首页 >资讯
大数据分析如何加速多种人类疾病的研究?
发布时间:2019/03/25

【1】Nat Genetics:大数据揭示影响阿尔兹海默症发生的5个遗传位点

doi:10.1038/s41588-019-0358-2

来自超过94,000名个体的遗传数据分析显示,阿尔茨海默病有五个新的风险基因,并确认了其他已知的20个基因。这些新发现支持开发证据,证明与特定生物过程相关的基因组,如细胞运输,脂质转运,炎症和免疫反应,是“遗传中心”,是疾病过程的重要组成部分。该研究于2019年2月28日在线发表在Nature Genetics期刊上。

“这项对阿尔茨海默氏症遗传基础的持续合作研究使我们能够深入研究这种破坏性疾病的复杂性,”NIA主任Richard J. Hodes博士说。 “随着我们继续更好地了解和针对治疗和预防老年痴呆症的方法,本研究的规模为优先排序的基因提供了额外的清晰度。”

研究人员,国际基因组阿尔茨海默氏症项目(IGAP)的成员,分析了94,437名晚发性阿尔茨海默病患者的罕见和常见基因变异,阿尔茨海默病是老年人中最常见的痴呆症。 IGAP由美国和欧洲的四个联盟组成,这些联盟自2011年以来一直在合作进行全基因组关联研究(GWAS),涉及数千个DNA样本和共享数据集。 GWAS旨在检测与阿尔茨海默氏症相关的基因组变异。了解遗传变异正在帮助研究人员确定影响疾病发生和发展的分子机制。

【2】PLoS One:大数据帮助科学家快速检测新生儿的脓血症

doi:10.1371/journal.pone.0212665

自通过使用电子健康记录(EHR)中常规收集的数据,研究人员和医生科学家在新生儿重症监护病房(NICU)人群中测试机器学习模型。研究表明:自动化程序可以在出现临床症状之前快速识别新生儿重症监护病房(NICU)中的哪些患病婴儿患有脓毒症。相关研究结果刊登于国际杂志PLoS One上。

败血症始于细菌侵入血液,它是婴儿死亡率和发病率的全球主要原因。不幸的是,攻击性免疫反应会导致脓毒性发展以及休克的发生,进而导致多个器官衰竭,有时甚至致命。虽然在健康的婴儿中相对罕见,但早产儿或慢性住院婴儿的败血症发生率要高200倍。婴儿败血症的幸存者可能会产生后遗症,如慢性肺病,神经发育障碍等。

【3】Nat Genet:重大突破!130万余人大数据助力揭示数百个与失眠相关的基因

doi:10.1038/s41588-018-0333-3

失眠是全世界第二大流行的精神疾病,而目前却没有有效的治疗方法。尽管大量研究表明失眠可以遗传,但是科学家们到现在为止都还不完全清楚其背后相关的基因和神经生物学通路。为了揭示这些秘密,近日来自阿姆斯特丹自由大学、荷兰神经科学研究所的研究人员进行了一项大型研究,他们分析了1331010个遗传学相关的人组织样品,以检测与失眠相关的新的基因位点,并深入研究相关的信号通路、细胞和组织,相关研究成果于近日发表在《Nature genetics》上,题为“Genome-wide analysis of insomnia in 1,331,010 individuals identifies new risk loci and functional pathways”。

通过基因定位、表达数量性状基因座分析和染色质谱图,研究人员发现了涉及956个基因的202个位点与失眠相关,meta分析揭示了2.6%的差异。研究人员发现神经元的轴突部分、皮层和皮层下组织、以及特定的细胞类型(包括纹状体、下丘脑和屏状体神经元)出现了大量的相关基因。研究人员还发现精神病学特征和睡眠时间存在很强的遗传学联系,而与其他的睡眠相关特点存在一定的联系。

【4】Nat Commun:科学家成功利用大数据分析来鉴别新型的癌症风险基因

doi:10.1038/s41467-018-04900-7

诱发癌症有很多遗传原因,比如有些突变会遗传自父母,而其它则是后天获得性的突变,比如因外界因素或DNA复制的错误导致等,大规模的基因组测序在识别因体细胞突变所诱发的癌症上取得了一系列研究成果,但这种技术却无法有效识别因遗传性突变所诱发的癌症,而且识别这些遗传突变的主要来源仍然是基于家族性的研究。

近日,一项刊登在国际杂志Nature Communications上的研究报告中,来自巴塞罗那基因组研究中心的科学家们通过研究开发了一种新型的统计学方法,其能够从肿瘤测序数据中鉴别出癌症易感性基因;该方法使用了一种古老的想法,即癌基因通常需要“两次击打”(two hits)才能够致癌,研究者表示,这种方法能帮助他们从当前癌症基因组数据库中系统性地鉴别出相关的基因。

【5】Nat Genet:大数据揭示疾病的基因关联

doi:10.1038/s41588-018-0294-6

想象一下,雨水落在人行道上的场景。虽然雨滴落地似乎是随机发生的,但随着时间的推移,人行道仍然会有一片区域保持干燥。这个类比类似于犹他大学健康研究所的研究人员设计的一种新方法。他们探索了超过100,000名健康人,以确定我们不容易改变的基因区域。他们认为,这些“受限制”区域的DNA突变可能会导致严重的儿科疾病。

“我们不是专注于DNA变化的地方,而是寻找DNA维持不变的基因部分,”U of U Health的人类遗传学和生物医学信息学副教授,副主任Aaron Quinlan博士说。 USTAR遗传发现中心。 “我们的模型在这个庞大的数据集中搜索密集遗传变异规则的例外情况,以揭示缺乏变异的基因的受限区域。我们相信这些区域可能是致命的,或者在突变时会导致疾病的极端表型。”

【6】Cancer Immunol Res:科学家有望利用大数据分析来预测癌症患者对免疫疗法的反应

doi:10.1158/2326-6066.CIR-18-0129

如今在大数据时代,癌症研究人员开始寻找多种新方法来监测癌症免疫疗法的有效性;近日,一项刊登在国际杂志Cancer Immunology Research上的研究报告中,来自约翰霍普金斯大学医学院的研究人员通过研究开发出了一种利用生物信息学的新方法,该方法或能作为一种新型工具帮助确定患者的免疫系统如何对癌症免疫疗法产生反应,以及如何有效识别机体自身的肿瘤。

研究者Kellie Smith博士表示,我们希望能够得到足够的数据,通过利用一种名为MANAFEST的技术来帮助临床研究人员确定癌症患者的最佳治疗方案;一旦某个人被诊断为癌症,我们就希望能利用该技术为其制定最佳的治疗手段,以前研究人员并没有开发出MANAFEST技术,在过去几年里,研究人员通过对这项技术进行不断改善,如今其能够对多项数据进行分析来帮助有效治疗癌症患者。

【7】Cell Systems:大数据分析或能鉴别出指示机体健康和疾病发生的特殊脂质分子

doi:10.1016/j.cels.2018.05.016  doi:10.1016/j.cels.2018.05.009

日前,两篇刊登在国际杂志Cell Systems上的研究报告中,来自瑞士洛桑联邦理工学院的科学家们通过进行大数据分析鉴别出了特殊的脂质或能作为机体健康和疾病的标记。尽管脂质非常重要,但从传统角度上来讲其是科学家们最难进行研究的生物分子,因为脂质分子结构具有一定的多样性,通过已经定义好的标准结构和指导DNA、RNA和蛋白质的简单规则似乎并不能确定脂质分子的结构,脂质分子的多样性也就意味着,并不像建立和分析基因组及转录组数据库,针对脂质分子需要更为个性化的分析步骤。

这项研究中,研究人员通过研究对小鼠血液和肝脏中将近150种脂质分子进行了测定,随后研究人员还鉴别出了每一种脂质分子的遗传调节子以及其相应的生理学功能。研究者利用系统遗传学的方法将脂质组学数据库同来自小鼠机体其它的“组学”数据库相结合,包括表型组、转录组和蛋白质组数据库等,这种方法就能够有效识别出不同血脂类的血浆和血脂,并以此作为指示机体健康状态的标志物。

【8】PNAS:大数据方法研究HIV包膜蛋白蓝图 有望开发新型HIV疫苗

doi:10.1073/pnas.1717765115

尽管人类在医学研究领域取得了很多重大进展,但目前仍然没有开发出应对HIV感染的有效疫苗,尽管最近研究人员希望能够发现有效的抗体来中和多种HIV毒株,然而有时候HIV仍然会通过一些突变途径来躲避已知的广泛中和抗体的反应,这就使得研究人员设计出一种有效的解决方案变得非常困难了。

一种理想的疫苗能够产生广泛中和性抗体来靶向作用HIV的突起蛋白,该部位的突变会明显减弱病毒的适应性或者病毒的再生和复制能力,这或许就需要疗法HIV的适应性蓝图,为了完成这一目标,来自香港科技大学和MIT的科学家们就通过研究开发出了一种计算方法,该方法能够评估HIV gp160蛋白的“适应性图像”,gp160是包含HIV突起蛋白的多聚蛋白,随后研究人员通过多种实验性测量进行对比就能证实他们所推荐的图像结构了。

【9】The Lancet Public Health:超5万人大数据!酗酒减寿20!是痴呆最大的风险因素!

doi:10.1016/S2468-2667(18)30022-7

酒精是预防所有痴呆最重要的因素,尤其是早发性痴呆。这是一项发表在杂志《The Lancet Public Health》上的法国全国范围内观察性研究的结果,而法国超过100万人被诊断患有痴呆。这项研究特别关注了酒精使用问题,包含已经确诊的由于长期使用酒精导致患有精神和行为异常或者慢性疾病的人。

在57000例早发性痴呆(早于65岁)患者中,大部分(57%)与慢性酗酒有关。世界卫生组织(WHO)将慢性酗酒定义为男性每天饮酒超过60g(纯酒精),或者女性超过40g。这项研究发现二者具有强烈的联系,作者建议筛查、酗酒干预以及治疗酗酒问题将有效减少酒精导致的痴呆问题带来的负担。

“这些发现表明酗酒和酒精使用问题是痴呆最重要的风险因素,对于65岁之前发病的早发性痴呆尤为重要,这将导致早死。”研究共同作者、CAMH精神卫生政策研究中心主任Jürgen Rehm博士说道。“酒精导致的脑损伤及痴呆是可以预防的,已知有效的预防和政策手段将有效降低痴呆相关的早死。”

【10】Nat Genet:大数据分析揭示HCV如何与人宿主相互作用

doi:10.1038/ng.3835

一项针对丙型肝炎病毒(HCV)和500多名HCV感染者的大数据研究有助更好地理解这种病毒如何与它的人宿主相互作用。来自英国等5个国家的研究人员首次开发出一种方法来分析和比较HCV的遗传组成,以及500多名HCV感染者的遗传组成。通过一起加以研究,这将让研究人员对HCV和人基因组如何与这种病毒相互作用并且改变这种病毒提供新的见解。

病毒性肝炎是全世界死亡和残疾的主要原因之一,2%~3%的世界人口被认为感染上HCV。在英国,据估计,有30万人感染上这种病毒。很多人并没有意识到他们感染上这种病毒,未接受治疗,从而导致肝病和肝癌。Barnes说,“这是首次利用一项大数据研究一同探究了一种病毒和它的宿主。我们鉴定出人基因组中的两个位点,在这两个位点发生的调节着我们的免疫系统的遗传变异影响这种病毒的遗传多样性。”

“可用的新药物能够清除HCV感染,但是它们是非常昂贵的,而且当前对它们的获得是受到限制的。这些药物也比其他的药物不难么有效地治疗存在的7种HCV毒株中的一些毒株导致的感染。这突出强调了理解这种疾病的遗传基础在未来开发新的疗法中的重要性。”