首页 >资讯
Cell:外显子组测序揭秘罕见疾病
发布时间:2012/02/02

两年前,美国国立卫生研究院(NIH)的“未确诊疾病计划”(Undiagnosed Diseases Program)开始以前所未有的规模向临床提供基因组学研究。现在该计划已完成对128个外显子组的测序,并对39个罕见疾病进行了诊断。该项目的成功为个人基因组学的普及铺平了道路,并为我们成功征服海量基因组数据提供了新的技术手段。

2009年,一对健康的哥伦比亚夫妇眼睁睁地看着自己的两个儿子因一种神秘的神经系统疾病而饱受痛苦。该疾病症状包括癫痫、震颤和其它并发症。当他们的小儿子于13岁因该疾病去世后,这个家庭决定尝试一种新的方法。这对夫妇让他们的大儿子(在此文章中称为Carlos)加入了美国国立卫生研究院(NIH)的“未确诊疾病计划”。该跨研究所的新研究计划致力于破解罕见、神秘疾病的病因。

2008年5月,“未确诊疾病计划”作为试验性项目被启动,启动资金为28万美元。从那时起,该计划研究组逐步发展到75名医生和科学家,涵盖了几乎每个NIH的研究机构,包括内分泌学家、免疫学家、肿瘤学家和心脏病学家。该研究组相互协作正在对300个疾病案例进行研究,其每年的研究经费高达350万美元。

该计划最先进的遗传分析体系使得它不同于其它大规模临床项目。该研究组的Illumina测序平台可以在短短九周内对一个病人和其家庭成员的整个外显子组(包括人类基因组中的18万个外显子)进行测序。此外,利用高分辨率芯片可以对每个家庭成员的数百万个单核苷酸多态性(SNPs)进行基因型分析,为包括内含子和非编码区域在内的其余99%的基因组组分提供信息。通过这种方式,“未确诊疾病计划”成为向临床提供基因组学研究的领跑者。

为什么这类临床基因组学研究在NIH之外并没有常规应用呢?那是因为虽然全基因组和外显子组的测序费用已分别降至约15000美元和3000美元,但是随后的数据存储和分析仍然太昂贵、太费力。坦白地说,应用于临床实践时也太没有效率。也就是说,测序是十分便宜和快速的,但是从数据中收集诊断信息还是相当吃力和昂贵的。

但是,“未确诊疾病计划”的最新研究成果正在扭转这一趋势。首先,该项目正在试图了解如何去确定哪些病人最可能通过基因组分析受益。其次,该研究团队已开发出有效的工具用于快速地从庞大的基因组数据定位到少数几个候选基因,进行下一步的功能学研究。通过这些新策略,该研究项目已成功进行了39个病例诊断,其中包括一个由其研究团队首次报道的新疾病。该研究成果已于上月发表在新英格兰医学杂志(The New England Journal of Medicine)上。

“未确诊疾病计划”主任和美国国立人类基因组研究所(The National Human Genome Research Institute,NHGRI)临床主任William Gahl说:“通过这个研究计划,科学家和临床医生可以了解到,新一代测序技术所面临的机遇和挑战;哪种案例适合基因组学研究;应采用什么样的过滤器对数据进行分析。”



在Carlos和他的家人来到NIH临床中心之前,他们面临的首要障碍是被接受加入该计划。NIH虽已收到约4600次有关该计划的查询和约1700份申请,但只接受了380个案例。一般来说,该计划根据病人的家庭历史信息,或者有迹象表明病人的症状具有共同的致病原因,挑选出可能由遗传因素致病的病人。

通常,NIH研究组首先会通过寻找已知的遗传标记和进行标准的商业化分子生物学和生物化学检测尝试确诊该疾病。但是,如果对于疾病没有很好的线索来获得候选基因以供搜索,他们将期待病人的完整外显子组。一个完整的外显子组承载了大量的信息,但必须要小心地处理。参与该计划的NHGRI临床医师Thomas Markello解释道,外显子组序列通常有2万个左右的点变化。这一巨大变异使我们几乎不可能发现一种神秘疾病背后的1到2个罕见等位基因。换句话说,核苷酸就像一个庞大的干草堆,它太大了。

该研究组经过反复试验和不断摸索,开发出一套能够迅速缩小干草堆的策略,即:他们通过比较病人与其家人的基因组信息排除许多变异。这一附加信息能够增加信噪比,并有效地减少候选基因的数量。Markello说:“数据简化几乎是一切。”

Gahl指出:“当临床表现没有指向一组特定的基因时,对单个人进行外显子组测序是毫无意义的。”根据家庭信息,该研究组可以使用经典谱系工具排除不遵循孟德尔遗传预测模式的突变。另外,健康的家庭成员的DNA能够帮助他们排除那些在家族中存在但并不致病的无害变异。

NHGRI的一位研究Carlos例子的临床医师David Adams说:“家系的数据给我们带来了本质的不同。你不只是需要家庭历史信息;而且获知家庭成员的DNA数据可以让我们成功。”

所以,对于Carlos的例子,遗传学家对他的外显子组进行测序,并且连同他的父母以及已经去世的兄弟。大体上说,该研究组以99.9%置信度得到了88%的完整外显子组。这套Carlos以及他的家人的外显子组数据初步产生了120,000个变异供遗传学家进行筛选。值得注意的是,该研究组之后使用由NIH开发的一系列软件把变异列表缩小到三个候选基因。

这些遗传学家首先把病人的外显子组与参考序列(这个参考序列由人类基因组计划产生)进行比对,并且根据黑名单排除不太可能的候选突变,该黑名单中的变异出现在来自两个独立项目的1%以上的外显子组和基因组中,这两个项目分别是NIH的ClinSeq以及1000基因组计划。之后,根据突变改变编码序列的严重程度对突变进行排序。例如,一个编码终止密码子的突变就比对氨基酸序列没有影响的突变要更加严重。

之后,另一个内部软件可以消除那些与这个疾病的遗传模式不匹配的突变。例如,Carlos的疾病看起来似乎遵循隐性遗传模式,所以研究组只留下了那些行为符合隐性遗传的突变。最终,这个研究组将结果输入到程序VarSifter,这个程序可以按可能性从小到大列出这些候选突变。

最近,这些软件中的一些已经对科学共同体(scientific community)开放,依照NHGRI的Nancy Hansen的说法,一旦优化完成,全套的软件就可能发布,这样临床医师和科学家们就可以在“未确诊疾病计划”的带领下开展工作。

虽然该项目采用的策略在不断改善,但是这种削减(whittling down)策略已经收获了一些成果。2010年末,该项目鉴定出了Carlos神经综合症(Carlos's neurological symptoms)的病因,并且即将发表他们对青少年的诊断报告。此外,“未确诊疾病计划”研究组的研究成果协助来自美国国立心肺血液研究所(National Heart, Lung and Blood Institute)的Manfred Boehm快速定位造成一类神秘血管钙化紊乱疾病(vascular calcification disorder)的突变。当时该研究组为Boehm提供了100个候选基因,Boehm在一个月内查明NT5E上的突变是造成该疾病的罪魁祸首。

NT5E编码一个膜结合的核酸酶,参与胞外ATP代谢。Boehm从三个家系中发现众多突变发生在该基因上,影响其核酸酶活性。通过将该酶作为靶向位点,临床医师可能很快就可以治疗这个前几个月还不知名的疾病。这项研究上个月已发表在新英格兰医学杂志(The New England Journal of Medicine)上。

跟这形成鲜明对比的是,Boehm说,两年前NIH的遗传学家曾向其提供了与一已知疾病相关的2000个候选基因,但他花了整整一年才从这么多基因中筛选出真正的易感基因突变。

迄今为止,该项目已经诊断了39个病例,其中3个是通过外显子组测序技术发现的神经和肌肉疾病,另有3个是使用SNP分析,剩余的则是借助商业检测诊断出的,包括所鉴定到的稀有疾病先天性2B型糖基化紊乱。

该研究组认为他们所提供的候选突变简明列表只是成功了一部分。他们需将这些简短的列表送到实验科学家手上,通过功能实验揭示这些突变如何导致疾病。目前,这些合作的实验科学家都局限在NIH内部。但是项目领导者说一旦他们建立起合作渠道,他们可以同NIH外的其他基础研究工作者合作。

Marjan Huizing是NHGRI代谢紊乱方向研究者。她的研究关注因细胞内吞转运缺陷导致的白化病、大出血及感染。虽然她未加入该项目,但她也采用他们的外显子组测序技术。

传统的候选基因筛选方法曾大大的挫败了她的研究组。他们花费了12年筛选疾病患者却没有筛选到真正的易感基因。因此她决定采用该项目的策略,对三个病人的外显子组测序。很快地,她鉴定出两位病人共享的一个发病突变。对于另一位更有难度的病例,她计划对该病人父母进行测序。

如此同时,Harvard基因组学家George Church说:“遗传学家都关注着该项目的进展,期盼它能提供一些证据说明稀有疾病的自然本质以及只通过测序能否鉴定出在医学上能被利用的等位基因;如果真能实现的话,这是一个方法学的革新。”

虽然Church的好奇在该项目的临床医生中引起了共鸣,但是他们还是更关心他们的病人。基因组学带来的诊断学巨变是科学家和临床医师的一场胜利,但是对数年来苦苦寻找疾病病因的病人及病人家属来说意义更加重大。

这场胜利是苦乐参半的。Carlos所患疾病以他的名字命名,但是目前还没有治愈手段或有效的药物。NIH临床中心主任John Gallin说:“即使我们走运,我们能带给病人最大的帮助也只是增强其信心,相信终究有一天有人会利用诊断开发出一种治疗方式。我们的病人都将其称为‘希望之屋’,但是从一个护理者的角度来看,我希望我能做得更多。”

原文:Exome Sequencing Deciphers Rare Diseases,

Cell, Volume 144, Issue 5, 635-637, 4 March 2011

链接:http://www.cell.com/abstract/S0092-8674(11)00185-1

感谢北京大学生物信息中心伍启熹、周维真、董珊、高华、黄岳五位志愿者的翻译!