摘要:
罕见病大多数是遗传性疾病,其发病率低,种类繁多且表型复杂多样,导致临床上难以进行及时和准确的诊断。随着分子遗传学、分子诊断技术、基因测序技术及组学技术的进步,罕见病诊断取得了重大发展。在传统基因检测技术基础上,二代测序技术迅速发展并广泛应用于罕见病的诊断和研究中,三代测序技术也展示出潜在应用价值。虽然传统的酶学检测技术仍占有重要地位,但已不能满足罕见病诊断的需求;蛋白质组学、代谢组学的崛起,使多种罕见病的准确诊断成为可能。同时结合分子影像技术和生物信息技术,计算机辅助诊断也展现出了广泛的应用前景。
罕见病又称“孤儿病”,由于单病种人群发病率低、病例分散等特点,长久以来罕见病研究处于医学研究的荒漠地带,未能引起临床医生的足够重视,导致许多罕见病患者不得不面临无法获得明确、及时的诊断亦或即使诊断明确却无药可医的两难境地。解决罕见病患者诊断难、治疗难的问题不仅是现代医学面临的重大挑战,也是社会发展提出的迫切需求。随着医学研究的进步和社会经济的发展,罕见病作为一组特殊疾病引起了研究者和临床工作者的广泛关注。
目前,已知的罕见病已超过6000种,其中大部分罕见病与遗传相关,且几乎所有的单基因遗传病均属罕见病。自1987年Online Mendelian Inheritance in Man(OMIM)数据库上线以来,临床医生和遗传学家们查找已知的人类表型和基因型以及二者关系越来越便利。目前已知的遗传疾病及其致病基因大多可在OMIM数据库中查找获悉,且随着研究的持续深入,不断有新的基因突变加入到OMIM数据库中。正是由于遗传学研究的发展,多种经典的基因检测技术使部分罕见病得到了明确诊断,如成骨不全和长Q-T间期综合征等。在实施人类基因组计划之前,要想诊断这些罕见病是极其困难的。近年来,测序技术的飞速发展为罕见病的诊断提供了新的选择。蛋白质组学、代谢组学等研究也试图从不同层次对明确罕见病的病因及发病机制实现突破。分子诊断技术的发展为罕见病诊断打开了一个全新的局面。尽管困难重重,研究者们对越来越多的罕见病患者得到及时、正确的诊断充满希望。本文综述了目前常用的罕见病诊断技术及其发展现状,旨在提高临床医生对罕见病诊断的重视,推动新的诊断技术在临床中应用。
罕见病是一组疾病的统称,各国对其定义不尽相同。其中,欧盟将患病率低于5/10000,危及生命的、严重渐进性疾病或严重慢性病归类于罕见病;由法国国家健康医学研究所(INSERM)和法国卫生部创建的罕见病相关数据库Orphanet在纳入罕见病词条时正是此为参考标准。2010年5月,中华医学会医学遗传学分会在中国罕见病定义专家研讨会上将罕见病定义为:患病率低于1/500000,新生儿发病率低于1/10000的遗传病。虽然该定义尚未获得官方认可,但目前国内罕见病研究多参考此标准。
据估计,中国至少有1000万罕见病患者,面对如此庞大的患者群体,中国的罕见病诊断水平总体却并不高。就中国的现状而言,临床大夫对罕见病的认识不够、经验不足,无法将罕见病患者从大量患者中准确识别,很容易造成漏诊、误诊;由于罕见病本身的异质性,缺乏临床可及的诊断试验也阻碍了疾病的及时确诊。但是,随着生物医学的发展以及国内外对罕见病的日益重视,加之不断出现的新技术作为辅助,罕见病诊断难的现状有望得到改善。
经典的基因检测方法
目前已知的罕见病大部分与遗传相关,因此基因检测技术是明确诊断罕见病的重要方法。染色体组、染色体、基因和碱基等不同水平的变异均可致病。经典的基因检测方法,如染色体核型分析、荧光原位杂交(fluorescence in situ hybridization,FISH)、微阵列比较基因组杂交(array comparative genomic hybridization,aCGH)、多重连接依赖的探针扩增(multiplex ligation-dependent probe amplification,MLPA)等,被认为对检出>400bp的片段的拷贝数变异是有效的,在罕见病的基因诊断中发挥了重要作用。然而,这些经典的基因检测方法往往不能检出更小范围的基因突变,且无法检出拷贝数恒定的致病变异,如平衡易位或倒位。
基因测序是20世纪70年代建立的一项重要技术,最早由Sanger等提出。Sanger测序技术的诞生很好地弥补了经典的细胞遗传学检测方法的不足,共同构成了经典的基因检测技术大厦。然而由于操作耗时且价格昂贵等缺点,Sanger测序正逐步被新的测序技术所取代。
二代测序技术
为了解决Sanger测序耗时和费用高的问题,人类基因组计划于2004年完成后,美国国家人类基因组研究所(NHGRI)启动了寻找革命性基因组测序技术——1000美元基因组测序的项目。在该项目的引导下,更加高效经济的高通量二代测序技术发展成熟,并最终从实验室走向了临床。
根据测序目的不同,二代测序技术可分为基因组测序、转录组测序和染色质免疫沉淀-测序(ChIP-seq)。基因组测序又有全基因组测序(WGS)、全外显子组测序(WES)、单细胞基因组测序、扩增子测序(amplicon sequencing)等。与传统基因检测方法相比,基于二代测序方法的诊断试验不受遗传方式的影响,测序结果不仅能够提供给我们致病基因的位置信息,还提供了致病突变的类型等重要信息。近几年来,二代测序技术凭借其精准高效的特点迅速崛起,成为了目前辅助诊断罕见病的重要方法之一。
基因组测序。二代基因组测序技术应用于罕见病诊断中可分为全基因组测序(WGS)、全外显子组测序(WES)和靶向目标基因测序。虽然外显子仅占全基因组的1%,但是据推断约85%的致病突变发生在该区域内。全外显子组测序(WES)通过二代测序技术获得全基因组外显子区域的DNA序列信息,结合临床表型和生物信息学分析,可推断出可能的致病基因。和全基因组测序(WGS)相比,WES省去了基因中的非编码序列,需要的样本量相对较少,更加经济;与靶向目标基因测序相比,WES不需要提前预测致病基因,更适用于诊断困难的罕见病患者,因此受到许多临床医生的青睐。
一项婴儿筛查研究表明,对于致病基因已知的单基因遗传病,WES能准确诊断57.5%的病人,远远高于标准诊断方法的准确率(13.75%),即使考虑到临床医生的诊断经验和检查的充分性再对数据进行校正,得到的诊断准确率仍低于WES。当然,WES也存在自身局限性:由于省去了内含子等序列,WES不能检出内含子序列变化引起的致病突变;对于复杂的结构变异或重复序列的检测敏感度低;对假基因的识别存在困难;对WES所得结果的解读依赖于对疾病致病基因的研究,可能存在检测到意义不明的基因突变而无法据此诊断的情况。目前由于捕获技术本身的随机性,WES检测到的致病位点仍需要Sanger技术验证其准确性。
WGS是利用二代测序技术获得全基因组的序列信息。其对于单碱基变异、剪切位点突变、内含子变异、多拷贝数变异的识别较其他基因测序技术更为有效。与WES相比,WGS测量结果的一致性更好,偏倚更小;但由于价格昂贵,其临床应用不如WES广泛。由于测量序列的不同造成获得数据量的显著差异,WGS与WES的结果准确性和价格差距将稳定存在。WGS的应用范围也会更广,尤其对于可能涉及内含子突变的疾病。
靶向目的基因测序是对特定的目的基因进行测序的方法,对于致病基因已知的单基因遗传病检测是经济可行的方法。Usher综合征是一组常染色体隐性遗传的单基因疾病,尽管具有遗传异质性,但利用靶向目的基因测序的方法可一次性检出单个碱基或序列重排等不同的突变方式引起的致病突变,提高了诊断效率。显然,靶向目的基因测序相较于经典基因检测方法的优势在于通过一次测定即可鉴定出各种形式的变异,但不能用于病因未知的罕见病。
RNA 测序。RNA测序不仅可用于诊断某些致病机理涉及特定RNA的罕见病,还可识别剪切位点变异导致的蛋白质转录水平异常引起的罕见病。RNA作为一种具有潜在诊断价值的生物标记物逐渐受到重视。除tRNA和rRNA外,非编码RNA多作为一种信号分子参与生命活动的调节过程。microRNA(miRNA)是一种常见的非编码RNA,仅由20~22个核苷酸组成,性质十分稳定,广泛存在于组织和体液中,可被现有的方法准确检测到。miRNA 可以通过碱基互补配对的方式与mRNA相互作用,根据互补匹配的程度不同,导致mRNA降解或不降解从而抑制翻译。因此miRNA调控的异常可能是导致罕见病的发病机制之一,检测miRNA的变异类型则可能为临床提供可靠的诊断依据。基因组关联研究(GWAS)提示miRNA及其靶mRNA的拷贝数变异和单核苷酸多态性对多种表型均有影响,如血压、药物抵抗、精神疾病、胃黏膜萎缩和帕金森病。多种罕见病已经将miRNA作为生物标记物,并且在疾病诊断及预后评估等方面有很重要的作用,如miR-206 与杜氏肌营养不良(DMD)和肌萎缩侧索硬化(ALS),miR21与Sézary综合征和多发骨软骨瘤。此外,通过检测疾病相关miRNA进而追本溯源找到其调控的mRNA和编码基因,还有助于研究未知致病基因的罕见病。
长非编码RNA(lncRNA)是转录出来缺乏开放阅读框的非编码RNA,约200 bp,远远大于miRNA,也被认为具有调控作用。其中研究最热门的lncRNA,Xist被认为参与了女性其中一条X染色体的失活过程;H19只在母亲来源的等位基因中表达,可能与某些肿瘤有关。虽然miRNA作为诊断性生物标记物更加成熟,但随着人们对其作用机制的理解深入,lncRNA也将成为一个潜在的诊断指标。
三代测序技术
虽然二代测序已经凭借其高效、经济且结果准确性与Sanger测序可比的特点受到追捧,被各大医学研究中心引进,但技术和设备上的要求较高仍然是测序技术的局限。三代测序的出现有望打破该限制。与二代测序不同,三代测序舍弃了容易产生误差的样本扩增步骤,实现了对单个DNA分子的测序,测量结果可即刻导出,将测序时间从几天进一步缩短至几小时甚至几分钟,是比二代测序更加快速、高效的测序方法。二代测序的设备通常体积较大且价格昂贵,因而只能在大型医学或遗传学研究中心安装。由英国Oxford Nanopore Technologies 研发的MinION 三代测序设备已经问世,因其相对低廉的价格和便携性引起了广泛关注。一项利用该手持设备在非洲埃博拉疫区快速检测病毒基因组的研究展示出了三代测序技术在疾病快速诊断中的潜在价值。
目前三代测序能够测量的片段大小较二代测序大,理论上可以降低将片段组装成完整序列的难度和误差,但实际上单次测量的准确率明显降低。三代测序系统PacBio RS II平均测量片段长度约10 kb,但错误率达10%~15%,相比二代测序的错误率(<2%)而言明显升高。当然,三代测序也无法逃避的测序技术面临的信息存储和结果解读的问题及遗传信息相关的伦理问题。
经典的蛋白质检测技术
事实上,并非所有罕见病均可找到明确的致病基因。因此,特征性的生物标记物对部分罕见病的诊断有着重要意义。传统的生物标记物可以是蛋白、脂质、多肽等,其中蛋白质作为人体内重要的功能分子在很多疾病中扮演着重要角色,因此许多经典的蛋白质检测技术也是疾病诊断的重要方法,对发病机制较明确的罕见病的诊断同样适用。慢性肉芽肿病是一种罕见的免疫缺陷病,利用Western blot 测定NADPH 氧化酶复合物的表达是其诊断的关键步骤之一。类天疱疮疾病是一组与自身抗体有关的罕见病,研究表明血清中含针对BP180的自身抗体如IgA、IgG或IgE是该病的特殊表现,而利用ELISA检测血清中的IgA具有非常高的诊断价值。
罕见病研究者们将已经发现的有价值的生物标记物以及相应的检测技术整理到生物库中,供研究者和临床医生参考,建立了EuroBioBank等生物信息平台。但其中一些生物标记物的临床应用价值尚待进一步评估。
蛋白质组学
虽然经典的蛋白质检测技术在临床疾病的诊断中占据重要地位,但对于机制复杂或尚不清楚的罕见病,这些经典的蛋白质检测技术就显得效率不足,难以满足诊断需求。蛋白质组学的发展使得某些常规技术无法检测的微量蛋白可以通过新的方法测得,某些以前诊断困难的罕见病也能够得到诊断,对研究和诊断罕见病意义重大。
目前蛋白质组学的检测技术主要以质谱法和基于亲和力的蛋白分析法为基础,已经在部分罕见病的诊断中表现出突出的优势。例如单克隆IgD沉积病(monoclonal Ig deposition disease,MIDD)的分子诊断,由于常用的抗体检测方法——免疫荧光法无法检测IgD,即使使用电子显微镜看到组织切片中的沉积物,也无法明确其性质。研究者采用激光微切片后提取蛋白多肽送质谱法检测的方法,测得大量IgD成分,结合免疫组化染色的方法,成功诊断了一例免疫荧光Ig阴性的肾脏受累的MIDD患者。也有研究者利用基于亲和力的高度复用抗体悬浮微粒阵列(highly multiplexed antibody suspension bead arrays)对杜氏肌营养不良患者进行血清蛋白分析,发现了多个与对照具有显著差异的蛋白标记物,虽然单个标记物不足以诊断DMD或提示疾病的严重程度,但多个标记物的组合对DMD的诊断灵敏度和特异性均较高,是一种高效的诊断方法。
代谢组学
代谢组学是系统化地研究生化反应产生的小分子(<1500 Da)代谢产物(如氨基酸、脂质、碳水化合物、生物活性胺和有机酸等)的一种方法。利用代谢组学的方法可以实时监测细胞通路,反映出细胞、组织甚至器官的代谢状态,代谢产物的研究还能够提示疾病隐藏的生化机制,为一些罕见遗传代谢病的诊断提供新思路。
代谢组学研究方法分为靶向和非靶向两类。非靶向代谢组学通过全面比较样本和对照中的代谢成分,找出具有显著差异的成分,利用生物信息学和数据库,将差异成分和已知的生化通路连接起来。类似于二代测序的方法,非靶向代谢组学适用于检测没有任何预测倾向性的样本,即临床毫无头绪的罕见病人。靶向代谢组学仅对目标类型的代谢产物检测其相对于对照的变化情况。目前最常用的方法是串联质谱法。只要预先知道疾病特异的代谢物,利用质谱法检测样本中代谢物的特异性和灵敏度都极高。串联质谱法能同时测量多种不同的生物学标记物,因此可以在一次试验中同时进行多种疾病的筛查,对于难以诊断的罕见病患者而言,一次采样即可完成大范围的筛查,非常实用。对于串联质谱法用于罕见代谢性疾病诊断的成本效益分析显示:尽管串联质谱法改善患者预后的程度存在差异,但大部分研究认为该方法是经济有效的。此外,还有用核磁共振光谱(nuclear magnetic resonance spectroscopy)来检测代谢产物的方法。无论质谱法还是核磁共振光谱法,在单独用于非靶向性代谢组学时均存在较大的误差,因此在有大量待测代谢物时可能同时采用两种方法更佳。
分子诊断技术的发展极大地推动了罕见病的诊断发展,与此同时,其他辅助诊断方法也开始关注其在罕见病诊断中的应用。虽然仅依靠传统的辅助检查往往不能明确诊断,但在可及性和可操作性上,影像学检查表现出突出的优势,甚至对于某些罕见病的诊断具有重要价值。例如Creutzfeldt-Jacob病(Creutzfeldt-Jacob disease,CJD)可引起患者脑实质特征性的解剖结构改变,在MRI上表现为FLAIR序列上特征性的脑回和纹状体高信号,具有很高的诊断价值,被列为CJD的诊断标准之一。在发展新技术的同时,研究罕见病在传统检查中的特征性表现也有一定的价值。
罕见病患者往往在确诊之前要经历大量冗余的检查检验,如何帮助临床医生在疾病早期明确诊断方向是一个值得思索的问题。计算机辅助诊断提供了一个值得努力的方向。研究表明,相对于辅助常见疾病诊断的尝试如ISABEL和DiagnosisPro而言,计算机辅助诊断(computer assisted diagnosis,CAD)用于辅助罕见病诊断的效果更优。CAD初步诊断罕见病的准确率可达80%且灵敏度较高。基于术语规范化和数据库的完善,研究者设计出了多个能够根据患者一系列症状对其可能的诊断及可能性大小进行预测的软件,如phenomizer、Find Zebra等,均为协助罕见病的初步诊断带来了便利。但目前已有的辅助诊断软件特异性较差,只能用于辅助初步诊断,还需要临床医生从软件给出的50~100个候选疾病中进一步找到正确的诊断。除了在算法和软件层面的改进以外,对罕见病患者的临床信息进行自动化和结构化的分析也能改善罕见病诊断的效率。在发展各种诊断罕见病的生物学技术的同时,重视信息化技术在罕见病诊断中的应用十分必要。
罕见病作为一组特殊的疾病,具有显著的异质性。虽然单病种发病率低,但整体发病人数并不少,全世界大概有3亿5000万罕见病患者;80%的罕见病与遗传相关,发病年龄早、危害大,若不及时诊断治疗,致死致残率高。然而,由于临床医生对罕见病的认识和重视程度均不足,很多罕见病患者被误诊误治,延误诊断。
近年来,由于分子诊断技术的发展,罕见病的诊断取得了明显的进步。一方面,在传统基因检测技术的基础上,测序技术飞速发展,二代测序技术已经相对成熟,三代测序技术也已经上市。相较于传统的基因检测技术,二代测序技术更加快速、经济。尤其是全基因组测序(WGS)和全外显子组测序(WES),克服了罕见病致病基因未知、突变类型多变的困难,为罕见病能得到及时、准确的基因诊断创造了条件。但由于对大型测序设备和数据处理的要求,二代测序的应用还仅局限于大型医学或遗传学研究中心,且由于大量序列信息的产生,数据的保存和结果的解读仍面临巨大挑战。二代测序的价格已降至许多人可接受的范围内,然而随着其应用的增多,有关遗传信息的保密性和诸多相关伦理问题日益突出。另一方面,得益于各种组学的蓬勃发展,罕见病的生物标记物检测也实现了突破。不断有各类抗体或代谢产物作为诊断标记物的面向临床,检出方法也在不断革新,诸如基于亲和力的蛋白分析法、质谱法和核磁共振光谱法等最新技术也被用于罕见病的诊断中。不过,尽管新的诊断技术层出不穷,但各类诊断试验在国内的临床可及性仍然较差,评价其用于罕见病诊断的灵敏度和特异性、成本经济效益分析的研究相对匮乏。各类非靶向的标记物检测虽然提高了一次试验获得辅助诊断信息的效率,但对可能出现的多种异常结果如何解读也是研究者和临床医生不得不思考的难题。在解决这些问题前,这些最新的分子诊断技术很难广泛应用于临床。罕见病患者是否能从这些诊断技术的发展中获益仍难以定论。因此,研究传统辅助检查对各罕见病的诊断价值依然有意义。此外,计算机辅助诊断技术在帮助临床医生早期判断罕见病方面也展现了突出的优势。
总之,罕见病的诊断已经脱离了缺乏技术手段的阶段,新的诊断技术在准确性和经济效益上表现出了一定的优势,但仍需要研究数据和经验的积累,提高临床可及性,完善诊疗规范,让罕见病的诊断更加准确高效。罕见病患者得到及时、准确的诊断仍有很长的路要走,但随着对罕见病的日益重视,罕见病患者和研究者们有理由对此保持乐观。
本文由 科技导报(公众号) 授权转载