美国加州一对龙凤胎出生后,他们的父母非常忧虑:两个婴儿不仅发育缓慢,而且肌肉松软无力。大脑扫描结果显示,男婴或存在大脑性麻痹;然而医生对造成女婴震颤和癫痫的原因却不清楚。一连串的检测均未能确诊两名婴儿的病因,当两名孩子5岁时,开始服用左旋多巴(用于治疗帕金森氏症的一种药物)进行治疗,然而该药物疗效有限。
直到2010年,这对双胞胎14岁后,全基因测序才结束了他们的病因诊断之旅。测序结果发现,参与墨蝶呤还原酶(这种酶参与生成神经递质多巴胺和5-羟色胺)基因编码的一个基因产生了一对突变。医生在临床治疗中加入了5-羟色胺之后,男孩的运动能力增强了,女孩也不再受到突然的、让人喘不过气的痉挛的折磨了。
国家基因工程
类似的病例激发了科学家进一步探索基因疗法的雄心。实际上,由于基因测序可以探查到与特定疾病相关的基因,该疗法正在成为一种日益受欢迎的诊断方法。但这种测序通常很难给出诊断结果,因为它们往往聚焦于部分基因组序列的已知基因。诸如上述双胞胎案例,研究人员和临床医生需要进一步对一个人的全基因组序列进行检测,才能发现致病基因。当前,全基因组测序仅用于个别案例,但是许多大规模计划正考虑把全基因组分析纳入常规医疗保健体系。
英国就是其一。通过10万人基因组计划(该项计划于2012年发起,并得到首相戴维·卡梅伦的支持),该国已经在基因医学方面迈出了一大步。
作为3亿英镑计划的一部分,10万人基因组计划到2017年将对被纳入英国国家医疗服务系统(NHS)的10万名癌症患者、罕见病患者以及传染病患者进行全基因组测序。该计划的目标是通过把疾病和精确的基因特征相关联,从而根据患者的个体需求提供精准治疗,最终刺激英国基因组学产业的发展。
由国家资助的、一体化的英国医疗卫生系统对于开展如此大规模的基因医学研究非常理想,牛津大学医学研究专家John Bell说,他也是基因组学英格兰公司的理事之一,该公司是NHS下属的一家旨在管理和运行10万人基因组计划的公司。NHS已经拥有大量个人临床信息,把这些信息和详细的基因组数据结合,将更有利于在医学和基因之间的联系上获得重要发现。现在,证明全基因组分析有助于诊断疾病的证据已经越来越多,长远来看,这项计划的目标是让全基因组成为NHS常规记录的一部分,Bell说。
然而,在实现这一愿景之前,10万人基因测序计划仍须跨越一些障碍。除了提取和测序大量个人基因的烦琐任务外,还存在辨别哪些基因突变会导致疾病、哪些突变是有害的等诸多问题,回答这些问题将需要处理海量数据,且耗时漫长,因此也需要专业公司设计出更先进的软件。
发展势头强劲
冰岛是首个对其公民实施大规模基因分析计划的国家。很多国家随后也开展了同样有着明确目标的计划:把公民健康和基因组测序相联系。在美国,“精准医学计划”打算对100万名志愿者进行基因测序,而正在酝酿的“百万老兵计划”目标也是在美国退伍军人之间开展类似的计划。其他正在进行类似项目的国家还包括加拿大、澳大利亚、日本、韩国、新华坡、泰国、科威特、卡塔尔、以色列、比利时、卢森堡和爱沙尼亚。
但英国的10万人基因工程发展势头最为强劲,该工程已经注册了3500名罕见病患者、2000名癌症患者,该工程共计划招募约7.5万人。最终招募的罕见病患者与其亲属将包括5万人,由于80%的罕见病会遗传,所以该项目将会对罕见病遗传者(通常是孩子)和与血缘关系最近的亲属进行基因组测序。其他的2.5万人将包括癌症患者,他们的基因组序列将会进行两次检测(肿瘤DNA将会被用于和该患者的正常细胞作对比),从而让测序总量达到10万人次。
该项目的目标是,希望可以让参试者受益于临床分析,而且他们的基因组数据还会对全社会的患者贡献价值。比如,医生通过把一名患者的前列腺癌症基因和英国基因数据库中的数据作对比,可能揭示出该病背后的具体基因模式。医生可能会找出具有同样基因模型的其他患者,然后了解哪些药物和程序对患者有益。
寻找合作伙伴
现在,基因组学英格兰公司正在为基因检测过程中的各个步骤——从提取DNA样本到分析基因组——寻找行业合伙人,总部位于加州圣迭戈的测序设备生产商Illumina公司就是合作者之一,该公司正在进行基因测序以及区分基因变异(即识别变体)等工作。该公司目前仍在位于英国小切斯特福德的分公司从事这项工作,但随着该项目规模日益扩大,未来数月,相关测序仪器将会被运往欣克斯顿威康信托基金会基因组校园。
Illumina正在利用高通量测序处理提取的DNA样本,以获得As、Ts、 Cs和Gs等DNA构建模块短片段的字符串。这些片段会通过运算被组合成一个一个连续的序列,然后科学家会通过生物信息学把这些生成的全基因组和人类参照基因组(由国际基因组参照序列合作体持续更新的一个人类基因组的典型范例)进行对比。其目的是发现和这个范例不同的每一处偏离:即每个基因变异。
为了识别这些变异,Illumina团队将使用该公司的艾萨克工作流—— 一种计算基因序列和识别变体工具的开放源代码——辨别每个基因组潜在的成千上万个变异中哪种变异与个体疾病相关联。基因组学英格兰公司将会对位于科舍姆安全数据中心的全部10万份基因组样本的序列和变异进行收集与分析。但是这家NHS下属的公司还要决定在这一过程中采用哪些软件:在选择最终用于该计划的软件之前,该公司将和Illumina等科研机构合作,以验证、测试以及提高现存的许多变体识别算术公式。
当前,Illumima公司已经对10万人基因工程中的3000多个基因组进行了测序,现在每天仍在进行更多的测序工作。“对于各种分析结果,公司将会收集和报告在DNA具体部位发现的不同种类的胚胎和体细胞变异。”该公司人口测序计划执行经理Peter Fromen说。这些变异可能包括插入或删除部分核苷酸,或是用一种核苷酸替代另一种核苷酸。此外还包括结构变异,比如一个基因复制数量的变化。
亟待软件创新
在此项工程中,每个变异都会被拿来和现有变异数据库中的数据进行对比,这些数据库包括诸如核苷酸多态性数据库(dbSNP);美国国立卫生研究院下属的一个短基因变异数据库;编纂了全球人类基因变异目录的国际研究计划;外显子组聚集联盟(ExAC)数据库;外显子组测序数据集等。由于该工程工作量极大,参与考量的10家最顶尖的公司将负责为该项目的首批8000名患者提供评注以及解释类的服务工作。目前基因组学英格兰公司已经把中标公司缩减到了其中的4家,并要求这些公司通过相关测试阶段,并达成一项协议。
据悉,剑桥的Congenica和加州的Omicia公司将分析罕见病基因;加州的Nanthealth公司将分析癌症基因;马萨诸塞州坎布里奇市的WuXi NextCODE公司将分析癌症和罕见病两者。加州圣迭戈的Cypher Genomics公司和与其合作的马里兰州的Lockheed Martin公司将成为保留的候选公司。这些公司此前均有相关领域的工作经验。
这些公司都将使用高性能计算机解释基因数据,并将在基因组学英格兰公司的安全数据中心工作,对数据进行分析。它们的宗旨是提供自动化服务,因为当前解释下一代测序数据在很大程度上仍要采取手动程序,这一过程须耗费大量时间。因此,每个公司都会带来其自有的、不同的专业知识和经验,以处理这些棘手的解读问题。
NHS并不擅长技术创新,Bell说,但基因组学英格兰公司在这一方面具备改革能力。对该公司来说,整个10万人基因组计划的目的是为临床医学提供答案。但是在诊断资料解析抵达医生和患者之前,科学家团队和临床医师需要分析这些数据。目前,10万人基因组工程已经进行了一系列活动,这对全基因组学领域的发展可能是有力的促进因素。它将会带来许多商业和学术机遇,可能会让基因医学最终实现其众望所归的前景,为受疾病折磨的患者带来益处。
英文地址:http://www.nature.com/nature/journal/v524/n7566/full/524503a.html