(原标题:国家基因库:揭秘中国“诺亚方舟”)
■本报记者 张文静 赵广立
在深圳东南部大鹏新区的观音山脚下,矗立着一座依山而建的白色建筑,建筑呈阶梯状向上攀延,从建筑的高处望去,对面是茂密的青山,远处能看见海。在这平静的外表下,建筑内庞大的高通量基因测序房、超级计算房以及冷冻资源房等正在日以继夜地运转着,它们负责存储和管理着我国特有的遗传资源、生物信息和基因数据。这就是上个月刚刚启动运行的国家基因库。
《圣经·创世纪》中,诺亚建造方舟带各类动物躲避了大洪水灾难,保留了生命繁衍的希望。在现实世界中,美国、欧盟和日本已经拥有了世界级基因库,以掌握生命经济时代的战略性资源。此次国家基因库的正式启动,则意味着中国也拥有了一艘承载生命希望的“诺亚方舟”。
比银行的金库更加宝贵
“基因库是真正的国库,甚至比银行的金库更加宝贵。”提到当前拥有自己的基因资源对于中国的意义,国家基因库主任、华大农业集团董事长兼总裁梅永红如是说。
梅永红解释说,在农业经济时代,拥有更多的耕地意味着优势;在工业经济时代,拥有更多的能源,如石油、天然气其他矿产等,也意味着有相应的优势;但是在生命经济时代,基因资源是国家的重要战略资源,拥有更多的基因资源,将提高中国在全球生命科学研究、生物产业发展以及对外开放合作方面的竞争力。
“同时,我们对自身健康和疾病的了解、干预,我们对生态环境、生物多样性的保护和合作开发,都需要以基因资源作为基础。因此,拥有自己的基因资源,将对中国全民健康事业、生物多样性资源开发和应用的可持续性发展,有着非常重要的作用和意义。”国家基因库执行主任、华大基因研究院院长徐讯对《中国科学报》记者说道。
2011年1月,国家发展改革委员会批复同意深圳依托华大基因研究院组建深圳国家基因库。当前已建成的国家基因库一期主体工程占地面积4.75万平方米。“三库两平台”,是梅永红描述基因库内容时使用频次最高的一个概念。
据梅永红介绍,与美国、欧盟、日本其他三大世界级的基因库不同,中国国家基因库不仅仅是数据库,而是国际上现有的各类生物样本库、数据库、生物多样性库、疾病库等的综合升级版。除了“干库”即基因、蛋白、分子、影像等多组学生物信息数据库,“湿库”即多样性生物样本和物种遗传资源库之外,国家基因库还引入了“活库”即生物活体库,包括动物资源、植物资源、微生物资源和海洋资源等。
国家基因库的装备也可谓是“豪华级”。国家基因库数字化平台装备了150台BGISEQ-500型测序仪和1台RevolocityTM测序仪,目前总数据产量将达到每年5Pb,相当于一年5万人全基因组或是1000万产前筛查的数据产出规模,升级后的系统预计年产数据可达10Pb,将成为全球最大的数据产出平台。同时,国家基因库开放数据中心已经建成了20Pb数据的可访问能力,并规划在二期完成500Pb的可访问能力,能力上将超越国际三大基因数据中心。
与普通人息息相关
基因技术看起来很“高大上”,实际上与我们的日常生活有着密切的关系。
当前,中国每年大概有1700万新生儿,每年的出生缺陷率有5.6%,已知的大概有7000种遗传病,包括人们较为熟知的唐氏综合征等。为了应对出生缺陷,国家在婚、育前阶段,产前阶段和新生儿阶段建立了三级预防体系。近年来,基因测序技术已经在三级预防体系里发挥了越来越重要的作用。
“比如,在婚前,利用基因测序技术可以开展面向普通人群和高风险人群,尤其是有家族遗传病史的人群,进行遗传病筛查,尤其是致死、致残率比较高的遗传病。另外,在辅助生殖领域,可以通过二代基因测序技术,检出在植入前常见的染色体非整倍体大片段的缺失或者是重复,筛选出健康的胚胎进行植入。”华大基因副总裁和首席市场官赵立见介绍说。
在面对一些罕见病的诊断上,基因测序技术也发挥着重要的作用。“2014年,河南的一个女婴出生之后,抽出的血是牛奶状的,最后通过基因测序技术帮助这个患儿确定了她有一个LPL基因的突变,最后诊断为她是高乳糜微粒血症。”赵立见说。
“以前,大家没能把这些罕见疾病的信息和样品集中管理,并同时链接到科研机构、科研团队的组织,罕见病也很少被大药厂关注。如今,国家基因库的罕见病数据库可能是目前世界上测了最多的罕见病的数据库。目前我们已检测的家庭将近3000多个,发现了400种以前从来没有人报道过的罕见病。”徐讯说,“此外,国家基因库还将发起一系列的科研志愿者活动,其中包括涉及很多罕见病的活动,号召大家捐献样品,引起全世界科学家的重视去参与罕见病的研究,提高发现罕见的、未知原因疾病的治疗和诊断方法的希望。”
另外,在人们普遍关心的肿瘤问题上,基因测序技术也能发挥重要作用。“一是在预防方面,包括遗传性肿瘤的早期预测和早期诊断;二是在目前相对应用比较广泛的诊疗领域,包括肿瘤个体化的应用指导;三是在转移和预后的监测方面。比如,好莱坞明星安吉丽娜·朱莉在前几年做了基因检测后,发现自己有乳腺癌的潜在风险,她就切除了乳腺,切除后她发生乳腺癌的几率从原来的87%降到5%。还有一些其他的家族性患癌风险,也可以通过基因测序技术进行早期的检测。”赵立见说。
在徐讯看来,在国家基因库建立的十几个数据库中,癌症数据库可能是未来访问最频繁的一个。“目前国际癌症组织所有的数据信息都存储在此,未来这个数据库将会为全球提供癌症数据,其中包含上万份不同类型的癌症数据,对未来疾病的诊断和治疗具有重要的意义”。
此外,国家基因库还会提供包括干细胞和免疫细胞保存的公共平台,可以进行个人保存,也可用于科研和应用的转化,相当于捐献样品。“保存在国家基因库这样的国家机构,相对于保存在商业机构会更有价值一些。对普通人来讲,每个人都可以把自己的样本保存起来,年轻时储存的样本,像老照片一样,是那一生命的瞬间,从疾病的预防和诊断甚至未来治疗上来讲,留下来就可能有用。”徐讯说。
赵立见也建议,趁着正值壮年,人们可以先把自己的血液、组织标本存储到国家基因库。
共享、共有、共为
随着国家基因库的开始运行,一个名为“基因组合成与编辑平台及基因组合成2020计划”的项目也正式启动。该计划将在2020年完成10万个噬菌体的合成,完成全球第一个动物基因组、全球第一个植物基因组以及人类21号染色体的合成。
“这是与中国科学院深圳先进技术研究院合作的项目。”徐讯说,该项目的完成将可能会在疾病治疗方面产生新的希望,也将对人类自身和生命本质的认识产生一个新的质的飞跃。
同时,国家基因库还将启动两大项目——数字化瑞丽植物园和母婴大人群队列研究。瑞丽植物园数字化项目将完成整个植物园内50万株不同植物、5万个不同动物和100万个不同微生物的全面影像数字化,是第一个全植物园林数字化项目。不仅仅有利于生态保护,还将对科研和资源的利用起到巨大的推动作用。
母婴大人群队列研究,将联合全国多个省市、地区共同启动,从母亲怀孕到孩子4岁之间的关键时间点,对母亲和孩子的关键的遗传信息、关键的生物样本和一些生理特征进行详细的保存,建立母婴健康队列,同时为母婴健康的精准医疗提供数据库服务。
“国家投资设立国家基因库,实际上就是希望我们的基因资源能够造福于国人,能够为我们的生命经济产业起到支持作用。我们也希望更多的人来使用我们平台和资源,也需要国家政策及战略来支持和引导。”徐讯说,“另外,这些生命资源的收集、开发和利用不能,也不可能只由国家基因库一方来完成,需要集全球各家之优势,共同去完成。”
梅永红同样也认为,“国家基因库是开放的平台,一个基因库拥有的资源总是有限的,我们希望通过更好的机制,让大自然馈赠给人类的基因资源能被充分地认知和利用。”
对于未来的发展,徐讯表示,今后国家基因库会启动更多类似“基因组合成2020计划”“数字化植物园”“数字化动物园”的全球性合作项目,来推动行业的发展。同时,国家基因库不仅是一个国家性的平台,还将建立一个国际化的标准,这个标准也是未来整个行业发展很重要的基础。“国家基因库将聚全球之力,共享、共有、共为,为物种多样性提供新的保障,为精准医学提供大数据支持,为生命时代引领健康生活”。