位于国家基因库第三层的高通量基因测序房,是我国建成的首个PB级国产化数字化平台。国家基因库供图

在山海交映、远离都市喧嚣的深圳大鹏新区观音山一侧,藏着一个我国重要的科研机构——深圳国家基因库,这里被喻为承载生命希望的中国版“诺亚方舟”。

走进这座外观庞若巨大梯田的建筑,记者首先看到一头猛犸象的雕塑,下面书写着“永存、永生”的字样。深圳国家基因库合作与联盟负责人万仟解释道:“在全球范围内,许多生物物种正以前所未有的速度消失。日臻完善的基因技术,或许是拯救濒危生物的最后一丝希望。只有将基因资源存储起来,才可以保持物种永远繁衍生息、不被灭绝,永存才能永生。”

目前,深圳国家基因库细胞、血液、组织等生物样本的保存能力超过2000万管,已成为全球最大的综合性生物资源样本库。

巨大存储能力▶▷

成全球最大综合性基因库

21世纪以来,伴随着基因组学、蛋白组学技术以及生物技术与信息技术的融合发展,生命科学领域的研究和产业发展进入崭新的时代,生命科学研究和生物技术发展也成为国家重要的战略性资源。

在这样的背景下,2011年1月,国家发展改革委员会正式批复同意组建国家基因库。经过5年时间的建设,2016年9月22日,国家基因库在深圳正式投入运营。

国家基因库的第三层,是我国建成的首个PB级国产化数字化平台。在隔着透明玻璃的基因测序房内,摆放着150台华大自主研发的BGISEQ-500桌面式基因测序仪,以及一台RevolocityTM超级测序仪。目前,该平台数据产出能力可扩至8PB/年。万仟告诉记者,国家基因库数字化平台的国产化、自主知识产权的测序仪,对我国生物遗传资源的安全性具有重要意义。

在数据存储能力方面,国家基因库目前可实现对基因信息数据总量达500PB的访问支持,基因信息数据存储能力达60PB,数据存储能力已超越美国、日本和欧洲等国际三大基因库。

这是一个什么概念?若以一部高清电影2GB、一首歌5MB来算,那么60PB相当于超过3000万部高清电影,近130亿首歌曲。

“深圳国家基因库不仅拥有数据库,还拥有样本库以及活体库,目前世界上其他国家还没有此类综合性基因库,深圳国家基因库现已是全世界最大的综合性基因库。”万仟说。

“三库两平台”▶▷

实现对基因资源“存、读、写”

与国际上其他基因库以“存基因”为主的使命不同,深圳国家基因库除了拥有强大的世界一流的存储能力,还利用其高通量、低成本和自动化的特点,打通了基因从解读到重编,从设计到合成的一体化流程。

据万仟介绍,深圳国家基因库的核心功能可概括为“三库两平台”:“三库”由生物样本资源库、生物信息数据库和生物活体库组成;“两平台”则为数字化平台、合成与编辑平台,以具备对海量生物资源“存、读、写”的能力。

简单来说,生物样本资源库存储各类生物样本,从中提取DNA,再进行测序和解读,以获得基因排列分布数据。而测序和解读带来的信息数据,一方面存入生物信息数据库,另一方面可以通过合成与编辑技术用于样本改造,应用于医疗、农业、海洋等领域,同时基因组编辑和合成改造也需要基因组测序来验证评估和进一步解读。合成与编辑可以帮助加速基因组的认识,而基因组的不断深入了解使得编辑和合成效率更高,应用更为广泛。此外,生物活体库致力于打造成为中国“诺亚方舟”,建设应用、健康、全球生物多样性示范基地和活体示范库。

万仟表示,国家基因库构建的“三库两平台”中的合成与编辑平台,目前已初具规模。其中,国家基因库参与的继人类基因组计划后,全球基因领域第二个超大标志性国际合作项目——“人工合成酵母基因组计划”,标志着我国基因组设计编写能力达到了前所未有的高度,具有里程碑式的意义。

“未来,国家基因库将继续瞄准世界科技前沿,不断提升平台能力和拓展平台功能模块,实现基因资源“存、读、写”的有机联动,在资源保护及全面数字化的同时支撑新的产业转化和应用。”万仟表示。

新的产业革命▶▷

带动万亿级生物健康产业

“深圳处在改革开放的前沿,它的包容、开放、科技实力、经济实力、前瞻性使得深圳是一个适合承载国家级项目的地方。”问及国家基因库缘何落地深圳,万仟如是说。

其实,国家基因库快速发展的背后,同样离不开深圳这片创新沃土。深圳“十三五”规划纲要就特别强调了“增强源头创新能力”,布局建设一批具有国际先进水平的科技基础设施,形成重大源头创新与前沿突破的强力支撑。

依托强大的生命科学研究和生物技术能力,国家基因库将为广东乃至世界,持续孕育和催生出新的产业革命。

“从长远来看,基因库所蕴藏的数据其经济价值对于生物产业是无价的。”万仟认为,通过国家基因库“三库两平台”的能力提升,将更好驱动低温存储产业、仪器制造业、数据存储、计算等IT技术、现代农业、生物制造、医学诊疗等领域的技术革新和产业发展,“将带动和支撑数个万亿级生物健康产业的形成”。

目前,已与深圳国家基因库建立战略性合作的国内外科研机构和行业组织有100多家。而作为一个公共服务平台,国家基因库所提供的开放样本、数据资源以及强大的基因读、写能力,对生命科学行业的发展起到了巨大的推动作用。

根据2017年印发的《广东省战略性新兴产业发展“十三五”规划》,我省明确提出要强化生物产业创新发展技术基础,加快产业化进程,力争到2020年,全省生物产业产值规模突破6000亿元。而在国家基因库的支撑下,广东未来生物科技产业的增长与升级,将更有底气。