北京时间2021年11月19日晚,国际人类表型组研究协作组(IHPC)第三次理事会在线召开。来自19个国家21位协作组理事和多位表型组学领域的一流科学家出席了此次会议,就下一步加快推进人类表型组国际大科学计划的重要事项展开国际协商和深入探讨。
人类表型组国际大科学计划协同创新稳步推进
经理事会决议,维也纳医科大学核医学系主任海克尔(Marcus Hacker)教授、马来西亚斯特雅大学(UCSI)健康医学系何文彬(Hoh Boon-Peng)教授和智利大学副校长、千禧年免疫与免疫疗法研究所昂弗雷(Flavio S. Onfray)教授被增选为协作组理事会理事。经过此次增选,已有来自覆盖六大洲20个国家、23家机构的学者加入国际人类表型组研究协作组,推进人类表型组国际大科学计划国际科技合作与协同创新网络得到进一步优化。
国际协作组的三位共同发起人美国系统生物学研究所胡德(Leroy Hood)院士、澳大利亚莫道克大学国家表型组学中心尼克尔森(Jeremy Nicolson)院士和中国复旦大学金力院士分别就一年来人类表型组大科学计划所取得的各方面进展做主旨汇报。德国莱布尼茨环境与医学研究所克鲁特曼(Jean Krutmann)院士代表数据共享专业分委会向全体理事介绍了“人类表型组计划跨境数据共享与开放原则”草案,并提交全体理事协商通过成为国际人类表型组协作组成员间的国际共识。日本国立成育研究中心梅泽明弘和印度理工学院(焦特布尔)慕克吉(Mitali Mukerji)教授分别作为伦理、法律与社会规范专业分委会和标准与技术规范专业分委会的成员代表分享了各自的最新研究进展和研究计划。
会上,全球第一本专门聚焦表型组研究的同行评审国际学术期刊Phenomics(《表型组学》)执行主编、复旦大学人类表型组研究院副院长丁琛教授向各国科学家汇报了该刊创刊一年来的发展情况。据悉,《表型组学》已刊发6期25篇高质量学术论文,前期共收到10个国家70篇投稿,已经成为国际学界交流分享表型组学前沿创新成果的重要国际平台之一。
协作组秘书长、上海国际人类表型组研究院副院长、复旦大学特聘教授田梅主持了当天的会议。上海国际人类表型组研究院作为IHPC秘书处组织承办了此次在线理事会。
复旦领导中国科学家团队初步绘制全球首张人类表型组参比导航图
表型是生命体的生物特征。表型组,是指生物体从微观(即分子)组成到宏观、从胚胎发育到衰老死亡全过程中所有表型的集合。基因(内因)与环境(外因、含环境暴露和生活方式)共同决定了表型。人类表型组计划就是要基于“测一切之可测”的理念,对人类的各种表型进行全尺度、全周期精密系统测量,从而解析基因-表型-环境之间以及宏观-微观表型之间的关联,进一步破解各种表型和人类健康与疾病的关系。因此,国际科学界已充分认识到,人类表型组是继基因组之后生命科学的又一个战略制高点和原始创新源,人类表型组大科学计划将深刻地改变生命科学领域的科研面貌,引领生命科学的范式变革。
人类表型组计划的首要目标就是要为未来的生命科学研究绘制“导航图”。这是一张什么样的图呢?中国科学院院士、复旦大学校长、上海国际人类表型组研究院院长金力介绍,人类表型组的“导航图”就是几万种甚至十万种不同人类表型之间的关联图。他强调,“科学家们通过按图索骥,可以大大提高生命科学的创新效率,大大提高我们对生命现象认知的能力”。而这张“导航图”,将为科学家未来进一步解析复杂生命系统的机理与奥秘指明新的方向、提供有价值的线索,是具有战略性意义的生命科学原始创新源,有望引领新一轮健康科技与生物产业变革。
在19日当天的国际协作组理事会上,金力院士介绍了中国科学家团队正在绘制的全球首张人类表型组参比导航图的研究情况。
据悉,作为上海市市级重大专项“国际人类表型组计划(一期)”的核心任务之一,依托在张江复旦国际创新中心建成的世界首个跨尺度、多维度人类表型精密测量平台和自主研发的全过程、自动化表型组大数据平台,中国科学家从2020年起开展了“上海自然人群健康表型核心队列研究”。截止2021年11月19日,已有超过730位常住上海的20-60岁志愿者完成了在张江平台2天1夜、每人测量超3万个指标的全景表型测量,使科学家首次获得了自然人群样本贯通宏观至微观尺度20余个领域类别的海量表型基线大数据,数据总量超过了3PB。经过多学科团队对现有数据的协同分析攻关,科学家们发现了不同表型间超过150万个强关联,其中约39%为跨尺度关联,且大部分关联是科学界首次看到。通过这些强关联形成的网络,中国科学家初步绘制了基于上海核心队列的全球首张人类表型组参比导航图。目前,面向科研用户的导航图数据库网站已经上线公测,多支科学团队正在从现有1.0版的导航图中,筛选具有重大科学意义和应用价值的强关联,开展进一步科研攻关。
各国科学家就人类表型组科研数据跨境共享原则达成共识
根据构想,人类表型组国际大科学计划最终将在全球各大洲代表性人群中进行5万人、每人10万个以上表型指标的全景测量和超过50万人的特定表型应用示范测量。要实现这一宏大目标,不可能全部由一个国家、一个团队完成,一定需要全球多个团队通过统一标准下的“分布式”协同测量与数据分享最终实现。因此,科研数据的跨境共享与开放是人类表型组计划不可或缺的前提条件。
19日的第三次理事会上,经过各国科学家的充分探讨与协商,国际人类表型组研究协作组(IHPC)理事会就人类表型组大科学计划下科研数据跨境共享与开放的基本原则达成共识。在兼顾安全和开放两大精神的指引下,相关原则共识共有6条:
一是采纳“FAIR”原则。即“寻获性(Findability),可及性(Accessibility), 互用性(Interoperability)和复用性(Reusability)”。这是目前全球主要科学数据共享机构普遍采纳的数据共享原则标准。
二是安全合规。数据安全与合法合规是人类表型组数据共享和开放的前提。人类表型组科研数据的采集、传输、保存、使用、分享、公开、销毁等数据全生命周期中各阶段的处理工作需要遵循当事国家和地区的法律法规。应根据数据生产者、处理者和使用者所在国家或地区的要求,满足相应的法律和道德伦理要求,保障当事方合法权益,确保人类表型组科研数据的安全共享、合法共享、规范共享。对于有关分歧,各方应以平衡、友好和基于科学的方式,协商探讨务实的解决方案。
三是数据标准化。数据的标准化是国际人类表型组计划进行数据共享和联合科学研究的基础。会议确认,IHPC将致力于研究和建立国际人类表型组科研数据标准化体系。协作组鼓励成员积极推动覆盖采集、分析、治理、使用、共享全周期的数据标准化工作,共同制定相关国际标准,以促进国际人类表型组计划更高质量的数据分享与开放。
四是分类分级。为了便于数据的分享和公开,应该将科学数据进行分类分级管理,不同类型、级别的数据适用不同的分享与开放原则。分类分级可以先由各国科研团队根据科研工作的实际情况进行,未来协作组将致力于通过成员间协商协调,形成国际人类表型组数据分级分类标准体系。
五是多模式分场景共享。为了更有效的进行数据共享,除了传统的数据复制共享模式外,协作组还鼓励各国科研机构开展算法共享、隐私计算、联邦学习等多种创新数据共享模式。
六是探索最佳实践。协作组鼓励各国科研团队通过科研实践参与到相关国家(地区)的法律与规则制定和实施过程中。探索在不同国家法制背景下,实现国际科研合作与数据跨境共享的最佳实践。