微生物在地球中无处不在,隐藏在人们的皮肤、肠道以及土壤、河流、海洋等环境,构成一个个复杂的微生物组(microbiome)群落。它们在不同环境下与不同宿主共生互动,成为影响人类健康、疾病发展、地球生态变化的重要因素。传统微生物组研究按照人类微生物、海洋微生物等不同栖息地分别进行研究,无法在全球视野下描述不同栖息环境中微生物群落的相互关联。
复旦大学类脑智能科学与技术研究院(下文简称“类脑研究院”)青年研究员路易斯·佩德罗·科埃略(Luis Pedro Coelho)、教授赵兴明、名誉教授皮尔·伯克(Peer Bork)与多国科学家合作研究,基于全球微生物组(global microbiome)的概念,将地球上不同栖息地的微生物作为统一系统,运用人工智能技术对1.3万个公开宏基因组样本进行挖掘,构建了迄今为止最全面的全球微生物基因目录 (GMGC,Global Microbial Gene Catalog),为全球微生物组研究迈出了重要一步。该研究同时发现,大多数基因具有栖息地特异性,跨越多栖息地的基因主要富集在抗生素耐药性基因和移动遗传元件。
研究成果《原核生物基因的生物地理学研究》(“Towards the biogeography of prokaryotic genes”)12月16日发表于《自然》(Nature)主刊。科埃略是第一作者和共同通讯作者。
构建迄今为止最全面的全球微生物基因目录
基因目录对于描述微生物群落的物种组成和功能特性具有重要意义。全球微生物基因目录(GMGC,Global Microbial Gene Catalog)涵盖了肠道、口腔、皮肤、海洋、土壤等 14 个微生物的主要栖息地,收集了 13174 个公开可用的高质量宏基因组和84029个高质量的基因组,得到了包含3.03亿个物种级的基因(95%的核酸一致性聚类),构建了迄今为止最全面的全球微生物基因目录,将为地球生态研究和人类健康研究提供重要贡献。
揭示微生物基因与栖息环境的重要关联
物种水平的单基因簇(unigene)可能代表着来自多种栖息地的基因(multi-habitat genes)。多栖息地基因可能来自在多种栖息环境中都生存的物种,或者来自基因组之间或者跨越栖息地边界水平转移的移动遗传元件(mobile elements)。研究发现,大多数基因都是栖息环境特异性的,这与微生物倾向于适应环境的特性是一致的;只有5.8%物种水平的单基因簇是多栖息环境基因,多栖息环境基因主要富集在抗生素耐药性基因和移动遗传元件。
研究者们发现大多数单基因簇是出现频率低于0.1%的罕见基因。单基因簇的频率服从中性(或接近中性)进化假设下的幂律分布(power law)。事实上,虽然观察到很多变异,但大多数变异并不是对环境的适应,而是由所谓的“中性进化”驱动:变异只是随机的结果,而不是达尔文选择。
这些发现对于理解抗生素抗性的产生,以及未来抗菌药物的研发具有重要的意义。
国际化研究团队多学科交融
类脑研究院生物医学人工智能团队聚焦于人工智能与生物医学交叉研究,自2018年以来引进一批国内外优秀学者,拥有计算机、数学、生物、物理等不同学科背景,交叉融合。近年来,围绕生物医学大数据的特点,发展了一系列人工智能算法,已成功应用于脑-肠轴、脑发育和脑疾病等场景中,相关工作发表于《自然》(Nature)、《科学》(Science)、《细胞》(Cell)、《细胞·新陈代谢》(Cell Metabolism)、《电气与电子工程师协会·模式分析与机器智能》(IEEE TPAMI)和《自然·通讯》(Nature Communications)等期刊。2020年,团队获吴文俊人工智能自然科学一等奖。
论文第一作者科埃略于2018年全职加入复旦,此前专注于利用宏基因组及显微图像技术对微生物群体进行分析。进入复旦类脑研究院工作以来,他与研究院生物大数据团队、计算生物学团队等多个研究组合作交流,作为课题骨干参与多个生物医学大数据、脑科学与类脑研究等重大研究计划,聚焦利用大数据的方法从事微生物组及精准医学等相关研究。
类脑研究院生物医学人工智能团队负责人赵兴明教授介绍,本研究构建了一个全球视域下的微生物基因目录,对于理解微生物与人类健康的关系具有重要的作用。下一步,团队还将基于所开发的基因目录,进一步与国内外科研院所和临床医疗开展合作,探究微生物包括人体肠道微生物与人类生命大健康、大脑认知和行为等方面的影响。
论文链接:
https://www.nature.com/articles/s41586-021-04233-4