泱泱中华,历史悠久,文明博大——复旦大学在“十四五”规划中设立文理交叉重大科研项目,探讨中华早期文明的形成与发展。正式运行一年以来,中华早期文明跨学科研究计划项目集中多个相关学科优势,强强联手,集体攻关,取得一系列丰硕成果。5月16日上午,在以“璀璨中华,文理交融”为主题的校庆学术报告会上,围绕历史地理、古文字、语言学、考古、遗传、世界文明参照系等6大方向以及项目研究成果的最终呈现系统,项目成员代表分享了各自研究进展。
穿越时空,找寻古代文明的框架
中华早期文明起源及中华文明的演进过程,是五千年以来在中华大地上这一时空范围中不断发展、形成的。要开展这一时空演进过程研究,首先要推动中华早期文明时空框架建设。
“我们的工作不仅涉及历史地理学,也包括考古学、分子人类学、语言学等其他学科。比如很多早期历史遗迹的考证,是无法利用历史文献完成的,这就需要考古学的贡献。”中国历史地理研究所所长张晓虹表示。
利用学科交叉手段,依托于现有两大平台——复旦大学与哈佛大学合作研发的中国历史地理信息系统(CHGIS),以及中国历史地理信息平台,张晓虹团队开启了构建中华早期文明时空框架的工作。由于缺乏历史文献,对考古时期的中华文明时空信息数据化存在诸多困难:“很多工作都是基于现代地名,但现代地名跟历史时期的数据怎样去匹配,这是需要解决的。”
采用历史GIS方法,张晓虹团队成功实现了精细化的数据管理和定位,建构出了适用于关系型数据库的中华早期文明历史地理框架。未来,这一框架将进一步扩展至非关系型数据库,并支持后期数据量的增大、表结构的扩展。“目前,秦至隋唐时期,每年的历史政区变迁都是明确的,未来我们还会进一步丰富和完善这个框架。”
对于文明的认定,有哪些要素和通行标准?这离不开对世界古代文明的参照。历史学系教授欧阳晓莉介绍了世界古代文明参照系子项目的情况。
“世界主要的古代文明,如两河文明、埃及文明等,文明下限远早于中华早期文明的下限。”欧阳晓莉说,域外古代文明的研究为中华早期文明研究提供了参照和比较对象,也利于将中华文明的研究发现融合到世界文明的研究体系中,使得世界古代史的学科建设既保持自主性,也体现包容性和开放性。
横贯古今,揭开基因交融的奥秘
中华民族如何演进至今?生命科学学院教授徐书华分享了基因大数据方法在中华遗传源流溯源方面发挥的重要作用:“中华民族大家庭包含众多的族群,但我们之间有共同的基因纽带,标志着我们中华民族的身份认同存在遗传学基础。”
以现生人群为研究对象,徐书华团队构建出了汉族、北方少数民族、南方少数民族的主要基因遗传格局。“比如汉族,有总体上的聚类关系,但进一步去看,也有南北之分。北方汉族和北方少数民族的交融关系更近一些,南方汉族和南方的少数民族关系更近一些。”
“丝绸之路”也一直是徐书华研究的重点。这一区域的基因信息体现了分化人群的再次接触和遗传交融。我们通过基因大数据发现,维吾尔族人群的基因构成体现了西欧、东亚、南亚等多个区域的影响,与东部人群包括汉族在内形成“你中有我、我中有你”的格局,这也是历史上“丝绸之路”交汇各方文明的真实体现。
从考古学视角出发,中华民族的基因又是如何交融的?科技考古研究院副教授文少卿介绍了团队基于生物剖面的早期中国人群基因组研究。
通过对从仰韶文化到夏商周时期五大生物地层进行样本分析,并纳入汉唐长安城、宁夏、山东、大西北地区四大生物剖面,文少卿团队致力于发现不同历史时期人群间的遗传关系以及内部结构。“例如,我们计划获取一百个完整的颅骨数据和一百个基因组数据,以探索汉唐时期民族大融合的基因变化。”
聚焦新石器时代以来黄河下游人群,他们获得了许多意想不到的发现。比如,在大汶口时期,山东的人口分化出包含黄河中游成分、本地采集狩猎成分、南方成分的亚结构;在商周时期,土著国的本地基因成分偏多,被分封国的中原基因成分升高。“最引人注意的是,从距今3000年的节点开始,山东的遗传结构就保持不变,基本与现代山东人一致。”文少卿说。
一字一语,解码融合演化的历史
出版120万字的第一部古文字专业研究生综合教材《出土文献与古文字教程》、成功申报国家社科基金项目多个重大项目和专项项目、入选第三批“全国高校黄大年式教师团队”……出土文献与古文字研究中心研究员张传官介绍团队近年获得的成果时说,这既离不开大家辛勤的努力与优异的学术能力,也是数据库建设推动古文字研究的重要体现。
团队近年来建设的几大数据库具有“多专一总”的特点。“一总”,指以2022年立项的“先秦秦汉古汉字资料数据库”项目为核心,致力于汉代以前古汉字资料的全面数字化。“多专”,指在此基础上建设了马王堆汉墓简帛数据库、“缀玉联珠”甲骨缀合信息库、“四方会同”甲骨著录信息库、“贯联汗青”简牍缀合信息库等多个数据库,兼具整体性和丰富性。
这些数据库在建设过程中,不仅重视学术方面的专业性,也考虑了信息公开的便利性。“这些数据库都是对外展示的,非常方便查阅。大家都可以自己去点击,熟悉它的体例、功能。”张传官现场演示时说。
与文字相似,语言也在历史变迁、人群融合中不断更迭。那么,诸多语系是如何起源并演化的?现代语言学研究院研究员张梦翰以侗台语为切口,开展了相关研究。
“侗台语的地理分布恰巧落于几个语族的交汇处,北面是藏缅语人群,南面是南亚语人群,东面是苗瑶语的人群。在人群频繁接触和混合的过程中,侗台语的演化十分典型。”
通过收集数据并构建贝叶斯语言系统发生树,他带领团队构建了早期侗台语在约4000年前于中国南方沿海地区分化并向外传播的模型。为了探寻扩张的原因,他将语言学、遗传学、考古学、古生态学和古气候学数据在同一时间纬度对齐,并发现,侗台语语言的演化可能与全新世晚期中国气候变化影响的人群扩张和农业传播密切相关。
“4000年左右的气温改变对应着水稻的存活率下降,而群体遗传的人口数目不变,意味着群体可能会向外寻找了新的栖息地和食物来源。人在大规模迁徙时遗留下的考古遗址也较少,这些都与语言的分化时间对齐。”由此,他发现了“农业-语言共扩散假说”的第二种可能性,即农业衰退驱动人群迁徙的模式。
一“元”集成,打破学科数据的壁垒
在跨学科研究中,不同学科的数据差异性很大,海量数据形式多样、来源广泛且分散在各处。工欲善其事,必先利其器。如何储存跨学科数据?如何支持跨学科学者交换、查询、利用数据,从而实现跨学科数据的融合式、可视化呈现?
“在跨学科研究中,需要图书馆把不同学科的数据集成起来。”人文社科数据研究所副教授潘晓声介绍了团队探索制定的人文社会科学平台核心元数据标准。
通过标准制定,团队完成了语言学、历史学、考古学、古文字、历史地理学、遗传学等多学科数据资源的规范性描述、快速定位、检索和共享提供支撑。例如,语言学元数据标准规范涵盖11个元数据元素和5个实体,规定了语言学数据资源核心元数据的描述方式、结构及其组成要素,支持跨学科学者迅速、准确地获取语言数据。
“最终,经过数据清洗整理,我们根据不同学科的要求做成数据大屏,以展示不同学科的数据分析手段与成果。”潘晓声展示了“稻”在东亚语言中的地理传播可视化界面。
通过可视化界面可以看到,“稻”在汉语方言区和少数民族地区的读音记录数据,变成了清晰形象的图表。语素的关系图直观显现不同读音之间的距离变化,体现了语音相似性差异;声、韵母音变链的可视化,也体现了“稻”读音的演变轨迹,它可以进一步映射到地理空间之上,间接提示空间上的传播途径,为进一步研究提供便利。
知其来路,方能致远。复旦将继续走学科交叉之路,将古老的历史知识与现代科技手段结合,回应“何以中国”之问,为中华文明的繁荣复兴贡献复旦智慧。