作为汉文化的重要载体之一,汉语方言在全球拥有超过14亿的母语人口,其传播与演化的机制一直是人类学界与群体遗传学界关注的焦点。在汉语方言的演化历史中,由自然灾害、战争或经济因素驱动的大规模人群迁徙以及科举制度、印刷术所促进的社会学习等因素都在其中扮演了重要角色。
此前,对汉语方言传播模式的研究大多依赖历史材料和语言调查材料的比较总结,并辅以遗传证据为佐证。然而,由于缺乏对汉语方言内部精细结构的定量分析,以及对于汉族人群中语言差异和遗传差异间的一致性检验,目前尚难以全面刻画汉族人群语言演化的全貌。
2024年5月13日,复旦大学现代语言学研究院、复旦大学智能复杂体系基础理论与关键技术实验室张梦翰研究团队(POPLANG)携手生命科学学院徐书华教授团队及金力院士团队在《自然-人类行为》(Nature Human Behaviour)发表题为《大规模词汇和遗传比对支持汉族人口扩张和文化传播的混合模式》(“Large-scale lexical and genetic alignment supports a hybrid model of Han Chinese demic and cultural diffusions”)的重要研究成果。
该研究系统整合了语言学、群体遗传学和生态学等多学科的理论和方法,深入解析了汉语方言内部的精细化结构和地理分布规律,同时结合现有的群体遗传数据,系统分析了中国各地语言和群体遗传结构之间的关系,透视了汉文化传播和融合的多重模式,为探究汉族人群的人口活动与语言文化交融的复杂历史提供了全新的视角。
定量分析“方言熔炉”
在研究中,团队首先通过对926个方言点的1018个词汇特征进行量化分析和空间投影,并发现汉语方言的多样性与地理分布密切相关,其词汇差异呈现明显的南北梯度分布,而大型山川河流作为地理屏障,进一步促进了方言群体之间的分化。
为进一步揭示汉族人群人口活动与方言融合历史,研究团队通过基于贝叶斯祖源推断方法,解析了各汉语方言的内部祖先成分。柱形图中不同颜色区块对应的成分代表了汉语方言发展历程中通过谱系分化或深度交融而形成的共有词汇特征,体现了方言群体间的分化和接触历史。另一方面,研究团队利用词汇特征频率数据构建了最大似然谱系树,在此基础上建模重构方言融合事件,推断了参与融合的方言群体、融合发生的方向以及对被融合方言词汇系统的影响比例。
综合多种方法分析的结果,研究团队发现中国中部地区方言呈现出多重来源的语言接触痕迹,形成了所谓的“方言熔炉”,特别是江淮官话、西南官话和赣语的使用地区,方言的特征显示了多样的语言成分集成,从而构成了复杂的方言体系。如此深度的语言接触和融合反应了不同方言群体长期共存以及互相作用的结果。
这一系列定量分析所揭示的语言融合模式与汉族历史上自北向南的大规模迁徙以及“江西填湖广,湖广填四川”等历史事件密切相关。
比对语言和遗传结构
为探究方言传播与融合背后的驱动力,研究团队对比了中国汉族人群的语言结构和遗传结构之间的关系,发现语言、基因、地理距离三者间分别存在两两强相关性。但当基因距离保持不变时,语言和地理分布之间的相关性变得不显著,这表明语言差异的形成伴随着人群遗传结构的变化即人口扩张模式(demic diffusion)在汉语方言演化中起到了主要作用。
通过进一步的线性回归分析,团队还揭示了各省份南北方基因成分和语言成分的比例,反映出汉语方言传播的复杂地区性模式。
在中国中部地区,人群扩张模式尤为显著,北方基因流与北方语言成分对中部地区具有相似的影响程度,对应着大规模人群迁徙造成的语言-基因同步融合。
在云南、四川、贵州和重庆的西南官话地区,文化传播模式(cultural diffusion)的影响更为明显。在有限的北方基因流之下,北方方言特征在这些地区得以快速传播,与明清时期的驻军和屯田带来的社会文化影响密不可分。
在浙江和上海的吴语区、福建的闽语区等,语言同化(language assimilation)在方言演变中也发挥了重要作用,表现为在显著的南北基因融合背景下,当地词汇系统却仍然保持高比例的南方特征。这一现象体现了吴语、闽语等地区性强势方言对于外来的北方移民语言的同化作用。
新文科领域探索不辍
近年来,东亚、东南亚文明探源研究持续受到考古学、语言学等学科的关注。该团队长期致力于采用多学科交叉分析的研究方法探索东亚及东南亚地区的语言演化史,并联合遗传、考古等多学科证据共同探讨整个区域群体和文化演化背后的驱动力。
在回答科学问题的同时,团队还持续构建计算方法,用于分析语言扩散模式及其背后驱动力。2024年初,团队开发了语言速度场估计法,为语言扩散研究提供新视角、新方法。该方法弥补了传统谱系地理法的不足,可以帮助研究者在语言演化不符合谱系树的情况下推断出语言的扩散中心和路径。
此次的研究过程中,量化分析方法与多学科交叉融合是贯穿全程的鲜明特征。
为建立具有代表性的词汇数据集,团队专门开发了特定软件工具,从三卷《汉语方言地图集》中进行特征数据的快速提取,速度相较传统方法提升了三倍。与此同时,团队还花费一年多的时间,整合语言学、群体遗传学和生态学等多学科的理论和方法,设计了一套多学科集成的计算框架,对大规模语言数据和遗传数据进行深入分析和对证。
最终,团队成功解析了汉语方言的精细化结构,并探讨了影响汉语方言形成的潜在驱动力,强调了人口扩张模式之外,社会和文化因素在语言演化中的关键作用,这一发现为了解汉族人群的活动历史提供了关键的跨学科依据,并为进一步研究中国语言的演化及“语言-遗传-文化”共演化提供了重要的参考。
据悉,近年来复旦大学持续布局新文科建设,大力推动研究方法创新。此次团队在汉语方言传播模式研究的重要突破,成为学校在新文科领域的又一重要探索。
团队表示,期待更多对文理交叉研究领域感兴趣的同学加入课题组,共同探索多学科融合创新,为新文科科研添砖加瓦。
论文链接:https://doi.org/10.1038/s41562-024-01886-9