还有什么工作不可能被AI取代,什么工作可以由AI催生?
面对这个具有普遍性的困惑,计算机科学领域杰出学者乔恩·克莱因伯格(Jon Kleinberg)坦言,“我不知道”。
“2008年我们不会想到人工智能将会在视觉分析、语言处理上有那么好的发展,2016年我们也未曾料到人工智能可以和人进行自然的对话。”同样惊诧于AI的迅猛发展的他始终认为,这些科学活动都是人类功能的延伸,“如果没有人类的观察和思考,我们就不可能推进这些工作。”
10月21日,第九期浦江科学大师讲坛在复旦大学相辉堂举行,在搜索引擎算法和社交网络底层架构等前沿领域取得开创性成就的康奈尔大学计算机科学和信息科学讲席教授乔恩·克莱因伯格(Jon Kleinberg)和视觉科学领域卓越的科学家之一、约翰斯·霍普金斯大学医学院分子生物学与遗传学、神经科学和眼科学讲席教授杰瑞米·内森斯(Jeremy Nathans)联袂开讲。
日前,他们在上海被授予2024世界顶尖科学家协会奖。这是2024世界顶尖科学家协会奖获奖者来沪学术交流活动首场活动,他们将出席10月25日在2024世界顶尖科学家论坛开幕式上举行的颁奖典礼。
报告前,上海市政协副主席吴信宝为两位嘉宾颁发浦江科学大师讲坛主讲科学家的纪念证书,中国科学院院士、复旦大学校长金力主持讲坛。市政协各专门委员会、市科技党委、市科委、市教委、市科协、顶科协等单位负责人,上海市各高校、中学师生以及科研人员、校友代表出席活动。
算法与生俱来就有偏见,需关注公平性与多元化
算法视角下的人类世界是怎样的?如何确保算法的公平性?未来人工智能是否会完全替代人类行动?克莱因伯格以“算法视角下的世界:计算与高风险决策”为题,对这些问题进行了回答。
克莱因伯格曾对小世界理论和万维网搜索算法做出开创性工作。他25岁拿下麻省理工学院博士,28岁发表关于“外部网络的HITS算法”的论文。他和各个学科领域开展合作,希望将人工智能更好、更善、更公平的应用于人类社会。如今,他思考并推动算法公平,尤其是当算法辅助人类做出决策时,如何定义和实现公平。
算法让互联网成为“智能生态系统”
31年前,天文学家、康奈尔大学教授卡尔·萨根(Carl Edward Sagan)在一场讲座中介绍了1990年12月伽利略探测器的绕地飞行历程,期间所收集的数据,通过图像特征揭示了大气层内存在丰富的氧气。这场讲座让克莱因伯格受益匪浅。
“90年代初,我们开始将互联网看作是一个巨大的图书馆。”克莱因伯格把计算机科学三十多年的发展史分为三个阶段,随之而来的是社交媒体兴起,互联网被赋予了更多含义——人与人、人与机器在社交网络的接触,产生巨量分享、转发和虚拟社群信息,在互联网空间形成了囊括各种人类行为的生态系统。
2014年以来,人工智能技术的发展使互联网的发展进入第三阶段。“在这个过程中,算法发挥了至关重要的作用,它们能够处理海量的信息,并从中提取有价值的部分。”克莱因伯格指出。
然而,算法的应用也产生许多新的问题,比如怎样通过算法分析获得更多信息?虚拟信息是否能转化为可研究、可加工的素材?为此,有效利用机器学习和人工智能技术,能让当前以人工智能作为基础的互联网生态体系更为健全。
算法视角解码人类活动“热点”
数字时代,海量的数据如何改变人类?算法视角下的世界是怎样的?
克莱因伯格团队通过分析数百万用户的照片、搜索引擎查询以及移动设备的位置信息,识别地球上人类活动的“热点”。这些“热点”不仅是物理空间中的聚集点,更是特定时间段内人们社会活动的中心。
旅行、度假、家庭、朋友……人们会在社交平台对这些地点进行标记。在一个城市著名地标周围,或是大型公共活动期间,都会形成显著的数据密集区。
在克莱因伯格看来,数据表面就能提供很多意义,大模型可以挖掘出更多信息。他们对地理标签数据进行热力图分析,借助大语言模型从纷繁复杂的数据中提炼出有用的信息,分析其中的高频词汇、特殊词汇,从而准确定位并描述这些“热点”。
这种基于大数据的研究方法,在两个不同的尺度上进行:以大约100公里为半径的大都市规模,和缩小到仅约100米的地标级精细度。这不仅有助于人们更好地了解大范围内的人口流动趋势,也能对单个地点有更加清晰的认识。“当我们使用算法来分析这些数据时,我们可以发现许多有趣且重要的社会和文化内涵。”
这项研究有助于提升城市规划、旅游管理、灾害响应等多个领域的工作效率。“随着越来越多关于人类行为模式的数据积累起来,未来或许能及时有效地应对更复杂多元的社会问题。”
克服算法偏见,需要公平与多元
“算法与生俱来就有偏见。在设计算法时,必须考虑到多元化的公平标准,并开发新的技术方法。”多年来,克莱因伯格一直致力于探索如何定义及实现算法公平,尤其是在算法辅助人类做决定的场景。在他看来,公平不只是是一个单一标准,而是涉及多个维度。“需要考虑不同的度量标准,确保算法在各个层面上都是公平的。”
有听众提出隐忧——如何在研究中考虑到没有移动设备、无法接入互联网的人?而世界各国人们常用的社交平台不同,又该如何得到更为客观准确的数据和分析?克莱因伯格对这一关切表示赞同,认为研究者们可以从政府、非营利组织、援助机构等渠道获得多元类型数据,开展物理世界和数字世界的综合比对,同时不能只关注某个特定的平台和地点,要全面关注人类对互联网的使用。
“我们必须思考算法对人类生活和后代可能产生的影响。”克莱因伯格强调,除了偏见,算法还可能存在文化单一问题。“如果我们都使用同一种算法去做决定,是否会导致做出的决定高度趋同,导致我们的文化也是高度趋同?”在他看来,人类在使用算法工具的时候,设计者、使用者、研究者都需要保持一定的多元性。
我通常不是人群中最聪明的,但擅长艰苦的工作
为什么人们能看见颜色?为什么有的人难以分辨红色和绿色?为什么男性比女性更容易患有色盲症……杰瑞米·内森斯(Jeremy Nathans)以“色觉、X染色体失活与女性优势”为题的分享,对这些有趣的问题进行了回答。
内森斯曾揭示人类颜色视觉的分子基础,通过基因研究阐明了视网膜发育的机制及其与遗传性眼病的关系。同时,他还探索了基因治疗在视觉系统疾病中的潜力,为视觉科学的研究和临床应用开辟了新的方向,也改变了人类对如何“看”世界的理解。
这两种氨基酸影响人对颜色的敏感度
颜色视觉在现实生活中不仅具有美学优势,还具有实用价值,是一种重要的信息来源。比如对植物而言,颜色能够帮助其吸引昆虫和鸟类为其授粉;对动物而言,可以利用自身鲜艳的颜色对捕食者发出警告,告诉对方“我有毒”。
早在300多年前,人类就已经开始探索颜色视觉的奥秘。1666年,英国科学家艾萨克·牛顿(Isaac Newton)进行了历史上著名的三棱镜色散实验,发现阳光经过三棱镜折射后,会在墙上被“分解”为多种颜色,证明阳光是由多种颜色的光组成的。内森斯认为,这一发现是“对人类颜色视觉最早、最深的洞察”。
20世纪中期,哈佛大学生物学家如特·哈勃(Ruth Hubbard)和乔治·沃尔(George Wald)发现所有动物的视觉都遵循顺反异构的规则。视黄醛11-12位的化学键有顺式和反式两种状态,两个状态之间转换的过程,就是所有视觉产生的过程。所有有视觉的动物都通过光异构化反应获得视觉,前提是在视觉光感受器细胞上具有光受体,才能够将光转化为大脑可处理的信息。
人体具有红、蓝和绿三类不同的色觉基因,不同基因对多个波长的光敏感程度不同,但对某一组特定波长的光的敏感度最佳。内森斯发现,人类感知红和绿的过程中,有三个关键位置的氨基酸起到非常重要的作用,携带不同氨基酸会导致人们对不同的颜色的敏感度不同。
他举了一个有趣的例子,同样是对红色敏感的视蛋白,如果180位的氨基酸是丝氨酸或丙氨酸,会导致人们有4nm的色觉偏差。而这个微小的偏差则会因性别不同而扩大,因为这个基因在X染色体上,使得男性和女性在长波长光谱的感知上有一些差异。
色觉障碍如何产生?他在分子层面阐明原因
从分子基础出发,内森斯开始探究视觉基因的相关疾病。
1794年,英国化学家约翰·道尔顿(John Dalton)第一次发现了色盲症。正常情况下,人类是“三色视者”,其视网膜上的视锥细胞存在三种感光色素,分别能够识别红、绿、蓝三原色。色盲患者则通常缺失或异常表达其中一种或多种色素,不能辨别某种或某几种颜色,包括人们所熟知的红色盲、绿色盲和较少见的蓝黄色盲。
“我相信听众中一定有人色觉跟其他大多数人不一样,这种色觉不一样是由基因来决定的。”内森斯表示,基因决定了人们对长波和中波光线的接收情况。在进化的过程中,编码红色和绿色色觉的基因到了一条染色体上,这一基因重组事件,也是人类色觉变异的根源。
内森斯表示,他对自己的DNA进行了测序,发现他的染色体上就有1个红色和2个绿色的色觉基因,这也是人类物种中最常见的组合。而基因内部的混合重组会导致异常色觉,红绿色盲的分子基础是在染色体上串联排布的红绿感光色素基因异常重组或者基因缺失。
X染色体失活,为女性视觉系统带来了新的可能
一只具有黑色、橘色、白色毛发的花色母猫看似寻常,但却反映了遗传学中一种特殊的现象:X染色体失活。在正常雌性哺乳动物的细胞中,两条X染色体中的一条会失去活性,导致X连锁基因得到剂量补偿,保证雌雄个体在功能上具有相同的基因表达水平。
X染色体失活,正是色盲症男女有别的奥秘。内森斯介绍,人类大部分色觉受体位于X染色体上,如果发生基因突变,就会导致色盲症。女性有两条X染色体,如果其一发生失活,另一条X染色体就会进行代偿,而男性只有一条X染色体,一旦发生病变,无法得到代偿,只能“认栽”。这就是男性比女性患色盲症比例高的原因。
在了解人类颜色视觉基因层面工作机制的基础上,内森斯和合作者进一步探索创新,在一项小鼠遗传和行为研究中,对具有基因缺陷的小鼠进行了基因改造,使得本来只具有长波、中波、短波色素基因中的一部分的二色视觉小鼠能够看到原来看不到的色彩,通过三色视觉测试。
这一惊人发现凸显了视觉系统的非凡可塑性。有听众提问:“X染色体失活能够应用于基因治疗之中吗?”内森斯表示,雌性动物X染色体失活机制有望在基因缺陷疾病诊疗方面解决一些问题,理论上,人们可以通过让让失活的基因重新表达,将突变的基因沉默,但如果一条染色体失活,可能会影响其他疾病的表达。“科学问题就像洋葱,揭开一层还有一层,”他强调,“尽管我们做了多年研究,但还是不了解具体机制,仍然需要做更多工作。”