从“阿尔法狗”(AlphaGo)到“阿尔法折叠”(AlphaFold),人工智能AI逐渐进入大众视野,成为深刻影响着基础研究、前沿科技、产业变革、乃至我们日常生活的热点概念。
你知道AI并非一个新词吗?你知道人工智能正在影响着包括数学、物理学、生命科学等诸多领域前沿科学研究吗?
11月15日,浦江科学大师讲坛首期三位报告人——2013年诺贝尔化学奖得主、复旦大学复杂体系多尺度研究院荣誉院长迈克尔·莱维特(Michael Levitt),复杂体系多尺度研究院院长马剑鹏,人工智能创新与产业研究院院长漆远,于讲坛开讲前汇聚一堂,解答计算生物学、人工智能领域最前沿的问题。
“地球上最复杂的学科可能是生物学”
“生物学是非常复杂的,非常复杂的,是很多不同对象以非常多不同的方式相互作用。”被问到计算生物学是一门怎样的学科时,莱维特连续说了两遍复杂。在他看来,生物学要比物理、化学复杂得多,甚至可能比经济学还要复杂得多。他说:”地球上最复杂的学科可能是生物学。”
计算生物学又名定量生物物理学,是用计算方法来解决生物学问题,虽是生物学的一个分支,但具有极强的学科交叉性。“观察一个系统,收集大量数据,检查数据,确保数据无明显错误,分析数据,建立一个简单的模型,使用这个模型来更好地理解这个系统并做出一些预测。”作为这个交叉学科的先驱,莱维特认为计算生物学始于脱氧核糖核酸(DNA)结构和蛋白质结构,就是使用不同的方法来理解从生物中获得的数字。
专长于计算机,又深耕生物学,莱维特把计算生物学看成是一个更大的领域。在他看来计算生物学的核心就是,“如何处理复杂性,生物学的这种复杂性意味着你必须非常聪明,才能应对复杂所带来的压力。”
“事情永远不会像看起来那么糟糕,也永远不会像看起来那么好”
“AI是一个具有魅力的词,也是一个很古老的词。”1967年,莱维特在剑桥大学读博时,就在图书馆看了很多相关内容,在他看来,人工智能真正实现质的飞跃是因为计算机变得越来越强大。
计算生物学是最早使用计算机进行研究的领域之一,计算机也一直与生物学有着紧密的联系。“1959年,当人类使用计算机解开第一个蛋白质三维结构,即血红蛋白时,彼时世界上的第一台电脑,才刚刚诞生10年而已。”他向在场的人挥了挥他手中的智能手机说:“我认为需要认识到计算机已经完全改变了,我告诉大家这款手机比世界上所有的电脑都重要。”
但人工智能并不是一个魔术,也不是一种魔法,它包含着算法、计算等等这些技术,所以从这个角度说,其实人工智能也是计算机算法中的一个组成部分。
“事情永远不会像看起来那么糟糕,也永远不会像看起来那么好。而人工智能并不是神奇的东西,它并不总是有效。”莱维特举例说,当一个人既会英语又懂中文,那对他来说语言间的转换,是很简单的事情。但如果用机器去翻译的话,有时就会很糟糕,甚至听起来很怪异。他回忆起一个月前的某个论坛上,一位非母语英语发言者,用带有浓重口音的英语进行演讲时,人工智能翻译机就无法识别出他的讲话内容,这让莱维特印象很深刻,“所以人工智能不一定在所有的事情上面都能够取代人类,或者说能够做得跟人一样好。目前的人工智能技术并不能完全地应对个性化的问题,还需要一些突破。”
“AlphaFold是很棒的统计技术,但不是一种数据创造技术”
已经能够预测超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质,被称为改变游戏规则的科学突破——AlphFold,可以说是计算生物界的大明星。人们认为它解决了蛋白质折叠问题,在结构预测上向前迈了一大步。
“AlphaFold以一种强大的方式结合所有数据和方法,让人类到达以前从未涉足的未知领域。现在非常重要的是要认识到,如果没有70多年来几十万个实验科学和15个诺贝尔奖所获得的数据,加之人们所使用过的方法论,那么将是一无所有。AlphaFold仍旧完全依赖于所有这些已经被获取的数据。“莱维特提醒说,“这是一种很棒的数据统计分析技术,但它不是一种数据创建技术。”
“希望科学能让更多人理解”
“希望科学能让更多人理解”是莱维特选择在浦江科学大师讲坛开讲的原因。对于当天的报告,他精心制作了近140张幻灯片,而这些背后,他想说明的一个核心问题就是:“何谓科学”。
虽然与同台演讲的马剑鹏已熟识近30年,但二人却做着不同的事情。对莱维特来说,能够把来自同一所大学从事不同领域研究的科学家聚集起来进行一场大型的对话是一个非常好的主意。“这是一件非常特别且重要的事情。”他希望这个讲坛能继续下去。
“人工智能就是新时代的望远镜、显微镜、雷达”
“人工智能开启未来的科研。”漆远教授在采访中提出,就像伽利略发明望远镜、列文虎克发明显微镜一样,人工智能就是这个新时代的望远镜、显微镜、雷达,能让我们看到更远的地方,也能让我们看到更小的细微之处。
人工智能将在可预见的未来,能对基础研究方法带来全方位的助力提升。包括但不限于生命科学、材料科学、新药研发、数学研究、大气科学乃至金融经济学等基础学科研究领域。
“每个人都可以看作一台计算机”
“每个人都可以看作一台计算机,‘硬盘’是父母给的。”漆远用一个生动的比喻解释什么是“计算生物学”。
就像计算机编码使用的是由0和1组成的二进制数一样,人体DNA中的ATCG的碱基序列就是人类一切生命活动的编码语言。ATCG碱基序列排列组合构成DNA,DNA转录产生蛋白质,蛋白质的互相结合变成网络,组成机体并调控着复杂的生命活动。但最底层的生命逻辑其实还是ATCG碱基序列构成的复杂信息网络——要想解码人类基因,对生命微观结构的研究必不可少。
那么,如何知道微观结构是如何对宏观产生影响的呢?庞大的基因片段、复杂的蛋白质结构中,究竟是哪一部分起到关键作用?其中的关键联系,如今可以由人工智能在学习、对比庞大数据后给出可靠预测,大大缩减以往所需的时间、金钱成本。
“人工智能赋能科学发现,用原始创新推进科创发展”
人工智能正在切实推进助力科研的发展。“随着生命科学数据采集成本降低,人工智能在其中扮演越来越重要的角色。”漆远指出,今天人工智能在多个领域的大放异彩,得益归功于过去的数十年内,计算机算力的大幅提升,以及数据测量采集技术逐渐成熟后带来的成本大幅降低。同时他也提示“人工智能需要数据,同时也要研究如何结合其它基础模型,并‘教会’人工智能学会自我提升、自我净化。”
同时,漆远强调,AI助力科研不仅事关基础研究,更要将人工智能与产业应用结合起来,用原始创新推进科创发展,让人工智能和产业的结合推动底层的科研,用底层创新推动行业发展,顺应时代国家大趋势。