【小哈划重点:人类发展总共有26种通用目的技术,而人工智能就是其中一种。硅谷创业教父史蒂夫·霍夫曼认为,人工智能是一股极强的趋势,它会改变地球上的一切行业。】
我们可以用算法设计出抗体,实现个性化免疫治疗,整个生物制药会更加精准、更安全、更经济、更普惠。
人工智能是计算机技术发展到高级阶段,是融合了数学、统计学、概率、逻辑、伦理等多学科于一身的复杂系统。从1956年达特茅斯学院助理教授约翰·麦卡锡正式提出人工智能的定义,人工智能已经走过60多年。
根据经济学家Richard Lipsey和Kenneth Carlaw对通用目的技术(GPT)的标准,人类发展史走到今天总共有26种通用目的技术,而人工智能就是其中一种。硅谷创业教父史蒂夫·霍夫曼认为,人工智能是一股极强的趋势,它会改变地球上的一切行业。
在生命科学领域,人工智能和机器学习带来的数字化转型正在影响价值链的几乎每一个方面。将人工智能应用于生命科学领域,可以帮助公司重塑商业模式,加速生物制药生产周期。
清华大学惠妍讲席教授、智能产业研究院(AIR)首席科学家马维英教授在人工智能领域已经深耕20余年。此前,他曾任字节跳动副总裁兼人工智能实验室主任、前微软亚洲研究院常务副院长。他的研究方向包括人工智能的几个核心领域(搜索与推荐、大数据挖掘、机器学习、自然语言理解与生成、计算机视觉)以及人工智能在生命科学、生物制药、基因工程、以及个体化精准医疗等领域的跨学科研究与应用。
“我们现在正在经历数字3.0时代,这是一个将信息与物理世界、生物世界融合的智能感知时代。健康计算就是在生物世界的数字化与智能化的大趋势下,以人工智能和数据驱动的第四科学研究范式,辅助人类探索并解决生命健康的问题。”马维英教授对本刊表示。
马维英教授预测,随着健康计算的发展,人类有望提前预测新冠病毒的变异毒株模型,甚至有望在未来解决癌症难题。
问:您为什么会对AI在生命科学领域的应用产生兴趣?
马维英:过去20年我一直在互联网做搜索、推荐和内容生成,基本上都是比较传统的AI,例如计算机视觉、自然语言处理、机器翻译、个性化推荐算法等,在这些方面我做了非常多的工作。大约在2018、2019年,我意识到机器学习和生成模型如果能用到生命科学领域,或许会产生更有意义的价值。
举个例子,我们训练AI写文章的时候,每个字都可以被看成是一个离散的字符,把这些离散的符号放在一起,还要有结构、符合语法、语意连贯,是一件很难的事情,但机器可以利用大量的诗词文章数据、用算法不断学习,所以机器现在写出的文章不仅有模有样,甚至如果我们把文章的中间一段拿掉,机器还能把文章还原回来。我们现在转换一下,把原子、分子、氨基酸等化学物质按照某种有意义的顺序,三维地建构在一起,最后它会形成一个有化学功能和性质的化合物,这种小分子或大分子化合物可以跟某个药物靶点结合,这问题也可以用机器学习的方法来解决。
所以,自然语言生成与化合物合成,问题抽象到一定程度后,背后的原理和数学问题是类似的,都是把一些离散的符号或单元组合起来,最后生成文章或化合物。用氨基酸合成出蛋白质或者大分子药,或者学物质小分子药。一旦理解了这些科学原理之后,AI技术和数据驱动的科研范式就可以应用于生命科学和生物制药领域了。
我非常鼓励做AI的人,如果对生命科学感兴趣,现在是一个非常好的加入时机,这个领域有点像互联网的元年。虽然我在过去20年里一直在做传统AI,但我认为生物世界的数字化会有巨大的发展前景,这是一片蓝海。这的确需要克服跨学科的门槛,有很多新的专业知识需要学。在我看来,由人工智能赋能的生命科学与生物医药领域,包括个人健康管理、新药研发,个体化精准医疗等是未来十年最大的机会。
问:在生命科学领域,您现在专注于哪个方向?
马维英:在清华大学智能产业研究院(AIR),我们的团队致力于打破AI与生命科学领域的壁垒,推动生命科学,生物医药等领域从孤立、开环向协同、闭环发展,提出了AI生命科学的“破壁计划”。目前团队主要聚焦在三个研究方向:数字治疗(Digital Therapeutic),AI驱动的药物设计(AI-powered Drug Discovery),以及精准治疗(Precision Medicine)。这三个方向分别对应四种“药”:数字药、化学药、生物药和基因药,我们想做“药神”(笑)。拿数字药来说,如果我们有一个智能健康助手,越用越智能,越用越了解你,它可以通过个性化学习帮助管理你的健康,你的健康数据可以通过所佩戴的可穿戴式设备来获取,这样就可以实现从测量、评估、指导和干预整个健康管理环节,形成闭环,这就是AI增强个人健康。
我们另一个工作是AI制药,抗体设计就很适合用AI的方式辅助,一个病毒出现后,对应的中和抗体的氨基酸序列应该是什么样?如果有了病毒的基因序列,解析出了抗原的表位结构,同时又能解析出病毒与人类的交互方式,我们就可以利用AI和计算的方法快速把抗体设计出来。
此外,AIR兰艳艳教授也带领学生做了一些基因测序方面的工作,并在2021年的创新工场Deecamp竞赛中获得了冠军。我们已知基因90%是未编码的,团队利用基因的未编码部分,结合前沿的预训练技术构造了一个全新的模态。
这些技术一旦突破,会产生巨大的影响力,相当于人类多了一个“外挂”的计算免疫系统。
问:现在中国这一领域研究,达到了一个什么样的水平,跟世界水平相比如何?
马维英:过去10年人工智能在中国飞速发展,也涌现出了很多优秀的青年AI人才,尤其是在移动端互联网的发展,中国可以说是“弯道超车”,引领了世界AI发展的新浪潮。但在生命科学领域里的AI应用,总体来说目前还尚处在开始阶段,发展空间很大。顶尖的跨界人才的数量和欧美相比还是有差距,由于AI和生命科学领域的知识鸿沟较大,相比于其他传统AI领域,例如CV(计算机视觉)、NLP(自然语言处理)等领域,智慧医疗领域更需要能够跨界的人才。
另外生命科学领域的数据的“成熟度”较低,机器还无法直接利用学习,而且还要做到数据“可用不可见”,保护隐私。在数据集的建立方面,中国还需要进一步发展。例如,目前美国有一个非常大的癌症病人数据库,但是这个数据库缺乏中国人的数据,他们有五十几种癌症病种数据库,而我们只有五种。现在有新的基因测序技术,我认为中国可以建立一个更好、更全的癌症病理库,对于癌症早筛和治疗这是非常宝贵的。在这个方面,中国有非常多的机会。
问:您对于AI和生命科学结合在应用层面的远景怎么看?
马维英:生命科学领域的前景,我认为还非常值得想象。例如在未来,个性化药物会出现。现在每个药的研发平均要花10年时间,平均投入25亿美元。将来,如果我们能够用AI的技术,加快药物研发的周期,并针对个体的基因序列和新抗原设计出对应的药物精准治疗,实现个性化的免疫疗法,整个生物制药会更加精准、更安全、更经济、更普惠。
我个人有这样一个梦想和希望:未来人类一定可以攻克癌症。
问:癌症会有不同的类型,都可以解决吗?
马维英:癌症有非常多亚型,这的确是个难题。即使患有相同的癌症,每个病人基因变异或者癌症亚型可能都不太一样。如果我们能够对癌症的机理了解得更深,能快速设计并生产出个体化的靶向药物,对癌症死亡率会有一个极大的压制。数据显示,中国癌症病人占全世界的25%,接近1/3的癌症死亡率发生在中国,所以精准医疗技术的进步对我们非常重要。
问:在人工智能的格局中,大药厂会是什么位置?
马维英:整个生物制药的流程,AI是有机会重新定义的,在新的范式下,产业有机会重新分工,我相信AI将引领生物制药未来十年、二十年的创新。
问:您认为新的产业格局会被新的力量改变,会以什么样的方式改变?
马维英:举个例子,目前做抗体药,要从康复病人里面去筛选,但这个过程比较像碰运气。每个人的体质与免疫系统的健康程度有关,免疫系统好、人就不容易生病,面对新冠时,如果本身有一些基础病,或者免疫系统比较弱,对抗病毒就很吃力。抗体药就是通过注射的方式,暂时提高人的免疫力。比如医护人员去疫区,打抗体药后,就可以短暂地提高他的免疫力;或者患病初期、刚刚出现症状时,用抗体药也有帮助,这就是传统意义上抗体药的原理。
我们最近孵化了一家AI制药公司叫华深智药,由AIR彭健教授带队,与清华大学医学院张林琦教授的团队合作,研发了一个智能抗体设计平台,利用机器学习技术对现有抗体开展了系统设计和优化。团队用AI设计出了一种抗体,展示出了高效又广谱的中和效果。这是目前全球首个用AI设计的新冠抗体,大大提高了对现有新冠抗体的抗病毒能力,为新一代抗体药物的研发开创了全新的路径和范式。另外,AI驱动的新药发现和生物学实验一旦形成闭环,将在快速设计出有效抗体方面发挥巨大的潜力。你可以想象这是一个人类的“外挂系统”,一个可被计算的数字免疫系统。
问:这个研究成果现在在商业化的什么阶段?
马维英:目前AI设计的抗体还需要进一步走临床实验,一般大概需要1.5年的时间,但这个AI设计抗体的成功研制预示着一个新的未来。有些科学家预测,新冠病毒可能会变成一种流行病,会反复出现、不断变异,最后与人类共存。在AI的帮助下,我们可以模拟并预测出它未来可能的变异,提前准备,在新病毒出现后很快设计出对应的中和抗体,并加速临床实验。
问:这些预测所需要的数据从哪里来?
马维英:一部分来自自公开数据,同时我们现在也关注纳米抗体,纳米抗体的来源是羊驼,它在野外经过长年的生存演化以及和各种病毒的接触,体内有非常多种类的抗体,它的抗体表位更小,能够对应到更小的靶点,可以以组合的方式识别不同的表位,对未来抗体药的研发提供更多可能性。
问:生命科学领域是不是存在一个公平性的问题?是不是富人先享有免疫外挂、先拥有个性化的药物,或者他们的癌症最先被治疗?
马维英:AI反而会让生物医药领域更经济、更普惠、更公平。目前已有的癌症免疫疗法没有能够规模化,并且成本极高,大约在25万美元。现在我们做这件事情就是为了让它的成本更低、速度更快,效果更好。未来如果从国家层面去支持这件事情,人人都会受益。
文 | 《巴伦周刊》中文版撰稿人郭慧萍,编辑 | 朴鸢儿
(本文仅供读者参考,并不构成提供或赖以作为投资、会计、法律或税务建议。)