【小哈划重点:1996年,贝克与研究生们开始编写一个叫做Rosetta的程序,该程序可以通过输入一段氨基酸序列,预测蛋白质的结构。1998年,贝克首次使用Rosetta参加了CASP(蛋白质结构计算机预测比赛)比赛,表现出色。】
当地时间10月9日,瑞典皇家科学院宣布,将2024年诺贝尔化学奖授予三位研究领域与人工智能相关的科学家。
其中,被誉为“AlphaFold之父”的谷歌DeepMind公司戴米斯·哈萨比斯(Demis Hassabis)博士和约翰·乔普(John Jumper)博士因为蛋白质结构预测获奖,而华盛顿大学的大卫·贝克(David Baker)教授则因计算蛋白设计获奖。
这些研究成果极大促进了药物研发的进程,技术的突破让AI制药站上风口,尽管这一领域目前成果寥寥,但不妨碍“AI+制药”已经成为医药行业极具想象力的赛道。
前述研究都涉及到了“蛋白质折叠”的问题。蛋白质折叠是当今分子生物学的核心研究领域之一,蛋白质折叠”的问题就是一维的分子链如何正确折叠成特定的三维形状的问题。而最终的三维形状将决定蛋白质的功能。
如果能从蛋白质分子的一维分子编码准确预测出蛋白质分子的三维形状,将对人类了解疾病产生的原理、新药研发、理解生命形成的机制产生重要影响。
过去的十几年时间里,科学家利用冷冻电子显微镜技术、核磁共振或X射线晶体学等技术确定蛋白质的形状,但试错成本高,所需时间和资金不菲。随着计算机科学、AI技术的发展,蛋白质折叠的问题的突破有了希望。
1996年,贝克与研究生们开始编写一个叫做Rosetta的程序,该程序可以通过输入一段氨基酸序列,预测蛋白质的结构。1998年,贝克首次使用Rosetta参加了CASP(蛋白质结构计算机预测比赛)比赛,表现出色。
2018年之前,Rosetta在CASP大赛上“打遍天下无敌手”,但是AlphaFold的出现,让Rosetta感受到了危机,AlphaFold首次亮相便拿下比赛亚军。2020年,DeepMind基于初代版本开发的AlphaFold2击败Rosetta卫冕冠军。此次大赛上,在接受检验的近100个蛋白靶点中,AlphaFold2对三分之二的蛋白靶点给出的预测结构与实验手段获得的结构相差无几。
AlphaFold主要尝试解决的问题也是蛋白质的结构性质预测问题。前述诺贝尔化学奖得主哈萨比斯是DeepMind的创始人兼首席执行官,同时也是AlphaFold项目的负责人。乔普则是AlphaFold项目的首席高级研究员。
此后,AlphaFold和Rosetta相互角力。2021年7月,DeepMind公司和贝克团队分别在《自然》杂志和《科学》杂志上发表论文,公开了“AlphaFold2”、RoseTTAFold的源代码。RoseTTAFold拥有媲美AlphaFold2的蛋白质结构预测超高准确度,而且更快、所需计算机处理能力更低。
同月,2021年7月,DeepMind公司在《自然》杂志再次发表论文,描述了AlphaFold对人类基因组编码的所有蛋白质(人类蛋白质组)的准确结构预测。结果显示,AlphaFold能够对人类蛋白质组中58%的氨基酸的结构位置做出可信预测,对36%的氨基酸的结构预测达到很高的置信度,是实验方法覆盖的结构数量的两倍。
2024年5月8日,DeepMind团队在《自然》杂志发表文章介绍AlphaFold3,其能以较高准确率预测蛋白质与其他生物分子相互作用的结构。该模型能预测含有蛋白质数据银行(Protein Data Bank)内几乎所有分子类型的复合物的结构。
值得注意的是,对于蛋白质与其他分子的相互作用,与现有预测方法相比,AlphaFold 3改进了至少50%,这使 AlphaFold3 成为首个在生物分子结构预测方面超越基于物理的工具的人工智能系统。
对于一些重要的相互作用领域,AlphaFold3预测准确度提高一倍(100%),可准确预测如蛋白质、DNA和RNA这样的大型生物分子,也包括配体等小分子的结构以及它们如何相互作用。也就是说,AlphaFold 3可预测的范围已经不局限于蛋白质,而是已经扩展到了生物分子领域,药物发现的效率将大大提高,一些“绝症”也有了治愈的可能。
实际上,已经有不少资本涌入AI制药行业。据行业自媒体智药局统计,单是国内,截至2024年8月5日,AI制药公司已经达到了104家,而2020年底时仅为16家。二级市场上,晶泰科技头顶“国产AI制药第一股”的光环在港上市。据智药局发布的《AI制药行业报告2023》,截至2023年底,全球共有超过80条成功进入临床阶段的AI药物管线。
相较于传统药物研发,AI能将药物发现、临床前研究的时间缩短近40%,将临床新药研发的成功率从12%提高到约14%。AI制药的瓶颈也显而易见,它仍无法跳脱与颠覆现代药物研发流程的基础轮廓——找到新靶点,再从类药化合物库中层层筛选出最优候选药物分子。
晶泰科技首席科学家张佩宇曾在接受界面新闻记者采访时表示:“从早期的靶点发现,到化合物发现,到临床前至临床间,甚至审批上市至商业推广都可以用到AI技术的赋能和加速。”
而目前而言AI主要集中应用于化药及生物药的发现和临床前开发阶段。
最知名的案例便是,辉瑞的新冠口服药Paxlovid就再药物探索阶段借助了AI的力量。晶泰科技曾帮助辉瑞将研发Paxlovid所需要化合物及其所有可能的固体形态,通过AI算法全部预测且准确匹配实验结果,仅6周就帮助辉瑞确认了候选药物的优势晶型,用于后续的开发和生产。这项工作关乎药品安全、大规模生产以及专利的申报,原本需要耗时半年以上。
而AI技术在新冠疫情制药中的使用推动了AI投资的增加,根据Precedence Research,AI制药行业将在未来十年保持高速增长。
不过,AI在制药领域也不是一颗完美的“魔术子弹”。2020年,Exscientia利用AI开发的首款治疗强迫症的药物,因未能达到预期标准而中断。2022年7月,Exscientia与住友制药合作的DSP-1181,因临床I期的研究未达到预期标准停止研发。2023年4月,BenevolentAI公布了其AI药物BEN-2293用于特应性皮炎(AD)的II期试验数据,未达到预期治疗效果。
直至今年9月19日,国内AI制药企业英矽智能发布AI药物ISM001-055临床IIa期积极结果,数据显示良好的安全性和剂量依赖性的药效趋势,该公司称这是全球首个AI药物概念验证案例。
这一定程度上鼓舞了AI制药行业的信心,不过,AI制药面临的最大问题仍然是数据壁垒。据亿欧智库研报,过去,药物研发积累的数据并非为人工智能所备,行业至今没有相关的标准数据集,一般通过公开文献、药物专利或者购买而来,这就造成数据不规范。对于药企来说,药物研发数据是企业的核心资产,不会轻易共享。对于医院来说,医院也不会轻易向药企提供数据,医院与医院之间的数据并不互通。
AI制药企业在获取数据这一步上就卡了壳。据21世纪经济报道,英矽智能联合首席执行官兼首席科学官任峰曾表示,目前,在实操应用层面,还没有用任何中国人的数据,特别是使用中国患者的数据来分析发现靶点的方式尚未普及。
张佩宇曾对界面新闻记者表示:“目前行业普遍认为,AI需要与湿实验相辅相成,‘干湿结合’才是对AI技术最好的使用。”而自动化与AI的结合使用也是行业未来的趋势。自动化实验能够收集大量的数据,还有望解决AI药物研发的数据短板问题,有助于提升整体研发流程的效率和成功率。大量重复性劳动交给机器人,科学家将有更多时间和精力投入到药物研发的关键环节中,不仅实验产出效率成倍提升,还能减少人为操作引起的实验误差。