AI for Science的上半场:人工智能如何重新定义科学研究新范式?


AI for Science的上半场:人工智能如何重新定义科学研究新范式?


文章图片


AI for Science的上半场:人工智能如何重新定义科学研究新范式?


文章图片


AI for Science的上半场:人工智能如何重新定义科学研究新范式?


文章图片


AI for Science的上半场:人工智能如何重新定义科学研究新范式?


文章图片


AI for Science的上半场:人工智能如何重新定义科学研究新范式?



AI发展七十余年 , 每一技术性突破都将给人类未来开辟新一种可能性 。 而它与科学研究的深度融合 , 则会裂变出无数或无穷种可能性 。
万众瞩目下 , 今年10月 , 有着诺贝尔奖“嫡传”之称的诺贝尔化学奖终于揭晓 , 授予了对“链接化学和生物正交化学的发展作出了贡献”的三位化学家 , 他们分别是美国化学家Carolyn R. Bertozzi、丹麦化学家Morten Meldal、美国化学家K. Barry Sharpless 。
实际上 , 靴子落地前 , 关于这一奖项到底花落谁家引起了无数热议 。 其中国际化学领域权威期刊《Chemical Reviews》就曾对该奖获得者进行了读者投票预测 , 带领DeepMind团队开发出能够精准预测蛋白质结构的AlphaFold 2的John Jumper获得了最高票数 。
尽管由于“时间问题” , 最终John Jumper并未折桂 , 但在此之前 , John Jumper团队已成功拿到了另一个堪称“豪华版诺贝尔奖”、“科学界的奥斯卡”的奖项——2023年生命科学突破奖(Breakthrough Prize in Life Sciences) , 这是迄今科研领域里奖金最高的生物学及医学奖项 。
为何John Jumper及其领导开发的AlphaFold会收获如此多的青睐?主要原因在于 , AlphaFold的诞生解决了困扰生物学界半个多世纪的经典难题 , 即1972年诺贝尔化学奖得主Christian Anfinsen提出的蛋白折叠问题(Protein Folding Problem)——“蛋白质的氨基酸序列应该能完全决定其结构” 。
John Jumper团队开创性地利用人工智能技术 , 终于破解了这一著名猜想 , 不仅让蛋白质结构预测的研究走入一个新阶段 , 也将人们对“AI for Science(科学智能)”的关注推向高潮 。
简单来说 , AI for Science就是让人工智能利用自身强大的数据归纳和分析能力去学习科学规律和原理 , 得出模型来解决实际的科研问题 , 特别是辅助科学家在不同的假设条件下进行大量重复的验证和试错 , 从而大大加速科研探索的进程 , 如今这一方法已在多个前沿科学领域中取得了显著的成果 。

与大家此前耳熟能详且触手可及的人工智能应用相比 , AI for Science所涉及的生物制药、能源、材料研发等科研领域尽管离大众生活看似遥远 , 但其背后的共同之处在于 , 利用人工智能来“解放”生产力——让人们能够从许多重复性、机械化的基础工作中释放出来 , 在人工智能的辅助下进行更高效的生产工作 。 这正是人工智能的价值和魅力所在 。

AI for Science:用人工智能催化一场新的“科学革命”
让我们回到AlphaFold , 从解析蛋白质的技术演进 , 来观察AI的加入到底能给科研带来怎样的颠覆 。
作为生命的物质基础 , 蛋白质与生命及各种生命活动有着极其紧密的联系 , 包括人体所有疾病的发生几乎都与蛋白质功能异常有关 。 换句话说 , 如果能人为地激发或抑制蛋白靶标 , “控制”蛋白质的结构和功能 , 就能够大大加速对疑难杂症的靶向药物和高效疗法的研发 。
在过去 , 生物学家们曾广泛使用X射线衍射、冷冻电子显微镜等实验技术来破译蛋白质的三维结构 , 这类方法耗时长且成本高 。 因此从1994年开始 , 多支科研团队在两年一届的国际蛋白质结构预测竞赛(CASP , Critical Assessment of protein Structure Prediction)上施展拳脚 , 并由此催生了I-TESSER、RaptorX、RoseTTAFold等蛋白质结构预测模型 。
但是问题也随之而来 , 这些大部分用计算机基于理论预测的蛋白质结构模型 , 其实与实际观测到的实验数据相去甚远 , 正确率不足40% 。 其后续发展需要持续提高预测模型的精度 , 以无限缩小预测结构和实验误差 。
不仅如此 , 从蛋白质结构预测推进到药物研发环节 , 不同药物设计方法的原理和应用场景也有着极大差异 。 例如在制药流程中 , 从前端的靶点发现、先导化合物的筛选优化 , 再到后期ADMET预测、甚至临床效果预测等多个环节 , 都面临着独特的技术挑战 。 在这个过程中 , 研究人员必须要进行高通量的重复性实验 , 甚至要花费多年的时间 , 验证次数也高达数百万次 。

推荐阅读