AI在蛋白折叠里再一次战胜人类


AI在蛋白折叠里再一次战胜人类


文章图片

【AI在蛋白折叠里再一次战胜人类】
AI在蛋白折叠里再一次战胜人类


文章图片


AI在蛋白折叠里再一次战胜人类


文章图片


出品丨虎嗅科技组
作者丨苏北佛楼蜜
题图丨视觉中国
近日 , 科学突破奖基金会宣布了2023科学突破奖(Breakthrough Prize)获奖名单 。 科学突破奖有“科学界的奥斯卡”之称 , 它旨在表彰在生命科学、基础物理学和数学方面的突破性成就 。
谷歌DeepMind科学家因开发人工智能 (AI) 系统而获得了300万美元的奖金 , 该系统预测了几乎所有已知蛋白质如何折叠成3D形状 。
研究人员使用AlphaFold程序实现了这一壮举 , 该程序于2018年首次开发并于2021年7月对外公开发布 。 开源程序可以根据构成蛋白质的氨基酸序列预测蛋白质的3D结构 。 蛋白质的结构决定了它的功能 , 因此AlphaFold识别2亿个蛋白质结构的能力让自己成为了帮助识别人类可以利用新蛋白质的主力军 。
早在发布之初 , 中国生物结构学领军人物、西湖大学校长施一公就曾评价称:“依我之见 , 这是人工智能对科学领域最大的一次贡献 , 也是人类在 21 世纪取得的最重要的科学突破之一 。 ”
知名药企Dewpoint Therapeutics董事会成员兼战略顾问、Relay Therapeutics联合创始人Mark Murcko也认为 , AlphaFold已经打开了一个工具箱 , 并向全世界展示了可能的东西 。
“现在我们将有几十个实验室 , 每个实验室都在思考略有不同的问题集 , 包括蛋白质-配体结构的预测、变构口袋的成药性、蛋白质-蛋白质相互作用和RNA靶标 , 以及疫苗免疫原和从头治疗性蛋白质的设计 。 ”Mark Murcko在曾采访中表示 。
从正式发布到此次的得奖已经过去了4年时间 , 业内有关AlphaFold的讨论始终更没有终止 , 从最开始科学界的为之振奋到现阶段更多应用的展开 , 如今 , 4岁的AlphaFold也给科学家带来了新的惊喜 。
成功预测蛋白质结构为什么如此重要 , 新技术又能给人类社会带来哪些便益?
生物“骨架”
蛋白质是组成人体所有细胞和组织的重要成分 。 在我们体内 , 几乎所有重要组成部分都有蛋白质的影子 。 此外 , 蛋白质是生命的物质基础 , 没有蛋白质就没有生命 , 它还是构成细胞的最基本的有机物 , 担当着生命活动承担者的角色 。
在蛋白质中 , 氨基酸为最基本的组成单位 , 它是将生命和其他各种样式的生命活动联系在一起的基本物质 。 人体内的蛋白质分为很多种类型 , 它们的作用、性质各不相同 , 但所有蛋白质都是由20种氨基酸按照不同的比例相互组合而成的 , 并且在体内不断进行着更新和代谢 。
他们就像微小的、难以理解的谜题 , 存在于细菌、植物、动物各种生物体中 , 当它们被制造出来时 , 会在几毫秒内折叠起来 , 但其结构非常复杂 , 试图猜测它们会变成什么形状几乎是不可能的 。
蛋白质的基本机构
在结构上 , 蛋白质分子中的肽链并不是直链形状 , 而是按照其内在规律发生卷曲或者是折叠 , 从而形成特定的空间结构 , 这就是蛋白质的二级结构 。
在二级结构的基础上 , 蛋白质肽链还会按照一定的空间结构 , 发展形成比二级结构更为复杂的三级结构 。 具有三级结构的肽链按照特定的空间排列顺序组合在一起 , 形成的聚集体结构就是蛋白质的四级结构 。 由于构成蛋白质的氨基酸种类繁多 , 氨基酸的排列顺序种类繁多 , 所以 , 虽然只有20种氨基酸 , 但蛋白质的种类却特别多 。
蛋白质的各级结构
美国分子生物学家赛勒斯·莱文塔尔(Cyrus Levinthal)在1969年的一篇论文中指出了一个悖论 , 即尽管蛋白质具有大量可能存在构型 , 但仍能快速而精确地折叠成不同的构像 。据估计 , 给定的蛋白质可能有 10^300 种最终结构 。
因此 , 如果人们试图通过逐个尝试来获得正确的蛋白质形状 , 那么获得正确答案所需要的时间将比宇宙存在的时间更长 。
此前 , 科学家们有办法可视化蛋白质并分析它们的结构 , 但这是一项缓慢而艰巨的工作 。 据《自然》杂志报道 , 最常见的蛋白质成像方法是利用X射线晶体学 , 通过在蛋白质的固体晶体上发射X射线 , 并测量这些射线是如何衍射 , 以确定蛋白质的排列方式 。 据DeepMind称 , 这项实验工作已经确定了大约190000个蛋白质的形状 , 这一技术也让冷冻电镜在过去十年中成为许多结构生物学实验室的首选工具 。

推荐阅读