生物史最全“证件照”!DeepMind开放35万种蛋白质结构,超人类知识2倍


 生物史最全“证件照”!DeepMind开放35万种蛋白质结构,超人类知识2倍
文章图片

 生物史最全“证件照”!DeepMind开放35万种蛋白质结构,超人类知识2倍
文章图片

 生物史最全“证件照”!DeepMind开放35万种蛋白质结构,超人类知识2倍



编译 | 韦世玮 徐珊
编辑 | 漠影
今天将成为人类生物学历史上具有重大意义的一天!
智东西7月23日消息 , 今日 , 人工智能研究实验室DeepMind与欧洲生物信息学研究所EMBL-EBI(European Bioinformatics Institute)合作 , 推出了AlphaFold蛋白质结构数据库 , 该数据库提供了迄今为止人类蛋白质组最完整、最准确的图像 , 是人类积累的高精度人类蛋白质结构知识的两倍多 。
除了人类蛋白质组(人类基因组表达的所有蛋白质约2万种)之外 , 他们还将提供其他20种具有生物学意义的生物蛋白质组的开放访问 , 总计超过35万种蛋白质结构 , 包括从果蝇到小鼠等动物 , 以及从大肠杆菌到酵母等细菌 。
发布第一批数据后 , DeepMind计划继续增加蛋白质库 , 几乎覆盖所有科学已知的已测序蛋白质 , 共超过1亿种结构 , 该库将由EMBL维护 。 在EMBL总干事Edith Heard看来:“这些数据集将改变我们对生命运作方式的理解 。 ”
“我认为这是DeepMind整个10年多生命周期的顶峰 。 ”DeepMind联合创始人兼CEO Demis Hassabis谈道 , 从成立之初 , DeepMind就打算将AI方面取得的突破在围棋、雅达利等游戏上进行测试 , 并将其应用于现实世界的问题 , 以加速科学突破并造福人类 。
Demis Hassabis称 , 这些数据对科学和商业研究人员来说都将永久免费开放 。 “任何人都可以将它用于任何事情 , 他们只需要归功于参与引用的人 。 ”他说 。
▲长期以来 , 人源中介体复合物(Mediator Complex)一直是结构生物学家最具挑战性的多蛋白系统之一 。 (图源:Nature)
一、AlphaFold预测蛋白质结构 , 缓解多领域生物研究瓶颈21世纪是生物的世纪 , 更是计算机的世纪 。
早在去年12月 , DeepMind就推出了AlphaFold 2系统 , 可通过AI软件对蛋白质结构进行准确预测 , 该解决方案被认为能解决困扰科学家们50年的蛋白质折叠(protein folding)问题 。
直到上周 , DeepMind还发表了相关科学论文和源代码 , 以解释如何创建这个高度创新的系统 , 允许其他人通过AlphaFold来完成相关研究工作 。
AlphaFold系统的诞生 , 证明了AI可以在几分钟内准确预测蛋白质的3D结构 , 精确到原子精度 。 而AlphaFold蛋白质结构数据库的开放 , 也将促进世界各地的科学家们加速对人类蛋白质的研究 。
那么 , 何为蛋白质折叠问题?
简单来说 , 许多生物过程都是围绕蛋白质来进行的 , 而蛋白质是由氨基酸序列组成的大型复杂分子 , 其真正的作用取决于自身独特的3D结构 , 也就是蛋白质中氨基酸序列的折叠方式 。
了解蛋白质结构能增进人类对生命组成部分的理解 , 从而推动科学家们在各个领域的研究 。
例如 , 英国朴茨茅斯大学(CEI)正在利用AlphaFold来设计一种新型酶 , 以快速分解污染严重的一次性塑料等废物;美国科罗拉多大学博尔德分校通过AlphaFold预测 , 来研究抗生素耐药性的前景;美国加利福尼亚大学旧金山分校则使用AlphaFold来研究新型冠状病毒的工作原理……
▲AlphaFold预测的蛋白质结构的两个例子(蓝色)与实验结果(绿色)的比较(图源:DeepMind)
这些都是科学家们利用科技带来的大量生物数据信息 , 一步步转换为未来人类的进步 。
但科学家们指出 , 这些信息转换到现实世界并产生结果的过程 , 仍需要大量时间 。 “我认为这不会在一年内改变患者的治疗方式 , 但它肯定会对科学界产生巨大影响 。 ”科罗拉多大学生物化学系教授Marcelo C. Sousa说 。
需要注意的是 , AlphaFold软件生成的是蛋白质结构的预测 , 而不是实验确定的模型 , 这意味着在某些情况下 , 科学家还需要进一步的工作来验证结构 。
DeepMind对此表示 , 他们花了许多时间在AlphaFold软件中构建准确度指标 , 让它能对每个预测的可信度进行排名 。
不过 , 蛋白质结构的预测仍对科学研究带来了巨大帮助 。 以往科学家们确定蛋白质结构的实验过程既耗时又昂贵 , 还要依赖大量反复试验 , 而蛋白质结构预测即便置信度低 , 也可以为科学家指明正确的研究方向 , 为他们节省多年的工作 。

推荐阅读