照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症


照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症


文章图片


照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症


文章图片


照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症


文章图片


照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症


文章图片


照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症


文章图片


照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症


文章图片


照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症


渐冻人症 , 这个陪伴了传奇物理学家史蒂芬·霍金终生的罕见病 , 也已经困扰了医生和生物科学家数十年的时间 。
而答案可能就在核孔蛋白 (neucleoporins) 上 。 具体来说 , 学者们认为渐冻人症和核孔蛋白组成的核孔复合体有着极强的关联 , 而这个复合体控制着细胞核与细胞质之间的物质传递 。 如果能够进一步了解核孔蛋白 , 我们就有可能找到根治渐冻人症的答案 。
然而想得到这个答案并不容易:核孔复合体由超过1000条30多种不同的核孔蛋白组成 , 这些蛋白质以极其复杂的方式相互交错在一起;更别提单条蛋白的大小可能只有数纳米 , 即便通过最先进的显微镜技术也很难进行有效的观察 , 给生物学者造成了极大的障碍 。
2019年 , 刚加入哈佛大学吴皓实验室的 Pietro Fontana , 就领到了核孔蛋白这个天文级难题 。
他不是第一个尝试吃螃蟹的人 , 前人在这件事上已经用尽了各种研究手段 , 付诸数十年的心血 。 但是 Fontana 有强援在手:AlphaFold , 由英国人工智能科研公司 DeepMind 开发的蛋白质预测模型 。
没过多久 , 在 AlphaFold 的帮助下 , Fontana 的研究就取得了关键性的进展:他们不仅成功预测出了之前没有被探究清楚的一批核孔蛋白的结构 , 还首次绘制出了核孔复合体的胞质环 (cytoplasmic ring) 的模型图 。 这一研究在今年刚刚获得《科学》期刊刊登 。
这一历史性的生物信息学突破 , 为攻克像渐冻人症等罕见、难治的神经退行性疾病疾病 , 重新点亮了希望 。
“我认为 AlphaFold 已经完全改变了结构生物学 , ” Fontana 表示 。
有意思的是 , 这么个如此重要的发现和研究 , 其实对于 AlphaFold 来说倒像是一件“顺手”的事 。

蛋白质数据库实现千倍扩容 , 成为“蛋白质宇宙” 这么说是因为:截至目前地球上已知的所有生物总共2.14亿种蛋白质 , 其结构都已经被 AlphaFold 预测出来了 。
值得一提的是 , DeepMind 的研究进展速度之快 , AlphaFold 的效果之好 , 已经远超“令人震惊”的水平 。
首先 , 去年该公司首次发布并开源了 AlphaFold 模型 , 当时它只预测出了人类的98% , 以及其它大约1万种生物的部分蛋白质 , 条数只有100万左右——当时这一研究已经入选了《自然》年度十大科学事件 。
仅一年后 , 这个数据库就实现了200倍扩容:
更厉害的是 , 现在这个数据库已经覆盖了动物、植物、细菌、真菌等几乎所有已经被科学记录的物种 , 总计大约100万种 。 其中80%的的预测结构结果的置信度已经足以支持研究实验的水平 , 更是有35%的结果置信度为高 。
此次 AlphaFold 放出的“全量蛋白质结构预测数据库” , 和之前人类手工测量的数据库相比 , 更是实现了1000倍的扩容 。 在此之前通过标准实验方式测量出的蛋白质结构 , 都存放在“蛋白质数据银行” (PDB) 计划的数据库里 , 今天这个数据库的条目只有19万条 。
这简直是为结构生物学 , 生物信息学、医药开发等领域 , 送上了一份惊天大礼包——更别提数据库还是完全免费、开放、可搜索的:
这一最新版的 AlphaFold 数据库 , 可以说其中超过99%的蛋白质结构在此之前都是未知的 。 而现在人类对于蛋白质结构的知识突然获得了200倍的增长 , 可想而知未来的更多生物学和医学进展将会更加频繁 , 许多肆虐几百年的疾病有望得到“根治\" , 许多存在了几十年的生物学难题也将得到破解 。
斯克里普斯研究所(世界顶级医学研究机构)创始人 Eric Topol 直言:

推荐阅读