人工智能|预测蛋白质结构只是开始 AI或为生命科学领域带来巨变( 三 )


“这次开源在生物学界掀起了巨大的波澜 , 意味着生物学家终于摆脱了先进设备的掣肘——此前这些昂贵的先进设备只有经费充足的大学或研究机构才有条件配置 , 而此后 , 小型团队或者个人研究者也有了参与蛋白质研究的可能 。 ”天壤创始人、上海交通大学计算机系原副教授薛贵荣说 。
苗洪江认为 , 目前的单个蛋白质结构预测只是一个起点 , 更加精准的侧链优化、蛋白质的动态分析、蛋白质与其配体(如小分子、DNA、RNA、多肽、蛋白质等)的相互作用等一系列的问题还没有解决 , 接下来的工作重点将是利用目前的全蛋白质组协同进化分析 , 建立起蛋白质与蛋白质之间相互作用的精准链路 。
有了算法模型只是开始 , 向前走依然困难很多 , 薛贵荣坦言:“算力是很大的制约因素 , 比如AlphaFold2做了大量的数据蒸馏工作 , 他们的算法模型是基于30%的真实数据和70%的蒸馏数据一起训练的 , 背后是巨大的算力支持 。 ”
充足的算力可以让蛋白质结构预测从单一结构向相互作用、从两两研究向规模化、从微观结构向宏观系统前进 , “生物界有很多蛋白结构 , 比如基因测序大概已经测了几十亿条序列 。 但我们只知道序列 , 不知道结构 , 这就是很大的信息缺失问题 。 ”薛贵荣说 , “蛋白质通常以复合物的形式成对或成组地承担生命所需的种种功能 。 然而许多蛋白质复合物的结构仍然是谜 , 蛋白质之间的相互作用也尚未被识别 。 我们需要有充足的算力去支撑整个体系 , 进行蛋白质结构预测、蛋白质设计 , 研究蛋白质相互作用 , 药物研发等漫长而富有挑战的工作 , 寻找精准的疾病治疗新方法 。 ”
【人工智能|预测蛋白质结构只是开始 AI或为生命科学领域带来巨变】同时 , 在数据来源和应用方面 , 也需要药厂、医院等进行协同和联动 。 “未来更多的医药企业、机构 , 以及人工智能公司 , 要一起把这个行业做大 , 现在只是个开始 。 ”薛贵荣说 。

推荐阅读