降低AI for Science门槛,实现生命科学领域新突破

来源:科技日报
说到AlphaGo , 一般人都或多或少听说过 , 它因击败了人类围棋大师被誉为“世界壮举” , 标志着人类向通用型的人工智能迈出了具有里程碑意义的重要一步 。
而如今在前沿科学研究中的AlphaFold2模型则是人工智能(AI)应用的另外一个标志 , 它因展现出AI for Science的巨大潜力 , 而受到了各界人士的青睐 。
AlphaFold2助蛋白质结构预测 , 树AI for Science新高度
蛋白质是组成人体细胞组织的重要成分 , 对蛋白质三维结构开展有效解析与预测 , 可为生物学、医学、药学乃至农业、畜牧业等行业未来研究与发展提供重要依据 , 尤其对与人类健康直接相关的药物研发意义重大 。
然而 , 用X光、冷冻电镜、核磁共振等传统方法对蛋白质结构进行解析 , 远赶不上氨基酸序列的增加速度 , 这会造成海量待测样品在实验室中等待数月乃至数年 。 国际权威数据库SWISS-PROT显示 , 目前累计的蛋白序列的信息已经超过56万 , 用传统方法去完成这浩瀚繁多的测序无疑成为“不可能完成的任务” , 须另辟蹊径 。
科技创新的车轮滚滚向前 。 如前文所述 , 人工智能的发展为蛋白质测序效率带来了契机 。 其中AlphaFold2模型让人工智能在生物医药领域发挥着重要的作用 。
一般来说 , 人工智能方法的预测精度超过90分 , 便可认为预测结果与实验方法得到的蛋白质结构基本一致 。 而AlphaFold2的92.4分 , 其不仅可以分析X-射线晶体学很难解决的楔入细胞膜中的蛋白质结构 , 还成功解开了蛋白质折叠问题 , 甚至可以帮助研究者们制造自然界中不存在的蛋白质 。
AlphaFold2带来的这些重大突破 , 标志着AI辅助药物基础理论研究进入新的阶段 , 树立了AI for science新高度 。
比如 , 目前全球设计的几乎所有的药物都作用于蛋白质 , 通俗讲 , 需要像钥匙开锁般精确匹配 , 而此过程的第一步是确定哪把钥匙开哪把锁 , 用更专业的话说 , 就是寻找药物靶标 , 即弄清楚药物分子作用与何种蛋白结合 。 而通过可解码蛋白质结构的人工智能算法 , 就可快速筛选成千上万的新药物靶标 , 从而大大缩短新药研制周期;而制造自然界中并不存在的蛋白质 , 无疑可以更好帮助人类以前所未有的方式应对重大挑战 。
端到端优化AlphaFold2 , 让人工智能更普适济民
AlphaFold2为蛋白质结构解析与预测提供了通途 , 为人工智能在生物医药等领域的应用打开了新的窗口 , 然而随其在产、学、研各细分领域中的落地 , 也遇到严峻挑战 。 例如 , 随各种应用对于推理高通量和高性能的需求与日剧增 , 使用者需要更加充分地挖掘平台计算潜力 , 来提升执行效率 。
所谓高通量测序技术 , 也被称为革命性的蛋白质测序方法 , 也是“十四五”时期生物经济领域重点推进创新应用的一项关键技术 , 简单讲就是一次并行对大量核酸分子进行平行序列测定的技术 , 但实施一次测序就能产出不低于100Mb的数据 , 这巨大的数据量给AlphaFold2的应用带来很大困扰 。
原来 , AlphaFold2刚问世时由于算法和硬件架构本身等问题 , 如GPU的并行计算 , 但是这类硬件存在严重的内存限制 , 使得即便是使用单卡最大内存 , 能够输入去预测的蛋白质序列长度也不足1000氨基酸 。
面对突破这一瓶颈的急迫需求 , 英特尔?架构产品--内置AI加速能力的至强? 可扩展平台搭配傲腾? 持久内存的产品组合 , 使得CPU平台得以具备TB级的内存容量 , 有潜力满足高通量测序需求 。 基于这一优势 , 英特尔针对不同氨基酸序列长度下蛋白质结构预测所需占用的内存开展了实验 , 实践表明该组合打破了限制预测序列长度的 “内存墙” , 实现了AlphaFold2的高通量优化 。
结果显示 , 从短到206个氨基酸 , 至长到2797个氨基酸 , 最终都达到了预期效果 , 验证了至强?可扩展平台产品组合 , 能够轻松应对AlphaFold2蛋白质测序从20GB至510GB的内存占用 , 并有助于其实现更大范围的蛋白结构探索 。
在推动AlphaFold2提升普适性、拓展应用的进程中 , 英特尔在发挥至强?可扩展平台产品组合提供强劲通用算力的同时 , 亦充分利用丰富的软件工具实施通量优化 , 让处理器内置的英特尔? AVX-512技术 , 在英特尔? oneAPI 软件工具的激活与配合下 , 实现并行计算加速 , 为AlphaFold2应用进一步提供性能调优空间 。
推荐阅读
- 小鹿确定回归,FOREVER成为队伍累赘,旺仔交易或已经完成
- 人类体温持续降低,可能已经停止进化,都是一夫一妻惹的祸?
- 非洲“Africa for Africans”活动将于本周在亚的斯亚贝巴举办
- 美国CDC真实世界数据研究:Paxlovid与成人COVID-19住院率降低有关
- 科学家发现:37℃不再是人体标准体温!体温降低对人类有何影响
- 科普原版动画《科学小子席德Sid the Science Kid》中文版+英文版,在家轻松给孩子做科学启蒙!
- 梦幻西游:牧场调整使单开的收益打了八五折,投入降低但可能断窝
- 尼克斯火箭交易谈判中,戈登不满火箭斯通或降低要价送走!
- AI for Science的上半场:人工智能如何重新定义科学研究新范式?
- 拯救脱发新思路!《Science》子刊:毛干生成率近100%