AI for Science的上半场:人工智能如何重新定义科学研究新范式?( 四 )


此外 , 考虑到AI for Science领域的模型或相似变体对内存的消耗非常敏感 , 且对大内存应用来说CPU平台的计算资源通常会更具优势 , 英特尔还有的放矢地的进一步强化了这方面的能力——其与至强CPU搭档的英特尔傲腾持久内存 , 能提供远超主流DRAM的容量 , 更容易达成TB级内存配置并拥有接近DRAM的性能 。 也就是说 , 它能够在尽可能降低科学计算模型在整个链路上时延的同时 , 突破限制AI for Science应用的内存容量瓶颈 。
虽然在现阶段 , 英特尔针对AI for Science等AI应用的核心硬件布局是以CPU为主 , 加速的应用类型也是以推理为主 , 但这只是其在XPU时代扩展AI产品组合的第一步 。 在英特尔的“XPU愿景”里 , 随着未来数据类型和应用类型的高速增长和裂变 , 其底层硬件架构也将从CPU拓展到CPU与GPU、FPGA和AISC加速器俱全的XPU架构 。
基于这一策略 , 英特尔2023年不但会推出代号为Sapphire Rapids的第四代至强可扩展处理器 , 还会发布可与这款CPU搭配 , 专攻科学计算及AI加速的、代号为Ponte Vecchio的数据中心GPU产品 , 并由此形成在AI推理上以高性价比、易获取和使用的CPU为主 , 在AI训练上则以GPU为主的更完善布局 。 而且这种XPU组合还可借助oneAPI工具包实现对异构硬件的统一编程和管理 , 具有灵活调配、无缝协作和高效易用等特点 。
依托上述产品组合已经或即将带来的强大算力支持 , 英特尔从硬件到软件多维度地为AI for Science提供了优化 , 力求让更多科研人员可以亲自参与到开发和定制当中 , 并实现科学智能的真正普及 。 在其持续的努力下 , 如今已有许多合作伙伴实现了产品落地 。
例如在AI小分子药物设计领域 , 英特尔与剂泰生物合作 , 在小分子药物优化方面实现了高通量的分子生成 , 有望在更大的化学空间中探索更多潜在的候选分子 。 在大分子药物设计领域 , 英特尔则与百度飞桨、晶泰科技、上海交大等各大机构和高校进行了深入合作 , 基于AlphaFold 2实现了高通量和长序列蛋白结构预测推理的优化 , 并在AlphaFold 2中引入了TB级内存技术 , 总体达到了降本增效 。

其中 , 英特尔与百度飞桨也早在2017年就开始了以软硬件协同优势为主的合作 。 随着双方在AI领域的持续布局 , 合作的广度和深度也在不断提升 。 例如 , 英特尔和百度飞桨致力于实现英特尔全栈软硬件和飞桨的相互支持 , 通过oneAPI实现深度适配与性能优化 , 并通过飞桨+OpenVINO等方式共建部署生态 。
有意思的是 , 如今百度飞桨与英特尔在AI for Science领域达成合作 , 不仅与这些前序的合作有关 , 也与开发者生态有着千丝万缕的关系 。
长期以来 , 百度飞桨都在积极发展开发者生态 , 如建设飞桨特殊兴趣小组(PPSIG) , 希望通过开放的社区形式与全球开发者共同构建一个开放、多元和架构包容的生态体系 。 而英特尔的一位专家正巧是PPSIG-科学计算Science小组最早期的成员 , 曾积极参与了PaddlePaddle科学计算开源社区建设 , 并且对分子动力学模拟在生物蛋白分子和能源材料的应用产生了浓厚兴趣 。
在这个契机下 , 双方在AI for Science的合作也水到渠成 。 从2022年3月起 , 百度飞桨与英特尔结合各自实际 , 经过多次讨论交流 , 最终确定了任务方向与合作内容 , 共同开展AI for Science在分子动力学和生命科学领域的实质性工作 , 并取得了一系列成果 , 包括:百度飞桨实现了国内首个完成与传统分子动力学软件LAMMPS以及AI势函数训练软件DeepMD-kit融合工作的AI深度学习框架 , 并基于英特尔oneAPI实现了从训练到推理全流程打通的“0到1”式突破性进展;百度Helix Fold模型基于至强平台的AVX-512、oneDNN和大内存能力进行优化 , 不但实现了性能的显著提升 , 还可轻松预测推理长度超过4000 , 即超长序列的蛋白质结构 。

结语:AI for Science的普惠之路 , 临界点已近
一个是在深度学习领域深耕多年 , 已成长为国内开源AI框架一哥的百度飞桨 , 一个是科学计算领域Top级玩家英特尔 , 双方正依托各自优势产品和对AI领域的持续布局 , 以灵活多样的“组合拳”不断拉低AI for Science的应用门槛 , 共同朝着“让AI无处不在 , 更加普惠千行百业”以及“让合作贯穿产、学、研 , 助AI for Science打通理论、实验和产业应用道路“的目标持续推进 。
站在这个关键的时间节点 , 我们再次回溯AI发展的七十余年 , 或能更清晰地看到 , 它在每一个发展阶段的爆发 , 都在历史长河中砸出了创新的波纹 , 这些波纹终于在今天叠加成推动产业变革的巨浪 。 正如今天的AI for Science , 就正在一浪又一浪地驱动着科研冲击范式革新的临界点 , 身处其中的每一个参与者 , 都在抑制不住地畅想这种冲击成功后将为人类未来开辟的可能性 。

推荐阅读