平台|百度飞桨晒出三年成绩单:从开源框架到AI大生产平台( 二 )


在飞桨平台上 , 和高鸿志、李桑郁一样的开发者 , 有406万 。 飞桨是国内首个开源开放、功能完备的产业级深度学习平台 , 它将大量基础的、需要重复的代码固化为模型 , 利用预先构建和优化好的组件集合定义模型 , 深度学习研究者不需要深入了解底层算法 , 便可以自主快速实现从建设数据集、到模型训练、再到模型部署的整套流程 , 从而大大降低人工智能的使用门槛 。
峰会现场 , 百度AI产品研发部总监忻舟现场演示了一只机器狗的5分钟 。 飞桨全新发布的智能边缘控制台 , 仅仅需要5分钟 , 便让一只机器狗学会了识别手势的新技能 。 对于高鸿志而言 , 一款更人性化的机器导盲犬“出街”的时间 , 又可以缩短了 。
值得一提的是 , 通过多层次、低成本的硬件适配方案 , 大大降低了框架与芯片的适配成本 。 以寒武纪MLU适配为例 , 飞桨方案相比原方案 , 代码行数减少69.4% , 修改的代码文件减少62.3% , 人力投入成本降低60% 。 截至目前 , 飞桨和22家国内外硬件厂商完成了31款芯片的适配和联合优化工作 。
AI进入工业化大生产期
2019年4月第一届WAVE SUMMIT+2021峰会上 , 王海峰曾将深度学习框架定义为“智能时代的操作系统” , 它下接芯片 , 上承应用 , 尤其在大生产阶段 , 能够将AI技术以标准化、自动化和模块化的方式输出给各行各业 , 实现规模化应用;同时以平台为基础促进融合创新、共同发展 , 凝聚各方 , 通过赋能广大开发者 , 有力支撑AI工业大生产 , 促进技术创新和产业智能化升级 。
飞桨源起于2018年7月 , 开源框架 v0.14发布 , 百度官方首次开源CV/NLP/语音/强化学习等10个模型 , 提供了从数据预处理到模型部署在内的深度学习全流程的底层能力支持 。
经过三年的发展 , 飞桨持续突破了核心框架的创新 。 全新发布的开源框架v2.2 , 新增大量科学计算API , 高效支持超大模型训练的端到端自适应大规模分布式训练技术;全流程加速文本任务 , 解决文本领域开发在性能和训推一体方面的痛点问题 , 在飞桨产业级模型库里 , 新增的知识增强文心大模型 , 可以让大模型真正进入产业应用 。
峰会现场 , 国家电网上海电力公司调度中心副主任肖飞讲述了国家电网对于“人工智能”的渴望 。 基于双碳的目标 , 风能和太阳能等可再生能源在电网中的占比正在逐步提升 , 但对整个电网的系统管理提出了非常大的挑战 , 尤其是因自然条件变化产生的不确定性 , 可能会对整个电网产生灾难性影响 。 这就需要利用深度学习、监督学习、非监督等模型 , 对可再生能源的消纳、负荷等资源的配比精准预测 。
肖飞介绍 , 通过百度飞桨平台 , 国家电网的新能源预测准确性提高了85% , 智能安排从分钟级提高到了秒级 , 为整个电网运行奠定了非常好的基础 。

推荐阅读