2019世界人工智能大会 百度吴甜揭示语言与知识技术进化路径( 三 )

此外,ERNIE也得到了深度学习平台飞桨(PaddlePaddle)的底层加持。在GPU多级多卡训练中,基于飞桨训练ERNIE模型多机加速比达到77%,远高于其他主流实现。在加载预训练模型方面,飞桨预训练模型管理和迁移学习组件PaddleHub,可一键加载工业级预训练模型。使用PaddleHub组件,可以让ERNIE 语义表示模型实现1行代码完成预训练模型的预测、10行代码完成大规模预训练模型的迁移学习。

飞桨自然语言处理模型库PaddleNLP是基于飞桨打造的工业级中文NLP开源工具集,拥有当前业内效果最好的中文语义表示模型和基于百亿级大数据训练的预训练模型,可大大减少用户在开发过程中的重复工作,获得更好的基于工业实践的应用效果。

在应用级平台方面,吴甜以UNIT(理解与交互技术)平台为例,解析了此类平台的智能便捷。智能客服、智能驾驶等场景都对人机对话的流畅度与准确性提出严苛考验,UNIT平台致力于打造为对话系统定制的专业、低成本、全链路的技术与服务平台,并已经为金融、教育等行业提供解决方案和服务。

UNIT平台核心技术包括语义理解、阅读理解和对话管理三大部分,其中ERNIE SLU可达到在同样理解精度下标注量降低37%~72%,DataKit可使数据生产效率提升8倍,使用语义理解SLU定制可使对话技能综合研发成本降低60%。目前,UNIT平台已实现6.8万定制技能,累计交互次数达570亿次,全面覆盖智能客服、智能出行、智能办公及其他智能交互场景,为一线开发者实现AI产业化提供有力工具。

推荐阅读