百度2019语言与智能技术竞赛完美收官,真实数据对接产业真实问题( 二 )

百度2019语言与智能技术竞赛完美收官,真实数据对接产业真实问题

百度技术委员会联席主席吴华博士总结本届竞赛成果

在AI技术逐渐与更多生活场景深度融合的时代,如何让机器像人一样具备语言能力,可以理解和运用自然语言,并基于知识学习持续进化,是人工智能目前需要解决的核心问题之一。据悉,百度作为此次大赛的承办方,不仅为选手开放了大规模的真实数据集,还为选手提供了全面的技术与资源支持。三大任务上,百度分别开发了先进的、基于飞桨(PaddlePaddle)深度学习框架的开源基线模型,帮助选手快速进入开发工作,大幅提升参赛效率。

“今年三个赛事中的阅读理解任务更聚焦在当前系统尚不能正确回答的问题,旨在全面评测机器进行深度语言理解以回答复杂问题的能力。”吴华在报告中表示,“知识驱动对话任务百度在360万知识信息构建的知识图谱基础上,人工标注了3万组有主动能力的对话数据、超过27万中文句子。”值得关注的是知识驱动对话任务是百度首次开放的对话数据集。信息抽取任务上百度发布了业界规模最大的中文信息抽取数据集。可以说,本届比赛更具有实践挑战性。

推荐阅读