王海峰出席第十四届中国电子信息技术年会,详解语言与智能( 五 )

多模态知识与语言、视觉等技术结合,发展进入“多模态深度语义理解”阶段。例如,基于知识图谱的视频理解技术,能够视频中抽取结构化语义知识,真正“看懂”视频。

语言理解技术持续发展,并通过与知识图谱、深度学习等技术融合,不断提高各种应用的智能化程度。

王海峰在演讲中介绍,百度创新地融合知识图谱、自然语言处理及深度学习技术,研发了能够深刻理解用户意图、精准满足搜索需求、提供更丰富知识内容的智能搜索引擎,并结合语音、图像、AR等感知技术能力,更便捷地与用户交互,为用户提供更精准高效的信息服务。

例如,用户用自然语言搜索“林徽因的丈夫的父亲是谁”,智能搜索引擎能够理解用户的意图,并结合知识图谱以图文并茂的形式把答案“梁启超”精准呈现给用户。又如,用户搜索“上面草字头下面句子的句是什么字”,智能搜索引擎能够为用户提供“苟”的读音、笔画、释义等丰富的信息。

除了智能搜索方面的应用,百度还基于语言理解和生成技术提供智能写作等能力。智能写作适用于财经、体育、天气、热点与娱乐事件等多领域的辅助与自动写作,大幅提升创作效率。比如,基于结构化的股票数据,可以生成关于股市的快讯新闻。结合视觉技术的智能春联,可通过刷脸检测出人物性别、年龄、微笑程度、性格特征等,生成特征词,然后基于神经网络生成技术创作出应景的春联,让人工智能技术融入大众的文化娱乐生活。

推荐阅读