百度王海峰:新一代人工智能技术促进产业智能化( 二 )

在数据、算法和算力三要素的共同作用下,尤其是深度学习的突破,人工智能技术取得巨大进步。

语音识别的准确率不断提升,在很多场景中已经超过人类。王海峰展示了基于百度语音识别技术的百度输入法“中英自由说”能力,这是目前唯一实现高精度中英文混合语音输入的产品。语音合成也取得巨大进展。百度近期上线的并行WaveRNN模型,解决了WaveNet模型需要大量计算资源的问题,合成效果大幅提升,同时能够满足在线的实时需求。结合麦克风阵列、低功耗语音芯片、高精度唤醒,以及模型波束等技术,百度领先的语音技术,应用于智能家居、车载设备、手机等,软硬结合,发挥出越来越大的价值。

计算机视觉技术也越来越实用化,形成适用于不同应用场景的技术矩阵,如图像检测、细粒度图像识别、图像处理,以及文字识别、人脸/人体识别、人体追踪、视频理解、图像生成等。比如门禁、支付等场景中的“刷脸”技术、爱奇艺等视频平台广泛应用的视频理解等技术。近期业界热议的图像生成技术,可以合成人说话的形象及声音,“AI虚拟主持人”正是基于这一技术得以登上荧幕。

在认知技术上,百度建立了完整的、包含知识图谱、语言理解、语言生成等在内的语言和知识技术布局。

推荐阅读