原创<br> 百度语音的「一小步」,可能是语音技术「登月计划」的一大步( 五 )

原创<br> 百度语音的「一小步」,可能是语音技术「登月计划」的一大步

上述注意力模型等一系列创新也是百度语音技术推动产品创新的一个缩影。

比如地图,去年 12 月的新版本里,百度地图也将语音作为一个重要的交互方式,涵盖了导航路线、地点查找以及小度助手等等,打造更具个性化、智能化的地图。

再比如翻译,去年 10 月,百度研发了具备预测能力和可控延迟的即时机器翻译系统,可实现两种语言之间的高质量、低延迟翻译。在语音识别方面,百度提出了上下文无关音素组合的中英文混合建模单元,该方法具有泛化性能好、对噪声鲁棒、中英文混合识别等特点。

与此同时,正如百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰在百度大脑论坛上所言,「百度大脑既带动了百度业务的升级,也在推动社会智能化升级」。百语音技术不仅是百度多个产品线创新的动力,也已经并正在通过百度大脑向行业赋能。

以远场识别算法为例,通过麦克风阵列前端处理算法,可以识别目标说话人 3-5米距离的说话。目前,基于语音远场方案技术的「小度机器人人机语音交互点餐」已在上海肯德基旗舰店投入应用。

推荐阅读