百度超谷歌跃升全球第二,硬核语音技术成抢夺智能音箱“C位”的王牌( 五 )

远场信号处理:回声消除等多重突破性技术齐头并进

对于远场语音识别而言,远场信号处理技术贯穿了整个语音交互的过程,技术的强弱将持续影响到整个语音交互体验。而这实际上是最容易受到外界环境干扰的环节,因而对于如何更好地对这项技术进行完善,需要实际落地到非常具体的场景和问题中去找答案。

多通道回声消除技术:播放音乐时也能接收用户命令

当我们在大声唱歌的同时,如果远处有个人在冲你大声说话,你能不能听清他说什么?智能音箱同样也会遇到这样的问题,因为人离设备的麦克风的距离往往很远而设备自身扬声器离麦克风的距离很近,所以当用户在智能音箱在播放音乐时下达语音命令,往往得不到准确回复,甚至得不到回复。

在这一场景下,回声消除技术就非常重要了。对此百度研发出了能够根据硬件与环境自适应的多通道回声消除技术,以及音量自适应的两级后处理和双模式下(回声和非回声模式)的噪音抑制技术,确保在任意音量下,回声都能被很好地消除以及说话人的声音能被很好地保留,在确保语音唤醒的精度、降低回声残余引起的误唤醒的情况下,还能在全双工连续交互技术的加持下实现高精准的语音交互成功率。

推荐阅读