百度超谷歌跃升全球第二,硬核语音技术成抢夺智能音箱“C位”的王牌( 六 )

噪音抑制与增益控制技术:可自适应感知声场环境抑制噪声

我们一般都将音箱放置在家里的哪个位置?回答一般是电视柜、床头柜、书桌等靠近墙边、墙角的地方,这就带来了声音遮挡、反射问题等一众问题,会大大加剧智能音箱判断说话人在哪以及谁才是说话人的难度。

智能音箱只有拥有硬核的降噪能力,才能应对这一场景中的问题。基于已有端到端远场语音交互的整体解决方案所具备的远场信号处理与声学模型的优势,百度主要从两个方面来提高智能音箱在此场景下的降噪效果:一方面,研发了语音解混响、声源定位、场景分析、干扰抑制及声场自适应的噪音抑制与增益控制技术;另一方面,利用唤醒与识别模型反馈的语音特征信息,为声源定位提供准确的说话人后验信息,与此同时由远场信号处理为唤醒与识别模型提供多维信号决策信息。

除了回声消除、降噪等常规的远场信号处理技术优化,百度作为一家占据了巨大市场份额,并拥有多个产品品类的智能音箱厂商,对于用户体验的关注可谓非常周到,因而即便在一些非常特殊的场景和细节问题上,也不遗余力地从技术上进行优化:

推荐阅读