百度超谷歌跃升全球第二,硬核语音技术成抢夺智能音箱“C位”的王牌( 七 )

例如考虑到用户在家中同时拥有多台小度智能音箱产品,会出现在唤醒小度时出现多台智能音箱设备同时响应的问题,百度研发了多设备协同交互技术,可准确判断用户距离不同设备的远近,从而智能选择距离用户最新的设备进行响应;而针对智能音箱的麦克风拾音孔出现堵塞、进水等问题,则从0到1研发了麦克风异常的实时监测技术,并在算法中加入抗风险的冗余模块,即使设备麦克风在出问题的情况下,依然可以实现高精度语音交互,同时将麦克风异常上报服务端,为产品售后及维修提供可靠信息。

语音声学设计:首创 Deep Peak 2、SMLTA 两大突破性模型

深度尖峰技术Deep Peak 2 模型

去年初,百度发布的 “深度尖峰技术Deep Peak 2 模型”在行业内引起的广泛关注,而百度智能音箱在该模型的加持下,无论是在解码速度还是语音识别的效率和准确性上,都已实现了行业领先。

Deep Peak 2 模型,其全称为基于 LSTM 和 CTC 的上下文无关音素组合建模,该模型通过声学模型学习和语言信息学习相分离的训练方法,使用音素组合来保留最重要的音素连接特性,从而避免了上下文无关建模时的过拟合问题。

推荐阅读