百度超谷歌跃升全球第二,硬核语音技术成抢夺智能音箱“C位”的王牌( 十 )

百度超谷歌跃升全球第二,硬核语音技术成抢夺智能音箱“C位”的王牌

基于CTC尖峰截断的流式多层注意力模型工作原理图

据悉,与目前业内最好的基于CTC模型的语音识别系统相比,SMLTA基于截断的端到端语音识别建模方法,让语音识别错误率的下降幅度达15%以上。

产品硬件技术:相同的价位,更佳的语音和音质体验

而除了语音识别技术,在当下的智能音箱市场,一款音箱要成为“好卖”的音箱,其中一个非常重要的因素就是性价比。如何将智能音箱的成本降到尽可能低,并拥有比同价位的竞品更加出色的音质,同时还能够有效控制住音频失真确保唤醒识别率呢?

百度超谷歌跃升全球第二,硬核语音技术成抢夺智能音箱“C位”的王牌

以百度音质、听感最好的大金刚系列智能音箱为例,百度在硬件技术层面率先做了以下尝试:

首先,在喇叭选型+音腔设计上,百度智能音箱选用了两只规格更大的2英寸全频喇叭,加两片91mm*51mm被动低音辐射器,经过将零件巧妙地布局在有限的音箱空间中,音腔容积达到了400CC,有力地保证了音效的全面输出。

推荐阅读