百度大脑首次发布AI硬件:「蓄谋已久」向终端发力( 四 )

百度远场语音开发套件

在语音识别方面,百度打算将智能音箱上最为重要的远场识别麦克风阵列的软硬件技术开放出来,供所有厂商使用。

「我清晰地记得在 2017 年,百度曾预测大量科技公司都会发力远场麦克风阵列。」百度语音技术部产品与架构负责人谢延在发布会上表示,「去年智能音箱领域的发展印证了我们的预测。今天 DuerOS 激活数量超过 2 亿,和百度大脑的语音识别技术进步是分不开的。」

百度在发布会上介绍了近期的一些技术突破,包括一次唤醒多次交互技术,以及刚刚推出的 SMLTA 模型。其中,流式截断多层注意力建模(SMLTA)方法可将在线语音识别精度提升 15%,是全球首次实现的基于 Attention 技术的在线语音识别服务,已大规模部署在了百度输入法中。现在,人们在手机上就可以获得人工智能带来的高精度语音识别体验了。

百度认为,在远场语音识别时代开发者有四个需要重点注意的地方:信号处理、软硬结合、端到端(在 AI 建模上)以及唤醒技术(整词的唤醒词进行建模)。为了方便更多公司开发属于自己的产品,百度发布了远场语音开发套件。

推荐阅读