原创<br> 百度语音的「一小步」,可能是语音技术「登月计划」的一大步( 六 )

2018 年的百度世界大会上,百度大脑也带来多个语音技术升级。比如「一次唤醒连续交互」的技术突破,用户只需唤醒一次就可以连续多轮对话,机器能够准确识别用户说话时的犹豫停顿、能够区分并跟随首次唤醒的用户等,用户的体验更自然、流畅,为语音交互提供了更多想象空间。

03 . 写在最后

作为当下 AI 的一个单项技能,语音技术依然有巨大的突破空间。一方面,语音识别在安静环境、普通话识别的准确率的确已经比较高了,但在复杂环境以及口音、方言等环境里的准确率还不尽如人意。

另一方面,语音技术不仅是声音与文字之间的转换问题,也不是单纯的软件或硬件问题,面向未来的语音技术是硬软一体、语音语言一体、识别和交互一体。

百度这次推出的流式多级的截断注意力模型SMLTA,无疑是中文在线语音识别历史上的又一次突破。

而未来,百度语音的重要着力点是向下朝低端芯片发展,向上超语音语义一体化和交互发展。最终,百度语音将建立从硬件底层芯片、到上层的智能硬件系统,再到系统软件,语音客户端,语音服务器及后端交互一体化的全链路语音交互技术。

推荐阅读