谷歌用新的语音数据扩增技术大幅提升语音识别准确率( 七 )

在 SpecAugment 的研究中 , 作者们意外发现借助 SpecAugment 训练的模型 , 在不使用语言模型增强的情况下就已经可以击败之前的所有使用语言模型增强的模型 。 这不仅意味着语音识别模型+语言模型的总体表现也被刷新 , 更意味着未来语音识别模型完全可以抛弃语言模型独立工作 。

以往的自动语音识别系统研究多数都关注于找到更好的网络结构 , 谷歌的这项研究也展现了一个被人忽略的研究方向:用更好的方法训练模型 , 也可以带来大幅提升的网络表现 。

推荐阅读