用脑电图也能做语音识别？新研究造福语音障碍者( 三 )_大数据文摘专栏作品作者：ChristopherD

在他们的研究中，他们观察到，与CTC模型相比，当使用较小的脑电图特征数据集训练时，attention模型的错误率更高。因此，他们在研究中只使用了CTC模型。他们还拓展了他们的工作，为一个由更多中文词汇和中英词汇等多语言词汇的列表应用了CTC模型。他们在工作中使用了非常嘈杂的语音数据，并且在使用脑电图特征的较小语料库中显示出较低的字符错误率(CER)。

本工作证明了利用脑电图特征进行鲁棒多语言语音识别的可能性，可以帮助有说话障碍的人实现语音激活技术。

它可以帮助自动语音识别(ASR)系统，例如飞行器直接语音输入，在背景噪声条件下使用简单的语音指令克服性能损失等，从而使他们能够在非常嘈杂的环境中如机场，商场等环境下执行高精度语音识别。

另外，这一研究提出的语音脑电图数据库还可以扩展，以促进该领域的研究。

原文：

https://arxiv.org/abs/1906.08045

面向更有识别力的深层神经网络嵌入，用于识别说话人