谷歌AI探索无障碍沟通( 四 )

目前设计的 AI 模型是以典型的 ALS 相关障碍的英语人士为目标对象,相信不久后这项研究将可应用到更大范围的不同语言障碍人群。

谷歌AI探索无障碍沟通

图5/8

图 | 谷歌语音研究员 Dimitri Kanevsky(来源:YouTube)

谷歌语音研究员 Dimitri Kanevsky 是一名听力障碍者,幼年失聪后才开始学的英文,他的主要语言障碍是发音不标准,吐字模糊。

谷歌的语音转录程序显然无法对非标准发音的句子进行高精确识别。于是 Kanevsky 研究员录入了 15000 条自己的语音数据来对模型训练,起初效果并不明显,但在他的坚持下模型终于有了不错的表现,程序可以很准确识别他的声音,适应了他讲话的方式。

不同语言障碍的人群所需要的技术不同,技术实现的难度也不同,但最终实现的效果是一样的,理解和被理解。这是人类沟通的快乐源泉。

目前谷歌的 Live Transcribe 转录技术也可以作为听障人士的辅助交流工具。

推荐阅读