Nature:华裔科学家成功解码脑电波,AI直接从大脑中合成语音( 四 )
最终,这套新系统每分钟能够生成150单词,接近自然讲话的语速水平。而以前基于植入物的通信系统每分钟可以生成大约8个单词。
技术细节:两阶段解码方法
在这项工作中,研究人员使用了一种叫做高密度皮层脑电图的技术来跟踪志愿者说话时大脑中控制言语和发音器官运动的区域的活动,志愿者们被要求说了几百句话。
为了重建话语,Anumanchipalli等人不是将大脑信号直接转换为音频信号,而是使用一种两级解码的方法。他们首先将神经信号转换为声道发音器官运动的表示,然后将解码的运动转换为口语句子,如图1所示。两次转换都使用了递归神经网络——一种人工神经网络,在处理和转换具有复杂时间结构的数据时特别有效。
图1:语音合成的脑机接口
在上图A中,以前的语音合成研究采用的方法是使用脑电图(ECoG)设备监测大脑语音相关区域的神经信号,并尝试将这些信号直接解码合成语音,使用一种称为递归神经网络(RNN)的人工神经网络;
推荐阅读
- 华为|美国禁令是“纸老虎”?中科院顶尖科学家发话了,致力粉碎美计划
- 狮子的“指纹”在哪?通过看脸,科学家改进亚洲狮种群监测方式
- 知道自己为什么不能成功吗 科学家终于找到实现目标的秘诀
- 时间胶囊!在南极冰下5公里发现“磁异常”,科学家:地壳变薄了
- 央视5直播匈公赛,伊藤美诚对阵丁宁苦主,平野对阵华裔削球手
- 已“灭绝”100年巨龟再次出现!科学家:需警惕第六次大规模灭绝
- 宇宙网络真的存在吗?科学家们一直无法实现对这些细丝的直接观测
- 如果病毒饶过人类,人类也放过蝙蝠可好?科学家:建议放手
- 宇宙最高级文明,到底掌握什么高科技?科学家:我们想象不出来
- 中国国宝级科学家,为国建造“地下钢铁长城”,将800万奖金无偿捐献