清华团队在仿生双通道语音识别方面取得新成果自动语音识别技术有助于提高人民的生活质量 , 但是该技术难以适用于失声患者或环境噪音较大等情况 。 为拓展语音识别技术的使用场景 , 可应用生理信号进行语音识别 , 但是目前该领域使用单一种类的生理信号进行语音识别 , 存在佩戴电极数量多、识别准确率低等问题 。
清华大学集成电路学院任天令教授团队根据语音的生成机制开发了一种基于石墨烯的融合肌电电极和力学传感器的双生物通道传感器(DGEMS)用于采集佩戴者说话时下颌部和喉部的肌电信号和力学信号 , 其中肌电电极和力学传感器均通过激光直写聚酰亚胺薄膜制备 , 石墨烯肌电电极比商业肌电电极具有更高的信噪比和更低的电极-皮肤阻抗 , 石墨烯力学传感器具有极高的稳定性 , 在千万次疲劳测试后依旧可以感知力学变化 。
图:语音生成机制和传感器工作原理、肌电信号和力学信号频谱及语音识别性能图
肌电信号和力学信号在频谱上具有不同的特征 , 肌电信号的能量主要集中在高频部分 , 力学信号的能量集中在低频部分 , 融合两种不同种类的生理信号进行语音识别可以减少电极佩戴数量并提升识别准确率 。 整个识别系统包含两个贴片 , 每个贴片输出一路肌电信号两路力学信号 。 该工作在包含数字0-9的数据集中实现100%的识别率 , 在包含71个单词的扩展数据集中实现96.85%的识别率 , 该结果是目前在最大的孤立词数据集上实现的最高的识别准确率 。 此外 , 使用该方法进行语音识别还具有较高的抗噪特性 , 在70dB的外界环境噪音下 , 也可实现95%以上的识别率 。 以上研究表面基于双生物通道的融合传感器在复杂的语音识别应用环境中具有重要的发展潜力 。
上述相关成果以“使用基于石墨烯的肌电-力学传感器的仿生双通道语音识别”(Bioinspired dual-channel speech recognition using graphene-based electromyographic and mechanical sensors)为题 , 于10月3日在线发表在《细胞报告·物理科学》(Cell Reports Physical Science)上 。
近年来 , 任天令团队致力于二维材料的基础研究和实用化应用的探索 , 尤其关注研究突破传统器件限制的新型微纳电子器件 , 在新型石墨烯声学器件和各类传感器件方面已取得了多项创新成果 。
推荐阅读
- 全由本土培养:29岁女科学家发6篇Science获百万大奖
- 陈宝惠/邹炜团队发表LiveArt新技术实时监测和定量核糖体RNA生成
- 自主研发“超级流感药”,「安谛康生物」如何布局抗呼吸道感染赛道?
- 一颗三亿年前的“螺丝”,镶嵌在石块中,史前巅峰时代由此被揭开
- 如果载人登月和月球基地建设成功,意味着我国新能源产业将会领先这个时代!
- 在人体内潜伏3500万年,史前病毒遗传物质或将觉醒!我们该担心吗
- “最有可能得诺奖的90后”,27岁攻克世界难题,纯国产美女科学家
- 达安科普:病毒如何发生变异?新冠核酸快速检测助力关口防控!
- 林东昕/郑健团队等首次揭示RNA甲基化可调控DNA甲基化