原创<br> 百度语音的「一小步」,可能是语音技术「登月计划」的一大步( 二 )
接下来,本文将从此次公布的流式多级的截断注意力模型入手,揭秘这项技术背后的意义,同时结合语音技术赋能百度其他产品线的案例,进一步探讨这家公司的 AI 战略方向。
01 . 技术突破:学术界一大难题的落地
过去几年,AI 被诟病的一大原因就是技术落地困难,一项实验室的技术即便再怎么先进,倘若无法再商业化的场景里得以应用,多少都有些当代「屠龙术」的意味。
比如语音领域的注意力模型(Attention模型)。
注意力模型是一种基于对一句话里每个音节或汉字音频特征的机器学习模型。通过机器学习的方法,将音频特征自动挖掘出来。也就是说,这种方法下的语音识别过程,变成了一个字一个字的滚动生成过程。
由于摆脱了传统语音识别的状态建模和按语音帧进行解码,该模型可以直接实现语音和文本一体化的端到端建模,拥有学术界公认的建模精度。
推荐阅读
- ag战队|一诺果真AG“亲儿子”,赛后语音曝光:月光强令一诺做最终决策,网友吐槽难怪输那么惨
- 王者荣耀|王者荣耀:异界灵契技能特效升级优化,拒霜思语音二选一,上官婉儿或获得亚运会专属
- 原神|T1再次证实FPX训练赛强,队内语音迟迟未放出,LNG也意难平!
- 穿越火线|原神:米哈游开始急了,刚告完B站,现在又来搞百度
- 原神|AG赛前语音曝光,猫神自黑玩梗求血包,语气卑微让人心疼
- ag战队|AG局内语音曝光,一诺再也不用指挥了,最初一句话拯救队伍
- 机战|机战30:原创女主三叶收获极高评价 夏亚坦言这是自己的新妈妈
- ag战队|AG队内语音曝光,月光只是傀儡,真正做BP的“主教练”是他!
- 明日方舟|明日方舟会出男性限定吗?年的语音中有提到,可能性不低
- RNG|伞皇接入了RNG队内语音?赛后却被爆破:赢四号种子像夺冠一样