简单粗暴而有效的改图:自动语音识别数据扩增的“一条野路”( 七 )
总结,利用改变频谱图的方式扩增音频数据样本,训练出的 ASR 模型表现极佳,优于现有最好模型,甚至超过引入语言模型,很好用。
-End-
参考:
语料库:
http://www.openslr.org/12/
https://catalog.ldc.upenn.edu/LDC97S62
文献:
https://arxiv.org/pdf/1508.01211.pdf
https://arxiv.org/abs/1904.08779
https://arxiv.org/pdf/1904.03288.pdf
https://arxiv.org/pdf/1810.11352.pdf
https://arxiv.org/pdf/1805.03294.pdf
https://arxiv.org/pdf/1609.03193.pdf
http://www.speech.cs.cmu.edu/15-492/slides/03_mfcc.pdf
推荐阅读
- 三国杀|三国杀:谁是技能最简单的武将,返璞归真,这就是武将基本元素!
- ag战队|关键的卡位赛,AG超玩会却上了猫神,原因很简单,但是却很心酸
- ps3|魔兽怀旧服:专业打“补丁”的装备,虽然获取简单,但能弥补短处
- 地下城堡|LOL手游上分总结,中单最简单上单没人帮,快手投大钱招新主播
- |《英雄联盟手游》当前版本最强上分英雄公布,阿克尚最强团战“利器”,上分很简单
- 黄忠|五个能秒坦克的射手,香香仅排第五,榜首瞬秒脆皮太简单
- 炸弹人|英雄联盟手游:炸弹人+石头人走下,简单又强力啊
- 貂蝉|高难度英雄等于高操作英雄?非也,有些英雄简单,但你却玩不好
- 冒险游戏|DNF:“大作战”活动真实有效!各大欧皇比拼,相当于送梦想白金
- 原神|原神:新深渊出炉后,钟离最终还是倒了?削弱一个角色太简单了