全球最大|出门问问联合发布全球最大多领域中文语音识别数据集WenetSpeech( 三 )_字幕|语音|文本|领域|音频|消息

文章图片

WenetSpeech 2.0
虽然 WenetSpeech 将开源中文语音识别训练数据规模提升到一个新的高度，然而希望进一步进行扩展和完善：
1.从领域角度，现有数据集在口音、中英文混合、会议、远场、教育、电话、语音助手等场景仍覆盖不足。
2.从数据量角度，现有的2万+小时的总数据，对于无监督学习仍然远远不够。
【全球最大|出门问问联合发布全球最大多领域中文语音识别数据集WenetSpeech】因此， WenetSpeech 在设计之初，就考虑到了未来做进一步扩展。目前出门问问已经开始 WenetSpeech 2.0 的工作，并且在 2.0 中，希望更多的行业机构和开发者能参与进来，能够集行业之力更好、更快地去做一个更大更泛化的数据集，从而进一步反哺和造福整个行业。

全球最大|出门问问联合发布全球最大多领域中文语音识别数据集WenetSpeech( 三 )

推荐阅读

如何找寻自我

缝纫机调线器怎么安装平车方法如何

强组词强字组词

火笋鸡翅的做法（增肥食谱）

闺女生日快乐祝福语朋友圈

LV请来潮牌设计师做艺术总监，看中的是啥

老虎豆怎么做好吃老虎豆图片怎样弄来吃

暖气有流水声是什么原因

皮球是什么体

手机怎样开通QQ空间

男生发mua说明 mua是什么意思

手指盖凹陷怎么回事

对自己的生活失去掌控咋调整

小米10s怎么没有月亮模式

我想找个偏僻的地方搞养殖！有没有推荐的地方？

南京养老金认证上门服务怎么申请南京市养老金认证

如何评价猪场阉割猪？

最后一个字是豹的成语

泰山散酒怎么样

猫发情的声音(猫发情的叫声)