全球最大|出门问问联合发布全球最大多领域中文语音识别数据集WenetSpeech( 三 )
文章图片
WenetSpeech 2.0
虽然 WenetSpeech 将开源中文语音识别训练数据规模提升到一个新的高度 , 然而希望进一步进行扩展和完善:
1.从领域角度 , 现有数据集在口音、中英文混合、会议、远场、教育、电话、语音助手等场景仍覆盖不足 。
2.从数据量角度 , 现有的2万+小时的总数据 , 对于无监督学习仍然远远不够 。
【全球最大|出门问问联合发布全球最大多领域中文语音识别数据集WenetSpeech】因此 , WenetSpeech 在设计之初 , 就考虑到了未来做进一步扩展 。 目前出门问问已经开始 WenetSpeech 2.0 的工作 , 并且在 2.0 中 , 希望更多的行业机构和开发者能参与进来 , 能够集行业之力更好、更快地去做一个更大更泛化的数据集 , 从而进一步反哺和造福整个行业 。
推荐阅读
- 最新消息|世界单体容量最大漂浮式光伏电站在德州并网发电
- 测试|图森未来完成全球首次无人驾驶重卡在公开道路的全无人化测试
- ASUS|华硕预热ROG Flow Z13:称其是“全球最强悍的游戏平板”
- AirPods|苹果谈论AirPods 3:最大榨取蓝牙技术,希望获得“更多带宽”
- IT|全球汽车行业价值两年突增至3万亿美元 中国电动车企立大功
- IT|全球供应25亿剂疫苗 科兴上半年营收110亿美元
- IT|全球每日新增确诊病例首超100万例 世卫:两大毒株正掀起“疫情海啸”
- 能力|有了长续航的独立通信手表,就不必为出门没带手机而焦虑了
- Tesla|特斯拉在美国召回约47.5万辆汽车 接近其去年全球交付总量
- 堆芯|全球首座,世界领跑!