面对内容理解的准确性和效率问题,facebook是这样利用自我监督技术的(11)
在使用两个卷积神经网络对原始的、未标记的音频数据预先生成模型后,系统进行了优化,以解决越来越困难的任务:在不同的时间点预测音频,其中,箭头指示对未来的预测。
一旦这个经过预训练的自我监督模型对语音有了很强的理解,我们就使用少量的监督数据——80 小时的转录音频来训练最终的语音识别系统。我们的系统使用的标签数据比之前最好的系统 Deep Speech 2 少 150 倍,同时将错误率降低了 9%。这项工作使我们能够快速地将语音识别能力扩展到更多的语言,而不需要在每种语言中都有大量的转录语音。
这两种方法都侧重于语音和语言理解,但它们也代表了我们如何探索甚至结合不同程度的数据监督的更基础的转变。这包括利用大量未标记的训练数据,以及使用少量标记的数据来释放自我监督系统的巨大潜力。在所有与人工智能相关的任务中,越来越强调自我监督,但没有一项任务比提高我们产品的安全性更重要。
雷锋网雷锋网
推荐阅读
- FMVP|Scout的FMVP争议过大,根本原因在于观众不理解什么是FMVP!
- RNG|原来RNG真是EDG最难缠的对手!edg教练maokai朋友圈内容引热议!
- 明日方舟|明日方舟:在面对散华精锐的大范围法伤时,群奶和奶盾是基本配置
- 魔兽世界|魔兽世界:“时空漫游”将改版,增加野外内容,回归经典
- 魔兽世界|暴雪嘉年华内容遭泄露,引玩家众怒,魔兽世界成捞钱工具?
- pero|PGC分组名单出炉,PeRo迎来一个好消息,17避开AAA仍要面对SQ
- 任天堂|不依赖对外收购工作室,任天堂将更着重扩大本身游戏内容开发能力
- 我的世界|我的世界:Mojang的拖更秘诀,找到了!修复漏洞,提出更好的内容
- 魔兽世界|暴雪嘉年华原定内容泄露,5个魔兽世界同步推进,wow变捞钱工具?
- 梦幻西游|梦幻西游:面对代价党的硬核回复方式,能让对方主动说出出售价格