面对内容理解的准确性和效率问题,facebook是这样利用自我监督技术的( 五 )
多年来,我们的 CV 系统已经逐渐识别出更多的图像组件,现在可以用一个单一的网络对前景和背景中的物体进行检测。这样可以更好地理解照片的整体背景,更高效的进行图像识别。
我们的结果表明,与只进行实例和语义分割的网络相比,全景 FPN 可以将执行实例和语义分割所需的总体计算量几乎减半。在实践中,这使系统对图像的故事背景有了更好的理解,而这一点在判断它是否违反我们的政策时很重要。但这项工作也会影响到其他应用程序,例如,它可能会潜在地改进我们用来向视力受损者描述图像的自动 alt 文本。
在视频中发现违反政策的行为比在照片中发现违反政策的行为更难。理解视频意味着理解构成给定帧序列的大量图像以及该序列中的行为表示的动机,同时还要处理非视觉的输入,如音频等。
由于这些困难,视频理解还处于起步阶段。无论是在准确性或是效率方面,我们一直在推进视频理解领域最先进的技术的研究,其中一部分工作是专注于我们系统的注意力和在最相关的数据集上进行训练。例如,通过将我们的三维卷积分解为单独的二维和一维卷积(分别与给定视频序列中的空间和时间相关),我们减少了可训练参数的数量。或者,我们可以保持相同数量的参数并提高精度。使用这个框架,我们可以在准确性和效率之间找到平衡。
推荐阅读
- FMVP|Scout的FMVP争议过大,根本原因在于观众不理解什么是FMVP!
- RNG|原来RNG真是EDG最难缠的对手!edg教练maokai朋友圈内容引热议!
- 明日方舟|明日方舟:在面对散华精锐的大范围法伤时,群奶和奶盾是基本配置
- 魔兽世界|魔兽世界:“时空漫游”将改版,增加野外内容,回归经典
- 魔兽世界|暴雪嘉年华内容遭泄露,引玩家众怒,魔兽世界成捞钱工具?
- pero|PGC分组名单出炉,PeRo迎来一个好消息,17避开AAA仍要面对SQ
- 任天堂|不依赖对外收购工作室,任天堂将更着重扩大本身游戏内容开发能力
- 我的世界|我的世界:Mojang的拖更秘诀,找到了!修复漏洞,提出更好的内容
- 魔兽世界|暴雪嘉年华原定内容泄露,5个魔兽世界同步推进,wow变捞钱工具?
- 梦幻西游|梦幻西游:面对代价党的硬核回复方式,能让对方主动说出出售价格