面对内容理解的准确性和效率问题,facebook是这样利用自我监督技术的( 四 )

这种方法和我们的跨语言预训练工作一起,将提高我们在不需要额外的语言标记的训练数据的情况下,处理多种语言的仇恨言论、欺凌和其他违反规定行为的能力。这两种技术都将支持我们现有的多语言单词嵌入的使用,它将不同语言的相似单词映射到同一空间(而不是 LASER 的句子级映射)。这些嵌入已经部署到产品中,用于广泛的跨语言理解任务,包括识别内容冲突等。

提高对照片和视频的理解水平

人们在我们的平台上共享数十亿张照片,理解这些照片中的内容对于保护人们的隐私安全极为重要。即使对像素的直接分析可能足以让我们的系统识别图片中的单个对象,我们也会进一步推进行业领先的 CV 技术的研究,并教会系统了解这些对象之间的关系在什么情况下代表着违反政策。

我们的系统擅长识别照片前景中的物品,如狗或球。但直到最近,他们一直在努力理解背景更大、包含更少的像素集合的照片。使用一种新的对象识别方法,即全景特征金字塔网络(panoptic feature pyramid network,即 Panoptic FPN),我们可以在一个统一的神经结构上同时执行实例分割任务(前台)和语义分割任务(后台)。

推荐阅读