面对内容理解的准确性和效率问题,facebook是这样利用自我监督技术的( 八 )

通过将音频整合到这个模型中,我们能够获得更好的效果。我们的实验证明,与采用相同架构和训练流程的视觉模型相比,我们联合了音频和视频的模型在音视频事件检测基准上达到了世界领先水平,并在检测亵渎和成人内容的准确性上提高了 20%。

用自我监督进行内容理解的未来

语言、图像和视频理解方面的这些技术上的进步是我们不断努力改进政策执行能力的一部分。但是,当我们着眼于保持平台安全的长期任务时,创建可以使用大量未标记数据进行训练的系统将变得越来越重要。

我们现在的大多数系统都依赖监督训练。这给训练带来了一系列的挑战,例如在某些情况下我们会缺乏训练数据,在某些情况下我们需要收集和标记示例以从头构建新分类器以进行时长时间的训练。由于新的内容违规案例发展迅速,选举等事件已成为有害内容的聚集处,我们有责任加快系统的开发,以提高我们的响应能力。

一个潜在的解决办法是 Facebook 首席人工智能科学家 Yann LeCun 多年来一直在讨论的一种方法:自我监督。相比于仅仅依靠人类为了训练而标记的数据——甚至是弱监督的数据,例如带有公共标签的图像和视频,自我监控让我们可以利用完全未标记的数据。这种方法本质上是通用的,使自我监控系统能够使用少量标记的数据来处理未知的任务,并有可能使我们更接近实现真正人工智能的目标。

推荐阅读