“神经网络之父”Hinton 引领机器感知浩瀚的人类语言文明【算力全球瞭望塔】

作者:周嘉莉

编辑:生煎

算力说

在自然语言处理(NPL)领域,深度学习正是目前热门的研究方向。在谈到实体识别、机器翻译等神经网络的高级功能前,最先需要解决的问题是如何让人类语言成为神经网络可以识别的数据类型。相比于图像、语音等较为低级的数据表示形式,语言是人类在数百万年演进中产生的一种抽象思维表达工具,机器在字面不同的两个词面前难以刻画它们之间的联系。视觉图像嵌入技术将帮助神经网络在复杂的上下文中获得丰富的语义信息,跨越语义的鸿沟。

本期编译文章来自于“深度学习之父”Geoffrey Hinton于2018年在自然语言处理领域顶级会议ACL上的获奖论文——《说明性语言理解:大规模的视觉基础与图像搜索》(Illustrative Language Understanding: Large-Scale Visual Grounding with Image Search)。Hinton在该文中探讨了图像搜索引擎在获得语言和图像之间通信的作用,重点介绍了一种大规模的基础语言查找操作系统Picturebook,并在单词相似性、语义相关性、情感/主题分类等广泛的任务中进行实验并报告结果。

推荐阅读