一年前的标准已过时!Facebook推出新NLP标准测试平台( 二 )

一、对话式AI基准已达上限

近日,Facebook AI实验室与纽约大学、谷歌DeepMind实验室和华盛顿大学合作,推出了一个衡量人工智能自然语言处理(NLP)能力的基准平台——SuperGLUE。

一年前的标准已过时!Facebook推出新NLP标准测试平台

GLUE平台

Facebook AI表示,这个名为SuperGLUE的基准测试平台建立在一个名为GLUE的旧平台之上,该平台是由谷歌DeepMind、华盛顿大学和纽约大学在2018年成立的。

SuperGLUE的创建是由于对话式人工智能系统在各种基准上“达到了一个上限”,从今年1月到现在,GLUE榜单的头名已经被微软、谷歌、Facebook刷新了3次。

“在发布后的一年内,几个NLP模型已经超过了GLUE基准测试中的人类表现。目前的模型已经推出了一个更有效的方法,它将大型文本数据集上的语言预训练模型与简单的多任务和转移学习技术相结合,”Facebook表示。

根据Facebook AI,SuperGLUE的基准测试包括一系列十分困难的NLP任务的创新,这些创新集中在机器学习的一些核心领域的上,包括采样效率、传输、多任务和自我监督学习。

推荐阅读