一年前的标准已过时!Facebook推出新NLP标准测试平台( 二 )
一、对话式AI基准已达上限
近日,Facebook AI实验室与纽约大学、谷歌DeepMind实验室和华盛顿大学合作,推出了一个衡量人工智能自然语言处理(NLP)能力的基准平台——SuperGLUE。
GLUE平台
Facebook AI表示,这个名为SuperGLUE的基准测试平台建立在一个名为GLUE的旧平台之上,该平台是由谷歌DeepMind、华盛顿大学和纽约大学在2018年成立的。
SuperGLUE的创建是由于对话式人工智能系统在各种基准上“达到了一个上限”,从今年1月到现在,GLUE榜单的头名已经被微软、谷歌、Facebook刷新了3次。
“在发布后的一年内,几个NLP模型已经超过了GLUE基准测试中的人类表现。目前的模型已经推出了一个更有效的方法,它将大型文本数据集上的语言预训练模型与简单的多任务和转移学习技术相结合,”Facebook表示。
根据Facebook AI,SuperGLUE的基准测试包括一系列十分困难的NLP任务的创新,这些创新集中在机器学习的一些核心领域的上,包括采样效率、传输、多任务和自我监督学习。
推荐阅读
- 手机游戏|酒馆战棋:全员恶霸,对5星随从已经过时?新英雄还有新玩法!
- 王者荣耀|王者:为什么女玩家英雄池那么浅?不是法师就是辅助,标准就两个
- 百里守约|后羿过时,伽罗太脆,最受欢迎射手易主,天克百里守约
- 貂蝉|貂蝉削弱,妲己过时,最受欢迎法师易主,天克米莱
- gk|DNF:最悲催的100级武器!1年前趋之若鹜,1年后狗都不带
- 炉石传说|炉石传说标准战士胜率第一,天梯开始硬碰硬,而bug是永恒的主题
- gk|吕德华组建混分战队,粉丝小国标不够入队标准,喊话赖神退队入伙
- 教练|把队伍从B组带到S组成为顶级教练的标准,Hero三教练全部做到了
- 穿越火线|最会画饼的国产网游,5年前就已立项,至今仍然只有一个官网
- 卡牌|炉石传说:大范重回标准!卡牌描述暗藏彩蛋?有复仇者内味儿了!