一年前的标准已过时!Facebook推出新NLP标准测试平台( 三 )
在执行基准测试之后,Superglue提供了一个单一的数字度量,总结了人工智能在完成基准测试后处理各种NLP任务的能力。
二、BERT COPA测试准确率仅有74%
根据Facebook AI,人类可以在可信的替代选择(COPA)测试上获得100%的准确率,而谷歌的BERT仅达到74%,这意味着NLP有很大的改进空间。
该研究联盟还开发了一个排行榜和PyTorch工具包,用于与SuperGLUE一起进行研究。
Facebook AI也在7月份推出了一套独立的长格式问答数据集和基准测试,这要求机器提供长而复杂的答案——这是现有算法以前从未遇到过的挑战。这个长格式问答挑战需要机器对开放式问题进行深入的回答,例如“没有大脑水母是如何工作的?”
XLNet在一些NLP任务上超过BERT
与此同时,Google在6月推出了一款名为XLNet的神经网络,该搜索巨头表示,在实际训练计算机如何在真实世界文档中显示语言方面,它比BERT更好。
推荐阅读
- 手机游戏|酒馆战棋:全员恶霸,对5星随从已经过时?新英雄还有新玩法!
- 王者荣耀|王者:为什么女玩家英雄池那么浅?不是法师就是辅助,标准就两个
- 百里守约|后羿过时,伽罗太脆,最受欢迎射手易主,天克百里守约
- 貂蝉|貂蝉削弱,妲己过时,最受欢迎法师易主,天克米莱
- gk|DNF:最悲催的100级武器!1年前趋之若鹜,1年后狗都不带
- 炉石传说|炉石传说标准战士胜率第一,天梯开始硬碰硬,而bug是永恒的主题
- gk|吕德华组建混分战队,粉丝小国标不够入队标准,喊话赖神退队入伙
- 教练|把队伍从B组带到S组成为顶级教练的标准,Hero三教练全部做到了
- 穿越火线|最会画饼的国产网游,5年前就已立项,至今仍然只有一个官网
- 卡牌|炉石传说:大范重回标准!卡牌描述暗藏彩蛋?有复仇者内味儿了!