AI会话能力超越人类 CoQA挑战赛微软创新纪录
智东西(公众号:zhidxcom)
文 | 轩窗 王颖
智东西5月5日消息,人类在NLP领域的研究已长达半世纪,现在AI终于扬眉吐气了!5月4日,在斯坦福大学的会话问答(CoQA)挑战赛中,AI的会话能力已媲美人类,并以0.6分优势全面“碾压”人类水平!也就是说,人类与这个模型互动更像是与真人之间的交流。
CoQA挑战赛通过理解文本段落,并回答对话中出现的一系列相互关联的问题,来衡量机器的性能。此次,微软亚研院NLP团队和微软Redmond语音对话团队联手组成黄金搭档参赛。
在CoQA挑战赛历史上,他们是唯一一个在模型性能方面达到人类水平的团队!他们于2019年3月29日提交的集合系统得分对应域内、域外和整体F1分别为89.9 / 88.0 / 89.4,而同一组会话问题和答案的人类表现则分别为89.4 / 87.4 / 88.8。
图1/5
从2018年至今,人类在NLP领域不断有好消息传来。去年10月谷歌推出BERT语言模型在11项NLP任务中夺得STOA结果。今年2月,OpenAI展示了其训练的一个大规模的无监督语言模型GPT-2,可以根据前文进行续写,并且不需要特定训练。
推荐阅读
- 卡牌|LOL手游高分段热门中单,卡牌对于C位限制能力大,出装火炮是关键
- bang|“S赛冠军AD名次图火了”!Viper不及阿水,看到Bang后:无法超越
- 金铲铲之战|金铲铲之战:新赛季玩不转?圣盾大嘴帮你上分,输出能力一流
- |为什么很多人都说剑圣JUGG是伪核,后期能力不行!
- 打野|英雄联盟:木木带征服者,团战能力还是差!可能这件装备你没出!
- 神战权力之眼|《宝可梦》论神战下智挥猩的辅助能力,一发号令能教你做人?
- 原神|原神:胡桃的流水超越雷神?胡桃的魅力太大,看看国外玩家怎么说
- 凤求凰|最良心传说皮肤来袭,造型超越倪克斯神谕,未上线预定超百万
- iqoo|一万多的iPhone才能体验的高刷屏+长续航,被这款千元机超越了?
- 任天堂|不依赖对外收购工作室,任天堂将更着重扩大本身游戏内容开发能力