AI会话能力超越人类 CoQA挑战赛微软创新纪录_智东西（公众号：zhidxcom）文|轩窗王

智东西（公众号：zhidxcom）

文 | 轩窗王颖

智东西5月5日消息，人类在NLP领域的研究已长达半世纪，现在AI终于扬眉吐气了！5月4日，在斯坦福大学的会话问答(CoQA)挑战赛中，AI的会话能力已媲美人类，并以0.6分优势全面“碾压”人类水平！也就是说，人类与这个模型互动更像是与真人之间的交流。

CoQA挑战赛通过理解文本段落，并回答对话中出现的一系列相互关联的问题，来衡量机器的性能。此次，微软亚研院NLP团队和微软Redmond语音对话团队联手组成黄金搭档参赛。

在CoQA挑战赛历史上，他们是唯一一个在模型性能方面达到人类水平的团队！他们于2019年3月29日提交的集合系统得分对应域内、域外和整体F1分别为89.9 / 88.0 / 89.4，而同一组会话问题和答案的人类表现则分别为89.4 / 87.4 / 88.8。

图1/5

从2018年至今，人类在NLP领域不断有好消息传来。去年10月谷歌推出BERT语言模型在11项NLP任务中夺得STOA结果。今年2月，OpenAI展示了其训练的一个大规模的无监督语言模型GPT-2，可以根据前文进行续写，并且不需要特定训练。

AI会话能力超越人类 CoQA挑战赛微软创新纪录