腾讯提出NumNet+模型,超越谷歌登DROP排行榜第一名( 九 )

微信 AI 团队:像我刚才举的例子 “刘德华老婆是谁?”,这种相对比较简单的,在文本当中能够直接找到答案的这类问题,或者通过稍复杂一点的字面匹配就能够把问题答案定位出来,现在来看大家提出的模型对这些问题解决得还是不错的。最近一两年大家比较关心的问题,SQuAD 是预先给定问题一段文本,并且答案一定会在这段文本里面出现。OpenQA 相对来说会把它拓宽一些,需要系统到库里面找材料,然后回答问题,这个显然比 SQuAD 的定义会更难一些。现在这一块大家也做了很多工作,但是普遍来看对于自动检索文本这一块做得还不是特别成熟,所以 OpenQA 的效果会比 SQuAD 差一些。这是一个分支。

第二,大家关心各种各样的推理问题。典型的两类,一类是正在研究的涉及到数学运算,或者涉及到直接操作符号相关的推理;另类是大家研究比较多的推理分支,是要回答这个问题一定要结合多条文本做多步推理,综合起来看才能拿到答案。这是第二种相对比较复杂的推理类型。

第三,像我们人回答问题的时候,我们基于生活会得到很多的背景知识,或者关于这个世界的常识。比如说,我们会知道金属是会导电的,读文章的时候,文章内容里面即使没有明确告诉我们金属会导电,我们也知道不能拿钥匙捅电门,因为会触电。但是对于机器来讲,如果这些知识没有明确告诉它,那么它肯定是不知道的。如何表达关于世界的常识在模型当中使用,这也是大家最近一年来关注的方向。

推荐阅读