腾讯提出NumNet＋模型，超越谷歌登DROP排行榜第一名( 九 )_图1

微信 AI 团队：像我刚才举的例子 “刘德华老婆是谁？”，这种相对比较简单的，在文本当中能够直接找到答案的这类问题，或者通过稍复杂一点的字面匹配就能够把问题答案定位出来，现在来看大家提出的模型对这些问题解决得还是不错的。最近一两年大家比较关心的问题，SQuAD 是预先给定问题一段文本，并且答案一定会在这段文本里面出现。OpenQA 相对来说会把它拓宽一些，需要系统到库里面找材料，然后回答问题，这个显然比 SQuAD 的定义会更难一些。现在这一块大家也做了很多工作，但是普遍来看对于自动检索文本这一块做得还不是特别成熟，所以 OpenQA 的效果会比 SQuAD 差一些。这是一个分支。

第二，大家关心各种各样的推理问题。典型的两类，一类是正在研究的涉及到数学运算，或者涉及到直接操作符号相关的推理；另类是大家研究比较多的推理分支，是要回答这个问题一定要结合多条文本做多步推理，综合起来看才能拿到答案。这是第二种相对比较复杂的推理类型。

第三，像我们人回答问题的时候，我们基于生活会得到很多的背景知识，或者关于这个世界的常识。比如说，我们会知道金属是会导电的，读文章的时候，文章内容里面即使没有明确告诉我们金属会导电，我们也知道不能拿钥匙捅电门，因为会触电。但是对于机器来讲，如果这些知识没有明确告诉它，那么它肯定是不知道的。如何表达关于世界的常识在模型当中使用，这也是大家最近一年来关注的方向。