AI做八年级试卷得90多分,艾伦研究所问答系统已达中学水平( 四 )

系统架构

系统一开始是由八个子模块组成的,基本上可以分成三类:

统计和信息提取

推理

大规模语言模型

AI做八年级试卷得90多分,艾伦研究所问答系统已达中学水平

图3/7

Aristo 系统的一个模块进行知识推理时的方法。

随着项目的进行,研究人员逐渐将研究精力投入语言模型模块的构建上,但是在系统最终集成时,他们会将八个模块集成为一个系统,使用集成模型进行推断。

在语言模型模块方面,研究人员主要使用了 BERT 作为语言模型。在此,BERT 将单选题视为一个分类任务。首先,研究人员将背景知识和对应的问题利用信息搜索的方法提取出来,并让 BERT 学习每个问题对应的知识。之后,研究人员使用几个数据集中的教学大纲微调模型,包括了一些不属于科学知识领域的内容。最终,研究人员将不同变体的 BERT 模型集成在一起。具体流程如下:

推荐阅读