机器学习教你学习语言:Duolingo推出CEFR语言检测器( 三 )

有了 CEFR 标准,我们可以将改写任务视为:将一段中级学习者(例如 B1)可以理解的文本修改为内容相同的文本,同时初学者(例如 A1 或 A2)可以理解这段修改后的文本。有时,我们甚至需要把 A2 级别的文本改写为 A1!这通常需要将语言的词汇、语法或习惯用语以及与文化相关的各个方面简化为不同级别的学习者更容易理解的形式。我们的 CEFR 检测器通过评估 CEFR 等级来辅助此过程,检测器将测试学习者可以在哪个 CEFR 等级下,理解改编文本中的每个单词。例如,下面的截图展示了该工具如何将原始爱伦·坡原文的一些单词评估为 C1 或 C2 级别(红色高亮表示),并在简化文本中将最高级的单词(「nervous」)评估为 B1 级别(橙色高亮表示)。

机器学习教你学习语言:Duolingo推出CEFR语言检测器

图2/3

该工具提供了数十万个英语、西班牙语、法语、意大利语、德语和葡萄牙语单词的 CEFR 评估值,我们今天将发布其中两种语言(英语和西班牙语)的公开版本!通过利用下文描述的人工智能机器学习模型,我们可以提供海量的词汇表和多种语言的评估值。

推荐阅读