NLP领域文本摘要有哪些研究方法?( 三 )

有一些可以对自动文本摘要技术进行分类的方法 , 如图1所示 。 本文将从摘要输出类型的角度探讨这些技术 。 在这方面主要有两类技术:抽取式和抽象式 。

图一 自动文本摘要方法

抽取式文本摘要方法:从语篇中识别出重要的句子或摘录 , 并逐字复制 , 作为摘要的一部分 。 不生成新文本 , 在摘要过程中只使用现有文本 。

抽象式文本摘要方法:采用更强大的自然语言处理技术来解释文本并生成新的摘要文本 , 而不是选择最具代表性的现有摘录来进行摘要 。

虽然这两种方法都是文本摘要的有效方法 , 但抽象技术更难实现 。 事实上 , 现在大多数摘要过程都基于抽取式方法 。 这并不意味着抽象式方法应该被忽视 , 相反 , 对该种方法进行研究——以及对人类语言的真正语义理解——是一项值得追求的事情 。

因此 , 本文余下部分将重点介绍抽取式文本摘要的具体内容及其不同的实施技术 。

推荐阅读