自动完成文本摘要,谷歌Pegasus系统在12项测试中成绩显著( 二 )

然而这也并不是梦 , 自动文本摘要是现如今机器学习算法努力研究的方向之一 , 微软近期的也发布了相关论文肯定了这一研究趋势、目标 。 与此同时 , Google Brain和伦敦帝国理工学院组建了一个研究该系统的团队 , 命名为Pegasus , 这一款系统对应于上述群体来说是一个难得的福音 。 该系统使用了谷歌的变形金刚架构 , 与针对文本摘要能力的目前的训练目标相互结合 , 达到摘取文字信息中重要文字的效果 。 其中最引人注目的就是Google Brain旗下的名为变形金刚的神经结构 , 他可以将每个输出的元素和每个输入的元素之间形成连接 , 并在实时动态下计算他们之间的权重 , 其如同深度神经网络 , 神经元被安排在这些元素之中 , 传递输入信息的信号 , 甚至对他们中每个连接权重进行调整 , 为Pegasus模型增加优势 。

研究人员指出 , 文本摘要的主要目的是总结输入的文档 , 进而生成对他的准确、间接的摘要、概要 , 并非是简单的复制、粘贴 , 而是系统总结其中的权重 , 保持输出的语言的流畅 。 这也也很好地概括了Pegasus的优势与目的 。 目前 , 该系统在科学、小说、电子邮件、立法法案、专利文书等12项测试中取得了不错的成绩 , 达到了目前世界上最为先进的水平 。 此外 , 在材料并不完整的情况下 , 该系统的文本整合测试的结果也十分令人满意 。 从外也不必担心其内容完整度不够 , 比如 , 在100篇文章中 , Pegasus的摘要质量可以达到与在2万篇至20万篇文章的摘要效果 。 在测试中 , 含有5.68亿个参数的Pegasus模型表现最佳 , 可以使用白名单域植入网络爬虫工具 , 进而覆盖在质量上并不统一的内容 , 其摘要语言也具有较高的流畅性和连贯性 。

推荐阅读