人工智能冒充人刷假新闻、灌水评论怎么办?让人工智能来鉴别( 二 )

GLTR可以根据词频,标明最可能出现的单词搭配。最易预测的单词是绿色的,较难预测的是黄色和红色的,最难预测的是紫色的。当对Open AI编写的算法所生成的文字进行测试后,发现大部分单词都可预测;而人类写出的新闻和科学摘要文字搭配更多样。

那么,什么样的用词才是AI无法模仿的“人来之笔”呢?澎湃新闻采访人员将《哈姆雷特》中脍炙人口的段落放进该工具中检索。

人工智能冒充人刷假新闻、灌水评论怎么办?让人工智能来鉴别

《哈姆雷特》选段,右为中文译文可以看到,莎翁的手笔确实不是AI能轻易揣摩的,短短的片段中就出现了20多处标紫。第一处标紫的“暴虐”虽非多么生僻的词汇,但用来修饰“命运”却并不常见。在AI眼中,这种搭配犹能体现出“人性之光”。

GLTR的研究人员让哈佛的学生分别在不使用GLTR、和使用GLTR的时候,判断文本是否是人工智能生成的。实验结果表明,在不使用GLTR时,学生们只能识别出一半的虚假文本;而看到GLTR所做的标注后,他们可以识别出72%的虚假文本。Sebastian Gehrmanns是一位参与GLTR发明的博士生,他表明:“我们的目标是建立一个人类和人工智能协作的体系。”

推荐阅读