进行替换|余鹏鲲:400篇论文涉嫌抄袭 ,为何大部分来自中国?

【文/观察者网专栏作者 余鹏鲲】
今年4月 , 法国图卢兹大学的计算机科学家Guillaume Cabanac等人发现 , 一些论文中作者有意回避已有的学术用语 , 而使用生造的同义词进行替换 。 对30个计算机短语的非学术同义词进行搜索后 , 他们发现有860多篇文章存在这样的问题 , 其中竟然有500多篇文章来自英文期刊《微处理器和微系统》 。 进一步的研究发现 , 这些论文如此反常的背后 , 大部分都可能存在学术不端 。
毕竟 , 把“大数据”改为“庞大的数据” , 不太可能是研究者不知情 , 更大的可能是混淆文本 , 避免查重 。
Guillaume Cabanac等人7月12日将他们的发现和这些文章学术不端的证据 , 发表在预印本网站arxiv上 , 希望引起学术界更多的讨论 。 这一风波发酵到8月 , 已成为学术界较有影响的舆论事件 。 近期《自然》新闻(Nature News) , 作为学术界头部媒体 , 完整地将Guillaume Cabanac等人的看法和证据进行了转发 , 进一步将此事推向高潮 。

进行替换|余鹏鲲:400篇论文涉嫌抄袭 ,为何大部分来自中国?
文章图片

Guillaume Cabanac等人在arxiv上公布了他们的发现和证据
针对这些情况 , 杂志的出版商爱思唯尔列出了在该期刊发表的400多篇可疑论文 , 并表示要对这些文章逐一进行“重新独立评估” 。 国内媒体也进行了跟踪报道 , 其中问题论文“大部分来自于中国”成了这些媒体标题中最刺眼的部分 。 中国的学术造假真的有这么严重吗?这次丑闻又会对中国科学家的学术声誉造成什么影响呢?
为何多数可疑论文来自中国作者
最初看到“大部分来自于中国”时 , 笔者是不愿意相信的 。 因为中国研究者虽然发生过“汉芯造假”、“基因编译婴儿”、“伪造博士证书当博后”等骇人听闻的学术丑闻 , 但总体还是相当正直的 。
2019年同样是爱思唯尔针对强迫引用发起了大规模学术调查 , 通过对69000名论文审稿人进行追踪 , 爱思唯尔最终认定其中有0.1%的审稿人高度疑似强迫引用 , 表现可疑的总占比大约是0.8% 。 在这样的一个调查中 , 没有发现任何一个中国审稿人存在类似行为 , 足以说明中国科研从业者的操守 , 绝没有某些人想的那么差 。
那为何这次多数的可疑论文会来自中国呢?直觉告诉我们 , 是否这本期刊的投稿者主要来自中国?是否这本期刊根本就是以学术不端为卖点呢?
可惜并不是这样 , 从种种角度看《微处理器和微系统》都显得十分正常 , 来自中国大陆的文章占比排名第二 , 但和后几个地区并没有很悬殊 。 国内给该期刊投稿的人员所属的机构也比较平均 , 并没有出现一家独大的情况 。 另一个尴尬的现实是 , 该杂志虽然并非什么权威的科研期刊 , 但确实在中科院评选出的高水平期刊的列表中 。

进行替换|余鹏鲲:400篇论文涉嫌抄袭 ,为何大部分来自中国?
文章图片

该期刊主要投稿者所属的地区和机构(没有来自中国的机构)
问题出在哪?笔者注意到大部分可疑的文章都发表在该期刊的特刊上 , 而且时间大部分在今年早些时候 。 所谓的特刊 , 就是学术期刊针对某一主题发出邀约 , 研究者们在截止时间之前将与主题相关的稿件投给期刊 , 期刊进行评比并按照计划选用若干篇稿件和正刊同时进行刊发 。
【进行替换|余鹏鲲:400篇论文涉嫌抄袭 ,为何大部分来自中国?】特刊稿件的审稿主要掌握在客座编辑(一般是与主编同等地位或该特刊主题领域内学有专精者)手中 , 不一定需要主编认可 , 很多时候也常常跳过同行评审就直接录用 。
过去看特刊稿件的含金量 , 主要是看特刊的主题是否与学术相关 , 再就是特刊的客座编辑是否与多数投稿者存在需要回避的关系 。 一般而言 , 除了庆祝特刊(例如某大学成立若干周年特刊)或者给钱就能发的宣传特刊(一般是给民科的 , 尊重他们的“研究自由”) , 大部分特刊上的文章是和正刊同等看待的 。
几十年来的学术发表实践证明 , 特刊这一发表方式是行之有效的 。 那些主题新颖或是社会急需的特刊 , 能够将尚不成熟的优秀研究内容征集出来 , 对后续研究者有明显的启发作用 , 从而带动一批高水平的研究 。
因此 , 这次特刊出问题有其特殊的背景 。 首先是特刊的规模太大了 , 自2019年末特刊开始 , 到2021年第二季度结束的六期特刊甚至将整个杂志的发表量都明显拉高了 , 特刊收录的文章远超正刊 。 如此之高的收录量 , 必然导致文章泥沙俱下 。

进行替换|余鹏鲲:400篇论文涉嫌抄袭 ,为何大部分来自中国?
文章图片

该期刊每一卷收录文章数量变化
另一个显著的变化是 , 从2019年末开始 , 《微处理器和微系统》的审稿时间具有统计学意义地缩短了 , 从审稿到录用的平均时间从202天 , 缩短到42天 。

进行替换|余鹏鲲:400篇论文涉嫌抄袭 ,为何大部分来自中国?
文章图片

不同时期《微处理器和微系统》杂志审稿周期
显然这背后存在着一条利益链 , 学术不端的参与者、论文掮客、客座编辑和负责学术期刊运营的责任编辑都是利益链上的重要环节 。 负责期刊运营的编辑在利益驱使下 , 设立大而无当的特刊;客座编辑对存在的问题睁一只眼闭一只眼 , 甚至出卖自己的学术名誉;论文掮客在其中上下其手 , 充当了润滑剂的作用;学术不端的参与者自不必说 , 这样的行为是很难以无心之举掩饰过去的 。

    推荐阅读