我国撤稿率相比全球偏高:“论文工厂”出品有哪些特征?( 三 )


经过作者调查研究发现 , 自2018年以来 , 目前有数千篇论文可能来自论文工厂 。
由诚信研究分析师、科学家、期刊编辑和采访人员组成的一个国际小组调查发现 , 论文工厂的服务可能包括数据捏造、出售作者、伪造同行评议和引用计划等 。通常 , 这些论文手稿在多个方面都很相似 , 往往能顺利通过同行评审 , 且引用情况良好 。
论文工厂对文献和后续研究的影响有多大尚不清楚 。近两年 , 在生命科学领域大量可能出自论文工厂的论文被撤回 。今年1月 , 英国皇家化学学会一次性撤回了68篇来自中国医院作者的论文 , 其中绝大部分出自知名大学或其附属医院 。尽管如此 , 仍有数千篇此类论文尚待确定 。
据报道 , 在伊朗、印度和俄罗斯等国均有论文工厂运行 。除了生命科学领域的论文 , 也涉及人文社科、计算机科学和工程等领域 。
Christopher指出 , 对于可能来自论文工厂的论文手稿 , 其指示性特征包括:
1.与其他论文/手稿的文本的相似性;
2.与其他论文/手稿在面板的组成和组织、注释样式、图表格式方面的相似性;
3.公式化的标题和结构;
4.杂志的稿件提交系统将稿件标记为 , 不同作者从同一台计算机提交;
5.作者使用商业的、非学术的电子邮件地址;
6.作者的ORCID ID(开放研究者与贡献者身份识别码)丢失或为空;
7.参考文献列表包含无明显原因的无关论文引用;
8.使用作者推荐的审稿人时 , 审稿时间异常短 , 且评审结果为肯定 。
02
案例解读
案例1:论文工厂或存在造假模板
论文工厂似乎有论文模板 , 在几篇不相关的论文中 , 其文本、表格、图形的总体布局和设计十分类似 。其图像数据被重复使用 , 不仅限于蛋白质印迹、显微照片等 , 还包括表格、散点图、条形图 , 甚至是数字 。
图1显示了2018年10月 , 在《皇家学会开放生物学》上发表的两篇不相关文章中的重复图像和具体数字 , 分别用蓝色和紫色框标记 , 这两篇文章来自不同的作者 , 都在2020年7月被撤回 。
图1 源自欧洲生化学会联合会快报(下同)
案例2:引用文献与内容毫不相关
可能出自论文工厂的论文还会互相引用 , 这增加了它们的可信度 。
最近提交给FEBS的一份论文手稿中 , 描述了miRNA、靶点及在特定疾病中的作用 , 参考文献列表引用了几篇文献 , 但这几篇文献中既没有miRNA、也没有靶点、更没有相关疾病机制 。这表明 , 这些论文纯粹是为了引用而列出的 。
仔细检查4篇被引用的论文后 , Christopher发现 , 每篇文章都包括一个条形图 , 值与新提交的论文手稿中的一个图形相同 , 但标签不同 , 设计和颜色也有所改变 , 见图2 。这4篇文章来自中国不同医院的不同作者 , 发表在2种杂志上 , Christopher等及时提醒了他们 。
我国撤稿率相比全球偏高:“论文工厂”出品有哪些特征?
文章图片

文章图片
图2
案例3:原始数据图像的背景和内容可随意组合
对于Christopher等检测论文工厂论文工作而言 , 围绕图表的原始数据制定一项强有力的规范至关重要 。
Christopher等还观察到 , 免疫印迹的原始数据经常会被操纵或完全捏造 。据报道 , 生成对抗网络(Generative Adversarial Nets , 一种基于人工智能的图像合成技术)可以通过计算机生成外观极为逼真的蛋白质印迹 , 创造出人们通常所称的“深度假货” 。
图3显示了最近被撤回的一篇论文中的“原始数据” , 这篇论文是在Christopher为其它杂志所做调查后撤回的 。在PS中打开图像数据文件显示 , 在每幅图像中 , 这些条带都与背景在不同的层 , 也就是说 , 可以任意将不同行的条带与假背景结合 , 这可以生成25个代表了不同实验的单独图像 。这个案例中 , 因为原作者没将这两个图层合并 , 因此可以清楚地追踪 。