首页>> 写作技巧 >>论文查重，可能比你想的更靠不住

论文查重，可能比你想的更靠不住

作者：PaperQuery论文查重日期：2019年10月25日

在谈及论文抄袭时，许多学者似乎都对所谓的“检测分数”深信不疑。前段时间，一家提供抄袭检测软件（编者注：著名英文论文查重服务系统Turnitin）的公司宣布，公司将于今年晚些时候被收购，价值17亿美元。这家公司提供基于“黑匣子”算法的软件系统，这种系统会根据你提交的文本生成一个分数，据称可以显示被检测文本与其他文本的相似程度。这样的公司不止一家。因为这些系统的确发现了一些抄袭案例，所以人们误以为它们能够将所有抄袭情况一网打尽。

漏洞百出

这用我祖母的话说，简直是“痴人说梦”。在过去的15年里，我一直在测试论文查重软件。检测结果经常令人费解，有时干脆就是错的。许多系统会把常见短语，机构的长名称，甚至参考文献的信息识别成抄袭。而且它也会漏报。如果被抄袭文本的来源未被数字化，有拼写错误，或因其他原因无法被软件系统所用，那么系统可能就无法检测到剽窃痕迹。许多抄袭案例都由于材料是翻译自外文或获取自多个来源，而未被发现。系统的评估同时基于使用的算法和可供对照的文本语料库。对于检测随机样本的系统而言，相隔仅仅几分钟再重复检测同个文档也可能得出不同的结果。我还曾见过不同的系统将同一个文本评估为全文抄袭、部分抄袭或没有抄袭。

然而这些系统生成的数字——常被冠以不同的名称，如“原创性得分”、“非唯一内容”或“剽窃等级”（PlagLevel）——通常会被人不假思索地接受。尽管可用的系统有很多，但极少有人会费劲去做二次检验。事实上，仔细阅读软件生成的报告能够发现，有些正确引用的材料，如已经恰当标明出处的“方法”部分，被标记为抄袭。

但是，编辑、教授和管理人员往往因为时间紧迫，而只依据一个简单的数字便做出对学者和论文至关重要的决策。如果软件报告的数字较小，评估论文的人可能会忽略明显能看出是抄袭的痕迹，如文风变化、拼写错误、字体更改或带下划线的字词——下划线往往意味着文本复制粘贴自维基百科。没错，我在数十篇博士论文和科学出版物中看到了这些。

如果软件报告的数字较大，编辑或教授可能会偏颇地认为提交的文章是赤裸裸的抄袭。高校针对不同学位等级正式定义了“可接受的”由软件评估的剽窃水平。教师希望软件可以标记出“烂”论文，省得他们再去费时间看。但害怕不慎被算作剽窃的学生会使用同一个系统来改写论文，用同义词替换并重新排列句子，直到检测数字看起来很好，这种行为大大损害了论文的可读性。

期刊编辑将这些数字当作“拐杖”，用以帮助他们快速过滤出那些能够直接拒绝，或在评审表示赞成之后能够毫无顾虑地发表的论文。一些期刊和会议甚至直接在网上公布他们的检测阈值。

上一篇：【论文查重】奥斯马尼亚大学论文重复率

下一篇：论文查重当前存在的某些缺陷

>>>免费查重软件介绍

>>>免费查重入口

论文查重，可能比你想的更靠不住

服务中心

导航目录

关于我们