在谈及论文抄袭时,许多学者似乎都对所谓的“检测分数”深信不疑。前段时间,一家提供抄袭检测软件(编者注:著名英文论文查重服务系统Turnitin)的公司宣布,公司将于今年晚些时候被收购,价值17亿美元。这家公司提供基于“黑匣子”算法的软件系统,这种系统会根据你提交的文本生成一个分数,据称可以显示被检测文本与其他文本的相似程度。这样的公司不止一家。因为这些系统的确发现了一些抄袭案例,所以人们误以为它们能够将所有抄袭情况一网打尽。
漏洞百出
这用我祖母的话说,简直是“痴人说梦”。在过去的15年里,我一直在测试论文查重软件。检测结果经常令人费解,有时干脆就是错的。许多系统会把常见短语,机构的长名称,甚至参考文献的信息识别成抄袭。而且它也会漏报。如果被抄袭文本的来源未被数字化,有拼写错误,或因其他原因无法被软件系统所用,那么系统可能就无法检测到剽窃痕迹。许多抄袭案例都由于材料是翻译自外文或获取自多个来源,而未被发现。系统的评估同时基于使用的算法和可供对照的文本语料库。对于检测随机样本的系统而言,相隔仅仅几分钟再重复检测同个文档也可能得出不同的结果。我还曾见过不同的系统将同一个文本评估为全文抄袭、部分抄袭或没有抄袭。
然而这些系统生成的数字——常被冠以不同的名称,如“原创性得分”、“非唯一内容”或“剽窃等级”(PlagLevel)——通常会被人不假思索地接受。尽管可用的系统有很多,但极少有人会费劲去做二次检验。事实上,仔细阅读软件生成的报告能够发现,有些正确引用的材料,如已经恰当标明出处的“方法”部分,被标记为抄袭。
但是,编辑、教授和管理人员往往因为时间紧迫,而只依据一个简单的数字便做出对学者和论文至关重要的决策。如果软件报告的数字较小,评估论文的人可能会忽略明显能看出是抄袭的痕迹,如文风变化、拼写错误、字体更改或带下划线的字词——下划线往往意味着文本复制粘贴自维基百科。没错,我在数十篇博士论文和科学出版物中看到了这些。
如果软件报告的数字较大,编辑或教授可能会偏颇地认为提交的文章是赤裸裸的抄袭。高校针对不同学位等级正式定义了“可接受的”由软件评估的剽窃水平。教师希望软件可以标记出“烂”论文,省得他们再去费时间看。但害怕不慎被算作剽窃的学生会使用同一个系统来改写论文,用同义词替换并重新排列句子,直到检测数字看起来很好,这种行为大大损害了论文的可读性。
期刊编辑将这些数字当作“拐杖”,用以帮助他们快速过滤出那些能够直接拒绝,或在评审表示赞成之后能够毫无顾虑地发表的论文。一些期刊和会议甚至直接在网上公布他们的检测阈值。
最新阅读: