2020-12-30 22:58:28
Turnitin 检测原理是基于互联网技术的一款强大的学术不端工具,用户通过浏览器7*24小时都可访问此软件系统,其原理是通过用户上传文稿与Turnitin海量的云端数据库和网页进行相似性的比对,并可以快速得到一个相似性评分同时在‘原创性报告’上面生成段落和句字相似性评分,并注明抄袭来源供评审者参考。
Turnitin 检测原理之原创性报告生成原理
软件上有一个总相似性指标计算公式:相似文字总数/文本字数。各个句子,段落也会有相似性指标用彩色高亮标注,蓝带 (0%),绿带(1-24%),黄带(25-49%),橘带 (50-74%) ,红带 (75-100%)。
Turnitin 检测原理经验
根据使经验推测连续5个词就会被高亮标注彩色,并且系统可以初步判断句子结构是否抄袭(变换顺序无效),它也会检测到段落结果是抄袭(会计算段落抄袭比例)。
上截图前小编和大家先确定一下分析的方法:首先分成两大类即citation(引用)和quotation(引证),因为citation有些复杂所以先说quotation,再一点点的测试citation。以举例的论文里的一处quotation为例,并结合Turnitin的分析:
这段quotation已经被Turnitin检测到,然后是Turnitin给出的理由:
我们可以发现Turnitin是有理有据的,然后Turnitin提供了与这段类似的其它essay。
并且附上Turnitin的检测度:
顺便说一句
Turnitin检测的是相似度不是抄袭度,
所以我们还是应该以一个平常心去面对。
于是我们做个实验,
将刚才的quotation改成citation:
首先我们改变句子的语序和主被动,看看能否被检测出来:
这段话中我们改变了整体句子的语序,可见如果只是简单的换下先后位置是没有用的,依然能检测出来,但当我们改变句子语义并变换动词后‘lead’后就会发现Turnitin不会把它当做相似内容,即使使用了相同的名词“alliances and circumstances”,甚至名词位置顺序不变都不会再被计入相似度内。我们再来看另一种,如果我将原先是一段的句子拆分成两个分别放在不同段落会怎样呢
可见Turnitin也不傻,句子依然会被检测到,而且还会被归为同一类
然后我们再来看看它所提供的检测度:
再然后是Turnitin给的有相似段落文章的地址:
为了检测动词是不是至关重要的被检测相似度的依据我们来换个词代替“flow”,并将此句子变成被动:
可见动词并不是关键词,关键的应该还是英文的逻辑,假如我们改变其中名词的顺序会发生什么呢?让我们测试一下:
我们可以发现在改变了单词顺序的情况下Turnitin已经不再把这段话算作相似段落了。至此我相信大家应该都明白了些什么了吧。
总结一下就是:
Turnitin检测相似度的原理显然不同于所谓的中文字数的重复检测原理,Turnitin检测的是句子在语法上的逻辑,这与单词是否重复是没有关系的,只要你使用了不同的逻辑来表达相同的话就算你重复的单词再多也是不会被检测出来的。
是否论文里抄袭的任何一点内容都会被Turnitin检测出?
是的,任何形式的想要抄,多抄少抄基本你都逃不过TurnitIn的检索。我们阅卷的时候,是可以看到你这句话里面那几个单词是抄自于哪一个文章中的哪几个单词。这个时候只要点击被TurnitIn标记出来的抄袭部分,就会出现一个文字筐,我们就可以看到原文。因此你就算是换了一半的文字以及打乱顺序,我们阅卷只要一看就知道。(很重要的一点,你读的文献你导师大部分都读过很多次了,你想懵哪有那么容易。)
如下图,只要我们点击一下红色,原文就会显示出来。
Q
检测出抄袭,又要如何打分?
文中所有的东西都会被检测,因此合格的引用也会被算进去,因此学校一般会有一个容忍限度。这也是为什么我们不能完全用机器阅卷的原因。如果有些同学就是引用了非常多原文,超过20%,有些人甚至到35%,这种情况我们判为“poor referencing”,会稍微减一点分,但没有大问题,前提是学生严格按照引用格式给出了citation和reference。如果纯粹的抄袭超过20%我们就会扣分了,到30%以上就会有挂科的危险了。不过有时候我们也会看你抄的好不好。大多数抄到这么多的同学论文本来也写得不好,给四十分或者挂掉都正常。但不排除个例写得特别好,把抄袭的东子连贯的特别好可能稍稍多给点分,但抄到20-25%基本不可能给60。
Q
我都是正常引用,检测相似度却非常高该如何办?
写得特别认真,引用了非常多文献,turnitin却显示相似度很高的,不用担心。只要你严格按照引用格式,而且一看就是自己做了很多research,查了很多文献写出来的。我们一看就知道。就算Turnitin都标记出来我们一看就知道你是正规的引用。有些学生写2000字论文引用文献list有两页纸的都有,而且格式写得好就一定会被Turnitin检测到,没关系,我们会心算减去那些部分的。这样精致的文章就算到20%都不影响我们评分。
如果是正规引用,检测却超过20%呢。那么你就要反思你的学术协作方式了。(下图是导师教导turnitin的PPT)
Q
能否具体说明一下文献常见的饮用方式?
常见的引用方式有三种:直接引用,释义,综述。最好的方式是释义。
a.直接引用,不同多说就是一字不改。根据引用长短不同分为短句引用,直接写在段落里,或者太长的就要单独列一个段落(如图)。
b.释义,也就是说你要转述文献,但你要用自己的话讲出来。你不能只是换几个单词或者换顺序,这都是属于抄袭。释义一般来说与原文长度差不多(下图为合格的以及不合格的释义手法)。
c.综述,这种一般来说你需要很简略地概括一下好几页文献的内容,你并不需要太多累赘的引用原文,你只需要把它的意思概括一下。有时候甚至用一两句话概括一本书。这时候的方式是summary。summary和quotation都不宜用太多。paraphrase才是引用的主导(下图是summary的例子)。
总之宁愿写得差,也不要抄。写得差还有感情分,写的努力更是有。抄袭那就是完蛋。
下面附带一些 Turnitin 疑问:
我应该选择Turnitin国际版还是Turnitin UK系统呢?
A:如果是在英国(UK)留学的请选择Turnitin UK来检测,在其他国家留学的请选择Turnitin国际版检测。也就是在英国留学的同学一定要选择TurnitinUK系统,不是在英国留学的都是选择Turnitin国际版;如果需要到国际期刊(如EI、SCI)上发表论文,需要提前检测,请选择Turnitin国际版检测,国内的高校毕业论文请选择turnitin国际版。
相似比超过多少会被认定为抄袭?
A:每个学校相关规定不同,部分学校规定复写率与引用率30%以下,部分学校规定在20%以下,多数学校规定在10%以下;而期刊部一般超过30%,则直接退稿。具体规定请参照各单位要求。低一些自然比较好,低于10%比较稳妥。不同学校、不同专业学科之间,重复率也不能一概而论,请咨询学校、老师或者上届学长。
turnitin 重新提交后会和第一次提交的重合百分之九十几吗?
1、第一次在学校提交turnitin查重后,会被收录进数据库中的,所以你再次提交就会出现100%或者90%多的情况。当然结果中也可以生成去除你本人作业后的那部分重复率。
2、一般学校里的turnitin系统是收录检测文章的,也就是说,你的论文只要在学校里的turnitin系统提交检测,那就会被turnitin系统数据库收录,下次检测时,就会和自己的文章重复,当然重复率就会是100%。
3、turnitin系统默认文章引用部分(quoted)和参考书目(bibliography)是算抄袭率的,有些国外的同学需要去除reference的检测报告,这就需要您告知papercheck服务人员下载排除参考书目和引用的检测报告,因为turnitin支持下载去除reference的检测报告。2019年后很多大学的Turnitin系统会减去文献部分的剽窃。
4、想提前检测一定要找可靠的检测网站或商家,因为有些商家的系统可能会收录文章或泄露你的文章,那样就麻烦了,所以在检测前一定要好好考察一下检测网站的可靠性。ASSIGNMENTBANG 论文代写检测网是专业提供论文检测服务的网站,安全可靠,值得您的信赖。
转自:https://www.assignmentbang.net/论文查重原理-一些关于turnitin的疑问分析/
原文链接:https://www.academicgod.com/us-writing/47.html
Academic God 专注提供全方位的留学生学术服务,欢迎添加我们的客服QQ/WX 5757940 咨询更多...
美国代写 2020-12-30
美国代写 2021-02-25
美国代写 2021-04-13
美国代写 2020-12-30
美国代写 2021-02-26
美国代写 2021-01-31
美国代写 2021-09-08
美国代写 2022-01-01
美国代写 2021-10-23
美国代写 2021-02-26
美国代写 2023-06-14
美国代写 2023-05-06
美国代写 2023-05-04
美国代写 2023-04-12
美国代写 2023-04-07
美国代写 2022-11-13
美国代写 2022-11-02
美国代写 2022-11-01
美国代写 2022-10-31
美国代写 2022-10-28
扫码二维码
或添加Q/微信5757940