知网学术不端论文查重检测系统

知网查重的原理究竟是什么?

发布时间:2020-04-28

  使用知网查重对于现在的很多毕业生来说,都是不可或缺的,但是大多数人在使用的时候往往都会觉得特别的迷茫,不知道它的原理是什么,今天小编就来和大家详细的讲解一下知网查重的原理。


  一、知网查重算法更新


  知网查重vip5.2更新升级至最新版5.3,更新内容包括以下:检测范围多了一个源代码库,对软件工程等需要写代码的论文会有影响,其他专业不影响。报告中图、表、公式检测后还原回原文展示,新增了2019年9月以前发表文章。系统加强OCR功能,可识别图片,文中如果有“纯文字图片”,将可能被还原为文字放在文中进行检测,比如说表格截成图片就很可能不行了这方法。


  二、知网查重原理13个字


  第一是连续13个字及以上的相同,第二是所引用的一篇文献的内容总和在你的各个检测段落中达到5%,只要符合这两个条件,中国知网论文查重系统就会对你的论文进行疑似抄袭的红色标注。第三是以“章”为基本单元的。比如“封面”、“摘要”、“绪论”都会作为单独的一章,每一章出一个论文检测结果,标明重复率。每一章有单独的重复率,全文还有一个总的重复率。以上就是中国知网查重原理。


  三、知网论文查重修改


  我们都知道知网查重是分章进行,在查重过程中通过一定的比对根据某句话是否与知网数据库当中收录的文章出现连续十三字以上重复,若存在这样的重复现象,则知网会判定为该部分为重复部分。换句话说,我们应当根据该查重规则,尽量避免连续十三字以上与其他文章重复,在修改的过程中应当对原文意思进行理解,以自己的言语进行表达,以有效降低重复率。Ps:并非简单加字就能避免连续13不相同,比如加的、同时等词是没用的。


  总结:知网的查重原理有三个,首先是13个相同算重复,其次是引文内容超过段落的5%,最后是在检测过程中知网会自动进行分章节。此外,知网本次更新是增加了一个源代码库,跟图表识别功能等。以上是“知网的查重原理是13个字吗?”全部内容。


相关文章