很多人以为知网查重就是“扔进去出个百分比”。其实没这么简单。你看到的那个数字只是结果不是规则本身。知网核心在查这几件事1. 连续重复的文字内容本质就是文本相似度比对。你的论文会和知网数据库里的内容做匹配包括已发表期刊论文学位论文本科/硕博会议论文图书资源网络资源部分英文文献库如果学校用本科版PMLC还会重点比对大学生论文联合比对库。这个很多人翻车。抄上一届学长学姐很容易直接撞上。2. 不是“几个字一样就算重复”那么简单很多人老问“连续13个字重复算重复吗”网上这个说法传得很广但别把它当铁律。真实逻辑更像按语义片段 相似内容综合判断。不是你把一句话删两个字就一定安全。比如原句企业数字化转型能够显著提升组织运营效率并优化资源配置。你改成企业数字转型可以明显提高组织运行效率并改善资源配置。这种很多时候照样会命中。因为核心表达没变。3. 引用不是自动免责很多人以为“我加了参考文献不算重复”不一定。规范引用和“不参与计算”不是一回事。如果引用格式不规范大段直接引用引用比例过高一样可能算进去。4. 自己以前写过的内容也可能算尤其硕博。你自己的已发表论文小论文会议文章已提交学位论文可能被识别成自重复。5. 表格 / 图片 / 公式不是绝对安全区很多人喜欢把文字截图塞进去。别这么搞。现在系统对图片文字识别能力比以前强很多。而且学校人工审核也不是摆设。6. 最终看的是“学校口径”同样一份知网报告不同学校看法不同。有人看总文字复制比有人看去除引用复制比有人卡单章重复率有人还会叠加AIGC检测。所以别只盯总百分比。简单说知网查的不是“你复制了多少字”而是“你的内容和已有数据库有多像”。