已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浅析如何降低毕业论文的查重率,汇 报 人:王成聪 学 号:S20113801 指导老师:高素萍 教授,Contents 目录,1.前 言,4.四种检测系统算法对比,5.论文修改的六大误区,2.几种常见检测系统,3.四种检测系统数据库对比,6.论文修改实战攻略,很多高校都明确规定,如果检测重复率超过学校规定范围,就会被延迟毕业甚至取消学位。 但而软件毕竟是人工设置的一种机制,里面内嵌了检测算法,我们只要摸清其中的机理,通过简单的修改,就能成功通过检测。 拒绝剽窃-_-|,现在提供论文检测的机构主要来源于三大中文期刊数据库(三驾马车): 1、中国知网论文检测系统(CNKI) 2、万方论文相似性检测系统 3、维普通达检测系统 4、PaperPass论文检测系统(最严格) 5、PaperTest论文检测系统(山寨版) 6、PaperRater论文检测系统(不常用) 7、Turnitin Uk英文检测系统(英文SCI、EI) 8、小语种论文检测系统,就目前的情况来看,中国知网论文检测系统(CNKI)检测结果最权威,被绝大多数高校采用。但是,知网检测系统不对个人用户开放,而且检测费用较昂贵,硕士论文一般为350元/篇。,1、中国知网论文检测系统(CNKI),万方检测系统十分廉价,淘宝网2元/万字,但检测结果不准确,而且万方不检测互联网及英文资料,和中国知网论文检测系统(CNKI)的偏差较大,不推荐使用。,2、万方论文检测系统,和万方检测系统一样,维普通达检测系统也检测价格也很便宜,淘宝网2元/万字,可检测互联网及英文资料,结果相比万方检测系统要更准确。 维普的复写率(红色字体标注)与中国知网论文检测系统(CNKI)相似,但引用率(蓝色字体标注)比对算法不科学,检测结果只可作为初级修改使用。(覃琳岚20%维普52%知网),3、维普通达检测系统,PaperPass检测论文的价格和万方、维普差不多,淘宝网2元/万字,检测结果相比万方、维普检测系统更接近知网,但其检测的严格程度要高于知网。 PaperPass的比对算法和知网一样,检测结果可作为后期修改使用。,4、PaperPass论文检测系统,CNKI主要包括1994年以来的期刊论文、报纸、博硕士学位论文以及全国重要会议论文等,8127种科技期刊全文,总量已达2272万篇,是目前最全面的中文数据库。 万方数据库主要收录1998年以来国家级学会、协会、研究会组织召开的会议论文,4529种科技类期刊全文。 维普自1989年以来共收录有中文期刊8000余种,全文文献6000多万篇,中文报纸1000余种,外文期刊4000余种,以及十多亿个网页资源。(使用不方便),1、CNKI&万方&维普数据库特征,2007年,李响和丁辉创建“”网站,两人编写并利用“爬虫”软件非法复制了“万方”、“维普”等公司的数据库,在网上进行论文查重检测,非法获利700多万元。部分PaperPass技术人员重新注册了域名:www. 因此,PaperPass数据库集“万方”、“维普”等数据库于一身,无论库容还是学科覆盖面都不逊于CNKI,论文总数高达9000万篇,网页10多亿个。,2、PaperPass数据库特征,各个检测系统的算法区别并不大,只是数据库有多有少;除了万方以外,知网、维普、PaperPass都检测互联网及英文资料;软件界定抄袭的阈值设置不同,这些都会影响检测结果。 下面以知网(CNKI)的对比算法为例进行讲解。,1、知网检测采用模糊算法,整篇上传检测,格式对检测结果的影响几乎为0。 2、如果该论文有自动生成的目录,系统会将按论文章节分段检测,否则自动分段进行检测。,中国知网论文检测系统(CNKI)算法,3、CNKI对界定抄袭的灵敏度阀值设为5%,以段落计,低于5%的抄袭或引用会被忽略。例如:某段有1000个字,单篇引用文献在50字以下是不会被检测出来的。 4、连续13个字相似或抄袭都会被红字标注,但是必须满足第3点里面的前提条件:即你所引用或抄袭的某篇文献总字数在检测段落中要超过5%。,中国知网论文检测系统(CNKI)算法,维普通达的复写率算法(红色字体)和CNKI类似,但引用率的内嵌算法不合理,系统默认凡是参考文献上标所在的两个句号之间的文字都算是引用,会用蓝色字体标示出来,用来计算引用率。,维普通达检测系统算法,PaperPass和知网检测系统比对算法相似,以句子为最小检测单位,也采用模糊算法(类似于杀毒软件的云查杀),加上PaperPass的数据库集万方、维普于一身,检测算法比知网还要严格,检测准确率达到了99%以上,检测结果往往偏高于知网7%左右。,PaperPass检测系统算法,1、将大段落分割成小段落(X) 2、文章中所有的字间插入空格(X) 3、抄袭那些没有在数据库中的书籍(X) 书籍中经典部分很可能已经被人引用而进入数据库,容易躺枪。 4、不同文章抽取不同章节拼接成新文章(X) CNKI是以句子为最小单位的,这对抄袭检测的结果影响几乎为零。,论文修改的七大误区:,5、将抄袭句子的后面标注参考文献(X) 知网在检测专用术语中有两种库:一种是抄袭库,一种是引用库。断句的时候,当发现一句话,来自于抄袭库,他则算是抄袭,如果发现是引用库的时候,则算引用。他只以两个库为标准,所以建议不要过度引用。 6、打乱一句话的顺序(X) 知网、PaperPass都采用模糊算法,只要关键词不替换就会标红 7、直接删除标红的句子(X) 模糊算法会自动关联前后句,这样修改会引起“蝴蝶效应”。,论文修改的七大误区:,1、外文文献翻译法(杨雪0.3%) 2、变化措辞法(更换关键词、重写等) 3、掐头去尾留核心,同义替换 4、Google双向翻译法(文字功底) 5、转换图片法(投机) 6、插入文本框法(投机) 7、自己原创法(伤脑筋) 8、参考PaperPass生成的修改建议 注:所有检测软件算法都在升级,灵活运用,2013年10
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 健康饮食计划测试题库及答案指南
- 项目经理年底总结及2026年度工作计划
- 2025年政工师职称考试题库及答案
- 北师大版三年级数学下册第五单元专项卷
- 卒中患者运动疗法
- 2025年公司车辆共享管理合同协议
- 幼儿园营养教案
- 作业疗法康复评定课件
- 2025年工业园区道路清洁服务合同协议
- 《综合素质》(幼儿园)历年教师资格考试真题题库(含答案解析)
- 大学生当兵职业规划
- 矿灯和自救器管理工复习试题及答案
- 冬季施工措施费(费用)
- 毛胚房租赁对方装修合同
- 初中物理课程标准(2022版)测试题库附答案(物理新课程标准试题教师资格考试教师招聘考试试卷)
- 既有线路基帮宽施工方案(锦承-改)
- ZZ024 美术造型赛题-2023年全国职业院校技能大赛拟设赛项赛题完整版(10套)
- 115个低风险病种ICD-10(2019 v2.0)编码表、专科医院单病种(术种)目录
- xx县副科选拔真题(干部选拔)
- GA 254-2022警服内穿衬衣
- 电力设备预防性试验规程
评论
0/150
提交评论