使用学术不端文献检测系统的几点体会.ppt_第1页
使用学术不端文献检测系统的几点体会.ppt_第2页
使用学术不端文献检测系统的几点体会.ppt_第3页
使用学术不端文献检测系统的几点体会.ppt_第4页
使用学术不端文献检测系统的几点体会.ppt_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

使用学术不端文献检测系统的几点体会,李家永 中国科学院地理科学与资源研究所 研究员 资源科学专职副主编、编辑部主任,目前流行的文献检测系统 国外的主要有: Turnitin (turn it ) ,iParadigms ( 1996 启用,2009亚洲版 Originality Checking allows educators to check students work for improper citation or potential plagiarism by comparing it against continuously updated databases. ) CrossCheck,CrossRef与iParadigms (抄袭检测平台, Thomson和Elsvier应用其进行投稿论文检测) MyDropBox, Sciworth (使用Microsoft搜索技术,可检测互联网资源、可公共存取的部分数据库以及可链接的某些机构内部文档),目前流行的文献检测系统 国内的主要有: ROST反剽窃(文档相似性检测)系统, 武汉大学信息管理学院 沈阳 (将文档切割为若干50-200字(可自定义)小文本,通过混合引擎将其与188亿个网页和490万篇文献进行模糊匹配,标示出相似文本块,支持PDF、DOC、PPT、XLS、TXT等格式的文档) 学术不端文献检测系统 清华大学中国学术期刊(光盘版)电子杂志社 ( 以CNKI文献库为基础,应用数据库技术、索引技术、中文处理技术、中文比对技术等集成,目前有科技期刊、社科期刊、学位学位3个系统,支持DOC、TXT等格式的文档),学术不端文献检测系统试用协议 甲方: 乙方:同方知网(北京)技术有限公司 为提高对学术不端文献的辨别和处理能力,甲方申请试用乙方开发的“学术不端文献检测系统”(下简称“检测系统”)。经过友好协商,乙方许可甲方试用并签订如下协议。 第一条 权利与责任 一、乙方许可甲方试用此检测系统。甲方只限于检测 的文献,不得检测其他任何文献。 二、对于甲方利用此检测系统作出的关于文献的任何性质认定,乙方不承担任何责任。 三、如果甲方公开使用检测系统获得的检测结果、检测数据,其后果由甲方负责。 四、乙方就甲方使用此检测系统提供技术支持和相关服务。 五、试用结束后,甲方有义务将试用情况以书面形式反馈给乙方。 第二条 知识产权 甲方应充分尊重乙方著作权,不得进行软件解密,也不得以任何方式向任何其它单位和个人转让此检测系统的使用许可,否则乙方有权要求甲方赔偿经济损失。 第三条 期限 第四条 其他,相关概念 对比范围:确定的比对数据库和时段。 重合字数:被检测文献在对比范围内,与他文句子重合、 数字重合以及相似文本块的字数总和。 文字复制比:被检测文献重合字数与该文总字数的百分比。 单源复制:复制的文字来源于单一文献(多为自抄)。 多源复制:复制的文字来源于多篇文献。 前部重合度:引言、方法、区域概况等部分的文字复制比。 后部重合度:结果与分析、结论等部分的文字复制比。 未 检 出: 文字复制比 100字,大段落连续 重合字数200字。 整体抄袭:文字复制比 80%。,资源科学文稿检测概况 比对范围: 1 中国学术期刊网络出版总库(收录 8200多种期刊)全文数据库; 2 中国博士学位论文全文数据库; 3 中国优秀硕士学位论文全文数据库; 4 中国重要会议论文全文数据库。 时段选取“全部”上网文献,资源科学文稿检测概况 2009年1月8日 9月30日 共上传自由来稿1068篇(其间所收专栏文稿54篇和部分质量很差直接退稿的未上传);检测1064篇(其中4篇检测未果); 未检出复制文字的517篇,占48.6%; 检出复制比3%的547篇,占51.4%。,48.59%,几个典型案例 自抄学位论文92% 互抄(课题组内)80% 多源抄袭52% 伪造数据24% 抄结论23% 引文复制20%(总字数10602,重合字数2074) 抄数据6%(总字数7547 ,重合字数452),几点体会 一、检测系统为界定引证、抄袭和剽窃提供了非常实用的技术手段。 从使用情况来看,检测结果绝大部分是客观的,多数情况下,当一篇文稿的文字复制比20%时或多或少有些问题,40%时多为自抄(包括团队内部自抄)或重复发表。 但检测系统仅仅是一个很有用的工具,复制或转意复制的情况非常复杂,不宜将复制比的高低作为抄袭定性的依据。,二、恰当引证是知识传承过程中的一个重要环节,应当鼓励正常的引用前人成果和正确使用参考文献,特别是综述和评论性文章,必要的复制是需要的,关键是摘抄是否合理和有无故意伪引,特别值得指出,复制率高低与创新性强弱没有必然的联系。 此外,对于青年学者,特别是硕士研究生等新入门的学者和缺乏写作经验的学者来说,他们需要有一个学习和临摹的过程,也有对学术规范的认识过程,因而必须注意区分故意抄袭和临摹效仿在性质上的不同。,三、不同的期刊和不同类型的文章对引用、复制和抄袭的界定标准应有所不同。 以报道最新研究成果为主的学术期刊应严格要求,以实用性为主的应用性技术期刊不宜过分强调,以综述、评论为主的期刊必须要求适当的引文量。 同时,复制多少合适还与期刊稿源相关,稿源好可要求严一些,反之则宽一些。 报道实质性研究成果和发布数据资料严一些,综论、综述、评论宽一些。,四、造假和剽窃是最恶劣的学术腐败行为,危害性极大,必须旗帜鲜明地加以反对和遏制。 造假包括编造数据和事实,也包括使用二次或三、四次文献无限外推和先入为主加工数据与事实。 剽窃是指没有参与课题或者没有参加实质性研究工作而占用他人成果,并且发表文章时故意隐瞒事实的行为。,五、由于数据库不够完备,文献经多次转抄后,检测可能给出错误信息,并且可能凸显版权纠纷,反而加大稿件处理的难度。 例如,某高工投给本刊的一篇稿件被检测出抄了某研究生的学位论文,而作者在收到退稿通知后来信说,该学位论文是在他的指导下完成的,学生先抄了他的会议文章。经查证,该作者反映的情况属实,但因这篇会议文章未入库,检测系统无法追踪,其结果必然是错误的。,类似的还有大量的图书、文件、内部资料等等在目前并没有被收录到相关的检索系统数据库中。 尊敬的编辑: 您好。感谢您百忙之中就稿件问题予以答复。看了附件的资料,情况基本清楚。拙文是基于我与另一研究者在西部蓝皮书:_(社会科学文献出版社出版,我记错了)的基础上修改的。该书05年出版(ISBN:XXXXXXXXXX)。去年年底因课题需要,我对文章做了些修正,但因为个人疏懒,一直拖至近期才向贵刊投稿。看了您提供的几位作者的论文,的确惊人“相似”,作为原创者,我对文章内容的来源还是自信的。这几人的文章发表时间显然晚于西部蓝皮书,我不敢妄称他人抄袭这本书,但这个事情的确令人哭笑不得。 所投文章不敢自誉,但的确是本人与合作者一点一滴积累而成。因地处偏僻,资料信息来源不畅,这个问题的确还是我第一次碰到。如条件允许的话,我打算和这几位作者联系一下,“交流”情况。我对贵刊严格审核文章的工作态度表示敬意,也希望向编辑说明真实情况,稿件弃留,烦请编辑斟酌。叨扰了。,六、学术期刊不仅是传承知识的载体,而且在维护学术评价公平、公正方面起作重要作用,做好学术期刊是学术共同体的共同责任。 “检测系统”的确为识别和遏制抄袭行为提供了有力的技术支持,但具体情况还需要具体分析,在这一点上计算机不可能代替人,同行评议和审稿仍然十分重要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论