答疑 :你真的了解CNKI论文查重吗?(转载)

发布时间:2016-10-08

 

查重,查什么?

目前,学校用来进行论文检测的系统是CNKI学术不端系统(简称“AMLC”),CNKI学术不端系统可为全国各行各业在学术出版、研究生论文答辩、科研项目审批和鉴定验收、学术职称评定等项工作中防治学术不端行为提供专门的信息咨询服务。CNKI学术不端系统的存在与防治学术不端行为是紧密相关的,所以查的是大家的论文有没有存在学术不端行为

什么是学术不端?

1992年,由美国国家科学院、国家工程院和国家医学研究院组成的22位科学家小组给出的学术不端行为的定义:在申请课题、实施研究报告结果的过程中出现的捏造、篡改或抄袭行为。即不端行为主要被限定在伪造、篡改、抄袭FFP)(Fabrication, Falsification, Plagiarism)三者中。

中国科协科技工作者道德与权益工作委员会提出了我国学术不端行为的七种表现形式:抄袭剽窃他人成果、伪造篡改实验数据、随意侵占他人科研成果、重复发表论文、学术论文质量降低和育人的不负责任、学术评审和项目申报中突出个人利益、过分追求名利和助长浮躁之风。

在中国著名生命科学家邹承鲁看来:在我国学术上的不端行为还应包括伪造学历和工作经历、贬低前人成果、自我夸张宣传、一稿多投、在自己并无贡献的论文上署名、为商业广告作不符合实际的宣传等。

虽然各种定义存在差别,但实质内容大体相同,即学术不端行为是指在学术研究过程中出现的违背科学共同体行为规范、弄虚作假、抄袭剽窃或其它违背公共行为准则的行为。大致都把现有主要的学术不端行为分为以下这四类:抄袭、伪造、篡改及其他。其他主要包括不当署名、一稿多投、一个学术成果多篇发表等不端行为。

哪些具体行为是学术不端?

一、抄袭

按抄袭的内容分类:

1、论点(结论、观点)抄袭

抄袭他人受著作权保护的作品中的论点、观点、结论。

2、论据论证(实验和观测结果分析)抄袭

抄袭他人受著作权保护的作品中的论据、论证分析、科学实验(对象及方法)和观测结果及分析、科学调研、系统设计、问题的解决方法等等。

3、表格数据抄袭

窃取他人研究成果中的调研、实验数据据为己有,或者照搬挪用他人以独创形式表现的数据,据为己有。

4、图像图形抄袭

窃取他人研究成果中的独创性图像、实验图像据为己有,或者照搬挪用他人以独创形式表现的图像、图表,据为己有。

5、概念(定义、原理、公式等)抄袭

窃取他人受著作权保护的作品中独创概念、定义、方法、原理、公式等据为己有。

6、文章套改

套改他人作品的表述结构(或者情节),观点表达体系,参考文献等。

7、引言抄袭

挪用剽窃他人作品引言(或绪论),包括研究工作的目的、范围、相关领域的前人工作和知识空白、理论基础和分析、研究设想、研究方法和实验设计、预期结果和意义等。

按抄袭文字的篇幅分类:

1、句子抄袭

其表现形式主要有:

A.整句照抄;

B.整句意思不变、句式不同。如:复合变为多个简单句;直接引用变为间接引用,字句变为字句,改变表达方式、修辞等。

C.整句意思不变、同义替换。

2、段落抄袭

其表现形式主要有:

A.整段照搬。

B.稍改文字叙述,增删文句,实质内容不变。包括:段落的拆分合并,段落内句子顺序改变等等。

3、章节抄袭

照搬或者基本照搬他人作品的某一章或几章内容。

4、全篇抄袭

A.全文照搬。

B.删简(删除或简化):指将原文内容概括简化、删除引导性语句或删减原文中其他内容等。

C.替换:指替换应用或描述的对象。

D.改头换面:指改变原文文章结构、或改变原文顺序、或改变文字描述等。

E.增加:一是指简单的增加,即增加一些基础性概念或常识性知识等;二是指具有一定技术含量的增加,即在全包含原文内容的基础上,有新的分析和论述补充,或基于原文内容和分析发挥观点。

二、一稿多投

一稿多投是指:同一作者将同一篇论文(或者是题目不同而内容相似)同时或几乎同时投给两家学术刊物同时发表或先后发表。这种一稿两投或两发被认定为是有违学术道德的,原因在于它一方面浪费了编辑为审阅处理编发稿件所付出的宝贵时间和精力,浪费了刊物及刊物购买者的宝贵资金,并易引起期刊之间的产权纠纷。

三、伪造

伪造类学术不端行为是指:不以实际观察和试验中取得的真实数据为依据,而是按照某种科学假说和理论演绎出的期望值,伪造虚假的观察与实验结果,一般有伪造实验数据和样品、伪造证据等形式

伪造类学术不端行为的特点是:新研究成果中提供的材料、方法、数据、推理等方面不符合实际,无法通过重复试验再次取得,有些甚至连原始数据都被删除或丢弃,无法查证。

四、篡改

这类行为是指:科研人员在取得试验数据后,按照期望值随意篡改或取舍数据,以符合自己的研究结论,一般有主观取舍数据和篡改原始数据等形式。

五、不正当署名

根据《著作权法》的规定,署名权是作者经智力活动创作后,在所形成的作品(含复印件)上标示姓名的权利。署名权作为著作权中的一项人身权利,既表明作品的作者身份,又反映作者与作品的内在联系。享有署名权的主体是真正的作者。法律禁止在他人作品上随意署名,即使作者本人在自己的作品上署示他人姓名,也系无效法律行为。

不正当署名包括:无端侵占他人成果,使该署名者不能署名;无功者在作品中搭便车;擅自在作品上标示知名作者的姓名,抬高自己作品或者出版物的声誉。

六、一个学术成果多篇发表

一个学术成果多篇发表是指:一篇论文拆成几篇发表、一次性成果多次反复使用、同一成果被拆分成多篇文章发表、同一实验被分成多种角度阐发。这种行为导致有限资源浪费,影响恶劣。

学术不端文献检测系统(CNKI论文查重)采用基于数字指纹的多阶快速检测方法,对指定的文档做数字指纹,与相关文档指纹比对,按照文档类型与内容特征不同,支持从词到句子、篇章级别的数字指纹。相似字符串检测阈值根据学校或单位需求可调,以获得学校或单位希望的最佳检测结果。。此外,学术不端系统的查准率和查全率都是>=80%。

学术不端文献检测系统采用量化的数字规则为学术不端行为诊察提供帮助,目前提供的诊察规则如下:

1)轻度:重合文字大于1000字或重合百分比小于40%

2)中度:重合文字大于5000字或重合百分比小于等于40%大于50%

3)重度:重合文字大于10000字或重合百分比大于等于50%

学术不端文献检测系统部分界面(略:见链接)

学术不端文献检测系统全文对比(略:见链接)

学术不端文献检测系统图片对比(略:见链接)

学术不端检测系统的检测范围是进行海量对比文献资源,涵盖期刊、博硕士学位论文、会议论文、报纸、专利等学术资源数据库,(这也是小知常和大家提到的中国知网大总库),还包括网页资源数据、数百万的英文学术文献数据,并实现定期对比数据更新。支持繁体和英文文献检测的。

对于CNKI论文查重通过率,每个学校的要求可能有些出入,小知以前学校的要求,是本科通过率是30%以内,硕士15%以内的,学校具体的细则,大家需到自己学校了解。

 

学术不端系统常见问题解答

 

1、系统的最小检测单位是句子吗?如果是,那么在每句话里改动一两个字就检测不出来了吗?

系统采用的是语义级别检测技术,没有最小检测单位的概念。系统在识别重复和引用内容时,会结合上下文的内容,对达到一定的语义级别的内容进行判定,并不是单纯根据一两个词、字或者单独的句子进行判断。完整内容的重合情况,是由系统根据算法综合得出的,对文献内容的原样抄袭、改写、语句顺序调整等,都能自动检测和识别,且能快速定位和动态标注显示。

2、学生可以使用该系统吗?

学术不端文献检测系统目前已经开发了多个版本、针对不同用户的产品,但由于系统的特殊性和敏感性,目前系统仅提供给机构用户使用。大学生论文管理系统(大学生论文抄袭检测系统)提供了直接面向学生使用的学生端,可由学校用户开放给本校的学生使用,并由学校进行管理。

3、如果是从书籍上摘下来的原话,但是此话已经被数据库中的相关文献也抄了进去,也就是说前面的文章也从相关书籍上摘了相同的话,但是我的论文中标注的这段话来自相关的书籍,这个算不算学术抄袭?

检测系统不下结论,只是提供各种线索和依据,帮助用户快速掌握检测文献的信息,而是不是抄袭的判定需要由用户进行人工审查,所以,如果是您描述的这种情况,专家会有相应判断。

4、我大量地将自己以前的文献用在了学位论文中,独立发表的。请问,这算不算是学术不端?

个人的文献放在学位论文中应该是合理的,也是被允许的,这样的事实系统会在检测结果中列举出来,如果是本人的文献,审查专家也会根据具体情况迅速给出判断。

5、检测系统权威吗?

系统在技术和资源方面都具备专业性和先进性,能够提供权威检测结果。系统采用的核心技术是CNKI自主研发并已申请专利的自适应多阶指纹(AMLFP)特征检测技术,并以成熟的SmartTextMiner知识挖掘技术与国际领先的NLPE自然语言处理技术为技术支持,是业界领先的专业技术。同时,系统拥有海量、丰富的全文比对资源库支持,包括《中国知识资源总库》的全部内容,以及外文文献资源、互联网资源及大学生联合比对库、高职高专院校联合比对库等资源,并提供开放资源建设。

6、系统支持文字、公式、表格、图片格式的内容的检测吗?

学术不端的各种行为中,文字复制是最为普遍和严重的,目前本检测系统对文字复制的检测已经达到相当高的水平。同时,系统已经实现了对公式和表格的检测,并将有关的检测结果展示在检测报告中。而对于图片内容的检测,目前系统已经具备了图片检测的技术,正在进行集成的测试和优化,欢迎继续关注并给与本检测系统更多的批评性和建设性的意见和建议。
    7、系统展示的检测结果中,不同的颜色代表的是什么意思?

系统共设定了4种不同的颜色表示检测结果中的不同的文字重合情况:绿色表示未检测到重合情况;黄色表示检测到的重合比例在0%-40%之间或者重合文字大于1000字;橙色表示检测到的重合比例在40%-50%之间或者重合文字大于5000字;红色表示检测到的重合比例在50%-100%之间或者重合文字大于10000字。

8、系统以不同的颜色表示不同百分比的文字重合情况,那么到底超过多少比例算是警戒线?多少比例算是可容忍的限度呢?

系统提供的百分比只是描述检测文献中重合文字所占的比例大小程度,并非给定特定检测文献的抄袭严重程度。系统的功能定位是提供线索的工具,帮助用户更精准、便捷地发现可能存在的抄袭剽窃、一稿多投等情况,而并不给与性质上的实质判定。是否认定为抄袭等,需要用户根据具体文献的内容及考核的侧重点和考核标准进行判定。


(更多的问题,欢迎联系客服:010-62980525/62982407;传真:010-62790260Emailamlc@cnki.net

 

 

XML 地图