文献检索课件_第1页
文献检索课件_第2页
文献检索课件_第3页
文献检索课件_第4页
文献检索课件_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲常用文献检索数据库和检索技术,信息检索基本流程,信息检索就是从信息集合中找出与用户需求相关的信息。信息集合找出用户需求相关信息使用搜索引擎的经验:输入关键词/句(用户需求)搜索引擎(信息检索系统)从网上(信息集合)“找出”包含这些关键词的若干网页(相关信息),这就是用户体验到的检索流程。,常见中外文献检索库,中文文献检索库中国知网(CNKI)维普期刊全文数据库万方数据读秀学术搜索数据库外文文献检索库Webofscience(三大引文数据库SCIE,SSCI,ADesignofLandspace;DesignofPlantinglandspace,5)“(F)”同字段检索含义:“(F)”算符中F的含义为“Field”。这个算符表示其两侧的检索词必须在同一个词段中出现,(例如;同在题目字段或文摘字段)词序不限,中间可插任意检索词项。例如:POLLUTION(F)CONTRON可命中Contronandmanagementofindustrialpollution同在题目中(F)邻近算符与AND布尔逻辑主要区别在于:(F)使两个检索项在同一字段,AND布尔逻辑中两个检索词会发生在不同字段中。,6)“(s)”同句检索含义:“(s)”算符中的S含义为“Sentence”。这个算符表示其两侧的检索词必须在同一自然句子(子字段)中出现,两词的词序可以颠倒。放宽了词位置检索的要求,使表达同一概念但不满足词位置条件的文献也可以被检索出来,从而提高了查全率。,以上介绍的各种位置算符,按照限制程度的大小,(W)、(nW)最强,(N)、(nN)次之,(S)再次之。当(nN)的n10时,其作用已经相当于(S)。,3、截词检索技术,含义:用截断的词(词的片段)的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。检索者将检索词在合适的地方截断,然后截出的片断进行检索。,原因:由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。为了保证查全,就得在检索式中加上这些具有各种变化形式的相关意义的检索词,这样就会出现检索式过于冗长,输入检索词的时间太久,同时也占太多机时。,截词的方式,(1)按截断的字符数量来分:有限截断和无限截断有限截断:有具体截去的字符数。无限截断:不指明具体截去的字符数。(2)按截断的位置区分:后截断、前截断以及中间截断。(3)截断常使用截断符号,各检索系统所使用的截断符号有所不同,常用的符号有“?”,“”,“”以及“*”。以下举例中用“?”来表示有限截断,用“*”表示无限截断。注意:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认。,后方截词(前方一致或右截断),含义:将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。(1)词尾的有限截断相同字符串后可能变化一个字符时,则在其后使用一个“?”、空格、再加一个“?”,常用来表示检索词的单复数变化。例如:用system?可以查出sytem和systems的文献。相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?”代替可能变化的字符。例如:?表示两个字符,?表示三个字符,以此类推。,(2)词尾的无限截断,相同字符串后可能变化任何字符串时,则在其后使用一个“?”。这种方法可以查找出含有相同字符串的所有检索词。例如:comput?可查出compute,computer,computing,computation,computerisation等。,后截词主要使用在如下4个方面,词的单复数,如book?,potato?;年代,如198?(80年代),19?(20世纪);作者,如用Lancaster*可检出所有姓Lancaster的作者;同根词,如用biolog*,可检出biological、biologist、biology等同根词。,有限截词检索法注意事项,(1)有限截断比较精确,只检索出用户需要的词汇;(2)使用时无限截断必须注意:词干不要太短,否则会检出许多无关的文献;(3)应尽量选用不会引起误检的截断词。,中间截词(中间屏蔽),将提问字符串中间的字符用符号代替,主要用于英式美式不同拼法的英文单词,或单复数不同的单词。截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索词的时间,节约了机时。例如:“woman”和“women”,可用“wom?n”代替;“defence”和“defense”可用“defen?e”代替。检索时为防止漏检可用中间屏蔽的检索方法:m?nwom?norgani?ationdefen?e当然使用中间屏蔽的方法也要注意是否可能误检其它词汇的文献。,前截断(后方一致或左截断),前截断检索常用于复合词。例:?computer表示minicomputer,microcomputers等。前截断与后截断也可以组合起来使用。例如:*chemi*可以检出下列词汇chemical、chemistry、chemist、eletrochemical、electrochemistry、physicochemistry、thermochemistry等。,4、字段限定检索,含义:限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。(规定的字段范围内出现的信息方为命中信息的一种检索方法。)适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率。由于字段限制采用前缀和后缀的形式,又可称为前缀限制和后缀限制。,限制检索主要有两种方式:字段检索利用字段进行限制,如题名、摘要、全文等通常的字段限制范围的大小顺序是:题名关键词=1994,5、扩检与缩检,1)扩检含义:指初始设定的检索范围太小,命中文献不多,需扩大检索范围的方法。扩检方法:概念的扩大范围的扩大增加同义词年代的扩大,扩大检索范围,提高查全率的技术方法:,(1)考虑同义词或近义词(使用布尔逻辑符or连接)(2)选择较大检索范围的字段如摘要(3)使用截词符(4)使用上位词(如飞行器航天飞机载人航天飞机),含义:缩检是指开始的检索范围太大,命中文献太多,或查准率太低的一个方法。缩检方法:概念的缩小范围的限定年代的减少核

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论