已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机检索基础知识,主要内容: 计算机信息检索基本原理; 计算机检索步骤; 检索策略构成和调整方法。 武汉工程大学图书馆文献检索教研室,一、计算机信息检索基本原理,取出过程:,二、计算机检索步骤,检索过程中的具体步骤: 指在分析信息需求实质的基础上,确定检索工具、检索途径与检索用词,并明确各词之间的逻辑关系。在检索过程中具体的步骤如下:,1、分析研究课题 分析研究课题的主题内容、所属学科,然后分析出主题概念、提取关键词和分子式、号码等作为检索词,再确定课题所需查找文献的时间范围、国家范围和文献类型范围。,2、关键词的抽取 在分析了课题后,可以进行关键词的抽取,滤除一些虚词、禁用词后,将剩余的词作为关键词。 制定关键词时还须考虑同义词、不同的拼写方法、单复数形式、常用缩写词语和其完整词语,即同一概念的检索词的扩展 。,3、选择检索工具(数据库) 确定和学科专业有关的、以及和所查文献类型有关的数据库。,一些常用的国内外科技综合类数据库 中国期刊网 中国科技期刊数据库 万方数据检索系统 中华人民共和国国家知识产权局 Ebscohost 全文数据库 Ei village 工程索引 SCI 科学引文索引 ISTP 科学技术会议索引 Derwent Innovations Index 世界专利索引 INSPEC 英国科学文摘 Cambridge Scientific Abstracts 剑桥科学文摘 STARDARDS & SPECIFICATION 美国标准和规范,4、构建检索式 根据课题分析的结果,将检索词用布尔逻辑、及数据库系统使用的检索算符组成检索表达式。,三、检索策略构成和调整方法 检索策略的制定过程可以简单地理解为检索表达式的形成过程,以提高检索的查准率和查全率。 制定检索策略主要应用到: 1、 布尔逻辑算符 2、截词算符 3、位置算符,1、布尔逻辑算符,规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑“与(AND)”、 “或(OR)”和“非(NOT)”。,(1) 逻辑与(AND,也可用“*”代替) 组配用来表示不同检索主题概念之间的相交。其含义是检出的记录必须同时含有所有的检索词。AND算符的基本作用是缩小检索范围,提高检索结果的查准率。其检索结果如图所示:,以提问式“communication AND satellite” 检索为例: 图2逻辑“与”示意图 这个实例的示意图,图中的阴影部分反映了“communication”和“satellite”两词间使用AND算符后的运算结果。,(2) 逻辑或( OR ,也可用“+”代替) 表示主题概念之间的同义、近义、相关或多个并列的检索概念。其含义是,检出的记录中,至少含有两个检索词中的一个。OR算符的基本作用是扩大检索范围。其检索结果如图所示:,以提问式检索“西红柿” 有关的文献为例: 图中所有部分都为检索结果,因此 OR算符的基本作用是扩大了检索范围,防止漏检。OR逻辑关系运算对所检的主题概念起到了概念的外伸作用。,(3) 逻辑非( NOT ,也可用“”代替) 在检索时建议使用NOT,以避免与词间的分隔符“-”混淆,NOT算符是排除含有某些词的记录的,A NOT B检索出的文献中包含A的主题概念,而不含B主题概念。 NOT算符的基本作用是缩小检索范围,提高检索结果的查准率。其检索结果如图所示:,例如:检索“ PATENT not GERMAN” ,检索结果示意如下:,优先处理算符“( )” 逻辑算符OR和AND的使用方法,如果归纳成一个模式,比如有 A、B、C、D四个检索词(其中A和B,C和D分别为同义概念),检索提问式为: (A OR B)AND (C OR D) 即,同一组检索提问既含有OR算符,又含有AND算符,此时须使用优先处理算符 “( )”,将OR算符前后的词放入括号中,计算机将优先运算括号内的算符。,2、截词算符(截词符号为*或?) 此算符可看作是将某一部分相同的检索词用“或”算符连接后进行检索。 不同数据库有不同的截词符,如EI_Village2用 ?,而Web of knowledge平台用*。 基本作用是,减少输入步骤,简化检索程序,扩大检索范围,提高查全率,提高检索效率。 一般可分为后截断、前截断、中间截断、混合截断四种。,(1)后截断(开放式截断) 后截断可保持词首部分的一致性。 如:computer? 或computer*,可实现:computer , computerised , computerized , computers 的检索,(2)前截断 前截断可保持词尾部分的一致性。 如: ?computer ,可实现:microcomputer , minicomputer 的检索,(3)中间截断(嵌入式截断) 中间截断可实现对某词不同拼法的检索,嵌入字母数等于问号数,通常用在英美不同拼法。 如:computeri?ed ,可实现:computerised , computerized 的检索,(4)混合截断 混合截断可以实现对不同词根、词首、及中间部分不一致的检索。 如:?computer? ,可实现:computer , computerized , computers , microcomputer , microcomputerized , minicomputer 的检索,(5)限制式截断 (1)词干后只跟一个字母,用? ?表示,两问号间空一格。主要用于单、复数名词的检索。 例:DYE? ? 表示检索DYE、DYED、DYES。 (2)词干后至多跟与问号数相同的字母数,用?或?表示,问号间不用空格。 例:UNIVERS? 表示最多跟2个字母,可检索UNIVERSE、UNIVERSAL等。 例:CAND? 表示最多跟3个字母,可检索CANDY、CANDIES、CANDIED等。,3、 位置算符 位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词以及化学分子式等。位置算符是调整检索策略的一种重要手段。,以AND运算符查得的记录中,尽管同时含有所希望的检索词,但AND算符并不限制两个检索词的位置和出现顺序。以 “communication AND satellite”这个策略为例,命中的文献中可能既含有“communication satellite”,又含有 “satellite communication”; 也可能既含有 “communication devices for satellite”,又含有 “communication links without satellites”, 显然其中的有些记录与课题要求毫无关系。位置算符可以用于改进AND运算符这种不足之处,因此,它们可以看成是特殊功能的AND运算符。,常用的位置算符有N 或 near、 W 等。各个检索系统中的位置算符的表示方法有所不同。下面介绍的以Ei COMPENDEX数据库使用的位置算符为例。,而对于EBSCO数据库: W算符表示在此算符两侧的检索词在命中时,必须按输入时的先后次序排列,不得颠倒顺序。两个检索词之间可以插入任何其它的词和字母(但可以有一个空格或一个符号连接号),相隔的词数用W加数字表示,即nW或W/n。可见,检索用户要想用一个固定的词组检索,也可采用(W)算符,如:thin(W)film等。 N算符表示在此算符两侧的检索词在命中时,词序可以颠倒。检索词之间允许插入任何其它的词和字母,相隔的词数用N加数字表示。,4、 字段限制(TI,AB,DE,ID) A. 基本字段限制 基本字段限制的用法是在需要指定字段(题目、叙词、识别词和文摘)的检索词后加上后缀运算符“/”和段码。 例如,检索策略“OPTICAL/TI AND FIBER/TI”的含义是指定在题目字段中查找含有 “optical” 和“fiber”两词的所有记录。字段段码可以多个连用,段码之间加“,”即可。例如,检索策略“FIB?/TI,DE”的含义是指定在题目和叙词字段中查找以 “fib”为词干的所有记录。,B. 辅助字段限制 辅助字段运算符的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符“=”。例如检索策略AU=“Robert, S.”的含义是在作者字段中查找含有“Robert, S.”的所有记录。 下面是其他常用的辅助字段限制及其实例: 指定著者单位字段 CS=SHANGHAI UNIVERSITY 指定刊物名称字段 JN=APPLIED MATHEMATICS 指定语言字段 LA=ENGLISH 指定文献类型字段 DT=JOURNAL,5、 检索策略的调整 检索表达式输入检索系统后,输出的检索结果有时不一定能满足课题的要求,或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检索策略。,调整检索策略之前,首先要分析造成结果不理想的原因。对于输出篇数过多的情况,应分析是否可能是如下原因造成: a .选用了多义性的检索词; b .截词截得过短; c. 输入的检索词太少; d. 应该使用“与(AND)”的使用了“或(OR)”; e.优先运算符“()”使用错误。,对于输出篇数过少的情况,应分析是否方式如下原因造成: a. 检索词拼写错误; b. 遗漏重要的同义词或隐含概念; c. 检索词过于冷僻具体; d. 没有使用截词算符; e. 位置算符和字段算符使用的过多; f. 使用过多的“AND”算符。,针对上述原因,如果是属于需要扩大检索范围,提高检索结果查全率的,调整策略的方法有: a. 减少“与(AND)”算符,增加同义词或同族相关词用逻辑或(OR)将它们连接起来; b. 在词干相同的单词后使用截词符(?或*); c. 去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。,如果是属于缩小检索范围,提高检索结果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- BD面试职业规划
- 吉林文书档案管理制度
- 地企关系协调工作制度
- 学校卫生室完整工作制度
- 2026四年级下新课标黄继光英雄事迹学习
- 幼儿园奖惩制度
- 炎症性肠病营养
- 甲状腺疾病症状解读及护理学习
- 心肌梗塞急救护理要点及护理指南
- 痔疮症状讲解及护理技巧
- 2025年广西壮族自治区崇左市初二学业水平地理生物会考真题试卷(含答案)
- TSG08-2026《特种设备使用管理规则》全面解读课件
- (二检)莆田市2026届高三第二次质量调研测试政治试卷(含答案)
- 毕业设计(伦文)-皮革三自由度龙门激光切割机设计
- 一项目一档案管理制度
- 2025华润建材科技校园招聘正式启动笔试历年参考题库附带答案详解
- 员工职位申请表(完整版2026年版)
- 2025新教材-译林版-七年级英语-上册-单词表
- 注塑车间安全生产培训内容
- 国家安全生产十五五规划
- TSG Z0007-2023《特种设备生产单位质量安全总监和质量安全员考试指南》
评论
0/150
提交评论