版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 信息检索策略和方法,检索策略是对检索的全面策划,即在分析检索课题内容基础上,选择检索系统和检索途径,确定检索词及其相互之间的逻辑关系等的检索方案。在操作上主要指数据库的选择和检索表达式的编制,前者取决于现有的数据库资源,后者则反映检索目标。 检索表达式是检索策略的具体体现,它一般由检索词和各种逻辑运算符组成,检索表达式:布尔逻辑运算符,在检索过程中用于表达词于词之间的逻辑关系的算符就称为布尔逻辑运算符,是最基本、最常用的检索技术。分为三种逻辑关系:逻辑与、逻辑或、逻辑非;分别用“AND”、“ OR”、和“ NOT”来表示。 检索表达式可以是一个检索词或者是一个逻辑表达式。,1、逻辑“与
2、”(AND或*),这是一种概念相交和限定关系的组配。 例如:“A AND B”或“A * B” 其含义:是检出的记录中必须同时含有“A”和“B”两个检索项(如图中阴影部分所示)。 “AND”算符的作用是对 检索词加以限定,逐步缩小 检索范围,提高检索结果的 查准率。例如检索“计算机 在图书馆中的应用”方面的 文献,其提问式可写成: “computer * library”或 “ computer AND library”,2、逻辑“或”(OR或+),这是用来组配具有同义或同族概念的词。 如:检索提问式:“A OR B”或“A + B” 其含义是:数据库记录中任何一条记录,只要含有“A”或“B”
3、中任何一个检索词即为命中的文献(如下图阴影部分)。 “OR”的作用是扩 大检索范围,增加命 中文献量,提高文献 的查全率。如: “微机 + 电脑 + PC机”、 “微 机 or 电脑 or PC机”,3、逻辑“非”(NOT或),“NOT”算符是排除含有某些词的记录,其逻辑提问表达式为“A NOT B”或“A-B”,即检出的记录中只能含有“NOT”算符前的检索词 A,而不能同时含有“NOT”后的检索词 B(如图中阴影部分)。 “NOT”的作用是缩小检索范 围,减少文献输出量。在联 机检索中可降低检索费用。 例如:“计算机 NOT 微机” 由于“NOT”算符有排除掉相 关文献的可能,在实际检索 中
4、应慎重使用。,检索表达式:位置算符检索,运用位置算符表示两个检索词间的位置邻近关系,又叫邻接检索。这种检索技术通常只出现在西文数据库中,在全文检索中应用较多。如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系 。,位置算符的用法意义如下:,(W)With (W)表示该算符两侧的检索词相邻,且两者之间只允许只有一个空格或标点符号,不允许有任何字母或词,顺序不能颠倒。(W)也可以简写为( )。 (nW)nWords (nW)表示在此算符两侧的检索词之间最多允许间隔n 个词(实词或虚词),且两者的相对位置不能颠倒。 (N)Near (N)表示该算符
5、两侧的检索词相邻,但两者的相对位置可以颠倒。 (nN)nNear (nN)表示此算符两侧的检索词之间允许间隔最多n 个词,且两者的顺序可以颠倒。,检索的基本程序,分析检索课题 选择检索系统及数据库 确定检索词 构建检索提问式 检索并调整检索策略 获取检索结果。,1. 分析检索课题,利用信息检索系统获取文献信息的用户,一般分为直接用户和间接用户两种类型。直接用户是指最终使用获得的信息进行工作的用户(如,科研人员,管理者,决策者等);间接用户是指专门从事检索服务的检索人员。检索人员在接到用户的检索课题时应首先分析研究课题,全面了解课题的内容以及用户对检索的各种要求,从而有助于正确选择检索系统及数据
6、库,制定合理的检索策略等。,分析检索课题应从以下几方面进行,(1)弄清用户信息需求的目的和意图。 (2)分析课题涉及的学科范围、主题要求。 (3)课题所需信息的内容及其特征。 (4)课题所需信息的类型,包括文献类型、 出版类型、年代范围、语种、著者、机 构等。 (5)课题对查新、查准、查全的指标要求。,2. 选择检索系统和数据库,在全面分析检索课题的基础上,根据用户要求得到的信息类型、时间范围、课题检索经费支持等因素综合考虑后,选择检索系统和数据库。正确选择数据库,是保证检索成功的基础。选择数据库时必须从以下几个方面考虑:,2. 选择检索系统和数据库,(1) 数据库收录的信息内容所涉及的学科范
7、围 ; (2) 数据库收录的文献类型、数量、时间范围以及更新周期; (3) 数据库所提供的检索途径、检索功能和服务方式。,3. 确定检索词,检索词是表达文献信息需求的基本元素,也是计算机检索系统中进行匹配的基本单元。检索词选择正确与否,直接影响着检索结果。在全面了解检索课题的相关问题后,提炼主要概念与隐含概念,排除次要概念,以便确定检索词。,检索词的确定有以下几种方法:,(1) 先选用主题词。当所选的数据库具有规范化词表时,应优先选用该数据库词表中与检索课题相关的规范化主题词,从而可获得最佳的检索效果。,检索词的确定有以下几种方法,(2) 选用数据库规定的代码。许多数据库的文档中使用各种代码来
8、表示各种主题范畴,有很高的匹配性。例如,世界专利文摘数据库中的分类代码,化学文摘数据库中的化学物质登记号。,检索词的确定有以下几种方法,(3) 选用常用的专业术语。在数据库没有专用的词表或词表中没有可选的词时,可以从一些已有的相关专业文献中选择常用的专业术语作为检索词。,检索词的确定有以下几种方法,(4) 选用同义词与相关词。同义词、近义词、相关词、缩写词、词形变化等应尽量选全,以提高查全率。,4. 构建检索提问式,检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。检索提问式构建得是否合理,将直接影响查
9、全率和查准率。,构建检索提问式应正确运用逻辑组配运算符:,(1)使用逻辑“与”算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也就高。 (2)使用逻辑“或”算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高。,构建检索提问式应正确运用逻辑组配运算符:,(3)使用“非”算符可以缩小命中范围,得到更切题的检索效果,也可以提高查准率,但是使用时要慎重,以免把一些相关信息漏掉。 另外,在构建检索提问式时,还要注意位置算符、截词符等的使用方法,及各个检索项的限定要求及输入次序等。,5. 检索并调整检索策略,构建完检索提问式后,就可以检索了。检索时,应及时分析检索结
10、果是否与检索要求一致,根据检索结果对检索提问式作相应的修改和调整,直至得到比较满意的结果。,1)检索结果信息量过多,产生检索结果信息量过多的原因可能有以下两点:一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。,调整检索策略的方法如下:,(1)减少同义词与同族相关词; (2)增加限制概念,采用逻辑“与”连接检索词; (3)使用字段限定,将检索词限定在某个或某些字段范围; (4)使用逻辑”非”算符,排除无关概念; (5)调整位置算符,由松变严。,2)检索结果信息量过少,造成检索结果信息量少的原因有以下几点:首先,选用了不规
11、范的主题词或某些产品的俗称,商品名称作为检索词;其二,同义词、相关词、近义词没有运用全;其三,上位概念或下位概念没有完整运用。针对这种情况,就要考虑扩大检索范围,提高检索结果的查全率。,调整检索策略的方法如下:,(1)选全同义词与相关词并用逻辑”或”将它们连接起来,增加网罗度; (2)减少逻辑“与”的运算,丢掉一些次要的或者太专指的概念; (3)去除某些字段限制; (4)调整位置算符,由严变松。,6. 输出检索结果,根据检索系统提供的检索结果输出格式,选择需要的记录以及相应的字段(全部字段或部分字段),将结果显示在显示器屏幕上、存储到磁盘或直接打印输出,网络数据库检索系统还提供电子邮件发送,至
12、此,完成整个检索过程。,信息检索方法:追溯法,又称回溯法或滚雪球法。从已有的文献后所附的参考文献入手,由近及远,逐一查找全文,再从这些原文后所列的参考文献逐一追查,不断扩大检索线索,象滚雪球似的获得相关文献的方法。它是科研人员常喜欢用的一种简便的获得文献的途径。,追溯法的优点和缺点:,优点:在没有检索工具或检索工具不全的情况下,此法可较快地获得相关文献,查找方法简单。 缺点:这种方法的漏检和误检的可能性较高,但仍不失为一种简便的获得相关文献的方法。,信息检索方法:常用法,也称工具法,是利用文摘、题录或索引等查找文献的方法。按所查文献时间的顺序,可分为顺查法、倒查法和抽查法三种。,顺查法,这是一
13、种以所查课题的起始年代为起点由远而近地按时间顺序的查找方法。 优点:查的文献较完整,查全率较高。缺点:工作量大,效率不高,而且起始年代难以确定。,倒查法,这是一种由近而远逆时间顺序的查找方法。重点放在近期的文献。 优点:倒查法比较省时省力。缺点:可能漏查一些有用的文献。,抽查法,这是一种根据课题的特点和需要,选查发展旺盛时期文献的查找方法 优点:检索时间较少,查得文献较多。缺点:有漏检的可能,并要求检索者对课题研究的历史情况有较多的了解和掌握。,信息检索方法:综合法,也称循环法、分段法、交替法,是结合追溯法和常用法的优点,分期、分段地交替使用,直到获得满意的相关文献为止。优点:检索的文献信息比较全面、准确。,实际课题的检索选用何种方法,要根据具体情况而定:,一是根据课题研究的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑结构雪荷载积雪分布系数取值方法选择原则制定方法选择
- 音乐可视化数据可视化技术课程设计
- 孕前优生健康教育
- 2025-2026学年2.4.1同类项 华东师大版数学七年级上学期(课件)
- 备皮手术化验常见问题解决方案培训
- 实习医生临床轮转培训方案
- 淋巴瘤放射治疗的护理指导培训
- 店面物流设计案例
- 皮肤湿疹的药物治疗管理计划
- 胰腺炎急性期护理教程
- 2026年宁波余姚市泗门镇人民政府公开招聘编外工作人员7人笔试参考试题及答案解析
- 2026届郑州市高三历史高考三模原创仿真模拟试卷(含参考答案解析)第847套
- 凉山州2025年四川凉山州第一批引进人才(559人)笔试历年参考题库典型考点附带答案详解
- 2026年二级建造师市政工程管理考试真题答案及详细解析
- 山东发展侯咽集37.52万千瓦风电项目220kV送出线路工程环境影响报告表
- 2026年商业伦理 测试题及答案
- AQ 3026-2026《化工企业设备检修作业安全规范》宣贯解读课件
- 2026年高考冲刺作文审题立意训练:选择题32道(附深度解析+答案)
- (2026年)检验检测机构资质认定“一单一库”的学习与解读(2026年实施)课件
- 2026中国期货市场市场深度与流动性风险研究报告
- 24J113-1 内隔墙-轻质条板(一)
评论
0/150
提交评论