计算机检索策略_第1页
计算机检索策略_第2页
计算机检索策略_第3页
计算机检索策略_第4页
计算机检索策略_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 计算机检索策略计算机检索策略 一、计算机检索概述一、计算机检索概述 1. 1. 计算机检索定义计算机检索定义 2. 2. 计算机检索系统的构成计算机检索系统的构成 3. 3. 计算机信息检索的分类计算机信息检索的分类1.1.计算机检索定义计算机检索定义 (1)计算机检索定义计算机检索定义 计算机信息检索就是在计算机和人的共同作计算机信息检索就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过用下,按照一定的方法组织和存储信息,并通过人人- -机对话从计算机存储的大量数据中自动输出用机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。户所需的那部分信息的过程。 (2

2、)(2)计算机信息检索过程计算机信息检索过程 信息存储过程信息存储过程 信息检索过程信息检索过程(3)(3)计算机信息检索的本质计算机信息检索的本质 是信息用户的提问标识和信息集合数据库特是信息用户的提问标识和信息集合数据库特征标识匹配的过程。征标识匹配的过程。 检索提问字符串检索提问字符串 匹配匹配 数据库中特征标识字符串数据库中特征标识字符串(4)(4)计算机检索的特点计算机检索的特点 检索速度快;检索功能强;检索速度快;检索功能强; 检索途径多;检索范围广;检索途径多;检索范围广; 资源能共享;能直接输出。资源能共享;能直接输出。 2. 2. 计算机检索系统的构成计算机检索系统的构成 (

3、1)(1)计算机计算机 (2)(2)通信网络通信网络 (3)(3)数据库数据库 数据库就是在计算机存储设备上按一定数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。是检索方式存储的相互关联的数据集合。是检索系统的信息源,也是用户检索的对象。系统的信息源,也是用户检索的对象。 数据库的基本类型数据库的基本类型书目数据库书目数据库:是机读的目录、索引和文摘检索工具检索是机读的目录、索引和文摘检索工具检索结果是文献的线索而非原文。如许多图书馆提供的基于网结果是文献的线索而非原文。如许多图书馆提供的基于网络的联机公共检索目录络的联机公共检索目录OPACOPAC系统。系统。全文数据库全文数

4、据库 :是存储文献全文或其中主要部分的数据是存储文献全文或其中主要部分的数据库,有的是印刷版的电子(网络)版,有的则是纯电子出库,有的是印刷版的电子(网络)版,有的则是纯电子出版物。版物。 例如:例如:中国期刊网中国期刊网、ElsevierElsevier数据库数据库等等。等等。事实数据库:事实数据库:指包含大量数据、事实,直接提供原始资指包含大量数据、事实,直接提供原始资料的数据库。又可分为数值数据库、指南数据库、术语数料的数据库。又可分为数值数据库、指南数据库、术语数据库等。例如美国医生数据咨询库据库等。例如美国医生数据咨询库PDQPDQ(Physician Data Physician

5、Data QueryQuery)。)。多媒体数据库:多媒体数据库:是存储声音、图象和文字等多种信息是存储声音、图象和文字等多种信息的数据库。如各种多媒体学习学习资料。的数据库。如各种多媒体学习学习资料。 如如知识世知识世界界。数据库结构数据库结构( (以书目数据库为例以书目数据库为例) )$ 由文档记录字段组成由文档记录字段组成$文档(文档(filefile):):$ 数据库中一部分记录的有序集合数据库中一部分记录的有序集合$记录(记录(recordrecord):):$ 数据库的信息单元,每条记录描述了一数据库的信息单元,每条记录描述了一 个原始信息的外部特征和内部特征。个原始信息的外部特征

6、和内部特征。$字段(字段(fieldfield):):$ 比记录更小的单位,是组成记录的数据比记录更小的单位,是组成记录的数据项目项目3.3.计算机信息检索的分类计算机信息检索的分类根据检索方式分:根据检索方式分: (1)(1)脱机检索脱机检索(1954-1964)(1954-1964) (2) (2)联机检索联机检索(1965-1972)(1965-1972) (3) (3)国际联机检索国际联机检索(1972-1994)(1972-1994) (4) (4)光盘检索光盘检索 (5)(5)网络检索网络检索(1995-(1995-今今) ) 世界上最著名的国际联机检索系统世界上最著名的国际联机检

7、索系统DIALOG:有900多个数据库,其中广泛使用的有600多个,内容涉及多个学科领域,文献存储量超过3亿篇。OCLC:联机计算机图书馆中心,是世界上最大的为读者提供文献信息机构。有60个数据库,提供会议录、工业通告、图书评论等信息。CNKI:中国知识基础设施工程 二、计算机检索技术二、计算机检索技术 1.1.布尔逻辑检索功能布尔逻辑检索功能 2.2.位置检索功能位置检索功能 3.3.截词检索功能截词检索功能 4.4.字段限定检索功能字段限定检索功能 1. 1.布尔逻辑检索功能布尔逻辑检索功能 所谓布尔逻辑检索,指用布尔逻辑算符来组所谓布尔逻辑检索,指用布尔逻辑算符来组配检索词以确定文献的命

8、中与否。布尔逻辑式的配检索词以确定文献的命中与否。布尔逻辑式的原理与检索方法取自于布尔代数与集合运算。其原理与检索方法取自于布尔代数与集合运算。其算符的相互匹配方式基本有算符的相互匹配方式基本有4 4种。种。 逻辑与(逻辑乘)逻辑与(逻辑乘) 逻辑或逻辑或 逻辑非逻辑非 逻辑异或逻辑异或 A AND B A B(1)(1)逻辑与逻辑与( (逻辑乘逻辑乘) ) 运算符号运算符号“and“and“或或”* *”作为连接词,是一作为连接词,是一种用于交叉概念或限定关系的组配,它可以缩小种用于交叉概念或限定关系的组配,它可以缩小检索范围,有利于提高检索的专指性。检索范围,有利于提高检索的专指性。 上图

9、检出上图检出同时含有同时含有“A”A”和和“B”B”文献。文献。 例:例:“有关计算机在图书馆工作中应用有关计算机在图书馆工作中应用”的文的文献献 检索式检索式= =计算机计算机* *图书馆图书馆例: 肠炎与肠病毒关系的文献。肠炎与肠病毒关系的文献。 检索式检索式= = 肠炎肠炎 * * 肠病毒肠病毒 生物学中的计算机图象处理。生物学中的计算机图象处理。 检索式检索式= = 生物学生物学 * * 计算机计算机 * * 图象处理图象处理(2)(2)逻辑或逻辑或 运算符号运算符号“or”or”或或”+”+”作为连接词,是一种作为连接词,是一种用于具有并列概念关系的组配。这种组配可以扩用于具有并列概

10、念关系的组配。这种组配可以扩大检索范围,提高查全率。检索出既含有大检索范围,提高查全率。检索出既含有“A”A”又又有有“B”B” 例:例:查查“计算机或机器人计算机或机器人”方面的文献方面的文献 。 检索式检索式= =计算机计算机 + + 机器人机器人 A B检索式检索式= =流行性感冒流行性感冒+ +咳嗽咳嗽查查“流行性感冒或者咳嗽流行性感冒或者咳嗽”方面的文献方面的文献 再如要查有关计算机方面的文献,为了扩大检再如要查有关计算机方面的文献,为了扩大检索面可以用检索式:索面可以用检索式:“微机微机 + + 电脑电脑 + PC+ PC机机”、 “微机微机 or or 电脑电脑 or PCor

11、PC机机”(3)(3)逻辑逻辑“非非” 用运算符号用运算符号“NOT”NOT”或或“”连接两检索词,连接两检索词,用于具有排除概念关系的组配。用于具有排除概念关系的组配。例:查例:查“玉米但不是甜玉米玉米但不是甜玉米”方面的文献。方面的文献。 检索式检索式= =玉米玉米甜玉米甜玉米 查找有关查找有关“关节炎关节炎”但不包括但不包括“类风湿性关节类风湿性关节炎炎”的文献。的文献。 检索式检索式= =关节炎关节炎类风湿性关节炎类风湿性关节炎 A B(4 4)“异或异或”关系关系 具有排除概念关系的组配,排除了具有排除概念关系的组配,排除了 A AND BA AND B的那部分,与的那部分,与A -

12、 B A - B 是有区别的是有区别的 。 (A OR B (A OR B )NOT NOT (A AND B A AND B )例例 A A= =水上运输工具,水上运输工具,B B= =陆上运输工具陆上运输工具 即即“水陆两栖运输工具水陆两栖运输工具”不能被命中。不能被命中。 A B运算顺序运算顺序 优先级运算即检索式中先后顺序 ( ) NOT AND OR 如果一个提问式中含有多个逻辑算符,则它们的执行顺如果一个提问式中含有多个逻辑算符,则它们的执行顺序将是序将是NOTNOT,ANDAND,OROR,需先执行的部分可用括号标出,需先执行的部分可用括号标出 如:如:A+BA+B* *C C

13、运算顺序为运算顺序为B B* *C C然后在然后在+A+A (A+B) (A+B)* *C C 运算顺序为运算顺序为A+BA+B然后再是然后再是* *C C例如:例例1 1:查找关于微波和毫米波雷达的信息:查找关于微波和毫米波雷达的信息 ( (微波微波+ +毫米波毫米波) )* *雷达雷达例例2 2: ( (心脏瓣膜病心脏瓣膜病 OR OR 心力衰竭心力衰竭) AND ) AND 手术并发症手术并发症布尔逻辑检索特点:布尔逻辑检索特点: 布尔逻辑检索是把任何检索课题加工成可以进布尔逻辑检索是把任何检索课题加工成可以进行逻辑运算的表达式,行逻辑运算的表达式, 这是计算机检索的一种被这是计算机检索

14、的一种被广泛采用的匹配方式。布尔逻辑运算的优点是简单广泛采用的匹配方式。布尔逻辑运算的优点是简单明确、易于理解、符合人们的思维习惯。明确、易于理解、符合人们的思维习惯。2.2.位置检索功能位置检索功能 位置检索又称邻近检索,是表示所连接的位置检索又称邻近检索,是表示所连接的各个检索词之间的位置关系的一种检索技巧。各个检索词之间的位置关系的一种检索技巧。位置检索多用于西文的全文检索。位置算符位置检索多用于西文的全文检索。位置算符一般只使用两个:一般只使用两个: with with 用用(W)(W)或或()()表示、表示、 nearnear用用(N)(N)表示表示 (W)(W)词序不能颠倒,中间除

15、符号不能插词词序不能颠倒,中间除符号不能插词 (nW(nW) )词序不能颠倒,中间可插词序不能颠倒,中间可插(0-N)(0-N)个词个词 (N)(N)词序可颠倒,中间不能插词词序可颠倒,中间不能插词 (nN(nN) )词序可颠倒,中间可插词序可颠倒,中间可插(0-N)(0-N)个词个词例1:CDCD(W W)ROMROM将命中将命中CDCDROMROM或或CDCDROM;ROM;如:如:high(W)classhigh(W)class命中的记录中出现的匹配词可能命中的记录中出现的匹配词可能有:有:high class high class 或或high-classhigh-class。例2:检

16、索检索“材料磨损材料磨损“(wear of materialswear of materials )方面的文献。方面的文献。检索式:检索式: wearwear(1W1W)materialsmaterials例3:cross(N)sectioncross(N)section(部分交叉部分交叉) 可以检索出可以检索出crosscrosssectionsection和和section cross(section cross(交交叉部分)叉部分)3.3.截词检索功能截词检索功能 所谓截词,就是指在检索词的适当位置截断。所谓截词,就是指在检索词的适当位置截断。用用“?、?、* *”表示表示 。 前截断前

17、截断(后方一致检索)?(后方一致检索)?ChemistryChemistry chemistrychemistry、biochemistrybiochemistry、 electrochemistry electrochemistry physicochemistryphysicochemistry 中间截断中间截断( (中间屏蔽中间屏蔽) ) “t“t?thth” ” ,“tooth”tooth”和和“teeth”teeth” 后截断后截断(前方一致检索)(前方一致检索) computcomput? ? 可查出可查出 compute compute , computer computer ,

18、 computingcomputing,computationcomputation,computerisationcomputerisation 4. 4. 字段限定检索功能字段限定检索功能 将检索词限定在某一字段中,检索时,将检索词限定在某一字段中,检索时,计算机只对限定字段进行运算,以提高检索计算机只对限定字段进行运算,以提高检索效果。效果。 关关鍵鍵词:医药限定在词:医药限定在健康报健康报(机构报(机构报刊名)关键词医药刊名)关键词医药andand机构机构健康报健康报作者常亚平作者常亚平andand机构机构武汉科技学院学报武汉科技学院学报 常有的字段:常有的字段: 篇(题)名字段篇(题

19、)名字段 TI=Title TI=Title 文摘字段文摘字段 AB=AbstractAB=Abstract 主题词字段主题词字段 DE=DescriptorDE=Descriptor 关键词字段关键词字段 ID=IdentifiedID=Identified 著者字段著者字段 AU=AuthorAU=Author 著者机构字段著者机构字段 CS=Corporate SourceCS=Corporate Source 刊名字段刊名字段 JN=Journal JN=Journal 出版年字段出版年字段 PY=publication YearPY=publication Year 文献类型字段文献

20、类型字段 DT=Document TypeDT=Document Type 语种字段语种字段 LA=LanguageLA=Language 分类号字段分类号字段 CC=Classification CC=Classification 计算机检索技术综合练习计算机检索技术综合练习 (smoking+tobacco)*heart(w)disease三、计算机信息检索步骤三、计算机信息检索步骤 1.1.分析课题分析课题 2.2.制定检索策略制定检索策略 3.3.选择检索词须注意的问题选择检索词须注意的问题 4.4.检索举例检索举例 5.5.检索技巧检索技巧 1. 1.分析课题分析课题 对用户提出的检

21、索课题进行全面的分析研究,对用户提出的检索课题进行全面的分析研究,为选择检索词,编写检索式作好准备,然后根据为选择检索词,编写检索式作好准备,然后根据检索课题的要求选择合适的数据库和检索系统,检索课题的要求选择合适的数据库和检索系统,开始检索后,要根据检索的具体情况及时调整检开始检索后,要根据检索的具体情况及时调整检索策略,使检索结果符合用户的要求索策略,使检索结果符合用户的要求 。 2.2.制定检索策略制定检索策略 (1)(1)列出待检课题的学科范围、主题范围等。列出待检课题的学科范围、主题范围等。 (2 2)确定检索词和词的截断部位,调整词之间的)确定检索词和词的截断部位,调整词之间的位置

22、关系及组配关系。位置关系及组配关系。 (3 3)选择相关数据库,确定检索途径。)选择相关数据库,确定检索途径。 (4 4)拟定检索式。)拟定检索式。 (5 5)实检与反馈调节)实检与反馈调节 。 3.3.选择检索须注意的问题选择检索须注意的问题(1)(1)该词的广义词、狭义词、相关词及多义词等该词的广义词、狭义词、相关词及多义词等(2)(2)该词的最佳截断部位该词的最佳截断部位(3)(3)对于泛指的主题概念词,应选用其包容特性的具体内容来对于泛指的主题概念词,应选用其包容特性的具体内容来表达:表达: 例:水果贮藏方面的文献例:水果贮藏方面的文献 (apple or pear or apple or pear or )and storageand storage (4)(4)当课题面窄,提问专指度高,而数据库中对文献的标引深当课题面窄,提问专指度高,而数据库中对文献的标引深度可能不足时,对检索词可进行粗化,取其上位检索词度可能不足时,对检索词可进行粗化,取其上位检索词 例:例: 玉米同功酶方面的文献:玉米同功酶方面的文献: isozymesisozymes ( (同功酶同功酶) enzymes() enzymes(生化酶生化酶)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论