计算机检索基础知识.ppt_第1页
计算机检索基础知识.ppt_第2页
计算机检索基础知识.ppt_第3页
计算机检索基础知识.ppt_第4页
计算机检索基础知识.ppt_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 计算机检索基础知识,第一节概述,一、计算机检索的发展,1、 脱机批处理检索,2、 联机检索,3、光盘检索,4、Internet网上检索,19541964,19651972,1985,1973,三、计算机检索系统的组成,硬件、软件、数据库,二、计算机检索的服务方式,1、追溯检索(Retrospective Search,简称RS),2、 定题服务(Selective Dissemination of Information,简称SDI),3、联机订购原文,4、电子邮件服务,四、 数据库类型,数据库类型,数据库是至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集

2、合.,根据载体的不同,可分为:联机数据库(online database) 、光盘数据库(CD-ROM database) 和网络数据库(networked database).,根据内容与功能可划分为:指南数据库(directory database) 、交易(执行)数据库(transactional database) 、全文数据库(full text database) 、书目数据库(bibliographic database) 、 字(词)典数据库(dictionary database) 、数值数据库(numeric database)与统计数据库(statistical data

3、base) 、图像数据库(image database,graphic database)等,第二节计算机检索方法,一、逻辑提问式(检索式)的基本要素,1、检索词:用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录,2、布尔逻辑运算符,(1)逻辑“与”:运算符为“AND”或“*”,(2) 逻辑“或”:运算符“OR”或“+”,(3) 逻辑“非”:运算符“NOT”或“”,检索算符 在输入检索表达式的过程中,可根据检索符号简化检索的过程,以达到快速检索的目的: 运算顺序依次为:NOTANDOR(非与或) 可灵活运用括号“()”改变优先级,括号内的逻辑式优先执行 检索代码 检索词前面

4、的英文字母是各字段的代码,可在检索入口选择框中查看。 代码字段:U任意字段 S机构 M题名或关键词 J刊名 K关键词 F第一作者 A作者 T题名 C分类号 R文摘,逻辑运算符的表达方式,1、布尔逻辑检索功能:用布尔逻辑算符来组配检索词以确定文献的命中与否。其算符的相互匹配方式一共有8种。 逻辑与(逻辑乘) 逻辑或 异或关系 “逻辑非”的“逻辑或”关系 “逻辑或”的“逻辑非” 逻辑非 被标引在该词下的,(1)逻辑与(逻辑乘),用运算符号:AND 或 * 连接检索词 例查 “有关计算机在图书馆中的应用”的文献, 检索式=计算机 * 图书馆 例查 “猪的饲养” 检索式=猪 * 饲养 用文氏图表示:图

5、1-1,(2)“逻辑或”,用运算符号 “OR” 或 “+”连接两检索词 例1 查“苹果或梨”方面的文献 检索式=苹果 + 梨 它在同义词检索中使用,能提高查全率。 例2 查“计算机或机器人”方面的文献 检索式=计算机 + 机器人 用文氏图表示如下:,A OR B,( 3)“逻辑非”,用运算符号“NOT”或“”连接两检索词 A AND NOT B 有的书上也称为“与非”关系,即“逻辑乘”与“逻辑非” 例1 查“玉米但不是甜玉米”方面的文献。 检索式=玉米甜玉米 例2 查“不是铬合金”方面的文献。 检索式=合金铬 用文氏图表示: 图1-3,A NOT B,(4)“异或”关系,(A OR B )AN

6、D NOT (A AND B ) “异或”排除掉的是A AND B部分 例 A=水上运输工具,B=陆上运输工 而“异或”的关系则排除了A AND B的那部分, 即“水陆两栖运输工具”不能被命中。 这同A OR B 是有区别的。 用文氏图表示如下:,(A OR B)NOT(A AND B),(5 )“逻辑非”的“逻辑或”关系,即: NOT A OR NOT B 两检索词的。 例:查除俄文、法文两种文字之外 的其它各语种的文献。 用文氏图表示:图1-5,NOT A OR NOT B,(6)“逻辑或”与“逻辑非”,即:A OR NOT B 检索A 但否定B后的逻辑或, 例:检索焊接(A)方面的资料,

7、但不要技术标准(B)。 这样,结果是“焊接标准”的资料被排除了。 但是其它一切课题的资料(除标准外)的资料均被命中。 用文氏图表示:图1-6 因此,A AND NOT B(即逻辑非) 和A OR NOT B是不同的 其效果相差很远。,A OR NOT B,(7)A即标引在A检索词下的文献,(8)NOT A检索不是检索词A下文献。 总结: 布尔逻辑检索是把任何检索课题加工成可以进行逻辑运算的 表达式, 这是计算机检索的一种被广泛采用的匹配方式。布 尔逻辑运算的优 点是简单明确、易于理解、符合人们的思 维习惯,A,A,NOT A,A,3、位置逻辑检索符,(W)算符:“with”的缩写,例:? SE

8、LECT CD()ROM相当于检索CD ROM或CD-ROM,(N),(nN)算符:“Near“的缩写,(nW)算符:“n Words”的缩写 例:electronic(1w)resources,可检出electronic resources 和electronic information resources,例: Railway (2N) Bridge 表示Railway Bridge, Bridge of Railway, Bridge of the Railway等等。,(F)算符:“Field”的缩写,(S)算符:“subfield”的缩写,(L)算符:“Link”的缩写,4、截词检索

9、符,中间截词 Wom?n相当于查找woman和women。,后截词 如输入stud?,表示截三个字母,可检索出带有study, studies, studied和 studing等的文献。,无限截词符 在检索词根后加一个“?”,表示该词后带任意个任何字母的词均为相匹配的词。,5、限制检索符,编写逻辑提问式举例:,1.高层建筑抗震结构设计,(tall+high rise)*building*earthquake resistance*structural design,2.加拿大酸雨造成的污染(要求语种为英文),acid( )rain*Canad?*pollution*LA=English,3.

10、核测量数据处理软计算方法研究,(nuclear measurement? ? + nuclear data)*(soft()comput?+algorithm)*(on real-time + on-line + dynamic),二、短语检索(phrase search) 短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度,三、括号检索(parentheses) 用于改变运算的先后次序,括号内的优先进行,四、自然语言检索(natural language search) 直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样,五、多语种检索(multilingu

11、al research) 提供多种语言的检索环境供用户选择,系统按用户选定的语种进行检索并反馈结果,六、模糊检索(fuzzy search) 当我们输入一个检索词时,搜索引擎不仅反馈包括了该关键词的网址,同时也发来了与关键词意义相近的内容,七、区分大小写的检索(case-sensitive research),第三节 检索策略,所谓检索策略,广义地说,就是在分析课题内容实质的基础上,选择检索系统、检索文档、检索途径、确定检索词相互间的逻辑关系,直到给出检索顺序的最佳实施方案等一系列的科学措施,是就一个问题检索一个(或多个)数据库所输入的全部检索式的集合。 狭义的检索策略,是指填写的“检索提问单”。,检索步骤,分析课题,选择信息资源,构造检索式,制定检索策略,调整检索策略,下载、保存检索结果,确定检索课题,数据库检索的一般方法,分析检索课题,明确信息需求 选择检索工具,了解检索系统 确定检索途经,选定检索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论