第三章 计算机信息检索_第1页
第三章 计算机信息检索_第2页
第三章 计算机信息检索_第3页
第三章 计算机信息检索_第4页
第三章 计算机信息检索_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、计算机检索概况 1.1.发展背景发展背景信息爆炸,文献数量迅猛增加信息爆炸,文献数量迅猛增加每年全世界发表科技论文300-400万篇;出版图书80-90万种以上期刊20万种以上专利105万件标准75万件会议论文10万篇学位论文10万件文献种类繁多文献种类繁多图书、期刊、专利、科技报告、会议文献等文献交叉重复,发表分散文献交叉重复,发表分散科学论文在直接相关专业杂志上发表的文献只占50%文献半衰期缩短文献半衰期缩短80%-90%科技文献的有效周期只有五年学科交叉学科交叉2. 2. 计算机检索的特点计算机检索的特点速度快,效率高:速度快,效率高:几分钟可从大量记录中找出所需信息检索范围广检索范

2、围广:可迅速浏览相关学科或主题的记录数据新数据新:网络数据更新快,能及时获取最新信息功能全功能全:检索界面友好,检索功能完善,输出方式丰富使用方便使用方便:检索不受时空限制,只要具备相应的网络条件,随时可以查询信息二、数据库 1.1.数据库概念数据库概念 由至少一种文档组成,能满足特定目的或特定数据处理系统需要的数据集合,是目前电子信息源的主体。2. 2. 数据库的类型数据库的类型定义:定义:指包含各种资料、信息和知识原始来源和属性的指包含各种资料、信息和知识原始来源和属性的 数据库。数据库。主要包括:主要包括:书目数据库、文摘数据库、索引数据库书目数据库、文摘数据库、索引数据库例如:例如:中

3、国科学文献服务系统中国科学文献服务系统(CSCD)(CSCD)、Ei CompendexEi Compendex、Web Web of Scienceof Science等等(1)参考型数据库参考型数据库(2 2)全文数据库全文数据库定义:定义:指收录有原始文献全文的数据库指收录有原始文献全文的数据库 主要包括:主要包括:期刊、会议论文、学位论文、报纸、专利说明书、期刊、会议论文、学位论文、报纸、专利说明书、标准等全文数据库标准等全文数据库 例如:例如:中国期刊网中国期刊网学术期刊全文库、学术期刊全文库、ASCEASCE、Elsevier Elsevier Science DirectScie

4、nce Direct、国家知识产权局专利文献服务等、国家知识产权局专利文献服务等3. 3. 检索技术检索技术(1)(1)布尔检索布尔检索 用布尔逻辑算符来表达检索词间的逻辑组配关系用布尔逻辑算符来表达检索词间的逻辑组配关系 与 或 非“与与”逐步减少检出文献的数量,提高检出文献与检索要求的相关性,提高查准率。(A and B) (A * B)“或或”扩大检索的范围,提高文献的检出数量,防止漏检,提高查全率。(A or B) (A + B)“非非”使用较少,减少文献输出量,提高检索 词的准确性。(A not B) (A - B)布尔检索式的优先执行顺序布尔检索式的优先执行顺序: :布尔检索式布尔

5、检索式优先执行顺序通常是优先执行顺序通常是NOTNOT、ANDAND、OROR。在有括号的情况下,在有括号的情况下,先执行括号内的逻辑运算先执行括号内的逻辑运算,在多层括号时,在多层括号时,先执行最内层括号中的运算。先执行最内层括号中的运算。例:查例:查南京工业大学南京工业大学(A A)或)或南京化工大学南京化工大学(B B)或)或南京化工南京化工学院学院(C C)的)的涂善东涂善东(D D)或)或许仲梓许仲梓(E E)的文章)的文章 A or B or C and D or E(A or B or C ) and ( D or E )孰对孰错?孰对孰错?(2)(2)截词检索截词检索概念:概念

6、:又称词干检索、模糊检索。词干加截词符号,凡是有与又称词干检索、模糊检索。词干加截词符号,凡是有与该词干相同的文献均能被检出。很好解决中西文单词的派生形该词干相同的文献均能被检出。很好解决中西文单词的派生形式,避免漏检现象的出现。检索系统不同,截词符也不同,常式,避免漏检现象的出现。检索系统不同,截词符也不同,常用有:用有: * ? #类型:类型:右截断(前方一致)、左截断(后方一致)、左右同时右截断(前方一致)、左截断(后方一致)、左右同时截断(中间一致)截断(中间一致)作用:作用:减少检索词的输入量、简化检索步骤、扩大检索范围、减少检索词的输入量、简化检索步骤、扩大检索范围、提高检全率。提

7、高检全率。前方一致前方一致: :将截词符放在词根后面,词根词根* *,右截断。是最常用的截词方式。Smith, A* = Smith, A. OR Smith, A. J. OR Smith, Alan J.Social* = social, socialist, socialistic, socialityComputer* = computer, computers后方一致后方一致: :即将检索词的词头部分截断,* *词根词根,左截断,是较常用的截词方式。如:*computer = minicomputer, microcomputer中间一致中间一致: :将字根左右词头、词尾部分同时截断,*词根词根*如:*computer*

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论