第2章文献信息检索基础.ppt_第1页
第2章文献信息检索基础.ppt_第2页
第2章文献信息检索基础.ppt_第3页
第2章文献信息检索基础.ppt_第4页
第2章文献信息检索基础.ppt_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章文献信息检索基础,第一节信息检索基本原理 第二节计算机信息检索,第一节信息检索基本原理,信息检索含义及类型 信息检索的含义 信息检索(Information Retrieval)的概念有狭义和广义之分。狭义的信息检索是指依据一定的方法,从己经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。而广义的信息检索包括信息的存储和检索两个过程。,下一页,返回,第一节信息检索基本原理,文献信息检索的类型 文献信息检索是指依据一定的方法,从已经组织好的文献信息集合中,查出所击特定文献信息的过程。按不同的标准可以将其划分为不同的类型。 根据检索手段的不同可以划分为手工检索和计算机检索 根据检

2、索内容的不同可以划分为文献检索、事实检索和数据检索 按照信息检索技术的发展可划分为全文文本检索、多媒体检索、超文本检索、网络信息检索,下一页,上一页,返回,第一节信息检索基本原理,信息检索语言 概述 检索语言又称为情报检索语言、文献标引语言,是一种由表达文献卞题概念及其相互关系的词汇及规则组成的人工语言系统。 检索语言种类 检索语言根据文献的不同特征有不同的分类方法。 根据文献资源的特征可以分为描述文献外部特征和内部特征的检索语言 按文献内容划分为分类语言和主题语言,下一页,上一页,返回,第一节信息检索基本原理,信息检索工其 检索工具的含义 检索工具是指根据检索语言,将尤序列文献按一定方式系统

3、组织起来,用以报道、存储和检索文献的工具,如专业文摘、图书目录、论文题录、数据库等。,下一页,上一页,返回,第一节信息检索基本原理,一般检索工具都具有存储和检索的职能,并同时具备以下特征: 有明确的收录范围。 必须详细描述文献的外部特征和内部特征。 每条记录或款目都必须包含有多个有检索意义的文献特征标识,并标明供检索用的标识。 全部文献条目按一定顺序,科学地组成一个有机的整体。 能够提供多种检索途径,能够满足用户从多个角度查找所需文献的要求。,下一页,上一页,返回,第一节信息检索基本原理,检索工具的类型 由于检索工具的著录特征、报道范围、载体形式和检索手段等不同,检索工具根据不同的划分标准,可

4、以分为不同的类型。 按著录信息特征分类可以分为以下六种 目录、题录、文摘、索引、参考工具书、搜索引擎 按文献信息存储介质可以划分为手工检索工具和计算机检索工具,下一页,上一页,返回,第一节信息检索基本原理,检索的方法、途径和步骤 文献信息检索方法 常用法 常用法又称直接法,是指直接利用检索工具(系统)检索文献信息的方法,以主题、分类、作者等为检索点,通过检索工具获取线索,再由线索查得原文。这是文献检索中最常用的一种方法。常用法目的性强,有利于查找,但需要熟悉检索工具的结构和应用。它又分为顺查法、倒查法和抽查法。,下一页,上一页,返回,第一节信息检索基本原理,顺查法 顺查法是指按照时间的顺序,由

5、远及近地利用检索工具进行文献信息检索的方法。 倒查法 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。 抽查法 抽查法是指针对检索课题的特点,选择有关该课题的文献信息最可能出现或出现最多的时间段,利用检索工具进行重点检索的方法。,下一页,上一页,返回,第一节信息检索基本原理,追溯法 追溯法是指利用某一文献后面所附的“参考文献”为线索,逐一追溯查找的方法。在学术论文或者著作后面往往附有“参考文献”或者“参考资料”。 综合法 综合法又称为循环法,它是把常用法和追溯法加以综合运用的方法,也是实践中采用较多的一种方法,它兼有常用法和追溯法的优点,可以查到较为全面而准确的文献。

6、,下一页,上一页,返回,第一节信息检索基本原理,文献检索途径 检索途径依赖文献信息的特征。文献的外部特征主要是文献著录项目,包括文献题名、责任者、出版者、出版地、出版年等。文献的内容特征有所属学科及所属主题,所涉及关键词等。一般来讲,常用的、重要的检索途径卞要有以下几种。 题名途径也称书名途径,是根据文献题名查找文献信息的途径。 著者检索途径是指根据己知文献著者来查找文献的途径,它依据的是著者索引,包括个人著者索引和机关团体索引。 分类途径是按照文献资料所属学科类别进行检索,能够满足信息用户族性检索的要求。,下一页,上一页,返回,第一节信息检索基本原理,主题途径是一种主要的检索途径。它通过文献

7、资料的内容主题进行检索。 某些检索工具是根据文献的题名或正文,文、摘要中选出来的关键词标引组织起来的。在查文献或文献正文段落,或其中的摘要等时,用户可以用这个途径来查。,下一页,上一页,返回,第一节信息检索基本原理,文献信息检索的步骤 文献检索工作是一项实践性和经验性很强的工作,检索程序与检索的具体要求有密切关系,对于不同的项目,可能采取不同的检索方法和程序。文献信息检索大致可分为四个步骤。 分析研究课题,明确检索要求 确定检索策略 查找文献线索 索取原始文献信息,下一页,上一页,返回,第一节信息检索基本原理,分析课题应包括以下两个方面。 明确检索目的 明确课题的主题或主要内容 制定检索策略,

8、优化检索过程,主要涉及三个方面的问题。 选择检索工具 确定检索途径 制定、调整检索策略,下一页,上一页,返回,第一节信息检索基本原理,查找文献线索 在明确了检索要求,确定了检索系统,选定了检索方法,就可以应用检索工具实施检索,所获得的检索结果即为文献线索,对文献线索的整理、分析、识别是检索过程中极其重要的一个环节。 做好检索记录 鉴别文献类型,下一页,上一页,返回,第一节信息检索基本原理,索取原始文献信息 信息检索的最终目的就是获取原始文献。当检索到文献线索并识别文献类型以后,即可根据不同的文献类型和语种索取原始文献。 利用馆藏获取原始文献 利用网上全文数据库获取原始文献 利用网上全文传递服务

9、检索原始文献 利用网上出版社、杂志网上有许多提供电子期刊的网站检索原始文献,上一页,返回,第二节计算机信息检索,计算机信息检索的定义及发展历程 计算机信息检索的定义 计算机信息检索是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所击的信息,继而再由终端设备显小或打印的过程。,下一页,返回,第二节计算机信息检索,计算机信息检索发展历程 脱机批处理检索阶段 联机检索阶段 光盘检索阶段 网络化检索阶段,下一页,上一页,返回,第二节计算机信息检索,计算机信息检索系统 计算机信息检索系统的组成 计算机信息检索系统主要由计算机、通信网络、检

10、索终端设备和数据库组成。 计算机信息检索系统的服务方式 计算机信息检索系统按其功能可划分为回溯检索、定题检索、随机问答和联机订购等服务方式。,下一页,上一页,返回,第二节计算机信息检索,计算机信息检索基本技术 布尔逻辑检索 所谓布尔逻辑检索是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。它是机检系统中最常用的一种检索方法。布尔逻辑算符卞要有:逻辑“与”(AND)、逻辑“或”(OR)和逻辑“非”( NOT ),下一页,上一页,返回,第二节计算机信息检索,截词检索 截词是指检索者将检索词在他认为合适的地方截断,

11、而截词检索则是指使用截词的一个局部进行检索的一种方法。凡满足这个词局部中的所有字符(串)的文献,都为命中文献。截词的方式有多种,按截断部位可分为右截断、左截断、中间截断、复合截断等;按截断长度可以分为有限截断和无限截断。 右截断 截去某个词的尾部,词的前方一致比较,也称前方一致检索。 左截断 截去某个词的前部,词的后方一致比较,也称后方一致检索。,下一页,上一页,返回,第二节计算机信息检索,中间截断 截去某个词的中间部分,词的两边一致比较,也称两边一致检索。 复合截断 复合截断是指同时采用两种以上的截断方式。 有限截断 有限截断是指允许截去有限个字符,是在一个词尾加有限个?号,n个?号表示其后

12、可添加的字符数少于等于n个。 无限截断 无限截断是指允许截去的字符数量不限,也称开放式截断。,下一页,上一页,返回,第二节计算机信息检索,位置检索 位置算符表小其连接的两个检索词之间的位置关系,,常用的有(W),(nW),(N),(nN),(S),(F)等。 (W)与(nW)算符 W是With的缩写。(W)表小其连接的两个检索词必须按序出现,中间不允许插词,只能有一空格或标点、符号。 (N)与(nN)算符 N是Near的缩写。(N)表示其连接的两个检索词的顺序可以互易,但两词间不允许插词。(nN)中的n表小允许插词量少于或等于n个。,下一页,上一页,返回,第二节计算机信息检索,(S)算符 S是Subfield的缩写。(S)表示其连接的两个检索词必须出现在同一子字段中。 (F)算符 F是Field的缩写。(F)表示其连接的两个检索词必须出现在同一字段中,字段不限,词序不限。 限制检索 限制检索(Range)是通过限制检索范

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论