《信息存储与检索》课件-第一章 绪论_第1页
《信息存储与检索》课件-第一章 绪论_第2页
《信息存储与检索》课件-第一章 绪论_第3页
《信息存储与检索》课件-第一章 绪论_第4页
《信息存储与检索》课件-第一章 绪论_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章绪论

本章目录第一节信息检索基本理论第二节信息检索系统第三节信息检索研究信息存储与检索》第一节信息检索基本理论

1.1.1信息检索的概念1

1.1.2信息检索的原理2

1.1.3信息检索的类型3信息存储与检索》1.1.1信息检索的概念“信息检索”(InformationRetrieval,IR,我国早期译为“情报检索”)一词最早出现于1952年,由美国学者穆尔斯(C.W.Mooers)提出,从1961年开始在学术界和实践领域中得到广泛的应用[1]。信息检索这一概念首先假设包含相关信息的文献或记录已经按照某种有助于检索的顺序组织起来。信息检索就是对信息项进行表示、存储、组织和存取的全过程。对信息项的表示和组织应该能够为用户提供其感兴趣信息的方便存取。遗憾的是,对用户信息需求进行全面而准确的描述不是一件轻而易举的事情。信息存储与检索》1.1.2信息检索的原理

信息检索的基本原理可以用下图表示

信息资源信息搜集需求分析信息需求信息用户信息分析信息表达词语转换需求表达词语转换数据库检索结果检索语言信息存储过程信息检索过程图1-1广义信息检索的基本原理信息存储与检索》1.1.2信息检索的原理

从上图可以看出,信息存储和信息检索有两个交汇处:一个是直接的,即表达信息主题内容的词语与表达需求主题内容的词语之间进行对比的交汇;另一个是间接的,即通过检索语言进行沟通,确保把存储用词和检索用词都统一到同一个检索语言体系中(对于自然语言检索系统来说,不存在存储与检索的间接交汇处)。

信息存储与检索》从由此可见,信息存储和信息检索的直接交汇处是至关重要的,由此形成了信息检索的一致性匹配作用机理,如图1-2所示。1.1.2信息检索的原理

比较判断选择符号化表示信息特征提取符号化表示需求特征提取现实的信息现实的需求输出检索结果图1-2信息检索的一致性匹配作用机理信息检索的一致性匹配作用机理包括5个机理:(1)提取机理(2)表示机理(3)比较机理(4)判断机理(5)选择机理信息存储与检索》1.1.3信息检索的类型(一)按照信息检索的对象性质划分(1)文献检索

(2)数值检索

(3)事实检索

(二)按照计算机检索技术划分(1)脱机检索(Off-lineRetrieval)(2)联机检索(On-lineRetrieval)

(3)光盘检索(CD-ROMRetrieval)

(4)网络检索(InternetRetrieval)信息存储与检索》第二节信息检索系统

1.2.1信息检索系统的概念1

1.2.2信息检索系统的类型2

1.2.3信息检索系统的物理结构3

1.2.4信息检索系统的逻辑结构4信息存储与检索》1.2.1信息检索系统的概念信息检索过程的实现要依靠特定的系统,这个系统就是信息检索系统。系统是由两个或两个以上既相互区别又互相影响的各种要素构成的统一整体,信息检索系统的构成包括六个要素:(1)目标(2)功能(3)资源(4)设备(5)方法(6)人员

信息存储与检索》1.2.1信息检索系统的概念由此可见,信息检索系统由若干个相互作用的部分构成,各部分的功能互异,设计的目的也各不相同,但它们之间相互联系,共同实现系统的目标。狭义地讲,这个目标就是检索信息;广义地讲,则是提升用户的知识水平。通常认为,信息检索系统的任务是告知用户他所需要的信息在哪里。也就是说,信息检索系统并不告诉用户他所询问的主题(即不改变用户的知识结构),它只是告诉用户这一主题是否存在于数据库中,相关的文献都存在哪里。信息存储与检索》1.2.2信息检索系统的类型

(1)书本式检索系统。(2)卡片式检索系统。(3)机械式检索系统。(4)缩微式检索系统。(5)计算机检索系统。(6)网络检索系统。信息存储与检索》1.2.3信息检索系统的物理结构(1)联机检索系统的物理结构所谓联机检索,是指用户利用终端设备,通过通信网络或通信线路与分布在世界各地的检索系统中心的中央计算机连接,通过人机对话的方式,运用特定的检索指令和检索策略,访问中央数据库,从中检索出所需信息的过程。联机检索系统也称国际联机检索系统,通常采用相对封闭的客户机/服务器模式,属于典型的主从式结构。如图1-3所示,联机检索系统通常由联机检索中心、通信设施、检索终端3个主要部分组成。

信息存储与检索》1.2.3信息检索系统的物理结构资源子网通讯子网通信网络数据库中央计算机外设联机检索中心通信设备通信设备检索终端检索终端检索终端用户图1-3联机检索系统的物理构成信息存储与检索》1.2.3信息检索系统的物理结构

联机检索系统的特点是:①检索范围广,数据库数量多,几乎涉及到各个学科领域,世界上公开出版发行文献的90%都可以通过几种主要的联机检索系统查到。②检索内容新,数据库更新及时,基本上是同步,能够检索到最新信息。③检索功能强,一个联机检索系统中的所有数据库通常使用统一的检索命令,检索途径多、检索效率高、检索质量好。信息存储与检索》1.2.3信息检索系统的物理结构④数据库质量高,都是经过严格加工、处理和组织的,通常是各个领域中核心的和权威的数据库。⑤检索较复杂,专业性太强,一般用户不容易掌握检索指令、规则和方法,通常依赖于专业检索人员。⑥检索费用高,要求熟练掌握检索技巧和经验,普通用户难以承受。⑦人机界面比较单一、呆板。信息存储与检索》1.2.3信息检索系统的物理结构目前,随着光盘检索和网络检索的兴起,联机检索系统的最终用户数量减少,大部分最终用户都委托专业检索人员进行代理检索,但这种检索方式和系统仍然存在,特别是对于科学研究更为重要。比较著名的联机检索系统有Dialog、ORBIT、BRS、ESA-IRS、STN、MEDLINE、DataStar、OCLC等。

信息存储与检索》1.2.3信息检索系统的物理结构

(2)光盘检索系统的物理结构光盘检索系统有两种类型:单机光盘检索系统和光盘网络检索系统。单机光盘检索系统比较简单,通常由计算机、光盘驱动器、光盘数据库等硬件设备组成,自成一体,系统结构简单,数据量少,利用率低,一次只能供一个用户检索,通常供单用户、单机使用。信息存储与检索》1.2.3信息检索系统的物理结构

光盘网络检索系统可以分为面向特定范围对象的局域网的系统和依托Internet的面向所有用户开放的系统,其实质是将光盘资源上网,允许局域网、广域网甚至Internet上的众多用户在同一时间、不同地点同时访问一个或多个光盘数据库。其局域网系统的物理结构如图1-4所示。

光盘塔服务器主域服务器数据库数据库镜像光盘服务器光盘库光盘库PC机PC机馆内网校园网图1-4光盘网络检索系统的物理结构信息存储与检索》1.2.3信息检索系统的物理结构光盘检索系统的特点是:①方便快捷,不受通信线路和网络等因素的影响和限制,可以随时启动使用。②检索费用低,一次购买、多次使用,不涉及远程通信,分摊成本低,用户心理上没有费用的压力。③操作界面友好,帮助信息、功能键、窗口式对话框、鼠标控制等,简单易学,直接面向最终用户,不需要对用户进行专门的培训。信息存储与检索》1.2.3信息检索系统的物理结构④输出灵活,可以有拷盘、打印、套录建库以及网上传输等多种输出形式。⑤融多种媒体为一身,结合激光技术、计算机技术和多媒体技术,将文字、声音、图像、视频等多种媒体信息存储在一起。⑥数据更新慢,周期较长,时效性差。⑦数据量有限,受到光盘容量的限制,通常局限于专业领域,范围不够广泛。

信息存储与检索》1.2.3信息检索系统的物理结构

(3)网络检索系统的物理结构

Internet路由器交换机服务器客户机数据库数据库数据库客户机客户机数据库数据库客户机客户机客户机交换机路由器服务器图1-5基于Internet的客户机/服务器结构(C/S)数据库信息存储与检索》1.2.3信息检索系统的物理结构数据库服务器Web服务器Internet浏览器浏览器浏览器图1-6基于Internet的浏览器/服务器结构(B/S)信息存储与检索》1.2.3信息检索系统的物理结构Web服务器检索器索引器搜索器索引库网络网络Web站点FTP站点Gopher站点Web站点新闻组站点搜索引擎图1-7搜索引擎系统结构用户用户用户用户用户页面库信息存储与检索》1.2.3信息检索系统的物理结构检索请求与结果检索代理接口检索式处理检索结果处理单搜索引擎单搜索引擎用户单搜索引擎用户用户图1-8元搜索引擎系统结构信息存储与检索》1.2.3信息检索系统的物理结构网络检索系统的特点是:①检索空间无限,检索范围覆盖了全球性、开放性Internet所能延伸到的世界各地,用户不必知道某种资源的具体地址。②检索内容极其丰富,包括网上所有领域、各种类型、各种媒体(文本、图像、声音、视频、动画等)的信息资源,如Web、FTP、Telnet、Usenet、Gopher等。③超文本浏览,检索结果是完全可以直接阅读的Web页面,可以非线性地随时从一个页面跳到另一个页面。信息存储与检索》1.2.3信息检索系统的物理结构④界面最友好,屏蔽了各个局域网之间的各种物理差异(如硬件系统、软件平台、地理位置、存储方式、通信协议等),极大地提高了系统的透明度,用户使用通用的图形窗口检索界面,即可访问和检索各种异构系统的数据库,在通过Web浏览器访问过程中,无需关心一些技术细节。⑤操作最简便,良好的交互式作业、多种导航和编辑功能、及时获得在线帮助和指导以及符合大多数用户检索习惯的用户接口使得检索简单易行,不必经过太多的培训即可操作。⑥检索效率不高,网络信息缺乏规范和统一管理,动态性强,重复率、冗余度高,无用信息较多,查准率差。信息存储与检索》1.2.4信息检索系统的逻辑结构系统的逻辑结构主要是指该系统所包括的子系统或功能模块及其相互之间的逻辑关系。不管信息检索系统的物理结构如何,它们的逻辑结构大体上都是相同或相似的,只有组成部分多与少的区别。如前所述,信息检索系统的两大基本功能是存储和检索,这两大基本功能可以分解为6个子系统或功能模块,它们共同构成了信息检索系统逻辑结构。这6个子系统是采选子系统、词语子系统、标引子系统、查询子系统、交互子系统和匹配子系统。如图1-9所示。信息存储与检索》1.2.4信息检索系统的逻辑结构词语子系统匹配子系统采选子系统标引子系统交互子系统数据库用户群信息源查询子系统图1-9信息检索系统逻辑结构信息存储与检索》第三节信息检索研究

1.3.1信息检索的研究内容1

1.3.2信息检索的相关学科2

1.3.3信息检索的产生和发展3

1.3.4信息检索的趋势4信息存储与检索》1.3.1信息检索的研究内容概括起来,信息检索的研究内容包括以下几个方面:(1)信息检索理论研究(2)信息检索方法研究(3)信息检索技术研究(4)信息检索语言研究(5)信息检索系统研究(6)信息检索服务研究(7)信息检索评价研究。

信息存储与检索》1.3.2信息检索的相关学科

与信息检索关系比较密切的相关学科和领域如下:(1)计算机科学与技术。(2)数学。(3)系统科学。(4)语言学。(5)认知科学。信息存储与检索》1.3.3信息检索的产生和发展从信息检索的发展历史来看,可以分为以下几个时期(1)起步期(20世纪50年代)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论