信息存储与检索(第二版)2章信息存储与索基础新课件_第1页
信息存储与检索(第二版)2章信息存储与索基础新课件_第2页
信息存储与检索(第二版)2章信息存储与索基础新课件_第3页
信息存储与检索(第二版)2章信息存储与索基础新课件_第4页
信息存储与检索(第二版)2章信息存储与索基础新课件_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2章 信息存储与检索基础 信息存储与检索原理 信息存取发展与类型 索引的结构与类型 2.1 信息存储与检索原理2.1.1 社会发展与信息需求 从学术研究到社会生活全方位信息需求 从文字资料到声音与活动画面的信息需求 从完备信息趋向对即时信息的需求 从注重信息载体物理性质到注重信息本身 从馆藏需求到国际互联网络共享 从传统的手工信息检索到Internet引擎查检2.1.2 信息存储与检索原理 信息存储与检索(Information Storage and Retrieval)是信息检索的全称形式或广义的信息检索,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一

2、定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与过程。信息存储与检索的基本原理就是,查询语言(检索提问)和系统标识语言所进行的“相符性比较”与“匹配运算”。信息存储与检索走过了文献检索、情报检索的过程,正向知识检索的领域迈进。信息检索通常包括4种类型,一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数值或数据的情报检索;四是关于图象信息的信息检索。信息存储与信息检索关系图 系统标识语言形式概念检索提问M形式概念信息资源M信息集合MABCDM检索系统答复M 信息存储 信息检索主题分析转换成索引标识转换成系统标识课题分析2.1.3 信息检索相关学科 作为一门学科的信息检索 现

3、代信息检索是以计算机科学与技术、网络技术、光盘技术、通信技术等现代信息技术在信息存储与检索中的应用为基础,全面探讨适应现代信息处理的信息描述、信息存储、信息检索和信息提供之理论、技术与方法的应用性学科。 信息检索的相关学科 信息检索是一门交叉学科,其相关学科涉及到信息管理科学、计算机科学、数学、系统论和语言学等多个学科领域。2.1.4信息检索研究信息检索是一门发展中的学科,目前国内外正从不同的角度展开全面的研究:信息检索理论与技术研究信息存取系统研究数据库标准与建设研究信息存取的语言处理现代信息检索工具比较研究检索策略研究2.2 信息存取发展与类型 信息检索存取发展 早期书目检索工具的编制 科

4、技检索刊物体系的形成 计算机检索的发展 计算机信息检索的4个发展阶段: 单机批处理时期 联机检索试用阶段 联机服务市场化与光盘检索的兴起 全球信息检索多媒体联网时期 我国计算机信息检索的发展过程: 引进开发国外磁带、开展定题服务(SDI) 开发国际联机检索终端 自建数据库 微型计算机和国际联机网信息存取的发展2.2.2 信息存储与检索类型 广义的信息检索包括信息存储与查检两个部分。狭义的信息检索有许多类型,从不同角度可划分为:按检索活动的执行主体划分 手工检索(Manual Retrieval ) 计算机检索 (Computer Retrieval)按查询信息的特征划分 书目检索(Biblio

5、graphic Retrieval ) 数据检索 (Data Retrieval ) 事实检索 ( Fact Retrieval ) 全文检索 ( Full Text Retrieval ) 图象检索 ( Image Retrieval ) 多媒体信息检索 (Multimedia Data Retrieval ) 2.2.2 信息存储与检索类型按检索系统的工作方式划分 脱机检索(Off-line Retrieval ) 联机检索(On-line Retrieval ) 光盘检索(CD-ROM Retrieval ) 国际互联网络检索(Internet Retrieval )按检索策略划分 布尔

6、逻辑检索(Logical Retrieval ) 截词检索(Truncation Retrieval ) 位置逻辑检索(Proximate Operator Retrieval ) 限定检索(Range Retrieval ) 加权检索(Weighting Retrieval )2.2.2 信息存储与检索类型按系统载体划分 印刷型文本系统检索(Printed Text Retrieval ) 缩微磁带检索(Microfilm Retrieval ) 光盘系统检索(CD-ROM Retrieval ) 计算机存取系统查询(Computer-based Retrieval ) 按检索工具类型划分

7、目录与题录检索(Catalog and Title Searching) 文摘检索(Abstract Searching) 索引检索(Index Searching ) 字典型检索(Dictionary Searching) 交互式检索(Alternately Searching )2.3 索引的结构与类型索引(Index)就是将信息集合中具有检索意义的事物名称及特征(如篇名、人名、书名、刊名、网页、网站、地名、分类号、主题词、分子式、专利号、报告号、名词术语等)抽取出来,著明其地址,按照字顺或逻辑分类等次序组织款目,从而为用户提供查询线索的检索工具。索引的款目结构: 索引标题词 索引标题词亦

8、称标目、索引键、索引标题等。它一般处于索引款目最醒目的位置,是索引款目的核心,它决定着一条索引款目在整个索引中的排列位置,是索引款目的检索入口。索引标题词可以为单一标题词,也可以为带有副标题的多级标题词。2.3.1 索引的款目结构 说明语 也称为上下文或修饰语,通常位于索引标题词的右边或下面,用来说明、解释、限定索引标题词含义的辅助项目。 地址参考项 地址参考项位于索引标题词和说明语之后,索引地址所指明的是索引标题词所在的页码或在检索系统中的文献顺序号、分类号或文献号等,即索引标题词的出处。索引参考项有时用于引导用户使用正式索引标题词。 例1: Methane,use in methanol

9、manufacture, 3241甲烷, 用于甲烷制备,3241说明:索引标题词, 说明语,文献号(地址参考项)2.3.2 主要索引类型索引系统从形式上讲是成千上万件索引款目的集合,从内容上看是信息单元的指南。索引系统的排序是按照索引标题的顺序组织而成,不同性质的索引标题词构成了不同类型的索引。依据索引标题词的性质划分:有揭示信息资源内容特征的主题索引、分类索引、关键词索引、分子式索引、结构式索引;有揭示信息资源形式特征的题名索引、人名索引、物名索引、代码索引、引文索引。依据索引标题词的排序方式划分:有按照标题词字顺组织的主题索引、题名索引、人名索引、关键词索引、语词索引等;有按照文献代码组织

10、的报告号索引、合同号索引、标准号索引等;有按其它排序方式组织的网络信息自动索引、重量索引、速度索引、专用索引等。按照检索方式划分:有先组式索引和后组式索引。按照索引所包括的对象划分:有综合索引和专门索引。2.3.2 主要索引类型以下简述几种常用索引的特点:题名索引(Title Index) 题名索引,是将信息资源的题名特征(书名、刊名、篇名)选作为索引标题词所编制的索引系统。题名索引常采用字顺排序法组织款目。 例如:未来的地球人/王佃亮 31解构爱因斯坦/一茗 32 一流大学校长必须是教育家等6则/睦依凡 36宇宙是什么颜色等6则/本刊资料室 42说明:索引标题词(题名)文献作者地址参照项(所

11、在页码或文献号)2.3.2 主要索引类型人名索引(People Name Index) 人名索引,是以文献上署名的著者、译者、编撰者、注释者以及文献中所论述的人物名称作为索引标题词所编制的一种索引。此类索引一般按照人物名称的字顺组织。英、德、法、西班牙等语种的著者索引姓在前、名在后,与其在文献中出现的姓名形式不同,用户检索时应注意掌握其排列规则。 例一:Sadykov,A.A. Chemical Study of Persica 91:135089k 例二:Harris,A.E. 001536 例三:伽利略 (Galilei,Galilei) B503.922 例四:梁启超(1873-1929

12、) B259.1说明索引标题词说明语(原文名,生卒年)地址参照项(文摘号、分类号)2.3.2 主要索引类型文献序号索引(Document Number Index) 文献序号索引,是根据信息资源的外表特征文献序号所编制的索引。在一些特定类型的文献资源中,每一份文献都有一个特定的专门排序号。如科技报告号、合同号、技术标准的标准号、专利说明书的专利号,图书的国际标准书号(ISBN)等;例一:合同/基金号索引(CONTRACT/GRANT NUMBER INDE)MIPR-FY 7616-02-00394 Cold Regions Research and Engineering.Hanover.N

13、H AD-A121 330/5 933 MIPR-82-504 Vaval Research Lab.Washington,DC AD-A121 087/1 714 说明:合同基金号 执行机构 报告号 索引地址号2.3.2 主要索引类型引文索引(Citation Index) 引文索引是从被引论文检索引用论文的索引工具。即以某较早公发发表的论文为起点,逐一查询那些引用过该论文的文献,随后还可以利用检索到的引用文献为被引文献进行循环检索,逐步扩大检索范围,以了解和掌握一大批具有相关关系的科学文献。引文索引的组织方式是,按照被引论文的作者排列,在被引论文之下,在按年代列举引用过该文献的全部论文。分

14、类索引(Classification Index) 分类索引是以文献内容的学科范围的分类标识(又称分类号)为依据编制而成的引文系统。本索引可提供按学科专业系统检索文献的途径。分类索引的编制原理是概念的划分与概括。在概念划分与概括的原理基础上建立起来的等级体系分类系统是一种先组式的索引语言。2.3.2 主要索引类型主题索引(Subject Index)主题索引,是将表征文献主题内容的主题词作为索引标题词,其后注明地址(或页码)编制而成的索引系统。此处所指的主题词是经过规范,有词表控制的标题词(Subject heading)以及词组和短语。这是一种先组式的索引语言。例1Sword, Manufa

15、cture, review on. 6385.4246.5367(赤刀) (制照)(有关评论)Parallel-access computer, in self-organizing 1234.6533.4211 (并行存取计算机) (自组织系统中的) 例2例3反义词, 汉语现代 H136.2说明:索引标题词 说明语(修饰语) 地址参照2.3.2 主要索引类型关键词索引(Keyword Index)又称键词索引,属于广义的主题索引。这是从文献题名、文摘、原文或网站、网页、网址甚至网页正文中抽取对于表述信息资源的主题内容具有关键意义的名词或名词性词组,作为索引标题词,其后标明出处所组成的索引。关

16、键词是信息资源的责任者(包括著者、编者、译者、专利权拥有者等)所直接使用的词语,是一种未经规范的自然语言。关键词索引的类型: 题内关键词索引(Keyword in Context Index) 题外关键词索引 (Keyword out of Context Index) 双重关键词索引(Double KWIC Index) 轮排关键词索引(Permuted Keyword Index) 单纯关键词索引(Keyword Index) 挂接主题词索引 (Articulated Subject Index)2.3.2 主要索引类型组配索引(Coordinate Index)组配索引是根据叙词(Des

17、criptor)及单元词(Uniterm)的后组式原理建立起来的索引系统。其基本原理是任何一个复杂的概念都可以划分出若干个单义概念,而若干个单义概念又可构成一个复杂概念。组配索引的基本特点是,在建立索引系统时,首先有将文献的主题分解成一些单独的概念单元进行分别记录与标识,而在检索时,根据检索课题的需要,将若干有关概念单元综合组配成各种检索提问实施检索。例如“化学纤维工业”这个复杂概念可以分解为“化学”、“纤维”“工业”三个概念单元,其三者的逻辑关系如下图: 化学纤维工业ABCabacbcabc2.3.2 主要索引类型PRECIS索引(Preserved Context Index)又称保留上下文关系索引系统、保留正文索引系统、保留愿意索引、上下文前后关联索引。PRECIS 为了明确无误地描述文献主题,力求每条索引款目都按照“上下文从属”的原则排定词语的次序。其索引的方式为:导词(LEAD)限定词(QUALIFIER)展示词 (DISPLAY)地址(ADDRESS)2.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论