信息组织―第二章信息组织原理_第1页
信息组织―第二章信息组织原理_第2页
信息组织―第二章信息组织原理_第3页
信息组织―第二章信息组织原理_第4页
信息组织―第二章信息组织原理_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 信息组织原理,本章知识点,1、对信息组织的要求,2、信息组织中的控制与规范,3、规范控制的依据,一、对信息组织的要求,1、检全率(查全率),系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比。,表示系统检出相关信息资源的能力。,一、对信息组织的要求,2、检准率(查准率),系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。,表示检索系统排除与检索提问无关信息资源的能力。,一、对信息组织的要求,检全率与检准率的关系,检全率与检准率之间呈互逆关系,检索系统对检全率与检准率的权衡,应考虑检索系统的任务、服务对象的需求、信息

2、资源集合的规模等多种因素,并根据使用需要提供选择的可能性。,一、对信息组织的要求,信息组织系统中有关于“市场营销成功案例”的文献220篇,某用户共检出文献200篇,其中有关的文献160篇,请计算查全率和查准率。,查全率:160/220100% 查准率:160/200100%,思考,一、对信息组织的要求,3、检索速度和系统的及时性,检索速度指用户实施检索时获得检索结果花费的时间。这一指标不仅与系统响应检索提问的速度有关,同时也涉及查全、查准等因素,与信息资源的组织是否合理直接相关。,系统的及时性指检索工具能否在较短时间内将信息资源纳入系统,尽快提供使用。,一、对信息组织的要求,4、系统的易用性,

3、对标引者而言,指系统是否便于进行描述和标引操作,是否需要掌握复杂的专门技能才能使用,在处理过程中为减少处理差错能否得到各种提示和帮助等。,对广大检索用户而言,则是指系统检索是否易于使用,操作是否复杂,是否需要预先学习才能实施检索;检索界面是否友好,是否配备有相应说明,并提供各种具有启发性的帮助等。,一、对信息组织的要求,5、检索的成本效益,指检索系统的成本和效益之比。 成本一般指检索系统设备费用、标引处理费用、检索运行费用。 效益则是指检索系统的性能及因此产生的效益,包括获取信息能取得的经济效益和社会效益。,二、信息组织中的控制与规范,信息组织的控制,对信息资源的描述控制,标引和检索的词汇控制

4、,标引和检索的句法控制,相关因素控制,二、信息组织中的控制与规范,描述控制,描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。,(1)描述项目的控制,根据资源特点选择具有组织和揭示价值的资源特征作为描述的项目。描述项目应该充分反映信息资源的基本特征和数据。,二、信息组织中的控制与规范,描述控制,描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。,(2)描述文字的控制,规定描述信息资源时所采用的文字,应当准确、精炼、统一、规范。,二、信息组织中的控制与规范,描述控制,描述记录一般概要记录下一资源各种基本特征的数据,可

5、以以浓缩的方式集中反映资源的特征和内容。,(3)描述级别的控制,规定对信息资源进行描述的详略程度。应根据不同的使用对象和需求、信息资源的特点、设备条件加以确定。,二、信息组织中的控制与规范,文献著录总则规定的三个级别,二、信息组织中的控制与规范,描述控制,描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。,(4)描述格式的控制,包括各种描述项目的次序、描述的标识、描述项目的表达形式等。对此做统一规定的目的是方便不同类型信息系统之间的交流。,二、信息组织中的控制与规范,卡片著录格式,正题名=并列题名:副题名及说明题名的文字/第一责任者;其他责任者.一版次及

6、其他版本形式/与本版有关的责任者.一出版发行地:出版发行者,出版发行年.月(印刷地:印刷者,印刷年) 页数或卷(册)数:图;尺寸或开本+附件.一(丛书名/编者,国际标准连续出版物编号;丛书编号) 附注 国际标准书号;中国标准书号(装订):获得方式 提要 .题名 .责任者 .主题 .分类号,二、信息组织中的控制与规范,描述控制,根据上述各项控制要求做具体的规定,就形成了各种信息描述规范。,二、信息组织中的控制与规范,词汇控制,词汇控制是根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。,二、信息组织中的控制与规范,词汇控制,为什么要进行词汇控制?,因为对信息的描

7、述离不开自然语言。但是自然语言做为日常交流的语言,存在很多问题: (1)表达不够精确一致,语词与概念不是一一对应 一词多义:e.g.疲劳一词,在医学和物理学领域各自有不同的含义 一义多词:e.g.土豆&马铃薯;电脑&计算机 词义含糊:e.g.笔记本(本子?便携式电脑?),二、信息组织中的控制与规范,词汇控制,为什么要进行词汇控制?,(2)自然语言词汇没有明确地表达词间关系,很难适合检索系统显示概念间联系的要求。 e.g.浮游生物,水生生物,水底生物的关系?,水生生物与浮游生物是包含与被包含的关系; 浮游生物与水底生物是并列关系等。,二、信息组织中的控制与规范,词汇控制,为什么要进行词汇控制?,

8、(3)词汇量过大,给词汇的加工、管理增加困难,在描述信息的选词和检索时确定检索用词都造成困难。,鉴于上述原因,一般必须根据检索系统的需要,对词汇进行必要的选择和处理。,二、信息组织中的控制与规范,词汇控制,词汇控制包括下述内容:,同义控制,词义控制,词间关系控制,二、信息组织中的控制与规范,词汇控制,词汇控制包括下述内容:,同义控制,目的:克服一义多词现象,将同一内容、特征的资源集中在相同的标识下。,方法:选定一个规范词,建立用代参照,举例:电脑 Y 计算机 计算机 D 电脑,殊途同归,二、信息组织中的控制与规范,词汇控制,词汇控制包括下述内容:,词义控制,目的:克服一词多义现象,方法:加限义

9、词、增设含义注释和范围注释,举例:疲劳(生理);疲劳(物理),二、信息组织中的控制与规范,词汇控制,词汇控制包括下述内容:,词间关系控制,目的:用于扩检、缩检、改变检索方向,方法:设置参照、倒置标题、使用副标题、通过类目体系揭示词间关系,举例:害虫 C 杀虫剂 无损检验 C 无损探伤仪 血管 F 动脉血管 动脉血管 S 血管,二、信息组织中的控制与规范,句法控制,句法控制是指根据信息资源标引和检索的需要,所作出的组词造句的规则,是对检索语词的组合方式的规定。,二、信息组织中的控制与规范,句法控制,为什么要进行句法控制?,因为仅有规范的语词是不够的,语词只能表达简单的概念。语词的组合才能表达复杂

10、的概念。特别是信息组织的一种重要方法主题法,就是通过对相应语词的组配来实现对复杂概念的表达的。但是汉语非常灵活,语词之间的组合方式多种多样,如下例。,计算机控制遥感系统对大地测量 遥感系统在计算机控制下对大地测量 大地测量在计算机控制下通过遥感系统进行 遥感系统对大地测量在计算机控制下进行,为了以明确、统一的方式对信息资源进行组织,需要对语词之间的组合方式,即句法进行控制。,二、信息组织中的控制与规范,句法控制,句法控制的内容:,引用次序,辅助符号,句式转换,二、信息组织中的控制与规范,句法控制,引用次序,亦称组配次序,指复合主题标引和检索时,各个主题因素的组合次序。,分类法指类目划分标准使用

11、次序或组配时不同分面被引用的先后次序。,主题法指字顺标题检索系统中主标题与各级子标题使用的次序。,在先组式手工检索工具中,引用次序决定复合主题的类聚方式和排检位置,是进行句法控制的重要手段。,二、信息组织中的控制与规范,引用次序在等级列举式分类法中,类目划分标准使用的先后次序,“美国现代侦探小说集”如何标引?,I712.456,二、信息组织中的控制与规范,引用次序在分面组配式分类法中,组配时不同分面被引用的先后次序,标引“中国现代花鸟水彩画作品集” :,二、信息组织中的控制与规范,引用次序在主题法中,组配时主标题与各级子标题使用的次序,主题分面公式: 主体因素通用因素地区因素时间因素文献类型因

12、素,研究对象、材料、方法、过程、条件,“20世纪90年代汽车工业规划研究文集”标引为:,“汽车工业规划中国1990-1999文集”,二、信息组织中的控制与规范,句法控制,辅助符号,亦称组配符号,是检索语言揭示主题概念之间关系、意义,进行检索操作的标识手段。辅助符号是检索系统进行句法控制的重要句法手段,它根据系统的特点和使用需要设置,可分别用于先组式检索系统和后组式检索系统。,二、信息组织中的控制与规范,句法控制,辅助符号,关系符号用于揭示语词组配中形成的关系类型的符号,常用于先组式检索系统。,联系符号用于揭示同一文献主题之间联系强度的专用符号,目的是防止主题词之间出现错误的组配关系,常用于后组

13、式检索系统。,职能符号用以表明主题标识在组配中的句法职能的辅助符号,作用是明确主题标识的句法含义,防止出现错误的组配关系。,逻辑组配符号使用逻辑符号对组配关系实施控制,可以进行各种演算,实施精确查找,常用于后组式检索系统。,二、信息组织中的控制与规范,句法控制,句式转换,简单地说,就是转换语词的排列顺序。,为什么需要句式转换?,因为复杂的主题要提高其被查全率和查准率需要提供多个检索入口;引用次序的选择有可能导致文献的分散。这些问题的解决可以通过句式转换来实现。,二、信息组织中的控制与规范,句法控制,句式转换,句式转换的目的是通过对语句中语词位置的变动解决上述两个问题。,句式转换的形式通常有三种

14、:,(1)轮排转换,(2)链式转换,(3)分析转换,二、信息组织中的控制与规范,句法控制,句式转换,链,句式转换在实际使用中,按照基本引用次序确定一种主要款目,然后将不同的轮排形式以参见的方式指向主要款目。,三、规范控制的依据,信息资源的组织和检索一般是以概念逻辑为工具,以知识分类为基础,根据信息资源的特点和设备条件的状况进行的。因此,要有效地对信息组织进行规范控制必须依据如下三方面因素:,逻辑知识,体现于主题法的组配和分类法的部分类目确立及归类,体现于分类法的类目确立及归类,知识分类,信息资源组织的特点,三、规范控制的依据,1、概念及其内涵和外延,逻辑知识,概念是表达事物对象的特有属性或本质

15、属性的思维形式,是检索系统交流的内容。按照形式逻辑,一个概念一般包括内涵和外延两个方面。,概念的内涵指概念的含义,即概念所反映对象的本质属性的总和。,概念的外延则是指具有该属性的事物对象,即所包括的范围。,三、规范控制的依据,1、概念及其内涵和外延,逻辑知识,概念及其内涵、外延的知识是各种信息组织形式进行标引和检索的基本依据,同时也是检索语言编制时词汇控制的依据。检索语言中语词的选择一般应含义明确,对含义不明确的语词,通常需要通过明确内涵或指明其外延的方法加以限定。,三、规范控制的依据,2、概念之间的关系,逻辑知识,概念之间按照其是否存在共有的外延,可以分为相容关系与不相容关系两类,三、规范控

16、制的依据,2、概念之间的关系,逻辑知识,相容关系:至少有一部分外延相同的概念之间的关系。,同一关系:具有相同外延的概念之间的关系。,包含关系:一个概念在另一个概念外延之中,并且是另一个概念的组成部分。,交叉关系:部分外延重合的概念之间的关系。,三、规范控制的依据,2、概念之间的关系,逻辑知识,不相容关系:不存在共有外延的概念之间的关系。,矛盾关系:外延之和等于上位概念的两个不相容概念之间的关系。,反对关系:外延之和小于属概念的两个相互对立概念之间的关系。,并列关系:一个属概念下几个不存在共有外延的并列种概念之间的关系。,三、规范控制的依据,2、概念之间的关系,逻辑知识,检索语言对词汇进行规范化

17、处理和词间控制时,一般均以上述概念关系为基础进行,包括对等同关系,等级关系,相关关系的处理等。,三、规范控制的依据,3、概念的限制与概括、分析与综合,逻辑知识,概念的内涵与外延之间是一种反比关系。,概念的概括:减少内涵、扩大外延的过程。,概念的限制:加深内涵、缩小外延的过程。,概念的综合:通过对子概念的组配,表达复合主题概念 。,概念的分析:将复合主题概念分解成若干个子概念。,三、规范控制的依据,3、概念的限制与概括、分析与综合,逻辑知识,概念范围可以通过对概念的限制和概括来进行调整,这是信息组织的原理;而概念的分析与综合则是实现概念范围的调整的具体方法,即信息组织的方法。,三、规范控制的依据

18、,3、概念的限制与概括、分析与综合,逻辑知识,对概念的划分一般可以依据明确的划分属性,将一个母项划分为若干子项,从一个属概念分出若干个子概念,如此连续进行,以此为基础就可以建立起等级性的概念体系。,根据概念的构成,将复合主题概念分解成若干个子概念,并通过对子概念的组配,表达复合主题概念,进行概念逻辑运算。,分类法原理,主题法原理,三、规范控制的依据,3、概念的限制与概括、分析与综合,逻辑知识,三、规范控制的依据,1、什么是知识分类体系,知识分类,知识分类体系是建立在人类对外部世界的探索和发现的基础之上的,是根据对知识之间关系的了解建立起来的系统。是进行主题之间关系处理的重要依据。,三、规范控制的依据,2、信息组织为什么需要依据知识分类,知识分类,因为单靠逻辑知识只能解决若干个概念之间有限的关系,不能很好的体现上下级概念的关系,不能建立一个严格的、体系化的等级系统。而只有建立起这样一个系统才能对信息资源有一个全面的、整体的把握。这个系统的建立需要参考知识分类体系。,三、规范控制的依据,3、知识分类体系的内容,知识分类,科学分类体系( !),学科分类体系,事物分类体系,行业分类体系,三、规范控制的依据,4、知识分类对信息组织的意义,知识分类,信息资源组织以知识分类为基础,可以较好揭示各个领域知识之间的关系和规律性,及时反映知识领域的进展。,三、规范控制的依据,1、为什么信息

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论