信息组织知识点汇总_第1页
信息组织知识点汇总_第2页
信息组织知识点汇总_第3页
信息组织知识点汇总_第4页
信息组织知识点汇总_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.知识点汇总第一章1、信息组织的定义以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程。2、信息组织的原理基本原理:如果有若干自然状态的无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料的用户能将自己的需求转换成相应的信息资料属性特征,并在排列后的信息资料序列中找到自己所需要的信息资料。信息组织由信息著录标引(信息描述揭示)和信息序化两个工作环节组成。3、信息组织的内容 一般而言,信息组织包括四项内容。 1.信息筛选(甄别有用信息,剔除无用信息) 2.信息分析(对信息的内外部特

2、征进行细化、挖掘、加工整理并归类) 3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程) 4.信息整序与存储(按照一定的格式和顺序存储在特定的载体中)4、信息组织的类型按信息的认识层次划分,信息组织有三种类型1.语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法)2.语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法)3.语用信息组织(研究环境与使用者的不同而不断变化的信息群,如:权重值信息组织法、概率组织法)5信息组织的作用控制整序提升品质传播利用节约成本第二章1、 熵(entropy)最早是热

3、力学上的一个符号,是一种测量在动力学方面不能做功的能量综述。熵指的是混乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。香农第一次将“熵”引入到信息论中,在信息论中,“熵”可以用作某件事不确定度的量度。信息量越大,体系结构越规则,功能越完善,熵就越小。利用熵的概念,可以从理论上研究信息的计量、传递、变换、存储等活动。学术界目前普遍接受的观点是“信息即负熵”。2、逻辑学原理在信息组织中的应用概念之间的关系(图略):相容关系同一关系:是指有相同外延的两个概念之间的关系。包含关系(属种关系):是指这样两个概念,其中一个概念完全被包含在另一个概念的外延里,是另一个概念外延的一部分。包含另一

4、个概念的概念(外延广的概念)对被它包含的概念(外延窄的概念)来说是上位概念或属概念,被包含的概念对包含它的概念来说是下位概念或种概念。交叉关系:是指有一部分外延重合的两个概念之间的关系。不相容关系并列关系:是指同一个上位概念(属概念)之下的几个不存在共有外延的下位概念(种概念)之间的关系。矛盾关系:这是概念并列关系的一种特殊形式,是指外延总和等于其上位概念全部外延的两个并列概念之间的关系,非此即彼,没有第三种情况。对立关系(反对关系):也是概念并列关系的一种特殊形式,是指外延总和小于其上位概念全部外延的两个并列而且是相互对立的概念之间的关系。第三章1、规范语言定义:规范语言从自然语言出发,根据

5、信息描述与信息检索的需要,从自然语言中筛选出特 定的词汇来网罗和指示概念,并依据一定的规则对自然语言进行事先规范而形成的人工语言,是符号化的概念表示系统。规范语言也称为受控语言、人工语言。规范语言是人工控制的语言系统,词汇控制和句法控制是核心所在。规范语言的词汇控制(1)词汇的选择:精选、压缩,保留具有检索意义的词汇,尽可能地控制词汇规模。(2)词形的控制:实现词义和词形的唯一性。(3)词义的控制:采用加限定词或加注释的方法让词汇与概念一一对应。(4)词间关系的控制:采用索引、图示系统或参照系统来揭示词典中语词间关系。规范语言的句法控制(1)引用次序/组配次序:显著性引用次序、范畴职能引用次序

6、、上下文从属引用次序(2)控制符号:联号、职号、关系符号、加权 例: 537+621.3(3)句式变换:检索词轮排转化。(机检时代已经变得无足轻重)2、 规范语言的类型:按照结构原理分分类语言:等级体系式、分面组配式、等级-组配式主题语言:标题法、单元词法、叙词法代码语言:化合物分子式、档案号、专利号按其标识的组合使用法分先组式语言:语词标识在编表时就固定组配好后组式语言:检索时进行临时组配3、 自然语言(关键词、自由词和出现在文章题名、摘要、正文和参考文献中的具有实质意义的语词)自然语言的复兴“以用户为中心”自然语言的应用:自然语言处理、自然语言标引、自然语言检索。自然语言的不足: (1)概

7、念与语词不是一一对应的关系。 (2)概念之间的关系具有隐含性,缺乏对词间关系的揭示与描述。 (3)检索效率直接与用户的认知水平相关。后控制词表弥补自然语言的不足 “后控制模式”=“标引不控制”+“检索后控制”自然语言系统中的三种后控制词表方式:(1)用户检索前通过浏览后空词表选择合适的检索词构造检索式/检索负担较重;(2)由系统自动执行调整检索式/受限于自然语言处理技术;(3)系统根据用户输入的自然语言检索式从后控制词表中给出相关词,供用户选择来调整检索式/交互式,是目前最常用的一种后控方式。4、分类法的类型(1)等级列举式分类法:依据传统的知识分类体系编制,也称为体系分类法 例:杜威十进分类

8、法DDC 美国国会图书馆分类法LCC 中国图书馆分类法(2)分面组配式:依据概念的分析与综合原理,组成“分面-亚面-类目”的结构体系 例:冒号分类法(Colon Classification)(3)列举组配式:在等级列举式的详尽类表的基础上,采用组配方式的分类法 例:国际十进分类法UDC5、分类法的结构体系6 复分表作用:(1)缩小类表的篇幅;(2)加强类表的灵活性;(3)增强类表的规律性。复分表分通用复分表(标准复分表、地区复分表、时代复分表)和专类复分表7、分类法的标记系统标记符号通常可以分为单纯号码和混合号码两种。几种特殊的标记方法(了解其含义和原理):八分法、双位制、借号法、预留空号法

9、、双位加点法8、国内外常用分类法:中国图书馆分类法杜威十进分类法DDC美国国会图书馆分类法LCC国际十进分类法UDC冒号分类法(Colon Classification,CC)要点:名称、大致概况、基本类目、标记符号制度等。例如:中图法有五个基本部类,22 个基本大类,混合号码制标记符号,8个通用复分表9、主题法(原理)主题法是直接以表达主题内容的词语作主题标识、以字顺为主要检索途径,以主题为中心集中信息资源,并通过详尽的参照系统等方法揭示词间关系的标引和检索方法。主题法的类型按照选词方法划分:标题法 元词法 叙词法 关键词法 10、叙词 概念组配式叙词法最基本的原理叙词之间的关系等同关系(正

10、式叙词 非正式叙词) 参照符号 Y D等级关系(上位概念主题词 下位概念主题词) 参照符号 F S相关关系 (类缘关系,语义相关) 参照符号 C11、国内外常用主题词表美国国会图书馆标题表(LCSH),世界上使用最广泛、最具影响的标题词表汉语主题词表中国分类主题词表12、汉语主题词表款目样例:第四章1、几个概念:著录是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。款目是指依据一定的规则和方法,对文献特征与编目业务信息所做的记录,包括描述项目、检索点、编目业务注记三部分信息。记录是指表述事物的特征,具有完整的含义,从内容和使用的角度能被作为一个整体来识别的一组相关数据项的组

11、合。2、 著录信息源著录信息源(source of information)是指款目或记录中著录信息的来源。明确著录信息源是准确、一致地进行文献著录的保障。主要信息源优先选作著录信息来源,一般是文献信息本身。如图书的题名页、版权页、封面、书脊、附录;正文、目次、序跋文字和内容提要等。参考信息源文献残缺、特征不详或有误的情形下选择文献信息本身之外的工具文献或参考文献来弥补主要信息源不足的问题。规定信息源著录项目的特定来源,依据规定信息源对顶的内容及先后次序来选择使用信息源。3、 国内外主要的几个著录规则国际标准书目著录(ISBD): 国际标准书目著录是为了实现文献著录的统一和规范而制定的一套供各

12、类型文献著录用的国际标准。ISBD的发展和维护工作由国际图联书目控制部的编目组负责承担。在文献著录规则的编制体例上,ISBD采用了总则与分则相结合的方式,形成了一整套完整的文献著录规则。AACR2(英美编目条例(第2版) )中国文献著录国家标准文献著录总则 (p158著录格式)4、MARC机器可读目录Machine-Readable Catalogue,简称MARC,是以代码形式结构和特定结构记录在计算机存储载体上的,可用计算机识别与阅读的目录。MARC的记录格式结构由记录头标区、地址目次区、数据字段区3个部分组成5、元数据元数据:(关于数据的数据)提供关于信息资源或数据的一种结构化的数据,是

13、对信息资源的结构化的描述。元数据的作用(功能)1)描述:根据元数据的定义,它最基本的功能就在于对信息对象的内容和位置进行描述,从而为信息对象的存取与利用奠定必要的基础。都柏林核心元素集所提供的,是信息对象的识别而言最为基本的描述信息;而机读目录格式,则为信息对象提供详细级别的描述。2)定位:元数据包含有关网络信息资源位置方面的信息,因而可确定资源的位置所在,促进了网络环境中信息对象的发现和检索。3)搜寻/检索:识别资源的价值,发现其真正需要的资源。4)选择:对信息对象的取舍,选择合适用户使用的资源5)评估:价值评估,作为存取与利用的参考。6)管理:权限管理、电子签名、使用管理等管理方面的信息。

14、7)保存:包括详细的格式信息、制作信息、保护条件、转换方式、保存责任等内容,从而支持对资源的保护和长期保存。元数据类型 依据元数据的功能: 管理型元数据(维护和管理信息资源的元数据,包括信息资源的版本信息、使用权限、获取条件和方式、数字签名、历史保存信息等)描述型元数据(描述和识别信息资源特征的元数据,包括题名、作者、出版日期、主题词、分类号及资源之间关系等)结构型元数据(文件的结构或标记、数据集和其他被描述的信息体,包括软/硬件文档、技术性信息等)6、都柏林核心元数据集(DC) 了解其背景及相关,元素及其含义简单都柏林核心集包括15个元素,分为3个种类:内容、知识产权和实例化(1)有七个元素

15、用于描述内容:Coverage、Description、Type、Relation、Source、Subject & Title(2)描述知识产权的元素共四个:Contributor、Creator、Publisher & Rights(3)实例化元素共四个:Date、Format、Identifier & LanguageDC的修饰词7、 元数据描述框架 RDF基本的RDF数据模型由3类对象组成:资源(resource) 属性(properties) 陈述(statements)使用以资源为节点的有向图方式显示,其中资源和属性值都是一节点表示的,属性以有向弧表示。(p187 RDF图示法)第五章1、分类标引法step1:类目辨析;step2:号码配置几个概念:仿分 复分2、主题标引方式:整体标引全面标引对口标引综合标引分析标引3、主题标引程序:1 查找利用已有的标引成果;2 主题分析;3 主题概念的转换;4 主题标引记录;5 审核 4、 主题结构分析主题结构分析是指分析信息资源的各因素及它们之间的相互关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论