信息组织知识点汇总_第1页
信息组织知识点汇总_第2页
信息组织知识点汇总_第3页
信息组织知识点汇总_第4页
信息组织知识点汇总_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.知识点汇总第一章1、信息组织的定义以用户需求为导向,依照信息体自己的属性特点,信息工作者或用户依照必定的原则、方法和技术,将凌乱无章的信息整理成为有序的信息会合的活动和过程。2、信息组织的原理基根源理:假如有若干自然状态的无序信息资料,将这些信息资料依照某种属性特点摆列成一个序列,并且需要使用信息资料的用户能将自己的需求变换成相应的信息资料属性特点,并在排列后的信息资料序列中找到自己所需要的信息资料。信息组织由信息著录标引(信息描绘揭露)和信息序化两个工作环节构成。3、信息组织的容一般而言,信息组织包含四项容。1.信息挑选(甄别实用信息,剔除无用信息)2.信息剖析(对信息的外面特点进行细化、

2、发掘、加工整理并归类)3.信息描绘与揭露(对信息资源的部分主题容、形式特点及物质形态等描绘维度进行剖析、选择、记录的过程)4.信息整序与储存(依照必定的格式温次序储存在特定的载体中)4、信息组织的种类按信息的认识层次区分,信息组织有三种种类1.语法信息组织(研究语言符号之间的形式畴的结构规则,如:字顺法、代码法、地序法、时序法)2.语义信息组织(研究信息的容特点的组织方法,如:分类法、主题法)3.语用信息组织(研究环境与使用者的不一样而不停变化的信息群,如:权重值信息组织法、概率组织法)信息组织的作用控制整序提高质量流传利用节俭成本第二章1、熵(entropy)Word文档.最早是热力学上的一

3、个符号,是一种丈量在动力学方面不可以做功的能量综述。熵指的是杂乱的程度,负熵是物质系统有序化、组织化、复杂化状态的一种量度。香农第一次将“熵”引入到信息论中,在信息论中,“熵”能够用作某件事不确立度的量度。信息量越大,系统结构越规则,功能越完美,熵就越小。利用熵的看法,能够从理论上研究信息的计量、传达、变换、储存等活动。学术界当前广泛接受的看法是“信息即负熵”。2、逻辑学原理在信息组织中的应用看法之间的关系(图略):相容关系同一关系:是指有同样外延的两个看法之间的关系。包含关系(属种关系):是指这样两个看法,此中一个看法完好被包含在另一个看法的外延里,是另一个看法外延的一部分。包含另一个看法的

4、看法(外延广的看法)对被它包含的看法(外延窄的看法)来说是上位看法或属看法,被包含的看法对包含它的看法来说是下位看法或种看法。交错关系:是指有一部格外延重合的两个看法之间的关系。不相容关系并列关系:是指同一个上位看法(属看法)之下的几个不存在共有外延的下位看法(种看法)之间的关系。矛盾关系:这是看法并列关系的一种特别形式,是指外延总和等于其上位看法所有外延的两个并列看法之间的关系,非此即彼,没有第三种状况。对峙关系(反对关系):也是看法并列关系的一种特别形式,是指外延总和小于其上位看法所有外延的两个并列并且是互相对峙的看法之间的关系。第三章1、规语言定义:规语言从自然语言出发,依据信息描绘与信

5、息检索的需要,从自然语言中挑选出特定的词汇来搜罗和指示看法,并依照必定的规则对自然语言进行预先规而形成的人工语言,是符号化的看法表示系统。规语言也称为受控语言、人工语言。规语言是人工控制的语言系统,词汇控制和句法控制是核心所在。规语言的词汇控制1)词汇的选择:优选、压缩,保存拥有检索意义的词汇,尽可能地控制词汇规模。2)词形的控制:实现词义和词形的独一性。3)词义的控制:采纳加限制词或加说明的方法让词汇与看法一一对应。4)词间关系的控制:采纳索引、图示系统或参照系统来揭露字典中语词间关系。规语言的句法控制1)引用序次/组配序次:明显性引用序次、畴职能引用序次、上下文附属引用序次(2)控制符号:

6、联号、职号、关系符号、加权例:537+621.3(3)句式变换:检索词轮排转变。(机检时代已经变得不足轻重)Word文档.2、规语言的种类:依照结构原理分分类语言:等级系统式、分面组配式、等级-组配式主题语言:标题法、单元词法、叙词法代码语言:化合物分子式、档案号、专利号按其表记的组合使用法分先组式语言:语词表记在编表时就固定组配好后组式语言:检索时进行暂时组配3、自然语言(重点词、自由词和出此刻文章题名、纲要、正文和参照文件中的拥有实质意义的语词)自然语言的中兴“以用户为中心”自然语言的应用:自然语言办理、自然语言标引、自然语言检索。自然语言的不足:(1)看法与语词不是一一对应的关系。2)看

7、法之间的关系拥有隐含性,缺少对词间关系的揭露与描绘。3)检索效率真接与用户的认知水平有关。后控制词表填补自然语言的不足“后控制模式”=“标引不控制”+“检索后控制”自然语言系统中的三种后控制词表方式:(1)用户检索前经过阅读后空词表选择适合的检索词结构检索式/检索负担较重;2)由系统自动履行调整检索式/受限于自然语言办理技术;3)系统依据用户输入的自然语言检索式从后控制词表中给出有关词,供用户选择来调整检索式/交互式,是当前最常用的一种后控方式。4、分类法的种类1)等级列举式分类法:依照传统的知识分类系统编制,也称为系统分类法规:杜威十进分类法DDC美国国会图书室分类法LCC中国图书室分类法2

8、)分面组配式:依照看法的剖析与综合原理,构成“分面-亚面-类目”的结构系统例:冒号分类法(ColonClassification)3)列举组配式:在等级列举式的详细类表的基础上,采纳组配方式的分类法规:国际十进分类法UDC5、分类法的结构系统Word文档.复分表作用:(1)减小类表的篇幅;(2)增强类表的灵巧性;(3)增强类表的规律性。复分表分通用复分表(标准复分表、地域复分表、时代复分表)和专类复分表7、分类法的标志系统标志符号往常能够分为纯真和混淆两种。几种特别的标志方法(认识其含义和原理):八分法、双位制、借号法、预留空号法、双位加点法8、外国常用分类法:中国图书室分类法杜威十进分类法D

9、DC美国国会图书室分类法LCC国际十进分类法UDC冒号分类法(ColonClassification,CC)重点:名称、大概概略、基本类目、标志符号制度等。比如:中图法有五个基本部类,22个基本大类,混淆制标志符号,8个通用复分表9、主题法(原理)主题法是直接以表达主题容的词语作主题表记、以字顺为主要检索门路,以主题为中心集息资源,并经过详细的参照系统等方法揭露词间关系的标引和检索方法。主题法的种类依照选词方法区分:标题法元词法叙词法重点词法10、叙词看法组配式叙词法最基本的原理叙词之间的关系等同关系(正式叙词非正式叙词)参照符号YD等级关系(上位看法主题辞下位看法主题辞)参照符号FS有关关系

10、(类缘关系,语义有关)参照符号CWord文档.、外国常用主题辞表美国国会图书室标题表(LCSH),世界上使用最宽泛、最具影响的标题辞表汉语主题辞表中国分类主题辞表、汉语主题辞表款目样例:第四章1、几个看法:著录是指在编制文件目录时,对文件容和形式特点进行剖析、选择和记录的过程。款目是指依照必定的规则和方法,对文件特点与编目业务信息所做的记录,包含描绘项目、检索点、编目业务注记三部分信息。记录是指表述事物的特点,拥有完好的含义,冷静和使用的角度能被作为一个整体来识其余一组有关数据项的组合。2、著录信息源著录信息源(sourceofinformation)是指款目或记录中著录信息的根源。明确著录信

11、息源是正确、一致地进行文件著录的保障。主要信息源优先选作著录信息根源,一般是文件信息自己。如图书的题名页、页、封面、书脊、附录;正文、目次、序跋文字和容概要等。参照信息源文件残破、特点不详或有误的情况下选择文件信息自己以外的工具文件或参照文件来填补主要信息源不足的问题。规定信息源著录项目的特定根源,依照规定信息源对顶的容及先后序次来选择使用信息源。3、外国主要的几个著录规则Word文档.国际标准书目著录(ISBD):国际标准书目著录是为了实现文件著录的一致和规而拟订的一套供各种类文件著录取的国际标准。ISBD的发展和保护工作由国际图联书目控制部的编目组负责担当。在文件著录规则的编制体例上,IS

12、BD采纳了总则与分则相联合的方式,形成了一整套完好的文件著录规则。AACR2(英美编目条例(第2版))中国文件著录标准文件著录总则(p158著录格式)4、MARC机器可读目录Machine-ReadableCatalogue,简称MARC,是以代码形式结构和特定结构记录在计算机储存载体上的,可用计算机辨别与阅读的目录。MARC的记录格式结构由记录头标区、地点目次区、数据字段区3个部分构成5、元数据元数据:(对于数据的数据)供给对于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描绘。元数据的作用(功能)1)描绘:依据元数据的定义,它最基本的功能就在于对信息对象的容和地点进行描绘,从而为

13、信息对象的存取与利用确立必需的基础。都柏林核心元素集所供给的,是信息对象的辨别而言最为基本的描绘信息;而机读目录格式,则为信息对象供给详细级其余描绘。2)定位:元数据包含有关网络信息资源地点方面的信息,因此可确立资源的地点所在,促进了网络环境息对象的发现和检索。3)找寻/检索:辨别资源的价值,发现其真实需要的资源。4)选择:对信息对象的弃取,选择合合用户使用的资源5)评估:价值评估,作为存取与利用的参照。6)管理:权限管理、电子署名、使用管理等管理方面的信息。7)保存:包含详细的格式信息、制作信息、保护条件、变换方式、保存责任等容,进而支持对资源的保护和长久保存。元数据种类依照元数据的功能:管

14、理型元数据(保护和管理信息资源的元数据,包含信息资源的版本信息、使用权限、获得条件和方式、数字署名、历史保存信息等)描绘型元数据(描绘和辨别信息资源特点的元数据,包含题名、作者、第一版日期、主题辞、分类号及资源之间关系等)结构型元数据(文件的结构或标志、数据集和其余被描绘的信息体,包含软/硬件文档、技术性信息等)6、都柏林核心元数据集(DC)认识其背景及有关,元素及其含义简单都柏林核心集包含15个元素,分为3个种类:容、知识产权和实例化(1)有七个元素用于描绘容:Coverage、Description、Type、Relation、Source、Subject&Title(2)描绘知识产权的元

15、素共四个:Contributor、Creator、Publisher&Rights(3)实例化元素共四个:Date、Format、Identifier&LanguageDC的修饰词Word文档.7、元数据描绘框架RDF基本的RDF数据模型由3类对象构成:资源(resource)属性(properties)述(statements)使用以资源为节点的有向图方式显示,此中资源和属性值都是一节点表示的,属性以有向弧表示。(p187RDF图示法)第五章1、分类标引法step1:类目辨析;step2:配置几个看法:仿分复分2、主题标引方式:整体标引全面标引对口标引综合标引剖析标引3、主题标引程序:1查找利用已有的标引成就;2主题剖析;3主题看法的变换;4主题标引记录;5审查4、主题结构剖析主题结构剖析是指剖析信息资源的各要素及它们之间的互相关系,国主要采纳湘生的主题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论