




已阅读5页,还剩168页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六讲,信息组织,1信息组织概述,信息组织的专业含义、要求及目的,3,1.1信息组织的必要性,信息空间的信息环境,信息检索需求的多样化,信息检索技术的进步,信息组织环境,获取信息的方法和工具,调解用户需求与检索的矛盾,服务于信息检索的信息增值过程,信息超载,信息垃圾,信息爆炸,专业的高度选择性、内容的精良性和时间的紧迫性,手工检索机械检索计算机检索,1.1信息组织的必要性,下游,信息的基础理论信息的本质、特征、种类、传播等,中游,上游,信息资源开发信息的搜集、组织、加工等,信息的利用和服务,信息的上游,信息的中游,信息的下游,信息管理活动,情报工作者,用户,1.2信息组织的含义,信息组织(informationorganization),信息组织,即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。,1.2信息组织的含义,内容相同或相关的集中;集中的信息要呈现某种秩序;相关信息单元之间关系明确。,按照不同用户的信息活动确定信息的传递方向;根据信息环境发展变化调整信息流向。,信息流向明确化,控制信息流动的速度;把握信息传递的时机。,信息流速适度化,信息组织基本要求是实现信息的无序向有序转换,信息内容有序化,1.2信息组织的含义,信息组织的专业目的,减少社会信息流的混乱程度提高信息产品的质量和价值建立信息产品与用户的联系节省社会信息活动的总成本,1.3信息组织的学科发展基础,1.3信息组织的基本原理,客观性,系统性,基本原则,A,B,现代化,D,目的性,C,1.3信息组织的基本原理,理论基础,方法基础,耗散结构论,协同论,知识组织论,信息自组织论,语言学,知识分类,概念逻辑,信息组织在其发展过程中,不断从相关学科的理论和方法中汲取营养。,系统科学论,1.3.1系统原理信息组织是一个系统化的过程,其最终目的是将无序的零散的信息层次化、结构化,形成一种有序的体系或系统,因此,系统科学是信息组织的重要理论基础,对信息组织有极为重要的指导意义。在信息组织系统中,如果将大量的、分散的、杂乱的信息组织成一个系统,建立起内在的关联,那么信息系统的整体功能将大于各个信息单元的功能之总和。也就是说,这将能充分发挥信息资源的价值和作用。不仅如此,在信息组织活动中,类目体系的展开、主题词族的编制、信息的分析等都体现着系统的思想。基于这一原理,信息组织的目标是要建立一个有效的方便检索的信息系统。,1.3信息组织的基本原理,在信息组织系统中,如果将大量的、分散的、杂乱的信息组织成一个系统,建立起内在的关联,那么信息系统的整体功能将大于各个信息单元的功能之总和。也就是说,这将能充分发挥信息资源的价值和作用。不仅如此,在信息组织活动中,类目体系的展开、主题词族的编制、信息的分析等都体现着系统的思想。基于这一原理,信息组织的目标是要建立一个有效的方便检索的信息系统。,1.3信息组织的基本原理,1.3.2语言学原理具体而言,信息组织中的语言问题重要性在于:(1)信息描述和信息揭示中需要运用大量的语言工具。对语言的理解和掌握是人类区别于动物的一个根本标志,某些动物虽然也能说人话,有时似乎也能“理解”人类语言,但这不是真正意义上的,它们对人类语言的使用仅仅是动物高级条件反射。只有人才能准确识别、记忆和领会语言。人对事物的认识几乎都要转化语言,只可意会不可言传的事物不能为其他人所了解。,1.3信息组织的基本原理,(2)信息组织的对象都是用语言描述的各种各样的具有语义性和准语义性的信息。没有语言就不可能有对事物的准确认识。(3)在信息组织的现代技术手段的使用上,信息的编码、算法语言、程序语言、机器语言运用和自然语言理解和处理都充分体现了语言的重要作用。,1.3信息组织的基本原理,1.3.3逻辑学原理信息组织是一种智力活动,离不开人的逻辑思维,信息组织本身是思维的一种表现形式,概念是思维的元素,逻辑则是思维的规则。所以信息组织自然包含相应的逻辑学问题。实践证明,逻辑思维越强的信息组织者其信息组织工作也越好。事实上,信息组织是对信息对象的各个元素(按内部特征和外部特征划分),经过从事物到概念再到语言的层层递进的分析之后,运用科学思维使之序化的一个复杂的过程。,1.3信息组织的基本原理,1概念的关系概念是事物本质属性的概括,其内涵是它所指事物的本质属性的总和。按照概念之间是否存在共有的外延,概念关系可以分为相容关系和不相容关系。第一、相容关系是指至少有一部分外延系统得概念之间的关系,包括的类型有同一关系、包含关系、交叉关系等。(1)同一关系,即具有相同外延的概念之间的关系。如计算机与电脑、土豆和马铃薯、山芋和红薯、西红柿和番茄、鲁迅和周树人等。其逻辑关系可以表示为。,1.3信息组织的基本原理,(2)包含关系,也称属种关系,指一个概念在另一个概念外延之中,并且是另一个概念的组成部分。,1.3信息组织的基本原理,第二、不相容关系可以分为不同论域之间的不相容关系和同一论域中的不相容关系。其逻辑关系可以表示为:(1)矛盾关系。指外延之和等于上位概念外延的两个不相容概念之间的关系,其特点是两个概念之间互斥。(2)反对关系。(3)并列关系。,1.3信息组织的基本原理,概念的划分、分析和综合是信息组织中使用十分普遍的方法。信息组织就是将所组织的信息对象从概念平面转换到语词平面再到转换到标记平面,即用语词标记和符号标记来表达概念。要正确地表达概念就要利用概念逻辑方法分析和认识各种概念及其相互关系,建立“一个概念只用一个标识表达,一个标记只表达一个概念”的一一对应关系。,1.3信息组织的基本原理,2概念的划分概念的外延,反映的是具有某些特有属性的一类事物。要对概念进行正确的划分,还必须遵守以下划分规则。划分必须是相应相称的。每次划分必须根据同一个标准。划分出来的子项必须互相排斥。,1.3信息组织的基本原理,1.3.4知识分类原理1科学分类的意义和原则什么是科学分类?恩格斯在自然辩证法一文中作了精辟的阐述。他说:“每一门科学都是分析某一个别的运动形式或一系列互相关联和互相转化的运动形式的,因此科学分类就是运动形式本身依据其内部所固有的次序的分类和排列,而它的重要性正是在这里。”(恩格斯自然辩证法人民出版社1971年版第227页),1.3信息组织的基本原理,1)科学分类的意义科学分类是科学研究的先行工作,它对于促进科学事业的发展有着重要的作用。(1)揭示了各门学科之间的相互联系和区别,反映了各学科在科学整体中的地位和作用,建立了一个符合时代的科学发展水平的科学整体结构,为辩证唯物主义关于世界统一性和多样性的原理提供了科学的论证和说明。,1.3信息组织的基本原理,(2)从方法论上,对于指导科学的发展具有重要的意义。这是因为,通过科学分类,使得每一门科学在科学总体系中都有确定的位置,这样便可以从其相同学科中得到方法上的启迪,从而促进科学研究事业的发展。(3)有助于认识科学发展的规律性,掌握科研的发展方向。由于科学分类揭示了各门学科之间的相互联系相互渗透的关系,因此有助于预见新学科的产生,同时也可以预见到新学科产生对科学研究和人们的实践会产生如何的影响,有助于掌握科研的发展方向。,1.3信息组织的基本原理,(4)为科学规划和组织科学研究机构,拟订教育体系和教学计划,以及图书分类等实践活动提供了科学的理论依据。2)科学分类的原则(1)客观原则(2)发展原则,1.3信息组织的基本原理,2科学分类的发展(1)古代分类思想古代西方许多有名的学者都对知识进行过分类,其中以亚里士多德的思想最有影响。(2)培根的分类思想英国著名的哲学家培根(15611620年)首先对近代早期发展的自然科学作了系统的描述。他把科学分为:历史(History):自然史(NaturalHistory)、文明史(CivilHistory)诗歌(Poetry):叙事诗(Narrative)、戏剧诗(Dramatic)和寓言诗(Parabolical)哲学(Philosophy):人类哲学(HumanPhilosophy)、文化哲学(CivilPhilosophy)、神学(Theology)(3)圣西门和黑格尔的分类思想,1.3信息组织的基本原理,(4)恩格斯的分类思想恩格斯把科学分为:数学、力学和天文学、物理学、化学、地学、生物学、社会科学和关于人类思维规律的科学。(5)毛泽东的分类思想毛泽东同志在整顿党的作风一文中说过:“什么是知识?自从有阶级的社会存在以来,世界上的知识只有两门,一门叫做生产斗争知识,一门叫做阶级斗争知识。自然科学、社会科学就是这两门知识的结晶,哲学则是自然知识和社会知识的概括和总结。”,1.3信息组织的基本原理,3现代科学的总体结构哲学:社会科学:自然科学:自然科学和社会科学处于同一层次。和哲学相比,它也是一门具有特殊性(5)科学分类发展趋势,1.3信息组织的基本原理,4科学分类的几种典型体系(1)文献分类体系文献分类是知识分类中最重要的应用,因为文献是人类知识最完整、最系统的记录,对它的整序要求也最高。(2)百科全书知识分类体系(3)大学学科分类体系(4)科研项目分类体系,1.3信息组织的基本原理,国家自然科学基金项目分类(2007年版):G:管理科学部,G0109:管理信息系统与决策支持系统G0111:互联网管理理论与技术G0112:评价理论与技术G0113:预测理论与技术G0114:数量经济分析理论与方法G0115:金融工程G0116:复杂性研究*G0117:知识管理G0118:其它,G01:管理科学与工程G0101:管理科学与管理思想史G0102:一般管理理论G0103:运筹与管理*G0104:决策理论与技术G0105:对策理论与技术G0106:行为心理与管理G0105:组织行为与组织理论G0107:管理系统与工程*G0108:工业工程,1.3信息组织的基本原理,1.3.5事物分类原理组织机构分类法(2)物品分类法标准国际贸易分类(StandardIndustrialTradeClassification,SITIC):由联合国制定,主要用于国际贸易统计。SITIC将商品分为10个大类。商品名称及编码协调制度(TheHarmonizedCommodityDescriptionandCodingSystem,HS):这是世界海关组织制定的水平分类编码体系,它在各国海关统计、商品统计、进出口管理及国家贸易中使用最为广泛。HS将商品分为45个大类。,1.3信息组织的基本原理,联合国主要产品分类(CarolinaPopulationCenter,CPC):这是国际招标、商品贸易、投资等领域的重要分类法,其大类为10个。全国工农业产品分类与代码(GB7635-87):它是我国最权威的产品、物资分类法,把各类产品分为23大类,分类原则是按照工农业产品的属性进行的,适当兼顾部门管理、生产流通领域的需要。大体以三次产业的顺序排列。由于中国“入世”的原因,这个分类体系不能满足对服务贸易的统计要求。2001年根据主要产品分类(CPC)修订为全国主要产品分类与代码,其显著特点是,将商品分为有形的产品和无形的产品,适应了当前国际服务贸易迅速发展的需要。,1.3信息组织的基本原理,1.3信息组织的基本原理,1.4信息组织的方法,1.4.1信息组织方法的类型1宏观层次方法和微观层次方法2形式、内容和效用的方法(1)形式信息组织(2)内容信息组织常用的内容特征组织法有分类法、主题法(标题法、单元词法、叙词法、关键词法)、元素结构法、逻辑法等(3)效用信息组织3描述、揭示、分析和存贮的方法4文献实体组织和信息内容组织方法5一般方法和具体方法,1.4.2信息组织方法的完整体系按照上述思想,我们将信息组织方法分为四大类,见下图:第一类方法是思维方法,它是一种普遍方法,不仅信息组织活动受其指导和控制,其它如科学研究活动也受其指导和作用,属哲学层次的信息组织方法。第二类方法是学科的一般方法,代表性的是“老三论”和“新三论”。老三论是“系统论”、“信息论”、“控制论”,新三论是“耗散结构论”、“协同论”、“超循环论”或“突变论”。这些方法在信息组织中有相当广泛的应用。,1.4信息组织的方法,第三类是信息领域的理论方法。属上述的第三层次的第一类,如布拉德福定律、齐夫定律、罗特卡定律等,是信息科学领域的一般方法。第四类信息组织的具体方法,是信息组织学科特有的,包括语法、语义、语用三个层次的信息组织方法,这类方法是构成信息组织方法的主体,反映了事物的不同特征属性。这里主题法和分类法是信息组织的两个主要方法,人们对其研究和使用最多,其它方法都是属于从属地位。,1.4信息组织的方法,1.4信息组织的方法,1.4信息组织的过程与方法,优化选择,确定标识,组织排序,比较法分析法核查法引用摘录法专家评估法,信息外在特征加工著录信息内容特征加工分类标引和主题标引,分类组织法主题组织法字顺组织法号码组织法时空组织法超文本组织法,信息组织活动过程,改编重组,汇编法摘要法综述法,2信息组织的发展与实践,从宏观上,按照信息组织的对象把信息组织分为信息资源组织和检索工具。,信息组织的类型,2.1信息组织发展的历史实践,信息组织的发展主要是与信息管理的整体发展和信息组织的理论方法及信息技术的发展紧密联系的。无论是我国还是国外,信息组织都经历了长期的发展历史。在文献管理活动中,分类法和主题法占有重要地位,其在国内外的产生和发展是信息组织实践活动和规模的集中反映。,2信息组织的发展与实践,2.1信息组织发展的历史实践,2信息组织的发展与实践,2.1信息组织发展的历史实践,古代信息组织实践,近代信息组织实践,现代信息组织实践,国外信息组织的历史实践,2信息组织的发展与实践,数字网络环境下传统信息组织方式的发展,2,网络环境下对信息资源新的组织方式的开发,3,2信息组织的发展与实践,2.2信息组织的发展现状,数字信息环境下信息组织的要求,1)能根据语义、应用和结构需要对任何信息内容进行定义、标记、描述、识别、验证和解释;2)能运用逻辑、语义、语法或结构方法对这些信息内容进行指向、确认、检索和传递;3)能运用逻辑、语义、语法或结构方法对这些信息内容及其集合进行过滤、析取、链接、合并、集成或重组;4)能按照语义关系、知识体系、应用需要或用户对象对信息内容组织格式和表现形式进行定义、标记、识别和转换;5)能以计算机可识别、解析和理解的方式实现上述功能,支持智能代理对信息内容及其交流处理过程的自动处理;6)能在多语种分布式开放式环境中实现上述能力;7)能根据用户的具体需要和应用环境调整上述能力及其实现方式,能根据新的媒提醒式、文献形式、技术能力和系统形态调整和发展上述能力及其实现方式,能以方便、经济和灵活的方式实现上述能力及其调整。,2信息组织的发展与实践,机读化国际通用性兼容性灵活性,基于关键词语言的搜索引擎利用现有词表组织网络信息,MARC格式为适应网络信息资源的特点而修订字段,主题法,机读目录,分类法,数字网络环境下传统信息组织方式的发展,2信息组织的发展与实践,2信息组织的发展与实践,2.3从信息组织到知识组织,网格技术,信息过滤,信息组织的新技术,信息构建,网格是把整个因特网整合成一台巨大的超级计算机,实现各种资源的全面共享。用简单的话讲,网格是高性能计算机、数据源、因特网三种技术的有机组合和发展,它与因特网相比具有高性能、一体化、知识生产、资源共享等技术优点。,信息构建就是从信息复杂的状态中抽取本质要点,并将这些要点以清晰美观易用的方式提交给用户。,信息过滤是指计算机根据用户提供的一个过滤需求(userprofile),从动态变化的信息流(比如web)中自动检索出满足用户个性化需求的信息。,2信息组织的发展与实践,2.3从信息组织到知识组织,知识组织和科学系统图书馆的知识组织,知识组织方面最高级别的国际协会InternationalSocietyforKnowledgeOrganization成立,JesseH.Shera(1965.1966),国际知识组织协会(1989),H.E.Bliss(1929.1933),图书馆与知识组织文献与知识组织,知识组织在国外的形成,2信息组织的发展与实践,2.3从信息组织到知识组织,ISKO国际大会,2信息组织的发展与实践,2.3从信息组织到知识组织,知识组织在国内的形成,蒋永福认为是袁翰青教授1964年在“现代文献工作基本概念”一文中最早使用“知识组织”概念,刘洪波认为是刘迅1985年首次将“知识的组织”作为图书馆情报学研究的一个内容提出。也有人谈到:“知识组织思想可追溯到我国1983年公布的文献著录总则中文献是记录知识的一切载体这一定义将文献主体界定为知识物化的产物,基于图书馆内部活动的全过程是一个对文献依据知识内容进行的组织过程,刘洪波指出图书馆内部活动是一种知识组织活动。但无论知识组织最早提出者是哪位学者,都可以看出我国有关知识组织的研究是从概念的提出而逐渐开始。,2信息组织的发展与实践,2.3从信息组织到知识组织,知识组织的内涵,知识组织的基本原理是以固定的方式方法把知识客体中的知识因子和知识关联揭示出来,并把被揭示的知识按一定的方式编排成序,以便于人们利用。其中,知识因子是知识组织的基本单位,一个概念、一个词语、一件事物都可以成为知识因子;知识关联是若干个知识因子间建立起来的特定联系。,2信息组织的发展与实践,2.3从信息组织到知识组织,知识组织方法体系,知识表示,知识重组,知识聚类,知识存检,知识编辑,知识布局,知识监控,2信息组织的发展与实践,3信息组织的技术方法分类法,类,类名,具有某种共同属性的一组事物的对象的集合。,表示类目概念的名称称做类名。,分类的概念,分类的原理,分类是指人们认识事物、区别事物,并在此基础上组织事物的一种科学方法,是人们根据事物的属性对其进行区分和类聚的过程。,依据事物的属性区分或分组,把具有相同属性或特征的对象集中在一起;按照区分出来的对象集合的关系排列次序,并在这些类中进一步按照其相同点和不同点进行区分和组织。,3信息组织的技术方法分类法,信息资源分类,信息资源分类是指根据信息资源内容的学科属性与相关的其他特征,对各种类型的资源予以系统地组织揭示、区分,并进行组织的一种方法。,信息资源分类的特征:揭示信息资源区分信息资源组织信息资源,3信息组织的技术方法分类法,信息描述,信息描述,亦称信息源描述,是指根据信息组织和检索的需要,对信息源的外部特征、物质形态(和主题内容)进行分析、选择、记录的活动。信息描述的结果,是获得描述记录亦即元数据,用作信息源的代替物(surrogate或representation)组织检索系统。,3信息组织的技术方法分类法,题名/作者:信息组织主编周宁丛编题名:面向21世纪课程教材ISBN号:7-307-03434-4出版发行项:武汉-武汉大学出版社2001.12载体信息:368页21cmCNY17.00个人名称等同责任者:周宁中图图书分类法类号:G203论题主题:信息管理-高等学校-教材论题主题:高等学校-信息管理-教材论题主题:教材-信息管理-高等学校附注项:有书目(第356-361页)和索引(第362-367页)。附注项:本书系统地讲述信息资源描述与组织的理论与方法。在因特网迅猛发展、数字化信息资源已成为信息资源主体的今天,本书着眼于知识经济和信息社会发展的需要,重点讨论以计算机为基础的数字化信息资源的描述与组织。书中吸收了国际上该领域的最新成果,并理论联系实际,列举了大量实例,且理论性与实用性兼顾,反映了信息组织工作的时代特征。内容附注项:本书系统地讲述信息资源描述与组织的理论与方法。在因特网迅猛发展、数字化信息资源已成为信息资源主体的今天,本书着眼于知识经济和信息社会发展的需要,重点讨论以计算机为基础的数字化信息资源的描述与组织。书中吸收了国际上该领域的最新成果,并理论联系实际,列举了大量实例,且理论性与实用性兼顾,反映了信息组织工作的时代特征。,3信息组织的技术方法分类法,3信息组织的技术方法分类法,按照分类法的编制方式,等级列举式分类法,分面组配式分类法,半分面分类法,分类法类型,3信息组织的技术方法分类法,将类目体系组织成一个树状结构,按照划分的层次,逐级列出相近的子目,并在线性形式显示时,以缩格表示类目的等级关系。,类目展开系统;分类结构显示直观;标记简明,号码单纯,特点,不能充分揭示细小专深主题;类具有一定的凝固性;无法根据现代科学发展自动生成新类;大型类表管理困难,缺点,等级列举式分类法,编制方式,3信息组织的技术方法分类法,等级列举式分类法样例,G文化、科学、教育、体育G0文化理论G02文化哲学G03文化的民族性G04比较文化学G05文化与其他学科的关系G07文化地理学G09文化史,代表性分类法杜威十进分类法美国国会图书馆图书分类法中国图书馆图书分类法,在类表中按照范畴列出各种基本概念,并分别配以相应号码,使用时,先分析对象的主题,根据主题分析的结果,通过相应概念的组配表达文献主题内容,以这些类目标识的组合,表示该主题在分类体系中的次序。,标引专指;标记表达性强,可以根据需要调整组配次序;可以表达新产生的复杂主题类表的篇幅小,便于管理、修订。,特点,类目体系具有隐含性,直观性差;标引难度高;号码冗长,不适合组织文献排架。,缺点,分面组配式分类法,编制方式,3信息组织的技术方法分类法,分面组配式分类法样例,伦敦分类法研究小组编制的专业分面分类法中,图书馆学分面分类法就可用图书馆类型、资料、操作、学科、地区、时代等特征进行划分,从而产生6组类目,即6个组面。每一组面还可用同一系列的更细的标准进行划分,分为两个或多个亚面。如图书馆类型面可以再划分为以下几个亚面:图书馆类型按上属机构分公共图书馆高等学校图书馆按用户分儿童图书馆盲人图书馆按规模分大型图书馆中型图书馆小型图书馆,以列表式类表为基础,具有一定的直观性,同时广泛采用组配方法,可以达到分面类表同等标引水平。,列表的管理修订工作量大;类目组配符号标记复杂、冗长。,列举组配式分类法,缺点,编制方式,半分面分类法,3信息组织的技术方法分类法,半分面式分类法样例,主表分为以下10大类:0总论1哲学、心理学2宗教、神学3社会科学4(1964年以前为语言学)5数学和自然科学6应用科学7艺术8语言学、文学9地理、历史,国际十进分类法(UDC)主表采用等级列举式分类法的体系结构在利用附分表过程中采用组配式。,3.2类目体系主表,基本部类是分类法合理展开对知识范畴所作的最概括、最本质的划分。,基本部类,3信息组织的技术方法分类法,3.2类目体系主表,它是分类法列出的第一级类目,也是分类法整体框架的体现。,基本大类(基本大纲),中国图书馆图书分类法22个基本大类A马克思主义、列宁主义、毛泽东思想B哲学C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学Z综合性图书,3信息组织的技术方法分类法,简表,详表,3信息组织的技术方法分类法,一般复分表实例,复分表作用:有利于节省主表的篇幅;增强类目表的灵活性;增强分类法的内在规律性。,3信息组织的技术方法分类法,G文化、科学、教育、体育(一级类)G2信息与知识传播(二级类)G25图书馆学、目录学、图书馆事业(三级类)G250图书馆学(四级类)G251图书馆管理(四级类)G252读者工作(四级类)G253图书馆采访和藏书组织(四级类)G254文献标引与编目(四级类)G254.0文献检索语言(总论)(五级类)G254.1分类法(五级类)G254.2主题法(五级类)G254.3文献编目(五级类)G254.34各种编目方式(六级类)G254.341集中编目(七级类),层累标记制,3信息组织的技术方法分类法,分面标记制例如按照冒号分类法,“1950年印度数学书目”这一文献主题的类号是Ba.44N5,其中“B”表示数字,“a”表示书目,“.44”表示印度,“N5”表示1950年。顺序标记制按标记符号本身固有顺序依次为每个类目配号的标记制度。它只反映类目排列的先后次序,不显示类表的层次结构。顺序标记制可分为整数顺序制、小数顺序制和字母顺序制3种。例如,伦敦教育分类法采用的是字母顺序制:Tab异常儿童Tap残疾Tas身体残废Teb盲人,3信息组织的技术方法分类法,类目注释,P4大气科学(气象学)大气科学是研究地球大气中各种现象的形成原因、时间、空间分布和演变规律以及如何利用这些规律为人类服务的一门学科。依总论复分表分。,含义性注释,O513低温特性比热、输运过程、磁性、临界等现象入此。,内容范围注释,3信息组织的技术方法分类法,类目注释,“A1/49(特殊分类规定)”马克思、恩格斯、列宁、斯大林、毛泽东、邓小平的科学专著,均按学科内容,在有关类下作互见,用“a”加以标志。例:列宁论图书馆在本大类编号为A267,互见编号为:G25a。,类目特性注释,3信息组织的技术方法分类法,类目注释,K历史、地理总论历史与兼论史地的著作入此。地理入K9。,类目关系注释,O659.37工业气体分析宜入TQ116.02。分。,类目关系注释,A42毛泽东单行著作见A12注。,类目关系注释,3信息组织的技术方法分类法,类目注释,N01科学研究的方针、政策及其阐述依世界地区表分。,分类方法注释,Q958.3动物的地带分布仿Q151分。,分类方法注释,3信息组织的技术方法分类法,杜威十进分类法,DDC22体系结构000Computerscience,Knowledgepreferspecifics;policy:ManualSection24;/Chem.IndpermittedButconsideralsoCARCINOGENS;CATALOG:fromqualifypermitted/diagnosiswasNEOPLASMDIAGNOSIS1964-65;CARCINOGENESISwasheading1977YseNEOPLASMS/CIorNEOPLASMS/ETtosearchCARCINOGENSIS1977SeerelatedDNA,NEOPLASMSONCOGENICVIRUSESXCANCERXTUMORSXRMEDICALONCOLOGY,MeSH款目的结构,4信息组织的技术方法主题法,3)汉语主题词表,中国编制的大型综合性中文叙词表。中国科学技术信息研究所与北京图书馆主编,1980年科学技术文献出版社出版。共收正式叙词91158条,非叙词17410条,范畴类目分为三级。1991年自然科学部分出增订本,增补新词8221条,删除不适用词5434条。汉语主题词表分3卷10册:第一卷(2册)为社会科学部分,第二卷(7册)为自然科学部分,两部分均包括字顺主表、范畴索引、词族索引和英汉对照索引,第三卷为附表,包括世界各国政区名称、自然地理区划名称、组织机构名称及人物名称。具体实例详见5.3叙词表的结构。,4信息组织的技术方法主题法,4)社会科学检索词表,社会科学检索词表是中国社会科学院文献信息中心编制的一部供社会科学文献资料标引和检索的词表。该词表采用分类主题一体化的形式,其分类表部分使用与传统分类体系结合的分面结构。词表的编制自1987年立项开始,到1993年12月结束,前后历时7年,期间经过试标引和反复修改、充实。全表共收词23,000个,其中正式叙词18,874个,非叙词4,126个,由分类表、字顺表和英汉译名对照表3部分组成,是国内供社会科学领域文献单位进行多学科标引和检索的工具。,4信息组织的技术方法主题法,常见的主题标引方式,整体标引,全面标引,对口标引,综合标引,分析标引,4信息组织的技术方法主题法,主题标引,4信息组织的技术方法主题法,查找并利用已有标引成果,主题分析,转换标识,标引记录,审核,查重,查找统一标引成果,查找联合标引成果,查看在版标引成果,标引工作程序,主题分析,主题分析一般是指标引过程了解和选择信息资源内容、形成和提取主题概念的环节。具体地说,主题分析是通过审读信息资源而了解其内容及其表现形式,选择内容单元而确定其主题数量,概括单元内容而形成主题概念,并分析主题的结构和类型,必要时判断主题的学科专业属性的一种智利劳动。,主题分析是主题标引的基础环节,正确的标引必须以正确的主题分析为前提。,主题分析,主题结构分析,主题类型的分析,根据信息资源的主题数量分为单主题和多主题;根据主题中主题概念的数量及其关系分为单元主题、复合主题和相关主题。,对主题结构分析的目的是,在分析主题类型的基础上,进一步对文献中复合主题的成分进行分析,以便查明主题构成因素及其相互关系,对主题概念进行提炼。,主题概念提炼不足主题概念提炼过度提炼错误,针对性客观性网罗性专指性一致性,主题分析的误差及注意事项,主题概念转换,主题概念的转换就是把用自然语言提炼的主题转换为正式主题词表达的主题。,主题概念转换,分解转换,直接转换,待标主题概念没有现成的主题词可供直接标引,必须首先将该主题要领分解成若干个简单主题概念;然后再分别用相应的主题词进行转换。,概念的直接转换是指待标主题概念可以直接用词表上的一个对应叙词加以表述。,标识的确定,标识的确定是指依据检索系统的使用需要,在完成标识转换的同时,对标引词进行必要的处理。目前,根据物质条件和检索手段的不同,将检索工具分为手检工具和机检系统。由于手检工具采用先组方式,而机检系统一般采用后组方式,而且不少机检系统在实际应用中往往又利用机检文档输出各种手工检索工具。所以,标识的确定也必须同时按照先组和后组两种方式进行。,选用标引词的基本规则,叙词组配标引规则,必须用正式叙词标引相对专职标引规则遵守选定标引词的优先顺序标引深度要适当保持标引的一致性,概念组配优先交叉组配参组叙词相对专指合理组配适度组配明确组配语言分组标引不可组配规则,自然语言标引和检索实践,自动标引,关键词法,文本检索,自由标引,自然语言入口词检索,自然语言标引主要方式,关键词法是最早用于计算机情报检索的自然语言形式,早期主要用计算机自动抽取文献题名、文摘或正文中有检索意义的语词,通过轮排生成各种类型的关键词索引,包括题带上下文的关键词索引(内关键词索引和题外关键词索引)、不带上下文的关键词索引(纯关键词索引和词对式关键词索引)等,这是在手工检索工具中。在建立数据库供计算机检索使用时,关键词索引一般以倒排档的方式组织。,自然语言标引和检索实践,自动标引,关键词法,文本检索,自由标引,自然语言入口词检索,自然语言标引主要方式,文本检索是一种不进行标引,直接利用计算机的功能,通过自然语言中的语词或语词组配,对文本形式的信息资源进行匹配检索的方式。优点:不需要标引,对信息资源的处理速度快,可以及时投入运行。缺点:检准率低,自由标引是不依赖词表的一种主题标引法,标引人员在对文献的情报内容进行分析之后,按一定规则自拟标引用词来表达文献主题。优点:标引速度快,成本低;专指度高,检准率高;标引员业务水平高标引质量则高。缺点:不能适应对海量有序化组织的需要。,自然语言入口词检索包括受控系统中使用入口词表检索与后控检索。受控系统的入口词表,由不用作标引的非正式主题词组成,本身不用来标引,只起入口作用。检索时,将入口词转换为对应的标引词进行匹配查找。后控词表中的入口词表既用作检索入口,本身也可以用于标引。在通过后控词表进行检索时,利用表中对词间关系的处理,同时使用检索提问中输入的语词和与该词对应的等同关系的自然语言语词检索查找。,主题标引全自动化研究,自动标引,关键词法,文本检索,自由标引,自然语言入口词检索,自然语言标引主要方式,自动标引是自动标引采用计算机来“阅读”被标引的信息内容(如题名、文摘或全文,并在计算机“读取”关键性词汇时,利用词频统计等测定方法,或者使用同预先存储在计算机中的主题词表中的词进行对比、分析等方法,对信息资源进行主题分析和选定标引词。关键问题:取出关键性词汇;分析确定标引词分成两种形式自动抽词标引自动赋词标引,主题标引全自动化研究,英语自动标引方法,汉语自动标引方法,英语自动标引方法包括统计表音法、语言标引法、概率标引法、书目标引法和人工智能标引法。,汉语自动标引方法可分为8类:词典标引法、切分标引法、统计标引法、机助标引法、单字标引法、语法语义标引法、神经网络分词标引法和专家系统标引法。,6信息组织的技术方法集成法,章节简介,分类主题一体化集成方式,信息组织工具的集成,元数据集成方式,6.1信息组织工具的集成,信息组织集成法,信息组织工具的集成就是通过各种组织工具结构上的有机配合及兼容转换,集多种信息组织工具于一身,既能使作为单一信息组织工具的原有功能得到了进一步的保留和加强,又能通过各种组织工具结构上的有机配合,产生出更加强大的信息组织及检索的总体功能。,6.1.1信息组织工具的集成,信息组织工具集成的形式,信息组织方法的兼容信息组织方法兼容目的是使信息组织组织工具和方法不依赖于某一种信息组织工具的单一组织方法,而是要实现多种信息组织方法兼容与融合。在信息描述方面,信息组织方法兼容是信息资源描述标准和规范之间的语义映射、互换等以及标准和规范的集成问题;在信息标引方面,信息组织方法兼容是检索语言的标准化与兼容化问题。在检索语言上,可采用词汇转换、中介词典兼容方式、宏观词表和微观词表兼容方式、集成词表兼容方式和叙词词库。,自然语言与受控语言的结合自然语言与人工语言各自本身的利弊,使其任何一种语言都不可能成为一种完善的独立检索语言,两种语言自身的弊端也为研究其融合提供了客观的事实依据。同时,在实际使用、检索语言性能改进的需要看,信息组织的发展趋势,不是一种检索语言取代另一种检索语言,而是两者的有机结合。目前常见的自然语言与受控语言结合的形式主要包括:两者并存,建立平行系统;建立混合系统;自然语言标引,后控制词表检索;自动标引赋词。,分类主题一体化,将按学科体系或逻辑体系排列和组织的分类法系统与按字顺排列并用参照系统予以组织的主题法系统,通过词汇的统一或对应、词间关系显示的互补,以类号作为连接件或转换器,有机地融为一体,形成两种重要的信息组织工具的集成,从而实现二者功能上的互补。,4信息组织的技术方法分类主题一体化,特性检索功能,族性检索功能,分类法,主题法,分类主题一体化,分类法中的主题因素分类法采用了一系列主题法的技术和手段,如编制分类表字顺索引或为分类目录设置字顺主题索引;在分类表中在一个学科或专业范围内,按主题事物集中列类,如在中国图书馆图书分类法中有关类目下注明的“总论入此,专论人有关各类”等;对类名的词形或词义的控制,明晰类目之间的各种关系;适度增加分类法中的组配因素,向着类目叙词化的方向发展。,主题法中的分类法因素主题法也引进了一系列分类法的技术和措施,诸如在标题表中设置副标题和倒置标题,设置“隐蔽的分类体系”参照系统;编制轮排索引,使主题词表中概念成族和字面成族;编制范畴索引,对叙词进行粗略分类,以便于按照学科、专业集中和查找主题概念;编制词族索引,显示主题概念间的属种关系;在款目词下设立属分参照,显示主题概念间的等级关系等。,4信息组织的技术方法分类主题一体化,分类主题一体化词表,分类主题一体化词表是一种分类语言和主题语言兼容互换的系统。具体地说,是指在一个检索语言系统中(或由两种原来独立的检索语言合成的系统),对它们的分类表部与主题词表部的术语、参照、标识、索引四部分实施统一的控制,从而能够满足分类标引与主题标引的需要,简称一体化检索语言或一体化词表。,4信息组织的技术方法分类主题一体化,分类主题一体化系统的结构,叙词或标题,类号,类名,词汇的统一或对应,分类主题一体化系统,字顺排列参照系统,逻辑排列加或不加参照系统,分类表从学科角度揭示主题概念的系统关系和等级关系,借助叙词表部分进一步揭示主题概念的多重等级关系和相关关系,分类子系统,主题子系统,叙词表能揭示等级关系和相关关系、同一关系及组配关系,并且借助对应的分类表可揭示主题概念之间的系统关系和等级关系,4信息组织的技术方法分类主题一体化,国内外应用,从分类主题一体化理论诞生以来,人们便开始尝试编制分类主题一体化词表。1969年,英国女情报学蒙琼艾奇逊(JeanAitchison)等人编制的分面叙词表被认为是分类法与主题法的首次成功结合,也是世界上第一部分类主题一体化词表。我国最早提出分类主题一体化设想的是著名图书馆学家刘国钧和杜定友先生。之后,国内外涌现出一大批分类主题一体化词表。,4信息组织的技术方法分类主题一体化,6.2.4中国分类主题词表的结构与使用,分类号主题词对应表,编制和使用说明,第一卷(共2册),体系结构,主题词分类号对应表,第二卷(共4册),6.2.4中国分类主题词表的结构与使用,中国分类主题词表电子版1.0界面,1元数据标准的映射与集成,映射原理,集成方式,元数据映射的原理是如果一个元数据集中的元素可以在另一个元数据集中找到相对应的元素,那么就可以认为这两个元素是对等的元素,彼此可以互相映射。元数据能够被互相映射主要是由于大多数元数据模型在其元数据元素、结构和描述的复杂性的级别方面有着相通之处。不同元数据方案的设计都受到USMARC的很大影响,同时,各个元数据方案又各有其自己的侧重点。因此,这种相通性和互补性为元数据映射与集成,实现互操作提供了可能。,在元数据标准的映射与集成层面上,互操作通常发生元数据方案的各个元素上。主要的实现方法有应用规范、直接对照、转换对照、超结构框架和元数据登记站。,4信息组织的技术方法元数据,元数据应用的复用与集成,元数据应用的复用,集成方式,无论采用哪种途径和方法实现元数据互操作,都必须以联合各方的资源和专家制定一个互操作的战略为前提,共同创建通用的元数据记录的集合或元数据模板,只有采用这样的方式开发的元数据集,才能最大限度地囊括高质量资源,实现信息系统或门户之间的互操作。,元数据记录层面上实现互操作,主要有两种方法,一是对元数据记录进行直接转换,二是数据重用,以产生新的元数据记录。,4信息组织的技术方法元数据,元数据与分类法集成的实践项目较多,应用主要有两种情况,即在网站或数字图书馆项目中,主要用作网络信息资源或数字信息资源的分类系统在元数据体系中,则是利用分类法作为对信息资源主题有关的元素或字段的编码体系。分类法在元数据中的应用有助于扩大索引词汇、在元数据的“学科”主题元素创建时自动分配分类号、为自动分类提供补充术语、为用户提供更多的检索选择通过分类号检索。此外,北京大学王军在其论文VISION:集成分类法、主题词表和语义元数据的概念网络中还提出了集成分类法、主题词表以及元数据构建概念网络的想法,元数据与分类主题集成,4信息组织的技术方法元数据,广义,狭义,网络信息资源是指“通过计算机网络可以利用的各种信息资源的总和”它包括除了信息内容本身,还包括与网络信息有关的设备、技术、资金和人员等各种资源。,网络信息资源是各种媒介和形式的信息的集合,包括文字、声音、图像、印刷信息、电子信息、数据库等,网络只是其依附的载体。,5网络信息资源组织,网络信息资源的类型按照交流方式,将网络信息资源区分为非正式出版的信息、半正式出版的信息和正式出版的信息;按照加工程度,将网络信息资源区分为一次出版网络信息资源、二次出版网络信息资源、三次出版网络信息资源;按照内容和用途,将网络信息资源区分为普通型网络信息资源、专门资料型网络信息资源、数据资料型网络信息资源、即时资料型网络信息资源;按照表现形式,将网络信息资源区分为全文型网络信息资源、数值型网络信息资源、书目索引型网络信息资源和实时活动型网络信息资源;按照出版类型,将网络信息资源区分为源于万维网的信息和基于万维网的信息;按照载体形式,将网络信息资源区分为文本信息和多媒体信息。,5网络信息资源组织,存储载体数字化,表现形式多样化,传播媒介网络化,网络信息资源的特点,资源层次复杂化,交流渠道自由化,传播方式动态化,资源管理无序化,信息检索专业化,5网络信息资源组织,网络信息资源组织要求针对存储载体数字化和数量增长快速化,需要发展适合海量资源的存储形式、高效处理能力和适合的检索方法,包括分布式存储、压缩存储等存储技术,探索通过联合编目方法和自动处理技术等,解决对海量数据的处理,同时针对在海量资源组织和检索时检准率更加重要的特点,改进检准措施;针对资源的表现形式多样化和层次复杂化,要求根据其结构揭示特点加以应用,并发展相似文献识别技术,对重复网页进行识别;发展适合的组织形式以及识别和处理技术,包括发展种类多样的系统,探索特种资源类型的识别和处理技术,如PDF处理技术、多媒体分析、处理技术等,不断发展对资源的处理能力;针对网络信息资源传播方式动态化和交流渠道自由化的特点,要求发展相应访问方法,以使网络变动能够及时得到发硬,使得新的内容能迅速纳入;针对网络资源资源管理无序化,要求建立适用的搜索和采集机制,以便能够解决分布式资源收集的问题,有效发现和处理有价值的资源对象;建立适合的质量评价机制,并根据网络的特点,结合多种因素予以解决;针对信息检索专业化,结合网络终端用户的特点和使用环境,充分发展通用检索技术,通过增加系统的易用性、直接性改进使用效果,同时发展面向对象的、适合不同用户的检索技术和个性化检索技术,并通过查询优化形式的应用,改进检索效果。,5网络信息资源组织,网络信息资源组织,网络信息组织是指人们根据网络信息本身的特点或属性,运用各种工具和方法,对网络信息进行加工、整理、排列组合,使之有序化、系统化、规律化,从而有利于网络信息的存储、传播、检索、利用,以满足人们的网络信息需求的活动过程。,5网络信息资源组织,网络信息资源组织方式文件方式:将网外丰富的信息资源电子化,投入网上,形成网上的各种文件,网络上诸如“文件传输协议”(FTP)来帮助用户利用那些以文件形式保存和组织的信息资源。数据库方式:数据库方式是指将数据经合理分类和规范化处理之后,以记录的形式存储于计算机
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年学历类自考专业(电子商务)电子商务案例分析-经济学(二)参考题库含答案解析(5卷)
- 2025年学历类自考专业(电子商务)互联网数据库-商法(二)参考题库含答案解析(5卷)
- 2025年学历类自考专业(法律)行政法学-外国法制史参考题库含答案解析(5卷)
- 2025年学历类自考专业(法律)外国法制史-民事诉讼法学参考题库含答案解析(5卷)
- 2025年学历类自考专业(法律)国际法-宪法学参考题库含答案解析(5卷)
- 2025年学历类自考专业(法律)保险法-民法学参考题库含答案解析(5卷)
- 保育保健及安全培训心得课件
- 2025年学历类自考专业(工商企业管理)企业管理概论-企业管理概论参考题库含答案解析(5卷)
- 2025年学历类自考专业(国贸)外经贸经营与管理-国际运输与保险参考题库含答案解析(5卷)
- 2025年学历类自考专业(国贸)国际贸易实务(一)-线性代数(经管类)参考题库含答案解析(5卷)
- 2025年秋人教鄂教版(2024)小学科学三年级上册《认识液体》教案
- 甜品制作基础知识点
- 2025年广东省中考历史试卷(含解析)
- 人工智能赋能基础教育应用蓝皮书 2025
- 钳工(中级) 课件项目7-10 液压传动机构的装配与调试-机械设备保养与维修
- 食堂费用开支审计方案(3篇)
- 小岗位大作用班会课件
- 认证产品一致性管理办法
- 怒海彭湃完整版本
- 安全数据脱敏技术
- 变化与更新-2025中国家居家装行业发展研究报告763mb
评论
0/150
提交评论