文献信息标引(下)第一章_第1页
文献信息标引(下)第一章_第2页
文献信息标引(下)第一章_第3页
文献信息标引(下)第一章_第4页
文献信息标引(下)第一章_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机与信息科学学院,信息组织中的主题法,信息组织是建立信息系统,进行信息管理的必要环节。在信息组织中,需要综合采用多种方法,其中,分类法和主题法是信息组织最主要的两类方法。分类法与主题法在信息检索系统中、在揭示馆藏文献中、在文献实体组织和统计等工作中及其在文献出版发行中都发挥着重要的作用。 分类法和主题法在信息组织活动中发挥着重要作用,有很多共同之处,也有很多不同。在前面的一个学期,我们主要学习了分类法的使用,在这个学期,我们将学习主题法的使用。,计算机与信息科学学院,第1章 主题法概述,基本概念 主题法 词汇控制 叙词语言,计算机与信息科学学院,基本概念,1.什么是主题法?,狭义:主题检索

2、语言,是经过规范的自然语言语词表达文献信息内容属性的人工语言。,广义:包括主题检索意义,同时用主题检索语言表达文献信息的内容属性,组织检索系统、检索工具,以提供主题检索途径的方法,也就是用主题检索语言进行标引的方法。,计算机与信息科学学院,2.文献信息标引,是指分析文献信息的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献信息检索标志的过程。,计算机与信息科学学院,3.主题标引,是指对文献信息进行主题分析,用主题检索语言表达分析出的主题,赋予文献信息主题检索标志的过程。,计算机与信息科学学院,4.主题,直接概括文献信息中有参考和检索价值的内容单元的概念,它重点指

3、向内容单元所论及的核心事物或论题。,计算机与信息科学学院,是用于描述、存储、查找文献信息主题的受控词汇,是主题检索语言的基本单元。,5.主题词,计算机与信息科学学院,是把主题词按一定方式组织与展示的词汇表。,6.主题词表,主题词表的作用体现在两个方面。从结构看,它按照信息检索查全、查准的要求,通过显示概念间的关系,去组织展示主题词,作为标引、存储和查检文献信息的依据。从功能看,它对所有主题词进行词形、词义、词间关系等方面的控制,从而在文献标引和检索之间搭起了一座桥梁,使二者有了共同的语言。,计算机与信息科学学院,主题法,也称主题检索语言,是以自然语言的语词为字符,以规范化或未经规范化的名词术语

4、为基本词汇,以概念之间的形式逻辑作为语法和构词法,用语词字顺排列,主题概念以参照系统显示概念之间关系的一类检索语言。 主题词表;主题整序法,计算机与信息科学学院,主题法概述,主题法类型 主题法特征 主题法作用 主题法理论基础 主题法与分类法,计算机与信息科学学院,主题法的类型,构成原理 依标识的组配特点 依学科、专业的划分范围 依所用自然语言语种数量 依使用前是否进行控制划分,计算机与信息科学学院,主题法的特征,以实物为中心集中文献信息 直接以自然语言的语词作为检索标识 以字顺作为排检的主要依据 用参照系统等方式揭示主题词之间的关系,计算机与信息科学学院,主题法的作用,揭示信息内容 建立信息检

5、索工具或检索系统,计算机与信息科学学院,主题语言的理论基础,主题语言的概念逻辑基础 术语学基础 知识分类基础 系统科学基础,计算机与信息科学学院,主题法与分类法,它们的共同之处主要是:两者都是为揭示文献信息内容;都需要对文献信息进行主题分析;一般都使用预先编制的专门语言工具;赋予的检索标志都是对文献信息主题概念的表达;,分类法与主题法之间的差异:表达主题概念的标识形式及特点不同;标识揭示文献信息内容、组织文献信息的角度不同;标引方法有所不同;作用不同。,计算机与信息科学学院,词汇控制,词汇控制的定义 词汇控制的原则 词汇控制的范围 句法控制,计算机与信息科学学院,1.什么是词汇控制?,所谓词汇

6、控制,就是一种把自然语言加工成信息检索语言的信息控制过程。它包括两个方面:一是对自然语言的语词进行压缩、优选和规范化处理;二是对自然语言进行结构化处理。,计算机与信息科学学院,2.词汇控制的原则,正确性 单义性 系统性 简明性 成族性 兼容性,计算机与信息科学学院,3.词汇控制的范围,词量控制 词类控制 词形控制 词义控制 词间关系控制 专指度控制 先组度控制 句法控制,计算机与信息科学学院,4.句法控制,所谓句法控制,就是根据主题标引和检索的需要,通过一定的组词造句的规则,对主题词的组合方式做出规定。,主题词通过组配方式表达文献主题的形成的词语组合,称为检索语句。检索语句中主题词之间形成的关

7、系,称为句法关系。,计算机与信息科学学院,句法控制,意义 引用次序 控制符号 句式轮排,计算机与信息科学学院,(1)句法控制的意义,在主题法中进行严格的句法控制,是正确、一致地标引和检索文献信息的需要。,计算机与信息科学学院,(2)引用次序,引用次序也称为组配次序,是指对复合主题进行标引和检索时,各个主题因素的组合或排列的次序。,计算机与信息科学学院,显著性引用次序,显著性引用次序是根据主题概念对用户心理映象的显著程度确定的次序。,克特:将更加显著的语词放在最前面 凯赛:实体过程 柯茨:事物部件材料活动施动者,计算机与信息科学学院,范畴职能引用次序,范畴职能引用次序是指将各种主题概念划分为范畴

8、,并按范畴的性质、职能确定组配顺序。,阮岗那赞:范畴分面公式(PMEST) 本体物质动力空间时间(具体性递减的原则),维克利:标准引用次序(从理论原则和范畴设置两个方面对阮岗那赞引用次序进行改进) 物质(产品)种类部分成分性质过程操作施动者或工具(目的性原则),计算机与信息科学学院,上下文从属引用次序,上下文从属引用次序是一种接近自然语言句法手段和语序的引用次序。这一引用次序是随着索引编制自动化的发展逐步建立的。,上下文从属原则,也称为语境原则,是根据复合主题中各个主题因素的关系,按从宽到窄的次序予以排列。 为了保证主题标引结果能正确显示上下文从属原则,奥斯汀精心设计了一个职能号表。,计算机与

9、信息科学学院,中文引用次序,刘湘生提出的主题分面组配公式: 主体因素通用因素位置因素时间因素文献类型因素 主体因素(对象方面方法结果条件),张琪玉对主题构成及其层次的分析研究(见图1),计算机与信息科学学院,控制符号,控制符号,是主题语言根据句法控制需要设计的一整套辅助符号。它是主题语言揭示主题词之间关系意义,进行有效检索的重要句法手段。,计算机与信息科学学院,联系符号,联系符号也称为联号,是一种用以揭示同一文献中不同主题概念之间联系强度的专用符号。它是后组式检索系统中用于防止主题词之间错误组配的重要句法手段。,联系符号主要用于揭示多主题文献中同一主题不同语词之间的联系。单主题文献一般不使用联

10、号。 联号的作用主要用于揭示主题词之间的联系强度,和不同主题间的联结性质上的差异。,计算机与信息科学学院,职能符号,职能符号也称职号,是一种表示主题词在组配中的句法职能的辅助符号。,使用职能符号一般应根据主题语言的组配特点和需要,预先确定相应句法范畴和职能号表。除了使用辅助符号作职号外,主题语言也可以用副标题代替职号。,职号较多使用于一些特殊的学科领域,如化学、核工业、医学等专业部门。,计算机与信息科学学院,加权是按照主题词在一文献或检索程序中的重要性,采用赋予一定权值的方式来确定其标引或检索价值的方法,是一种可以在充分揭示文献主题的同时,剔除那些与文献中心主题关系不大、论述较为肤浅的资料的造

11、句手段。,加权,计算机与信息科学学院,加权标引:是根据各个主题因素在文献中的重要程度,在标主题词的同时赋予相应权值。 加权标引通常应预先规定取值方法。,加权检索:是指在加权标引的基础上,结合主题词的权值进行查找。 加全检索还可以通过权值计算,使用阈值的策略进行查找。,加权,加权作为一种句法手段,更适应于机检。,计算机与信息科学学院,(4)句式轮换轮排,所谓轮排,是将检索语句中每一个有检索意义的语词轮流在排检位置上出现,并对其他主题词作出相应编辑处理的方法。,采用句式轮换,可以通过对语词位置的调换,使每一个具有检索意义的语词都有机会成为检索入口,从而可以从不同角度检出该内容的全部文献。,计算机与

12、信息科学学院,轮排技术主要用在计算机辅助编制的索引之中。,(4)句式轮换轮排,主题词轮排方法:简单轮排;词对轮排;转动轮排;结构轮排。,计算机与信息科学学院,叙词语言,叙词语言是一种较新型的主题标引语言,他综合了在其之前产生和发展的各种标引语言的优点,能较好的适应自动化检索系统和检索方法的需要,已经成为当代主要的标引语言,在信息组织和检索中发挥着重要作用。,计算机与信息科学学院,叙词语言,概念 叙词语言原理的综合性 叙词语言的词汇控制 叙词表的结构 叙词表的编制、管理和评价,计算机与信息科学学院,叙词语言:概念,叙词语言的概念:是以从自然语言中精选出来的,经过严格处理的语词作为文献主题标识,通

13、过概念组配方式表达文献主题的主题法类型。 叙词:亦称主题词,是指经过规范化处理的,以基本概念为基础的表达文献主题的词或词组。 (注:元词是字面上不能再分的语词。),计算机与信息科学学院,叙词语言原理的综合性,叙词语言对单元词语言的扬弃 叙词语言对其他标引语言原理方法的吸收 概念组配是叙词语言最基本的原理 叙词语言的特点,计算机与信息科学学院,1.叙词语言对单元词语言的扬弃,叙词语言继承了单元词语言的语词标识后组方式。但是抛弃了单元词语言的字面组配原则,采用了概念组配原理。,单元词语言开创了标引语言使用的标识单元方式,并同时适用于手工检索系统和机械检索系统。叙词语言以此为基础,发展成为,即适用于

14、标识单元方式(倒排档),又适用于文献单元方式(顺排档);既特别适合于计算机检索系统,又能用于手工检索系统。,计算机与信息科学学院,1.叙词语言对单元词语言的扬弃,单元词语言较早采用了防止语词标识后组产生歧义的句法控制符号(联系符号和职能符号)。叙词语言在必要的时候,以适当的方式采用了这种方法及其原理,降低了使用上的复杂性。,计算机与信息科学学院,2.叙词语言对其他标引语言原理方法的吸收,采用了分面组配分类语言的概念组配来取代单元词语言的字面组配;,适当采用标题语言的预先组配,选用必要的词组,放弃单元词语言的标识单元性原则;,计算机与信息科学学院,2.叙词语言对其他标引语言原理方法的吸收,采用标

15、题语言和单元词语言对语词实行严格控制的方法,以保证概念表达的唯一性。,采用并进一步完善了标题语言的参照系统;,计算机与信息科学学院,2.叙词语言对其他标引语言原理方法的吸收,采用等级列举式分类语言的原理编制叙词分类索引(范畴索引)和等级索引(词族索引),甚至直接引入等级列举式分类表或分面分类表,实现分类主题一体化;,采用关键词语言的轮排方法,编制叙词轮排索引。,计算机与信息科学学院,3.概念组配是叙词语言最基本的原理,概念组配与字面组配的区别 叙词的概念组配类型 叙词组配的作用,计算机与信息科学学院,(1)概念组配与字面组配的区别,概念组配与字面组配对词汇单位的要求不同;(字面组配强调的是词汇

16、的单元性;概念组配要求词汇单位既能单独表达概念,又能组配表达概念,而且表达的概念应该一致) 概念组配与字面组配的本质不同;(概念组配在概念分析的基础上进行;字面组配利用构词法进行词的分拆与组合),计算机与信息科学学院,(2)叙词的概念组配类型,交叉组配 使用两个或多个具有交叉关系的同性质叙词相互限定的组配。交叉组配所产生的概念肯定是各个参加组配概念的种概念。 例:教育心理学既是教学的种概念,又是心理学的种概念。,计算机与信息科学学院,方面组配(限定组配),是指将表示某一事物的叙词与表示事物方面(部分、属性、状态、过程、条件等方面)的叙词进行组配。,参与组配的词不是同性质的词,它们所表达的概念,

17、在外延上并不相交。但是,它们所代表的文献信息及其内容集合却又交叉部分。 方面组配产生的新概念也是一个专指概念,或称下位概念。但是,它只是其中一个参与组配概念的种概念,与参与组配的另一个概念的关系则是方面与事物、部分与整体、过程与主体等关系种的一种。 例:汽车和发动机组配表达汽车发动机,汽车与操纵稳定性组配表达汽车操纵稳定性。,计算机与信息科学学院,联结组配,这种组配表示两个或多个概念之间或表示两个或多个事物之间的联系,并不形成新的概念。 它往往是表达不同事物的叙词之间用表示它们之间关系的叙词联结起来。 例:用“图书馆学-关系-情报学”组配表达“图书馆学与情报学的关系”;用“粤语-比较-普通话”

18、组配表达“广东话与普通话的异同”。,计算机与信息科学学院,广义的特称组配是指将事物类称缩小为事物特称的组配,或者说是将属概念为种概念的组配。 狭义的特称组配不包括交叉组配,它类似于概念逻辑中的“属种加差”定义方法,用一个表示属概念(事物类称)的叙词与表达“种差”(即待标引种概念比参与组配的那个属概念多出某种特征)的叙词进行组配。 例:用“平面磨床”与“卧式”组配表达“卧式平面磨床”;用“齿轮”与“不锈钢”组配表达“不锈钢齿轮”。,特称组配,计算机与信息科学学院,概念概括,同级词相加或并列。组配结果可形成一个新概念,它是原来用以组配的两个或两个以上概念的属概念。 这种组配用于表达已紧密结合在一起

19、当作一个泛指概念使用的并列概念,而这些并列概念在词表中又没有可以恰好概括它们的上位词。在叙词法中,实际上等于使用两个或三个词分别标引,在检索时用两个或三个词联合检索。,从概念逻辑上看,是一种概念概括。 例:文学理论+艺术理论文艺理论 中学+小学中小学 广播+电视+文化事业广播电视事业,计算机与信息科学学院,(3)叙词组配的作用,减少标引所需词汇量,缩小词表篇幅,以有限的词汇表达众多的主题概念。,能够完整、细致的表达各种主题概念,保证标识表达主题概念的专指性。,方便自由的扩大或缩小检索范围;,提供多途径检索;,比较及时的反映新出现的主题概念。,计算机与信息科学学院,4.叙词语言的特点,概念组配;

20、 完善的参照系统; 灵活的的叙词组配; 提供检索同一课题的多条途径; 能同时适用于标识单元方式和文献单元方式的检索系统。,计算机与信息科学学院,叙词语言的词汇控制,词类控制和词组控制,词形和词义控制,词间关系控制,计算机与信息科学学院,叙词表的结构,宏观结构 字顺表的微观结构 各辅助部分的微观结构,计算机与信息科学学院,1.叙词表的宏观结构,(1)叙词表的一般宏观结构,计算机与信息科学学院,(2)汉表的宏观结构,第一卷 社会科学 第一分册 字顺表(主表) 第二分册 索引(包括词族索引、范畴索引和英汉对照索引) 第二卷 自然科学 第一至四分册(增订本改为第一至二分册)字顺表(主表) 第五分册(增订本改为第三分册)词族索引 第六分册(增订本改为第三分册)范畴索引 第七分册(增订本改为第四分册)英汉对照索引,计算机与信息科学学院,(2)汉表的宏观结构,第三卷 附表 包括:附表一 世界各国政区名称 附表二 自然地理区划名称 附表三 组织机构 附表四 人物 附表一、二、三、四的英汉对照索引,计算机与信息科学学院,2.字顺表的微观结构,(1)正式叙词款目的著录项目及其著录格式举例,正式叙词款目著录项目包括:款目叙词项、标注项、参照项、注释项,计算机与信息科学学院,计算机与信息科学学院,计算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论