



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、信息主题类型分析的要领 及汉语主题检索标识构成公式的扩展 顾潇华 一、信息标引时主题类型判断1、主题类型的判断是分类标引和主题标引工作的重要基础判断主题类型是做信息标引工作时主题分析的第一步。因此,也等于是整个信息标引工作得第一步。 因为,无论分类标引还是主题标引都要做主题分析。主题分析时,首先要判断主题类型,然后才能做接 下来的其他各个主题分析环节或全部信息标引各环节的工作。所以,主题类型的判断是分类标引和主题 标引工作的重要基础。2、信息主题的类型1)按信息主题数量分:单主题:信息内容只涉及一个中心对象或问题,如:钢;还可以是只涉 及一个中心对象或问题但带有其他因素,女口:钢的抗拉性,钢是
2、中心问题,抗拉性是其他因素。多 主题:文本信息涉及两个或多个事物对象和问题,如:摄影与空中摄影,摄影、空中摄影都是中心对象 或问题。2)按信息主题中主题概念的数量及关系分:单元主题:只有一个中心对象作为主题概念,如: 普通生物学。复合主题:有两个以上主题概念,即:除了中心问题还有其他概念,如钢的抗拉性。 联结型主题:一般有两个中心对象或问题并被一个联结词连接,如:激光在医学中的应用,激光、医学 是中心对象,“应用”是起联结作用的联结词。3)前两种划分方法的联系:单主题包括:单元主题(钢)和复合主题(概念交叉型、概念限定 型、概念联结型);多主题包括:并列多主题(河流与湖泊)和从属多主题(摄影和
3、空中摄影);4)复合主题类型:概念交叉型:如喷气式垂直起落飞机,是由喷气式飞机和垂直起落飞机这两 个概念(两个中心问题)交叉组成;概念限定型:如汽车车身,汽车这一中心问题被车身这一其他因 素限定;概念联结型:如;激光在医学中的应用,激光、医学是中心因素,被应用这一联结词联结。另外还有一些主题类型的划分角度,如按信息内容被表达程度划分的,按专业角度划分的等等。但 上述基础主题类型是关键方面。所以本文仅探讨所列出的主题类型的判断要领3、判断主题类型要领的具体实施步骤当拿到被分析的文本,无论是纸质文献信息,还是其他载体形式的信息,信息标引时判断主题类型 要采用排除法一步一步进行。首先,判断被标引对象
4、是单主题还是多主题,如果有两个研究的中心问题 的概念,要看在表达信息内容的题名或语句中有无联结词,如:“作用”、“影响、”“应用”、“关系”等 字样,有这些字样的信息,其主题类型一般为概念联结型复合主题,就可以依照概念联结型复合主题的 要求做分类标引和主题标引的后续工作;如果没有上述联结词字样,说明不是概念联结型复合主题,这 时可以判断文本是多主题,就可以依照多主题的要求做分类标引和主题标引的后续工作;如果不是多主 题,在单主题的情况下还需要判断是单元主题还是复合主题,如果是单元主题,就可以依照单元主题的 要求做分类标引和主题标引后续工作;如果不是单元主题,在复合主题的情况下“优先考虑是否为概
5、念 交叉型复合主题”,如果是概念交叉型复合主题,就可以依照概念交叉型复合主题的要求做分类标引和 主题标引的后续工作;如果不是概念交叉型复合主题,才能判断信息的主题类型为概念限定型复合主题, 然后依照概念限定型复合主题的要求做分类标引和主题标引后续的工作。的确,需记录在检索数据库或 说检索工具中的信息大多是概念限定型复合主题的信息,但此要领的关键就是要在排除了其他所有主题 类型后,才能判断信息为概念限定型复合主题,而不能拿到被标引的文本就认为信息的主题类型是概念 限定型的复合主题,这种排除法就是保证准确判断主题类型的要领。 二、对汉语主题检索标识因素构成和词串序列扩展探讨的意义尽管现在信息组织领
6、域研究大多围绕汉语分词、自动标引、语义网和本体等等新问题进行,信息主 题的因素及检索标识词序等问题看上去已成熟,没什么可研究的。但是,由于绝大多数国内外图书馆仍 然使用 MARC 描述信息,其中的 6 主题功能模块各字段的形成离不开主题因素及词串序列的应用。 另外,在版编目也需提供依据主题因素构成和词序规则来形成其主题检索标识项目。还有,除搜索引擎 这种检索数据库的形成其各个环节是自动化的外,就是中国学术期刊网等等检索数据库也是需要人工处 理一些检索标识。所以,应在已有的概念限定型复合主题的因素构成和词串序列的基础上扩展出其他主 题类型的因素构成和词串序列。这种扩展,对分类标引工作有部分作用,
7、对主题标引实际工作和信息管 理类专业的信息组织课程及图情档工作业务培训的教学十分有益。概念限定型复合主题的因素构成及词串序列是所有信息组织的资料或教材都介绍的,即:主题构成 的因素及其序列可分为主体因素(研究对象,即:中心对象或问题、材料、方法、过程、条件等)、通 用因素、位置因素、时间因素、文献类型因素等五种。一般来说,主题因素最全的一条信息也就由这五 种因素构成。须强调的是,共同表达一条信息主题的每个主题词语必定属于其中的某个因素,各个因素 分别表示属于该因素的主题词语在主题标识词串中的职能,而主题词串中的各个主题都必须按照五个因 素或范畴面的规定词序排列,形成一种主题词串的序列公式:A(
8、A1A2A3A4A5)BCDE式中:A为主体因素(Al表示研究对象,A2表示材料,A3表示方法,A4表示过程,A5表示条 件);B表示通用因素;C表示位置因素,D表示时间因素;E表示文献类型因素。假如有一条信息的题目为:二十世纪中国财政学学科发展论文集,其主体因素是财政学、通用因素 是学科发展、位置因素是中国、时间因素是二十世纪、文献类型因素是论文集。该题的主题标识结果则 是:财政学学科发展中国二十世纪论文集。主体因素是信息内容涉及的研究对象,其他因素是 对研究对象的限定,该题的研究对象是财政学、但不讨论财政学的全部范围,只研究财政学的学科发展, 还只是中国的财政学,不是现在、不是未来、只是刚
9、刚过去的二十世纪的,不是期刊,不是报纸,只是 论文集。所谓限定就是指限定了研究对象的范围。此题包括的主题因素是最全的、五个因素都具备的一 个限定型复合主题举例,但有些信息内容可能没有一些因素或范畴面,比如:河北档案,主体因素是档 案,位置因素是河北,即只研究河北的档案问题,其他档案问题不是此“河北档案”课题涉及的范围, 而且该题没有通用因素、时间因素和文献类型因素。概念限定型复合主题的因素和词串序列已众所周知,但还有其他主题类型的信息。其他主题类型也 应该有其因素构成和词串序列形式。但是到目前为止,无论主题标引实际工作还是信息组织的教学工作, 没有明确规定其他类型的因素构成和词串序列公式。一般
10、认为仿照概念限定型复合主题的因素和词串序 列规定自行处理即可。本文认为,明确指出或拓展出其他主题类型的因素构成和词串序列是十分必要的, 可借此解决主题标引结果的不规范性和不确定性,因此具有较高的现实意义。 三、主题构成因素和词串序列的扩展1、多主题的因素构成和词串序列公式:多主题是指信息主题的主体因素有两个以上,即有两个以上的研究对象,如“图书馆学情报学与档 案学”,该题有三个研究对象,即三个主体因素,一个是“图书馆学”,一个是“情报学”,第三个是“档 案学”,该题没有其他因素。多主题信息的标引结果要求有几个主体因素就有几个主题检索标识结果, 一般形成两个以上主题检索标识,如“河流与湖泊”,其
11、主题检索标识结果是:1) 河流2) 湖泊从而可得出:多主题的因素由多个主体因素构成,其词串序列公式:1)A2) A (或更多的只有一个主体因素的检索标识,看课题涉及到几个研究对象)。另外,即便有其他因素,因其研究对象有两个以上,也属于多主题信息,如“西藏的河流与湖泊”, 西藏是位置性限定因素,西藏作为该题的限定因素。其主题检索标识结果:1) 河流西藏2) 湖泊西藏从而可以得出带有其他因素的多主题的词串序列公式:1)AB(AC 或 AD 或 AE)2)AB(AC 或 AD 或 AE)上述公式表明,多主题的主体因素可以被任何因素限定,并且有几个主体因素(研究对象)就有几 个带限定因素的多主题检索标
12、识结果。当然,每个词串公式也可以同时带有若干限定因素,比如:)A BD, 2)ABC。2、概念交叉型复合主题的因素构成和词串序列公式 概念交叉型复合主题的信息其研究对象一般是指研究对象是用几个概念交叉语词组合成的,这种情 况下有几个概念参与交叉就有几个主体因素,如“高钛合金钢”是由三个主题概念词交叉而成的,即: 高合金钢、钛钢、不锈钢。其标引结果为:高合金钢:钛钢:不锈钢若用词串序列公式中的A表示主体因素,概念交叉型复合主题的词串序列公式为:A: A: A(按规定,用“:”做各词之间的组配符号)。虽然说概念交叉型复合主题是由两个以上主体因素交叉构成,但有时带有其他因素,比如“超音速 轰炸机结构
13、设计”,其主题检索标识结果:超音速飞机:轰炸机结构设计。因此构成用两种符号组配 成的检索标识结果,其词串序列公式为:A: AB (通用因素参与限定)A; AC (空间因素参与限定)A; AD (时间因素参与限定)A; A一E。(文献类型因素参与限定) 当然,每个词串公式也可以同时带有若干限定因素,比如: A: ABC。3、单元主题的因素构成和词串序列公式单元主题实质上就是一条信息涉及某一事物所有的方面,研究对象就只有一个,而且内容涉及研究对象的所有方面,比如“普通语言学”,其研究对象就是普通语言学,构成因素也就只有一个,因涉及 其所有方面,所以就仅有主体因素没有其他任何限定的因素。那么,“普通
14、语言学”的标引结果为: 普通语言学从而可以得出单元主题的因素只由一个主体因素构成,其词串序列公式:A单元主题的标引结果非常简明单纯。4、概念联结型复合主题的因素构成和词串序列公式概念联结型复合主题一般涉及两个事物,因此也就有两个研究对象或说两个主体因素,并有一个起联结作用的通用因素语词(应用、影响、关系、作用等)联结,比如“激光在医学中的应用”、“森林对 气候的影响”、“图书馆学与情报学的关系”、“信息资源在企业战略决策中的作用”等等。这些题目的标 引结果分别为:激光应用医学森林影响气候图书馆学关系情报学 信息资源作用企业战略决策 概念联结型复合主题的两个事物都可作为主题检索标识结果的主标目,即:都可到词串序列中的第 一个词的位置作检索入口词,也就是常说的“轮排”。但是,轮排时要对联结词做相应的改动,如:信 息资源对企业战略决策的影响企业战略决策影响因素信息资源。若用词序公式中的A表示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电动汽车充电过程优化试题及答案
- 提升2025年注册土木工程师考试的效率试题及答案
- 建筑工地安全培训试题及答案
- 突破自我限制的土木工程师考试试题及答案
- 突破个人障碍的2025年商务英语考试试题及答案
- 建筑工人安全教育的多元化实施试题及答案
- 消防灭火器试题及答案
- 精神科护士试题及答案
- 大学物理解题技巧提升试题及答案
- 家具设计中的环境友好材料分析考题试题及答案
- hsk5-成语的主要内容
- 【浅谈温州万豪酒店餐饮食品安全管理的问题与措施(论文)11000字】
- 2022年中国石油大学《化工原理二》完整答案详解
- 形势与政策电气 个人答案
- PHOTOSHOP图形图像处理课程标准
- 国开电大《Java语言程序设计》形考任务三答案
- 2022年全国大学生英语竞赛C类试题
- 装饰、装修施工方案
- 远盛水工重力坝辅助设计系统用户使用手册
- 矿井瓦斯抽采
- 立法学完整版教学课件全套ppt教程
评论
0/150
提交评论