版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 文献信息组织1文献检索的基本原理2文献检索语言3文献信息组织法 1文献检索的基本原理1.文献替代1)定义:对原始文献的外表特征和内容特征进 行描述的过程。2)著录:将原始文献制成它的替代文献 二次 文献,著录必须客观准确地反映原文的特征, 项目简洁,醒目易辨。 1983年,我国颁布检索期刊条目著录格式(GB379383)文献的特征:外表特征:可以在文献的封面或扉页,即不打开书本,或不看文献的具体内容就可以确定一篇文献。如题目、作者、出处、作者工作单位、专利号、报告号。 内容特征:深入文献内容中间获得的特征,如分类号、主题词、摘要等。 模糊对应外表特征内容特征精确对应文 献环境科学文摘著
2、录格式:中国药学文摘著录格式:中国专利文献著录格式:2.文献整序1)定义:对替代文献进行标引,给出文献标识,将所有替代文献按其标识进行有规律的组织排列并编制出各种类型的索引的过程。2)分类:形式整序 内容整序3.文献特征标识与检索提问标识的匹配 标引员对文献的表达检索者对文献需要的表达文献检索匹配实现检索语言2 文献检索语言1.定义:是根据信息检索的需要编制的,供标引文献和检索文献用的一种人工语言,是标引者和检索者共同约定使用的语言。2.特点: 1)表达的概念具有单义行和唯一性 2)可使内容相同和相关的文献集中,使大量分散的文献存储系统化、组织化,便于进行有规律的检索。文献检索语言3.分类表3
3、 文献信息组织法1.体系分类法2.主题法3.分类法与主题法的比较1.体系分类法1)构成原理:把具有某种或某些共同属性的事物集合,划分为一类,用概括该类事物所共有的本质属性的概念作为类目,并给出相应的标记符号作为类号,在一类事物中,每一事物除了具有与同类其他事物共同的属性外,还有许多与同类事物不同的属性。用这些不同属性的一种作为标准划分该类事物,会得到若干个下位类,再分别给出每个下位类的类号,各下位类又可按事物的另外一种属性为标准进行细分,以此类推。 分类法语言使用分类号来标识类目,分类号可反映类目在分类体系中的位置和排列次序。2)种类: 中图法 杜威十进分类法国际十进分类法 中图法体系结构基本
4、大类 简表详表复分表杜威十进分类法 (Dewey Decimal Classification and Relative lndex)简称DC或DDC或杜威法,又名十进制图书分类法,是美国图书馆学家麦威尔杜威(Melvil Dewey)所创制的,初版于1876年,1971年已出第18版。这是一部在国际上出现最早、流行最广、影响最大的图书分类法。采用十进制的等级分类体系,即把所有学科分成9大类,分别标以100900的数字。9大类表示9个专门的主题范畴,各类中的类目均按照从一般到特殊,从总论到具体的组织原则,对不能归人任何一类的综合性资料入第10类,即总论类,以下依次逐级分类,形成一个层层展开的等
5、级体系。从18版起,该分类法采用了一些分面综合手段,增强组配性能。 杜威十进分类法体系结构000 Generalities100 Philosophy and related disciplines200 Religion300 Social sciences400 Language500 Pure sciences600 Technology(Applied sciences)700The arts800 Literature(belles-lettres)900 General geography and history 国际十进分类法(Universal Decimal Classifi
6、cation)简称UDC。由比利时学者鲍威尔奥特勒(Paul Otlet)和亨利拉芳(Henri La)在DDC的基础上补充而成,初版于1905年,现已出第3版。它是一种半组配式的体系分类法,现已有3种文本,从20世纪60年代末期起被称为世界图书信息的国际交流语言。该分类法由主表、辅助表及辅助符号3大部分组成。主表把知识分为10大门类、大类划分沿用了杜威法的基本大类结构。全表有近20万个类目,是世界上现有各种分类法中类目设置最多的一部,科技部分设类尤为详尽。 国际十进分类法体系结构0 总类1 哲学2 宗教、科学3 社会科学、经济、法律、行政4 (语言学)(该类1963年已并入第8类,现为空类)
7、5 数学、自然科学6 应用数学、医学、工业、农业7 艺术8 语言学、文学9 地理、传记、历史1.体系分类法3)特点:优点:体现了学科的系统性,便于从学科和专业的角度出发进行族性检索缺点:缺乏进行多概念灵活组配的能力;无法反映新学科和新技术的内容;不能全面检索有关跨学科专业的某一事物的所有文献。2.主题法:1)定义:以自然语言中的词语或规范化的词语作为揭示文献主题的标识,并以此标识编排组织和查找文献的排检方法。主题词:表达主题概念的词语,优选出的词语必须词义明确,避免其多义性,并受特定的词表控制。2)分类:a标题词法、b单元词法、c关键词法 d叙词法 a标题词法:a1定义:以标题词(规范的事物名
8、称、名词术语)作为文献主题内容的标识和检索标识的先组式主题法。 规范化处理:同义词(计算机和电脑)、近义词(实验与试验)、词形(汉字的简体、繁体、异体)、词组的组合方式(正叙、倒叙、并列)、用注释方式对标题词的内涵进行限制的规范a2标题词表:工程标题词表(SHE) 工程标题词表(SHE) INFORMATION SCIENCE 903 (Before 01/86,use code 901) Abstracting (Beginning01/81) Indexing (Apply code 723 if computerized) (723) Information Dissemination
9、See INFORMATION DISSEMINATION Information Retrieval (For systems, see INFORMATION RETRIEVAL SYSTEMS) Information Use Language Translation and Linguistics (723) (Apply code 723 if computerized. See also TRANSLATING MACHINES) 说明:主标题词;注释项,说明词的使用范围、用法及含义;副标题词;见项,指向规范化的标题词;参见项,指向相关的标题词;分类号(用于计算机检索)。 a标题词
10、法a3特点:优点:使检索具有直接性与直观性;适合于从事物出发按专题进行特性检索缺点:缺乏按学科进行族性检索的能力;缺乏表述专指度较高的复杂概念的能力;缺乏多途径检索和自由扩检的能力。b单元词法b1定义:以单元词作为文献主题内容的标识和检索标识的后组式主题法。b2单元词表:专利工具中的WPI规范化主题词表单元词从文献内容中抽出,再经规范,能表达一个独立的概念。是最基本的、不能再分的词汇,比如“计算机软件”不是单元词,而“计算机”和“软件”才是单元词。 b单元词法b3特点:优点:强调词汇的单元化和后期组配,因此提高了主题法的灵活性;缺点:由于它过分强调词汇单元化,词汇处理方法又不甚合理,易发生错误
11、组配,误检率较高,故实用性不是很好。C关键词法C1定义:以关键词作为文献主题内容的标识和检索标识的主题法。 关键词:直接从文献题名、文摘或全文中抽取出来的有实际检索意义的信息单元(关键词)。关键词是非规范的,无需查阅标准词表,或者只编制一个“禁用词表”,它收录为数不多的禁用词,如助词、连词、介词、冠词以及一些通用概念的词。 C关键词法C2特点:优点:关键词法不受词表控制,快捷简便,适于用计算机组织和检索文献信息;缺点:由于关键词法的词语不规范,影响了文献信息的查全率和查准率。d叙词法d1定义:以叙词做主题词的后组式主题法 d2叙词表:汉语主题词表 叙词:是一种以概念为基础的,经过优选的规范化名
12、词术语,具有单义性,组配性能好的特性。 组配的形式1)概念相交:即内涵不同、外延部分重合的两个相同性质概念之间的组配。组配的结果产生一个新概念,这个概念分别属于这两个概念的下位概念。2)概念限定:即两个不同性质概念之间的组配,其中一个概念反映了另一概念的某一方面、某一特征或时空中的某一部分。限定的结果也产生一个新概念,它表示该事物的某一方面或某一特征。3)概念概括:即两个或两个以上的同级概念相加或并列,组配结果形成一个新概念,作为原来概念的属概念。4)概念联结:这种组配表示几个概念之间的联系,并不形成新的概念。 例如:档案学+图书馆学一档案学与图书馆学的关系。组配的条件1)当组配表达会产生意义
13、失真时,不用组配表达。例如,用“蘑菇”和“战术”两个词来组配表达“蘑菇战术”这个概念,“蘑菇”一词在检索时独立使用会产生误检,所以应直接采用专指性词组,即在叙词表中设置“蘑菇战术”这一叙词。2)某些专业词汇和专有名词不必用组配,可直接采用专指性词组。如“收录两用机”。3)当组配表达不可能得到组配长处时,就采用专指性词组。例如,“文化水平” 一词就不必分拆成文化+水平。因为“水平”一词并没有检索意义,不会成为一条检索途径。 组配的作用 1) 控制词量。组配可以起到控制词表体积的作用。只要选择了基本的词汇,通过组配,就可以用少量的词表达和描述尽可能多的概念。组配实际上遵循了数字排列组合的原理和方法
14、。2)扩大检索途径。在组配中,每一个词及其组合都可以作为检索人口参加排序,所以可以扩大检索途径。如查找教育心理学方面的文献,可有三个人口,教育学、心理学及教育+心理学,即提供了三条检索途径。3)可以自由扩大、缩小或改变检索范围。在标引时,可用许多个词来标识一篇文献,因而可以达到很高的专指度和标引深度。在检索时,可根据检索中出现的具体情况,随时增减叙词,以扩大、缩小或改变检索范围,直到满足检索要求为止。汉语主题词表 词目一: 正式叙词与非正式叙词款目结构 shou fa kai guan guan 收发开关管 56CD 范畴号 Transmit receive tubes D 放电器 收发管 F
15、 放电管 宽频带开关管 窄频带开关管 S 充气管 Z 电子管*族首词符号 C 反收发开关管 词目二: shou fa guan 收发管 56CD Transmitreceive tubes Y 收发开关管 汉语主题词表的结构:主表:全部叙词+部分非叙词注释范畴号参照系统附表:从主表中分离出来的专用叙词表,包括世界各国政区名称、自然地理区划名称、组织机构、人物名称 汉语主题词表词目三:Gao Wen fa 高温阀(温度4500C)含义注释词目四:Fen xi(hua xue) 分析(化学)*使用范围注释 Analysis(chemical) F 半微量分析参照系统: 汉语主题词表辅助表: 词族索
16、引:等级索引,利用概念成族原理 范畴索引:分类索引,采用三级分类制体系,数字与字母混合的号码标记制度,把主表中全部叙词按学科分类排列 英汉对照索引:按英文名称字母顺序排列,提供从英文名查找叙词的检索途径。 词族索引款目结构: chu deng shu xue 初等数学 * 初等代数 初等几何 立体几何 平面几何 三角 球面三角 算术范畴索引款目结构:45 生物科学 45R 人类学 45RA 古人类学 阿特拉猿人 Y 毛里坦直立人 北京猿人 Y 北京直立人 北京直立人英汉对照索引款目结构: Air drag 空气阻力 Y 大气阻力 Air drilling 空气钻进 Air drills 风钻
17、d叙词法d3 特点:网罗性高:能形成概念网罗性高的检索标识,概括主题所涉及的各个方面,提高查全率;专指度高:能形成专指度高的检索标识,表达主题所包含的复杂概念,提高查准率;能形成若干检索标识,可进行多途径检索;完善的参照系统,可帮助选准叙词,并可进行扩检和缩检。主题语言按字顺排列,其参照系统反映的是直接上下级关系,所以无法从整体上揭示某一词族的关系,因而它所反映的族性关系不如在体系分类法中表现的充分。 3.分类法与主题法的比较:1)相同点: 都是文献信息单位广泛使用的文献信息整序法 ; 揭示和检索的对象都是各种类型的文献资料; 都是从文献资料的内容途径进行揭示和检索;2)不同点:揭示对象方面使
18、用标识方面排列方式方面用途方面a揭示对象方面:分类法揭示的是文献内容的学科属性,处理和检索文献都必须对文献内容的学科属性作出判断;主题法揭示文献论述的具体事物或主题概念,一般不涉及学科类别的判断。b 使用标识方面:分类法则以抽象化的类目代号分类号作为文献内容标识和检索标识,比较简洁,但也较费解。主题法直接用词语表示文献主题,即用事物名称或概念词语做描述文献主题的标识和检索标识,直观易懂。 C 排列方式方面:分类法按分类号(学科或专业门类的代号)排列,系统性较强,但不熟悉有关分类表则难以有效地利用它;主题法按词语字顺排列,如同词典,易学易查。 d用途方面: 分类法比较适合于图书或文集的组织和检索
19、,既可用于编制分类目录和分类索引,还可用于文摘编排、文献报道、藏书排架与统计,提供的是从学科或专业角度查找文献信息的途径,族性检索功能强;主题法较适合于期刊论文、研究报告、会议论文等单篇文献的组织和检索,且更适于计算机组织和检索,主要适用于编制主题索引和主题目录,提供了从具体事物入手查找文献信息的途径,专指性强。9、静夜四无邻,荒居旧业贫。9月-229月-22Sunday, September 4, 202210、雨中黄叶树,灯下白头人。20:36:3120:36:3120:369/4/2022 8:36:31 PM11、以我独沈久,愧君相见频。9月-2220:36:3120:36Sep-22
20、04-Sep-2212、故人江海别,几度隔山川。20:36:3120:36:3120:36Sunday, September 4, 202213、乍见翻疑梦,相悲各问年。9月-229月-2220:36:3120:36:31September 4, 202214、他乡生白发,旧国见青山。04 九月 20228:36:31 下午20:36:319月-2215、比不了得就不比,得不到的就不要。九月 228:36 下午9月-2220:36September 4, 202216、行动出成果,工作出财富。2022/9/4 20:36:3120:36:3104 September 202217、做前,能够环
21、视四周;做时,你只能或者最好沿着以脚为起点的射线向前。8:36:31 下午8:36 下午20:36:319月-229、没有失败,只有暂时停止成功!。9月-229月-22Sunday, September 4, 202210、很多事情努力了未必有结果,但是不努力却什么改变也没有。20:36:3120:36:3120:369/4/2022 8:36:31 PM11、成功就是日复一日那一点点小小努力的积累。9月-2220:36:3120:36Sep-2204-Sep-2212、世间成事,不求其绝对圆满,留一份不足,可得无限完美。20:36:3120:36:3120:36Sunday, September 4, 202213、不知香积寺,数里入云峰。9月-229月-2220:36:3120:36:31September 4, 202214、意志坚强的人能把世界放在手中像泥块一样任意揉捏。04 九月 20228:36:31 下午20:36:319月-2215、楚塞三湘接,荆门九派通。九月 228:36 下午9月-2220:36September 4, 202216、少年十五二十时,步行夺得胡马骑。2022/9/4 20:36:3120:36:3104 September 202217、空山新雨后,天气晚来秋。8:36:31
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外研八下英语Unit 5 Presenting ideas-Reflection《单元写作》课件
- 2025 高中信息技术数据结构在社交电商用户关系网络数据处理中的应用课件
- 2026年水管改造维修合同(1篇)
- 2026年酒店厨房承包合同(1篇)
- 斜坡码头施工技术的设计原理和施工方法
- 2026届浙江宁波十校高三下学期二模政治试题+答案
- 班主任带班育人 方略课件
- 2025 高中信息技术数据与计算之数据在互联网金融市场情绪分析中的应用课件
- 2025 高中信息技术数据与计算之数据仓库的 ETL 数据调度与任务管理课件
- 2026年海洋石油201 291等专业化深水船舶作业能力
- 2026年安徽卫生健康职业学院单招职业倾向性考试题库及答案详解(考点梳理)
- 护理教师角色与职责
- 2026年宁夏石嘴山市单招职业适应性考试题库附答案详解(能力提升)
- 雨课堂学堂在线学堂云《国际多式联运(浙江万里学院)》单元测试考核答案
- 新教材八下语文寒假必背古诗文+文言文(拼音+停顿+译文)
- 2026森岳科技(贵州)有限公司招聘工作人员29人考试参考试题及答案解析
- 2025年徐州地铁招聘笔试题题库及答案
- 2025年浙江省金华市兰溪市事业单位考试题及答案解析
- 歌舞娱乐场所卫生制度
- 南粤家政培训课件
- 2025-2030细胞治疗产品商业化生产质量控制体系建设指南
评论
0/150
提交评论