




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章 档案文献检索系统概述 1 广义的档案文献检索包括存储和查找两个具体过程。前者是指将档案中具有检索意义的特征标识出来,通过编制检索工具、建立数据库等方法使之成为有序的档案信息集合的过程;后者则是指在档案信息集合中选择、获取特定档案信息的过程。 2 简答档案文献检索的基本原理:是实现档案需求与相关档案信息的匹配,即将特定的档案需求与存储在检索系统中的档案信息进行相符性比较,根据一定标准从中选择出符合需求的档案信息。匹配的实现是存储和查找互相作用的结果。 3 存储阶段的目的是:使档案信息达到高度的组织化。主要采取对档案文献进行标识化压缩处理的方法,即把档案文献中具有检索意义的特征用语词、代码等符号表示出来,通过编目、编写提要等方式将档案原件转换成一种篇幅较短的特殊文献形式,一般成为简短记录档案文献特征的一个条目,并按照一定的规则把这些条目组织起来,形成有序的档案信息集合,供查找之用。 4 查找阶段的目的:是获取所需档案信息,主要方法是对档案需求课题进行标识化处理,形成检索提问,再将提问标识与档案信息集合中的标识进行相符性比较,选择出所需要的档案信息,也就是说,在存储的逆过程中把所需档案查找出来。(3、4题可合并一题) 5 档案文献检索同其他文献检索一样,可以采取三种形式: (1) 数据检索。这种检索是直接回答利用者所需要的有关特定主题的查询,检索出的结果是数据、公式、图表等。 (2) 事实检索。这种检索也是直接回答利用者所需特定主题的确定性检索,检索出的结果是某种事实。 (3) 文献检索。这种检索是要查出记载所需信息的档案文献,但检索结果所提供的并不是文献本身,而是文献线索,检索人员借助文献线索中提供的存址提取档案文献,再从文献中获得所需信息。 6 试述档案文献检索系统的构成与功能? 从检索系统的整体功能出发,去设计规划各个因素或环节的构成方式及其相互关系,可以使整个检索系统的功能得到改善,从而获得较好的检索效果。档案文献检索系统包括两大部分:存储部分和检索部分。存储部分的主要功能是通过著录标引、编制检索工具、建立数据库等手段使档案信息有序化;档案部分的主要功能是通过编制检索策略实现利用者提问与档案信息的有效匹配。 在存储档案时,档案标引人员首先要对档案文献的内容进行主题分析,形成若干能反映其主题的概念,并借助于检索语言把这些概念转换成规范化的检索标识,这一段工作就是档案的著录标引。 在检索(查找)档案文献时,档案检索人员首先要根据利用者的提问确定其所需档案的实质内容,形成概念,然后同样借助于检索语言,把表示检索课题的概念转换成规范化的检索标识,并按实际需求把这些标识之间的逻辑关系表达出来,形成检索表达式。 7 档案文献单元方式按照目录构成或计算机文档中数据排列方式的不同,可区分为文献单元方式和标识单元方式。 8 文献单元方式:在计算机检索中又称为顺检方式、顺序文档。它以一份文献为一个条目,指明该文献的各种特征,即以文献为单元进行检索。 9 标识单元方式:在计算机检索中又称为逆检方式、倒排文档。它以文献的一个属性标识为单元,指明含有该属性的全部文献,一般只有标识和文献号(档号)两个项目。 10 检索效率是指在检索过程中满足利用者的全面性和准确性程度,它是衡量检索系统性能的一个最基本的指标。检索效率通常采用查全率和查准率两个指标来衡量和表示。 11 查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。 12 查准率是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。 13 简答查全率和查准率的关系 查全率和查准率之间存在着互逆关系的结论。也就是说,如果放宽检索以达到较好的查全率,那么查准率就会下降;反之,若是限制检索范围以改善查准率,则查全率就会变坏。当进行范围宽泛的检索时,查全率很高,可以达到90%左右,而这时查准率则很低;相反,当检索范围小,很专指时,则查准率较高,查全率较低。 14 论述影响检索效率的因素: (1)检索语言的性能。检索语言是沟通档案文献存储和查找两个过程的桥梁,对于特定需求信息与纳入检索系统的信息集合的准确匹配具有直接的影响。 (2)检索途径的数量。从理论上说,档案在存入检索系统之后,该系统向利用者提供的检索途径愈多,它被查到的概率也就愈高。 (3)著录标引的质量。检索标识是组织检索工具、进行检索的依据,因此,检索标识的准确性也是影响查全率、查准率的一个重要因素。 (4)检索策略的优劣。档案著录标引的结果对于文献存储的质量至关重要,那么,检索策略在查找过程中则具有决定性的作用。 (5)检索人员的素质。不论是手工检索系统还是机械检索系统,都要由检索人员来参与和控制检索过程,上述因素中除检索语言之外,均与检索人员的素质有关,因此检索人员的素质对于检索效率有直接的影响。 15简档案文献检索系统评价的目的和作用 系统评价就是对系统的效率和价值进行测定,它是对系统进行科学管理的重要依据。主要目的是对系统整体及其组成要素的功能、特性和运营情况进行评测。 作用主要有三个方面: (1)明确系统当前的性能特征,从而科学地、最大限度地发挥系统的功能。 (2)发现系统现存的缺陷及其原因,提出改进意见或其他对策。 (3)为设计和建立新的档案文献检索系统提供参考。 16试述系统评价的指标体系:档案文献检索系统评价的指标主要包括数据覆盖率、检索效率、响应时间、可存取性、费用等。 (1)数据覆盖率又称为收录范围,指一个检索系统已收录数据量与应收录数据量的百分比,它反映该检索系统的资源拥有状况。 (2)查全率和查准率。二者实质上反映了系统运行结果与利用者检索要求的吻合程度,是衡量检索系统性能的最重要的指标。需要说明的是,在实际测评时根据公式计算出来的查全率和查准率常常不能完全准确地反映系统的实际检索效率,其主要原因是: 对文献相关性的判断不可避免地带有主观性和模糊性。 查全率是以检索系统中与某一检索要求相关的文献总数作为分母,计算检出的相关文献在全部相关文献中的比例,而检索人员和评价人员都难以确定这个总数是多少。 在计算查全率、查准率时,“相关文献”被同等看待,不作任何区分,而实际上,在一组相关文献中,每一份文献的相关程度是有差异的。 (3)响应时间。它是指一次检索过程中从利用者向检索系统提出问题到检索系统完成匹配过程,形成检索结果,交付利用者所需的全部时间。 (4)可存取性。是指一个档案文献检索系统的易用程度。 (5)费用。构造和维持一个档案文献检索系统需要投入一定的费用,利用者检索档案文献也要有一定的支出,这些投入包括货币和活劳动两种形式。 17简系统评价步骤 (1)制订评价方案。包括确定对该系统进行评价时采用哪些评价指标。 (2)评价对象调查。可根据评价对象以及评价指标的特点采用问卷调查、抽样调查等不同的方法。(3)测试。根据样本进行检索测试,然后对检索结果的相关性、响应时间、系统易用程度等进行判断。 (4)数据处理与分析。对调查测试的各种原始数据进行整理、计算,得出有关评价对象的各种性能指标。 (5)对评价结果进行分析,提出改进意见。 第二章 检索语言 1检索语言:是根据检索的需要而创制的人工语言,专门用于各种手工的和计算机化的文献信息检索系统,表达文献主题概念和检索课题概念。 2.简答检索语言的基本功能 主要有以下四个方面: 对文献的主题加以标引的功能; 对内容相同及相关的文献主题加以集中或揭示其相关性的功能; 对大量文献信息加以系统化或组织化; 便于将标引用语和检索用语进行相符性比较。 3.产生检索语言第一项基本功能的结构: (1)编码型标识结构。 (2)组配型标识结构。 (3)层次型结构标识。 4.产生检索语言第二项基本功能的结构: (1)等级结构 (2)参照系统结构 (3)轮排聚类结构。 5.按构成原理,可分为分类检索语言、主题检索语言和代码检索语言三大类型。 6.简答构成原理 (1)分类检索语言。其特点是用分类号来表达各种概念,把各种概念按知识分类进行系统组织和排列,有很好的系统性。 (2)主题检索语言。其特点是用取自自然语言的语词来表达各种概念,把各种概念完全按字顺排列而不管其相互关系如何,其标识有很好的直接性。 (3)代码检索语言。它一般只就事物的某一方面特征,用某种代码系统来加以标引和排列。 (4)引证关系追溯法。即引文索引法,是显示科学论文之间互相引证而形成的论文网的一种方法。 7.主题检索语言包括标题词语言(标题法)、单元词语言(单元词法)、叙词语言(叙词法)和关键词语言(关键词法),它们可统称为主题法系统。 8.简答先组式语言与后组式语言有何区别 先组式语言就是文献标识在编表时就已固定组配好,或绝大部分已固定组配好,如体系分类法和标题词法。后组式语言就是文献标识到标引和检索时才组配起来,如单元词法和叙词法。 第三章、分类检索语言及单选:1、一个类在分类表中被称为(类目)。2、表示类目概念的名称称为(类名)。3、(分类标准)的选择决定着提供什么检索途径。4、分类标准使用次序的选择,决定着形成什么样的(分类体系结构)。5、类目的排列包括纵向排列和横向排列,纵向排列决定着类目之间与(隶属关系)。横向排烈决定的(同位类目)的排列次序。6、(归附列类法)即将按学科、专业、职能分类不能集中在一起事物按某种联系归附于有关类目。7、(合并列类法)即将若干相近的并列概念合并设立一个类目,或构成一个类目。8、(交替烈类目)即对可以隶属于两个的学科、专业职能的事物在各有关类下都设立子目,并视需要选择其中一个作正式类目,在另一处引见正式类目。9、类目名称限定着类目所表达的事物概念的(内涵)和(外延)。10、体系分类法是直接体现(知识分类)的概念标识系统。11、使用数字或使用字母的分类号称为(单纯标记),同时使用字母和数字的分类号称为(混合标记)。12、(顺序制)即用若干个数字或字母编成(固定长度)的连贯的号码。13、(八分法)这是解决同位类超过十个阿拉伯数字限度进的一种标记方法。14、双位法即在展开时一下就用两位数字。这是解决同位类个数很多的一种标记方法,双位法也称(百分法),便不用00_09以及102090等号码,所以实际上只能标识(81个)子目。15、(中国档案法)于(1987年)12月由档案出版社正式出版。16、1989年又开始了第二版的编制工作,并于1995年通过专家鉴定,中国档案出版式(1997)年出彼。17、主要适用于档案文献(检索系统)的建立,但某些专业部门也可用以组织档案实体的分类排架。18、是以不同历史时期的国家机构,社会组织,从事社会实践活动的(职能分工)为基础,并紧密结合档案记述和反映的事物属性关系,来建立从总到分,从一般到具体的逻辑体系。19、详表,也称(主表),是分类表的(正文)。多选:1、分类检索语言可分为(体系分类法)和(组配分类法)两大类。2、体系分类法包括、.3、组配分类法.4、分类检索语言从其结构而言,都具有三种构成要素:即(类目)、(类号)和(注释)。5、类号即(分类号)也称(分类标记)。6、体系分类法的主要特点是按(学科)、(专业)或(职能集中文献),并(揭示各类文献在内容上的区别和联系)、(提供从科学、专业或职能分类检索文献信息的途径)。7、分类应守下列几条规则:A在每一次划分时,只使用一个划分标准主B划分位子数的外延之和等于其母类的外延C要选择反映事物的本质的符合分类的属性作为划分标准。8、类目的划分包括(分类标准的选择)和分类标准使用次序的选择)两个问题。9、列类是体系分类法编制中的主要环节,实际上就是(类目的划分)和(类目的排列)的过程。10、列类应遵循(文献保证原则)和(用户保证原则)。11、列类方法(设置类目的方法)大体可归纳如下:A正规列类法B列举列类法C重点列类法D罗列列类法E对应列类法F集中列类法H突出列类法、归附列类法、归附列类法、合并列类法、交替类法、专表列类法。12、类目名称必须符合(确切)(科学)(简洁)的要求。13、注释方式可以分为以下几种:A简单的注释与带实列的注释B笼统注释与具体的注释C指示性的注释与参考性注释D对一个类目的注释与具体的注释,14、标记制度是指分类号的构成方法,可分为(顺序制)(层累制)和混合制)三种。15、混合制:一般是指分类号分成两部分,一部分用(层累制),一部分用(顺序制)16、把全表分为(政治)(科学文化)和(经济)三个部分。(19)个大类。17、是一部完整的体系分类表,它主要由(编制说明)(大纲)(简表)(详表)(类目表)(辅助表)(复分表)。18、复分表分为(通用复分表)和(专类复分表)。19、编有(综合复分表)(世界各国和地区表)(中国地区表)(中国民族表)等四个通用复分表和一个科技档案专用的综合复分表。20、包含四种分类表:、.21、中设置了交替类目,即在不同的位均*列出,以便从不同角度均可查到有关档案,同时规定其中一个类目为实际归属类目,称为:“使用类目”,其他类目并不集中有关文献,仅起指引查找的作用,称为:“选择类目”或交替类目。22、中的标记符号,采用字母与数字的混合标记,严格采用(层累制),当同位类超过9个时采用(八分法)或(双位法)。23、中的注释,按其性质大体可归纳为(范围注释)和(方法注释)两类。24、分面组配分类法是根据概念的分析和综合原理编制的文献分类法,又称(分面分类法)(组配分类法)(分析_综合分类法)。25、分面组配式分类法可分为(全分面分类法)和(半分面分类法)两种。简答一、简述类目注释的作用?答(1)、当类目的含义不够明确时,用注释来明确。(2)、当类目之间的关系不可能用等级结构来显示时,用注释来显示。(3)、当在分类方法上有某些需要说明的地方时,用注释来加以说明。二、简述同位类目排列次序的主要方法和要求?答(1)自然序列,其要求是:连续性、规律性、稳定性、重要类目的突发性。其中最重要的是连续性。(2)、人为序列,就是按照事物的重要程序排列。人为序列包括:1)、从重要物类目到次要事物类目的排列次序。2)、从有较多文献论述的事物类目到只有很少文献论述的事物类目睥排列次序。3)、从抽象的、理论的、一般性问题的类目到具体的、应用的、个别性问题的类目排列次序。三、简述确定类目名称的基本要求?答:类目名称必须符合确切、科学、简洁的要求:(1)、确切。即所用的语或词组要能准确、恰当地反映类目的实际内容范围。(2)、科学了。即采用比较通行的科学名词术语作类目名称,而不要采用不通行的表达方式。(3)、简洁。即所用的词或词组要概括简练,并能准确表达原义。四、简述分类标记(分类号)的作用?答:(1)可以明确类目次序,便于排列目录和组织馆藏。(2)用分类号标引文献比较简单。(3)在检索时可作相符性比较。(4)层累制分类号在一定程序上可以表达各个类目的从属关系和并列关系。(5)可以帮助分辨一个类目的涵义。五、简述理想的分类标记应符合哪几个条件?答:(1)有较大的容纳性。(2)有较好的表达性。(3)易排易检。(4)号码简短。(5)有伸缩性。(6)有助记性。六、简述复分与仿分的异同?答:(1)、仿分和复分的道理是一样的、区别在于,对于普通的和大量的共同类目采用复分的方法,按专门编制的复分表进行细分,而对于少量的共同类目则采用仿分的方法(2)、仿分即在细分类目时仿照某一类目的下位类来设类,不必专门编表。七、简述分面分类法的特点?答:(1)、它虽然类目较少,但能通过类目的组配表示众多的主题概念,标引能力强于体系分类法。(2)可以较自由地扩大或缩小检索范围,能从多途经检索文献,在检索性能和效率方面都优于体系分类法。(3)采用分段标记制度,便于分类标记,检索较为灵活。(4)可用于组织分类目录以及建立分类检索系统等。(5)半分面分类法还可用于文献的分类排架和分类统计等。(6)分面分类法的类目体系不够直观,编制和使用都比较复杂项推广难度大。论述:一、试述分类检索语言的特点与作用?答:(1)、分类检索语言的特点主要表现在:1)、它是一部类目的汇编,对表达事物概念的类目起登录作用,只有分类检索语言中有的类目或能够组配而成的类目,才能用于类分文献。2)、它是一个类目的体系,有关角度提示类目之间的关系。3)、它是一部目的“词典”,对类目起定义作用,限定和说明类目的内涵和外延。4)、它是一种类目的排列表,通过线性排列,明确各个类目在分类体系中的位置和次序。(2)、分类检索语言的作用主要表现在:1)、这是进行分类标引和组织分类检索工具的规范。2)、它能作为对文献资料进行分类排架的依据。但在档案机构一般要采用另一种类型的分类体系来组织分类排架。3)、它是检索者从分类途径检索文献资料的指南。4)、它是文献工作者工作中常用的参考手册。二、试述体系分类法的局限性及其在中的体现?答:(1)、体系分类法自身存在着一个难以克服的矛盾_集中与分散的矛盾。它一方面按学科按专业或职能分工,系统地集中了文献内容,另一方面又从其他角度使其具有同类性质的文献分散。(2)、这一矛盾在中的主要表现是:1)党政职能的交*问题。在分类表中党务和政务是分别设类目的,但实际上在党务活动中往往涉及各种政务问题。2)各项职能范围中的相同职能手段问题。当我们按职能的范围集中某类档案时,全国各职能范围中相同职能手段的档案便被分散了。3)会议文件问题,分类表在许多体类中都设置了会议类,这样一方面使有关会议的档案得到了集中,另一方面又使会议所讨论的专门问题脱离了有关志类。4)同一类问题的部分档案入有关专类而造成的分散。5)一事物概念由若干概念因素构成,造成该类档案在一种概念因素上集中,而在其他概念因素上分散。(3)体系分类法主要采用列举式的列类方法。一方面列举式很难获得十分完整的类目,另一方面列举式还会膨胀分类法的篇幅。(4)体系分类法严格的逻辑体系给增加,删减类目造成困难。第四章 主题检索语言及中国档案主题词表 1.简答主题检索语言的特点和性能 它的特点是:语词标识几乎都是事物的名称,关于同一事物的文献全部被集中标引在同一语词标识下,所以要在主题检索系统中查全同一事物的档案就比较容易。 它的性能有: (1)控制主题检索系统所用的语词标识,以保证其具有较高的检索效率。 (2)引导使用者周密选用检索词,以便准确、全面地标引和检索文献。 (3)方便标引人员和检索人员查找所需检索词。 2 .简叙词的优点有哪些 叙词法就其基本性质而言,是一种采用表示单元概念的规范化语词的组配来对文献主题进行描述的后组式词汇型概念标识系统。叙词法比其他主题检索语言具有更好的性能,体现了检索语言的发展趋势。绝大部分计算机检索系统都采用叙词法。 3.简叙词法的构成原理 (1)按主题集中文献; (2)用规范化的、可以通过组配来表达复杂概念的语词直接标引文献主题; (3)用参照系统、分类索引、等级索引、轮排索引和主题词关系图等多种方式来显示主题概念之间的相互关系; (4)用字顺序列直接提供主题检索途径; (5)用于标识单元方式手工检索系统或用于计算机检索系统时,具有标引深度大,能够实现多途径检索,扩大、缩小或改变检索范围灵活,适应多种检索要求等优点。 4.简答主题词的组配 概念组配是决定其特点的基本原理。概念组配即概念的分析与综合。概念组配与字面组配在形式上有时相同,有时不同;从性质上说,两者有着原则性的区别。字面组配,其实质是词的分拆与组合;概念组配,其实质是词义的分析与综合。两者检索效果有很大差异。 5.简主题词组配的作用 (1)可以控制词汇量。 (2)可以对同一项情报进行多途径检索。 (3)可以自由扩大、缩小或改变检索范围。 (4)可以及时地反映新事物、新学科。 6.简中国档案主题词表特点 其特点仅在于: (1)在文书档案用词方面,为体现文献保证原则,因而所选的词与一般主题词表有较大区别。而就科技档案和某些专门档案的主题词表而言,其区别不大。 (2)其范畴索引也如档案分类表一样,以国家机构和社会组织从事社会实践活动的职能分工为基础来建立分类体系和对主题词进行归类。 (3)为保持历史原貌,便于标引和检索,对古代档案用词也予收录。 (4)档案主题词表除个别的以外一般不需要标注外文同义词和设置双语种对照索引。 7.简中国档案主题词表的结构体系 (1)主题词字顺表; (2)主题词分类索引; (3)主题词等级索引; (4)主题词轮排索引; (5)词双语种对照索引; (6)专有主题词索引; (7)正式主题词索引和款目词索引; (8)主题词关系图。 8.每条词款目大体可分为款目词、标注项和参照项三部分。 9.简字顺表的功用 一是提供从字顺查词的途径; 二是可通过参照系统,获知与所查词有密切联系的词,既可提高选用主题词的准确性,又有助于检索中扩大、缩小、改变检索范围; 三是可以通过其标注的范畴类号和族首词,比较容易地进入范畴索引和词族索引;四是还可获得主题词的其他信息。 10.范畴索引:是将主题词按其概念所属学科、专业或职能性质划分成大类,在大类之下再分若干小类,在小类下则将主题词和非主题词按字顺排列的一种索引。 11.简词族索引的功能 词族索引是把主表中具有属分关系、包含关系和整体部分关系的正式主题词,按规定属分级别展开全显示的一种词族系统。词族索引的功能是可以从一族中外延最广的主题词出发,找到其全部同族词,并且可以明确它们之间的层层隶属关系,从而弥补主题词字顺表族性检索功能差的缺点。在机检系统中是实现自动扩检、缩检及上位词登录的重要手段。 第五章 检索语言的发展与应用 1.检索语言基本上可分为分类检索语言和主题检索语言两大类。 2.简等级体系分类检索语言的主要特点 按照不同的学科和专业集中文献,用等级结构直接显示主题概念之间的关系,用分类符号作为标引和检索的依据,它便于从事物的有序性和知识的系统性方面来认识和查找文献。而中国档案主题词表属于叙词型主题检索语言。 3.简叙词型主题检索语言的主要特点 按文献所论述的事物主题集中文献,用参照系统显示主题概念之间的关系,用规范化的词语作为文献主题概念的标识,可以直接按事物的名称进行标引和检索。分类检索语言和主题检索语言的功能不尽相同,不能互相代替,但也不互相排斥,二者各有长短。 4.论分类检索语言和主题检索语言二者的生成原理的相同之处 首先,从本质上来说,二者都使用了分类的方法。分类检索语言和主题检索语言都要求一个基本的步骤分类,两者的区别仅在于类的排列上。分类检索语言是公开地采用分类方法,而主题检索语言是采用隐蔽的分类体系参照系统,当叙词表设置范畴索引和词族索引时,它运用分类方法便转入公开。 其次,从二者的基本构件来看,它们的实质是相同的。主题检索语言和分类检索语言两者皆是“立类”,主题检索语言是“以名立类”,分类检索语言是“以类立名”,两者的差别只是类集的方式和采用的标识不同。 第三,分类号、检索词作为文献主题的标识系统,它们都具有下列4种功能: (1)对文献的主题加以标引; (2)对内容相同及相关的文献主题加以集中或揭示其相关性; (3)对大量文献信息加以系统化或组织化; (4)便于将标引用语和检索用语进行相符性比较。 5.简自然语言在档案文献检索中的应用途径 (1)作为检索语言中入口词运用于档案检索。 (2)作为检索语言专用的入口词表运用于档案检索。 (3)作为自由词与主题词相结合运用于档案检索。 (4)采取自然语言的关键词法运用于档案检索。(5)采取自由标引后控词表检索法运用于档案检索。 第六章 档案著录 1.档案著录工作的要求 档案著录是指在编制档案目录时,对档案的内容和形式特征进行分析、选择和记录的过程。 基本要要求是: (1)准确性,即著录结果全面、客观、准确地揭示档案的内容特征和形式特征。 (2)规范化,即推行标准化著录,按照统一规定的著录项目、著录格式、标识符号、著录项目细则进行著录。 2.简档案著录规则及主要项 档案著录规则规定了单份或一组文件、一个或一组案卷的著录项目、著录格式、标识符号、著录用文字、著录信息源及著录项目细则。 著录的项目共分七项: (1)题名与责任说明项。 (2)稿本与文种项。 (3)密级与保管期限项。 (4)时间项。 (5)载体形态项。 (6)附注与提要项。 (7)排检与编号项。 3.简著录级别的选择 著录级别分为文件级、文件组合级、案卷级和案卷组合级。在选择著录级别时,首要的问题是要保证适当的检索深度,在此基础上力求减少不必要的重复劳动,提高著录速度。一般说来,机关档案室、综合性档案馆的著录应以文件级著录为主。不同的档案馆、室在著录时可根据档案的实际情况和利用者的需求特点,自行选择适当的著录级别。 第七章 档案标引 1.简档案标引不同方式 (1)按使用的标引语言可分为自由标引和受控标引。 (2)按提供检索标识的数量可分为浅度标引和深度标引。 (3)按主题分析方法可分为概括标引和分析标引。 (4)按标引单元可分为综合标引和分散标引。(5)按利用者需求可分为全面标引和对口标引。 2.按照国家标准文献主题标引规则的规定,主题因素分为5种,即主体因素、通用因素、位置因素、时间因素、文件类型因素。 3.简主题因素分为哪几种 ()主体因素,是指反映文件或案卷中所论述的主题的关键性概念,作为该文件或案卷的检索入口。 ()通用因互素,是指某些通用的词汇或概念。这些词汇或概念本身不具有专业的属性,但它与主体因素相结合,可以加强主题的专指性。 ()位置因素,是指文件或案卷所论述对象的空间和地理位置的概念,包括国家、地区、机构等方面的标识。 ()时间因素,是指文件或案卷所论述对象存在的时间概念,包括朝代、年度等方面的标识。 ()文件类型因素,是指文件类型和形式方面的概念。 .简题名不能直接、准确地反映档案内容主题,一般有下列几种情况 (1)题名概念过窄,包括不了档案的实际内容,特别是档案中有参考价值的内容,题名不可能全部列举。 (2)题名概念过宽,而实际内容较窄。(3)题名含义模糊,不能准确地反映档案内容。 (4)题名中无主题含义。 (5)题名与原文不符。 5.简主题分析中应注意的问题 (1)要准确把握被标引档案的主体因素,避免主体因素含混或主次不清的现象。 (2)要注意揭示档案的隐含主题。 (3)要注意考虑利用者的需求方式。 6.简档案主题分析的质量标准包括以下几方面 (1)既不要遗漏档案中有参考、检索价值的内容,又不要将无参考检索价值的内容或档案中根本不存在的东西作为分析的结果; (2)正确判断档案中叙述的重点内容; (3)正确表述档案的内容,即形成正确的概念。 7.简主题分析误差大致可归纳为下列三种 (1)主题分析不充分,析出的主题少于文献实际含有的有参考价值的东西,结果会造成漏检; (2)主题分析无控制,将无关重要的内容分析为主题,结果会造成误检; (3)主题分析错误,析出的主题与文献实际内容不符,结果既会造成漏检,也会造成误检。 8.简档案概念转换的质量标准包括以下几方面 (1)正确运用分类表和主题词表,选用符合专指性要求的分类号和主题词; (2)根据档案的价值确定标引深度,对主题分析结果的标引要有所选择取舍,不要遗漏有价值的情报; (3)给出的检索标识应符合一致性要求,即对同一主题概念的表达要前后一致。 9.简标引结果审核的具体内容 (1)分析出的主题是否少于档案中实际含有的具有参考、检索价值的内容; (2)是否将无关重要的内容分析为主题; (3)主题的概括是否准确、恰当; (4)标引的类号和主题词是否正确; (5)标引是否一致: (6)标引中是否有技术性错误; (7)应有的互见和轮排类号、轮排主题词是否已给出。 10.论述分类标引技巧 分类标引技巧主要是指档案主题在分类表中没有完全相符的类目时的标引方法,包括上位标引、组配标引、靠类标引和暂定性标引等。 (1)上位标引。某一档案的主题在分类表中没有相应专指的类目可归,而只得归入范围较大的上位类的标引方法称为上位标引。 (2)组配标引。指扩大使用范围的组配标引,是当某一档案在分类表中没有确切类目时采用的一种解决办法。 (3)靠类标引。当某一档案的主题在分类表中无专指的类目可归,又不可能采用上位标引和组配标引时,将其归入与其有某种联系的相关类,称为靠类标引。 (4)暂定性标引。当某一档案内容在分类表中无类可归时,分类人员根据其职能性质,在有关大类里新增类目暂作安置,待分类表编委会发出增设类目通知,或新版分类表修订出版后再重新标引。这种标引技巧可称为暂定性标引。 11.简主题标引的定义及与分类标引的同异 主题标引是将档案的主题内容纳入词表体系的过程。主题标引与分类标引都是针对档案内容给予相应检索标识的过程,但是,由于两者使用不同类型的情报检索语言,所以标引方法有所不同。甚至可以说,主题标引与分类标引有重大区别。分类标引是针对档案内容的职能分工或事物性质进行标引,每份档案归入所反映的社会职能分工或事物性质的类目。 12.简主题标引的一般规则 (1)了解所用主题词表各个组成部分的特点,以便在标引选词时根据具体情况,选择最有效的查词途径,迅速查到所需的主题词。 (2)在标引选词时应仔细、耐心,多查几处,注意每个词的参照项和注释项,反复推敲。 (3)标引用词必须是主题词表中的正式主题词,并且必须严格按照词表中的书面形式使用,不得有任何改动。 (4)要根据本单位的需要和档案的价值,掌握适当的标引深度。 (5)标引时应遵守专指性原则,即必须选用主题词表范围内最专指的主题词进行标引。 13.简自由词标引在下列情况下可以使用 (1)采用组配标引其结果出现多义时; (2)虽可靠词标引,但这些概念的被标引频率较高时; (3)词表中明显漏选的词,包括未收录的地名、人名、机构名、产品名、文件名等各种专有名称;(4)表达新生事物的词。 14.简标引时应遵守主题词标引的优先顺序 (1)当主题词表中有专指词时,必须用专指词标引; (2)当无专指词时,可采用组配标引,在组配标引中优先考虑交叉组配,然后考虑方面组配; (3)对词表中没有专指词,也不适合组配标引的主题概念,可以采用靠词标引,在靠词标引中优先考虑上位词标引,然后考虑近义词标引; (4)对用上述方法标引都不适合的主题,可以进行自由词标引。 15.简主题词组配标引规则 (1)组配标引应是概念组配,而不是字面组配。 (2)避免用不必要的词进行堆砌。 (3)避免概念不明确、逻辑不合理、内容不科学的不符合一般思维规律的组配。 (4)遵守专指性规则,选用与主题概念关系最密切、最邻近的主题词进行组配,不能越级组配。 (5)遵守主题词标引的优先顺序。 (6)当一个概念可用多种组配方案标引时,应使用确切的组配方案。 (7)专有名词不得用普通主题词组配表示。 16.论计算机检索系统与手工检索系统的比较 (1)一种手工检索系统一般只提供一种检索途径,例如分类检索系统只能提供分类检索途径,主题检索系统只能提供主题检索途径,而计算机检索系统则不同,它的数据库可以容纳多种检索标识,所以,一个计算机检索系统相当于多种手工检索系统。 (2)各种手工检索系统的条目格式各不相同,因此对一份档案要编制许多格式不同但又著录项目大同小异的条目。而在计算机检索系统的数据库中,对一份档案只需编制一条详细记录。 (3)每种手工检索系统都有与其他检索系统不同的排序方法,计算机检索系统的主文档只用一种排序方法,但输出时可采用多种排序方法,甚至字顺排列也可同时采用不只一种排序方法。 (4)手工检索系统与计算机检索系统中条目的结构以及识别每个著录项目所用的标识符号不同。 (5)计算机检索系统采用磁性载体,必须利用计算机才能进行检索。检索效率一般比手工检索高。(6)计算机检索系统像一个目录加工厂,可以按需要输出各种各样的目录,还可将数据从一磁性载体转录到另一磁性载体上,这就是所谓“一次输入,多次多种输出”的功能。 17.简计算机检索系统中档案标引工作的特点 (1)作双重标引。即对一份档案同时标引分类号和检索词。 (2)进行深度标引。即除了标引档案的基本主题内容以外,对于其中的局部主题内容,只要在检索中确实有意义的,都可以进行标引。 (3)可使用自由词作补充标引。但是,自由词标引也须注意进行一定的规范,以提高其检索效率。(4)使用关联符号。这是因为在计算机检索系统中检索词是后组式的。 (5)加机编主题目录或主题索引的标题符号。在为计算机检索系统进行档案标引时,若准备生产书本式主题目录或索引,就要为此加注标题符号。 (6)可进行上位登录。所谓上位登录,是指在给出一个检索词或一个分类号时,也同时给出它的所有各级上位词或上位类号。上位登录是通过程序由计算机自动进行的。上位登录的作用也可用其他方法达到。 (7)使用著录标引工作单。为计算机检索系统进行档案编目时,项目比较全,而且要求非常严格,所以一般都要填写著录标引工作单。 18.简目前我国档案部门大多采用题名关键词自动标引的原因:主要有两方面:一是应用计算机辅助管理的单位大多采用二次文献检索的方法,二是计算机对自然语言的理解技术还很不成熟。从题名中自动提取关键词的方法主要有词典匹配法和分词抽词标引法。 19.词典匹配法标引时可采用以下规则提高标引质量: (1)概念组配规则 (2)最长组配规则 (3)特定词规则 (4)并列词规则。 20.简题名关键词自动标引应注意的问题 (1)题名必须准确地反映档案文献的主题内容。 (2)要建立或选用一个高质量的词典库,其中的词应具有相当的可用性、包容性和通用性。 (3)建立同义词词典。在这个同义词链上还有主题词“自行车”,不但起到提高查全率的作用,也实现了对关键词的规范。 21.简影响档案自动标引质量的主要原因有 (1)我国目前主要采用的是题名关键词自动标引,但不少文件、案卷题名不能准确揭示其内容主题,从而失去了自动抽词的基本前提。 (2)我国目前的关键词自动标引还处于形式标引阶段,还没有实现语义、语境分析,分词、词组配方面的各种自动技术也还不够成熟。 (3)自动标引用的词典库质量还不高。 22.简对自动化标引的质量控制方法主要有以下几方面 (1)选择性能较好、与本单位档案实际相适应的自动标引软件。 (2)加强审校工作,并形成制度,未经审校的自动标引结果不能存入数据库。 主题词标引审校的内容大致有: 主题分析是否准确。 选词是否得当。 根据需要调整标引软件。 第八章 档案检索工具 1.简档案检索工具的作用 (1)检索作用 (2)报道和交流作用 (3)管理作用。 2.检索工具体系的功能取决于两个因素 一是每一种检索工具的质量, 一是各种检索工具之间的配合与协调。 3.简档案检索工具体系的基本要求 (1)要有一定数量的不同种类的检索工具。 (2)不同种类的检索工具要能够功能互补。 (3)检索工具设置要与利用需求相吻合。 4.简明见式检索工具 明见式检索工具有很多种类,其主要特点是每一个条目的检索标目显露在外,以便于查找。明见式检索工具一般采用卡片式,用不同的方法将卡片以鱼鳞式错落排列并固定下来进行翻动检索。 5.简表式检索工具 表式检索工具包括不同形式的用于记录检索标识的表格,有坐标式索引,圆盘式索引等。坐标式索引通常以纵坐标表示文献检索标识分组,横坐标表示文献编号,如档号。制作时在表中相应位置填写检索标识,检索进可从特定检索标识查找该文件档号。 6.简比孔卡、比号卡检索工具的优缺点 优点: 第一,设备简单,便于编制,使用也很方便; 第二,可以根据需要对标引词进行组配检索; 第三,可根据需要选择适当的标引深度,检索速度快。 缺点有: 第一,一张标引词卡片所容纳的文献号是有限的,检索时容易产生漏检; 第二,对标引词必须按照字顺或音序排列,操作结束后必须将取出的卡片放回原处; 第三,比孔卡、比号卡检索提供的文献信息单一,只能提供文献号,利用者需根据文献号再去查找文献卡或原件才能满足检索要求。 7.简边缘穿孔的主要优点 (1)具有多元检索的功能。 (2)排卡方便。普通卡片要按照一定顺序排列,形成一个体系。 (3)查检速度快。边孔卡在扫描和匹配技术上向前跨进了一步。 (4)设备简单,操作简便。边孔卡比起计算机检索费用低廉得多,而且技术比较简单,易于掌握。第九章 检索策略 1.简检索策略的含义与作用 检索策略就是为实现检索目标而制定的计划和方案。制定检索策略是对整个检索过程的谋划和指导,目的是使检索人员按照明确的目标,采用科学的程序和灵活的技巧实检索过程,以求最大限度地使检索结果接近以至满足利用者的需求目标。 2 .简制定检索策略的基本步骤 制定一个好的检索策略需要掌握很多信息和知识,大致包括3个方面: 一是利用者的需求信息; 二是现有检索系统的特性与功能,数据库的标引规则及词表结构等; 三是必要的检索方法与调节技术,所检课题的专业知识等。 制定检索策略的基本步骤是: (1)选择检索途径 (2)选择检索标识 (3)确定检索词之间的逻辑关系。 3.简加权检索 是指在检索时,给每一检索词一个表示其重要程度的数值,权值多少视检索词在档案文献中所占的重要程度而定,然后对含有这些检索词的档案文献进行加权计算,其和在规定的阈值以上者,作为答案输出。 4.简加权检索主要有两个方面的作用 (1)可获得较理想的查全率和查准率。采用了加权检索,赋予每个检索词一定的权值,就可以从数量上掌握这个“度”,从而获得较为满意的查全率和查准率。 (2)可在输出时对档案进行排列。当一次检索过程检出数量较多的档案时,利用者常常希望能根据每份档案的相关程度排列,在加权检索中,输出的每份档案都有权值,可以按照提问者兴趣相关性递减的顺序进行排列,排在前面的是相关性最高的,依次递减。 5.简加权检索与布尔逻辑检索的不同点 二者的主要不同点在于,布尔检索的结果只有或是或非的二值逻辑,而加权检索按照检出文献对于检索提问的切题程度分等级输出,这样一方面更加灵活,有可供利用者选择检索结果的余地,另一方面也有助于提高查准率。因此,有人把布尔检索方法称为定性检索方法,而把加权检索方法称为定量检索方法。 6.简制定检索策略中提高查全率的方法 (1)降低检索词的专指度,可从词表或检出文献中选一些上位词或相关词补充到检索表达式中。 (2)调节检索式的网罗度,如删去某个不甚重要的概念组面。 (3)进行族性检索,可采用上级、同级分类号检索,也可以采用一组近义词、同义词或相关词用OR连接在检索式中。 (4)进行截词检索,可以采用前截断、后截断、前后截断等截词方法。 (5)增加检索途径,如将主题途径与非主题途径结合起来使用。 7.简族性检索 可采用上级、同级分类号检索,也可以采用一组近义词、同义词或相关词用OR连接在检索式中。 具体做法有以下3种: (1)全族检索。 (2)同位类检索。 (3)上组配检索法。 第十章 档案计算机检索系统 1.简建立档案机读目录的基本要求 (1)档案目录数据要标准、规范。采集档案目录数据,应严格按照有关档案著录标引的国家标准、行业标准进行。 (2)编制好接收档案目录数据的计算机程序。这项工作应由了解档案工作的计算机专业人员或有编程能力的档案专
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全国甲级数学试卷
- 抽水蓄能电站水力发电方案
- 历年德州小升初数学试卷
- 龙马潭区初一数学试卷
- 化妆品原料知识培训课件
- 知道智慧树敲开医学之门满分测试答案
- 2025年小学生对联试题及答案
- 2025年小学教资笔试题目及答案
- 2025年小学教招音乐试题及答案
- 机场商铺消防知识培训课件
- 双重预防机制构建-隐患排查治理(中石化中原油田天然气厂)
- 二年级下册音乐《每天》教案
- 音乐美学.课件
- 心肺复苏说课比赛课件模板(一等奖)
- 健康体检证明
- 2021年江西外语外贸职业学院教师招聘试题及答案解析
- 外科学肺部疾病教案(共18页)
- 电鱼机的相关知识与各级电路的电路图
- 公司闲置资产及废旧物资盘活处置管理办法
- 幼儿园简介范文
- 专业技术职务任职资格评审表2009
评论
0/150
提交评论