档案文献检索系统_第1页
档案文献检索系统_第2页
档案文献检索系统_第3页
档案文献检索系统_第4页
档案文献检索系统_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE40第一章档案文献检索系统概述

1.广义的档案文献检索包括存储和查找两个具体过程。前者是指将档案中具有检索意义的特征标识出来,通过编制检索工具、建立数据库等方法使之成为有序的档案信息集合的过程;后者则是指在档案信息集合中选择、获取特定档案信息的过程。

2.简答档案文献检索的基本原理:是实现档案需求与相关档案信息的匹配,即将特定的档案需求与存储在检索系统中的档案信息进行相符性比较,根据一定标准从中选择出符合需求的档案信息。匹配的实现是存储和查找互相作用的结果。

3.存储阶段的目的是:使档案信息达到高度的组织化。主要采取对档案文献进行标识化压缩处理的方法,即把档案文献中具有检索意义的特征用语词、代码等符号表示出来,通过编目、编写提要等方式将档案原件转换成一种篇幅较短的特殊文献形式,一般成为简短记录档案文献特征的一个条目,并按照一定的规则把这些条目组织起来,形成有序的档案信息集合,供查找之用。

4.查找阶段的目的:是获取所需档案信息,主要方法是对档案需求课题进行标识化处理,形成检索提问,再将提问标识与档案信息集合中的标识进行相符性比较,选择出所需要的档案信息,也就是说,在存储的逆过程中把所需档案查找出来。(3、4题可合并一题)

5.档案文献检索同其他文献检索一样,可以采取三种形式:

(1)数据检索。这种检索是直接回答利用者所需要的有关特定主题的查询,检索出的结果是数据、公式、图表等。

(2)事实检索。这种检索也是直接回答利用者所需特定主题的确定性检索,检索出的结果是某种事实。

(3)文献检索。这种检索是要查出记载所需信息的档案文献,但检索结果所提供的并不是文献本身,而是文献线索,检索人员借助文献线索中提供的存址提取档案文献,再从文献中获得所需信息。

6.试述档案文献检索系统的构成与功能?

从检索系统的整体功能出发,去设计规划各个因素或环节的构成方式及其相互关系,可以使整个检索系统的功能得到改善,从而获得较好的检索效果。档案文献检索系统包括两大部分:存储部分和检索部分。存储部分的主要功能是通过著录标引、编制检索工具、建立数据库等手段使档案信息有序化;档案部分的主要功能是通过编制检索策略实现利用者提问与档案信息的有效匹配。

在存储档案时,档案标引人员首先要对档案文献的内容进行主题分析,形成若干能反映其主题的概念,并借助于检索语言把这些概念转换成规范化的检索标识,这一段工作就是档案的著录标引。

在检索(查找)档案文献时,档案检索人员首先要根据利用者的提问确定其所需档案的实质内容,形成概念,然后同样借助于检索语言,把表示检索课题的概念转换成规范化的检索标识,并按实际需求把这些标识之间的逻辑关系表达出来,形成检索表达式。

7.档案文献单元方式按照目录构成或计算机文档中数据排列方式的不同,可区分为文献单元方式和标识单元方式。

8.文献单元方式:在计算机检索中又称为顺检方式、顺序文档。它以一份文献为一个条目,指明该文献的各种特征,即以文献为单元进行检索。

9.标识单元方式:在计算机检索中又称为逆检方式、倒排文档。它以文献的一个属性标识为单元,指明含有该属性的全部文献,一般只有标识和文献号(档号)两个项目。

10.检索效率是指在检索过程中满足利用者的全面性和准确性程度,它是衡量检索系统性能的一个最基本的指标。检索效率通常采用查全率和查准率两个指标来衡量和表示。

11.查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。

12.查准率是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。

13.简答查全率和查准率的关系

查全率和查准率之间存在着互逆关系的结论。也就是说,如果放宽检索以达到较好的查全率,那么查准率就会下降;反之,若是限制检索范围以改善查准率,则查全率就会变坏。当进行范围宽泛的检索时,查全率很高,可以达到90%左右,而这时查准率则很低;相反,当检索范围小,很专指时,则查准率较高,查全率较低。

14.论述影响检索效率的因素:

(1)检索语言的性能。检索语言是沟通档案文献存储和查找两个过程的桥梁,对于特定需求信息与纳入检索系统的信息集合的准确匹配具有直接的影响。

(2)检索途径的数量。从理论上说,档案在存入检索系统之后,该系统向利用者提供的检索途径愈多,它被查到的概率也就愈高。

(3)著录标引的质量。检索标识是组织检索工具、进行检索的依据,因此,检索标识的准确性也是影响查全率、查准率的一个重要因素。

(4)检索策略的优劣。档案著录标引的结果对于文献存储的质量至关重要,那么,检索策略在查找过程中则具有决定性的作用。

(5)检索人员的素质。不论是手工检索系统还是机械检索系统,都要由检索人员来参与和控制检索过程,上述因素中除检索语言之外,均与检索人员的素质有关,因此检索人员的素质对于检索效率有直接的影响。

15.简档案文献检索系统评价的目的和作用

系统评价就是对系统的效率和价值进行测定,它是对系统进行科学管理的重要依据。主要目的是对系统整体及其组成要素的功能、特性和运营情况进行评测。

作用主要有三个方面:

(1)明确系统当前的性能特征,从而科学地、最大限度地发挥系统的功能。

(2)发现系统现存的缺陷及其原因,提出改进意见或其他对策。

(3)为设计和建立新的档案文献检索系统提供参考。

16.试述系统评价的指标体系:档案文献检索系统评价的指标主要包括数据覆盖率、检索效率、响应时间、可存取性、费用等。

(1)数据覆盖率又称为收录范围,指一个检索系统已收录数据量与应收录数据量的百分比,它反映该检索系统的资源拥有状况。

(2)查全率和查准率。二者实质上反映了系统运行结果与利用者检索要求的吻合程度,是衡量检索系统性能的最重要的指标。需要说明的是,在实际测评时根据公式计算出来的查全率和查准率常常不能完全准确地反映系统的实际检索效率,其主要原因是:

①对文献相关性的判断不可避免地带有主观性和模糊性。

②查全率是以检索系统中与某一检索要求相关的文献总数作为分母,计算检出的相关文献在全部相关文献中的比例,而检索人员和评价人员都难以确定这个总数是多少。

③在计算查全率、查准率时,“相关文献”被同等看待,不作任何区分,而实际上,在一组相关文献中,每一份文献的相关程度是有差异的。

(3)响应时间。它是指一次检索过程中从利用者向检索系统提出问题到检索系统完成匹配过程,形成检索结果,交付利用者所需的全部时间。

(4)可存取性。是指一个档案文献检索系统的易用程度。

(5)费用。构造和维持一个档案文献检索系统需要投入一定的费用,利用者检索档案文献也要有一定的支出,这些投入包括货币和活劳动两种形式。17.简系统评价步骤

(1)制订评价方案。包括确定对该系统进行评价时采用哪些评价指标。

(2)评价对象调查。可根据评价对象以及评价指标的特点采用问卷调查、抽样调查等不同的方法。(3)测试。根据样本进行检索测试,然后对检索结果的相关性、响应时间、系统易用程度等进行判断。

(4)数据处理与分析。对调查测试的各种原始数据进行整理、计算,得出有关评价对象的各种性能指标。

(5)对评价结果进行分析,提出改进意见。

第二章检检索语言言

1..检索语语言:是是根据检检索的需需要而创创制的人人工语言言,专门门用于各各种手工工的和计计算机化化的文献献信息检检索系统统,表达达文献主主题概念念和检索索课题概概念。

2.简简答检索索语言的的基本功功能

主主要有以以下四个个方面::

①对对文献的的主题加加以标引引的功能能;

②②对内容容相同及及相关的的文献主主题加以以集中或或揭示其其相关性性的功能能;

③③对大量量文献信信息加以以系统化化或组织织化;

④便于于将标引引用语和和检索用用语进行行相符性性比较。

3.产产生检索索语言第第一项基基本功能能的结构构:

(11)编码码型标识识结构。

(2)组组配型标标识结构构。

(33)层次次型结构构标识。

4.产产生检索索语言第第二项基基本功能能的结构构:

(11)等级级结构

(2)参参照系统统结构

(3)轮轮排聚类类结构。

5.按按构成原原理,可可分为分分类检索索语言、主主题检索索语言和和代码检检索语言言三大类类型。

6.简简答构成成原理

(1)分分类检索索语言。其其特点是是用分类类号来表表达各种种概念,把把各种概概念按知知识分类类进行系系统组织织和排列列,有很很好的系系统性。

(2)主主题检索索语言。其其特点是是用取自自自然语语言的语语词来表表达各种种概念,把把各种概概念完全全按字顺顺排列而而不管其其相互关关系如何何,其标标识有很很好的直直接性。

(3)代代码检索索语言。它它一般只只就事物物的某一一方面特特征,用用某种代代码系统统来加以以标引和和排列。

(4)引引证关系系追溯法法。即引引文索引引法,是是显示科科学论文文之间互互相引证证而形成成的论文文网的一一种方法法。

77.主题题检索语语言包括括标题词词语言(标标题法)、单单元词语语言(单单元词法法)、叙叙词语言言(叙词词法)和和关键词词语言(关关键词法法),它它们可统统称为主主题法系系统。

8.简简答先组组式语言言与后组组式语言言有何区区别

先先组式语语言就是是文献标标识在编编表时就就已固定定组配好好,或绝绝大部分分已固定定组配好好,如体体系分类类法和标标题词法法。后组组式语言言就是文文献标识识到标引引和检索索时才组组配起来来,如单单元词法法和叙词词法。

第三章、分分类检索索语言及及<<中中国档案案分类法法>>

单选选:

1、一一个类在在分类表表中被称称为(类类目)。

2、表示类目概念的名称称为(类名)。

3、(分类标准)的选择决定着提供什么检索途径。

4、分类标准使用次序的选择,决定着形成什么样的(分类体系结构)。

5、类目的排列包括纵向排列和横向排列,纵向排列决定着类目之间与(隶属关系)。横向排烈决定的(同位类目)的排列次序。

6、(归附列类法)即将按学科、专业、职能分类不能集中在一起事物按某种联系归附于有关类目。

7、(合并列类法)即将若干相近的并列概念合并设立一个类目,或构成一个类目。

8、(交替烈类目)即对可以隶属于两个的学科、专业\职能的事物在各有关类下都设立子目,并视需要选择其中一个作正式类目,在另一处引见正式类目。

9、类目名称限定着类目所表达的事物概念的(内涵)和(外延)。

10、体系分类法是直接体现(知识分类)的概念标识系统。

11、使用数字或使用字母的分类号称为(单纯标记),同时使用字母和数字的分类号称为(混合标记)。

12、(顺序制)即用若干个数字或字母编成(固定长度)的连贯的号码。

13、(八分法)这是解决同位类超过十个阿拉伯数字限度进的一种标记方法。

14、双位法即在展开时一下就用两位数字。这是解决同位类个数很多的一种标记方法,双位法也称(百分法),便不用00_09以及10\20\90等号码,所以实际上只能标识(81个)子目。

15、(中国档案法)于(1987年)12月由档案出版社正式出版。

16、1989年<<中国档案法>>又开始了第二版的编制工作,并于1995年通过专家鉴定,中国档案出版式(1997)年出彼。

17、<<中国档案法>>主要适用于档案文献(检索系统)的建立,但某些专业部门也可用以组织档案实体的分类排架。

18、<<中国档案分类法>>是以不同历史时期的国家机构,社会组织,从事社会实践活动的(职能分工)为基础,并紧密结合档案记述和反映的事物属性关系,来建立从总到分,从一般到具体的逻辑体系。

19、详表,也称(主表),是分类表的(正文)。

多选:

1、分类检索语言可分为(体系分类法)和(组配分类法)两大类。

2、体系分类法包括<<中国档案分类法>>、<<中国图书馆图书分类法>>、<<国际十进分类法>>.

3、组配分类法<<冒号分类法>>.

4、分类检索语言从其结构而言,都具有三种构成要素:即(类目)、(类号)和(注释)。

5、类号即(分类号)也称(分类标记)。

6、体系分类法的主要特点是按(学科)、(专业)或(职能集中文献),并(揭示各类文献在内容上的区别和联系)、(提供从科学、专业或职能分类检索文献信息的途径)。

7、分类应*守下列几条规则:A在每一次划分时,只使用一个划分标准主B划分位子数的外延之和等于其母类的外延C要选择反映事物的本质的符合分类的属性作为划分标准。

8、类目的划分包括(分类标准的选择)和分类标准使用次序的选择)两个问题。

9、列类是体系分类法编制中的主要环节,实际上就是(类目的划分)和(类目的排列)的过程。

10、列类应遵循(文献保证原则)和(用户保证原则)。

11、列类方法(设置类目的方法)大体可归纳如下:A正规列类法B列举列类法C重点列类法D罗列列类法E对应列类法F集中列类法H突出列类法、归附列类法、归附列类法、合并列类法、交替类法、专表列类法。

12、类目名称必须符合(确切)(科学)(简洁)的要求。

13、注释方式可以分为以下几种:A简单的注释与带实列的注释B笼统注释与具体的注释C指示性的注释与参考性注释D对一个类目的注释与具体的注释,

14、标记制度是指分类号的构成方法,可分为(顺序制)(层累制)和混合制)三种。

15、混合制:一般是指分类号分成两部分,一部分用(层累制),一部分用(顺序制)

16、<<中国档案分类法>>把全表分为(政治)(科学文化)和(经济)三个部分。(19)个大类。

17、<<中国档案分类法>>是一部完整的体系分类表,它主要由(编制说明)(大纲)(简表)(详表)(类目表)(辅助表)(复分表)。

18、复分表分为(通用复分表)和(专类复分表)。

19、<<中国档案分类法>>编有(综合复分表)(世界各国和地区表)(中国地区表)(中国民族表)等四个通用复分表和一个科技档案专用的综合复分表。

20、<<中国档案分类法>>包含四种分类表:<<中华人民共和国档案分类表>>、<<新民主主义档案分类表>>、<<民国档案分类表>>、<<请代档案分类表>>.

21、<<中国档案分类表>>中设置了交替类目,即在不同的位均*列出,以便从不同角度均可查到有关档案,同时规定其中一个类目为实际归属类目,称为:“使用类目”,其他类目并不集中有关文献,仅起指引查找的作用,称为:“选择类目”或交替类目。

22、<<中国档案分类法>>中的标记符号,采用字母与数字的混合标记,严格采用(层累制),当同位类超过9个时采用(八分法)或(双位法)。

23、<<中国档案分类法>>中的注释,按其性质大体可归纳为(范围注释)和(方法注释)两类。

24、分面组配分类法是根据概念的分析和综合原理编制的文献分类法,又称(分面分类法)(组配分类法)(分析_综合分类法)。

25、分面组配式分类法可分为(全分面分类法)和(半分面分类法)两种。

简答

一、简述类目注释的作用?

答(1)、当类目的含义不够明确时,用注释来明确。

(2)、当类目之间的关系不可能用等级结构来显示时,用注释来显示。

(3)、当在分类方法上有某些需要说明的地方时,用注释来加以说明。

二、简述同位类目排列次序的主要方法和要求?

答(1)自然序列,其要求是:连续性、规律性、稳定性、重要类目的突发性。其中最重要的是连续性。

(2)、人为序列,就是按照事物的重要程序排列。

人为序列包括:

1)、从重要物类目到次要事物类目的排列次序。

2)、从有较多文献论述的事物类目到只有很少文献论述的事物类目睥排列次序。

3)、从抽象的、理论的、一般性问题的类目到具体的、应用的、个别性问题的类目排列次序。

三、简述确定类目名称的基本要求?

答:类目名称必须符合确切、科学、简洁的要求:

(1)、确切。即所用的语或词组要能准确、恰当地反映类目的实际内容范围。

(2)、科学了。即采用比较通行的科学名词术语作类目名称,而不要采用不通行的表达方式。

(3)、简洁。即所用的词或词组要概括简练,并能准确表达原义。

四、简述分类标记(分类号)的作用?

答:(1)可以明确类目次序,便于排列目录和组织馆藏。

(2)用分类号标引文献比较简单。

(3)在检索时可作相符性比较。

(4)层累制分类号在一定程序上可以表达各个类目的从属关系和并列关系。

(5)可以帮助分辨一个类目的涵义。

五、简述理想的分类标记应符合哪几个条件?

答:(1)有较大的容纳性。(2)有较好的表达性。

(3)易排易检。(4)号码简短。

(5)有伸缩性。(6)有助记性。

六、简述复分与仿分的异同?

答:(1)、仿分和复分的道理是一样的、区别在于,对于普通的和大量的共同类目采用复分的方法,按专门编制的复分表进行细分,而对于少量的共同类目则采用仿分的方法

(2)、仿分即在细分类目时仿照某一类目的下位类来设类,不必专门编表。

七、简述分面分类法的特点?

答:(1)、它虽然类目较少,但能通过类目的组配表示众多的主题概念,标引能力强于体系分类法。

(2)可以较自由地扩大或缩小检索范围,能从多途经检索文献,在检索性能和效率方面都优于体系分类法。

(3)采用分段标记制度,便于分类标记,检索较为灵活。

(4)可用于组织分类目录以及建立分类检索系统等。

(5)半分面分类法还可用于文献的分类排架和分类统计等。

(6)分面分类法的类目体系不够直观,编制和使用都比较复杂项推广难度大。

论述:

一、试述分类检索语言的特点与作用?

答:(1)、分类检索语言的特点主要表现在:

1)、它是一部类目的汇编,对表达事物概念的类目起登录作用,只有分类检索语言中有的类目或能够组配而成的类目,才能用于类分文献。

2)、它是一个类目的体系,有关角度提示类目之间的关系。

3)、它是一部目的“词典”,对类目起定义作用,限定和说明类目的内涵和外延。

4)、它是一种类目的排列表,通过线性排列,明确各个类目在分类体系中的位置和次序。

(2)、分类检索语言的作用主要表现在:

1)、这是进行分类标引和组织分类检索工具的规范。

2)、它能作为对文献资料进行分类排架的依据。但在档案机构一般要采用另一种类型的分类体系来组织分类排架。

3)、它是检索者从分类途径检索文献资料的指南。

4)、它是文献工作者工作中常用的参考手册。

二、试述体系分类法的局限性及其在<<中国档案分类法>>中的体现?

答:(1)、体系分类法自身存在着一个难以克服的矛盾___集中与分散的矛盾。它一方面按学科\按专业或职能分工,系统地集中了文献内容,另一方面又从其他角度使其具有同类性质的文献分散。

(2)、这一矛盾在<<中国档案分类法>>中的主要表现是:

1)党政职能的交*问题。在分类表中党务和政务是分别设类目的,但实际上在党务活动中往往涉及各种政务问题。

2)各项职能范围中的相同职能手段问题。当我们按职能的范围集中某类档案时,全国各职能范围中相同职能手段的档案便被分散了。

3)会议文件问题,分类表在许多体类中都设置了会议类,这样一方面使有关会议的档案得到了集中,另一方面又使会议所讨论的专门问题脱离了有关志类。

4)同一类问题的部分档案入有关专类而造成的分散。

5)一事物概念由若干概念因素构成,造成该类档案在一种概念因素上集中,而在其他概念因素上分散。

(3)体系分类法主要采用列举式的列类方法。一方面列举式很难获得十分完整的类目,另一方面列举式还会膨胀分类法的篇幅。

(4)体系分类法严格的逻辑体系给增加,删减类目造成困难。

第四章主主题检索索语言及及《中国国档案主主题词表表》

11.简答答主题检检索语言言的特点点和性能能

它的的特点是是:语词词标识几几乎都是是事物的的名称,关关于同一一事物的的文献全全部被集集中标引引在同一一语词标标识下,所所以要在在主题检检索系统统中查全全同一事事物的档档案就比比较容易易。

它它的性能能有:

(1)控控制主题题检索系系统所用用的语词词标识,以以保证其其具有较较高的检检索效率率。

(22)引导导使用者者周密选选用检索索词,以以便准确确、全面面地标引引和检索索文献。

(3)方方便标引引人员和和检索人人员查找找所需检检索词。

2..简叙词词的优点点有哪些些

叙词词法就其其基本性性质而言言,是一一种采用用表示单单元概念念的规范范化语词词的组配配来对文文献主题题进行描描述的后后组式词词汇型概概念标识识系统。叙叙词法比比其他主主题检索索语言具具有更好好的性能能,体现现了检索索语言的的发展趋趋势。绝绝大部分分计算机机检索系系统都采采用叙词词法。

3.简简叙词法法的构成成原理

(1)按按主题集集中文献献;

(22)用规规范化的的、可以以通过组组配来表表达复杂杂概念的的语词直直接标引引文献主主题;

(3)用用参照系系统、分分类索引引、等级级索引、轮轮排索引引和主题题词关系系图等多多种方式式来显示示主题概概念之间间的相互互关系;;

(44)用字字顺序列列直接提提供主题题检索途途径;

(5)用用于标识识单元方方式手工工检索系系统或用用于计算算机检索索系统时时,具有有标引深深度大,能能够实现现多途径径检索,扩扩大、缩缩小或改改变检索索范围灵灵活,适适应多种种检索要要求等优优点。

4.简简答主题题词的组组配

概概念组配配是决定定其特点点的基本本原理。概概念组配配即概念念的分析析与综合合。概念念组配与与字面组组配在形形式上有有时相同同,有时时不同;;从性质质上说,两两者有着着原则性性的区别别。字面面组配,其其实质是是词的分分拆与组组合;概概念组配配,其实实质是词词义的分分析与综综合。两两者检索索效果有有很大差差异。

5.简简主题词词组配的的作用

(1)可可以控制制词汇量量。

(22)可以以对同一一项情报报进行多多途径检检索。

(3)可可以自由由扩大、缩缩小或改改变检索索范围。

(4)可可以及时时地反映映新事物物、新学学科。

6.简简《中国国档案主主题词表表》特点点

其特特点仅在在于:

(1)在在文书档档案用词词方面,为为体现文文献保证证原则,因因而所选选的词与与一般主主题词表表有较大大区别。而而就科技技档案和和某些专专门档案案的主题题词表而而言,其其区别不不大。

(2)其其范畴索索引也如如档案分分类表一一样,以以国家机机构和社社会组织织从事社社会实践践活动的的职能分分工为基基础来建建立分类类体系和和对主题题词进行行归类。

(3)为为保持历历史原貌貌,便于于标引和和检索,对对古代档档案用词词也予收收录。

(4)档档案主题题词表除除个别的的以外一一般不需需要标注注外文同同义词和和设置双双语种对对照索引引。

77.简《中中国档案案主题词词表》的的结构体体系

(11)主题题词字顺顺表;

(2)主主题词分分类索引引;

(33)主题题词等级级索引;;

(44)主题题词轮排排索引;;

(55)词双双语种对对照索引引;

(66)专有有主题词词索引;;

(77)正式式主题词词索引和和款目词词索引;;

(88)主题题词关系系图。

8.每每条词款款目大体体可分为为款目词词、标注注项和参参照项三三部分。

9.简简字顺表表的功用用

一是是提供从从字顺查查词的途途径;

二是可可通过参参照系统统,获知知与所查查词有密密切联系系的词,既既可提高高选用主主题词的的准确性性,又有有助于检检索中扩扩大、缩缩小、改改变检索索范围;;

三是是可以通通过其标标注的范范畴类号号和族首首词,比比较容易易地进入入范畴索索引和词词族索引引;四是是还可获获得主题题词的其其他信息息。

110.范范畴索引引:是将将主题词词按其概概念所属属学科、专专业或职职能性质质划分成成大类,在在大类之之下再分分若干小小类,在在小类下下则将主主题词和和非主题题词按字字顺排列列的一种种索引。

11..简词族族索引的的功能

词族索索引是把把主表中中具有属属分关系系、包含含关系和和整体部部分关系系的正式式主题词词,按规规定属分分级别展展开全显显示的一一种词族族系统。词词族索引引的功能能是可以以从一族族中外延延最广的的主题词词出发,找找到其全全部同族族词,并并且可以以明确它它们之间间的层层层隶属关关系,从从而弥补补主题词词字顺表表族性检检索功能能差的缺缺点。在在机检系系统中是是实现自自动扩检检、缩检检及上位位词登录录的重要要手段。

第五章检检索语言言的发展展与应用用

1..检索语语言基本本上可分分为分类类检索语语言和主主题检索索语言两两大类。

2.简简等级体体系分类类检索语语言的主主要特点点

按照照不同的的学科和和专业集集中文献献,用等等级结构构直接显显示主题题概念之之间的关关系,用用分类符符号作为为标引和和检索的的依据,它它便于从从事物的的有序性性和知识识的系统统性方面面来认识识和查找找文献。而而《中国国档案主主题词表表》属于于叙词型型主题检检索语言言。

33.简叙叙词型主主题检索索语言的的主要特特点

按按文献所所论述的的事物主主题集中中文献,用用参照系系统显示示主题概概念之间间的关系系,用规规范化的的词语作作为文献献主题概概念的标标识,可可以直接接按事物物的名称称进行标标引和检检索。分分类检索索语言和和主题检检索语言言的功能能不尽相相同,不不能互相相代替,但但也不互互相排斥斥,二者者各有长长短。

4.论论分类检检索语言言和主题题检索语语言二者者的生成成原理的的相同之之处

首首先,从从本质上上来说,二二者都使使用了分分类的方方法。分分类检索索语言和和主题检检索语言言都要求求一个基基本的步步骤———分类,两两者的区区别仅在在于类的的排列上上。分类类检索语语言是公公开地采采用分类类方法,而而主题检检索语言言是采用用隐蔽的的分类体体系———参照系系统,当当叙词表表设置范范畴索引引和词族族索引时时,它运运用分类类方法便便转入公公开。

其次,从从二者的的基本构构件来看看,它们们的实质质是相同同的。主主题检索索语言和和分类检检索语言言两者皆皆是“立立类”,主主题检索索语言是是“以名名立类”,分分类检索索语言是是“以类类立名”,两两者的差差别只是是类集的的方式和和采用的的标识不不同。

第三,分分类号、检检索词作作为文献献主题的的标识系系统,它它们都具具有下列列4种功功能:

(1)对对文献的的主题加加以标引引;

(22)对内内容相同同及相关关的文献献主题加加以集中中或揭示示其相关关性;

(3)对对大量文文献信息息加以系系统化或或组织化化;

(44)便于于将标引引用语和和检索用用语进行行相符性性比较。

5.简简自然语语言在档档案文献献检索中中的应用用途径

(1)作作为检索索语言中中入口词词运用于于档案检检索。

(2)作作为检索索语言专专用的入入口词表表运用于于档案检检索。

(3)作作为自由由词与主主题词相相结合运运用于档档案检索索。

(44)采取取自然语语言的关关键词法法运用于于档案检检索。(55)采取取自由标标引后控控词表检检索法运运用于档档案检索索。

第六章档档案著录录

1..档案著著录工作作的要求求

档案案著录是是指在编编制档案案目录时时,对档档案的内内容和形形式特征征进行分分析、选选择和记记录的过过程。

基本要要要求是是:

(11)准确确性,即即著录结结果全面面、客观观、准确确地揭示示档案的的内容特特征和形形式特征征。

(22)规范范化,即即推行标标准化著著录,按按照统一一规定的的著录项项目、著著录格式式、标识识符号、著著录项目目细则进进行著录录。

22.简《档档案著录录规则》及及主要项项

《档档案著录录规则》规规定了单单份或一一组文件件、一个个或一组组案卷的的著录项项目、著著录格式式、标识识符号、著著录用文文字、著著录信息息源及著著录项目目细则。

著录的的项目共共分七项项:

(11)题名名与责任任说明项项。

(22)稿本本与文种种项。

(3)密密级与保保管期限限项。

(4)时时间项。

(5)载载体形态态项。

(6)附附注与提提要项。

(7)排排检与编编号项。

3.简简著录级级别的选选择

著著录级别别分为文文件级、文文件组合合级、案案卷级和和案卷组组合级。在在选择著著录级别别时,首首要的问问题是要要保证适适当的检检索深度度,在此此基础上上力求减减少不必必要的重重复劳动动,提高高著录速速度。一一般说来来,机关关档案室室、综合合性档案案馆的著著录应以以文件级级著录为为主。不不同的档档案馆、室室在著录录时可根根据档案案的实际际情况和和利用者者的需求求特点,自自行选择择适当的的著录级级别。第七章档档案标引引

1..简档案案标引不不同方式式

(11)按使使用的标标引语言言可分为为自由标标引和受受控标引引。

(22)按提提供检索索标识的的数量可可分为浅浅度标引引和深度度标引。

(3)按按主题分分析方法法可分为为概括标标引和分分析标引引。

(44)按标标引单元元可分为为综合标标引和分分散标引引。(55)按利利用者需需求可分分为全面面标引和和对口标标引。

2.按按照国家家标准《文文献主题题标引规规则》的的规定,主主题因素素分为55种,即即主体因因素、通通用因素素、位置置因素、时时间因素素、文件件类型因因素。

3.简简主题因因素分为为哪几种种

(11)主体体因素,是是指反映映文件或或案卷中中所论述述的主题题的关键键性概念念,作为为该文件件或案卷卷的检索索入口。

(2)通通用因互互素,是是指某些些通用的的词汇或或概念。这这些词汇汇或概念念本身不不具有专专业的属属性,但但它与主主体因素素相结合合,可以以加强主主题的专专指性。

(3)位位置因素素,是指指文件或或案卷所所论述对对象的空空间和地地理位置置的概念念,包括括国家、地地区、机机构等方方面的标标识。

(4)时时间因素素,是指指文件或或案卷所所论述对对象存在在的时间间概念,包包括朝代代、年度度等方面面的标识识。

(55)文件件类型因因素,是是指文件件类型和和形式方方面的概概念。

4.简简题名不不能直接接、准确确地反映映档案内内容主题题,一般般有下列列几种情情况

(11)题名名概念过过窄,包包括不了了档案的的实际内内容,特特别是档档案中有有参考价价值的内内容,题题名不可可能全部部列举。

(2)题题名概念念过宽,而而实际内内容较窄窄。

(33)题名名含义模模糊,不不能准确确地反映映档案内内容。

(4)题题名中无无主题含含义。

(5)题题名与原原文不符符。

55.简主主题分析析中应注注意的问问题

(11)要准准确把握握被标引引档案的的主体因因素,避避免主体体因素含含混或主主次不清清的现象象。

(22)要注注意揭示示档案的的隐含主主题。

(3)要要注意考考虑利用用者的需需求方式式。

66.简档档案主题题分析的的质量标标准包括括以下几几方面

(1)既既不要遗遗漏档案案中有参参考、检检索价值值的内容容,又不不要将无无参考检检索价值值的内容容或档案案中根本本不存在在的东西西作为分分析的结结果;

(2)正正确判断断档案中中叙述的的重点内内容;

(3)正正确表述述档案的的内容,即即形成正正确的概概念。

7.简简主题分分析误差差大致可可归纳为为下列三三种

(11)主题题分析不不充分,析析出的主主题少于于文献实实际含有有的有参参考价值值的东西西,结果果会造成成漏检;;

(22)主题题分析无无控制,将将无关重重要的内内容分析析为主题题,结果果会造成成误检;;

(33)主题题分析错错误,析析出的主主题与文文献实际际内容不不符,结结果既会会造成漏漏检,也也会造成成误检。

8.简简档案概概念转换换的质量量标准包包括以下下几方面面

(11)正确确运用分分类表和和主题词词表,选选用符合合专指性性要求的的分类号号和主题题词;

(2)根根据档案案的价值值确定标标引深度度,对主主题分析析结果的的标引要要有所选选择取舍舍,不要要遗漏有有价值的的情报;;

(33)给出出的检索索标识应应符合一一致性要要求,即即对同一一主题概概念的表表达要前前后一致致。

99.简标标引结果果审核的的具体内内容

(11)分析析出的主主题是否否少于档档案中实实际含有有的具有有参考、检检索价值值的内容容;

(22)是否否将无关关重要的的内容分分析为主主题;

(3)主主题的概概括是否否准确、恰恰当;

(4)标标引的类类号和主主题词是是否正确确;

(55)标引引是否一一致:

(6)标标引中是是否有技技术性错错误;

(7)应应有的互互见和轮轮排类号号、轮排排主题词词是否已已给出。

10..论述分分类标引引技巧

分类标标引技巧巧主要是是指档案案主题在在分类表表中没有有完全相相符的类类目时的的标引方方法,包包括上位位标引、组组配标引引、靠类类标引和和暂定性性标引等等。

(11)上位位标引。某某一档案案的主题题在分类类表中没没有相应应专指的的类目可可归,而而只得归归入范围围较大的的上位类类的标引引方法称称为上位位标引。

(2)组组配标引引。指扩扩大使用用范围的的组配标标引,是是当某一一档案在在分类表表中没有有确切类类目时采采用的一一种解决决办法。

(3)靠靠类标引引。当某某一档案案的主题题在分类类表中无无专指的的类目可可归,又又不可能能采用上上位标引引和组配配标引时时,将其其归入与与其有某某种联系系的相关关类,称称为靠类类标引。

(4)暂暂定性标标引。当当某一档档案内容容在分类类表中无无类可归归时,分分类人员员根据其其职能性性质,在在有关大大类里新新增类目目暂作安安置,待待分类表表编委会会发出增增设类目目通知,或或新版分分类表修修订出版版后再重重新标引引。这种种标引技技巧可称称为暂定定性标引引。

111.简简主题标标引的定定义及与与分类标标引的同同异

主主题标引引是将档档案的主主题内容容纳入词词表体系系的过程程。主题题标引与与分类标标引都是是针对档档案内容容给予相相应检索索标识的的过程,但但是,由由于两者者使用不不同类型型的情报报检索语语言,所所以标引引方法有有所不同同。甚至至可以说说,主题题标引与与分类标标引有重重大区别别。分类类标引是是针对档档案内容容的职能能分工或或事物性性质进行行标引,每每份档案案归入所所反映的的社会职职能分工工或事物物性质的的类目。

12..简主题题标引的的一般规规则

(11)了解解所用主主题词表表各个组组成部分分的特点点,以便便在标引引选词时时根据具具体情况况,选择择最有效效的查词词途径,迅迅速查到到所需的的主题词词。

(22)在标标引选词词时应仔仔细、耐耐心,多多查几处处,注意意每个词词的参照照项和注注释项,反反复推敲敲。

(33)标引引用词必必须是主主题词表表中的正正式主题题词,并并且必须须严格按按照词表表中的书书面形式式使用,不不得有任任何改动动。

(44)要根根据本单单位的需需要和档档案的价价值,掌掌握适当当的标引引深度。

(5)标标引时应应遵守专专指性原原则,即即必须选选用主题题词表范范围内最最专指的的主题词词进行标标引。

13..简自由由词标引引在下列列情况下下可以使使用

(11)采用用组配标标引其结结果出现现多义时时;

(22)虽可可靠词标标引,但但这些概概念的被被标引频频率较高高时;

(3)词词表中明明显漏选选的词,包包括未收收录的地地名、人人名、机机构名、产产品名、文文件名等等各种专专有名称称;(44)表达达新生事事物的词词。

114.简简标引时时应遵守守主题词词标引的的优先顺顺序

(11)当主主题词表表中有专专指词时时,必须须用专指指词标引引;

(22)当无无专指词词时,可可采用组组配标引引,在组组配标引引中优先先考虑交交叉组配配,然后后考虑方方面组配配;

(33)对词词表中没没有专指指词,也也不适合合组配标标引的主主题概念念,可以以采用靠靠词标引引,在靠靠词标引引中优先先考虑上上位词标标引,然然后考虑虑近义词词标引;;

(44)对用用上述方方法标引引都不适适合的主主题,可可以进行行自由词词标引。

15..简主题题词组配配标引规规则

(11)组配配标引应应是概念念组配,而而不是字字面组配配。

(22)避免免用不必必要的词词进行堆堆砌。

(3)避避免概念念不明确确、逻辑辑不合理理、内容容不科学学的不符符合一般般思维规规律的组组配。

(4)遵遵守专指指性规则则,选用用与主题题概念关关系最密密切、最最邻近的的主题词词进行组组配,不不能越级级组配。

(5)遵遵守主题题词标引引的优先先顺序。

(6)当当一个概概念可用用多种组组配方案案标引时时,应使使用确切切的组配配方案。

(7)专专有名词词不得用用普通主主题词组组配表示示。

116.论论计算机机检索系系统与手手工检索索系统的的比较

(1)一一种手工工检索系系统一般般只提供供一种检检索途径径,例如如分类检检索系统统只能提提供分类类检索途途径,主主题检索索系统只只能提供供主题检检索途径径,而计计算机检检索系统统则不同同,它的的数据库库可以容容纳多种种检索标标识,所所以,一一个计算算机检索索系统相相当于多多种手工工检索系系统。

(2)各各种手工工检索系系统的条条目格式式各不相相同,因因此对一一份档案案要编制制许多格格式不同同但又著著录项目目大同小小异的条条目。而而在计算算机检索索系统的的数据库库中,对对一份档档案只需需编制一一条详细细记录。

(3)每每种手工工检索系系统都有有与其他他检索系系统不同同的排序序方法,计计算机检检索系统统的主文文档只用用一种排排序方法法,但输输出时可可采用多多种排序序方法,甚甚至字顺顺排列也也可同时时采用不不只一种种排序方方法。

(4)手手工检索索系统与与计算机机检索系系统中条条目的结结构以及及识别每每个著录录项目所所用的标标识符号号不同。

(5)计计算机检检索系统统采用磁磁性载体体,必须须利用计计算机才才能进行行检索。检检索效率率一般比比手工检检索高。(66)计算算机检索索系统像像一个目目录加工工厂,可可以按需需要输出出各种各各样的目目录,还还可将数数据从一一磁性载载体转录录到另一一磁性载载体上,这这就是所所谓“一一次输入入,多次次多种输输出”的的功能。

17..简计算算机检索索系统中中档案标标引工作作的特点点

(11)作双双重标引引。即对对一份档档案同时时标引分分类号和和检索词词。

(22)进行行深度标标引。即即除了标标引档案案的基本本主题内内容以外外,对于于其中的的局部主主题内容容,只要要在检索索中确实实有意义义的,都都可以进进行标引引。

(33)可使使用自由由词作补补充标引引。但是是,自由由词标引引也须注注意进行行一定的的规范,以以提高其其检索效效率。(44)使用用关联符符号。这这是因为为在计算算机检索索系统中中检索词词是后组组式的。

(5)加加机编主主题目录录或主题题索引的的标题符符号。在在为计算算机检索索系统进进行档案案标引时时,若准准备生产产书本式式主题目目录或索索引,就就要为此此加注标标题符号号。

(66)可进进行上位位登录。所所谓上位位登录,是是指在给给出一个个检索词词或一个个分类号号时,也也同时给给出它的的所有各各级上位位词或上上位类号号。上位位登录是是通过程程序由计计算机自自动进行行的。上上位登录录的作用用也可用用其他方方法达到到。

(77)使用用著录——标引工工作单。为为计算机机检索系系统进行行档案编编目时,项项目比较较全,而而且要求求非常严严格,所所以一般般都要填填写著录录—标引引工作单单。

118.简简目前我我国档案案部门大大多采用用题名关关键词自自动标引引的原因因:主要要有两方方面:一一是应用用计算机机辅助管管理的单单位大多多采用二二次文献献检索的的方法,二二是计算算机对自自然语言言的理解解技术还还很不成成熟。从从题名中中自动提提取关键键词的方方法主要要有词典典匹配法法和分词词抽词标标引法。

19..词典匹匹配法标标引时可可采用以以下规则则提高标标引质量量:

(11)概念念组配规规则

(22)最长长组配规规则

(33)特定定词规则则

(44)并列列词规则则。

220.简简题名关关键词自自动标引引应注意意的问题题

(11)题名名必须准准确地反反映档案案文献的的主题内内容。

(2)要要建立或或选用一一个高质质量的词词典库,其其中的词词应具有有相当的的可用性性、包容容性和通通用性。

(3)建建立同义义词词典典。在这这个同义义词链上上还有主主题词“自自行车”,不不但起到到提高查查全率的的作用,也也实现了了对关键键词的规规范。

21..简影响响档案自自动标引引质量的的主要原原因有

(1)我我国目前前主要采采用的是是题名关关键词自自动标引引,但不不少文件件、案卷卷题名不不能准确确揭示其其内容主主题,从从而失去去了自动动抽词的的基本前前提。

(2)我我国目前前的关键键词自动动标引还还处于形形式标引引阶段,还还没有实实现语义义、语境境分析,分分词、词词组配方方面的各各种自动动技术也也还不够够成熟。

(3)自自动标引引用的词词典库质质量还不不高。

22..简对自自动化标标引的质质量控制制方法主主要有以以下几方方面

(11)选择择性能较较好、与与本单位位档案实实际相适适应的自自动标引引软件。

(2)加加强审校校工作,并并形成制制度,未未经审校校的自动动标引结结果不能能存入数数据库。

主题词词标引审审校的内内容大致致有:

①主题题分析是是否准确确。

②②选词是是否得当当。

③③根据需需要调整整标引软软件。第八章档档案检索索工具

1.简简档案检检索工具具的作用用

(11)检索索作用

(2)报报道和交交流作用用

(33)管理理作用。

2.检检索工具具体系的的功能取取决于两两个因素素

一是是每一种种检索工工具的质质量,

一是各各种检索索工具之之间的配配合与协协调。

3.简简档案检检索工具具体系的的基本要要求

(11)要有有一定数数量的不不同种类类的检索索工具。

(2)不不同种类类的检索索工具要要能够功功能互补补。

(33)检索索工具设设置要与与利用需需求相吻吻合。

4.简简明见式式检索工工具

明明见式检检索工具具有很多多种类,其其主要特特点是每每一个条条目的检检索标目目显露在在外,以以便于查查找。明明见式检检索工具具一般采采用卡片片式,用用不同的的方法将将卡片以以鱼鳞式式错落排排列并固固定下来来进行翻翻动检索索。

55.简表表式检索索工具

表式检检索工具具包括不不同形式式的用于于记录检检索标识识的表格格,有坐坐标式索索引,圆圆盘式索索引等。坐坐标式索索引通常常以纵坐坐标表示示文献检检索标识识分组,横横坐标表表示文献献编号,如如档号。制制作时在在表中相相应位置置填写检检索标识识,检索索进可从从特定检检索标识识查找该该文件档档号。

6.简简比孔卡卡、比号号卡检索索工具的的优缺点点

优点点:

第第一,设设备简单单,便于于编制,使使用也很很方便;;

第二二,可以以根据需需要对标标引词进进行组配配检索;;

第三三,可根根据需要要选择适适当的标标引深度度,检索索速度快快。

缺缺点有::

第一一,一张张标引词词卡片所所容纳的的文献号号是有限限的,检检索时容容易产生生漏检;;

第二二,对标标引词必必须按照照字顺或或音序排排列,操操作结束束后必须须将取出出的卡片片放回原原处;

第三,比比孔卡、比比号卡检检索提供供的文献献信息单单一,只只能提供供文献号号,利用用者需根根据文献献号再去去查找文文献卡或或原件才才能满足足检索要要求。

7.简简边缘穿穿孔的主主要优点点

(11)具有有多元检检索的功功能。

(2)排排卡方便便。普通通卡片要要按照一一定顺序序排列,形形成一个个体系。

(3)查查检速度度快。边边孔卡在在扫描和和匹配技技术上向向前跨进进了一步步。

(44)设备备简单,操操作简便便。边孔孔卡比起起计算机机检索费费用低廉廉得多,而而且技术术比较简简单,易易于掌握握。

第九章检检索策略略

1..简检索索策略的的含义与与作用

检索策策略就是是为实现现检索目目标而制制定的计计划和方方案。制制定检索索策略是是对整个个检索过过程的谋谋划和指指导,目目的是使使检索人人员按照照明确的的目标,采采用科学学的程序序和灵活活的技巧巧实检索索过程,以以求最大大限度地地使检索索结果接接近以至至满足利利用者的的需求目目标。

2..简制定定检索策策略的基基本步骤骤

制定定一个好好的检索索策略需需要掌握握很多信信息和知知识,大大致包括括3个方方面:

一是利利用者的的需求信信息;

二是现现有检索索系统的的特性与与功能,数数据库的的标引规规则及词词表结构构等;

三是必必要的检检索方法法与调节节技术,所所检课题题的专业业知识等等。

制制定检索索策略的的基本步步骤是::

(11)选择择检索途途径

(22)选择择检索标标识

(33)确定定检索词词之间的的逻辑关关系。

3.简简加权检检索

是是指在检检索时,给给每一检检索词一一个表示示其重要要程度的的数值,权权值多少少视检索索词在档档案文献献中所占占的重要要程度而而定,然然后对含含有这些些检索词词的档案案文献进进行加权权计算,其其和在规规定的阈阈值以上上者,作作为答案案输出。

4.简简加权检检索主要要有两个个方面的的作用

(1)可可获得较较理想的的查全率率和查准准率。采采用了加加权检索索,赋予予每个检检索词一一定的权权值,就就可以从从数量上上掌握这这个“度度”,从从而获得得较为满满意的查查全率和和查准率率。

(22)可在在输出时时对档案案进行排排列。当当一次检检索过程程检出数数量较多多的档案案时,利利用者常常常希望望能根据据每份档档案的相相关程度度排列,在在加权检检索中,输输出的每每份档案案都有权权值,可可以按照照提问者者兴趣相相关性递递减的顺顺序进行行排列,排排在前面面的是相相关性最最高的,依依次递减减。

55.简加加权检索索与布尔尔逻辑检检索的不不同点

二者的的主要不不同点在在于,布布尔检索索的结果果只有或或是或非非的二值值逻辑,而而加权检检索按照照检出文文献对于于检索提提问的切切题程度度分等级级输出,这这样一方方面更加加灵活,有有可供利利用者选选择检索索结果的的余地,另另一方面面也有助助于提高高查准率率。因此此,有人人把布尔尔检索方方法称为为定性检检索方法法,而把把加权检检索方法法称为定定量检索索方法。

6.简简制定检检索策略略中提高高查全率率的方法法

(11)降低低检索词词的专指指度,可可从词表表或检出出文献中中选一些些上位词词或相关关词补充充到检索索表达式式中。

(2)调调节检索索式的网网罗度,如如删去某某个不甚甚重要的的概念组组面。

(3)进进行族性性检索,可可采用上上级、同同级分类类号检索索,也可可以采用用一组近近义词、同同义词或或相关词词用ORR连接在在检索式式中。

(4)进进行截词词检索,可可以采用用前截断断、后截截断、前前后截断断等截词词方法。

(5)增增加检索索途径,如如将主题题途径与与非主题题途径结结合起来来使用。7.简族性性检索

可采用用上级、同同级分类类号检索索,也可可以采用用一组近近义词、同同义词或或相关词词用ORR连接在在检索式式中。

具体做做法有以以下3种种:

(11)全族族检索。

(2)同同位类检检索。

(3)上上组配检检索法。

第十章档档案计算算机检索索系统

1.简简建立档档案机读读目录的的基本要要求

(11)档案案目录数数据要标标准、规规范。采采集档案案目录数数据,应应严格按按照有关关档案著著录标引引的国家家标准、行行业标准准进行。

(2)编编制好接接收档案案目录数数据的计计算机程程序。这这项工作作应由了了解档案案工作的的计算机机专业人人员或有有编程能能力的档档案专业业人员完完成。

2.简简档案机机读目录录数据库库的建立立需要做做哪些工工作

(11)对档档案目录录数据进进行分析析。档案案目录数数据从不不同角度度反映了了档案特特征,是是计算机机检索档档案的重重要依据据和基础础。建库库之前,必必须结合合档案检检索系统统的功能能设计,对对各种档档案目录录数据及及其关系系进行分分析。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论