版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章
数字档案馆元数据体系数字档案馆学(第二版)元数据的一般知识01电子文件元数据02数字档案元数据03数字档案元数据的互操作04目录CONTENTS元数据的一般知识01
元数据是在互联网环境下对事物进行描述而产生的数据。元数据最早是作为计算机科学领域的专用术语出现的,主要功能是描述数据以及数据环境。
从广义上讲,元数据是一种标准化的框架,用来描述和表征某一类事物或
(信息)资源的基本特征,以实现对资源的组织和管理,并为用户提供定位、检索、共享和利用该信息资源的线索。从狭义上讲,元数据主要指网络环境下针对数字资源进行描述的数据。元数据的含义根据应用领域划分元数据的分类(1)图书资料元数据,如都柏林核心元数据集(DC);(2)政府信息元数据,如我国《党政机关电子公文元数据规范》(GB/T33480—2016)、美国政府信息定位服务
;(3)档案元数据,如《建设电子档案元数据标准》(CJJ/T187—2012)、编码档案著录标准(EAD)、《气象档案元数据》;(4)艺术品元数据,如艺术作品著录类目(CDWA)、视觉资料核心类目(VRA);(5)地理空间信息元数据,如国际标准化组织地理信息技术委员会(ISO/TC211)定义的空间元数据标准,美国联邦地理数据委员会定义的元数据标准。此外,还有软件元数据、商品元数据、服务元数据、活动元数据等。根据功能划分元数据的分类(1)内容元数据。(2)责任元数据。(3)关系元数据。(4)获取元数据。(5)表示元数据。(6)管理元数据。(7)溯源元数据。(8)元数据管理元数据。电子文件元数据02电子文件元数据的使用目的(1)对文件及相关实体进行标准化描述,确保并证明电子文件的真实性、完整性、可用性和安全性,从而保证其凭证价值和查考价值;(2)为电子政务、办公自动化、文件及档案管理系统的设计提供依据;(3)有利于归档电子文件的保护,实现长期保存;(4)对异构信息系统中的电子文件进行规范和管理,保证归档电子文件的可捕获、可收集、可长期利用;(5)对归档电子文件及馆
(室)藏档案数字化资源进行集成管理,便于检索与利用。
将电子文件元数据的结构表述为:文件描述、责任者描述、业务描述、关系描述、长期保存描述。
其中,业务描述的内容包括:业务层级、业务标识、业务法规依据、业务内容描述、业务权限和业务处理过程。电子文件元数据的一般结构
国家档案局中央档案馆办公室下发了关于
《电子文件元数据标准》和
《电子文件管理细则》两项档案行业标准征求意见稿的通知,这标志着我国电子文件元数据标准的制定已经基本成熟。
其中,《电子文件元数据标准》征求意见稿的总体框架表揭示了我国电子文件元数据核心元素集、标识与限定元素等,从文件、责任者、业务、关系与长期保存五个实体出发,为电子文件的内容、现行业务、机构背景与长期保存提供了较为全面的描述框架。电子文件元数据标准单电子公文元数据标准
电子公文的核心元数据包括公文标识、文种、份号、密级和保密期限、紧急程度、发文机关标志、发文字号、签发人、标题、主送机关、附件说明、发文机关或签发人署名、成文日期、附注、抄送机关、印发机关、印发日期、发布层次及扩展方案。国外电子文件元数据项目(1)业务可接受通信参考模型元数据规范
(BAC)(2)美国国防部记录管理元数据标准
(DOD5051.2)(3)联邦机构文件保持元数据标准
(RMSCA)(4)InterPARES项目单数字档案的移交与接收移交与接收工作流程:
数字档案又称电子档案,主要有两大来源,一是传统载体档案的数字化,二是电子管理可以划分为两个阶段:一是归档后电子文件的管理,主要由机关档案室负责;二是在移交单位将电子档案的保管权移交给档案馆后,由档案馆保存管理。单数字档案的移交与接收移交与接收方式:
(1)在线移交,要求档案移交单位通过符合安全管理要求的网络,使用相关应用系统向档案馆提交电子档案移交信息包,应用系统应具有开放性和可扩展性。(2)离线移交,要求档案移交单位配备符合安全管理要求的光盘、硬磁盘等存储载体,存储载体的选择和检测应符合相关标准。单数字档案的移交与接收移交数据的组成:
移交的电子档案数据主要包括电子档案的目录数据、内容数据和元数据等。电子档案一般以件为单位进行管理,其目录数据项目应至少包括:顺序号、档号、责任者、题名、日期、保管期限、密级、页数、备注等。单数字档案的移交与接收移交档案信息包:
移交单位应对电子档案移交清单与待移交电子档案的一致性进行检查,确认无误后,导出待移交电子档案的目录数据、内容数据和元数据,形成电子档案移交信息包。单数字档案的移交与接收档案信息包“四性”检测:
移交电子档案时,移交方和接收方(档案馆)都应对电子档案移交信息包的真实性、完整性、可用性和安全性进行检测,又称“四性”检测。单数字档案的移交与接收档案信息包的接收:
在线移交时,档案馆收到电子档案移交信息包后,应通过应用系统签收功能或系统日志记录等方式向档案移交单位进行确认。离线移交时,可将签收人、签收时间等信息记录到电子档案移交接收登记表上。数字档案元数据03数字档案元数据的功能(1)描述与组织,即对档案文件的内容特征和外部特征进行揭示,并根据特定的特征对数字档案资源进行组织整理;(2)检索和发现,为用户提供方便快捷、多层次、多途径的检索体系;(3)评价和选择,支持用户在不浏览档案信息的情况下,对信息对象有基本的了解,从而决定对信息的取舍;(4)定位,提供档案信息资源所在位置的信息;(5)管理和保存,记录档案管理和使用信息,便于数字档案资源的长期保存。单数字档案元数据标准介绍《国际档案著录标准》:(1)历史背景(2)结构①标识声明②背景
③内容和结构④访问和利用条件
⑤关联资料
⑥附注
⑦著录控制
单数字档案元数据标准介绍《法人、个人及家庭背景信息国际档案规范文本》:(1)背景(2)结构①身份
②描述区域③关系④控制域(3)发展单数字档案元数据标准介绍《编码档案著录标准》:
《编码档案著录标准》主要用于描述档案和手稿资源,包括文本文档、电子文档、可视材料和声音记录。(1)背景(2)结构(3)EAD与ISAD(G)的关系(4)EAD的特点单数字档案元数据标准介绍《编码档案背景规范———法人、个人及家庭》:
《编码档案背景规范———法人、个人及家庭》是一项基于XML的元数据标准,是EAD的延伸和扩展。EAC-CPF用于编码档案材料创建者
(即法人、个人或家庭)的信息,包括他们与资源
(书籍、藏品、论文等)及其他法人、个人和家庭的关系。目标是提供有关记录创建和使用情况的背景信息。请输入您的标题(1)著录元素的数量和格式不同。(2)著录的层次等级不同。(3)著录的主要对象不同。(4)著录规范化手段不同。(5)简易程度和扩展性不同。我国档案著录规则与EDA的比较数字档案元数据的互操作04数字档案元数据的互操作档案OAI-PMH元数据互操作框架数字档案元数据的互操作档案数据提供者的结构数字档案元数据的互操作档案服务提供者的结构与元数据收割数字档案元数据的互操作基于OAI-PMH的档案元数据互操作系统的体系结构:(1)档案DP模块。(2)档案元数据服务提供者模块。(3)基于OAI的应用模块。(4)注册服务器模块。DC元数据标准简介都柏林核心元数据集是帮助用户检索网络资源的一套描述性元素和最小集合。特点如下:(1)操作简单。(2)受控检索。(3)可扩展。(4)适应网络搜索工具。(5)适于互操作。(6)国际化。(7)XML与资源描述框架
编码规则提供了一个理解DC并与其他元数据标准进行互操作的基础。结构层次不同,使电子文件的归档和移交困难元素同名异义,使互操作困难元素的详细程度不同,导致二者的映射关系不均衡,映射转换困难DC与EAD的映射关系项目介绍面临的问题OAI的标准元数据过于简单与EAD复杂结构之间存在矛盾。会丢失原EAD记录中的上下文信息。转换后的著录不够清晰,可能出现错误指示。解决思路:在采用元数据标准时,应充分考虑各数字档案馆之间实现互操作的需要,尽量采用通用的元数据标准。同时可以设立一个专门的部门来监督、统一协调元数据的开发工作,对每个数字档案馆的建设进行指导监督和验收,提高各个数字档案馆建设中元数据利用的标准化水平与一致性。基于OAI-PMH的数字档案互操作谢
谢
大
家数字档案馆学(第二版)第六章
档案数据库分析与设计数字档案馆学(第二版)档案数据库的结构01档案机读目录格式02建设原则与要求03档案数据库设计04目录CONTENTS05档案数据库的建立档案数据库的结构01TEMPLTE
档案目录数据库是指借助数据库管理系统存储在计算机存储设备之中的档案文件目录信息的集合,用以提供档案信息的计算机管理和检索服务,是计算机环境下用户利用档案信息的指南。
档案目录数据库主要有两种数据来源:一是将传统载体档案的目录输入计算机进行管理。二是通过对归档电子文件的接收,由档案管理信息系统自动捕获提取在业务部门形成的电子文件的目录数据,存入目录数据库中。一、档案目录数据库TEMPLTE
档案全文数据库是档案数据库的主体,是指将档案文件的全文存储在计算机数据库中,以供全文检索利用的数据库。档案全文数据库的数据可以由传统载体档案文件的全文扫描而来,也可以通过电子文件的接收而获得。档案全文数据的格式丰富多样,可能是文本文件、表格或者电子邮件,也可能是声音、图像或多媒体文件。二、档案全文数据库档案机读目录格式02机读目录是计算机编目的产品,最早产生于图书馆自动化管理领域。它是以代码形式和特定格式结构记录在计算机存储载体上,能够被计算机识别并编辑输出书目信息的目录形式。一、机读目录格式介绍单MARC格式是基于计算机处理的机读目录格式,是目前适用于书目数据系统的最完善、字段最复杂、标准最严密的著录格式,著录元素非常详尽而且规范,主要面向图书馆内部业务。但其标引比较复杂,对标引人员要求很高,标引成本高,适用于管理数量有限的正式出版物,但用来标引类似网页这样的信息资源成本太高。
因此,网页资源的描述普遍采用了更加轻便、灵活的元数据描述格式。由于计算机将MARC作为单独的数据库进行管理,MARC与其所描述的对象本身仍然是分离的,这导致MARC数据的可读性较差,对软件平台的依赖性较强。二、档案MARC与档案元数据、档案著录规则的比较单元数据之间的映射是实现资源互操作和一站式服务的基础。数字图书馆在建设之初主要采用MARC格式进行数据描述。随着图书馆网络化服务的增加,只采用MRC格式进行资源描述已经难以满足需求,因此需要将MARC格式转换为网络环境下的元数据格式,如DC格式。三、MARC与元数据之间的映射转换档案数据库建设的原则与要求03010203缩短档案检索时间,提高接待利用效率提高查全率,降低档案调卷量利用全文数据,保护档案原件一、档案数据库的价值1234标准化安全性科学性服务性二、档案数据库的建设原则三、档案数据库的建设要求(1)数据库管理系统的选择应充分考虑用户所需的数据容量;数据结构设计应符合检索优先的原则,能够以DBF文件格式或通过XML文档进行数据交换,并具备安全、合理、灵活等特性。(2)数据项的设置应符合
《档案著录规则》及
《中国档案机读目录格式》的要求。(3)系统应提供键盘录入、文件扫描和直接接收电子文件等多种档案数据输入方式。(4)具有文档一体化功能的档案管理软件,应能保证系统内文件处理部分录入数据的格式与档案数据对应项目的格式完全一致,并能根据归档标识实现归档文件的有效迁移。(5)具有图纸管理功能的档案管理软件,其录入图纸的幅面与精度应满足用户的应用要求。(6)各种不同类型的档案数据,其文件格式均应尽量采用不同标准格式。(7)确需采用专用
(非通用)格式的,应能根据需要实现与通用格式之间的转换。档案数据库设计04单一、数据模型概述
物理层是数据抽象的最底层,用来描述数据物理存储结构和存储方法。
逻辑层:逻辑层是数据抽象的中间层,描述数据库数据整体的逻辑结构。这一层的数据抽象称为逻辑数据模型。
概念层是概念层次的数据模型,称为概念数据模型。概念数据模型离机器最远,从机器立场看是抽象级别的最高层。单一、数据模型概述
概念层应该:(1)语义表达能力强,能够方便、直接地表达各种语义。(2)易于用户理解。概念数据模型是用户与数据库设计人员之间交流的语言。用户一般缺乏计算机知识,因此概念数据模型应当简单、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园防洪防灾责任制度
- 医疗损害机构责任制度
- 小学全员安全责任制度
- 总分包安全生产责任制度
- 基建项目管理责任制度
- 仓库试用期岗位责任制度
- 参会人员岗位责任制度范本
- 外场服务安全责任制度
- 健全融资管理责任制制度
- 采集员岗位责任制度范本
- 青海国家电网2026年高校毕业生招聘第二批笔试参考题库及答案解析
- 2026及未来5年中国铁路信号微机监测系统行业市场运营态势及未来趋势研判报告
- 2025至2030中国服装市场运行分析及发展前景与投资研究报告
- 2026年新修订《医疗器械经营质量管理规范》培训考核试题及答案
- 2025-2030中国DNA测序行业市场发展趋势与前景展望战略研究报告
- 2026年四川德阳市社区工作者考试真题及答案
- 2025年南京城市职业学院单招综合素质考试试题及答案解析
- 2026年山东传媒职业学院单招文化素质模拟试题
- 《水产养殖用复合单过硫酸氢钾》团体标准编制说明(征求意见稿)
- 2026年包头铁道职业技术学院单招职业适应性测试题库附答案详解(考试直接用)
- 2026广东韶关南雄农商银行春季校园招聘笔试备考题库及答案解析
评论
0/150
提交评论