基于XML电子公文归档数据结构规范.doc_第1页
基于XML电子公文归档数据结构规范.doc_第2页
基于XML电子公文归档数据结构规范.doc_第3页
基于XML电子公文归档数据结构规范.doc_第4页
基于XML电子公文归档数据结构规范.doc_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于XML电子公文归档数据结构规范(报批稿)天津市档案局2006年5月8日目 录1.范围12.规范性引用文件13.电子公文归档数据结构描述14 数据结构组成要素描述44.1说明文件44.2文件级目录44.3归档文件夹44.3.1 归档文件属性44.3.2 文件修改或承办信息44.3.3 草稿、修改稿、审核稿44.3.4 签发稿54.3.5 版式公文54.3.6 元数据54.3.7 日志文件55.各组成要素及其XML描述55.1 文件级目录55.1.1条目信息65.2 归档文件属性75.2.1 电子文件特征75.3 归档文件元数据85.3.1标识信息95.3.2 内容信息95.3.3 背景信息105.3.4 结构信息115.4 日志文件12附录A文件级目录数据结构规范模式14附录B 归档文件属性数据结构规范模式15附录C 元数据结构规范模式16附录D日志文件数据结构规范模式1818基于XML电子公文归档数据结构规范1.范围本规范规定了电子公文归档过程中所需数据文件信息组织方式、存储结构及其基于XML数据体描述的规则和方法等。本规范适用于电子公文归档信息的生成、存储与交换。2.规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GBT 188942002电子文件归档与管理规范GBT 187932002 信息技术可扩展置标语言(XML)1.0DA/T 12000 档案工作基本术语DA/T 18 档案著录规则DA/T 22 归档文件整理规则国家档案局令第6号 电子公文归档管理暂行办法W3C XML Schema Part0:Primer XML模式 第0部分:简介W3C XML Schema Part1:Structures XML模式 第1部分:结构W3C XML Schema Part2:Datatypes XML模式 第2部分:数据类型W3C extensible Markup Language(XML)1.0(Second Edition) 可扩展置标语言(XML)1.0(第2版)W3C Namespace in XML XML的名字空间(Namespaces)3.电子公文归档数据结构描述为了保证电子文件真实性、完整性、有效性和长期可读性,本标准以归档环节为关键点,收集捕获电子公文形成的内容、背景、结构信息以及公文办理的过程文件等。将电子公文从形成、办理到归档所形成的不同版本的电子公文及其元数据采用有利于数字档案信息长期保存和可存取的数据结构进行存储与交换。该结构采用树形结构进行存储,每一存储载体只有一个根目录,一般以“组织机构代码-年度”设置根目录名称,但必须按保管期限相对集中存储。根目录下可再设文件夹,分别管理不同类型、不同保管期限的电子公文。具体数据结构如下图所示:4 数据结构组成要素描述同一年度形成的归档电子公文应保存在同一载体中,每一载体的根目录中应包括说明文件、文件级目录及多个归档文件夹。一般情况下,文件级目录有多少条,就应有多少个归档文件夹与其对应。4.1说明文件文件名称为说明文件.TXT。用于记录各种有助于说明本年度归档电子公文及载体的信息,包括载体编号、移交单位、文件件数、制作单位、制作人、制作时间、检查人等。4.2文件级目录文件名称为文件级目录.XML。主要指按照一定的次序、体例编排面成的条目组合,一般包括:全宗号、保管期限代码、年度、归档机构代码、件号、文件标题、责任者、保管期限、文件编号、日期、文种、归档机构、密级、保密期限、页数等著录项目。4.3归档文件夹归档文件夹的名称以电子文档号来命名,一件电子公文保存在一个归档文件夹中,用于保存应归档的不同版本的电子公文如草稿、修改稿、审核稿、签发稿、版式公文,以及归档文件属性、归档元数据信息、日志文件等内容。 4.3.1 归档文件属性文件名称为归档文件属性.XML。用于描述一件归档电子公文所有信息的电子特征,如一条记录带有不同稿本如签发稿、正式公文、拟稿单或承办单,那么此文件中应有三条记录,每条记录应包括:过程文件、文件格式、文件大小、页数等信息。4.3.2 文件修改或承办信息指公文流转过程或签批过程的信息。一份归档电子公文如是发文应带有拟稿单,如是收文应带有承办单,拟稿单和承办单必须归档、保留。其格式允许使用XML、PDF、CEB、SEP、TIFF、JPEG、TXT、RTF、DOC、WPS等。4.3.3 草稿、修改稿、审核稿主要指公文办理过程中产生的不同版本。可根据具体情况进行取舍,对于重要公文要保留历次的修改稿,一般情况下不保留。版本的格式允许使用XML、PDF、CEB、SEP、TIFF、JPEG、TXT、RTF、DOC、WPS等。4.3.4 签发稿指发文机关领导人对公文进行最后审定、签署的稿本。一般情况下必须保留。其格式允许使用XML、PDF、CEB、SEP、TIFF、JPEG、TXT、RTF、DOC、WPS等。4.3.5 版式公文指正式的电子公文,一般情况下必须保留。其格式允许使用XML、PDF、CEB、SEP、TIFF、JPEG、TXT、RTF、DOC、WPS等。4.3.6 元数据文件名称为元数据.XML。主要用于记录每一份电子公文的必备和可选元数据信息。其中必备元数据包括电子文档号、文件标题、责任者、保管期限、文件编号、日期、文种、签发人、归档机构、密级、保密期限、过程文件、文件格式、文件大小、页数。可选元数据包括分类号、主题词或关键词、内容描述、附件信息、归档时间、主送者、抄送者、语种、行文依据、相关信息、电子公文类别代码、信息系统描述、操作环境描述,阅读软件描述、数字签名描述等。4.3.7 日志文件文件名为日志文件.XML。主要用于记录每一份电子公文从生成、办理直至归档过程中所作的任何操作,如谁起草的公文,谁对公文进行了改动等信息,每一份公文的任何改动都应记录在日志文件文件中,通过日志文件可以反应出该份公文的操作过程。5.各组成要素及其XML描述5.1 文件级目录XML标记:文件级目录。值 域:不作要求。Schema定义:见表1。元素:文件级目录 表1层次模型注释源代码5.1.1条目信息XML标记:条目信息。值 域:不作要求。Schema定义:见表2。元素:条目信息 表2层次模型注释源代码5.2 归档文件属性XML标记:归档文件属性。值 域:不作要求。Schema定义:见表3。元素:归档文件属性 表3层次模型注释源代码5.2.1 电子文件特征XML标记:电子文件特征。值 域:不作要求。Schema定义:见表4。元素:电子文件特征 表4层次模型注释源代码5.3 归档文件元数据XML标记:元数据。值 域:不作要求。Schema定义:见表5。元素:元数据 表5层次模型注释电子公文归档数据结构源代码电子公文归档数据结构 5.3.1标识信息XML标记:标识信息。值 域:不作要求。Schema定义:见表6。元素:标识信息 表6层次模型注释源代码 5.3.2 内容信息XML标记:内容信息。值 域:不作要求。Schema定义:见表7。元素:内容信息 表7层次模型注释源代码 5.3.3 背景信息XML标记:背景信息。值 域:不作要求。Schema定义:见表8。元素:背景信息 表8层次模型注释源代码 5.3.4 结构信息XML标记:结构信息。值 域:不作要求。Schema定义:见表9。元素:结构信息 表9层次模型注释源代码5.4 日志文件X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论