XX市档案局档案数字化加工项目_第1页
XX市档案局档案数字化加工项目_第2页
XX市档案局档案数字化加工项目_第3页
XX市档案局档案数字化加工项目_第4页
XX市档案局档案数字化加工项目_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

XX市档案局档案数字化加工项目 第64页XX市档案局档案数字化加工解决方案方正国际软件有限公司目 录1.项目需求分析41.1.项目概述41.2.项目建设内容41.3.项目服务标准52.现场加工管理方案62.1.现场人员管理62.2.现场设备管理62.3.实时监控73.技术方案一:制作PDF格式文件83.1.生产流程配置83.2.资料提取和归档93.3.规范库和工程信息库建设93.3.1.规范库建设93.3.2.工程信息库建设93.4.数字化内容组织103.5.档案整理113.6.档案扫描123.7.图像处理143.7.1.图像数据质量检验143.7.2.图像精细化处理153.7.3.补扫163.8.图像版面分析和基础信息提取163.8.1.工作内容163.8.2.制作标准163.8.3.实现方法163.8.4.输出数据173.9.全文识别和编改173.9.1.工作内容173.9.2.制作标准173.9.3.实现方法183.9.4.输出数据203.10.档案目录著录203.10.1.数据格式选择203.10.2.标引著录203.10.3.录入方式213.10.4.校对方式213.11.单层纯图像PDF文件生成213.11.1.工作内容213.11.2.制作标准213.11.3.实现方法213.11.4.输出数据223.12.双层PDF文件生成223.12.1.工作内容223.12.2.制作标准223.12.3.实现方法233.12.4.输出数据243.13.数据存储243.13.1.存储格式243.13.2.存储文件的命名253.14.数据挂接253.15.数据验收253.16.数据备份263.17.数字化成果管理273.18.档案归档273.19.成品数据274.技术方案二:只制作JPEG格式文件294.1.生产流程配置294.2.资料提取和归档304.3.规范库和工程信息库建设304.4.数字化内容组织304.5.档案整理314.6.档案扫描314.7.图像处理314.8.档案目录著录314.9.数据存储314.9.1.存储格式324.9.2.存储文件的命名324.10.数据挂接324.11.数据验收334.12.数据备份334.13.数字化成果管理344.14.档案归档344.15.成品数据345.项目服务方案365.1.服务承诺365.2.数据交付和验收365.2.1.方正自检部分365.2.2.合格数据验收375.3.项目实施进度安排和资源配置375.3.1.工期要点375.3.2.本项目扫描仪等设备的配备数量(暂定)385.3.3.任务的划分(暂定)395.3.4.扫描生产计划(暂定)405.4.售后服务405.4.1.实时远程技术支持服务405.4.2.热线电话415.4.3.技术服务网站支持415.4.4.现场技术支持服务415.5.培训415.5.1.数据管理维护培训415.5.2.相关技术培训42附录一:公司介绍43(1)公司总体情况43(2)方正数据处理中心介绍44(3)公司资质与荣誉45(4)方正的优势46附录二:成功案例48(1)国礼中华数字书苑48(2)新闻出版总署49(3)国家图书馆地方志第四期数字化加工方案介绍49(4)天一阁50(5)民国期刊库50(6)国学要览数据库51附录三:方正博通数字档案管理平台52(1)目前产品版本52(2)方正博通数字档案管理平台软件概述52(3)方正博通应用领域53(4)方正博通产品优势63(5)产品运行环境63(6)硬件部署建议641. 项目需求分析1.1. 项目概述XX市档案局十分重视档案资源建设。截止目前,馆藏档案全宗达到100个,计37637卷册,排架长度560米,其中包括革命历史档案和建市以来的文书档案、专业档案、特色档案、荣誉档案及寄存档案等。馆藏档案的来源,一是定期接收市直机关、团体及部分企业单位应进馆档案及撤销单位档案;二是收集、征集散存于社会的有深存价值的档案;三是通过馆际交流从其它档案馆复制的与XX市有关的档案材料。客户简介为进一步提高档案服务水平,完善信息化建设,XX市档案局推出了本次“档案数字化加工项目”的规划建设,通过项目的实施,实现一般人员基础的调阅功能、研究机构和管理部门深层次的调查研究和管理应用的功能,提高办事效率和服务水平,具有十分重要的科技创新意义。1.2. 项目建设内容本项目建设目标是对XX市档案局的档案资料进行数字化应用开发,接入方正提供的方正博通数字档案管理平台实现档案数字化系统应用。关于方正博通数字档案管理平台的详细介绍请参见附录三:方正博通数字档案管理平台。方正提供数字档案管理平台针对本项目,方正提出两种解决方案,一是通过图像识别编改制作PDF格式文件,最终提供的成品数据有PDF格式文件、JPEG格式文件、XML文件及TIF文件;二是只制作JPEG格式文件,不提供PDF格式文件,最终提供的成品数据有JPEG格式文件、XML文件及TIF文件。提供两种解决方案供选择1.3. 项目服务标准(1) 档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,以满足采购方对档案利用的需求。(2) 档案的数字化,必须符合国家档案开放规定以及有关规定,如中华人民共和国档案行业标准DAT 312005档案数字化技术规范、中华人民共和国档案法、档案著录规则(DA/T 181999)、档案分类标引规则(GB/T 1541894)等。(3) 加强档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。(4) 档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。2. 现场加工管理方案本项目按照XX市档案局保密要求采取现场加工的生产模式。XX市档案局提供必要的办公场所和电力等工作条件,方正提供人员、加工设备和软件平台,并按照XX市档案局的保密、安全要求去进行设备处理及网络布线,以及数字化加工中的软硬件,网络的维护工作。遵照CMMI和ISO/IEC27001-2005对信息安全管理的要求并结合XX市档案局档案加工保密特性,方正签订保密协议,在XX市档案局的档案数字化加工过程中履行信息安全保密责任,具体体现在人员管理、设备管理和实时监控三方面。2.1. 现场人员管理l 现场服务人员资料在XX市档案局备档,办理加工场地现场出入证明。l 现场服务人员不得携带任何带有存储、照相功能的设备进入现场。l 现场服务人员需签订XX市档案局档案数字化生产加工保密协议,明确工作人员的保密义务和责任。2.2. 现场设备管理l XX市档案局档案数字化生产加工过程中现场所使用的扫描设备,按涉密设备进行管理和使用,不使用无保密保障的扫描设备。l XX市档案局档案数字化生产加工所使用的计算机及其存储介质,应当严格遵守计算机有关保密管理规定。l 服务区域内网络与其他网络完全物理隔离。不得安装具有无线互联功能的硬件模块和联接无线鼠标、键盘等无线互联的外围设备。任务完成后,应当继续按涉密计算机使用、管理,或者拆除硬盘。l 使用的移动硬盘、U盘、光盘等存储介质,按涉密载体进行管理,不得在非涉密计算机及其网络上使用。2.3. 实时监控按照信息安全管理体系ISO27001的要求,对加工现场实施24小时实时监控,及时掌握现场加工状态,保证现场加工信息安全。3. 技术方案一:制作PDF格式文件3.1. 生产流程配置参考中华人民共和国档案法、档案数字化技术规范(DA/T 31-2005)和电子文件归档与管理规范(GB/T18894-2002)等档案数字化加工国家法律法规,同时按照本项目档案资料特点,结合XX市档案局要求和方正多年数字化经验,方正专门配置的生产加工流程,力求做到扫描效率高、图像扫描清晰、数据不丢失、档案不凌乱、不损坏恢复原样、安全。其加工流程如下:以上是根据数字化加工需求所配置的流程,在此基础上根据数据规格和加工质量要求,将对基本环节的工艺进行进一步配置,方正按照以上加工要求定制一套生产加工流程并配置生产流程软件系统。 以下为详细介绍:3.2. 资料提取和归档l 方正到用户指定地点下架提取需加工档案,登记明细并打包运至指定的加工场地,提供现场加工服务。档案提取登记表:序号档号卷数借出日期借卷人还卷日期档案接收人备注1001-010102009.1.1张三2009.1.3李老师2011-020102009.1.1张三2009.1.3刘老师3021-030102009.1.1张三2009.1.3李老师l 方正在档案数字加工过程中,对扫描档案进行编号和批次处理,形成基本的核对流程,杜绝漏扫或重复扫描情况出现。l 所有档案保证做到不损坏、不损失、原样归还。l 方正将已加工完成后的档案按照批次及时归还。3.3. 规范库和工程信息库建设3.3.1. 规范库建设针对需进行加工的档案,建立基本属性对应的著录项目,并生成基本目录规范数据,同时为规范数据建立相应的代码识别体系,该代码识别体系将贯穿整个工程的信息交换和数据交换,避免出现信息和数据不一致的情况。结合目录规范数据并通过智能检测模块可以有效的避免在数字化过程中可能出现的漏扫、重扫等情况。3.3.2. 工程信息库建设通过对档案进行归类整理,在规范库基础上,根据工程各环节所需要公用的基础信息,将档案的基础著录项目抽取成为资料内部特征,建立信息标引配置数据库和相关流水线工艺文档,制定项目评价标准和环节控制标准等。工程信息库与方正业务流程管理系统挂接,工程信息库在整个工程实施中会围绕基础信息,随着数据流转不断增加相关的信息,通过方正业务流程管理系统,可以实时的掌握每一批次、每卷档案的生产进展和所处环节,也能掌握到数据的状态、收发时间、生产责任人等相关信息。3.4. 数字化内容组织l 内容组织按照生产模式,多卷档案可以形成一个批次,每个批次都有一个唯一的编号。每卷档案在加工过程中也要形成一个唯一标识号。档案以整卷为单位进行数字化处理,形成对应的各种过程数据和结果数据,如扫描影像数据、图像属性数据、索引信息XML文档等各类文档。所有档案案卷都包含档案编号等著录项目必备的相关属性信息。卷内文件按照目录数据著录。对照档案原件,著录卷内文件索引信息的所有项,同时可以根据采购方的需要建立其他自定义的索引项。l 数据命名图像存储文件(PDF格式、JPEG格式、TIF格式)、索引信息格式文件(XML 文件)命名规则描述如下:1. PDF格式文件、JPEG格式文件、TIF格式文件:PDF文件、JPEG文件、TIF文件的命名以每卷案卷目录的目录项顺序统一编页后,每个文件都用唯一的页码标识。2. 著录索引信息XML格式文件:一个图像文件对应一个索引信息文件,所以索引信息文件的命名同样以每卷案卷目录的目录项顺序统一编页后,每个索引信息文件和图像文件同名。l 存放规则档案加工过程中的文件存放规则是按照每卷档案为一个根目录文件夹, 文件夹内存放按照案卷目录排序的所有图像文件和索引信息文件。以下是部分重要的数据加工环节介绍:3.5. 档案整理 目录数据准备按照档案整理办法的相关要求,规范档案中的目录。核对案卷信息,包括基本目录项信息以及其他可自定义目录项信息。按照档案著录规则(DA/T18)等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。 区分扫描件和非扫描件 在案卷领取交接后,将档案分类为加急扫描和普通扫描两种,一般流程设定下,加急档案3小时内完成扫描任务,普通档案24小时内完成任务。在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。 页面处理破损严重、无法直接进行扫描的档案,由XX市档案局专业人员先进行技术修复,折皱不平影响扫描质量的原件,按照档案管理规定先进行相应处理(压平或烫平等)后再进行扫描。 档案整理登记1. 确认档案袋内目录的记录是否与档案资料相符;2. 对档案袋的资料按照案卷目录上的目录项进行排序,并统一进行页码的编排;3. 如有目录与档案资料不符的情况,修改错误并进行相关信息记录。3.6. 档案扫描参照国家档案局颁布的档案数字化技术规范中关于档案扫描的要求,方正制定以下扫描方案。 扫描分辨率及色彩模式按项目要求,选择合适的扫描分辨率及色彩模式。图像文件采用300DPI分辨率的彩色扫描模式,其余档案采用300DPI分辨率的黑白扫描模式。 扫描方式扫描设备为平板式扫描仪或高速扫描仪。纸张状况较差,过薄、过软或超厚的档案,通过使用平板扫描方式确保不损坏原始档案,对于纸张较好的档案用高速扫描仪进行扫描。对于纸质太薄出现透字现象的要采用衬纸的方式进行扫描,保证图像的清晰度。 扫描登记l 对同一档案编号的文件及其附件,按目录号进行存储,不乱序,不混档,与目录进行挂接;l 不允许有折叠或缺损,保证图像的完整、端正、无扭曲;l 填写档案扫描过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。注:因客户资料不能公开,遵照ISO27001的信息安全管理要求和与客户签订的数据保密协议,以下图片均经过处理。【档案扫描界面】【档案扫描设置界面】3.7. 图像处理参照国家档案局颁布的档案数字化技术规范中关于档案扫描的要求,方正制定以下图像处理方案。3.7.1. 图像数据质量检验图像数据质量检验是扫描过程中重要环节。检验人员通过对档案原件与扫描影像的比较,对扫描影像的清晰、位置、格式、完整、次序等做出判断,提交改正或通过。三级校对管理软件避免了日后的错误。质量管理是本软件生产平台的最大亮点。扫描时员工必须按照正确方法进行扫描:张数不对,无法通过;质量不好无法通过。否则系统提示无法提交下一步工序。在质量检验中,必须通过严格的三级质量检验,否则打回重扫,再校对,最终通过总检,方可进入数据库。质量管理软件如下图所示:注:因客户资料不能公开,遵照ISO27001的信息安全管理要求和与客户签订的数据保密协议,以下图片均经过处理。3.7.2. 图像精细化处理l 纠斜后的图像四角成90度,图像内容居中;l 调整明暗度或对比度,去除版面污点,达到所有版芯外的污迹都去除掉;l 去图像黑边,裁边等;尽可能达到好的色彩、对比度还原等要求;l 对大幅面档案进行分区扫描形成的多幅图像后进行拼接处理,合并为一个完整的图像;l 对案卷中遗漏编目的页面进行合页处理,确保扫描好的影像页数与原案卷页数;l 保证扫描图像字迹清晰、颜色恰当,正文文字可以看清楚。l 将通过精细加工的原始扫描图像压缩成300DPI的JPG格式,存储成单页JPG,并将封装好的文件存储到相应文件夹中。填写档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,若原档案有残缺、污损等影响阅读的情况,若扫描处理无法解决时,需要在相应版面处添加说明,同时需在readmetxt文件中记录说明,并及时与用户联系协商处理办法。注:因客户资料不能公开,遵照ISO27001的信息安全管理要求和与客户签订的数据保密协议,以下图片均经过处理。【图像处理前后情况示意图】3.7.3. 补扫图像扫描整个加工过程需要通过三级校对环节,对个别被判定不合格的影像文件打回重扫,直至通过总检,合格备份。3.8. 图像版面分析和基础信息提取3.8.1. 工作内容对图像处理环节完成的档案图像文件进行版面分析和信息提取工作,主要标注档案版面文字块、图像块、纹饰块和颜色信息等等版面信息,为后期版面识别和版面合成提供数据基础。3.8.2. 制作标准分类标准版面画框根据文字区域、插图区域和纹饰区域进行画框字体标注对于版面中的不同字体详细标注字号标注对于版面中的不同字号详细标注图像属性标注标注图像的精度、图像模式(黑白、彩色)3.8.3. 实现方法运行方正标引程序,将档案图像文件根据需求依次进行版面分析,以达到能够让识别程序进行正确识别,且识别出来的文字,阅读顺序正确。要求:1、 版面分析准确,栏目层次分明,文章主题明确,清楚文章的阅读顺序。2、 版面分析操作一定要规范,避免出现漏标(指整篇文章、一段文字或一行文字)、多标、错标、重框、压框(压图片、压表格、压字等)等问题。3、 标引内容:从前往后标(正文不标引);若遇到下转、上接的文章时,注意文章阅读顺序完整。4、 需要标引内容:包括文件名、案卷号、顺序号、文号、责任者、题名、日期、页号、保管期限、页密级等。3.8.4. 输出数据带有版式信息的中间文件,根据XX市档案局的要求输出AMF文件前置文件GNS文件。3.9. 全文识别和编改3.9.1. 工作内容将档案图像版面分析后生成的过程文件直接导入识别软件进行全文识别,全文识别是个批量处理的工作,识别后文件对文字进行编改校对,生僻字进行著录和造字后导入方正自主研发的XML制作工具生成本项目要求的XML文件。3.9.2. 制作标准档案XML文件标准文字要求文字准确,造字、特殊符号用“”代替表格要求表格在XML文件中不体现公式要求公式在XML文件中不体现段落要求段落之间只能有上一段落的回车和下一段落的两个全角空格,不能有其他内容。换行的回车需要去除文章开始处要求文章内容每个段落开始要求有两个全角空格,结束要求有回车文字正确率要求文章XML综合差错率不超过万分之一3.9.3. 实现方法本环节根据全文内容进行自动文本识别处理,并依据质量规范对识别后的文本进行编改和校对处理,保证文字的准确性。l 全文识别采用方正自主知识产权的识别核心,并结合其他的识别技术,采用复杂的集成投票判别算法,大幅度降低OCR的误判率,提高自动辨识效果,确保文字质量可控。全文识别在版面分析的基础上,对于各个制定的文字区域进行自动识别。在初次识别结果上,进行系统一级的优化处理,提炼出识别相似度较低、易错字、或无法识别的文字,进行加扰处理并组合后进入校对环节。对于系统判定识别正确度文字,进行另外的组合进入检查环节。l 录入全文识别软件对于无法识别的内容,提供与原图对照录入的功能,提高录入效率,并可以原图上标记识别困难的模糊字、无法输入的冷僻字(缺字)和认同字。将每幅图像内所显示的文字,由人工利用方正新典码输入法输入在与图像文件同名的指定格式文档中。l 编改在本项目中按照所要求的文字错误率标准,设置生产线并制定强化环节控制和增加校对批数,以保障全局的文字质量。 除中文之间的标点符号为全角,其它全部在英文状态下输入(原则是规定为分割符号的必须半角,其他的以原内容为准)。 编改中打不出来的字用代替,并要记录,记录要统一。为有效地随时监控校对效果和校对质量,在校对系统中还内置了一套校对质量智能分析模型,可以自动地甄别基本的工作质量。【示例:采用校对质量智能分析,随时掌握校对过程、智能查错等】对于质量要求更高的内容,可重新配置工艺,设立多层次的质量保证体系,包括采用多人不同方法同时处理、电脑校验、多人采取不同方法同时核对等手段杜绝全部错误。校对方法包括:语义智能机器校对、字形自动比对、人工易错字/词校对、OCR易错字/词校对、地名/人名/词语校对等。为了保证作业在第一时间就符合质量要求,利用信息系统支持流水线作业的特点,对员工在文字校对作业环节进行严格的强化培训,使他们能够达到很高的准确率水平。同时,方正还充分利用技术手段通过处理系统内部内置的程序进行质量控制,依据质量指标要求设置系统参数,在校对环节不达标时系统拒接回收提交的数据。l 导出XML文件通过自主研发的AMF转XML工具,将全部的档案AMF文件批量转换成XML文件,如下图所示:3.9.4. 输出数据包含有文章著录项的每份档案XML文件。3.10. 档案目录著录3.10.1. 数据格式选择目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。3.10.2. 标引著录标引著录为了方便查阅与管理,打印制作档案目录及档案封面,对文字录入的准确性要求较高,但要录的文本域并不是完全统一的在某一页面上,一些文本域要在多个文件中选择,所以录入时需要相关学部专家进行指导,确保文本域录入的准确率。对所需录入的文本进行标引、或对不同类别的档案录入特征制作相应的文字录入说明,供录入员和校对人员参考。3.10.3. 录入方式由于文本类型不一,有印刷体、手写体、有表格内的也有表格外的文本信息,所以采用手工录入和OCR软件相结合的方式录入。即手写体或不清晰的印刷体采用手工录入,较规整的印刷体采用OCR技术的录入方式。3.10.4. 校对方式校对以软件校对和打印输出对比校对相结合的方式,即对手工录入和OCR自动录入的文本打印输出进行对比校对的一校、二校、抽查校对,确保索引信息错误率达到出版质量万分之一以下。3.11. 单层纯图像PDF文件生成3.11.1. 工作内容将经过图像处理后的单页图像文件加工后制作生成单层纯图像PDF文件。3.11.2. 制作标准分类标准PDF图像要求纯图像PDF文件所使用彩色为300dpi初始设置PDF初始放大率设置为“适合页面”3.11.3. 实现方法将图像处理完成并符合质量要求的图像文件整理分类后,通过PDF批量转换工具生成单层纯图像PDF文件。【示例:采用PDF还原系统还原PDF版面数据】3.11.4. 输出数据本环节加工完成后生成每张图像文件的单层纯图像PDF文件。3.12. 双层PDF文件生成3.12.1. 工作内容将经过全文识别和编改后的档案图像文件加工后制作生成双层PDF文件。3.12.2. 制作标准分类标准PDF图像要求图像所使用的图片格式为JPG,精度为300dpi,要求保证图片显示比例200%以内清晰的基础上进行压缩,压缩后符合JBIG2、JPEG2000标准的最大压缩比PDF完整性 PDF的数据要完整,保证无缺页、重页,页码顺序颠倒的情况发生PDF图像与文字对位双层PDF文件的图像层和文字层的文字对位准确,反显区域与文字区域相差1毫米以内PDF图像质量打开一份电子档案阅览并对文字放大时,保证在放大到百分之二百的时候,字迹清晰,笔画连续,无断裂、缺块的现象初始设置PDF初始放大率设置为“适合页面”PDF文字部分通过版式还原以代码格式显示,不以图片形式展示,并保持与原档案一致的排版格式。文字所使用的字体以“已嵌入子集”方式嵌入PDF文件。缺字用矢量造字补缺,对应文本统一为“”PDF表格、公式、格式等特殊符号档案中特殊符号、复杂数学公式以图片形式展示。特殊符号对应文本统一为“”,数学公式对应文本为计算机通常可输入的表达式,如公式中存在一些无法输入的符号按特殊符号处理综合差错率每个PDF综合差错率小于万分之一PDF文字处理PDF版面文字的字体、字号、字间距和行间距与原档案保持一致3.12.3. 实现方法采用专用的软件,对修整后的档案图像进行自动文字识别和编改,合成一个完整的双层PDF文件,图像在下,文字在上,文字层采用透明属性。完成双层PDF版面还原的基础工作后,建立对应档案的独立PDF文件。该PDF文件名称与档案标识号规则定义一致,便于调阅。将PDF文字层所使用的字体以“已嵌入子集”方式嵌入PDF文件。1. 对在版面分析后生成的XML文件、版面插图文件和版面纹饰文件采用方正专用的软件,对合格图像、文字等文件全部综合打版合成一个完整的档案双层PDF文件。打版工具如下图所示:2. PDF文件的行距和字间距进行检测和调整后完全和原档案一致。3. 对PDF文件中的文字字体和字号进行定位检测和调整。4. 设置PDF文件初始设置为“适合页面”。5. PDF版面中字体嵌入,效果如下:3.12.4. 输出数据本环节加工结束后生成档案的双层PDF文件。3.13. 数据存储参照XX市档案局要求及国家档案局颁布的档案数字化技术规范中关于档案扫描图像的存储格式及命名要求并结合方正博通数字档案管理平台的入库文件定义,方正制定以下数据存储及命名方案。3.13.1. 存储格式图像文件在保证扫描的图像清晰可读的前提下,存储格式采用JPEG格式、PDF格式及TIF格式存储档案图像。 3.13.2. 存储文件的命名JPEG文件、PDF文件、TIF文件的命名以每卷案卷目录的目录项顺序统一编页后,每个文件都用唯一的页码标识命名。3.14. 数据挂接(1) 汇总挂接档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。(2) 数据关联以档案目录数据库为依据,将每一份档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。(3) 数据入库根据XX市档案局电子档案管理要求,将验收后的档案数据(包括PDF文件、图像数据、XML著录文件等)批量导入方正博通数字档案管理平台,实现档案数据与系统的无缝链接。3.15. 数据验收 (1) 数据抽检以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、PDF文件、图像文件及数据挂接的总体质量。(2) 验收指标l 档案装订:大于10%抽检,检查所有档案的装订还原情况,要求所有抽检档案实体资料完整,装订顺序无差错,无漏、跳编页码,保持同一份文件的完整,托裱、平整和去钉。l 扫描图像检查:大于10%抽检,要求所有抽检档案无漏扫、多扫。l 图像质量检查:大于10%抽检,要求所有抽检图像四角成90度,影像清晰整洁,分辨率合适。l 检索检查:大于10%抽检,目录与图像挂接错误率小于1%。l 目录名称检查:大于10%抽检,要求所有数据目录著录准确。l 页密级检查:大于10%抽检,要求所有文件页密级准确。(3) 验收审核验收“通过”的结论,必须经分管领导审核、签字后方有效。3.16. 数据备份(1) 备份范围将经验收合格的完整数据及时进行备份,包括以下各类数据:l 原始扫描图像文件l 卷内目录信息文件l JPEG格式存储图像l 单层纯图像PDF文件、双层PDF文件l XML文件(2) 备份方式为保证数据安全,备份载体选择硬盘和光盘,采用在线、离线相结合的方式实现多套备份,并实现异地保存。l 伴随工程进行,随时进行多套500G规格硬盘数据备份l 阶段性DVD光盘刻录备份(3) 数据检验备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。(4) 备份标签数据备份后应在相应的备份介质上做好标签,以便查找和管理。(5) 备份登记填写档案数字化备份管理登记表单。3.17. 数字化成果管理参照国家档案局颁布的档案数字化技术规范对数字化成果进行管理:(1) 加强对档案数字化成果的管理,确保其安全、完整和长期可用。(2) 档案数字化成果提供网上检索利用时,有制作单位的电子标识,并根据具体情况分别采用可下载或不可下载的数据格式。3.18. 档案归档在档案实施数字化过程中,方正将根据国家档案文件保护的相关规定对每道工序严格把关,责任到人,加强对档案的保护,保持档案的原样归还。数字化加工结束后,方正将严格遵守加工管理控制流程并参照档案数字化技术规范,严格按照相关流程归还档案,并严格填写档案处理结果表等完成归档交接手续。3.19. 成品数据数据建设文档管理:包括数据结构、数据样板、数据处理流程和规范、数据维护方法等。测试文档管理:对于数据质量、完整性、规范性、一致性、格式化等不同内容的测试文档及报告等。实施培训和服务文档管理:数字化工程实施文档,根据工程建设及发展要求整理的培训和维护文档等。按照数字化工程最终的交付要求,整合各工程环节的文档,并整理出向用户提交的完整内容,包括成品数据:JPEG文件、PDF文件、TIF文件:按要求提交JPEG文件、PDF文件、TIF文件。档案图像XML文件:内容包括档案编号等卷内文件索引信息项,同时还包括用户自定义的信息项。存放形式,成品数据全部用不低于500G的硬盘存储,存储方式如下1) 根目录:硬盘根目录下存放有序的若干文件夹,按照一张DVD光盘的容量,每个文件夹都能独立的刻录到一张DVD光盘;2) 二级目录由若干以案卷编号命名的文件夹及一张记录这些案卷资料基本信息的电子表格组成;3) 三级目录存放各案卷资料的JPEG文件、PDF文件、TIF文件,文件的命名按照统一要求命名。4. 技术方案二:只制作JPEG格式文件4.1. 生产流程配置参考中华人民共和国档案法、档案数字化技术规范(DA/T 31-2005)和电子文件归档与管理规范(GB/T18894-2002)等档案数字化加工国家法律法规,同时按照本项目档案资料特点,结合XX市档案局要求和方正多年数字化经验,方正专门配置的生产加工流程,力求做到扫描效率高、图像扫描清晰、数据不丢失、档案不凌乱、不损坏恢复原样、安全。其加工流程如下:以上是根据数字化加工需求所配置的流程,在此基础上根据数据规格和加工质量要求,将对基本环节的工艺进行进一步配置,方正按照以上加工要求定制一套生产加工流程并配置生产流程软件系统。 以下为详细介绍:4.2. 资料提取和归档参见3.24.3. 规范库和工程信息库建设参见3.34.4. 数字化内容组织l 内容组织按照生产模式,多卷档案可以形成一个批次,每个批次都有一个唯一的编号。每卷档案在加工过程中也要形成一个唯一标识号。档案以整卷为单位进行数字化处理,形成对应的各种过程数据和结果数据,如扫描影像数据、图像属性数据、索引信息XML文档等各类文档。所有档案案卷都包含档案编号等著录项目必备的相关属性信息。卷内文件按照目录数据著录。对照档案原件,著录卷内文件索引信息的所有项,同时可以根据采购方的需要建立其他自定义的索引项。l 数据命名图像存储文件(JPEG格式、TIF格式)、索引信息格式文件(XML 文件)命名规则描述如下:3. JPEG格式文件、TIF格式文件:JPEG文件、TIF文件的命名以每卷案卷目录的目录项顺序统一编页后,每个文件都用唯一的页码标识。4. 著录索引信息XML格式文件:一个图像文件对应一个索引信息文件,所以索引信息文件的命名同样以每卷案卷目录的目录项顺序统一编页后,每个索引信息文件和图像文件同名。l 存放规则档案加工过程中的文件存放规则是按照每卷档案为一个根目录文件夹, 文件夹内存放按照案卷目录排序的所有图像文件和索引信息文件。以下是部分重要的数据加工环节介绍:4.5. 档案整理参见3.54.6. 档案扫描参见3.64.7. 图像处理参见3.74.8. 档案目录著录参见3.104.9. 数据存储参照XX市档案局要求及国家档案局颁布的档案数字化技术规范中关于档案扫描图像的存储格式及命名要求并结合方正博通数字档案管理平台的入库文件定义,方正制定以下数据存储及命名方案。4.9.1. 存储格式图像文件在保证扫描的图像清晰可读的前提下,存储格式采用JPEG格式及TIF格式存储档案图像。 4.9.2. 存储文件的命名JPEG文件、TIF文件的命名以每卷案卷目录的目录项顺序统一编页后,每个文件都用唯一的页码标识命名。4.10. 数据挂接(1) 汇总挂接档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。(2) 数据关联以档案目录数据库为依据,将每一份档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。(3) 数据入库根据XX市档案局电子档案管理要求,将验收后的档案数据(包括图像数据、XML著录文件等)批量导入方正博通数字档案管理平台,实现档案数据与系统的无缝链接。4.11. 数据验收 (1) 数据抽检以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。(2) 验收指标l 档案装订:大于10%抽检,检查所有档案的装订还原情况,要求所有抽检档案实体资料完整,装订顺序无差错,无漏、跳编页码,保持同一份文件的完整,托裱、平整和去钉。l 扫描图像检查:大于10%抽检,要求所有抽检档案无漏扫、多扫。l 图像质量检查:大于10%抽检,要求所有抽检图像四角成90度,影像清晰整洁,分辨率合适。l 检索检查:大于10%抽检,目录与图像挂接错误率小于1%。l 目录名称检查:大于10%抽检,要求所有数据目录著录准确。l 页密级检查:大于10%抽检,要求所有文件页密级准确。(3) 验收审核验收“通过”的结论,必须经分管领导审核、签字后方有效。4.12. 数据备份(1) 备份范围将经验收合格的完整数据及时进行备份,包括以下各类数据:l 原始扫描图像文件l 卷内目录信息文件l JPEG格式存储图像l XML文件(2) 备份方式为保证数据安全,备份载体选择硬盘和光盘,采用在线、离线相结合的方式实现多套备份,并实现异地保存。l 伴随工程进行,随时进行多套500G规格硬盘数据备份l 阶段性DVD光盘刻录备份(3) 数据检验备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。(4) 备份标签数据备份后应在相应的备份介质上做好标签,以便查找和管理。(5) 备份登记填写档案数字化备份管理登记表单。4.13. 数字化成果管理参见3.174.14. 档案归档参见3.184.15. 成品数据数据建设文档管理:包括数据结构、数据样板、数据处理流程和规范、数据维护方法等。测试文档管理:对于数据质量、完整性、规范性、一致性、格式化等不同内容的测试文档及报告等。实施培训和服务文档管理:数字化工程实施文档,根据工程建设及发展要求整理的培训和维护文档等。按照数字化工程最终的交付要求,整合各工程环节的文档,并整理出向用户提交的完整内容,包括成品数据:JPEG文件、TIF文件:按要求提交JPEG文件、TIF文件。档案图像XML文件:内容包括档案编号等卷内文件索引信息项,同时还包括用户自定义的信息项。存放形式,成品数据全部用不低于500G的硬盘存储,存储方式如下4) 根目录:硬盘根目录下存放有序的若干文件夹,按照一张DVD光盘的容量,每个文件夹都能独立的刻录到一张DVD光盘;5) 二级目录由若干以案卷编号命名的文件夹及一张记录这些案卷资料基本信息的电子表格组成;6) 三级目录存放各案卷资料的JPEG文件、TIF文件,文件的命名按照统一要求命名。5. 项目服务方案5.1. 服务承诺针对本次档案项目,遵照ISO/IEC 27001信息安全管理体系和ISO 9001质量管理体系的要求,方正在档案扫描服务项目中保证做到以下几点:1 认真规划,做到流程科学、管理科学,高质量、高速度地做好项目实施的落实工作。2 保证不拷贝档案信息,不泄密档案内容。严格按照信息安全管理规范执行,确保档案资料和数据的安全。3 积极配合委托方实现数字化档案与电子档案系统的无缝衔接入库。 4 对我方提供扫描的档案做长期跟踪服务。项目结束后,保持7x24小时电话支持服务。5.2. 数据交付和验收5.2.1. 方正自检部分1 对项目组准备提交的合格数据,方正提前检查验收。2 数据的抽查不低于30,抽查的数据影像合格100。3 对存在的问题较小时提出整改通知,对质量问题严重时责令停产整顿。4 在数据交付前,组织质量检验的同时,再次挂接检查,保证条目、影像的关联。5 每月上交一次数据。6 成立数据交付小组,配合XX市档案局验收。5.2.2. 合格数据验收l 对于已经完成全部工序的影像数据、著录数据,以抽检的方式检查总体质量。l 一个全宗的档案,数据验收时抽检的比率不得低于5。l 目录数据库与图像文件挂接错误码,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”。l 一个全宗的档案,数字化转换质量抽检的合格率达到99以上时,给予验收“通过”。l 合格率:抽检合格率需达到100。l 验收审核:验收“通过”的结论,必须经分管领导审核、签字后方有效。l 验收登记:认真填写档案数字化验收登记表单。5.3. 项目实施进度安排和资源配置5.3.1. 工期要点 扫描工作是一项人员较多的手工、脑力为一体的频繁操作工作,因为员工的长时间疲劳、反应滞后、粗心等错误操作,非常容易产生文件扫描错误。然而每页文件对应一个影像文件、一个条目,一旦错误得不到解决,导入数据库,就无法得到准确查阅,甚至造成整个项目的失败。如何做到扫描质量达标、按时完成进度,确保项目的成功实施,管理工作起着决定因素。为达到以上标准,我们推出工厂式流水线管理方式,结合软件管理流程,从而对项目全过程实行科学控制。 从设计每条流水线操作过程的开始阶段,到数据安全入库,做到责任到人严格检查,如实记录,并及时根据需要调整流程。在实施中,方正更注重于实际工作,配备了各种扫描设备。员工针对档案纸张大小、档案材质、字迹、色泽深浅不匀等情况应用不同设备采用不同的扫描方案,并严格执行扫描流程。加强档案的保护工作,作业中配备档案箱等必要的工具,既保证档案不受损坏,又控制了作业流程的顺序。33人员的配备 (暂定) 根据我们对档案情况的掌握及XX市档案局对生产周期的要求,并结合我们长期扫描生产经验,我们安排本次实施人员分工如下表:合计12人,其中调档、装订、还档工作由项目指挥兼职负责,维修、安全、后勤等人员由上述人员兼职。方正可根据实际的生产任务量和进度要求,随时调整人员数量,以满足任务进度要求。5.3.2. 本项目扫描仪等设备的配备数量(暂定)由三台高端机(平板、高速两用机型)扫描仪,电脑、服务器等组成。如图:将扫描仪分成三个分队,由三台高端扫描仪、电脑等组成。1234561、2号机为彩色(高速、平板)文件扫描仪和计算机,用于A3、A4档案文件扫描、处理;3号机为大幅面档案用扫描仪及计算机,用于大幅面档案扫描;4号机用于标引文本制作;5号机用于数据质检;6号机为文件备份服务器。若干台维修及备用机器不含在内。以上扫描仪机型均为黑白、灰度、彩色三用机器,可根据XX市档案局需要选择扫描方式。5.3.3. 任务的划分(暂定)平均日产能:日产能90009500,可以根据实际进度进行调配:序号工作环节人员数量资质或职责1档案调档1负责从档案室调档,专人负责2档案整理4档案整理工作3档案扫描、档案处理3档案扫描工作4著录、打印2档案目录信息制作、打印5质检2独立的质检部门人员负责质量检验6装订1整理完成的档案按照档案原貌装订7还档1由调档人员负责还档,专人负责8数据备份3实施过程数据“三地”备份,保证数据安全9项目指挥1项目组织、协调,保证项目正常进行方正的人员和设备配备完全能够胜任该次档案信息化工程,特别是在项目实施过程中,我们坚信的是:速度的快与慢更多的取决

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论