数字化档案处理方案_第1页
数字化档案处理方案_第2页
数字化档案处理方案_第3页
数字化档案处理方案_第4页
数字化档案处理方案_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

档案室、档案馆

馆藏档案扫描、数字化加工

整体处理方案

♦♦••♦•]

第一节质数字叱加_L作业前期准备.....

一、数字化工作人员准备.......................1

二、数字化工作软件、硬件准各................4

三、确定数字化内容、数量及顾客需求..........5

笫二节数字化加工流程及重要技术方案.............6

一、入库提卷、拆卷...........................6

二、标引著录.................................7

三、档案扫描.................................8

四、图像处理..................................11

五、全文OCR、生成双层pdf、板式还原及格式…12

六、总质检....................................14

七、批量挂接..................................15

八、还卷及数据备份提交.......................15

第三节质量控制方案和保证措施.....................17

一、加工质量保障措施.......................17

二、多环节,多层次的质量检查体系..........17

三、阶段性验收与终验相结合的严格验收程序是质量控制的终

级保障..................................19

第四节安全保密控制...............................21

保密协议...................................22

第五节售后服务...................................24

项目背景

伴随全国文化信息夷源共享工程与中国数字图书馆工程的起动,信息化已

成为国际时尚,信息资源建设成为当务之急。信息资源建设的重点是电子文献、

各类数据库、网络资源、电子档案、电子图书等新型数字化信息资源的建设。

在数字化信息资源建设中,很大的一种需求是将既有的纸介质印刷品数字化,

使之成为可以用计算机阅读、理解、查询、检索的电子文献,最终将其应用于

数据库存储,或通过CD-ROM、Internet网进行出版,或上传数字档案馆供顾客

使用。

以老式纸张为载体的保留方式,占据了大量的空间,需要特殊的环境,并

且不以便查询,伴随时间出J推移,还面临着腐蚀、老化等问题。而将纸介质文

献信息进行电子化处理,保留到光盘上,具有存储、管理、共享等功能,还可

以减少文献库房占地,节省保管设备和人员方面开支,又以便记录和进行远程

查询。

因此,将档案、期刊、文献等资料通过扫描仪,扫描成图像文献,再通过

处理转换成电子文档,建立目录和索引,制作成电子文献,己是当务之急。

第一节数字化加工作业前期准备

一.数字化工作人员准备

1.甲方人员

职务:现场交接管理人员

人数规定:一名

专业规定:为学校档案馆负责档案管理工作的技术或管理人员。

职责范围:

①.负责与乙方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录

并签字。

②.负责监督乙方规范化加工。

③.随时把握乙方加工进度并进行协调。

④.及时关注并抽查乙方加工质量

⑤,代表甲方与乙方进行及时的沟通及问题协调,保证项目顺利竣工。

2乙方人员

2.1.管理人员

重要为:熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现

场管理及沟通能力的乙方负责人。

2.2.工程技术人员

重要为:熟悉计算机软、硬件技术,理解档案数据库原则和系统开发。理解档案

管理等有关专业知识H勺乙方技术部技术支持工程师。

2.3数据采集作业员

重要为:理解档案数据库数据原则和计算机软件应用等有关知识的乙方数字化制

作部工作人员。

人员

职务职责人备注

员排见表

项目负责人

不一定要常驻

1.负责人员,资源n勺调配工作。

现场,但要通过

2.负责施工组织设计、管理。

一切通讯手段

项目负责3.负责施工条件日勺保障及与甲乙双方

1人和定期到现场

人有关项目进展状态的1汇报和协调工

口勺督导,切实做

作,

管到对该项目加

理工进度和加工

人质量的掌控

1.负责与乙方的档案提卷和还卷等交

接工作

2.负责现场的人员管理和加工管理

现场主管1人

3.负责数据的终验和挂接

4.配合项目负责人做好与乙方的沟通

协调工作。

负责将档案卷内目录及其他索引信息

著录人员1人

进行手工录入为电子数据信息并校对

据负责按制定日勺技术规范将档案资料扫

扫描人员1人

采描

集在进行图像处

人1.去污:将扫描获取的图像进行图像去理的时候,肯定

员污;去黑边及去杂点等;是逐页处理,因

2.纠偏:将偏斜的图像进行纠正处理;此要留心每一

图像处理

3.文字处理:将不清晰的文字进行加深1人页扫描日勺质量,

人员

或变浅;发现扫描质量

4.拼接:.页面较大的图像进行拼接处

问题立即发还

理;上一工序重扫

并作好记录。

矢量化人员最

1.负责将处理好的图像进行全文识别、

终定员需结合

图像矢量2.校对、板式还原和格式转换1-3

矢量化口勺图形

化人员3.对己经产生的成品数据进行初验后人

数量和采集难

移交给现场主管终验并挂接。

度。

二.数字化工作软、硬件准备

1.配置硬件数量及档次要视数据采集工作状况及数据量大小。

2.甲方提供PC机4-6台给乙方作为采集作业使用,其他硬件设备由乙方自行处

理。

3.场地:甲方提供。

4.办公用品:甲方提供打印机(以实际用量为原则)、办公桌椅、档案资料的

装订及打印机所用的所有耗材。

5.其他条件:提供电力和饮水。

软硬件准备详见表3-2

表3-2软、硬件配置列表

软、硬件名称数量详细配置响应时间提供方

1.需支持全文

检索使用功

能。

项目开始需

综合档案管理系统一套2.支持TIFF知甲方

到位

PDF格式数

据的批量挂

接功能。

能满足本加

数字化流程管理和加工项目开始需

全套工项目所有的乙方

软件、OCR软件到位

技术规定

项目开始需

服务器一台甲方

到位

富士通A3幅面项目开始需

扫描仪(A3幅面)一台乙方

FI-4750C(ADF)到位

A4幅面

项目开始需

扫描仪(A4幅面)一台虹光-FB6030乙方

到位

(平板)

项目开始需

计算机4-6套PC机甲方

到位

三.确定数字化内容、数量及顾客需求

在数据采集之前,首先要客观真实记录数字化内容和数量,确定顾客使用需求,

然后制定对应方案和技术控制以便精确地进行施工安排。

表3-3三峡大学档案馆档案数字化顾客需求调研表

档案类型档案数量数字化准备状况纸张及保留状况顾客需求

r档案装订厂很好厂一般「影像化

约一件

招生名册r档案著录

约一面

r档案整理排序「较差r很差r矢量化

厂档案装订「很好「一般r影像化

约一件

学籍档案厂档案著录

约一面

厂较差「很差厂矢量化

r档案整理排序

厂档案装订厂很好厂一般厂影像化

约一件

学生成绩厂档案著录

约一面

厂档案整理排序厂较差「很差厂矢量化

厂档案装订厂很好「一般r影像化

约一件

党群档案厂档案著录

约一面

厂档案整理排序厂较差「很差厂矢量化

厂档案装订厂很好厂一般r影像化

约一件

基建档案厂档案著录

约一面厂档案整理排序厂较差「很差厂矢量化

r档案装订厂很好厂一般「影像化

约一件

科研档案厂档案著录

约一面厂档案整理排序厂较差「很差厂矢量化

其他:

r档案装订厂很好厂一般r影像化

厂档案著录

约一件

厂档案整理排序厂较差「很差厂矢量化

约一面

填表人职务

第二节数字化加工流程及重要技术方案

档案数字化加工重要流程包括:提卷-拆卷-档案著录-扫描-图像处理-OCR-

校对-版式还原-转双层PDF-终验-挂接。

图一档案数字化加工流程图

流程单,

编写页号

档案目量

还卷数据录入

光盘制作档案

目录

光盘移交清单单

电子

文件

总质检数据校对

扫描文件电子

文件

电子

电子文件

文件

装订I--------(文件质检・一{批■挂接)♦—・,■山(图像处理文件扫描

流程单、y流程单、7流程单\y流程单

一、入库提卷、拆卷

1.从档案室移交档案,严格执行原始档案的交接手续,使用双方项目负责人

确认的档案交接清单(完毕清点登记)。

2.档案整顿:编写页码、查对纸质档案页码、对可拆钉日勺文献做拆钉处理以

适应扫描的规定、对需要修复的档案进行归并整顿(假如发现破损严重,无法

直接进行扫描的档案,应先进行技术修复、折皱不平影响扫描质量出J原件应先

进行对应处埋后再进行扫描,发现破损严重的档案须立即报知项目有关负责人)

制作卷内目录,扫描文献抽取

3按照扫描处理量明确交接周期和档案交接量(双方项目负责人签字,以保

在施工过程中等案不损失、不丢失。)

4装订案卷应保证装订牢固,案卷整洁,卷内材料不松动,脱落,保持与原

案卷一致。

图二

档案交接流程图

二、标引著录

按规定将文献所需信息录入到软件数据库里,标引著录按照国家档案局有

关原则结合顾客档案著录日勺详细规定进行。

1.录入方式

采用手工录入的方式

2.校对方式

校对以软件校对和打印输出、对比校对相结合,错误率在万分之二如下。

案卷目录和卷内目录按照档案H勺原始数据录入。卷案目录和卷内目录H勺样

式经顾客同意可做对应调整。对档案目录数据修改和补充的数据,须填写更改

资料、更改资料放入原案卷内,卷内目录及其他不全的需补充完整。

三、档案扫描

1.扫描方式:根据档案幅面W、J大小选择对应规格H勺扫描仪或专业扫描仪进

行扫描。大幅面档案可采用加长式扫描或者图像拼接处理方式处理,同一页面

有两个以上文献,需分别扫描。

2.扫描色彩模式:以黑白二值扫描为主,附有灰度(彩色)照片及原件分明

度很低的档案,可视状况采用灰度和24位真彩色扫描。然后以黑白二值保留。

例:蓝底招生名册,此和档案长见为A3幅面、纸张很薄,底色与文字的分明度很低。实

物档案查看时都显吃力,此种档案假如用黑白二值扫描,则会出现大幅暗面,文字显现不清;

假如使用彩色扫描,文字部分明度很低。只有使用灰度扫描,效果相对好某些,如图三。扫

描后的图像再辅以黑白二值保留,则最大程度日勺提高了图像质量,如图四。

图三灰度扫描效果图四保留为黑白值后H勺效果

谭玉凤女ii6i

11108105011110487^

杨飞i男i16i

20205901521202008U

_1_________

刘畅“i女ii5i

201059014512010073£

1—111

t11

1010C0075611010944冬祥风vd女1151

Li।1।jI

210059002512100068李春霞"女1151

3.辨别率:无全文检索需求的文档辨别率调整为200DPI最为合适。需要全

文检索而做。cr识别的文档,黑白二值扫描辨别率最佳为4()()dpi,此辨别率下识

别成功率最高。24位真彩色扫描辨别率原则为200dpi。

4.图像文献的大小:黑白二值扫描A3页面:20K—40K;灰度或彩色扫描

A3页面:100—150K。

5.如遇字间距和行间距过密、原件自身是复印件等字迹不清晰日勺状况,可

合适增长扫描的辨别率,但要保证图像清晰的同步,又不影响远程查询和浏览

的速度。

6.清晰度:扫描图像字迹清晰、颜色恰当,不适宜过浅或过深,并且不得

出现字迹笔画残缺或字迹笔画叠合而影响阅读的状况,虽然原档案存在锈斑变

质、颜色过浅或深浅不一致,也保证扫描图像可读,扫描留下的墨迹宽度不得

超过0.5厘米,并且指印和黑线不能覆盖或影响正文内容。

7.根据档案实体状况,在档案电子文献中相对应目录设置“复制件”、“原

件不清”标志。目录以原有档案目录为准,在实际处理过程中著有未归类的新

目录。可根据状况修改目录,增长或调整原则目录,对档案原目录数据修改或

补充日勺数据,需填写更改资料,更改资料放入原案卷内,能实现一条目录对应

多种图像和一种图像对应多条目录H勺编目。

8.图像内容:

8.1实时在屏幕上监控扫描全过程,遇有漏扫、重张,图像黑边、偏斜、

折角、不清晰等状况,则进行重扫或补扫。

8.2检查扫描件与否合乎规定,扫描图像必须与原图页面一一对应,不

得出现颠倒、缺页、重页或错页状况,不能有遗漏、反复,扫错的现象

8.3扫描的页面内容居中显示,不可出现明显偏左或偏右的现象,正文

内容、页眉、页脚、背面印章、附件、手写注释等信息完整;图像内容与书本

面完全对应,不得出现书页内容残缺或将旁边页面信息扫入本页的现象。(对图

像黑边、偏斜、折角、不清晰等状况进行处埋,以到达顾客需求)

8.4纸张较差档案扫描方案:由于进行数字化的档案会有部分为历史档

案,纸张质量比较差,对于这部分纸张质量较差日勺历史档案扫描,我们本着如

下原则:

保证档案安全。纸张较差的档案多为破损档案,对于破损档案

更应当在生产流程中加以特殊看待,不能导致二次破坏。保证档案的安

全是第一要务。因此,在处理纸张较差的档案时,不容许使用蘸水防滑

等有破坏档案也许性的操作措施。

保证扫描质量。历史档案之因此进行档案数字化,其中最重要

日勺目的之一就是急救这部分历史档案,此后在应用这部分档案时,尽量

防止人为翻阅历史档案而给档案导致二次伤害,而应使用电子系统,使

用扫描件。这样档案扫描的质量要尽量的清晰、洁净,尽量日勺恢复历史

原貌,这对扫描质量的规定很高。

高效高质的完毕任务。

9.扫描登记:认真填写纸质档案数字化转换过程交接登记表单,登记扫描

的页数,查对每份文献W、J实际扫描页数与档案整顿时填写W、J文献页数与否一致,

不一致时应注明详细原因和处理措施。

四、图像处理

1.逐张检查图像质量(包括黑边、折角、图像偏斜度、清晰度、失真度等

进行检查,发现不符合图像质量规定时,应重新进行图像处理),档案次序(页

号)与否对的,有无漏扫、重张等状况(发现文献漏扫时,应及时补扫并对H勺

插入图像。发现扫描图像的排列次序与档案原件不一致时,应及时进行调整。)

2.纠偏:图像整体倾斜不得超过1度,不得出现图像日勺一部分倾斜或扭曲

而影响阅读H勺现象。假如档案页面存在部分倾斜的,以页面中标题纠正为准。

3去污:所有扫描留下的黑线、指印、阴影或污点都必须清除洁净(在放大

50%的状况下)由于印刷质量或纸张质量等导致口勺页面上有零星的污点和背面倒

映文字污点比较多,假如在页面视图下看不清晰,或该污点嵌在文本行中无法

清除,可以不清除,但应尽量保证图像可读。

4全文页面及局部文字日勺加深和变浅日勺处理:原始档案的清晰度较低口寸,可

提高图像的清晰度,修正原资料中存在的字间距和行间距过密,文字较深或较

浅,字迹不清晰的缺陷,保证文字及图像信息清晰可辨。

5图像拼接:对大幅面档案进行分区扫描形式日勺多幅图像,应进行拼接处理,

合并为一种完整的图像,以保证档案数字化图像H勺整体性和数字化档案的精确

可读。

6照片页处理:必要时采用专业W、J图像处理软件进行处理,保证照片日勺清晰

度。

7图像存储:存储格式以G-4压缩TIFF格式保留。A4幅面档案保留文献不

得不小于100K;其他幅面档案扫描形成文献在保证影像质量的前提下,尽量缩

小文献占用空间。扫描文献存储命名必须与条目档案号一一对应。

五、全文识别(OCR)及生成双层pdf、版式还原及格式转换

将扫描处埋完毕后的文档运用专业的识别软件进行全文OCR,如甲方对识别

成功率有严格规定的,还需此外进行人工校对,校对结束后将版式还原及转换

成双层PDF文献格式。

根据顾客对识别率的规定,可选择性进行人工校对。进行人工校对和不进行

校对W、J优缺陷对比:

1.不进行人工校对:其原理是在单层PDF的基础上运用计算机软件进行全

文OCR识别后生成双层PDF文献。从而激活了图片中所反应的文字,而到达提

取文字和运用原文所包括的文字进行检索的目的。不过不进行人工校对和版式

还原,识别日勺精确率取决于原始资源日勺状况及俣留现实状况。

长处:效率高、成本低、能运用原文检索浏览速度快。

缺陷:识别精确率取决于原件的质量,因此精确率不稳定。

适应范围:

①、原件版面洁净及保留完好H勺资源。(精确率可达95%以上)

②、原文中只含部份关键检索内容的资源。(如学籍档案,检索的重点

只是围绕学生日勺身份信息)

双层PDF数字化加I:流程图

蛉打描文档处理校对•生成处理最终文档

2.进行人工校对:其原埋是在OCR的基础上,为了保证识别的精确率而增

长了人工校对和版式还原的工序。可实现无障碍日勺全文检索。

长处:全文检索无差错,精确率可达99%,且文本层和图像层一一对

应。

缺陷:效率极低、成本极高、由于进行了版式还原,囚此原真率不到

98%,并且存储空间很大而致浏览速度减少。

适应范围:

①、所载信息宝贵且使用频率很高的资源。

②、数字化项目资金预算富余且项目实行时间宽松日勺资源。

③、有很好的硬件环境支持日勺数字化项目。

六、总质检

1.对扫描处理完毕后的图像页进行检查,对档案拆分、扫描、修正、去污、

插图、照片的处理以及文本和图像页的匹配等质量进行全面检查,对于质量达

不到规定的I进行重扫、补扫等操作。

2.对文本域录入与文本录入域的标引、文献日勺页号和页数进行对比,对扫

描前图像页的标引与扫描后H勺图像页的编号与页数进行对比,发现不合格的登

记清单重新处理。

3.对图像质量的检查,保证图像版面清晰,洁净,大小一致,方向一致。

4.重要质检原则:

4.1.加工后的电子影像在总数量、完整性、清晰度上与源文献保持一

致。

4.2.案卷著录、按文献的属性著录数据库字段,检查“文献途径”字

段与文献实际存储位置一致,差错率控制在千分之五以内。

4.3.电子影像档案件信息定义数据差错率控制在百分之二以内。

4.4.电子影像档案卷内页码差错率控制在千分之一以内。

4.5.每页电子影像左右端正度控制在三度以内。

4.6,电子影像漏扫,压边率控制在千分之一以内。

4.7.电子档案与条目数据的挂接一致,差错率不不小于千分之一以内。

七、批量挂接

1扫描处理后的图像成品,按年度、机构上传至档案专用服务器,运用档案

管理软件中的对应挂接功能将扫描图像信息与录入到档案管理软件系统中的目

录进行对应挂接,保证目录与原文日勺一一对应。

2挂接到档案管理系统中区,进行再次日勺成品验收。

八、还卷及数据备份提交

1.原始档案还原工作严格按照国家档案局规定的有关原则和实际状况进行

有序时还原,

将还原日勺档案资料逐卷精心检查,确实没有落页、掉页、折页等问题后再

偿还档案管理人员,经双方仔细核算无误后,在还卷交接单上签字确认。

2.在数据化加工过程中的各项工作记录,在数据转移完毕后、提交给顾客

方。

3.为了有效地保护数据,因此建立数据备份制度,在数字化加工项目工作

结束,并经顾客在终验汇报上签字确认后,将通过验收后日勺数据运用顾客软件

的光盘制作功能刻录成光盘,刻录到DVD光盘中,刻录完毕后再制作一种光盘

备份,或用移动硬盘等存储介质,将所有成品数据备份,提交给顾客。

4.刻录光盘规定:

4.1、光盘制作两份,制作成档案数据格式为多页TIFF的光盘单盘调阅。

4.2,同一份文献不跨越二片DVD片号(同一份文献页数需在同一DVD内)

4.3、电子档案存在于符合原则日勺单片包装光盘

4.4、光盘标示光盘编号,单片包装盒上注明光盘内重要信息

4.5、在光盘刻录完毕后,与硬盘系统中电子档案进行一次比对,保证档案资

料无遗漏及对口勺性。

4.6、制作光盘人员对于所有光盘序号进行标识,并提交对应表格。

第三节质量控制方案和保证措施

项目加工总体质量目日勺:保证合格、争创优良!

一、加工质量保障措施

1.严格遵照执行我方签定口勺《不分包、转包三峡大学档案数字化项目承

诺书》,防止项目转包、分包引起的管理混乱和质量风险。

2.严格按照我方制定的人员和设备投入计划进场加工,保证人员设备供

应,为项目进度和质量提供保障。

3.在该项目加工过程中,我方所有现场加工人员均受我企业《数字化作

业人员质量考核制度》的约束,并承担对应奖罚成果。

二、多环节,多层次的质量检查体系。

1.对档案签收和属性数据录入的质量检查,重要内容:档案签收的精确性,

完整性和即时性:数据内容齐全,属性数据输入精确;与数据校对日勺档

案交接。

2.对数据校对处理的I质量检查,重要内容:校对后的数据内容齐全,对口勺;

纸质档案实体完整,还案及时无误。

3.对数据迁移的质量检查,重要内容:迁移后的数据n勺完整性精确性;对

数据进行组合查询并且成果对的;对数据进行汇总记录并输出原则表

格,试运行无死机现象。

4.在完毕以上每个环节后,检查人员将其数据再次进行一遍全面的复查,

尤其对检查记录单上改正后的错误进行仔细日勺检查,保证扫描得来的数

据与源文献内容完全一致。

5.实行项目负责人对成品数据进行百分之十的抽查,在抽查时将该查数据

W、J年度、保管期限、全宗号、卷号、卷内次序号等目录信息与否精确无

误,再对获取图像数据的亮度、歪斜、与否错页等方面进行抽查,如有

不合格H勺数据及时进行记录和修正,保证最终数据的精确无误。

三、阶段性验收与终验相结合的严格验收程序是质量控制的终极保障。

阶段验收汇报

项目名称项目编

汇报人时间

项目负责人所处阶

项目状态参数监控状况

项目状态计划状况实际状况偏差扫描纠正措施

项目进度

项目工作量

(人时)

项目规模

项目外工作

量状况描述

(非项目工

作)

其他

工作中碰到问题及困难:

需要顾客支持与配合:

顾客意见:

顾客签字:

签字日期:

终验汇报

项目名称项日编号

汇报人时间

项目负责人第()阶段

本阶段项目完毕状况

验收项目完毕状况备注

档案整顿(卷)

档案扫描(A4页,A3页,其他页)

图像处理(卷页)

索引目录录入(条)

全文OCR

所有报表输出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论