版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
XX市档案局档案数字化加工项目第页方正国际软件有限公司方正国际软件有限公司方正集团IT产业集信息技术之大成,提供IT服务、软件、硬件和数据运营在内的综合解决方案。FounderGroup'sITsectorisaleaderininformationtechnology,providingcomprehensivesolutions,includingITservices,software,hardware,anddata北京市海淀区北四环西路52号中芯大厦18层10008018F,E-CenterBuilding,No52BeisihuanWestRoad,HaidianDistrict,Beijing,China100080,P.R.China.Tel:+861082179084
Fax:+861082179001XX市档案局档案数字化加工解决方案方正国际软件有限公司
目录1. 项目需求分析 41.1. 项目概述 41.2. 项目建设内容 41.3. 项目服务标准 52. 现场加工管理方案 62.1. 现场人员管理 62.2. 现场设备管理 62.3. 实时监控 73. 技术方案一:制作PDF格式文件 83.1. 生产流程配置 83.2. 资料提取和归档 93.3. 规范库和工程信息库建设 93.3.1. 规范库建设 93.3.2. 工程信息库建设 93.4. 数字化内容组织 103.5. 档案整理 113.6. 档案扫描 123.7. 图像处理 143.7.1. 图像数据质量检验 143.7.2. 图像精细化处理 153.7.3. 补扫 163.8. 图像版面分析和基础信息提取 163.8.1. 工作内容 163.8.2. 制作标准 163.8.3. 实现方法 163.8.4. 输出数据 173.9. 全文识别和编改 173.9.1. 工作内容 173.9.2. 制作标准 173.9.3. 实现方法 183.9.4. 输出数据 203.10. 档案目录著录 203.10.1. 数据格式选择 203.10.2. 标引著录 203.10.3. 录入方式 213.10.4. 校对方式 213.11. 单层纯图像PDF文件生成 213.11.1. 工作内容 213.11.2. 制作标准 213.11.3. 实现方法 213.11.4. 输出数据 223.12. 双层PDF文件生成 223.12.1. 工作内容 223.12.2. 制作标准 223.12.3. 实现方法 233.12.4. 输出数据 243.13. 数据存储 243.13.1. 存储格式 243.13.2. 存储文件的命名 253.14. 数据挂接 253.15. 数据验收 253.16. 数据备份 263.17. 数字化成果管理 273.18. 档案归档 273.19. 成品数据 274. 技术方案二:只制作JPEG格式文件 294.1. 生产流程配置 294.2. 资料提取和归档 304.3. 规范库和工程信息库建设 304.4. 数字化内容组织 304.5. 档案整理 314.6. 档案扫描 314.7. 图像处理 314.8. 档案目录著录 314.9. 数据存储 314.9.1. 存储格式 324.9.2. 存储文件的命名 324.10. 数据挂接 324.11. 数据验收 334.12. 数据备份 334.13. 数字化成果管理 344.14. 档案归档 344.15. 成品数据 345. 项目服务方案 365.1. 服务承诺 365.2. 数据交付和验收 365.2.1. 方正自检部分 365.2.2. 合格数据验收 375.3. 项目实施进度安排和资源配置 375.3.1. 工期要点 375.3.2. 本项目扫描仪等设备的配备数量(暂定) 385.3.3. 任务的划分(暂定) 395.3.4. 扫描生产计划(暂定) 405.4. 售后服务 405.4.1. 实时远程技术支持服务 405.4.2. 热线电话 415.4.3. 技术服务网站支持 415.4.4. 现场技术支持服务 415.5. 培训 415.5.1. 数据管理维护培训 415.5.2. 相关技术培训 42附录一:公司介绍 43(1)公司总体情况 43(2)方正数据处理中心介绍 44(3)公司资质与荣誉 45(4)方正的优势 46附录二:成功案例 48(1)国礼-中华数字书苑 48(2)新闻出版总署 49(3)国家图书馆地方志第四期数字化加工方案介绍 49(4)天一阁 50(5)民国期刊库 50(6)国学要览数据库 51附录三:方正博通数字档案管理平台 52(1)目前产品版本 52(2)方正博通数字档案管理平台软件概述 52(3)方正博通应用领域 53(4)方正博通产品优势 63(5)产品运行环境 63(6)硬件部署建议 64项目需求分析项目概述XX市档案局十分重视档案资源建设。截止目前,馆藏档案全宗达到100个,计37637卷册,排架长度560米,其中包括革命历史档案和建市以来的文书档案、专业档案、特色档案、荣誉档案及寄存档案等。馆藏档案的来源,一是定期接收市直机关、团体及部分企业单位应进馆档案及撤销单位档案;二是收集、征集散存于社会的有深存价值的档案;三是通过馆际交流从其它档案馆复制的与XX市有关的档案材料。客户简介客户简介为进一步提高档案服务水平,完善信息化建设,XX市档案局推出了本次“档案数字化加工项目”的规划建设,通过项目的实施,实现一般人员基础的调阅功能、研究机构和管理部门深层次的调查研究和管理应用的功能,提高办事效率和服务水平,具有十分重要的科技创新意义。项目建设内容本项目建设目标是对XX市档案局的档案资料进行数字化应用开发,接入方正提供的方正博通数字档案管理平台实现档案数字化系统应用。关于方正博通数字档案管理平台的详细介绍请参见附录三:方正博通数字档案管理平台。方正提供数字档案管理平台方正提供数字档案管理平台针对本项目,方正提出两种解决方案,一是通过图像识别编改制作PDF格式文件,最终提供的成品数据有PDF格式文件、JPEG格式文件、XML文件及TIF文件;二是只制作JPEG格式文件,不提供PDF格式文件,最终提供的成品数据有JPEG格式文件、XML文件及TIF文件。提供两种解决方案供选择提供两种解决方案供选择项目服务标准档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,以满足采购方对档案利用的需求。档案的数字化,必须符合国家档案开放规定以及有关规定,如《中华人民共和国档案行业标准DA/T31—2005档案数字化技术规范》、《中华人民共和国档案法》、《档案著录规则》(DA/T18—1999)、《档案分类标引规则》(GB/T15418—94)等。加强档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。现场加工管理方案本项目按照XX市档案局保密要求采取现场加工的生产模式。XX市档案局提供必要的办公场所和电力等工作条件,方正提供人员、加工设备和软件平台,并按照XX市档案局的保密、安全要求去进行设备处理及网络布线,以及数字化加工中的软硬件,网络的维护工作。遵照CMMI和ISO/IEC27001-2005对信息安全管理的要求并结合XX市档案局档案加工保密特性,方正签订保密协议,在XX市档案局的档案数字化加工过程中履行信息安全保密责任,具体体现在人员管理、设备管理和实时监控三方面。现场人员管理现场服务人员资料在XX市档案局备档,办理加工场地现场出入证明。现场服务人员不得携带任何带有存储、照相功能的设备进入现场。现场服务人员需签订XX市档案局档案数字化生产加工保密协议,明确工作人员的保密义务和责任。现场设备管理XX市档案局档案数字化生产加工过程中现场所使用的扫描设备,按涉密设备进行管理和使用,不使用无保密保障的扫描设备。XX市档案局档案数字化生产加工所使用的计算机及其存储介质,应当严格遵守计算机有关保密管理规定。服务区域内网络与其他网络完全物理隔离。不得安装具有无线互联功能的硬件模块和联接无线鼠标、键盘等无线互联的外围设备。任务完成后,应当继续按涉密计算机使用、管理,或者拆除硬盘。使用的移动硬盘、U盘、光盘等存储介质,按涉密载体进行管理,不得在非涉密计算机及其网络上使用。实时监控按照信息安全管理体系ISO27001的要求,对加工现场实施24小时实时监控,及时掌握现场加工状态,保证现场加工信息安全。技术方案一:制作PDF格式文件生产流程配置参考《中华人民共和国档案法》、《档案数字化技术规范》(DA/T31-2005)和《电子文件归档与管理规范》(GB/T18894-2002)等档案数字化加工国家法律法规,同时按照本项目档案资料特点,结合XX市档案局要求和方正多年数字化经验,方正专门配置的生产加工流程,力求做到扫描效率高、图像扫描清晰、数据不丢失、档案不凌乱、不损坏恢复原样、安全。其加工流程如下:以上是根据数字化加工需求所配置的流程,在此基础上根据数据规格和加工质量要求,将对基本环节的工艺进行进一步配置,方正按照以上加工要求定制一套生产加工流程并配置生产流程软件系统。以下为详细介绍:资料提取和归档方正到用户指定地点下架提取需加工档案,登记明细并打包运至指定的加工场地,提供现场加工服务。档案提取登记表:序号档号卷数借出日期借卷人还卷日期档案接收人备注1001-010102009.1.1张三2009.1.3李老师2011-020102009.1.1张三2009.1.3刘老师3021-030102009.1.1张三2009.1.3李老师方正在档案数字加工过程中,对扫描档案进行编号和批次处理,形成基本的核对流程,杜绝漏扫或重复扫描情况出现。所有档案保证做到不损坏、不损失、原样归还。方正将已加工完成后的档案按照批次及时归还。规范库和工程信息库建设规范库建设针对需进行加工的档案,建立基本属性对应的著录项目,并生成基本目录规范数据,同时为规范数据建立相应的代码识别体系,该代码识别体系将贯穿整个工程的信息交换和数据交换,避免出现信息和数据不一致的情况。结合目录规范数据并通过智能检测模块可以有效的避免在数字化过程中可能出现的漏扫、重扫等情况。工程信息库建设通过对档案进行归类整理,在规范库基础上,根据工程各环节所需要公用的基础信息,将档案的基础著录项目抽取成为资料内部特征,建立信息标引配置数据库和相关流水线工艺文档,制定项目评价标准和环节控制标准等。工程信息库与方正业务流程管理系统挂接,工程信息库在整个工程实施中会围绕基础信息,随着数据流转不断增加相关的信息,通过方正业务流程管理系统,可以实时的掌握每一批次、每卷档案的生产进展和所处环节,也能掌握到数据的状态、收发时间、生产责任人等相关信息。数字化内容组织内容组织按照生产模式,多卷档案可以形成一个批次,每个批次都有一个唯一的编号。每卷档案在加工过程中也要形成一个唯一标识号。档案以整卷为单位进行数字化处理,形成对应的各种过程数据和结果数据,如扫描影像数据、图像属性数据、索引信息XML文档等各类文档。所有档案案卷都包含档案编号等著录项目必备的相关属性信息。卷内文件按照目录数据著录。对照档案原件,著录卷内文件索引信息的所有项,同时可以根据采购方的需要建立其他自定义的索引项。数据命名图像存储文件(PDF格式、JPEG格式、TIF格式)、索引信息格式文件(XML文件)命名规则描述如下:PDF格式文件、JPEG格式文件、TIF格式文件:PDF文件、JPEG文件、TIF文件的命名以每卷案卷目录的目录项顺序统一编页后,每个文件都用唯一的页码标识。著录索引信息XML格式文件:一个图像文件对应一个索引信息文件,所以索引信息文件的命名同样以每卷案卷目录的目录项顺序统一编页后,每个索引信息文件和图像文件同名。存放规则档案加工过程中的文件存放规则是按照每卷档案为一个根目录文件夹,文件夹内存放按照案卷目录排序的所有图像文件和索引信息文件。以下是部分重要的数据加工环节介绍:档案整理目录数据准备按照档案整理办法的相关要求,规范档案中的目录。核对案卷信息,包括基本目录项信息以及其他可自定义目录项信息。按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。区分扫描件和非扫描件在案卷领取交接后,将档案分类为加急扫描和普通扫描两种,一般流程设定下,加急档案3小时内完成扫描任务,普通档案24小时内完成任务。在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。页面处理破损严重、无法直接进行扫描的档案,由XX市档案局专业人员先进行技术修复,折皱不平影响扫描质量的原件,按照档案管理规定先进行相应处理(压平或烫平等)后再进行扫描。档案整理登记确认档案袋内目录的记录是否与档案资料相符;对档案袋的资料按照案卷目录上的目录项进行排序,并统一进行页码的编排;如有目录与档案资料不符的情况,修改错误并进行相关信息记录。档案扫描参照国家档案局颁布的《档案数字化技术规范》中关于档案扫描的要求,方正制定以下扫描方案。扫描分辨率及色彩模式按项目要求,选择合适的扫描分辨率及色彩模式。图像文件采用300DPI分辨率的彩色扫描模式,其余档案采用300DPI分辨率的黑白扫描模式。扫描方式扫描设备为平板式扫描仪或高速扫描仪。纸张状况较差,过薄、过软或超厚的档案,通过使用平板扫描方式确保不损坏原始档案,对于纸张较好的档案用高速扫描仪进行扫描。对于纸质太薄出现透字现象的要采用衬纸的方式进行扫描,保证图像的清晰度。扫描登记对同一档案编号的文件及其附件,按目录号进行存储,不乱序,不混档,与目录进行挂接;不允许有折叠或缺损,保证图像的完整、端正、无扭曲;填写档案扫描过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。注:因客户资料不能公开,遵照ISO27001的信息安全管理要求和与客户签订的数据保密协议,以下图片均经过处理。【档案扫描界面】【档案扫描设置界面】图像处理参照国家档案局颁布的《档案数字化技术规范》中关于档案扫描的要求,方正制定以下图像处理方案。图像数据质量检验图像数据质量检验是扫描过程中重要环节。检验人员通过对档案原件与扫描影像的比较,对扫描影像的清晰、位置、格式、完整、次序等做出判断,提交改正或通过。三级校对管理软件避免了日后的错误。质量管理是本软件生产平台的最大亮点。扫描时员工必须按照正确方法进行扫描:张数不对,无法通过;质量不好无法通过。否则系统提示无法提交下一步工序。在质量检验中,必须通过严格的三级质量检验,否则打回重扫,再校对,最终通过总检,方可进入数据库。质量管理软件如下图所示:注:因客户资料不能公开,遵照ISO27001的信息安全管理要求和与客户签订的数据保密协议,以下图片均经过处理。图像精细化处理纠斜后的图像四角成90度,图像内容居中;调整明暗度或对比度,去除版面污点,达到所有版芯外的污迹都去除掉;去图像黑边,裁边等;尽可能达到好的色彩、对比度还原等要求;对大幅面档案进行分区扫描形成的多幅图像后进行拼接处理,合并为一个完整的图像;对案卷中遗漏编目的页面进行合页处理,确保扫描好的影像页数与原案卷页数;保证扫描图像字迹清晰、颜色恰当,正文文字可以看清楚。将通过精细加工的原始扫描图像压缩成300DPI的JPG格式,存储成单页JPG,并将封装好的文件存储到相应文件夹中。填写档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,若原档案有残缺、污损等影响阅读的情况,若扫描处理无法解决时,需要在相应版面处添加说明,同时需在readme.txt文件中记录说明,并及时与用户联系协商处理办法。注:因客户资料不能公开,遵照ISO27001的信息安全管理要求和与客户签订的数据保密协议,以下图片均经过处理。【图像处理前后情况示意图】补扫图像扫描整个加工过程需要通过三级校对环节,对个别被判定不合格的影像文件打回重扫,直至通过总检,合格备份。图像版面分析和基础信息提取工作内容对图像处理环节完成的档案图像文件进行版面分析和信息提取工作,主要标注档案版面文字块、图像块、纹饰块和颜色信息等等版面信息,为后期版面识别和版面合成提供数据基础。制作标准分类标准版面画框根据文字区域、插图区域和纹饰区域进行画框字体标注对于版面中的不同字体详细标注字号标注对于版面中的不同字号详细标注图像属性标注标注图像的精度、图像模式(黑白、彩色)实现方法运行方正标引程序,将档案图像文件根据需求依次进行版面分析,以达到能够让识别程序进行正确识别,且识别出来的文字,阅读顺序正确。要求:版面分析准确,栏目层次分明,文章主题明确,清楚文章的阅读顺序。版面分析操作一定要规范,避免出现漏标(指整篇文章、一段文字或一行文字)、多标、错标、重框、压框(压图片、压表格、压字等)等问题。标引内容:从前往后标(正文不标引);若遇到下转、上接的文章时,注意文章阅读顺序完整。需要标引内容:包括文件名、案卷号、顺序号、文号、责任者、题名、日期、页号、保管期限、页密级等。输出数据带有版式信息的中间文件,根据XX市档案局的要求输出AMF文件前置文件GNS文件。全文识别和编改工作内容将档案图像版面分析后生成的过程文件直接导入识别软件进行全文识别,全文识别是个批量处理的工作,识别后文件对文字进行编改校对,生僻字进行著录和造字后导入方正自主研发的XML制作工具生成本项目要求的XML文件。制作标准档案XML文件标准文字要求文字准确,造字、特殊符号用“■”代替表格要求表格在XML文件中不体现公式要求公式在XML文件中不体现段落要求段落之间只能有上一段落的回车和下一段落的两个全角空格,不能有其他内容。换行的回车需要去除文章开始处要求文章内容每个段落开始要求有两个全角空格,结束要求有回车文字正确率要求文章XML综合差错率不超过万分之一实现方法本环节根据全文内容进行自动文本识别处理,并依据质量规范对识别后的文本进行编改和校对处理,保证文字的准确性。全文识别采用方正自主知识产权的识别核心,并结合其他的识别技术,采用复杂的集成投票判别算法,大幅度降低OCR的误判率,提高自动辨识效果,确保文字质量可控。全文识别在版面分析的基础上,对于各个制定的文字区域进行自动识别。在初次识别结果上,进行系统一级的优化处理,提炼出识别相似度较低、易错字、或无法识别的文字,进行加扰处理并组合后进入校对环节。对于系统判定识别正确度文字,进行另外的组合进入检查环节。录入全文识别软件对于无法识别的内容,提供与原图对照录入的功能,提高录入效率,并可以原图上标记识别困难的模糊字、无法输入的冷僻字(缺字)和认同字。将每幅图像内所显示的文字,由人工利用方正新典码输入法输入在与图像文件同名的指定格式文档中。编改在本项目中按照所要求的文字错误率标准,设置生产线并制定强化环节控制和增加校对批数,以保障全局的文字质量。除中文之间的标点符号为全角,其它全部在英文状态下输入(原则是规定为分割符号的必须半角,其他的以原内容为准)。编改中打不出来的字用‘■’代替,并要记录,记录要统一。为有效地随时监控校对效果和校对质量,在校对系统中还内置了一套校对质量智能分析模型,可以自动地甄别基本的工作质量。【示例:采用校对质量智能分析,随时掌握校对过程、智能查错等】对于质量要求更高的内容,可重新配置工艺,设立多层次的质量保证体系,包括采用多人不同方法同时处理、电脑校验、多人采取不同方法同时核对等手段杜绝全部错误。校对方法包括:语义智能机器校对、字形自动比对、人工易错字/词校对、OCR易错字/词校对、地名/人名/词语校对等。为了保证作业在第一时间就符合质量要求,利用信息系统支持流水线作业的特点,对员工在文字校对作业环节进行严格的强化培训,使他们能够达到很高的准确率水平。同时,方正还充分利用技术手段通过处理系统内部内置的程序进行质量控制,依据质量指标要求设置系统参数,在校对环节不达标时系统拒接回收提交的数据。导出XML文件通过自主研发的AMF转XML工具,将全部的档案AMF文件批量转换成XML文件,如下图所示:输出数据包含有文章著录项的每份档案XML文件。档案目录著录数据格式选择目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。标引著录标引著录为了方便查阅与管理,打印制作档案目录及档案封面,对文字录入的准确性要求较高,但要录的文本域并不是完全统一的在某一页面上,一些文本域要在多个文件中选择,所以录入时需要相关学部专家进行指导,确保文本域录入的准确率。对所需录入的文本进行标引、或对不同类别的档案录入特征制作相应的《文字录入说明》,供录入员和校对人员参考。录入方式由于文本类型不一,有印刷体、手写体、有表格内的也有表格外的文本信息,所以采用手工录入和OCR软件相结合的方式录入。即手写体或不清晰的印刷体采用手工录入,较规整的印刷体采用OCR技术的录入方式。校对方式校对以软件校对和打印输出对比校对相结合的方式,即对手工录入和OCR自动录入的文本打印输出进行对比校对的一校、二校、抽查校对,确保索引信息错误率达到出版质量万分之一以下。单层纯图像PDF文件生成工作内容将经过图像处理后的单页图像文件加工后制作生成单层纯图像PDF文件。制作标准分类标准PDF图像要求纯图像PDF文件所使用彩色为300dpi初始设置PDF初始放大率设置为“适合页面”实现方法将图像处理完成并符合质量要求的图像文件整理分类后,通过PDF批量转换工具生成单层纯图像PDF文件。【示例:采用PDF还原系统还原PDF版面数据】输出数据本环节加工完成后生成每张图像文件的单层纯图像PDF文件。双层PDF文件生成工作内容将经过全文识别和编改后的档案图像文件加工后制作生成双层PDF文件。制作标准分类标准PDF图像要求图像所使用的图片格式为JPG,精度为300dpi,要求保证图片显示比例200%以内清晰的基础上进行压缩,压缩后符合JBIG2、JPEG2000标准的最大压缩比PDF完整性PDF的数据要完整,保证无缺页、重页,页码顺序颠倒的情况发生PDF图像与文字对位双层PDF文件的图像层和文字层的文字对位准确,反显区域与文字区域相差1毫米PDF图像质量打开一份电子档案阅览并对文字放大时,保证在放大到百分之二百的时候,字迹清晰,笔画连续,无断裂、缺块的现象初始设置PDF初始放大率设置为“适合页面”PDF文字部分通过版式还原以代码格式显示,不以图片形式展示,并保持与原档案一致的排版格式。文字所使用的字体以“已嵌入子集”方式嵌入PDF文件。缺字用矢量造字补缺,对应文本统一为“■”PDF表格、公式、格式等特殊符号档案中特殊符号、复杂数学公式以图片形式展示。特殊符号对应文本统一为“■”,数学公式对应文本为计算机通常可输入的表达式,如公式中存在一些无法输入的符号按特殊符号处理综合差错率每个PDF综合差错率小于万分之一PDF文字处理PDF版面文字的字体、字号、字间距和行间距与原档案保持一致实现方法采用专用的软件,对修整后的档案图像进行自动文字识别和编改,合成一个完整的双层PDF文件,图像在下,文字在上,文字层采用透明属性。完成双层PDF版面还原的基础工作后,建立对应档案的独立PDF文件。该PDF文件名称与档案标识号规则定义一致,便于调阅。将PDF文字层所使用的字体以“已嵌入子集”方式嵌入PDF文件。对在版面分析后生成的XML文件、版面插图文件和版面纹饰文件采用方正专用的软件,对合格图像、文字等文件全部综合打版合成一个完整的档案双层PDF文件。打版工具如下图所示:PDF文件的行距和字间距进行检测和调整后完全和原档案一致。对PDF文件中的文字字体和字号进行定位检测和调整。设置PDF文件初始设置为“适合页面”。PDF版面中字体嵌入,效果如下:输出数据本环节加工结束后生成档案的双层PDF文件。数据存储参照XX市档案局要求及国家档案局颁布的《档案数字化技术规范》中关于档案扫描图像的存储格式及命名要求并结合方正博通数字档案管理平台的入库文件定义,方正制定以下数据存储及命名方案。存储格式图像文件在保证扫描的图像清晰可读的前提下,存储格式采用JPEG格式、PDF格式及TIF格式存储档案图像。存储文件的命名JPEG文件、PDF文件、TIF文件的命名以每卷案卷目录的目录项顺序统一编页后,每个文件都用唯一的页码标识命名。数据挂接(1)汇总挂接档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。(2)数据关联以档案目录数据库为依据,将每一份档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。(3)数据入库根据XX市档案局电子档案管理要求,将验收后的档案数据(包括PDF文件、图像数据、XML著录文件等)批量导入方正博通数字档案管理平台,实现档案数据与系统的无缝链接。数据验收数据抽检以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、PDF文件、图像文件及数据挂接的总体质量。验收指标档案装订:大于10%抽检,检查所有档案的装订还原情况,要求所有抽检档案实体资料完整,装订顺序无差错,无漏、跳编页码,保持同一份文件的完整,托裱、平整和去钉。扫描图像检查:大于10%抽检,要求所有抽检档案无漏扫、多扫。图像质量检查:大于10%抽检,要求所有抽检图像四角成90度,影像清晰整洁,分辨率合适。检索检查:大于10%抽检,目录与图像挂接错误率小于1%。目录名称检查:大于10%抽检,要求所有数据目录著录准确。页密级检查:大于10%抽检,要求所有文件页密级准确。(3)验收审核验收“通过”的结论,必须经分管领导审核、签字后方有效。数据备份备份范围将经验收合格的完整数据及时进行备份,包括以下各类数据:原始扫描图像文件卷内目录信息文件JPEG格式存储图像单层纯图像PDF文件、双层PDF文件XML文件备份方式为保证数据安全,备份载体选择硬盘和光盘,采用在线、离线相结合的方式实现多套备份,并实现异地保存。伴随工程进行,随时进行多套500G规格硬盘数据备份阶段性DVD光盘刻录备份数据检验备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。备份标签数据备份后应在相应的备份介质上做好标签,以便查找和管理。备份登记填写档案数字化备份管理登记表单。数字化成果管理参照国家档案局颁布的《档案数字化技术规范》对数字化成果进行管理:加强对档案数字化成果的管理,确保其安全、完整和长期可用。档案数字化成果提供网上检索利用时,有制作单位的电子标识,并根据具体情况分别采用可下载或不可下载的数据格式。档案归档在档案实施数字化过程中,方正将根据国家档案文件保护的相关规定对每道工序严格把关,责任到人,加强对档案的保护,保持档案的原样归还。数字化加工结束后,方正将严格遵守加工管理控制流程并参照《档案数字化技术规范》,严格按照相关流程归还档案,并严格填写《档案处理结果》表等完成归档交接手续。成品数据数据建设文档管理:包括数据结构、数据样板、数据处理流程和规范、数据维护方法等。测试文档管理:对于数据质量、完整性、规范性、一致性、格式化等不同内容的测试文档及报告等。实施培训和服务文档管理:数字化工程实施文档,根据工程建设及发展要求整理的培训和维护文档等。按照数字化工程最终的交付要求,整合各工程环节的文档,并整理出向用户提交的完整内容,包括成品数据:JPEG文件、PDF文件、TIF文件:按要求提交JPEG文件、PDF文件、TIF文件。档案图像XML文件:内容包括档案编号等卷内文件索引信息项,同时还包括用户自定义的信息项。存放形式,成品数据全部用不低于500G的硬盘存储,存储方式如下根目录:硬盘根目录下存放有序的若干文件夹,按照一张DVD光盘的容量,每个文件夹都能独立的刻录到一张DVD光盘;二级目录由若干以案卷编号命名的文件夹及一张记录这些案卷资料基本信息的电子表格组成;三级目录存放各案卷资料的JPEG文件、PDF文件、TIF文件,文件的命名按照统一要求命名。技术方案二:只制作JPEG格式文件生产流程配置参考《中华人民共和国档案法》、《档案数字化技术规范》(DA/T31-2005)和《电子文件归档与管理规范》(GB/T18894-2002)等档案数字化加工国家法律法规,同时按照本项目档案资料特点,结合XX市档案局要求和方正多年数字化经验,方正专门配置的生产加工流程,力求做到扫描效率高、图像扫描清晰、数据不丢失、档案不凌乱、不损坏恢复原样、安全。其加工流程如下:以上是根据数字化加工需求所配置的流程,在此基础上根据数据规格和加工质量要求,将对基本环节的工艺进行进一步配置,方正按照以上加工要求定制一套生产加工流程并配置生产流程软件系统。以下为详细介绍:资料提取和归档参见3.2规范库和工程信息库建设参见3.3数字化内容组织内容组织按照生产模式,多卷档案可以形成一个批次,每个批次都有一个唯一的编号。每卷档案在加工过程中也要形成一个唯一标识号。档案以整卷为单位进行数字化处理,形成对应的各种过程数据和结果数据,如扫描影像数据、图像属性数据、索引信息XML文档等各类文档。所有档案案卷都包含档案编号等著录项目必备的相关属性信息。卷内文件按照目录数据著录。对照档案原件,著录卷内文件索引信息的所有项,同时可以根据采购方的需要建立其他自定义的索引项。数据命名图像存储文件(JPEG格式、TIF格式)、索引信息格式文件(XML文件)命名规则描述如下:JPEG格式文件、TIF格式文件:JPEG文件、TIF文件的命名以每卷案卷目录的目录项顺序统一编页后,每个文件都用唯一的页码标识。著录索引信息XML格式文件:一个图像文件对应一个索引信息文件,所以索引信息文件的命名同样以每卷案卷目录的目录项顺序统一编页后,每个索引信息文件和图像文件同名。存放规则档案加工过程中的文件存放规则是按照每卷档案为一个根目录文件夹,文件夹内存放按照案卷目录排序的所有图像文件和索引信息文件。以下是部分重要的数据加工环节介绍:档案整理参见3.5档案扫描参见3.6图像处理参见3.7档案目录著录参见3.10数据存储参照XX市档案局要求及国家档案局颁布的《档案数字化技术规范》中关于档案扫描图像的存储格式及命名要求并结合方正博通数字档案管理平台的入库文件定义,方正制定以下数据存储及命名方案。存储格式图像文件在保证扫描的图像清晰可读的前提下,存储格式采用JPEG格式及TIF格式存储档案图像。存储文件的命名JPEG文件、TIF文件的命名以每卷案卷目录的目录项顺序统一编页后,每个文件都用唯一的页码标识命名。数据挂接(1)汇总挂接档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。(2)数据关联以档案目录数据库为依据,将每一份档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。(3)数据入库根据XX市档案局电子档案管理要求,将验收后的档案数据(包括图像数据、XML著录文件等)批量导入方正博通数字档案管理平台,实现档案数据与系统的无缝链接。数据验收数据抽检以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。验收指标档案装订:大于10%抽检,检查所有档案的装订还原情况,要求所有抽检档案实体资料完整,装订顺序无差错,无漏、跳编页码,保持同一份文件的完整,托裱、平整和去钉。扫描图像检查:大于10%抽检,要求所有抽检档案无漏扫、多扫。图像质量检查:大于10%抽检,要求所有抽检图像四角成90度,影像清晰整洁,分辨率合适。检索检查:大于10%抽检,目录与图像挂接错误率小于1%。目录名称检查:大于10%抽检,要求所有数据目录著录准确。页密级检查:大于10%抽检,要求所有文件页密级准确。验收审核验收“通过”的结论,必须经分管领导审核、签字后方有效。数据备份备份范围将经验收合格的完整数据及时进行备份,包括以下各类数据:原始扫描图像文件卷内目录信息文件JPEG格式存储图像XML文件备份方式为保证数据安全,备份载体选择硬盘和光盘,采用在线、离线相结合的方式实现多套备份,并实现异地保存。伴随工程进行,随时进行多套500G规格硬盘数据备份阶段性DVD光盘刻录备份数据检验备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。备份标签数据备份后应在相应的备份介质上做好标签,以便查找和管理。备份登记填写档案数字化备份管理登记表单。数字化成果管理参见3.17档案归档参见3.18成品数据数据建设文档管理:包括数据结构、数据样板、数据处理流程和规范、数据维护方法等。测试文档管理:对于数据质量、完整性、规范性、一致性、格式化等不同内容的测试文档及报告等。实施培训和服务文档管理:数字化工程实施文档,根据工程建设及发展要求整理的培训和维护文档等。按照数字化工程最终的交付要求,整合各工程环节的文档,并整理出向用户提交的完整内容,包括成品数据:JPEG文件、TIF文件:按要求提交JPEG文件、TIF文件。档案图像XML文件:内容包括档案编号等卷内文件索引信息项,同时还包括用户自定义的信息项。存放形式,成品数据全部用不低于500G的硬盘存储,存储方式如下根目录:硬盘根目录下存放有序的若干文件夹,按照一张DVD光盘的容量,每个文件夹都能独立的刻录到一张DVD光盘;二级目录由若干以案卷编号命名的文件夹及一张记录这些案卷资料基本信息的电子表格组成;三级目录存放各案卷资料的JPEG文件、TIF文件,文件的命名按照统一要求命名。项目服务方案服务承诺针对本次档案项目,遵照ISO/IEC27001信息安全管理体系和ISO9001质量管理体系的要求,方正在档案扫描服务项目中保证做到以下几点:认真规划,做到流程科学、管理科学,高质量、高速度地做好项目实施的落实工作。保证不拷贝档案信息,不泄密档案内容。严格按照信息安全管理规范执行,确保档案资料和数据的安全。积极配合委托方实现数字化档案与电子档案系统的无缝衔接入库。对我方提供扫描的档案做长期跟踪服务。项目结束后,保持7x24小时电话支持服务。数据交付和验收方正自检部分对项目组准备提交的合格数据,方正提前检查验收。数据的抽查不低于30%,抽查的数据影像合格100%。对存在的问题较小时提出整改通知,对质量问题严重时责令停产整顿。在数据交付前,组织质量检验的同时,再次挂接检查,保证条目、影像的关联。每月上交一次数据。成立数据交付小组,配合XX市档案局验收。合格数据验收对于已经完成全部工序的影像数据、著录数据,以抽检的方式检查总体质量。一个全宗的档案,数据验收时抽检的比率不得低于5%。目录数据库与图像文件挂接错误码,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”。一个全宗的档案,数字化转换质量抽检的合格率达到99%以上时,给予验收“通过”。合格率:抽检合格率需达到100%。验收审核:验收“通过”的结论,必须经分管领导审核、签字后方有效。验收登记:认真填写档案数字化验收登记表单。项目实施进度安排和资源配置工期要点扫描工作是一项人员较多的手工、脑力为一体的频繁操作工作,因为员工的长时间疲劳、反应滞后、粗心等错误操作,非常容易产生文件扫描错误。然而每页文件对应一个影像文件、一个条目,一旦错误得不到解决,导入数据库,就无法得到准确查阅,甚至造成整个项目的失败。如何做到扫描质量达标、按时完成进度,确保项目的成功实施,管理工作起着决定因素。为达到以上标准,我们推出工厂式流水线管理方式,结合软件管理流程,从而对项目全过程实行科学控制。从设计每条流水线操作过程的开始阶段,到数据安全入库,做到责任到人严格检查,如实记录,并及时根据需要调整流程。在实施中,方正更注重于实际工作,配备了各种扫描设备。员工针对档案纸张大小、档案材质、字迹、色泽深浅不匀等情况应用不同设备采用不同的扫描方案,并严格执行扫描流程。加强档案的保护工作,作业中配备档案箱等必要的工具,既保证档案不受损坏,又控制了作业流程的顺序。3.3人员的配备(暂定)根据我们对档案情况的掌握及XX市档案局对生产周期的要求,并结合我们长期扫描生产经验,我们安排本次实施人员分工如下表:合计12人,其中调档、装订、还档工作由项目指挥兼职负责,维修、安全、后勤等人员由上述人员兼职。方正可根据实际的生产任务量和进度要求,随时调整人员数量,以满足任务进度要求。本项目扫描仪等设备的配备数量(暂定)由三台高端机(平板、高速两用机型)扫描仪,电脑、服务器等组成。如图:将扫描仪分成三个分队,由三台高端扫描仪、电脑等组成。1234561234561、2号机为彩色(高速、平板)文件扫描仪和计算机,用于A3、A4档案文件扫描、处理;3号机为大幅面档案用扫描仪及计算机,用于大幅面档案扫描;4号机用于标引文本制作;5号机用于数据质检;6号机为文件备份服务器。若干台维修及备用机器不含在内。以上扫描仪机型均为黑白、灰度、彩色三用机器,可根据XX市档案局需要选择扫描方式。任务的划分(暂定)平均日产能:日产能9000~9500,可以根据实际进度进行调配:序号工作环节人员数量资质或职责1档案调档1负责从档案室调档,专人负责2档案整理4档案整理工作3档案扫描、档案处理3档案扫描工作4著录、打印2档案目录信息制作、打印5质检2独立的质检部门人员负责质量检验6装订1整理完成的档案按照档案原貌装订7还档1由调档人员负责还档,专人负责8数据备份3实施过程数据“三地”备份,保证数据安全9项目指挥1项目组织、协调,保证项目正常进行方正的人员和设备配备完全能够胜任该次档案信息化工程,特别是在项目实施过程中,我们坚信的是:速度的快与慢更多的取决于人而不是机器,方正将更加发挥的是员工的整体智慧。扫描生产计划(暂定)根据XX市档案局要求,以及我们对档案的初步掌握情况,为此,我们准备按时间要求完成任务,不作提前完成计划,重点放在扫描等数字化质量上。我们计划一班作业:上班时间:与XX市档案局同步。每天完成档案扫描数量约9100页影像文件,一个月约21万页。说明:项目已考虑人员休息、设备维修、法定假日等一系列问题。售后服务在最终验收合格后,方正提供3年的售后服务期,以保证所提供数字化成果的正常应用。数据应用中,若出现非人为因素或不可抗力因素导致的数据破坏,我方提供应急技术支持服务,承诺在8小时之内响应。实时远程技术支持服务实时远程技术支持服务、即时在线通讯等多种服务手段。支持信箱:bposupport@;可以通过E-Mail的形式和我们的技术服务人员沟通,方正技术支持信箱的最长答复时间为24小时。热线电话热线电话支持:(010)-82179066,有效时间为:9:00~18:00/工作日。方正的技术服务人员将热心解答问题,提供解决方案。技术服务网站支持方正集多年在应用软件系统领域的开发、设计、实施经验,为保证项目的实施,我方将建立专用的技术服务支持网站。为用户提供在线的免费技术支持,解答系统使用中的常见问题。 技术支持网站:/现场技术支持服务当用户系统发生故障时,用户方面及时通知方正,电话解决无效时,方正将派出工程师在第一时间到达用户现场进行支持。培训在工程实施后期,开始安排相关的数据维护技术培训工作,培训内容主要有以下方面:数据管理维护培训、相关技术培训。数据管理维护培训对此次数字化结果数据的维护和管理培训;各种数据格式的转换培训;数据备份管理培训;对今后新增数据的管理培训;培训对象:数据管理员、数据维护人员;人数:2人;时间:2个工作日;培训人:方正数据中心培训部教师。相关技术培训XML基础培训;培训对象:数据管理员或系统维护人员;人数:2人;时间:2个工作日;培训人:数据库系统工程师、数字化工程主要技术负责人。附录一:公司介绍(1)公司总体情况方正国际软件有限公司,是在方正软件(苏州)有限公司、北京方正国际软件有限公司、武汉方正国际软件有限公司的基础上合并组建起来的,隶属于方正集团,注册资本一亿五千万元人民币。是国家认定的高新技术企业、国家规划布局内重点软件企业、软件出口骨干企业、软件企业出口联盟的成员、软件进出口工作委员会理事单位。公司定位于业务流程外包服务供应商,提供专业的数据外包服务,依靠集团的雄厚实力,以及方正集团在BPO和ITO等高科技产业领域的丰富资源,已组建起包括档案管理、专业数据外包、软件系统分析、软件开发、配置、过程改进、测试、品保,以及政府、事业单位派遣定制人员在内的强大技术队伍。面向国内外事业单位、企业和合作伙伴已开展资源数字化“现场”服务、软件开发“离岸”服务、“项目整体外包”核心内容服务和IT应用进出口业务。方正国际由一支经验丰富的管理团队领导,管理团队主要成员都有欧美日项目管理背景,在该行业有着15年以上的行业管理经验,具备较强的经营管理能力,他们以全新的理念为客户创造价值,为员工提供持续发展的机会。目前公司已组建起包括项目管理、软件系统分析、软件开发、配置、过程改进、测试、品质保障,资料数字化生产工艺改进与发布管理、呼叫中心系统等软件研发队伍,并建有优质的呼叫中心系统,为广大用户提供电子商务、呼叫中心运维及外包服务。目前公司拥有700多人的队伍,其中高级技术人才200多人,将在五年内发展成为一家5000人以上的大型软件及数据加工企业。作为一家国际型企业,方正国际软件有限公司着眼于软件及数据加工服务,致力于开拓国内、日本、欧美的业务流程外包、高端数据服务以及软件外包服务,已在美国、加拿大、日本、上海、北京、杭州、南京、武汉、江阴设立办事处,吸收海外优秀的管理与开发人员,在国际市场开拓方面取得突破成果,并形成了稳定的业务渠道以及广泛的海外业务资源。在国内,我们已全面具备数字化领域最高端的古籍文献全文数字化加工工艺、一般纸质档案文献全文数字化加工工艺及各类排版文件全真解析转换技术,并以此保障方正集团为合作伙伴提供的每年超过15万种电子书、250万版数字报纸、80亿字全文识别的图书及档案数据业务处理服务。(2)方正数据处理中心介绍从数据中心创立至今,我们一直坚持依靠科技进步来提高生产力,以自主开发的数据资源处理加工工具为核心,依托于长期以来大量的实践经验,建立了国内先进的资源加工流水线。自主研发的全文数据库加工流水线每天处理1500万字(折合简体、十万分之一误码率)的数据,甚至可以达到十万分之三或更低的错误率,向用户提供XML、HTML、CEB/PDF、TXT、DOC等用户所需的文档格式。数据中心的目标是通过不懈努力,为中国数字出版的基础建设服务,成为价格优、质量高、服务好的专业数据加工队伍。数据中心已完成几十万种数据的加工任务,另外累计处理文字量超过百亿字。我们愿以数据中心的精诚服务推动社会信息化发展,为我国数字出版建设做出应有的贡献。(1)数据中心理念技术推动,效率管理,合作态度。(2)数据中心宗旨客户需求,即我们的价值。(3)服务范围向用户提供XML、HTML、CEB/PDF、TXT、DOC等用户所需的各种文档格式及相关软件。建立数据库系统、光盘检索系统。加工制作相应电子版,并根据客户要求以光盘Internet或其他载体形式提供,支持单机/局域网/Internet/Intranet。(3)公司资质与荣誉CMMI3认证双软认证企业高新技术企业江苏省服务外包重点企业十佳科技创新明星企业ISO9001:2008管理体系认证证书ISO27001信息安全管理体系江苏省信息化协会常务理事单位方正博通公文档案一体化管理系统测评等级:优秀计算机软件著作权登记证书数字资产保护技术获国家重大科技进步奖中共中央、国务院使用方正数字资产加密保护技术承担国家级项目国礼-中华数字书苑【温总理馈赠剑桥大学国礼】【习近平副主席向鲁汶大学赠送“中华数字书苑”】新闻出版总署-中国共产党思想理论资源数据库与传播工程(4)方正的优势专业的图书数字化加工能力方正的数据处理技术是完全自主开发的,是在长达10年,历经数百亿字的加工锤炼逐渐成熟起来的,能够高效高质量地处理各种多语种、复杂版式资料的数字化加工项目。拥有了成熟的数字化加工处理工艺还不能代表全面的加工水平,还必须具备优秀的管理工艺,能够有效地进行需求分析、任务分解、工艺定制、环节调度、质量监控、进度监控等。优秀的管理工艺是大规模数字化加工处理的基本保障,其本身具有很高的技术含量。管理工艺的成熟与数字化工艺的成熟有直接的相互促进关系,通过对数字化工艺的监管,能够及时总结各类问题,完善数字化工艺,并不断提高管理工艺和水平。方正经过长期的发展,已经形成了一套与数字化工艺配套的优秀的管理工艺,充分保障了数字化加工处理的有效实施。持续的开发支持方正公司下设有方正研究院近3000人的专业研发技术队伍,为我们项目的实施提供着坚实的开发技术支持,同时结合方正在多个项目的加工经验,我们敢于为客户承诺提供完全符合要求的数据,满足客户个性化管理平台的应用需求。专业的字库技术二十年字库的技术沉淀,方正字库全面支持方正系统和第三方系统,前端显示和后端输出保持一致,做到“所见即所得”,产品系列化、标准化、通用化,开放性产品跨平台使用。通过使用方正字库,实现了图书真正意义上的原版原式。对于生僻字,方正采用补字造字方法,依据一定的编码标准形成规范字库。解决图书加工中生僻字无法实现数字化的问题。完善的版权控制方正通过数字版权保护技术(DigitalRightsManagement,即DRM)和CEB版式文件技术来防止数据的非法拷贝,不仅为用户实现了版权的维护和管理,还加快了图书资源在大型内容库中获取或续订许可证的过程,从而开拓了一个潜力无限的受用范围,提高了用户对在线服务的满意度。附录二:成功案例(1)国礼-中华数字书苑2009年1月27日至2月2日随着互联网技术的不断发展,信息的传播突破了时间和空间的限制,数字出版物的出现更是为人类不同文明之间的交流变得更为畅通。此次总理出访选择了电子书库“中华数字书苑”馈赠剑桥大学,就是希望通过其收录的中国出版的20万种、内容涉及中国政治、经济、历史、文化等各个领域的电子图书,让剑桥大学师生、让世界更好地了解中国。中华数字书苑所有内容的制作都采用了本方案所描述的数字化技术及方正数字出版技术,是目前国内最高水平的数字化应用方案。(2)新闻出版总署人民出版社2009年10月双层PDF加工制造项目形成一套完整的标准化的电子数据。具体包括:①扫描的图像文件。图像文件指的是从封面到封底,一本书所包含的所有页的扫描图。书内页插图、图表等非文本信息单独提供扫描图。②文本文件。文本文件指的是扫描的图像文件经OCR识别及人工校对后,识别错误率为万分之一以内的XML文件。图书章节目录单独制作XML文件。③PDF文件。将图像和文本制成双层PDF文件,图在上,文本在下。同时制作单层纯图像PDF文件,黑白图片精度为600dpi,灰度和彩色为300dpi,可供按需印刷使用。④书目数据。提供所加工图书的书目信息。⑤排版文件。与PDF完全一致的可进行修改并能够重新生成PDF的排版文件或加工文件。(3)国家图书馆地方志第四期数字化加工方案介绍《国家图书馆地方志》第四期数字化加工项目内容:完成国家图书馆馆藏的地方志中50万筒子页的数字化加工。数字化加工的特点:针对图书印刷品影像开发的自动版面分析工具,自动记录版面信息。系统采用方正超大字符集,符合GB18030-2005标准,并具有UNICODE5.0的转换工具,采用五笔字型输入法和方正的典码输入法进行汉字录入,对常用汉字采用五笔字型进行录入,对生僻字采用方正典码输入法进行录入,实现效率和功能有效结合。采用双工双录计算机自动比对及纵向校对和横向校对等措施进行校对,在保证操作效率的前提下降低差错率。对生僻字、替代字提供批量修整功能,以保证成品随着操作技能的提高的质量不断改进。自动化版面还原,根据版面分析结果实现版面自动还原,大大提高了操作效率。一体化作业管理系统,管理从前端工序到后端产品输出的整个操作过程,保证操作过程的有效管理和高效率。(4)天一阁《天一阁古籍数字化系统》天一阁藏书楼是我国现存历史最久的私家藏书楼,也是世界上现存最早的三个私家藏书楼之一。现藏各类古籍近30万卷,其中珍椠善本8万卷,尤以明代地方志和科举录最为珍贵。天一阁古籍数字化项目正式启动始于今年4月,第一部走上数字化“变身”平台的古籍是铜活字版的《古今图书集成》,这是一部罕见的大书,全书共10040卷,天一阁保存至今的有8700多卷。08年年底,方正中标了“宁波天一阁博物馆古籍数字化加工、系统软件开发、系统集成项目”。帮助天一阁完成150万筒子页古籍数字化加工项目。天一阁古籍数字化系统建设的目的是通过数字加工将馆藏古籍转换成影像数据和全文数据,制作古籍文献书目数据库和古籍全文数据库等数字资源,使古籍资源得到再生性保护。(5)民国期刊库《民国期刊》特色资源建设《民国期刊》特色资源库的建设,方正帮助用户完成了600余种、2万余期的民国期刊和报纸的数字化加工和应用,为研究民国时期的政治、经济、文化教育、工业、农业、商业等各方面提供强大的文献保障。《民国期刊》特色资源库不仅仅完成了数字化加工的任务,同时通过对原刊原样影印制作,给读者带来的不仅是各种民国期刊的原貌展示、让读者了解那一时期社会生活和人文风貌;还可以同时对所有书中的每一篇文章标题进行检索、帮助读者快速找到需要的内容。(1)收录内容:千余种有价值的民国期刊、几十种有价值的民国报纸、其他有价值的民国出版物(2)涵盖范围:民国期刊库以政治法律、文化教育、历史地理为主,经济、文学等为辅,收录有价值的民国期刊。从1902年出版的《大路报》,到1954年结束发行的《当代日报》,跨度52年,是当时历史社会的最真实纪录,传承再现了中华民族深刻的思想渊源和历史文化底蕴。(6)国学要览数据库方正国学要览库完成了6千余种、5万多卷古籍内容的数字化,其中包括义理之学、考据之学、辞章之学、经世之学、科技之学在内的,承载着中国传统文明精髓的古籍图书。国学要览数据库根据由北京大学钻研古籍图书的专家编制分类方法完成其应用分类,在古籍常用的四部分类法基础上,向目前在中国图书馆界影响最大的《中国图书馆图书分类法》靠拢,按照社会科学、自然科学、综合性图书的序列安排类目,总共分为二十二个一级分类,大类下又分若干二级分类。方便读者检索和应用。附录三:方正博通数字档案管理平台(1)目前产品版本产品名称版本通用版本解决方案方正博通数字档案管理平台软件(馆版)V3.1方正博通数字档案管理平台软件(处室版)V3.1方正博通现行文件中心(江苏推广版)V1.0方正博思文档采集工具软件V2.0方正锐思文字识别工具软件V2.0行业版本解决方案出入境检验检疫行业档案管理系统V3.0公安行业档案管理系统V3.0检察院行业档案管理系统V2.5法院行业档案管理系统V3.1.1煤炭行业档案管理系统V3.1军队后勤档案信息综合管理系统V3.1.1核工业档案及新闻宣传综合资源一体化管理系统一期V3.0;二期V3.1(2)方正博通数字档案管理平台软件概述集文档一体化、馆室一体化、馆网一体化的统一平台B/S结构有效满足档案信息资源远程服务和利用数字化档案与传统档案并存的统一管理模式开放的编目体系架构可灵活扩展跨库检索,跨不同种类信息资源检索真正意义的数字档案馆(3)方正博通应用领域方正博通数字档案一体化管理平台适用于国家各级综合档案馆、专业档案馆,政府机构,军队、国家科研、教育等事业单位的档案馆、档案室、机要室(保密室),企业档案馆和档案处(室)。方正博通采用方正博思内容管理平台作为基础数据管理平台,利用方正博思对文字、图片、视音频等各种形式数字化内容的管理优势,结合传统档案管理业务,以文档一体化为原则,构建成既能同时管理各种格式的电子公文、电子档案、多媒体资料,又能够对档案采集、管理、利用提供支持的强大的数字档案管理平台。其目标通过对馆藏档案数字化、增量档案电子化,数字档案管理规范化、自动化实现档案信息资源广泛利用和高度共享。博通档案应用架构图方正博通数字档案管理平台结构图方正博通数字档案管理平台软件为了满足档案馆和档案室不同层次用户需求,产品划分为档案处(室)版和数字档案馆版两个版本。方正博通档案处(室)版方正博通档案处(室)适用于政府、军队、企事业单位内部各级立档单位的档案处(室)。实现立档单位对电子文档的接收、转换,档案管理与存储及档案移交到上级档案馆的全流程管理。产品功能特点真正的文档一体化,全面覆盖文件生命周期管理开放式的体系架构和数据标准,实现OA系统文件向档案管理系统的自动归档支持国务院办公厅、中央办公厅采用的公文传输系统和标准电子公文格式,全面实现文件生命周期管理数字化档案管理,实现全文检索可同时管理档案目录和各种类型的电子档案原文。不必记忆复杂的目录信息,轻松实现跨档案库的全文检索全文检索百万记录级数据,查询数据响应速度不超过1秒多种便捷的检索途径,方便远程借阅利用突破目录检索的限制和不便,实现电子档案全文检索、跨库自由检索、模糊检索、高级检索支持档案网络借阅、网上移交,实现档案信息广泛利用、提高管理效率电子档案安全保护屏障可将包括AUTOCAD在内的各种格式电子文档自动转换成符合国家档案局标准的安全电子档案格式,统一浏览器调阅。对电子档案提供文档级安全保护,有效防篡改、防扩散加强内部审计,数据日志自动记录每份档案数据的操作方正博通数字档案管理平台档案处(室)版架构图方正博通数字档案馆版方正博通档案馆版适用于国家各级综合档案馆、专业档案馆,政府部门、事业单位、大中型集团企业的档案馆。以档案信息资源服务为中心,实现传统档案管理上的数字档案管理。涵盖档案的数字化创建、档案管理及存储、检索利用和档案发布四个阶段。可集成现行文件中心,促进政务公开,发挥现行文件服务公众的作用。方正文档、图片数字化处理模块提供对纸质文档、图片的扫描、管理、修版、著录、入库的数字化创建全过程应用。方正锐思文字识别软件档案版在完成文字识别功能的同时实现自动入库。数据转换功能提供了对用记历史数据的安全迁移方面的应用。档案管理及存储集中档案业务管理和系统管理以及存储策略等方面的管理功能。档案利用通过多种高效的检索工具实现灵活便捷的借阅服务和强大的跨媒体的档案发布功能。实现互联网站、政务门户网站的动态实时发布、光盘数据发布等。并不断通过系统良好的扩展性来满足更多新技术的功能,实现未来档案发布及呈现模式。方正博通数字档案管理平台档案馆版架构图产品功能特点高效的档案数字化创建专为档案数字化加工量身设计,集扫描、管理、修版、图像压缩、著录、自动入库于一体的档案数字化加工工具,实现与档案管理平台的无缝连接。针对不同类型档案特点,分别提供纸制文档、图片、声像的专业档案数字化创建工具,并做到与硬件无关提供自动著录和在线OCR文字识别,极大减轻档案管理者的工作量。多页扫描文档自动合成PDF或CEB,符合国家档案局规定的档案图像存储格式采用先进的多媒体图像压缩技术,实现大文件数据高压缩比不失真,便于网络发布和浏览促进档案管理规范化、自动化先进的工作流引擎技术,图形化界面灵活定制各项档案业务流程,实现业务自动处理规范业务管理,实现业务流程实时监控数字化与传统档案管理模式的完美结合基于先进的内容管理技术,在传统档案管理流程下,实现各类数字化档案的“收、管、用”支持传统案卷管理与简化立卷管理并存可集成现行文件中心,促进政务公开目前许多政府部门的档案馆都有一个社会职能,就是保存并管理现行文件,并向社会公众提供现行文件查询检索服务。集成现行文件中心,促进政府、企业信息资源的开发利用。实现对现行文件的集中管理,涵盖各种格式电子文件的实时收集、整理、审核、检索、自动归档、发布利用、统计分析的高效管理。全面提升档案信息服务水平实现跨媒体的档案发布服务-网络借阅、网站信息发布、光盘发布、档案网络征集等多种信息服务途径可集成档案信息服务网站发布、现行文件网站发布,实现馆、网一体化。更好地为公众提供信息服务,提高政府、企业信息资源开发利用水平提供符合国际标准的通用开发接口,方便其他应用系统共享信息资源可靠的海量数据存储管理支持TB级海量数据的集中/分布式存储、集中/分布式管理,提高海量数据访问效率支持在线、近线、离线多级存储管理,磁盘阵列、光盘库、磁带库的存储介质以及SAN、NAS等存储架构数字版权保护加强电子档案安全统一身份管理实现统一权限管理、安全访问控制和单点登录数字水印保护电子档案发布的版权和防篡改电子档案安全浏览器可对档案信息浏览、下载、打印进行严格授权功能描述公文处理系统提供了简单的电子文件公文库,可以实现收文、发文的一般操作,实现简单的OA公文流转功能。公文打印系统提供常用的收发文模版,可以按照类别、日期等条件进行检索打印。文件收集文件收集模块专门用于接收OA系统、现行文件中心或者其他需要变成档案的文件。这些文件可以经过加入新卷或者已有卷,审批归档后进入正式的档案库;或者经过简化立卷后进入正式的档案库。也可以将一些资料性的文件转成资料;对于不合格的文件,档案管理员还可以进行删除操作,也可以进行重新修改。纸质档案数字化部分馆藏档案是指对利用率高的纸质档案、图片档案等以及珍贵的历史档案,对它们进行数字化加工,并将数字化信息的图文数据库存储到海量存储载体中,采用OCR技术,实现扫描结果的文本转化。数字化采集与转换后的电子文件格式符合国家《电子文件归档与管理规范》要求。扫描形成的电子文档(主要记录文章内容),可以方便实现全文检索,并且执行效率高。系统还提供文本数字化上载工具,自动提取部分元数据信息。档案接收本模块管理是馆藏系统重要的功能,主要是在线接收或者离线接收各个立档单位的电子数据和实体数据,并能够根据接收的情况自动进行各种数据的统计和管理。著录编目可以著录各种馆藏档案数据,包含建国前、建国后和革命历史时期的各种类型的馆藏档案,是馆藏软件中较为重要的数据采集窗口。档案保管本模块用于记录、控制、统计库房温湿度的采集情况,记录档案的存放位置以及打印档案存放位置索引,并可记载库房检查情况。档案鉴定对保管期限已到的文件级/案卷级档案进行鉴定,以决定是否有继续保存的价值,如果有则修改保管期限及记载修改情况,继续保存,否则进行销毁。同时本模块也可鉴定档案是否开放、是否控制,达到开放鉴定的功能,系统支持单卷、单件开放,也支持批量开放。档案统计统计是以表册或数字的形式,揭示档案和档案工作中诸现象的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 营养支持护理的跨学科沟通
- 2026浙江温州市乐清市龙西乡卫生院招聘1人备考题库附答案详解(典型题)
- 2026云南昆明市卫生健康委员会全国引才活动第二批后备人才招聘54人备考题库及答案详解(各地真题)
- 2026安徽黄山市中医医院招聘工作人员3人备考题库含答案详解(满分必刷)
- 2026云南省气象部门事业单位招聘应届毕业生21人备考题库(第2号)及答案详解(必刷)
- 2026广西北海市银海区第一小学春季学期招聘临聘教学人员1人备考题库含答案详解ab卷
- 2026广东广州白云区招聘内勤文职1名备考题库及一套答案详解
- 2026北京大学燕京学堂招聘劳动合同制人员1人备考题库附答案详解(黄金题型)
- 2026吴忠市人民医院自主招聘事业单位工作人员49人备考题库含答案详解(预热题)
- 2026年上半年新疆昌吉州第二人民医院面向社会招聘编制外聘用人员11人备考题库附答案详解
- 止水钢板施工人员配置
- 职场课课件教学课件
- 2025深圳南山半程马拉松竞赛组织方案
- 无人吊装施工方案(3篇)
- 2026年新疆生产建设兵团兴新职业技术学院单招职业技能测试题库及答案详解一套
- 八上12短文二篇《记承天寺夜游》公开课一等奖创新教学设计
- 会计伦理规范与法规体系的协同机制
- 防水工程施工流程
- 铁路接触网工(高级技师)理论考试题(附答案)
- 2025年黑龙江省哈尔滨市中考数学真题含解析
- 休克的应急预案及流程(全文)
评论
0/150
提交评论