国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书_第1页
国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书_第2页
国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书_第3页
国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书_第4页
国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1国家数字图书馆国家数字图书馆文献数字化加工中心文献数字化加工中心项目需求书项目需求书 2009 年年 12 月月2目录目录一、前言一、前言 -3二、国家数字图书馆总体建设目标及总体架构二、国家数字图书馆总体建设目标及总体架构-4三、国家数字图书馆的核心业务系统功能模块架构三、国家数字图书馆的核心业务系统功能模块架构 -53.1、国家数字图书馆核心业务系统架构 -53.2、国家数字图书馆数字资源的数据流向 -73.3、国家数字图书馆数字资源的分布状态 -7四、国家数字图书馆文献数字化加工中心四、国家数字图书馆文献数字化加工中心-94.1、文献数字化总体要求-104.2、文献数字化加工中心应用软

2、件要求-104.2.1、文献数字化加工中心应用软件开发技术要求-、符合软件工程规范的要求-、承建商应采用统一的标记语言 -、承建商应采用统一的开发语言版本-、承建商应采用主流的开发集成平台-、接口的规范-134.2.2、文献数字化加工中心应用软件开发功能要求-、术语 -、需求描述-、功能描述-、接口 -、格式与标准-284.2.3、文献数字化加工中心应用软件性能要求-294.3、文献数字化加工中心专业采集设备的性能要

3、求-304.3.1、大幅面扫描仪-304.3.2、快速扫描仪-314.3.3、缩微胶片扫描仪(平片、8/16/35毫米胶片扫描加工用)3套-334.3.4、彩色书刊非接触扫描仪(非接触式,用于书刊半自动翻页,可仿真复制)1套-334.3.5、专业类非接触式扫描仪(超大、非接触、实物等加工处理)1套-344.4、培训要求及售后服务-354.5、对文件数字化处理中心承建商的要求-363一、前言国家数字图书馆文献数字化加工中心主要承担国家图书馆馆藏资源中,文献资源的数字化生产,包括普通纸介质文献、古籍善本、缩微文献、音视频、特殊资源(如舆图、甲骨等) 。它是国家数字图书馆数字资源建设和服务的起点,它

4、是国家数字图书馆核心业务系统之一。该中心的主要职能是数字资源创建。本次项目的工程范围和边界是指文献数字化加工中心的应用软件开发,各类专业采集设备及它们之间的集成和接口程序。建设单位要以高度的责任心和为能参加这样的国家级项目的荣誉感,站在全局的角度,以细致、科学的工程实施手段高质量的完成此次项目。二、国家数字图书馆总体建设目标及总体架构国家数字图书馆将全面履行国家图书馆的职能,有重点的收藏、建设和长期保存中文数字信息,在互联网上形成超大规模的、高质量的中文数字资源库群,建构数字资源采集、加工、保存的技术支撑平台,并通过国家骨干通信网向全国以及全球提供中文数字信息服务,使国家数字图书馆成为世界最大

5、的中文数字信息保存基地与服务基地,成为国家重要的信息基础设施。利用先进的技术和传播手段,向全国及全球展示中华优秀文化,实现馆藏资源的共享。国家数字图书馆的建设要完成我国中文文献的书目数据库建设,通过网络通道向公众全面提供中文二次、三次文献的检索(包括图书、期刊、报纸的名称及篇名数据) ;完成馆藏特色资源库的建设,向公众提供具有中国文化特色的信息资源,包括:甲骨资源库、金石拓片资源库、敦煌资源库、地方志资源库、图书馆学资源库、中国国情资源库、中国博士论文资源库、中国学资源库等;建立中文互联网信息资源库,保存中国重要的网站网页信息,并向公众提供查询服务;与其他行业性、地区性数字图书馆系统连通,向公

6、众提供全方位的知识信息库,使国家数字图书馆成为世界中文数字信息资源的权威查询中心和服4务中心。站在信息化建设的角度讲,它的总体架构如下: 安安 全全 保保 障障 体体 系系文文献献传传递递与与馆馆际际互互借借文文献献数数字字加加工工电电子子资资源源缴缴送送网网络络资资源源采采集集数数字字资资源源加加工工管管理理全全国国联联合合编编目目数数字字资资源源组组织织与与存存储储版版权权处处理理中中文文信信息息处处理理全全文文检检索索元元数数据据检检索索虚虚拟拟参参考考基基层层资资源源服服务务资资源源发发布布与与服服务务子子系系统统读读者者管管理理系系统统OAIS永永久久保保存存元元数数据据库库采采购购

7、资资源源多多媒媒体体资资源源自自建建资资源源互互联联网网信信息息资资源源电电子子图图书书书书目目数数据据基基于于SOA的的数数图图馆馆业业务务系系统统系系统统平平台台数数图图馆馆业业务务数数据据库库Portal统统一一门门户户国国家家数数字字图图书书馆馆总总体体架架构构文文件件适适配配器器FTP适适配配器器WebService适适配配器器定定制制适适配配器器元元数数据据转转换换适适配配器器运运 维维 保保 障障 体体 系系服服务务管管理理服服务务发发现现资资源源采采集集资资源源加加工工资资源源组组织织与与管管理理资资源源发发布布与与服服务务唯唯一一标标识识符符系系统统新新增增/定定制制业业务务

8、数数据据库库适适配配器器各各级级各各类类图图书书馆馆大大学学科科研研机机构构资资源源供供应应商商外外部部系系统统国国图图现现有有运运行行系系统统服服务务注注册册数数据据接接口口标标识识符符服服务务 x1 服服务务x2 服服务务认认证证/授授权权服服务务版版权权服服务务一一卡卡通通系系统统网网上上支支付付Aleph系系统统服服务务合合成成服服务务发发布布X n 服服务务国国 家家 数数 字字 图图 书书 馆馆 标标 准准 规规 范范 体体 系系 基基于于ESB的的应应用用支支撑撑平平台台5三、国家数字图书馆的核心业务系统功能模块架构国家数字图书馆的核心业务系统功能模块架构3.1、国家数字图书馆核

9、心业务系统架构数字图书馆从业务流角度来讲,它分为数字资源的采集、数字资源的集中管理和保存、数字资源的发布与服务。整个核心系统各模块的功能用以支持系统中信息资源的流向、转换、管理及发布。架构中主要包括和涉及的功能模块有:文献数字化和数据采集系统数字资源集中保存与管理数字资源长期保存服务与发布平台元检索与核心业务系统配套的唯一标识符系统与核心业务系统配套的版权管理系统与国家数字图书馆各业务系统配套的应用支撑平台3.3、国家数字图书馆数字资源的分布状态1.外部信息资源2.采集系统数字资源3.集中保存数字资源4.长期保存数字资源5.面向特定检索应用的元数据资源6.呈现给外部用户的数据6四、国家数字图书

10、馆文献数字化加工中心本项目需求书是围绕着文献数字化加工中心的建设展开的。文献数字化加工中心包括文献数字化处理及管理软件、采集设备、输出设备、系统运行平台及基础设施和配套设备。本项目的工程范围和边界是指文献数字化加工中心的应用软件开发,各类专业扫描仪、缩微数字化处理设备及它们之间的集成。文献数字化加工中心,并不单纯是一个软件开发和软硬集成项目。承建商不仅是提供一个生产系统,更重要的是要提供一套行之有效的生产和管理流程,并通过培训使用户指定的人员熟练使用直至交付。其中文献数字化加工中心的应用软件中的数字成品管理(包括介质)模块,负责对中心的生产产品进行有效的管理,侧重的是毛成品的管理,而数字资源集

11、中保存与管理系统中的数字资源管理侧重的是资产管理、长期保存及面向服务的管理。4.1、文献数字化总体要求文献数字化中心业务处理能力普通纸质文献数字化处理能力:30 万册(件)/年;缩微介质数字化处理能力:300 万拍/年;文摘记录加工处理能力:9 万个/年;书目记录、文摘记录、版权关系、数字资源唯一标识符等挂接处理能力:各 9 万个/年;目次的处理、挂接处理能力:180 万行/年篇名的处理、挂接处理能力:600 万个/年音频、视频资源的深度标引处理能力:6000 小时/年4.24.2、文献数字化加工中心应用软件要求、文献数字化加工中心应用软件要求文献数字化加工中心应用软件从功能要求上讲主要包括三

12、个方面。一是对各类文献数字化生产和标引生产过程中各道工序的处理提供软件工具级支持,以提高各道工序(操作员处理或程序自动完成)的完成质量和生产效率;二是7对文献数字化处理任务进行流程化管理,通过对任务的分派和跟踪管理,提高文献数字化处理的整体质量和工作效率;三是提供系统级支撑和管理功能,包括用户及权限管理、生产工序配置管理、全局数据管理、生产情况统计、数字成品管理(包括介质管理)和移交管理。文献数字化加工中心应用软件提供对数字化生产过程中物流数据、生产管理数据、数字化元数据和对象数据、历史数据的有效管理,这是提高各处理环节生产效率的基础。文献数字化加工中心应用软件从组成上讲,包括文献数字化生产(

13、扫描、拍摄、音视频数字化、缩微品数字化等)子系统、标引生产子系统及配套的文献数字化中心管理子系统。文献数字化加工中心应用软件要尽可能遵循的国家图书馆关于汉字规范处理、唯一标识符、对象数据、元数据等相关标准规范。对于规范所不能涵盖或不适用的部分,要在实施的过程中制定相应的内部标准。文献数据化成果以对象数据和元数据的形式体现。4.2.1、文献数字化加工中心应用软件开发技术要求、文献数字化加工中心应用软件开发技术要求文献数字化加工中心应用软件是作为国家数字图书馆整个应用系统的一部分,它的开发要符合国家数字图书馆工程建设对软件开发的规范要求。所谓国家数字图书馆软件开发的规范要求至少包括如下几个方面:1

14、.符合软件工程规范的要求符合软件工程规范的要求承建商对软件设计、开发要符合软件工程的规范要求,它的具体表现之一就是在设计和开发过程中按软件工程规范要求承建商向用户和总集提交过程文档,经多方评审通过再进入下一步的流程,以保证软件开发质量及开发过程受控。软件工程实施过程中关键的技术和过程文档如下:软件开发计划软件需求规格说明书质量保证计划配置管理计划数据结构设计说明软件概要设计说明8软件详细设计说明软件测试计划软件测试说明及用例软件测试报告用户手册安装部署手册运维手册部署实施报告软件配置文档试运行报告2.承建商应采用统一的标记语言承建商应采用统一的标记语言3.承建商应采用统一的开发语言版本承建商应

15、采用统一的开发语言版本4.承建商应采用主流的开发集成平台承建商应采用主流的开发集成平台5.接口的规范接口的规范4.2.2、文献数字化加工中心应用软件开发功能要求、文献数字化加工中心应用软件开发功能要求文献数字化加工中心应用软件包括:文献数字化生产(扫描、拍摄、音视频数字化、缩微品数字化等)子系统、标引生产子系统及配套的文献数字化中心管理子系统,该系统是一个 B/S 与 C/S 相结合的软件项目,其中服务端采用UNIX 操作系统。另外,在该管理子系统中其很重要的一部分是对生产所得到的数字成品进行有效管理,它将作为该中心生成的数字成品的管理工具。本节是项目需求书最重要的一节。、术语、

16、术语文献:文献:本系统涉及的文献指普通纸质书册、古籍善本、缩微文献、音视频、特殊资源(如舆图、甲骨等)国家图书馆拥有的资源。元数据:元数据:数据的数据。一般记录对象数据的描述信息、结构信息、管理信息(技术、数据版权、数据出处、数据来源等) ,用于检索、分类、统计等功能。9数字化:数字化:采用数字手段将普通数据转化为数字信息。这里普通数据指纸质、胶片、舆图、甲骨、磁带、录像带等介质上载有的数据;数字信息则存储于磁盘、光盘、磁带等载体上的数字信号。数字化的手段一般是数字采集、OCR 识别、存储。对象数据:对象数据:普通文献数字化后形成的数据,称为对象数据,如一段数字视频,一个 TIFF 图象文件等

17、。数字水印:数字水印:数字水印技术是将一些标识信息(即数字水印)直接嵌入数字载体(包括多媒体、文档、软件等)当中,但不影响原载体的使用价值,也不容易被人的知觉系统(如视觉或听觉系统)觉察或注意到。通过这些隐藏在载体中的信息,可以达到确认内容创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。、需求描述、需求描述(1) 、文献数字化生产、文献数字化生产文献数字化生产的任务,就是要对各类文献通过一系列流程工艺处理,最后形成可供移交的数字对象资源,以及相关的元数据。文献数字化生产的核心是对生产流程的管理,流程工序包括任务分配、资料前整理、对象数据处理、数据后处理、数据输出、实物整

18、理归还等。各流程工序为独立模块,生产线以任务为目标而灵活设置。文献数字化生长应用软件的开发,就是要对文献数字化生产工序的各生产环节提供软件支持,提高文献数字化生产各环节的自动化程度,从而提高文献数字化生产效率和数字化成品质量。(2) 、文献数字化标引、文献数字化标引文献数字化标引的任务是对文献数字化生产所得到的数字资源进行二次加工,包括编辑加工书目数据、篇名数据、摘要、全文等,形成或完善相应的元数据。文献数字化标引的核心是对标引生产流程的控制管理,流程工序包括任务10分配、工序设置,文献对象的加工标引、校对检验、数据整合、数据输出等。文献数字化标引应用软件的开发,就是要对文献数字化标引生产工序

19、的各生产环节提供软件支持,提高标引生产的自动化程度,从而提高标引生产的效率和数字化成品质量。文献数字化生产和文献数字化标引的相关环节,可供配置组合到一起构成一个新的工序。文献数字化标引子系统应提供预留接口以处理国图其它渠道获得的数字资源。(3) 、系统管理、系统管理从业务角度讲,系统管理的目的,就是要对文献数字化生产和文献数字化标引提供全局性的配置、管理和控制功能,提供数字成品管理功能,并通过统计分析为生产决策服务。系统管理的功能,包括管理和提供文献数字化生产、文献数字化标引所需的工序和工艺表,根据不同的任务类型和登录类型组配生产工序;组配任务分至相应生产线,接收生产线管理系统的各种信息;提供

20、生产线上文献信息、数字成品、生产信息、人员、光盘加工数量以及历史数据等的各种查询和统计功能,按需输出各种电子报表;提供系统管理员权限管理的功能,对操作员等进行管理;提供以及报警和数据备份等维护功能。、功能描述、功能描述以下是文献数字化加工中心生产流程示意图,不同文献的数字化流程所包含的工序,需要在软件实现时进一步分析确认:11文献数字化生产流程图(此图为示意图,仅作为参考)一、一、文献数字化生产系统文献数字化生产系统(1) 文献前整理实现自动接收和输出书目数据或其他元数据;按文献类型,分发任务,补充元数据(描述型元数据) ;登记文献是否需要修正或修裱;记录整理信息;检查校对;数据

21、输出至相应生产线等功能。(2) 图书数字化按设定工序扫描;数据整合;图象编辑处理;版面切分处理;格式转换;检查、校对;数据封装(全部元数据、对象数据) ;数据刻盘;数据输出至服务器;磁盘清理;生成装订、还书单等。(3) 期刊数字化按设定工序扫描;数据整合;图象编辑处理;版面切分处理;格式转换;检查、校对;数据封装(全部元数据、对象数据) ;数据刻盘;数据输出至服务器;磁盘清理;生成装订、还书单等。(4) 报纸数字化按设定工序扫描;数据整合;图象编辑处理;版面切分处理;格式转换;检查、校对;数据封装(全部元数据、对象数据) ;数据刻盘;数据输出至服务器;磁盘清理;生成装订、还书单等。(5) 普通

22、古籍善本数字化按设定工序,扫描或数码拍摄;预处理(遵循标准) ;数据整合;图象12编辑处理;版面还原等处理;格式转换;检查、校对;数据封装(全部元数据、对象数据) ;数据刻盘;数据输出至服务器;磁盘清理;生成归还清单等(6) 特殊文献数字化专业设备组建的特殊文献生产线。文献包括超大幅面地图、拓片、实物、珍贵古籍等。由于文献的特殊性,在生产过程中,强调生产工艺和工序环节,注重文献的细节处理。特殊文献生产要求、设定条件、生产时间、人员、文献保护等等,根据对象和任务具体情况,设置参数指标和生产线工序。基本工序同普通古籍善本生产线,特殊工序的添加,需在任务加工初期配置。(7) 缩微品数字化针对 16

23、毫米、35 毫米、平片等缩微制品, 进行数字化处理。系统支持专业硬件设备接口,并将设备处理的数字文件导入生产系统,完成进一步的编辑处理。工序可根据对象的文献类型,进行生产线配置,如图书、报纸、期刊、善本等文献。(8) 音频、视频数字化(采集;导入)合理组织、配置生产线,使硬件系统与软件系统实现高指标的的生产效率。音视频文献的数据来源包括模拟资源(VHS)和原生数字资源(DV、DVD、VCD) ,所以数据的生产流程又分为数据采集和数字转换。由于音视频文件的加工大多采用专业软件或编码器来完成,所以音频、视频加工生产线系统应注意与第三方软件的接口问题。生产主要过程如下:原始资源组织整理-建立工作目录

24、-文件数字化-质量检查-数据保存(9) 其它数字化临时或指定的生产任务。根据具体需求,在工艺、工序、加工等参数表中,自动组配、定制生产线系统。比如对购买数据的格式转换、封装、拆分、命名,或更加深入数字处理对象文件。13(10) 对硬件设备和专业处理软件配置管理功能 能与专业采集处理设备进行良好的集成,能根据处理工序中对设备参数的配置要求,基于硬件设备所提供的接口对硬件设备进行参数控制。 能与专业处理软件进行良好集成,能根据处理工序和工艺中对专业处理软件的参数配置要求,基于专业处理软件所提供的接口对处理软件进行参数控制。(11) 数字水印处理对文献数字化产生的对象数据进行水印处理。根据数字水印处

25、理策略,按照工序流程,对文档、图片、音视频数字资源加盖数字水印,数字对象的水印属性可以记录在相关元数据中。数字水印处理可以作为一项独立的功能,嵌入到文献数字化生产支撑软件中。数字水印处理功能支持可见水印和隐形水印的处理,提供数字水印查看工具。隐形水印应有安全性。(12) 元数据的生成与管理包括管理型在内的各类元数据的生成贯穿于整个文献数字化处理的过程中,并在文献数字化的各个环节中会不断的补充与完善。描述性元数据的获取与完善需要根据不同种类的文献数字化工序而定。(13) 唯一标识的和成与唯一标识符注册 根据中心管理系统的唯一标识管理策略对生成的对象数据分配与指定唯一标识,并按唯一标识符系统的注册

26、格式要求,向唯一标识符系统注册并获取数字对象唯一标识符。内部唯一标识的生成和唯一标识符注册将作为生产环节的两个功能模块配置到各类文献数字化的流程工序中。二、文献数字化标引系统二、文献数字化标引系统(1) 书目编辑提供书目数据的编辑,以及书目与数字对象的挂接处理。能提供多种书目的编制方法:外部数据导入、相近记录拷贝、人工录入等。能够按基本元数据进行字段提取与处理;能够区分数据各个字段,并按要求在CNMARC、DC、XML 或其他元数据格式、数据库之间的转换。要求具有检索、剔重、唯一标识处理的能力,且能够分配唯一资源标识符。14(2) 篇名标引提供多种制作方法:数据导入;OCR 识别;人工录入等;

27、提供目次、书目、摘要、数字对象的挂接;建立目次到资源的唯一对应关系;校验、检查(3) 摘要标引主要处理摘要信息与对象实体进行连接;对于基本元数据进行提取与处理;提供多种制作方法:数据倒入;OCR 识别;人工录入等;提供目次、书目、摘要、其他元数据与数字对象的挂接,建立唯一定位关系;校验、检查(4) 自定义内容标引版面指定内容置标(OCR 识别、人工录入、数据导入) ;多媒体指定段落置标(OCR 识别、语音识别、人工录入、数据导入) ;置标位置信息、与其它载体管理关系的记录;校验、检查(5) 全文数字化处理(手工录入;或 OCR 识别)生成 ISO2709、XML、HTML、PDF、TXT、等格

28、式和元数据转换;商业数据格式转换;支持多种加工方式;多种校验方式;检查(6) 编辑管理专用文字输入编辑管理工具,可以处理横排、竖排的输入;可以使用多种输入方法;可以进行多种信息编码之间的转换;可以支持形码、音码的输入;有多重输入比较的能力,版式预览的能力,支持基准的 XML 文件结构,含位置信息(对应加工图像) 、可转换进入通用的文本编辑工具中(7) 数字水印处理对标引后形成的全文数据,在必要时可以作为对象数据来看待。当这些全文数据作为对象数据时,其发布与服务必须受到版权的约束,因此标引生产系统也需要具有数据水印处理功能。根据数字水印处理策略,按照工序流程,对数字对象加盖数字水印,数字对象的水

29、印属性可以记录在相关元数据中。数字水印处理可以作为一项独立的功能,嵌入到标引生产支撑软件中。15(8) 字符集外管理可建立 Unicode 字形字库,提供简单容易正确操作的输入方法,检索指定字形的字,对外字进行自动查重。可建立和修改字形曲线库、字的结构图、字音、自给编码等外字库,建立外字的属性。建立数字资源与外字的关联表。提供外字输入、检索、查重和统计。提供输出外字功能。根据Unicode 版本升级,修改外字库,并可按需要修改已做数字资源中相关外字的编码。该部分功能需要与中文信息处理系统子项目所购软件提供的功能进行整合。(9) 元数据的生成与管理数字资源标引生产过程所产生的元数据,一般都以元数

30、据的形式保存。所产生或补充的元数据信息包括描述型元数据、管理型元数据等。元数据的属性字段规范需要在软件需求分析时进一步分析确定,原则上尽量采用国图标准。(10) 对硬件设备和专业处理软件(主要是 OCR)配置管理功能 能与专业采集处理设备进行良好的集成,能根据处理工序中对设备参能与专业采集处理设备进行良好的集成,能根据处理工序中对设备参数的配置要求,基于硬件设备所提供的接口对硬件设备进行参数控制。数的配置要求,基于硬件设备所提供的接口对硬件设备进行参数控制。 能与专业处理软件进行良好集成,能根据处理工序和工艺中对专业处能与专业处理软件进行良好集成,能根据处理工序和工艺中对专业处理软件的参数配置

31、要求,基于专业处理软件所提供的接口对处理软件进行理软件的参数配置要求,基于专业处理软件所提供的接口对处理软件进行参数控制。参数控制。(11)标引生产管理根据任务生产通知单,按照要求分发到相应的标引生产线;根据具体任务设定生产流程、工序,掌握和控制生产进度和数量;数据接收(输入) ;置标字段管理,实现自定义字段名称和属性、任意选择字段、自动灵活组配标引数据库;统计及报表输出;人员角色、权限管理;生产线数据库维护;文件系统管理,包括对象文件、元数据和备份数据;数据输出。三、文献数字化中心管理系统三、文献数字化中心管理系统文文献数字化中心管理系统是与文献数字化生产文献数字化标引配置的管理系统,一方面

32、实现文献数字化加工中心日常生产管理所需要的功能,另一方面实现事后统计分析功能。16(1) 任务管理包括任务定制和管理。根据文献类型、任务要求,生成任务单。调用工序工艺管理相关指标,与任务单一起发至生产线。根据生产线完成人员的不同(馆内文献数字化加工中心、馆内其他业务部门和馆外加工企业) ,负责任务下达、质量监督、工程过程控制、标准制定等。(2) 人员权限管理系统管理员、子系统管理员、操作员的帐户、密码、权限的管理。(3) 接收管理接收生产线外数据;接收生产线各个模块应用数据库数据;根据参数化管理来适应底层不同数据库和操作系统的不同数据传输格式的需要。 (4) 工序工艺管理不同加工对象的工序工艺

33、的配置。设置各种相关设备的参数,设置存储方式方法,设置数据格式转换要求,设置检查与校对的方式等。针对不同加工对象的数字化生产工序工艺的缺省设置,要符合国图实际的数字化加工规范要求。对于生产流程的管理与任务分配,应充分考虑对服务器的支撑能力,以及终端处理过程的支撑能力。工序工艺配置信息可与定制任务进行匹配。提供色彩、实物管理。对于实物扫描、拍照等的色系、拼图体系进行管理,主要是色基的管理、生产设备与处理参数说明、实体说明、数据格式、拼图等(5) 数据库管理对形成的各类数字资源的库进行维护管理,并有相应的功能应对生产过程需要的配置。(6) 文件管理对形成的各类文件进行维护管理,并有相应的功能应对生

34、产过程中需要的调整。(7) 数据输出管理17管理、输出各个文献数字化加工过程中产生的过程文件、资源数据格式、加工数据格式、元数据、对象数据。提供批量、增量等多种输出方式。对于输出可以根据加工任务时间、加工任务的质量检查、完成的批量等进行控制输出转移。加工完成前输出到临时存储区域,验收完毕,转移到资源储藏存储区域。对于输出任务形成一个可管理的、可检查的清单文件标签,便于再加工、转移、存储使用。(8) 软硬件接口参数配置管理软硬件接口参数配置管理负责有关扫描仪、摄像系统、非线性编辑系统、音频视系统等各种设负责有关扫描仪、摄像系统、非线性编辑系统、音频视系统等各种设备的驱动、格式转换和格式控制等参数

35、配置信息的管理。根据工序的不同备的驱动、格式转换和格式控制等参数配置信息的管理。根据工序的不同调整和设置相应的硬件设备参数。根据工艺的需要,转换各种设备输入输调整和设置相应的硬件设备参数。根据工艺的需要,转换各种设备输入输出的格式。出的格式。负责对配属的专业处理软件的相关参数的配置管理,根据工序的不同负责对配属的专业处理软件的相关参数的配置管理,根据工序的不同调整和设置相应的专业处理软件参数。调整和设置相应的专业处理软件参数。(9) 版权信息登记根据需要对数字资源的版权信息进行登记。(10)数字化产品移交管理可定时批量或单独将生产审校通过的数字化成品,自动生成移交电子通知单,送至数字资源集中保

36、存与管理系统,接收电子回执,并回送收到的通知回执。处理过程信息自动记录到加工记录中。(11)统计管理对工作人员、加工时间、加工数量、数据成品、生产过程(工序)等各个方面进行统计。统计结果可打印、可显示棒形图、饼形图、表格,并可按时间输出电子表格。(12)快速印刷根据已有的书目记录和数字资源目录进行查重、确认。提供待印刷清单,并通知快速印刷系统。任务批准后,进行质量检查,包括数据的完整性、顺序关系、版权关系、文献状态。(13)数字成品管理(包括介质管理)能够管理各种存储介质的出入库。对新介质和成品盘的出入库、库内18报废以及库内丢失都进行计算机管理,使介质的管理系统化。查询各种介质的使用情况。用

37、户可以方便的查询成品盘的情况以及盘中图书的信息。提供统计库存各种介质的数量,使管理者清楚库存各种介质的情况。 提供统计文献成品,包括存放位置、类型、进库时间、数据数量、数据格式等信息;记录数据出库信息。库房(存储介质)管理子系统是一个独立的系统,它使用的数据库与生产管理系统可以公用,在整个管理系统中,起着重要的作用。(14)帮助和自我学习支持提供涉及到文献数字化加工系统的各个软件模块的使用、工序、工艺、技术规范等的电子在线帮助手册,并可供生产操作人员和管理人员方便查询使用。、接口、接口应用软件的接口分两类,一类是与文献数字化中心专业采集设备的接口,如高速扫描仪、非接触扫描仪、大幅

38、面扫描仪、数字音视频设备等,这方面在文献数字化标引系统软件要求中的第 10 点和文献数字化中心管理系统软件要求中的第 8 点有具体的要求。另一类是与其他应用软件的接口。由于本项目承建商不但要承担应用软件的开发,同时还要完成软硬件设备的集成及接口程序,与硬件设备接口属于承建商内部实现的问题,因此本节所重点讲的问题是与其他应用系统软件的问题。接口关系的业务描述接口关系的业务描述数字资源集中保存与管理系统数字资源集中保存与管理系统 文献数字化系统将需要处理的文献进行数字化,并生成相应的元数据,得到的对象数据和元数据需要进入数字资源集中保存与管理系统进行深加工和集中保存,深加工的依据是根据国家数字图书

39、馆制定的元数据、对象数据、知识组织等相关的标准。 另外,数字资源集中保存与管理系统还要处理电子资源呈缴、网页资源获取等其它途径过来的数字资源。19版权管理系统版权管理系统 在对文献进行数字化的过程中需要从版权管理系统中查询文献的版权授权等信息,并根据这些信息对文献的数字化对象地行相应的版权加工。在文献数字化过程中根据需要将版权基础信息(版权页信息)登记到版权管理系统。唯一标识符系统唯一标识符系统 国家数字图书馆唯一标识符系统实现数字对象唯一标识符的注册和管理,并提供对象访问地址的解析。因此,文献数字化系统在生成数字对象的过程中,需要生成并向唯一标识符系统注册数字对象的唯一标识符。快速印刷系统快

40、速印刷系统缺书处理与快速印刷系统根据需要,向文献数字化系统申请对文献进行数字化处理,文献数字化系统处理完成后提供快速印刷所需的数字资源。另外,根据需要文献数字化系统也会向快速印刷系统请求对数字资源的快速印刷服务。AlephAleph 系统系统对于需要数字化的传统文献,文献数字化处理系统向 ALEPH 系统(自动化系统)中申请获得元数据,用于生成或修订数字对象的元数据,以及对已数字化的资源进行查重。馆际互借系统馆际互借系统文献传递和馆际互借业务在需要调用数字化资源的时候,如果集中保存系统中没有这些资源,则可以直接向文献数字化系统申请进行文献数字处理。、格式与标准、格式与标准 文献数

41、字化加工中心的生产过程、标引过程、管理过程中所涉及的仅用于管理的文件格式及数据标准,由承建商根据自己的经验结合国图的具体情况制20定,在概要设计说明书确定之前加以明确并通过数图项目办的审核。文献数字化加工中心的生产过程、标引过程中所涉及的对于元数据和对象数据的格式和标准,由承建商根据国家数字图书馆所制定的数据标准,结合软件实现和实用的因素制定,在软件需求规格说明书确定之前加以明确并通过数图项目办的审核。承建商需要在国家图书馆现已形成的数字化加工处理规范成果的基础上,结合新建的文献数字化加工中心的功能,与用户方一起制定新的数字化加工处理规范。目前国图已经制定的标准规范有:汉字属性字典规范国家图书

42、馆唯一标识符标准规范国家图书馆管理元数据规范国家图书馆博士论文数字化加工规范(内部)国家图书馆中文图书数字化加工规范(内部)国图正在制定的标准规范有:中文文献全文版式还原与全文输入 XML 规范计算机中文信息处理规范数字资源对象管理规范文本数据加工标准与工作规范图像数据加工标准与工作规范音频数据加工标准与工作规范视频数据加工标准与工作规范国家图书馆核心元数据标准国家图书馆元数据应用规范国家图书馆专门元数据设计规范专门元数据标准与著录规范拓片专门元数据标准与著录规范舆图专门元数据标准与著录规范甲骨专门元数据标准与著录规范古籍21专门元数据标准与著录规范家谱专门元数据标准与著录规范电子图书专门元数

43、据标准与著录规范电子连续性资源专门元数据标准与著录规范学位论文专门元数据标准与著录规范期刊论文专门元数据标准与著录规范网络资源专门元数据标准与著录规范音频专门元数据标准与著录规范视频专门元数据标准与著录规范图像数字对象统计规范4.2.3、文献数字化加工中心应用软件性能要求、文献数字化加工中心应用软件性能要求1文献数字化日处理能力普通纸质文献数字化日处理能力 1200*400 页/工作日;缩微介质数字化日处理能力 12000 拍/工作日;文摘记录加工日处理能力 360 个/工作日;书目记录、文摘记录、版权关系、数字资源唯一标识符等挂接日处理能力,各 360 个/工作日;目次的处理、挂接日处理能力

44、,72000 行/工作日;篇名的处理、挂接处理能力,24 万个/工作日;音频、视频资源的深度标引处理能力,24 小时/工作日2并发支持及响应时间生产任务管理并发支持,支持 500 人同时在线,最多并发用户支持 100个。软件人机交互响应时间,在不涉及大对象数据处理和元数据检索的情况下,100 用户并发时,响应时间不起过 5 秒,平均响应时间不超过 2 秒。系统内部标元数据/标引数据检索、平均响应时间不超过 3 秒,100 用22户并发时不超过 15 秒。在线成品信息检索,平均响应时间不过 5 秒,100 用户并发时不超过 15秒。3数据传输要求在进行与业务相关的大数据量传输时,在支持可靠性传输

45、的前提下,系统应能充分利用所处网络和运行平台的性能。4.34.3、文献数字化加工中心专业采集设备的性能、文献数字化加工中心专业采集设备的性能参考参考4.3.1、大幅面扫描仪、大幅面扫描仪56 英寸快速彩色数字化设备(英寸快速彩色数字化设备(2 套)套)扫描精度: +/-0.1% +/-1 象素点扫描速度: 200dpi: 单色:9.00 英寸/秒;24 位彩色:1.5 英寸/秒光学分辨率: 输入 1200 x 600 / 输出 600 x 600 (dpi)插值分辨率: 线性插值从 100 到 9600dpi 以 1 dpi 递增色彩模式: RAW RGB/ sRGB;色域: 48-位原始点彩

46、色图像捕捉;16-位原始点灰度图像捕捉消蓝模式: 2D 智能自适应消蓝 (IAT)最大进纸厚度:20 毫米;最大进纸宽度:61.9 英寸(157 厘米)最大扫描宽度:56 英寸(142.3 厘米)走纸系统: 双排高精密度驱动轴和全轮驱动等高校准橡胶滚轮;单排动态介质控制的压力轴光学成像系统:双高效节能 LED 光源(只有扫描时亮起,寿命达 5 万小时)8 x 四重线性 CCD (RGB + 单色) 和红外虑镜镜头操作面板: LCD 面板 (显示扫描仪状态, 模式和设置), 扫描 / 拷贝 按钮电源: 外置电源接口: USB2 接口;千兆以太网接口软件: 专业的扫描处理软件,具备扫描流程管理和图

47、像处理功能认证: 欧洲能源之星(ENERGY STAR) 保修服务要求:原厂提供技术服务,三年保修服务要求:原厂提供技术服务,三年 7x24 小时小时。大幅面高精度彩色扫描仪(大幅面高精度彩色扫描仪(2 套)套)扫描精度: +/-0.05% +/-1 象素点23扫描速度: 200dpi: 单色:12.00 英寸/秒;24 位彩色:4 英寸/秒光学分辨率: 输入 1200 x 1200 dpi / 输出 1200 x 1200 (dpi)插值分辨率: 线性插值从 100 到 9600dpi 以 1 dpi 递增色彩模式: RAW RGB/ sRGB;色 域: 48-位原始点彩色图像捕捉;16-位

48、原始点灰度图像捕捉消蓝模式: 2D 智能自适应消蓝 (IAT)走纸系统: 大直径、单滚筒、高精度驱动轴;介质厚度自动调节光学成像系统:没有反光镜的直线光路成像;双高效节能 LED 光源(只有扫描时亮起,寿命达 5 万小时) ;6 x 四重线性 CCD (RGB + 单色) 和红外虑镜镜头操作面板: LCD 面板 (显示扫描仪状态, 模式和设置), 扫描 / 拷贝 按钮电源: 外置电源接口: USB2 接口,千兆以太网接口软件: 专业的扫描处理软件,具备扫描流程管理和图像处理功能认证: 能源之星(ENERGY STAR)保修服务要求:原厂提供技术服务,三年保修服务要求:原厂提供技术服务,三年 7

49、x24 小时小时.2、快速扫描仪、快速扫描仪企业级高速文档扫描仪企业级高速文档扫描仪( (日工作量日工作量 6 6 万页万页)(5)(5 台台) )扫描速度(200dpi、双面、横向、信纸尺寸文档):i620:80ppm*(可达320ipm*)扫描技术:两个三色增强 CCD 光分辨率:300dpi照明:每侧两个 2500 小时以上氙气灯、无汞输出分辨率:彩色灰度:100150200240300dpi黑白:200240300400dpi最大文档尺寸:30.5 厘米 x66.04 厘米(12 英寸 x26 英寸)最小文件尺寸:64 毫米 x64 毫米(2.5 英寸 x2.5 英寸)

50、进纸器升降机:500 页带有升降机的自动文档进纸器,有两种设置:连续 进纸和 500 页批量进纸重张探测:最新的和增强的超声波重张检测功能(使用三个传感器)文档长度检测功能连接:IEEE-1394(火线)接口,6 针接头,包括 IEEE-1394 卡和连线接口支持:TWAIN 和 ISIS 驱动器(内含):影像采集软件,VirturalReScan(VRS)影像特征(扫描仪硬件本身):带有智能阈值处理的完美页面的扫描,自动剪切,强力剪切,纠偏,电子彩色滤除,正交旋转,误差扩散,半色调移除,噪声移除文件格式输出:JPEG(用于彩色和灰度影像) ;TIFF(用于双色影像)推荐 PC 配置:P 2.

51、4GHz 处理器,512MB RAM24支持的操作系统:Windows 98SE,Me,2000,XP 存储器:扫描仪内装 256MB DIMM保修服务要求:原厂提供技术服务,三年保修服务要求:原厂提供技术服务,三年 7x24 小时小时中档高速扫描仪中档高速扫描仪 (5 台台)速度:每分钟 75 页/150 副影像(黑白/灰度/彩色)(速度会因您选择的驱动程序、应用程序软件、操作系统和 PC 而有所不同。)扫描技术:双 CCD;光学分辨率:600dpi 照明:双荧光(冷阴极)输出分辨率:75, 100, 150, 200, 240, 300, 400, 600 和 1200dpi最大文档尺寸:

52、297 毫米863 毫米(11.7 英寸34 英寸)最小文档尺寸:50 毫米64 毫米(2 英寸2.5 英寸)纸张厚度和重量:34-413 克/每平方米(9-110 磅)进纸器:容量高达 150 张 60 克/每平方米(16 磅)重张进纸检测:具备超声波重张检测技术 连接功能:USB2.0捆绑软件:TWAIN,ISIS 和 WIA 驱动程序,采集软件,Lite 版影像功能(在扫描仪中):完美页面扫描功能、iThresholding 智能阈值、自适应阈值处理、纠偏、自动裁剪、局部裁剪、强力裁剪、电子滤色、双流数据扫描、交互式色彩、亮度和对比度调整、自动调整方式、自动彩色检测、背景平滑、黑白影像分

53、区处理、自动照片裁剪、多颜色电子滤色、可训练式电子滤色、长文档模式、特别文档模式、切换补丁文件格式输出:单页以及多页 TIFF,JPEG,RTF,PDF,或可搜索 PDF保修服务要求:原厂提供技术服务,三年保修服务要求:原厂提供技术服务,三年 7x24 小时小时普通高速扫描仪普通高速扫描仪(10 台台)扫描速度:在 150dpi 黑白、灰度和彩色模式及 A4 纸下,不低于 50(单面)/100(双面)/每分钟光学分辨率:300dpi纸张自动适应:自动适应 纸张厚度和重量:从超薄纸到卡片都可以最大文档尺寸:A3 ADF 容量:不少于 100 页 扫描元件:双面 CCD接口:IEEE 1394 接

54、口(400MB/S)扫描输出选项:支持以下五种输出选项:1、黑白:纯黑白 2、灰度:8 位灰阶扫描 3、彩色:24 位真彩扫描4、同时输出黑白和灰度(双流输出) 5、同时输出黑白和彩色(双流输出)文件格式输出:JPEG(用于彩色和灰度影像),TIFF(用于黑白影像)重张检测,3D 超声波 影像特性: 自动纠偏、自动修剪,智能阈值处理完美页面扫描功能25软件: Smartscan 扫描控制软件(集成扫描、编辑功能;自动色彩判断、书刊扫描模式等功能)保修服务要求:原厂提供技术服务,三年保修服务要求:原厂提供技术服务,三年 7x24 小时小时普通平板扫描仪普通平板扫描仪(25 台台)A3 扫描仪 光

55、学分辨率1600dpi 最大分辨率 1600 x 1600 dpi色彩位数 48-bit 接口类型 USB 2.0 扫描速度: 6 页/分软件 Acrobat Reader、Readiris Pro 10 Corporate Edition、Presto PageManger、Presto! ImageFolio 4、OCR 专业版保修服务要求:原厂提供技术服务,一年保修服务要求:原厂提供技术服务,一年 5x8 小时小时.3、缩微胶片扫描仪、缩微胶片扫描仪(平片、平片、8/16/35 毫米胶片扫描加工用毫米胶片扫描加工用)3 套套功能:将缩微胶片转换成电子影像胶片类型:平片,封

56、套片,开窗卡,16mm 卷片,35mm 卷片屏幕尺寸:303440mm 放大尺寸:7.5x,9-16x,13-27x,20-50 x聚焦方式:手动 ;变 焦:手动 ;扫描速度:6.5 秒/页(A4,400dpi)扫描分辨率:200,300,400,600,800dpi;曝 光:自动,手动扫描特点:自动对中;自动遮幅;自动影像转动;卤 素 灯:20V,150W配置:主机、计算机接口板、PowerFilm 操作软件、2940 SCSI 接口卡、UC-7 平片架/电动卷片架、变焦镜头: 9-16X、变焦镜头: 20-50XX保修服务要求:原厂提供技术服务,三年保修服务要求:原厂提供技术服务,三年 7

57、x24 小时小时.4、彩色书刊非接触扫描仪、彩色书刊非接触扫描仪(非接触式,用于书刊半自动翻页,可仿真复制非接触式,用于书刊半自动翻页,可仿真复制)1 套套扫描仪描述:顶置式扫描头,台式非接触扫描,适合文物、古籍、图书、报纸、字画、地图等单页或装订成册稿件原件尺寸:635460 毫米(超 A2)扫描速度:1 秒/页(A2,黑白、灰度,300dpi)4 秒/页(A2,彩色,300dpi)分辨率:100-600dpi扫描模式:36 位彩色,12 位灰度,1 位黑白二值原稿厚度:书本最大厚度为 100 毫米扫描稿台:连机书稿台(可选 90 度开合电动压稿玻璃)扫描方式:自动对焦,景深

58、达 50 毫米接口:双 IEEE1394 火线接口影像格式:TIFF 不压缩,TIFF G4,JPEG,JP2,PDF,多页 TIFF,BNMP,PCS扫描软件:OS11 基本模块(扫描、存储、浏览)PerfectBook 完美 3D 书刊扫描:纠斜、去杂点、翻转、去黑边、遮幅、锐化,智能分26页、手指删除、水印处理、盖章效果、同步彩色转灰度和黑白保修服务要求:原厂提供技术服务,三年保修服务要求:原厂提供技术服务,三年 7x24 小时小时.5、专业类非接触式扫描仪、专业类非接触式扫描仪(超大、非接触、实物等加工处理超大、非接触、实物等加工处理)1 套套描述:顶置式扫描头,台式非接触扫描,适合文物、古籍、图书、报纸、字画、地图等单页或装订成册稿件 最大原件尺寸: 1240 x 870 mm(超 A0) 分辨

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论