




已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.1 工程背景.2 1.2 工程建设目标.2 1.2.1 总体目标2 1.2.2 服务目标3 1.2.3 技术目标3 1.3 工程建设内容.4 1.4 建设思路.6 1.4.1 框架为基,业务为主6 1.4.2 信息资源整合7 1.4.3 业务应用整合7 1.4.4 服务整合8 1.5 总体结构.10 1.5.1 系统示意图10 1.5.2 总体逻辑架构11 1.5.3 网络与存储逻辑结构15 1.5.4 数字资源和传统文献总体流图16 1.6 外部接口设计.17 1.6.1 全国图书馆联合编目接口17 1.6.2 使用 Z39.88 开放链接接口实现和资源供应商及各图书馆的接口18 1.6.3 用 OAI 协议提供元数据接口 19 1.6.4 基于国际标准 ILL 实现馆际互借接口 .19 1.6.5 使用 URI 实现调度接口20 1.6.6 VR 虚拟参考咨询接口21 1.6.7 DD 文献传递接口22 1.6.8 Proxy 数据代理服务接口22 1.7 技术路线.22 1.7.1 标准化规范设计22 1.7.2 基于 SOA 的体系架构24 1.7.3 采用在线、近线、离线相结合的存储策略27 1.7.4 计算机集群27 1.7.5 基于 OAIS 的长期保存27 1.7.6 虚拟化技术29 1.8 基础平台建设.29 1.8.1 网络系统建设29 1.8.2 存储与灾备系统31 1.8.3 集群系统31 1.8.4 系统软件平台31 1.9 应用平台建设.32 1.9.1 应用支撑平台的框架结构的逻辑结构32 1.9.2 平台框架的组成32 1.9.3 应用支撑平台框架的实现机制33 1.10 业务系统建设.33 1.10.1 资源采集与获取系统33 1.10.2 数字资源加工系统40 1.10.3 数字资源组织与管理系统47 1.10.4 数字资源发布与服务52 1.1 工程背景工程背景 国家图书馆是综合性研究图书馆,担负国家总书库的任务,履行搜集、加工、存储、 利用和传播知识信息的职责,承担全国书目中心、图书馆信息网络中心、图书馆发展研究 中心的职责。ISO5127国际标准中有关国家图书馆的定义中明确规定:“凡建在该国内有负 责收集和保存该国出版的全部重要文献的图书馆,即可具有法定呈缴本职能” 。从传统图书 馆阶段看,国家图书馆区别于其他图书馆的主要特征,就是全面收藏本国印本出版物并面 向全国乃至全世界服务。在现代计算机网络环境下,按照国家图书馆的职能,国家数字图 书馆建设与其他行业数字图书馆建设应有明显的区别。 首先,在数字资源建设方面,履行国家图书馆的职能,在全面收藏中文文献信息的基 础上,作为全球最大的中文文献提供中心,负有重点收藏和长期保存中文数字资源,建立 中文数字资源保障中心,建设中文数字资源查询基地的责任。 其次,在数字资源服务方面,国家图书馆是公益性文化单位,具有社会知识传播与信 息服务中枢的核心地位,担负着为“构筑终身教育体系、创建学习型社会”服务、最大限 度地满足读者全方位、多渠道获取信息与知识需求的重任。国家图书馆的服务对象主要分 为四个层面,一是为中央国家机关立法决策服务;二是为全国重点教育、科研及企事业单 位服务;三是为社会公众服务;四是为图书馆和信息机构服务。 第三,在数字图书馆技术方面,国家数字图书馆构建数字资源采集、加工、保存的技 术支撑平台时,无论在体系结构设计、网络平台与硬件设施搭建,还是在软件研制方面的 建设都不同于一般的数字图书馆,它不是独立和封闭的系统,而是要保持与其它各数字图 书馆系统之间的兼容性、可互操作性和开放性,为全国数字图书馆建设的共建共享提供支 撑。 第四,在资源框架与标准规范方面,要使数字图书馆理论、需求分析、接口分析、互 通标准的采用与技术实现有机结合,实现以内容管理框架为基础技术、硬件体系结构面对 框架、应用软件面对框架接口的数字图书馆系统。在标准规范研制方面,将采用数字图书 馆相关国际、国家及行业标准,致力于为全国数字图书馆建设提供统一的标准规范。 1.2 工程建设目标工程建设目标 1.2.1 总体目标总体目标 国家数字图书馆将全面履行国家图书馆的职能,有重点的收藏、建设和长期保存中文 数字信息,在互联网上形成超大规模的、高质量的中文数字资源库群,建构数字资源采集、 加工、保存的技术支撑平台,并通过国家骨干通信网向全国以及全球提供中文数字信息服 务,使国家数字图书馆成为世界最大的中文数字信息保存基地与服务基地,成为国家重要 的信息基础设施。利用先进的技术和传播手段,向全国及全球展示中华优秀文化,实现馆 藏资源的共享。 到2007年底,建立统一的国家数字图书馆服务门户,向读者提供揭示性书目信息(书 目、篇名、目次等)3000万条左右,在互联网、馆域网上向读者提供超过200TB的数字资源, 在二期工程新馆馆区内提供580个电子阅览室席位,初步建成具有国际先进水平的国家数字 图书馆。 2008-2015年完成我国中文文献的书目数据库建设,通过网络通道向公众全面提供中 文二次、三次文献的检索(包括图书、期刊、报纸的名称及篇名数据) ;完成馆藏特色资源 库的建设,向公众提供具有中国文化特色的信息资源,包括:甲骨资源库、金石拓片资源 库、敦煌资源库、地方志资源库、图书馆学资源库、中国国情资源库、中国博士论文资源 库、中国学资源库等;建立中文互联网信息资源库,保存中国重要的网站网页信息,并向 公众提供查询服务;与其他行业性、地区性数字图书馆系统连通,向公众提供全方位的知 识信息库,使国家数字图书馆成为中文数字信息的查询中心和服务中心。 1.2.2 服务目标服务目标 国家图书馆的主要服务对象分别为中央国家领导机关,重点科研、教育、生产单位, 社会公众和图书馆和信息机构服务四个部分。 1、 对于中央及国家领导机关,主要是提供元数据检索;利用参考咨询服务平台开展 专题服务;提供针对重大事件或专门主题的信息搜集与整理,进行信息推送服务;在立法 决策过程中提供信息与知识服务。 2、 对于重点科研、教育、生产单位,主要是提供元数据检索;开展馆际互借与文献 传递服务;开展虚拟参考咨询服务;提供信息推送服务;进行数字资源的联合采购工作; 根据数字资源的版权情况最大限度地对教育和科研用户提供资源;联合编制全国联合目录 等。 3、对于社会公众,主要是提供元数据检索;提供信息推送服务;提供虚拟参考咨询 服务;提供馆际互借和文献传递;提供数字资源链接或订购。提供用户个性化服务,用户 能订制自己所关注的资源信息,依靠EMAIL、BBS、留言板、即时交流和手机多种技术手段, 及时获取由图书馆系统根据用户关注点所自动推送的即时信息。对于到馆读者,可以在数 字资源与物理资源的选择上获得最大的帮助,对于研究读者还可以提供含国际电视能力、 物理资源能力和数字资源能力的更好的研究环境。 4、对图书馆的服务,主要提供全国联合编目服务、馆际互借服务、联合参考咨询服 务和专业人员培训。 1.2.3 技术目标技术目标 1、 数字资源加工能力 普通纸质文献数字化加工能力:30万册(件)/年; 缩微介质数字化加工能力:300万拍/年; 文摘记录加工处理能力:9万个/年; 书目记录、文摘记录、版权关系、数字资源唯一标识符等挂接处理能力:各 9万个/年; 目次的加工、挂接处理能力:180万行/年 篇名的加工、挂接处理能力:600万个/年 音频、视频资源的深度标引处理能力:6000小时/年 2、 存储能力 本地与灾备存储中心:在线存储能力60TB,永久保存数据存储能力 340TB(包括离线和近线部分) 。 3、 提供服务能力 二期馆区具备6000个信息点的接入能力,主要阅览区、会议区、室外休息区 具备无线接入能力(11兆/秒、108兆/秒) ; 互联网资源输出能力大于1000GB/天; 接入超过3000G/S带宽能力; 2亿条以上结构化元数据的检索能力; 平均100,000次检索请求/分钟能力,峰值10,000次检索请求/秒能力,可以 进行1亿页全文检索,可以进行古籍全文检索; 支持600个读者终端(电子阅览席位)和移动无线终端的服务能力; 具备50个机位的数字图书馆管理与技术人员培训环境及能力。 4、 技术支持能力 具备国家数字图书馆主要生产系统的仿真测试能力及三个项目的同时开发能 力; 具备开展数字图书馆发展方向研究及相关标准规范研究的能力,建立国家数 字图书馆工程有关标准与规范。 1.3 工程建设工程建设内容内容 本项目主要建设内容为:制定国家数字图书馆的标准、规范;搭建数字图书馆的网络 系统、存储与灾备系统、视频会议系统、数据广播系统、集群系统、RFID、一卡通系统、 快速印刷;建设满足数字图书馆系统运行要求的硬件和系统软件平台;建设数字图书馆的 业务应用系统、公共支撑平台。具体建设内容如下: 1、国家数字图书馆标准、规范制定 国家图书馆将在参照和遵循信息化方面的相关国际标准和国家标准的基础上,形成自 己的技术标准、业务管理规范和指标体系。国家数字图书馆标准化体系包括汉字规范处理、 数字资源唯一标识符、数据对象管理、元数据总则、专门元数据、知识管理、资源统计和 长期保存等标准规范。 2、网络系统、硬件和系统软件平台以及配套基础系统建设 数字图书馆的网络系统采用核心层、接入层的两层结构设计,采用星型冗余结构的连 接方式,确保无单点故障,达到万兆主干,千兆到桌面的带宽要求,并具有少量光纤到桌 面的接入能力。 在硬件和系统软件平台建设方面,系统将为各子系统设置应用服务器和数据库服务器, 以及存储与灾备系统。 为了满足新馆的辅助功能建设视频系统、一卡通系统、数字广播、RFID和快速印刷系 统。 3、数字图书馆业务应用系统和公共支撑平台 数字图书馆应用系统建设包括资源采集与获取系统建设、数字资源加工系统建设、数 字资源组织与管理系统建设、数字资源发布与服务系统建设和应用支撑平台的建设。 a)a)资源采集与获取系统 资源采集与获取系统有三个子系统组成: 文献数字化子系统:对图书文献进行数字化加工,将传统介质资源转化为数 字化资源,对加工的数字资源按标准进行标引,构建元数据。 网页资源获取子系统:能自动进行专题数字资源的搜集、分类、标引、存档, 并以多种形式向读者提供专题资源。 电子资源缴送子系统:用户通过互联网上传学位论文、电子出版物等电子文 档,并进行元数据加工和检索。 b)数字资源加工系统 数字资源加工系统将各种数据库、电子图书、电子期刊等进行有效的格式转换、元数 据标引等处理,使各种资料具备数字图书馆的基本管理和服务需求。 数字资源加工系统有两个子系统组成: 数字资源加工管理子系统:建立与存放各类型元数据库、资源库和知识库, 为国家图书馆建立、组织、管理各种类型元数据库、资源库和知识库;建立 元数据制作、整合、检索平台,为数字资源加工工作人员提供元数据建设工 作窗口和工具;建立资源库加工平台,为数字资源加工工作人员提供资源库 建设工作窗口和工具;建立知识组织体系和检索基础平台,为建立知识组织 体系、知识库,为知识挖掘提供知识组织模型、知识挖掘工具和知识本体库 (语料库) ,解决知识组织的语料的输入或输出以及应用检索。 全国联合编目子系统:是全国图书馆行业本着资源共建共享的原则,按照统 一标准和规范,在统一系统平台上联合工作,编制全国图书馆实体文献资源 和数字资源元数据的过程。因此,除应达到原有的联合编目系统功能(上传、 下载、查重、质量控制、用户管理、经费计算和管理等)外,还应能满足数 字图书馆的特殊要求。 c)数字资源组织与管理系统 数字资源组织管理系统实现对资源安全、资源级别、资源调度、权限控制、元数据与 对象数据的管理,并能够进行资源的存储、永远保存、异地备份、数据迁移、数据仿真等, 同时对数字资源实现版权登记和管理、数字版权加工和管理、资源发布安全认证、资源服 务与版权保护认证。 d)数字资源发布与服务系统 数字资源发布与服务是指对到馆读者、馆外读者使用多种方式进行自建数字资源和外 购数字资源的集中及分散服务功能。 e)应用支撑平台 应用支撑平台是指依据国家数字图书馆的业务要求,依据制订的规范化标准化体系创 建的,用于支撑各业务子系统开展业务协同、互访,功能调用,数据交换的通用运行、管 理环境。 1.4 建设思路建设思路 1.4.1 框架为基,业务为主框架为基,业务为主 “国家数字图书馆”的建设采取:“制定规范搭建框架业务开发集成” 的模式,这其中“制定规范、搭建框架”最为重要。具体的开发模式如下图所示: 图 1-1 开发模式示意图 1.4.2 信息资源整合信息资源整合 国家图书馆现有的信息资源整合的类型包括纸质馆藏资源与数字馆藏资源之间的整合、 数字馆藏资源之间的整合、馆藏资源与网络资源之间的整合、数字图书馆之间的资源整合 等。信息资源的不同类型和用户的使用需求,决定了不同的信息资源整合的实现模式和技 术方法的差异。 国家数字图书馆的信息资源整合采用元数据层的信息资源整合方式,从信息资源组织 的源头着眼,对信息资源进行彻底的整合。对于现行系统和外部系统通过元数据互操作方 式来完成元数据的整合。本次建设系统采用统一的元数据标准格式来实现资源整合。 制定元数据制作、元数据互操作的标准规范。涉及的标准包含元数据标准、编码 体系和元数据置标等标准。 建立统一、集中的元数据库。将各类信息资源进行数字化加工,提取元数据按照 统一的元数据标准,集中保存并管理。 对现有 Aleph500 系统所产生的 MARC 数据,按照 DC 标准,进行重新套录、剃重 并保存到元数据库中。 针对近几年发展势头正健的 OAI 协议,支持对分布、异构资源在元数据层面的数 据收割。 在上述过程的基础上,进行二次文献数据归并以及一、二次文献数据链接。 采用 OpenURL 技术,为用户提供分布式检索与获取的深度服务。OpenURL 是一种 附带有元数据信息和资源地址信息的“可运行”的 URL。由国家数字图书馆维护 的链接解析器依照规则动态生成开放链接的 URL,实现资源之间一对一,一对多 的“恰当”链接,对文献之间错综复杂的关系进行了有序的动态管理和链接。 1.4.3 业务应用整合业务应用整合 整个“国家数字图书馆”系统可以划分为核心框架和四大业务子系统,再加上已有的 图书馆业务自动化系统和办公自动化系统,系统规划如下图所示: 核心框架核心框架 数字资源加数字资源加 工工 资源资源 组织与管理组织与管理 信息发布与服务信息发布与服务 办公自动化办公自动化 资源采集与资源采集与 获取获取 业务自动化业务自动化 图 3-2 系统规划图 采用面向服务的体系架构实现整合服务的发布和业务应用的接入,具有战略性的开放 框架和强大的应用系统集成能力。如下图所示: 图 1-2 应用集成技术对比示意图 基于消息代理的企业服务总线架构及其相应的接口和适配器作为整合服务的代理, 连接了作为服务请求者的前台应用系统和作为服务提供者的后台应用系统,使国 家数字图书馆建立起具有开放的 SOA 基础和特点的整合架构。 1.4.4 服务整合服务整合 传统“点到点” “point-to-point”整合方法导致 “杂乱无章” 使用 SOA, 应用暴露成服务而通过服务总线整 合起来 2007 年底统计,国家数字图书馆经网络提供服务的资源库已达 126 个;中外文全文电 子期刊超出 19000 余种,其中外文期刊约 12000 余种;中外文电子图书 50 多万种。年度订 购数字资源的经费约占书刊文献总采购经费 13.39%。 国家数字图书馆的资源和服务都迫切需要一个集中展示的窗口。国家数字图书馆建立 门户主要是面向用户,对可利用的资源和服务做整体性、深层次的揭示。 1、门户的定位和作用: 为用户构建一个基于网络、远程利用资源的和谐环境。通过系统平台、技术 手段和图书馆员的工作,对信息资源进行充分的挖掘、关联和升值,对资源 和服务的整体性揭示更全面和深入,使信息的查找和定位更细化和快捷。 使用户感受到的图书信息资源是一个整体,不再是零散割裂的“信息孤岛” 。 免去读者为了查询所需要的资料,需要分别登录不同系统、熟悉不同的检索 命令,重复进行检索的烦恼。 使用户获得个性化的定制与服务。 2、门户建设的思路 “国家数字图书馆信息资源门户”将电子资源的导航与检索、馆藏书刊目录查询、馆 际互借和文献传递、虚拟参考咨询、参考文献引用以及网络搜索引擎等扩展服务有机地整 合在一起。通过一个门户,读者可以远程访问、无缝地获取所需信息和服务,更为有效地 利用图书馆提供和揭示的信息资源。 国家数字图书馆将围绕四个方面建立业务流程并提供服务: 资源揭示和描述 资源导航与检索 资源管理与用户认证 个性化服务 (1)资源揭示和描述。对 126 个资源库做规范化著录和描述,从方便读者利用的角 度,资源揭示到子库。 主要著录字段包括:资源名称及 URL、交替名称、资源简介、资源图标、学科分类、 资源类型、覆盖范围、时间跨度、语种、出版商、资源检索平台、资源关键词、资源创建 者、版权所有者、数据库指南(URL)、咨询反馈(email)、做整合检索时的提示信息等。 (2)信息导航与检索。 数据库导航与检索 期刊导航与检索 整合检索:整合检索提供单库检索、跨库检索、快速检索三种方式通过整合 检索得到的结果,可以从原库直接获取全文,也可以通过 OpenURL 开放链接 到全文或者扩展获取目标内容和相关服务。整合检索 OPAC,通过 OpenURL 获 取全文期刊的多个途径。 (3)资源配置管理: 资源分析及建立模版,包括:资源名称、资源类型、访问协议、URL、资源 供应商:资源的 IP 地址和端口号、数据库代号(内部代码,供应商提供或 图书馆确定) 、认证信息、记录格式(UNIMARC,USMARC 等) 、BIB 属性 (Z39.50 的 BIB 属性) 、字符编码集(如:ISO8859-1)等。 配置参数,包括:构造 HTTP 请求(包括 hostname:port 和 URL MASK) ;获 取检索结果数;返回结果参数的描述等。 为尚未支持标准协议的资源开发外部程序并建立配置文件。 (4)用户统一认证。 统一认证平台确保读者只需一次登录,即可使用其权限范围内的网上资源或进入有关 系统,并在不重复登录的情况下,进行系统间的跳转。系统应支持跨域认证,支持多应用 系统,实现统一认证、统一权限、统一用户。其他系统可以调用本系统进行身份认证和分 配权限,并且应该预留接口。认证应支持 IP 地址、用户名/口令,以及 IP 地址+用户名/口 令的三种认证方式。 (5)个性化服务。 建立“我的数据库” 、 “我的电子期刊” 、 “我的检索历史” ,用于组织、收藏 与个人课题或兴趣相关的文献信息、常用数据库集、常用电子期刊列表及检 索历史,还可以定制定题通报(Alert)服务。 建立“我的电子书架” ,可分为不同的文件夹,收藏不同课题的文献信息, 通过整合平台检索到的文献,可随时保存到电子书架中。 1.5 总体结构总体结构 1.5.1 系统示意图系统示意图 图 1-3 数字图书馆示意图 1.5.2 总体逻辑架构总体逻辑架构 图 1-4 国家数字图书馆总体架构图 国家数字图书馆总体架构完整地诠释国家图书馆数字资源的生命周期,完成数字资源 从内容策划到创建、组织描述、保存管理、获取和整合,再到维护和提供服务的完整流程。 国家数字图书馆的总体应用体系是一个由各类应用软件组成的、多层次的复杂系统,在这 个体系中各个应用软件不是孤立的,各个应用软件系统遵循一定的标准和规范、由统一的 网络系统、服务器系统、存储系统等系统平台支撑,软件之间存在着功能关联、功能互补、 功能支持、数据交换、数据共享等关系。 国家数字图书馆系统总体架构可分为用户层、业务应用层、应用支撑层、数据层和基 础设施层。 1、用户层 用户层主要负责与数字图书馆用户以及商业伙伴之间的相互交互。将不同业务系统中 发掘出的知识以最恰当的方式表示出来,为国家数字图书馆的决策者提供决策依据。国家 数字图书馆平台可以通过门户、智能代理等为终端用户提供个性体验,提供定制内容和页 面外观及版式的表现形式,还可利用相应的工具,使用户可以编制个性化的内容,满足国 家数字图书馆平台各类用户的需求和兴趣。在数字图书馆平台里所有的数据交换将通过 XML 格式进行,这些数据由表示层负责翻译成外部浏览者(HTML),无线设备 (WAP,Mobile)等可以理解的格式。 这个层面需要实现统一身份认证,通过对知识的分类和权限规划,将基于浏览器的应 用按照规则统一界面入口,并实现数字图书馆平台、部门用户和个人用户的多级需求,建 立统一访问的界面规则和风格。 2、业务应用层 业务应用层构成国家数字图书馆各类业务子系统的基础部分,应用模块主要包括资源 采集与获取、数字资源加工、数字资源组织与管理和信息发布与服务。 首先,资源采集与获取以及数字资源加工系统将各种类型的资料转化为有序的数字资 源。将各种印刷型资料、音频资料、视频资料等进行数字化加工,转化为数字格式的资源; 有目的有方向地采集原本无序分散的网络资源,将之进行初步有序化处理;将各种数据库、 电子图书、电子期刊等进行有必要的格式转换、元数据标引等处理。使各种资料具备数字 图书馆的基本管理和服务需求。 经过加工的数字资源进入资源组织与管理系统。数字资源组织与管理系统依据 OAIS、Z39.84(DOI) 、ISO10646 等国际标准构造。资源组织与管理要完成的工作是:网 络资源的分类、整合及发布;对各种异构的数字资源进行整合,使之形成统一的检索和使 用界面;将经过加工和标引的数字资源进行多种表现形式的发布;进行元数据管理、数字 版权管理及数字对象管理。 最后,直接面向用户和读者的是资源发布与服务平台。该平台为用户提供方便快捷的、 主动的、个性化的、安全可靠的服务,并实现传统图书馆与数字图书馆之间“相互补充、相 得益彰”的理念。通过我的图书馆等系统对用户进行个性化服务,用户能订制自己所关注的 资源信息,及时获取,同时获取由图书馆系统根据用户关注点所自动推送的即时信息。通 过 EMAIL、BBS、留言板、即时交流等方式进行数字参考咨询,提高图书馆服务的即时性 和交互性。提供异构资源检索平台,使用户真正享受到跨平台跨库无缝检索。同时,基于 本系统的文献传递、馆际互借等能实现与其他图书馆情报机构的互联互通,形成一个广泛 的知识园地。 这些应用模块是通过各种不同的组件进行构建,应用模块之间即可以共享其他应用模 块的组件,也有本应用模块专用的组件,这些组件通过业务适配器和数据适配器连接到平 台框架上的业务总线和数据总线,实现不同业务子系统的功能调用和数据访问,形成一个 完整的业务子系统。这样形成的业务子系统虽共享组件,但功能相对独立,得以保障完成 国家数字图书馆的各项业务功能。 3、应用支撑层 该层是国家数字图书馆平台体系架构的核心层,包括数字图书馆应用系统服务的整合、 资源的整合等内容。在国家数字图书馆平台中,基于 SOA 的应用支撑平台将国家图书馆的 各种业务应用系统、工作流程等无缝整合,使国家数字图书馆平台具备可扩展性,可以在 系统中随时增加业务功能模块,使数字图书馆的前期投资可以被无限利用。基于 SOA 的数 字图书馆平台的整合主要包括业务流程的整合以及数字图书馆应用服务及数字资源的整合。 在这种基于 SOA 的数字图书馆平台架构中,可以用一个服务替换另一个服务而无须关 心其底层的实现技术,唯一要考虑的就是服务接口,而它采用了通用的 Web 服务和 XML 标准。因此,可以在不牺牲同构环境的传统价值(即管理、安全性、可靠性、伸缩性和性能)的 情况下,提供将底层服务实现无缝地重新部署到其他技术、地理或组织领域的能力。它可 以对数字图书馆的业务流程进行监控管理,对业务过程实时数据进行分析计算,建立与完 善过程监视、在线性能计算、可靠性管理、生产综合查询;实现运行优化指导和优化支持; 结合历史数据和理论模型及专家经验,形成对国家数字图书馆运行的决策支持,实现管理 层与控制层的集成,同时也为上层应用提供统一的数据平台。 4、数据层 该层主要负责数字资源组织管理和数字资源长期保存。数字资源组织管理是对资源安 全、资源级别、资源调度、权限控制、元数据与对象数据进行管理,有效地调度异地异构 数据资源和进行服务综合协调等;数字资源长期保存,是进行资源的存储、永远保存、异 地备份、数据迁移、数据仿真等。 数据层包含着国家数字图书馆的事实、文档的元数据,以及描述事实和元数据结构的 本体,即本体知识库与实例知识库。知识库中存储了大量不同类型的结构化和非结构化知 识,其主要的内容是本体、事实知识和文档表示。利用知识挖掘管理工具,对数字图书馆 的所有数据资源进行多维分析,汲取有价值的数据信息,不仅挖掘各种结构化和非结构化 知识文档和数据,而且包括相关的管理组织、流程、管理制度,以及知识管理的方式与方 法等,分类、分级进行组织管理,构建数字图书馆级知识库,并通过相应的管理手段保证 其运行。 5、基础设施层 网络硬件平台是整个系统基础设施平台。主要包括:网络系统、计算机系统、操作系 统、数据库系统及存储与灾备系统,为整个系统提供网络服务器环境、通信链路上的支持, 同时通过系统软件和平台支撑软件对应用系统提供数据和运行环境上的保障,它提供计算、 存储和网络硬件,以及操作系统和网络协议等。 1.5.3 网络与存储逻辑结构网络与存储逻辑结构 图 1-5 国家数字图书馆网络与存储逻辑结构图 1.5.4 数字资源和传统文献总体流图数字资源和传统文献总体流图 图 1-6 总体信息流图 1.6 外部接口设计外部接口设计 国家图书馆数字图书馆应该和各级各类图书馆、大学、科研机构及资源供应商等有相 应的接口进行业务相互服务和支撑。 表 1-2 数字图书馆外部接口表 所使用协议接口及面向的用户 Z39.50全国图书馆联合编目接口 Z39.88开放链接接口,资源供应商、各个图书馆 OAI元数据接口,资源供应商、各个图书馆、大学 ILL馆际互借接口,各个图书馆、大学图书馆等 URI调度接口,资源服务 VR虚拟参考咨询接口,各个图书馆、大学、科研 DD文献传递接口,资源代检代查文献传递服务 Proxy数据代理服务接口,资源代理服务 1.6.1 全国图书馆联合编目接口全国图书馆联合编目接口 使用 Z39.50 协议作为全国图书馆联合编目接口,同其他图书馆建立联合编目接口。 Z39.50 协议(全称 Informational Retrieval Service Definition and Protocol Specifications for Library Applications)是一种网络协议,它由一套用来控制和管理计算机之间通讯过程中所 涉及的格式和进程的规则所组成。Z39.50 又是一种开放网络平台上的应用层协议,它支持 计算机使用一种标准的、相互可理解的方式进行通讯,并支持不同数据结构、内容、格式 的系统之间的数据传输,实现异构平台异构系统之间的互联与查询。同时它还是一种基于 网络的信息标准,它允许用户检索远程数据库,但不局限于检索书目数据,在理论上可用 于检索各种类型的数据资源。它共有三个版本,1988 年美国国家标准化组织公布了 Z39.50 协议国家标准第一版,1992 年公布了第二版,1995 年公布了第三版。Z39.50 协议是一种 在客户服务器环境下计算机与计算机之间进行数据库检索与查询的通讯协议。它的出版及 使用解决了不同系统间的数据交流,克服了不同数据库之间的异构问题,解决了信息检索 网络化的障碍,从而提高了检索效率,扩大了检索范围。它已经被软件公司、图书馆用户、 数据库资料中心等有关单位所广泛接受。 Z39.50 目前的版本 3 已于 1996 年被 ISO(国际标准化组织)正式确定为信息检索的国际 标准(ISO23950) 。Z39.50 产生于图书馆界,最初的目的是为了提供联机公共书目数据检 索。至今,图书馆界仍然是 Z39.50 的主要应用领域之一。在 Internet 上,存在着大量的 Z39.50 服务器,这些服务器连接着世界上许多大型图书馆的馆藏书目数据。用户只要采用 一种基于 Z39.50 的检索软件就可以在自己的计算机上同时对世界上多种异构平台数据库进 行检索,共享信息资源。 Z39.50 协议是图书馆行业经过 20 多年的努力和摸索才开发出来的、并最终为 ISO 所 接受的用于网络信息检索和服务的标准。国外的许多大型图书馆等文献情报服务机构都已 经支持或者正在积极地支持该标准。在国内,支持这一标准也已经是大势所趋了。 Z39.50 协议第三版中有一个新的特性,可以使用该扩展服务(ES)来预定文献(Item),进 行馆际互借。但是扩展服务非常特殊,这是因为通过扩展服务所请求的服务本身并不是 Z39.50 协议提供的服务,而是由远程系统支持的,在 Z39.50 会话之外执行的功能。扩展服 务和信息检索相关,但是又超出了协议数据库检索、获取记录的范围。标准化的扩展服务 包括: (1) 保存一个结果集以供日后使用 (2) 保存一个查询表达式以供日后使用 (3) 定义一个周期性的查询日历 (4) 更新数据库:增加、替换和删除数据 (5) 规定递交的地点(打印机,传真机) (6) 订阅某文献(Item Order) 。 所有这些服务都需要在 Z39.50 连接之外保存所需信息。当需求方请求一个扩展服务, 即形成一个扩展服务任务。此扩展服务任务的执行不是 Z39.50 连接的一部分,而是由提供 方执行的连接之外的独立功能。例如,对于一个订阅某文献请求的处理往往发生在收到订 单,Z39.50 会话结束之后进行。协议并没有规定目的端如何完成此任务。 提供方系统收到了扩展服务任务后就建立一个任务包。此任务包记录关于此任务的信 息,保存在一个由提供方维护的扩展服务数据库中。此任务包中的数据既包含需求方提交 的数据,也包括提供方的信息。任务包中的信息分两种:所有扩展服务任务包共有的信息 和每种扩展服务的不同信息。 扩展服务任务的执行在 Z39.50 协议之外,需求方系统可以通过查询扩展服务数据库来 获取此扩展服务任务的信息。 Item Order 的扩展服务允许需求方向提供方发送一个订阅某文献的信息,并且查询此 任务的状态信息。订阅的文献可以是也可以不是一次 Z39.50 查询所找到的书目。此文献可 以是提供方愿意提供的任何种类的服务(归还性和非归还性文献;专论或者期刊文章;通 过纸或者电子方式传递等) 当需求方的一个 Item Order 的请求被接收,提供方将在扩展服务数据库中建立一个 Item Order 的扩展服务任务包。任务包中,由需求方提供的信息包括:联系信息(如联系 人、电话等) ,其他帐户信息(如何对所借文献付费、信用卡信息、客户购买订单号等) , 文献标识以及附加信息(允许需求方提供的描述性信息) 。任务包中,提供方提供的信息包 括:请求的复本状态或者错误报告,附加的状态信息(状态或者错误报告中的补充信息) 。 由此,通过 Z39.50 Item Order 的扩展服务,就可以进行需求方和提供方之间的文献 借阅。 国家图书馆数字图书馆联合编目系统建立在计算机网络应用技术的基础上,通过 Z39.50 协议实现和各成员馆间书目数据的实时传输和联合编目,从而建立具有一定规模的 联合书目数据库和联合馆藏目录,供各成员馆共享书目成果与文献资源,从而在网络图书 馆内部及其外部的广大区域中形成统一而畅通的网络编目平台,提高其文献编目的整体效 率与水平。联合编目系统能够克服传统方式下各个图书馆分散编目所产生的重复劳动、效 率低下的弊端,实现了文献信息资源和人力资源的共享。 1.6.2 使用使用 Z39.88 开放链接接口实现和资源供应商及各图书馆的开放链接接口实现和资源供应商及各图书馆的 接口接口 使用国际标准 Z39.88(The OpenURL Framework for Context-Sensitive Services)构建开 放链接系统,实现不同资源系统的兼容,这样,读者只需要在一个平台上就能调用各种资 源,也能与国际接轨。 1.6.3 用用 OAI 协议提供元数据接口协议提供元数据接口 使用 OAI 协议为各地方图书馆和大学图书馆提供元数据接口。 OAI 是 Open Archives Initiative 的简称,最初由 Paul Ginsparg, Rick Luce, Herbert Van de Sompel 等人在 1999 年 10 月于 Santa Fe 的 Universal Preprint Service 会议中促成。OAI 是解决各个数据系统之间互不隶属,资料分散存储,难以整合等问题的一种能够合分布式 存放的系统之中文献的架构标准。OAI 协议的建立为数字资源联合目录的建立提供了有力 的支持 OAI 最初是为了电子期刊联合检索而建立的,但数字图书馆中的联合检索问题与之相 似,所以 2000 年初,OAI 将其适用性扩展到数字图书馆领域,由 Digital Library Federation 与 Andrew W. Mellon Foundation 在 Harvard University 举行的 Cambridge Meeting 中,讨论 如何联合检索数字图书馆内收藏的数字资源。图书馆界代表,博物馆界代表一致认为:整 合元数据(metadata)是关键。 2001 年 1 月,OAI 发表了名为 Open Archives Initiative Protocol for Metadata Harvesting 的网络通讯协议,提供数字资源联合检索的一个可行的解决方案。Open Archives Initiative Protocol for Metadata Harvesting 采用互联网技术和元数据思想来实现,具有功能强大,实 现简单的特点。 OAI 是一个简单的易于实现的协议,主要是通过特定的命令集合,提供前端向后端存 储器提取所需信息的协议。OAI 分为 OAI Service Provider 和 Data Provider 两部分。以 OAI 协议为基础的联合目录架构中,主要由 OAI 的 Service Provider 定期的向 Data Provider 主动 抓取其中的元数据,建立集中的元数据联合目录。由于 OAI 是建立在 HTTP 协议上的应用 层协议,所以其命令集是通过 HTTP 发送 OAI 给相应的服务器端程序的,服务器根据指令 准备数据返回相应的记录集合,记录集合是遵循 OAI 协议的 XML Schema 的 XML 的格式 数据。Service Provider 集中维护从各个系统中抓取来的元数据,并在获得的元数据上建立 增值服务;Data Provider 主要维护特定范围的数字资源,并且支持 OAI 协议来获取其中资 源的内容。 1.6.4 基于国际标准基于国际标准 ILL 实现馆际互借接口实现馆际互借接口 国家图书馆数字图书馆采用国际标准 ILL 实现馆际互借,从而灵活调配图书资源。 ISO ILL 协议,也叫馆际互借协议是关于馆际互借的国际标准,也是基于 ISO 的 OSI 结构的应用层协议。 ILL 协议最先是由加拿大国家图书馆在 1983 年为了便利国家网络信息资源共享而发起 的。1993 年由国际标准化组织定义为国际标准,并在 1993 年发布了第一版,1996 年发布 了第二版。ISO ILL 协议标准规定了两个或者多个 ILL 馆际互借应用通过 Internet 交互报文, 而不用考虑使用的软硬件情况。协议规定了所交互报文的数量和类型、报文中的数据元素 和报文交互的顺序。协议还定义了两种传输语法:EDIFACT 和 ASN.1/BER 编码。同时, 尽管协议没有规定通讯的方式,它预见了两种基本模式:存储转发和连接方式。目前的 ILL 经常在 TCP/IP 协议运作:存储转发模式使用 MIMIE e-mail,连接模式使用 TCP/IP 上 的直接连接。标准规定了系统之间的交互,但是并没有规定系统内部如何运作,或者如何 存储数据。 ILL 协议包括两个文件:ISO 10160 和 ISO10161。ISO 10160 目前的版本为第二版, 全称为:1997 年信息与文献开放系统互连馆际互借应用服务定义(1997 Information and Documentation Open Systems Interconnection Interlibrary Loan Application Service Definition) ;ISO 10161 协议分为两个部分:ISO 10161-1:1997 信息和文献开 放系统互连馆际互借应用协议规范第一部分:协议规范(1997 Information and Documentation Open Systems Interconnection Interlibrary Loan Application Protocol Specification Part 1:Protocol Specification) ;ISO 10161-2:1997 信息和文献开放系统 互连馆际互借应用协议规范第二部分:协议实施一致性形式声明(Information and Documentation Open Systems Interconnection Interlibrary Loan Application Protocol Specification Part 2:Protocol Proforma) 。在这两个协议之间,ISO 10160 协议规定了馆际互 借应用向用户提供的服务;而 ISO10161 协议规定了馆际互借一方如何提供这种服务。 在 ILL 协议的规定中,共有三种馆际互借事务方式:简单式、链状和分步式事务: (1) 简单式 ILL 事务。它包括两个活动的事务方,一个请求方和一个应答方。请求方 和应答方以点对点的方式交互。 (2) 链状 ILL 事务。对于一个链状 ILL 事务,至少包括三个事务方:请求方,应答方 和一个或者多个中间方。一个 ILL 请求从一个请求方传送到另一个或者多个中间方,最后 传送到一个应答方,形成一个事务链,每个中间方作为所有 ILL 消息包的中继。在请求方 和应答方之间没有直接的报文交互。 (3) 分步式 ILL 事务。一个分步式 ILL 事务至少包括三个事务方:请求方 、应答方和 一个或者多个中间方。一个 ILL 请求由中间方传递给向中间方作出应答的应答方,然后中 间方向请求方作出应答。当所请求的文献运出,并且请求方收到了文献运出的通知,所有 的进一步事务都直接在请求方和应答方之间进行,中间方不再参与 ILL 事务。分步式 ILL 事务适合在如下情况下使用:中间方作为请求方寻找合适的应答方的代理,但是对进一步 的 ILL 事务不感兴趣。这在一些联合编目组织中特别有用。分步式 ILL 事务分为两个阶段。 第一阶段为“处理阶段” ,在这一阶段中包括请求方和应答方通过一个或者多个中间方进行 的事务;第二阶段为“跟踪阶段” ,包括请求方和应答方之间的直接事务,用来监控被借阅 文献的状态,如归还、过期等。 1.6.5 使用使用 URI 实现调度接口实现调度接口 数字图书馆系统使用 URI 实现调度接口,用于为用户提供资源服务。 Web 上可用的每种资源: HTML 文档、图像、视频片段、程序等,都可以通过通用 资源标志符(Universal Resource Identifier, 简称“URI“)进行定位。URI 一般由三部分组成: (1) 访问资源的命名机制。 (2) 存放资源的主机名。 (3) 资源自身的名称,由路径表示。 考虑下面的 URI,它表示了当前的 HTML 4.0 规范: /lesson/148/2623648.shtml URI:是一个可通过 HTTP 协议访问的资源,位于主机 上,通过路径 “/lesson/148/”访问。在 HTML 文档中其它资源包括“mailto“(收发 email)和“ftp“(FTP 访问)。 这是 URI 的另一个例子,指向一个用户的邮箱: 写给龙犊 注:大多数读者可能熟悉“URL“,而不是 URI。URL 是 RUI 命名机制的一个子集。 1.片段标志符 有的 URI 指向一个资源的内部。 这种 URI 以“#“结束,并跟着一个 anchor 标志符(称 为片段标志符)。例如,下面是一个指向 section_2 的 URI: /html/top.htm#section_2 2.相对 URI 相对 URI 不包含任何命名规范信息。它的路径通常指同一台机器上的资源。相对 URI 可能含有相对路径(如, “”表示上一层路径),还可能包含片段标志符。为了说明相对 URI, 假设我们有一个基本的 URI /support/intro.htm 下面的链接中使用了相对 URI: 网页陶吧 它扩展成完全的 URI 就是 “/104/2627604.shtml“。 在 HTML 中,URI 被用来: 链接到另一个文档或资源。 链接到一个外部样式表或脚本 在页内包含图像、对象或 applet 建立图像映射 提交一个表单 建立一个框架文档 引用一个外部参考 指向一个描述文档的 metadata 1.6.6 VR 虚拟参考咨询接口虚拟参考咨询接口 通过 VR 虚拟参考咨询接口为各个图书馆、大学、科研机构提供服务。 1、虚拟参考服务的含义 虚拟参考(Virtual Reference) ,也称 E 参考(E-Reference)或是数字参考(Digital Reference) ,实际上就是指图书馆采用数字化手段,通过网络方式向读者提供信息参考的一 种新型服务方式。 现在它已经得到了越来越多的图书馆业界人士的重视,在国外已成为图 书馆的核心服务项目之一。 2、虚拟参考服务的类型 虚拟参考服务是一个国际性的潮流,是图书馆发展到一定阶段的产物,它标志着图书 馆正在利用网上平台拓展自己的专业性服务。目前被大多图书馆所采用的虚拟参考服务的 类型有以下几种:公告板或讨论组 (BBS or Group);电子邮件(E-mail);网上表格(Web Form);网上实时咨询服务(Real-time Reference Service);网络会议咨询服务(Video Conferencing Reference Service);专家咨询服务(Ask A Expert) ;合作的数字参考服务 (Collaborative Digital Reference Service)。虚拟参考服务的交流方式主要有解答式和交互式 和两种。解答式是比较
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 审计与决算管理办法
- 士兵退伍前管理办法
- 商铺积分制管理办法
- 外包队安全管理办法
- 室内外装饰管理办法
- 场地押金用管理办法
- 委托经营及管理办法
- 政府非投标管理办法
- 动态口令卡管理办法
- 回收筒维护管理办法
- 03S702钢筋混凝土化粪池图集
- 葫芦岛广宁220千伏输变电工程环评报告
- DL-T 748.1-2020 火力发电厂锅炉机组检修导则 第1部分:总则
- YS/T 922-2013高纯铜化学分析方法痕量杂质元素含量的测定辉光放电质谱法
- GB/T 22751-2008台球桌
- GA 1205-2014灭火毯
- 肌肉注射操作流程培训课件
- 社区工作者经典备考题库(必背300题)
- 自然拼读元音字母组合及单词
- 杭州市高层次人才分类认定申请表-
- 企业年金实施细则及分配办法
评论
0/150
提交评论