数字图书馆体系结构的发展_第1页
数字图书馆体系结构的发展_第2页
数字图书馆体系结构的发展_第3页
数字图书馆体系结构的发展_第4页
数字图书馆体系结构的发展_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 / 7 数字图书馆体系结构的发展 【内容提要】首先介绍了目前大多数数字图书馆所遵循的基本的数字图书馆体系结构,该结构在功能上可划分为四个逻辑组件:资源库、命名系统、索引 /搜索系统、用户界面。然后介绍了 NSDL、 NCSTRL 两个最大的数字图书馆项目在体系结构的关键问题方面的实践,最后,作者提出了数字图书馆体系结构发展的看法。 【摘 要 题】专题探讨 【关 键 词】体系结构 /互操作 1 介绍 世界上有许多国家进行数字图书馆的建设,但到目前为止,并不存在一个通用的数字图书馆体系结构, 这是由于信息技术和相关标准不断发展的结果,怎样基于现有的技术并考虑到未来技术的发展,构筑一个灵活强大的数字图书馆体系结构,对于数字图书馆的建设是至关重要的,这需要我们了解相关技术和标准以及数字图书馆体系结构的发展变化。 数字图书馆要为用户提供各种简单易用、功能强大的知识服务,通常从功能上可将数字图书馆划分为:用户界面、命名服务、搜索系统、资源库等部分。数字图书馆的建设涵括各种数字资源的创建、管理、查询、利用、存储的整个过2 / 7 程。自从 william 等于 1997 年提出了数字图书馆的信息体系结构以来 1,数字图书馆的体系结构在不断完善和发展,通过许多试验项目仍在不断改进。图 1 代表了数字图书馆的基本体系结构。 附图 图 1 数字图书馆的基本体系结构 资源库 资源库的功能包括存储和管理各种数字对象,通常是由关系型数据库来管理。应用程序通过资源库提供的库访问协议( RAP)来访问资源库。可实现存储、访问、复制、移动和删除数字对象等操作。 与 web 上的信息所不同,数字图书馆中数字资源是以数 字对象的形式进行封装的,一个数字对象包括: 一个全球唯一的独立于地址的长期标识符; 数字资料,存储数字图书馆的资料,也就是最终用户需要获取的信息内容,如经 XML 置标后的文本、一本电子图书等, 元数据,关于数字资料的数据。一般情况下,元数据有三种: a.描述性元数据,用于发现和标识一个对象,如MARC 和 Dublin Core。 b.结构性元数据,为用户显示和导航一个对象(包括该对象的内部组织信息),如一本书由章节组成。 c.管理性元数据,描述该对象的管理信息;创建3 / 7 日期、文件的格式、访问权限、知识产权问题等。 命名系统 命名系统是针对长期标识符的分配、管理及解析的一个综合系 统, CNRI 为数字图书馆提出了完整的命名系统“调度系统( Handle System)”,它是一个独立的系统,其职能是负责数字资源的全球唯一的、长期的、独立于地址的命名的分配、管理和解析。在调度系统中,本地名称空间通过获取一个调度系统的命名授权,就可以纳入到全球调度名称空间,这样所有的本地名称在全球调度名称空间中将是唯一的。 索引与搜索系统 索引的创建可能是由机器的自动扫描、手工录入和干预,或者是这两者的结合。客户机把查询式提交给索引服务器,将返回相匹配的数字对象的 URN(统一资源命名,如调度码 )。索引服务还提供被索引信息的元数据和查询机制。 用户界面 用户界面是用户与数字图书馆的接口,数字图书馆向用户提供的最终服务都是通过用户界面来实现的。一般情况下,数字图书馆借助通用的 Web浏览器作为其用户界面工具。此外,用户界面的内容编排和服务方式问题是很复杂的,不同的用户需求是不同的,用户对数字图书馆的简单灵活的需求首先就表现在用户界面上。 4 / 7 2 NSDL 项目的体系结构介绍 NSDL( National STEM Digital Library,STEM Science , Technology ,Engineering and Mathematics)是 NSF 资助的、由多家单位来实施数字图书馆项目,它包括 64 个子项目,其目的是支持科学、技术、工程和数学教育,提供广泛接入和方便使用的分布式资源网络和学习机制, NSDL 一期工程已于2002 年底为公众提供服务,它是目前规模最大的数字图书馆项目。 由于 NSDL 的内容和用户的多样性,为让各种用户共享不同的信息,最初的体系结构设计就是通过共享元数据,并利用元数据开发核心服务(如,搜索和发现)。其体系结构(见图 2),包括以下几个基本概念: 23 附图 图 2 NSDL 体系结构 采用公共的核心元数据实现异构系统间的资源发现。 核心元数据与具体领域的扩展元数据相结合。 以元数据为基础实现跨库搜索并创建更丰富的服务。 采用自动索引和检索系统来减少编目工作。 元数据库 NSDL 体系结构的关键部分是元数据库。元5 / 7 数据库存储所有藏品集的元数据,并通过 OAI 协议把它们提供给服务商,服务商通过元数据可以开发出各种服务。在NDSL 中,元数据库可能分布在多个服务器上,并有多个镜像。NSDL 早期采用分布式元数据库,现在改成集中式。这是因为分布式元数据库在检索时会因为其中的一个元数据库的查询失败或响应较慢,而造成整个检索的失败或长时间的响应,而集中式元数据库可以避免这种现象。 NSDL 的互操作性问题 NSDL 的互操作性采用三种方式来实现: 4 联合:这是一种传统的方法,其所有的成员组织都遵从某些标准规范,如通过协议共享在线目录。 OAI 采集:以 OAI 元数据采集为基础。每个数字图书馆藏品的元数据都能提供到 Dublin Core 的映射,并以简单的交换格式向外提供 ,这样,服务提供商就能采集这些元数据,把它建入到信息发现系统中,而且这些藏品能够实现良好的互操作性。 搜集:即使各种不同的组织之间不存在任何形式的合作,通过网络爬虫收集开放访问的信息仍然可以实现一定程度上的互操作。各种网络搜索引擎就是这样。 NSDL 主要通过 OAI 元数据采集来实现互操作。 2001年初, NSDL 确定支持 8 种标准元数据格式,这 8 种元数据之间的互换通过 Dublin Core 元数据核心集作为过渡。 6 / 7 ( 1) Dublin Core ( 2 ) Dublin Core with DC Ed Extensions ( 3) LTSC( IMS) ( 4) ADL( SCORM) ( 5) MARC 21 ( 6) Content   ;Standard for Digital GeospatialMetadata( FGDC) ( 7 )Global Information Locator Service( GILS) ( 8) Encoded Archival Description 3 NCSTRL 项目体 系结构介绍 NCSTRL ( Networked Computer Science Technical Reference Library)是另一个有代表性的数字图书馆项目,其规模仅次于 NSDL,它是由 DARPA 资助的,来自北美、欧洲和亚洲的 160 多家学术研究机构参与了该项目。其体系结构以 Dienst 体系结构为基础,该体系结构的一个重要特征就是分布式搜索(见图 3) 5。 附图 图 3 NCSTRL 的体系结构 7 / 7 在 NCSTRL 的早期项目中,用户的查询式被直接提交给所有的索引服务器, 但随着参与机构的增多,检索时同样会因为其中的一个元数据库的查询失败或响应较慢,而造成整个检索的失败或长时间的响应,为了解决这一问题,NCSTRL 引入了查询路由器的概念 67。 查询路由器 QR( Query Routers):根据一定的机制把查询式发送到分布式的索引服务器中,并负责合并来自不同的索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论