




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
j 立銮道盔堂甄堂焦途塞撞 要 摘要 摘要:数字图书馆的出现主要有两大原因,一是人们迫切需要对各种信息资源进行 方便快捷查询;- - 是互联网的高速发展为这种需求提供了基础。和传统图书馆相比, 数字图书馆利用最新的计算机技术和通信技术,建设大规模、可互操作的分布式 知识库,实现资源共享,并提供在互联网上高速的统一检索服务,从根本上改变 了目前信息分散、无序、不便使用的现状。 数字图书馆所涉及的内容很广泛,本文主要研究和实现了统一检索中的信息集 成平台。统一检索即向用户提供一个统一的检索界面,由用户自行选择需要的数 据源,锝到满足条件的查询结果,改变了以前不周数据源需要进入不同检索界面 的查询方法,极大的方便了用户。信息集成平台是统一检索的核心,负责翻译转 化用户请求,根据请求的内容把请求分发给相应的查询适配器,最后整合各个适 配器的查询结果,返回给用户。 在研究和实现中,笔者结合当前各种成熟的软件设计架构和软件开发技术,设 计了一个健壮、可靠、可扩展性强的信息集成平台,对该结构的性能和特点给出 了理论分析和说明。根据信息集成平台的特点,主要采用了w e bs e r v i c e s 技术实 现。通过在信息集成平台上的实验,证明该平台的功能和性能实现了预期目标, 方便地实现了统一检索。 关键词:数字图书馆;统一检索;信息集成;w e bs e r v i c e s 分类号: a b s t r a ( 玎 a b s t r a c t :t h e r ea r et w om a i nt e a s o n sf o rt h ee m e r g e n c eo fd i 班a ll i b r a r y f i r s t , t h eu r g e n tn e e do fe x p e d i e n t l ya n ds p e e d i l yi n q u i r i n ga l lk i n d so fi n f o r m a t i o nr e s o u r c e s ; s e c o n di st h er a p i dd e v e l o p m e n to ft h ei n t e m e tp r o v i d e sab a s i sf o rs u c had e m a n d c o m p a r e dw i t ht r a d i t i o n a ll i b r a r i e s ,t h ed i g i t a ll i b r a r y , w i t ht h el a t e s tc o m p u t e ra n d c o m m u n i c a t i o nt e c h n o l o g i e s ,b u i l d i n gl a r g e s c a l e ,i n t e r o p e r a b l ed i s t r i b u t e dk n o w l e d g e b a s e ,t os h a r er e s o u r c e s ,a n dp r o v i d eh i g h s p e e du n i f yr e t r i e v a ls e r v i c e so nt h ei n t e r n e t i tf u n d a m e n t a l l yc h a n g e st h ec u r r e n ts t a t u st h a ti n f o r m a t i o ni ss c a t t e r e da n dd i s o r d e r l y , a n di sn o tf a c i l i t yt ob eq u e r y d i g i t a ll i b r a r yi n v o l v e sv e r yw i d ec o n t e n t , t h ep a p e rm a i n l yr e s e a r c h e s a i n f o r m a t i o ni n t e g r a t i o np l a t f o r mi nt h eu n i f yr e t r i e v a l u n i f yr e t r i e v a lm e a n st h a tu s e r s c a ng e tw h a tt h e yw a n tt oq u e r yw i t hau n i f i e ds e a r c hi n t e r f a c e ,a n dt h e yo n l yn e e d c h o o s et h ed a t as o u r c e st h e yw a n t i tc h a n g e st h a tu s e r sn e e dg ot od i f f e r e n ts e a r c h i n t e r f a c et og e tt h er e s u l tt h e yw a n ta n di sg r e a tc o n v e n i e n c et ou s e r s t h ei n f o r m a t i o n i n t e g r a t i o np l a t f o r mi st h ec o r eo fu n i f i e dr e t r i e v a ls y s t e m ,i tr e s p o n s i b l ef o rt h e t r a n s l a t i o no fu s e r sr e q u e s t , d i s t r i b u t i n gt h eu s e rr e q u e s tt ot h er i g h ta d a p t e ra c c o r d i n g t ot h er e q u e s tc o n t e n t ,g e t t i n ga n di n t e g r a t i n gt h er e s u l tf r o mt h ea d a p t e ra n df i n a l l y r e t u r n i n gt ot h eu s e r s f r o mt h ec u r r e n tm a t u r es t r u c t u r eo ft h es o f t w a r ed e s i g na n ds o f t w a r ed e v e l o p m e n t , w ed e s i g nas t r o n g , r e l i a b l ea n ds e a l a b l es t r u c t u r eo fi n f o r m a t i o ni n t e g r a t i o np l a t f o r m t h e r ea r et h e o r e t i c a la n a l y s i sa n de x p l a n a t i o n sa b o u tt h es t r u c t u r e sc a p a b i l i t i e sa n d c h a r a c t e r i s t i c s a c c o r d i n gt ot h ec h a r a c t e r i s t i c so f t h ei n f o r m a t i o ni n t e g r a t i o np l a t f o r m , i tm a i n l yu s e dw e bs e r v i c e st e c h n o l o g yt or e a l i z e i ti sp r o v e dt h a tt h ef u n c t i o na n d p e r f o r m a n c eo ft h ep l a t f o r mh a sm a t c h e dt h ee x p e c t e dg o a lt h r o u g hal a r g en u m b e ro f e x p e r i m e n t so nt h ei n f o r m a t i o ni n t e g r a t i o np l a t f o r m k e y w o r d s :d i g i t a ll i b r a r y ;u n i f yr e s e a r c h ;i n f o r m a t i o ni n t e g r a t i o n ;w e bs e r v i c e s c l 醛s n o : 致谢 本论文的工作是在我的导师罗西维教授的悉心指导下完成的,罗四维教授严 谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来 罗四维老师对我的关心和指导。 罗四维教授悉心指导我完成了实验室的科研工作,在学习上和生活上都给予 了我很大的关心和帮助,在此向罗四维老师表示衷心的谢意。 罗四维教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷 心的感谢。 在实验室工作及撰写论文期间,潘晓玲、王权良,常江,丁朝盈、邓成杰等 同学对我论文中的研究工作给予了热情帮助,在此向他们表达我的感激之情。 另外也感谢我的父母,他们的理解和支持使我能够在学校专心完成我的学业。 1 引言 i i 论文背景及意义 人们不管在工作、学习还是生活中都离不开对各种信息资料的查询,其中,图 书馆是人们获取资料的一个重要来源。随着网络技术和网络应用的迅猛发展,网 络已经成为人们获取、发布和交流信息的主要途径。数字图书馆在这种背景下应 运而生。 数字图书馆是伴随着互联网发展而产生的一个正在成长中的新生事物,是为 了从根本上改变目前互联网上信息分散、无序、不便使用的现状而提出来的下一 代互联网上信息资源的管理模式。它通过集成和利用最新的计算机技术、通信技 术以及数字化的多媒体信息内容,建设超大规模、可扩展、可互操作的分布式海 量知识库群,并提供在互联网上高速、统一检索的电子存取服务。 自从上个世纪9 0 年代初美国科学家首次提出数字图书馆( d i g i t a ll i b r a r y ) 这一概念以来,全球开展数字图书馆研究与实践已近十几个年头。不管从对数字 图书馆技术的研究还是实践上来看,欧洲都处于领先位置 不久前,美国国会图书馆宣布,准备把国会图书馆、公共图书馆,以及科研 图书馆中的藏书和资料全部转化为数字形式存储起来,并将馆藏的图书、资料、 绘画、手稿和照片都转换为计算机可读的数字化形式,使读者在屏幕上直接阅读 原件。同时,美国国家科学基金会、国家宇航局和国防研究署联合公布“数字化 图书馆倡议”,在斯坦福等六所大学进行有关数字化图书馆的分项研究。在英国, 数字图书馆建设主要以信息存储方式的变革为出发点。其中,英国国家图书馆的存 储创新协议,共涉及2 0 个项目,目前大部分已经完成,并在网上提供服务。”法 国倡导欧洲数字图书馆的建设,目前已有德国、西班牙、匈牙利、意大利以及波 兰正式加入了法国提出的欧洲数字图书馆建设。 我国图书情报界、i t 业界自1 9 9 5 年左右开始对这一领域跟踪研究,1 9 9 8 年 开始全面升温,迄今无论是在对数字图书馆的认识,还是理论研究、关键技术准 备方面,都取得了很大的进展。许多图书馆,尤其是一些条件好的高校图书馆都 不同程度地开展数字图书馆的实践,逐步把一些本馆有特色的资源数字化或将各 类数字资源整理上网并提供服务。此外,i t 行业的一些专业公司也同样在推动与 促进数字图书馆的发展。这些公司有些是在国家科研项目成果转化的基础上形成 的,有的是在掌握相关技术基础上逐渐发展起来的。 目前,国内数字图书馆的实践活动大致可分为以下三种类型: ( 一) 资源服务型 这种类型一般是通过对某类传统资源进行数字化,或对现有数字资源进行归 并整理,采用实用的w e b 和数据库技术构建服务平台。这些平台大多有一个通用 的关系全文型数据库作为后台支持,完成对资源的管理和检索不同于普通网站 的是,这些信息资源大多经过更为精细的加工和索引。此类型的网上信息服务目 前已在大多数图书馆开展,是现阶段我国图书情报界提供网上数字服务的主要形 式。典型的例子如国家科技图书文献中心、中国期刊网、c a l l s 专题特色数据库、 超星数字图书馆等。从严格的意义上来说,这些尚不能被称为真正的数字图书馆。 ( 二) 服务研究型 这种类型的实践更多地集中在科研机构中,其实践对开展大规模数字图书馆 建设意义重大。这种类型的实践往往是兼有研究和提供服务的双重目的。特征是 以图书馆的某些特定类型资源的数字化服务为目的,以数字图书馆的理念来组织 资源和选择技术,构建一个相对完整的系统。通过这些实践,在完成服务目的的 同时,也完成了对某些技术或数字图书馆模式的研究,购买或建立的系统将是未 来数字图书馆系统的雏形或其中的组成部分。此类应用的典型例子有国家图书馆 和北京大学图书馆。 ( 三) 联合建设型 与前两种以图书馆自身建设为核心的类型不同,联合建设类型的特征是多个 机构合作,共同争取经费支持,统一标准规范,强调资源的合理布局与共享。通 过合作的方式,实行优势互补,充分利用资金和入力资源。它们多以政府投资的 项目方式进行,影响较大的有中国试验型数字式图书馆、中国高等教育文献保障 系统和中国数字图书馆工程。肼 数字图书馆整个系统涉及的内容很多,可以分为前台和后台两个部分。前台 即读者面对的部分,主要功能包括;和读者的消息互动( 消息通知、新书通报、 读者交流等) 、资源检索( 分类检索和跨库统一检索) 、个人数字图书馆( 个人书 架、个人定制资源库、个人提醒等) ;后台主要功能包括:资源维护( 对数字资源 采编、审发、统计、添加,删除、修改) 、系统管理( 用户管理、计费管理) 。 本文主要研究数字图书馆中的统一检索服务,因为数字图书馆系统其余部分 主要多为管理系统,信息资源检索部分研究内容更丰富一些,技术性更强,也更 有价值在信息资源检索中,主要有两类检索:分类检索和统一检索。分类检索 主要是分不同数据资源具体查找,这可以直接利用数据库提供商提供的接口,通 过简单部署即可实现不同数据资源的查找。而统一检索必须整合不同的数据资源, 实现只需一个查询界面即可查询到所有满足查询条件的资源,这是现阶段读者主 2 要所需的。 以前,各种资料的来源主要是纸质的图书,查询方法也是纸质的索引卡片,这 些资料都是分散的,查找费时费力,效率很低在互联网高速发展的今天,大多 数资料都已经电子化,人们迫切需要一种快捷方便的资源查找方法,不需要具体 关心其查找资源的细节,只需要指定查找内容就会得到满意的内容丰富的结果, 这就是数字图书馆中统一检索的由来。 经过调研,目前国内各大高校纷纷建设自己的数字图书馆,但是随着各个高 校购进数据库的增加,读者查询资料的步骤也变得更加繁琐。大部分高校只是单 纯的为每个专题数据库提供一个检索入口,这样当读者想要检索某个数据库的资 料时,就必须进入该数据库的检索入口来查询资料,这给查询带来很大的不便 以北京交通大学图书馆为例,中文电子数据库有1 7 种,包括:维普中国科技期刊、 清华同方中国学术期刊,中国学术期刊文摘数据库、万方数字化期刊、万方中国 学位论文数据库以及万方中国会议论文数据库等等;外文数据库有2 8 种,包括: a c m 美国计算机协会数据库、e ic o m p c n d e x w e b ,s d o se l s e v i e r 、f i r s t s e a r c h ( o c l c ) 、i e e e i e ee l e c t r o n i cl i b r a r y 、i n s p e c 科学文摘,i s t p & i s s h p 、k l u w e r a e d e m i c 等。所以迫切需要实现对不同数据库数据资源的整合,实现统一检索,展 现在用户面前的是一个统一的检索入口,使得进行一次查询便可得到所有满足用 户需求的查询结果。 本课题研究和实现了统一检索中的信息集成平台,用户可以通过统一检索入 口检索数字图书馆中的所有馆藏数据库的资料,这样极大的方便了用户查询所需 资料。只有建立了一个良好的统一检索的信息集成平台,才能确保查询的效率和 质量。 1 2 论文主要研究内容 论文主要研究内容如下: 数字图书馆研究内容、现状和发展趋势 w e b s e r v i c e s 技术 数字图书馆信息集成平台的设计 数字图书馆信息集成平台的实现 1 3 论文结构 本文主要对数字图书馆信息集成平台进行研究和实现,全文共分五章,其结构 a e塞至望太堂 蘧堂焦i 佥塞i直 如下: 第一章引言。介绍了论文背景,论文主要内容和意义,简单介绍了本论文的组 织结构。 第二章介绍了数字图书馆的主要内容和概念,所涉及的规范以及现阶段我国 数字图书馆的状况和发展趋势。 第三章对数字图书馆信息集成平台实现主要使用的w e bs e r v i c e s 技术做了介 绍和分析。 第四章详细介绍数字图书馆信息集成平台的研究内容和具体实现,探讨了所 选择的设计方法的原因。 第五章对全文做了总结,分析下一步需要做的工作。 4 2 数字图书馆 2 1 数字图书馆的由来和主要概念 数字图书馆的由来可以追溯到上个世纪4 0 年代,1 9 4 5 年,美国著名科学技术 管理学家布什( v b u s h ) 在大西洋月刊上发表了诚如我们想象的那样一文, 文中,他首次提出将传统的图书馆馆藏文献的储存、查找机制与计算机结合起来, 构思并描述了他所设想的一种m e m e x 装备机械化的个人文档与图书馆,即台式个 人文献工作系统,能存贮书、记录和通讯的装置。 1 9 4 8 年,美国数学家维纳( n w i e n e r ) 成为第一个指出电子计算机将能够在 图书馆运作中大显身手的学者。 1 9 7 8 年,美国著名图书馆学家兰卡斯特( e w l a n e a s ) 发表了走向无纸的时 代和电子时代的图书馆员两部论著,第一次向世人详细描述了电子图书馆 的前景。 1 9 7 9 年,英国不列颠图书馆的哈利( a j h a r l e y ) 提出了“虚拟图书馆”的概 念。 1 9 8 8 年,美国国家科学基金会( n s f ) 的伍尔夫( w w u l f ) 撰写国际合作自 皮书,正式提出了数字图书馆的概念。 所谓数字图书馆,就是利用现代信息技术对有高度价值的图像、文本、语音、 音响、影像、影视,软件和科学数据库等多媒体信息进行收集,组织规范性的加 工和压缩处理,使其转化为数字信息,然后通过计算机技术进行高质量保存和管 理,实施知识增值,并通过网络通讯技术进行商效、经济地传播、接收,使用户 可以在任何时间、任何地点,都能从网上得到各种服务,成为国家的知识基础设施。 同时,数字图书馆工程建设还包括知识产权、存取权限、数据安全管理,加强研 究机构、商业机构、政府和教育团体之间的联系与合作等内容。“, 通俗地讲,数字图书馆就是数字化的信息资源库( 或者叫信息数据库) ,它应 有以下几个特性: ( 1 ) 资源数字化。资源数字化是数字化图书馆的首要特征和必备条件。数字 化图书馆的数据、文本、语音、图形图像和视频信息等所有信息资源都是经过计 算机处理的数字化信息,以便提供更为快捷和方便的服务。 ( 2 ) 流通网络化传统图书馆向读者提供的是直接面对面交流的流通服务, 而数字图书馆读者获取的查询、检索、预约、下载等一切的服务几乎全都是通过 5 计算机网络完成。 ( 3 ) 管理自动化。馆藏信息资源库的常规管理如数据库的, q b 更新、数据 库访问量的统计、读者类型的统计分析,各种资源利用率的比较等均可通过管理 员在服务器上的预设置而实现操作的全自动化, ( 4 ) 资源共享化。本地或者远程用户可以对图书馆提供的开放的、有组织的 信息资源库进行访问,获取自己需要的最终信息。同样的个体信息源如一篇文章 或者一个视频作品可以提供给不同地点的几十个甚至是几百个以上用户同时利 用,实现了真正意义上的资源共享。脚 2 2 相关支撑技术 数字图书馆的实现包括很多方面的功能,实现不同的功能需要各个领域提供技 术支持,同时,保证数字图书馆良好的性能。相关的主要支撑技术有一下几个部 分,随着各种技术的不断涌现,优秀的技术必将为数字图书馆提供强有力的技术 保障。 ( 一) 计算技术 1 并行计算 随着需要处理的信息量的膨胀,对计算机的处理能力和处理速度要求越来越 高,由于芯片的发展速度难以跟上这种需求,这就需要不同计算机并行协作共同完 成任务,即并行计算技术。经过多年的发展,并行计算技术已经取得了显著的进步, 目前主要有两个标准:p v m ( p a r a l l e lv i r t u a lm a c h i n e 标准和m p i ( m e s s a g ep a s s i n g i n t e r f a c * ) 标准。 p v m ( 并行虚拟机) 可以使多个异构的计算机进行协作和灵活的并发计算,这些 计算机通过网络连接起来,每个计算机可以是多处理器计算机,向量超级计算机、 图形工作站或者是标量工作站。用户通过p v m 类库访问p v m ,可以控制程序组件的 执行位置。p v m 系统透明的处理消息路由、数据格式转换等在异构网络环境下必须 进行的操作。 m p i 标准是由很多并行计算机用户和厂商共同制定的,定义了处理器之间基于 消息的通信规范。采用m p i 标准可以保证并行程序的可移植性。和p v l , t 相比,m p i 有不少优势,主要表现在;m p i 有更多的实现方式,定义了第三方的实现规范,支 持异步通信,对消息缓冲池的管理更好,可以同步有效地保护第三方应用程序, 移植性强,同时m p i 集群具有更好的稳定性、效率和确定性。旧 2 分布式计算 分布式计算是一种把需要进行大量计算的工程数据分割成小块,由多台计算机 6 分别计算,在上传运算结果后再统一合并得出数据结论的科学。其主要概念就是 构件,构件可以跨越不同的平台、语言、应用程序和硬件,软件开发者可以定购自 己需要的构件来完成任务。分布式计算的优点在于稀有资源可以共享,可以在多 台计算机上平衡计算负载,把程序放在最适合运行它的计算机上。目前分布式计 算标准正处于形成阶段,构件模型主要有c o m d c o m ( c o m p o n e n to b j e c t m o d e l d i s t r i b u t e d c o m p o n e n to b i e c tm o d e l ) ,c o r b a ( c o m m o no b j e c tr e q u e s t b r o k e r a r c h i t e c t u r e ) ,j a v a b e a n 。 c o m d c o m 分别提供了建立依赖于w i n d o w s 平台的非分布式组件和分布式 组件的方法。基于j a v a 的d c o m 客户和服务器可以建立在j a v a 虚拟机内。c o m 标准使c o m 对象之间可以进行相互操作,这些对象可以使用不同编程语言和不同 的结构d c o m 是c o m 在分布式计算方面的自然延续,通过剪切、粘贴实现两 个应用程序之间共享数据的动态交换,它为分布在网络不同节点的两个c o m 组件 提供了互操作的基础结构。d c o m 提供远程访问和分布式计算以及对象回收机制, 让c o m 组件能够提升企业级计算能力。 c o r b a ( 公共对象请求代理体系结构) 是通过一组标准描述的一个语言和平 台中立的规范体,通过它用于建立分布式应用程序。它代表着一种标准的模型, 利用这种模型以异构的语言实现并运行在异构的硬件和操作系统平台之上的客户 和服务器之间进行通信。应用程序和通信代码的细节是隔离的,从c o r b a 客户 角度讲,c o r b a 服务器分布式是完全透明的。公共对象服务规范( c o r b a s e r v i c e s ) 、公共设施体系结构( c o r b af a c i l i t i e s ) 、c o r b a 业务对象都是建立在 c o r b a 之上的标准,他们提供了十分丰富的分布式通信服务和框架。c o r b a 同 时提供了一系列的公共服务规范c o s s ,其中包括名字服务、永久对象服务、生命 周期服务、事务处理服务、对象事件服务和安全服务等。它们相当于一类用于企 业级计算的公共组件。 j a v a 的软件组件称为j a v a b e a n ,或者简称b e a n ,它是能够在构建工具中进行 可视化操作的可重用软件。j a v a b e a n 的组件模型包含组件和容器两个基本要素。 作为一种典型的组件模型,j a v a b e a n 具有属性、方法、事件、自我检查、定制和 永久性等6 个方面的基本特征。其中,前3 个特征是面向对象组件必须满足的基 本要求,属性和方法保证b e a n 成为一个对象,而事件可以描述组件之间的相互作 用以及组件和容器之间相互感兴趣的事情。后3 种特征主要侧重于对j a v a b e a n 的 组件性质的刻画。j a v a b e a n 组件的本地活动是在与其容器相同的地址空间内运行 的,j a v a b e a n 主要以3 种方式活动:j d b c 使得组件能够访问数据库;b e a n 可以实 现给定数据库中的表操作,完成相应的业务逻辑;远程方法调用r m i ( r e m o t e m e t h o di n v o c a t i o n ) 使分布在网络不同地址上两个组件之间实现互操作。啪 7 3 移动计算 移动计算是随着移动通信,互联网、数据库、分布式计算等技术的发展而兴 起的新技术。移动计算技术利用计算机技术和电信技术为用户提供移动的计算环 境和计算模式,将使计算机或其它信息智能终端设备在无线环境下实现数据传输 及资源共享。它的作用是将有用,准确、及时的信息提供给任何时间、任何地点 的任何客户。这将极大地改变人们的生活方式和工作方式。 移动计算是一个多学科交叉、涵盖范围广泛的新兴技术,是当前计算技术研 究中的热点领域,并被认为是对未来具有深远影响的四大技术方向之一( 其余技 术为;网络基础设施、电子商务和软件重用) 。 2 0 0 3 年,英特尔公司开发的“迅驰 ( c e n t r i n o ) 移动计算技术是一种包括了全新 的p e n t i u m m 处理器、i n t e l8 5 5 芯片组和i n t e lp r o 无线网络连接模块的移动计算 技术平台,它将开辟人类计算发展史上新的里程碑,为人们的生活与工作带来前 所未有的自由空阋和计算体验。这项技术的应用也将使移动终端的便携性得到真 正的提高,并进而催生出很多新的功能设计和应用模式,同时,新的移动计算技 术将给我国通信和计算产业带来新的商机,将推动新的价值链的产生和发展。【8 】 4 网格计算 网格的构想源于电力供应网( p o w e r g r i d ) ,其基本思想就像人们日常生活中从 电网中获取电能一样获取高性能的计算能力。 网格是继传统因特网、万维网之后的第三代因特网应用。传统因特网实现了 计算机硬件的连通,万维网实现了网页的连通,而网格则试图实现互联网上所有 资源的全面连通,其中包括计算资源、存储资源,通信资源、软件资源、信息资源、 知识资源等,形成对用户相对透明的虚拟的高性能计算环境,最终实现网络虚拟环 境上的资源共享和协同工作,消除信息孤岛和资源孤岛。因此,网格是信息社会的 网络基础设施,它把整个因特网整合成一台巨大的超级虚拟计算机,实现互联网上 所有资源的互联互通,完成计算资源、存储资源、通信资源、软件资源、信息资源、 知识资源、专家资源等智能共享的一种新型的分布式计算技术。网格技术中最为 核心的是为各种网络上的资源提供一种安全、高效的共享机制,使得各种异构和 孤立的资源能以一个整体为用户提供各种计算和信息服务。美国从九十年代初已 经开始网格计算方面的研究,目前已经有相当规模,最著名的有g l o b u s 项目。同 时,我国也大力支持网格技术的研究和应用。目前,我国比较好的几个网格项目 包括中国国家网格、中国教育网格和织女星网格等。随着网格技术的快速发展, 网格技术在现实生活中的成功应用将越来越多。州 网格计算即建立在网格基础上的充分汇聚众多计算机计算资源的一种计算方 式,其优势是处理能力强,能充分利用网上的闲置计算能力网格计算系统一般 8 由网格硬件、网格操作系统、网格界面、网格应用4 层基本结构构成,其最突出 的特点是资源共享,协同工作和开放性标准。 ( 二) 网络技术 1 v 6 现有的互联网是在i p v 4 协议的基础上运行。i p v 6 是下一版本的互联网协议, 它的提出最初是因为随着互联网的迅速发展,i p v 4 定义的有限地址空间将被耗尽, 地址空间的不足必将影响互联网的进一步发展。为了扩大地址空间。拟通过i p v 6 重新定义地址空间。l p v 4 采用3 2 位地址长度,只有大约4 3 亿个地址,估计在2 0 0 5 2 0 1 0 年间将被分配完毕,而i p v 6 采用1 2 8 位地址长度,几乎可以不受限制地提供 地址。按保守方法估算i p v 6 实际可分配的地址,整个地球每平方米面积上可分配 1 0 0 0 多个地址。在i p v 6 的设计过程中除了一劳永逸地解决地址短缺问题以外,还 考虑了在i p v 4 中解决不好的其它问题。i p v 6 的主要优势体现在以下几方面:扩大 地址空闯、提高网络的整体吞吐量、改善服务质量( o o s ) 、安全性有更好的保证、 支持即插即用和移动性、更好实现多播功能。 目前f r c c b s d 、s o l a r i s 、u n i x 上都已经有了i p v 6 协议栈的实现,同时很多大 的厂商宣布将在其产品中支持i p v 6 。c l ” 2 无线网络 无线网络,就是利用无线电波作为信息传输的媒介构成的无线局域网 ( w ia n ) ,与有线网络的用途十分类似,最大的不同在于传输媒介的不同,利用 无线电技术取代网线,可以和有线网络互为备份。使用无线网络最大的方便在于 不受固定位置的限制,方便灵活无线网络常见标准有以下三种: i e e e8 0 2 1 l a :使用5 g h z 频段,传输速度5 4 m b p s ,与8 0 2 1 l b 不兼容。采 用正交频分复用技术,可提供2 5 m b p s 的无线a t m 接口和l o m b p s 以太网无线帧结 构接口,支持语音、数据、图像业务。一个扇区可以接入多个用户,每个用户可 带入多个终端。 i e e e8 0 2 1 l b :使用2 4 g z 频段,传输速度1 1 m b p s 。它从根本上改变了无 线局域网的设计和应用现状,满足了人们在一定区域内实现不问断办公的需求。 8 0 2 1 l b 运作模式基本分为两种:点对点模式和基本模式。点对点模式是指无线网 卡和无线网卡之间的通信方式,基本模式是指无线网络规模扩充或无线和有线网 络并存的通信方式。8 0 2 1 l b 无线局域网的便利性和灵活性很适合小型办公环境和 家庭网络,根据不同情况具体解决方案主要有:对等解决方案、单点接入解决方 案、多点接入解决方案,无线中继解决方案、无线冗余解决方案和多蜂窝漫游工 作方式。 i e e e8 0 2 1 l g :使用2 4 g h z 频段,传输速度5 4 m b p s ,可向下兼容8 0 2 1 i b , 9 目前i e e e8 0 2 1 l b 最常用,但i e e e8 0 2 1 l g 更具下一代标准的实力。 3 网络存储 近年来随着i n t e r a c t 的迅速发展,信息交易量也以惊人的速度增长,网络存储技 术的出现及时地缓解了这一问题。研制高性能,扩展性强的网络存储服务系统成为 网络服务器系统的主要趋势以存储为核心的网络服务系统主要通过新型的体系 结构,对系统和数据的有效监控和管理为客户提供服务,包括w e b 、e m a i l 、流媒 体等海量数据的服务。主要技术有n a s 和s a n 。 n a s ( 网络存储服务器) 使得文件的存储和检索更有效,它的操作系统被优 化为只作一件事,即管理和保护文件。n a s 是一个网络中心的概念,取代了传统 的网络文件服务器,提供一个共享的存储器,对数据访问来说,它是一个瘦服务 器,专为文件共享而设计。与传统的服务器相比,其优势在于:快速联网并投入 使用,易于使用,外形紧凑,成本低。 s a n ( 存储区域网) 是指独立于服务器网络系统之外几乎拥有无限容量的高 速存储网络。这种网络采用高速光纤通道作为传输介质,以f c 、s c s i 应用协议作 为存储访问协议,将存储子系统网络化,实现真正的高速共享存储它主要经历 了三个阶段:多主机的磁盘共享;服务器之间的文件系统共享及存储设备的多服 务器平台连接;异构服务器之间文件系统共享以及多种存储设备的开发式共享。 ( 三) w e b 技术 w e b 技术是当今计算机领域不可缺少的重要部分之一,w e b 是分布在不同计算 机间信息分享的纽带,利用w e b 技术可以方便地进行信息共享和交互。w e b 技术是 数字图书馆实现技术的关键之一。其内容包括h t m i ,f i t t p ,m i m e , u r l 等等。 h t m l ( 超文本标记语言) 是用户描述文档结构和表现的语言,包括需要显示 的文本以及用于描述格式和结构的标记,标记成对出现,被包含在“ ” 中。哪是i n t e r n e t 中广泛使用的一种传输协议,包括传送消息的格式描述,消 息内容传送顺序、相应方式和出错条件等等。m i m e 最初是为描述电子邮件而 开发的,现在在w e b 应用中用来描述数据类型,h 1 曙的g c 命令传送的数据都对 应一个数据类型,m i m e 是系统、灵活的记录和传递类型化数据的方法。u r l 提 供了简单灵活的寻址机制,使得w e b 能够连接世界上各地的计算机信息。i n t e r n e t 中数字对象的标识基准是u r i ( u n i f o r mr e s o u r c ei d e n t i f i e r , 统一资源标识符) 命名 机制,u r i 是i n t e r a c t 资源统一的标识符体系。 ( 四) 信息安全技术 信息安全涉及到信息的保密性( c o n f i d e n t i a l i t y ) 、完整性( i n t e g r i t y ) 、可用性 ( a v a i l a b i l i t y ) 、可控性( c o n t r o l l a b i l i t y ) 。综合起来说,就是要保障电子信息的有效性。 保密性就是对抗对手的被动攻击,保证信息不泄漏给未经授权的人。完整性就是 1 0 对抗对手主动攻击,防止信息被未经授权的篡改。可用性就是保证信息及信息系 统确实为授权使用者所用。可控性就是对信息及信息系统实施安全监控。1 1 1 1 2 3 主要规范 ( 一) 数字内容创建的标准规范 数字内容包括传统的图书、图片、音像制品数字化形成的数字对象,以及直 接的数字文本、数字摄像或录音文件。数字内容创建的标准规范主要涉及内容编 码、内容数据格式、内容对象标识等方面。 1 内容编码 内容编码包括数据内容的计算机编码形式和标记形式。国际基本编码标准包 括i s o ,m c l 0 6 4 觚i n i c o d e 。根据我国汉字编码的特点,目前主要标准有 g b 2 3 1 2 - 1 9 8 0 、g b l 3 0 0 1 9 9 3 和g b l 8 0 3 0 0 0 。在标准编码基础上,还有特殊信 息编码,涉及数学符号和公式、化学符号、矢量信息、地理坐标等编码。此外, 还有数据文献结构编码标准,即如何定义文献的结构,目前普遍采用x m l d t d x m ls c h e m a 。 2 内容数据格式 数据格式涉及文本、图像、音频、视频、多媒体等数据的标准格式规范。文 本文件描述主要采用h t m l 、x h t m l 、x m l 或者x m ls c h e m a ,有些特殊领域 采用特殊的标准,例如数学和工程计算领域采用t c x ia t c x 格式。图像文件主要 标准有t i f f 、j p e g 、p d f 和g i p ,由于p d f 并不是开放格式,有些描述体系规定 采用p d f 时要建立开放数据迁移以保证p d f 数据转换为开放格式数据,对于纯黑 自文本,也可以使用g i f 格式扫描为文本图像。视频数据一般主要选用m p e g 格式, 另外也有a p p l eq u i c k t i m e 和m sr e a lv i d e o 等专用格式,由于视频格式都存在压 缩,因此数字视频数据的保存格式多采用数字录像格式,如d v 、d v c a m 、d v c p r o 、 d i g i b e t a 。音频的数据格式除常用的m p 3 外,还有w a v 、a p p l e o u i c k t i m e 和m s r e a l a u d i o 等,与视频情况类似,音频数据的保存格式采用数字录音格式,如c d - a u d i o 、 d a t 、舢f f 等。矢量数据标准格式主要有s v g 。 3 内容对象标识 内容对象标识规范涉及对数字对象的唯一标识符。实现唯一标识需要完整的 数字对象唯一标识机制,包括; 命名域( n a m e s p a c e ) ,定义所标识对象的类别和 范围b 唯一标识符,即命名域的具体表现形式;c 命名机构;d 命名登记机构; e 地址解析系统。因特网中数字对象标识基准是u r i 命名机制。目前比较流行的 数字对象唯一标识符体系结构包括:c n r i h a n d l e 、d o i ,s i c i ,b i c i ,p i i 等 1 1 数字内容对象比较普遍的规定包括:a 数字对象必须按照规范的命名体系用 一个唯一标识符予以命名,标识符本身应是逻辑的、不与物理地址绑定的,但是 可以通过标识符解析系统转换为对应的物理地址;b 数字内容对象命名所采用的 命名体系规则是公开和明确界定的,命名体系应遵从i e f t u r i 体系,应尽量采用 标准或通用的标识符命名体系:c 提供数字对象的资源系统应该能接受以唯一标 识符形式提供的指令、并将唯一标识符准确地解析为自己的内部标识;d 如果资 源系统因技术原因不能加入或建立公共命名体系及其解析机制,应建立内部数字 对象标识规则,使其他系统能够利用这些靓则来标识相应的数字对象;e 作为大 范围数字信息服务系统,需要考虑多个唯一标识符系统的互操作;f 许多数字对 象可能由多个数字对象组成或者是动态组成的,它们的连接和复用往往需要通过 标识机制来支持。 ( 二) 元数据的标准规范 元数据是描述数据的数据,在不同的领域有相应的元数据标准。在网络资源 领域内,标准包括:d u b l i n c o r e ,、a f a t e m p l a t e ,、o a d s t e m p l a t e :在文献资料领 域,主要有m a r c 、e l h e a d e r 和o n i x ;在数字图像领域,有m o a 2m e t a d a t a , c d l m e t a d a t a 、a rc , o r e 等:连续图像领域,有m p e g 7 、m p e g 2 1 等。 在开放的网络环境中,对信息系统各层次内容进行定义和描述是一个动态和 全局的问题,元数据标准规范的发展趋势之一是开放元数据机制。 ( 三) 资源组织描述的标准规范 数字对象按照一定的主题,资源类型、用户范围,生成过程、使用管理范围 等因素被组织在一起,就形成了资源集合,在这个组织过程中,不同层次包含可 相应的标准规范,例如,在数据描述方面,n s d l 规定参与其项目的资源都采用 d c 来描述资源集合,c d l 要求自己范围内的资源集合采用e a d 进行描述。在管 理机制方面,包括p i c s ,o d r l 和x a c l 等。过程规范方面,有r l g d l f 、i m l s 、 c c o p 等。 ( 四) 数字资源系统服务标准规范 数字资源的存在归根结底在于向用户提供服务,服务也必须有相应的规范。 服务规范的内容包括:输入输出条件、数据检索服务条件,数据服务处理条件和 系统调用条件。输入条件属于w 3 c 规范范围,内容有c a g 和u a a r 等,中问传 输标准涉及传输数据封装,m 口有相应的规范标准检索条件的规范主要有 7 - , 3 9 5 0 , o a i 等。服务处理包括馆借互借标准,如i s 0 1 0 1 6 0 和i s 0 1 0 1 6 1 等,开放 流通服务信息交换协议,如美国国家信息标准局提出的n c i p 协议,以及参考咨询 服务标准q u i p 和k b i t 等。【1 2 1 2 4 现状和发展趋势 在国内,由“全国中心地区中心一高校图书馆”三级构成的c a l i s 作为教 育部“2 1 1 工程”的重点项目,其目标是通过共享信息资源的建设和共享环境平台 的建设,将全国高校图书馆资源融为一个整体,形成包括多种资源类型、多种服 务方式的学术资源保障能力。工程分两个阶段由国家投资实施。第一期工程已通 过“2 1 1 工程”验收,第二期工程将围绕数字资源建设和数字图书馆系统及公共服 务平台的建立两个重点开展。目前已开始制订相关标准规范,选择或开发集成适 用技术,对各成员馆提供支持。 1 9 9 7 年,“中国试验型数字图书馆项目”启动标志着我国数字图书馆建设的开 始,迄今无论是对数字图书馆的认识,抑或是理论研究,关键技术准备等方面均 取得了较大进展,但与国外发达国家大规模
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某著名企业上海浦东空港物流园区战略定位及业务模式分析咨询项目Presentation02
- 工业废水处理与河道水质改善关系研究
- 工业安全与智能制造的融合探讨
- 工业机器人与自动化流水线技术
- 工业污染防治中的大数据分析方法
- 工业废水处理的新技术与趋势
- 工业物联网技术解析
- 工业污染防治的先进技术
- 工业生产中的环保优化策略探讨
- 工业节能减排技术与措施
- 船舶建造项目管理-全面剖析
- 世界公民教育的发展趋势
- 成人PICC堵塞的预防及处理专家共识解读课件
- 2025年福建省龙岩市中考数学模拟卷 (原卷版+解析版)
- 煤矿顶板事故预防及应急处置知识培训课件
- 新疆乌鲁木齐市2024-2025学年八年级上学期期末生物学试题(含答案)
- 租户电梯使用协议书
- 土地整治项目管理
- 2025年中考历史开卷专题速查简表
- 某冶金机械厂全厂供电系统的电气设计 (一)
- 信用卡风险防控培训课件
评论
0/150
提交评论