




已阅读5页,还剩72页未读, 继续免费阅读
(图书馆学专业论文)基于网格的数字图书馆发展建设研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要网格技术出现于2 0 世纪末。目前对网格技术的研究已成为分布式计算、互联网技术的发展方向。它将对人们的思维模式、生活方式和工作环境产生巨大的影响,并成为未来引领全球信息科技发展新潮流的强大动力。网格技术强调全面地共享资源与服务,而这些都与数字图书馆的职能有着密切的联系。网格技术将给数字图书馆的服务模式带来巨大的机遇与挑战,如果将网格技术与数字图书馆的建设全面结合起来,将在提升信息服务水平与效率方面发挥重要的作用。本文首先介绍了网格技术的基本概念、体系结构、网格环境下资源管理模式等关键技术、阐述了需要解决的关键问题。在分析国内外基于网格的图书馆研究现状部分,详细列举了国内外重要的网格项目以及重要项目的主要内容,希望通过对这些项目的了解,吸取网格技术建设的经验。本文理论研究的重点部分是如何将网格技术与数字图书馆的建设相结合。介绍了网格技术特别符合数字图书馆建设的技术特点,研究了网格技术对数字图书馆建设的影响,并以国内外数字图书馆网格项目为例,研究了网格技术在数字图书馆建设中的具体应用,基于以上研究背景,本文从网格环境下数字图书馆的发展建设入手,阐述网格环境下数字图书馆的发展模式,并尝试性的提出网格环境下数字图书馆的异构环境统一检索模型。【关键字】网格、e s c i e n c e 、数字图书馆、模型构建a b s t r a c tt h ee n do ft h e2 0 t hc e n t u r yh a sw i t n e s s e dt h ea p p e a r a n c eo fg r i dt e c h n o l o g y n o w a d a y s ,t h er e s e a r c hi ng r i dt e c h n o l o g yh a sb e c o m et h ed e v e l o p m e n to r i e n t a t i o nf o rb o t hd i s t r i b u t i n gt e c h n o l o g ya n di n t e r n e tt e c h n o l o g y g r i dt e c h n o l o g yw i l ln o to n l ye x e r tg r e a ti n f l u e n c eo np e o p l e st h i n k i n gm o d e ,l i f es t y l ea n dw o r k i n ge n v i r o n m e n t ,b u ta l s ow i l lb et h es t r o n gp o w e ro ff u t u r ed e v e l o p m e n to fg l o b a li n f o r m a t i o nt e c h n o l o g y g r i dt e c h n o l o g ye m p h a s i z e so i lc o m p r e h e n s i v e l ys h a r i n gr e s o u r c e sa n ds e r v i c e s w h i c hh a sc l o s e l yl i n k e dt ot h ef u n c t i o n so fd i g i t a l1 i b r a r y g r i dt e c h n o l o g yw i l lb r i n gh u g eo p p o r t u n i t i e sa n dc h a l l e n g e sf o rs e r v i c em o d e so fd i g i t a ll i b r a r y ,a n di fw ec a l lc o m b i n eg r i dt e c h n o l o g yw i t ht h ec o n s t r u c t i o no fd i g i t a ll i b r a r y , i tw i l lp l a ya l li m p o r t a n tr o l ei nu p g r a d i n gi n f o r m a t i o ns e r v i c ea n de f f i c i e n c y t h ep a p e l f i r s ti n t r o d u c e ss o m ea s p e c t so fg r i dt e c h n o l o g ys u c ha sb a s i cc o n c e p t ,k e yt e c h n o l o g ya n dk e yp r o b l e m st ob es o l v e d ,e t c i nt h ep a r to fa n a l y z i n gt h es i t u a t i o no fd o m e s t i ca n di n t e r n a t i o n a ll i b r a r yr e s e a r c hb a s e do n 嘶dt e c h n o l o g y ,t h ep a p e ri t e m i z e st h ei m p o r t a n t 斫dp r o j e c t sh o m ea n da b o a r da n dt h e i rm a i nc o n t e n t s i ti sh o p e dt h a te x p e r i e n c ei ng r i dt e c h n o l o g yc o n s t r u c t i o nc a nb ea b s o r b e df r o mt h eu n d e r s t a n d i n go f t h e s ep r o j e c t s jt h ek e yp a r to ft h ep a d e l i sh o wt oc o m b i n eg r i dt e c h n o l o g yw i t ht h ec o n s t r u c t i o no fd i g i t a l1 i b r a r y w i t ht h ei n t r o d u c t i o no ft h et e c h n i c a lc h a r a c t e r i s t i c so fg r i dt e c h n o l o g yw h i c hs p e c i a l l ya c c o r d sw i mc o n s t r u c t i o no fd i g i t a ll i b r a r y , t h ep a p e rh a se x p l a i n e dt h ei n f l u e n c eo f 鲥dt e c h n o l o g yt oc o n s t r u c t i o no fd i g i t a ll i b r a r y a n df r o ms o m ee x a m p l e so fg r i dp r o je c t si nb o t hd o m e s t i ca n di n t e r n a t i o n a lc o n s t r u c t i o n so fd i g i t a ll i b r a r y , i ta l s oi l l u s t r a t e dt h ec o n c r e t ea p p l i c a t i o n so fg r i dt e c h n o l o g yf o rc o n s t r u c t i o n so fd i g i t a ll i b r a r y i nt h el a s tp a r t t h ep a p e rt r i e st om a k eu pt h ef r a m e w o r km o d e l so fd i g i t a ll i b r a r yb a s e do ng r i dt e c h n o l o g y k e y w o r d sig r i d ,d i g i t a ll i b r a r y ,e - s c i e n c e ,f r a m e w o r km o d e l so f d i g i t a ll i b r a r y独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得丞洼王些太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。靴做储雠嗍弓答字嗍:1 年月学位论文版权使用授权书本学位论文作者完全了解云洼王些太堂有关保留、使用学位论文的规定。特授权丞洼王些太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。( 保密的学位论文在解密后适用本授权说明)黧嚣需签字日期:1 年,月论文主要研究内容与创新点本文主要研究网格技术在数字图书馆发展建设中的作用,并结合实例说明网格技术与数字图书馆相结合的具体应用,最后构建出基于网格的数字图书馆框架结构模型。整个工作的创新点主要体现在以下几方面:一、在数字图书馆信息系统建设中运用了网格理念及技术,并在理论上实现了两者的有机结合,更好的满足用户的信息需求。二、分析了网格技术特别符合数字图书馆建设的技术特点,研究了网格技术对数字图书馆建设的影响,并以国内外数字图书馆网格项目为例,研究了网格技术在数字图书馆建设中的具体应用。三、基于以上研究背景,本文试图从网格环境下数字图书馆的发展建设入手,阐述网格环境下数字图书馆的发展模式,并对网格环境下数字图书馆的异构资源统一检索模型进行构建。第一章绪论1 1 研究意义及背景1 。1 1 研究背景第一章绪论信息化、网络化、数字化研究与应用的不断深入,一方面预示着人类历史正在进入一个崭新的文明阶段信息社会:另一方面也使我们面临极为严峻的挑战知识和信息的总量越来越大,知识和信息更新的速度越来越快,而与之相对应的则是人类获取信息、吸收信息的相对能力在下降。虽然网络能在瞬间为我们提供“海量信息”,但我们真正渴望的是系统化的信息、专门化的知识。网络系统对信息的传递在很大程度上是无序的,无序的信息不仅不能被利用,而且还会导致信息过载、信息焦虑、信息污染等问题。信息的有效利用和信息的快速无序增长之间的矛盾日渐激化,必然严重影响信息的交流与共享,最终延缓人类文明演进的步伐。数字图书馆正是为了适应这一社会需求而产生的。在计算机、网络发展的背景下,以o p e na c c e s s 为代表的新型学术信息交流模式,g o o g l es c h o l a r p r i n t 为代表的新型信息服务机制,以w i k i 和w e b l o g 所代表的网络交流平台等给科研人员提供了一定的新型信息服务模式,但目前所采用的各种方法比如主动推送、频道技术、智能代理、专业门户网站等技术尚未从根本上解决问题。尽管随着搜索引擎技术的不断发展,在信息搜索方面有所改善,但是对于作为数字资源管理技术核心的信息和知识的生产和组织方面仍是没有实质突破。我们简要回顾一下互联网技术的发展历程就不难发现问题的根源。上个世纪席卷全球的以互联网技术为代表的信息技术给人们的生活带来革命性的变化。人们在享受信息技术带来的方便和快捷的同时,互联网技术的缺陷逐渐显露出来,其中最显著的缺陷就是所谓“信息孤岛”效应。该缺陷与互联网技术特别是i n t e r n e t 技术本身的结构体系是有关系的。我们知道i n t e r n e t 是一个分散管理的结构体系,任何符合条件的个人或团体都可以在上面建设网站、发布信息,这样互联网上信息的混乱就不可避免,其结果便是产生无数的信息垃圾。这种状况的直接后果是给用户在海量信息中准确而且全面地查找本学科、本专业所需的信息和知识带来障碍:在互联网一端是束手无策的信息用户急于通过各种途径寻找有用信息,另一端是堆积如山的海量信息等待组织和发掘。从互联网技术发展看。第一阶段是2 0 世纪7 0 - 8 0 年代,主要的成就是把分布在世界各地的计算机天津工业大学硕十学位论文用t c p i p 协议连接起来,主要应用于e - m a i l ;第二阶段是2 0 世纪9 0 年代至今,主要成就是把成千上万个网站上的网页连接起来,主要应于w e b 信息浏览以及电子商务等信息服务,其中以人们所熟知的i n t e r n e t 和万维网( w w w ) 技术为代表。我们可以看出,网络技术发展这两个阶段的重点主要在于网络硬件本身的互连和数据流的互通。对于网络信息资源在语义( s e m a n t i c ) 层面上的组织与整合等方面的工作只是刚刚开始,而且在现有的互联网平台上进行“语义w e b 的构建遇到了很大的技术瓶颈。一个新名词的出现使人们看到了转机这就是网格( g r i d ) 口1 。早期的互联网实现了计算机硬件等物理设备的连通;随着h t t p 协议和w w w 的使用,互联网实现了网页信息之间的连通;在前两个发展阶段基础上,网格更进一步。它试图实现互联网上所有资源的全面联通,以便在动态变化的多个“虚拟组织间共享资源和协同解决问题。网格技术具有的资源全面联通的特点为我们解决互联网环境下信息与知识组织的混乱现状提供了一个可行方案口1 。网格出现以后,人们上网时可能不用w w w ,而用g g g 。美国福布斯杂志的科技版f o r b e sa s a p 2 0 0 1 年9 月1 0 日发表一组文章,预测信息技术的下一波大浪潮将在2 0 1 0 年以前出现,这一波浪潮的本质特征就是万维网( w o r l dw i d ew e b ) 将升华为网格( g r e a tg l o b a lg r i d ) 。网格技术就是继因特网、万维网之后计算机工业下一波大浪潮的主线,以后人们说“上网”可能指的是上“网格”,网格是继传统因特网、万维网之后的第三代因特网应用h 1 。图书馆如果还墨守陈规,不对自己的服务内容与服务模式进行相应的改进,则必将在这场竞争中处于不利的地位。1 1 2 研究意义( 1 ) 克服传统信息知识载体缺陷的需要现在的i n t e r n e t 就像一个巨大的信息山,使信息用户在海量信息面前无所适从。据统计,全球的互联网站总数为6 3 0 0 万个。网页个数方面,光是全球最大搜索引擎g o o g l e 存储的就有4 2 8 亿个,而这个数字还不到实际网页数量的一半:同时,网页总数还在以每天7 0 0 万个的速度增长腼1 。信息的庞杂只是传统信息载体缺陷的一个方面。更为严重的是,这些信息和知识被封锁在由网站或单个信息系统构成的信息孤岛中。早在i n t e r n e t 兴起之初,人们就敏锐地意识到这个问题的严重性,开发出各种搜索引擎试图打破这种封锁,比较著名的搜索引擎如、y a h o o ,g o o g l e 等,但是这些功能强大的搜索引擎给人们带来某些便利的同时并没有从根本上解决多少问题,不难想象面对少则成千上万条,多则上百万条2第一章绪论的搜索结果,信息用户仍需大海捞针般地从中查找自己所需的知识。不仅费时费力,而且搜索引擎的查准率也不太理想。问题的根源还是在于信息用户不得不面对互联网上数千万个网站和数十亿个网页。反过来讲,解决问题的关键也在于此就是将这数千万个网站和数十亿个网页集成起来构成一个整体面向用户。网格技术所具有的功能和特点恰好可以解决这个问题,那就是所谓的“单一系统映像( s i n g l es y s t e mi m a g e ) ”机制。网格的单一系统映像机制保证网络上的所有资源作为一个整体呈现在用户面前,包括互联网上的信息和知识资源。这将从根本克服传统互联网作为信息和知识载体所具有的缺陷1 。( 2 ) 整合异质、异构的信息和知识传统互联网上的信息和知识资源的存在方式种类繁多。在存储介质上,就有硬盘、磁带、随机存储器、光盘存储等;从存储格式上看,有d o c ,p d f ,h t m l ,x m l等无数种文件格式以及多媒体存储等;从存储方式上看,有文件数据、数据库( 数据库从结构上分为关系型和非关系型,从存储数据的类型上又分为文献型、事实型和数值型) 等;从存储安全上,有加密与非加密信息数据;从存储地域上,有整合存储和分散存储。面对如此众多存在方式,用户必须使用相应软、硬件工具来获取信息和知识。这对于大部分非计算机专业的用户来说是一个很大的难题。即便是对那些计算机专业用户来说,软硬件工具的购买以及使用版权等都是一笔不小的开支。而且获得和学会使用某些专用工具所付出的时问和金钱上的代价也是用户必须考虑的问题。为了解决互联网上信息和知识的异质和异构化给用户获取、使用信息和知识所带来的不便,就必须采取某种技术使互联网上的信息和知识同质化和同构化,存储网格就能很好地承担这个任务。所谓存储网格就是将传统互联网上的分布式数据库、存储设备、文件系统等多个层面的技术应用进行有机整合,构成一个理想的存储环境。存储网格对互联网上的信息和知识资源进行整合,覆盖了它们异质、异构的存储方式,提供给用户的是一个透明的、统一存储方式的信息和知识资源的整体架构。( 3 ) 提高知识生产、挖掘和发现的效率世界上各科研机构的大型高精尖科学仪器每天都在产生大量数据。比如位于瑞士日内瓦欧洲原子能研究机构( c e r n ) 的世界上最大的正负电子对撞机l e p ( l a r g ee l e c t r o n p o s i t r o nc o l l i d e r ) 和超级质子同步加速器s p s ( s u p e rp r o t o ns y n c h r o t r o n ) 每天产生的数据量就接近1 g 字节。对这些海量数据的处理、存储和传输都不是现有的互联网技术能够承担的。为了解决这个问题,欧洲原子能研究机构正在开发一种专用网格数据网格( d a t ag r i d ) 。数据网格的任务就是以“空前的计算能力来处理这些数据,空前的人类智慧来分析这些数据,以空前的存储能力来保存这些数据。 所以与传统的互联网技术不同,各科研机天津- t 业火学硕一卜学位论文构的大型科研仪器可以直接连接到网格上,数据一经产生便输送到网格上,由网格来对数据进行分析,并从海量数据中提取有用信息和知识。这一切可以由网格自己来完成。在此基础上人们又提出了语义网格( s e m a n t i cg r i d ) 和知识网格( k n o w l e d g eg r i d ) 的概念。这两种网格具有知识挖掘和生产能力。语义网格目标是“通过使用本体论和标记语言( 如:x m l 可扩展标记语言、r d f 资源描述框架语言等) 使互联网资源的内容能被机器理解,为用户提供智能索引、基于语义的内容检索和知识管理等智能服务;结合网格、语义互联网以及互联网服务的优势,扩充网格的语义能力,并提升语义互联网的计算能力知识网格的作用则更进一步,它的目标是“利用网格、数据挖掘、推理等技术从大量在线数据集中抽取合成知识,使搜索引擎能够智能地进行推理和回答问题,并从大量数据中得出结论。 因此相对传统互联网而言,网格不再是单纯的信息和知识的载体,而成为知识的生产者、发掘者和发现者,是科技工作者等各类专业用户进行研究的好帮手,它可以直接参与到科技工作者的日常研究流程中来,承担部分研究工作,提高知识生产、发掘和发现的效率n0 。网格技术的发展以及以网格技术为基础构建的e - s c i e n c e 科研环境则给图书馆的发展带来了机遇。在e - s c i e n c e 环境下,科学研究的各个阶段都需要各种信息、仪器设备等资源的支持,而且这种支撑的力度和紧密性将比传统环境下更强大。因此,科学研究需要文献情报服务在各个阶段融入科研活动之中,而这种融入将是以人员、产品、平台、服务的全方位融入。在e s c i e n c e 下,知识传播的方向与方式都可能发生改变,图书馆将通过全面融入科研活动发挥更加积极主动的作用,图书馆工作人员将可以管理、传播科研活动中产生的各种信息,而不再局限于文献信息。并且图书馆工作人员通过全面参与科研活动,还可以直接生产知识,成为知识制造者,这样图书馆将在知识生产与传播的链条上扮演全新的角色,行使更多的职能,地位也将得到大大提高。因此,对网格技术尤其是网格技术在数字图书馆建设中的应用进行深入的探索与研究是非常必要的,它有助于我们在面对技术变革的大环境时,准确的把握主流技术发展的脉络,并将其与我们的实际工作相结合,发挥其长处以改善我们的信息服务模式,提高我们的信息服务水平与效率。1 2 国内外研究现状面对网格技术的巨大发展前景,网格技术在世界各国引起了前所未有的关注和重视,从美国、欧洲等发达国家到印度这样的发展中国家,都启动了大型网格4第一章绪论研究计划。面对国际网格技术研究开发的激烈竞争,我国也不甘落后,启动了众多的网格技术研究开发项目,网格所依托的基础网络设施也在全国范围内进行了研究与建设。随着基础研究的不断突破与成熟,网格技术己经走出实验室,并在国内外数字图书馆建设领域开始发挥作用。2 0 0 2 年,美国国会图书馆利用由圣地亚哥超级计算中心( s d s c ) 开发的数据网格软件一一存储资源代理s r b ( s t o r a g er e s o u r c eb r o k e r ,s r b ) 来测试其在保存与管理图书馆数字资源方面的效用。国会图书馆还探讨了网格技术在规划、整合数字资源方面的作用,用户可以从数字内容罩产生新的观点和获取新的知识。2 0 0 4 年,清华同方公司和知识传播技术研究院在近十年大规模开发知识资源及整合传播技术的基础上,研制成功了基于网格技术的全新资源管理应用技术“c n k i 网格资源共享平台 。网格技术在数字图书馆建设中的应用方面的研究目前已成为数字图书馆领域的研究热点。1 3 研究内容与方法1 3 1 研究内容、本文主要研究网格技术在数字图书馆发展建设中的作用,并结合实例说明网格技术与数字图书馆相结合的具体应用,最后构建出基于网格的数字图书馆框架结构模型。通过对网格的基本概念,需求环境,体系结构及网格资源的描述,说明网格体系结构下数字图书馆的资源交互已经不仅仅停留在传统数字图书馆的信息层交互层。通过分析网格体系结构,网格服务( g r i ds e r v i c e ) 构架供s a ,该环境下提供对分布式的、异构的、跨平台的资源进行集成化管理,从元数据标引到网格环境下体系结构构建,理论上实现了网格环境下数字图书馆的一站式异构资源统一检索模型。( 2 ) 分析了网格技术对数字图建设的影响,并以国内外数字图书馆网格项目为例,研究了网格技术在数字图书馆建设中的具体应用。通过对国外的研究项目e - s c i e n c e 工程及基于该工程下的d i l i g e n t 项目的分析,说明该科研环境下数字图书馆的海量存储技术,隐性知识显性化服务及分布式技术与图书馆的融合。使利用网格技术形成的e s c i e n c e 环境下的数字图书馆的功能被进一步得到扩展,方便了科研活动,使信息服务协作、共享、集成化。通过对国内清华同方知网节的分析,说明了目前国内知识网格的研究现状,系统构成及其存在的不足等。( 3 ) 基于以上研究背景,本文从网格环境下数字图书馆的发展建设入手,阐天津丁业大学硕士学位论文述网格环境下数字图书馆的发展模式,并尝试性的提出网格环境下数字图书馆的异构环境统一检索模型。1 3 2 研究方法( 1 ) 采用归纳法对国内外网格技术发展状况及基于网格的数字图书馆研究现状进行总结;( 2 ) 调研法是采用文献调研和网站法,文献调研法是通过搜索数据库来掌握目前国内外都有哪些成果和实践,网站调研法是通过浏览国内外网站,对基于网格的图书馆的实践情况进行考察;( 3 ) 个案研究法是通过对国内外典型案例进行分析,总结成功经验和不足之处;( 4 ) 分析方法综合运用了理论分析、案例分析和对比分析等,最终尝试性的构建一站式异构资源统一检索模型。1 4 论文的研究框架第一章对论文的研究意义及背景进行介绍,说明为什么要研究基于网格环境下的数字图书馆,概况性地介绍目前国内外的研究现状。第二章说明网格在国内外的不同应用进展及网格在不同方面的应用介绍。第三章和第四章分别从网格的技术原理及网格在国内外的具体应用案例入手进行分析。第三章详细分析网格的基本概念,体系结构,网格资源管理技术;第四章对国外的e s c i e n c e 工程,基于网格的虚拟数字图书馆一d i l i g e n t 项目及国内的c n k i 知网节作了详细的分析,总结成功经验和不足之处;第五章构建网格环境下数字图书馆异构资源统一检索和模型,并以上海研发公共服务平台为案例,引证了网格环境下的数字图书馆的服务深度及广度,说明网格环境下的数字图书馆给广大用户带来的便利及其所产生的知识增值的效果。最后总结了上海研发公共服务平台的不足之处。第六章说明本文不足及需要继续研究的内容。如图1 - 1 所示,希望这样的结构安排可以让读者对网格环境下的数字图书馆发展建设过程有一个完整的认识。6第一章绪论1 5 论文的创新点图卜1 论文总体框架( 1 ) 在数字图书馆信息系统建设中运用了网格理念及技术,并在理论上实现了两者的有机结合,更好的满足用户的信息需求。( 2 ) 分析了网格技术特别符合数字图书馆建设的技术特点,研究了网格技术对数字图书馆建设的影响,并以国内外数字图书馆网格项目为例,研究了网格技术在数字图书馆建设中的具体应用。( 3 ) 基于以上研究背景,本文试图从网格环境下数字图书馆的发展建设入手,阐述网格环境下数字图书馆的发展模式,并对网格环境下数字图书馆的异构资源统一检索模型模型进行构建。第二章国内外网格研究概述第二章国内外网格研究概述2 1 国外网格应用研究2 1 1 网格基本体系结构研究网格的理论思想早在1 9 6 0 年就开始提出来了。“网格”最初应用于科学研究的思想,可以追溯到i n t e r n e t 的先驱j c r l i c k l i d e r ,当时他做出以下设想:世界上所有的计算机连接在一起,人们可以采用一台远程计算机,从另一台远程计算机上获取数据;或者在自己的工作中,同时使用多台计算机。因此,上世纪高速发展的i n t e r n e t 技术部分实现了l i c k l i d e r 的设想。对网格的大规模研究只是近几年的事,经过学者们的不断努力,网格研究已取得很大进展。网格技术的相关专业术语如元计算( m e t ac o m p u t i n g ) 、对等计算( p e e r t o p e e rc o m p u t i n g ) 、分布计算( d i s t r i b u t e dc o m p u t i n g ) 、数据网格( d a t ag r i d ) 、计算网格( c o m p u t i n gg r i d ) ,访问网格( a c c e s sg r i d ) 、信息网格( i n f o r m a t i o ng r i d ) 、语义网格( s e m a n t i cg r i d ) 知识网格( k n o w l e d g eg r i d ) 等纷纷出现并广泛应用 2 1o上个世纪9 0 年代,网格技术的主要研究者们如i a nf o s t e r ,c a r lk e s s e l m a n ,j e f f r e ym n i c k ,s t e v e nt u e c k e 等在网格的剖析实现可扩充的虚拟组织和 g r i d 的生理个应用于分布式系统整合的开放式g r i d 服务体系结构嘲研究论文中就详细阐述了网格“虚拟组织”的概念和网格体系结构的五层沙漏体系。论文中论述了网格“虚拟组织”的基本特征,即虚拟组织是分布式的、异构的、动态的,由企业的异构资源和外部资源共享以及服务提供者关系构成;论文中还给出一个开放式网格服务体系结构即o g s a 。o g s a 体系结构构建在g r i d 服务以及w e b 服务的概念和技术规范上,定义了一个统一的对外服务语义( g r i d 服务) ;还定义了创建、命名和发现短暂网格服务实例的标准机制:提供服务实例的定位透明性和多协议绑定:并支持与本地平台设施的整合。根据“w e b 服务描述语言( w s d l ) 中的接口定义和相关规范,开放式网格服务体系结构还定义了创建组合复杂分布式系统所需的一系列机制,包括生命周期管理、变更管理及通知等。如果需要,服务绑定能够支持可靠调用、认证、授权和委派。通过描述如何用网格机制来实现一个面向服务的体系结构,说明如何将网格的功能融入到w e b 服务框架中,并阐明了如何将五层沙漏体系结构作为组织域内和跨天津t 业大学硕上学位论文组织域的分布式系统整合方式并应用于商业计划中。在此基础上,美国和欧洲等西方发达国家著名科研机构相继提出网格的试验模型,如:g l o b u s ,g l o b e ,s e t i h o m e ,d 2 0 l 。还有其它被启动的项目如n s f 国际虚拟数据网格实验室和欧洲网格项目、欧盟数据网格工程以及英国g r i d p p ,意大利i n f n 网格和n o r d u g r i d 等国际网格项目。其中尤以g l o b u s 项目最著名,研究进展最迅速,技术体系最完整。g l o b u s 是美国a r g o n n e 国家实验室的研发项目,全美有1 2 所大学和研究机构参与其中。g l o b u s 对资源管理、安全、信息、服务及数据管理等网格计算的关键理论进行研究,开发了能在各种平台上运行的网格计算工具箱( t o o l k i t ) ,帮助规划和组建大型的网格试验平台,开发适合大型网格系统运行的大型应用程序。t o o l k i t 是g l o b u s 最重要的成果,第一版软件在1 9 9 9 年就己推出。t o o l k i t 源码开放,任何人都可以从其网站下载源代码。目前,g l o b u s 的技术已在n a s a 网格( n a s ai p g ) 、欧洲数据网格( d a t a g r i d ) 、美国国家技术网格( n t g ) 等8 个项目中得到应用隅1 。在发表网格的剖析和g r i d 的生理这两篇网格技术的经典文献前后,i a nf o s t e r 等专家针对具体的问题写出了一系列的研究论文。在ad i r e c t o r ys e r v i c ef o rc o n c u r i n gh i g h p e r f o r m a n c ed i s t r i b u t e dc o m p u t a t i o n s 一文中s t e v e nf it z g e r a l d ,i a nf o s t e r ,c a r lk e s s e l m a n ,g r e g o rv o nl a s z e w s k i ,w a r r e ns m i t h ,s t e v e nt u e c k e 等专家探讨在分布式计算环境中资源信息查找的问题n 纠n3 l 。在分布式环境中( i n t e r n e t 就是一个广义上的全球分布式计算环境) ,高性能计算通常需要仔细选择和配置的方面不仅仅包括计算机、网络和其它硬件资源,而且还包括协议以及应用的算法等软件资源。反过来,选择和配置这些软、硬件资源又需要具有访问这些资源的权限账号、资源状态和结构的最新信息。在网格技术出现以前,还没有现成的标准机制来对这些信息进行组织和访问。与单机环境不同的是,在分布式环境中存在大量不同的工具和应用,它们为了适应不同的计算环境,也为了应用本身的轻便实用而采用了不同的配置和机制。在该文中,i a nf o s t e r 等建议使用元数据目录服务( m d s ) 来提供足够的而且可扩展的体系来访问这些种类繁多的资源结构和状态信息;这些信息都是动态的、随时变更的、分布式的。i a nf o s t e r 等还定义了一个可扩展的数据模型来表示所需信息,同时发布了一个可扩展的,高性能的,分布式的实现方式。在实现中,数据呈现和应用编程接口采用的是l d a p ( 轻量级目录访问协议) ;还采用了全新数据模型和实现方式。2 1 2 网格资源管理研究在a p p li c a t i o ne x p e r i e n c e sw i t ht h eg l o b u st o o l k i t 1 4 1 一文中i a nl o第二章国内外网格研究概述f o s t e r :等描述了在高性能网格计算环境下的应用( 比如信息查询) 和工具( 信息查询工具) 开发的复杂性。主要原因有二:网格底层异构资源的频繁变动:网格资源自身复杂性所导致的分布式计算复杂度和超级计算( s u p e r c o m p u t i n g ) 复杂度同时发生并牢固结合起来,从而产生更高的复杂度。该文介绍了一个在g l o b u s环境下开发的工具包,它通过提供一些核心服务的具体实现来提高分布式高性能计算环境的性能,以简化应用和工具开发任务的过程。文中还描述了通过这个工具包开发的两个大型应用实例:一个分布式互动仿真和一个远距离指挥系统。通过这次应用的开发周期,获取学习经验值,然后得出资源管理效率的通用结论。2 1 3 网格在知识管理方面应用的研究网格技术在信息与知识资源管理中的应用己经得到广泛的研究,主要成果有:信息网格( i n f o r m a t i o ng r i d ) ,访问网格( a c c e s sg r i d ) ,语义网格( s e m a n t i cg r i d ) 和知识网格( k n o w l e d g eg r i d ) 等。世界上的各i t 公司相继在进行这方面的研究,比如微软公司于2 0 0 2 年提出的d o t n e t 平台,就是一个超越浏览器、跨网站的革命性新技术。该平台的基本实现思想是:不再关注单个网站和与i n t e r n e t连接的单个设备,而是让所有的计算机、相关设备和服务商协同工作,提供更广泛和更丰富的解决方案,使人们能够控制信息并让它在指定的时间以指定的方式传送给用户。i b m 公司提出的w e bs e r v i c e s 技术是一种较成熟的商业信息和知识服务共享解决方案,它可以使全球范围内的采购商、供应商和交易市场以低廉的价格共享商业信息服务。s u n 公司则充分利用其在跨平台语言方面的优势,以j a v a 语言为核心推出了相应的j 2 e e 平台规范。除了上述的平台和规范,其它比如x m l ,s o a p ,u d d i ,w s d l 等具体技术都使网格技术在信息和知识管理领域得到实际使用。信息网格和访问网格都强调对信息的透明和安全访问。其中尤以美国国际商用机器公司( i b m ) 重视此项研究。i b m 资深信息专家m e l i s s ah y a t t ,r o bv r a b l i k在t h ei n f o r m a t i o ng r i d s e c u r ea c c e s st oa n yi n f o r m a t i o n ,a n y w h e r e ,o v e ra n yn e t w o r k n 司一文中提出信息网格就是网格计算模型核心组件的思想。它允许终端用户和应用能够安全访问任何信息资源,不管这些信息资源存储在何处。随之而来,信息网格在发展过程中就会碰到与其功能相适应的挑战,比如:由于环境的异构性以及底层存储方式和计算方式的异构性所导致的信息资源的琐碎和分散性;数据访问方式繁琐、笨重以及数据集成度不高;信息安全和保护功能的存在所导致的分散分布系统和资源管理的复杂性。并在这些基础上比较明确地提出了信息网格的功能和任务。从该文定义的功能上来看,信息网格还只是网格计算的组件之一,只是为更广泛范围内的网格计算提供支持。l u i s灭津工业大学硕七学位论文f e r r e i r a ,j o a c h i md i r k e r ,o l e g a r i oh e r n a n d e z ,c a r l o sa l e x a n d r eq u e i r o z ,v o l k e rr o h l e d e r 等在t h ei n f o r m a t i o ng r i d ,p a r t l :t h ei n f r a s t r u c t u r e :g e t t i n gi n f o r m a t i o nf r o m h e r et ot h e r ea n db a c ka g a i n 和p a r t 2 :b l u e p r i n t sa n dl a y e r s :p l a n n i n gt h ei n f o r m a t i o ni n f r a s t r u c t u r ef o rag r i d u 6 1 中提出了“虚拟化资源( v i r t u a l i z e dr e s o u r c e s ) 的体系,这个体系基本的理念就是将物理上分开的、分布的资源看成一个单独整体。比如数据库、数据文件以及存储设备等都是资源在不同层次上的抽象,那么就需要在不同层次上进行虚拟化处理。该文中提出了三层虚拟结构,从底层到高层依次为:存储层,文件系统层,数据或信息层;并依据不同的层次,作者提出了相应的“资源虚拟化”策略和方式。网格技术在信息与知识资源管理中的另一个应用是语义网格( s e m a n t i cg r i d ) 。语义网格并不是最早的语义网络技术,最早的语义网络技术是“语义w e b ”。所谓语义w e b ( s e m a n t i cw e b ) 是对当前w e b 资源的一种扩展,其目标是通过本体论和标记语言等技术( 如r d f ,x m l ,d a m l ) 的使用,使w e b 资源的内容能被机器理解,为用户提供智能索引、基于语义的内容检索和知识管理等智能服务n7 | 。语义网格是英国e - s c i e n c e 项目在实际研究工作中根据需要所提出的一个网格应用技术,是在现有网格技术上的一种扩展。在语义网格中,所有信息和服务进行了良好的组织,而且都能够非常显明地表示其意义,以便计算机和用户能够更好地在一起互操作。语义网格的目的在于建立全球性的知识社区( k n o w l e d g ec o m m u n i t i e s ) ,智能地管理知识。具体来说,语义网格具备最初网格技术元数据语义的显明表示功能和基于知识的网格服务:还包括基于语义的元数据集成和聚合,其具体实现包括知识表示和知识本体论、语义网格服务、基于语义的知识建议,动态分布的社区构建等。因此,从软件实现的角度看,语义网格是一个智能中间件( i n t e l l i g e n tg r i dm i d d l e w a r e ) ;从资源组织结构体系角度来看,它是另一种网格技术知识网格的前身 1 8 o网格技术发展到一定阶段之后,它对自身知识管理的要求进一步提高了,知识网格就是在这个背景下提出来的。知识网格这个概念最早是2 0 0 1 年1 1 月被提出来的。著名信息科学家f r a nb e r m a n 在其发表的论文“f r o mt e r ag r i dt ok n o w l e d g eg r i d 中提出了知识网格的概念,并指出知识网格的主要研究内容是:利用网格、数据挖掘、推理等技术从大量在线数据集中抽取和合成知识,使搜索引擎能够智能地进行推理和问题回答,并从大量数据中得出结论。c a n n a t a r o 和t a l i a 于也于2 0 0 3 年1 月提出了基于数据挖掘的知识网格,并提出进一步完善知识网格功能的建议和设想啪】 。知识网格是一个智能环境,它使用户能够有效地获取、发布、共享和管理知1 2第二章国内外网格研究概述识资源,并为用户以及其它服务提供所需要的知识服务,辅助实现知识创新、协同工作、问题解决和决策支持。知识网格的基本功能发掘知识,管理知识。知识网格所要解决的主要科学问题包括:资源的规范组织、智能聚合和语义互联。资源的规范组织解决如何规范地组织资源空间,使用户和服务能够有效、正确地根据语义来操作各种资源,提高资源的使用效率。资源的智能聚合解决如何使资源能够互相理解,根据用户的需求有效、动态、智能地聚合各种资源。2 2 国内网格研究概述2 2 1 国内网格研究环境“即使是学计算机的人,知道网格的也仅有2 0 左右”,中国教育科研网格计划专家组组长金海博士表示,“而网格最大的用户不应该是学计算机的人,这说明网格普及还有很长的路。近期最重要的工作是挖掘网格的应用。作为即将建成的世界上最大的教育网格,中国国家教育科研网格( c h i n ag r i d ) 建设第一期投入仅2 0 0 0 万元,初步建立起包括清华大学、华中科技大学等在内的1 2 所大学的网格环境,并开始建设一些专业性的应用系统,如图像处理、生物信息科学、海量信息处理、远程教育等网格。目前,c h i n ag r i d 正在与i b m 、英特尔、s u n 和h p 等各大公司探讨合作建立覆盖全国1 0 0 所大学的公共网格平台,以达到全国教育资源、信息的共享和优化配置。建立全国性的大学数字博物馆,服务西部的远程教育网格。网格在教育系统中最迫切的应用需求主要来自计算网格、信息服务网格和仪器设备网格几个方面。从计算网格讲,由于我国6 0 的科研项目由高校承担,而越来越多的项目需要共同协作完成,对科研来说,通过网格实现计算资源的共享和调配是一个很现实的需求;从信息服务的角度来讲,教育系统有大量丰富的教育课件等教学资源需要得到充分和有效的利用;更进一步地,教育系统还有大量的仪器设备和软件需要共享使用,以降低重复购买带来的投资浪费,金海博士特意提到,仅“2 l l 工程 在1 0 0 所重点高校中仪器设备的投资就达4 5 0 亿元,目前这些资源还很少能够被有效地共享使用。另一方面,目前除了传统的科学计算,网格在商业领域的需
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 12克服胆怯(教学设计)-大象版心理健康四年级
- 第四单元第1课 身临其境 说课稿-2024-2025学年人教版(2024)初中美术七年级上册
- 第六课 成功贵在坚持说课稿-2025-2026学年小学心理健康川教版五年级上册-川教版
- 2025年高考生物试题分类汇编植物生命活动的调节(解析版)
- 2025年审计专业知识考试题及答案
- 2025年高考生物试题分类汇编:群落及其演替解析版
- 葡萄酒美容知识培训课件
- 小班科学连线题目及答案
- 2025经理聘用合同的范文
- 项目论文题目及答案范文
- 上海交通大学学生生存手册
- 《道德与法治》三年级上册教材分析解读课件
- 幼儿园绘本故事:《苏丹的犀角》 课件
- 03第三阶段04印章模型制作
- 英汉互译课件05
- GB∕T 17766-2020 固体矿产资源储量分类
- Q∕SY 06515.1-2016 炼油化工工程电气技术规范 第1部分:通则
- 2010现代领翔nfcg2.0dohc原厂维修手册车身和外部
- 电动汽车充电站建设项目可行性研究报告
- 六年级上科技制作教案(共11页)
- 九年级综合实践活动教案
评论
0/150
提交评论