已阅读5页,还剩60页未读, 继续免费阅读
(计算机应用技术专业论文)基于网格的异构数据库集成技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨t 程大学硕十学位论文 摘要 随着数据库技术的发展,信息资源的异构性在各行各业的信息管理系统 中无处不在,形成了大量的信息孤岛。但在网络平台普遍使用的今天,现实 要求人们必须将异构数据库系统中的数据进行有效的集成,以便更好地进行 数据共享和数据处理。网格技术被誉为互联网第三次浪潮,它以地理上分布、 逻辑上异构、资源上动态、网格节点上自治为主要特点,这一特点恰好符合 资源共享的需求。因此,用网格这种新的技术来解决异构数据库集成就成为 一个重要的研究课题。 本文首先介绍了网格环境下数据库集成相关技术,如x m l 技术、w e b 服务和网格的技术,重点对网格工具包g l o b u st o o l k i t 、o g s a d a i 的体系结 构及其服务等进行了研究,并分析了o g s a d a i 中间件的局限性;其次,设 计了基于网格的数据库集成系统,对系统中的关键问题进行研究,在底层对 数据库连接进行改进同时给出了数据库注册发布方法,使用户能方便的将数 据库封装为服务发布出去。另外,利用标准化的网格接口通过系统为不同数 据库节点提供单库查询服务、元数据获取服务,通过x m l 格式进行数据转 换和传输,给出了异构关系数据库闯及x m l 数据库与关系数据库间的集成 的方法,并提出多数据库查询的模型;最后介绍了网格环境的搭建,在实验 室局域网环境下对系统进行了测试,给出了演示界面及结果。 关键词:网格;异构数据库集成;o g s a d a i a b s t r a c t w i t ht h e d e v e l o p m e n t o fd a t a b a s e t e c h n o l o g y ,i n f o r m a t i o n s o u r c ei s h e t e r o g e n o u sw h i c he x i s t si ne v e r yv o c a t i o ni n f o r m a t i o nm a n a g e m e n ts y s t e m w h i c hc a u s i n gal o to fs i n g l ei n f o r m a t i o n i s l a n d b u tn e t w o r k p l a t f o r mi s c o m m o n l yu s e dn o w ,i n t e g r a t i n gd a t ai nh e t e r o g e n e o u sd a t a b a s e se f f e c t i v e l yt o s h a r ea n dp r o c e s sd a t ab e t t e ri se s s e n t i a l g r i dt e c h n o l o g yi sc o n s i d e r e da st h e t h i r dw a v eo ft h ei n t e r a c t ,i ti sc h a r a c t e r i z e da sg e o g r a p h i cd i s t r i b u t i o n ,l o g i c a l l y h e t e r o g e n e o u s ,r e s o u r c e sd y n a m i c a l l ya n dg n d n o d ea u t o n o m yo nt h em a i n c h a r a c t e r i s t i c sw h i c hp e r f e c t l ym e e tt h en e e d so f r e s o u r c e s h a r i n g s ou s i n g 酿d t os o l v eh e t e r o g e n e o u sd a t a b a s e si n t e g r a t i o nh a sb e c o m ea l l i m p o r t a n tr e s e a r c h t o p i c f i r s t l y , t h et e c h n o l o g i e sa r ei n t r o d u c e di ng r i dd a t a b a s ei n t e g r a t i o n ,s u c ha s x m lt e c h n o l o g y ,w e bs e r v i c e sa n dt h e 咖dt e c h n o l o g y g l o b u s t o o l k i t , 0 g s a d a ia r c h i t e c t u r ea n di t ss e r v i c e sa r er e s e a r c h e d ,m e a n w h i l et h es t u d ya n d a n a l y s i so ft h eo g s a - d a im i d d l e w a r el i m i t a t i o n sa r ei n c l u d e d ;s e c o n d l y , t h i s t h e s i sd e s i g nag r i d b a s e dd a t a b a s ei n t e g r a t i o ns y s t e m ,s t u d yk e yp r o b l e m so ft h e s y s t e m ,t h ed a t a b a s ec o n n e c t i o ni si m p r o v e da tt h eb o t t o m 。t h em e t h o do f r e l e a s i n gd a t a b a s ei sp r o p o s e d ,t h e nu s e r sc a ns e n do u tt h ed a t a b a s e sw h i c ha r e p a c k a g e da ss e r v i c e i na d d i t i o n ,t h i ss y s t e mp r o v i das i n g l ed a t a b a s eq u e r y , m e t a d a t aa c c e s ss e r v i c e sv i as t a n d a r d i z e dn e ti n t e r f a c e ,a n dr e a l i z e si n t e g r a t i o n w i t h i nr e l a t i o n a ld a t a b a s e ,b e t w e e nt h ex m ld a t a b a s ea n dr e l a t i o n a ld a t a b a s e t h r o u g hx m lf o r m a t ,m u l t i d a t a b a s eq u e r ym o d e li sp r o p o s e d ;f i n a l l yt h e m e t h o do fb u i l d i n gg r i di s i n t r o d u c e d ,s y s t e mi s t e s t e di n l a b o r a t o r yl a n e n v i r o n m e n t ,t h er e s u l t sa r eg i v e n 。 k e yw o r d s :g r i d ;h e t e r o g e n e o u sd a t a b a s ei n t e g r a t i o n ;o g s a d a i 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导下,由 作者本人独立完成的。有关观点、方法、数据和文献的引用已在 文中指出,并与参考文献相对应。除文中己注明引用的内容外, 本论文不包含任何其他个人或集体已经公开发表的作品成果。对 本文的研究做出重要贡献的个人和集体,均已在文中以明确方式 标明。本人完全意识到本声明的法律结果由本人承担。 作者( 签字) :珍像侄 日期:硼年乃月另日 哈尔滨工程大学 学位论文授权使用声明 本人完全了解学校保护知识产权的有关规定,即研究生在校攻读 学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨工程 大学有权保留并向国家有关部门或机构送交论文的复印件。本人 允许哈尔滨工程大学将论文的部分或全部内容编入有关数据库进 行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位 论文,可以公布论文的全部内容。同时本人保证毕业后结合学位 论文研究课题再撰写的论文一律注明作者第一署名单位为哈尔滨 工程大学。涉密学位论文待解密后适用本声明。 本论文( 口在授予学位后即可口在授予学位1 2 个月后口解 密后) 由哈尔滨工程大学送交有关部门进行保存、汇编等。 作者( 签字) :翻主位导师( 签字) :珏廑 日期:7 卯7 年哆月乃日7 卯7 年刁月孑日 哈尔滨t 程大学硕十学位论文 第1 章绪论 1 ,l 课题研究背景和意义 随着计算机网络技术和数据库技术的迅速发展,数据库管理系统已经从 d o s 环境下的f o x b a s e 、d b a s e 等小型微机数据库发展到了w i n d o w s 、u n i x 环境下的o r a c l e 、d b 2 等大型数据库。不同数据库技术的发展,以及多样化 新技术的采用,使得信息资源的异构性在各行各业的信息管理系统中无处不 在,形成了大量的信息孤岛。但在网络平台普遍使用的今天,现实要求人们 必须将异构数据库中的数据进行有效的集成,以便更好地进行数据共享和数 据处理。要实现网络环境下的信息共享,就必须使网络上的各数据库,集成 为统一的数据应用平台,实现不同数据库之间的数据信息资源合并和共享。 异构数据库的异构性主要体现在以下几个方面【l 】: ( 1 ) 计算机体系结构的异构。各个参与的数据库可以分别运行在大型机、 小型机、工作站、p c 机或嵌入式系统中。 ( 2 ) 操作系统的异构。各个数据库系统运行的操作系统可以是u n i x 、 w i n d o w s 、l i n u x 等。 ( 3 ) 存储模式的异构。一般的存储模式包括关系模式、对象模式、对象 关系模式和x m l 文档树型模式等几种,其中关系模式为主流存储模式。需要 注意的是,即便是同一类存储模式,他们的模式结构可能也存在差异。例如 o r a c l e 所采用的数据类型与s q l s e r v e r 所采用的数据类型并不是完全一致的。 网格是继万维网之后出现的一种新型网络计算平台,其目的主要是为用 户提供一种包括网页在内的各种资源全面共享的基础设施。通过这种基础设 施,用户不需要知道这个基础设施上资源的具体细节就可以使用自己需要的 资源。网格把分布的资源集成为一台能力巨大的超级计算机,提供计算资源、 存储资源、数据资源、信息资源、知识资源、专家资源、设备资源的全面共 享。资源共享是网格的根本特征,消除资源孤岛是网格的奋斗目标【2 j 。具体 来说网格的本质特征有: 哈尔滨t 程大学硕十学位论文 ( 1 ) 分布性与资源共享。分布性是删格最主要的特征,网格是通过集中 分散的资源来完成计算的,而集中资源的手段是各种资源的共享,分布是网 格硬件在物理上的外在表现,而共享是网格软件在逻辑上的内在体现,两者 对于网格来说都十分重要。 ( 2 ) 动态性和多样性。网格的动态性包括动态增加和动态减少两个方面, 原来拥有的多种资源或功能,在某一时刻可能会出现故障或者不可用;而原 来没有的资源,可能随着时间的推移会不断地加入。 ( 3 ) 自治性与管理的多重性。网格节点内部的自治和外部的受控整合是 网格的一个特征,分层的资源需要层次化的管理,而分层来自于网格节点的 归属问题和性能方面的考虑。 本文主要针对各种异构数据库资源在网格环境下建立数据库集成系统, 在充分保证分散数据库自治性的情况下,屏蔽各个节点数据库的结构、运行 环境上的差异、网络分布状况和具体的物理位置,保证各个节点数据库的独 立性和数据的安全性。相比较其它集成环境,这是它的优势所在,随着网格 技术的进一步完善与规范,数据网格的应用会越发成熟。 1 2 国内外研究现状 目前,数据库集成方法大概可以分为两种:数据仓库和虚拟视图法。数 据仓库一般用于数据分析,通常被称为只读集成。而虚拟视图法则是语义层 次上的集成,关注于数据库模式,在此基础上可以实现异构数据库间的互操 作。采用虚拟视图法集成异构数据库主要有两种体系结构,即联邦数据库系 统和中介系统。 1 数据仓库法 数据仓库方澍3 】需要建立一个存储数据的仓库,将来自多个数据源的数据 副本都存储在数据仓库中,由e t l ( e x t r a c t t r a n s f o i i t i l o a d ) 工具定期从数据 源过滤数据,然后装载到数据仓库供用户查询。其系统结构如图1 1 所示。 数据仓库主要是针对企业某个应用领域提出的一种数据集成方法,适用 于面向主题并为企业提供数据挖掘和决策支持的系统。不足之处在于数据仓 库中的数据在存储之前要经过一定的筛选处理,而且数据仓库还需要定期更 新,所以用户查询到的数据可能不是最新的。 2 哈尔滨t 稗大学硕十学伊论文 图1 1 数据仓库体系结构 2 联邦数据库系统 联邦数据库系统( f e d e r a t e dd a t a b a s es y s t e m ,f d b s ) 【4 】是由参与联邦的 半自治的数据库系统组成,目的是实现数据库系统间部分数据的共享。联邦 中的每个数据库的操作是独立于其它数据库和联邦的,之所以叫“半自治 是因为联邦中的所有数据库都添加了彼此访问的接口。 对这些半自治数据库的操作进行控制和协调的软件,称为联邦数据库管 理系统( f e d e r a t e dd a t a b a s em a n a g e m e n ts y s t e m ,f d b m s ) 。f d b m s 是一个 管理中心,它能把各成员数据库模式映射到一个公共的联邦模式,负责各种 模式之间的转换工作,自动解决网络传输问题和异构数据库操纵问题,接受 联邦用户的数据请求,把这个请求翻译后送到各个目的数据库引擎,并将收 到的结果数据集成后返回给用户。 f d b s 中实现互操作最常用的方法是将每个数据库模式分别和其它所有 数据库模式进行映射,这样联邦中需要建立n ( n 1 ) 个模式映射规则,但当 参与联邦的数据库很多( n 值很大) 时,建立映射规则的任务将变得很复杂 而难于实现。所以,联邦数据库集成系统适合于自治数据库的数量比较小的 情况,希望各数据库有较好的自治性,允许用户单独查询,数据库间能够彼 此联合回答查询的情况。其体系结构如图1 2 所示。 哈尔滨t 稃人学硕十学位论文 图1 2 联邦数据厍体系结构 3 中介系统 中介系统则是一种软件结构,支持虚拟视图或视图集合。它不存储任何 实际数据,作用是在用户提交了一个查询后,将用户查询翻译成一个或多个 对数据源的查询。然后将数据源的查询结果进行综合处理,汇总并将之返回 给用户。用户的查询基于中间模式,不必知道每个专门的数据源的特点,查 询执行引擎直接与包装器( w r a p p e r ) 打交道,将基于中间件模式的查询转换 为基于各个局部数据源的模式。中间件模式更适应于数据源数目多、各局部 数据源的自治性很高且局部数据经常变化的w e b 环境。而且x m l 的出现使 得对各种数据信息的标准化描述成为可能,使系统更易于适应的空间的不同。 中介系统与紧耦合联邦数据库相比较有如下优点:中介系统可以集成非 数据库数据源,基于中介器( m e d i a t o r ) 的系统中的数据源的查询能力可以 是受限制的,数据源可以不支持s q l 查询;中介系统中的数据源是完全自治 的,这就意味着很容易向从系统中添加删除数据源【5 】。 中介系统的主要部分是中介器和针对每个数据源的包装器( w r a p p e r ) 。 这里中介器的功能是接收针对全局模式生成的查询,根据数据源描述信息及 映射规则将接收的查询分解成每个数据源的子查询,再根据数据源描述信息 优化查询计划,最后将子查询发送到每个数据源包装器。包装器将这些子查 询翻译成符合每个数据源模型和模式的查询,并把查询结果返回给中介器。 中介器将接收的所有数据源的结果合并成一个结果返回给用户。 4 哈尔滨t 程大学硕十学伊论文 网格环境所面对的是大量的分布式异构数掘源且数据源吏新频繁,凶此 基于网格的数据库集成通常采用的是中介系统的方法,这不仅可以避免联邦 数据系统对联邦中数据源数量的限制,也可以避免数据仓库中无法对数据进 行实时查询的缺点。 国外对于基于网格的数据库集成相关研究工作起步较早,水平较高,成 果较多。其中比较著名的项目有s p i t f i r e t 6 1 、o g s a d q p r 、o r a c l e1 0 9 8 】和开 放网格服务架构数据访问和集成( o p e ng r i ds e r v i c e sa r c h i t e c t u r e d a t a a c c e s sa n di n t e g r a t i o n ,o g s a d a i ) 【9 j 等。国内在数据网格方面的相关研究仍 处于起步阶段,但已有一些成功的范例,科学数据网格( s c i e n t i f i cd a t a g r i d ,s d g ) 【lo j 就是其中的典型应用。 s p i t f i r e 和o g s a d q p 是尝试在网格中管理数据库的项目。s p i t f i r e 使用 w e bs e r v i c e 技术提供基于s o a p 的远程过程调用来对数据库进行操作如对 一行或几行的查询插入等,但它不能处理大数据集和一些复杂的操作。o g s a - d q p 的目的是为了提供有效的数据服务编排功能,并对数据服务进行查询 和分析。它由g d q s 和g e s 两部分组成。g d q s 是一个协调器,它能够对 查询语句进行编译、优化、划分和调度,并生成查询计划;g e s 是一个评估 器,被用于执行查询计划并获取相应的数据。不过它有三个明显的缺点:一 是使用的查询语言是o q l ,需要用户重新学习;二是g d q s 使用的编译期是 基于p o l a r 水的,依赖于l i n u x 平台,且安装使用复杂;三是d q p 还不太完善, 很多功能还在进展之中。 o r a c l e1 0 9 是美国o r a c l e 公司推出的第一个真正的网格数据库。o r a c l e 1 0 9 作为网格资源的使用方、服务和数据的提供方,对数据库利用存储和服 务器的方式进行了虚拟化,自动地将集群化的存储器和服务器供应给网格中 的不同数据库,同时提供了实现数据池以及应用程序虚拟的相关技术。它是 通过o r a c l e 透明网关和o r a c l e 物化视图等功能的支持,实现异构数据的透明 访问和有效集成,但是不太适合大规模广域范围内的数据集成。 o g s a d a i 项目致力于建造通过网格访问和集成来自不同的孤立数据源 的中间件,这个项目是由u kd a t a b a s et a s kf o r c e 提出构想,并紧密的和全 球网格论坛数据访问和集成服务工作组( g g fd a i s w g ) 以及g l o b u s 团队一 起工作。总体上,o g s a d a i 与d a i s 相符合,努力成为d a i s 网格数据库 5 哈尔滨t 稗人学硕十学位论文 服务推荐标准的第一个参考实现。它采用的开放网格服务框架参考工具来自 g l o b u s 项目的g l o b u st o o l k i t 。g l o b u st o o l k i t 是一种供网格应用的j a v a 主机 框架结构,它提供了使网格应用可在框架内注册其服务,维护其状态,及与 其它应用通讯的一个环境。 科学数据网格是在中国科学院科学数据库海量数据资源的基础上,利用 先进的数据网格技术、连接分布在全国的四十多个研究所而建设的一个面向 大规模分布式异构数据资源的共享平台和应用环境。该项目采用自行研发的 网格中间件,解决了大规模、分布式、异构科学数据的统一访问问题,提高 了共享的效率和数据的利用率。 在以上介绍的几个项目中,0 g s a d a i 的研究开展比较深入,它是在网 格领域中研究数据库集成方面的代表作。o g s a d a i 包含了一系列的组件, 用于查询、转换和传输数据,此外,还提供了一个简单的开发客户端应用软件 的工具。它具有很好的可扩展性,用户可以根据需求,在提供的扩展点上增 加新的功能。 1 3 论文的主要研究内容 本文以异构数据库为研究对象,从数据提供者和使用者的角度出发,分 析设计了基于网格的数据库集成系统。使数据提供者能方便地将数据库资源 发布出去使用,同时使数据使用者也能够方便透明地访问分布式异构数据库 资源。具体包括以下主要内容: ( 1 ) 介绍了基于网格的数据库集成的相关技术,如x m l 、网格技术及 网格开发工具包g l o b u st o o l k i t ,重点研究了网格数据访问与集成中间件 o g s a d a i ,分析了目前的o g s a d a i 中间件的不足。 ( 2 ) 通过对数据库集成需求的分析给出了基于网格的数据库集成系统的 结构。使用缓冲池的技术对在o g s a d a i 下数据库的连接进行了改进并研究 了将数据库加入到网格中的方法,使用户能方便地将数据库资源封装为网格 服务发布出来。 ( 3 ) 给出了集成系统关键问题的解决方案,实现了在网格环境下单库查 询、元数据获取、异构数据库集成,并在异构数据库集成基础上提出了多数 据库查询的模型。 6 哈尔滨t 程大学硕十学伊论文 i ( 4 ) 在局域网内搭建环境对数据库集成系统进行测试,以验证所研究的 基于网格的异构数据库集成的可行性和正确性。 1 4 论文的组织结构 本文共分五章,组织结构如下: 第1 章介绍本文的研究背景和意义、国内外研究现状、本文主要研究内 容和组织结构。 第2 章介绍基于网格的数据库集成相关技术,包括x m l 技术、w e b 服 务、网格技术、g l o b u st o o l k i t 4 0 和网格数据访问与集成中间件o g s a d a i 。 第3 章在结合以上各种相关技术和对o g s a d a i 的深入研究与分析的基 础上提出网格环境下异构数据库集成的体系结构,并说明了它的特点及系统 的工作流程。 第4 章对系统关键问题进行研究并提出了解决方案,对底层数据库的连 接进行了改进,提出了将数据库能方便发布出来的方法,并通过网格服务来 实现如单库查询、元数据获取、x m l 数据库和关系数据库间、关系数据库间 集成,并在此基础上提出了多数据库查询的模型。 第5 章介绍网格环境的搭建方法,在实验室局域网内对基于网格的数据 库集成系统进行测试,展现了演示界面及结果。 结论对本文所做的工作进行了总结,并对下一步的工作进行了展望。 7 哈尔滨i :稗大学硕十学位论文 第2 章数据库集成相关技术 本章主要介绍在网格环境下进行数据库集成所涉及到的相关技术,包括 x m l 技术、w e b 服务、网格技术、网格工具包g l o b u st o o l k i t 4 0 和网格数据 访问与集成中间件o g s a d a i 。 2 1x m l 技术 2 1 1x m l 技术简介 x m l ( e x t e n s i b l em a r k u pl a n g u a g e - - 可扩展标记语言) 【1 l 】近来逐渐成为 i n t e m e t 上数据表示和数据交换的新标准,它迅速地被应用于电子商务等领域 ( 如电子数据交换e d i ) 。x m l 的基本思想是:用标记表示数据的意义,而 不是像h t m l 仅仅用来规定数据的显示方式。x m l 将内容和形式相分离具 有很大的意义,那些将数据以x m l 格式编码的w e b 服务和应用程序可以迅 速地以一种简单有效的格式提供这些数据信息,这些w e b 服务和应用程序之 间也可以很容易地进行交互,并且可以通过可扩展的样式表语言x s l ( e x t e n s i b l es t y l e s h e e tl a n g u a g e ) 【1 2 1 等对同一数据内容提供多种数据表示形 式。x m l 突破了h t m l 固定标记集合的约束,用户可以根据需要定义新的 标记来描述文档中的数据元素。 2 1 2x m l 的优势 1 异构系统间的数据交流 x m l 极好地解决了因为平台、数据库和软件的差异造成信息交流困难的 问题,它可以作为交流媒介方便异构系统间的信息交流。x m l 格式简单易读, 对于各种文本、图形等资料都能标注,并可通过安装解析器来解读其他系统 传来的信息,然后加以利用。x m l 实现了跨平台的信息交互,起到了理想的 中介缓冲作用。x m l 作为一种应用广泛的网络语言,方便了各式各样网络工 具间的信息交流。 8 哈尔滨t 秤大学硕十学伊论文 2 更精确的搜索 数据可被x m l 唯一的标识,并且用户可自行设计中意的标签,搜索引 擎能依据标签和内容之间的依存关系,快速、准确地定位、检索和读取数据 信息。它改变了h t m l 中搜索时完全依赖关键字和词的方法进行数据检索。 3 不同来源数据的集成 x m l 能够使不同来源的结构化的数据很容易的结合在一起。软件代理商 可以在中间层的服务器上对从后端数据库和其他应用处来的数据进行集成。 然后,数据就能被发送到客户或其他服务器做进一步的集合、处理和分发。 4 本地计算和处理 x m l 格式的数据发送给客户后,客户可以用应用软件解析数据并对数据 进行编辑和处理。除了显示数据,客户还可以使用不同的方法对数据进行处 理。 5 数据的多样显示 由于x m l 定义的数据显示与内容是分开的,因此数据允许指定不同的 显示方式,使数据更合理地表现出来。通过以简单开放扩展的方式描述结果 化的数据,x m l 在继承h t m l 优势的同时,弥补了h t m l 的不足。h t m l 描述数据的外观,而x m l 描述数据本身。本地的数据能够以客户配置、使 用者选择或其他标准决定的方式动态地表现出来【1 3 】。 2 1 3x m l 数据库 x m l 数据库是一个x m l 文档的集合,这些文档是持久的并且是可操作 的。目前x m l 数据库主要有两种类型: ( 1 ) x m le n a b l e dd a t a b a s e ( x e d b ) ,即能处理x m l 的数据库。其特 点是在原有的数据库系统上扩充对x m l 数据的处理功能,使之能适应x m l 数据存储和查询的需要。一般的做法是在数据库系统上增j j i x m l 映射层,这 可以由数据库供应商提供,也可以由第三方厂商提供。映射层管理x m l 数据 的存储和检索,但原始的x m l 元数据可能会丢失,而且数据检索的结果不能 保证是原始的x m l 形式。x e d b 的基本存储单位与具体的实现紧密相关。 ( 2 ) n a t i v ex m ld a t a b a s e ( n x i ) ) 0 4 ,即纯x m l 数据库。其特点是以 自然的方式处理x m l 数据,以x m l 文档作为基本的逻辑存储单位,针对x m l 9 哈尔滨t 稗大学硕十学伊论文 的数据存储和查询特点专门设计适用的数据模型和处理方法。在本系统中用 到的x m l 数据库是n x d 型数据库。 2 2w e b 服务 w e b 服务是网格服务的基础,理解w e b 服务的架构是开发网格应用程序 的基础【1 5 】。一个w e b 服务就是一个可以被u r i 识别的软件应用,它的接口 和绑定可以被x m l 描述和发现,并且可以通过基于i n t e r n e t 的协议直接支持 与其他基于x m l 消息的软件应用的交互。这就意味着所有客户机都可以使 用i n t e m e t 进行远程过程调用操作。虽然w e b 服务很大程度上依赖现有的 w e b 技术,比如h t t p ,但这里谈到的w e b 服务同w e b 浏览器和h t m l 没 有关系一网站是为网络用户服务的,而w e b 服务是为软件服务的。 w e b 服务的体系结构不管在一个w e b 服务交互过程中底层使用的什么 技术,它所采用的基本的角色都遵循通用模式。在底层,一个服务消费者希 望从服务提供者那里得到服务。如果服务消费者己经知道了一个合适的服务 提供者,它会直接与这个服务提供者联系并且把自己绑定到提供的服务接口 上。但是,通常情况下,并不是消费者来确定一个合适的提供者满足它的要 求。而是服务提供者向第三方发布一个提供的服务的描述,这个第三方是一 个服务中介。消费者只需要确定这些第三方中介之一来发现是否有任何服务 提供者发布了适合它要求的服务描述既可。w e b 服务的角色及操作如图2 1 所示。 图2 1w e b b 艮务的角色及操作 w e b 服务与网格有关的两个比较重要的协议标准是简单对象访问协议 ( s i m p l eo b j e c ta c c e s sp r o t o c o l ,s o a p ) 1 6 1 、w e b 服务描述语言( w e bs e r v i c e 1 0 哈尔滨t 程大学硕十学何论文 d e s c r i p t i o nl a n g u a g e ,w s d l ) 17 j 。 s o a p 是万维网联盟定义国际互联网上消息交换和传输格式的标准协 议。规范的三个主要部分是信封、编码规则和远程过程调用。s o a p 是x m l 编码的一种字符序列消息,整个消息有一个必需的s o a p 信封,信封内有一 个可以省略的s o a p 消息头和一个必需的s o a p 消息体。s o a p 信封、s o a p 消息头和s o a p 消息体分别用e n v e l o p e 、h e a d e r 、b o d y 元素标记。h e a d e r 主要用于向s o a p 消息中添加一些信息,如果不省略,它就必须出现在b o d y 元素之前。s o a p 消息的b o d y 是不可以省略的,里面包含了真正的消息内容 或s o a p 消息远程过程调用。 s o a p 信封定义消息中的内容、处理消息的方法,以及定义的这些方法 是必需的还是可以选择的。s o a p 信封定义了一个整体的s o a p 消息表示框 架,用于表示消息中的内容是什么,是谁发的,谁应当接收并处理它,以及 这些处理操作是否是必需的,等等。s o a p 信封是任何s o a p 消息都必需的, 并且必须作为s o a p 消息中第一个元素出现,它除了包含消息头和消息体元 素之外,还可以有一些属性。 s o a p 编码规则向用户提供一种用于交换应用程序定义的数据类型的机 制。s o a p 编码规则定义数据的编码机制,通过它定义应用程序中需要使用 的数据类型,并可用于交换由这些应用程序定义的数据类型所衍生的实例。 信封和编码规则被定义在不同的x m l 命名空间中,这样有利于通过模块化 获得定义和实现的简明性。 w s d l 是万维网联盟用来描述万维网服务接口的一种描述语言。它用 x m l 语言形式来描述,定义了一系列的标记,力图做到描述的服务接口独立 于具体的实现平台,在任何平台下都可以调用。 w s d l 把万维网服务定义为端点的集合,服务由不同的端点组成。端点 由网络地址和一个绑定组成。绑定定义了客户端连接该端口时所使用的具体 传输和编码协议,比如是通过h t t p 协议绑定连接到s o a p 服务器还是通过 s m t p 绑定到邮件服务器。通常情况下,网络地址和绑定协议与其他有关服 务的抽象信息相互独立。w s d l 有一个根元素,使用类型、消息、端口类型、 绑定和服务等元素来定义万维网服务。 w e b 服务的缺点包括【1 8 】:( 1 ) 过大的压力。x m l 中的数据没有定义好 哈尔滨下程大学硕十学伊论文 的二进制的代码效率高。在赢得通用性的同时降低了效率。( 2 ) 用途狭窄。 不像c o r b a 提供给开发者很多像持续服务、通知、生命周期管理这样的服 务。 网格服务可以在包含w e b 服务所有优点的基础上弥补他的不足,这也正 是网格技术兴起的原因。 2 3 网格技术 2 3 1 网格的概念 从广义上讲,网格【1 9 。2 1 】就是一个集成的计算与资源环境,或者说是一个 计算资源池。网格能够充分吸纳各种计算机资源,并将它们转化为一种随处 可得的、可靠的、标准的同时还是经济的计算能力。除了各种类型的计算机, 这里的计算机资源还包括网络通信能力、数据资料、仪器设备甚至是人等各 种相关资源。 从狭义的角度讲,网格被称为计算网格,主要用于解决科学与计算问题 的网格,它的资源指的仅是计算机资源。 但是,关于网格至今还没有一个普遍接受的定义,网格概念的分歧和争 议仍然存在。但不管是狭义还是广义的网格,其目的不外乎是要利用互联网 把分散在不同地理位置的电脑组织成一台“虚拟的超级计算机”,实现计算 资源、存储资源、数据资源、信息资源、软件资源、存储资源、通信资源、 知识资源、专家资源等的全面共享。其中每一台参与的计算机就是一个节点, 就像摆放在围棋棋盘上的棋子一样,而棋盘上纵横交错的线条对应于现实世 界的网络,所以整个系统就叫做“网格”了。 2 3 2 网格技术的优点 网格作为一种新出现的重要基础设施,其优点主要表现在【2 2 j : 1 更强大的数据处理能力 随着应用规模的不断扩大,待解决的问题越来越复杂,局部的计算能力 和资源无法满足许多用户的需求。网格则打破了计算能力大小和使用资源时 对地理位置的限制,它利用网络上所有的计算资源、存储资源和数据资源, 1 2 哈尔滨t 程人学硕十学位论文 为人类提供自订所未有的计算能力。在这种计算能力的支持下,人们叮以做许 多以前无法想象和无法完成的工作。 2 更灵活的集成 企业用户经常遇到的难题是“集成。采用网格服务是一种有效、低成 本的实现方法,这种方法也能很好地解决异地存储数据的集成难题,从而实 现按需服务。网格以服务为单位进行集成,体现了强大的灵活性。网格服务 采用x m l 、s o a p 、w s d l 和u d d i 等开放标准,它不倾向于任何编程语言、 编程模型以及系统软件,不关心底层如何实现,只需要实现一组共用的接口, 就能够为消费者使用【2 3 1 。这使得异构、跨平台的集成变得非常的容易,这是 以往的分布式系统所不能做到的。 3 更广泛的共享与协作 网格以虚拟组织( v i r t u a lo r g a n i z a t i o n ,v o ) 来实现共享。在网格中解决问题 的基本方式是建立动态的、多机构的虚拟组织,利用虚拟组织内的资源共享 协同地解决问题。网格打破了传统的共享或协作方面的限制,以前对资源的 共享往往停留在数据文件传输的层次,而网格资源的共享允许对其他的资源 进行直接的控制。共享资源的各方在协作时可以以多种方式更广泛地交流信 息,充分利用网格提供的各种功能,并可以根据需要,动态地给不同组织与 个人建立各种级别的工作关系。通过建立虚拟组织,可以调配本组织内所有 的资源,达到更深层次的协作共享。 2 3 3 开放网格服务体系结构o g s a 网格体系结构是关于如何构建网格的技术,包括对网格基本组成部分和 各部分功能的定义和描述、网格各部分相互关系与集成方法的规定、网格有 效运行机制的刻画。显然,网格体系结构是网格的骨架和灵魂,是网格最核 心的技术,只有建立合理的网格体系结构,才能够设计和建造好网格,才能 够使网格有效地发挥作用。 目前网格体系结构的设计研究已有了一定的发展水平,其中,五层沙漏 结构和开放网格服务体系结构( o p e ng r i ds e r v i c e sa r c h i t e c t u r e ,o g s a ) 1 2 4 2 5 】 是最重要最具代表性的两种结构。五层沙漏结构以协议为中心,而o g s a 以 服务为中心。前者强调被共享的物理资源,而后者将资源抽象为服务,从而 哈尔滨t 程大学硕十学伊论文 更加有利于灵活的、一致的、动念的共享机制的实现。 为了使服务的思想更加明确和具体,o g s a 定义了“网格服务”的概念。 网格服务是一种w e bs e r v i c e ,虽然w e bs e r v i c e 提供一种基于服务的框架结 构,但是,w e bs e r v i c e 面对的一般都是永久服务,而在网格应用环境中,大 量的是临时性的短暂服务,所以o g s a 结合w e bs e r v i c e 提出了网格服务, 用于解决服务的发现、动态服务的创建、服务生命周期的管理等与临时服务 有关的问题。 在o g s a 中,所有一切请求和操作都可以看作是服务,因此网格就可以 看作是可扩展的网格服务的集合,即可以表示为网格= 网格服务 。网格服务 可以以不同的方式聚集起来满足虚拟组织的需要,虚拟组织自身也可以部分 地根据它们操作和共享的服务来定义。 简单地定义如下:网格服务= 接口行为+ 服务数据。 o g s a 的架构【2 6 j 如图2 2 所示。 ( 1 ) 物理资源和逻辑资源层。资源的概念是o g s a 以及通常意义上的 网格计算的中心部分。构成网格能力的资源并不仅限于处理器。物理资源包 括服务器、存储器和网络。物理资源之上是逻辑资源,它们通过虚拟化和聚 合物理层的资源来提供额外的功能。通用的中间件,比如文件系统、数据库 管理员目录和工作流管理人员,在物理网格之上提供这些抽象服务。 图2 2o g s a 的架构 1 4 哈尔滨下秆人学硕十学伊论文 ( 2 ) w e b 服务以及定义蚓格服务的外放网格服务基础架构( o p e ng r i d s e r v i c e si n f r a s t r u c t u r e 。o g s i ) 【2 7 】层。这旱有一条重要的o g s a 原则:所有网 格资源( 逻辑的与物理的) 都被建模为服务。o g s i 规范定义了网格服务并建 立在标准w e b 服务技术之上。o g s i 禾u 用诸如x m l 与w s d l 这样的w e b 服务机 制,为所有网格资源指定标准的接口、行为与交互。不仅如此,o g s i 还进一 步扩展了w e b 服务层定义,提供了动态的、有状态的和可管理的w e b 服务的 能力,这在对网格资源进行建模时都是必需的。 ( 3 ) 基于o g s a 架构的网格服务层。全球网格论坛目前正在致力于在诸 如程序执行、数据服务和核心服务等领域中定义基于网格架构的服务。随着 这些新架构的服务开始出现,o g s a 将变成更加有用的面向服务的架构。 ( 4 ) 网格应用程序层。随着时间的推移,一组丰富的基于网格架构的服 务不断被开发出来,使用一个或多个基于网格架构的服务的新网格应用程序 亦将出现。这些应用程序构成了o g s a 架构的第四个主要的层。 在o g s a 的结构中,o g s a 的两个主要逻辑组件是w e b 服务加上o g s i 层和基于o g s a 架构的服务层。o g s a 的主要贡献之处在于【2 驯: 由于网格环境中所有的组件都是虚拟的,所以通过提供一组相对统一的 核心接口,所有的网格服务都基于这些接口实现,就可以很容易地构造出具 有层次结构的高级别的服务,这些服务可以跨越不同的抽象层次,以一种统 一的方式来看待。同时,虚拟化也使得将多个逻辑资源实例映射到相同的物 理资源上成为可能,在对服务进行组合时不必考虑具体的实现,可以以底层 资源组成为基础,在虚拟组织中进行资源管理。通过网格服务的虚拟化,可 以将通用的服务语义和行为,无缝地映射到本地平台的基础设施之上。 2 4g l o b u st o o l k i t4 0 2 4 1 从o g s i 到w s r f 在最初,o g s i 是作为o g s a 核心规范提出的,o g s i 规范定义了下列内容: 如何命名和引用网格服务实例;常见的网格服务接口和行为有哪些;如何指 定其它接口、行为及其扩展。基于o g s i 的w e b 服务有两项核心的需求描k g 一个是描述接口继承的能力,这是大多数分布式对象系统的核- 1 5 概念;另一 哈尔滨丁程大学硕十学伊论文 个是利用接l 定义描述其它信息元素的能力,即服务数据。服务数据的声明 是一种通过己知模式公开表达服务的可用状态信息的机制。但o g s i 通过封装 资源的状态,将具有状态的资源建模为w e b 服务,这种做法引起了“w e b 服 务没有状态和实例 的争议,同时某些w e b 服务的实现不能满足网格服务的 动态创建和销毁的需求。另外,由于o g s i 过分强调网格服务和w e b 服务的差 别,导致了两者之间不能更好地融合在一起。上述原因促使了o g s i 被w e b 服 务资源框架( w e bs e r v i c er e s o u r c ef r a m e w o r k ,w s r f ) 2 9 】所替代。 w s r f 采用了与网格服务完全不同的定义:资源是有状态的,服务是无 状态的。为了充分兼容现有的w e b 服务,w s r f 使用w s d l1 1 定义o g s i 中的 各项能力,避免对扩展工具的要求,原有的网格服务已经演变成了w e b 服务 和资源文档两部分。w s r f 推出的目的在于,定义出一个通用且开放的架构, 利用w e b 服务对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年红杉资本尽职调查标准化实践
- 2026年店长如何管控门店库存与损耗
- 2026年八段锦标准教学分解动作与呼吸配合
- 2026年奢侈品O2O线上线下融合的私享与预约服务
- 股东股权结构协议2026版
- 能源管理2026年能源交易市场合作协议
- 互联网线上数据标注兼职2026审计合规协议
- 2026年护理技术岗新员工入职培训手册
- 玩具行业数据共享协议
- 2026年销售团队新老更替过渡期业绩保障措施
- 2026重庆北碚区静观镇招聘在村挂职本土人才8人考试参考题库及答案解析
- 2025年神农架林区公安局招聘辅警真题
- 24J113-1 内隔墙-轻质条板(一)
- 特种设备安全管理2026版
- 小学音乐中多元文化音乐元素的融合与创新教学课题报告教学研究课题报告
- 心脏再同步化治疗的精准医疗策略
- “十五五规划纲要”解读:托育服务解育儿忧
- 涉融资性贸易案件审判白皮书(2020-2024)-上海二中院
- 专题11 环境与发展(讲义全国适用)(原卷版)
- 纵隔神经源性肿瘤影像表现
- (2026年)成人术后口渴症状评估与管理的专家共识课件
评论
0/150
提交评论