




已阅读5页,还剩63页未读, 继续免费阅读
(计算机软件与理论专业论文)基于ogsadai的异构数据源集成研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研 究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人 或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集 体,均已在文中以明确方式标明。本声明的法律责任由本人承担。 学位论文作者:楠舌力 日期:秒o 年歹月以日 学位论文使用授权声明 本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。 根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部 门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本、人授权郑州 大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、 缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学 位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑 州大学。保密论文在解密后应遵守此规定。 学位论文作者:砧汤、勘日期:z 年箩月“日 摘要 摘要 信息技术的发展使得数据信息爆炸式的增长,然而由于这些数据的异构性 等特点导致了大量的信息孤岛。现实要求人们必须对异构数据源实行有效的集 成,以便进行更好的数据共享和数据处理。网格技术是近年来兴起的网络技术, 目标是将地理上分布的、系统上异构的多种资源通过高速网络连接起来,进行 资源的分布共享。因此,用网格技术来解决异构数据源集成成为一个重要的研 究课题。 本文首先介绍了异构数据集成的相关理论和技术,包括网格技术、x m l 技 术、w e bs e r v i c e 技术,重点对网格环境下实现异构数据集成中间件o g s a d a i 的体系结构以及资源、服务等进行了研究,并且研究了为弥补o g s a d a i 中间 件局限性开发的o g s a d q p 中间件。然后基于o g s a 。d a i 中间件以及 o g s a d q p ,设计了一个异构数据源中间件系统,并利用模式映射原理,提出 了一种从全局模式查询语句转换为针对各局部数据源且能被o g s a d q p 所执行 的查询语句的方法,实现了对多数据源的集中统一访问。最后将设计思想应用 于某实际的党员服务管理信息系统中,扩展其党员信息查询模块功能,集成来 自多个社区异构的党员信息数据库,使得用户能够实现跨区的信息查询,为其 屏蔽了各数据源的平台、系统环境、结构等方面的异构性,给用户提供了一个 统一、透明的访问界面。 关键词:异构数据;o g s a d a i ;o g s a d q p ;网格;集成 a b s t r a c t a b s t r a c t d e v e l o p m e n to fi n f o r m a t i o nt e c h n o l o g ym a k e st h ee x p l o s i v eg r o w t ho fd a t a ,b u t t h eh e t e r o g e n e i t yo ft h e s ed a t al e a d st oal o to fs i n g l ei n f o r m a t i o n i s l a n d r e a l i t y r e q u i r e sp e o p l et oi m e g r a t eh e t e r o g e n e o u sd a t as o u r c ee f f e c t i v l yf o r b e t t e rd a t a s h a r i n ga n dd a t ap r o c e s s i n g g r i di sar e c e n t l yd e v e l o p e dt e c h n o l o g y ,i t sg o a li s t o l i n kd i s t r i b u t e da n dh e t e r o g e n e o u sr e s o u r c e st o g e t h e rb yh i g hs p e e dn e t w o r ka n d o f f e rr e s o u r c es h a r i n g t h e r e f o r e , u s i n g 酣dt e c h n o l o g yt oa d d r e s st h ei n t e g r a t i o no f h e t e r o g e n e o u sd a t as o u r c e sh a sb e c o m e a l li m p o r a n tr e s e a r c ht o p i c t h i sp a p e rf i r s ti n t r o d u c e sr e l a t e dt h e o r ya n dt e c h n o l o g i e so fh e t e r o g e n e o u sd a t a i n t e g r a t i o n ,i n c l u d i n g 咖d ,x m lt e c h n o l o g i e s ,w e b s e r v i c et e c h n o l o g y ,w i t h e m p h a s i so nt h er e s e a r c ho fa r c h i t e c t u r e ,r e s o u r c e sa n ds e r v i c e so fo g s a d a i m i d d l e w a r ew h i c hi su s e dt oi n t e g r a t eh e t e r o g e n e o u sd a t ai n 鲥de n v i r o n m e n t ,a n d s t u d i e so g s a d q pm i d d l e w a r ew h i c hi su s e dt oc o m p e n s a t ef o rl i m i t a t i o n so f o g s a 。d a i a n dt h e nd e s i g n sam i d d l e w a r es y s t e m sb a s e do no g s a - d a ia n d o g s a - d q p ,g i v e san e wm e t h o dt oc o n v e r tg l o b a lq u e r yi n t ol o c a lq u e r yw h i c hc a n b ee x e c u t e db yo g s a - d q pu s i n gm o d e lm a p p i n gt h e o r y , a c h i e v e sc e n t r a l i z e da n d u n i f o r m e da c c e s st om u l t i p l ed a t as o u r c e s f i n a l l y ,u s e st h ed e s i g ni d e ai n t oap a r t y s e r v i c em a n a g e m e n ti n f o r m a t i o ns y s t e m ,e x p a n d si t sf u n c t i o no fp a r t y m e m b e r i n f o r m a t i o nq u e r ym o d e l ,i n t e g r a t e d sd a t as o u r c e sf r o mm u l t i p l ea r e a s ,e n a b l i n gu s e r s t oa c h i e v ec r o s s a r e a si n f o r m a t i o n q u e r y i n g ,s h i e l d i n g i t s h e t e r o g e n e i t y o f p l a t f o r m ,s y s t e me n v i r o n m e n ta n ds t r u c t u r ea n dp r o v i d i n gau n i f i e da n dt r a n s p a r e n t a c c e s si n t e r f a c e k e yw o r d s :h e t e r o g e n e o u sd m a ;o g s a - d a i ;o g s a d q p ;鲥d ;i n t e g r a t e i i 8 9 一l o 一1 1 一1 1 目录 2 3w e bs e r v i c e 1 :; 2 3 1w e bs e r v i c e 的体系结构1 4 2 3 2w e bs e r v i c e 的调用过程15 2 4网格环境下数据库访问与集成o g s a d a i 15 2 4 1 o g s a - d a i 架构。16 2 4 2 o g s a d a i 资源。1 7 2 4 3o g s a d a i 部件l8 2 4 4 o g s a - d q p 1 9 2 5 模式映射方法2 4 2 6 小结2 5 3o g s a d m 访问异构数据源机制2 7 l 3 1o g s a d a i 环境搭建2 7 3 2 注册数据源2 8 3 - 3 数据源访问机制3 0 3 4 小结3 7 4 异构数据集成中间件系统设计与实现3 8 4 1中间件系统体系结构3 8 4 2 模式映射4 1 4 3 模式映射冲突4 4 4 4 s q l 查询语句解析4 7 4 5 系统查询流程5 0 4 6 系统实现5l 4 6 1 注册数据资源5 2 4 6 2 集中查询5 3 4 7 小结5 4 i v 目录 5 总结与展望5 5 5 1 总结5 5 5 2 展望5 5 参考文献5 7 致谢6 0 个人简历、在学期间发表的学术论文与研究成果6 1 个人简历6 1 参研项目6 1 v 图目录 图目录 图1 1 数据仓库法体系结构一2 图1 2 联邦数据库体系结构3 图1 3 中间件方式体系结构4 图2 1 五层沙漏模型9 图2 2o g s a 架构1 0 图2 3w e bs e r v i c e 体系结构示意图1 4 图2 4w e b 服务调用过程15 图2 5o g s a d a i 体系结构1 6 图2 6o g s a d a i 结构图1 9 图2 7 异构数据库映射- 2 0 图2 8p e o p l e 表2 1 图2 9p o s t c o d e r e g i o n t y p e 表2 1 图2 1 0 映射后的p e o p l e 表一2 2 图2 1 1 映射后的p o s t c o d e r e g i o n t y p e 表2 2 图2 12 新数据库表p e o p l e 2 3 图2 1 3d q p 工作流程图一2 4 图3 1o g s a d a i 浏览器访问界面2 8 图4 1 郑州市金水区党员服务管理系统功能模块图3 8 图4 2 系统架构图4 0 图4 3 集成中间件系统框架4 0 图4 4 模式映射图4 1 图4 5 模式映射4 3 图4 6 查询流程图5 0 图4 7 党员项目层次结构图5 2 图4 8 注册数据源5 2 图4 9 表映射查看5 3 图4 10 集成查询界面5 4 v i 1 绪论 1 绪论 1 1 研究背景 当前越来越多的企事业单位使用计算机应用系统实现其信息管理,但由于 各个企业采用不同的应用环境和体系结构来存储数据,所以导致了大量异构数 据的存在,从而形成一个个巨大的信息孤岛,企业内部以及企业与企业之间无 法有效实现存储数据的共享,使得资源得不到最大利用。 企事业如何通过有效方式来利用这些大量的异构数据资源,对来自不同地 方,不同格式的数据资源进行有效的集成访问,从而实现异构数据资源的共享 变得越来越必要。因此对异构数据集成技术的研究尤为重要。 实现对异构数据资源的集成访问,就是屏蔽多个异构资源的不同,使得用 户不必考虑各个异构数据源结构、运行环境不同等因素,给他们提供统一的视 图和访问方式,实现数据无缝集成。 异构数据库的异构性主要体现在以下几个方面【1 1 : 1 计算机体系结构的异构。各个参与的数据库可以分别运行在大型机、小型 机、工作站、p c 机或嵌入式系统中。 2 操作系统的异构。各个数据库系统运行的操作系统可以是u n i x 、w i n d o w s 、 l i n u x 等。 3 存储模式的异构。一般的存储模式包括关系模式、对象模式、对象关系 模式和x m l 文档树型模式等几种,其中关系模式为主流存储模式。需要注意的 是,即便是同一类存储模式,他们的模式结构可能也存在差异。例如o r a c l e 所 采用的数据类型与s q l s e r v e r 所采用的数据类型并不是完全一致的。 1 2 异构数据源集成技术 当前异构数据集成所采用的技术常见的有三种2 1 ,数据仓库、联邦数据库和 中间件技术。本文将其总结为两类,一类是数据仓库法,另一类是虚拟视图法。 1 绪论 1 2 1 数据仓库法 数据仓库法【3 1 通过周期性的集中原有局部数据源的数据到一个统一数据仓 库系统实现数据收集,并对移植到统一数据仓库系统的数据进行集中查询。数 据仓库提供的统一接口可方便用户对历史数据进行查询访问,来实现决策支持。 数据仓库法的系统结构如图1 1 所示。 图i 1 数据仓库法体系结构 数据仓库法的优点是:处理简单,查询效率高,可以给用户提供简单快速 的数据访问,能够保证查询性能的高效和快速。 数据仓库法的缺点是:实施的周期长,工作量大,因为需要各个局部数据 源的数据转移到数据仓库中进行额外存储,导致数据重复存储,并且针对各个 局部数据源的更新数据不能及时的反应到查询结果中。 1 2 2 虚拟视图法 在虚拟视图法中,数据仍存储在各个局部数据源中,用户查询时,它对用 户屏蔽了底层数据源的差异、特质和实现,使用户不必了解数据的结构特点和 位置等信息,而通过构造一个或多个“中间模式实现统一查询。 利用虚拟视图法来集成不同的局部数据源主要有两种体系结构:联邦数据 库系统和中间件方式系统。 1 联邦数据库系统 2 l绪论 联邦数据库系统【4 5 】是由“联邦者”( f e d e r a t o r ) 和“被联邦者 ( f e d e r a t e e ) 组成。“联邦者 通过执行全局查询来访问“被联邦者 ,而“被联邦者 在 本地进行数据库查询操作。最终使每个局部数据库操作彼此之间都是独立的, 从而实现数据库系统间的数据共享。联邦数据库系统实现互操作最常用的方法 是将每个数据库模式分别和其他数据库模式进行映射,这样在联邦中需要建立 n 幸( n 1 ) 个模式映射规则,当参与联邦的数据库很多时,建立映射规则的任务变 得不可行了。联邦数据库结构如图1 2 所示。 图1 2 联邦数据库体系结构 联邦数据库的优点是:各数据源之间相互独立,一个数据源可以访问其他 数据源的信息,能够实时快捷的对异构数据源进行查询,可扩展性和开放性强。 联邦数据库的缺点是:它仅仅支持关系数据源的集成,而对于半结构化和 无结构化数据源并不适用,并且只适合局部数据源较少的情况。 2 中间件方式 中间件方式【销】也即m e d i a t o r w r a p p e r 方法,该方法给用户提供一个全局视 图,用户的查询是基于全局视图进行的,而数据源仍然是保存在各局部数据源 中。m e d i a t o r 将用户针对全局模式的查询转换为针对各局部数据源的查询,包装 器负责把接收到的子查询转换为针对局部数据源的实际查询,各局部查询结果 返回后由m e d i a t o r 对查询结构进行汇总封装后返回给用户。用户无需知道各局 部数据源的地理位置,运行环境,结构等信息。m e d i a t o r w r a p p e r 的结构如图1 3 所示。 3 l 绪论 中间件方式的优点是:局部数据源不必是数据库,也可以是半结构化的x m l 数据或无结构的文件系统等。数据源是完全自治的,可以非常方便的添加或者 删除数据源。 中间件方式的缺点是:由于需要进行查询的分解以及查询结果的合并等步 骤,查询效率不高。 图1 3 中间件方式体系结构 1 3 国内外研究现状 近三十年来,国内外研究学者对异构数据集成进行了大量的研究,提出了 许多异构数据集成体系结构和技术方案。 o i d ( o r a c l ei n t e m e td i r e c t o r y ) 【9 】是o r a c l e 公司推出的异构数据库解决方案, 目前已被集成到o r a c l e1 0 9 a s 中,但缺点是对于非o r a c l e 类型的数据库产品集 成支持较弱。 m i x 1 0 】系统用x m l 作为数据交换和集成的统一模型,用x m ld t d 作为交 换数据的结构化描述,m e d i a t o r 视图基于d t d 结构。它的形式化集成规则基于 树型结构模型表示局部d t d 模式和集成模式,但并未考虑语义模型。 在国内由万常选等人开发的x r e s t o r e 1 1 】中间件系统,支持x m l 文档在 关系数据库中的存储和查询。该系统只针对无模式的x m l 文档进行存储和查询。 网格技术的兴起极大的促进了分布资源的共享,近年来也有许多研究项目 基于网格技术来实现异构数据集成,网格环境中数据存取和集成的主要研究项 4 l 绪论 目是o g s a d a i ,它是由苏格兰e p c c 和英格兰的m mh u r s l e y 合作开发的一 个网格数据集成中间件,o g s a d a i 的目标是为网格环境下的异构数据访问和集 成提供统一的服务接口。它支持的数据源类型包括关系数据库、x m l 数据库以 及文件系统。 网格环境下的数据库研究工作主要是在o g s a d a i 的基础上进行展开的,例 如:o g s a d q p t l 2 。1 5 1 基于o g s a d a i 提供面向并行处理的分布式查询处理机制; o g s a w e b d b 1 6 】基于o g s a d a i 提供访问与集成w e b 数据库能力;m y g r i d t l 7 】 是英国es c i e n c e 核心项目的代表,它为生命科学研究提供了一套中间件软件, 该中间件基于o g s a d a i 开发组开发的o g s a d q p 来实现数据库的访问和集 成;g d i s 1 8 】采用o g s a d q p 、o g s a d a i 和g l o b u s t o o l k i t 中间件,并且基于 服务框架实现x m l 数据集成。 1 4 研究内容和组织结构 本文研究了分布、异构数据库系统的集成方法和网格技术,对各种方法进 行对比分析,使用x m l 技术、w e bs e r v i c e 、o g s a d a i 中间件以及o g s a d q p , 通过模式映射、s q l 语句分解等方法实现针对多个异构数据库的透明性访问。 本文的组织结构如下: 第一章绪论部分 描述本文的研究背景、研究意义,并介绍了异构数据源集成通常所采用 的方法以及针对这一领域的国内外研究现状。 第二章相关技术 描述了网格数据库集成涉及的相关技术,包括:网格技术,x m l 技术, w e bs e r v i c e 技术,o g s a d a i 中间件以及o g s a d q p 。 第三章o g s a d a i 访问异构数据源机制 实现o g s a d a i 环境的搭建,异构数据源注册以及对o g s a d a i 中间 件的访问机制。 第四章异构数据集成中间件系统设计及实现 设计异构数据集成中间件框架结构,提出全局虚拟数据库模式和局部数 据库模式映射方法以及映射冲突的解决办法,提出了对针对全局模式的查询 语句到局部模式的转换算法。然后基于某实际的党员服务管理信息系统扩展 5 的无缝集成查询,屏蔽各局部数 一的查询方式。 2 网格数据库相关技术 2 网格数据库相关技术 在网格环境下,实现分布、异构数据库资源集成依赖很多技术的支持,包 括网格技术、x m l 、w e bs e r v i c e 以及网格环境下异构数据集成中间件o g s a d a i 等,本章针对这些技术分别进行介绍。 2 1 网格 2 1 1 网格定义 网格【1 9 加】的概念来自电力网格,它的最终目的是希望用户在使用网格计算能 力的时候,就像使用电力一样,只需插上插头,不需要关心它是从哪个发电站 输送来的,也不需要关心电力是核发电、火力发电还是水力发电,我们使用的 都是一种统一形式的“电能”。即,网格希望为最终用户提供与地理位置无关 的、与具体计算设施无关的、通用的计算能力。 美国心g o 衄e 国家实验室的资深科学家、全球网格研究的领军人物、 g l o b u s 项目的领导人i a n f o s t e r 教授曾在19 9 8 年出版的“t h e g r i d :b l u e p r i n tf o ra n e w c o m p u t i n gl n 仔a s t 九l c 眦”一书中这样描述网格:“网格是构筑在互联网上的 一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程 设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性 【2 l 】。2 0 0 1 年,i a nf o s t e r 、t u e c k e 和c a r lk e s s e l m a n 将网格重新定义为:“协作 资源共享,在动态多机构的虚拟结构中解决问题,【2 1 】。到2 0 0 2 年7 月,i a nf o s t e r 在什么是网格? 判断是否网格的三个标准【2 l 】一文中,从三个方面更加清晰 地定义了网格,他认为网格是一个满足如下三个条件的系统: 1 在非集中控制的环境中使用资源:网格能够集成和协调资源与用户在不同 的控制域内活动。 2 使用标准的、开放的、通用的协议和接口:网格是由多种用户协议和接口 来构建的,这些协议都是基于标准的、开放的,解决诸如鉴别、授权等一些基 本问题。 7 2 网格数据库相关技术 3 提供非常的服务质量:网格允许按协作的方式来使用网格虚拟组织的组成 资源,提供满足用户需求的服务能力。 2 1 2 网格的特点 1 分布性 网格中的资源包括计算资源、存储资源、数据资源、仪器资源等,他们分 布在不同的地方,网格的目的就是要使其中的任何资源都可以让网格上的使用 者使用,网格在逻辑上又是共享这些资源的。 2 异构性 组成网格的资源是异构的,首先资源类型不同,包括计算资源,存储资源 和其他资源,每种资源差异也很大,例如对于计算资源,有不同类型的计算机, 不同的计算接口,不同的系统架构。 3 自治性 网格上的资源首先是属于某一个人或者组织,资源的拥有者具有最高级别 的管理权限,网格允许资源拥有者对其资源有自主的管理能力,同时,这些资 源根据一定的约束和规则接受网格的统一管理,实现资源的共享,这使得网格 管理比一般的分布式系统更为复杂,具有管理的多重性。 4 动态性 由于网格中的资源具有自治性,所以必然存在网格资源的动态加入、退出 或者出现故障,因此,网格本身的设计就是要具有很好的扩展性。 5 自相似性 网格的整体和局部之间存在一定的相似性,整体的特性在局部有一定的体 现,局部在许多地方也具有整体的某些特征,网格的构建是基于一个个小的局 部网格,因此其构成方式具有相似性。 2 1 3网格的体系结构 到目前为止,流行的网格体系结构有三个2 0 2 2 】:第一个是i a n f o s t e r 等人在 早些时候提出的五层沙漏结构( f i v e l e v e ls a n d g l a s sa r c h i t e c t u r e ) ;第二个是 i a n f o s t e r 等人在五层沙漏结构的基础上,结合w e bs e r v i c e 技术提出的o g s a ( o p e ng r i ds e r v i c e sa r c h i t e c t u r e ,开放网格服务体系结构) ;第三个是由 8 2 网格数据库相关技术 g l o b u s 联盟、i b m 和h p 于2 0 0 4 年初共同提出的w s r f ( w e bs e r v i c er e s o u r c e f r a m e w o r k ,w e b 服务资源框架) 。 2 1 3 1 五层沙漏结构 五层沙漏结构的重要思想是以“协议”为中心,强调服务与a p i 和s d k 的 重要性,其特点简单,采用层次式的体系结构,分为五个层次:构造层、连接 层、资源层、汇聚层和应用层,如图2 1 所示。这个结构十分类似于网络协议中 的t c p i p 层次体系结构。 五层沙漏结构 t c p i p 图2 1 五层沙漏模型 1 构造层( f a b r i c ) :该层基本功能就是控制局部的资源,向上提供访问这些资 源的接口,这些资源可以是计算资源、存储资源、数据库、网络资源和传感器 等。 2 连接层( c o n n e c t i v i t y ) :该层基本功能是实现通信,它定义了网格的网络处理 需要的核心通信和认证协议,用于网格的网络事务处理。 3 资源层( r e s o u r c e ) :该层主要功能就是实现对单个资源的共享,它建立在连 接层的通信和认证协议基础之上,为独立资源上共享操作的安全启动、监督和 控制定义了协议。 4 汇聚层( c o l l e c t i v e ) :该层主要是用来协调多种资源的共享,汇聚层协议与服 务描述的是资源的共性,包括目录服务,数据复制服务等,他们说明了不同资 源集合之间是如何相互作用的,但不涉及资源的具体特征。 9 器一 2 网格数据库相关技术 5 应用层( a p p l i c a t i o n ) :该层是在虚拟组织环境中存在的,在体系结构中的每 一层都定义相应的协议,以提供对相关服务的访问,包括资源管理、数据存取、 资源发现等,在每一层a p i 用来实现特定活动服务的交换协议。 2 1 3 2o g s a 开放网格服务体系结构( o g s a ) 是一种以“服务”为中心的体系结构,在 o g s a 框架中一切都可抽象为服务,包括各种计算资源,网络,存储资源,数据 库等,这样有利于通过统一的标准接口来管理和使用网格。它包括两大关键技 术:网格技术( 如g l o b u s 软件包) 和w e bs e r v i c e 技术,它解决了两个重要问 题:标准服务接口的定义和协议的识别。 o g s a 为了使“服务 的思想更加明确、具体,定义了网格服务的概念。网 格服务也是一种w e bs e r v i c e ,它提供了一组接口来解决服务发现、动态服务创 建、l 生命周期管理等问题,可以说网格就是网格服务的集合。网格服务可以以 不同的方式聚集起来满足虚拟组织的需要,根据这种特点,网格服务可以表示 为网格服务= 接d 行为+ 服务数据。o g s a 架构如图2 2 所示。 0 6 s a 体系结构的服务( o g s aa r c h i t e c t u r a ls e r v i c e s ) 囤国圈囤 图2 2o g s a 架构 1 0 2 网格数据库相关技术 2 1 3 3w e b 服务资源框架w s r f w s r f 采用了与网格服务完全不同的定义:资源是有状态的,服务是无状态 的。为了充分兼容现有的w e b 服务,w s r f 使用w s d l1 1 定义o g s i 中的各 项能力,从而避免对扩展工具的要求,原有的网格服务演变成为w e b 服务和资 源文档两部分。 在w s r f 架构中,w e b 服务和有状态资源是分开的,共同构成网格服务。 本质上,w s r f 是一组w e b 服务规范,定义了w e b 服务资源的表现形式。 w s r f 通过使用不同的结构来模型化状态资源和相应的w e b 服务,而o g s i 通过采用单一的结构来模型化状态资源。w s r f 允许w e b 服务和任何相关联的 有状态资源之间形成多对多的映射,因此,w s r f 比o g s i 更具有表达力。 与o g s a 的最初核心规范o g s i 相比,w s r f 具有五个方面优势,具体如 下: 1 融入w e b 服务标准,并且全面地扩展了现有的x m l 标准,在目前的开发 环境下,实现更加简单。 2 w s r f 对消息处理器和状态资源实行分离,从而明确了它的目标是:允许 w e b 服务操作对状态资源进行管理和操纵。 3 w s r f 定义了更为通用的w s r e s o u r c ef a c t o r y 模式。 4 w s r f 规范从广义角度理解通知机制,状态改变通知机制正是建立在常规 的w e b 服务需求之上。 5 o g s i 规范的规模非常庞大,使得读者不能充分理解其内容,以及明确具 体任务中所需的组件。在w s r f 中通过将功能进行分离,简化并拓展了组合的 伸缩性。 w s r f 的提出加速了网格和w e b 服务技术的融合,但是由于其提出不久, 其规范还有待于进一步证明,并逐步得到完善。 2 2x m l 可扩展置标语言( e x t e n s i b l em a r k u pl a n g u a g e ,简称x m l ) 2 3 1 于19 9 8 年定 义发布为w 3 c ( w o r l dw i d ew e bc o n s o r t i u m ) 的标准( x m l l o ) 。它是一套规则 严谨且使用规则简单的描述性文本语言,它使用文本格式来表示文本结构以及 2 网格数据库相关技术 数据类型。开发者可以很方便的利用它定制针对自己不同应用环境的标记元素, 因此x m l 被广泛用来作为跨平台之间交互数据的规范形式。 x m l 有如下几个特点: 1 自描述性 x m l 是以文本形式来描述的一种文件。使用标记元素来描述数据,由于标 记可以多重嵌套和引用,因而适于表示层状和树状数据集合。x m l 是面向内容 的,标记元素中隐含着语义信息,它可以方便表示结构化和自描述性的数据。 2 面向对象 x m l 的文件是有属性的树状结构,这符合面向对象的编程应用,而且更体 现出面向对象方式的存储和使用。 3 内容和形式分离 x m l 有丰富的是显示样式,数据定义、显示语言c s s 、x s l t 、x s l 以 及f o 等这些方法能够生成丰富的样式,编写外观完美的页面。而x m l 标记层 次只是来表示数据内容,所以只改变数据样式表单就可以修改文本显示方式, 而x m l 数据内容可以保持不变。 4 具有验证机制 程序员可以自己定义x m l 标记,但是需要验证标的记定义和使用是否符合 规范。x m l 有两种验证方法。一种是d t d ,它是专门用来定义和检验x m l 文 档的标记。另一种是x m ls c h e m a ,利用x m l 语法描述。它比d t d 有更多的 优点,多个s c h e m a 可以复合使用一个x m l 名称空间,这样就可以详细定义元 素的内容和属性值的结构和类型。 5 选择性更新 通过x m l ,数据可以实现局部更新。如果修改一部分数据,则不需要重发 所有的数据,修改过的数据不需要刷新整个页面就能显示更新。x m l 对于新加 入的信息,能够动态流入现存页面,不需要浏览器重发整个新页面。 2 2 1x m l 模式 x m l 模式是用来描述x m l 结构和约束因素的语言,目前主要有两种模式: x m ld t d 和x m ls c h e m a 。它们都属于语法模式,以某种格式来表示,但是 x m ls c h e m a 的格式与x m ld t d 相比有着非常明显的优势。x m ls c h e m a 的一 个最显著的特征,就是它对数据类型的支持的多样化。x m ld t d 只提供十种内 1 2 2 网格数据库相关技术 置( b u i l t i n ) 数据类型,而x m ls c h e m a 则内置了三十七种数据类型,并具有 更大的灵活性。所以w 3 c 于2 0 0 1 年正式以x m ls c h e m a 作为x m l 的标准模式。 2 2 2 x m l 查询语言 x q u e r y 是用来查询x m l 文本内容的w 3 c 标准,x q u e r y 相对于x m l 的 关系,就像s q l 相对于数据库表的关系,它可以操作基于x m l 和非基于x m l 的数据。不管是本地存储的x m l 数据还是由关系数据构建而来的x m l 视图, 它都有高效的查询方法。甚至相对于关系数据库而言,x q u e r y 更容易使用,而 且可以大大减少使用x m l 服务所需要的代码量。 x p a t h 是一门在x m l 文档中查找信息的语言,基于x m l 的树状结构。通 过路径表达式,它可以对x m l 文档中的节点集进行导航。x p a t h 和x s l t , x q u e r y 等共享函数库提供了多种函数调用,而且,也可以自定义需要的函数, 它的返回值可能是节点,节点集合或原子值等。x q u e r y 和x p o i n t e r 均构建于 x p a t h 表达式之上,所以,它是学习很多高级语言的前提和基础。 2 3w e bs e n 殖c e w e bs e r v i c e 2 4 , 2 5 实际上是一组工具,并有多种不同的方法调用之,是构建 不同体系结构中不同形式应用程序的普遍模型。实现w e bs e r v i c e 的三种最普遍 手段是:远程过程调用( r p c ) ,面向服务架构( s o a ) 以及表象化状态转变 ( r e s t ) 。它向外界提供了一个可通过w e b 调用的a p i 。把调用w e bs e r v i c e 的 应用程序叫做客户。它以x m l 、x s d 等平台独立的语言为基础,实现了跨平台 的可互操作性和分布式应用。 w e bs e r v i c e 可以实现跨防火墙的通信,把传统应用中的中间层换成w e b s e r v i c e ,可以使用不同s o a p 客户端,最后再与应用程序连接起来,完成与客 户端的数据传输,实现应用程序的可重用性和跨平台使用,而分布式对象模型 ( c o r b a 和d c o m ) 不能做到这些。这也是w e bs e r v i c e 重要的一点,它不仅可 以重用代码,而且可以重用代码背后的数据。它通过标准的w e b 协议提供服务, 通过s o a p 、u d d i 、w s d l 和h t t p 等协议,将网络间孤立的系统连接起来, 形成分布式的网络系统,这样就可以达到充分利用网络资源,提高网络传输效 率的目的。 1 3 2 网格数据库相关技术 2 3 1w 曲s e r v i c e 的体系结构 w e bs e r v i c e 体系结构基于服务提供者、服务注册中心和服务请求者以及他 们之间的交互操作,如图2 3 所示。交互包括发布、查找和绑定等规范操作,这 些角色和规范操作使得w e bs e r v i c e 能与其他兼容组件进行互操作。其中,服务 提供者( s e r v i c ep r o v i d e r ) :发布服务,并对要求使用本服务的请求做出响应; 服务注册中心:( s e r v i c eb r o k e r ) :注册已发布服务的提供者,并有搜索功能; 服务请求者( s e r v i c er e q u e s t e r ) :对所需服务进行搜索,并使用该服务。 图2 3w e bs e r v i c e 体系结构示意图 w e bs e r v i c e 中几个比较重要的协议标准是s o a p ( s i m p l eo b j e c ta c c e s s p r o t o c 0 1 ) 、w s d l ( w e bs e r v i c ed e s c r i p t i o nl a n g u a g e ) 和u d d i ( u n i v e r s a l d e s c r i p t i o n ,d i s c o v e r ya n di n t e g r a t i o n ) 2 6 】。 s o a p :它是用于交换x m l 编码信息的轻量级协议,可以在任何其它传输协 议上传输数据。服务请求者通过s o a p 协议获得w e b 服务,消息传递采用x m l 文本格式。 w s d l :它是一种描述w e b 服务的标准x m l 格式,它定义了w e b 服务交互 中的接口和结构规范,用于描述w e bs e r v i c e 及其参数和返回值。 u d d i 它是一个跨产业、跨平台的开放性架构,可以帮助w e b 服务提供商 在i n t e m e t 上发布w e b 服务信息。 w e bs e r v i c e 中三种角色和三种协议之间的交互过程为:首先,服务提供者 用w s d l 描述所要提供的服务,再用u d d i 在服务注册中心处注册这些服务。 接着,若服务注册中心接收到请求者的服务请求,就使用u d d i 在服务注册中 心进行搜索查询。最后,请求者获得所需服务,完成服务过程。 1 4 2网格数据库相关技术 2 - 3 2w e b s e r v i c e 的调用过程 w e bs e r v i c e 可以用任何语言构建起来,再通过h t t p ,利用s o a pt o o l k i t 等内建支持把服务暴露给用户,使用者查阅w e bs e r v i c e 的描述语言后,c l i e n t 端和s e r v e r 端分别产生c l i e n ts t u b 和s e r v e rs t u b ,用户端c l i e n ts t u b 再通过w s d l 文档,生成一个s o a p 请求服务信息,请求被嵌入h t t pp o s t 中发送到w e b 服 务器中,s e r v e rs t u b 完成解析s o a p 请求,最终实现w e bs e r v i c e 的调用。 假设已经通过u d d i 搜索到需要的w e bs e r v i c e 。根据w s d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农牧局岗位专业试题及答案
- 糖果收纳盒教学课件中班
- 空中黔课教学课件下载
- 新员工文员转正工作总结
- 人工浇筑水渠施工方案
- 证券从业资格考试通州及答案解析
- 儿科诊所营利方案范本
- 太阳能管路保温施工方案
- 定制非标过滤器施工方案
- 罗源县杀虫灭虫施工方案
- 新产品可行性评估表
- 小学综合实践活动成长手册三年级上册第2课《传统游戏》教案
- 《电气CAD》(汪玲娟)625-5教案 第3课 AutoCAD2020操作界面与绘图环境
- 绿色建筑和绿色建筑材料
- 《七堂保险金信托课》读书笔记思维导图
- Jade6操作和应用优秀课件
- 渐开线花键强度校核(完整计算)
- 沥青砼下面层试验段施工方案
- FZ/T 60029-2021毛毯脱毛测试方法
- 常用塑料性能及其注塑工艺培训资料
- 医院科研课题申报伦理审查申请及审批表
评论
0/150
提交评论