已阅读5页,还剩58页未读, 继续免费阅读
(计算机应用技术专业论文)基于ogsa的数据库网格查询系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 目前,科学计算领域和商业应用领域中的数据呈爆炸式增长,实现对海量 异构数据的统一访问和管理已经成为越来越迫切的需求。而随着网格技术的日益 发展,在网格环境下如何访问已有的数据库,如何提供一个访问不同数据资源的 统一接口,并且在这个基础上将已有的数据库动态地组成一个虚拟数据库完成一 个特定的任务,是一个非常值得研究的问题。 本文结合相关的x m l 技术和网格技术,分析了利用网格对异构数据库进行 集成的优势,研究了基于网格的对异构数据库进行访问的数据库网格查询系统的 设计和实现。在研究o g s a d a i 的构架和内部流程的基础上,设计并实现了用 户自定义的元数据管理服务( m d s ) 和分布式查询处理服务( d q p ) ,通过这两 个模块的交互实现了对异构数据库的分布式查询。 m d s 模块实现对元数据的定义和管理。m d s 模块根据网格的特点对元数据 进行了定义,建立服务缓冲区以提高服务发现的效率,分析了如何从g d s f 提供 的服务数据元素中抽取数据库服务元数据。d q p 模块在与m d s 模块交互的基础 上实现对异构数据库的查询。d q p 模块对用户的查询主要通过命令分析、查询 任务分解和查询执行三个子模块实现,详细介绍了查询请求的内部表示与算法实 现,给出了查询任务分解的一般过程,分析了查询执行子模块在实现过程中细节。 最后,基于以上模型,构建原型系统并进行测试,测试结果表明系统的设计合理, 达到了设计要求。 关键词:网格,数据库网格,元数据服务,数据库查询 a b s t r a c t n o wd a t ao fs c i e n t i f i cc o m p u t i n ga n dc o m m e r c i a la p p l i c a t i o nf i e l d si si n c r e a s i n g a ta l la m a z i n gs p e e d t h en e e do fa c c e s s i n ga n d m a n a g i n gt h e s ec o m p l i c a t e da n dg r a t d a t ai nau n i f o r mw a yb e c o m e sm o r ea n dm o r ei m p e n d i n g w i t ht h ed e v e l o p m e n to f g r i dt e c h n o l o g y , h o wt oa c c e s st h ee x i s t e dd a t a b a s e s ,p r o v i d eau n i f o r mi n t e r f a c et o a c c e s st h ed a t a b a s e s ,a n dc o m p o s et h ee x i s t e dd a t a b a s e st om a k eav i r t u a ld a t a b a s ei s ai s s u et h a tw o r t ht os t u d y i nt h i sp a p e r , w es t u d yo nx m l t e c h n o l o g ya n dg r i dt e c h n o l o g y , a n a l y s et h e a d v a n t a g eo fi n t e g r a t i o no ft h ei s o m e r o u sd a t a b a s e sb yt h e 西dt h e c h n o l o g ya n dw o r k o v e rt h ep l a na n di m p l e n e m to ft h ed a t a b a s e 酣dq u e r ys y s t e mt oa c c e s si s o m e r o u s d a t a b a s e s o nt h eb a s eo fr e s e a r c ha n da n a l y s i so ft h ea r c h i t e c t u r ea n di n n e r i m p l e m e n t a r yp r o c e s so fo g s a d a i ,w ea d v a n c et w om o d u l e st h a ta r ed e f i n e db y u s e ro w n t h et w om o d u l e sa r em e t a d a t as e r v i c em l d u l ea n dd i s t r i b u t e dq u e r y p r o c e s s i n g s e r v i c em o d u l e b yt h ei n t e r c o m m u n i o no ft h et w om o d u l e s ,w e i m p l e m e n tt oq u e r yt h ei s o m e r o u sd a t a b a s e sd i s t r i b u t e d l y m d sm o d u l ed e f i n e st h em e t ad a t aa n di st om a n a g et h em e t ad a t a i td e f i n e s m e t ad a t ao nt h ec h a r a c t e r i s t i c so ft h eg r i d ,c o n s t i t u t e ss e r v i c eb u f f e rt oi m p r o v et h e e f f i c i e n c yi nf i n d i n gs e r v i c e s ,a n da n a l y s i s e so nh o w t oe x t r a c tt h ed a t a b a s es e r v i c e m e t a d a t af r o ms e r v i c ed a t ap r o v i d e d eb yg d s ew i t ht h ei n t e r c o m m u n i o no fm d s m o d u l e ,d q pm o d u l ei m p l e m e n tt oq u e r yo ni s o m e r o u sd a t a b a s e s b yd e s i g nt h r e e s u b m o d u l e so fq u e r ya n a l y s i s ,d e c o m p o s eo f q u e r yt a s k ,a n dp e r f o r m m i o no ft h e s u b t a s k ,w ei m p l e m e n tt h eu s e r sq u e r y i ta n a l y s e so nh o wt oe x p r e s sa n do p t i m i z e t h eq u e r yf r o mu s e r s ,h o wt od e c o m p o s et h eq u e r yt a s k ,a n dh o wt oi m p l e m e n tt h e m o d u l eo fq u e r yp e r f o r m a t i o n a tl a s t ,b a s e do nt h em o d e l ,t h i s p a p e rs e tu pt h e p r o t o t y p es y s t e ma n dt e s ti t t h er e s u l to ft h et e s ts h o w st h a tt h ed e s i g no ft h e p r o t o t y p ei sf e a s i b l e ,a n dr e a c h e st h er e q u i r eo ft h ed e s i g n k e y w o r d s :g r i d ,d a t a b a s eg r i d ,m e t a d a t as e r v i c e ,q u e r yo nd a t a b a s e 学位论文独创性声明: 本人所呈交的学位论文是我个人在导师指导下进行的研究工作及 取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的 同事对本研究所做的任何贡献均已在论文中作了明确的说明并表示 了谢意。如有不实,本人负全部责任。 论文作者( 签名l j 盈二j 哗 加缉多月易目 学位论文使用授权说明: 河海大学、中国科学技术信息研究所、国家图书馆、中国学术期 刊( 光盘版) 电子杂志社有权保留本人所送交学位论文的复印件或电子 文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档 的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许 论文被查阅和借阅。论文全部或部分内容的公布( 包括刊登) 授权河海 大学研究生院办理。 论文储( 签名) 上山户l 加6 年6 月伽 河海大学硕士学位论文 基于o g s a 的数据库网格查询系统的研究与实现 1 1 选题背景 第一章绪论 1 1 1 数据库与数据管理问题 海量数据的产生和分布是互联网发展的必然结果,而大规模数据资源的开发 式共享和协同管理则是网络时代所产生的必然需求。特别是对于科学数据,如远 程教育、医药、气象、生物等,这种需求已经比较迫切。n 1 概括起来,现有的海 量科学数据应用存在以下的问题: 数据孤岛:由于大部分科学数据都由不同部门、研究组织或大学独立开发, 缺乏统一的整合和集成方式,因此形成了一个个彼此间分离的信息孤岛; 缺乏规范和标准:大部分科学数据的建设都没有相应的国际或国家标准做 指导,造成科学数据的深度异质异构; 海量大规模:科学数据不断增长,现有的数据管理平台无法支持大数据量 的有效管理。乜3 这些问题严重地阻碍了科学数据的有效共享,因此如何应用现代信息技术, 动态整合与集成这些科学数据资源,实现开放、动态、松耦合网络环境下的多层 次、分布式数据、信息与知识的共享是急需解决的课题。 数据库是目前一种主流的数据存储媒体和管理平台,现有分散在互联网上的 数据库集合了丰富的信息资源,在这些数据库信息资源基础上,通过有效的数据 整合,可以开发出大量领域相关的科研应用和商业应用。口t 们这也正是异构数据 库集成的意义所在。 异构数据库是一个既与各种数据库有密切联系,又有别于各种数据库的新的 领域,它的目标是对地理上分布的多个异质数据库,在尽可能少地影响本地自治 的基础上,构造具有用户需要的透明性的全局数据库,以支持对各种数据库的全 局应用和各异质数据库之间的信息交换和共享。瞄1 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 1 1 2 网格与异构数据库集成 当前,最常用的具体的数据集成方式一般有三种:联邦数据库( f e d e r a t e d d a t a b a s e ) 、数据仓库( d a t aw a r e h o u s e ) 以及中介( m e d i a t i o n ) 。 ( 1 ) 联邦数据库系统( f e d e r a t e dd a t a b a s es y s t e m ,f d b s ) 是由参与联邦的半 自治的数据库系统组成,联邦中的每个数据库的操作是独立于其他数据库和联邦 的,之所以叫“半自治”是因为联邦中的所有数据库都添加了彼此访问的接口。 哺1 f d b s 中实现互操作最常用的方法是将每个数据库模式分别和其他所有数据库 模式进行映射,这样联邦中需要建立n 木( n 一1 ) 个模式映射规则,但当参与联邦的 数据库很多时,n 值很大,建立映射规则的任务变得不可行了。所以,联邦数据 库集成系统适合于自治数据库的数量比较小的情况,而面对网络上越来越丰富的 数据源,f d b s 显然不是一个很好的解决方案。 ( 2 ) 数据仓库就是把来自于几个数据源的数据副本都存储在单一的数据库 中。在这种结构中,所有的数据源的数据都被抽取出来,合成一个全局模式,并 存储在数据仓库中,这在用户看来和一般的数据库系统无异。缺点是需要定期更 新,无法实时反映各个数据源的数据变换,而且为了避免数据仓库与数据源中的 数据出现不一致,通常不允许用户对数据仓库进行更新。订1 ( 3 ) 中介则是一种软件结构,支持虚拟视图或视图集合。它不存储任何实 际数据,作用是在用户提交了一个查询后,将用户查询翻译成一个或多个对数据 源的查询。然后将数据源的查询结果进行综合处理,汇总并将之返回给用户。用 户的查询基于中间模式,不必知道每个专门的数据源的特点,查询执行引擎直接 与包装器( w r a p p e r ) 打交道,将基于中间模式的查询转换为基于各个局部数据源 的模式。中间系统模式更适应于数据源数目多、各局部数据源的自治性很高且局 部数据经常变化的w e b 环境。而且x m l 的出现使得对各种数据信息的标准化描 述成为可能,使系统更易于适应的间的不同。隅3 数据库网格是以数据库为最主要资源的数据网格环境。研究的主要内容是如 何把分布异构的数据库有效地集成到网格环境中,使其能够共享数据库的数据和 能力,并在此基础上为用户提供更高层次,更强功能的服务。 2 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 数据库网格采用中间系统模式来对异构数据库进行集成,并采用x m l 来对 各种数据信息进行标准化描述。1 数据库网格所面对的是i n t e m e t 上大量的分布 式异构数据库,且数据源更新频繁,因此采用中间系统模式来对数据库进行集成 不仅可以避免联邦数据系统对联邦中数据库数量的限制,也可以避免数据仓库中 无法对数据进行实时查询的缺点。虽然中介系统模式要以一定的性能为代价,因 为每次查询都要连接数据源,可能出现响应延时,但可以运用元数据管理和缓存 的方法来解决。 利用网格来实现数据集成的优势还在于:网格提供了一个平台,这个平台支 持系统化的身份鉴别和授权、资源发现、数据传输、进程创建和调度及跨异构平 台的动态绑定。n 町在网格提供的这些功能的基础上,可以更方便地构造一个安全 可靠的高性能的数据库网格管理系统。而且网格所提供的这个平台还在不断的发 展和优化中,不断和新的、更好的技术相融合。如x m l 技术、w e bs e r v i c e 技术 等,从而保证了构建在其上的数据库网格查询系统能够不断地发展。 1 1 3 数据库网格的研究内容和现状 数据库网格是对现有数据库的网格化,基于开放网格服务体系结构提供网格 数据库服务,使网格用户或其他网格服务可通过数据库网格服务访问网格中的各 种异构数据库,从而达到数据资源的高度共享和协同处理,对数据资源的访问更 加透明、高效、可靠,网格数据处理的能力更强,以满足虚拟组织的数据处理需 求。1 数据库网格的研究现在主要集中在以下几方面: ( 1 ) 数据库的存取与集成。全球网格论坛( g g f ,g l o b a lg r i df o r u m ) 的 主要目标是建立网格的技术标准,由七个领域组成,每个领域又分为若干个工作 组和研究组。d a i s 工作组( d a t a b a s ea c c e s sa n di n t e g r a t i o ns e r v i c e sw o r k i n g g r o u p ) 隶属于g g f 的数据领域,其主要研究内容是如何将数据库运用到网格中。 d a i s 工作组正在制定数据库网格服务的标准,该标准的草案可以从g g f 的网站 上下载。n 2 1o g s a d a i ( o p e n g r i ds e r v i c e sa r c h i t e c t u r e d a t aa c c e s sa n d i n t e g r a t i o n ) 项目的目标是构造一个中间件,用于网格环境中对数据的存取和集 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 成,是d a i s 工作组制定的数据库网格服务标准草案的一个参考。 ( 2 ) 分布式查询处理。网格是分布式系统,需要做分布式查询。p o l a r 项目 研究网格环境下分布式查询,试图根据网格本身的特点实现高性能的分布式查询 处理。p o l a r 项目的研究者认为,网格环境下分布式查询处理最大的特点是自适应 性,它必须能充分利用并行计算能力和网格资源动态演化的特性。n 3 1 ( 3 ) 数据流处理。数据流应用最近被广泛研究。这类应用中的部分或全部 数据并非事先存储在磁盘或者内存中,而是以多个连续数据流的形式不断到达。 d q u o b ( d y n a m i cq u e r yo b j e c t s ) 项目基于关系数据库来管理数据流,其特点是, 采用了基于网格的体系结构,将数据流变成网格上的一种资源;其目标是满足在 科学计算可视化、性能监控和大规模传感器应用中数据流管理的需要。n 4 1 ( 4 ) 信息检索。主要研究如何搜索非结构化的数据( 如文本文档) 以返回 用户查询结果,如因特网搜索引擎,它和数据库技术的结合是近年来数据库领域 的研究热点。已经有项目在研究如何融合信息检索技术和网格技术。如g r i d l r 工作组( g r i di n f o r m a t i o nr e t e i e v a lw o r k i n gg r o u p ) 隶属于g g f 的信息系统和性 能领域,其主要研究内容是制定一个网格环境下分布式信息检索的标准。n 5 3 ( 5 ) 科学数据分析。c h i m e r a 是虚拟数据管理系统,可以生成虚拟数据并 追溯数据的来源。g r i d d b 比c h i m e r a 更进一步,它在现有的过程为中心的网格 服务上增加了对科学数据分析的重要服务。n 6 1 目前国内外对数据库网格的研究和开发还处于起步阶段,英国e s c i e n c e 核 心项目o g s a d a i 是数据库网格研究领域的代表作,o g s a d a i 是一种数据访 问和集成的中间件平台,它主要实现了对多种数据库的服务化访问,使得数据库 能够用网格服务的形式对外共享数据。此外,a v a k i 是支持各种关系数据库和 文件系统的数据网格产品,它可以使人们把分布的数据源作为一个单独的数据 池,以简化企业的数据供应、数据访问和数据集成的过程。它通过在上层为用户 提供数据库连接与数据的逻辑视图的映射关系来方便用户的访问,没有采用服务 的形式。1 在国内,对数据库网格的研究也有一些探索,例如浙江大学吴朝辉教授领导 的d a r t g r i d 项目,是针对中医药应用建立的数据库网格环境。d a r t g r i d 首先实现 了数据库的服务化访问接口,根据应用特点定义了语义标准并在该语义标准的基 4 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 础上建立了全局的数据模式和实现了统一数据操作语言,提供分布式查询的能 力。该项目的主要研究工作集中在语义层。理想的数据库网格环境是要能够同时 容纳各种应用的,因此该项目属于数据库网格一个实例性的探索。n 砌此外,人民 大学王珊教授领导开发的g d b i r 也属于一种数据库网格环境,与d a r t g r i d 类似, 它面向单个应用,其研究重点在数据搜索功能的建立上。 1 2 本文的主要研究内容 由于数据库网格访问与集成中间件o g s a d a i 是一个新的项目,还在不断 的研究和发展中,有不少地方需要改进和完善。本文研究的重点是在o g s a d a i 基础之上,构建用户自定义的网格服务,包括元数据管理服务m d s 和分布式查 询处理服务d q p ,在o g s a d a i 基础上构建网格数据库查询系统,实现对底层 异构数据的分布式查询。 本文的主要研究内容包括: ( 1 ) 研究和分析o g s a d a i 内部架构和运行流程,结合x m l 技术、网格 技术、数据库技术和分布式查询技术,构建数据库网格查询系统; ( 2 ) 基于o g s a d a i ,在其提供的基本服务的基础上,设计了用户自定义 的服务m d s ( m e t a d a t as e r v i c e ,元数据服务) ,实现对元数据的管理,为分布式 查询模块提供元数据服务。其中主要研究了适应于网格环境的元数据定义,元数 据的抽取,服务缓冲区的设计与服务查找和更新算法。 ( 3 ) 基于o g s a d a i ,设计了用户自定义的服务d q p ( d i s t r u b u t e dq u e r y p r o c e s s ,分布式查询处理) ,在与m d s 服务交互的基础上,实现对异构数据库 的集成和分布式查询。其中主要研究了查询请求的内部表示和优化,给出算法实 现,设计查询分解的算法,分析查询执行子模块的工作方法和实现细节。 1 3 本文的组织结构 本文共分为六个章节,其组织结构如下: 第一章为绪论,介绍了本文的选题背景、研究现状、主要研究内容和组织结 构。 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 第二章介绍了与本文的研究相关的技术,包括x m l 技术、开放网格服务体 系o g s a 、基于o g s l l 0 用于网格应用开发的工具包g l o b u st o o l k i t 、数据库访 问与集成中间件o g s a d a i 。 第三章介绍了数据库网格查询系统构建的总体思想。首先在o g s a d a i 中 间件基础上提出了改进的方法和构建数据库网格查询系统的思路,给出数据库网 格查询系统的总体框架。着重介绍了系统的两个核心服务:元数据服务m d s 模 块和分布式查询处理d q p 模块的构建方法和设计细节。 第四章主要说明了两个核心模块的实现,给出了关键部分所涉及的数据结 构、操作过程、算法实现。 第五章对原型系统进行测试,给出了测试的环境、测试数据、结果输出时的 x s l 样式表、测试内容及演示界面、测试结果分析。 第六章对全文进行了总结,并对下一步的研究工作进行了分析和展望。 6 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 第二章与数据库网格相关的关键技术 2 1x m l 技术 2 1 1x m l 技术简介 帆( e x t e n s i b l em a r k u pl a n g u a g e ) 是一种描述型的标记语言,与h t m l 同 为s g m l ( 标准通用标记语言) 的一种应用。n 钔传统的h t m l 语言具有固定语法和 固定标记集,它简单易学而且通用。但是由于h t m l 功能有限,它不仅无法支持 w e b 上不断涌现的新应用,而且在各浏览器之间也无法实现良好的兼容;另外, h t m l 还缺乏对文档结构信息的描述,链接功能也不够强大。这就在很大程度上 限制了w e b 的进一步发展。l 则是为了克服h t m l 存在的局限性而设计的一种 新型数据描述语言。它实际上是一种用来表达结构化数据的通用语法,是一种允 许用户对自己的标记语言进行定义的元语言( m e t a - l a n g u a g e ) 。 2 1 2x m l 的特点和优势 ( 1 ) x m l 允许用户自定义标签,具有扩展功能。“扩展性”就成为x m l 的一个中心特性。由于h t m l 只是以一套固定的标签( t a g s ) 来描述数据的显示 方式,因而在可扩展性方面具有很大的局限性。x m l 则不同,它允许用户根据 需要定义数量不限的标记来描述文档中的资料,也允许嵌套的信息结构,从而把 用户从浏览器厂商固定标签的束缚中解脱出来。由于煳l 能针对特定的应用来 定义自己的标记语言,这就使得它能够在多种行业的信息交换中一显身手。 ( 2 ) 识别文档中的元素,使搜索具有智能性。由于h t m l 只是描述如何在 页面上布置文字和图形等,而并没有对信息的本身含义进行描述,因此在基于 h t m l 的w e b 中,准确搜索到真正需要的特定信息相当困难。而x m l 由于定义了 各种标识来描述信息中的所有元素,因而它对信息能够进行“自我描述”;而且 7 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 x m l 的资源描述框架( i m f ) 还能提供类似图书分类卡的w e b 数据。因此,x m l 不仅改变了h t m l 僵化的固定标识集,而且改变了传统的信息构造方式,使得互 联网传输在信息检索和获取方面速度更快捷,搜索内容更准确。 ( 3 ) 严格遵循语法要求,具有良好的结构性。h t m l 的语法要求并不严格, 而且具有一定的随意性。x m l 则不同。虽然x m l 的扩展性允许用户创建新标识, 但它对语法有着严格的规定。结构良好的x m l 文档遵从l 语法的一般规则; 而有效的x m l 文档比结构良好的x m l 文档要求更为严格。它除了要满足一般规 贝j j # l - ,还要严格遵守文档类型定义( d t d ) 的规定。“结构良好”这一标准保 证了x m l , 严密的条理性、逻辑性和良好的结构性,并大大提高了处理数据的准 确性和效率。 ( 4 ) 内容和应用分开,具有良好的复用性。h t m l 文档虽然能够包含丰富 的数据,但这些数据只能为相应的浏览器所理解,其他应用程序则无法有效地使 用这些数据。而在x m l 文档中,尽管文档类型定义( d t d ) 描述了文档数据的 结构、语义以及如何组织存放等,但却没有提供一套应用程序接口( a p i ) 来控 制其行为;它并不涉及数据如何被显示和应用,而只是简单地将文档数据解析成 层次型的结构化数据传递给应用程序。因而x m l 数据就可以被不同的应用程序 加以利用。呦1 2 1 3x m l 的核心技术 x m l 主要由三个要素构成:文档类型定义d t d ( 或s c h e m a ) ,可扩展样式表 语言x s l 和可扩展链接语言x l l 。其中,d t d 或s c h e m a 规定了x m l 文档的逻辑结 构,定义了x m l 文档中的元素、元素的属性以及元素和元素之间的属性关系。 x s l 用来控制x m l 文档在显示时的版面风格,x s l 还可以处理多国文字、双字节 的汉字显示等。x l l 是x m l 的链接语言,它与h t m l 的链接相似,但功能更强大, 可以进一步扩展当前已有的简单链接,支持可扩展的链接和多方向的链接等。瞳 ( 1 ) d t d 和s c h e m a d t d 是一套关于标记符的语法规则,它告诉你可以在文档中使用哪些标记 符,它们应该按什么次序出现,哪些标记符可以出现于其它标记符中,哪些标记 8 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 符有属性等等。而言之,d t d 规定了一个语法分析器来解释一个“有效的”x m l 文档所需要知道的所有规则的细节。d t d 可以包括在包含它所描述的文档的文件 中,或者与外部的u r l 相链接,这些外部d t d 可以被不同文档和网站所共享。 d t d 作为x m l 文档的结构起到了很好的描述作用,但是它也有一些缺点, 比如它采用了非x m l 的语法规则、不支持数据类型、扩展性较差等等,s c h e m a 正好解决了这些问题。s c h e m a 禾u 用元素的内容和属性来定义x m l 文档的整体结 构,对d t d 进行了扩充,引入了数据类型、对域名的支持,这样一个x m l 文档 可以有多个s c h e m a 与其对应,而一个x m l 文档只能与一个d t d 对应,从而使其 具备较强的可扩展性。 ( 2 ) x s l 和c s s x m l 描述的是文档的结构和语义,它不描述文档的表现形式。x m l 把内容 和显示格式分开,这样做的好处是可以让不同的用户按照各自希望的格式显示同 一文档的数据内容。为x m l 文档提供格式信息的是样式表( s t y l e s h e e t ) 。适用 于文档的样式表有c s s ( c a s c a d i n gs t y l es h e e t s ,层叠样式表) 和x s l ( e x t e n s i b l e s t y l el a n g u a g e ,可扩展样式语言) 。这些样式表随x m l 文档发送给用户,通过样 式表告诉浏览器如何格式化每个元素,使得不同的用户可以根据自己的需要来定 义数据的表现形式。 ( 3 ) x l i n k 和x p o i n t e l l 中的链接x l l ( e x t e n s i b l el i n kl a n g u a g e ,可扩展链接语言) 包括x l i n k 和x p o i n t e r 。x l i n k 是x m l 的链接语言,定义一文档如何与另一文档相连,而 x p o i n t e r 是x m l 的指针语言,定义文档的各部分如何寻址。x l i n k 指向u r l ,以 指定特定的资源,该u r l 可能包含x p o i n t e r 部分,它主要确认目标资源或文档中 所要寻找的服务。与h t m l 中的链接相比较,x l l 的功能更强大,它是专为x m l 文档设计的,但有些部分也可与h t m l 文档一起使用。2 1 2 2 开放网格服务体系( o g s a ) 网格体系结构描述了网格各组成部分的关系以及它们集成的方式或方法,规 定了支持网格有效运转的方式,给出了网格的基本组成和功能。 9 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 网格发展初期的网格体系结构是i a nf o s t e r 等给出的以协议为中心,强调服 务、强调a p i 和s d k 的五层沙漏结构,侧重于定性的描述而没有给出具体的协议 定义,不能适应现有的技术。近年来,结合网格与w r e b 服务技术,以服务为中心 的开放网格服务体系结构o g s a 作为一个得到了大量业界支持且不断发展的标 准,已经取代了沙漏结构成为网格新的结构体系标准。瞳3 1 o g s a 将网格中大量的异构资源均看作服务,并使用w r e b 服务描述语言( w e b s e r v i c e sd e s c r i p t i o nl a n g u a g e ,w s d l ) 将服务标准化、透明化,使之能以一致的 方式进行交互与运转,解决了网格中最重要的开放性问题。开放网格服务基础结 构( o g s i ) ,完成了将网格软件基础结构标准化的工作,定义了在网格环境中各种 服务间使用的接口和协议的标准,为o g s a 软件组件提供最大的互操作性。堙司 图2 1 为o g s a 的架构:乜5 1 ( 1 ) 物理和逻辑资源层。它是o g s a 架构的最底层,包括网格上可以应用 的物理资源和逻辑资源。物理资源包括服务器、存储器、网络等;逻辑资源是在 物理资源上通过虚拟化和聚合物理层的资源来提供额外的功能,如在物理网格上 提供的文件系统、数据库管理系统等这些抽象的服务都属于逻辑资源。 ( 2 ) w r e b 服务与o g s i 层。在o g s a 中,g r i d 技术与w e b 服务技术相结合,所 有的网络资源( 包括物理的和逻辑的) 都被建模成g r i d 服务,该层就包括了这些 服务。这一层有一个重要的组件- o g s i 规范,该规范提供一套已定义的接口 来解决g r i d j 报务的发现、创建、生命周期管理、通知等问题,并使用x m l 和w s d l 等w 曲服务机制实现了g 耐服务的标准化和透明化。 ( 3 ) 基于o g s a 架构的网格服务层。它包括基于前两层提供的基本构架的 网格服务,这些服务可以根据应用需要使用。目前g g f 正致力于在诸如程序执行、 数据服务等领域定义基于网格架构的服务。随着这些新架构服务的出现,o g s a 的应用将会更加广泛。 ( 4 ) 网格应用程序层。它包括所有使用前一层提供的网格服务的应用程序。 在四层架构中,w - e b 服务与o g s i 层和基于o g s a 架构的网格服务层是构成 o g s a 的主要逻辑组件。w 曲服务与o g s i 层提供了最核心的服务,基于o g s a 架 构的网格服务层则基于o g s i 层提供的核心服务构建直接供网格应用程序调用的 w e b 服务。 1 0 河海大学硕士学位论文 基于o g s a 的数据库网格查询系统的研究与实现 图2 1o g s a 架构 2 3o g s a 体系结构的工具包g l o b u st o o l k i t 2 3 1g t 3 简介 开发网格服务体系结构o g s a 只是一个框架,它不涉及网格服务如何实现等 具体的问题。g g f 组织的开发网格服务基础结构o g s i ( o p e ng r i ds e r v i c e s i n f r a s t r u c t u r e ) 工作组制定了o g s i 标准来实现o g s a 中提出的各种概念。它是一 个正式的技术规格说明书。相对o g s a 来说,o g s i 在技术层面上涉及的要多的多, 也更为正式。 g l o b u s 项目是美 a r g o n n e 家实验室的研发项目。g l o b u s 对信息安全、信 息服务、数据管理以及应用开放环境等网格的关键理论和技术进行了广泛研究, 开发出能在多种平台上运行的网格计算工具包g l o b u st o o k i t 。这个工具包能够帮 助规划和组建大型的网格实验和应用平台,开发适合大型网格系统运行的应用程 序。g l o b u s t o o k i t l 9 9 9 年推出第一版,目前使用较多的是2 0 0 3 年推出的基于o g s a 体系结构并融合了w e bs e r v i c e 技术的3 0 版。瞳6 1 g t 3 是一个基于o g s l l 0 标准而实现的用于开发网格应用的工具包。是t h e g l o b u sa l l i a n c e 提供的开放源码项目,它包含了寻找、发现和管理所需的软件服 河海大学硕士学位论文 基于o g s a 的数据库网格查询系统的研究与实现 务和程序库。目前它是基于j a v a 语言的。 图2 2 网格服务世界中的主要角色 由图2 2 可以看出,o g s a 给网格服务进行了定义。o g s a 定义什么是网格服 务,它能做什么,它是基于什么技术的,但没有给出一个技术性的详细说明,而 这又是实现网格服务所需的。o g s i 是对o g s a 中的概念进行的技术实现说明。 g t 3 是o g s i 的实现。w e b 服务是网格服务的基础,网格服务是对w 曲服务的扩展。 为了有效地支持网格计算环境,g l o b u st o o k i t 针对g l o b u s 项目中的各种协 议,提供了一系列的服务、软件库和编程接口。如图2 3 所示为g t 3 的体系结构。 o g s i 参考实现( o g s i ) 是o g s i 规范1 o n 定义的接口,以a p i 和工具的 形式提供给用户以方便开发和o g s i 兼容的网格服务。安全基础设施( s i ) 提供 s o a p 安全、传输层安全、相互认证、单点登陆服务认证等功能。g t 3 核心还提 供了系统级服务用来作为运行时和其他服务相关联的基础,它们建立在o g s i r i 和0 g s i 。s i 之上。 g t 3 同时还提供了一些基础服务,如程序执行、数据管理和信息服务等。这 些服务是建立在o g s i 和g s i 组件之上的。用户定义服务是指由用户开发的高层服 务,它不由g t 3 提供,可以建立在任何g t 3 的组件之上,包括基础服务。乜刀 所有这些服务是和抽象的o g s i 运行环境相交互的,称为网格服务容器。网 格服务容器把应用和服务运行时的细节分离开来,同时还控制服务的生命期、把 消息分发给对应的服务实例等。 河海大学硕士学位论文基于o g s a 的数据库网格查询系统的研究与实现 2 3 2g t 3 程序设计 图2 3g t 3 体系结构 g t 3 安装在本论文中不再叙述,具体见参考文献。啪1 g t 3 程序设计符合通常的分布式计算编程模型,o 口p r o x y s t u b 模型。它包括 服务端编程和客户端编程两个部分。服务端和客户端是弱耦合的。它们之间的联 系是通过w s d l 服务描述文件来完成的。服务提供者在开发服务时,必须提供相 应服务的w s d l 服务描述文件。在该文件中具体描述了服务的接口、服务的调用 方法以及服务调用同底层通信协议的绑定情况。客户端用户得到w s d l 服务描述 文件后,就可以根据该文件生成服务调用的s t u b ,并通过该s t u b 来完成对服务的 调用。同时,以w s d l 文档为中心,也为上层服务调用与底层通信协议的分离提 供了可能。服务提供者可以提供多种服务调用与底层通信协议绑定的方法。客户 端可以在这些方法中选定一种绑定来完成服务调用。 ( 1 ) 服务端程序设计 服务端程序设计分为五个步骤: 提供一个服务接口; 生成网格服务支持代码( s t u b 文件) ; 实现服务; 河海大学硕士学位论文 基于o g s a 的数据库网格查询系统的研究与实现 创建部署文件; 部署服务。 ( 2 ) 客户端程序设计 在客户端,首先要得到服务的w s d l 描述文件,然后由该w s d l 描述文件得 至l j s t u b ,由于在服务端程序设计中生成的s t u b 也可供客户端使用,可以直接使用 在服务端编程中生成的s t u b 。 2 4o g s a d a i o g s a d a i 即开放网格服务架构数据访问和集成( o p e ng r i ds e r v i c e s a i c h i t e c t u r e d a t aa c c e s sa n di n t e g r a t i o n ) ,它符合基于o g s a 的网格标准,并在 g t 3 上进行开发。支持d b 2 、o r a c l e 、x i n d i c e 、m y s q l 等数据库管理系统。 o g s a d a i 项目致力于建造通过网格访问和集成来自不同的孤立数据源的 中间件。这个项目是由u kd a t a b a s et a s kf o r c e 提出构想,并紧密地和全球网格 论坛数据访问和集成服务工作组( g g fd a i s w g ) 以及g l o b u s 团队一起工作。乜们 总体上,o g s a d a i 与d a i s 相符合,它也努力成为d a i s 网格数据库服务推荐 标准的第一个参考实现。 o g s a d a i 的目标是通过网格为数据访问和集成提供统一的服务接口。通 过o g s a d a i 的接口,不同的、异构的数据源和资源被视为逻辑上的单一资源。 它还允许这些资源在o g s a 的框架内进行集成。o g s a d a i 网格服务提供基本 的操作来完成复杂的操作,比如数据联盟、在虚拟组织进行分布式查询,但是它 隐藏了如数据库驱动、数据格式和从客户端的传输机制等技术细节。 2 4 1o g s a d a i 架构 o g s a d a i 的架构如图2 4 所示。 1 4 河海大学硕士学位论文 基于o g s a 的数据库网格查询系统的研究与实现 客户端 jl jl 客户端a p i vv w e b 服务代理 jl j l 表示层d a i s d a i w s r fo g s i w s i 1r 1r1r1r i 业务逻辑层 数据访问核心( d a i c o r e ) i 数据层 一 1 1r 】 二数据源l 其他资源( 如文件) 图2 4o g s a d a i 架构 o g s a d a i 将整个数据访问功能分成表示层、业务逻辑层和数据层三层。 其中表示层将业务逻辑层提供的功能表示为不同的应用程序框架可以访问的服 务,如基于o g s i 的客户端可以访问的服务、基于w e b 服务资源框架( w s i 强) 的客户端可以访问的w s r f 服务、基于d a i s 的应用程序可以访问的d a i 服务。 表示层和客户端必须对应;表示层不是必需的,非w e b 客户端可以绕开表示层 直接访问业务逻辑层提供的功能。表示层接收客户端提交的执行文档提交给业务 逻辑层,并将业务逻辑层返回的响应文档( x m l 格式) 返回给客户端。 业务逻辑层是o g s a d a i 中间件的处理核心,包括引擎( e n g i n e ) 和活动 ( a c t i v i t y ) 两部分。其中引擎检查表示层传递的执行文档,并将执行文档分解 为活动。在o g s a d a i 中,活动可以分为查询类、表示类以及传输类。其中查询 类活动主要是处理与数据源的交互( 查询和更新数据) ;表示类活动主要是将查 询类活动返回的结果表示为指定的格式或进行压缩处理;传输类活动主要是处理 数据输出,将经过表示类活动处理后的数据发布给第三方。业务逻辑层主要是检 查并处理执行文档并生成响应文档。 数据层处理查询类活动并将结果返回给业务逻辑层。在处理该活动时,从活 动上下文环境中得到用户的身份,将用户身份映射为具体的数据库角色,根
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年科二写教学设计吗
- 2025-2026学年彩旗飘飘美术教案
- 2025-2026学年花儿与少年教学设计数学
- 19.1 确定平面上物体的位置教学设计初中数学冀教版2012八年级下册-冀教版2012
- 小学六年级英语教案 谈论未来计划的表达方式
- 物流企业车辆GPS监控与轨迹管理制度
- 企业资金支付审批流程规范
- 2025-2026学年爱护视力教案中班
- 高中学业水平考试备考与教学工作方案
- 电子制造企业制程质量巡检管控执行方案
- 小升初综合试题及答案
- 2026年湖北省中考英语真题含解析
- GB/T 47720-2026起重机械远程控制系统通用技术规范
- 2026继续教育一级消防工程师试题题(答案附后)
- 2026年全国一卷高考英语读后续写深度解读及范文
- 2026年广东广州市中考一模化学试卷(含答案)
- 2026届漯河市召陵区数学三年级下学期期末统考模拟试题(含答案解析)
- 学法减分考试常考题目题库(80题)
- 贵州省贵阳市 2024-2025学年七年级下学期期末考试英语试卷(含答案)
- 2025年军校模拟面试试题及答案
- NB-T 47013.15-2021 承压设备无损检测 第15部分:相控阵超声检测
评论
0/150
提交评论