(计算机应用技术专业论文)基于中间件技术的设备故障信息集成研究.pdf_第1页
(计算机应用技术专业论文)基于中间件技术的设备故障信息集成研究.pdf_第2页
(计算机应用技术专业论文)基于中间件技术的设备故障信息集成研究.pdf_第3页
(计算机应用技术专业论文)基于中间件技术的设备故障信息集成研究.pdf_第4页
(计算机应用技术专业论文)基于中间件技术的设备故障信息集成研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

r e s e a r c ho fe q u i p m e n tf a i l u r ei n f o r m a t i o n i n t e g r a t i o nb a s e do nm i d d l e w a r et e c h n o l o g y at h e s i ss u b m i t t e df o rt h e d e g r e eo f m a s t e r c a n d i d a t e c h e nl i n s u p e r v i s o r :p r o f c h u a ij i n h u a c h a n g a nu n i v e r s i t y , x i a n ,c h i n a 9 9哪844 m,iiiiim y 论文独创性声明 本人声明:本人所呈交的学位论文是在导师的指导下,独立进行研究工 作所取得的成果。除论文中已经注明引用的内容外,对论文的研究做出重 要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何 未加明确注明的其他个人或集体已经公开发表的成果。 本声明的法律责任由本人承担。 论文作者躲弘、杯 僻年。其j 日 论文知识产权权属声明 本人在导师指导下所完成的论文及相关的职务作品,知识产权归属学 校。学校享有以任何方式发表、复制、公开阅览、借阅以及申请专利等权 利。本人离校后发表或使用学位论文或与该论文直接相关的学术论文或成 果时,署名单位仍然为长安大学。 ( 保密的论文在解密后应遵守此规定) 论文作者签名:硝科 导师签名: 圆 卜- - 。 _ 扣年其f 日 如l0 年6 月7e l 摘要 信息化的高速发展是当今时代的特点,但信息化的差异给企业间甚至是企业内部的 数据共享带来了意想不到的麻烦数据异构。异构数据的集成问题已成为计算机技术 研究的一个重点与热点。本文主要研究企业内部关系型异构数据库的数据集成,其目标 是向用户提供一个统一的数据访问接口,使用户可以透明的访问集成系统内部所有异构 数据库。目前比较成熟的数据集成方法主要有联邦数据库、数据仓库、中间件三种方法。 本文将采用中间件的方法并结合w e bs e r v i c e 技术来实现异构数据的集成。 本文的主要研究内容包括:在研究现有异构数据集成的原理、方法的基础上,根据 实际情况,提出了基于中间件的数据集成系统方案,此方案结合了w e bs e r v i c e 技术; 在传统的b s 模式中通过添加一个进行数据处理的中间件层,使得用户能透明的访问各 异构数据库;在对中间件分析与设计之后,选择适当的开发工具加以实现;最后,将本 系统应用于故障预测系统,通过在故障预测系统中的应用,说明了应用中间件能够有效 的解决异构数据的集成问题。 关键字:异构数据集成,中间件,w e bs e r v i c e 技术 a b s t r a c t n o w a d a y si n f o r m a t i o nt e c h n o l o g i e sd e v e l o p s or a p i d l yt h a tt h eu n e x p e c t e dt r o u b l eo f h e t e r o g e n e o u s d a t ei s b r o u g h t t od a t as h a r i n go fb u s i n e s s t ob u s i n e s sa n de v e n i n n e r - e n t e r p r i s e i n t e g r a t i o no fh e t e r o g e n e o u sd a t eh a sb e c o m eaf o c u s a n dh o t s p o to f c o m p u t et e c h n o l o g yr e s e a r c h t h i st h e s i sm a i n l ys t u d i e sd a t ai n t e g r a t i o no fi n n e r - e n t e r p r i s e r e l a t i o n a lh e t e r o g e n e o u sd a t a b a s e ,w h o s eg o a li st op r o v i d eau n i f i e dd a t aa c c e s si n t e r f a c e ,s o t h a tu s e rc a nt r a n s p a r e n t l ya c c e s sa l lh e t e r o g e n e o u sd a t a b a s eo ft h ei n s i d ei n t e g r a t i o ns y s t e m t h e r ea r eu s u a l l yt h r e ed a t ai n t e g r a t i o nm e t h o d s ,w h i c hi n c l u d e f e d e r a ld a t a b a s e ,d a t a r a r e h o u s ea n dm i d d l e w a r e t h i st h e s i sr e a l i z e dh e t e r o g e n e o u sd a t ai n t e g r a t i o na d o p t i n g m i d d l e w a r ec o m b i n e dw i t hw e bs e r v i c e t h em a i n w o r ki nt h i st h e s i si sl i s t e da sf o l l o w s f i r s t l y , ad a t ai n t e g r a t i o ns y s t e mw a s p r o p o s e do nt h eb a s i so fs t u d y i n gt h ep r i n c i p l ea n dm e t h o d s o fh e t e r o g e n e o u sd a t ai n t e g r a t i o n , w h i c ht a k ea d v a n t a g e so fm i d d l e w a r ea n dw e bs e r v i c e s e c o n d l y , am i d d l e w a r el a y e rw a s a d d e di nt h et r a d i t i o n a lb sm o d et op r o c e s sd a t a , s ot h a tu s e rc o u l dt r a n s p a r e n t l ya c c e s sa l l h e t e r o g e n e o u sd a t a b a s e a n dt h e nw ec h o s ea p p r o p r i a t et o o l st o r e a l i z et h es y s t e ma f t e r a n a l y z i n ga n dd e s i g n i n gm i d d l e w a r e f i n a l l y , t h es y s t e mw a sa p p l i e dt of a i l u r ep r e d i c ts y s t e m t h er e s u l to fa p p l i c a t i o ni n d i c a t e dt h a tt h ed a t ai n t e g r a t i o ns y s t e mb a s e do nm i d d l e w a r ec a n e f f e c t i v e l ys o l v et h ep r o b l e mo fh e t e r o g e n e o u sd a t ai n t e g r a t i o n k e yw o r d s :h e t e r o g e n e o u sd a t ai n t e g r a t i o n ;m i d d l e w a r e ;w e bs e r v i c et e c h n o l o g y i i 目录 第一章绪论l 1 1 课题背景与意义l 1 2 国内外现状。1 1 3 本文完成的主要工作2 第二章异构数据集成研究4 2 1 异构数据产生的原因及特点4 2 2 异构数据集成时需要解决的问题4 2 3 异构数据集成方法介绍5 2 4 本文所采用的集成方法7 2 4 1 中间件简介8 2 4 2 数据访问中间件9 2 5 本章小结1 0 第三章w e bs e r v i c e 技术研究1 1 3 1w e bs e r v i c e 技术概述1 1 3 1 1w e bs e r v i c e 的概念及特点1 1 3 1 2w e bs e r v i c e 的体系结构1 2 3 2w e bs e r v i c e 的相关技术13 - 3 2 1w e bs e r v i c e 的基础:x m l l3 3 2 2w e bs e r v i c e 的消息传递方式:s o a p 1 4 3 2 3w e bs e r v i c e 的描述方式:w s d l 16 3 2 4w e bs e r v i c e 的发布与注册:u d d i 1 6 3 3 基于w e bs e r v i c e 的数据集成的优势一18 3 4 本章小结l8 第四章基于w e bs e r v i c e 的中间件的分析与设计一1 9 4 1 设备故障集成系统的整体设计1 9 4 1 1 设备故障信息集成系统的目标1 9 4 1 2 设备故障信息集成系统的流程2 0 4 1 - 3 设备故障信息集成系统的体系结构一2 0 4 2 基于w e bs e r v i c e 的中间件的分析与设计一2 2 4 2 1w e bs e r v i c e 调用接口的分析与设计2 3 4 2 2 中介器的分析与设计2 3 4 2 3 中间数据库的分析与设计2 7 4 3 远程数据源包装器的分析与设计2 8 4 4 本系统的特点3 0 4 5 本章小结3 1 第五章基于w e bs e r v i c e 的异构数据集成中间件的实现3 2 5 1 开发平台与开发语言3 2 5 1 1 开发平台n e t 3 2 5 1 2 开发语言c 样。3 3 5 2 基于w e bs e r v i c e 的中间件的实现。3 3 5 2 1w e bs e r v i c e 调用接口的实现3 3 5 2 2 中介器的实现3 4 5 2 3 中间数据库的实现4 0 5 3 远程数据源包装器的实现4 2 5 4 设备故障信息集成系统界面的实现4 6 5 4 1 登录界面4 7 5 4 2 标准表的选择4 7 5 4 3 标准字段的选择4 8 5 4 4 远程数据库注册界面4 9 5 4 5 表对应界面5 0 5 4 6 字段对应界面5l 5 5 系统应用5 5 5 6 本章小结5 6 总结与展望一5 7 参考文献5 8 致谢6 0 i v 长安大学硕士学位论文 1 1 课题背景与意义 第一章绪论 随着计算机技术的发展、互联网应用的普及,越来越多的企业实施了信息化系统, 开发了企业内部网站。信息化提高了企业的管理水平,提高了管理效率,降低了管理成 本,提高了企业综合竞争力。随之而来的问题是企业多年来分散开发或引进的信息系统, 互相之间不能信息共享,业务不能舒畅执行和有效控制,形成了许多“信息孤岛”,既影 响了现有系统的继续运行,也影响了新系统的实施。因此,需要有一种有效的方法来实 现数据的集成。 中原高速集团下辖六个分公司,各分公司都拥有各自的系统对设备及设备故障进行 管理。因为信息化时间以及对问题的解决方案不尽相同,各分公司使用的数据库系统并 不完全一样,且存在语义异构等问题。这些分布的数据库系统虽然在各自的范围内能满 足数据存储与管理功能的要求,但是,总公司难以得到全局性的设备故障信息,而不能 做全局性的决策并实施一些整体规划。公司亟需整合现有的各分公司的数据信息。 要实现中原高速集团内各分公司的信息共享,一种方法是把现有的系统推倒重做, 重新设计数据库与系统,但这样花销太大且现有数据库数据的录入也是一个不小的问 题。另一种方法就是使用数据访问中间件对现有数据进行集成。数据访问中间件具有良 好的开放性,通用性,它提供对多种数据源的统一访问的接口,对数据访问实行集中管 理,更加符合远程数据访问的需要。要解决这种地域分布、异质平台、异质环境、异质 数据库的统一访问、统一存取的问题,使用数据访问中间件是一个不错的选择。 通过中间件来实现数据集成系统,既可以很方便的扩展新的异构数据库系统,也可 以很方便扩展中间件的功能。这些都不需要对中间件的应用系统以及原异构数据库系统 做任何改动。因而,应用中间件可以降低系统开发的难度,缩短集成系统的开发时间, 降低系统的开发成本,提高系统的可靠性与利用率,为实现企业内部数据集成与资源共 享提供了强有力的支持。 1 2 国内外现状 数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机的映射,从 第一章绪论 而为企业提供全面的数据共享【1 1 。数据集成所采用的方法基本可以分为实视图与虚拟视 图两类方法【2 1 。实视图方法会读取出数据源数据存入某一中间模块,它既可用于数据集 成也可用于决策支持查询,但会导致数据更新不及时、数据重复存储等问题;虚拟视图 方法只由集成系统提供一个虚拟集成视图以及全局查询的处理机制,不会重复存储大量 数据,且能保证查询到最新的数据,因此比较适合集成数据多、更新变化快的异构数据 集成【引。 目前已经研制出来的异构数据集成系统有很多,这里选取其中有代表性的几个系统 【4 】,介绍其功能和特点: ( 1 ) l o r e :l o r e ( l i g h t w e i h g to b j e c tr e p o s i t o r y ) 是美国s t a n f o r d 大学设计的一个专门 用于管理半结构化信息的数据管理信息系统。可以对半结构化数据( o e m ) 和x m l 数据 进行存储和管理。l o r e 包含标准数据库的一些特征,如:多用户支持,日志和恢复功能 以及查询和更新语言。同时l o r e 也提供了其他一些操作数据库的工具。 ( 2 ) o z n o e :o z n o e 是美国s t a n f o r d 大学设计的一个集成模型,该模型对面向对象数 据的o d m c 模型进行了扩展,可以对结构化和半结构化数据进行集成。o z n o e 系统特 别适合处理杂合性数据,尤其是广泛应用于w e b 上的数据。 ( 3 ) v e r s a t i l e :v e s r a t i l e 是由东南大学开发的一个基于c o r b a 的可扩展的异构数据 源集成系统原型。该模型在i o n a 公司的o b r x i 产品的基础上。对s q ls e r v e r 、v e s m a t 、 文件系、超文本数据进行包装和集成。该系统不仅能集成上述数据源,而且能集成随时 插入的新数据源中的数据。 在上述的三种模型中l o r e 系统是存储x m l 数据的一个专门数据库系统,它是异构 数据集成系统代表性的例子。该系统的体系结构设计,查询处理和优化方式为后来的异 构数据集成系统提供了很好的借鉴【3 】。 1 3 本文完成的主要工作 通过上面对课题背景的介绍,我们知道,中原公司需要一个对异构数据进行集成的 系统,为此我们将对此系统进行分析设计并予以实现。本文在第二章到第五章对系统采 用的方法技术以及系统的分析、设计与实现做了一个详细的说明。 首先本文详细介绍了当前比较成熟的三种异构数据集成方法一联邦数据库法、数 长安大学硕士学位论文 据仓库法、中间件方法,并比较了各自的优劣性。根据国内外异构数据集成现状的分析 并与中原高速集团的实际情况相结合,本文选择了中间件的方法来实现本系统的数据集 成工作。 接着本文讲述了中间件的具体实现技术:w e bs e r v i c e 技术。本文在第三章详细的 讲述了w e bs e r v i c e 技术的特点、体系结构以及w e bs e r v i c e 实现的关键技术。采用w 曲 s e r v i c e 技术,我们可以方便高效的建立一个稳定的、高可维护的、便于扩展的、可移植 的异构数据集成中间件。本文第四章详细讲述了故障集成系统的整体设计,包括系统的 目标、流程与体系结构,然后对系统的各组成部分包括核心部分的数据访问中间件与部 署在各远程数据库的数据库包装器进行了分析和设计。 最后,在前面几章相关方法、技术介绍和分析的基础上,结合中间件方法与w e b s e r v i c e 技术应用到一个具体的故障预测系统中,通过在故障预测系统中的应用,说明了 应用中间件能够有效的解决异构数据的集成问题。 第二章异构数据集成研究 第二章异构数据集成研究 2 1 异构数据产生的原因及特点 异构数据是一个含义非常丰富的概念,它不仅指不同数据库系统之间的数据异构, 如s q ls e r v e r 和o r a c l e 数据库;而且还包括不同数据结构之间的数据异构,如结构化 的s q ls e r v e r 和半结构化的x m l 数据 4 】。 在企业信息化建设过程中,由于各业务系统建设和实施数据管理系统的阶段性、技 术性以及其它经济和人为因素等因素影响,导致企业在发展过程中积累了大量采用不同 存储方式的业务数据,包括采用的数据管理系统也大不相同,从简单的文件数据库到复 杂的网络数据库,它们构成了企业的异构数据源【5 】。 一般而言,异构数据源都具有以下三个特点【6 】: ( 1 ) 分布性。异构数据源一般都是分布在不同的地域,依靠i n t e r a c t 或者内部网络 相连。 ( 2 ) 自治性。异构数据源一般有自己的管理系统,具有自治处理能力,独立完成 局部应用。异构数据源可以提供某些服务也可以不提供。 ( 3 ) 异构性。异构性是异构数据源的根本特性,也是异构数据集成要解决的难点。 其主要表现在以下两点: 1 ) 系统异构。各异构数据源的应用系统、数据库管理系统、操作系统之间的异构 构成了系统异构。 2 ) 模式异构。各数据源在存储模式上的不同称为模式异构。存储模式可以简单的 分为关系模式和非关系模式。其中关系模式为主流存储模式。 2 2 异构数据集成时需要解决的问题 数据集成是对各种异构数据提供统一的表示、存储、管理,以实现数据在逻辑上和 物理上的统一。通过数据集成,用户可以透明,高效的进行数据操作,进而实现全面的 数据共享。 但是由于异构数据源具有分布性、自治性、异构性等特性,在设计异构数据集成系 统时还需要考虑以下几个方面: 4 长安大学硕士学位论文 ( 1 ) 异构性。异构性是异构数据集成要解决的首要问题,异构数据集成的目的就 是要屏蔽掉数据之间的异构性,以便用户能方便的使用异构数据; ( 2 ) 完整性。集成后的数据要保证一定的完整性以保证数据能被有效的使用。完 整性包括数据完整性和约束完整性。 ( 3 ) 性能。网络时代对数据的集成提出了更高的要求,集成系统要满足可以快速 适应数据源的改变和低投入的特性。 ( 4 ) 语义冲突。由于看待问题与解决问题的方法思路不一致,各数据源之间必定 会存在语义冲突。语义冲突会带来结果冗余,干扰数据处理、发布、交换等负面影响, 集成系统必须尽可能的减少各数据源之间的语义冲突。 ( 5 ) 权限限制。数据源的自治性必然要求对外部数据操作的判断与控制。 ( 6 ) 附加约束。集成两个或多个异构数据源的时候,数据源数据之间可能存在某 种逻辑关系,那么这些逻辑关系也必须附加到集成结果中来。 ( 7 ) 范围限定。多数据源之间的数据集成往往并不需要将所有数据都进行集成, 这时候就需要对集成的范围做一个限定。 需要注意的是,以上的这些问题并不是相互孤立的,而是互相联系互相制约的。只: 有在数据集成时充分考虑了上述的这些问题,才有可能设计出一个好的数据集成系统。 、j 2 3 异构数据集成方法介绍 目前,在企业的数据集成领域,已经有很多成熟的框架可以使用,主要有联邦式、 基于中间件模型和数据仓库等方法来构成集成系统【l 】。下面详细介绍一下这三种数据集 成方式的优劣性。 ( 1 ) 联邦数据库系统【7 1 。联邦数据库系统主要面向多个数据库系统的集成,是最简 单的一种异构数据库集成方式。在联邦数据库系统中,各异构数据源是相互独立,一个 自治的数据库系统可以加入若干个联邦数据库系统。联邦数据库系统中的各数据源之间 相互提供映射关系来实现数据共享,这样一个n 个数据库系统的组成的联邦数据库系统 就需要n 宰( n 1 ) 个映射关系。例如一个由4 个异构数据库组成的联邦数据库系统就需 要1 2 个映射关系,如图2 1 所示: 第二章异构数据集成研究 图2 1 联邦数据库系统映射图 这种方法的优点是易于实现,尤其在数据数量和种类都很少的情况下,缺点是当数 据库数量较大时工作量极大,且难以对各数据库进行灵活的数据集成,另外,此方法的 扩展性与通用性都比较差。 ( 2 ) 数据仓库法。数据仓库技术则是在另外一个层面上表达数据之间的共享,它 将来自各异构数据源的数据副本按统一的、集中的视图要求转换成符合数据仓库的模 式,然后通过数据清洗、变换、集成、装入、定期刷新等过程来构造数据仓库。与联邦 数据库系统不一样的是它的数据是集中在一起的一个超大的数据集合。数据仓库将来自 各异构数据源的信息进行集成,从事务历史和发展角度来组织和存储数据,以联机分析 工具和数据挖掘工具为手段,形成一整套可操作、可实施的决策支持系统可行方案。数 据仓库能实现用户对数据集成的要求且能向用户提供全面性、综合性。动态性、多层次 长安大学硕士学位论文 ( 3 ) 中间件模式。中间件是目前比较流行的数据集成方法,它通过在中间层提供 一个统一的数据视图来隐藏底层的数据细节,使用户可以把集成数据源看成一个统一的 整体。中间件在异构数据库和应用程序之间构建一个中间层,中间层向下对各异构数据 库进行操作,向上为用户层提供统一的数据模式和数据访问接口。这样对用户而言,异 构数据源就如同单一的数据源,使得应用系统的开发工作更加简单。应用中间件组件, 可以不影响原有的各数据库管理系统,有效的实现了现有系统的快速集成。应用中间件 技术来解决异构数据集成是一个性价比较高的解决方案。中间体系结构图如图2 3 所示。 随着软件开发思想的不断发展,对软件开发的要求不断提高,基于构件的中间件方法越 来越受到软件开发人员的重视。特别是近年来w e bs e r v i c e 的迅猛发展将中间件的开发 与使用范围都推到了一个新的高度。因此,可以断定,中间件的发展代表了今后软件开 发的潮流与趋势,而基于w e bs e r v i c e 中间件将会是中间件的重点发展方向。 2 4 本文所采用的集成方法 图2 3 中间件体系结构图 由第一章可以看出,河南中原高速集团所需要的数据集成系统主要是在企业内部进 行的面对不同关系型数据库的一个异构数据集成系统。结合上一节所介绍的几种数据集 第二章异构数据集成研究 成方法,本系统将采用中间件的方法来集成异构数据。下面将简单介绍一下中间件的特 点与优势。 2 4 1 中间件简介 随着计算机软硬件的发展以及i n t e r n e t 的出现,计算机的应用范围越来越广,许多 应用程序需要在网络环境的异构平台上运行。如何把这些异构系统集成起来并开发新的 应用是一个非常现实而困难的问题【1 1 。中间件就是为解决这样的问题而被提出来的一个 概念。那么什么是中间件呢? 顾名思义,中间件是处在操作系统与用户应用软件中间的软件,主要作用是为处于 自己上层的应用软件提供运行与开发的环境,帮助用户灵活、高效地开发和集成复杂的 应用软件【l 】。由于应用广泛以及发展的时间还不是很长,中间件还没有一个统一的定义 和标准。目前比较普遍被接受的是i d c 表述的:中间件是一种独立的系统软件或服务程 序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机服务 器的操作系统之上,管理计算资源和网络通信。中间件的结构如图2 4 所示: 应用程序 应用程序 应用程序接口 中间件( 分布式系统服务) 平台接口平台接口 平台操作系统平台操作系统 图2 4 中间件结构图 由i d c 的表述我们知道,中间件解决的首先是互连和互操作问题【5 1 。这就要求中间件 能支持不同的操作系统,支持标准的协议和支持标准的接口。由于标准接口对于可移植 性和标准协议对于互操作性的重要性,中间件已成为许多标准化工作的主要部分。对于 应用软件开发,中间件远比操作系统和网络服务更为重要,中间件提供的程序接口定义 了一个相对稳定的高层应用环境,不管底层的计算机硬件和系统软件怎样更新换代,只 8 能完成所 方法, 面向数据 型的也可以是非关系型的还可以是对象型的。数据访问中间件的工作原理如图2 5 所示: 图2 5 数据访问中间件的工作原理图 通过使用数据访问中间件,一方面,可以解决因各异构数据源数据结构不一致而导 致的难以统一访问与集成的问题;另一方面,它可以在屏蔽底层异构数据源结构变化的 同时,尽可能的不影响位于上层的用户应用程序,极大地降低了系统维护的难度,实现 了用户对异构数据源的透明访问。应用这类中间件可以使应用程序的开发变得更加简 单,但如果在广域网上使用会带来严重的效率问题,因为在低速网上来回交互s q l 语 句会使通信量过大,同时对数据压缩、加密带来不便。 但总的来说,数据访问中间件屏蔽了底层异构系统的复杂性,使应用程序开发人员 9 第二章异构数据集成研究 只需面对一个简单而统一的环境,减少了程序设计的复杂性、缩短了开发周期,同时也 减少了系统的维护、运行、管理的工作量大大的节约了开发与维护成本。当然数据访问 中间件也存在着一些不足,我们在使用的时候要尽量避开这些不足。 由于本文所涉及的系统是在企业内部实现异构数据库系统的数据集成,在享受数据 访问中间件给我们带来便利的同时,也因计算机硬件的发展、高速的内部网络、以及一 些系统的特性而避开了它的一些缺陷,从而使系统具有了可行性与实用性。 2 5 本章小结 本章首先介绍了异构数据集成产生的原因、特点以及解决异构数据时需要解决的问 题。然后讲述了目前常用的三种异构数据集成方法:联邦数据库系统、数据仓库、中间 件模式。其中,中间件模式以其特有的优势已成为当今研究数据集成的热点,本文所采 用的数据集成方法就是中间件的方法。最后,结合中原高速集团的实际需求着重讲述了 数据访问中间件的原理与优势。 l o 长安大学硕士学位论文 第三章w e bs e r v i c e 技术研究 本文第二章介绍了异构数据集成的方法,并结合中原高速集团的实际情况选择了数 据访问中间件来实现系统。但数据访问中间件只是一种方法,一种思路,需要用具体的 技术来实现。在本系统中,我们选择w e bs e r v i c e 技术来具体实现异构数据集成系统。 3 1w e bs e r v i c e 技术概述 随着i n t e r n e t 在各个领域应用的普及和深化,人们迫切需要能够方便地实现i n t e m e t 上跨平台、语言独立、松散耦合的异构应用的交互和集成,这对分布式计算提出了新的 要求。虽然现有的中间件系统能部分的解决这个问题,但由于不同的厂家或不同种类的 中间件产品之间的不兼容又带来了新的问题:现行的基于w e b 的分布式中间件都要求 客户端必须使用特定的协议访问服务器端的对象。由此,w e bs e r v i c e 作为一种新的技 术应运而生,提出了面向服务的分布式计算模式。由于其采用的协议简单、灵活,远程 服务访问的语义定义和数据的表示是采用最为流行的x m l 格式,而消息的格式又支持 最为普及的h t t p 消息格式绑定。这就很好的解决了服务与客户之间的系统异构和服务 提供的语言的区别。w e bs e r v i c e 已成为计算机领域的一个研究热点。 3 1 1w e bs e r v i c e 的概念及特点 从表面上看,w e bs e r v i c e 就是一个应用程序,它向外界暴露出一个能够通过w - e b 进行调用的a p i ;更深入一点看,w e bs e r v i c e 就是建立可互操作的分布式应用程序的新 平台。为了实现跨平台的互操作性,w e bs e r v i c e 完全基于x m l ,独立于平台、独立于 软件供应商的标准,是创建可互操作的、分布式应用程序的新平台。从外部的使用者的 角度而言,w e bs e r v i c e 是一种部署在w e b 上的对象组件,它具备以下几个特征: ( 1 ) 完好的封装性。w e bs e r v i c e 既然是一种部署在w e b 上的对象,自然具备对象 的良好封装性,对于使用者而言,他能且仅能看到该对象提供的功能列表。 ( 2 ) 松散耦合。这一特征也是源于对象组件技术,当一个w e bs e r v i c e 的实现发 生变更的时候,调用者是不会感到这一点的,对于调用者来说,只要w e bs e r v i c e 的调 用界面不变,w e bs e r v i c e 的实现任何变更对他们来说都是透明的,甚至是当w e bs e r v i c e 的实现平台从j 2 e e 迁移到了n e t 或者是相反的迁移流程,用户都可以对此无所知。 第三章w e bs e r v i c e 技术研究 对于松散耦合而言,尤其是在i n t e m e t 环境下的w e bs e r v i c e 而言,需要有一种适合 i n t e m e t 环境的消息交换协议。而x m l s o a p 正是目前最为适合的消息交换协议。 ( 3 ) 使用协约的规范性。这一特征从对象而来,但相比一般对象其界面规范更加 规范化和易于机器理解。首先,作为w e bs e r v i c e ,对象界面所提供的功能应当使用标 准的描述语言来描述( l t 如w s d l ) ;其次,由标准描述语言描述的服务界面应当是能够 被发现的,因此这一描述文档需要被存储在私有的或公共的注册库里面。同时,使用标 准描述语言描述的使用协约将不仅仅是服务界面,它将被延伸到w e bs e r v i c e 的聚合、 跨w e bs e r v i c e 的事务、工作流等,而这些又都需要服务质量( q o s ) 的保障。其次,我们 知道安全机制对于松散耦合的对象环境的重要性,因此我们需要对诸如授权认证、数据 完整性( 比如签名机制) 、消息源认证以及事务的不可否认性等运用规范的方法来描述、 传输和交换。最后,在所有层次的处理都应当是可管理的,因此需要对管理协约运用同 样的机制。 ( 4 ) 使用标准协议规范。作为w e bs e r v i c e ,其所有公共的协约完全需要使用开放 的标准协议进行描述、传输和交换。这些标准协议具有完全免费的规范,以便由任意方 进行实现。一般而言,绝大多数规范将最终有w 3 c 或o a s i s 作为最终版本的发布方和 维护方。 ( 5 ) 高度可集成能力。由于w e bs e r v i c e 采取简单的、易理解的标准w e b 协议作 为组件界面描述和协同描述规范,完全屏蔽了不同软件平台的差异,无论是c o r b a 、 d c o m 还是e j b 都可以通过这一种标准的协议进行互操作,实现了在当前环境下最高 的可集成性。 3 1 2w e bs e r v i c e 的体系结构 一个完整的w e bs e r v i c e 包括三种逻辑组件:服务提供者、w e bs e r v i c e 注册中心和 服务请求者。服务提供者提供服务,并进行注册以使服务可以使用;w e bs e r v i c e 注册 中心起中介作用,它是w e bs e r v i c e 的注册场所,充当服务提供者和服务请求者之间的 媒介;服务请求者可以在应用程序中通过向服务代理请求服务,调用所需服务。其体系 结构图如图3 1 所示: 1 2 长安大学硕士学位论文 图3 1w e bs e r v i c e 体系结构图 与此相对应的是与w e bs e r v i c e 的相关的三种操作服务发布、服务发现、服务绑定。 ( 1 ) 发布。服务提供者在w e bs e r v i c e 注册中心发布所提供的服务。该操作对服务 进行一定的描述并在w e bs e r v i c e 注册中心进行注册。在发布过程中,服务提供者可以 发布w - e bs e r v i c e 也可以移除w r e bs e r v i c e 。 ( 2 ) 发现。服务请求者向w e bs e r v i c e 注册中心提出服务查询请求。w e bs e r v i c e 注册中心提供规范的接口来接收服务请求者的查询请求。通常的方法是,服务请求者根 据通用的行业分类标准来浏览或通过关键字来搜索并逐步缩小查找范围直到找到满意 的服务为止。 = ( 3 ) 绑定。服务的具体实现:分析从w e bs e r v i c e 注册中心得来的调用该服务的详 细的绑定信息,包括服务的访问路径、调用的参数、返回的结果、传输协议、安全要求 0 等。根据这写信息,服务请求者可以编程实现对服务的调用。 。1 3 2w e bs e r v i c e 的相关技术 3 2 1w 曲s e r v i c e 的基础:x m l 可扩展的标记语言( x m l ) 是w e bs e r v i c e 平台中表示数据的基本格式。是互联 网联合组织( w 3 c ) 所开发和创建,其目的不仅在于满足不断增长的网络应用需求。更是 为了确保在通过网络进行交互合作时具有良好的可靠性和可操作性。x m l 是一种独立 于系统的表达数据信息的标记语言,可运行在任何平台和操作系统之上,现已成为网络 系统中通用的数据交换格式。 x m l 是一种语法简单自描述性的标记语言,x m l 数据的格式在x m l 文档内部被 描述。另外它还有可移植性与互操作性等特点。正是这些特点允许它在描述不同数据库 中的数据。能使来自不同数据结构的数据很好地结合在一起,能很好地实现异构数据库 第三章w e bs e r v i c e 技术研究 之间的透明互操作。这些特点使得x m l 具有以下优点: ( 1 ) 很强的可扩展能力。x m l 允许用户定义自己的标签以及这些标签携带相关参 数的属性和值。 ( 2 ) 强大、灵活、高效的表达数据内容的能力。 ( 3 ) 数据的可重用性好。x m l 利用d t d ( d o c u m e n tt y p ed e f i n i t i o n ) 来显示数据, x s i ( e x t e n s i b l es t y l es h e e tl a n g u a g e ) 来描述相关文档如何显示,使得数据内容与具体应 用无关,大大提高了数据的可重用性,这一点在通过网络交换数据时表现得更加明显。 总之,x m l 使用一个简单而又灵活的标准格式,为基于w e b 的用提供了一个描述 数据和交换数据的有效手段,是一个很好的交互中间媒介。就w e bs e r v i c e 而言,w e b s e r v i c e 的消息传递方式( s o a p ) ,w e bs e r v i c e 的描述方式( w s d l ) ,w e bs e r v i c e 的发 布与注册( u d d i ) 都是建立在x m l 之上的。 3 2 2w e bs e r v i c e 的消息传递方式:s o a p s o a p 是一种简单、轻量级的协议,用于在w e b 上传输、交换x m l 数据。客户应 用程序正是通过s o a p 协议来访问i n t e m e t 上的w e bs e r v i c e 的。s o a p 规范定义了消息 传输的信封( e n v e l o p e ) 格式,提供了数据编码的基准并提供代表远程过程调用( r p c ) 的一 系列规则。s o a p 协议可以构建在t c p ,s m t p ,h t t p 等协议之上。最常用的是h t t p , 因为h t t p 协议可以方便地穿过防火墙,使得在i n t e m e t 上执行分布式计算可以畅通无 阻的进行。和许多标准协议一样,s o a p 也采用采用客户和服务器型的请求。由客户程 序发出请求、送出参数,服务器程序做出相应的响应,两种消息均为x m l 格式。客户 端的s o a p 请求以h t t p 头部构架和所需的x m l 格式被封装成h t t p 包发送至服务器。 s o a p 响应的格式与请求格式类似,只不过响应元素的子元素名前必须加r e s p o n s e 后缀。 当服务器识别s o a p 请求后,调用相应的具体过程并将结果封装在s o a p 响应中返回给 客户端。s o a p 体系结构如图3 2 所示: 图3 2s o a p 体系结构图 1 4 长安大学硕上学位论文 s o a p 是一个基于x m l 的协议包括三个部分: ( 1 ) s o a p 信封( e n v e l o p e ) 定义了一个整体框架,描述消息内容、内容的属性以 及谁负责处理。 其中,s o a p 的信封格式如图3 3 所示: 图3 3s o a p 消息结构图 s o a pe n v e l o p e 是定义s o a p 消息的定级容器,它包含s o a p 头部( h e a d e r ) 和主体 ( b o d y ) 两部分,其中头部信息是可选的,但所有s o a p 消息都必须有主体部分。h e a d e r 。 是为了支持在松散环境下,在通讯方( 可能是s o a p 发送者、s o a p 接收者或者是一个或 多个s o a p 的传输中介) 之间尚未预先达成一致的情况下,为s o a p 消息增加特性的通 用机制主要包含一些与安全性、路由信息以及消息处理模型相关的一些重要信息;b o d y 为该消息的最终接收者所想要得到的那些强制信息提供了一个容器用于传输的实际信 息,此外s o a p 定义了b o d y 的一个子元素f a u l t 用于报告错误。 ( 2 ) s o a p 编码规则( e n c o d i n gr u l e s ) :定义了数据的编码机制,用以交换应用程 序定义的数据类型的实例。s o a p 编码是x m l 规定的一个子集。用户也可以定义自己 的编码规则,并通过属性e n c o d i n g s t y l e 指明。s o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论