




已阅读5页,还剩58页未读, 继续免费阅读
(计算机软件与理论专业论文)基于xml数据迁移中间件的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨工程大学硕+ 学位论文 摘要 随着信息技术的迅猛发展,企业信息管理系统不断的更新换代,原有旧 系统重要的历史数据需要迁移至新系统中,因此,迫切需要一种通用的、跨 平台的数据迁移技术。 数掘迁移的主要困难在于数据的异构性。要实现新旧系统问的数据迁移, 首先要求数据描述耍基于统一的格式,从而实现数据的转换、处理等功能, 因此,本文采用x m l 来实现企业新旧系统间的数据迁移。x m l 是自描述、 可交换、能够以树型或图型结构描述数据的一种语言。数据的交换性是其最 重要的一个优势。 为使本文提出的数据迁移方法具有更好通用性和更强的适用性和平台无 关住,本文在分析了中闻件技术的理论和作用的基础上,采用了基于x m l 的中间件。在此基础上,针对目前市场上数据迁移工具的不足,本文讨论了 多种情况下数据迁移问题,并分析了数据迁移的策略,并对目前数据迁移工 具的优缺点进行了分析和比较,引入一个基于x m l 中间件的数据迁移总体 模型,用来交换异构数据库管理系统之间的数据。并讨论了该模型的优点和 关键技术。 最后,本文提出了基于x m l 的中间件的具体模型,说明了其内部模块 的详细功能及其数据转换流程。 关键词:数据转换;数据迁移;中间件;x m l 堕玺鎏三堡盔兰鎏圭兰垡鲨銮 , a b s tr a c t w i t ht h e r a p i dd e v e l o p m e n t o fi n f o r m a t i o nt e c h n o l o g y , e n t e r p r i s e i n f o r m a t i o nm a n a g e m e n ts y s t e mc o n t i n u o u s l yu p d a t e s 。r e p l a c e m e n to ft h eo l d s y s t e mo fh i s t o r i c a ld a t an e e dt 0b em i g r a t et 0t h en e ws y s t e m , t h e r e f o r e , a n u r g e n tn e e df o rau n i v e r s a l ,c r o s s - p l a f f o r md a t am i g r a t i o nt e c h n o l o g y 耵圮m a i nd i f f i c u l t yo f d a t am i g r a t i o nl i e si nt h ed a t ah e t e r o g e n e o u s i no r d e r t om i g r a t ed a t af x o mo l ds y s t e mt on e ws y s t e m t h ed a t as h o u l db ed e s c r i b e do na u n i f i e d f o r m a t , t h u sa c h i e v i n g d a t a c o n v e r s i o n , p r o c e s s i n g a n do t h e r f u n c t i o n s t h e r e f o r e t h i st h e s i sp r o p o s e ) n 亿t 0c o m p l e t ed a t am i g r a t i o nf r o m o l ds y s t e mt on e ws y s t e mo f t h ee n t e r p r i s e x m lc a l ld e s c r i b ei t s e l f , a n dc o m m u t e d a t a i na d d i t i o n , i tc a r ld e s c r i b ed a t aw i t ht h et r e na n df i g u r e 1 1 l ed a t a c o m m u n i c a t i o ni st h em o s ti m p o r t a n tm v a n t a g eo fi t i th a sa l r e a d yb e c o m eo n e k i n do f s t a n d a r do f t h ed a t aa l l t l o a n c e so ni n t e r a c ta n dd a t ae x c h a n g e d i no r d e rt om a k et h em i g r a t i o nm e t h o dw h i c hp r o p o s ei nt h i st h e s i sh a v e b e t t e r g e n e r a la v a i l a b i l i t y a n db e t t e rs e r v i c e a b i l i t ya n db e t t e rp l a t f o r m i n d e p e n d e n c em a k e d a t am i 鲫o nm e t h o db r o u g h tf o r w a r db yt h em a i nb o d yo f ab o o kh a v em u c hb e t t e rg e n e m la v a i l a b i l i t ya n ds t r o n g e r , a 船ra n a l y s et h et h e o r y a n de f f e c to f m i d d l e w a r e , t h i st h e s i sp r o p o s ex m l - b a s e dm i d d l e w a r e b ea i m e da tt h ei n s u f f i c i e n to ft h ed a t am i g r a t i o ni nt h em a r k e t p l a c e ,i nt h i s t h e s i s ,t h ev a r i o u sc o n d i t i o no f t h ed a t am i g r a t i o np r o b l e m h a sb e e nd i s e a s e da n d m a n yd a t am i g r a t i o nt a c t i c sh a v eb e e na n a l y s e d a n dt h e np r o p o s ead a t a m i g r a t i o nm o d e lw h i c h c o n t a i nx m l b a s e dm i d d l e w a r et om a n a g ea n de x c h a n g e t h ed a t ab e t w e e ni s o m e r i s md a t ab a s em a n a g e m e n ts y s l e m ,a n dd i s c u s s et h e m e r i t ya n dd i f f i c u l t yo f t h em o d e l f i n a l l y , t h i st h e s i sp r o p o s et h em o d e l o f x m l - b a s e dm i d d i e w a r e ,a n de x p l a i n t h ed e t a i l e df u n c t i o no fi t , a tt h es a m et i m e e x p l a i ni i si n t e r n a lf u n c t i o n sa n dd a t a c o n v e r s i o np r o c e s s e s k e y w o r d s :d a t ac o n v e r t i o n , d a t am i g r a t i o n , m i d d l e w a r e ,x m l 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导 下,由作者本人独立完成的。有关观点、方法、数据和文 献的引用已在文中指出,并与参考文献相对应。除文中已 注明引用的内容外,本论文不包含任何其他个人或集体己 经公开发表的作品成果。对本文的研究做出重要贡献的个 人和集体,均己在文中以明确方式标明。本人完全意识到 本声明的法律结果由本人承担。 作者( 签铋。拗公 日期:触7 年月o ) 日 1 1 课题研究背景 第1 章绪论 在人类跨入2 l 世纪,中国加入w r o 之际,无论是国内企业,国外企业 或者是政府部门,都将面临一个全球经济一体化的市场环境,竞争日益激烈。 谁能迅速了解市场信息,并随市场变化而动,谁就能在竞争中立于不败之地。 为此,越来越多的企业建立了各种信息管理系统,这些系统采用不同平 台,不同厂商提供的数据库,在企业信息化不断发展的过程中,在将应用系 统升级到更高版本或新的平台,同时,存储在数据库中的历史数据也必须能 够顺利迁移,实现业务系统的平滑过渡。 完成数据迁移( d a t a m i g r a t i o n ) 有不同的方法。如果新旧数据库表结构没 有发生变化,可以使用数据库厂商提供的备分,恢复工具实现数据的迁移,即 升级前备份旧数据库,升级后用恢复工具将旧数据恢复到新数据库中;还有 一些开发工具提供在两个数据源( d a t as o u r c e ) 之间直接迁移数据的功能,例 如p o w e r b u i l d e r 提供的p i p e l i n e ,b o r l a n dd e l p h i 提供的d a t a p u m p 等工具。 这些迁移工具使用起来比较方便,但是有一个前提:数据源表结构必须一致, 字段类型要兼容。 在实际的应用系统升级过程中,新旧版本数据库表结构常常会发生一些 变化。例如,在新版本数据库中修改了原有数据表字段名、字段值的类型或 者表名,因此,不能使用现成的工具来完成数据迁移,用户必须编写专门的 程序来达到这个目的。 可扩展标记语言o ( m l ) 以其简单、可扩展、容易编辑、支持跨平台、跨 地域,异构应用间的协同工作等优点为异构数据的交换提供了一个合适的平 台,它已逐渐成为信息数据表示、传输、交换与共享的重要标准和格式。利 用x m l 进行数据交换,有一定的优势。x m l 是自描述的、可交换的、能够 以树型或图型结构描述数据。因此,可以利用x m l 实现企业信息化系统的 数据迁移 i s l 。 哈尔滨工程大学硕士学位论文 本文引入了一种基于x m l 技术的中间件的通用数据迁移方法,这种方 法充分利用了x m l 的灵活性,可以应用在不同的数据迁移场合。 1 2 国内外研究现状 近年来,国内外在x m l 技术和中间件技术领域的研究有了长足的进展, 对于数据迁移工具的研究也已有了一定的成果,但是利用x m l 技术和中问 件技术来开发数据迁移工具目前尚处于初期探索阶段。对于国内外在数据迁 移工具、x m l 技术和中间件技术的研究现状介绍如下: 1 数据迁移方法 随着信息技术的发展,现代企业信息系统不断的更新换代,这些系统采 用不同平台,不同厂商提供的数据库,企业原有的重要的历史数据需要迁移 至新系统中。然而企业在系统迁移时,不同数据库之间的数据交换成为开发 人员最头疼的问题,每种数据库都有自己特定的数据表示格式,当从一种数 据库要迁移至另一种数据库时,由于互不相同的数据格式和数据库运行的操 作,导致加载困难。 目前,已有一些较为成熟的数据迁移工具,如o r a c l e 提供的将外部文本 文件中的数据转移到o r a c l e 数据库表的数据装入工具s q ll o a d e r ,m i c r o s o f t 公司开发的s q ls e r v e r 中的数据转换工具d t s 和p o w e r s o f i 公司的p o w e r b u i l d e r 中提供的数据管道( d a t ap i p e l i n e ) m 。但是,使用这些数据转换工 具的缺点是它们不是独立的软件产品,必须首先运行该数据库产品的前端程 序才能运行相应的数据迁移工具,通常需要几步才能完成,且多用手工方式 进行迁移。如果目的数据库不是数据迁移工具所对应的数据库,数据迁移工 具就不能再使用。 通常的解决办法是自己定义一套特定的数据格式,将数据源中的数据先 以自己定义的格式导出来,然后再将数据导入到目的数据库中。这种办法没 有统一的标准,缺乏一定的规范,重用性差,与企业外部交流数据更有困难。 针对这种情况,对于数据迁移来说,最重要的是进行数据迁移的源数据库和 目的数据库双方要对数据的格式达成统一的认识。只有采用统一的数据格式, 才能实现数据的自动流转、处理等功能。可利用目前流行的可扩展标记语言 哈尔滨工程大学硕士学位论文 ( x m l ) 作为交换数据的介质。x m l 以其简单、可扩展、容易编辑、支持跨 平台、跨地域、异构应用问的协同工作等优点,为异构数据表达与传输提供 了一个合适的平台,它己逐渐成为w e b 上企业信息数据表示,传输、交换与 共享的重要标准和格式,因此,我们可以利用x m l 实现异构数据库间的数据 迁移。 2 x 札与异构数据 x m l 的出现为异构数据源的交换与迁移带来了新的希望,v i l 具有很 多优良的特性: ( 1 ) 扩展性:x m l 是一种元标记语言( m e t am a r k u pl a n g u a g e ) 。它允许使 用者根据它所提供的规则制定各种各样的标记语言。在x m l 文件中,一个 标识元素确定了文件内容的一部分或者一个复杂的数据对象应用程序定义的 标识能够传递被标记内容的语义。元素允许嵌套定义,即一个元素可以由其 他元素构成。可以具有与它有关的一些属性,这些属性是对标识进一步的描 述和说明,增强了元素的语义。由于x m l 的标记是用户定义的,从理论上 讲,其类型可以是无限的。 ( 2 ) 结构性:x m l 提供了一种结构化的数据表示方式。使得用户界面分 离于结构化数据。x m l 使用d t d ( 文档类型定义1 或s c h e m a 规定一套关于 标记符号的语法、语义规则。比较准确地描述文本资料的内容、含义、结构、 特征和关系等信息,而把资料的外观表现形式交给样式表( 如c s s 、x s l 等) 处理。由于数据显示与内容分开。x m l 定义的数据允许指定不同的显示方式, 使得数据更合理地呈现出来。 ( 3 ) 自描述性;不仅人能读懂x m l 文件,计算机也能处理。x m l 表示数 据的方式真正做到独立于应用,独立于平台。所以,x m l 文档被看作是文档 的数据库化和数据的文档化。 x m l 还有其他许多优点。比如它有利于不同系统之问的信息交流。完全 可以充当网际语言,并有希望成为数据和文档交换的标准机制。因此,运用 x m l 可以有效解决新旧系统、不同应用系统之间或者不同数据源之问的数据 共享与交互闯题t l 】。 目前,主流数据库厂商都在把对x m l 的支持结合到其产品中。如m m 哈尔滨工程大学硕士学位论文 提供了x m l e x t e n d e rf o rd b 2 ,以允许用户在d b 2 中存储x m l 文件。目前 关于x m l 的建模研究主要分为以下三类:x m l 文档逻辑建模、) a l 文档概 念建模、x m l 到关系数据库模式的转换等。其中关于x m l 文档的逻辑建模, 已有了一些成果及工具支持。目前主要使用x m ls c h e m a 和d t d 等模式语 言来描述x m l 的逻辑结构,以提供规范的语法约束:也出现了一些可视化的 x m l 逻辑建模工具,如a l t o v a 公司的x m l s p y 、s y b a s e 公司p o w e r d e s i g n e r 1 1 0 中的x m l m o d 当前相关的研究主要集中在x m l $ c h e m a d t d 与r d b 之间的模式转换和映射算法,这是逻辑或物理存储模式的转换;其重点和难 点是如何减少语义的丢损。为了方便模式转换或映射,也有少量研究致力于 工具的开发,i b mc l i o 是这方砸的典型代表。 在从更高的层次来抽象地表达x m l 文档的结构这个领域,还远没有被 充分地研究。国内在这一课题上的研究较少,主要分散在各大院校和研究所, 缺乏相应的组织;而且研究的内容集中在皿。模式和关系模式之间的相互 转换;对于上层的抽象的模型,仍有大量的问题值得进一步研究m 】。 3 x g l 数据库系统 如何有效的存储和查询x m l 数据是当前研究的一个热点。在存储和查 询x m l 数据这一领域,主要有两种方法: ( 1 ) 在已有的关系数据库系统或面向对象数据库系统的基础上扩充相应 的功能,使其能够胜任x m l 数据的处理,这种数据库又称为x m l 使能数据 库( e n a b l ex m ld a t a b a s e ) 。目前,x m l 使能数据库的研究主要是基于关系数 据库,这种方法的优点是可以充分利用己有的非常熟悉的关系数据库技术, 集成现有的大量存储在关系数据库中的商用数据,但这种处理方法不能利用 x m l 数据自身的特点,如结构化、自描述性等特征,使得在处理x m l 数据 的时候要经过多级复杂的转换,如存储x m l 数据时要将其转换为关系表或 对象,在查询的时候要将x m l 查询语言转换为s q l 或o q l ,查询结果还要 转换为x m l 文档等,多级转换必将带来效率的降低。 ( 2 ) 为x m l 数据量身定做的数据库即纯x m l 数据库( n a t i v ex m l d a t a b a s e ) ,也称为本原x m l 数据库或原生x m l 数据库。纯x m l 数据库充 分考虑到x m l 数据的特点,以一种自然的方式来处理x m l 数据,能够从各 哈尔滨工程大学硕士学位论文 方面很好地支持x m l 的存储和查询,并且能够达到较好的效果,但是,纯 x m l 数据库要走向成熟还有很长的路。 纯x m l 数据库这个术语首先是于t a m i n o 的市场推广活动中显露出来。 除了专门用于存储x m l 文档,纯x m l 数据库同样需要支持诸如:事务、安 全、多用户访问、编程接口和查询语言等传统数据库的特性。对于纯x m l 数据库,r b o u r r e t 给出了一个定义,即只有满足以下3 个条件的x m l 数 据库才能称之为纯x m l 数据库: 第一,为x m l 文档定义了一个逻辑模型,并且根据模型对x m l 文档进 行存储和检索。 第二,把x m l 文档作为其基本的存储单元,就像关系数据库在一个表 中把行作为其基本存储单元( 在逻辑概念上) 。 第三,不需要由任何特殊的底层物理存储模型。它可以建立在关系、层 次、或者面向对象的数据库之上。 上述定义表明了纯x m l 数据库是为了存储和检索x m l 文档的所有组成 部分( 包括元素、属性、c d a t a 、实体、u r i 等) 而设计的,这是x m l 使能 数据库不能完成的;纯x m l 数据库存入和取出的数据格式都是x m l :纯 x m l 数据库底层的数据存储格式并不重要。 目前,正式公布的纯x m l 数据库产品有2 8 种,其功能各具特色。在支 持对x m l 文档管理的同时,不同程度的增加了一些附加功能。比较著名的 产品有t a m i n o ,d b ) i l ,e x c e l o n 和x h i v e d b ,分别由美国的s o f t w a r e a g 公司、d b x m lg r o u pl l c 公司、e x e e l o n 公司和荷兰的t h ec o n n e c t i o nf a c t o r y 公司研制。x m l 使能数据库是在传统数据库的基础上,通过增加对x m l 数 据的管理功能,从而实现对x m l 数据的管理的数据库。x m l 使能数据库的 主要用途是实现数据关系不太复杂的x m l 文档与传统数据库之间的转换。 目前已经知道的x m l 使能数据库产品有a c c e s s 2 0 0 2 ,s q l s e r v e r 2 0 0 0 ,i b m 的d b 2x m l e x t e n d e r ,f i l e m a k e r ,f o x p r o ,i n f o r m i x ,o b j e e t i v i t y d b ,o r a c l e 8 i 和9 i 。 大多数知名的研究机构和大学实验室都建有自己的x m l 数据库系统 1 6 1 : ( 1 ) x i s s ( x m li n d e x i n ga n ds t o r a g es y s t e m ) 是由亚利桑那州大学开发的 一种用于基本索引组合实现结构查询。x j s s 索引主要介绍三个方面:编码方 5 哈尔滨工程大学硕士学位论文 式、索引的存储和联接算法。x i s s 索引支持正则路径表达式,采用间隔码编 码方式( 用p r e 唯一标识结点,每个结点间隔一段数s i z e ,在s i z e 范围内,索 引不须更新) 。包含五种基本索引结构,三种是前面所描述的,另外两个是名 称索引( n 锄ei n d e x ) 和值表( v a l u et a b l e ) ,是从技术角度提出的。 ( 2 ) t o x ( t o r o n t ox m le n g i r t e ) 是一个x m l 数据库,它支持多种查询语言 和不同的存储模式( 关系型、面向对象型、原型n a t i v e ) ,采用哪种存储类型 依文档属性而定。t o x i n ( t o xi n d e x ) 是一种最小结点数的弱d a t a g u i d e 型索 引,由多伦多大学提出,用来克服通常的半结构化数据索引只能够处理一部 分查询处理的局限。t o x i n 是种x m l 数据的索引,在查询处理中采用。 数据库的全路径结构,综合了面向对象的路径索引和其在半结构化数据领域 的扩展所用到的思想。目前,t o x i n 索引在索引结构的排序、图形索引结构 的实现等方面还需改进。 ( 3 ) s t a n f o r d 大学数据库研究组就将其开发的用于半结构数据管理的原型 系统l o r e ,移植到完全基于x m l 的数据模型上,并相应地对其查询语言进 行了扩充。l o r e ( l i g h t w e i g h to b j e c tr e p o s i t o r y ) ,以半结构化数据模型o e m ( o b j e c te x c h a n g em o d e l ) 为基础,是一个为管理半结构化数据而特别设计的数 据库管理系统。 ( 4 ) o r i e n t ) 由中国人民大学信息学院数据与知识工程研究所研发的纯 x m l 数据库系统。目前,该系统己被国际知名的万维网标准组织w 3 c 的网 站收录在x q u e r yi m p l e m e n t a t i o nl i s t 。o r i e n t x 系统是国内首个纯x m l 数据 库系统。 4 中间件 随着互联网的发展,企业的信息系统和以往相比已发生了很大的变化。 企业级的应用己不再满足于单机系统和简单的客户服务器系统,而是向着三 层和多层体系结构的分布式环境不断迈进。所谓三层结构,就是在原有的“两 层结构”( 客户端和服务器端) 之间增加了一层组件,这层组件包括事务处理逻 辑应用服务、数据库查询代理数据库等。随着这层组件的增加,两层结构向 三层结构转变后,客户端和服务器端的负载就相应减轻了,跨平台、传输不 可靠等问题也得到了解决。增加的这层组件就是所谓的呻间件”。中间件在 6 哈尔滨工程大学硕士学位论文 三层结构中主要充当中间层,完成数据安全和完整传输,通过负载均衡来调 节系统的工作效率,从而弥补两层结构的不足。中间件技术多应用于分布式 系统中。在分布式环境中,无论硬件平台还是软件平台都不可能做到统一。 大规模的应用软件通常要求在软、硬件各不相同的分布式网络上运行,为了 更好地开发和应用能够运行在这种异构平台上的软件,迫切需要一种基于标 准的、独立于计算机硬件及操作系统的开发和运行环境,中间件技术就应运 而生了【埘。 国内在中间件技术领域研究的起步时间与国外基本相同,国内厂商与国 外厂商在技术水平方面基本处于同一条起跑线上,国产中间件软件与国际先 进产品的差距不是很大,有的已经接近国际领先水平。国内不少大学和科研 院所也加入到了中间件软件的研究与开发中来,为国内中间件技术的创新起 到了一定的推动作用。目前国内已经拥有比较齐全的国产中间件软件产品线, 国产中间件软件与国外产品在市场占有率上的差距日益缩小也说明技术的差 距越来越小。 1 3 论文研究的主要工作 根据研究的目标,本文的主要研究工作有以下几点: 首先,对国内外各种数据迁移工具、方法和策略进行详细地分析和研究, 总结其优缺点及不足之处。 其次,对介绍中间件的定义、分类、作用以及优点等相关知识进行详细 地介绍,说明利用中间件来实现异构数据库迁移方案的必要性和可行性。 再次,对x m l 的基本概念、性质、优点、与数据库的关系以及与应用 程序的接口进行详细地介绍,并分析) ( m l 适用于数据表示、文档转换、与 数据库转换等技术的优势,说明其适合数据交换的特点。 最后,本文引入基于咀,中件间的数据迁移总体模型,并详细介绍模 型层次结构,工作流程、优点、设计的重点和难点,着重研究并设计数据迁 移中问件的具体模型,对其关键技术进行研究和实现。 哈尔滨工程大学硕+ 学位论文 1 4 本文的组织安排 本文主要研究数据迁移技术及其应用。分为以下5 章: 第l 章介绍课题背景及国内外研究现状。 第2 章介绍中间件的定义、分类、作用以及优点等相关知识进行详细的 介绍,说明利用中间件来实现异构数据库迁移方案的可行性。x m l 的基本概 念、性质、优点、与数据库的关系,以及与应用程序的接口进行详细地介绍, 并分析x m l 适用于数据表示、文档转换、与数据库转换等技术的优势。 第3 章对数据迁移的方法与策略进行仔细的研究,分析各种方法和策略 和常用迁移工具的优缺点,提出使用x m l 进行数据交换,并说明其适合数 据交换的特点。 第4 章提出适合本文中数据迁移模型的方法和策略,引入基于x m l 中 件间的数据迁移总体模型,并详细介绍模型层次结构,工作流程、设计的重 点和难点。 第5 章研究并设计数据迁移中间件的具体模型,对其关键技术进行研究 和实现。 8 哈尔滨工程大学硕士学位论文 2 1 中间件技术 第2 章相关技术介绍 计算机技术的飞速发展,各种各样的应用软件需要在各种平台之间进行 移植,或者一个平台需要支持多种应用软件和管理多种应用系统,软、硬件 平台和应用系统之间需要可靠和高效的数据传递或转换,使系统的协同性得 以保证。这些,都需要一种构筑于软、硬件平台之上,同时对更上层的应用 软件提供支持的软件系统,中间件正是在这个环境下应运而生的。 2 。1 1 中间件的定义 中间件( m i d d l e w a r e ) 是基础软件的一大类,属于可复用软件的范畴。它介 于系统软件和用户的应用软件之间,使用系统软件所提供的基础服务,衔接 网络上应用系统的各个部分或不同的应用,能够达到资源共享、功能共享的 目的。也就是说,中间件在操作系统、网络和数据库之上,应用软件的下层, 其作用是为处于自己上层的应用软件提供运行与开发的环境,帮助用户灵活、 高效地开发和集成复杂的应用软件。 由于中间件技术正处于发展过程之中,因此目前尚不能对它进行精确的 定义。但是业界普遍能接受的定义是:中间件是一种独立的系统软件或服务程 序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于 客户机服务器的操作系统之上,管理计算资源和网络通信。 从中间件的定义可以看出,中间件是类软件,而非一种软件。中间件 不仅仅实现互连,还要实现应用之间的互操作,是基于分布式处理的软件。 中间件在分布式系统中的位置如图2 ,1 所示旧。 2 1 2 中间件的分类 随着计算机软件技术的发展,中间件技术也已经日渐成熟,并且出现了 不同层次、不同类型的中间件产品。 宏观上,从中间件所起的作用来看,中间件技术可以分为三大类: 9 哈尔滨工程大学硕士学位论文 _ _ _ _ _ i j i _ 一r ( 1 ) 数据类:用于数据的存取、利用和增值,此类中问件用于构建以数据 为中心的应用。 ( 2 ) 处理类:把分布在网络节点上的各个应用或处理连接在一起,形成一 个统一的、协同工作的分布式应用。 ( 3 ) 分布式构件类:支持构件式应用,未来应用的发展方向,目前竞争激 烈。 a p i 中间件 图2 1中间件在分布系统中的位置 而按照i d c 的分类方法,中间件则可细分为六类,分别是:数据访问中 间件、基于远程过程调用的中间件、消息中间件、交易中间件、对象中间件 和终端仿真屏幕转换中间件等。 需要注意的是,中间件的分类是随着技术的进步而不断变化和拓展的。 上面的分类是比较传统和经典的,随着电子商务和企业信息化建设的深入, 中间件的类型会更加丰富起来。 本文中利用数据类的中间件对不同平台、不同数据结构的数据进行迁移。 2 。1 3 中间件的作用 由于标准接口对于可移植性和标准协议对于互操作性的重要性中间件 已成为许多标准化工作的主要部分。对于应用软件开发,中间件远比操作系 统和网络服务更为重要,中间件提供的程序接口定义了一个相对稳定的高层 应用环境,不管底层的计算机硬件和系统软件怎样更新换代,只要将中间件 升级更新,并保持中间件对外的接口定义不变,应用软件几乎不需任何修改, 】0 哈尔滨工程大学硕士学位论文 从而保护了企业在应用软件开发和维护中的重大投资。 世界著名的咨询机构t h es t a n d i s hg r o u p 在一份研究报告中归纳了中间 件的十大优越性唧: ( 1 ) 应用开发。t h es t a n d i s hg r o u p 分析了1 0 0 个关键应用系统中的业务逻 辑程序、应用逻辑程序及基础程序所占的比例:业务逻辑程序和应用逻辑程 序仅占总程序量的3 0 ,而基础程序占了7 0 ,使用传统意义上的中间件一 项就可以节省2 5 6 0 的应用开发费用。如果用新一代的中间件系列产品来 组合应用,同时配合以可复用的商务对象构件,则应用开发费用可节省至 8 0 。 ( 2 ) 系统运行。没有使用中间件的应用系统,其初期的资金及运行费用的 投入要比同规模的使用中间件的应用系统多一倍。 ( 3 ) 开发周期。基础软件的开发是一件耗时的工作,若使用标准商业中间 件则可缩短开发周期5 0 * 0 - 7 5 。 ( 4 ) 减少项目开发风险。研究表明,没有使用标准商业中间件的关键应用 系统开发项目的失败率高于9 0 。企业自己开发内置的基础( 中间件) 软件是 得不偿失的,项目总的开支至少要翻一倍,甚至会十几倍。 ( 5 ) 合理运用资金。借助标准的商业中间件,企业可以很容易地在现有或 遗留系统之上或之外增加新的功能模块,并将它们与原有统无缝集合。依靠 标准的中间件,可以将老的系统改头换面成新潮的i n t e m e t i n t r a n e t 应用系统。 ( 6 ) 应用集合。依靠标准的中间件可以将现有的应用、新的应用和购买的 商务构件融合在一起进行应用集合。 ( 7 ) 系统维护。需要一提的是,基础( 中间件) 软件的自我开发是要付出很 高代价的,此外,每年维护自我开发的基础( 中间件) 软件的开支则需要当初 开发费用的1 5 - 2 5 ,每年应用程序的维护开支也还需要当初项耳总费用的 1 0 2 0 左右。而在一般情况下,购买标准商业中间件每年只需付出产品价 格的1 5 2 0 的维护费,当然,中间件产品的具体价格要依据产品购买数量 及哪一家厂商而定。 ( 8 ) 质量。基于企业自我建造的基础( 中间件) 软件平台上的应用系统,每 增加一个新的模块,就要相应地在基础( 中间件) 软件之上进行改动。而标准 的中问件在接口方面都是清晰和规范的。标准中间件的规范化模块可以有效 1 1 哈尔滨工程大学硕士学位论文 地保证应用系统质量及减少新旧系统维护开支。 ( 9 ) 技术革新。企业对自我建造的基础( 中间件) 软件平台的频繁革新是极 不容易实现的( 不实际的) 。而购买标准的商业中间件,则对技术的发展与变 化可以放心,中间件厂商会责无旁贷地把握技术方向和进行技术革新。 ( 1 0 ) 增加产品吸引力。不同的商业中间件提供不同的功能模型,合理使 用,可以让你的应用更容易增添新的表现形式与新的服务项目。从另一个角 度看,可靠的商业中间件也使得企业的应用系统更完善,更出众】。 总的来说,中间件能屏蔽低层操作系统的复杂性,使程序开发人员面对 一个简单而统一的开发环境,减少程序设计的复杂性,将注意力集中在自己 的业务上,不必再为程序在不同系统软件上的移植而重复工作,从而大大减 少了技术上的负担1 2 1 1 。 2 2x m l 技术 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ,可扩展标记语言) 是由w 3 c 组织于 1 9 9 8 年2 月制定的一种通用语言规范,是( s g m ls t a n d a r dg e n e r a l i z e dm a r k u p l a n g u a g e ) 的一个简化子集。它以一种开放的自我描述方式定义数据结构,在 描述数据内容的同时能突出对结构的描述,从而体现出数据之间的关系。因 此,目前正在迅速成为网络资料交换的标准。x m l 技术自出现以来,发展非 常迅速,在许多领域内得到广泛的支持,有着广阔的应用前景。 2 2 1x m l 简介 x m l 是一种界定文本数据的标准方法,它允许用户创建用来描述数据信 息的标记,并可以通过d t o ( 文档类型定义) 或者x 池s c h e m a 来进行有效性的 验证。x i d l 和h t 扎不同,它并没有在可视化的表现形式方面下功夫,而更注 重数据本身。删l 文档具有高度结构化的特点,结构化层次中的描述标记表 达了数据本身的信息,所以x m l 文档集合了文本文档和纯数据文档的优点, 成为统一数据及其意义的载体。x m l 给出了一个不与平台相关的规范,为不 兼容的各种平台提供了一种有效的中间体,减少了移植的麻烦。 1 x m l 的主要特性和优点 ( 1 ) x m l 是一种元标记语言,只定义了一套元句法。即定义了用于定义 1 2 哈尔滨工程大学硕士学位论文 其它与特定领域有关的、语义的、结构化的标记语言的句法语言。用户可以 根据需要定义自己的标记。这种可扩展特性使得x m l 能被用于各种领域。 ( 2 ) x m l 描述的是数据的结构和语义,而不是格式,即x m l 有效地实现 了数据与格式的分离。表示的是所描述数据的层次结构关系以及数据本身的 含义,丽数据的格式,则可以通过相关的样式表进行描述。此特性使使用者 可以将其用于各种结构信息的表示。同时,对于同一x m l 文档内容,通过 使用不同的样式表,可以对它进行不同格式的输出。 ( 3 ) x m l 使用独立于平台与语言的文本格式来表示数据,这便使得它成 为在不同的应用间交换数据的理想格式。人们可以利用任何理解x m l 的工 具来处理数据。 由于x m l 具有的诸多特点,现正被广泛应用于三个主要领域:简单的 数据表示与交换、面向消息的计算以及和用户界面相关、表示相关的应用。 本文中即应用x m l 来进行数据的交换。 2 x m l 与h t m l 的关系 h t m l 是x m l 的先驱。h t m l ( h y p e r t e x tm a r k u pl a n g u a g e 超文本标识 语言) ,它的优点是比较适合w e b 页面的开发,但是它有一个缺点就是标记相 对少,只有固定的标记集,如 、 等,不能支持特定领域的标记语 言,对数学、化学、音乐等领域的支持比较少。举个例子来说,开发者很难 在w e bp a p e r 上表示数学公式、化学分子式和乐谱。 3 h t m l 的局限性 h t m l 对整个w w w 几年来的蓬勃发展 1 9 1 、知识和信息的流通,可谓是 第一功臣,在短短几年之内,h t m l 己成为信息交流的最通用的标准格式。 无论是网络电子商务,还是个人间的文件信息交流,无处不在使用h t m l 。 可以说,h t m l 直接推动了一场前所未有的信息革命。 然而,尽管h t m l 在人机界面方面很成功,但却非常不利于机器问的相 互交流与信息传递。其不足之处具体体现在以下几个方面: ( 1 ) 扩展性差:h t m l 是符合s g m l 语法的一种固定格式的超文本标记 语言,因其格式固定,敬难以扩展。浏览器供应商虽然可通过以非标准的扩 展的方式来获得市场份额,但这容易造成对w e b 的交互操作性的破坏。 1 3 哈尔滨工程大学硕士学位论文 ( 2 ) 交互性差:当用户需要与应用进行频繁交互时,使用h t m l 不容易实 现。因为频繁的请求处理使w e b 服务器不堪重负,虽然动态m m i 可以把 一些处理交给浏览器完成,但在这方面它远不及x m l 。如果想对同一数据以 不同的视角进行观察时,h n 仉的办法是请求服务器重传另一个页面给浏览 器,这无疑更加重了服务器及网络的负担。而如果使用x m l ,则可以在本地 完成排序、过滤和进行其它的数据操作。 ( 3 ) 语义性差在h t m l 中,所需信息( 如产品名和产品价格等) 可能隐藏在 文档的任何地方,没有任何特别之处,计算机无法将其从文档中识别出来, 因此也就谈不上对其进行更深入的处理。h t m l 没有考虑语义性,因此它至 少在电子数据交换( e d i ) 、数据库应用和搜索引擎三个方面存在极大的不足。 帆与m _ m l 相对比,各自的优缺点如表2 1 所示: 表2 ,1x m l 和m m i ,对照表 比较内容 h t m lx m l 元标记语言,可用于定义新的 可扩展性不具扩展性 置标语言 不要求标记的嵌套腕对 严格要求嵌套,配对,和遵循 语法要求等,不要求标记之间具有 d t d 或s c h e m a 定义 一定的顺序 交互性及可维护性 难于阅读维护结构清晰,便于阅读维护 内容描述与显示方式整合 数据和现实的关系内容描述与显示方式相分离 为一体 编辑及浏览工具已有大量编辑羊浏览工具编辑和浏览工具尚不成熟 2 2 2 扩展样式语言x s l 扩展样式语言x s l ( e x t e m i b l es t y l e s h e e tl a n g u a g e ) 是w 3 c 标准,为x m l 文档迸行标准格式化。它包括两个标准:格式和转换。格式标准定义了一系 列格式对象的格式语义,转换标准逐渐演变成一种语言,用来自动把一个 x m l 文档转换成另外一个x m l 文档,这个语言就是扩展样式转换语言x s l t ( e x t e n s i b l es t y l e s h e e tl a n g u a g ef o rt r a n s f o r m a t i o n s ) 。x m l 内部使用扩展的 x p a t h 语言来定位x m l 文档的某个部分嗍。 h t m l 网页使用预先确定的标识( t a g s ) ,这就是说所有的标记都有明确的 含义,例如t 妒- 是另起一行办l 是标题字体。所有的浏览器都知道如何解析 和显示h t m l 网页。然而,x m l 没有固定的标识,使用者可以建立其需要 1 4 哈尔滨工程大学硕士学位论文 的标识,所以浏览器不能自动解析它们,例如 可以理解为表格,也可 以理解为桌子。由于x m l 的可扩展性,使使用者没有一个标准的办法来显 示l 文档。 为了控制3 e v i l 文档的显示,有必要建立一种机制,c s s 就是其中的一 种,但是x s l ( e x t e n s i b l es t y l e s h e e tl a n g u a g e ) 是显示x i v l l 文档的首选样式语 言,它比c s s 更适合于) 跚l 。 x s l 可以被用来定义x i v i l 文档如何显示,可以将3 l m l 文档转换成能 被浏览器识别的h t i v i l 文件,通常的,x s l 是通过将每一个3 0 v l l 元素“翻 译”为h 聊l 元素,来实现这种转换的。 x s l 能够向输出文件里添加新的元素,或者移动元素。x s l 也能够重新 排列或者索引数据,它可以检测并决定哪些元素被显示,显示多少。 2 2 3x m l 文档格式定义语言 x m l 文档具有格式良好和有效性两种约束。格式良好是指x m l 格式严 格满足y d v i l 标准中对于格式的规定,此约束适合于所有的3 a v i l 文档。格式 良好是对咀。文件的基本要求,它使得沮。文件结构清晰、完整,便于处 理程序对其进行解析。但有时x i v i l 的格式良好性约束还不能满足人们的要 求,当在一个较大的范围内使用) a v i l 文档数据格式进行数据交换、处理时, 对x m l 数据的语义约束就显得非常重要,当x m l 文档一定的语义约束时则 称该龇文档为有效的x m l 文档。对沮,文
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山体喷浆挂网施工方案
- 中国邮政2025遵义市秋招寄递物流运营类岗位面试模拟题及答案
- 新乡市烟草公司2025秋招财务会计类岗位面试模拟题及答案
- 咨询合作方案
- 白酒行业品牌定位策略研究:2025年高端白酒消费者饮酒场景与市场趋势洞察
- 白酒行业2025年消费者饮酒场景与品牌情感营销策略研究
- 2025小区消防应急预案编制与演练组织协议
- 中国邮政2025盐城市秋招综合管理职能类岗位面试模拟题及答案
- 2025年儿童早教中心经营许可及资产转让协议
- 淄博市经开区应急预案
- 十大医药代表成功经验分享
- 医患沟通技巧与人文关怀课件
- 消防设施正确使用与操作指南
- 超声引导下经支气管针吸活检术核心组织采集率的影响因素分析介绍演示培训课件
- 养护队组建方案
- 绘本《其实我很喜欢你》冯玉梅
- 铸牢中华民族共同体意识主题班会
- 应急管理行政执法案卷立卷规范
- 沉降观测记录表(标准版)
- 第十章青霉素和头孢菌素C
- 绿色建筑材料和建筑设备
评论
0/150
提交评论