




已阅读5页,还剩52页未读, 继续免费阅读
(计算机应用技术专业论文)基于eai的水路运输集成框架研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 目前,水路运输行业的各港航管理部门逐渐建立起了各自的港航信息管理系统,但 这些系统在开发时由于缺乏统一的规划,因此采用的开发平台、开发技术以及后台数据 库均有不同,形成了一个个“信息孤岛”。这些系统无法互通互联,造成数据流通不畅, 无法信息共享,更无法实现对水路运输整体情况的掌控,严重影响了水利运输工作效率。 本文的研究背景为大连港务集团的实际项目,水路运输整体平台框架的开发。针对 以上问题本文以企业应用集成( e n t e r p d s e a p p l i c a t i o n i n t e g x a t i o n ,e a i ) 的思想为出发点, 将e a i 当今主要采用的j 2 e e 技术和w e bs e r v i c e s 技术的各自优点相结合,对水路运输 集成框架进行了研究和设计。针对当前一些港航信息管理系统难于升级和修改的特点, 考虑到基于w e bs e r v i c e s 的企业应用集成会对现存异构系统产生高度入侵,从而导致工 作量巨大的问题,引入了j 2 e e 的相关技术和机制。利用j 2 e e 连接器架构( j c a ) 解决了 将现存的异构资源集成起来的问题。同时,针对该集成框架信息共享的需求,利用模式 映射中的基于x m l 的映射模型对各港航管理系统的异构数据源进行了数据集成。针对 共享信息可能不仅包括存储在数据库中的结构化数据,而且还有存储于文件系统、 h t m l x m l 文档等系统中的半结构化和无结构化数据的特点,利用基于x m l 的集成 数据模型,采用全局映射和局部映射实现了异构数据源的数据集成,完成了数据迁移, 实现了信息共享,达到了以数据集成辅助应用集成的目的。 水路运输集成框架的研究与实现,很好的解决分布、异构数据库中数据的集成和共 享问题,显著地提高了水路运输部门的工作效率。同时由于系统实现方案具有通用性, 将对其他交通运输行业集成平台的设计开发具有指导意义。 关键词:水路运输;企业应用集成;数据集成 大连理工大学硕士学位论文 r e s e a r c ho n i n t e g r a t i o nf r a m e w o r k o f w a t e r a g eb a s e d o ne a i a b s t r a c t c u r r e n t l y ,t h ew a t e r w a ya d m i n i s t r a t i o no ft r a n s p o r th a v eg r a d u a l l yd e v e l o p e dt h e i ro w n m a n a g e m e n ti n f o r m a t i o ns y s t e m b e c a u s eo fl a c ko fi n t e g r a t e dp l a n n i n g , t h ep r o b l e mo f i n f o r m a t i o ni s l a n dc o m e so u tw i t ht h ed i f f e r e n c ei nt h er e s p e c t so fd e v e l o p m e n tp l a t f o r m , t e c h n o l o g ya n dd a t a b a s em a n a g e m e n ts y s t e m a sar e s u l t , t h e s es y s t e m sc a n tc o n n e c ta n d s h a r ei n f o r m a t i o nw i me a c ho t h e r , o rs u p e r v i s et h ew h o l ew a t e r a g es y s t e m , w h i c hs e r i o u s l y a f f e c t e dt h ee f f i c i e n c yo f w a t e r w a yw a n s p o r t t h er e s e a r c hb a c k g r o u n do f t h i sp a p e ri st h er e a lp r o j e c t o f w a t e r a g ep l a t f o r mf r a m e w o r k i nd a l i a nh a r b o rg r o u p w i t ht h ei d e o l o g yo f e n t e r p r i s ea p p l i c a t i o ni n t e g r a t i o na st h es t a r t i n g p o i n t , ad e s i g na n dr e s e a r c ht ot h ei n t e g r a t i o nf r a m e w o r ko fw a t e r a g ei sp r o p o s e db y c o m b i n i n gt h ea d v a n t a g e so fj 2 e ea n dw e bs e r v i c e sw h i c ha r em a i n l yu s e di ne n t e r p r i s e a p p l i c a t i o ni n t e g r a t i o n w i t hav i e w t ot h a ts o m ei n f o r m a t i o nm a n a g e m e n ts y s t e m so f h a r b o r a l ed i f f i c u l tt ou p g r a d ea n dm o d i f y , a n dc o n s i d e r i n gt h a te n t e r p r i s ea p p l i c a t i o ni n t e g r a t i o n b a s e do nw e bs e r v i c e sw i l lc a u s es e r i o u si n b r e a kt oi s o m e r i cs y s t e mw h i c hm a yb r i n gh u g e v o l u m eo fw o r k , c o r r e l a t i v et e c h n o l o g ya n dm e c h a n i s mo fj 2 e ea r ea d o p t e di nt h i sp a p e r t h ep r o b l e mo fi n t e g r a t i n gt h ei s o m e r i cr e s o u r c ei ss o l v e db yu s i n gj c a m e a n w h i l e , a c c o r d i n gt o t h er e q u i r e m e n to fs h a r i n gi n f o r m a t i o nf o rt h i si n t e g r a t i o nf r a m e w o r k , t h e i s o m e r i cd a t as o u r c e so fe a c hm a n a g e m e n ts y s t e ma r ci n t e g r a t e db yu s i n gm a p p i n gm o d e l t h a tb a s e do ns c h e m am a p p i n go fx m l b a s e do nt h es h a r i n gi n f o r m a t i o ni n c l u d e sn o to n l y t h es t r u c t u r a ld a t as t o r e di nd a t a b a s e ,b u ta l s oh a l f - s t r u c t u r a la n dn o - s t r u c t u r a lt h a ts t o r e di n f i l es y s t e ma n dh t m l x m ld o c u m e n t , t h i sp a p e ri n t e g r a t e st h ei s o m e r i cd a t a s o u r c 七, a c c o m p l i s h e si n f o r m a t i o ns h a r i n ga n dd a t ai n t e g r a t i o na s s i s t i n ga p p l i c a t i o ni n t e g r a t i o nb y u s i n gi n t e g r a t e dd a t am o d e lb a s e do nx m la n dm a k e su s eo fg l o b a lm a p p i n ga n di n c a m a p p i n g t h er e s e a r c ha n da p p l i c a t i o no fw a t e r a g ei n t e g r a t i o nf r a m e w o r ks o l v e st h ed a t a i n t e g r a t i o na n ds h a r ep r o b l e mo fd i s t r i b u t e da n dh e t e r o g e n e o u sd a t a b a s e s ,s i g n i f i c a n t l y i n c r e a s e st h ew o r ke f f i c i e n c yo fw a t e r w a ya d m i n i s t r a t i o n b e c a u s et h es y s t e ma p p l i c a t i o ni s g e n e r a l ,i ti sf a v o r a b l et ot h ed e s i g na n dd e v e l o p m e n to fi n t e g r a t i o np l a t f o r mi nt h eo t h e r t r a n s p o r t a t i o ni n d u s t r i e s k e y w o r d s :w a t e r a g et r a n s p o r t ;e n t e r p r i s ea p p l i c a t i o ni n t e g r a t i o n ;d a t ai n t e g r a t i o n 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 作者签名: 型固日期:迎整盎i 壁堡王盔:兰堕主婴塑生堂垡丝奎 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解大连理工大学硕士、博士学位 论文版权使用规定”,同意大连理工大学保留并向国家有关部门或机构送 交学位论文的复印件和电子版,允许论文被查阅和借阗。本人授权大连理 工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也 可采用影印、缩印或扫描等复制手段保存和汇编学位论文。 作者签名: 窿盛 导师签名 左耋型 蹲上月- l 日 大连理工大学硕士学位论文 引言 e a i 是对企业中完成不同业务功能的应用系统进行集成,在它们之间建立起可供数 据交流和应用沟通的中枢系统,以使不同的企业信息系统能够协调地配合工作。传统e a i 架构模式多采用点对点的通讯方式,这会使得网络流量随着节点的增加而急剧增加,通 讯接口的开发量也是呈指数增长的。针对这类问题,w e bs e r v i c e s 等一些新的技术元素 被引入到e a i 中,很好地解决了传统e a i 的问题。尽管如此,基于w e bs e r v i c e s 的e a i 依 然存在着对原有系统侵入过高的问题,并且对e a i 的应用也多局限在e r p 的相关领域, 在水路运输等交通行业领域尚未找到可以借鉴的先例。 要进行以上的应用集成,必须先进行数据的集成。数据集成是把不同来源、格式、 特性的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。通过从一 个数据源将数据迁移到另外一个数据源或直接进行局部数据源的全局访问来完成数据 集成。数据集成能够解决数据的分布性和异构性问题。但前提是被集成的应用必须公开 数据结构,即必须公开表结构、表间关系、编码的含义等。 ( 1 ) 选题背景 本课题来源于大连港务集团的水路运输整体平台框架的实际项目。水路运输行业是 国家交通行业的重要组成部分,有着独特的管理运营方式,其管理手段和流程有着严格 的规定和规则,且涉及到很多的港航单位和部门。由于采用先计划后调整以及各部门相 对独立的管理方式,使得在实际的实施中,其实际的工作方式是各港航单位先进行人工 的沟通协调,然后再利用各自的管理系统进行发布实施。这样既不能做到信息的及时更 新,也无法对水路运输的整体情况进行掌控,更无法在突发情况下对水路运输进行整体 的,及时的,有效的调整。所以该项目的主要目的是,将现有的各港航单位的港航管理 系统集成到统一的平台框架上来,实现各业务系统的互通互联,实现水路运输基础数据 的统一和共享,从而实现水路运输的全局掌控,为突发状况下进行全国水路运输的整体 协调调度做准备。 ( 2 ) 本文主要工作 首先,本文针对要集成到统一平台框架下的一些港航管理系统难于升级和修改的特 点,为避免基于w e bs e r v i c e s 的企业应用集成对现存港航异构系统产生高度入侵的危险, 引入了j 2 e e 的相关技术和机制。利用j 2 e e 连接器架构( j c a ) 解决了将现存港航异构系 统集成起来的问题。利用基于j 2 e e 应用服务器和基于w e bs e r v i c e s 技术的应用集成在 技术上具有很好的互补性,把这两种最具发展前景的e a i 方案结合起来。这种新型的集 成框架能够在很少入侵或者不入侵原系统的情况下实现对现存港航异构系统的集成。 基于e a i 的水路运输集成框架研究 其次,针对共享信息可能不仅包括存储在数据库中的结构化数据,而且还有存储于 文件系统、h t m l x m l 文档等系统中的半结构化和无结构化数据的特点,利用基于 x m l 的集成数据模型,采用全局映射和局部映射实现了异构数据源的数据集成,完成 了的数据迁移,实现了信息共享,达到了以数据集成完成功能集成的目的。 具体工作如下: 研究了w e bs e r v i c e s 的技术标准以及j 2 e e 连接器架构的基本原理,给出了w e b s e r v i c e s 与j 2 e e 相结合的水路运输集成框架模型,并对框架模型的设计与实现进行了详 细的分析。给出了水路运输集成框架中的主要功能组件及它们所依赖的相关接口,包括 通用客户端接口( c c i ) 和服务提供方接口( s p i ) 。 运用了多种设计模式的思想,使得开发出的连接器架构只要修改简单的配置同 样也可以插入到遵循了j c a 规范的其他j 2 e e 应用服务器当中,实现了软件的松耦合、 可配置性及可重用性。 在研究了多种模式映射技术和各港航异构系统的基本模式结构的基础上,给出 基于x m l 的异构数据映射模型( x m l - b a s e dh e t e r o g e n e o u sd a t am a p p i n gm o d e l , x h d m m ) 作为水路运输集成框架的公共数据模型。给出了全局模式到输出模式之间的 全局映射以及输出模式到局部模式的局部映射,解决了m m m 模型与关系数据模型 之间的映射问题。 将x h d m m 模型实际应用到了水路运输集成框架的数据集成模块中,验证了水 路运输集成框架的可行性,实现了集成框架的数据集成功能。 ( 3 ) 本文组织 本文共分五章,引言部分介绍选题背景;说明了相关技术的研究情况;总结了本文 所做的主要工作。 第1 章介绍了企业应用集成的发展,集成层次,相关技术及研究现状和面临的问题。 第2 章介绍了模式映射的相关知识,包括模式结构、公共数据模型、核心技术等。 第3 章研究了j c a 应用集成架构,给出了w e bs e r v i c e s 与1 2 e e 相结合的水路运输 集成框架模型,并对该模型的c a 连接器架构,做了详细的分析和设计实现的说明。 第4 章给出了水路运输集成框架基于x m l 的公共数据模型x i - i d m m ,以及全局映 射和局部映射的实现。 第5 章介绍了数据集成的具体实现过程,包括局部模式映射、定制约束关系、数据 采集以及保存全局元素簇映射关系等功能的实现。 最后,总结全文,并对后续研究开发进行了展望。 大连理工大学硕士学位论文 1 企业应用集成综述 企业应用集成( e n t e r p r i s ea p p l i c a t i o ni n t e g r a t i o n ,e a i ) 是将业务流程、软件、标准 和硬件结合起来,在两个或更多的企业应用系统之间实现无缝集成,使它们就像一个整 体一样进行业务信息处理和信息共享【l j 。e a i 不仅包括企业内部的应用系统和组织的集 成,还包括企业与企业之间的集成,以实现企业与企业之间的信息交换、商务协同、过 程集成和跨企业的业务流程集成等。 1 ,1发展概述 企业应用集成技术是伴随企业信息系统的发展而产生和演变的。在2 0 世纪6 0 年代 到7 0 年代期间,企业应用大多是用来替代重复性劳动的一些简单设计。当时并没有考 虑到企业数据的集成,惟一的目标就是用计算机代替一些孤立的、体力性质的工作环节。 到了2 0 世纪8 0 年代,有些公司开始意识到应用集成的价值和必要性。这是一个巨 大挑战,很多公司的技术人员都试图在企业系统整体概念的指导下对已经存在的应用进 行重新设计,以便让它们集成在一起。典型的方法是采用点对点方式,在各个应用系统 之间通过各自不同的接口进行点对点的简单连接,实现部分信息的共享。 2 0 世纪9 0 年代,e r p 应用开始流行的时候,简单的点对点连接已经很难满足不断 增长的应用集成要求,这就必须引入e a i 。对e a i 的需求首先来自于企业将它们的主机 系统转换成c s 结构系统的过程中,其次是利用e r p 建立企业骨干信息系统时。企业 迫切需要一种方法,让它们少写程序,无须花巨大的费用,就可以将各种旧的应用系统 和新的系统集成起来。采用r p c ,o d b c ,面向消息的中间件( m o m ) 等中间件技术的 e a i 方案在一定程度上解决了上述问题。 9 0 年代后期,世界经济一体化进程的发展和企业竞争的日趋加剧,企业整合不同的 应用来获取竞争优势日趋迫切。信息的集成从e r p 延伸到s c m ,c r m ,o a 以及大量 的现存系统等。分布式对象技术( d o t ) 在e a i 方案中得到了较大的应用,把企业级软件 包,企业内各种现存系统以及企业间业务过程集成起来。 近年来,随着i n t e r n e t 在各个领域应用的普及和深化,企业迫切需要能够方便地实 现i n t e r n e t 上跨平台、语言独立、松散耦合的异构应用的交互和集成,这对e a i 又提出 了新的要求。同时w e bs e r v i c e s 作为一种新的技术应运而生,提出了面向服务的分布式 计算模式,用于在i n t e r n c t i n t r a n c t 上使用标准的x m l 协议和信息格式来展现商业应用 服务。 基于e a i 的水路运输集成框架研究 1 2 集成层次 e a i 解决方案是以多种层次和模式出现的,其最终目的是使一个企业可以快速、方 便地将不同应用程序集成到一起。从实施的深度,从易到难可以分为以下几个层次【2 】: ( 1 ) 表示层集成 表示层集成是集成最简单的方式之一。在这种模式中,般使用软件用户界面来实 现对多种软件的集成。通过提供一个统一的界面( 主要是浏览器) 来代替原来应用系统的 不同的图形界面,从而隐藏不同应用程序的后台实现细节。根据用户对统一界面的操作, 会自动调用原来不同的应用系统,避免了用户在不同应用界面之间的切换,从而简化了 操作,提高了效率。 ( 2 ) 数据层集成 数据层集成的基本思想是跳过显示界面与业务逻辑模块,直接进入应用软件的数据 结构或数据库来创建新的集成,具体包括数据共享、数据转化、数据移植及数据复制等。 这样的集成可能只需要简单访问软件所使用的数据库管理系统,也可能需要与应用程序 所管理的文件或用户数据库进行更加复杂的集成。 数据层集成是现有e a i 解决方案的最普通的一个形式。与表示层集成相比,它更灵 活,能提供更广泛的数据访问,允许用户访问完整的一套信息或其中一部分。数据集成 一旦完成,可以被其他集成方案复用。但是,每种集成都与种数据模型相联系。如果 数据模型发生改变,那么集成就会被破坏。这就使数据集成对变化非常敏感。同时直接 的数据访问也可能为数据损坏和打开安全缺口提供了可能。 ( 3 ) 应用层集成 应用层集成的目的在于从其他新的或现有的软件中调用现有的功能,通过把不同的 应用程序连接起来,以共享和利用信息,使不同应用系统中的信息可以在整个企业范围 内共享。应用层集成要求集成点存在于应用程序代码内,集成处可能只需要简单的使用 公开的a p i 就可以访问,因此这种集成可以通过软件接口来实现。 ( 4 ) 业务流程层集成 业务流程层集成是一种面向过程集成,通过集成实现信息系统商业流程的管理。当 对业务过程进行集成的时候,企业必须在各种业务系统中定义、授权和管理各种业务信 息的交换,以便改进操作,减少成本、提商响应速度。业务过程集成包括业务管理、进 程模拟以及综合任务、流程、组织和进出信息的工作流。还包括业务处理中每一步所需 要的工具。 大连理工大学硕士学位论文 1 3 相关技术 1 3 1w e bs e r v i c e s 技术 w e bs e r v i c e s 是一种基于现有的被广泛接受和成熟的i n t e r n e t 技术的分布式应用程 序技术框架,由w 3 c 和i n t e m e t 工程任务组( i e t f ) 等组织设计【3 】o 可以这样大概地描述w e bs e r v i c e s ,w e bs e r v i c e s 是一种基于w e b 的分布式计算技 术框架,目的是方便各种平台上的以各种不同语言和技术开发的分布式应用程序之间的 相互协作和交互1 4 】。它建立在一些成熟的技术基础上,以可扩展标记语言( “l ) 技术为 基础,通过基于x m l 技术的w e b 服务描述语言w s d l 对提供的服务进行封装,然后 通过统一的定义、查找和集成协议( u d d i ) 在i n t e m e t 发布该服务及提供服务的企业和组 织的相关信息,供现有的或潜在的客户以一些标准的方式访问。其最大优势就是提供了 跨平台的,用不同语言编写的各种程序之间交互的一系列标准。 x m l 作为一种i n t e m e t 上的数据交换标准,其应用范围从早先的w e b 信息描述发 展到后来的数据交换的开放标准,乃至目前的服务集成和服务交换的开放技术。x m l 已经成为开放环境下描述数据、描述信息的标准技术,它是w e bs e r v i c e s 平台中表示数 据的基本格式瞪j 。w e bs e r v i c e s 的全部规范、技术都是以x m l 为底层核心和架构基础的。 无论是w e bs e r v i c e s 的调用s o a p ,w e bs e r v i c e s 的描述w s d l ,还是w e b s e r v i c e s 的发现u d d i ,都是使用x m l 作为信息描述和交换的标准手段。 s o a p 是w e bs e r v i c e s 交换x m l 信息的标准协议。对于w e bs e r v i c e s 来说,s o a p 主要用来通过x m l 文档传递方法参数,进行w e bs e r v i c e s 调用。它使用现有的基于 t c p ,m 的应用层协议h t t p 、s m t p 、p o p 3 等,可以获得与现有的网络通讯协议最大程 度的兼容。 w s d l ( w e bs e r v i c e sd e s c r i p t i o nl a n g u a g e ) 是定义如何利用x m l 语法描述w e b s e r v i c e s 的规范。大多数w e bs e r v i c e s 都带有w s d l 文档,指定应用程序提供的w e b s e r v i c e s 信息,w s d l 文档描述了客户调用w e bs e r v i c e s 的获取地址( 一般是一个h t t p u r l 地址) 、可供调用的方法、每个方法的输入输出参数类型。 统一描述、发现和集成协议( u n i v e r s a ld e s c r i p t i o n ,d i s c o v e r ya n di n t e g r a t i o n ,u d d i ) 是一套基于w e b 的、分布式的、w e bs e r v i c e s 信息注册中心的实现标准。同时也包含一 组使企业能将自身提供的w e bs e r v i c e s 注册以便使别的企业能够发现的访问协议的实现 标准。借助u d d i 所定义的功能,程序或程序员能够定位到合作伙伴所提供的w c b s e r v i c e s 的信息,然后按照这些合作伙伴的w e bs e r v i c e s 所提供的调用标准进行集成并 与之相容。企业也可以使用u d d i 找到潜在的合作伙伴。 基于e a i 的水路运输集成框架研究 1 3 2 , 1 2 e e 连接器架构 ( 1 ) j 2 e e 连接器架构体系结构 j 2 e e 连接器架构( 简称j c a ) 是一个遵守j 2 e e l 3 及以上版本规范的应用程序服务器 上实现的,同时需要一个由e i s 厂商提供的遵守j c a 规范的资源适配器【6 1 。这个资源适 配器在j 2 e e 应用程序服务器中是一个e i s 专用的可插入组件,它提供了一个用于与底 层e i s 系统通信的接口。 j c a 框架中主要定义了系统级协议和应用级协议。 系统级协议和服务:定义了j 2 e e 组件、应用程序服务器和e i s 系统之间的标准接 口。这些协议和服务是由j 2 e e 服务器提供者实现的,并且也位于e i s 厂商提供的资源 适配器中。 应用级协议:定义了一组通用客户接口( c o m m o n c l i e n t i n t e r f a c e ) ,是j 2 e e 组件( 如 j s p ,e j b ) 与e i s 系统连接或交互的一个客户a p i 。除了j 2 e e 客户组件之外,它还允许 非管理的应用程序( 如j a v aa p p l e t 和应用程序客户端) 使用一个遵守j c a 的资源适配器 与一个e i s 集成。 ( 2 ) 资源适配器 j c a 协议的实现依赖于应用服务器和资源适配器的共同支持。其中系统协议所定义 的一组服务提供接口的实现( s p i ) 分由应用服务器端和资源适配器端两部分来完成,而 应用级协议所定义的通用客户接口( c c i ) 则主要是由资源适配器来实现的。资源适配器 在j c a 中是很重要的一部分,它在应用组件、应用服务器以及e i s 资源之问扮演着连接 桥的角色。在j 2 e e 应用程序服务器中,资源适配器运行在应用程序服务器的地址空间 中,并且管理着对基层e i s 的连接。资源适配器的打包及实施过程与在一个j 2 e e 容器 中实施e j b 或w e b 组件相似。 1 4 研究现状及面临的问题 从当前国内外的e a i 工程实践中产生了各种e a i 体系结构和实现的技术方法。其 中最受关注的是j 2 e e 技术框架和w e bs e r v i c e s 技术在企业应用集成中的应用。 企业应用集成非常困难的原因之一是没有一个标准的框架实现与异构系统之间的 通信。因此,e a i 中使用j a v a 的开发者必须为每个连接器编写代码。为了解决这个问题, s u n 公司和它的合作伙伴提出了一个j 2 e e 连接器体系结构标准( j a v ac o n n e c t o r a r c h i t e c t u r e ,j c a ) ,j c a 是j 2 e e l 3 规范的一部分。j 2 e e 连接器通过一个标准架构和 一个统一接口的定义,在基于j 2 e e 平台的企业应用与现有各种企业信息系统( e i s ) 如 日冲、c r m 和传统数据库等的集成方面,解决了当前软件开发商和应用服务厂商所面 大连理工大学硕士学位论文 临的许多棘手问题。首先,在j 2 e e 平台范畴内解决了多功能的集成问题;其次,让现 有各种e i s 和基于j 2 e e 的应用服务器做到了“即插即用”。就是说,任何支持j 2 e e 标准 的应用服务器都能够十分简单地与j 2 e e 连接器架构实现连接,可以很方便地自由调用 基于j 2 e e 连接器架构的某一e i s 的资源适配程序并实现其功能。 w e b 油i 螂溴成平台 u s o a p x m le 柚 s o a p m 姆b u s t tt t n s c “i e e sp r o v i d e r 几 a d 呷舀斋;,瞄s a 驴l 和却;而器s a 弘 h d k 盱 b r o k e r 圈圈 匣囝 图1 _ l 基于w e bs e r v i c e s 的企业应用集成模型 f 适1 1 e a im o d e lb a s e do nw e bs e r v i c e s w e bs e r v i c e s 是一种标准化的松耦合集成模式,比较适用于那些需要更大的灵活性, 改动频繁的应用集成系统。它彻底改变了传统e a i 中点对点的集成处理方式,以一种松 散的w e bs e r v i c e s 捆绑集合形式能够快速、低代价地开发、部署、发现和动态绑定应用。 基于w e bs e r v i c e s 的应用集成模型如图1 1 所示。可以看出,基于w e bs e r v i c e s 的 e a i 解决方案需要很高程度的侵入现存系统,通过对现存系统的包装使其适合作为w c b s e r v i c e s 被调用。因此现存系统必须被修改和更新,以包括一个w e bs e r v i c e s 栈,这个 栈处理所有的s o a p 消息分析和现存系统的调用。在具体实施中这是一项庞大的任务。 同时,通过w e bs e r v i c e s 集成的遗留系统必须把系统中的数据转换成x m l 来传输, 然后再转换成使用w c bs e r v i c e s 的客户端的编程语言格式。如果e a i 系统使用客户端 - w e bs e r v i c e s - 服务器中间件_ 本地集成适配器遗留系统这种途径进行数据传输, 那么遗留系统中的数据将沿着一种不良的路径转换,即本地格式_ 本地集成适配器转换 的语言格式- x m l 转换一 使用w e bs e r v i c e s 的客户端的语言格式。在这个过程中很有 可能造成数据的丢失。 基于e a l 的水路运输集成框架研究 2 模式映射相关知识 在异构信息系统集成中,由于各局部数据源的数据模式是由不同的用户,在不同的 时间和地点,基于不同的数据模型独立地设计的,它们之间可能存在着各种差异和冲突。 为了实现用户对多数据库系统的透明访问,需要研究一种方法能在系统全局层屏蔽这些 差异和冲突。但是,我们不能简单地通过修改局部模式来解决这一问题,集成系统的一 个基本特征是要保证各局部数据源的自治性,必须保证那些建立在原有各自数据源上的 应用( 开发这些应用往往已投入了巨额的资金) 仍然能够继续运行。通常采用的解决办法 是在异构系统集成中构造一个全局模式,这一全局模式是由各参与的成员系统中的局部 模式经过一定的模式变换得到的【”。 2 1 模式结构 异构信息系统集成的模式结构决定了模式映射的层次和查询处理的流程。一般采用 四级模式结构来表达集成系统中的模式层次,它包括以下四种模式【s 】。 ( 1 ) 局部模式( l o c a ls c h e m a ) 。局部模式由局部数据源的数据模型来表示,不同的 局部模式有不同的数据模型,如对象模型、关系模型等。 ( 2 ) 输出模式( e x p o r ts c h e m a ) 。通过将局部模式翻译成标准数据模型得到输出模 式,这个翻译过程将在局部模式类与输出模式类之间建立一种映射关系。 ( 3 ) 全局模式( g i o b a ls c h e m a ) 。集成多个输出模式以产生全局模式,它会产生有关 数据分布的映射信息。通过查询管理器将全局模式中的查询传输到相应的输出模式。全 局模式有时也叫联邦模式。 ( 4 ) 外模式( e x t e r n a ls c h e m a ) 。外模式是为一个用户或一个应用定义的模式,主要 用来存放那些不能由输出模式导出的附加信息,包括与用户紧密相关的全局模式的信息 子集和一些附加的一致性约束等。 2 2 公共数据模型 异构信息系统集成和传统分布式数据库系统的主要区别在于全局模式的定义方式 不同。传统分布式数据库的全局模式是各局部数据库全体数据的逻辑集成,它为分布式 数据库提供了全局概念视图。而异构信息系统集成的全局模式是各局部数据源的非紧密 集成,它表达了各局部数据源中共享数据的集成,其它非共享数据仅供局部应用使用。 与此同时,集成系统中各局部数据源可能有各自不同的数据模型。 大连理工大学硕士学位论文 为了解决集成系统中各成员系统数据模型的异构性,集成多个数据模型的系统必须 提供一个模型中概念与另一个模型中概念的映射,最常用的方法是提供一个公共数据模 型( c o m m o nd a t am o d e l ,c d m ) ,每个成员模型被映射到c d m 上。公共数据模型和公 共数据语言是对异构型分布式多数据库系统实现异构性同一化、分散性集中化的基础【9 1 。 选择公共数据模型和公共数据语言一般遵循以下两个原则: ( 1 ) 公共数据模型和公共数据语言与成员数据库系统的数据模型和数据语言之间 应易于相互转换。这要求公共数据模型应尽可能简单。 ( 2 ) 公共数据模型和公共数据语言应该能很方便地表达集成系统中的数据和处理 过程,能支持面向结构化和半结构化数据的处理。 公共数据模型定义了集成系统中的输出概念模式,与此对应,全局数据模型则定义 了集成系统的全局概念模式。公共数据模型和全局数据模型可以是相同的,也可以是不 同的,例如使用面向对象模型作为公共数据模型【1 0 1 ,以方便集成不同类型的局部数据模 型,而使用关系数据模型作为全局数据模型,因为大多数用户对s q l 比较熟悉。 2 3 模式映射 在异构信息系统集成中,有三个数据层:全局数据层、输出数据层和局部数据层。 全局数据层是为全局用户创建的,它仅包含全局模式而不含具体的对象,是一个虚拟数 据库。输出数据层包含基于公共数据模型的输出模式,它也是一个虚拟的数据库,对应 于不同的局部数据源模式,有不同的输出模式。局部数据层包括数据库系统、文件系统、 h 1 m i m l 文档等数据源,它包含实际的数据对象,不同的局部系统有不同的局部模 式和数据表达方法。 在异构系统集成的四级模式中,如果不考虑针对不同应用的外模式,全局用户访问 的是全局模式,要获得全局访问的结果,就必须通过输出模式再到局部模式,将针对全 局模式的查询转换为针对局部模式的局部查询,才能得到具体的数据。因此,在全局模 式、输出模式和局部模式之间必定存在一种映射机制将它们维系起来,这就是模式映射。 在进行模式集成时,集成系统的管理员将局部模式翻译为输出模式,然后集成这些 输出模式得到全局模式,在这一集成过程中,就可以建立全局模式到输出模式以及输出 模式到局部模式的映射。图2 1 描述了异构信息系统集成中模式集成的过程以及模式映 射的结构。系统中主要有两种类型的模式映射:全局映射( g l o b a lm a p p i n g ,g m ) 和局部 映射( l o c a lm a p p i n g ,l m ) 。全局映射是全局模式的一部分,局部映射是输出模式的一 部分,它们将全局模式、输出模式和局部模式联系在一起。关于模式映射有如下定义。 一9 一 基于e a i 的水路运输集成框架研究 模式映射( s c h e m am a p p i n g ) :异构信息系统集成中全局模式与输出模式、输出模式 与局部模式之间联系的集合,称为模式映射。模式映射描述了异构信息系统集成中全局 模式的对象最终是如何从局部数据源中获取数据的【1 1 】。全局模式与输出模式之间的映射 又称为全局映射,输出模式与局部模式之间的映射又称为局部映射。 厂 厂 厂 外模式外模式 外模式 弋= 1 f 歹7 一孑7 一 - 一 一一 模式翻译 全局映射 模式截取 - - - - 一 - - - - 模式集成 局部映射 直接映射 全局数据层 ( 全局数据模型) 输出数据层 ( 公共数据模型) 局部数据层 ( 局部数据模型) 图2 1 模式集成过程与模式映射结构 f i g 2 1 m o d e l i n t e g r a t i o n p r o c e s s a n ds t r u c t u r e o f s c h e m a m a p p i n g 2 3 1 模式映射的基本形式 ( 1 ) 全局模式( g l o b a l a s - v i e w ,g a v ) 方法 g a v 方法是将各地数据源的局部视图映射到全局视图,即全局模式被描述为源模 式上的组视图。用户查询直接作用于定义在数据源模式上的全局视图。g a v 方法的优 点是查询效率比较高,缺点是用这种方法构建出来的映射关系的可扩展性较差,不适合 数据源存在动态变化的情况。为一旦有任何一个局部数据源发生改变,全局视图都必须 进行修改,维护起来较困难,开销也较大。g a v 是较早以前提出的方法。 ( 2 ) 局部模式( l o c a l a s v i e w ,l a v ) 方法 大连理工大学硕士学位论文 l a v 方法是种新的、更适合数据源特点的语义映射关系构建方法。l a v 方法是 将全局视图映射到各数据源上的本地局部视图,即各数据源模式被描述为全局模式上的 视图。当用户提交某个查询时,中介系统通过整合不同的数据源视图决定如何应答查询。 这种方法可看做利用视图回答查询。该方法的优点是映射关系的可扩展性好,适合于信 息源变化比较大的情况,缺点是可能会造成“信息遗失”、信息查询效率低。 l a v 方法有如下两个显而易见的好处。 描述数据源变得更简单容易了。描述( 即视图) 只用描述本地数据库就可以了, 不必再描述用户查询需要涉及到的其他的数据源和各数据源之间的关系。由于有这种特 性,当有新的数据源要加入进来时,数据集成系统可以非常容易地适应,因为每个视图 仅描述这个数据库的内容。在实际应用的数据集成系统中,往往要涉及到成百上千个数 据源,而且经常需要去除旧的不用的数据源,加入新的源,再做集成,所以这个容易更 新再集成的特性是极其重要的,所以l a v 方法是现在最流行的数据集成方法。 对数据源的描述更加精确了。因为源的描述( s o l t r c ed e s c r i p t i o n ) 在视图定义语言 的表达能力中起着最关键的作用,因为系统能够选取一个最小数量的数据源集合来回答 一个特定的查询,所以比较节省时间和系统开销。 目前兴起的g l a v ( g l o b a l 1 0 c a l a s - v i e w ) 映射方法是一种g a v 和l a v 方法相结合 的产物,它是由全局模式上的视图与各数据源上的视图相结合形成的。g l a v 方法可以 结合g a v 和l a v 的优势,能够为数据集成系统提供更具表达能力的语义映射。 2 3 2 模式映射中的核心技术 ( 1 ) 模式匹配 在数据集成领域中,由于数据源系统多是独立开发,数据源是相当自治的,因此描 述数据的数据模型或存储结构经常会出现不同的情况,使得不同数据源模式的匹配变得 困难。数据源的自治性和数据源模式匹配的复杂性加大了模式匹配的难度。这些正是模 式匹配的焦点问题,它们形式上的性质使得人们想到要用模式匹配去解决逻辑、语义和 知识的描述问题。 对于描述模式匹配中的冲突问题有两种较有代表性的分类。第一种分类将冲突分为 异类冲突、命名冲突、语义冲突和结构冲突。第二种分类主要是对第一类异类冲突概念 的一个细致的改进,但和其它分类仍有细微的不同,它把异类冲突看作是语义不一致的 一类( 如语义冲突) ,把冲突分为命名冲突、域冲突、元数据冲突,结构冲突、属性丢失 和硬件软件不同。 基于e a i 的水路运输集成框架研究 多种匹配方法可以相互结合,例如混合匹配( h v
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 景区拍照安全知识培训课件
- 景区安全生产培训会讲话课件
- 2025年荆门市“招硕引博”考试考前自测高频考点模拟试题及答案详解(夺冠系列)
- 低压电气安装技术交底文档范文
- 加油站员工绩效考核实施方案
- 幼儿园营养配餐及食品安全管理
- 2025甘肃平凉市灵台县粮油购销储备有限责任公司招聘会计人员1人模拟试卷及一套完整答案详解
- 不同人群对暖膏中天然成分的反应差异研究-洞察及研究
- 小学二年级科学实验教学设计
- 八年级物理上学期期末模拟题
- 核桃肽粉生产技术规程(征求意见稿)编制说明
- 《储能技术》课件-3.各种类型的蓄能技术
- (2025)企业首席质量官培训考核试题(附含答案)
- 2024年丽水市莲都区事业单位招聘真题
- 农业现代化种植技术培训课件
- 中城汽车(山东)有限公司审计报告
- 锂电池pack工厂安全培训课件
- 大学博士竞赛试题及答案
- 钢结构彩钢瓦施工工艺与技术交底
- 2025版煤矿安全规程宣贯培训课件
- 梁启超家教家风课件
评论
0/150
提交评论