




已阅读5页,还剩75页未读, 继续免费阅读
(计算机软件与理论专业论文)基于cscw的异构数据库集成技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着i n t e r n e t 迅猛发展,w e b 网站的信息资源为人们的学习和生活提供了极 大的方便。如何将来自于各种各样数据源的数据通过网络实现共享,利用网络上 宝贵的资源提高网络信息服务质量,己经成为当前研究的一个热点问题。如何保 证各个数据库之间的数据相互访问,消除异构数据库中数据的冲突、异常,成为 一个重要的研究方向,异构数据源集成是整合企业各项信息和对企业实现有效管 理的基础。 计算机支持的协同工作( c s c w ) 是一个多学科交叉和支持的新兴研究领域, 它是最新信息技术与人类社会传统的协作方式相结合的产物。利用协同工作提高 整个企业的效率,成为现代信息企业的目标。 本文首先论述课题的研究背景和理论基础,对c s c l r 、w e bs e r v i c e s 和x 札 技术进行简单的介绍;然后分析当前异构数据库集成管理技术和异构数据库管理 系统,针对现有异构数据库系统协同性的不足,详细探讨了异构数据库管理系统 和c s c w 相结合的可能性,研究异构数据库协同工作可能带来的闯题,以及c s c w 环境下异构数据库管理系统的新特性,提出了基于c s c w 的异构数据库集成策略。 数据库集成技术可以有效地检测数据异常、尽早地调整数据、消除数据的不 完整和不一致,从而有助于提高信息综合利用的质量。本论文在基于c s c w 的异构 数据库集成方面展开研究,主要是解决在分布式、异构环境下的数据源的访问以 及数据交换问题,并对数据库集成的三个关键技术问题一元数据、分解合并器、 查询器进行设计与实现。 关键字:c s c w ,w e bs e r v i c e s ,x m l ,异构数据源,数据提取集成 童! 些奎兰! :耋堡圭兰堡竺兰 。 a b s t r a c t w a ht h ed e v e l o p m e n to ft h et e c h n o l o g yo fs u p p l y i n gi n f o r m a t i o ns e r v i c eo n i n t e r n e t ,i ti si n c r e a s i n g l yb e c o m i n go n eo ft h eh o tf o c u s e st h a th o wt o s h a r ed a t a b e t w e e na l lk i n d so f d a t as 0 1 硝c c sa n dh o wt oi m p r o v eq o s o fi n f o r m a t i o no ni n t e m e t w i t hs c a r c er e s o l n c e st h r o u g hn e t w o r k h o wt od e t e c ta n dr e s o l v ed a t ac o n f l i c t sa n d h e t e r o g e n e i t y a r ct h ef u n d a m e n t a li s s u e s t h ei n t e g r a t i o no f h e t e r o g e n e o u sd a t a b a s ei s t h ef u n d a m e n tf o ri n t e g r a t i n gt h ec a t e r p t i s e i n f o r n m t i o na n dr e a l i z i n ge f f e c t i v e i n a n a g c m e n t c s c wi san 删r e s e a r c hr c a h nw i t hm u l t i - k n o w l e d g ec r o s s e da n ds u p p o r t e d i t r e s u h s 盘o mt h ec o m b i n a t i o no fl a t e s ti n f o r m a t i o nt e c h n i q u e sa n dh u m a nc o l l a b o r a t i o n o f t r a d i t i o n a ls o c i e t y u s i n gt e a m w o r kt oi m p r o v et h ee f f i c i e n c yo f t h ee n t i r ee n t e r p r i s e h a sb e c o m et h em o d e r ni n f o r m a t i o ne n t e r p r i s eo b j e c t i v e f i r s t l y , t h i sp a p e rd i s c u s s e s r e s e a r c hb a c k g r o u n da n dt h e o r yf o u n d a t i o na n d s i i n p l yi n t r o d u c e sc s c w , w e bs e r v i c e s , x m l ,a n dt h e na n a l y z e sh e t e r o g e n e o u s d a t a b a s ei n t e g r a t i o nt e c h n o l o g y b a s e do nt h ea n a l y s i so nt h es h o r t c o m i n g so f e x i s t e n t h e t e r o g e n e o u sd a t ai n t e g r a t i o ns y s t e m , t h i sp a p e r d i s c u s s e si nd e t a i lt h ep r o b a b i l i t yo f c o m b i n i n gh e t e r o g e m o u sd a t ai n t e g r a t i o ns y s t e mw i t hc s c w , s t u d i e s t h ep r o b l e m so f h e t e r o g e n e o u sd a t a b a s ec o o p e r a t i v ew o r ka n d t h en e wc h a r a c t e r i s t i c so f h e t e r o g e n e o u s d a t a b a s ei n t e g r a t i o nm a n a g e m e n tb a s e do nc s c w , b l 缸g $ f o r w a r dt h eh e t e r o g e n e o u s d a t a b a s ei n t e g r a t i o ns t r a t e g y d a t a b a s ei n t e g r a t i o nt e c h n o l o g i e sp r o v i d ee f f e c t i v ec h a n n e l sf o rd e t e c t i n gd a t a h e t e r o g e n e i t y , m o d i f y i n g d a t a e a r l i e r , r e s o l v i n g d a t a i n c o m p l e t e n e s s a n d i n c o u s i s t e n c i e s ,a n df i n a l l yi m p r o v i n gd a t aq u a l i t yf o rc o m p r e h e n s i v eu s a g e t h i s p a p e rm a i n l ys o l v e st h ed a t ar e s o d i c o sc a l la n dt h ed a t ae x c h a n g ep r o b l e mb a s e do n t h ed i s t r i b u t i n ga n dh e t e r o g e n e o u sc o n d i t i o n , a n dr e s o l v e st h et h r e ek e yt e c h n o l o g i c a l p r o b l e m s - - - m e t a d a t a , d e c o m p o s e ra n d c o m b o q u e r y a b s t r a c t k e y - o r d s : c s c w ,w e bs e r v i c e s ,x m l , h e t e r o g e n e o u sd a t as o u r c e s ,d a t a i n t e g r a t i o n 独创性卢明 独创性声明 秉承学校严谨的学风与优良的科学道德,本人声明所呈交的论文是我个人在 导师的指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以 标注和致谢的地方外,论文中不包含其它人已经发表或撰写过的研究成果,不包 含本人或其他用途使用过的成果。与我一同工作的同志对本研究所做的任何贡献 均已在论文中作了明确的说明,并表示了谢意。 本学位论文成果是本人在广东工业大学读书期间在导师的指导下取得的,论 文成果归广东工业大学所有。 申请学位论文与资料若有不实之处,本人承担一切相关责任,特此声明。 一暾学 论文作者签字讳捣 2 0 0 7 年5 月9 日 第章绪论 第一章绪论 1 1 研究的背景和意义 随着信息交流和i n t e m e t 技术的发展,实现了全球范围的网络互联与通信, 各种多媒体文件和资料大量出现。这些文件和资料主要以数字形式存储在计算机 中,并通过网络传播,极大扩展了信息的来源,为人们提供了丰富的信息服务, 如电子商务、电子出版、远程医疗、网络购物、远程教育、视频点播等等基于 w e b 的新兴领域的全面兴起使得传统的w e b 资源更加复杂化、多样化。数据量 的日趋庞大对网络的传输能力也提出更高的要求。同时,人们对w e b 服务功能 的需求也达到更高的标准。比如:用户需要对w e b 进行智能化的语义搜索和对 数据按照不同的需求进行多样化显示等个性化服务:公司和企业要为客户创建和 分发大量有价值的文档信息“2 1 以降低生产成本。由于网络上提供的信息内容繁 多,这就需要将各种各样的信息资源进行统一的表示,对不同平台、不同格式的 数据源进行数据集成和数据转化将变的越来越广泛和迫切 在欧美等发达国家对信息技术的研究应用开始较早,并已经取得了一定的成 就,如已经实现了数字图书馆、知识点播等应用,成功地将异构数据源实现了集 成管理。我国的数据集成技术研究起步比较晚,目前研究主要集中在信息表示、 异构数据源共享、集成实现等方面目前主要的研究项目有国家8 6 3 数据库重大 专项课题“基于x m l 的数据集成、共享与交换”,国家8 6 3 高技术研究发展计 划计算机软硬件主题“支持w r e bs e r v i c e 的数据集成和中间件”以及国家9 7 3 重 点基础研究发展规划项目“万维网上的数据集成、数据仓储及知识发现的有效算 法与软件系统”等,通过这些专项课题的研究,积累了大量的科研、开发和应用 经验,掌握了异构系统数据集成共享技术等许多重大关键技术 异构数据源集成技术研究的目标之一是支持通过网络对多个异构数据源的查 询。它和异构数据库集成技术原理基本相同,但是网络的异构数据源集成还要处 理大量的、数目递增的数据源。网络的异构数据源集成除了集成具有规则结构的 数据之外,还需要集成半结构化的数据,甚至还有非结构化的数据0 1 。这些数据 源不仅数据模型不同,而且查询能力各异“1 给查询带来了新的问题。随着信息化 广东j :业大学i 学硕十学位论文 的不断深入,网络信息共享将成为未来社会的公共信息中心和枢纽,推动信息的 传播和应用,提高全社会信息化程度。 信息共享、集成程度将成为评价国家信息基础设施以及国家科技、文化水平 的一项重要标准。由于我国信息共享技术研究开展得比较晚,因此加强信息共 享、集成技术的研究、开发和应用就更加重要。 1 2 c s c w 与异构数据库 计算机的发展走出了一条从相互没有联系或联系困难的独立计算机到互连、 互操作、甚至协同工作的计算机群体的道路。当大量的用户都可方便地使用计算 机时,计算机才可能深入人们的工作和生活,并影响到人们的协作方式,进而使 计算机与我们的工作和生活融合到一起,形成新的在计算机支持下的人类协作方 式,提高人们的协作效率。现代的计算机协同工作c s c w 被普遍认为是下一个 世纪的人类工作方式。“计算机支持的协同工作”( c o m p u t e rs u p p o r tc o o p e r a t i v e w o r k ) 可以定义为:在计算机技术支持的环境中( 即c s ) ,一个群体协作完成一项 共同的任务( c w ) 碡1 。它的目标是要设计各种各样的协同工作的应用系统。它是 信息化进程发展的一种必然趋势。其原因有- - - :第一、人类社会是一个广泛紧密 协作的共同体,第二、网络技术的发展为信息社会的协同工作提供了物质基础, 第三、w e b 站点( 也称之为数据源) 信息的共享也要求数据之间协同工作。 在当前的c s c w 研究中,主要技术基础是计算机及计算机网络技术,主要 的动力来源于广泛的应用需求。其中许多关键技术还有待解决。这些关键技术的 深入研究是c s c w 应用系统出现飞跃的基础。 x m l ( e x t e n s i b l em a r k u pl a n g u a g e , 可扩展标记语言) 是i n t c r n e t 上数据表示 和数据交换的新标准。它是i s o ( i n t e r n a t i o n a lo r g a n i z a t i o nf o rs t a n d a r d i z a t i o n ,国 际标准化组织) 的s g m l ( s t a n d a r df o rg e n e r a lm a r k u pl a n g u a g e ,通用标记语言 标准) 的一个简化子集。x m l 关注信息本身,是w e b 上表示结构化信息的一种 标准文本格式。 在x m l 基础上发展起来的w e b 服务( w e bs e r v i c e ) 是一种革命性的分布式 2 第一章绪论 计算技术。它使用基于x m l 的消息处理作为基本的数据通讯方式,消除使用不 同组件模型、操作系统和编程语言的系统之间存在的差异,使异类系统能够作为 计算网络的一部分协同运行。开发人员可以使用像过去创建分布式应用程序时使 用组件的方式,创建由各种来源的w e b 服务组合在一起的应用程序。 使用w e bs e r v i c e 的集成技术作为一种新的面向函数和方法的应用集成技 术,在很大程度上解决了原有集成技术在i n t e m e t 远程通信方面的问题。w e b s e l n l c e 基于x m l 文档进行服务描述,服务请求和反馈结果,可以在i n t e m e t 上 通过h t r p 协议进行传递,很容易的被访问和返回结果。同时,由于w e bs e r v i c e 的相关标准都是w 3 c 的开放协议,与平台和操作系统无关,不同的平台和操作 系统上的w e bs e r v i c e 的实现在很大程度上可以做到互操作,这就使异构平台上 应用的集成变得很容易。此外,过去使用的基于l 心c ( i 心c r e m o t ep r o c c d l k e c a l l ,远程过程调用) 和a p i ( a p p l i c a t i o np r o g r a m m i n gi n t e r f a c e ,程序编程接口) 的集成技术都是一种函数级的静态解决方案( 即使它们在客户机和服务器通讯时 使用沮,) ;w e bs e r v i c e 则是一种动态的集成方案,所有的服务都可以通过 u d d i 标准动态地被发现、绑定和使用,容易适应系统的变动,提高系统的灵活 性和伸缩性。 1 4 论文的研究内容 计算机自诞生以来,被大量用于数据处理工作。由于在选择数据处理系统时 存在时间和空间上的差异,使得人们使用的数据源千差万别,这就相应的带来了 数据集成的问题。例如:一个集团内部的各个子公司分别根据自身要求选用了不同 的数据库,当要在集团内进行踌公司的数据处理时,就将牵涉到多种异构数据库。 这是空间上的异构;而一个企业在发展的过程中也往往需要随着情况的变化。升 级选用更适合的新系统,这是属于时问上的异构。近来,随着社会合作国际化的 加强,数据集成的要求愈发强烈。 本论文在基于c s c w 的异构数据库集成方面展开研究,主要是探讨和解决在分 布式、异构环境下的数据源的访问以及数据交换问题。 3 广东i ,业大学:学硕十学位论文 1 5 论文的结构和章节安排 全文共分七章,内容如下: 第一章为绪论,介绍论文的研究背景和意义,并对课题主要研究工作和组织 结构做简要说明。 第二章主要介绍c s c w 和w e bs e r v i c e s 技术,并分析了c s c w 和w e bs e r v i c e s 技术特点和适用范围。 第三章主要介绍异构数据库系统,着重介绍当前异构数据库的几个技术问题 以及实现异构数据集成应解决的问题。 第四章详细阐述x m l 在异构数据库集成中的作用,以及x m l 作为中间语言在 转换过程中的原理、思想精髓等重点问题。 第五章详细阐述基于c s c w 的异构数据库共享方案和设计思想,对系统的组成 部分功能进行详细的说明,并对系统的一些关键技术进行了讨论。 第六章从程序的概要设计出发,讲解如何实现异构数据库的集成,并对关键 问题给出了源代码或者伪代码。 第七章对已做的工作进行总结,并提出应进一步深入研究的问题 1 6 本章小结 本章首先详细论述基于c s c w 的异构数据库集成技术研究的背景,并对相关的 技术及概念做简要说明,最后给出本文的研究内容及组织结构。 4 叁三耋呈兰兰塑兰:! ! = 筌:篁尘 第二章c s c w 和w e bs e r v i c e s 简介 2 1 c s c w 技术 2 1 1 c s c w 简介 随着社会的发展和科技的进步,各种工作变得越来越复杂。以前完成一项工 作可能只要一个人或几个人就能胜任了,现在就不相同了,几乎每项工作的完成 都是许多人智慧的共同结晶,因此协同工作在当今社会变得日益重要。在协同工 作中最重要的问题是如何提高整个工作的效率。为此,在通信和计算机技术的日 益成熟的当今信息社会中,通信技术与计算机及其网络技术相融合,产生了一个 新的研究领域计算机支持的协同工作( c s c w :c o m p u t e rs u p p o r t e d c o o p e r a t i v ew o r k ) “。它的提出和实现将从根本上改变人们传统的工作方式和 生活方式。c s c w 的研究目标是利用计算机克服小组工作的时间和空间的障碍,以 取得更高的工作效率。 2 1 2 c s c w 系统的特点 c s c w 系统作为一种新型的计算机系统,通信、合作、协调是c s c w 的三要 素m 御,根据它的工作目标,应该满足以下的功能需求: 1 、分布性 c s c w 系统应支持地理位置上分散的多用户的工作,c s c w 本质上是一个分 布式系统,并且支持与协同无关的透明性。 2 、高性能和可靠性 c s c w 使一项任务由多个用户协同完成,无疑比单用户系统提高了工作的效 率,但信息在网络上的传输开销可能导致性能的降低。c s c w 系统应该具有很高 的可靠性,能对一些故障进行恢复,用户操作错误也不会引起整个系统的崩溃。 3 、信息共享 信息共享是协同工作的前提条件,在协同工作中采用不同种类的共享对促进 协同工作的效率是至关重要的。然而以往大多数的c s c w 系统是基于异步的消息 广东i 业大学f :学硕+ 学位论文 传递来协调多用户的协作的,限制了用户对信息的共享 4 、协作控制需求 c s c w 系统本质上支持人与人之间丰富的协同形式,c s c w 系统中协调控制 要求尽量反映这种丰富性,提供用户多种灵活的协同工作的方式,尽量使用户的 工作方式更自然、更灵活。 s 、系统的开放性 c s c w 应用提供了不同的模型和机制,或支持某一特定的协作活动,或支持 某一类的协作。每一类c s c w 应用代表了不同的协作模型,从各个方面支持了群 体问的协作,它们的功能比较单一,而实际的协作任务往往需要一定范围内的 c s c w 应用联合使用。因此,c s c w 系统往往需要具有综合性和通用性的协作支 持环境,以容纳这些协同应用。 2 i 3 c s c w 研究中的主要问题 设计一个c s c w 系统要考虑的因素很多,大致可以归结为两个方面:其一, 分析和认识合作工作的特征,并建立组工作模型,这是进行系统开发的基础;其 二,依据组工作模型,设计必要的机制以实现c s c w 系统的目标,这可以从4 个 方面来概括:通信机制、共享的工作空间、共享的信息空间和组活动支撑系统。 其中,通信机制是c s c w 系统的关键组成部分。 1 、组工作模型的建立 在c s c w 这一概念被提出后的几年里,出现了一大批属于c s c w 范畴的实 验性系统,但成功的并不多,究其原因主要在于设计者对合作工作的特征没有清 楚的了解与认识,也就是说,仅凭常识和实践经验难以设计出高质量的群件来。 g r u d i n 认为分析个人和小组在合作工作中的行为特征实际上是c s c w 研究的基 本组成部分,而其目的在于创建一个尽可能真实地反映客观实际的组工作模型, 为整个系统的开发设定基准。值得注意的是,社会科学方面的研究成果以及社会 科学工作者的参与对组工作模型的建立有着积极的作用。 w i l s o n 认为应当从4 个方面来理解和分析合作工作的特征。首先,工作组是 由个体构成的,所以每个成员的技能、知识水平、与他人交流的方式和个人的工 作习惯都会对组工作的效率产生影响;其次,合作工作总是在一定的组织内部进 6 第二章c s c w 和w c bs e r v i c e s 技术 行的,因而有必要分析组织的结构以及个人在这个组织框架内受到的约束和必须 遵循的工作原则;再次,计划和组织是提高工作效率的不可缺少的手段,所以工 作目标的确定、流程的安捧、个体在合作工作中所扮演的角色,如项目组织者、 一般参与者等,以及承担的责任等都是在建立模型时要考虑的因素;最后,合作 工作的动态特征也是建立模型时要涉及的问题,这包括工作组规模的变化、组成 人员角色的动态调整、通信方式对工作效率的影响等。总之,建立组工作模型是 一项常常被忽视,而实际上又是极复杂、重要的工作。 2 、共享的工作空间和信息空间 一个c s c w 系统的主要目的在于协助工作组成员完成同一任务,而共享空间 的创建是实现这一目标的先决条件。共享空间又可以进一步划分为共享的工作空 间和共享的信息空间,前者指的是一种能够反映工作组内任何成员活动的机制, 如会议系统中的白板;后者是一种允许组成员创建、存储、浏览和提取共享信息 的系统,如多用户的数据库系统 协调机制是实现共享的关键,而并发控制是其中的主要问题,目的在于解决 用户对共享空间访问的冲突。c s c w 系统的并发控制与传统的多用户系统的并发 控制有着本质的区别,后者力图使侮个用户认为自己是整个系统的唯一用户,而 前者,恰恰相反,相互感知到对方的活动则是其要达到的目的之一。所以,如何 在群件中完成并发控制是一个新的课题。c a e i l l s 等人在文章中列出了群件设计 中与并发控制相关的几个问题。 a 用户响应 用户响应是评估系统性能的重要指标,对群件这样的多用户系统而一言,可 以进一步分为响应时间和通知时间。响应时间是指用户的操作结果反映到本地界 面上所需的时间,而通知时间指的是用户的操作在其他组成员的界面上有所反应 所需的时间。一个实时c s c w 系统的并发控制机制应当能够确保用户操作有比较 短的响应时间和通知时间。 b 工作组界面 w y s i w i s ( w h a ty o us e ei sw h a tls e e ,你所见即我所见) 是设计组界面时要 遵循的基本原则。如果并发控制机制妨碍了工作组的所有成员同时一看到某个操 作的结果,相关的用户就不能“平等地”对共享空间中所发生的事件做出反应。 这实际上是一个组通信中的同步问题。 , 广东f 业大学i 学硕十学位论文 c 广域分布问题 群件的用户一般分布在不同的地理位置上,相应的微机或工作站通过网络相 联,因而数据传输的延时和差错都是并发控制算法要考虑的因素。 d 数据复制 数据的复制是指将共享数据同时拷贝到不同用户的节点上,用户之间通过交 换操作码及参数来完成对数据的处理。它是减少信息传送量,加快用户响应,提 高系统性能的一种方法,但这要求并发控制机制能够有效地维护数据的一致性。 2 2 w 曲s e r v i c e s 技术 2 2 1 w e bs e r v i c e s 的简介 从1 9 9 8 年开始发展的) m 几技术及其相关技术已证明实现不同实体间资源的 共享是有可能的。而近期蓬勃发展的w e bs e r v i c e s 技术。1 是基于x m l 技术的针对 资源共享的最佳解决方案之一,并降低实现共享的花费和加快解决方案的部署“”。 w e bs e r v i c e s 使用了一些建立在现存和正在出现的标准( 或协议) 之上的程序间通 讯模型,采用统一的方法进行服务的描述、注册、查询,解决了信息孤岛问题, 充分实现了信息的共享。这些标准( 或模型) 包括:h r r p ,可扩展标记语言( x m l ) , 简单对象访问协议( s o a p ) ,网络服务描述语言( w s d l ) ,统一描述、发现和集 成规范( u d d i ) 。对w e bs e r v i c e s 的理解可以从多个方面进行1 : 1 ) w e bs e r v i c e s 是一套标准,定义了应用程序如何在w e b 上搭建可互操作的 分布式应用程序的平台,实现跨平台的互操作性。 2 ) w e bs e r v i c e s 是一种部署在w e b 上的对象( w e bo b j e c t ) ,以一种松散的 服务捆绑集合形式,可以动态创建应用,是以x m l 为主的、开放的w e b 规范技 术“。 3 ) w e bs e r v i c e s 是一个作为服务发行的w e b 应用程序,具有自包含( s e l f c o n t a i n e d ) ,自描述( s e l fd e s c r i b i n g ) 以及模块化的特点,是可以通过u r l 定位 自动将信息返回需要它的客户端的一种资源。 4 ) w r e bs e r v i c e s 是一套用来将已有的应用进行拼装组合,提供信息,实现系 统集成的软件工具。 8 第二章c s c w 和w e bs e r v i c e s 技术 通过从不同方面对w e bs e r v i c e s 进行认识和理解,可以看出w e bs e r v i c e s 的 主要目标是通过使用统一标准,能够统一封装数据、消息、行为等,在无需考虑 具体应用环境下让不同系统跨越平台,彼此兼容,进行无缝通信和数据共享。w e b s e r v i c e s 实现的功能可以是响应一个简单的请求,也可以是完成一个复杂的商务 流程。 开发、实现w e bs e r v i c e s 的工具和语言有很多种,但是w e bs e r v i c e s 的调用 与具体实现无关,只要通过m 1 p 使用s o a p 协议就可以调用它,其构架都应如 图2 - l 所示“1 1 竺竺:竺i 幽r l t 协s e r v i c e s i 黧k 墼。一f 。警芸圈 圈歪产e 拦 图2 - 1w e bs e r v i c e s 架构 f i g u r e2 - lt h ea r c h i t e c t u r eo f w e bs e r v i c e s 一般过程是,w e bs e r v i c e s 提供者使用合适的编辑语言和工具开发出w e b s e r v i c e s 并部署使用,用户根据w e bs e r v i c e s 的w s d l ( w e bs e r v i c ed e s c r i p t i o n l a n g u a g e ) 服务描述文档中的信息生成一个s o a p 请求消息来调用这个w e b s e r v i c e s 。通常w e bs e r v i c e s 都是位于w e b 服务器后面,用户生成的s o a p 请求 会被嵌入在一个h t t pp o s t 请求中,发送到w e b 服务器,w e b 服务器再把这些 请求转发给w e bs e r v i c e s 请求处理器( r e q u e s th a n d l e r ) 。收到请求消息后,w e b s e r v i c e s 请求处理器就会解析收到的s o a p 请求,调用w e bs e l v i c 龆,然后再生成 相应的s 0 a p 响应消息。w e b 服务器得到s o a p 应答后,会再通过h t t p 应答的 方式把它送回到客户端。 2 2 2 w e bs e r v i c e s 的模型 w e b 服务体系结构是基于三种角色之间的交互,分别是服务提供者、服务注 册中心和服务请求者。交互涉及发布、查找和绑定操作。这些角色和操作一起作 用于w e b 服务构件一w e b 服务软件模块及其描述。服务提供者定义w e b 服 务的服务描述并把它发布到服务请求者或服务注册中心。服务请求者使用查找操 9 广东1 业大学r 学硕十学位沦文 作来从本地或服务注册中心检索服务描述,然后使用服务描述与服务提供者进行 绑定并调用w e b 服务实现或同它交互。图2 2 展示了这些操作、提供这些操作 的组件及它们之间的交互关系“”。 图2 - 2w e b 服务角色、操作和构件 f i g u r e2 - 1t h er o l e ,o p e r a t i o na n dc o m p o n e n to f w e bs e r v i c e s 2 2 3 w e bs e r v i c e s 的协议机制 要以一种可互操作的方式执行发布、发现和绑定这三个操作,必须有一个包 含每一层标准的w r e b 服务协议栈。图2 - 3 展示了一个概念性w e b 服务协议栈 j 6 1 “”。上面的每层都是建立在下面层次提供的功能之上。垂直的条表示在协议栈 中每一层必须满足的需求及所应用的标准技术。 l o 第二章c s c w 和w e bs e r v i c e s 技术 图2 - 3w e b 服务概念性协议栈 f i g u r e2 - 3w e b s e r v i c e sp r o t o c o l 2 2 4 w e bs e r v i c e s 的关键技术 1 可扩展的标记语言( 儿) x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 是针对包含结构化、半结构化信息的文 档而设计的一种标记语言。x m l 是元语言中的一种,所谓“元语言”,就是能够 帮助不同个人和组织定制自己的标记语言的语言,定制后的标记语言可以用于特 定的应用领域中实现信息数据的交换。x m l 是w 3 c 的一个开放标准,可以说它 是构建w e bs a w l c e 8 的基石。x m l 解决了在不同平台、系统之问的数据结构、模 式的差异,使得数据层在x m l 技术的支持下统一起来。 一个规范的x m l 文档必须满足两方面的条件,一,必须满足格式良好的要 求;二,必须是一个有效的x m l 文档。格式良好的x m l 文档指的是文档必须遵 守x m l 文档语法,而有效的x m l 文档指文档必须遵守d t d ( d o c u m e n tt y p e d e f i n i t i o n ,文档类型定义) 。 自x m l 诞生以来,其相关的各项技术和应用不断涌现,其标准和规范也在 不断完善规范之中。图2 - 4 是对x m l 特性标准的总结。 标准一驾说嘲 秘也s l m e t $t 陆m e s l m e e s防止不同软件钢豹名事目为重复葡麓生冲囊 i i p a t hl n g l l m ex t i -定位吏葺中的蝴 帆p o i n t e rl a 哪m 埘n t r 藐啊在文菪中自啦置 m 伽玎l _ 硼p期融订毫支籀量中蠢擅糕 竭钆n 疆撂r 田- n l 矾-撇对t 曩遗行格式转文 i h t e a s i b l e s t y l e s h e e tx 轧孰贾蕾格式表示t l 玑l l n l t i ql i 叫i h p 札j 喊连接素自不一定筒帕糯 柚l h l , 童曩比啪芰广泛的格式崽置 图2 4 x m l 特性标准 f i g u r e2 - 4x m l c h a r a c t e r i s t i cs t a n d a r d x m l 是w e bs e r v i c e s 平台中表示数据的基本格式。x m l 技术的提出,其初 广东i 业大学1 学昀十学位论文 衷是为了改善h t m l 的无结构化状况而造成的全球w e b 信息的结构混乱。x m l 规范的开发小组为了使得全球w e b 信息能够迈向结构化的方向,基于强大的 s g m l 语言制订了x m l l 0 规范。由于x m l 的处理器( p a r s e ) 在各种平台上都 被开发人员使用,所以大家不约而同地发现,使用x m l 在不同的异构系统之间 交换数据是一件方便的事情。首先,x m l 格式具备描述各种类型数据的能力;其 次,d o m s a x 为x m l 处理封装了一套有效的方法,使用d o m 或s a x 对x m l 进行处理,开发人员可以节省开发一些经常需要的文件格式处理模块;再次, x m l ,d o m 是w 3 c 规范,大家都会遵循规范,在不同平台的处理方式是完全一 致的。因此,很快,x m l 就成为应用范围极为广泛的数据交换的工具。目前使用 x m l 进行数据交换己经成为计算机软件领域,尤其是电子商务应用领域的标准技 术模式。在本文的原型系统中,采用x m l 作为中间语言,实现异构数据转换。 2 w e bs e r v i c e s 描述语言( w s d l ) w s d l 文档将w e b 服务定义为服务访问点或端口的集合。在w s d l “”中, 由于服务访问点和消息的抽象定义已从具体的服务部署或数据格式绑定中分离出 来,因此可以对抽象定义进行再次使用。消息是指对交换数据的抽象描述;而端 口类型是指操作的抽象集合。用于特定端口类型的具体协议和数据格式规范构成 了可以再次使用的绑定。将w e b 访问地址与可再次使用的绑定相关联,可以定义 一个端口,而端口的集合则定义为服务。 图2 5 展示了w s d l 文档的结构组织: 1 2 第二章c s c w 和w e bs e r v i c e s 技术 图2 5 w s d l 文档结构 f i g u r e2 - 5w s d ld o c u m e n ts t r u c t u r e 3 简单对象访问协议( s o a p ) s o a p 用于调用w e bs e r v i c e s ,是基于x m l 在分布式环境中交换信息的简单 协议。s o a p 是在x m l 基础上定义的,完全继承了x m l 的开放性和描述可扩展 性,它使用现有的基于t c p i p 的应用层协议h t r p ,s m t p ,p o p 3 等,可以获得 与现有通信技术最大程度地兼容。s o a p 本身并不定义任何应用语义( 如编程模 型或特定语义实现) ,它只是定义了一种简单的机制。它通过一个模块化的包装模 型和对模块中特定格式编码的数据重编码机制来表示应用语义 4 统一描述、发现和集成( 删) u d d i 规范中包含一个x m la lls c h e m a ,定义了一套用于注册和发现w e b s e n r h s 信息的基于s o a p 的程序接口。u d d i 提供了两种方法供商业实体将自己 的w e bs e r v i c e s 信息添加到u d d i 商业库中:商业实体可以通过登陆u d d i 成员 网站,以人工的方式注册信息:商业实体也可以通过一些支持u d d ia p i 的工具 来帮助添加注册信息。u d d i 商业库由多个成员站点组成,是一个逻辑上集中、 物理上分散的分布式数据库。商业实体只需要在任何一个u d d i 成员网站注册一 次,其信息将会自动分布到各个成员网站,供全世界的访问者查询。u d d i 的信 1 3 广东f 业大学i 学预+ 学位论文 息模型如图2 - 6 所示。 图2 - 6 u d d i 信息模型 f i g u r e2 - 6u d d ii n f o r m a t i o nm o d e l 5 w e bs e r v i c e s 流语言( w s n 。) w s f l 使用x m l 语法建模来描述w e bs e r v i c e s 架构内的工作流过程。w e b s a v i c e s 使应用程序能够在网络上无缝集成,而不必考虑它的编程语言和运行环 境。w e bs e r v i c e s 工作流使商业流程和利用了大量w e bs e r v i c e s 的交易生命周期 能够无缝集成。 6 分布式w e bs e r v i c e s 发现 w s i n s p e c t i o n 规范并非是定义了一种w e bs e r v i c e s 的描述语言,事实上,其 文档提供了一种方法来聚集不同类型的服务描述。在w s i n s p e c t i o n 文档中,一个 服务可以拥有多种对服务描述的引用。例如,既可以使用w s d l 文件,又能在 1 4 第二章c s c w 和w e bs e r v i c e s 技术 u d d i 注册中心描述一个w 曲服务。对这两种服务描述的引用,应该放在 w s - i n s p e c t i o n 文档中。如果一个w e bs e r v i c e 拥有多个服务描述的引用,把它们 全部放在w s i n s p e c t i o n 文档里的好处是显而易见的。这样,文档用户可以自由选 择能够理解、并希望使用的服务描述类型。 7 w e bs e r v i c e s 的运行机镧 在w e bs e r v i c e s 的开发中,服务提供者可以把已有的应用系统转换成w e b s e r v i c e s 的形式对外发布,也可以重新开发新的w e bs e r v i c e s 应用系统。在发布 w l bs e r v i c e s 时,服务提供者把所提供服务的接口和需要的数据类型及结构用 w s d l 进行描述,生成相应的w s d l 文件,在全球的u d d i 注册中心进行注册 服务请求者首先利用u d d i 浏览器浏览u d d i 注册服务器,查询到满足需求的 w e bs e r v i c e s 后,取得其地址,并将相应的服务描述文件( 即w s d l 文件) 下载 到本地服务器上,当服务请求者需要服务时,就依据相应的地址发起连接,应用 系统通过s o a p 协议和w e bs e r v i c e s 中的远程对象绑定在一起,进行请求的发送 和应答的接收。在基于x m l 消息传递的分布式计算中服务提供者和服务请求者 的基本要求是构建、解析s o a p 消息的能力,以及在网络上接收、发送消息的能 力。 2 3 小结 本章对论文中使用到的c s c w 和w e bs e r v i c e s 技术进行简单的介绍,重点介 绍c s c w 研究中的主要问题和w e bs e r v i c a g s 的关键技术。为论文后面,把c s c w 理念引入到异构数据库集成管理,通过w e bs e r v i c e s 机制实现异构数据库集成管 理打下技术基础。 1 5 广东i 业大学1 学硕十学位论文 第三章异构数据库系统 3 1 异构数据库系统 企业在发展过程中积累了大量数据,并为存储和管理这些数据不断投资。然 而,由于实施数据管理系统的阶段性、技术性以及其它经济和人为因素的影响, 以至即使在一个单独企业,采用的数据管理系统也大不相同,从简单的文件数据 库到复杂的网络数据库,它们构成了企业的异构数据源。尽管这些数据管理系统 能够满足数据存储和管理要求,但是在许多情况下,为完成一项工作,企业应用 可能需要访闽分布在网络不同位置上的多个数据管理系统中的数据。例如,某公 司需要了解套型架的生产和使用情况,那么,相关应用首先必须访问生产准备 科、工装所、以及使用车间的不同的数据库系统来提取相关数据,然后进行处理。 很显然,原有的数据管理系统并不能提供这种支持,需要一个强大的系统能够集
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 森林防火基层知识培训会课件
- 桶装水工艺培训课件
- 桥梁质量培训课件
- 桥梁知识培训心得体会
- 大面积脑梗死的护理试题及答案
- 2025年外企招聘面试技巧与模拟题解析英语专项
- 2025年市场营销专业岗位能力测试题库及答案解析
- 2025年电商物流行业招聘物流运营总监的面试技巧及参考答案
- (2025校招)人工智能工程师招聘笔试试题及答案
- 2025年电商行业运营经理招聘面试题解析
- 我们为什么要努力学习-励志主题班会(课件)
- JJF 2182-2024农灌机井取水量计量监测方法
- 工作交接表模板
- 人教版PEP四年级英语上册全册课件
- 数据治理与数据中台建设方案
- 全册(教案)人教精通版英语六年级上册
- DL-T5455-2012火力发电厂热工电源及气源系统设计技术规程
- 穴位贴敷治疗过敏性鼻炎技术
- 公司自行车管理制度
- 《剧院魅影:25周年纪念演出》完整中英文对照剧本
- 蒋诗萌小品《谁杀死了周日》台词完整版
评论
0/150
提交评论