已阅读5页,还剩65页未读, 继续免费阅读
(计算机软件与理论专业论文)电信企业数据仓库web服务的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,也信企业数据仓库w e b 服务的设计与实现 电信企业数据仓库w e b 服务的设计与实现 摘要 随着数据仓库技术的发展,很多电信企业都已经成功实施了数据 仓库系统。电信企业的数据仓库系统已经成为企业进行决策分析的重 要工具,电信企业内部的其它系统甚至电信企业外部系统也开始有访 问数据仓库系统应用的需求。问题也就随之产生,由于企业内部系统 异构性、紧耦合性的特点,系统间的访问非常困难,s o a 的出现恰恰 解决了这个问题,它使用w e bs e r v i c e s 技术有效的封装了应用实现 的细节,通过一系列的标准协议开发出与平台和编程语言无关的w e b 服务,从而降低了应用系统的耦合性并充分利用了现有的资源。 本论文围绕数据仓库对外提供w e b 服务展开。首先,概要的介绍 了数据仓库技术,并结合电信领域实际的数据仓库系统进行了应用分 析,总结出目前需要向外界提供服务的为报表和o l a p 。然后,详细 研究了w e b 服务技术和面向服务架构,明确了w e b 服务的定义、实现 方式以及面向服务架构与w e b 服务之间的关系。接着,根据对w e b 服 务和面向服务架构的研究和数据仓库的应用分析,设计出了基于面向 服务架构的数据仓库系统w e b 服务解决方案并根据解决方案进行了 系统的实现。该解决方案主要包括w e b 服务包装规范的设计和w e b 服 务注册发现系统的设计两个部分。w e b 服务包装规范设计是本文的 一个创新点,它包括报表和o l a p 的w e b 服务包装规范,作者将公共 仓库元模型规范中对报表和o l a p 元模型的定义引入到了规范的设计 中,它与描述w e b 服务的w s d l 规范相结合,根据元模型中定义的类 以及类之间的关系,定义出包装报表和o l a pw e b 服务所应该定义的 数据类型、消息以及操作,这种基于已有标准的设计方式使得w e b 服 务包装规范更具规范性和通用性,包装出的服务也更容易理解。w e b 服务注册发现系统的设计依据面向服务架构,该系统集成了面向服 务架构中服务注册者的角色。它的用户认证功能、w e b 服务查找功能、 w e b 服务注册功能以及w e b 服务集成功能为数据仓库w e b 服务提供了 基础性平台。论文最后对全文作了系统的总结,并提出下一步需要进 行的一些研究工作。 关键词:数据仓库报表o l a p 面向服务架构 w s d l 公共仓库元模型m v c l u 信企业数据仓库w e b 服务的硅汁7 0 实兕通信软件工程中,山 d e s i g na n di m p l e m e n to ft e l e c o m m u n i c a t i o nd a t a 矸白r e h o u s e 眦6s e r v i c e s a b s t r a c t a c c o r d i n g t ot h e d e v e l o p m e n t o fd a t a w a r e h o u s e , m a n y t e l e c o m m u n i c a t i o ne n t e r p r i s e sh a v eb e e ns u c c e s s f u l l yi m p l e m e n t e dd e c i s i o ns u p p o r t s y s t e mb a s e do nd a t aw a r e h o u s et e c h n o l o g y ,i ti sav e r yi m p o r t a n tt o o lf o rd e c i s i o n p r o c e s s e s ,a n dt h e r ea r eag o o dm a n yr e q u i r e m e n t st ou s et h i st o o l ,n o te v e nf r o mt h e i n t e m a lo ft h ee n t e r p r i s e ,b u ta l s of r o mt h ee x t e r n a lo ft h ee n t e r p r i s e b e c a u s et h e s y s t e m si n t h ee n t e r p r i s ea r ei s o m e r o u sa n dt i g h t l y c o u p l e d ,i ti s d i f f i c u l tt o c o m m u n i c a t eb e t w e e ns y s t e m s ,n o ws e r v i c e o r i e n t e da r c h i t e c t u r e ( s o a ) c a r ls o l v e t h ep r o b l e m ,s o ah i d e st h ed e t a i l so ft h es y s t e m ,a n dd e v e l o p sw e bs e r v i c e st h a ta r e i n d e p e n d e n tf r o mp l a t f o r m sa n dp r o g r m n m i n gl a n g u a g e sb yu s i n gas e r i e so f p r o t o c o l sa n ds t a n d a r d s i l lt h i sp a p e r , a u t h o rf o c u so nh o wt op r o v i d ew e bs e r v i c e si n 2 a t a w a r e h o u s e f i r s t l y , a u t h o ri n t r o d u c ed a t aw a r e h o u s et e c h n o l o g ya n da n a l y z et h e a p p l i c a t i o n si nt e l e c o md a t aw a r e h o u s e ,t h e na u t h o rf i n dt w ot y p e so fa p p l i c a t i o n s n e e dt op r o v i d ew e bs e r v i c e s ,t h e ya r er e p o r ta n do l a p s e c o n d l y , a u t h o rs t u d i e s w e bs e r v i c e sa n ds o ac a r e f u l l y , i n c l u d i n gt h ed e f i n i t i o na n dm a n n e ro fw e b s e r v i c e s ,a n dt h er e l a t i o n s h i p sb e t w e e nw e bs e r v i c e sa n ds o a t h i r d l y , b a s e do nt h e r e s e a r c h o fw e bs e r v i c e s ,s o aa n dt h ea n a l y s i so fd a t aw a r e h o u s ea p p l i c a t i o n s , a u t h o rw o r ko u tt h es y s t e ms o l u t i o no ft h ew e bs e r v i c e si nd a t aw a r e h o u s e ,a n d i m p l e m e n tt h es y s t e m t h es o l u t i o ni n c l u d e st w op a r t s ,t h ec r i t e r i o no fp a c k a g i n gt h e w e bs e r v i c e so fd a t aw a r e h o u s ea n dt h ed e s i g no fw e bs e r v i c e sr e g i s t r y d i s c o v e r y s y s t e m t h ec r k e r i o ni sac r e a t i v ei d e a a u t h o ri m p o r t st h ec o n l i n o n w a r e h o u s e m e t a m o d e l ( c w m ) i n t ot h ed e f i n i t i o no ft h ec r i t e r i o n b e c a u s et h em e t a m o d e lo f r e p o r ta n do l a ph a sb e e nd e f i n e dc l e a r l y , w ec a nu s et h e s em e t a m o d e l st oh e l pt h e d e f i n i t i o no fd a t at y p e sa n dm e s s a g e sa n d o p e r a t i o n si nt h ec r i t e r i o na n dp r o v i d em o r e a d a p t a b i l i t ya n dr e g u l a r i t y t h ew e bs e r v i c e sr e g i s t r y d i s c o v e r ys y s t e mi n t e g r a t e s t h er o l eo fs e r v i c ep r o v i d e ri ds o a a n di tp r o v i d e sa ni n f r a s t r u c t u r et oi m p l e m e n t 北京邮电大学顿士论文 乜信企业数据仓库w e b 胀务的设计与宴现通信软件工程中心 w e bs e r v i c e si nd a t aw a r e h o u s e f i n a l l y , a u t h o rs l l t n i i l a r i z e st h ew h o l ep a p e r , a n d p o i n t so u tt h er e s e a r c hw o r kn e e dt od oi nt h ef u t u r e k e yw o r d s :d a t aw a r e h o u s e r e p o r t o l a ps o ac w m 北京邮 b 大学顿:卜论文 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中 不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或 其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处 本人签名i 2 应 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权 保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅 和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印 或其它复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密 论文注释:本学位论文不属于保密范围,适用本授权书。 本人签名 导师签名 日期 日期 捌王2 _ 7 垦竺:2 :盟 。乜信企业数据仓库w e b 服务的啦汁与实现通信软件工程中心 第一章绪论 本章介绍了论文的研究背景和研究意义,以及数据仓库技术和s o a 架构的 国内外发展动态。最后说明了论文的研究内容和目标以及论文的结构。 1 1 论文研究背景与意义 在当前的i n t e r n e t 时代,企业的信息系统正在面临一次新的转折。在以电子 商务为特征的新的企业经营模式下,随着竞争的日益加剧,企业迫切需要消除“信 息孤岛”,使得各个信息系统的应用间既相互独立又能有效协同工作,可以将不 同的应用集成到一个完整的企业级信息化环境中,并能够实现与其它企业间的集 成。 但是由于目前企业内部系统的设计大都基于独立解决方案的实现模式,大多 数内部系统都是异构的,系统间应用的相互调用需要了解各系统的设计细节,实 现起来非常复杂,工作量也非常大。 电信企业同样也存在这样的问题,目前的电信企业内部系统繁多,系统之间 的访问比较困难,而第三方企业对电信内部系统的访问就更加困难。作为电信企 业中对决策支持超着举足轻重作用的数据仓库,系统怎样向其它内部系统甚至第 三方系统提供服务,怎样能够简单、透明的访问其它系统的服务,成为目前急需 解决的问题。 现有的一些分布式计算解决方案例如c 0 r b a 和d c o m 可以实现分布式调 用,但是它们有一些共同的缺点,首先它们都是紧耦合的,应用系统的两端都必 须遵守相同的a p i 约束,而且如果一个应用的代码有了更改,那么访问该对象的 代码也必须做出相应的修改。 s o a 的出现使异构系统间应用的相互调用成为可能,它可以基于w s d l 、 u d d l 、s o a p 、x m l 等标准,将系统的应用设计成标准统一的w e b 服务,在其 它系统调用服务时,只要遵循服务接口的标准定义,无需了解系统的具体细节。 这样就可以解决数据仓库系统对外提供w e b 服务的诸多困难。 通过s o a 架构在电信企业数据仓库领域的应用,将数据仓库中的应用包装 成为服务,这样其它的应用可以在不了解其它应用细节的情况下,访问s o a 架 构的应用服务器上的所有数据仓库应用,并有效地将商务逻辑和应用的具体实现 北京邮电大学硕士学位论文第1 页共6 6 页 u 信企业数据仓库w e b 服务的世汁与实玑通信软件工程中,t 相分离,其它的商业伙伴也可以方便的访问包装好的数据仓库应用。 1 2 国内外发展动态 随着数据仓库技术的发展,很多企业都已经成功地实施了数据仓库系统,数 据仓库系统中的报表服务、o l a p 服务、即席查询服务等已经成为企业分析决策 的重要参考。数据仓库的建立使企业内部的海量数据成为企业的重要资源。国内 的电信企业基本上都已经完成了数掘仓库系统一期的建设,报表应用、o l a p 应 用等都已经投入使用,以帮助企业的决策者和市场营销人员做出正确的决策。 w e b 服务正在成为分布式计算的革命性技术。它使用x m l 作为消息格式, s o a p 作为应用层通讯协议,w s d l 作为描述服务的语言,u d d i 作为服务注册 和服务发现手段。随着这种技术的广泛使用,一种新的架构方法s o a ( s e r v i c e o r i e n t e da r c h i t e c t u r e ) ,即面向服务的架构应运而生。s o a 目前已经被广泛的应 用,并将在几年内主导整个i t 产业。同时各大技术提供商都陆续推出了支持s o a 的开发工具,如i b m 的w e bs e r v i c et o o l k i t ,m i c r o s o f t 的v i s u a ls t u d i o n e t ,s u n 的s u n o n e 等。 电信企业内部系统实施s o a 是电信企业系统信息化的趋势,通过s o a 的成 功实施,电信企业内部系统的应用可以很容易地被访问,这有效提高了电信内部 系统的可重用性,并且s o a 松散耦台的特点也降低了系统之间的耦台性。国外 的一些电信公司已经开始关注s o a 或准备对企业实施s o a ,英国电信已经对企 业内部系统成功实施了s o a 。数据仓库作为电信企业内部至关重要的决策、分 析系统,需要对电信企业内部用户以及企业的合作伙伴、s p ( 服务提供商) 提供 应用服务,s o a 也为此提供了实现基础。 1 3 论文研究内容与目标 本论文的研究目标是,通过学习,牢固掌握数据仓库理论,深入了解数据仓 库中的报表应用和o l a p 应用。并围绕解决异构系统之间的互操作、集成和协作 的问题展开深入研究,掌握面向服务的体系架构以及业界的相关标准,包括 x m l 、s o a p 、u d d i 、w s d l 等。将s o a 与数据仓库技术相结合。其目的在于 使s o a 有效的应用于电信企业数据仓库系统。 本论文的研究和开发工作主要有以下几个方面: 1 对某运营商数据仓库系统的应用进行需求调研和分析,总结出需要包装 北京i c 【l i 也大学硕= l 学位论文第2 页共6 6 负 u 信企业数据仓库w e b 服务的i 5 计与实现通信软件工程中心 为w e b 服务的应用。 2 在分析面向服务的体系架构( s o a ) ,以及w s d l 、u d d i 、s o a p 等标 准规范的基础上,找出根据传统解决方案的不足,并得出基于s o a 的 数据仓库系统w e b 服务解决方案。 3 ,根据c w m 中对数据仓库系统应用的元模型描述,制定出描述数据仓库 系统应用的规范。这也是本论文论述的重点。 4 设计出实施s o a 的数据仓库w e b 服务的架构,并实现基于s o a 架构的 u b i sw e b 服务注册发现系统( u b i s w s r s 系统) 。这是本论文论述的 重点。 5 将o l a p 应用和报表应用包装为w e b 服务,使它们可以被其它系统所 调用。 6 实现并验证u b i s 系统w e b 服务,并对可行性进行分析。 1 4 论文结构 论文的结构安排如下: 第一章,绪论,介绍论文的研究背景与意义,国内外发展动态,论文的研究 内容和目标,最后介绍论文的组织结构 第二章,数据仓库及其应用分析,介绍数据仓库的定义和体系结构,根据某 运营商统一经营分析系统( 以f 简称u b l s 系统) 整理数据仓库应用服务需求, 并对数据仓库应用服务进行描述和分析。 第三章,基于面向服务体系架构与w e b 服务技术,介绍s o a 的体系结构和 w e b 服务协议栈,阻及w e b 服务与s o a 的关系,并介绍了怎样基于s o a 及相 关标准实现w e b 服务的描述、访问和注册。 第四章,数据仓库系统,分析传统分布式解决方案的缺陷,指出基于s o a 的w e bs e r v i c e 解决方案是如何解决这些问题的。并完成数据仓咩系统w e b 服务 设计规范以及w e b 服务注册发现子系统设计 第五章,u b i s 系统w e b 服务的实现和应用分析,包括对开发环境、服务器 部署的描述,并进行了应用分析和应用实例验证。 第六章,结束语,总结本论文内容,并对现有研究成果存在的问题提出了改 进意见,指出了继续研究和开发的方向。 北京邮电大学硕七学位论文 第3 页共6 6 页 i b 信企业数据仓库w e b 服务的设计与实现通信软件工程中心 第二章数据仓库及其应用分析 随着数据仓库技术的发展,应用数据仓库技术构建的决策支持系统越来越 多,某运营商根据企业决策支持和扩大企业市场的需要,也已经完成了基于数据 仓库技术的统一经营分析系统( 以下简称u b i s 系统) 的建设,u t 3 i s 系统的应 用比如报表应用、o l a p 应用、即席查询应用和数据挖掘应用,已经成为某运营 商进行企业相关决策和制定市场战略的重要工具。因此,对于u b i s 系统应用对 外提供服务的需求也越来越多,有必要对这些应用做认真的分析和研究。 2 1 数据仓库 2 1 1 数据仓库的定义 业界公认的数据仓库概念创始人w h i n m o n 在其著作( ( b u i l d i n gt h ed a t a w a r e h o u s e ) ) 一书中给予如下描述:数据仓库( d a t aw a r e h o u s e ) 是一个面向主题 的( s u b j e c to r i e n t e d ) 、集成的( i n t e g r a t e ) 、相对稳定的( n o n v o l a t i l e ) 、反映历 史变化( t i m ev a r i a n t ) 的数据集合,用于支持管理决策制定过程| l 】。对于数据仓 库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分 析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异 构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放 在数据仓库中的数据一般不再修改。 2 1 2 数据仓库的体系结构 企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基 础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供 它们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息 加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任 务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。 整个数掘仓库系统是一个包含四个层次的体系结构,具体由图2 1 表示。 北京邮电大学硕士学位论文第4 页共6 6 页 电信企业数据仓库w e b 胀务的设计与实现通信软件工程中心 日 e 3 匕 口 煮掘勰 n 1 3 曰 菇i * 隹市t 3 l a t 嬲鸯嚣 张递工且 鐾惑煎碑站 蝾矗工n 岛罾螂一 凰 图2 。1 数据仓库体系结构图 数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内 部信息和外部信息。内部信息包括存放于r d b m s 中的各种业务处理数据和各类 文档数据。外部信息包括各类市场信息、竞争对手信息和各种手工收集的信息等 等。 数据的存储与管理:是整个数据仓库系统的核心。数据仓库的真正关键是数 据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也 决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的 核心,则需要从数据仓库的技术特点具体需求着手分析。针对现有各业务系统的 数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的 覆盖范围可以分为企业级数据仓库和部门级数据仓库( 通常称为数据集市) 。 o l a p ( o n l i n ea n a l y s i sp r o c e s s ) 服务器:对分析需要的数据进行有效集成, 按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实 现可以分为:r o l a p 、m o l a p 和h o l a p 。r o l a p 基本数据和聚合数据均存 放在r d b m s 之中;m o l a p 基本数据和聚合数据均存放于多维数据库中: h o l a p 基本数据存放于r d b m s 之中,聚合数据存放于多维数据库中。 前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工 具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针 对o l a p 服务器,报表工具、数据挖掘工具主要针对数据仓库。 2 2 数据仓库系统应用服务需求 下面以某运营商统一经营分析系统为例,对数据仓库系统的应用服务需求进 行分析。 统一经营分析系统( u n i f i e db u s i n e s sl n f o r m a t i o r ts y s t e m ,简称u b i s ) ,是基 北京师电大学顸? i = 学位论文第5 页共6 6 页 篙、 磊竺 电信企业数据仓库w e b 服务的吐汁与实现 通信软件工程中,l 于数据仓库技术构建的,其目的在于整合企业内部的海量数据,并为企业的决策 和市场营销提供支持。u b i s 系统功能包括经营信息的收集、存储、展现。其中, 经营信息的收集指按照统一经营信息基线产品规定的数据源接口标准,从服务支 撑系统的生产子系统数据源( 统一客户资料子系统、综合营业子系统、综合帐务 子系统、客服子系统等) 中进行抽取、转换、装载,形成本系统所需的信息。经 营信息的存储指对本系统数据仓库中各级信息进行组织、存储与访问控制管理。 经营信息的展现使得u b i s 系统的用户可以通过上层提供的各种应用,利用w e b 方式对经营信息进行查看和访问。u b i s 系统的整体架构如图2 2 所示: 图2 2u b i s 系统体系架构 由u b i s 系统的架构我们可以看到,目前的u b i s 系统提供了w e b 、g u i 、 a p i 三种对外接口方式,这三种方式中w e b 方式和g u i 方式都必须登陆u b i s 系统,a p i 方式虽然不需要登陆u b i s 系统,但是调用u b i s 提供的a p i 的系统 北京帅电大学硕:l 学位论文第6 颤共6 6 页 电信企业数据仓库w e b 服务的& 计与实现通信软件工程中心 必须要兼容这些a p i 。除此以外其它方式是很难甚至是无法使用这些应用的。因 为这些应用的接口都是基于特定组件的,而其它的组件是无法访问的,即使是相 同的组件也需要为不同系统的应用单独开发接口。然而其它系统访问u b l s 系统 应用的需求却越来越多,其它系统可能需要在不登陆u b i s 系统的情况下查询数 据仓库中的历史数据,或者根据不同的电信业务使用o l a p 应用对u b i s 系统中 的数据进行联机分析,或者企业的合作伙伴例如s p 需要使用报表应用来查看自 己的经营情况报表。上述的这些情况在目前的u b i s 系统是无法实现的。这使企 业不得不考虑用一种合理方式来实现u b i s 系统服务的对外提供。 作者通过对u b i s 系统的数据仓库应用的需求调研,发现数据仓库应用中的 o l a p 应用、报表应用是使用最多的也是最重要的应用,这些应用不仅被企业内 部用户所使用,同时也在被企业的合作伙伴所使用。所以把这些应用包装成为 w e b 服务是首先需要完成的工作。 2 3 u b i s 系统应用服务分析 2 3 1 报表应用分析 u b i s 系统的决策支撑特性决定u b i s 系统必须提供不同业务不同层次的报 表,系统用户可以查看u b i s 系统提供的这些报表。报表的主要内容是u b i s 系 统中的数据,绝大部分都是汇盟的数据信息,这些信息通过固定的报表格式展现 给用户。例如,图1 3 描述了某运营商某分公司本日网络类型a 、b 在网用户用 户数、本日网络类型a 、b 用户净增量等信息。该报表包括两个维度:地区维度 和网络类型维度,一个指标:总在网用户数,以及报表显示的格式。我们可以将 报表的主要信息分为维度信息、指标信息以及报表显示格式的信息。 总在网用户数 地区 网络类型a 网络类型b 抽羼1 2 0 9 2 5 21 0 3 7 9 2 5 地区2 7 5 3 4 41 9 0 1 4 8 地区3 7 8 4 6 91 6 5 4 7 8 地区4 4 9 8 4 4 2 5 4 8 2 5 地区5 5 6 9 6 22 5 6 4 1 7 地区6 1 6 6 2 6 38 9 2 7 9 2 地区7 7 4 9 3 21 7 7 9 9 7 地区8 1 0 1 3 3 95 2 4 3 7 5 i 地区9 1 0 5 7 9 2 4 3 5 7 7 6 l 总计 9 1 8 1 9 73 9 3 5 7 3 3 图2 3 某运营商某分公司在网用户报袁 北京邮电大学硕士学位论文第7 页共6 6 页 l 岜信企业数据仓库w e b 服务的设计与实现 通信软件工程中心 2 32 o l a p 应用分析 o l a p ( o n l i n e a n a l y s i sp r o c e s s ) 是数据仓库提供的核一心功能,通过o l a p 可以对数据进行多角度、不同粒度的分析,服务使用者可以使用数据仓库提供的 o l a p 服务,进行联机分析。 联机分析处理( o l a p ) 区别于传统的联机事务处理( o n l i n et r a n s a c t i o n p r o c e s s i n g ,o l t p ) ,是专门为数据存取和分析而设计的技术,o l a p 理事会对 o l a p 的定义是:o l a p 是一种软件技术,它使分析人员能够迅速,致,交互 地从各个方面观察信息,以达到深入理解数据的目的【1 。 对于o l a p 技术,c o d d 提出过1 2 条o l a p 准则中,其中心内容可以概括 成两点。第一点是对o l a p 数据的多维可操作性进行规定,第二点是对o l a p 的数据透明性的要求,定义了c s 的体系结构准则,并在此基础上提供多用户访 问的功能。随着o l a p 的发展,提出了对于o l a p 系统比较简洁f a s m i ( f a s t a n a l y s i so f s h a r e dm u l t i d i m e n s i o n a li n f o r m a t i o n ) 的5 条原则: 1 快速性( f a s t ) ,是指系统应当使用各种技术,尽量提高对最终用户的响 应速度。 2 可分析性( a n a l y s i ,是指系统必须能够对数据进行逻辑分析。s ) o l a p 3 共享性( s h a r e d ) 是指提供多个用户共享同份o l a p 数据。 4 多维性( m u l t i d i m e n s i o n a l ) ,是o l a p 最本质的特征,即必须向用户呈 现一致的多维视图 5 信息性( i n f o r m a t i o n ) ,是指在o l a p 系统中给出的不再是o l t p 系统中 散乱的数据,而是能够导入具有指导意义的信息,同时要求数据能够以 多种图形方式进行展示。 在o l a p 系统中通过多维数据模型来支持分析操作,多维模型中的主要概念 包括维,度量和事实,其中维是用户观察数据的角度,度量是一些数据指标,事 实是对某类事件的记录,它将各个维度和度量联系起来。在o l a p 分析中对数据 的分析的基本操作包括切片,切块,聚合,钻取,旋转等,通过这些操作使用户 可以从多种角度,多个侧面,多种不同的综合程度查看数据,从而显示数据间的 内在关联规律。o l a p 的主要功能有: 1 提供数据的多维逻辑视图。o l a p 提供了一种多维表现和组织方式,使 最终用户能多角度、多侧面、多层次地考察数据仓库中的数据,在对数 北京邮电大学硕士学位论文第8 页共6 6 页 皇堡垒、业堑塑鱼壁堕! 坚堑坚望! 兰茎兰 望堕竺堡三堡! 尘 据的分析过程中,用户可以运用切片( s l i c e ) 、切块( d i c e ) 、上卷( r o l l u p ) 、 下钻f d r i l l 一d o w n ) 和翻转( r o t a t e ) 等操作,操作结果可以用多维表格、图 形或图表等形式直观地显示给用户。 2 具有动态的查询和分析功能。o l a p 提供了一种随机的动态的查询和统 计分析功能,分析过程是由分析人员在分析过程中确定,没有固定模式。 3 能快速响应用户交互式查询和复杂的分析查询。o l a p 多维数据模型和 数据聚合技术可以组织并汇总大量的数据,对频繁查询的数据预先进行 计算,以便提高分析查询的响应速度。 4 支持多用户同时操作。多个用户可以同时工作在同一分析模型上,还可 以在同一数据仓库数据上建立不同的分析模型,提供了并发控制、数据 完整性及安全机制。 5 可以在不同的数据源之间灵活地采集、转换数据。 图2 - 4 显示了某运营商某分公司用户发展分析的o l a p ,这个o l a p 包括了 多维立方体各个维度的信息( 例如时间、地域、业务类型等几个维度) ,多维立 方体指标的信息( 在c d m a 用户发展o l a p 中为用户数量) ,以及对o l a p 操 作的信息( 例如对时间层次的选择,上卷、下钻等) 。 基于o l a p 应用的这些特点、功能,以及对o l a p 实例的描述,o l a p 应用 的信息应该包括多维数据模型的维度信息、指标信息以及对o i 。a p 操作的信息。 北京邮电大学硕:卜学位论文 船9 页共6 6 页 i 也侪企业数据仓库w e b 服务的殴计与实现通信软件工程中心 第三章w e b 服务与面向服务架构 w e b 服务是使应用程序可以用与平台和编程语言无关的方式进行相互通信 的一项技术。而面向服务体系架构是一种软件体系结构,它提供了种构成并组 织w e b 服务的体系结构思想。本章中我们将对w e b 服务和面向服务架构以及它 们之间的关系进行研究。 3 1 w e b 服务技术 3 1 1w e b 服务的定义 服务作为一种新的分布式计算范式,不同的研究人员根据自己的研究实践曾 给出不同的定义。t s a l g a t i d o u 等认为:服务是一种自包含、模块化的应用程序, 它通过w e b 访问企业与个人提供了一系列的功能。p a p a z o g l o u 认为:一个w e b 服务是一个基于i n t e r n e t 的分布式组件,它满足技术中立、松耦合、位置透明的 服务要求,可为跨企业应用提供描述、发现、集成和协作提供支持【1 ”。 从论域的角度讲,w e b 服务是论域u 中一个六元组构成的一个分布式有机 智能软件体( 大粒度组件) ,它可以形式化地描述为a j 。 其中,a 表示一个由w e b 服务组成的系统架构;c 是a 中业务逻辑单元( 资源 对象) 组成的非空集合,即c = c i l l i k ,c i a ,k u ) ;s 是a 中所提供的 w e b 服务组件组成的非空集合,即s = s i l l i m ,8 i a ,m u ) ,它是企业对 外发布的资源对象的一种抽象和封装:r 是a 中的角色组成的非空集合, 即 r i 托1 1 i n ,r i a ,n u ) ,其中,服务提供者( p r o v i d e r ) 、请求者( r e q u e s t e r ) 和注册中心( r e g i s t r y ) 是主要的三类角色:p 是a 中的协议栈组成的非空有限 集合,即p = f 酬l i l ,p a ,1 u ) ,其中u d d i 、w s d l 、s o a p 是p 中的 核心协议:b 是a 中的角色r 施加在服务对象s 上的服务行为非空操作指令集, 它由r 和s 中的对象元素组成的有序对偶来表示,即b = l r e r ,s s ) ; l 是服务行为约束规则的集合,它包括服务业务构件行为的初始条件、前置条件、 后置条件和协同时序关系,即l = c o n s ( i n i t ,p r e c o n d ,p o s t c o n d ,a c t i o n ) 。 无论具体的定义如何,在本质上,w e b 服务是封装成单个实体并采用普遍使 用的i n t e m e t 协议与其它分布式的软件组件( 封装资源的服务接口) 进行交互的 自包含、自适应和自描述的软件组件,可视作w e b 上的组件编程。 北京邮电大学硕二i 学位论文第1 0 页共6 6 页 乜信企业数掂仓库w e b 服务的设汁与实现 通信软件工程中也 w e b 服务是由一系列的协议规范来支撑的,w e b 服务的协议栈与o s i 的七 层网络协议栈类似,w e b 服务的协议栈如图3 1 所示: 图3 - 1w e b 服务协议栈 w e b 服务协议栈中是一层的协议同样需要下一层的协议来支持,而安全 性、生命周期、服务质量则需要各个层次都有体现1 4 】。在协议栈中h t l 、p ,s m t p , f t p 是传输网络数据的协议,s o a p ( 简单对象访问协议) 是在服务闻进行交互 的协议,w s d l ( w e b 服务描述语言) 是用来对服务进行统一的描述,u d d i ( 统 一描述发现和集成) 是用来对服务进行注册和查找的协议,w s f l ( w e b 服务流 语言) 用来组织w e b 服务使多个w e b 服务能够协同工作( 本文中不作为研究重 点) 。 3 1 2w e b 服务描述方式 随着s o a p 的发展和应用,业界意识到对服务描述语言标准化的必要性,以 赋予w e b 服务统一的描述能力。2 0 0 0 年9 月i b m ,m i c r o s o f t 和a r i b a 的共同努力 下,w s d 乙1 ,0 诞生了。2 0 0 1 年3 月w 3 c 接受w s d l 规范,并提供了1 1 版本。 w s d l 文档将w e b 服务定义为服务访问点或端口的集合。在w s d l 中,由于服 务访问点和消息的抽象定义已从具体的服务部署或数据格式绑定中分离出来,因 此可以对抽象定义进行再次使用消息对交换数据的抽象描述;而端口类型,指操 i 作的抽象集合。用于特定端口类型的具体协议和数据格式规范构成了可以再次使 用的绑定。将w e b 访问地址与可再次使用的绑定相关联,可以定义一个端口, 而端口的集合则定义为服务。因此,w s d l 文档在w e b 服务的定义中使用下列 北京i l i 电大学硕士学位论文第1 1 页共6 6 页 i b 信企业数据仓库w e b 服务的设计与实现 通信软件工程中心 对象,w s d l 对象结构图如图3 2 所示: t y p e s 数据类型定义的容器,它使用某种类型系统( 一般情况下使用 x m l s c h e m a 中的类型系统) 。 m e s s a g e 通信消息的数据结构的抽象类型化定义。使用t y p e s 所定义 的类型来定义整个消息的数据结构。 o 口e r a t i o n 一对服务中所支持的操作的抽象描述,般单个o p e r a t i o n 描 述了一个访问入口的请求响应消息对。 p o r t t y p e 对于某个访问入口点类型所支持的操作的抽象集合,这些 操作可以由一个或多个服务访问点来支持。 b i n d i n g 特定端口类型的具体协议和数据格式规范的绑定。 p o n 定义为协议臌据格式绑定与具体w e b 访问地址组合的单个服务 访问点。 s e i c e 相关服务访问点的集合。 图3 - 2w s d l 对象结构图嘲 北京邮电大学顶:忙学位论文第1 2 页共6 6 页 电信企业数据仓库w e b 服务的世计与实现 通信软件工程中也 31 3 w e b 服务注册和发现 u d d i 是一套基于w e b 的、分布式的、为w e b 服务提供的信息注册中心的 实现标准规范,同时也包含一组使企业能将自身提供的w e b 服务注册,以使别 的企业能够发现的访问协议的实现标准。u d d i 基于现成的标准,如可扩展标记 语言( e x t e n s i b l em a r k u pl a n g u a g e ,x m l ) 和简单对象访问协议( s i m p l eo b j e c t a c c e s sp r o t o c o l ,s o a p ) 。公共规范是机构成员在开放的、兼容并蓄的过程中开 发出来的。目的在于先生成并实现这个规范的三个连续版本,之后再把将来开发 得到的成果的所有权移交给一独立的标准组织。u d d i 版本l 规范于2 0 0 0 年9 月发布,版本2 于2 0 0 1 年6 月发布。版本3 于2 0 0 2 年9 月发布。版本1 打 下了注册中心的基础,版本2 则添加了企业关系等功能,版本3 解决正在进行 的w e b 服务开发中的重要领域内的问题,如安全性、改善了的国际化、注册中 心之间的互操作性以及为进一步改进工具而对a p i 进行的各种改进。 u d d i 构建于网络传输层,它基于s o a p 的x m l 消息传输层之上。诸如 w e b 服务描述语言( w e bs e r v i c e sd e s c r i p t i o nl a n g u a g e ,w s d l ) 之类的服务描 述语言提供了统一的x m l 词汇( 与交互式数据语言( i n t e r a c t i v e d a t a l a n g u a g e , i d l ) 类似) 供描述w e b 服务及其接口使用。可以通过添加分层的功能搭起整个 基础,比如使用w e b 服务流程语言( w e b s e r v i c e sh o wl a n g u a g e ,w s f l ) 的 w e b 服务工作流描述、安全性、管理和服务质量功能,从而解决系统可靠性和可 用性问题。 u d d i 数据模型中u d d i 注册信息的数据结构如图3 3 所示: 图3 - 3u d d i 数据模型数据结构m 北京邮电大学硕士学位论文第1 3 页共6 6 页 电信企业数据仓库w e b 服务的吐汁与实现通信软件工程中心 u d d ix m ls c h e m a 定义了四种主要的信息类型,它们是技术人员在需要使 用合作伙伴所提供的w e b 服务时必须了解的技术信息。它们是:商业实体信息 ( b u s i n e s s e n t i t y 结构) 、服务信,宙, ( b u s i n e s s s e r v i c e 结构) 、绑定信息( b i n d i n g t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年名城市协管员笔试考题、考点带解题思路及答案详解
- 中国隐藏式闭门器项目投资可行性研究报告
- 依普黄酮片行业深度研究报告
- 中国机红瓦项目投资可行性研究报告
- 中国无线通讯器材项目投资可行性研究报告
- 中国高速艇配件项目投资可行性研究报告
- 中国台车翻转式电阻炉项目投资可行性研究报告
- 河北素描联考真题及答案
- 社区照看帮助服务行业深度研究报告
- 2026年年中国源网荷储一体化行业现状分析及投资前景预测报告咨询
- 部队仓储基础知识培训课件
- 海南安全员c证考试题库及答案
- 游泳教学蛙泳腿课件
- 妊娠合并贫血护理查房记录
- 半导体行业销售知识培训课件
- 微信使用保密课件
- 《民航民航安全检查实训》全套教学课件
- 2025年民政行业技能鉴定考试-遗体整容师考试历年参考题库含答案解析(5套典型题)
- 2025年中广核在线笔试题及答案
- 村级用车管理办法
- 中国石油集团招聘考试题含答案
评论
0/150
提交评论