




已阅读5页,还剩59页未读, 继续免费阅读
(计算机应用技术专业论文)基于soa的商务智能系统研究和实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
上海大学硕士学位论文 摘要 商务智能( b u s i n e s si n t e l l i g e n c e ,b i ) 帮助企业实现从数据到信息、从信息 到知识、从知识到利润地转化。传统商务智能系统是在原有业务系统的开发技 术之上架构起来的,这些技术很大程度上是专门服务于原有业务系统的运作模 式,往往存在移植性、集成性和可扩展性差等弱点,在商业需求频繁变化的条 件下很难提供充分可靠的决策支持。所以,迫切需要一种解决方案,能够弥补 传统商务智能系统移植性、集成性和可扩展性差的弱点。 本文针对传统商务智能系统在实际应用中存在的上述弱点,提出了改进方 案基于面向服务体系结构( s e i c e o r i e n t e d 心c h i t e c 砸e ,s o a ) 的商务智能 系统,主要做了以下几方面的工作: l 、对s o a 和商务智能相关技术进行了分析,将s o a 与商务智能相结 合,给出了将w 曲服务技术运用到商务智能系统中的思路。 2 、设计了一种基于s o a 的商务智能平台,构建了基于w 曲服务的数 据抽取转换装载( e x t r a c tt r a l l s f o ml o a d ,e t l ) 和前端展现,并给 出了详细设计方案。有效解决了传统商务智能系统移植性、集成性 差的问题。 3 、引入语义层u i l i v e r s e 作为数据仓库到商务智能服务器的连接中间 层,增强了可理解性、可扩展性。 4 、通过好美家商务智能系统的实现和应用,证实了基于s o a 的商务智 能设计思路的正确性和有效性。 关键词:商务智能、面向服务体系结构、w 曲服务、数据仓库 a b s t r a c t b u s i i l e s sh t e l l i g c ec 锄仃孤s f o 衄d a 协t 0i n f o m a t i o n ,i l l f o m a t i o nt ok i l o w l e d g ea n d k n o w l e d g et op r o f i tf o re n t e f p r i s e s t h e 眈d i t i o n a lb u 咖e s si n t e l l i g e n c es y s t e mb a s e do n 位 t e c h f l 0 1 0 9 ) ,o f 砸g i i l a lo p e m t i o ns ) ,s t e m 咖l l yh 舔d i 鼢d v a n t a g e s 跚c h 船p 0 0 r 仃孤1 s p l a i l 洲o n , i i l t e 笋a t i o n ,觚de x p 觚s i b i l i 吼a n d “i sh a r dt 0p r 0 、,i d es u 伍c i e n ta 1 1 dc i i e d i b l ed c c i s i o ns u p p o r t t h e r e f b r e ,as 0 1 u t i o nw t l i c hc 锄m a k eu p 五叮t h e s ew e a :h e s s e sa n e e d e du r g 吼t l 弘 i nm i sp a p 盯,as o l u t i o nf o rs e r v i c e - o r i c n t c da r c h i t e c t u r e _ b 鳃e d b u s i n e s sn e l l i g c es y s t 钮l i sp r o p o s e da c c o r d i i l gt 0d i s a d v 锄t a g 鹤d i s c u s s e d t h 嫩a 托v e r a lp r i m a 巧a s p e c t s 试t h i s p a p c r : 1 i ti ss t i l d i e dt h ew 曲s e r v i c e st e c h o l o g y 蛆ds o a ,锄a l y z e dt h eb 璐m s si n t e l l i g e l l c e , 锄dt h e nb r o u 曲tf o r w a r dt h em e 弱u 代o f b u s i i l 鹤si l l t e l l i g e n c es ) ,s t e mu s i i l gs o a 2 s o a b a l s e db u s 址s si n t e l l i g c ei sd e s i 弘e d ,e s p e c i a l l yo nw e bs e i c e s - b a s e de t l s o l 面o n 觚d 舶n t - e n dr 印o r t i n g n em e t l l o do fs ) ,s t 锄d e s 谫i sa l s o 百v i i ld e t a i l ,w h i c h s o l 咖gp r o b l e m sd i s c u s s e de 髓c t i v e l y 3 s e m 锄t i cl a y e rw ec a l l e d 瑚i v e r s ei su s e d 私ac o 衄e c t i v em i d m e1 a y e rb e 觚e 即d a t a w 玳h o u s e 锄db u s i i l 髓si 1 1 t e l l i g e i l c es e r v i i n p r o v i i l gc o q 玳h e i l s i b l y 孤de x t e i l s i b i l i 够 4 ah o m e m a r tb u s i r l e s s 血e l l i g e n c es y s t e t i l si sp r e s e r 她d ,锄dn l e 印p l i c 撕o np r o v e d 缸s a p p r o a c hi sc o 仃e c t 孤de 伍c i e n t k e y w o r d s :b u s m s sb 伦l l i g c e ,s o w 曲s e r 讹e ,d a t a w a r e h o l l s e h 上海大学硕士学位论文 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发 表或撰写过的研究成果。参与同一工作的其他同志对本研究所做的 任何贡献均已在论文中作了明确的说明并表示了谢意。 签名: 本论文使用授权说明 日期: 本人完全了解上海大学有关保留、使用学位论文的规定,即: 学校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学 校可以公布论文的全部或部分内容。 ( 保密的论文在解密后应遵守此规定) 一和摊名:掣吼掣 i i 上海大学硕士学位论文 1 1 课题来源 第1 章绪论 本课题源于上海大学计算机学院与捷玛公司( j m l l r ) 合作项目“好美家商务 智能系统”的研发工作。作者作为主要设计和研发者参与了项目的全过程。我们 将该系统中的数据e t l 功能和前端展现功能进行拓展而确定了本课题的研究内 容。主要工作是结合w 曲服务和商务智能的相关理论知识,研究系统的面向服 务结构设计与实现等问题。 1 2 选题背景及研究意义 随着信息技术的高速发展,企业所处环境和组织结构越来越复杂,市场竞 争日益激烈,商务智能作为保障企业高效运营、正确决策和快速响应的有效手 段,有利于人们收集、整理、分析和评估大量数据。商务智斛l 】相关技术地研 究至关重要。 据统计【2 】,国内外的商务智能市场( 如软件、服务、服务器和数据存储) 平均每年以2 0 以上的速度增长。在欧美等发达国家,商务智能逐渐受到人们 地关注,美国市场上已有数十家商务智能厂商。在北美,商务智能已经成功地 应用于社会生活的各个领域,如政府管理决策、商业经营、科学研究和企业决 策支持等。在国内,商务智能应用还处于起步阶段,理论界和业界还缺乏对商 务智能软件地充分了解。然而,国内的商务智能市场发展很快,每年大约保持 6 0 地增长。目前,国内应用的主流的几种商务智能产品分别由四家国外厂商 提供:h y p 耐o i l b r i o ( 已被o r a c l e 收购) 、b u s i n e s so b j e c t s ( 已被s a p 收购) 、 c o g n o s ( 已被i b m 收购) 和m i c r o s t r a t e g y 。尽管国内商务智能应用市场的大部 分份额被国外r r 厂商瓜分,但也正是这些国外厂商推动了国内商务智能地研究 和应用,例如b u s i l l e s so b j e c t s 中国公司同国内的大学合作建立了培训中心, h y p 舐。栅r i o 和国内代理商合作建立了商务智能实验室等。 在商务智能具有良好发展前景的同时,我们也应该注意到,在以电子商务 上海大学硕士学位论文 为特征的新的企业经营模式下,企业迫切需要消除“信息孤岛”,使得信息系统 的应用之间既相互独立又能有效协同工作,可以将不同的应用集成到一个完整 的企业级信息化环境中,并能够实现与其它企业间地集成。目前,商务智能系 统往往存在移植性差和集成性差等问题,缺乏可扩展性和灵活性,加上各种技 术地发展,软件规模的不断扩大及其复杂性的不断增加,对商务智能相关问题 的研究变得越来越迫切。 w 曲服务技术广泛地应用到了企业的r r 系统和商业流程中,并给企业带来 了直接的经济效益,一直以来得到了国内外企业管理者地推崇。w 曲服务具有 封装性、松散耦合性、行业标准性、可扩展性、高度集成性等特点。s o a 【3 】的 出现,使得兀系统可以更快的响应业务单位的需求。基于s o a 的应用开发和 集成,与传统的应用集成方法相比,相对比较简单、有效而且灵活。 商务智能系统地开发及其相关应用在国内已经取得一定的成果,但总体上 还处于起步阶段,相关技术不是很成熟。如何灵活地整合商务智能和w 曲服务 技术,使之有效的对数据进行集成、处理和分析,提供全面、完善的解决方案, 从而更好解决面临的问题,具有重要意义。 1 3 课题研究的目的 商务智能对于企业的发展和社会生活各个领域都有着重要影响,到目前为 止,商务智能技术地研究和应用主要集中于某些局部范围,缺乏整体规划,企 业内部各系统间缺乏有效地通信,无法互通互联,形成“信息孤岛”【4 】。商务智 能系统应用领域存在的不足包括: ( 1 ) 缺乏能够应用于多个操作系统、多个应用软件的跨平台的系统来整合 信息资源,对数据进行有效分析和处理。 ( 2 ) 系统服务间缺乏简单、透明的访问机制。d c o m 和c o r b a 等技术 虽然可以实现分布式调用,缓解了部分问题,但它们是紧藕合的,应用系统的 两端都必须遵守相同的a p i 约束,一个应用的代码有了更改,访问该对象的代 码也必须做出相应的修改,同时两者间的通信也有很多的限制。 ( 3 ) 系统模块移植性差。各个模块常局限于某一特定的硬件平台、特定的 2 上海大学硕士学位论文 操作系统、特定的接口模型、特定的编程语言以及客户端和服务器组件版本的 特定匹配,缺乏移植能力。将公共功能编写为二进制的动态连接库或者c o m 组 件,虽然可以实现跨语言调用,但这种调用仅限于特定的平台范围内,例如, w i n d o w s 系统下的d l l 和c o m 组件在l i n u x 或u i l i x 系统下就不可用。 ( 4 ) 系统模块集成性差。目前企业内部系统的设计大都基于独立解决方案 的实现模式,大多数内部系统都是异构的,系统间应用的相互调用需要了解各 系统的设计细节,实现起来非常复杂,工作量也非常大。企业内部系统之间地 访问比较困难,而不同的企业之间的内部系统相互访问就更加困难。 针对商务智能的重要性和应用中存在的问题,本课题的研究目的是:结合 商务智能和s o a ,建立面向服务的商务智能系统的体系结构,设计数据e t l 、 语义层和前端展现,实现跨平台操作和数据传输。由此提高商务智能系统的实 用性、移植性、集成性和可扩展性,使得可以有效集成其它报表工具、数据挖 掘工具和联机分析工具等,并提高数据分析的准确性和业务分析的智能化程度。 1 4 国内外研究概况 1 4 1 国外研究概况 丸丽n e 【5 】等人在分析和探讨了目前商务智能系统的缺点后认为,在目前竞争 越来越激烈的环境下,数据分析的结果应该更加注重实时性,从两描述了对未来 实时商务智能的看法和观点,并列举了一系列已经出现并且有一定研究程度的技 术。 m 球k e i t h 【6 】等人介绍了越来越成熟的相关技术给商务智能带来的改变,并 基于一个典型的案例进行了相关研究,分析了从传统的商务智能结构向面向服务 的企业级应用结构转变时出现的困难和问题,提出了将协调网络分析作为估计和 优化结构转变带来的影响的研究方法。 鼬c ks h e m d 7 1 认为数据集成作为商务智能的相关技术,将是未来的一种趋 势,s o a 、软件即服务、开源、数据仓库工具和主数据管理将为数据集成的发展 起到关键作用。 3 上海大学硕士学位论文 l i y aw u 【8 】等人认为商务智能的目标就是提供可实际应用的观点和意见,并 描述了一种基于面向服务的商务智能体系结构,使商务智能环境中许多技术的 无缝整合成为可能,从而简化了数据传输和降低了分析的延迟。提出商务智能 的主要目标是为整个企业组织提供“统一口径”、简单化的系统执行,展开和管 理和传递战略的、战术的和运作的知识,还有可实际应用的观点和意见。 国外的许多知名厂商纷纷加入到了商务智能的研发行列。专门研发商务智 能产品的公司有h y p 耐。栅r i o 、b u s i n e s so b j e c t s 和c o g n o s 等;i b m 成立了商 务智能方案设计研究中心,o r a c l e 、m i c r o s o r 纷纷推出支持开发与应用的软件 产品;近几年,商务智能领域出现了许多重量级的合并和收购事件,例如o r a c l e 收购h y p 舐o n 、s a p 收购b u s i i l e s so b j e c t s 和i b m 收购c o 舶o s 。在企业的需求 推动和厂商的技术支持下,商务智能应用迅速发展,在国外已进入快速发展的 时期,在全球的应用增长非常迅速。 1 4 2 国内研究概况 上海商学院的龙青云【9 】等人对商务智能的定义和发展背景进行了阐述,对商 务智能整体的结构和底层的基础设施进行了重点介绍和剖析,并进步对商务 智能技术工具的类型、处理对象、战略价值和市场定位等进行了对比,对商务 智能的发展趋势进行了探讨。 重庆大学的李林杰【1 0 】等人对商务智能的关键技术和现行实施过程进行了剖 析,在基于商务智能系统特性研究的基础上,提出几个传统系统工程构建策略 的改进策略,并研究了商务智能实施过程的核心流程,给出了规范的商务智能 流程控制方案。 中国科学技术大学的王卫平【1 1 】等人采用w 曲服务构建了商务智能网络,实 现了企业间商务智能系统的分析协作和知识共享。利用x m l 解决了异构数据 格式的不兼容问题,利用s o a p 减少了系统中的分布式组件,使用w 曲服务封 装发布查询、分析等功能。 复旦大学的徐娜【1 2 】等人针对传统的商务智能系统存在的被动性和集成困难 的缺点,提出一个基于a g e n t 的商务智能模型,利用a g e n t 建立和维护数据仓 4 上海大学硕士学位论文 库,并进行数据挖掘。给出了其主动监控商务环境原理,以及对推理规则的定 义,从中找到决策支持信息,并进行了相关实践。 浙江大学的单鹏飞【1 3 】等人提出了一个统一的商务智能应用框架,将大量的 商务智能应用建模为基本的原子服务功能,开辟了基于网格的商务智能新领域。 通过提高网格计算技术来提高商务智能应用的性能具有高度的可扩展性,并对 基于网格计算技术构建的通用商务智能服务平台进行了实现。 国内一些重点大学也纷纷同国外商务智能公司展开合作研究,如上海交通 大学同b u s i n e s s o b j e c t s 中国公司联合组建了商务智能培训中心;中国人民大学 携手删a t a 共建数据仓库与商务智能联合实验室;北京邮电大学、西安电子 科技大学等对商务智能的应用都有很多的研究与成果。我国本土的一些公司也 开展了商务智能技术的应用服务,帮助广大的企业实现商务智能,但主要运行 模式都是与国外的公司以合作的方式开展,除了自己开发少部分的产品,主要 销售国外厂商的产品。 1 5 论文章节安排 本论文在商务智能的设计和实现中引入w 曲服务技术,结合语义层 u i l i v e r s e ,设计和实现了一种跨平台,高度集成的基于s o a 的商务智能平台, 论文的具体结构安排如下: 第1 章介绍了课题来源、选题背景、研究意义和研究目的,并对国内外商 务智能的研究和应用现状做了简单论述。 第2 章介绍了商务智能的多种定义,并结合s o a 给出了一种较完整的商 务智能定义;介绍了商务智能的技术体系和结构,说明了商务智能实现的四个 步骤。对w 曲服务技术和s o a 的概念作了分析,并探讨了s o a 的优势、体系 结构和关键技术组成。 第3 章在商务智能系统中引入s o a 和语义层u 1 1 i v e r s e ,提出并设计了一种 基于s o a 的商务智能平台( j m i t 商务智能平台) ,并在数据e t l 和前端展现 中引入w 曲服务技术,给出了整个平台中数据e t l 、语义层u i l i v e r s e 和前端展 现的详细设计。 5 上海大学硕士学位论文 第4 章通过应用于j m i t 商务智能平台的好美家商务智能系统项目实例的 研发,对本文提出的设计思路进行验证。介绍该实例系统概况和总体结构,通 过展示系统部分分析功能,证实了本文提出的设计模型的实践可行性。 第5 章对整篇论文研究的内容做了总结和展望。 6 上海大学硕士学位论文 第2 章商务智能及s o a 相关基础 2 1 商务智能 2 1 1商务智能的定义 商务智能的概念最早是g 黝e r u p 于1 9 9 6 年提出来的,当时将商务智能 定义为“以帮助企业决策为目的,对数据进行收集、存储、分析、访问等处理的 一大类技术及其应用, 1 0 】。虽然研究与应用在不断深入,但对于商务智能尚没有 一个统一的定义。下面列出几种不同角度的商务智能定义【1 刃: 从技术角度看,商务智能的过程是企业的决策人员以企业中的数据仓库为 基础,经由o l 心工具、数据挖掘工具加上决策规划人员的专业知识,从数据中 获得有用的信息和知识,帮助企业获取利润。 从应用角度看,商务智能帮助用户对商业数据进行联机分析处理和数据挖 掘,例如预测发展趋势、辅助决策、对客户进行分类、挖掘潜在客户等等。 从数据角度看,商务智能使得很多事务性的数据经过抽取、转换之后存入 数据仓库,经过聚集、切片或者分类等操作之后形成有用的信息、规则,来帮 助企业的决策者进行正确的决策。 随着商务智能的不断发展,它的定义也不断地扩充和完善,本文结合s o a 和商务智能的相关技术给出一种商务智能定义:商务智能是企业利用数据仓库、 数据挖掘、o l a p 、决策支持系统等信息技术对企业经营过程中产生的大量结构 化和非结构化商务数据和信息进行收集、整理和分析,提供整个企业组织内的 “统一口径”和一种简单化的系统执行、展开和管理,并传递战略的和运作的知 识,及可实际应用的观点和意见,以辅助企业做出正确决策、采取有效商务行 动、优化完善商务流程、全面提升商务绩效的工具、方法和技术的统称。 2 1 2 商务智能的体系结构 实施商务智能,首先需要准备正确可用的数据,其次要将这些数据转换成 7 上海大学硕士学位论文 有价值的信息,再用于指导商业实践。这个过程包括了数据抽取、分析和挖掘 三个主要环节,分别由数据仓库、联机分析处理和数据挖掘技术来完成。数据 仓库是商务智能的基础,存储按照商务智能要求重新组织的来自业务系统的数 据;联机分析处理和数据挖掘在数据仓库的基础上进行分析,提供给最终用户 灵活自主的信息访问途径、丰富的数据分析与报表功能。为了清晰的了解商务 智能,图2 1 给出了商务智能的体系结构。 决策支持工具 查询和报表o l a p 数据挖掘 访问工具 应用接口中间件服务器 对体系结构中各组成部分说明如下【1 4 】: ( 1 ) 可操作的和外部的数据:商务智能系统的数据源。其中,内部信息来 自企业的日常业务处理系统,如e i 冲( e n t e 印r i s er e s o u r c ep l 觚1 1 i n g ) 、前台交易 系统等,外部信息来自h l t e m e t 和行业期刊等。 ( 2 ) 数据仓库建模和构造工具:用来从数据源系统中捕捉数据,经过加工 和转换后装入数据仓库,例如数据e t l 工具将业务数据库中的数据经过处理后 装载入数据仓库服务器中。 上海大学硕士学位论文 ( 3 ) 数据管理:管理终端用户感兴趣的信息。一般采用三层存储结构,即 数据仓库一数据集市一特定主题的信息存储。其中,数据仓库( 全局仓库) 集 成企业的所有信息;数据集市( 又称部门数据仓库) 存储某个部门的信息;特 定主题的信息存储用于存储根据用户和应用需求裁剪后的信息。经数据仓库建 模和构造工具处理后的数据装载到全局仓库,然后按部门从全局仓库中抽取相 关数据载入部门仓库,再根据终端用户要解决的特定问题从部门仓库中抽取关 于该主题的数据载入其他信息存贮。 ( 4 ) 访问工具:包括应用接口和中间件服务器,使得客户工具能够访问和 处理数据库和文件系统中的信息。 ( 5 ) 决策支持工具:包括基本的查询和报表工具以及o l a p 和数据挖掘工 具。这些工具都支持图形用户界面,有些还可以在w 曲界面上使用。 ( 6 ) 商务智能应用:是许多针对不同行业或应用领域,经过裁剪的完整的 商务智能解决方案软件包。 ( 7 ) 元数据管理:用来管理与商务智能系统有关的元数据,包括技术元数 据和商业元数据。 ( 8 ) 管理:包括商务智能管理的各个方面,如安全性和验证、备份和恢复 及其监控和调整等。 2 1 3 商务智能的相关技术 商务智能的实现一般主要有四个步骤 9 】:数据的抽取、数据的管理、数据 的分析和数据的展现。商务智能的技术体系主要有数据仓库、联机分析处理以 及数据挖掘技术三部分组成。 ( 1 ) 数据仓库 数据仓库技术【1 5 ,1 6 1 是为了有效地把操作型数据集成到统一的环境中,以提 供决策型数据访问的各种技术和模块的总称。数据仓库是在企业管理和决策中 面向主题的、集成的、与时间相关的和不可修改的数据集合。 1 ) 数据仓库与业务数据库的联系 业务数据库系统为数据仓库提供历史数据支持。数据仓库之所以产生是因 为业务数据“爆炸”。爆炸的结果使原有联机事务处理( o n l i l l et r a n s a c t i o n 9 上海大学硕士学位论文 p r o c e s s i n g ,o l t p ) 为特点的数据库系统无法处理海量的数据,更无法提供丰 富的数据分析功能,数据仓库技术和联机分析处理技术正是在对大量历史数据 的重组需求驱动的背景下产生的。原有大量业务数据经过抽取、转换、清洗和 加载后植入到数据仓库中。 2 ) 业务数据库与数据仓库的区别 数据的时效性 数据仓库中的数据是反映历史上某一段时间的数据,一般对这段时间的数 据进行了预处理,加工成面向主题的不同粒度的数据。而业务数据库中的数据 是当前的数据,这些数据是准确的,可被有效的访问和更新。业务数据库中的 数据可以根据需要不包含时间元素,而数据仓库中总是包含时间元素,并且它 还是关键字的一部分。 数据操作方式 业务数据可以进行反复地增加、删除、修改和查询等操作,而在数据仓库 中,数据一般不进行更新操作,而只进行查询操作,数据仓库数据地更新是批 次更新的,更新频度相对要小得多。 数据组织方式 业务数据库中的数据的组织方式是针对于具体业务处理问题的,而数据仓 库则以一个企业中固有的业务主体为主题,从全局的角度组织数据。 数据存储量 业务数据库中的数据一般最多存储几个g b ,而数据仓库中的数据可能是其 百倍以上。 ( 2 ) 联机分析处理 在“数据海量,而信息匮乏”的形势下,许多软件开发商开发了各种关系型 数据库的前端产品。利用专门的数据综合引擎和直观的数据访问界面,以统一 复杂查询中各种混乱的应用逻辑,使系统在很短的时间内响应用户的复杂查询。 1 9 9 3 年,e f c o d d 提出将这类技术称为o l a p 【16 1 。c o d d 认为1 6 1 0 l t p 已不能满 足终端用户对数据库查询分析的需要,s q l 对大数据库的简单查询也不能满足 用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结 1 0 上海大学硕士学位论文 果,而简单查询的结果并不能满足决策者提出的商业需求。 传统的数据模型( 如实体模型和关系模型) 不能有效地表示数据仓库中的 数据结构和语义,也无法支持o l a p 应用。因此c o d d 提出o u 廿技术的同时也指 出o l 谨具有多维特性【3 4 1 。o u 廿的基本分析操作有:切片( s l i c e ) 、切块( d i c e ) 、 旋转( p i v o t ) 、下钻( d m l d o w ,1 1 ) 和上卷( r 0 1 1 u p ) 等。o “廿的数据来源于 数据仓库,通过o l 廿服务器将这些数据抽取和转换为多维数据结构,以反映用 户所能理解的企业真实的维。 ( 3 ) 数据挖掘技术 “数据挖掘是从巨量数据中获取有效的、新颖的、潜在有用的、最终可理解 的模式的非平凡过程”。这是u f a y ) ,a d 等数据库专家在1 9 9 6 年的知识发现和数据 挖掘国际学术会议上给出的数据挖掘定义【1 6 】。简单地说,数据挖掘是从大量数 据中提取或“挖掘”知识。 尽管商务智能系统中的o l a p 工具可以支持多维分析和决策,对于深层次的 分析,如数据分类、聚类和数据随时间变化的特征等,但是仍然需要其他分析 工具。数据挖掘可以看作是o l a p 的高级阶段,数据挖掘通过结合更高级的数据 理解技术,比o u 心汇总型分析处理更加具有预知性。数据挖掘技术的出现使商 务智能有了更加美好的前景,可以说目前的商务智能是数据仓库技术、联机分 析处理技术和数据挖掘技术的结合体。 数据挖掘的结果和人们感性认识的结果有所不同,它不是确切的数据而是 一种模式( p a t t 锄s ) 、概念( c o n c 印t s ) 、规则( r 1 j 1 e s ) 、规律( r e g u l a r i t i e s ) 和 约束( c o n s 仃a i n s ) 等。因此,数据挖掘的结果是一种更具“普遍性”的结果,而 这种“普遍性”正是决策者用以辅助决策所需要的商务智能的实现。 2 2s o a 和w 曲服务 2 2 1w e b 服务 ( 1 ) w 曲服务概述 w 曲服务1 7 1 是描述一些操作( 利用标准化的可扩展标识语言x m l 消息传 上海大学硕士学位论文 递机制可以通过网络访问这些操作) 的接口。w 曲服务是用标准的、规范的删l 描述的,称为w 曲服务的服务描述。这一描述囊括了与服务交互需要的全部细 节,包括消息格式( 详细描述操作) 、传输协议和位置。该接口隐藏了实现服务 的细节,允许独立于实现服务基于的硬件或软件平台和编写服务所用的编程语 言使用服务。这允许并支持基于w 曲服务的应用程序成为松散耦合、面向组件 和跨技术实现。w 曲服务可以单独或同其它w 曲服务一起用于实现复杂的聚集 或商业交易。 ( 2 ) w 曲服务体系模型 w 曲服务基于三种角色【1 7 】:服务提供者( s e i c ep r 0 “d e r ) 、服务请求者 ( s e i c er e q u e s t e r ) 和服务注册中心( s e i c er e 百s 仃y ) 。三种角色互相交互, 涉及到发布( p u b l i s h ) 、绑定( b i n d ) 和查找( f i n d ) 的操作。这些角色和操作 一起作用于w 曲服务构件:w 曲服务软件模块及其描述。在典型情况下,服务 提供者托管可通过网络访问的软件模块;服务提供者定义w 曲服务的服务描述 并把它发布到服务请求者或服务注册中心;服务请求者使用查找操作来从本地 或服务注册中心检索服务描述,然后使用服务描述与服务提供者进行绑定并调 用w 曲服务实现或同它交互。服务提供者和服务请求者角色是逻辑结构,因而 服务可以表现两种特性。图2 2 显示了这些操作、提供这些操作的组件及它们 之间的交互。 图2 2w 曲服务体系结构 w 曲服务体系结构中的三个角色: 1 2 上海大学硕士学位论文 1 ) 服务提供者一从企业的角度看,这是服务的所有者;从体系结构的角 度看,这是托管访问服务的平台。 2 ) 服务请求者从企业的角度看,这是要求满足特定功能的企业;从体 系结构的角度看,这是寻找并调用服务,或启动与服务的交互的应用程序。 3 ) 服务注册中心这是可搜索的服务描述注册中心,服务提供者在此发 布他们的服务描述。在静态绑定开发或动态绑定执行期间,服务请求者查找服 务并获得服务的绑定信息( 在服务描述中) 。对于静态绑定的服务请求者,服务 注册中心是体系结构中的可选角色,因为服务提供者可以把描述直接发送给服 务请求者。同样,服务请求者可以从服务注册中心以外的其它来源得到服务描 述。对于利用w 曲服务的应用程序,必须包括以下三个行为: 发布为了使服务可访问,需要发布服务描述以使服务请求者可以查 找它。发布服务描述的位置可以根据应用程序的要求而变化。 查找在查找操作中,服务请求者直接检索服务描述或在服务注册中 心中查询所要求的服务类型。对于服务请求者,可能会在两个不同的生 命周期阶段中牵涉到查找操作:在设计时为了程序开发而检索服务的接 口描述,而在运行时为了调用而检索服务的绑定和位置描述。 绑定最后需要调用服务。在绑定操作中,服务请求者使用服务描述 中的绑定细节来定位、联系和调用服务,从而在运行时调用或启动与服 务的交互。 在w 曲服务体系结构中包含两个构件: 服务在这里w 曲服务是一个由服务描述来描述的接口,服务描述 的实现就是该服务。服务是一个软件模块,它部署在由服务提供者提供 的可以通过网络访问的平台上。服务可被服务请求者调用或者同服务请 求者交互。当服务的实现中利用到其它的w 曲服务时,它也可以作为 请求者。 服务描述服务描述包含服务的接口和实现的细节。其中包括服务的 数据类型、操作、绑定信息和网络位置。还可能包括可以方便服务请求 者发现和利用的分类及其它元数据。服务描述可以被发布给服务请求者 1 3 上海大学硕士学位论文 或服务注册中心。 ( 3 ) w 曲服务关键技术 x m l ( e x t e i l s i b l em a r k u pl a n g u a g e ) 扩展标记语言、s o a p ( s i m p l eo b j e c t a c c e s sp r o t o c 0 1 ) 简单对象访问协议、w s d l ( w 曲s e r v i c ed e s 嘶p t i o nl a n g u a g e ) w 曲服务描述语言和u d d i ( u m v e r s a ld e s 嘶p t i o nd i s c o v e 巧a i l di n t e 黟a t i o n ) 通 用描述、发现和集成是w 曲服务四大核心技术。在w 曲服务体系中,使用x m l 来描述数据结构,w s d l 来描述服务,u d d i 来发布、查找服务,而s o a p 用 来执行服务调用。下面就逐一简单介绍: 1 ) x m l x m l 6 】是由万维网联盟( w b d dw i d ew 曲c o n s o n i 啪,w 3 c ) 制订、得到 业界广泛支持的标准,被专门设计为描述数据的标准元语言。l 的优越性不 仅仅在于表现和描述数据,更重要的在于它采用文本标记的形式定义各种可交 换数据结构,并可以利用标准的网络协议进行传输。正因为这些特性,x m l 实 际上代表了平台中性和进行网络计算的趋势。 x m l 是推动整个w 曲服务架构实现的原始动力,它是w 曲服务得以实现 的技术基础。w 曲服务所依赖的其它协议规范都是以l 为标准来描述和表 达的。 2 ) s o a p s o a p 【3 1 6 1 继承了l 的开放性和描述可扩展性。s o a p 使用基于t c p 口 的应用层协议,可以与现有通信技术最大程度地兼容。s o a p 为在松散、分布 的环境中使用x m l 对等地交换结构化和类型化信息提供了一个简单的机制。 s o a p 本身并不定义任何应用语义,它只定义一种简单的机制来表示应用语义。 s q 奸定义了服务请求对象和服务提供对象之间的消息协议,实现了w 曲服务 之间的消息交换。 3 ) w s d l w s d l 【3 1 6 1 是用x m l 文档来描述w 曲服务的标准,是w 曲服务的接口定义 语言,由崩b a 、i n t e l 、i b m 、m s 等共同提出。通过w s d l ,可描述w 曲服务 的三个基本属性: 1 4 上海大学硕士学位论文 服务做些什么服务所提供的操作( 方法) 。 如何访问服务和服务交互的数据格式以及必要协议。 服务位于何处协议相关的地址,如网络地址( u r l ) 。 w s d l 文档以端口集合的形式来描述w 曲服务,w s d l 服务描述包含对一 组操作和消息的一个抽象定义,绑定到这些操作和消息的一个具体协议,和这 个绑定的一个网络端点规范。w s d l 文档被分为两种类型:服务接口( s e f v i c e i n t e 晌c e ) 和服务实现( s e i c ei m p l 锄肌t a t i o i l s ) 。 文档中的主要元素作用将在下一章结合数据e t l 的w 曲服务设计进行详细 介绍。 4 ) u d d i u d d i 【3 ,1 6 1 是一套基于w 曲的、分布的、为w 曲服务提供的信息注册中心的 实现标准规范,同时也包含一组使企业能将自身提供的w 曲服务注册以使得别 的企业能够发现的访问协议的实现标准。u d d i 提供了一种基于分布式的商业 注册中心的方法,该商业注册中心维护了一个企业和企业提供的w 曲服务的全 球目录,其目的就是促进企业的w 曲服务发展及为企业发现适当的w e b 服务, 而且其中的信息描述格式是基于通用的l 格式的。同时,u d d i 与s o a p 、 w s d l 、) ( 1 l 等是一个不可分割的技术体系。 u d d i 规范描述了w 曲服务的概念,同时也定义了一种编程接口,这种编 程接口提供了描述各种w 曲服务的简单框架。u d d i 规范包括若干文档和一个 x m ls c h e i i l a ,用来定义基于s o a p 的注册和发现w 曲服务的标准。u d d i 真 正实现了w 曲服务信息访问的“一次注册,到处发布”。 2 2 2s o a 的技术基础 s o a 是一个组件模型,它将应用程序的不同功能单元( 称为服务) 通过这 些服务之间定义良好的接口和契约联系起来【3 1 。接口是采用中立的方式进行定 义的,它应该独立于实现服务的硬件平台、操作系统和编程语言。这使得构建 在各种这样的系统中的服务可以以一种统一和通用的方式进行交互。s o a 不同 于现有的分布式技术之处在于大多数软件商接受它并具有可以实现s o a 的平 台或应用程序。s o a 伴随着无处不在的标准,为企业的现有资产或投资带来了 上海大学硕士学位论文 更好的重用性。s o a 可以作为一种全新系统的结构,也可以基于现有的系统投 资来发展,而不需要彻底重新创建系统;s o a 能够在最新的和现有的应用之上 创建应用;s o a 能够使客户或服务消费者免予服务实现的改变所带来的影响; s o a 能够升级单个服务或服务消费者而无需重写整个应用,也无需保留已经不 再适用于新需求的现有系统【3 1 。s o a 是w 曲服务的下一代体系结构【3 1 。w 曲服 务是s o a 的技术基础,但并不是实现s o a 的唯一方式。w 曲服务作为一种新 的技术作为s 0 a 的技术基础的主要原因是w 曲服务优于传统分布式计算 d c o m 和c o i 国a 。主要表现在以下几个方面【3 ,3 2 ,3 3 】: ( 1 ) 异构平台互通 w 曲服务的最大优势是提供了异构平台无缝衔接的技术手段。长久以来, 人们一直在摸索异构平台互通的解决方案,在w 曲服务之前出现的解决方案都 有一定的局限性。 当然,如果所有的用户都使用同样的硬件平台、同样的操作系统、同样的 软件,采用相同的协议通信,这样或许就根本不会产生互通的问题。但显然这 样的假设在现实中并不成立,互通的需求总是存在。例如,用户可能不希望每 次都访问公司a 的网站以察看即时股票信息,相反,他们希望在自己的应用程 序中集成该功能,w 曲服务正好满足了这种需求。公司a 把即时股票信息、查 询转变为w 曲服务s ,然后将该服务信息公布在某个公共的站点b ,用户c 通 过访问b 了解到服务s 的信息,其中包括s 的服务描述。然后c 将根据s 的服 务描述生成本地代理,借助于该代理用户获取s 提供的即时股票信息。有了 w 曲服务,就不仅仅是提供信息,还具有处理信息的无限潜力。任何两个应用 程序,只要能读写x m l ,那么就能互相通信。 ( 2 ) 更广泛的软件复用 通过组合己有模块搭建应用程序,就是软件设计中的复用技术。使用成熟 稳健的模块,能大幅度提高软件的生产效率和质量。在软件开发史中,最先出 现的就是源代码级的复用:把经常使用的代码包装为过程而被其他代码调用。 这样的复用仅限于同一种开发语言,例如,用p a s c a l 编写的排序函数不能在 c 中直接使用。为了克服这个问题,人们想到把某些公共功能编写为二进制的 1 6 上海大学硕士学位论文 动态连接库( d y i l 锄i cl i i l kl i b 聊y ,d l l ) 。d l l 可由一种语言编写而可能由 另一种变成语言调用。但不同语言编写的d l l 仍可能存在差异,例如参数传递 顺序、数据类型的内存布局等。另外,这种复用仅限于特定的平台范围内,因 为d l l 是二进制的机器代码。此外,为了使用d l l 中的函数,用户必须了解 很多细节信息,如方法名称及其参数、参数传递规则等。 c o m 是基于二进制的对象复用标准,它将接口和接口实现分离开来。借助 于系统提供的服务,用户可以透明地引用c o m 对象,而不用实现细节以及确 定d l l 所在的位置。事实上接口的实现可以采取任何编程语言,但由于c o m 是二进制标准,所以仍依赖于特定的平台。也就是说,w i n d o w s 系统下的c o m 组件在l i n u x 或u n i x 下将不可用。 采用w 曲服务技术,可以用任何语言在任何平台下把一组功能包装成w 曲 服务,然后将其注册到u d d i 中心。用户只要获得了描述w 曲服务的w s d l 文件,就可以用代理工具自动产生合适的客户端代理,然后就可以通过代理访 问w 曲服务提供的功能。这里用户不必了解w 曲服务实现的细节、实现的平台 等。用户只需确认根据w s d l 描述的w 曲服务能否满足需要,因此w 曲服务 将软件复用技术推向了一个高峰。 ( 3 ) 普遍的通信能力 w 曲服务可用基于x m l 的s o a p 来表示数据和调用请求,并且通过h t t p 协议传输这些x m l 格式数据。这一点非常重要,因为它意味着w 曲服务的调 用请求和回应消息可以透过防火墙。出于安全性的考虑,一般系统都关闭了除 h t t p 协议标准端8 0 以外的其他端口。而在w e b 服务出现以前的各种分布式组 件技术,都是基于二进制标准的,并且通过特殊的端口进行通信,因此当调用 被防火墙隔离时,就可能导致失败。 ( 4 ) 更迅捷的软件发行方式 在w 曲服务出现以前,软件主要通过机器预装、光盘等物理媒介发行。这 种发行方式的缺点是:成本高,需要大笔的营销开支,从而也增加了用户的使 用费用;软件更新周期长;不便于定制,一般只能针对某些需求制作有限数量 的版本。,软件购买者要为他可能永远不会使用的某些功能模块付费用,这显然 1 7 上海大学硕士学位论文 是不公平的。 w 曲服务改变了软件的发行方式。软件供应商把软件分解成若干w 西服务 模块构成的系统,直接在w 曲上发布软件。通过支付少量的费用,用户在网上 下载安装基本的客户端模块,这些模块利用远程的w 曲服务满足用户的特殊要 求。随着软件开发商不断更新w 曲服务版本,用户也能及时享受新版本的服务。 ( 5 ) 方便商务到商务的集成 随着电子商务的发展,各个商务公司需要更有效的方式来推动它们的商务 活动,这就产生了商务到商务集成的趋势。公司需要与他的合作伙伴建立更为 紧密的联系,以促进向现有用户销售彼此的产品。 但这个过程受到如下因素的干扰:各个企业有自己的一套专用的数据格式 和自己的业务软件,紧密集成这些软件需要大量的中间转换。但有了w 曲服务, 这种情况将得到改观。各个企业把业务软件的核心模块以w 曲的形式向其合作 伙伴发布,这样就能以较低的代价实现商务到商务的集成。 2 2 3s o a 和w e b 服务的区别和联系 人们在理解s o a 和w 曲服务的关系上,经常发生混淆。y e f i r nvn a t i s 【1 9 】 给予了以下解释:“w r e b 服务是技术规范,而s o a 是设计原则。特别是w e b 服 务中的w s d l ,是一个s o a 配套的接口定义标准:这是w 曲服务和s o a 的根 本联系。”从本质上来说,s o a 是一种架
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石大学前儿童保育学课外必读:中国居民膳食营养素参考摄入量表(DRIS)
- 2025年三年级寓言故事阅读试题
- SnO2-钛中空纤维电催化膜的制备及水处理性能研究
- 饮料行业客户细分与个性化服务策略-洞察阐释
- 专精特新小巨人企业的定义与行业定位
- 绿色园区的能源管理与低碳减排策略
- 建立产业协同机制促进跨界融合
- 新文科背景下传统文化类课程建设与实践
- 第七章运动和力教学设计
- 高中美术跨学科教学的现状与发展趋势
- 电力拖动自动控制系统-运动控制系统期末试卷附答案共6套
- 医疗器械随货同行单模版
- 康复科实习生入科教育
- GB∕T 17466.1-2019 家用和类似用途固定式电气装置的电器附件安装盒和外壳 第1部分:通用要求
- 青岛市 主要片区 项目 拆迁补偿方案 链接
- Q∕GDW 11612.2-2018 低压电力线高速载波通信互联互通技术规范 第2部分:技术要求
- 《国际贸易实务》全书电子教案完整版教学设计
- JTT888-2020公共汽车类型划分及等级评定_(高清-最新)
- DR曝光参考条件
- 房地产营销策略外文翻译文献
- 办公室面积整改方案
评论
0/150
提交评论