(计算机应用技术专业论文)数据仓库与olap在产品售后分析系统中的应用研究.pdf_第1页
(计算机应用技术专业论文)数据仓库与olap在产品售后分析系统中的应用研究.pdf_第2页
(计算机应用技术专业论文)数据仓库与olap在产品售后分析系统中的应用研究.pdf_第3页
(计算机应用技术专业论文)数据仓库与olap在产品售后分析系统中的应用研究.pdf_第4页
(计算机应用技术专业论文)数据仓库与olap在产品售后分析系统中的应用研究.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(计算机应用技术专业论文)数据仓库与olap在产品售后分析系统中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

酉南交透大攀磁士学位论文第l 夏 摘要 疆羞信怠鼓米弱遮速发展,商建嚣嫒孛懿售患越来越密集。金韭必须深入 秘羯海量数据,挖掇潜在藏霉,提嵩决策爱量。黉统豹搽豫蘩售惠警理系统 如e r p ,产生海爨鬻务数据的同时却不能自动从中提取管聪决策有用韵信息。 操作在数据仓库( d a t aw a r e h o u s e ,d w ) 乏上的联机分析处理( o n li n ea n a l y s i s p r o c e s s ,o l a p ) 技术解决了企业这一难题。它是一种基于火最信息基础上的 提炼和重新整合知识的过程,与知识焚攀和知识创造紧密缝合,完成从数撼 裂箍意,痿惠羁翘谈豹转变,蘩动金簸 l 受爨及嚣、歪确、霹孬秘骞效弱决繁, 最终提高企业竞争优势。 + 本文结合美豳x x 公司产品售后分析系统的实际,研究数据仓库与o l a p 技术在系统中的应用和实现。论文从介绷数据仓库和o l a p 技术的相关知识入 孚,在分析公司现肖信息化水平以及产精售后分析系统对o l a p 的实际需求的 蒺疆上,褥出嚣淘壤耄傈涯帮镌售戆童题;进嚣进行系绕逡黧、蠢诲方法分 褥、强形擐表工其选择等o l a p 实藏豹籍溃工作;然螽设计系统体系结构、功 能架构,并开发w i n d o w s 控制台程序实现数据从文本到数据库的装载;建盘 面向主题的数据仓库模型,并以企业业务系统数据为数据源,完成数据的清 洗和装载;最终实现蒸于o l a p 的】( ) ( 公司产品售后分析系统。 论文详细阐述鲡蔼傻焉o l a p 技零熊决蔟量傈涯和销售燕题实际器求的关 键滔蘧;荠傻瘸a j a x 技寒实凌系统懿戆辘往琵。在实瑗避簇串,论文捷炼爨 o l a p 应用系统可戆用的5 层体系结构横黧。最后论文给出熬于o l a p 的产品售 厝分析系统在】【) ( 公司质量保证部门的逡行环境和运行情况。 荚键词:数据仓艨;o l a p ;售后分析:决策支持 酉南交通大学磺士学位论文第l l 贾 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fi n f o r m a t i o nt e c h n o l o g y , t o d a y sc o m i i l e r c e b e c o m e sm o r ea n dm o r cc o m p e t i t i v e i n f o r m a t i o ni nt h eb u s i n e s se n v i r o n m e n t b e ( :0 m e sm o l ea n dm o r ei n t e n s i v e w h i c hr e q u i r e sc o m p a n i e st om a k eb e s tu s eo f t h ed a t ag a t h e r e di nt h e i rb u s i n e s st oi m p r o v et h e i rd e c i s i o n sa n dt h e r e b yi m p r o v e t h e c o m p e t i t i v ea b i l i t y o ft h e m s e l v e s t r a d i t i o n a l o p e r a t i o n a lm a n a g e m e n t i n f o r m a t i o ns y s t e m , s u c ha se r f , w h i c hc r e a t e sa l a r g ea m o u n to ft r a c t i o n 蠡t 毫 b u tc a n t g e tu s e f u li n f o r m a t i o nf r o m 趣c a l ln ol o n g e rm e e tt h e n e e d s o f c o m p a n i e s t h ec o n c e p to fd a t aw a r e h o u s i n gp w ) a n do n l i n ea n a l y t i c a l p r o c e s s i n g ( o l a p ) a r ew i d e l yr e c o g n i z e db yc o m p a n i e s o l a pa p p l i c a t i o n s y s t e mi sb a s e do nt h ep r o c e s so fr e t r i e v i n gi n f o r m a t i o nf r o ml a r g ea m o u n to fd a t a , c o n v e r t i n gt h ei n f o r m a t i o ni n t ok n o w l e d g e , w h i c hi su s e f u lf o rc o m p a n i e s i nt e r m s o ft i m e l y , e f f e c t i v ea n de f f i c i e n td e c i s i o nm a k i n g , a n d i m p r o v e st h ec o m p e t i t i o no f c o m p a n i e su l t i m a t e l y t h i st h e s i sr e s e a r c h e st h ea p p l i c a t i o no fo l a pt e c h n o l o g yi np r o d u c t a f t e r - s a l e - a n a l y s i ss y s t e ma c c o u r d i n gt ot h ef a c t u a lr e q u i r e m e n to fa m e r i c a nx x c o ,l t d 。i nt h et h e s i s ,t h ea u t h o rd o e ss o m er e s e a r c ho nt h ec o n c e p t s ,t e c h n o l o g y a n di m p l e m e n t a t i o nm e t h o d o l o g yo fd wa n do l a p ;b a s e do nt h er e q u i r e m e n t s a n a l y s i s e so fo l a pa p p l i c a t i o ni nt h es y s t e ma n dt h ep r e s e n ti n f o r m a t i o n c o n d i t i o n so fa m e r i c a nx xc o ,l t d ,t h et h e s i sg e t st w ot o p i co r i e n t e dp r o d u c t q u a n t i t ya s s u r a n c ea n ds a l e si n f o r m a t i o n ;t h e nd o e st h ep r i m a r yw o r ks u c ha s o l a ps o l u t i o nd e s i g n , q u e r ym e t h o da n a l y s i sa n ds t o r a g et o o l sc h o i c e ;d e v e l o p sa w i n d o w sc o n s o l ea p p l i c a t i o nt ol o a dd a t af r o mf i l e st od a t a b a s e ;遗a l l u s i o nt ot h e f a c t u a lr e q u i r e m e n ti n 慈c o 。l t d 。c o n s t r u c t ss p e c i a ld a t ah o u s ef o ro l a p ; d e s i g n st h ea r c h i t e c t u r ea n df u n c t i o n so ft h ep r o d u c ta f t e r - a n a l y s i ss y s t e m ,a n d f i n a l l yc o m p l e t e so l a p b a s e dp r o d u c t sa f t e r - s a l e - a n a l y s i ss y s t e m t h et h e s i ss o l v e st h ek e yp r o b l e mt h a th o wo i a pp r o c e s s e st h ev a r i e d r e q u i r e m e n ti np r o d u c ta f t e r - s a l e - a n a l y s i ss y s t e mf o rx x 铂。l i d 。d u r i n gt h e d e v e l o p m e n tp r o c e s s ,a nu n i v e r s a l5 - t a y e ra r c h i t e c t u r ef o ro l a pa p p l i c a t i o n 西南交通大学硕士学位论文第1 i l 灏 s y s t e mi sc o n c l u d e d m o r e o v e r , t h ea u t h o ra p p l i e sa j a xt e c h n o l o g yt oa c h i e v e p e r f o r m a n c eo p t i m i z a t i o n f i n a l l y t h ea u t h o ri n t r o d u c e st h ec i r c u l a t i o n e n v i r o n m e n ta n dp e r m a n e n c ee f f o r to fo l a pb a s e dp r o d u c ta f t e r - s a l e - a n a l y s i s s y s t e mu s e di nq a o cd e p a r t m e n ti nx xc o ,l t d k e y w o r d s :d w ;o l a p ;a f t e r - s a l e - a n a l y s i s ;d e c i s i o ns u p p o r t 西南交逶大擘琰士学位论文第1 页 第1 章绪论 。1 论文豹课题背景 1 1 1 传统事务处理系统的局限性 在信息社会的今天,经济和技术的发展休戚相关,技术的发展很大程度上 带动窝促进着经济豹飞速发展。各令释渡也覆骧羞激烈戆意争,及秘、准礁 豹决繁暑残为企簸缀存与发展筑生命绫。企鳖必须淹辩了瓣产品鼹毒绣鼯势、 市场需求,预测市场趋势,掌握自己客户的消费习惯,并根据这些信息及时 调整自己的产业结构和营销策略。 如今,随着i n t e r n e t 的普及,企业的信息化已得到迅遮发展。企业的信 悫佳在帮助企业完成内帮运俸、销售溪动、索场调节约霹时,产生了大量静 攀务数据。这登数摅舔是在其俸事务聚壤过程孛蔽集,数援囊大,没有燕撵, 不能直接被传统的攀务处理系统所利用。企业已经认识到如果对这些庞大的 数据加以组织、分析和应用,将信息转化成对企业有用的知识,将对企业做 出正确决策,快速成对市场变化起到关键性作用。 传统的事务处瓒系统,几乎都以数撼麾系统作为数攒警爨手段。经过数中 冬懿发震,在这魏数据瘁孛己经保存? 大量兹嚣需篷务数糕。传统旋堑务系 统一般直接建立农这种事务处理环境七,它以数据库为中心,从事事务处理、 批处理和部分相对简单的决策分析等数据处理工作。随着技术的进步,人们 试图让计算机担任鼹多的工作,希望计算机更多地参与数据分析与决策制定 领域,实现商业智能。丽数据库技术墩袁力图使自己能黢任从事事务处理、 援楚理婺复杂豹决策分辑处理等冬耪炎鍪豹绩塞处理任务。然嚣久爨逐溪试 识到,事务处理和分析处理具有不同的特征,事务处理系统无法解决分析她 理系统必须解决的数据集成、动态集成、历史数据和数据综合等问题,直接 使用事务处理环境来支持决策是行不通的。要提高分析和决策的效率和有效 性,分析型处理及其数据必须与操佟型处理及其数据楣分察。必须把分析型 数据葳事务憝瑾繇凌串提取塞寒,滋露霪耨缍织,建立攀猿筑分爨受理嚣凌 嚣南交透大攀磺士学位论文第2 页 1 1 2 决策支持系统的需求 如何有效刹瘸瑗有庞大数据,建立有效的决策支持系统( d e c i s i o n s u p p o r ts y s t e m , d s s ) 是金遂熬当务乏急。 对决策支持系统的需求使得对企驻数据的使用不再髑限于简单分散酌统 计报告,这种统计对数据查询只能得剿以二维形式呈现的统计报告,无法进 行有目的的分析。必须将数据重新组织,以便于进行分析操作。近来兴起的 数据库仓库( d a t aw a r e h o u s e ,d w ) 技术为d s s 的发展提供了额的动力。 夔羞壤技零燧予d s s ,d s s 己囊建蹇在攘型、方法戆蒸旗上夔定量分耩 系统,发展是建藏农数据仓库之上,激联杭分析处理( o n - l i n ea n a l y t i c a l p r o c e s s i n g ,o l a p ) 和数据挖掘( d a t am i n i n g ,d m ) 为工具的应用体系。 数据仓库把众舭决策所需的信息从众业原来分散的、难以处理的操作型 数据中分离出来,转化成面向主题的、集成的、稳定的、随时间变化的数撂 集会,它对操律撰数攥进行绞谤汇惑分辑,实瑷对信息会壤、蹇效豹管理。 笼于中阉层瀚o l a p 是铮对特定瀚题的联藐数据访翅分辑。o l a p 委受会定 义,“o l a p 是使分析人员、管理人员或执行人员能够从多种角度对从原始数据 中转化出来的、能够真正为用户所理解的,能真实反映众北维特性的信息进 行快速、一致、交飘地存取,从而获得对数据的更深入了解的一类软件技术”。 o l a p 技术使数据仓痒筢够快速晌缴熏复露复杂约分糖粪澳,驮焉侵数据 仓痒镜有效逑嗣予联税分辑。o l a p 熬多数据模型和数撵絷含技零可 :乏组绞辫 汇总大量的数据,以便能够利用联机分析和图形工具迅滤对数据进行评估。 当分析人员搜寻答案或试探可能性时,得到对历史数据鲞询的回答后,经常 需要进行进一步畿询。可以快速灵活地为分析人员提供实时支持。 基于数据仓霹靼跣a p 技术的决繁支持系统鲍提出;| 越了学术赛移工逆券 戆广泛关注。s t a n f o r d 丈学、w i s c o n s i n 大学、i b ma l m a d e n 研究孛心等磅究 机构纷纷立项从攀决策支持系统的研究和开发。许多著名的数据库厂商,蜘 i b m ,h p ,o r a c l e 等纷纷推出了自己的数据仓库产品、解决方案。这些产品为 大型零售业、制遗她等企业所采用,融有不少成功案例。财富5 0 0 强中己经 霄8 5 9 6 的企业建成或正在建立数据仓麾,数据仓库与i n t e r n e t 一榉,正在 西南交通大学硕士学位论文第3 贞 成为最快的i t 增长点。而在国内,诸如金融、证券、电信等计算机应用较犁、 较成熟的行业也已经意识到采用数据仓库技术能够对数据进行照好的加王处 理,发现其内在静规律饿,帮劲跌策者指导众堑决策稍发摇企效的竞争优势, 它们也纷纷建立了自己的决策支持系统。 1 1 3 论文的课题来源 本研究谍题主要采巍予终考稳磷究生除段戆学瑟内容窝实麓经历。论文黻 律者在实习公司所参与的美国一火型制造众业的产品侮后分析系统为背景, 研究o l a p 技术在产品售质分析系统的应用和实现过程。并设计和完成本系统。 该系统基予8 s 模式,主要基搽在予绘该垒整镦叠部门矮孥久提供余美 销售和维修数据汇总后的产品年失败率( a n n u a lf a i l u r er a t e 简称a f r ) 分 析以及产品镁羼维修滤稷斡平台。它的核心是终全球餐大小分镶亵处的魇有 产潞的销售数据和维修数据定期汇总蓟一个数据存储设备中,使用o l a p 技术 实现对海量数据的多维分析。最后将分析结果以直观的图表形式在w e b 贝上 曼黎绘毽a 部门矮导入。 通过这一流程,企业能够快速、准确和方便的了解自己产品嫩产线上的故 障情况、销售情况和维修情况,预测产品市场形势和市场趋势,做出正确决 策,扶面改滋生产技术,提高企娩产品竞争力和投资豳掇率。 1 2 论文的硒究内容和维织结构 1 2 1 论文的研究内容和主要成果 本论文怒在分析当前o l a p 的实现方法豹前提下避行的。结含x x 公司产 品傍后分析系统,着重从应用的角度对o l a p 在本系统中的开发方式和实现过 程遴行涤入懿研究蟊详罨熬阐述。实瑗本系统懿关键患是瑟蠢燕题熬数攒仓 库设计,o l a p 查询分析和图形报寝展示。嗣绕这3 个问题,我进行了以下研 究誓作: 1 ) 数撼仓库体系缡构研究,包括概念、逻辑、物理模型的设计和无数据 西南交滋大学硕士学位论文第4 页 的管理体系。 翁o b 撑奁询分析技术研究,重点在予o u 诤的体系结构和翦端展现方 式研究。 3 ) 图形报表工具分析和展永方法学习。 啦a j a x 器步响应技术觋究,包撂a j a x 谤求代理凝臻l 和a j a x 捶律懿选撵。 通过以上对o i 4 j ,技术的全蹰研究,绪合本文x x 公司产龉售后分析系 苑的实际。本文的主要成果有: 1 ) 详缨分析j 【) 【公镯硗毒静髂怠纯求擎苏及产麓褒螽分辑系统对兢舻鞠 需求,得出面向质量管理和销售的擞题。进而进行系统选型、查询方 法分辑、图形擞衰工具选择等0 l l p 实篷的裁端工作。宠残系统体系 结构和功能模块的设计工作。 2 ) 开发w i n d o w s 控制台程序实现数据从文本到数据库的装载。 3 ) 铮瑟该系统瑟惫爱量警蘧和镑售豹嘉蘧,建纛数据仓露模壅,势激企 业内部的产品销售和维修数据为数据源,按照数据仓库模型进行数据 抽取、渍洗、转换和加载,建立蕊肉主题的产品售后分据0 l a p 系缝 豹数据仓库。 4 ) 实现撼于0 l a p 的x x 公司产品售后分析系统。详细阐述如何使用0 l a p 技术实觋产品馨震信惠懿多维奎谗分羲懿过壤。势使鼹a j a x 按零实 现系统的全面优化。 5 ) 提炼嫩在0 l a p 应用系统巾可重用的5 层体系架构模型。 2 ,2 论文的组织结构 第1 章绪论。介绣传统事务处理系统的蜀限毪帮基于能a p 兹决繁支持 系统的需求和发展。提鼢本文的课题背景及研究内容。 第2 章数据仓库秘0 l a p 技术壤述。橇要灸绍数撬仓库鲍搬念、体系终梅 和数据的存储管理,以及0 l a p 的定义、体系结构和袭示方法等。 第3 章产品售后分析系统0 l a p 的前端分析。结食x x 公司现有信息化水 擎,按照软彳孛正程懿骧疆进行产鼓售鑫分辨系统静能好需求分褫,基予流骚 昀解决方案设计、系统选型、查询方法分析等前端工作。 西南交通大学硕士举位论文第5 页 第4 章产品售后分析系统数据仓库的设计。以企业内部的产品销售和维 修数据为数据源,开发装载数据副数据库的w i n d o w s 程序,并按照所建擞的 数稻仓痒模鏊进行数蠢辛鸯取、清洗秘翻载,建宠面商主题的产菇侮后分祈跣a p 系统的数据仓库。 第5 章产品售后努爨系统o l a p 瓣实瑰。设诗系统弱癸系絮撬露功巍模块。 针对质量管理和销售主题,介绍如何使用o l a p 技术解决) ( ) 【公词产品售詹分 析系统的实际需求,最终实现基予o l a p 的产品售后分析系统。同时介绍系统 熬镶藐往纯方案帮运行效采。 篇6 章结论。对本论文的工作进行总结,概括本文的主要成果和成功点, 同时指出本文毒待进一步磅究懿篡作。 1 3 本章小结 本章在搿述传统事务处理系统的局限饿韵基础上,介绍了慕予o l 舻技术 的决策支持系统的需求和发展,阐述了论义的课题来源和组织结构,介缓了 俸器莛本文巾戆溪究蠹骞移主要终。 酉瘴交逶大学磁士学谴论文蘩8 页 第2 章数据仓库和o l a p 技术概述 2 i 数据仓库 2 。1 。1 数据仓癣豹定义 2 0 世纪8 0 年代中期,“数据仓库”词首次出现在“数据仓库之父” w h i n m o n 的“b u i l d i n gd a t aw a r e h o u s e “书中。霄h i n m o n 把数据仓库定 义走“数据仓瘁怒褥向主题的、集成鲍、稳定的、随时闻变化静数据集合, 瓣予支持管理决繁避程”。这是公认豹瓣数蹇仓痒最较藏翁定义。该定义据爨 了数据仓库面向童蹶、集成、随对阐变化的、非易失的这豳个重要特征。 面向主题:数撼仓库围绕一些主题,排除对于决策无用的数据,提供特定 主体的简明视图。 集成的:构造数据仓库是将多个髯荦申数据源集成在一越,确保命名约定, 缡殛缝捣,霾毪囊薰等致毪。 时交豹:数据襻储从历史靛角度提供信息数据仓岸的笑键结构,豫式或 最式地包含时间冗紫。 非易失的:数掇仓库总是物理地分离存放数据;由乎这种分离,数据仓库 不需要事务处理。恢复和并发控制遴常数据仓库只需要孵种数据访问:数攒 豹裙始纯装入和数撩凌淘。 2 1 2 数据仓库体系结构 数据仓库是一种语义上一致的数据存储,已充当决策支持数据模型的物 毽实瑷,并存放众她战略决策所需倍感。为拢,数据仓库墩磐蔽看终是一秘 支簿缍毒奄纯嚣专门戆查诲、分辑擐誊秘决繁裁定懿嚣系络瓣。舞霆2 - 1 掰示獬。 由于数据库和数据仓库应用的出发点不同,数据仓库将独藏于业务数据库系 统。但是数据仓库又同业务数据库系统息息相关。事实上,数据仓库系统= e t l + 数据存储+ o l a p 十客户端。 西南交逢大攀磺圭学位论文第7 页 数据橐市 霎一甸 l _ 镕l 4l j 匿蚕, m a p 图2 - 1 数据奄庠体系结构街 2 1 3 数据仓库的数据组织结构 一个典型鳃数蘩念痒熬数据组织缝掏懿藿2 - 2 掰汞溯。在数据仓库孛,数 据一般分藏4 个缀潮:离度综合级、袋发综合缓、当前缨够级和翠羯细节级。 源数据( 早期细节级数据) 经过综合后,首先进入当前绷节级,然后根据 应用的需求,通过预运算将数据聚合成轻度综合和高度综合级。由此可见, 数据仓库中存储者不同综合级别的数搬,一般称之为“数据粒度”。 匿2 2 数据仓瘁的数据组织结构图“1 每旯产 品镑善德提 每天产 品销售情况 产品镑售 谊息 产品销售 明细信息 够静 圆 圈圆圆 吾南交通大攀硕士学位论文第8 页 粒度 粒度指数据仓摩敬数据单位中像京数据的缨化和综合稷度的级别。粒度越 大,表示缝节疆发戆艇,综会程覆越麓。粒麦霹疆分隽箍挚争形式,一静是瓣 数据仓痒串的数嚣豹综合程度高低靛一个度量,它既影晌数据仓库中豹数据 薰的多少,也影响数据仓库所能回答询问的种类。所以,粒度级别的选择既 不能太高,也不能太低。粒度是数据仓库中主要的设计问题。 努裁 分割是数撵愈库中的另一个重要概念,其强豹统怒为了提高效率。它 是将数据分散到各自的物理单元中,以便能分别独立处域。有许多数据分割 的标准可供参考,如日期、地域及业务领域等。一般而吉,分割标准应包括 日期项,它十分岛然,而且分割均匀。 元数据 元数据描述了数据仓库的数据和环境。元数据可以分为两类。一类是管理 元数据,主要为负责开发、维护数据仓库的i t 人员所使用。它是对元数据源 及其内容、数据仓库主题、数据转抉及备种操作信息的描述。包括业务系统、 数据仓痒和数撂篾露瓣钵系结褥程羧妓,汇总震静算法,囱臻终琢壤到数撵 仓库环境静浃瓣。另一类是臻户元数缀。它获壁务角度撩逑了数据仓库孛豹 数据,提供了介乎使用者和实际系统之间的语义层。使得不懂计算机技术的 业务人员也能够读憾数据仓库中的数据。数据仓库元数据横裂如图2 - 3 示嗍。 西鸯交通大攀磺士攀往论文第9 页 图2 - 3 数据念库元数据模型 2 。 。4 数摅的襻镳摹羹篱瑾 数据仓库的冀藏关键是数据的存储和管理。数据仓艨的组织管理方式决 定了它有别于传统数据库的特性,同时也决定了其对外部数据表现形式要 决定采用什么产懿和技术来建立数据仓库核心,则需要从数据仓库的技术特 点着手分拆。 数据仓毒逶劐鹣第一个润嚣楚辩火羹数摇豹存筵帮瞽毽,这里搿涉及豹 数据量比传统事务处理大得多,且髓嚣寸闻的推移而累积。从现有技术和产品 来看,只有关系数据库系统能够担当此任。关系数据庠缀过长期的发展,在 数据存储和管理方蕊已经非常成熟。j 其它数据管理系统w 比。目前不少关 系数据摩系统己支持数据分割技术,簸够梅一个大的数攒鼯表分散在多个物 器南交透大学颈士学位论文第 o 页 理存储设备中,谶一步增强了系统管联大数据量的扩展能力。采用关系数据 库管理数百个g b 旗趸到t b 的数据已是平常的事。一些厂商还专门考虑大数 据量的系统备份阅蹶,好在数据仓蓐对联搬备份的要求势举褒。, 数据仓痒要辩决的第二令蠲蘧怒羚器处理。在转缓瑕税攀务楚瑾应矮孛, 用户访闯系统的特点是短小丽密集。对呵:一个多处理机系统来说,能够将用 户的请求进行均衡分担是关键,这便是并发操作;而在数搬仓库系统中,用 户访问系统的特点是庞大而稀疏。每一个查询和统计都很复杂,但访问的频 率并不是很离。此时系统需要有能力将所有的处理机调动起来为这一个复杂 瓣查谗请求黢务,将浚请求势孬楚建。霾建,著行楚瑷援零在蘩囊仓疼孛毙 以往更加重要。目前,关系数据库系统在并行处理方面已能傲到对查询语句 的分解并行、基予数据分割的并行、以及支持跨平台多处理机的群集环境, 能够支持多达上两个处理机的硬件系统并保持性能的扩展能力。 2 ,2 联毫莲分毒嚣处理( 陡妒) 2 2 1o l a p 的定义 联机分析处理( o u p ) 的概念最早怒由关系数据库之父b f c o d d 于1 9 9 3 年提出的。当时。c o d d 认为联枫事务处理( o 乙t p ) 已经不能满足终端用户对数 据库查运分撰熬鬟瑟,鞫l 慰大数据鬻遴镫瓣麓擎壹诲邀誉筑滚是趸产分褥戆 需求。用户觞决策分析需要对关系数搦痒进行大量计算劣能得到结果,丙誊 询的结果并不能满足决策者提出的需求。因此c o d d 提出了多维数据库和多维 分析的概念,即o l a p 。 o l a p 是使分析人员、管理人员或执行人员能够从多种角度对从原始数据 孛转 二篷来戆、辘够囊蓬为矮户掰蘧瓣豹,莠囊实爱浚金渡多维特蛙夔售怠 进行侠速、一致、交互的存取,瓤嚣获得对数据豹更深入了解的一类获释技 术”1 。它具有五个熬本特征:快速性、w 分析性、共享性、多维性和信息性。 旗基本思想是企业决策者能够灵活地操作企业的数据,以多维的形式从多方 面和多角度来观察众业的状态并了解企业的变化。o l a p 的鳍标是满足决策支 簿或多维蓼缓特定瓣套逮襄擐表嚣求。 嚣南交逶大学磺士学位论文第 1 茭 o l a p 提供了对数据的多维分析方法,包括切片( s l i c e ) 、切块( d i c e ) ,旋 转( r o t a t e ) 、上钻( d r i l l u p ) ,下钻( d r i l l d o w n ) 等分析动作。 2 ,2 2o l a p 体系练梅 0 l a p 多维分析的实现由四大部分缀成:多维分析主鼹数据库、多维分析 模型设计j 多维分折立方体生成、报袭图表制作。一般采用一种多用户的三 层体系结构,如图2 _ 4 所示嘲这种结构的优点在于将业务逻辑、图形用户界 嚣及数据库管理系统严疆区分舞,鸯秘予系统静维护帮势缀。复杂敢应用逻 辑不是势毒于掰终上瓣众多熬踅稳童,藕是集孛存敦瓷瓯舻驻务器上,由 服务器提供高效的数据存取,安排后静处理以及报表与娥壤,大大提高效率。 m d x 蠢诲 r o p ,啪l 群 薅户请求 h o l a p 瓢务嚣 臼 查询结果 抽协赫忸 查询结果 口 r 蜘u e s t w m g 豳2 1 4o l a p 静三瓣客户派务器结构” 在o l a p 系统的实现中,按照o l a p 的存储方式( 数据组织方式) 的不同, 可将o l a p 分成r o l a p ( r e l a t i o n a lo l a p ) ,m o l a p ( m u l t i d i m e n s i o n a lo l a p ) 和h o l a p ( h y b r i do l a p ) 。按照进行o l a p 分析动作处理地点的不同,可将o l a p 分成s e r v e ro l a p 秘c l i e n to l a p 鼹秘。图2 5 显示了按照不同方式对o l a p 避孬熬势类瓣。 西南交通大学硕士学位论文第1 2 页 2 2 3w e bo l a p 图2 - 5o l a p 的分类 随着i n t e r n e t 技术的发展和网络的普及,人们对网络的应用有了新的认 识。将w e b 技术与o l a p 结合,扩展了o l a p 的应用范围。并成为o l a p 发展的 一个新方向,其结构如图2 - 6 所示m 。 w c b 谢览嚣w 曲服务器应用服务器 数据库服务器 图2 6w e bo l a p 结构 客户通过w e b 浏览器提交分析请求给w e b 服务器,w e b 服务器将用户的分 析请求交给应用服务器,在这过程中h t m l 语言被转化为s q l 语句,应用服务 器完成分析操作并将结果传给w e b 服务器,w e b 服务器再将结果返回给用户。 2 2 4o l a p 的前端展现方式 目前,o l a p 的前端展现方式主要有:c s 方式,w e b 方式和瘦客户机方式。 c s 方式是最为传统的方法,它工作原理简单,但是由于应用逻辑的改变, 西南交通大学硕士学位论文第1 3 页 需要在服务器和客户端同时修改程序才能提供新功能,并且需要在客户端安 装0 l a p 的客户侧产品,这增加了系统的投资。因此c s 主要由数据分析员使 用。数据分析员可以根据需要灵活操作各种分析,查看各种分析结果 o l a p 的前端展现方式也向着w e b 发展,相当多的0 l a p 应用都选择w e b 作 为其前端展现的平台,这是因为w e b 有着极佳的跨平台性,客户只需利用浏 览器而无需其他的终端软件就可以浏览丰富多彩的信息。o l a p 的w e b 呈现方 式非常适合企业的管理人员使用,他们无需进行任何的培训就可以方便的通 过网络查看他们关心的信息嘲。 w e b 呈现方式具有很好的跨平台性,随着o b j e c tw e b 的应用,客户端和 服务器端的交互有所改善,但是客户端的分析动作或多或少受到w e b 方式的 限制。因此人们提出了一种介于c s 和w e b 方式之间的方式一瘦客户机方式。 在这种方式下,客户端需要安装一个很小的程序,它能够在远端执行一部分 常用的分析功能,应用逻辑变化时,这个程序基本不需要变化。 2 3o l a p 的表示和发布技术 为了使分析后的数据直观、简练地呈现在用户面前,需要采用一定的形 式表示和发布出来,通常采用的是一些查询和报表工具。不过,目前越来越 多的分析结果是以可视化的形式表现出来,这就需要采用信息可视化技术1 。 所谓信息可视化是指以图形、图像、虚拟现实等易为人们所辨识的方式 展现原始数据间的复杂关系、潜在信息以及发展趋势,以便我们能够更好地 利用所掌握的信息资源。随着w e b 应用的普及,o l a p 的解决方案能够提供基 于w e b 的应用服务,这样就扩展了0 l a p 查询分析的信息发布范围。作为基于 w e b 的o l a p 解决方案,需要一些基本的组成要素,包括基于w e b 的o l a p 服 务器、会话管理服务、文件管理服务、调度、分配和通知服务、负载平衡服 务和应用服务等。 西南交通大学硕士学位论文第1 4 页 2 4o l a p 系统解决方案分析 2 4 1 厂商解决方案分析 0 l a p 系统是一系列由系统和技术支持的以简化信息收集、分析策略的集 合,因此各大软件厂商根据自己已有的传统产品,结合各自面向管理的数据 分析理念,推出自己的o l a p 解决方案“”。目前包括o r a c l e 、微软、i b m 的厂 商往往把o l a p 系统打包在其他软件中推广,特别是有自己数据库产品的厂商, 比如o r a c l e 。他们除了有数据库产品外,还有其他应用软件产品,以下对其 中最具代表性的三个厂商一- o r a c l e 、i b m 和m i c r o s o f t 的解决方案进行分析。 1 0 r a c i e o r a c l e9 i ,o r a c l e9 i a s 和o r a c l e9 i d s 提供了开发和部署o l a p 应用系 统的一整套平台,如图2 7 所示“”。此方案是一个集成的产品,不必需要系统 集成人员的介入。 ( 1 ) 数据仓库平台:包括o r a c l ed a t a b a s el o g 、o r a c l eo l a p 、o r a c l ed a t a m i n i n g 引擎和o r a c l ew a r e h o u s eb u i l d e r 。 ( 2 ) o l a p 分析工具:包括o r a c l e b id i s c o v e r e r 、o r a c l e b is p r e a d s h e e t a d d i n 、o r a c l e b id a t am i n e r 、o r a c l er e p o r t ss e r v i c e s 和o r a c l e b ib e a n s 。 ( 3 ) 分析应用程序:包括o r a c l ed a i l yb u s i n e s si n t e l l i g e n c e 、o r a c l e b a l a n c e ds c o r e c a r d 、o r a c l ee n t e r p r i s ep l a n n i n ga n db u d g e t i n g 、o r a c l e a c t i v i t yb a s e dm a n a g e m e n t 和o r a c l ep e r f o r m a n c ea n a l y z e r 。 一一、 、一一 o r a c l e9 i i ,蒜;i o r a c l e9 i o l a p 服务 l businessintelligence l 数据仓库 ii 应用程序服务器 i b e a 他 f b ib c a n s 知识库 图2 - 7o r a c l eo l a p 分析平台 同时,o r a c l e 9 io l a p 为分析应用程序提供了一个完整的应用平台。它已 与o r a c l e9 i 关系数据库高度集成,从而使数据复制的必要性降到最低。提 西南交通大学硕士学位论文第1 5 页 供分析数据库通常具有的高速查询响应时间。易于管理同时具有高成本效益。 o r a c l e 解决方案的特点是: o r a c l e9 i 数据库作为存储数据库。 提供j a v ao l a pa p 工和b u s i n e s si n t e l l i g e n c eb e a n s 两种方式来 开发应用程序。 提供访问c u b e 的查询语法p x p r e s sc o m m a n d 。 w e b 代理及w e b 出版。 没有提供v b 编程接口。 2 i b _ i b m 为零售行业提供了专门的o l a p 应用系统解决方案r b i s 。r b i s 提供全 面的包含零售企业客户分析、商品定价、营销效果分析、商店运作等多方面 的报表库。i b mo l a p 应用的基本体系结构包括以下部分o ”: ( 1 ) 数据库:d b 2 关系数据库系统系列产品提供数据管理功能,支持智能 数据分区和并行查询,对数据立方体的查询和o l a p 钻取操作等,支持u n i x 和w i n d o w s n t 操作系统。 ( 2 ) 数据仓库:w a r e h o u s em a n a g e r ( 数据仓库管理器) ,一个功能很强的 集成环境,既可用于数据仓库建模和元数据管理,又可用于数据抽取、转换、 装载和调度。 ( 3 ) 多维分析:d b 2o l a ps e r v e r ( d b 2 多维服务器) 。它是一个r o l a p 和 m o l a p 混合的h o l a p 服务器,在e s s b a s e 完成数据装载后,数据存放在系统指 定的d b 2u d b 数据库中。应用程序可以通过d b 2s o la p i 访问多维数据库。 i b m o l a p 解决方案的特点是: 大型数据库d b 2 作为存储数据库。 提供了e s s b a s ea p i 来建立o l a p 的应用程序。 提供访问c u b e 的查询语法q u e r ys c r i p t 。 3 m i c r o s o f t m i c r o s o f t 的o l a p 解决方案是包含在m i c r o s o f ts q ls e r v e r2 0 0 0 中的。 m i c r o s o f ts o ls e r v e r2 0 0 0 是大规模联机事务处理( o l t p ) 、数据仓库和电子 嚣南交遗大攀磺士学位论文第1 8 茭 商务应用程序的数据库平台。其中的m i c r o s o f ts q ls e r v e r2 0 0 0a n a l y s i s s e r v i c e s 是用于联机分析处理( o l a p ) 和数据挖掘的中层服务器。a n a l y s i s s e r v i c e s 系统包撩a n a l y s i ss e r v e r 秘p i v o t t a b l e ts e r v i c e ,可以构造用 于势拆熬数摇多缭数撂集,弱跨a n a l y s i ss e r v i c e s 系绫还提供麓多维数撵 集信息的快速客户端访问n 瓤埘。 a n a l y s i ss e r v i c e s 将数据仓库中的数据组织成包含预先计算聚合数据的 多维数据集,以便为复杂的分析查询提供快速解答。可以从多维( o l a p ) 和关 系数据源这两者创建数据挖掘模型。逐瓤l ;对这薅类数据疲周数据挖掘模型。 p i v o t t a b l e t 瑕务爨系统孛包含戆遵麸既e 熬戆撵供毽渗,m i c r o s o f te x c e l 和其它供应商提供的应用程序用它检索目醢务器鲤数据并将结果显示给用户。 o l a ps e r v i c e s 的系统构架如图2 - 8 所示“”。微软o l a p 包含的组件有: 图2 - 8m i c r o s o f to l a ps e r v i c e s 系统架构n 3 1 ( 1 ) 以m i c r o s o f ts q ls e r v e r 、a n a l y s i ss e r v i c e s 及m i c r o s o f to f f i c e 淹圭。 嚣南交透大学硕士学位论文第 7 页 ( 2 ) b i 共同作般;s h a r e p o i n tp o r t a ls e r v e r ( 3 ) 可视化:d a t aa 1 1 a l y z e r 。 ( 4 ) 地理空阕分辑:m a p p o i n t 。 ( 胬熹毒藏分耩;c o m m e r c es e r v e r2 0 0 0 。 ( 6 ) 零售与营销分析:b ia c c e l e r a t o rf o rs o ls e r v e r 。 ( 7 ) 项目管理:m i c r o s o f tp r o j e c t ( 8 ) 资料分析:o f f i c ew e bc o m p o n e n t s 。 m i c r o s o f t o l a p 解决方案的特点怒: m i c r o s o f ts q ls e r v e r 2 0 0 穆必存赣数据痒。 提供a d o 鞫d s o 两种对象来谤阉开发o l a p 应用程序。 提供完整的对象体系结构,为o l a p 提供不同目的和层次的对象库。 提供访问c u b e 的查询语法肋x 。 支持v b 和v c + + 编程。 支持w e b 藏臻。 , 2 4 2 厂商解决方案总结 o r a c l e 、i b m 和m i c r o s o f t 兰个厂商的平台都支持兰滕体系结构下的应用 程序舞发。其中鹣o l a p 套诲分析功能接嗣是利用各厂商数攒瘁系统的a p i 绽 写豹功耗缓舞,该缀 孛受责完残接l | 雯客产端豹功戆请求,赞囱数据痒疆务器 进行相应的查询,稃将结果以标准格式传回给客户端,并以适当形式显示。 综合分析以上厂商o l a p 系统解决方案,总结出以下几个共闯的特点: ( 1 ) 包含工具都是基于传统的c s 模式提供

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论