(工商管理专业论文)数据仓库管理系统在零售连锁企业之应用研究.pdf_第1页
(工商管理专业论文)数据仓库管理系统在零售连锁企业之应用研究.pdf_第2页
(工商管理专业论文)数据仓库管理系统在零售连锁企业之应用研究.pdf_第3页
(工商管理专业论文)数据仓库管理系统在零售连锁企业之应用研究.pdf_第4页
(工商管理专业论文)数据仓库管理系统在零售连锁企业之应用研究.pdf_第5页
已阅读5页,还剩88页未读 继续免费阅读

(工商管理专业论文)数据仓库管理系统在零售连锁企业之应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容提要 将数据分析及储存起来是一种企业上应有的策略,可给予企业高层决策阶层及相关 人员一种弹性存取及分析重要信息的方式。然而t 如何去定义其需求及成功地建置一个 数据仓库,是会比起一般所谓的应用系统的开发来讲,是困难了许多。原因即在于一般 的应用系统开发时其对应的业务单位需求均已十分明白,然而数据仓库的建置却是必须 了解并且能够弹性分析数据需求模式,而这些模式每次并不是一成不变的。 建置数据仓库的成功因素:必须要能够在深入了解企业信息的需求并能吻合企业营 运方向的基础上,提供全面且具策略价值的信息给它的使用者,不论是高阶主管,或 是一般相关业务人员。成功发展及建置数据仓库极具复杂性:不光是在新的信息科技上 做改变即可,要满足使用者信息及报表需求的多样化及快速转变更是件不简单的事,而 数据仓库的最重要发展方向即在发现有价值的信息及储存下来,提供决策时重要而有策 略价值的参考。 最后数据仓库的价值是创造一个决策形成的信息基础,这些特征与得到的利益有: 从应用系统或其它来源撷取有意义的数据集,去了解问题,解决问题、流程控制与分享 信息。促进决策的形成,建构企业多维角度观点。结合统计分析与报表工具去发展企业 洞察力。支持决策的策略是一项趋势,能带相关人员在日常作业中,何者是对? 何者 是错? 最大利益为何? 零售连锁企业能轻易提供上万品项商品作为销售,也能轻易累积百万客户销售数据, 面对这些数据讯息如何转换成决策信息,是该企业领导干部梦想渴望得到的结论,我希 望能透过个案公司建置数据仓库过程与实证研究转成文字记载,提供成果分享。 关键词:数据仓库( 考船螽东辉毋渤,零售连锁企业, 决策支持( 占咸脯决康期,数据挖掘( 旨咸曰再黄鹑锈搦 联机分析处理( 考蓐曰辑:疆亡髟埒分祈客枣召野 a b s t r a c t a ne n t e r p r i s es h o u l dh a v ei t ss t r a t e g yo nd a t aa n a l y s i sa n dd a t as t o r a g es i n c ef l e x i b l e i n f o r m a t i o na c c e s sa n da n a l y s i sa r ee s s e n t i a l f o re x e c u t i v el e v e li nd e c i s i o n m a k i n g h o w e v e r , t h er e q u i r e m e n td e f i n i t i o na n dt h eb u i l d i n go fad a t aw a r e h o u s ea r ef u rm o r e d i f f i c u l tt h a nt h a to far e g u l a ra p p l i c a t i o ns y s t e m t h er e a s o nl i e si nt h a t ,f o rt h er e g u l a r a p p l i c a t i o ns y s t e m s ,t h er e q u i r e m e n t sf r o mu s e ru n i t sa r ev e r yc l e a ri nt h ed e v e l o p m e n t p e r i o d ,w h i l et h er e q u i r e m e n t s ,t h ed a t aa n a l y s i sm o d e l s ,o fb u i l d i n ga d a t aw a r e h o u s e f l u c t u a t ea l lt h et i m e t h es u c c e s sf a c t o r st ob u i l dad a t aw a r e h o u s ei n c l u d e :i n d e p t hu n d e r s t a n d i n go ft h e e n t e r p r i s e si n f o r m a t i o nn e e d sa n dt h ea b i l i t yt op r o v i d ei n f o r m a t i o nw i t hs t r a t e g i cv a l u e s t ou s e r s ,e i t h e rt oe x e c u t i v el e v e lt ot h eb u s i n e s su n i t s d e v e l o p i n gaw e l l - d e s i g n e dd a t a w a r e h o u s ei saw o r kf u l lo fc o m p l e x i t i e s i tr e q u i r e sn o to n l yt h ea d o p t i o no fl a t e s t i n f o r m a t i o nt e c h n o l o g y , b u ta l s ot h ef u l f i l l m e n tt ot h er a p i dc h a n g eo fr e p o r tf o r m a t sa n d i n f o r m a t i o nn e e d s t h em o s ti m p o r t a n tg u i d e l i n ef o rd e v e l o p i n gad a t aw a r e h o u s ej st o e x p l o r ea n ds t o r ev a l u a b l ei n f u r m a t i o nf o rd e c i s i o ns u p p o r t d a t aw a r e h o u s e ,w i t hi t s c a p a b i l i t y t oc r e a t ea ni n f o r m a r i o nb a s ef o r d e c i s i o n m a k i n g , w i l lb r i n gs i g n i f i c a n tv a l u e st o a ne n t e r p r i s e f i r s t , i ti n t e g r a t e s i n f o r m a t i o nf r o md i f f e r e n ta p p f i c a f i o ns y s t e m sw i t h i nt h ee n t e r p r i s e t h ev i s i b i l i t yo f i n f o r m a t i o nw i l lb ev e r yh e l p f u lf o rp r o b l e mi d e n t i f i c a t i o na n dw o r k f l o wc o n t r 0 1 s e c o n d , d a t aw a r e h o u s eu s e sm u l t i - d i m e n s i o n a ld a t ac u b ec o m b i n e dw i t hs t a t i s t i cm e t h o da n d r e p o r t i n gt o o l st oc u l t i v a t e d i s c e r n m e n tt ot h ee n t e r p r i s e a sar e t a i lc h a i ns t o r e ,w ec a ne a s i l yg a t h e rc u s t o m e ri n f u r m a f i o nf r o ms e l l i n g m i l l i o n so fc o m m o d i t yi t e m s h o wt oc o n v e r tt h a tb u i ka m o u n to fd a t ai n t ou s e f u l d e c i s i o n - s u p p o r ti n f o r m a t i o na r ew h a tl e a d e r se a g e rt ok n o w 1h o p e t h a tb yi m p l e m e n t i n g t h er e s e a r c ha n dr e c o r dd o w nt h ep r o c e s si nb u i l d i n gad a t aw a r e h o u s ew cc o u l do f f e r s o m ev a l u a b l ee x p e r i e n c et oe v e r y o n e k e yw o r d s :d a t aw a r e h o u s e 、r e t a i l i n gc h a i ns t o r e 、d e c i s i o ns u p p o r t ( d s ) 、 d a t am i n i n g ( d m ) 、o n l i n ea n a l y t i c a lp r o c e s s i n g ( o l a p ) 图 l 一1 图l 一2 图1 3 图1 4 图 ! 1 图2 2 图2 3 图2 4 图2 5 图2 6 图2 7 图2 - 8 图3 1 图3 2 图3 3 图3 - 4 图3 5 图3 - 6 图3 7 图3 8 图3 - 9 图3 1 0 图3 1 l 图3 一1 2 图3 1 3 图3 1 4 图3 1 5 图3 1 6 图4 1 图4 2 图片索引 数据仓库的数据整合 堕堕塑至堑壅盟一一 动态数据与静态数据 w a t s o n w i x o m 数据仓库研究架构 1 1 1 1 3 1 消费观念变化图 零售连锁企业数据关联图 3 5 3 6 零售连锁企业决胜关键的f 客户关系管理( c r m ) j 数据仓库关联 图 3 8 数据仓库建置之可行性发展图3 8 数据仓库建置之信息需求范围图 数据仓库建置之进程图4 5 数据仓库数据库构面图 数据仓库软硬件选择考虑图 个案公司t e r a d a t ac r ms u i t e 数据仓库功能模块图5 9 个案公司t e r a d a t ac r ms u i t e 数据仓库建置流程图( 1 ) 个案公司t e m d a t ac r m s u i t e 数据仓库建置流程图( 2 ) 个案公司现有e r p 系统数据作业流程图 6 7 个案公司数据仓库系统数据流程图 6 7 个案公司数据仓库系统数据作业流程图 个案公司数据仓库架构图 个案公司数据仓库业务探索访谈业务问题表7 0 个案公司数据仓库字段定义报告书 个案公司数据仓库逻辑数据模型 个案公司数据仓库e t l 范例 祀瓢两甄磊湃瓦i 蕊瓢 7 5 7 6 个案公司数据仓库使用者网站实例 个案公司数据仓库使用者应用实例 个案公司报表网站应用实例 个案公司数据报表应用实例 建置数据仓库之蓝图 企业数据仓库之信息需求建置图 8 5 v 一 表格索引 数据仓库的特性8 传统数据库与数据仓库的比较 1 3 v f j 之o 0 之o 4 j石一墙母川0 0 之 2 2 2 2 2 2 2 2 2 2 2 3 3表表表表表表袭表表表表表表表表表 绪论 在海峡两岸加入w t o 后,以及发展贸易自由化、国际化的趋势迫使业者必须积极 应变,企划多样性的商品与服务项目以吸引客户上门,而由于同业间彼此同构型高,如 何确定目标市场、建立专业形象、创新本身商品、并提升产品素质和服务的质量,以确 立经营策略,迎接新纪元之挑战,确实是值得企业领导者所深思。 近几年企业面l 临之挑战有:全球化竞争,缩短产品生命周期,客户服务作为差异性, 企业稳定获利来源,产业上下游均势改变。要克服这些问题就要让信息达到透明化,这 样才能让企业内各阶层对于所拥有的信息,产生最有效率的决策分析,如此让企业内部 有限的资源,做最合理及有效率的资源分配。因此希望藉由建置数据仓库的相关措旋, 进而打破阻碍企业运作藩篱,并且让信息不成为企业运作孤岛,并且为有效整合铺路, 以确保企业运作的通畅性。 一、研究动机 在人们的日常生活中,每天都离不开消费,离不开到商场购物,也就是说每天都离 不开市场。随着生产力的发展,人民生活水平的提高,人们的购买力也不断加大,消费 需求也由需要型向享受型转变了。消费重点从物质消费转化为时间、空间、服务和附加 价值的消费,消费者不仅要求购物方便,要求一次购齐所需物品,而且要求购物环境优 雅。这一点中小型商店是不可能做到的,零售企业的大型化、规模化势在必然。 面对市场竞争,单个店铺的面积再大也是有限的。为了获取规模效益,实行连锁经 营是提高组织化程度的重要手段。连锁销售是指流通领域中若干个同行业的商店,以共 同进货、经营同类商品、共享经营技术的方式连结起来,在同一商业形象下共享规模效 益的一种经营形式。 发展连锁销售可以使连锁总部在经营战略和策略研究上能够投入巨大精力,这有利 于提高各店铺的经营水平。在激烈的市场竞争中,经营战略与策略的研究与开发决定着 企业的命运,正确决策的制定与实施是连锁经营的核心所在。 当今世界充满了剧烈竞争,正确及时的决策是企业生存和发展的最重要环节。现在, 愈来愈多的企业认识到,要想在竞争中取胜,获得更大的收益,必须利用网络、数据仓 库等计算器技术,深层次地挖掘、分析当前和历史的业务数据,以及相关的环境数据, 自动快速地获取其中有用的决策信息,为企业提供快速、准确和方便的决策支持,这就 需要零售连锁数据仓库管理系统的迅速开发,为经营决策的制定提供信息和技术支持。 二、研究目的与期望贡献 人类的各项活动,无论巨细均离不开决策,个人的荣辱、企业的成败、国家的兴衰 无不与一个一个决策的正确或错误紧密相连。特别是随着计算器化信息系统的广泛应用 与人类逐步进入信息社会,辅助人类决策的决策支持系统日益受到人们的重视,井得到 迅速发展。数据仓库( d w ) 、联机分析处理( o l a p ) 、数据挖掘( d m ) 是2 0 世纪9 0 年代中 期国外兴起的三项决策支持技术。数据仓库是在数据库的基础上发展起来的,数据库用 干事务处理,而数据仓库可用于决策分析。联机分析处理是把数据的组织由二维平面结 构扩充到多维空间结构,并提供了多维数据分析方法。数据挖掘( 或称数据丌采) 则是在 人工智能、机器学习中发展起来的,它是从多个数据库中发现知识( k d d ) 过程的核心。 数据仓库、联机分析处理、数据挖掘技术的结合开创了决策支持系统的新方向,决 策支持就是采用数据仓库、联机分析处理、数据挖掘技术,充分利用企业内部己存在的 海量数据,挖掘出有价值的知识和规则,将客观详实的数据经验和企业决策者宝贵的自 身经验结合起来,支持企业决策。 当前决策支持与数据仓库系统、数据挖掘技术已广泛应用于金融、保险、电信、零 售业等多个领域。随着计算器系统应用范围的不断扩大和数据量的迅速增加,这项技术 的发展正方兴未艾,其前景无限光明。 最近这几年来,大家越来越将信息当作是关键的商业工具,在企业所面临日益竞争 剧烈问题,有共通的信息,仅可作为企业生存的基本需求,不足以为企业创造竞争优势, 满足消费者需求才是企业经营成功的关键因素。然而企业的资源有限,因此,确认目标 市场,再将公司整体资源集中在最有潜力的消费者身上是致胜关键。鉴于企业经营环境 诡谲多变,所面对问题的难度与复杂度亦随之增加,传统之管理信息系统却难以提出有 效的解决方案,以弥补现有管理信息系统在计算处理及分析预测能力上不足之处,并藉 此协助企业提升经营优势,是当前管理者亟待突破之处。 在经营活动中,了解客户是成功的关键。随着商品和服务的多样化,对客户的了解 就显得更为重要,其难度也愈来愈大。客户在做些什么? 对商家推出的优惠措旌有什么样 的反应? 商家应该如何提供新的产品和服务? 这些都是每个商家必须面对的问题。每个客 户都希望享有“一对一”的个性化服务,但事实上这种希望是几乎不可能实现的。解决 这些问题的一种可行的方法是,通过分析客户购买商品的行为,利用数据挖掘技术将这 些客户分成不同的类别,这个过程称之为客户分片( c u s t o m e rs e g m e n t a t i o n 。客户购买商 品的行为可能是:购物时间是集中性购买,还是分散性购买? 所购产品是趋向于物美,还 是偏好价廉? 选择产品的类型是多样,还是单一等。针对不同类型的客户,商家推出不同 的策略,以迎合不同客户的购物习惯,这样,所推出的策略就更具有针对性,而客户也 感到了更多的人文关怀。 针对以上提出的问颗,本文鑫介绍数据仓库、数据挖掘的一些必各知识的基础上, 以台湾个案连锁店数据仓库系统为例,介绍讨论如何构建该连锁零售业的数据仓库系统 应用的实例。 :、研究流程方法与章节安排 本课题以连锁经营形式为依托,以连锁专门店的销售数据为依据,首先研究了创建 数据仓库的理论及技术,然后在数据仓库理论的指导下研究了创建连锁销售数据仓库的 方法、模型和步骤。 其次在连锁销售数据仓库的基础上,研究了o l a p 数据库的创建技术,拜且创建了 多个立方体,其中不同立方体对连锁销售数据仓库数据的分析角度不同。同时在连锁销 售数据仓库和o l a p 数据库的基础上,研究了数据挖掘技术,在连锁销售决策支持系统 中进行了数据挖掘。采用的数据挖掘方法有决策树方法、回归分析方法。 最后在结合连锁企业的具体业务基础上,给出了连锁销售决策支持系统的一种设计 方案,实现了连锁销售决策支持系统软件的开发与应用。 通过对销售计划和业绩的完成情况及有关环境数据进行多角度多层次的分析,连锁 销售决策支持系统可以使连锁经营决策者及时掌握销售内部的运行情况和发展趋势,并 对制定销售计划和长远规划提供理论指导,提高企业的管理水平和竞争优势。 论文的主体结构 绪论,研究动机,研究目的与期望贡献,研究流程方法与章节安排。 第一章数据仓库理论与学理,介绍了数据仓库的定义、结构、特性、优点,建置数 据仓库的考虑因素,各数据仓库系统供货商的解决方案。 第二章零售连锁企业建置数据仓库需求与连锁销售决策支持系统的设计方案,包括 系统的设计方案、总体规划、系统研发的关键技术、系统的各模块功能。 第三章个案公司连锁销售决策支持系统的案例研究与具体展现。 第四章结论与展望,连锁企业所需要的基于数据库技术的数据仓库、联机分析处 理、数据挖掘三种技术相结合的决策支持系统带来无限的发展前景,进而对 抗同业竞争与拉大格局。 - 3 第一章数据仓库理论综述 本章节针对与本研究相关之学理作一探讨与整理,内容包括数据仓库学理与发展技 芒、建置数据仓库系统的考虑因素与成功例子等部份。 第一节数据仓库的学理 一、数据仓库的定义 1 数据仓库概念起于6 0 年代,美国m i t 为研究计量经济学而发明的多维式模块 ( m u l t i d i m e n s i o n a lm o d e l i n g ) ( 苏堤,1 9 9 8 ) 。 2 数据仓库( d a t a w a r e h o u s e ) - - 词,最先出现在决策支持( d e c i s i o ns u p p o r t ) 查询或分中 的信息或数据之储存处( r e p o s i t o r y ) 由barr y d e v l i na n d p a n l mur p h yl9 86 门最先介绍。 3 数据仓库之父i n m o n ( 1 9 9 0 ) 定义数据仓库之名,其定义的数据仓库为数据的集体, 其特性有主题导n ( s u b j e c t o r i e n t e d ) 、整合。岿i ( i n t e g r a t e d ) 、一致性( c o n s i s t e n t ) 、时间 变异。i 生( t i m e v a r i a n t ) 、数据的不变性( n o n v o l a t i l e ) 用于支持管理决策。 4 这个观念由i b m 于19 9 1 提出”信息仓储( i n f o r m a t i o nw a r e h o u s e ) ”最先商业化。 5 k i n g b a l i ( 1 9 9 6 ) 为数据仓库所下的定义是,数据仓库乃是一群静态的历史数据,由臼 常的交易系统中取得,另外形成一个数据的集合体,因此,数据仓库可说是专为支 持决策的数据库。 6 h o v e n ( 1 9 9 8 ) i a n 数据仓库是一套经过改良的决策支持系统,它产生高阶的、整合的、 系统的、结构化的数据,使其可以被解释、查询、报告、分析以协助商业的决策。 7 s t e p h e n ( 1 9 9 8 ) 认为,数据仓库不是一项产品,而是- t e e 程序( p r o c e s s ) ,它透过收集 与管理由不同数据来源获得的数据,来满足获得企业全部或部份之简单或详细观点 的目的。 8 台湾地区学者陈文华( 1 9 9 9 ) 贝j j 认为,数据仓库指的是一种存取方便的整合性数据储 存体,这些数据经由各种不同来源汇集在一起,经过转换成有意义的主题或信息群 组,以作为查询、报告、分配资源、决策制定以及思考的辅助工具。 9 苏堤( 1 9 9 8 ) 指出,数据仓库乃为一电子信息集中储存所在,不同来源不同型态的数 据经过清洗( c l e a n s i n g ) 、萃取( e x t r a c t i o n ) 、转换( t r a n s f o r m a t i o n ) 之后以齐一的型态储 存于仓储( w a r e h o u s e ) i 匈。他认为广义的数据仓库指的是一种解决方案,除了数据集 中储存,还包含了在线分析( o n l i n e a n a l y t i c a lp r o c e s s i n g ;o l a f ) 的功能,应客户的需 求有些数据仓库也会提供数据采撷( d a t am i n i n g ) 的服务。 1 0 谢松桦( 1 9 9 9 ) 指出数据仓库是统合全企业数据的一个信息基础建设,能让使用者简 单快速地存取业务信息,并进行在线分析及数据采撷等策略需求上的分析,并且进 a - u m a r , “a p p l i c a t i o n ( r e ) e n g i n e e r i n g :b u i l d i n gw e b - b a s e da p p l i c a t i o n sa n dd e a l i n gw i t hl e g a c i e s ,” p r e n t i c e h a l l i9 9 7 4 一步延伸此信息为企业知识。 1 1 w a t s o n w i x o m 等人( 2 0 0 1 ) 指出数据仓库乃是作为决策支持的最佳化数据储存体, 可用来制作分析报表,提供预设或临时性的数据查询,d s s e 1 s 等系统的支持数据 库或供数据采撷( d a t am i n i n g ) 之n ,以及作为其它应用等特定需求的预备数据。 数据仓库是一种以主题导向、整合、随时间改变、非挥发性的数据集合,用来支 持管理决策。换言之,数据在数据仓库中为: ( 】) 主题导向一数据是以主题( s u b j e c t ) 为导向,非以应用( a p p l i c a t i o n ) n 导向,如零 售操作性系统( o p e r a t i o n a ls y s t e m ) 是由订单处理、采购、销售等构 成。而在数据仓库中,数据是由顾客和产品组成。 ( 2 ) 整合一不同的值和概观( v i e w ) 予以合并,如授信额度在不同操作性系统为 2 0 k 或2 0 ,0 0 0 ,在数据仓库中,仅有一值好比说2 0 k 。 ( 3 ) 随时间改变- 意指数据具汇总。l 生( s u m m a r i z e d ) 、历史性( 1 l i s t o r i c a l ) ,经过一段时间 其值才会变动,数据好比被时间标示( t i m e s t a m p e d ) ,如周或月, 因此为稳定的( s t a b i l i z e d ) 数据值( d a t av a l u e s ) 。 ( 4 ) 非挥发性一是指数据在数据仓库中不常被更新,不至于在日交易中有所更动。 有时候会定义dataw a r e h o u s i n g 2 ,是因为它是建构( c o n s t r u c t i n g ) 和使用( u s i n g ) 数据仓库的处理程序的意思。 数据仓库可进一步9 3 l 3 1 为具有下列特色的信息系统: 它是用来设计分析工作的数据库,并使用多个应用数据。 - 它支持少量使用者中较久的互动。 它的使用习惯和读取较有密切相关。 它的内容是周期性更新( 大多为新增) 。 它含有目前及历史数据,以便提供信息的历史观点。 它含少量大型表格。 每次查询会产生大量结果,经常需要扫瞄整个表格,多个表格均须联结情形。 一个或多种工具去萃取任何种数据结构( 平面、阶层、关连、对象、开放或专有1 , 包括外部数据。 以中介数据( m e t a d a t a ) 4 】目录型式,将数据合成到非挥发性、整合、主题导向的数 据库。中介数据,就是数据相关的数据( d a t aa b o u td a t a ) ,它捕捉所有种类的信息放 入中介数据储存处( m e t a d a t ar e p o s i t o r y ) 5 ,以便能够分析、设计、建立、使用、解 译数据仓库的内容,一般包含商业中介数据( b u s i n e s sm e t a d a t a ) ,其分类包括使用者 特定文件,数据字典,特定本质上的知识,商业知识,以及事先定义好的查询和 报表,主要由终端使用者使用。而技术中介数据( t e e h n i c a lm e t a d a t a ) ,是由数据库 rw e s t e n n a n “d a t aw a r e h o u s i n gu s i n gt h ew a l m a r tm o d e l ”m o r g a nk a u f m m mp u b l i s h e r s 2 0 0 1 a b e l s o i l s s m i t h ,k t h e a r l i n g ”b u i l d i n gd a t am i n i n ga p p l i c a t i o n sf 0 1c r m :”m c g r a w h i l l ,i9 9 9 i :v e n e r l i ,a g a d u v a m s t a u d t 。 m e t a d a t as t a n d a r d sf o rd a t aw a r e h o u s i n g :o p e ni n f o m l a t i o nm 。d e iv s c o m m o nw a r e h o u s i n gm e t a d a l a ”s i g m o dr e c o r d ,v 0 1 2 9 n 0 3 p p 6 8 7 5 2 0 0 0 a b e r s o n s j s m i t h “d a t aw a r e h o u s i n g ,d a t am i n i n g a n do l a p , ”m c g r a w h i l l i9 7 7 主管者或由数据仓库系统的软件组件所产生,包括纲目定义和环境特定型态,实体 储存信息,存取权利,执行特定规格,数据转换,执行信息,如日志文件和效能结 果。而为了推广中介数据的使用,并在储存处间互通( i n t e m p e r a b i l i t y ) ,所以数据仓 库内2 1 2 具的整合,就显得相当重要,也因此提出两种数据仓库标准化中介数据: m i c r o s o f t o 采用o i m ( o p e ni n f o r m a t i o nm o d e l ) 架构,而o m g ( o b j e c tm a n a g e m e n t g r o u p ) 定义的c w m ( c o m m o nw a r e h o u s em e t a d a t a ) 架构如i b m 、o r a c l e 等所采 用。 r 数据仓库j ,一般来说就是搜集其它系统中有用的数据,存放在一经过整合的储存 区域内,以提供决策支持或数据分析时使用。由此可知,数据仓库的主要目的之一是 提供管理决策的支持与分析。而从另外一方面来看,数据仓库的目标是在组织中在正 确的时间,将正确的数据交给正确的人,因此,数据仓库可视为集中且储存企业电子 信息的管理中心,从原先不同来源和型态的数据经过筛选和转换之后以一致的型态和 有组织的排列储存于管理中心内提供分析。以上这些程序是一种持续性的作业,不是 做完一次就结束的,另外与过去以交易为主( t r a n s a c t i o n o r i e n t e d ) 的交易处理系统开 发的方式也有所不同。因此数据仓库与以往的信息系统在目的与本质上是有所不同的。 其中,在数据分析的需求中,庞大的数据量而快速响应的速度是被强调的,因此,数 据仓库强调的就是从庞大的数据中快速获取足以支持管理者决策的信息,因此符合数 据分析的需求。而数据仓库着重宏观的查询,高阶管理者可藉由数据仓库所提供的信 息来了解并掌控问题,并寻求解决的方法。传统数据库在面对不同范围之问题必须靠 信息人员不断重写程序来符合使用者之需求,而数据仓库以分析为主体的规划架构, 便能展现其宏观之优点,将信息的价值性一览无遗表现出来,赋予信息更高的价值。 且数据仓库系统是以管理者为主要操作人员,因此,更需强调友善的接1 2 1 与一般化的 操作,以期能更符合使用者之查询需求。 此外,广义上数据仓库的目的是提供企业一个整体的解决方案,包括数据有系统 的集中储存、数据在线分析( o l a p ) 等。而因不同的需求,也可接续着提供数据采 掘( d a t a m i m n g ) 的分析与服务。更进一步的利用信息。因此,数据仓库的建立主要 是提供一个决策支持的服务环境,而且不同于一般传统数据库的是,随着数据不停的 累积,数据仓库所能提供的决策准确度也会跟着提高。而数据仓库的主要目的在于回 答企业业务经营上的决策,而这点在没有数据仓库以前这是不可能达到的境界,因此 数据仓库提供企业一个宏观且整体的解决方案。 二、数据仓库的特性 ( 一) 数据仓库和数据库的最大差异是,数据库进行数据的新增、修改删除、查询等基 本功能,其目的在方便储存管理,但是数据仓库查询的仅是原始数据重组、加值后, 所呈现的决策信息,并不对原始数据进行新增、修改、删除的功能,因为它目的在 问题决策分析导向,并不对数据作修改,强调是以各种观点,以就是数据仓库所称 的多维度视野( m u l t i d i m e n s i o nv i e w ) ,完整地、直觉地呈现组织活动的事实( 林裕仁, 6 h r t o :w w w n l i c r o s o f t c o m - 6 1 9 9 9 ) a f 二) 王信介( 1 9 9 9 ) 认为就技术上而言,数据仓库不同于一般数据库,因为数据仓库具 有以下七个特性: f 1 ) 区分- | 生( s e p a r a t e ) 一数据可从操作系统上的数据加以区分。 f 2 ) 使用性( a v a i l a b l e ) 数据可以适用于业务上的使用者。 ( 3 ) 整合性( i n t e g r a t e d ) 一数据可以整合于标准的企业模式。 f 4 ) 时间性( t i m es t a m p e d ) 一可以定义为特定地点或特定时段。 ( 5 ) 适当主题t 眭( s u b j e e t o r i e n t e d ) 一一般而言“客户”为其主要对象。 ( 6 ) 数据不变性( n o n - v o l a t i l e ) 一不会随着个案( 一个数据) 而影响整个结果。 ( 7 ) 易使用一| 生( a c c e s s i b l e ) 一即使用者无须具备足够的计算机知识也可以毫无问题 的使用。 ( 三) c o d d ( 1 9 9 3 ) 认为广义数据仓库应包含在线分析系统( o l a p ) ,并具备以下1 2 项特 性: ( 1 ) 多维度概念( m u l t i d i m e n s i o n a l ) ( 2 ) 透通。l 生( t r a n s p a r e n c y ) ( 3 ) 可存取。性( a c c e s s i b i l i t y ) ( 4 ) 一致性的报表绩效( c o n s i s t e n tr e p o r t i n gp e r f o r m a n c e ) ( 5 1 主从式架构( c l i e n t s e r v e ra r c h i t e c t u r e ) ( 6 ) 一般性维度( g e n e r i cd i m e n s i o n a l i t y ) ( 7 ) 动态稀疏矩阵处理( d y n a m i cs p a r s em a t r i xh a n d l i n g ) ( 8 ) 多使用者支持( m u l t i u s e rs u p p o r t ) ( 9 ) 无限制跨维度作业( u n r e s t r i c t e dc r o s s d i m e n s i o n a lo p e r a t i o n s ) ( 1 0 ) 直觉式数据操作( i n t u i t i v ed a t am a n i p u l a t i o n ) ( 1 1 ) 弹性化的报表( f l e x i b l er e p o r t i n g ) ( 1 2 ) 支持无限制维度与汇总层次( s u p p o r tf o ru n l i m i t e dn u m b e ro f d i m e n s i o n sa n d a g g r e g a t i o nl e v e l s ) ( 四) w a t s o n 与h a l e y ( 1 9 9 7 ) 认为数据仓库所带来的效益: ( 1 ) 减轻m i s 部门在产生数据报表内容的负担 ( 2 ) 降低使用者在寻找信息上的困难 ( 3 ) 产生较多且较好的信息内容 ( 4 ) 提供较佳的决策支持 ( 5 ) 有利企业流程运作 ( 6 ) 支持企业策略目标的达成 经由文献的整理 i n m o n ,1 9 9 5 ;陈文华,1 9 9 9 1 后,数据仓库的九大特性,整 理列表( 表l l 、如下: 7 表1 1 数据仓库的特性 【资料来源:l n m o n ,1 9 9 5 ;陈文华,1 9 9 9 1 特性 描述 l 主题导向( s u b j e c t o r i e n t e d ) 主要是为了解决特定的问题或有主要的领域范围。 2 整合性( i n t e g r a t e d ) 数据仓库的数据是经过整合的,以其整合的特性, 使数据产生价值。 3时间差异性( t i m e v a r i a n t )数据仓库的数据是经过一段时间而逐渐累积下来, 再经过整合分析,因此其数据是有时间差异性的。 4 数据不变性( n o n v o l a t i l e )数据仓库的数据输入后,所允许的操作只有新增与 删除,因此其数据是不会改变的。 5 来源多样化数据仓库系统为处理各种不同数据源的数据,所以 数据仓库的来源是很多样化的。 6可扩充性 数据仓库系统高度并行的处理方式,不会受数据量、 机器数目的限制,而具有高度的扩展性。 7 数据本身特性数据仓库中数据具有整合性、以实体为主、与时间 相关、保持最新、多人共同使用、内容详细、结构 化,同时亦包含了一些衍生性、汇总性、摘要性的 数据。 8决策支援系统分析 数据仓库对数据作一整合性的归纳,其最终目的在 有效的使用信息,提供决策支持系统及分析工具。 9多重维度 数据仓库中的数据项可以重复出现,且可将数据以 采不同维度的方式呈现,且配合多元的使用方法 ( m u l t i d i m e n s i o n a l ) 呈现不同角度的信息。 我们再对前四种特性加以说明: ( 一) 主题导向的 数据仓库中的数据是以主题导向进行数据的组织, i n m o n ,1 9 9 4 陈文华,民8 8 1 。 主题导向的数据组织方式,就是在较高层次上对分析对象数据的一个完整并一致性 描述,完整、统一地刻画各个分析对象所涉及的组织中的各项数据,以及数据之间 的关系 i n m o n ,1 9 9 4 k i m b a l l ,1 9 9 6 。所谓较高层次是相对应用导向的数据组织方式 而言的,是指按照主题进行数据组织的方式具有更高的数据抽象。关于数据的组织 程序分为两个步骤:抽取主题以及确定每个主题所应包含的数据内容。 主题是一个抽象的概念,是在较高层次上将组织信息系统中的数据综合、归类并 进行分析 i n m o n ,1 9 9 4 。在逻辑意义上,它是对应组织中某一总体分析领域所涉及 的分析对象。主题是一个在较高层次上对数据的抽象,这使得主题导向的数据组织 可以独立于数据的处理逻辑,因而可以在这种数据环境上方便地开发新的分析型应 用;同时这种独立性也是建设组织全局数据库所要求的,所以主题导向不仅是适用 于分析型数据环境的数据组织方式,同时也是选用于建设组织全局数据库的数据组 织方式 k i m b a l l ,1 9 9 6 1 ( i n l n o n ,1 9 9 4 ) 。 8 一 ( 二) 整合性的 如【图1 3 】所示,数据仓库的数据是从原有分散的数据库的数据中抽取出来的 i n m o n ,1 9 9 4 s u r a j i t ,1 9 9 5 。操作型数据与决策支持系统分析型数据之间差别甚大。 第一,数据仓库的每一个主题所对应的来源数据在原有的各分散数据库中有许多重 复和不一致的地方,且来源于不同的在线系统的数据都和不同的应用逻辑捆绑在一 起;第二,数据仓库中的综合数据不能在原有的数据库系统直接得到【i 姗o n ,1 9 9 4 m a l e o d ,19 9 5 。 因此在数据进入数据仓库之前,必然要经过统一与综合。这一步是数据仓库建设 最关键、最复杂的一步。这个阶段所要完成的工作有 g i l l ,1 9 9 6 1 : 第一、要统一源数据中所有矛盾之处,如字段的同名异义、异名同义,单位不统 ,字长不一致等等。 第二、进行数据综合和计算,数据仓库中的数据综合工作可以在从原有数据库抽 取数据时生成,但许多是在数据仓库内部生成的,即进入数据仓库以后进 行综合生成的。 在传统操作性环境中有各式各样的应用程序,其中可能包括了上百种不同的数据 结构、不同的格式、不同的属性、不同的命名等等。数据仓库整合了结构、格式、 属性和命名的一致,使其变得井然有序,相同性质的数据皆以单一和一致的方法表 示 w a l l a c e ,1 9 9 4 。例如:【图】中所表示,有各式各样的应用程序,包括了不同 的表示和字段格式,在数据加载数据仓库之前,皆经过不同的处理使其相同的数据 有相同的表示方法。 对于【图l 一1 】的内容表示做个说明,图中的a p p l a 、a p p l b 、a p p lc 和a p p l d 分 别代表不同的应用程序;图中的m ,f 、l ,0 、x , y 及m a l e ,f e m a l e ,虽然都是代表男生 和女生,但是在不同的应用程序中使用了不同的命名,但是数据在加载数据仓库之 前,必须定义一致性、单一的命名,m ,f 就是其统一的命名:图中的d e s c r i p t i o n l 、 d e s c r i p t i o n 2 、d e s c r i p t i o n 3 及d e s c r i p t i o n 4 是代表在不同的应用程序中使用了不同的 叙述,但是在数据仓库中使用了相同的叙述d e s c r i p t i o n 。图中的d e c f i x e d ( 1 3 ,2 ) 、d i c 9 ( 9 ) v 9 9 、d e cf i x e d ( 1 l ,0 ) 、p i cs 9 ( 7 ) v 9 9c o m p - 3 分别代表了在不同应用系统中的字段 格式,但在数据仓库中使用了统一的字段格式d e cf i x e d ( 1 3 ,2 1 。 - 9 图1 _ i 数据仓库的数据整合【资料来源: n l t l o r l ,1 9 9 4 】 ( 三) 时间差异性 每笔数据在某一时刻的记录经过时间的延续,存放在数据仓库中就成了一序列的 历史数据 i n m o n ,1 9 9 4 g i l l ,1 9 9 6 。如【图1 2 】所示,数据在数据仓库以时间的特 性来观察,它还包括了三种特性:视需要而定,它可能跨越五年甚至十年的数据: 每笔记录皆会有一个字段表示是何时所记录的数据:假设彼时彼刻所记录的数据是 正确的,则在之后此数据即不能再修改 h a c k a t h o m ,1 9 9 4 。 一1 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论