




已阅读5页,还剩61页未读, 继续免费阅读
(管理科学与工程专业论文)营销数据仓库模型的构建方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西安建筑科技大学硕士学位论文 营销数据仓库模型的构建方法研究 专业:管理科学与工程 研究生:李宝林 指导教师:黄光球教授 摘要 数据仓库作为近年来发展迅速的一种新兴技术,它把收集到的数据转变成有意义的可 用在分析和报表等应用程序中的信息。并且通过多部进程执行处理和分析,这些进程包括 收集数据、挣化数据和存储数据等。数据仓库是支持管理决策过程的、面向主题的、集成 的、随时间而变得、持久的数据集合。数据仓库管理系统根据企业的原始数据和来自外部 的数据汇集和整理成数据仓库,为企业提供完整、及时、准确和明了的商业决策支持信息。 本论文主要阐述营销数据仓库模型的建立过程。其包括六个大方面:第一部分主要阐 述营销数据仓库的发展和现状。从数据仓库现状入手,着重说明了未来营销数据仓库的作 用;第二部分主要介绍了营销数据仓库中所涉及的基本概念,其中主要包括一些基本概念 和基本操作:第三部分主要是对营销数据仓库中数据的提取,营销数据仓库中的数据主要 包括操作型营销数据库中的数据,这部分数据主要是根据一个基本营销公司的基本职能进 行提取,和通常的进、销、存系统一样,本文给出了详细的流程和数据:另外营销数据仓 库中的一部分数据来自于营销过程与其相关的主题,主要包括营销的四个基本步骤和几个 基本主题( 产品、客户、竞争对手) ;本文的第四部分主要对营销数据仓库的企业级模型做 一个比较详细的说明,通常,一个数据仓库的模型主要包括三个大的基本方面:概念模型、 逻辑模型和物理模型。本章通过第三章的分析提取出了营销过程中相关的主题,并且对相 应的主题做了细致的研究和分析。在此基础上综合描述了营销数据仓库的三大模型,并且 给出了具体的e r 图:论文的第五部分主要是从营销数据仓库的维度分入手,在o l a p 的 基础上提炼出了相关主题和过程的星形模式图。 总之,本论文从营销数据仓库的数据抽取、数据转移、数据迁移入手。在营销主题和 操作职能方面全面阐述了营销数据仓库企业级模型。另外从维度和粒度入手,从顾客、产 品、竞争对手和营销过程方面做了详细的分析。从两让我们在营销数据仓库方面有一个全 面的、系统的了解。 关键词:o l a p 、营销组合、e d m a 、数据钻取、数据聚合 论文类型:应用研究 西安建筑科技大学硕士学位论文 t h er e s e a r c ha b o u tt h em e t h o d m a r k e t i n g d a t aw a r e h o u s e s m o d e l s b u i l d i n g s p e c i a l :s c i e n t i s e a n d p r o j e c to f r r m n a g e m e n t n a m e :l ib a o l i n i n s t r u c t o r p r o f h u a n gg u a n g q i u t h ed a t aw a r e h o u s ei sa sd e v e l o p i n gak i n do f f a s tn e w d e v e l o p i n gt e c h n o l o g yi n r e c e n t y e a r s ,i t m a k et h ec o l l e c t e dd a t am e a n i n g f u lb y u s i n ga n a l y s i sa n d 佗l p o r tf o r m i nt h ea p p l i c a t i o n p r o g r a m m i n g i ti sd e a lw i t ha n d a n a l y s e st h r o u g hm a n yp a r t so f p r o c e s s t h ei si tc o l l e c t d a t a 、p u r i f y d a t u ma n ds t o r e d a t u m 、e t c t oi n c l u d et oe a r l yo u t d a t aw a r e h o u s es u p p o r tt om a n a g ed e c i s i o n - m a k i n gp r o c e s s , t h e m e - o r i e n t e d , b e c o m e ,l a s t i n g d a t u ms e tw i t ht i m et h a t i n t e g r a t e d a t aw a r e h o u s ea c c o r d i n g t oi n i t i a l d a t aa n dc o m ef r o me x t e m a ld a t u mg a t h e ra d m i n i s t r a t i v es y s t e ma n d p u t , o f f e rt h ei n t a c t , p r o m p t , a c c u r a t ea n dc o m m e r c i a ld e c i s i o ns u p p o r ti n f o r m a t i o nu n d e r s t o o df o re n t e r p r i s e i n st h e s i sm a i n l y e x p l a i n st h ef o u n d a t i o na b o u t t h ed a t aw a r e h o u s em o d e lo f m a r k e t i n g i ti n c l u d e ss i xg r e a tr e s p e c t s : f i r s tp a r te x p l a i nt h ed e v e l o p m e n to ft h ed a t aw a r e h o u s eo f m a r k e t i n ga n d c u r r e n ts i t u a t i o nm a i n l y p r o c e e dw i t hw a r e h o u s ea 】i i t n ts i t u a t i o no f t h e h a ss t a t e dt h ef u n c t i o no f t h ed a t aw a r e h o u s eo f m a r k e t i n g i nt h et i m r ee m p h a t i c a l l y ;s e c o n d p a r ti n t r o d u c em a r k e f n g d a t ab a s i c c o n c e p t i o n i n v o l v e d i nt h ew a r e h o u s e m a i n l y , i n c l u d es o m e b a s i cc o n c e p t i o na n db a s i c o p e r a t i o nm a i n l ya m o n gt h e m ;t h e t h i r dp a r tt o m a r k e t i n g d a t aa b s t r a c t i o no f d a t ao f t h ew a r e h o u s e m a i n l y , m a r k e t i n g d a t ao f w a r e h o u s e i n c l u d em a r k e t i n gd a t ao fd a t a b a s eo f o p e m l i n ge r e m a i n l y , t h ed a t at od r a wa c c o r d i n gt oo n eb a s i c m a r k e t i n g b a s i cf u n c t i o no f c o m p a n y m a i n l y , w i t he n t e r i n gc o m m o n l y ,r o u n dp i n ,s t o r i n gt h es y s t e m t h es a r n l y , t h i st e x tp r o v i d e sd e t a i l e dp r o c e d u r ea n dd a t a ;s o m ed a t amt h ed a t aw a r e h o u s eo f m a r k e t i n gc o m e 丘o m t h er e l e v a n tt h e m ei na d d i t i o n , as e r i e so fm e a s u r e si n c l u d i n gt h ep r o d u c t s t a k i n gi n t h ec u s t o m e r ,r i v a la n d m a r k e t i n gm a i n l y ;m a k e am o r ed e t a i l e d e x p l a n a t i o n t ot h e e n t e r p r i s e l a y e rm o d e l o f t h ed a t aw a r e h o u s e o f m a r k e t i n gm a i n l yw i t hf o u r t hp a r to f t h i st e x t , u s u a l l y , t h em o d e l o fad a t u mw a r e h o u s ei n c l u d e st h r e eb i gb a s i cr e s p e c t sm a i n l y :c o n c e p t u a lm o d e l ,l o g i cm o d e la n d p h y s i c a lm o d e l t h i s t e x ti si th a p p e nm a r k e t i n gr e l e v a n tt h e m eo f t h ec o u i s et od r a w t h r o u g ha n a l y s i s o fc h a p t e rt h r e e ,a n dh a sm a d ec a r e f u lr e s e a r c ha n da n a l y s i st ot h ec o r r e s p o n d i n gt h e m e h a v e d e s c r i b e dt h r e em a j o rm o d e l so ft h ed a t aw a r e h o u s eo f m a r k e t i n gs y n t h e t i c a l l yo nt h i sb a s i s ,a n d 西安建筑科技大学硕士学位论文 p r o v i d ec o n c r e t ee rp i c t u r e ;f i v ep a r to f t h e s i s t oi si ts p e n df r o m m a r k e t i n g d a t aw a r e h o u s es t a r tw i t h t ol n km a n y , h a v er e f i n e do u tt i 】er e l e v a n t 血e m ea n ds t a rm o d ep i c t u r eo f t h ec o l l r s eo n t h eb a s i so f o l a p t 1 1 e s i st h i st e l lm a r k e t i n gd a md a t t n no fw a r e h o u s ec o l l e c t , t h ed a t aa l es h i f t e d , t h ed a t aa r e m o v e d o p e r a t e f r o m m a r k e t i n g t h e m ef u n c t i o ne x p l a i nt h ed a t u mw a r e h o u s ee n t e r p r i s el a y e rm o d e l o f m a r k e t i n g i na na l l r o u n dw a yi na d d i t i o n s t a r tw i t hl i n k i n gd e g r e ew i t h 蛐s i z ei na d d i t i o n ,h a s d o n et h ed e t a i l e de x p l a n a t i o nf l o mc u s t o m e r , p r o d u c _ t s ,r i v a la n ds a l ec o u l e e t h u sm a k eu sh a v ea n o v e r a l l ,s y s t e n a a t i cu n d e r s t a n d i n g i nd a t aw a r e h o u s e o f m a r k e t i n g “y w o r d :o l a p 、m a r k e t i n g a r em a d e u p 、 e d m a 、d a t aa r eb o r e da n df e t c h e d 、 t h ed a t aa r eg o t t o g e t h e r t y p e o f t h e t h e s i s :a p p l i c a t i o ns t u d y - 1 1 1 声明 y6 1 7 0 6 4 本人郑重声明我所呈交的论文是我个人在导师指导下 进行的研究工作及取得的研究成果。尽我所知,除了文中特 别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含本人或其他人在其它单位已 申请学位或为其它用途使用过的成果。与我一同工作的同志 对本研究所做的所有贡献均已在论文中作了明确的说明并 表示了致谢。 申请学位论文与资料若有不实之处,本人承担一切相关 责任。 论文作者签名:鹰( 之,本棼且期:o 卯畛,占,乡 2 u 。 关于论文使用授权的说明 本人完全了解西安建筑科技大学有关保留、使用学位论 文的规定,即:学校有权保鼠送交论文的复印件,允许论文 被查阅和借阅;学校可以公布论文的全部或部分内容,可以 采用影印、缩印或者其它复制手段保存论文 ( 保密的论文在论文解密后应遵守此规定) 敝储签名瓤和师签冬默粥期:伽彬多 西安建筑科技大学硕士学位论文 1 1 论文研究的目的和意义 1 绪论 随着市场竞争的日趋激烈,信息对于企业生存合发展所起的作用越来越重要。由于计算机 技术的普遍运用,承载信息的数据随着时间的推移而不断积累并与目俱增,使得企业难以从巨 量的数据中提取有价值的真正有用的决策信息,因此企业迫切需要新的技术和方法从巨量数据 中提取有价值的信息和知识。数据仓库是2 0 世纪1 9 年1 弋发展起来的新技术。数据仓库是一种 针对大数据集进行数据组织和管理的技术,专门用于支持分析型的数据查询。 为了获得跟更好的经济效益,企! l k ! 西须把业务经营同市场需求联系起来,在此基础上做出 科学、正确的决策,以求生存。为此,企业纷纷建立起了自己的数据库系统,由计算机管理代 替手工操作,以此来收集、存贮、管理业务操作数据,改善办公环境,提高操作人员的工作效 率。然而,传统的数据库应用系统著不能很好地支持决策。由于传统的数据库应用系统是面向 业务操作设计的,简化了具体操作人员的劳动强度,而企业的中高层领导却没有相应的系统。 企业需要新的技术来弥补原有数据库系统的不足,需要把己经广泛收集到的数据集成到数据仓 库中,以便从业务数据中提取有用的信息,帮助他们在业务管理和发展e 做出即时、正确的判 断。数据仓库应运而生,成为信息技术领域非常热门的话题之一。 数据仓库的目的是要建立一种体系化的数据存贮环境,将分析决策所需的大量数据从传统 的操作环境中分离出来,使分散的、不致的操作数据转换成集成的、统一的信息,企业内不 同单位的成员都可以在此单一的环境之下,j 恿过运用其中的数据与信息,发现全新的视野和新 的问题、新的分析与想法,进而发展出制度化的决策系统,并获取更多经营效益。 营销业务是随着商业的发展而发展的。在今天我f 门面对着海量的数据,当我们仅仅是运用 数据库技术是可以说是爱莫能助,但数据仓库可以解决我们一系列的难题。另外,数据仓库作 为决策支持的有效工具,可以说对此任务当之无愧。首先,运用数据仓库技术可以更好的解决 海量数据问题,以便决策者能够在恰当的时候做出最明智的字选择。以避免资源浪费或资源严 重不够;其次,运用数据仓库技术可以让企业各个部门能够更好的分配自己的工作及对某一时 段某集体对象做出相应的决策,比如,个超市的采购部门要决定该年冬季的货物采购量, 那么他可以借助数据仓库取得相应的决策支持;最后,运用数据仓库可以更好的实行特定查询、 复杂查询和大查询结果集。丽且数据仓库事务数量比较少,事务历肘长,更加有利于数据的稳 定性。 现在商业竞争越来越激烈,客户群体越来越大,客户对服务酶要求也就越高,客户关系管 理仅靠手工完成是难以实现的。因为不同企业客户群体各不相同,而且客户管理内容也干差万 西安建筑科技大学硕士学位论文 别。总之,这一切就决定了数据仓库在决策支持的发展领域中始终都是一种强而有力的工具。 1 2 国内外研究现状及发展动态 众所周知,管理信息系统早己成功应用于全球的各行各业中,并且积累了大量的数据,基 本上满足了用户对数据的存储、查询和统计的需要。然而目前由于社会的日益发展,数据量越 来越多。单纯的数据库系统只能满足用户进行事务处理操作,而对于一些领导层的运筹帷幄的 决策支持来说,可以说是无能为力,在此状况下,一些专家学者们便提出了数据仓库的概念。 最早提出“数据仓库( d w ,d a t aw a r e h o u s e ) ”的是w h i n m o n 在建立数据仓库 一书中 提出的,随后数据仓库得到了迅速的发展。随着人们对数据仓库的不断研究,最终达成了一个 统一的认识就是“数据仓库的数据是面向主题的、集成的、不可更新的( 稳定的) 并随时间不 断变化的,建立数据仓库的目的是为了更好的支持决策分析,而数据仓库与传统的数据库又存 在着区大的差别,它主要表现为如下几点: ( 1 洧的联机处理强调的是密集的数据更新处理性能和系统的可靠性,并不关山数据查询的 方便和快捷。联机分析和事务处理对系统的要求不同,同个数据库在理论上很难两全。 ( 2 刈臻数据往往被存放于分散的异构环境中,不易统一查询访问,而且还有大量历史数据 处于脱机状态。 ( 3 刈绉尝据的模式针对事务处理系统设计,数据的格式和描述方式不适合非计算机专业人 员进行业务e 分析和统计。 目前,数据仓库在欧美发达国家运用比较广泛,而且取得了明显的成效,而在中国目前数 据仓库主要运用在电信和银行业e ,其它行业可以说是风毛麟角。这主要是因为建立一个比较 好的数据仓库需要大量的人力、财力。一般的企业不可能一下拿出几百万元来建立个宦棚目 前还不太了解的东西,同时,在国内即懂业务又懂技术的人才也很缺乏,所以在以后的一段时 间内数据仓库是中国的大热门。 1 3 论文的主要研究内容 数据仓库技术以改进后的数据库技术作为存储数据和管理资源的基本手段,以统计分析技 术作为分昕数据和提取信息的有竞叻诖,通过人工智能、神经网络、知识推理等挖掘方法发现 数据隐藏的规律,从而实现从数据至吖言息,由信息到知识的过程,为企业的管理阶层提供各种 层次的决策支持。 本论文从数据仓库基本概念人手,详细的分析了营销的整个流程,并且在i q 基础上提出了 相关的主题和数据。另外借助数据仓库的理论,建立了数据仓库的企业模型。最后从o ia p 入手,提出了营销数据仓库各个阶段的有效维度划分。综合阐述了建立营销数据仓库模型的过 西安建筑科技大学硕士学位论文 ;i i i ;i ;i i ;i i ;i ;i i ;i ;i i ;- - ; 程及理论实现。 本文第二章主要介绍与数据仓库相关的基本概念和数据处理流程,着重介绍了o l u p 中 的一些重要的操作。以及营销数据仓库的基本结构框架。第三章主要介绍了营销的基本职能, 从报价管理系统、售订单系统、出货管理系统、销售分析系统、库存管理系统、采购管理系统、 财务管理系统等几个方面详细介绍了个部分的功能、所需数据和基本流程。第四章主要介绍营 销数据仓库的建模方法,以及内部的处理问题。通过第二章我们知道营销数据仓库所需的基本 数据,油料这些基本数据即基本的主题,并不是我们论文的最终主题,在这一些列的过程中, 建立数据模型是建立数据仓库的一个必要的步骤。而在构建数据仓库模型中主要包括三大部 分:概念模型设计、逻辑模型的设计、物理模型的设计。第五章以前几章维基础,提出了各个 主要职能上维度的合理划分,怎样才可以做至u 最好的得决策支持,重点的阐述了财务的未来发 展方向。 西安建筑科技大学硕士学位论文 2 营销数据仓库模型的基本框架和基本概念 本章主要介绍在数据仓库建模中所常到的概念以及营销数据仓库模型建立的基本框架。在 第一节中主要介绍数据仓库中一些常用到的概念,第二节中主要介绍本系将会采取那种数据仓 库结构模式以及期开发过程中应当注意的一些问题o “1 。 2 1 数据仓库的基本概念和特征 2 1 1 数据仓库基本特点 2 0 世纪8 0 年代中期,“数据仓库”这个词首次出现在号称“数据仓库之父”w t i l i m nh 蛔0 1 1 的建立数据仓库一书中。数据仓库有如下n 个特点【4 j : ( 1 ) 面向主题:主题是一个抽象概念,是指在较高层次t 将数据综合、归类后进行分析利用 的抽象。面向主题的数据组织方式,就是在较高层次上对分析对象数据的一个完整、统一并一 致的描述,能完整及统一的刻画各个分析对象所涉及的有关的各项数据,以及数据间的联系; ( 2 堞威的数据:数据仓库中存储的数据从原来分散的各个子系统中提取出来,并不是原有 数据的简单拷贝,而是经过统一并综合。这是因为:数据仓库的数据不能从原有数据库系统 中得到,原有数据库系统记录的是每项业务处理的流水账,这些数据并不适合于分析处理。 在进入数据仓库之前必须经过综合、计算,抛弃分析处理不需要的数据项,增加一些可能 ;步及 的外部数据:数据仓库每个主题所对应的源数据在源分散数据库中有许多重复或不致之 处,必须将这些数据转换成全局统一的定义,消除不一致和错误之处,以保证数据的质量;对 原数据的集成是数据仓库建设中最为关键,也是最复杂的步: ( 3 ) 数据不可更新:从数据的使用方式上看,数据仓库的数据不可更新,即数据保存到数据 仓库中后,最终用户只能通过分析工具进行查询和分析,而不能鲣改,即数据仓库的数据对最 终用户是只读的。从数据的内容上看,数据仓库存储的是企业当前和历史数据,在一定时间间 隔以后,当前数据需要按一定的方法转换成历史数据; ( 4 坳据随时间不断变化:数据进入数据仓库后,这些数据随时间变化而定期更新。每隔 一段固定时间间隔后,抽取运行数据库系统中产生的数据,转换后集成到数据仓库中。而数据 的过去版本仍保留在数据仓库中。随时间变化,数据以更高的综合层次不断综合,以适合趋势 分析要求。当数据超过数据仓库的存储期限,或对分析无用时,从数据仓库中删去这些数据。 数据仓库的结构和维护信息保存在数据仓库的原数据中,数据仓库维护工作由系统根据其中的 定义自动进行或系统管理员定期维护; 西安建筑科技大学硕士学位论文 ( 5 蝴数据仓库:建立数据仓库不是要取代原有的运行数据库系统,其目的是为了将企业 多年来已经收集到的数据按一个统一且一致的企业级视图组织并存储,然后对这些数据进行分 析,从中得出有用信息。 2 1 2 数据仓库中的基本概念 ( 1 ) 主题:主题( s u b j e c t ) 示一个在较高层次上将数据归类的标准,每一个主题基本对应 一个宏观的分析领域。主题是一个抽象的概念,是在较高层次上j 各企业信息系统中的数据综合、 归并进行分析焉用的对象; ( 2 ) 粒度:是指数据仓库中数据单元的详细程度和级别。数据越详细,粒度就越小,级别 就越低;数据综合级别越高,粒度就越大,级别也就越高。粒度可以有两种形式,第一种形式 的粒度是对数据仓库中数据综台度高低的一个度量,它既影响到数据仓库中数据量的多少,又 影响到数据仓库所能回答询问的种类。粒度越小,则详细程度越高,综合程度就越低,回答询 问的种类也就越多;相反,粒度越大,则详细程度越低,综合程度就越高,回答询问的种类也 就越少。从另一个角度而言,粒度的提高将会提高查询的效率,但同时也造成了回答细节问题 的能力下降。因此根据分析需要,选择适当的粒度,将会使决策分析简单易行。在数据仓库中 多重粒度是必不可少的; 另一种特殊形式的粒度,即样本数据库的粒度,与通常意义下的黻不同,样本数据库的 粒度级别不是根据综合程度的不同来划分的,而是根据采样率的古f 氐来划分的。样本数据库一 般是以一定的采样率从细节档案库或轻度综合数据中抽取的一个子集。它不是一般目的的数据 库,而是根据一定需求从数据源中获得的一个样本; ( 3 堙皱:维度是指人们观察事物的角度。例如,企业常常共心产品销售数据随着时间推移 而变化的情况,这是从时间的角度来观察产品的销售,所以时间是一个维。人们从某个维的角 度观察数据,还可以根据细节程度不同形成多个描述层次,如时间维上,可以分成日期、星期、 月等不同层次来描述。般层的关系使用层次图来表示。同一维的维层次上可简可繁,这主要 是因为不同分析应用对象数据组织粒度要求不同。有关维的层次信息需要存放在员数据中,系 统在进行各种综合查询时,通过元数据的信息区分不同的维层次,从而正确地完成相应的分析 功能: 维度类性有:常规维度、虚拟维度、父子维度和数据挖掘维度。其中父子维度基于两个维 度表列,这两列起定义了维度成员中沿袭关系。- n 称) b “成员键列”,标识每个成员:另 一列称为“父键列j 标识每个成员的父代。这个信息用于创建父子链接。该链接将在创建后 组合到代表单个元数据级别的单个成员层次结构中。数据挖掘维度是共享维度,它不能在维度 编辑其中创建,丽必须基于o l a p 挖女茸漠型。而且它创建后无法编辑。可以在维度向导或挖 掘模型向导中创建数据挖掘维度。 西安建筑科技大学硕士学位论文 ( 4 ) 数据立方体:数据仓库中维的概鑫剡以于关系表的属性。数据立方体是指由两个或更多 的属性即两个或更多个维来描述分类的数据。在三维的清况下以图形来表示,该类数据具有立 方体结构,一般称为数据立方体: ( 5 弹元:是多维数据集的原子元素,或者为来自于该多维数据集相关联的每个维度的某个 成员的唯逻辑交集。实质上,多维数据集由按度量值、级别以及维度组织的单元组成。可从 多个源获得单元中的值,单元中的值由多维数据集的事实数据表中派生而来。并非多维数据集 中的每个单元都必须包含一个值,所以就存在空单元,没有值的多维数据集也可以交集。单元 可以附加一些信息,用来确定与其相关联的数据的内容、字体以及格式等,客户端应用程序可 以使用这些信息来表示单元数据; ( 6 ) 多维数据集:多维数据集是o l a p 中的主要对象,是项可对数据仓库中的数据进行 快速访问的技术。多维数据集是个数据集合,通常从数据仓库的子集构造,并组织 噼 总成 个由一组维度和度量值定义的多维结构。多维数据集采用一种便于使用的查询数据机制,不 但快捷而且响应时问一致; ( 7 ) 事实:事实是不同维表在某一取值下的交叉点,它是对事件的度量; ( 8 ) o l a p :联机分析处理( o l a p ) 是快速、灵活的多维数据分析工具。o l a p 的目的是 支持分析决策,满足多维环境的查询和报表需求,其核心技术在于“维”的概念,o l a p 是多 维数据分析的工具。o l a p 访问和分析数据对象是多维数据信息,这些数据信息是已经从原始 数据完成了抽取、清理、转换的信息,反映的是用户所理解的企业业务事实和观察这些事实的 各维。o l a p 主要是采用多维数据视图来做出决策分析的: ( 9 澎粥集市( d a t a m a r t ) :数据集市是完整的数据仓库的们翌辑子集,而数据仓库正是 由其所有的数据集市有机的组合而成,数据集市_ 皎在某个业务部门建立,满足其分析决策 需要,可以将它理解成“部门级数据仓库”。需要指出的是,虽然数据集市可以理解为“部门 级数据仓库”,但是寸渤据集市都应该是数据仓库有机组成部分,且各们燃市应协调致, 满足整个企业分析决策的需要。 2 1 30 l , a p 的基本分析和动作 联机分析主要通过对多维组织后的数据进行切片、切块、聚合、钻取、旋转等分析动作, 以求剖析数据使用户能够从多种维度、多个侧面、多种数据综合度查看数据,从而了解数据背 后蕴藏的规律。 ( 1 磷媚切片:多维数据是由多个维度组成的,如果在某个维度e 选定一个取值,则多维 数据就扶n 维下降到n l 维,我j f 琳多缨致组的子集( 维度l 、缎2 ,维度1 1 ,度量变 量) 为多维数组在维度i 上的切片。 ( 2 ) 数据切块:数据切块就是将完整的数据立方体切取一部分数据而得到的新的数据立方 6 西安建筑科技大学硕士学位论文 i 体。也就是将大的数据立方体分成若干小的部分。 ( 3 激据钻取:维度具有层次陛,如时间维可能是由年、月、日构成,维度的层次实际上反 映了数据的综合程度。维度层次越高,代表的数据综合度越高,细节越少,数据量越少;维度 层次越f 氐,贝f 味e 的数据综合度越低,细节月充分,数据量越大。数据钻取就是从较高的维度 层次下降到较低的维度层次上来观察多维数据。 ( 4 ) 数据聚合:数据聚合实际上是钻取得逆向操作,是列数据进行高层次综合的操作。比如, 将每3 个月的数据聚合成一个季度的数据。 ( 5 墩据旋转:数据旋转是改变维度的位置关系,使最终用户可以从其他视角来观察多维数 据。( 看待数据维度时可以想象成立体坐标系。) 2 ,1 4 元数据 数据是对事物的描述,“元数据”就是描述数据的数据,它提供了有关数据的环境。读者 熟悉的可能是数据库系统的元数据,它包含数据库系统的所有存储信息、各个数据库和数据表 中的字段信息、数据表之间的关联信息、数据索引约束等等。 按照传统的定义,元数据( m e t a d a t a ) 是关于数据的数据。在数据仓库系统中,元数据可以帮 助数据仓库管理员和数据仓库的开发人员非常方便地找到f 也 门所关心的数据;元数据是描述数 据仓库内数据| q 结构和建立方法的数路,可将其按用途的不同分为两类:技术元数曙( 1 础n i c a l m e t a d a t a ) 和业务元数据( b u s i n e s sm e t a d a t a ) 。 技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的 数据,它主要包括以下信息: ( 1 渤据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数 据集市的位置和内容; ( z 址务系统、数据仓库和数据集市的体系结构和模式。 ( 3 冲 总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、汇总、预定义的 查询与报告。 ( 4 ) 由操懈境至唧螺仓库环境的映射,刨舌源娄蹶和剖门的内容、数据分割、数据提取、 清理、转换规则和数据刷新规则、安全( 用户授权和存取控制) 。 业务元数据从业务角度描述了数据仓库中的数撼它提供了介于使用者和实际系统之间的 语义层,使得不懂谢糊的业务,k 员也自彩“读匿”剡税漳中蝴致据。业务础主要 包括以下意氢:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数 据的来源:系统所提供的分析方法以及公式和报表的信息;具体包括以下信息: ( 1 硷业溉念模型:这是业务元数据所应提供的重要的信息,它表裣止数据模型的高层信 息、整个企业的业务概念和相互关系。以这个企业模型为基础,不懂数据库技术和s q l 语旬 西安建筑科技大学硕士学位论文 的业务人员对数据仓库中的数据也a 兽镦到心中有数。 ( 2 ) 多维数据模型:这是企业概念模型的重要组成部分,它告诉业务分析人员在数据集市当 中有哪些维、维的类别、数据立方体以及数据集市中的聚合规则。这里的数据立方体表示某主 题领域业务事实表和维表的多维组织形式。 ( 3 ) 业务概念模型和物理数据之间的依赖:以上提到的业务元数据只是表示出了数据的业务 视图,这些业务视图与实际的数据仓库或数据库、多维数据库中的表、字段、维、层次等之问 的对应关系也应该在:元数据知识库中有所体现。 元数据实际上就是数据仓库中所用数据的一个详细的说明,它和数据字典很类似。与其说 数据仓库是软件开发项目,还不如说是系统集成项目,因为它的主要工作是把所需的数据仓库 工具集成在起,完成数据的抽取、转换和力1 :1 载,o l a p 分析和数据挖掘等。如图 1 2 2 1 所示,它的典型结构由操作环境层、数据仓痒层和业务层等组成。 即席查询o l a p 分 斤i 数据挖掘 陪 企业数据模型、多维数据模型 j 彗 ,雠襁 1 e 各l 凶+ + o i 图2 1 数据仓库基本结构图 其中,第一层( 操作环境层) 是指整个企业内有关业务的o l t p 系统和些外部数据源; 第二层是通过把第层的相关数据抽取到一个中心区而组成的数据仓库层;第三层是为了完成 对业务数据的分析而由各种工具组成的业务层。图中左边的部分是元数据管理,它起到了承上 启下的作用,具体体现在以下几个方面:元数据是进行数据集成所必需的:元数据定义的语义 层可以帮助最终用户理解数据仓库中的数据;元数据是屎汪数据质量的关键;元数据可以支持 需求变化。 i s 西安建筑科技大学硕士学位论文 2 2 营销数据仓库模型的基本框架 在数据仓库的建设结构上,一种观点认为,首先应该建立个集中的完整的企业级数据仓 库,再在此基础上建立部门级的数据仓库,虽然资金突入大,见效漫,但同一实旋,易于维护。 另外种观点认为,应该在需求最迫切的部门建立一个部门级的数据集市,资金投入较少,又 能及时解决问题。其实上述两种方法都有自己的弊端,最好的办法是把两者相融合。即数据仓 库的建设应该是一步步实施完成的,以部门级数据集市的建设为出发点,但必须统观全局,使 数据集市成为完整的企业级数据仓库的们翌辑子集。这种结构在数据仓库中被称为数据仓库 的总线型结构。其实是的步骤是: ( 1 ) 魃企业级数据仓库的总体框架,给出其总体范围和实施方案。 ( 2 滥控企业级数据仓库的各组成部分数据集市的建设。 在数据模型设计应用上要遵循两个原则:各数据集市的维定义是统一的;事实定义是标准 化的、一致的。 本系统采取的数据仓库建设是总线型结构企业式结构。它是由多个数据集市来构威数据仓 库,由小到大由部分到整体的思想来构建数据仓库。该种思想的杨心是从关键部分开始,现已 最少的投资,完成企业当前的需求,获得最陕的厘】 艮然后不断的扩充,不断完善。通过从小 做起,走逐步集成、逐步完善的道路,最终建立全局数据仓库。该结构有助于部门级管理人员 合理安排预算和及时采用新的数据仓库技术来产生合乎自己的角色的专门应用。同时它兼顾全 局。 通过创建一个共享的结构,企业级数据集市结构( e d m a ) 支持由数据集市到数据仓库的 开发。e d m a 框架包括企业主题域、通用维、度量、业务规则和数据源,所有这些都舀嬲 上统一的全局数据中心库( g m r , g l o b a lm e t a d a t ar e p o s i t o r y ) 中表示出来( 在逻辑上统一,不 定在物理t 集中一) 。这种框架不是固定不变的,它随数据仓库开发而不断调整。它的另 核心是d s s ( 动态数据存储) ,d s s 用于储存、净化和转换从操作型系统中抽取来的数据,并 为数据进入动态存储单元做准备。e d m a 它统一了逻辑上的数据驻留单元,因而有助于数据 集市甚至数据仓库的集成。对于不同的数据市场,我们可以变向的认为它是个关于主题内某 一具体业务的数据仓库。但是在范围上它又不同于小型数据仓库。数据市场面向组织内独立的 主题区域,数据仓库是面向螫能目织。数据市场接收来自外部资源和操作环受的数据,它独立 于任何数据仓库之外。 总而言之,e d m a 是企业建立数据仓库的种较好模式。另外e d m a 的数据集市可以采 用多种合适的数据存储技术,但如果为关系型数据库技术时,星型结构模式比较合适。具体的 西安建筑科技大学硕士学位论文 企业级数据集市结构见图2 , 2 : 共享元数据中心库层 原有应用和数据元 应用服务器 图2 2 企业级数据集市结构( e d m a ) 西安建筑科技大学硕士学位论文 3 营销分析与数据提取 营销可以从社会角度和管理角度二个方面进行定义,从社会角度来看,营销是一个社会性 的过程,在这个过程中,个人和集体通过创造、提供和他人自由交换价值的产品和服务以 蘸足 自身的要求。从管理角度看,营销的目的就是要使推销成为多余。营销的目的是要深入理解顾 客的需要,使产品和服务完全满足顾客的需要从而自然而然的销售出去o “。 营销作为一项独立的业务,它拥有自己独特的业务流程和相应的信息。一般来说,营销数 据的来源主要分为二个主要部分,第部分来自于操作型营销数据库,一般来说,操作型营销 数据库主要包含如下几个子系统:报价管理系统、售订单系统、出货管理系统、销售分析系统、 财务管理系统“”;另外一部分来自于外部,主要是营销过程中与营销相关的一些主题。对主 题进行合理的数据提取是营销数据仓库中数据提取的另一个重要来源。通常与营销相关的实体 主要有十种:分别是商品、服务、体验、事件、个人、地点、财产权、组织、信息和理念。 3 1 营销基本过程及相关主题 3 1 1 营销的基本过程 在市场营销过程中,目标消费者位居于中心地位。企业识别总体市场,将其划分为较小 的细分市场,选挥最有开发价值的细分市场,并集中力量满足和服务于这些细分市场。企业设 计由其控制的四大要素( 产品、价格、渠道和促销) 所组成的市场营销组合。为找到和实施最 好的营销组合,企业要进行市场营销分析、计划、实施和控制。通过这些活动,企业观察并应 变于市场营销环境。 公司、部门和业务层面的计划工作是营销过程不可分割的组成部分。要想了解营销的全过 程必须先了解个营销公司是如何定义其基本业务的。任何业务的目标都是向市场提供价值并 从中赢利。价值转移的观点至少有两种。传统的观点是公司生产某种东西,然后销售出去。按 照这种观点,营销发生在价值转移的后半部分,传统观点假定,公司知道该生产什么,而市场 的购买数量会足以维公司带来利润。传统观点的公司的物资短缺的经济环境中会有好的成功机 会,因为在物资短缺的经济环境,消费者不重视质量、性能和样式。但业务过程的传统观点在 竞争经济环境中行不通,因为在竞争经济环境中,人们有充裕的选择机会,“大众市场”实际 上被分割成许多微观市场,每个市场都有自己的需求、感受、偏好喝购买标准。因此,精明的 竞争者必须为糟心界定的目标市场设计所需的供应品。这种观点是业务过程新观点的核心,新 观点把市场营销放在计划过程的始点。与强调生产和销售相反,公司是自己加入到个三阶段 西安建筑科技大学硕士学位论文 的价值仓u 造和转移过程中。详纽清况见下图: 图3 1 营销的基本过程图 第一阶段是选择价值,它是在产品产生之前市场营销必须做的战略准备。营销人员必须细 分市场,选择适当的市场目标,确定供应品的价值定位。第二阶段是提供的价值,营销者决定 具体的产品特征、价格和分销,以作为营销策略的部分内容。在第三部分的任务是宣传价值。 在这里,利用销售队伍、促销活动、广告和其他促销员工实施进步的营销策略,让市场了解 产品。因此,正是上图所示,营销过程实际上是开始于产品存在之前,继续于产品开发之中和 生产出来之后。 ( 1 ) 目标消费者:为了在今天竞争激烈的市场中获胜,企业必须以顾客为中心,从竞争对 手处赢得顾客,并通过提供更大的价值来保住顾客。但是在满足顾客之前,企业! 断须先了解顾 客的需求和欲望。因此健全的市场营销要求仔细的分析消费者。这一过程包括三个步骤:市场 细分,目标市场选择,以及市场定位。 ( i ) 市场细分:将市场分为具有不同需要、特征或行为,因而需要不同产品或营销组合的不 同购买者群体的过程,被称为市场细分。 目标市场选择:企业在划分好细分市场之后,可以进入既定市场中的个或多个细分市 场。目标市场选择是指估计每个细分市场的吸引力程度,并选j 罩j 差入一个或多个细分市场。 市场定位:市场定位是指为使产品在消费静山目中相对于竞争产品而言占据清晰、特别 和理想的位置而进行的安排。因此,营销人员设计的位置必须是f 刨门的产品有别于竞争品牌, 并取得在目标市场中的最大战略优势。 ( 2 版计营销组合:营销组合是现代营销的主要概念之一。所谓营销组合是指企业为了在 目标市场制造它想要的反应而混合采用的一组可控制的战术营销手段。营销组合包括企业为影 响对其产品的需求而做的任何事情,大致可分为四组变量,被称为四个p ,即产品( p r o d u c t ) 、 价格( p r i c e ) 、分销( p l a c e ) 和促销( p r o m o t i o n ) 。 产品是指企业向目标市场提供的“商品和服务”的结合体。 价格是指顾客为获得产品而必须支付的金额。 分销包括企业为使产品到达目标消费者手中而进行的活动。 西安
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民生银行襄阳市老河口市2025秋招笔试英文行测高频题含答案
- 2024年事业单位工勤技能考试每日一练试卷附参考答案详解【满分必刷】
- 华夏银行武汉市蔡甸区2025秋招笔试EPI能力测试题专练及答案
- 招商银行黄冈市黄州区2025秋招笔试综合模拟题库及答案
- 平安银行杭州市拱墅区2025秋招笔试热点题型专练及答案
- 广发银行宁波市宁海县2025秋招笔试英语题专练及答案
- 民生银行重庆市巴南区2025秋招笔试英文行测高频题含答案
- 2024安全监察人员模拟试题含答案详解(基础题)
- 2025年盘锦市大洼区人民医院面向社会招聘合同制工作人员(49)考前自测高频考点模拟试题及完整答案详解
- 农发行南平市光泽县2025秋招半结构化面试题库及参考答案
- ISO 22000-2018食品质量管理体系-食品链中各类组织的要求(2023-雷泽佳译)
- 卡巴斯基应急响应指南
- 理财规划大赛优秀作品范例(一)
- 2023年四川能投筠连电力招聘笔试参考题库附带答案详解
- 护理管理组织结构与设计
- 静配中心清洁消毒考核试题
- 一级烟草专卖管理师理论考试题库(含答案)
- 小学数学《分数除法》50道应用题包含答案
- 碳捕集、利用与封存技术课件
- 化工试生产总结报告
- 复句与单句的辨析课件
评论
0/150
提交评论