版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第7章 CRM系统中的商业智能技术数据仓库技术数据挖掘理解三种技术的的应用CRM系统中商业智能技术本章主要内容:)联机分析处理数据挖掘 OLAP的应用 数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能第一节商商业业智能商业智能能是从大量量的数据据和信息息中发掘掘有用的的知识,并用于于决策以以增加商商业利润润,是一一个从数数据到信信息到知知识的处处理过程程。商业业智能用用来辅助助商业活活动作出出快速反反应,加加快知识识的获取取速度,减少企企业不确确定性因因素的影影响。因因此能很很好地满满足管理理层和决决策层对对信息知知识的时时间性和和准确性性的
2、要求求。商业智能能在我国国尚处于于起步阶阶段,虽虽然其在在发展和和应用过过程中仍仍存在很很多不足足,但商商业智能能正朝着着实时性、标准化、集成性、实用性、大众化方向发展展。商业智能能的定义义数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能支撑技术:数据仓库为平台,数据挖掘OLAP互补,进行分析体系结构构:以Web服务形式式提供,以XML形式发放放BI应用的分分析结果果是新的的发展趋趋势。应用系统统:BI系统将更更具专业业化和行行业化的的特点,与企业业门户、企业应应用集成成紧密相相连商业智能的发展商业智
3、能能的发展展第一节商商业业智能数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据仓库决策支持企业决策层OLAP数据挖掘数据存储提取、清洗、转化业务数据库决策信息反馈到实际的业务系统中商业智能能系统的的构成商业智能能系统由由业务数据据仓库系系统、决策支持持系统等部分构构成。图7-12商业智能能系统的的数据处处理循环环第一节商商业业智能数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能商务智能能系统的的三大支支撑
4、技术术数据仓库库技术OLAP数据仓库库完成了了数据的收集、集成、存储、管理等等工作,商务智能面对对的是经经过加工的数据据,能更更专注于信息的的提取和和知识的发现。OLAP从多种种角度对对原始数据据进行分分析,将其转转化为用用户所理解、并真实实反映企业经经营情况况的信息,为为决策提提供依据。数据挖掘掘技术数据挖掘掘技术能能高度自动动化地分分析数据,做出归归纳性推理理,挖掘掘出潜在的的模式,帮助决策策者作出出正确的决决策。商业智能能系统的的支撑技技术第一节商商业业智能数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用
5、商业智能能客户智能能是创新和和使用客客户知识识,帮助助企业提提高优化化客户关关系的决决策能力力和整体体运营能能力的概概念、方方法、过过程以及及软件的的集合。客户智能能客户智能的理解 理论基础信息系统层面数据分析层面知识发现层面战略层面客户智能能的定义义第一节商商业业智能数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能客户知识识,顾名思思义,是是有关客客户的知知识。客客户知识识包括客客户的消消费偏好好、喜欢欢选用的的接触渠渠道、消消费特征征等许多多描述客客户的知知识。客客户知识识是人们们通过实实践认识识
6、到的、与客户户有关的的规律性性,而客客户智能能是获得得客户知知识并使使用客户户知识求求解问题题的能力力。客户智能能是对企企业战略略决策真真正有价价值的事事物和行行动。生生成客户户知识的的过程称称之为客户知识识的加工工处理过过程,客户智智能不仅仅包括了了客户知知识的生生成,而而且强调调了客户户知识在在企业中中的分发发、使用用,直到到产生客客户智能能 。客户知识识第一节商商业业智能数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能客户知识生成客户知识分发客户档案客户知识使用营销客户服务。客户智能客户智能图7
7、-13客户智能能的生成成、分发发和使用用第一节商商业业智能数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能(1)客户知识识的生成成(generation):使用商业业智能提提供的OLAP分析工具具、数据据挖掘工工具或两两种工具具的组合合,发现现存在于于客户数数据中的的模式、规则、概念、规律的的整个过过程,称称为客户户知识的的生成。(2)客户知识识的分发发(distribution):客户知识识必须到到达组织织内每一一个需要要客户知知识的部部分。将将客户知知识存储储与动态态知识库库,借助助CRM的系统平
8、平台,将将客户知知识分发发到需要要的终端端。(3)客户知识识的使用用(usingit):将客户信信息和知知识投入入使用是是CRM的最后一一个环节节。许多多CRM和知识发发现没有有成功,很大程程度上在在于产生生的与客客户有关关的信息息和知识识不能投投入使用用。第一节商商业业智能数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能第二节数数据仓仓库概述述数据仓库库的产生生没有(一一致的)全局信信息 很难难产生正正确的决决策没有(完完整的)历史数数据历史数据据分析(经验)发展趋势势预测隐含信息息挖掘更难支支持企
9、企业决策策研究企业范围围内的数数据集成成多数据库库系统面向问题题的分析析海量数据据存储产生一项项新的信信息技术术DataWarehousingDW的概念起起源于20世纪80年代美国著著名信息息工程学学家W.H.Inmon博士RecordSystemAtomicData提出数数据仓仓库的概概念DecisionSupportDatabase数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能第二节数数据仓仓库概述述早期数数据仓库库的定定义的重重要文文献:MartinHubel1986.10DataBasean
10、dtheDataWarehousingConcept数据仓库库的定义义B.A.DevilinP.T.MurphyAnArchitectureforaBusinessandInformationSystemIBMSystemJournal其中,披披露了一一项IBM的 内部部研究计计划目的:构构造一种种“以关系数数据库为为基础的的公司数数据的集集成化仓仓储”仓储的使使用者:不不是IT人员而是各级级决策者者数据仓库库1991年,IBM公司正正式公公布其其DW构架INDEPTH成功开开发DW数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构
11、构成OLAP技术应用商业智能能第二节数数据仓仓库概述述数据仓库库(datawarehouse)是一个面面向主题题的(subjectoriented)、集成的的(integrated)、非易失失的(non-volatile)、随时间间变化的的(timevariant)数据集合合,用于于支持管管理决策策。面向主题集成性非易失性时变性 在数据仓库中,所有数据都是围绕一定主题进行。对于同一主题:关系数据库中,数据分布在相关的数据表中,在数据仓库中,数据存放在同一数据表中。数据仓库中数据都经过清洗、过滤、转换。都有统一得格式、消除了源数据中结构、表示方式、代码含义,不一致性 对于支持决策,历史数据非常重
12、要。数据一旦写入,几乎不再更改,除非错误。对数据仓库的操作只是数据追加。 所以数据仓库中数据是非易失的(稳定的)数据仓库中数据是只增不删的,所以记录了所有的数据。反映企业各个时期的信息,即反映企业随时间动态变化的数据。 数据仓库库的定义义数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能第二节数数据仓仓库概述述面向主题案例数据结构构:销售管理理系统顾客(顾顾客号,姓名,性别,年龄,文化程程度,地地址,电电话)销售(员员工号,顾客号号,商品号,数量,单价,日期)采购管理理系统订单单(订单号号,供应应商号,
13、总金额额,日期期)订单细则则(订单单号,商品号,类别,单价,数量)供 应商商(供供应商号号,供应应商名,地址,电话)库存管理理系统领料单(领料单单号,领领料人,商品号,数量,日期)进料单(进料单单号,订订单号,进料人人,收料料人,日日期)库存存(商品品号,库库房号,库存量量,日期期)库房房(库房房号,仓仓库管理理员,地地点,库库存商品品描述)数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能第二节数数据仓仓库概述述面向主题案例这种数据据组织的的特点:对相关部部门的数数据进行行收集和和处理,重点是是“数据
14、”和“处理”数据按部部门的组组织结构构和业务务活动特特点进行行;数据是不不断变化化和反复复更新的的,所以以,是动动态的,要求的的是处理的速速度和即即时性(只反映映当时的的情况);数据库中中存储的的表与部部门中的的业务报报表基本本上是对对应的,所以,直观,处处理方便便,易理理解;数据库建建立的本本质:数数据与处处理分离离(在程程序中不不分离)因为:很很多应用用涉及同同一数据据项,而而同一数数据项分分散在不不同的数据库中中 造造成数数据的不不一致性性。 这样的数数据处理理方式称称为“联机事务务处理”OLTP数据库的的存储要要求冗冗余小小 (各各种范式式)速度快(保留留一定的的冗余)数据挖掘掘OLA
15、P的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能第二节数数据仓仓库概述述按主题组组织数据据的数据据结构:商品品商品固有有信息(商品号,商品名,类别,颜色,)商品采购购信息(商品号,供应商号号,供应价,供应日期期,供应量,)商品销售售信息(商品号,顾客号,售价,销售日期期,销售量,.)商品库存存信息(商品号,库房号,库存量,日期,)供应商供应商固固有信息息(供应商号号,供应信息息,地址,电话,)供应商品品信息(供应商号号,商品号,供应价,供应日期期,供应量,)顾客客顾客固有有信息(顾客号,顾客名,性别,年龄,文化程度度
16、,住址,电话,)顾客购物物信息(顾客号,商品号,售价,购买日期期,购买量,)企业关心心的业务务方向:客户,商品,供应商商对上述分分析对象象,可围围绕主题题进行数数据组织织:采购销售库存商品(一致)信息,便于联联机分分析处理理OLAP数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能(1)数据粒粒度面向数据据挖掘面向OLAP粒度的大大小反映映数据仓仓库的数据综综合程度度。粒度度越小,数据据越详细细,数据据量也越大。(表)反映的是是抽样率率。抽样样率的确定取决决于源数数据量的的大小和数据挖挖掘的具具体要求求
17、。源数据量越越大,抽抽样率越越低。表数数据粒度度的相关关指标数据粒度度的划分分是设计计最重要要的工作作,需考考虑数据据仓库可可接受的的分析类类型和最最低粒度度以及能能存储的的数据量量。一般般数据仓仓库都选选择多重重粒度的的结构。重要概念念第二节数数据仓仓库概述述数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据分割割常见形形式垂直分割水平分割图解分割(2)数据分分割数据分割割就是将大大量的数数据分成成独立的的、较小小的单元元进行存存储以提提高数据据处理的的效率。在进行行分割时时要考虑虑数据量量、数据
18、据对象和和粒度划划分策略略等几个个方面。一个表垂垂直分成两部分分,把一个大表表分成两个表,表之间通过关关键字段关联联。表按行分分成两部分,表表被用来存储用用户联系紧密的的本地重要数据据,减少网络查查询。经过多个个分布系系统把一个个图分解解成两部分分,从指指定的服务务器或在在多个服务务器之间间建立连接接而得到到一个表所所需要的的全部数据据。第二节数数据仓仓库概述述数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能第二节数数据仓仓库概述述数据仓库库与数据据库的区区别表2数据库和和数据仓仓库的区区别数据库只只
19、存储当当前数据据,而数数据仓库库存放历历史数据据;数据据库主要要面向业业务操作作,而数数据仓库库面向数数据分析析和决策策支持;数据库库中的数数据是动动态变化化的,随随时刷新新,而数数据仓库库中的数数据是静静态的,一般不不会改变变;数据据库使用用频率比比数据仓仓库高,数据访访问量少少,要求求响应时时间短。数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能企业外部部数据数据仓库库存储业务操作作型系统统数据清洗/转换数据提取提取仓库数据挖掘系统/数据展现系统数据集市数据集市数据集市数据集市数据仓库库的体系系结
20、构数据据元数数据据图3数据据仓库的的体系结结构图第二节数数据仓仓库概述述数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据仓库库的体系系结构由于数据据库和数数据仓库库应用的的出发点点不同,因此数数据仓库库与业务务数据库库系统是是相互独独立的,但数据据仓库又又同业务务数据库库系统密密切相关关。数据仓库库是将业业务操作作型系统统中的数数据提取取出来,辅以企企业外部部数据,这些数数据经过过清洗和和转换,存储在在数据仓仓库中。数据仓仓库不只只存储业业务数据据,还存存储记录录数据信信息的元元数据。数据仓库库中
21、还可可以抽取取部门型型数据仓仓库,即即数据集集市。数数据最终终传送给给数据挖挖掘系统统或数据据展现系系统,以以供数据据分析或或展现给给用户。所以,数据仓仓库不是是简单地地对数据据进行存存储,而而是对数数据进行行“再组组织”。第二节数数据仓仓库概述述数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能传统数据据库面向向操作型型环境,系统设设计人员员能够明明确了解解用户需需求,因因此传统统数据库库一般采采用系统生命命周期法法(system development lifecycle,SDLC)。而数据据仓库面
22、面向分析析型应用用,设计计人员要要在与用用户不断断沟通的的基础上上,逐步步明确与与完善系系统需求求,因此此数据仓仓库设计计采用CLDS(cycle lifedevelopmentsystem)方法。需求分析析贯穿整整个数据据仓库设设计过程程。数据仓库库的设计计方法与与步骤第二节数数据仓仓库概述述数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据仓库库的设计计方法与与步骤第二节数数据仓仓库概述述图7-4SDLC方方法和CLDS方法比比较数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓
23、库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据仓库库的设计计方法与与步骤第二节数数据仓仓库概述述表7-3数据仓仓库设计计与数据据库设计计的区别别数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据仓库库的设计计方法与与步骤第二节数数据仓仓库概述述图7-5数据据仓库设设计的主主要步骤骤数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能第三节CRM系统统中的数数据仓库库技术最终用户
24、信息使用者 知识挖掘者 数据仓库库的用户户信息使用用者使用用数据仓仓库是经经常性的的、重复复性的,只访问问很少的的一部分分数据。每次查查询也许许是相同同的几个个指标,运用数数据仓库库可以快快速、准准确地得得到他们们所需要要的信息息。信息息使用者者是操作作型用户户。知识挖掘掘者不只只查询数数据仓库库目前能能够提供供的信息息,还通通过数据据分析找找到其中中的隐含含信息,用以发发现更深深层次的的知识来来指导决决策。知知识挖掘掘者是分分析型用用户。知识挖掘掘者在使使用数据据仓库时时,先对对数据进进行概括括分析,然后根根据需要要从数据据仓库中中抽取数数据,对对抽取出出来的数数据选择择合适的的数据挖挖掘算
25、法法进行建建模分析析,最后后是根据据建模分分析得到到的知识识对数据据仓库进进行分类类处理。数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能客户数据仓库的功能动态、整整合的客客户数据据管理和和查询功功能基于数据据仓库支支持的客客户关系系结构和和忠诚客客户识别别功能基于WEB数据仓库库的信息息共享功功能基于数据据仓库支支持的客客户购买买行为参参考功能能基于数据据仓库支支持的客客户流失失警示功功能CRM系系统中数数据仓库库的功能能CRM的数据仓仓库必须须是动态态的、整整合的数数据库系系统。动态指数据库库能够
26、实实时地提提供客户户的基本本资料和和历史交交易行为为等信息息,并在在客户每每次交易易完成后后,能够够自动补补充新的的信息;整合是指客户户数据库库与企业业其他资资源和信信息系统统要综合合、统一一,各业业务部门门及人员员可根据据职能、权限的的不同实实施信息息查询和和更新功功能,客客户数据据仓库与与企业的的各交易易渠道和和联络中中心必须须紧密结结合等。实施忠诚诚客户管管理的企企业需要要制定一一套合理理的建立立和保持持客户关关系的格格式或结结构。即即企业要要像建立立雇员的的提升计计划一样样,建立立一套把把新客户户提升为为老客户户的计划划和方法法。例如如,航空空公司的的里程积积累计划划客户飞行行了一定定
27、的里程程数,便便可以获获得相应应的免费费里程,或根据据客户要要求提升升舱位等等级等。企业运用用客户数数据仓库库,可以以使每一一个服务务人员在在为客户户提供产产品和服服务时,明确客客户的偏偏好和习习惯,从从而提供供更具有有针对性性的个性性化服务务。例如如,读者者俱乐部部都有定定制寄送送服务,他们能能根据会会员最后后一次的的选择和和购买记记录,以以及他们们最近一一次与会会员交流流获得的的有关个个人生活活信息,向会员员推荐不不同的书书籍。企业的客客户数据据仓库将将通过对对客户历历史交易易行为的的观察和和分析,发挥警警示客户户异常购购买行为为的功能能。如一一位客户户的购买买周期或或购买量量出现显显著萎
28、缩缩变化时时,就是是潜在的的客户流流失迹象象。客户户数据库库通过自自动监视视客户的的交易资资料,对对客户的的潜在流流失现象象作出警警示。Web数据仓库库将成为为企业信信息共享享的基础础架构。客户数数据仓库库应拥有有可以通通过浏览览器使用用的接口口,以成成为支持持客户关关系管理理的基本本架构,并且数数据仓库库要能够够通过用用户的简简单点击击就可以以获得分分析结果果。CRM环境下连连接分散散单位的的数据中中心建成成关键在在于Web数据仓库库构造之之初就为为其所有有部分确确立一致致的数据据元,并并通过一一致的数数据元实实现数据据仓库的的总线体体系结构构。第三节CRM系统统中的数数据仓库库技术数据挖掘
29、掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能图7-6客户数据据仓库的的体系结结构数据挖掘对分析的结果进行评估客户信息客户活动清洗、转换外部数据联机分析处理数据仓库数据准备客户数据集市CRM系系统中数数据仓库库的系统统结构第三节CRM系统统中的数数据仓库库技术数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能CRM系系统中数数据仓库库的系统统结构数据通过过抽取、转转换和装装载,形成数数据仓库库,并通通过OLAP和报表
30、,将客户户的整体体行为分分析和企企业运营营分析等等传递给给数据仓仓库用户户。在数据仓仓库中,利用数数据仓库库的ETL(extraction-transformation-loading)工具,针针对行为为分组和和寻找重重点客户户的需要要,产生生相应的的数据集市市(DM),将分析析结果与与性能评评价等传传递给CRM用户。对对于客户户量巨大大、市场场策略对对企业影影响较大大的企业业,CRM要以数据据仓库为为核心。数据来源客户信息息客户行为为生产系统统其他相关关数据第三节CRM系统统中的数数据仓库库技术数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户
31、智能能定义、构构成OLAP技术应用商业智能能分析建立企业模型 概念模型设计 逻辑模型设计 物理模型设计 数据仓库生成确定系统边界及主题域技术准备工作确定数据的存储结构 确定数据存放位置 确定存储分配 CRM系系统中数数据仓库库的设计计与实施施第三节CRM系统统中的数数据仓库库技术数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能客户数据仓库的建立注意问题数据信息息收集和和集成确保数据据的质量量按规则更更新客户户数据,保持对已已有客户户的统一一看法数据仓库库统一共共享,以以发挥最最大作用用为进一步步了解客
32、客户身份份及其需需求,并并做出预预测,企企业需要要花费一一些精力力进行分分析,因因此产生生了数据据信息搜搜集。成成功地使使用数据据信息搜搜集是CRM建设的重重要步骤骤。CRM的客户数数据仓库库需要把把企业内内外的客客户数据据集成起起来。就就客户数数据集成成来讲,企业需需要对客客户进行行匹配和和合并。首先,在在建立CRM数据库时时,一定定要确认认由应用用程序所所生成的的客户编编码的唯唯一性;其次,建立完完整、准准确的客客户数据据仓库,姓名和和地址这这两个信信息片段段是很重重要的,一定要要进行分分解和规规范化;最后,对企业业想收集集又没有有一定结结构且信信息量比比较大的的数据一一定要非非常慎重重,
33、比如如文本信信息。首先识别别新数据据性质,新客户户的数据据给一个个独立的的标识,在数据据仓库中中插入一一条新的的记录;如果是是已有客客户的数数据,更更新客户户记录的的相关信信息片段段。数据据更新要要求同步步化是CRM数据仓库库的特点点之一。统一共享享的客户户数据仓仓库把销销售、市市场营销销和客户户服务的的所有信信息连接接起来。如果一一个企业业的信息息来源互互相独立立,那么么这些信信息会不不可避免免地出现现重复、互相冲冲突等现现象,这这对企业业的整体体运作效效率将产产生消极极的影响响。第三节CRM系统统中的数数据仓库库技术CRM系系统中数数据仓库库的设计计与实施施数据挖掘掘OLAP的应用数据挖掘
34、掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能CRM中数据仓库的应用客户行为为分析重点客户户发现市场性能能评估客户行为为分析包包括整体行为为分析和群体行为为分析两个方面面。整体行行为分析析用来发发现企业业所有客客户的行行为规律律,行为为分组时时按照客客户的不不同种类类的行为为,将客客户划分分成不同同的群体体。在行为分分组完成成后,要要进行客客户理解解、客户户行为规规律发现现和客户户组间交交叉分析析等。重点客户户发现主主要是发发现能为为企业带带来潜在在效益的的重要客客户。根根据客户户的属性性特点就就可以挖挖掘出重重点客户户,然后后做
35、好保保持和提提高这些些重点客客户的忠忠诚度工工作。此此外,通通过数据据仓库的的数据清清洗与集集中过程程,可以以将客户户对市场场的反馈馈自动输输入数据据仓库中中,这个个获得客客户反馈馈的过程程,称为为客户行为为追踪。根据客户户行为分分析,企企业可以以准确地地制定市市场策略略和市场场活动。然而,这这些市场场活动是是否能够够达到预预定的目目标,是是改进市市场策略略和评价价客户行行为分组组性能的的重要指指标。因因此,在在CRM中必须须对行为为分析和和市场策策略进行行评估。第三节CRM系统统中的数数据仓库库技术CRM系系统中数数据仓库库的应用用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施
36、数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能第四节OLAP技术及其其在CRM系统统中的应应用OLAP是共享多多维信息息的、针针对特定定问题的的联机数数据快速访问和分分析的软软件技术术。它通通过对信信息的多多种可能能的观察察形式进进行快速速、稳定定一致和和交互性性的存取取,允许许管理决决策人员员对数据据进行深深入观察察。相关概念变量 维 维的层次次性维成员多维数组组数据单元元联机分析析处理的的概念数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能变量:分析数据据时要考
37、考虑的属属性,即即描述数数据“是是什么”。维:是人们观观察数据据的特定定角度,是考虑虑问题时时的一类类属性,属性集集合构成一个维维。维的层次次性:人们观察察数据的的某个特特定角度度(即某某个维)还可以以存在细细节程度不同同的各个个描述方方面,我我们称这这多个描描述方面面为维的的层次。一个维维往往具有多多个层次次。维成员:维的一个个取值,若维分分为几个个层次,那么维维成员就就是不同同维层次取值的的组合。多维数组组:多维数组组是维和和变量的的组合表表示。一一个多维维数组可可以表示示为:(维1,维2,维维n,变变量)。数据单元元:数据单元元是多维维数组的的取值。当多维维数组的的各个维维都选中中一个维
38、成员员,这些些维成员员的组合合就唯一一确定了了一个变变量的值值。那么么数据单单元就可以表表示为:(维1维成员员,维2维成员员,维n维维成员,变量的的值)。联机分析析处理的的概念第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能多维数据据模型上上的OLAP操作对多维数数据集(维1、维2、维3维n、变量值值)在维维度i上选定一一个维成成员,得得到一个个n1维多维数数据集,称得到到的这个个n1维多维数数据集为为原数据据集在第第i维上的数数据切片片。OLAP的分析
39、方法数据切片数据切块数据钻 取 数据聚 集 数据旋 转 在多维数数据立方方体中,确定某某些维度度的取值值范围,得到一一个原立立方体的的子立方方体的过过程被称称为数据据切块。数据切切块与数数据切片片得到的的多维数数组都是是原多维维立方体体的子集集,不同同的是数数据切片片使多维维立方体体降低了了一个维维度,而而数据切切块得到到的多维维立方体体与原立立方体的的维度是是相同的的。数据钻取取(数据下钻钻),是由概概括的数数据到详详细的数数据的过过程。数数据钻取取对应于于维的层层次,它它是由维维的高层层次展开开到低层层次的一一个动作作。比如如,我们们由“年”数据下钻钻到“季度”数据,这这无疑会会增加数数据
40、细节节和数据据量,得得到更详详细的数数据。数数据钻取取的具体体操作参参见图图72中的数据据钻取部部分。数据聚集集又叫数数据上卷卷,是数数据钻取取的逆过过程。数数据聚集集是将详详细的数数据聚集集为较概概括的数数据,是是一个综综合数据据的动作作。数据旋转转即变换换维度的的位置,也就是是转动数数据的视视角,给给用户提提供一个个从不同同的角度度观察数数据的方方法。第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能原数据立立方体包包含了时时间(年年)、城城市、产产品
41、三个个维度,其中a1,a2为产品名名。钻取取过程是是按时间间下钻,由年数数据得到到季度数数据,数数据由原原来的两两行展为为八行。聚集过过程是按按地区维维度上卷卷,将城城市维上上卷为国国家维,即将北北京、上上海两城城市数据据统计为为中国的的数据,将东京京、大阪阪两城市市的数据据统计为为日本的的数据。数据聚聚集和数数据钻取取为用户户提供了了不同层层次观察察数据的的方法。2007 3季2007 1季2006 1季2006 3季2007 4季2007 2季2006 4季2006 2季a1a2 北京 上海 东京 大阪钻取聚集a2a120062007中国 日本20062007北京 上海 东京 大阪a1a2
42、图7-7 数据钻取与聚集 聚集钻取第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能20062007A1200230A2456478A3100120A1A2A320062004561002007230478120图7-8数据旋转转图7-8是数数据旋转转的一个个简单示示例,只只体现了了二维表表的旋转转。当数数据是三三维或是是三维以以上的多多维数据据时,数数据旋转转将更有有意义,每进行行一次数数据旋转转就可以以从一个个新的视视角观察察数据。第四节OLAP技术及
43、其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能OLAP的特点联机分析析处理的的用户是是企业中中的专业业分析人人员及管管理决策策人员,在分析析业务经经营的数数据时,从不同同的角度度来审视视业务的的衡量指指标是一一种很自自然的思思考模式式。比如如,分析析销售数数据时,综合时时间周期期、产品品类别、分销渠渠道、地地理分布布、客户户群类生生成一张张张报表表,各个个分析角角度的不不同组合合又可以以生成不不同的报报表,使使得IT人员的工工作量相相当大。联机分析析处理的的主要特特点是直
44、直接仿照照用户的的多角度度思考模模式,预预先为用用户组建建多维的的数据模模型。一一旦多维维数据模模型建立立完成,用户可可以快速速地从各各个分析析角度获获取数据据,也能能动态地地在各个个角度之之间切换换或者进进行多角角度综合合分析,具有极极大的分分析灵活活性。这这也是联联机分析析处理近近年来被被广泛关关注的根根本原因因,它从从设计理理念和真真正实现现上都与与旧的管管理信息息系统有有着本质质的区别别。第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能OLAP的
45、应用数据仓库库系统核核心是联机分析处理理,从应用的的角度来来说,数据仓库还可可以采用用传统的的报表或或数理统统计和数数据挖掘掘等人工工智能方方法,涵盖的范范围更广广;从应用的的范围来来说,联机分析析处理往往往根据据用户分分析的主主题进行应用分分类,如销售分分析、市市场推广广分析、客户利利润率分分析等,每一个分析析的主题题形成一一个OLAP应用,而而所有的的OLAP应用实际际上只是是数据仓库库系统的的一部分分。以某家电电企业为为例介绍绍OLAP的应用。家电的的多维分分析涉及及产品、销销售数量量、地区区和时间间4个维。所所有抽查查的数据据都是第第1季度的。第四节OLAP技术及其其在CRM系统统中的
46、应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能冰箱销售第1季度,冰冰箱在什什么地区区销售情情况最好好?第1季度,哪哪个省份份的冰箱箱销量处处于领先先地位?第1季度,哪哪个城市市的冰箱箱销售数数量最高高?负责冰箱箱销售的的副总裁裁提出了了以下3个问题:解决方法法需要用用到OLAP的两种多多维分析析方法,即数据切切片/切块和数数据钻取取,其他的分分析方法法还有数数据旋转转和数据据聚集等等。第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数
47、据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能产品地点时间电视冰箱空调华东东北西北2006.42007.12007.22007.3冰箱图7-9运用数据据切片来来进行数数据分析析首先使用用数据切切片方法法来对第第一个问问题进行行分析。在图7-9的数据立方方体中,时间、地区和和产品分分别是3个维度,销售额额是度量变量量。在产产品维上上选定“冰箱”则形成在在产品维维上的数数据切片,显示示了冰箱箱在各地地区和各各月份的的销售情情况。第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓
48、库库客户智能能定义、构构成OLAP技术应用商业智能能数据钻取取和聚集集会改变变维的层层次,变变换分析析的粒度度,在家家电企业业的例子中中,必须须采用联联机分析析处理工工具深入入的地区区维中,通过数数据钻取来查看看某地区区维中更更细致的的数据。 (如如图7-10所所示)。表4按按地区划划分的销销售数据据通过模型型驱动工工具来查查询数据据仓库的的数据,如表7-4第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能冰箱44899西北79954华东36040东北25
49、309浙江29344江苏17866吉林18174辽宁西北东北华东冰箱24632陕西20267甘肃25301山东图7-10运用数据据钻取来来进行数数据分析析图7-10表表示的是是对地区区维数据据钻取的的第一步步,即显显示了该该家电企企业按地地区划分分的各省省份的冰冰箱销售售量(如表7-5所示示);更深一一步的钻钻取可以以显示出出各城市市的销售售情况,得到表表7-6。第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能表5按按地地区和省省进行划划分的销销售数据据
50、第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能表6按按地区区、省和和城市进进行划分分的销售售数据第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能通过OLAP得出了负负责冰箱箱销售的的副总裁裁所提出出的3个问题的的答案:2007年第1季度,冰冰箱在华华东地区区销售情情况最好好。2007年第1季度,在在华东地地区,江
51、江苏的冰冰箱销售售量处于于领先地地位。2007年第1季度,江江苏的南南京冰箱箱销售量量最高。OLAP的应用第四节OLAP技术及其其在CRM系统统中的应应用数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能第五节数数据据挖掘概概述数据挖掘掘(data mining)是从大量量的、不不完全的的、有噪噪声的、模糊的的、随机机的实际际应用数数据中提提取人们们感兴趣趣的知识识,这些些知识是是隐含的的、事先先未知的的、潜在在有用的的信息。它是通通过分析析数据发发现数据据内部的的信息和和知识过过程。数据挖掘掘的基础础
52、是大量量数据,所以具具有高效效处理大大量数据据的能力力。这也也是目前前数据挖挖掘技术术的一个个难题,一些算算法在小小数据集集上效果果很好,但数据据量增加加到一定定程度,算法的的实现代代价过大大、效率率太低,甚至无无法实现现。数据挖掘掘的定义义数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据来源源事务数据据库高级数据据库数据仓库库关系数据据库数据挖掘掘的数据据来源关系数据据库:关系数据据库中的的数据是是最丰富富、最详详细的。在进行行数据挖挖掘之前前也要对对数据进行行清洗和和转换。数据的的真实性性和一
53、致致性是进进行数据据挖掘的的前提和和保证。数据仓库库:数据经过过清洗和和转换,不存在在错误和和不一致致的情况况,数据据仓库在在获取数数据后就不需要要再进行行这些数数据处理理工作了了。数据仓库库、数据据挖掘和和联机分分析处理理共同构构成了系系统的决决策支持持模块。事务数据据库:数据挖掘掘可从事事务数据据库中提提取数据据。其每每个记录录代表一一个事务务。在进行数数据挖掘掘时,可可以只将将一个或或几个事事务数据据库集中中到数据据挖掘库库中进行行挖掘。高级数据据库:面向对象象的数据据库、空空间数据据库、时时间和时时间序列列数据库库、文本本和多媒媒体数据库库等新的的数据库库。这些些结构更更为复杂杂的数据
54、据库为数数据挖掘掘提供了了更加全全面、更更加多元化化的数据据,也为为数据挖挖掘技术术提出了了更大的的挑战。第五节数数据据挖掘概概述数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据挖掘掘的基本本步骤数据挖掘掘包括确确定分析析和预测测目标、建立数数据挖掘掘库、分分析数据据、建立立模型、模型评估与与验证、模型实实施等几几个基本本步骤。第五节数数据据挖掘概概述图7-11数数据挖掘掘的基本本步骤数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构
55、成OLAP技术应用商业智能能数据挖掘掘的基本本步骤第五节数数据据挖掘概概述数据挖掘的基本步骤1)确确定分析析和预测测目标确定分析析和预测测目标相相当于需需求分析析,主要要是明确确业务目目标。确确定分析析和预测测目标是是数据挖挖掘的基基础条件件。同时时,定义义了数据据挖掘的的分析目目标也就就定义了了评价这这一挖掘掘模型的的标准。2)建建立数据据挖掘库库首先要进进行数据收集集,对于收收集到的的数据,应对数数据的来来源、大大小、存存储位置置和数据据在使用用上的限限制等进进行详细细的记录。完成数数据收集集后,要要对数据据进行描描述。数据挖掘掘库可以是一一个单独独的数据据库,也也可以和和数据仓仓库建立立
56、在相同同的物理理介质上上。数据据挖掘库库中还应应包括数数据的元元数据。3)分分析数据据分析数据据即对数数据挖掘掘库中的的数据进进行分析析,对数数据有了了全面、细致的的了解以以后,就就可以针针对数据据挖掘分分析目标标选择合合适的变变量和记记录。对对于变量量的选择择,首先先要考虑虑对结果果有影响响、可以以反映结结果的变变量。4)建建立模型型建立模型型是选择择合适的的方法和和算法对对数据进进行分析析,得到到一个数数据挖掘掘模型的的过程。建立模模型是一一个反复复进行的的过程,它需要要不断地地改进或或更换算算法以寻寻找对目目标分析析作用最最明显的的模型,最后得得到一个个最合理理、最适适用的模模型。5)模
57、模型评估估与验证证为了验证证模型的的有效性性,一般般会将数数据集分分为两部部分:一一部分用用于建立立模型,另一部部分则用用于测试试模型。对模型型的验证证主要需需要考虑虑以下几几个方面面:(1)模型的准准确性;(2)模型的可可理解性性;(3)模型的性性能。模型建建立和模模型检验验是一个个反复的的过程。6)模型型实施模型的实实施有两两种情况况:一种种是将数数据挖掘掘模型得得到的结结果提供供给信息息需求者者或者管管理者,以辅助助管理者者的决策策分析;还有一种种情况就就是保留留模型,以后每每遇到类类似问题题就用这这个模型型进行分分析,或或者将模模型用于于不同的的数据集集上(这这些数据据分析需需要采用用
58、相同的的方法)进行分分析。在模型的的使用过过程中,随时间间及环境境的变化化,还应应对模型型进行重重新测试试,并对对模型进进行相应应的修改改,这就就是模型维护护的过程程。数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据挖掘掘工具及及其选择择第五节数数据据挖掘概概述数据挖掘掘工具包包括数据挖掘掘(datamining)工具具和文本挖掘掘(textmining)工具具。数据挖挖掘工具具主要是是用来进进行聚类类分析、关联分分析、时时间序列列分析以以及统计计分析的的。文本本挖掘工工具主要要应用在在市场调调研
59、报告告中或呼呼叫中心心(callcenter)的客客户抱怨怨定级、专利的的分类、网页的的分类以以及电子子邮件的的分类等等方面。一般而而言,目目前市场场上这些些数据挖挖掘工具具又可以以分成两两类:企企业级工工具以及及小型工工具。数据挖掘掘OLAP的应用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能数据挖掘掘工具及及其选择择第五节数数据据挖掘概概述数据挖掘工具的选择公司的的数据挖挖掘需求求是短期期行为还还是长期期使用公司的的数据挖挖掘经验验和水平平公司的的数据状状态公司的的预算工具的的性能数据挖掘掘OLAP的应用数据挖掘掘应用
60、基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能CRM中常用的的数据挖挖掘算法法1)关联分分析(associationanalysis)设I=i1, i2,im是项的集集合。设任务相相关的数数据D是数据库库事务的的集合,其中每每个事务务T是项的集集合,使使得TI。每一个个事务有有一个标标识符,称作TID。设A是一个项项集,事事务T包含A当且仅当当AT。项的集合合称为项项集(Itemset)。包含k个项的集集合称为为K-项集。项集的出出现频率率是包含含项集的的事务数数,简称称为项集集的频率率、支持持计数或或计数。关联规则则是形如AB的蕴含式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- (新教材)2026年青岛版八年级上册数学 2.3 尺规作图 课件
- 提升护理安全的策略与方法
- 护理伦理案例分析
- 大丰市小海中学高中化学检测参考答案
- 2025年保险从业资格考试辅导协议
- 基于JVM的代码分析技术
- 2025年AI视觉技术构建无人售货机健康管理场景
- 增强现实触觉反馈
- 2026 年中职康复治疗技术(康复评定量表应用)试题及答案
- 工厂消防知识考试及答案
- 肠易激综合征中西医结合诊疗专家共识(2025)解读课件
- 库存周转率提升计划
- 护理部竞聘副主任
- 《统计学-基于Excel》(第 4 版)课件 贾俊平 第5-9章 概率分布- 时间序列分析和预测
- 中国计量大学《文科数学》2021-2022学年第一学期期末试卷
- 信阳师范大学《伦理学》2021-2022学年第一学期期末试卷
- 中国普通食物营养成分表(修正版)
- 20道长鑫存储设备工程师岗位常见面试问题含HR常问问题考察点及参考回答
- 抖音ip孵化合同范本
- 小升初语文总复习《文章主要内容概括》专项练习题(附答案)
- DL-T606.5-2009火力发电厂能量平衡导则第5部分-水平衡试验
评论
0/150
提交评论