客户关系管理第6章ppt课件_第1页
客户关系管理第6章ppt课件_第2页
客户关系管理第6章ppt课件_第3页
客户关系管理第6章ppt课件_第4页
客户关系管理第6章ppt课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第6章 CRM中的数据管理 数据仓库data warehouse与数据发掘 data mining.6.1 数据仓库的根本原理数据仓库的兴起1.“数据太多,信息缺乏的现状2. 异构环境的数据源 据美国杂志所列的全球2000家大公司中已有90%将Internet网络和数据仓库这两项技术列入企业方案。 数据仓库是1995年开场盛行起来的。.6.1.1 数据仓库的概念 1W.H.Inmon在一书中,对数据仓库的定义为: 数据仓库是面向主题的、集成的、稳定的,不同时间的数据集合,用于支持运营管理中决策制定过程。.2SAS软件研讨所定义: 数据仓库是一种管理技术,旨在经过通畅、合理、全面的信息管理,到

2、达有效的决策支持。. 传统数据库用于事务处置,也叫操作型处置,是指对数据库联机进展日常操作,即对一个或一组记录的查询和修正,主要为企业特定的运用效力的。用户关怀的是呼应时间,数据的平安性和完好性。 数据仓库用于决策支持,也称分析型处置,用于决策分析,它是建立决策支持系统DSS的根底。.操作型数据DB数据与分析型数据DW数据之间的差别为:.数据仓库特点1数据仓库是面向主题的 主题是数据归类的规范,每一个主题根本对应一个宏观的分析领域。 例如,银行的数据仓库的主题:客户 DW的客户数据来源: 从银行储蓄DB、信誉卡DB、贷款DB等三个DB中抽取同一客户的数据整理而成。 在DW中分析客户数据,可决议

3、能否继续给予贷款。.传统的数据库是面向运用而进展数据组织的,其笼统程度不够高,没有完全实现数据与运用的分别。但这种方式能较好地将企业业务活动与数据库方式相对应,利于从手工处置向计算机处置过渡,因此具有较好的可操作性;数据仓库是面向主题而进展数据组织的。主题是一个在较高层次上对数据的笼统,在逻辑意义上,它是对企业中某一宏观领域所涉及的分析对象,即将数据组织成主题域。.面向主题汽车人寿安康不测伤亡操作性环境应 用顾客保险单保险费索赔数据仓库主 题.2数据仓库是集成的 数据进入数据仓库之前,必需经过加工与集成。 对不同的数据来源进展一致数据构造和编码。一致原始数据中的一切矛盾之处,如字段的同名异义,

4、异名同义,单位不一致,字长不一致等。 将原始数据构造做一个从面向运用到面向主题的大转变。. 数据库 运用A m,f运用B 1,0运用C x,y运用D 男,女 数据仓库 m,f编码运用A 管道cm运用B 管道inches运用C 管道mcf运用D 管道yds管道cm属性度量.运用A 描画运用B 描画运用C 描画运用D 描画运用A char(10)运用B dec fixed(9,2)运用C pic 9999999运用D char(12)多重信息源 ?描画char(12)冲突的键码集成.3数据仓库是稳定/非易失的操作型数据库中的数据通常实时更新,数据根据需求及时发生变化。数据仓库的数据主要供企业决策分

5、析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,普通情况下将被长期保管,也就是数据仓库中普通有大量的查询操作,但修正和删除操作很少,通常只需求定期的加载、刷新。.非易失性插入删除插入修正删除访问修正访问数据的逐个记录方式处置数据的批量载入/访问数据库数据仓库.4数据仓库是反映时间变化的 操作型数据库主要关怀当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开场运用数据仓库的时点)到目前的各个阶段的信息,经过这些信息,可以对企业的开展历程和未来趋势做出定量分析和预测。 数据仓库中的数据时间期限要远远长于操作型系统中的数据时间期限。

6、操作型系统的时间期限普通是6 09 0天,而数据仓库中数据的时间期限通常是51 0年。.操作型数据库含有“当前值的数据,这些数据的准确性在访问时是有效的,同样当前值的数据能被更新。而数据仓库中的数据仅仅是一系列某一时辰生成的复杂的快照。操作型数据的键码构造能够包含也能够不包含时间元素,如年、月、日等。而数据仓库的键码构造总是包含某时间元素。数据仓库的数据码键都包含时间项,用作标明数据的历史时期。数据仓库中的数据包含有大量综合数据,很多与时间有关,如按时间段进展综合或隔时间片进展抽样。随着时间变化,数据仓库需求不断添加新数据、删去旧数据。.数据库数据仓库时间期限:当前到6090天 记录更新键码构

7、造能够包括也能够不 包括时间元素时间期限:510年 数据的复杂快照键码构造包括时间元素. 5DW中数据量大。 大型DW是一个TB1000GB级数据库问题普通为10GB级相当于普通数据库100MB的100倍 需求一个宏大的硬件平台 需求一个并行的数据库系统 最好的数据仓库是大的和昂贵的。. 6是信息的概括和聚集。 .操作性数据仓库 J Jones女1945年7月20日。J Jones去年有两张罚单一次大事故。 J JonesMain大街123号已婚。 J Jones两个孩子高血压。人寿保险汽车保险房产保险安康保险J Jones女1945年7月20日出生去年两张罚单一次大事故已婚两个孩子高血压。顾

8、客.6.1.2 数据仓库中的数据组织1 数据的粒度2 数据仓库的数据组织构造3 数据的分割4 数据仓库的数据组织方式5 数据仓库的数据组织方式6 数据的追加.1 粒度粒度是指数据仓库的数据单位中保管数据的细化或总合程度的级别。细化程度越高,粒度级就越小;细化程度越低,粒度级就越大。粒度细节的级别粒度的划分决议了数据仓库中数据量的大小和查询的详细程度。多重粒度.粒度的一个例子高细化低细化每月200个记录每月40,000个字节每月一个记录每月200个字节经过检索可以回答无细节无法回答讯问某一的细节. 近期根本数据:是最近时期的业务数据,是数据仓库用户最感兴趣的部分,数据量大。 历史根本数据:近期根

9、本数据随时间的推移,由数据仓库的时间控制机制转为历史根本数据。 轻度综合数据:是从近期根本数据中提取出的,这层数据是按时间段选取,或者按数据属性attributes和内容contents进展综合。 高度综合数据层:这一层的数据是在轻度综合数据根底上的再一次综合,是一种准决策数据。2 数据仓库的数据组织构造.2 数据仓库的数据组织构造元数据高度综合级轻度综合级(数据集市)销售细节级2000-2001操作型转换早期细节级每月销售1994-2001每周销售1994-2001当前细节级销售细节级1994-1999.3 分割分割将当前细节数据分散到各自的物理单元中去以便能分别独立处置,以提高数据处置效率

10、。分片数据分割后的独立单元。数据的分割 提高了数据管理的灵敏性重构、索引、重组、恢复、监控分割的规范:日期、地域、业务领域。.分割的一个例子分片9分片8分片72001分片6分片5分片42000分片3分片2分片11999事故保险生命保险安康保险.4 数据仓库的数据组织方式简单堆积数据轮转综合数据简化直接数据延续数据.简单堆积文件 1月1日 1月2日 1月3日 2月1日 2月2日 2月3日 3月1日 3月2日 3月3日 .轮转综合文件 星期一 星期二 星期天 第一周 第二周 第五周 一月 二月 十二月 .简化直接文件数据库快照姓名 顾客号 地址张平 C960100 北京王珂 C960101 上海刘辉 C960102 天津李强 C960103 成都 . . . 一月份顾客表操作性数据生成简化直接文件.延续文件姓名 顾客号 地址张平 C020210 北京王珂 C020211 上海张顺 C020212 天津李强 C020213 成都姓名 顾客号 地址张平 C020210 北京王珂 C020211 上海张顺 C0202

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论