crm与数据仓库.ppt_第1页
crm与数据仓库.ppt_第2页
crm与数据仓库.ppt_第3页
crm与数据仓库.ppt_第4页
crm与数据仓库.ppt_第5页
已阅读5页,还剩196页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,第5章客户关系管理和数据仓库,官方博客:QQ:1318241189QQ Group: 175569632,第5章客户关系管理和数据仓库,5.1数据仓库概述5.1.1数据仓库生成5.1.2数据仓库概念和功能5.1.3数据仓库内容5.1.3数据仓库系统架构5.2客户关系管理中的数据仓库5.2.1客户关系管理需要数据仓库5.2.2数据仓库在客户关系管理中的作用5.2.3客户关系管理数据仓库的系统结构5.3客户关系管理数据仓库的实施5.4客户关系管理数据仓库测试5.4.1客户关系管理QQ群:175569632,5.1数据仓库概述,数据仓库和客户关系管理有着密不可分的关系,很多客户关系管理工作都是基于

2、数据仓库的。从某种意义上说,数据仓库是客户关系管理的灵魂。通过使用数据仓库,企业可以分析和预测客户行为,从而制定准确的市场策略,发现关键客户,评估市场表现,并通过销售和服务部门与客户沟通,提高企业利润。对于客户数量大、市场战略影响大的企业,客户关系管理系统必须包含数据仓库。5.1.1数据仓库的出现,早期的数据库主要支持在线交易处理和决策支持,用于数据分析。传统的数据库系统不适合决策支持系统的事务处理和分析处理。不同的数据集成问题、数据动态集成问题、历史数据问题、数据集成问题、复杂操作问题,(1)事务处理和分析处理的性能特征不同。所有在线事务处理都强调数据更新处理的性能和系统的可靠性,而不关心数

3、据查询的便捷性。在事务处理环境中,用户行为的特点是数据访问操作频率高,处理时间短。在分析和处理环境中,用户的行为模式完全不同,这就强调了数据处理和分析的能力。基于传统数据库系统的决策支持系统应用可能会持续几个小时,消耗大量系统资源。在线分析和事务处理对系统有不同的要求,对于同一个数据库,理论上很难做到两者兼顾。在同一环境中运行两个处理性能如此不同的应用程序显然是不合适的。(2)数据集成。决策支持系统需要综合数据。全面和正确的数据是有效分析和决策的首要前提。收集的相关数据越完整,结果就越可靠。目前,大多数企业数据的真实情况是分散的,而不是集成的。造成这种分散的原因有很多,包括事务处理应用程序的分

4、散、“蜘蛛网”问题、数据不一致、外部数据和非结构化数据。(3)数据动态集成。静态集成的最大缺点是,如果数据源中的数据在数据集成后发生变化,这些变化将不会反映给决策者,导致决策者使用过时的数据。集成的数据必须在某个时间段(例如24小时)内刷新,这称为动态集成。显然,事务处理系统不具备动态集成的能力。(4)历史数据。事务处理通常只需要当前数据,短期数据通常存储在数据库中。不同数据的保留期不同。即使一些历史数据被保存下来,它们也被束之高阁,没有得到充分利用。但是对于决策分析来说,历史数据非常重要,许多分析方法必须依赖于大量的历史数据。没有详细的历史数据分析,就很难把握企业的发展趋势。决策支持系统对数

5、据在空间和时间上都有较高的要求,但事务处理环境不能满足这些要求。(5)数据综合。交易处理系统中积累了大量的详细数据,决策支持系统一般不进行分析。在分析之前,通常需要不同程度地综合详细的数据。然而,交易处理系统不具备这种综合能力。根据标准化理论,这种综合能力往往是有限的,因为它是一种数据冗余。(6)简化操作的问题。业务数据模式是为交易处理系统设计的,数据的格式和描述不适合非计算机专业人员分析和统计业务。有人感叹:20年前,我们找不到数据是因为数据太少,但今天,我们找不到数据是因为数据太多。为了提高分析和决策的效率和效力,分析处理及其数据必须与业务处理及其数据分开。必须从事务处理环境中提取分析数据

6、,根据决策支持系统处理的需要进行重组,并建立单独的分析处理环境。数据仓库是一种数据存储和组织技术,用于构建这种新的分析处理环境。数据仓库的数据来源于在线交易处理系统、异构外部数据源和离线历史业务数据。这是一个在线系统,专门用于分析统计和决策支持应用。它可以满足决策支持和在线分析应用的所有要求。5.1.2数据仓库的概念和特征。目前,数据仓库这个术语还没有统一的定义。著名的数据仓库专家英蒙在他的构建数据仓库一书中描述了以下内容:数据仓库是一个面向主题的、集成的、非易失的和时变的数据集,用于支持管理决策。数据仓库概念的两个层次:数据仓库用于支持决策和面向分析的数据处理,不同于现有的企业运营数据库;内

7、容和特点:数据仓库是多个异构数据源的有效集成。集成后,它会根据主题进行重组,并包含历史数据,存储在数据仓库中的数据通常不会被修改。数据仓库的四个特点面向主题、传统数据库面向应用和数据组织,其抽象程度不够高,并且没有完全实现数据和应用的分离。但是,这种方法能够更好地将企业的业务活动与数据库模式相匹配,有利于从手工处理过渡到计算机处理,因此具有更好的可操作性;数据仓库是面向主题的数据组织。主题是更高层次的数据抽象。从逻辑上来说,它是一个涉及到企业宏观领域的分析对象,即把数据组织成主题领域。例如,在银行业务中,业务(存款、贷款、汇兑)、货币、客户、机构和会计是主要的框架或方向。因此,在银行数据仓库中

8、,选择了五个主题,即业务、货币、客户、机构和会计,会计被视为连接其他四个主题的交易主题。面向主题可以独立于数据处理逻辑,适用于分析数据环境和构建企业全局数据库;目前,关系数据库技术仍在数据仓库中使用,在对其进行更高程度的抽象时,应强调其逻辑意义。数据仓库集成的和面向事务的操作数据库的四个特征通常与一些特定的应用程序相关,并且这些数据库是独立的并且通常是异构的。在数据仓库的所有特征中,这是最重要的。多年来,对于应用程序问题的设计者做出的不同设计决策,有许多不同的表示方法,没有一个应用程序在编码、命名习惯、实际属性、属性度量等方面是一致的。每个应用程序问题设计者都可以自由地做出自己的设计决策。数据

9、仓库中的数据是集成的。但是,数据仓库中的数据是在提取和清理原始分散的数据库数据的基础上,通过系统的处理、汇总和整理得到的,因此必须消除源数据中的不一致性,以确保数据仓库中的信息是关于整个企业的一致的全局信息。在数据仓库的建设中,这是最关键、最复杂的一步。主要任务如下:一是进行数据综合和计算;第二,统一源数据中的所有不一致和矛盾(如同义词、同义词、字长、单位等)。)。数据仓库的四个特点相对稳定,操作数据库中的数据通常是实时更新的,数据根据需要及时变化。数据仓库中的数据主要用于企业决策分析,涉及的数据操作主要是数据查询。某个数据一旦进入数据仓库,一般会保存很长时间,即数据仓库中有大量的查询操作,但

10、修改和删除操作很少,通常只需要定期加载和刷新。数据仓库的四个特征相对稳定和数据仓库的四个特征反映了历史的变化。操作型数据库主要关心一定时期内的数据,而数据仓库中的数据通常包含历史信息。系统记录了从过去某个时间点(如数据仓库启动的时间)到现在每个阶段的信息。通过这些信息,可以定量分析和预测企业的发展历史和未来趋势。数据仓库中的数据时限比操作系统中的长得多。操作系统的时限一般为6 09 0天,而数据仓库中数据的时限通常为51 0年。操作数据库包含“当前值”数据,这些数据的准确性在访问时是有效的,并且当前值数据可以更新。然而,数据仓库中的数据只是在某个时刻生成的一系列复杂的快照。运营数据的关键代码结

11、构可能包含也可能不包含时间元素,如年、月和日。数据仓库的关键代码结构总是包含一定的时间元素。数据仓库的数据键包含时间项,用来表示数据的历史周期。数据仓库中的数据包包含大量的综合数据,其中许多与时间有关,如按时间段合成或间隔采样。随着时间的变化,数据仓库需要不断添加新数据和删除旧数据。数据仓库的四个特征反映历史的变化和数据仓库的本质,数据仓库实际上是一个基于大规模数据管理信息系统的应用系统,附属于这个数据库系统,它存储从企业的所有业务数据库中获得的综合数据,并能利用这些综合数据经过处理后为用户提供有用的信息。如果说传统数据库系统的重点和要求是将数据快速、准确、安全、可靠地存储到数据库中,那么数据

12、仓库的重点和要求就是准确、安全、可靠地从数据库中提取数据,这些数据在被管理者用于分析之前可以被处理并转换成常规信息。数据仓库要研究和解决的问题是从数据库中获取信息。5.1.3数据仓库的内容,数据仓库没有严格的数学理论基础,也没有成熟的基本模型,更倾向于工程化,具有很强的工程性。因此,在技术上,人们习惯于从工作过程的角度进行分析,并根据其关键技术部分,将其分为三个基本方面:数据提取、存储和管理以及数据表示。数据抽取,数据抽取是数据进入仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将在线交易处理、外部数据源和离线数据存储介质中的数据导入数据仓库。数据提取主要涉及互连、复制、增量、

13、转换、调度和监控。数据仓库中的数据不需要与在线事务处理保持实时同步,因此数据抽取可以有规律地进行,但执行时间、相互顺序以及多次抽取操作的成败对数据仓库中信息的有效性至关重要。数据仓库的真正关键是数据的存储和管理。数据仓库的组织和管理方式决定了它不同于传统的数据库,也决定了它对外来数据的表现形式。为了决定用什么产品和技术来构建数据仓库的核心,我们需要分析数据仓库的技术特征。事实上,数据表示相当于数据仓库的门面,其性能主要集中在多维分析、数理统计和数据挖掘上。多维分析是数据仓库的一种重要形式。近年来,由于互联网的发展,多维分析领域的工具和产品更加注重提供基于网络的在线分析界面,而不仅仅是在互联网上

14、发布数据。5.1.4数据仓库系统架构、数据源和数据源是数据仓库系统的基础,也是整个系统的数据源。它通常包括企业的内部信息和外部信息。内部信息包括各种业务处理数据和各种文档数据。外部信息包括各种法律法规、市场信息和竞争对手信息等。数据存储和管理是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织和管理方式决定了它不同于传统的数据库,也决定了它对外来数据的表现形式。为了决定用什么产品和技术来构建数据仓库的核心,我们需要分析数据仓库的技术特征。根据主题对现有业务系统的数据进行提取、清理、有效集成和组织。根据数据覆盖范围,数据仓库可以分为企业级数据仓库和部门级数据仓库(通常称

15、为数据集市)。OLAP服务器、OLAP服务器有效地整合了分析所需的数据,并按照多维模型进行组织,从而进行多角度、多层次的分析,发现趋势。其实现可分为ROLAP、MOLAP和HOLAP。ROLAP基础数据和聚合数据存储在RDBMS中。MOLAP基础数据和聚合数据存储在多维数据库中。基础数据存储在关系数据库管理系统中,聚合数据存储在多维数据库中。前端工具主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及基于数据仓库或数据集市的各种应用开发工具。其中,数据分析工具主要针对OLAP服务器,报告工具和数据挖掘工具主要针对数据仓库。数据仓库概述和概述,5.1.1数据仓库的产生,5.1.2数据仓

16、库的概念和特点,5.1.3数据仓库的内容,5.1.4数据仓库系统的体系结构,数据仓库的项目实施,数据仓库系统是一个解决问题的过程,而不是一个可以买到的现成产品。不同的企业会有不同的数据仓库。企业人员通常不知道如何建立和利用数据仓库并发挥其决策支持的作用,而数据仓库公司人员不知道业务、建立哪些决策主题以及从数据源中提取哪些数据。这就要求双方相互沟通,共同协商开发数据仓库,所以这是一个不断往复的过程。数据仓库的建设是一个系统工程,是一个不断建立、发展和完善的过程,通常需要很长时间。这就要求企业对整个系统的建设提出一个全面清晰的长期规划和技术实施蓝图,将整个项目的实施分为几个阶段,并以“统筹规划、分

17、步实施、分步见效”为原则,既能快速从当前的投资中获得收益,又能在现有系统和其他现有业务系统的基础上逐步构建一个完整、健壮的数据仓库系统。数据仓库为有效访问和管理大量数据提供了理想的环境,数据仓库系统的建立是一个以数据为驱动、以技术为支撑、满足应用需求的成长和完善的发展过程。因此,数据仓库的建立可以从数据、技术和应用三个方面进行。数据仓库、项目计划、项目计划的项目实施是指定义创建数据仓库的项目目标和确定项目范围,包括评估项目计划和调整过程。在数据仓库建设之初,其主题应该是明确的。主题是在更高层次对数据进行分类的标准。每个主题对应一个宏观分析领域,可以根据具体决策需求细分为多个主题表,具体确定决策范围和需要解决的问题。然而,主题的确定必须基于现有的在线事务处理(OLTP)系统,否则,根据该主题设计的数据仓库存储结构将成为一个空壳,缺乏可存储的数据。然而,关注OLTP数据信息会导致数据提取方向的迷失和主题的偏离。有必要在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论