08数据挖掘最终版_第1页
08数据挖掘最终版_第2页
08数据挖掘最终版_第3页
08数据挖掘最终版_第4页
08数据挖掘最终版_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第8章CRM的数据仓库和数据挖掘,客户关系管理,第1 . CRM部分的数据仓库,客户关系管理,8.1.3,8.1.1数据仓库的基本概念,8.1.2,8.1.1数据仓库的基本概念附加到此数据库系统,存储来自企业所有业务数据库的综合数据,并使用这些综合数据向用户提供处理的有用信息的应用系统。” 现有数据库系统的重点和要求是快速、准确、安全、可靠地将数据存储在数据库中。数据仓库的重点和要求是从数据库中准确、安全、可靠地提取数据,通过处理将其转换为常规信息,然后让管理员进行分析。客户关系管理、8.1.2 CRM的数据仓库体系结构、客户关系管理、基本数据仓库模型、斯坦福大学“WHPS”任务组建议的数据仓

2、库基本框架,以及一个数据仓库的基本体系结构需要以下几个基本组件:监视数据源系统集成商数据仓库客户应用程序、客户关系管理、CRM的数据仓库结构、CRM的数据仓库逻辑结构和整个系统。数据源数据仓库系统CRM分析系统,客户关系管理,8.1.2,8.1.3 CRM的数据仓库角色,8.1.1,8.1.3 CRM的数据仓库角色,客户关系管理,(a)客户行为管理不足的数据仓库症状应用程序之间缺乏集成优化的低可用性系统可用性数据可用性低性能监视加强管理功能不响应更改低安全功能没有满足新容量要求的能力,客户关系管理,协作方案,扩展数据跟踪数据和加强CRM自定义客户关系提高系统智能水平数据保持最新,客户关系管理,

3、事故练习问题,数据仓库是什么? 数据仓库的特征是什么?CRM的数据仓库逻辑结构是什么?简述在CRM中构建数据仓库的基本步骤。客户关系管理,第2 CRM部分的数据挖掘,8.2.3,8.2.4,8.2.2,8.2.1数据挖掘的基本定义,客户关系管理,8.2.1数据挖掘的基本定义数据挖掘决定了客户关系管理能否满足现代企业的需要。只有采用数据挖掘技术的客户关系管理才能称为现代的客户关系管理。对企业而言,数据挖掘可以帮助企业掌握业务发展趋势,揭示已知事实,预测未知结果,分析企业完成工作以提高收益、降低成本所需的关键因素,从而使企业处于更有利的竞争位置。客户关系管理,8.2.1.1数据挖掘的业务背景,数据

4、挖掘可以为业务执行以下任务: 1:研究工具(research);流程控制增强功能;流程控制增强功能;流程控制增强功能;流程控制增强功能;流程控制增强功能;流程控制增强功能;流程控制增强功能;流程控制增强功能;流程控制增强功能。作为营销工具(营销);4.客户关系管理作为CRM工具(客户关系管理)。客户关系管理,8.2.1.2数据挖掘的技术背景,1 .数据挖掘的技术组合数据挖掘技术包括三个主要部分:算法和技术。数据建模功能。2.数据挖掘和机器学习机器学习是计算机科学和人工智能AI开发的产物。机器学习分为自组织学习(例如神经网络)两种学习方式。示例概括了规则(例如,决策树)。数据挖掘和统计统计数据也

5、开始支持数据挖掘。统计最初包括预言算法(回归)、取样、基于经验的设计等。4.数据挖掘和决策支持系统集成了数据仓库、OLAP和数据挖掘,从而构成了企业决策分析环境。客户关系管理,8.2.1.3数据挖掘的社会背景,数据挖掘和个人预测:数据挖掘声称可以通过过去的数据分析预测客户的行为,但实际上客户自己可能并不清楚下一步。因此,数据挖掘的结果并不像人们想象的那么神秘。不可能完全正确。客户的行为与社会环境相关联,因此数据挖掘本身也受到社会背景的影响。客户关系管理,8.2.4,8.2.1,8.2.3,8.2.2 CRM数据挖掘的基本应用程序,客户关系管理,8.2.2 CRM数据挖掘的基本应用程序,从分析方

6、法的角度来看,数据挖掘还可以完成6项其他任务分类2。估计3。预测4。相关性分组或关联规则5。群集6。描述和可视化,客户关系管理,8.2.1,8 . 2 . 2 . 2,8.2.4,8.2.3 CRM的数据挖掘过程,客户关系管理,8 . 2 . 4定义业务问题每个CRM应用程序都有一个或多个业务目标,这需要相应的模型。必须根据特殊目标(如提高响应率或提高每个响应的价值)建立完全不同的模型。问题的有效陈述包括评估CRM程序结果的方法。客户关系管理,8.2.3 CRM的数据挖掘流程(续),2 .营销数据库构建阶段2至4是构成数据准备的关键因素。可以在数据准备和模型创建之间重复。在模型中学习新的东西,

7、然后修改数据。生产数据库和公用数据仓库通常没有所需格式的数据,因此需要构建市场营销数据库。在构建市场营销数据库时,必须净化它。所需的数据可以位于不同的数据库中。也就是说,必须将数据合并和合并到单个市场营销数据库中,并调整来自多个数据源的数据在数值上的差异。数据值差异调整不当是质量问题的主要来源。多个数据源之间的主要差异包括管理客户关系,8.2.3 CRM的数据挖掘流程(续),3 .浏览数据在建立良好的预测模型之前,必须了解使用的数据。可以通过收集各种数据描述(如平均值和标准差等搜索统计数据和注意数据分布)开始导航数据。您可能需要设置多个数据的交叉表(透视表)。图形和可视化工具可以帮助您准备数据

8、,但不应过分强调数据分析的重要性。客户关系管理,8.2.3 CRM的数据挖掘流程(续),4 .建模准备数据之前,准备数据的最后一步主要包括四个主要部分:首先,选择构建模型的变量。接下来,从原始数据构建新预测值。然后,要在模型中设置模型,必须从数据中选取子集或示例。最后,必须转换变量以匹配选择用于创建模型的算法。客户关系管理,8.2.3 CRM的数据挖掘流程(续),5 .构建数据挖掘模型构建信息模型最重要的一点是模型构建是一个迭代过程。要研究可选择的模式,找出最能解决你事业问题的一个。在寻找好模型的过程中知道的知识,可以要求修改正在使用的数据,甚至问题说明。大多数CRM应用程序基于称为监视学习的

9、协议。你开始使用客户信息,期待的结果是已知的。客户关系管理,8.2.3 CRM的数据挖掘流程(续),6 .在评价模型评价模型结果的方法中,最有可能产生高评价的指标是准确性。客户关系管理,8.2.3 CRM的数据挖掘流程(续),7 .将数据挖掘应用于CRM方案的数据挖掘实际上构建在应用程序中的方式取决于客户交互的性质。与客户的交互有两种方法:客户直接联系或客户直接联系(inbound)。部署的要求完全不同。在这两种情况下,将模型用作新数据时需要处理的重要问题是用于构建模型的数据转换。如果输入数据包含“年龄”、“收入”和“性别”字段,但是模型所需的年龄-收入比率和性别已更改为辅助变量,则必须转换输

10、入数据。如果要快速展开大量模型,则轻松插入这些转换数据是最重要的效率因素。客户关系管理、8.2.2.3、8.2.1、8.2.4数据挖掘的基本阶段、客户关系管理、8.2.4数据挖掘的基本阶段、8.2.4.1数据挖掘的一般过程、客户关系管理了解问题和数据、收集和准备数据、建立数据挖掘模型、评估构建的模型和应用的模型等一系列任务、管理客户关系、实施8.2.4.3数据挖掘的人员、逐步实施数据挖掘流程,以及在不同阶段需要不同专业知识的人员可分为很多类别。1.业务分析员2。数据分析员3 .域专家4。决策开发人员5。数据管理器、客户关系管理、8.2.4.4实施数据挖掘的主要问题、1、使用数据挖掘解决任何业务

11、问题项目的要求范围通常是所有应用程序系统共有的实施风险。数据挖掘项目由于巨大的投资和巨大的需求相关性,在数据挖掘项目中,这种风险尤为明显。也就是说,必须按照软件工程的方法开发,明确了解要求,才能为项目提供基本保证,盲目数据挖掘难以成功。2、数据挖掘的数据准备实际上对数据挖掘的最终成功和失败、是否经济高效起到了非常重要的作用。数据准备包含从多个数据源集成数据挖掘所需的数据。这意味着确保数据仓库的想法和技术可能需要的数据的综合性、易用性、质量和及时性。另一方面,从现有数据导出所需指标的方法主要取决于数据挖掘的分析经验和工具的易用性。3、数据挖掘的各种分析算法数据挖掘的分析算法主要来自统计分析和人工

12、智能(机器学习、模式识别等)两个方面。还要强调统计分析方法、神经元网络、各种树分析方法、遗传算法等任何算法都是万能的。根据业务问题,应该用不同的方法解决。客户关系管理、第3部分数据挖掘的功能和方法、客户关系管理、8.3.1数据挖掘的功能、8.3.2、8.3.1数据挖掘的功能、客户关系管理、8.3.1数据挖掘的功能通常,数据挖掘任务可以分为说明和预测两类。说明挖掘任务描述了数据库中数据的一般特征。预测挖掘任务通过推断当前数据创建预测。客户关系管理、8.3.2数据挖掘方法、8.3.2.1决策树数据挖掘的决策树方法基于信息论原理,是当前最有效、最广泛使用的方法。决策树是预测模型,可以看作树。每个分支

13、都是分类问题,树叶是特定类别下数据集的子集。客户关系管理,8.3.2.1决策树(手机行业请参见图8 . 3 . 3):(1)在每个分支点不丢失数据(指定父节点的记录数始终等于包含的两个子节点的记录数之和)。(2)终止合同的客户数和未终止合同的客户数始终保持不变。(3)构建模型的过程非常容易理解(与神经网络和标准统计技术相比)。(4)决策树模型有效地发现可能终止合同的客户,并进行以此为目标的营销活动。(5)使用决策树模型,建立对客户的直觉。客户关系管理,8.3.2.1决策树(续),图8.3.3决策树结构图,客户关系管理,8.3.2.1决策树(续),决策树方法在业务研究和预测过程中广泛使用,例如信

14、用卡客户损失预测,以及其他国家货币之间汇率变化的时间序列分析预测。当然,决策树也有很多不适用的领域,其中有很多简单的问题,通过线性回归分析更有效。决策树更适合建立的模型和分析过程主要包括:1、业务开发2、数据预处理3、预测、客户关系管理、8.3.2。2在粗糙集概念中,第一个是Z.Pawlak在1982年提出的复杂的实际问题。在最早的医学和工业知识库中使用。近年来研究发展得很快,领域很广。理论的起点:根据给定问题的当前知识,划分问题的论着,决定对分裂各个组成部分的哪些概念的支持程度。基本思路:将数据库中的属性分为条件和结论属性,对数据库中的元组,将各个属性根据不同属性值分成相应的子集,然后生成条件属性分割子集和结论属性分割子集之间父子近似关系的决策规则。客户关系管理,8.3.2.3遗传算法,1 .遗传算法的起源1975年,美国密歇根大学的约翰霍兰德在他的着作自然界和人工系统中的适应性中首次提出了在计算机上模拟自然界进化过程的一些观点。还有一些学者进行了这方面的研

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论