浅析决策树的数据挖掘在电信CRM中的应用_第1页
浅析决策树的数据挖掘在电信CRM中的应用_第2页
浅析决策树的数据挖掘在电信CRM中的应用_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、浅析决策树的数据挖掘在电信CRM中的应用 浅析决策树的数据挖掘在电信CRM中的应用 摘 要:电信CRM中一直存在着“数据丰富但是知识缺乏的现象,现有的数据分析技术完全没有跟上时代开展的潮流,更无法适应日益复杂的数据分析的需要,因此,如何挖掘决策树的数据挖掘在电信CRM中的应用就显得尤为重要。决策树的数据挖掘,能实现在CRM中根据客户的年龄、所在的城市、性别等因素对客户进行分别归类,该技术一旦实行,就能更大程度地防止客户的流失,也能争取新的电信用户。 关键词:决策树;数据挖掘;CRM 中图分类号:TP311.13 文献标识码:A 文章编号:1674-7712 20-0000-02 随着时代的进步

2、,社会主义的蓬勃开展,我国的市场经济体制已经逐步形成了,国内的电信行业的市场环境已经开展得越来越合理了,但是,还应该看到的是,开展是一把双刃剑,国内的电信市场竞争也因此变得越来越剧烈了,而更重要的是,随着世界经济的全球化进程以及市场的国际化,我国还参加了世界贸易组织。这就在一定程度上要求我国的电信企业在经营管理等各个方面能够和国际接轨,赶超国际水平,在国际化竞争中脱颖而出,才能实现我国的更有力的进步,向着强国富国的中国梦前进。众所周知的是,我国传统的电信企业在以前都仅仅是以产品为核心,与此同时尽量控制本钱的运营模式的,而在经营模式方面,也只是以销售地点、柜台式效劳以及产品和价格为主要着力点,在

3、当今的时代要求下,我国的电信企业必须要向着以客户和市场为中心的转变,更要在客户的消费心理和价值取向方面做一番功夫的研究才能在世界市场的竞争中立于不败之地。而本文要说的决策树的数据挖掘在电信企业中的有效应用。 一、在电信CRM中使用数据挖掘的重要意义 众所周知的是,随着社会主义的开展,人民生活水平的提高,电信业务也迅猛地增长,而在激增的数据背后,却隐藏着越来越重要的数据信息,最后随着数据的累积,乃至出现了“数据丰富知识贫乏的现象,也就是说,数据分析技术的开展,跟不上数据分析复杂度的需要。经过几代人的努力,决策树的数据挖掘技术就在此时应运而生。数据挖掘技术和传统的数据分析有着很大的区别。首先,数据

4、挖掘技术在挖掘信息之前没有任何假设的环节,在这样的情况下所发现的知识和信息,具有有效性、实用性以及事先未知性的特点。因此理所当然地,在CRM中应用数据挖掘技术可以为客户数据分析提供更有效的决策支持。 另一方面,还应指出的是,现存的数据仓库的数据存储结构其实更适合于做数据的挖掘,甚至可以做比数据挖掘提供的数据更加细的数据,还可以对事务的、文本的、空间的甚至是多媒体的数据进行分析。 二、决策树挖掘模型的建立 数据的准备、模型的建立、模型验证以及模型评价是数据挖掘一般情况下的步骤。首先,数据准备就包括对数据进行取样、特征探索、分析以及预处理。其次,可以看出的是,建立模型是一个反复不断的过程,所挖掘的

5、类型和模型的类型应该是一样的。另外,决策树、神经网络、时间序列分析以及数理统计分析等方面都可以成为模型类型。最后,模型的验证以及评价那么是主要通过对结果和模式或者模型的分析和验证来到达评价模型是否对决策支持信息有价值的目的。不然的话就要建立新的模型。一旦建立了模型并且也通过了验证,那么在实施模型上可以使用两种方法:第一,把该模型提供应分析或者业务人员做参考,并尽量进行全程的观察和分析然后对该模型提出行动方案或者建议;第二,把该模型运用到不同的数据集上。 本文主要是对电信的CRM数据里不同种类的客户进行一个简单的分类,并且对客户的类型进行一个简单的预测。而以下那么是主要对“客户流失的类型进行一个

6、简单的分析,从而到达对建立决策树挖掘模型的过程进行一个简单的论述。 分析决策树应用 在电信的CRM数据中,主要是以客户的年龄、所在的城市以及性别为依据对客户进行简单的分类,而在该分类的根底上对客户的类型进行预测,进而可以争取更多的新用户,与此同时还要过滤掉一大批已经没有什么开展潜力的用户,要到达这样的一个目的,可以说,决策树是比拟直观易懂的,在设计分类模型的时候,可以运用决策树的算法来进行,与此同时还需要做的工作就是要提取该分类中隐藏的规那么,在这种情况下,就能对客户类型进行预测。因此,显而易见的是,客户类型就是决策树要挖掘的目标。 选择决策树的构造算法 决策树构造的最原始的算法应该是ID3算

7、法,这种算法仅仅能处理内存里面的数据,有着很弱的可伸缩性,而值得庆幸的是,当下的决策树的构造算法有好多种,并且也不再是仅仅能在内存中处理,还能处理内存以外的数据,包括处理离散和连续的属性值,不仅如此,这些算法的处理速度也实现了大大的提高,因此,这些构造算法具有很强的实用性。而SLIQ算法和SPRINT算法就是其中的两种。 决策树的工作过程 一般情况下,决策树的工作过程是:在构造决策树的时候,使用一个带有类标记的训练数据集,接着还使用另外的一个测试数据集来检验所生成的决策树是否正确,如果该决策树具有足够高的正确性的话,就可以使用该决策树去预测未知类型的数据类型。需要指出的是,一般情况下某个属性的

8、一次检测是用一个内部节点来作为代表的。在这样的根底下,在输入新的被决策的记录的时候,就可以对该记录隶属于哪个类进行预测。以下是一个由训练样本归纳判断树的根本算法的描述。 算法:用给定的训练数据产生一棵判定树。 三、在电信客户信息决策实现决策应用 通常情况下,客户行为分析可以保存客户输入的年龄、性别以及所属的城市,因此就可以是使用这些信息作为基于决策树的数据挖掘的输入属性,并且根据用户所使用业务的多少,把客户分成三种客户类型:成熟客户、一般客户以及非客户。所以,就能寄期望于从中掌握客户的年龄、性别以及所属的城市和客户类型之间形成的一个隐藏的内在函数关系,最后,就能把输入属性设置为年龄、性别和所在

9、的城市,最终实现预测客户的类型。值得注意的是,在输入的属性设置为年龄、性别和所属的城市的时候,要实施有效的策略进行防止决策树的过度增长。比方当叶子节点的样本数量大于一定的阀值之后,就要对该叶子结点实行停止分裂,并且用多数表决的方法对该叶子进行类标记。 四、结语 在电信CRM中运用基于决策树的数据挖掘的数据分析技术对客户类型进行挖掘,与此同时到达对客户类型进行预测的目的,是具有十分重要的实用价值的,不仅可以为运营公司在制定个性化的效劳以及新业务的时候提供一个十分有价值的决策性参考,还可以通过预测用户类型来实现吸引新客户,保持老客户的目的。因此,这对提高整个电信运营企业的市场竞争力具有十分重要的意义和深远影响。另外,还需要指出的是,当今的决策树的数据挖掘数据分析技术其实还有许多需要完善的地方,通过当今高科技技术人员的不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论