利用ClementineC5.0模型预测CDMA客户流失_第1页
利用ClementineC5.0模型预测CDMA客户流失_第2页
利用ClementineC5.0模型预测CDMA客户流失_第3页
利用ClementineC5.0模型预测CDMA客户流失_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、利用ClementineC5.0模型预测CDM序户流失1 概述以中国电信云南某公司的项目支撑为基础,从统计数据来看,维持5%的老用户增长,给电信公司带来的利润将远远超过85%,而要想把一位非电信用户发展成客户,其成本将比保留一位老客户的成本高得多,统计数据表明成本是4倍左右,此时,客户对电信的忠实程序也将发生强烈的变化,由此给企业造成的损失将大大增加。从项目的实施情况来看,为了保证成功向客户推销运营商的产品,多数人都只愿意向老客户推销。因为由此付出的代价比用户要小得多,成功率也要高得多。通过这些数据我们可以看到防范老客户的流失相比发展新用户来说就显得尤为重要了,这也是普遍企业最为关注的问题之一

2、。2 研究现状及C5.0模型特点在我们国内,很多运营商为了应对市场的竞争,多数都己经建立了“电信经营分析系统”,这在一定程序上为深层次的数据分析提供了良好的数据处理分析平台。而目前国内在数据利用上确远远不及国外的层次深,国内的数据应用主要集中在固定报表处理、查询分析和个人的主观探索,在更高领域的应用如数据挖掘还不太成熟,更谈不上深层次的应用。而这些在国外,很多知名的电信运营商却已经能够很好地利用数据挖掘技术,以便通过建立客户流失的模型,提升利润空间及对一些流失概率比较高这样做的目的可能有效地控制入网用户的流失。Clementine作为一个数据挖掘软件,给运营商创造了很好的数据处理应用平台,在此

3、平台下,运营商可以有效地使用一些商业技术准确、快捷地建立预测的模型,而后把由此模型生成的数据使用在推销应用领域。参照行业执行标准CRISP-DM莫型,我们可以有效地改进决策过程,这不仅可以数据到更优商业成果的数据挖掘。而且还可以这样可以分析出哪些属性是影响客户流失的重要因素。现在比较流行的流程包括决策树、神经网络、逻辑回归、聚类关联性分析等。本文选择的是C5.0模型节点来进行电信的客户流失预测。该模型的工作原理是根据在每个级别提供最大信息收获的字段分割样本,目标字段必须为分类字段,允许进行多次多于两个子组的分割。它通常会根据不同的字段再次分割由第一次分割定义的每个子样本,且此过程会重复下去直到

4、无法继续分割子样本。C5.0可以生成两种模型:1)决策树是对由算法建立的分割的简单描述,每个终端(或“叶”)节点可描述训练数据的特定子集,而训练数据中的每个观测值都完全属于树中的某个终端节点。2)规则集则是尝试对单个记录进行预测的一组规则,规则集源自决策树,并且在某种程度上表示在决策树中建立的经简化或提取的信息版本。对于所存在的问题,例如缺失数据和大量输入字段,C5.0模型十分稳健,通常不需要花费很长的训练时间用于估计。同时C5.0模型与其他模型类型相比更容易理解,解释起来更简明易懂。3 建构并应用C5.0模型C5.0有两种模式提供选择:1.简单模式:将试图生成尽可能精确的树,但有时可能会导致

5、过度拟合,从而在将此模型应用于新数据时导致性能偏低。2.专家模式有以下几点:a.修剪严重性:确定对生成的决策树或规则集的修剪程度,增加该值可获得一个更简洁的小型树,减小该值可获得一个更精确的树。b.每个子分支的最小记录数:可使用子组的大小限制树的任何分支中的分割数,增加该值有助于防止使用噪声数据进行过度训练。c.使用全局修剪:分两个阶段修剪树,第一个阶段是本地修剪,此时将检查子树并折叠分支以提高模型的准确性。第二个阶段是全局修剪,在此阶段中将把树视作一个整体并折叠虚弱的子树。d.辨别属性:此项将在开始构建模型之前检查预测变量的有效性,如果发现不相关的预测变量,系统会自动把它从模型构建过程中排除

6、。这个选项对于那些具有很多预测变量字段的模型非常有效,而且还可以有效地防止数据过于拟合。单击对话框下面的“执行”按钮后,这样会在右面的窗口中生成的C5.0的模型,打开此模型,我们可看到统计后的数据及此模型的准确度和时间等信息,另外我们还可以在该模型中导出PMM或者SQL等。如果模型的准确度已经达到我们的要求,接下来将生成的模型导入到业务支撑系统中,根据需要在导出模板中选择数据库,输入服务器地址及数据库名称。模型选项和导入SQL数据库如图3-图4所示。4 数据分析和总结经过上面的操作,再对其进行分析整理后,可以看出CDMA客户流失的一些特征,如在使用彩铃的客户群中,有24%的流失率,远远超过不使用彩铃的用户,而在这些客户群中,使用彩铃并且在网时长大于25的客户,其流失率更高,达46%以上。这是要重点关注的用户群。分析结果如图5所示。而在FEEALLa一项中,高端客户的流失率较低,CDM毓失最严重的客户群在月消费为10至40的客户,流失率在22%以上,这也是占比最多的一部分。如果CDMA1户捆绑有其他业务,如我的e家等,则流失率较低。而在网时长这一项中,在网时长小于15的客户是流失率较小。由本研究不难看出,目前电信的客户流失率是一个非常值得关注的问题,对运营商造成影响是非常大的,因此电信运营商应该特别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论