埃森哲数据挖掘模型DM的分类及说明.ppt_第1页
埃森哲数据挖掘模型DM的分类及说明.ppt_第2页
埃森哲数据挖掘模型DM的分类及说明.ppt_第3页
埃森哲数据挖掘模型DM的分类及说明.ppt_第4页
埃森哲数据挖掘模型DM的分类及说明.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、0,子目录,模型的分类与适用范围 模型的评价标准与方法 案例,1,预测性模型,描述性模型,数据挖掘,我们的客户是什么样子的?他们需要什么?,如何选取最好的针对性客户交互方式,以保证利润最大化?,揭示蕴含于历史数据中的规律 无指导的学习,数据挖掘模型按照功能划分主要分为描述性模型和预测性模型两类,无指导性分群,关联规则(购物篮),逻辑回归,线性回归,非线性回归,决策树,神经网络,对未来事件的预测 有指导的学习,指导性分群,技术相关:,技术相关:,2,电信行业中最常用的两种数据挖掘模型是客户分群和预测模型,客户分群模型 指导性分群 无指导分群,预测模型模型 回归 决策树 神经元,3,电信业数据挖掘

2、模型主要适用范围,4,无指导性分群定义,群1,群2,群4,群3,无指导性分群是将客户划分到具有相同行为、价值和社会属性等的不同组别的分析性工具,5,指导性分群定义,群1,群2,群4,群3,指导性分群是在一定的目标变量(或称指导性变量)将客户划分到具有相同行为、价值和社会属性等的不同组别的分析性工具,6,指导性分群和无指导分群的主要区别问题,您会怎样将这三个客户进行客户分群呢?,7,指导性分群1,目标变量(分群指导变量):是否订阅了纽约客杂志,群1:纽约,群2:台北,1,2,A,C,B,编码,8,指导性分群2,1,2,A,B,C,编码,目标变量(分群指导变量):是否订阅了化妆师杂志,群1:女性,

3、群2:男性,9,无指导性分群,群1: ?,群 2: ?,B,C,A,编码,10,客户分群常见维度,确定分群维度,人口统计,最常见的战略分群维度,11,行为和价值是最能反映客户态度和需求的两个维度,客户,关系,需求/态度,行为,$价值$,满意,品牌体验,品牌效应,品牌依附度,基于产品种类 的参与,态度决定行为 行为决定价值 关系体验决定满意度 交易关系、客户待遇及产品满意度决定态度,客户态度驱动了客户价值,12,预测模型定义,预测模型是通过对过去数据学习来判断未来某种行为或计量的数学模型,模型目标可以是逻辑型或连续性变量,模型可以简单的用数学公式Y=F(X)来描述预测模型(X是n元向量)。每个客

4、户都将通过模型计算获得一个预测值作为业务决策依据之一。 电信行业中最为广泛使用的预测模型通常是二元逻辑变量预测模型,如客户离网挽留模型、营销活动相应模型等,Y=F(X),13,模型应用,8月,7月,6月,5月,4月,3月,基于离网模型,应用3-6月份客户数据预测9月离网客户,挽留行动,预测模型的建立方法,14,子目录,模型的分类与适用范围 模型的评价标准与方法 案例,15,分群模型评估标准,互斥性和穷尽性原则 (Mutually exclusive High IR (13%),High IDD to US, UK, Australia and Canada (11%),High Weekday

5、 Off-peak (21%),High SMS (11%),Incomer (7%),High Weekend Off-peak (10%),High ARPU (27%),High IDD to China; High IR (15%),High IDD to China; High IR (15%),High IDD to China; High IR (14%),High IDD to US, UK, Australia and Canada (13%),High IDD to US, UK, Australia and Canada (14%),High IDD to US, UK,

6、 Australia and Canada (12%),High Weekday Off-peak (19%),Before 1am (15%),Before 1 am (16%),High Weekend Off-peak (8%),High Weekend Off-peak (7%),High Weekend Off-peak (8%),Incomer (7%),Incomer (7%),Incomer (7%),High ARPU; High-range Plan (22%),High ARPU; High-range Plan (19%),High ARPU; High-range P

7、lan (18%),High ARPU; Low-range Plan (6%),High ARPU; Low-range Plan (6%),High ARPU; Low-range Plan (5%),High SMS (10%),High SMS (11%),Avg. tenure 2yr (4%),Avg. tenure 2.5yr (8%),After 1 am (6%),After 1 am (8%),18,预测模型评估标准,模型信息可解释性 模型信息丰富度。丰富度越高,模型越好 模型主要变量从业务上解释与目标变量的相关性,相关性越高,模型越好 模型预测准确性 对客户用模型预测出的

8、概率进行排序,前xx%(根据实际需求确定,通常为10%)的客户中实际预测准确的客户数越多,模型越好 模型应用强壮性 将模型应用到有相同结构的数据集得到的预测结果越接近,模型的应用强壮性越好,模型就越好,19,预测模型核心评估图,客户得分排序百分比(%),抓到预离客户百分比(% ),A,B,C,模型信息可解释性 = (B+C)/(A+B+C) 模型应用强壮性=B/(B+C) 模型前10%提升值 =42%/10%=4.2,10%,找到预离客户: 42%,理想曲线,20,模型可解释性示例,流失模型一关键变量 IP长途mou IP长途mou占总mou百分比 传统长途mou 传统长途占总mou百分比 省

9、内漫游mou 省内漫游mou占总mou百分比 国内漫游MOU 国内漫游mou占总mou百分比 港澳台漫游mou 港澳台漫游mou占总mou百分比 国际漫游(包全部,包港澳台) 国际漫游(包全部,包港澳台)占总mou百分比 漫游(省内+国内+国际)呼出次数 漫游呼出占总呼出次数的百分比 漫游(省内+国内+国际)呼入次数 漫游呼入占总呼入次数的百分比 移动运营商的平均mou(网内+联通) ,流失模型二关键变量 电话号码 客户生日 IP长途mou IP长途mou占总mou百分比 传统长途mou 传统长途占总mou百分比 省内漫游mou 省内漫游mou占总mou百分比 国内漫游MOU 国内漫游mou占

10、总mou百分比 港澳台漫游mou 港澳台漫游mou占总mou百分比 国际漫游(包全部,包港澳台) 国际漫游(包全部,包港澳台)占总mou百分比 漫游(省内+国内+国际)呼出次数 漫游呼出占总呼出次数的百分比 漫游(省内+国内+国际)呼入次数 漫游呼入占总呼入次数的百分比 移动运营商的平均mou(网内+联通) ,21,模型可解释性示例,对目标变量的影响,模型中关键变量“MOU变化趋势”对客户流失的影响,说明:正数代表变量为该数值时,客户越倾向于离网;负数则相反,22,模型预测准确性示例,20%,找到预离客户 61%,10%,找到预离客户: 42%,客户得分排序百分比(%),抓到预离客户百分比(%

11、 ),20%,找到预离客户 55%,10%,找到预离客户: 35%,客户得分排序百分比(%),抓到预离客户百分比(% ),模型一,模型二,23,模型预测强壮性示例,客户得分排序百分比(%),抓到预离客户百分比(% ),客户得分排序百分比(%),抓到预离客户百分比(% ),模型一,模型二,24,子目录,模型的分类与适用范围 模型的评价标准与方法 案例 广州移动神州行客户流失管理 亚洲某移动运营商客户流失管理,25,由此,我们给出如下的预离客户定义,并将离网管理的重点放在防止使用期客户进入预离状态上,预离客户:在目标月进入保留期并至少延续到下个月底的客户或者下个月出了保留期但MOU=0且充值金额3

12、0,预离率,目标月(M-1)预离客户数,观察月底(M1)在使用期的客户数,在观察月(M1)或间隔月(M0)成为预离客户数,M2,M-1,M-2,数据观察期,间隔月,进入保留期月,M4,M0,M1,M3,预离月,26,神州行品牌 0月租 大众卡 畅听卡,ARPU,在网时长,入网区域,通话类型,对于神州行各品牌,根据四个重要维度对使用期客户其做初步分析,以形成具体的建模策略,27,0月租卡客户中高端客户数比例较低,ARPU 大于50元的客户预离率差别不大,为5%左右,ARPU低于50元的客户预离率较高,为9% 在网时长小于1年的客户和大于一年的客户的预离率比较接近,都在7%左右 各地区客户预离率差

13、异不大,广州中预离率稍微较低 0月租卡中有80多万至少在最近两个月(6,7月)沉默(无语音通话)的客户,占据了神州行全部沉默客户的88%,且此类客户预离率为28%,关键发现,0月租卡离网预测建模策略,连续沉默客户离网 预测模型,非连续沉默客户离网 预测模型,7月底使用期客户,9月预离。数据来源为7,8,9,10月离网宽表和补充宽表,从ARPU、在网时长、入网区域及通话类型四个维度分析形成0月租卡的建模策略:连续沉默客户(至少在最近两个月无语音通话)和非连续沉默客户分别建立模型,28,大众卡客户中高端客户数比例较大,低端客户预离率高于中高端客户 大众卡在网时长小于1年的客户预离率大于7%,大于一

14、年的客户预离率为2%左右 各地区客户预离率差异不大,广州中和广州西地区预离率稍微较低 最后一个月没有通话的大众卡客户流失风险较高,但大众卡客户极少在某月中有0次通话,关键发现,大众卡离网预测建模策略,大众卡老客户离网预测模型,7月底使用期客户,9月预离。数据来源为7,8,9,10月离网宽表和补充宽表,综合大众卡分析结果,形成大众卡离网预测建模策略:对在网时长小于等于1年的客户和大于1年的客户分别建立模型,29,畅听卡主要是中低端客户,低端客户预离率高于中高端客户 有一半客户为入网时间小于等于3个月的新客户;新客户的预离率很高,高达10% 各地区客户预离率差异不大,广州中和广州西地区预离率稍微较

15、低 最后一个月没有通话的客户离网风险较高 绝大部分客户有连续月份通话,关键发现,畅听卡离网预测建模策略,老客户离网预测模型,7月底使用期客户,9月预离。数据来源为7,8,9,10月离网宽表和补充宽表,综合畅听卡分析结果,形成畅听卡离网预测建模策略:对在网时长小于等于3个月的客户和大于3个月的客户分别建立模型,30,基于神州行三个产品线针对不同的客户群,建立了六个预测模型,提升效果明显,神州行客户流失预测模型,大众卡,0月租卡,畅听卡,非 连 续 沉 默 客 户 离 网 预 测,连 续 沉 默 客 户 离 网 预 测,在 网 时 长 小 于 1 年 客 户,在 网 时 长 大 于 1 年 客 户

16、,在 网 时 长 小 于 等 于 3 个 月 客 户,在 网 时 长 大 于 3 个 月 客 户,+,+,+,六个模型更有针对性更加精确的预测客户离网可能性,4.2,前10%客户模型Lift,3.3,2.8,3.5,2.2,3.6,31,客户离网管理总体框架,新客户 (在网时长3个月),老客户 (在网时长=3个月),神州行使用期客户,新客户预离率较高,考虑给予客户关怀;对老客户,结合各品牌战略分群和预测模型,对有较高预离可能性的客户进行针对性营销,是离网管理的重点。,畅听卡 客户流失预测模型,大众卡新客户 入网关怀,0月租流失 模型,客户战略分群,畅听卡流失 模型,大众卡流失 模型,32,由此

17、,我们建议制定以下的老客户离网管理策略,提供短信 优惠,提供长途漫游 优惠,在网时长=3个月客户,离网挽留策略,战略群,营销创意,0月租卡 畅听卡 大众卡,0月租卡 畅听卡 大众卡,综合高值 省内漫游者 省外来穗务工者 高值商务 工薪全业务 外地移民 高端全业务需求 国内长途呼出 省内群 长途和短信呼入群,品牌,综合高值 省内漫游者 省外来穗务工者 本地老客户 联通他网 高端全业务需求 国内长途呼出 省内群 长途和短信呼入群,向0长途客户推广我爱我家 向低长途用量且无12593使用习惯客户推广12593 向高长途漫游客户推广优惠包,发xx短信,送xx短信 充值赠送免费短信条数 短信和语音一起的捆绑性优惠,33

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论