




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
四川移动准沉默客户识别模型分析设计说明书版本号 1.0项目名称四川移动准沉默客户模型建设文档名称四川移动准沉默客户模型分析设计说明书版本号1.0发布日期2010.6文档变更记录版本修改章节修改类型日期修改人备注2目 录1.模型概述12.业务理解与目标定义12.1 模型定义12.2 目标定义13.数据准备与数据探索23.1 数据准备23.2 数据探索74.模型构建84.1 建模工具84.2 建模流程85.模型评估95.1 模型评估95.2结果解释106.模型部署12附录121. 模型概述沉默客户的存在,不仅造成了资源的大量浪费,也为市场运营及营销工作带来了困难,同时,也造成了离网用户的大量增加和挽留难度的大幅提升。准沉默客户识别模型的目标在于为营销工作提供决策参考,协助需求部门有效的进行营销前移,通过沉默客户预判工作,在客户接触点尚未消失前进行针对性的营销及挽留相关工作,保证其资源利用和效率提升,进一步深入进行市场精细化运营。由于最后一次通话状态和用户在网时长在用户沉默原因上的差异性较明显,如最后一次通话为漫游状态的用户一般认为是自然流失客户,如网3个月以内的号码稳定性一般较差,受渠道、sp厂商的影响也较大。因此,在进行模型建设的具体工作的之前,结合业务经验及具体数据分析,为使模型结果更能够符合实际使用需要,将准沉默客户细分成三类:最后一次通话为漫游的客户、最后一次通话非漫游且在网时长3个月以内的客户和最后一次通话非漫游且在网时长3个月以上的客户,针对每一类客户均建立了预测模型。2. 业务理解与目标定义2.1 模型定义沉默客户定义:指上月上网本月未上网的客户上网客户定义:当月产生语音、短信、gprs等话单的客户净增客户定义:当月上网客户数减去上月上网客户数2.2 目标定义建立准沉默客户识别预测模型并且产生最可能的目标客户的名单,结合每个客户的价值评分,用0到1之间的值来量化目标客户的可能性大小。3. 数据准备与数据探索3.1 数据准备基础变量表:字段名数据类型解释id_no_1bigint用户编码phone_no_1varchar(20)手机号码run_namevarchar(32)截止提数日用户状态run_codeoldcharacter(10)截止提数日用户状态编码group_idvarchar(32)入网渠道编码group_namevarchar(300)入网渠道名称area_namevarchar(32)归属地市county_namevarchar(64)归属区县open_timevarchar(20)入网时间sm_codecharacter(10)资费代码brand_namevarchar(100)品牌名称mode_namecharacter(100)资费名称vipflagintegervip客户标记vip_classvarchar(10)vip客户等级grpflaginteger归属集团编码grp_namevarchar(300)归属集团名称highflaginteger中高端客户标记allduration05integer总通话时长allcalltimes05integer总通话次数allduration04integer上月通话时长allcalltimes04integer上月总通话次数allduration03integer上上月通话时长allcalltimes03integer上上月总通话次数bdduration05integer本地通话时长bdcalltimes05integer本地通话次数bdduration04integer上月本地通话时长bdcalltimes04integer上月本地通话次数bdduration03integer上上月本地通话时长bdcalltimes03integer上上月本地通话次数ctduration05integer长途通话时长ctcalltimes05integer长途通话次数ctduration04integer上月长途通话时长ctcalltimes04integer上月长途通话次数ctduration03integer上上月长途通话时长ctcalltimes03integer上上月长途通话次数myduration05integer漫游通话时长mycalltimes05integer漫游通话次数myduration04integer上月漫游通话时长mycalltimes04integer上月漫游通话次数myduration03integer上上月漫游通话时长mycalltimes03integer上上月漫游通话次数zjduration05integer主叫通话时长zjcalltimes05integer主叫通话次数zjduration04integer上月主叫通话时长zjcalltimes04integer上月主叫通话次数zjduration03integer上上月主叫通话时长zjcalltimes03integer上上月主叫通话次数bjduration05integer被叫通话时长bjcalltimes05integer被叫通话次数bjduration04integer上月被叫通话时长bjcalltimes04integer上月被叫通话次数bjduration03integer上上月被叫通话时长bjcalltimes03integer上上月被叫通话次数ltduration05integer与联通通话时长ltcalltimes05integer与联通通话次数ltduration04integer上月与联通通话时长ltcalltimes04integer上月与联通通话次数ltduration03integer上上月与联通通话时长ltcalltimes03integer上上月与联通通话次数dxduration05integer与电信通话时长dxcalltimes05integer与电信话次数dxduration04integer上月与电信通话时长dxcalltimes04integer上月与电信通话次数dxduration03integer上上月与电信通话时长dxcalltimes03integer上上月与电信通话次数ddusrs05integer通话对端用户数ddusrs04integer上月通话对端用户数ddusrs03integer上上月通话对端用户数ydddusrs05integer移动通话对端用户数ydddusrs04integer上月移动通话对端用户数ydddusrs03integer上上月移动通话对端用户数ltddusrs05integer联通通话对端用户数ltddusrs04integer上月联通通话对端用户数ltddusrs03integer上上月联通通话对端用户数dxddusrs05integer电信通话对端用户数dxddusrs04integer上月电信通话对端用户数dxddusrs03integer上上月电信通话对端用户数bd1008605integer拨打10086次数bd1008604integer上月拨打10086次数bd1008603integer上上月拨打10086次数bd1000005integer拨打10000次数bd1000004integer上月拨打10000次数bd1000003integer上上月拨打10000次数bd1001005integer拨打10010次数bd1001004integer上月拨打10010次数bd1001003integer上上月拨打10010次数hzcalltimes05integer呼转次数hzcalltimes04integer上月呼转次数hzcalltimes03integer上上月呼转次数ydhzcalltimes05integer呼转移动次数ydhzcalltimes04integer上月呼转移动次数ydhzcalltimes03integer上上月呼转移动次数lthzcalltimes05integer呼转联通次数lthzcalltimes04integer上月呼转联通次数lthzcalltimes03integer上上月呼转联通次数dxhzcalltimes05integer呼转电信次数dxhzcalltimes04integer上月呼转电信次数dxhzcalltimes03integer上上月呼转电信次数smsfs05integer点对点短信发送量smsfs04integer上月点对点短信发送量smsfs03integer上上月点对点短信发送量lastromainteger最后通话为漫游标记gprsflow05decimal(16,4)gprs流量gprsflow04decimal(16,4)上月gprs流量gprsflow03decimal(16,4)上上月gprs流量id_nobigint用户编码prepay_feedecimal(16,4)截止取数日话费余额arpudecimal(16,4)arpumonth_feedecimal(16,4)月租费pay_countbigint充值次数pay_montydecimal(16,4)充值金额lprepay_feedecimal(16,4)上月月底话费余额larpudecimal(16,4)上月arpulmonth_feedecimal(16,4)上月月租费lpay_countbigint上月充值次数lpay_montydecimal(16,4)上月充值金额llprepay_feedecimal(16,4)上上月月底话费余额llarpudecimal(16,4)上上月arpullmonth_feedecimal(16,4)上上月月租费llpay_countbigint上上月充值次数llpay_montydecimal(16,4)上上月充值金额cunfei_flagvarchar(2)是否参与存送捆绑标记innet_timevarchar(20)存送捆绑到期时间family_flagvarchar(2)合家欢客户标记changtu_flagvarchar(2)长途风暴客户标记yang_flagvarchar(2)疑似渠道养卡标记shoujibao_flagvarchar(2)手机报客户标记feixin_flagvarchar(2)飞信客户标记toushu_flagvarchar(2)投诉客户标记toushu_numsbigint投诉次数shuxin_feedecimal(16,4)数信业务费用chengshi_flagvarchar(10)城市农村客户标记zhongduan_flagdecimal(16,4)是否参与终端捆绑标记zd_begin_timevarchar(10)参与终端捆绑时间zd_end_timevarchar(10)终端捆绑到期时间term_bind_namevarchar(200)参与终端捆绑活动名称save_bind_namevarchar(200)存送捆绑活动名称account_typevarchar(32)账户类型innet_feedecimal(16,4)开户缴费金额生成衍生变量表:字段名数据类型解释id_nobigint用户编码phone_no_1varchar(20)手机号码channel_namevarchar(300)入网渠道brand_namevarchar(100)品牌mode_namecharacter(100)资费open_timevarchar(20)开户时间net_ageinteger网龄run_namevarchar(32)截止取数日期用户状态family_flagvarchar(2)合家欢客户标记changtu_flagvarchar(2)长途风暴客户标记lastcall_roaminteger最后一次通话为漫游标记chengshi_flagvarchar(10)城市农村客户标记toushu_numsbigint投诉次数shoujibao_flagvarchar(2)手机报用户标记fetion_flagvarchar(2)飞信用户标记vipflagintegervip客户标记highflaginteger中高端客户标记grpflaginteger集团客户标记grp_namevarchar(300)归属集团名称cunfeiinteger是否参与存送捆绑活动标记zhongduaninteger是否参与终端捆绑活动标记kunbang_lefttimeinteger捆绑剩余周期shuxin_ratio_08decimal(31,14)数信业务费用占比=数信业务费用/arpumonthfee_ratio_08decimal(31,14)月租费用占比=月租/arpuleft_feedecimal(19,4)话费余额pay_countbigint充值次数pay_moneydecimal(16,4)充值金额arpu_avgdecimal(31,18)近三月arpu平均值mou_avginteger近三月mou平均值bd_dura_avginteger近三月本地通话时长平均值ct_dura_avginteger近三月长途通话时长平均值my_dura_avginteger近三月漫游通话时长平均值lt_dura_avginteger近三月与联通通话时长平均值dx_dura_avginteger近三月与电信通话时长平均值dd_nmb_avginteger近三月通话对端数量平均值lt_nmb_avginteger近三月联通通话对端数量平均值dx_nmb_avginteger近三月电信通话对端数量平均值bd1008605integer拨打10086次数bd1000005integer拨打10000次数bd1001005integer拨打10010次数hzcalltimes05integer呼转次数ydhzcalltimes05integer呼转移动次数lthzcalltimes05integer呼转联通次数dxhzcalltimes05integer呼转电信次数sms_fasong_avginteger点对点短信发送量gprs_mount_avgdecimal(31,18)gprs流量bd_dura_ratiodecimal(31,19)近三月本地通话时长占比ct_dura_ratiodecimal(31,19)近三月长途通话时长占比my_dura_ratiodecimal(31,19)近三月漫游通话时长占比dd_yddecimal(31,19)近三月移动通话对端占比dd_ltdecimal(31,19)近三月联通通话对端占比dd_dxdecimal(31,19)近三月电信通话对端占比arpu_stddouble近三月arpu波动值mou_stddouble近三月mou波动值bd_dura_stddouble近三月本地通话时长波动值ct_dura_stddouble近三月长途通话时长波动值my_dura_stddouble近三月漫游通话时长波动值lt_dura_stddouble近三月联通通话时长波动值dx_dura_stddouble近三月电信通话时长波动值huzhuan_stddouble近三月呼转通话次数波动值ydhuzhuan_stddouble近三月呼转移动通话次数波动值lthuzhuan_stddouble近三月呼转联通通话次数波动值dxhuzhuan_stddouble近三月呼转电信通话次数波动值sms_fasong_stddouble近三月点对点短信发送量波动值gprs_mount_stddouble近三月gprs流量波动值3.2 数据探索利用spss的clementine软件对建模字段进行数据审核和探索。toushu_nums(投诉次数)、vipflag(vip标识)等字段经审核无法用于建立模型,需剔除4. 模型构建4.1 建模工具经过数据预处理、探索型数据分析, 最终确定了准沉默客户预测分析模型的变量,采用spss公司的clementine软件的决策树结点作为数据挖掘工具及数据挖掘技术来建立准沉默客户识别模型。4.2 建模流程为使模型尽量精确,针对每一个地市均单独进行识别模型的建设工作。以宜宾分公司为例,建模流程如下:5. 模型评估5.1 模型评估用模型增益和测试集查全查准率进行模型评估工作。以最后一次通话非漫游且在网时长3个月以上的客户识别模型为例。1、增益评估增益图是不同阀值下命中率(pv+,正确预测到的正例数占预测正例总数的比例)与预测成正例的比例(depth)的轨迹。随着阈值的减小,更多的客户就会被归为正例,也就是depth变大,这样pv+就相应减小。一个好的模型,在阈值变大时,相应的pv+就要变大,曲线足够陡峭。如下图所示,在阀值设定为20%的时候,曲线足够陡峭,模型效果较好,使用模型之后效果提升了约4.2倍。2、查全查准评估查全率=模型准确识别出的准沉默客户数/实际总的沉默用户数查准率=模型准确识别出的准沉默用户数/模型识别出的总用户数5.2 结果解释准沉默用户识别模型的规则非常复杂,适用于准沉默用户的规则就达658个,无法在文档中进行详细展示,如图所示(以最后一次通话非漫游且在网时长在3个月以上的沉默用户识别模型为例):因此,仅将决策树的前四层节点展示如下:模型规则概率如下表所示:其规则大致可总结为:1、账户余额很低、且与月均arpu的比例在0.01以下的客户容易产生沉默,有约70%以上的客户具有此特征2、准沉默客户一般为网龄较短的客户,有约60%的沉默客户网龄小于5个月3、准沉默客户的mou波动性及月均本地通话时长较短的特征也很明显,一般mou波动较大且呈减少趋势、本地通话时长小于20分钟的客户有90%左右的可能性会沉默4、捆绑剩余时间低于12个月的客户有60%左右的可能性会沉默,低于1个月的客户有超过80%的可能性会沉默5、月缴费次数在2次以上、平均缴费金额低于2元或平均缴费金额与arpu的比值在0.21以下的客户有约60%的可能性会沉默同时,在准沉默客户识别的基础上进行聚类:分析并总结客户沉默原因及规则: 准沉默客户模型主要输出三个字段:沉默标识($c-silence_flag)和沉默概率($cc-silence_flag)、沉默原因(reason)。沉默标识可以用来识别用户是否疑似沉默客户(0:否 1:是);沉默概率可以用来作为用户是否疑似沉默客户的概率(介于0到1之间),如一个客户的目标标识为1,目标可能性为0.9的要比0.7的更可能成为沉默客户。如下图所示:6. 模型部署准沉默客户识别模型的主要成果为提供各地市分公司当月疑似沉默客户清单,营销策划人员可以依据这份清单进行针对性的疑似沉默客户挽留及激活工作。附录模型分析报告感谢您的使用 “小萍,晚上10点以后你为什么老关机?”陈飞很直接的发过来一条这样的疑问。有些按捺不住心头的怒火得力萍想起白天母亲那无休止的唠叨,在看看陈飞所发过来的令人气愤的短信,。平日有着高雅素养的她也很难一下子控制住心头怒火中烧的情绪,“我忙忙碌碌一整天,下班以后我只想回家安安静静好好的睡一觉,沉沉香甜的睡梦中,我不想被外界的因素所打扰,这就是我下班以后回家立刻关机的原因。陈飞你问这话到底是什么意思?”气愤填膺的李萍立刻回复着
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 13890-2025天然石材分类与术语
- GB/T 10257-2025核仪器和核辐射探测器质量检验规则
- 粮油会计考试题库及答案
- 森林防火知识培训报告课件
- 八大员的质量员(设备安装专业)考试题及答案(完整版)
- 2025年中级厨师长专业烹饪技能考试试题集
- 2025年数据分析面试题融媒体集
- 2025年中级摄影测量员考试要点及备考指南
- 2025年信息技术职位面试高频问题解答与模拟题
- 2025年高级数字殡葬规划师专业能力评估题库及参考答案详解
- 2025至2030中国股指期货行业发展分析及发展前景与投资报告
- 美术介绍教学课件
- 2025年福建省福州左海供应链集团有限公司招聘笔试参考题库含答案解析
- 2025届上海市中考语文真题作文题目解析+范文
- 素描构图与透视教案
- 体育培训入股协议书
- 2025年职工技能大赛考核试题及答案
- 仓库运输管理方案计划
- 2025年“铸牢中华民族共同体意识”应知应会知识竞赛题库试卷及答案
- 云计算环境下的数据安全与隐私保护研究
- 传媒入股协议合同
评论
0/150
提交评论