




已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,某运营商数据挖掘项目汇报_新增用户维系,2012年3月,非凡图库:,新增用户维系基本流程,1、采用生存分析法,对有流失倾向的用户进行提前预警,并可根据用户流失概率的高低划定预警级别流失高危用户群在网异动用户群正常用户群,异动预警监控,1、维系策略方案生成渠道养卡监管措施重入网与反复用户管控措施正常低网龄用户维系措施2、维系方案实施营销案实施流程维系渠道维系方式,维系策略及方案,1、维系情况反馈2、目标达成情况3、维系效果评估:渠道养卡识别及监管重入网与反复重入网正常低网龄用户维系,维系效果评估,1、新增用户分群:渠道养卡重入网与反复重入网用户正常低网龄用户细分根据正常低网龄用户偏好进行细分,新增用户分群,建立新增用户维系闭环管理体系,准确分群,分级预警,制定针对性的维系策略和方案并实施,实现新增用户保有。,柳州渠道养卡行为特征及监控思路建议,产品:渠道养卡一般选择无月租或最低月租的产品,以降低养卡的成本,研究发现柳州2种类型产品均被渠道选择使用ARPU:渠道养卡号码消费额一般较低,研究发现柳州养卡号码月均消费一般低于15元主叫时长:渠道养卡号码主叫时长非常低,研究发现柳州有70%以上无通话行为,有通话行为用户主叫时长主要集中在3分钟以内用户状态:研究发现柳州渠道养卡新增号码停机流失高峰出现在入网后的第1-3个月消费情况:同一个渠道发展的养卡号码中,出现多个号码消费行为一致的情况,如多个号码入网当月和次月消费完全一致激活IMEI:养卡号码在激活时,一般用同一个手机激活,因此养卡号码中大量号码的激活IMEI一致,柳州渠道养卡行为特征,制定疑似养卡渠道的判断规则:从渠道发展用户的产品、ARPU、用户状态进行判断,当用户数占比符合一定标准后,即判断为疑似养卡渠道;制定疑似养卡号码的判断规则:从用户消费情况、激活IMEI等进行判断,符合一定标准的号码为疑似养卡号码;分析疑似养卡渠道的养卡号码量,计算养卡号码占其当月新发展的比,并按各渠道此比例排序,养卡行为监控思路建议,通过研究发现柳州渠道养卡行为特征及监控思路建议如下:,以上判断标准,都以同一渠道发展的用户作为判断基础数据;判断步骤是首先判断疑似养卡渠道,在判断其为疑似养卡渠道后,统计其疑似养卡号码数量对养卡号码的判断模型是对渠道养卡违规行为进行分析的基础,需要在执行中进一步分析、调研完善优化判断规则,提升判断准确率。,疑似养卡渠道和养卡号码判断规则,疑似养卡渠道,产品:渠道新增用户中,30%以上的用户都为两广情零听计划或都市“零听”计划二,该渠道为疑似养卡渠道,主叫时长:渠道新增用户中,50%以上或100人以上的用户入网当月和次月主叫时长在3分钟内,该渠道为疑似养卡渠道,用户状态:渠道新增用户中,入网后在第3个月,30%以上的用户状态为停机流失,该渠道为疑似养卡渠道,疑似养卡号码,消费情况:a.出现5个或以上号码号码入网当月和次月主叫时长都在3分钟内;b.或出现5个或以上号码号码入网当月和次月消费在5元以内;c.或出现2个以上号码入网当月或次月应收费完全一致,这些号码为疑似养卡号码,激活情况:a.出现5个或以上号码号码激活IMEI一致;b.或2个或以上号码登记身份证号一致这些号码为疑似养卡号码,ARPU:渠道新增用户中,30%以上或100人以上的用户入网当月和次月ARPU低于5元,该渠道为疑似养卡渠道,重入网与反复重入网(跳蚤)用户识别规则,重入网:新用户IMEI或身份证号与历史IMEI或身份证号码能够匹配(6个月以内)。如,9月新入网用户IMEI或身份证号与3月到8月用户IMEI或身份证号码库匹配后,得到9月新入网用户中重入网用户。反复重入网(跳蚤用户):重入网用户在6个月以内重入网2次及2次以上的用户。,识别规则:通过对新入网用户使用手机的IMEI号(或身份证号码)与存量用户的IMEI号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户。为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如下:用户在N月入网并激活(有话单产生),则在N+1月(计算月)对N月入网并激活的所有用户进行重入网分析。,用户重入网主要原因分析,产品,价格,促销/宣传,渠道,产品线过长,产品重叠较多,目标用户群存在较多交叉,不同品牌及资费存在内部竞争,产品价格调整比较频繁,而且在价格调整过程中没有考虑产品体系间的平衡问题预存费用低,用户入网门槛不高,使其可以轻易弃卡,新入网促销活动优惠力度过大品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足,部分社会渠道迫于指标压力或利益驱动,诱导用户换卡社会渠道虚假激活,通过养卡恶意套取酬金,追求经济收益,受入网优惠的吸引换取吉祥号码欠费,竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网,公司内部,竞争对手,用户,服务,补卡成本高,手续复杂,补卡不如买新卡欠费提醒不及时,欠费后被停机,选择重入网,从产品、促销、渠道、传播、服务等多方面入手加强重入网与反复重入网管理,降低重入网比率,重入网与反复重入网管理措施,加强入网促销活动管理,减少促销活动对在网用户的干扰;提高入网首次预存费用,增加在网时长;用户忠诚度管理:网龄营销。,产品/促销,传播,渠道,服务,加强(社会)渠道掌控,规范渠道行为,减少系统性离网行为。,采用户外广告、报纸等大众媒体及营业厅、10086短信、网站、WAP等自有媒体体开展网龄营销、优惠补卡及带号转品牌、套餐、停机保号等的传播。,加强欠费管理,减少无效欠费;主卡付费+亲情网;账户低余额时充值提示;优惠或免费补卡;推荐带号转品牌或带号转套餐。,非凡图库:,正常低网龄用户维系基本策略,剔除了渠道养卡用户和反复重入网用户后所获得的正常低网龄用户是新增用户流失控制的重点。运用数据挖掘方法,识别出不同流失预警级别的用户,针对高危用户和异动用户分别采取针对性的营销捆绑手段进行维系,同时结合网龄营销,延长用户生命周期。,正常低网龄用户分群,用户,重绑:针对高危用户在网黏性已很弱的特点,采取较大力度的营销捆绑策略,以返还周期短的财务捆绑和力度较大的业务捆绑为主,以服务捆绑为辅。,力保:针对异动用户尚处于流失犹豫期、还具有一定黏性的特点,维系策略将以强化用户的业务黏性为重点,以业务捆绑和较长返还周期的财务捆绑为主,以服务捆绑为辅。,全用户常规保有(不研究)。,细分用户群,基本策略,流失高危用户,在网异动用户,相对稳定用户,多级预警,多级维系,在模型挖掘的基础上,准确判别正常低网龄用户的流失倾向,根据用户流失概率的高低分别实施针对性的维系策略和措施,对可能流失的用户提前预防,多级维系,有效地防止用户流失。,一级匹配和维系;二级匹配和维系。,1,2,正常低网龄用户细分、预警及维系框架,精准营销模型,新增用户细分模型,用户价值,在网时长,渠道偏好,促销偏好,用户号码,消费特征,用户清单,话费余额,新增网用户流失模型,商务高端用户群,长途话务突出群,本地话务突出群,本地低端用户群,数据业务发烧群,漫游突出用户群,数据业务兴趣群,本地话务偏好群,在网异动用户,流失高危用户,长途话务突出群,本地话务突出群,本地低端用户群,漫游突出用户群,数据业务突出群,本地话务偏好群,当月新增用户,其他新增用户,营销案,用户流失预警和细分建模过程,流失现状分析流失原因分析流失用户特征分析流失预警建模目标沟通确定流失细分模型目标沟通确定,根据建模要求和现有数据情况,构思、沟通和确定建模数据提取需求提取09年1-10月新增用户在1-10月的自然属性和消费行为数据提取09年10月新增用户在10月的日消费行为数据数据质量审核数据探索非正常用户的剔除。根据渠道养卡和跳蚤用户识别模型提取异常用户,数据抽样。确定建模用户集合建模衍生变量计算。根据提取的基础数据宽表计算衍生变量建模变量筛选特征建模分析卡方分析方差分析双变量分析Pearson相关分析wald显著性检验量重要性分析建模变量数据转换对数变换标准化变换,确定建模用户集确定建模用户数据集采用TwoStep聚类算法,建立用户细分模型月数据用户细分模型(高价值用户和在网2月及2月以上的新增用户细分日数据用户细分模型(在网1月新增用户细分)业务解释聚类结果,调整模型参数和建模变量,直到得到满意结果,确定建模用户集确定建模用户数据集采用逻辑回归和决策树算法建立流失预警模型在网2月新增用户流失预警模型在网2月以上新增用户流失预警模型在网1月新增用户流失预警模型采用生存分析算法建立高价值用户流失预警模型,模型的评估提升图、收益图混淆矩阵。准确率和查全率模型的优化建模训练集比例异常值处理建模变量建模方法模型参数显著性检验方法显著性检验变量剔除阈值树的深度和页节点记录个数,数据提取,数据清洗,数据审核,数据集成,数据挖掘宽表构建,缺失数据处理极值数据处理错误数据处理冗余数据处理,数据统计错误审核数据源错误审核数据统计口径审核,数据准备确保建模数据的完整性、可用性和完整性,提取建模所需数据,数据准备,筛选建模变量、根据模型要求进行数据变换,建模准备,经分数据,挖掘宽表,变量转换,变量筛选,健康度建模指标库,变量清洗,用户细分采用凝聚层次聚类算法,选择,初始化,更新,结束,计算包含每对样本间距离(如欧氏距离)的相似矩阵,把每个样本作为一个簇,使用相似矩阵查找最相似的两个簇,将两个簇合并为一个簇,簇的个数通过合并被更新;同时更新相似矩阵,将两个簇的两行(两列)距离用1行(1列)距离替换反映合并操作。,当所有样本都合并成一个簇或满足指定的簇的数目时,整个过程结束。,层次聚类可以分为两种:凝聚的方式和分割的方式,凝聚是一种至底向上的方法,将每一条记录看作一个类,然后根据一些规则将他们聚合成越来越大的类,直到满足一些预先设定的条件。,执行n-1次步骤2和步骤3,网龄2月及以上新增用户细分模型,采用SPSS及CLEMENTINE作为数据分析与聚类建模工具算法为TwoStep聚类算法使用细分矩阵,按照语音消费行为和数据业务消费行为两次聚类的方法分别聚类,多维聚类的方法较传统单维聚类方法,聚类后的用户细分特征更明显聚类数据集为2009年1-9月新增用户入网后第二个月,且第二月状态正常的用户的基础数据和消费行为数据数据在聚类前需进行标准化变换和极值处理,本地通话次数,长途通话次数,计费通话时长,漫游通话次数,ARPU,低端,中低端,长途突出,本地突出,漫游突出,商务,GPRS流量,新业务费,新业务使用种类数,彩信条数,短信条数,新业务费占比,使用少,占比高,兴趣,短信突出,上网突出,发烧友,细分群主要消费行为特征(网龄=2个月)-1,非凡图库:,细分群主要消费行为特征(网龄=2个月)-2,网龄1月新增用户细分模型,采用SPSS及CLEMENTINE作为数据分析与聚类建模工具算法为TwoStep聚类算法使用细分矩阵,按照语音消费行为和数据业务消费行为两次聚类的方法分别聚类,多维聚类的方法较传统单维聚类方法,聚类后的用户细分特征更明显聚类数据集为2009年10月125日入网,11月1日之前未流失的用户从入网当日至月底的日均消费行为数据数据在聚类前需进行标准化变换和极值处理,低端,中低端,长途突出,本地突出,商务,占比占比高,使用少,兴趣,上网突出,发烧友,日均本地通话次数,日均长途通话次数,日均漫游通话次数,日均计费通话时长,日均GPRS流量,日均彩信条数,日均短信条数,新业务使用种类数,新业务费占比,细分群主要消费行为特征(网龄1个月)-1,细分群主要消费行为特征(网龄1个月)-2,新增用户中的流失用户超过四分之三的用户生命周期不超过四个月,不具有完整的生命周期特征COX生存分析模型,隐含了一条假设,即在时间越长,其离网的可能性就越大,这样一来,是否离网和在网时间应该是正相关的,COX模型在拟合的时候,会在这个约束之下,所以其对数据的拟合没有LOGIT效果好因此对新增用户离网预警,采用LOGIT回归模型或决策模型,新增用户中的流失用户有76%在入网后的四个月内流失,流失用户的76%是在入网后的四个月内流失分别有22%和23%的流失用户在入网后的第一个月和第二月内流失,数据来源:09年1月-10月新增用户流失用户定义:当月停机,且连续停机60天以上用户,到2009年11月仍未开机用户网龄举例:3月入网,3月流失的用户,网龄为0个月,流失用户的在网时长分布,决策树预测模型:决策树是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规则的实例中推理出以决策树表示的分类规则。它采用自顶向下的递归方式,在决策树的内部节点进行属性的比较,并根据不同属性值判断从该节点向下的分支,在决策树的叶节点得到结论。,逻辑回归预测模型:也称定性变量回归,类似于线性回归,但是目标字段使用字符型字段而不是数值型字段。Logistic回归建立一组方程,把输入属性值与输出字段每一类的概率联系起来。一旦生成模型,便可用于估计新记录属于某类的概率。概率最大的目标类被指定为该记录的预测输出值。,逻辑回归算法具有训练集和测试集预测准确率的差异是最小的优点能给出用户属于某类型概率,可精确控制用户群大小,对有缺失值的记录不能给出预测概率模型自变量之间可能存在多重共线性干扰业务可解释性较决策树差,优点,缺点,逻辑回归算法具有训练集和测试集预测准确率的差异是最小可以精确控制筛选用户群大小的优点,同时我们采用缺失值处理、相关性分析可以规避算法的缺点,优先选用逻辑回归算法。比较模型预测效果,选择预测效果较佳分类算法,模型,比较,结论,正常低网龄用户流失采用预警分类算法,在网2月新增用户流失预警模型,采用SPSS和CLEMENTINE作为数据分析和建模工具分别采用逻辑回归算法和决策树算法建模,比较模型预测效果,确定使用逻辑回归算法,建模时间窗口,测试时间窗口,入网月份,取数月份,流失月份,流失观察月份,建模变量,建模结果,余额通话次数套餐名称本地被叫次数欠费金额本地主叫次数网内通话对端数网外通话对端数彩铃订购标志通话时长大于5分钟标志多次充值标志欠费标志ARPU大于0标志长途通话次数漫游通话次数新业务费通话标志包打套餐标志手机报费用本地主叫通话标志拨打10086次数重入网标志,所有的数据经过对数变换和标准化变换,消除不同变量和不同月份对模型的影响逻辑回归算法使用的方法是进入法,模型调整变量的依据是回归参数的Wald检验,模型拟合优度的评判标准时是-2对数似然值,值越小,拟合效果越好模型的结果为对数流失风险比的线性拟合表达式,应用模型时输入为用户当前在建模变量上的值,输出为用户的流失概率下图展示了建模变量的重要性(调整后的实际建模变量),变量重要性,用户集:09年07月入网、08月仍然正常的用户;模型筛选用户:通过模型筛选出的用户集中20%的用户,其中,包含了用户集中52.2%的9月流失用户;模型筛选用户9月、10月和11月的流失率(模型准确率)分别为16%、34%和48%,比用户集中用户的流失率(不使用模型筛选的准确率)提升度分别为2.4、2.5和3.2倍。,52.2%,*提升度=模型筛选用户流失率/用户集中用户流失率,考察模型筛选用户三个月流失情况,模型准确率为48%,在网2月以上新增用户流失预警模型,分别采用逻辑回归算法和决策树算法建模,比较模型预测效果,确定使用逻辑回归算法,建模时间窗口,测试时间窗口,建模变量,建模结果,余额本地被叫通话次数欠费金额本地被叫次数波动率通话标志通话时长大于5分钟标志多次充值标志其他费用本地主叫次数波动率新业务费通话次数月租费ARPU彩铃订购标志长途通话次数漫游通话次数本地主叫次数,所有的数据经过对数变换和标准化变换,消除不同变量和不同月份对模型的影响回归分析方法和参数设置同在在网2月新增用户流失预警模型模型的结果为对数流失风险比的线性拟合表达式用户余额、本地被叫通话次数、欠费金额、本地被叫次数波动率、通话标志、通话时长大于5分钟标志变量重要,变量重要性,非凡图库:,模型预警20%的正常用户,包含61%的下月流失用户,用户集:09年06月(包括06月)以前入网、08月仍然正常的用户;模型筛选用户:通过模型筛选出的用户集中20%的用户,其中,包含了用户集中61.4%的9月流失用户;模型筛选用户9月、10月和11月的流失率(模型准确率)分别为26.7%、36%和43%,比用户集中用户的流失率(不使用模型筛选的准确率)提升度分别为3.4、2.7和2.3倍。,61.4%,*提升度=模型筛选用户流失率/用户集中用户流失率,在网1月新增用户流失预警模型,在网1月新增用户没有月数据,只有日数据,由于系统只保留最近3月的日数据,9月的日数据不完整,11月的新增用户不能判定用户流失,只能取10月新增用户的日数据为建模数据集用户的样本量小,考虑到决策树算法如使用交叉验证,能一定程度上弥补样本量小的不足,采用决策树算法作为预警建模算法,建模时间窗口,建模变量,入网时间在10月125日的用户从入网当天直到10月底的日数据,建模结果,余额品牌手机报费用套餐名称日均长途通话次数月租费日均本地被叫通话次数充值次数日均漫游通话次数包打套餐标志本地通话次数波动率手机邮箱标志新业务费多次充值标志彩铃订购标志手机报订购标志本地主叫次数波动率重入网标志外网通话对端数波动率通话大于5分钟标志通话标志短信发送条数波动率,模型使用了交叉验证,模型的结果为决策树,应用模型后的输出为用户流失的置信度用户余额、品牌、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 培训机构入股合同范本
- 海尔空调采购合同范本
- 海绵鞋料售卖合同范本
- 社区广告合作合同范本
- 商场店面装修合同范本
- 宜州租房转租合同范本
- 石材施工采购合同范本
- 简单的付款合同范本
- 工程押金协议合同范本
- 外卖代理合同范本
- 废铅酸蓄电池回收处置项目可行性研究报告立项计划书
- 《网络传播概论》考试复习题库(重点160题)
- AO 史密斯热水器EES系列说明书
- 昏迷患者的评估
- 高中俄语教材必修一第一课
- 智能家居市场分析报告与操作手册
- 管理会计说课
- 云南省昭通市镇雄县2024年小升初数学高频考点模拟卷含解析
- 2024-2029年中国合成红宝石行业市场现状分析及竞争格局与投资发展研究报告
- 深化政府采购制度改革方案
- 甲状腺围手术期的护理
评论
0/150
提交评论