




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
联通的客户数据的分析概述客户分析报告提出了客户分析方法论,通过对联通CDMA在网客户的分析,识别潜在客户和了解其特征。客户分析的结果是进行Offer设计和直复营销活动策划的重要输入。同时报告还提出了潜在客户列表的清洗建议,并列出了潜在客户列表清洗结果。报告从CDMACDMA在网客户系统中的人口信息和计费信息,通过年龄分析、ARPU值分析和相关的话费用量分析,确定本次直复营销项目的潜在目标客户群,提出了客户分群建议,并且提出了潜在目标客户的购买倾向性。报告提出了具体的潜在目标客户列表的清洗建议,这些建议和清洗方法应用在深圳和宁波试点测试的数据清洗中,并对潜在客户清洗的结果进行了统计和分类。从本次得测试中,要进行潜在客户列表的分析的先决条件是各联通市公司必须具备良好的潜在客户数据。然而在项目进行的过程中因种种的原因在数据源的获取上联通碰到了种种的问题,其中问题包括数据源公司数据的质量。如在深圳方面,数据源没有任何如客户职业,收入等相关的数据,而宁波方面的数据也只有名字,号码和地址。如此的数据质量是无法进行任何细分的。不管怎样,埃森哲在项目一开始时意识到这问题的严重性,因而建议运用了通过联通内部数据来作为客户分析的基础-详情如在方法论中所提一般。此方法在各会议中也曾与联通讨论过,在进行后也被联通认为是最可行最重要的途径1目录客户分析方法总论客户信息视图客户分析维度客户分析内容与结果客户分群/细分建议客户分析中的实际问题与限制潜在客户列表清洗方法潜在客户列表清洗结果附件:话费结构与话务分析的样本数据抽样标准21.客户分析方法总论下图是埃森哲公司的建议的客户分析方法论。客户分析方法是根据客户分析的目的定义数据需求,并从系统中摘录相关数据进行相应的行为分析,在识别目标客户群的基础上,匹配目标客户与Offer。32.客户信息视图客户分析基于客户消费和接触过程中已经积累的和可获得的各类客户信息。客户信息视图是根据客户的特征,分类组织的客户信息。客户信息一般分为人口信息、心理信息、行为信息几种类型。根据移动消费的特征,移动客户信息视图由下图所示,基本可以分为以下信息内容:客户基本信息、人口信息、历史信息、客户行为信息、客户价值贡献、生活方式、心理信息等。4经验之谈数据的预处理(ETL)远比预期投入的要多目前联通的数据基础普遍较低,即使是在如深圳联通这样对数据仓库进行过大规模投资的分公司,在做数据分析前还是需要大量的工作做数据预处理,以使数据的质量和条件达到数据分析的要求.不要低估这些准备工作所需的时间.52.客户信息视图(续)人口信息基本信息:客户在购买手机时或入网时一般都有的信息。人口信息(Demographic):人口信息是进行客户分析时的重要变量,也是用来描述细分客户群的主要变量。对于移动通信客户来说,年龄、职业、收入水平、家庭都是重要的变量。人口信息的收集和整合需要大量的基础工作,一般需要通过内部数据与外部数据的融合来对客户数据进行丰富。政府部门、专业的数据公司、某些行业如金融、航空、电信的企业都拥有大量的客户数据。心理信息生活方式(
LifeStyle):生活方式主要用来反映客户的社会行为,主要包括客户的社会阶层、个性和社会风格等,这些信息往往需要进行相应的客户调查才能得出。心理信息(Psychographic):心理信息一般描述客户的兴趣和爱好等,这些信息对于深入理解客户的消费倾向和偏好有一定的帮助。但这类信息往往在数据营销的初期比较欠缺,需要根据移动通信公司的实际需求来有针对性的收集。行为信息客户接触记录:这类信息是客户在与移动通信公司进行产品购买、产品与服务的使用记录、客户服务咨询与投诉记录、以及其他客户服务接触记录。这些记录需要移动通信公司有意识的收集、整理和分析。移动消费信息:移运客户的每月移动消费情况和资费结构等,这些数据息基本上都可以通过计费系统直接获取。这些消费信息的分析也能够用来描述移动客户的价值贡献。移动行为信息:主要用来描述移动客户的消费行为信息,这些信息能够反映移动客户的消费习惯、产品偏好、消费频率等等,这些信息往往需要根据分析的不同需求从计费系统中抽取数据进行多维分析,而且经常需要基于大量数据的复杂计算。63.客户分析维度客户的信息是多维的,对客户的分析是基于主题的。同时,客户信息的丰富程度将对客户分析产生约束根据试点直复营销以CDMA客户获取的主要目的,客户分析是基于以下当地联通现有的客户数据:客户基本信息、客户移动消费行为信息、客户移动消费价值贡献、客户反馈、市场信息。其中客户基本信息、行为信息和价值贡献信息来源于联通的计费系统。具体在进行CDMA客户分析时,采用的分析维度主要有:年龄、ARPU、套餐、话费结构、话务分布。73.客户分析维度
①变量选择下图是进行CDMA客户分析时的变量选择。在初步进行年龄分析时,按5岁一个年龄段进行划分,然后再分析总结。根据ARPU值的不同及目前联通的实际客户价值划分情况分为5段。话费结构和话务分布列出了基本的分析变量,实际分析时根据分析目的对变量进行选择。接下来会进一步描述不同分析维度的分析目的和分析内容。83.客户分析维度
②年龄细分年龄ARPUOFFER话费结构话务分布20岁以下21-2551岁以上26-3030-3536-4041-4546-50目标分析客户的年龄分布特征分析不同年龄层的客户群大小分析不同年龄层ARPU值的分布分析不同年龄层对Offer的偏好分析不同年龄层的话费贡献分析不同年龄层话费结构为进一步的细分提供输入分析内容:分年龄段的客户数量分布分年龄段的ARPU值分布分年龄段的Offer选择分年龄段的客户话费贡献分年龄段的话费结构期望结果:找出主要的年龄细分客户群年龄细分与ARPU的关系年龄细分与Offer的关系数据源要求:CDMA付费用户在网在用客户数(出帐客户)去除不合格数据(如没有年龄)可通过身份证计算年龄年龄93.客户分析维度
③年龄+ARPU值OFFER话费结构话务分布Offer1Offer2Offer3本地通话Offer4国内长途Offer5国内漫游Offer6国际长途Offer7国际漫游Offer8SMS联通在信月租费年龄ARPU20岁以下50元以下50-15026-30150-30030-35300-50036-40500元以上41-4546-5021-25话务量分布通话次数呼入/呼出次数通话时长呼入/呼出时长话务时间分布话务日期分布其他分布话费总额51岁以上年龄分析目的:话费结构差异移动消费行为差异Offer选择偏好分析内容:客户数量分布ARPU值大小与分布Offer选择情况话费贡献话费结构话务分布期望结果:找出不同年龄段之间的ARPU值差异不同年龄段的客户价值构成不同客户群体的价值贡献不同客户群体的话费结构差异数据源要求:CDMA付费用户在网在用客户数去除不合格数据可通过身份证计算年龄ARPU103.客户分析维度
④话费结构(年龄+ARPU值)OFFER话费结构话务分布Offer1Offer2Offer3本地通话Offer4国内长途Offer5国内漫游Offer6国际长途Offer7国际漫游Offer8SMS联通在信月租费年龄ARPU话务量分布通话次数呼入/呼出次数通话时长呼入/呼出时长话务时间分布话务日期分布其他分布话费总额年龄分析目的:不同客户群话费结构差异不同客户群的移动消费行为差异Offer与话费结构的关系分析内容:ARPU值与客户年龄分布Offer选择情况与话费结构的差异话费贡献与话费结构的关系基本的话务分布期望结果:找到不同客户群之间的话费结构差异不同客户群的话费贡献率具有相同话费结构的客户群特征数据源要求:CDMA付费用户在网在用客户数去除不合格数据可通过身份证计算年龄ARPU话费结构话费总额月租费本地通话国内长途国内漫游国际长途国际漫游SMS联通在信113.客户分析维度
⑤话务分布(年龄+ARPU值)OFFER话费结构话务分布Offer1Offer2Offer3本地通话Offer4国内长途Offer5国内漫游Offer6国际长途Offer7国际漫游Offer8SMS联通在信月租费年龄ARPU话务量分布通话次数呼入/呼出次数通话时长呼入/呼出时长话务时间分布话务日期分布其他分布话费总额年龄分析目的:不同客户群的话务分布话务分布对ARPU值的影响移动消费行为差异Offer选择对话务分布的影响分析内容:重点关注使用频率与次数静态话务分布Offer选择情况对话务分布的影响话费贡献与话务分布的关系期望结果:不同客户群之间的话务分布差异ARPU值与话务分布的关系Offer与话务分布的关系数据源要求:CDMA付费用户在网在用客户数去除不合格数据可通过身份证计算年龄ARPU话务分布话务量分布通话次数呼入/呼出次数通话时长呼入/呼出时长话务时间分布话务日期分布其他分布124.客户分析内容与结果
①假定试点项目所进行的客户分析有以下的几个假定:假定一:客户的人口信息(在此选用了年龄*),配合客户的ARPU值,资费结构(行为)等数据是客户分析与细分的依据假定二:顾客年龄群与ARPU值、资费结构、Offer选择等有一定的相关性假定三:不足的信息/数据(如:人口信息,生活信息等)可能导致非决定性的分析假定四:现有客户的资费结构、Offer选择与FocusGroup的反馈等将做为了解潜在客户的需求与购买倾向的基本依据假定五:联通的整体营销战略将集中于高价值/高端顾客群134.客户分析内容与结果
②概要在选定了分析的维度后,就需要根据分析的目的收集和抽取选择分析需要的客户数据。本次CDMA在网客户分析的数据主要来自于计费系统。从计费系统中摘录、抽取数据时发现:系统中记录的客户信息较少,仅有姓名、证件号等有限的项目客户信息登记后很少进行维护或更新客户的计费信息非常完整客户服务系统中的客户信息与计费系统中的客户信息没有进行过关联,客户计费信息和服务信息是分离的以前实施的数据仓库项目使得深圳较宁波有着更好的数据分析基础本项目对CDMA在网客户进行了以下分析:年龄与ARPU值的客户分布分析年龄分段客户占比年龄分段的话费结构分析年龄与套餐选择分析详细分项的话费结构分析基本的话务分析下面详细描述了列联通CDMA客户各项分析的图表与分析结果144.客户分析内容与结果
③深圳联通CDMA客户年龄与ARPU值分析数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.去除600包月用户6005人。客户数量:96349人*数据来源:7/8/9月出帐用户15数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.去除600包月用户6005人。客户数量:96349人*数据来源:7/8/9月出帐用户4.客户分析内容与结果
④深圳联通客户年龄与ARPU值关系分析——图表说明164.客户分析内容与结果
⑤宁波联通CDMA客户年龄与ARPU值分析客户样本:72689人数据来源:8-10月出帐用户*174.客户分析内容与结果
⑥年龄分段的话费结构分布(深圳)客户数量:96349人*数据来源:7/8/9月出帐用户数值标准:优惠前用量数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
184.客户分析内容与结果
⑦年龄分段的话费结构分布(深圳)客户数量:96349人*数据来源:7/8/9月出帐用户数值标准:优惠前用量根据实际话务量按标准计费价格计算出的相应话费项目的优惠前话费平均值。相应话费项目的总体用户平均线相应移动业务项目分年龄段的平均值数据轴年龄分段的话费结构分析的主要目的:分析CDMA用户群总体移动消费中不同移动业务项目的消费数量和比例。分析不同年龄段的移动业务之间的差异性。分析相同年龄段在不同移动之间的消费差异性。分析具体移动业务随年龄段变化的差异性。数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
话费结构分析统计时的计算标准(按标准资费):本地通话:0.40元/分钟国内长途:0.07分/6秒国内漫游:0.60元/分钟国际长途:0.80元/6秒短信息费:0.10元/发送一条194.客户分析内容与结果
⑧年龄分段的话费结构分布(宁波)客户数量:72689人数据来源:8/9/10月出帐用户数值标准:优惠前用量数据来源:2003年/8/9/10月宁波联通CDMA出帐用户数据.
20连续三个月在网出帐用户(7/8/9)抽样客户数量:96349人抽样样本分布:16岁-55岁样本计费标准:优惠前费用4.客户分析内容与结果
⑨年龄分段的话费结构特征数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.21连续三个月在网出帐用户(7/8/9)抽样客户数量:96349人抽样样本分布:16岁-55岁4.客户分析内容与结果
⑩年龄分段的话费结构特征数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.224.客户分析内容与结果
(11)话费结构分析——本地通话分析客户数量:96349人数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
234.客户分析内容与结果
(12)话费结构分析——国内长途分析客户数量:86575人客户使用比率:89.9%数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
244.客户分析内容与结果
(13)话费结构分析——国内漫游分析客户数量:50851人客户使用比率:52.8%数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
254.客户分析内容与结果
(14)话费结构分析——国际长途分析客户数量:4028人客户使用比率:4.18%数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
264.客户分析内容与结果
(15)话费结构——国际漫游分析客户数量:941人客户使用比率:0.9%数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
274.客户分析内容与结果
(16)话费结构分析——数据增值业务数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
284.客户分析内容与结果
(17)话费结构——短消息(SMS)使用客户数量:93953人客户使用比率:97.5%平均月使用次数:101次平均月发送次数:56次数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
294.客户分析内容与结果
(18)本地通话呼入呼出分析呼入呼出时长比是以年龄分群的客户实际呼入时长与实际呼出时间的比值。呼入呼出时长比主要是用来反映不同客户群之间的移动语音消费行为。一般来说年轻人对资费价格较敏感,社交需求与高年龄群相比较少,其呼入呼出比会高于较高年龄群。实际的统计图表也反映出这样的趋势。数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
总体上,各年龄群的呼入时长均大于呼出时长。总体呼入时长与呼出时长的比平均为1.70。18-25岁,呼入呼出时长比为1.92。26-34岁,呼入呼出时长比为1.69。35岁以上,呼入呼出时长比稳定的保持在1.5左右。304.客户分析内容与结果
(19)本地通话呼叫时间分布本地的呼叫时间分布没有明显的年龄差异性18-25年龄群的夜间呼叫比例高于其他年龄群工作日与休息日无明显差异性数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
呼叫时间分布主要是用来反映移动用户的语音业务消费行为,更多的应用于客户维系和客户提升时的客户分析和产品设计。对于客户获取来说,呼叫时间分布分析的主要目的是看不同客户分群之间的差异性,是否存在明显的呼叫时间分布变化。以有助于设计分时段的业务产品适应特应消费行为的客户群。呼叫时间分布的分析可以根据时间分段、不同的客户群、不同的语音业务等进行组合分析。本报告就本地通话、国内长途和国内漫游通话进行了数据取样和分析,并按早7点至19点,晚19点至23点,夜间23点至早7点三个时间段,分别按工作日和休息日进行统计。25岁以下的年轻人夜间呼叫所占比例明显高于较高年龄群体。有接近40%的呼叫发生在晚上和夜间。30岁以上的客户群呼叫时间分布无论休息日还是工作日都非常稳定,没有明显的波动。有近70%的呼叫发生在白天。对于本地呼叫来说,工作日与休息日的差别并不明显。从本地通话呼叫时间分布来看,周未的夜间呼叫所占比例稍高于工作日,但并没有明显差异。314.客户分析内容与结果
(20)国内长途呼叫时间分布国内长途的呼叫时间分布没有明显的年龄差异性18-25年龄群的夜间呼叫比例稍高数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
18-25的年轻人夜间呼叫所占比例稍高于较高年龄群体。有接近50%的国内长途呼叫发生在晚上和夜间。考虑到晚上的分时段优惠,这类客户群比较高年龄的客户群价格敏感。30岁以上的客户群呼叫时间分布无论休息日还是工作日都非常稳定,没有明显的波动。有近60%的国内长途呼叫发生在白天。从国内长途呼叫时间分布来看,周未与工作日并没有明显差异。324.客户分析内容与结果
(21)国内漫游呼叫时间分布尽管从前面的国内漫游话费结构分析中显示国内漫游的使用率和漫游时长随着年龄增长而逐渐增加,但从下图的分析中可以看出,国内漫游的呼叫时间分布没有明显的年龄差异性。数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
33使用率特价机方案似乎对年纪较轻的客户群有较大的吸引力特价机方案:主要是低价的国产CDMA手机(1500元以下居多)主要定位于消费较低的中低端移动消费人群广告的宣传和渠道的宣传以价格为主要的吸引点4.客户分析内容与结果
(22)客户年龄与选择套餐方案关系分析年龄目标客户以理解客户购买倾向为出发点,我们也针对了客户年龄与选择套餐方案关系做了基本分析:34使用率年龄4.客户分析内容与结果
(23)客户年龄与选择套餐方案关系分析反观,联通最低消费赠机似乎对年纪较大的客户群有较大的吸引力联通最低消费赠机包括:预存一定数额的话费以获得手机端终。一般要求固定客户每个月的最低移动业务消费量。手机终端不同档次的选择,相应的有不同月租费水平要求。目标客户以理解客户购买倾向为出发点,我们也针对了客户年龄与选择套餐方案关系做了基本分析。35在完成CDMA在网客户分析后,我们可以得到相当多的信息:不同年龄的人数分布和年龄群平均ARPU值客户的年龄与ARPU值有一定的正相关性客户的年龄分布与相关移动通信业务用量的关系不同年龄段客户的移动业务用量情况不同年龄段的话务分布之间的差异性在进行客户分群时,我们主要考虑以下一些方面的因素:客户群的规模足够大。分群得到的客户群要具有一定的数量,年龄分群很好的解决了这一问题。容易识别。不同客分群间有较明显的区别的差异性,能够很容易识别出不同的客户群。年龄分布与ARPU值的关系。希望通过分群将具有相似ARPU值和年龄的客户群集合在一起,便于采取相应的市场活动进行有针对性的获取。从深圳和宁波的年龄-ARPU分布和年龄-人数分布中,很明显的看出ARPU值的连续变化,结合不同年龄的人数分布,对深圳和宁波进行了相应的分群建议。接下来的几页分别描述了试点地区的分群建议5.客户分群/细分建议365.客户分群/细分建议(续)从不同年龄群的ARPU值分布来看,年龄与ARPU值有着明显的相关性,随着年龄的增长,ARPU值随渐增加并保持稳定。我们可以按以下的规则分为三群:低于平均ARPU值水平在平均ARPU值周围高于平均ARPU值数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
根据年龄与ARPU值进行分群。18-25岁年龄群,ARPU值低于平均水平。26-34岁年龄群,ARPU值基本相当于平均水平。35-45岁年龄群,ARPU值高于平均水平。37数据来源:2003年/8/9/10月宁波联通CDMA出帐用户数据.
5.客户分群/细分建议(续)385.客户分群/细分建议
①18-25岁客户群–“CoolYouth”连续三个月在网出帐用户(7/8/9)客户样本总数:96349人分群样本分布:18岁-25岁客户群数量:23960人数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
395.客户分群/细分建议
②26-34岁客户群–“YoungAchievers”连续三个月在网出帐用户(7/8/9)客户样本总数:96349人分群样本分布:26岁-34岁客户群数量:45265人数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
405.客户分群/细分建议
③35-45岁客户群–“EstablishedAdults”连续三个月在网出帐用户(7/8/9)客户样本总数:96349人分群样本分布:35岁-45岁客户群数量:22676人数据来源:2003年7/8/9月深圳联通CDMA出帐用户数据.
为此项目的主要目标客户群41在埃森哲的客户洞察分析方法论中,客户分析/细分模型是建立在大量的生活方式/人口统计学/生命阶段数据上。这些数据通常可以从专业的数据提供商处购买得到(如在许多的欧美国家)。目前联通的系统中不存在这些数据,同时在本项目期内也无法从潜在的数据源提供商处获得如此丰富的的数据。由于数据的不足,项目在此刻无法使用此方法论来建立一个交全面的客户获取模型以支持筛选潜在客户。因此在此项目中我们不得不使用目前联通数据库与外部数据列表共有的字段-年龄,来建立客户倾向模型。我们期望年龄作为一个细分变量来定义潜在客户并驱动客户获取战役。一些其他全球性的通讯公司也通过年龄来进行客户分析/细分。基本上,年龄是可行的基本细分方法,因为一般公司都有这方面的数据和去预测客户行为及使用特征的能力。6.客户分析中的实际问题与限制以下说明此试点项目在进行客户分析时所面对的一些问题和约束:以下继续说明在不同数据条件下对识别目标客户时所产生的影响:42经验之谈潜在数据的获取远没有想象的那么难在项目启动前,试点地区的有关人员都对潜在数据的获取相当担心,而实际工作开展起来后,发觉正如项目建议书中分析的那样,潜在客户数据的获取途径和方法有相当多的选择可以尝试,关键是要有人去想,去有技巧的沟通接洽.中国联通更可以通过系统化的与业外伙伴合作,通过长期合作取得稳定,安全的潜在数据43在没有足够数据条件下对识别目标客户时所产生的影响
-是随机/没目标的客户选择示例6.客户分析中的实际问题与限制(续)44反观,拥有足够的数据将能更有针对性及有效地识别目标客户示例6.客户分析中的实际问题与限制(续)45而在有限数据情况下,使用年龄细分能带来相当程度的针对性示例6.客户分析中的实际问题与限制(续)46以下为因为数据支持不足其它无法进行的分析6.客户分析中的实际问题与限制
①其它无法进行的分析人口变量统计分析客户职业分布客户收入水平客户家庭生命周期职业与移动消费的关系心理变量统计分析客户兴趣、爱好生活方式行为变量统计分析呼叫倾向分析(参阅名词解释)呼叫集中度(参阅名词解释)手机终端统计分析CDMA手机细分用户的手机购买倾向手机类型与消费的关系手机生命周期缺乏详细的职业信息缺乏客户收入信息缺乏客户家庭信息缺乏客户心理变量信息缺乏分析客户呼叫的集中度缺乏调查客户呼叫的情况需要收集用户的手机信息需要通过市场调研了解用户对手机的偏好项目未分析内容原因47呼叫集中度。指用户呼入呼出号码的集中程度。例如,年轻用户群中可能相当数量的呼入或出是与父母等家庭成员、同学或朋友的通话,呼入/呼出号码可能有着明显的集中倾向。又如,一些快递公司业务员的主要是接听公司的业务来电,因此呼入号码的集中度可能会非常高。商务用户中大多数的打给公司客户或合作伙伴,呼入或呼出号码比较分散。通过对移动用户呼叫集中度的分析可以有助于了解客户的移动消费特征。呼叫倾向分析。呼叫倾向一般指移动用户在使用移动时的以下一些行为:呼入/呼出时长呼入/呼出时长比呼入/呼出时间分布呼叫转移使用频率与使用习惯对于移动用户呼叫倾向分析的主要目的了解客户的移动业务消费行为特征,这些分析需要对客户的移动业务话费详单进行分析,需要大量的分析和计算,一般需要数据仓库和数据挖掘与分析工具的支持。6.客户分析中的实际问题与限制
①其它无法进行的分析—名词解释48示例基于所遇的问题,我们给中国联通的建议如下:联通应当发展长期的数据获取计划,以期望通过长期性的数据收集及丰富流程,能在将来采用更成熟的数据挖掘来建立更成熟与深入的客户获取模型。6.客户分析中的实际问题与限制
②建议49第一波营销活动第二波营销活动Offer测试与学习“Test&Learn”购买者信息人口信息生活方式信息反馈信息其他信息等等调整目标初始目标非购买者信息人口信息生活方式信息反馈信息其他信息等等短期来讲,我们建议基于年龄细分分析设计Offer。根据目前项目的计划,营销战役将通过直复营销渠道启动并测试。基于客户对营销战役Offer的响应,我们期望通过“测试与学习”方法实现更精细的分析,来进一步分析购买者/非购买者以年龄为基础的分析示例6.客户分析中的实际问题与限制
②建议(续)507.潜在客户列表清洗方法获取潜在客户数据后,就要根据直复营销的需求进行营销数据的准备工作。数据准备一般包括三个方面的内容:数据真实性评价、数据清洗和数据校准。数据清洗的主要目的是:根据直复营销的数据要求,排除列表数据中格式或意义不符合要求的数据。(需要注意的是不同的营销目的,对于数据的要求不同,也就是说同样一批数据对于不同的营销活动来说,具有不同的数据价值。)数据清洗的主要内容包括:错误数据/无效数据排除排除重名的数据(姓名//地址)格式标准化(姓名/等)地址标准化匹配/合并匹配/分解归类融合数据校准是为了最大限度的利用数据资源,通过一定的规则对于存在错误的数据进行校准,一般来说,校准后的数据有效性会低于不需校准的数据。数据需要校准有很多原因,以号码为例,号码的升位和校入错误是最主要的原因。数据校准量也是判断数据质量的重要因素,如果一批数据源中有超过20%的数据需要校准,我们一般认为这样的数据源质量较差,有效性也较差。接下来的几页分别描述了列表准备和清洗的主要内容51经验之谈自身数据的安全保有刻不容缓目前各大运营商的客户数据的安全保有存在区大问题。市面上可以找到各类客户数据的购买线索。建议联通在坚持使用合法来源数据的同时,加大对自身客户数据的安全管理,防止通过任何渠道流出公司。一系列的防范措施的制定与实施迫在眉睫。52地址和号码的准确性反馈机制(Feedbackmechanisms):准确的号码信息总是来源于通信公司。中国联通可以通过自已的客户数据信息来对列表数据的质量和号码准备性进行判断。姓名与地址清洗姓名标准化(Namestandardization):主要包括去掉姓名中的空格,英文姓名的标准化等。一般通过列表比对的方式来进行。地址标准化(ListConstruction):对于经常采取的直邮的方式来说,地址的标准化重要性不言而喻。主要的方式是将地址描述分段标准化为不同的层次。特殊名称和地址的清洗:出于一些特定原因,对于一些敏感的姓名和地址,需要通过工具来过滤或排除。数据字段的真实完整性Datafieldintegrity为保证列表的可用性,着要的问题就是要检查和确认列表字段内容和范围的真实完整性,确定每一数据字段拥有应当具备的信息。内容真实完整性(ContentIntegrity):内容真实性描述了数据的质量。在许多情况下,列表中的字段相对应当拥有的信息来说,仅有很少的信息。比如:一个字符型字段中可能包含“ABC”这样的字符串,其他类似的问题也可能有很多。范围正确性(DomainIntegrity):指数据字段的值是否具备正确的类型和范围,比如:年龄字段的值一般为0-100之间,性别字段应仅为男或女。数值正确性(ContextIntegrity):最关键的真实性是数据值本身的正确性。比如:列表中客户号码或地址是否正确?在绝大多数的情况下,真实性管理可以通过市场营销人员人工评估列表,也可以通过编写相应的程序来对列表数据进行检查。客户/潜在客户关键字客户号或潜在客户ID号。这一基本的关键字有助于帮助市场人员为客户及潜在客户附加稳定、不变的客户识别机制,并以此为基准来保持客户的历史记录:包括客户信息变化、地址变更、通话服务、等等。7.潜在客户列表清洗方法
①数据准备的主要内容537.潜在客户列表清洗方法
②数据总体评价数据整体评价数据样本数量:统计数据样本量,并进行分类。根据本次直复营销战役的目标,主要依据联系方式对潜在客户列表进行划分,如联通用户与非联通用户。数据存贮格式:数据存贮格式是关系数据库还是其他数据文件格式。标准化的数据库格式便于数据清洗和数据应用。联系号码质量:直复营销最直接的评价原则就是数据的到达率,即潜在目标客户的接通率。有两个步骤来评价这一点,一是通过小程序来校检联系号码的规范程度;二是通过抽取联通号码与联通内部的系统客户数据进行比对,从而推算出可能的接通率。列表数据时效性:需要对列表数据的收集时间进行评价,一般来说一年内的数据是比较理想的。数据完整性:检验直复营销需要的数据字段的完整性,通过程序来完成。数据真实性:判断列表数据中客户号码或地址是否正确,需要通过抽样来核查。按联系方式分类联通联系客户移动联系客户固定联系客户其他联系方式客户购房数据的样本分类其他分类因素客户性别客户国籍…按楼盘信息分类楼盘单价楼盘总价房屋类型楼盘区域数据收集时间最近三个月最近六个月最近一年来最近二年客户年龄是重要的分类方式547.潜在客户列表清洗方法
③数据清洗排重的主要目的是从列表数据中挑出已经成为客户的数据筛选出留有联通移动号码的数据以身份证进行比对核查(列表数据与联通客户列表)通过姓名进行比对核查(列表数据与联通客户列表)将联系相同的数据进行标志并排重2排重根据直复营销的目标和数据需求,排除以下数据没有号码的数据记录号码格式不对的数据记录没有邮寄地址的数据记录(针对直邮)明显错误且无法使用的数据1错误/无效记录排除4地址标准化3姓名/号码准确性在采取直邮的情况下,可以采取以下几种方式邮政编码校准:根据楼盘的位置,校准邮政编码。直邮的到达率:除与准确性相关外,也与楼盘的情况相关,如果租户较多,则目标到达率会较低。地址准确性:主要取决于信息采集的情况。地址标准化:本次可能没有时间进行地址标准化的工作。可以采取以下几种方式号码准确性估计:筛选出联通的号码,与内部数据进行比对。通过分析客户信息的准确性、入网时间等等来评估预测接通率和客户整体情况。号码抽样核对:对于非联通号码,采取抽样核查的方式。(主要用来预测数据准确率或接通率)557.潜在客户列表清洗方法
③数据清洗(续)根据数据某些字段的取值范围或属性,对数据进行归类号码:根据号码,对列表数据进行分类客户年龄:根据客户的年龄对列表数据进行归类楼盘情况:可以结合楼盘的单价或总价等情况对列表数据归类6归类Householding最经常使用的融合两个以上列表的方法通过身份证号或其他字段数据,将不同列表的数据合并成一个更完整的数据列表。如将号码排序后,将外部数据列表与移动用户数据进行比对。5匹配/合并Match/merge8更新融合Merge/purge7分解/过滤通过两个或多个不同的列表,以比对的方式对数据的某些字段进行更新,从而产生新的数据。例1:用潜在客户列表数据与移动公司的客户消费数据进行比对,从而产生更完整的数据列表。例2:将移动客户数据与公安户政部门的公民身份信息比对,从而更新移动客户数据信息。经常用于客户数据的更新和校准。将列表数据根据不同的营销目标需要进行分解,以产生出适合不同营销目标要求的列表经常采用的方式是建立客户模型,设定与该客户模型相适应的过滤机制,从而生成相应的客户列表567.潜在客户列表清洗方法
④数据真实性与数据较准数据字段的较准 本项目由于时间和条件的限制,没有机会对于源数据进行校准,但从长期来考虑,数据校准对于大规模数据营销来说,至关重要。官方数据比对:对于客户姓名、身份证号等信息可以通过公安机关的公民身份信息系统来进行较准。(国家公安部构建的全国公民身份信息系统是最直接最准确的数据较准源,该系统统一了全国各地市公安机关户证部门的公民身份信息,可以通过批量身份信息核查的方式校准源数据)内部数据融合:将获取的外部数据与中国联通内部确认过的客户数据进行融合,也是有效较准数据准确性的重要方法。外部数据融合:通过合作的方式,与外部数据源进行相应的数据比对,融合外部数据较准的信息。无效字段排除:对于数据源中信息可信度较差,或是信息不完整的一些字段,则需要在分析时进行排除。当然这些字段也可以通过相应的数据处理进行完善和校准。数据校准的所需要的时间和成本投入都是非常高,需要根据具体的应用需求。从长期来看,数据都有一定的时效性,需要周期性校准。国外很多公司都会将一段时间未联系过的客户数据(如两年)交由客户服务中心进行呼出数据核准,即是客户维系的服务,同时也校准了数据。数据校准的成本考虑可以采取以下几种方式号码准确性:筛选出联通的号码,与内部数据进行比对。可以评估预测到达率和客户整体情况。号码抽样核对:对于非联通号码,抽样核对。准确性评价不仅可以用来做为评价数据源、确定数据获取成本的重要依据,还是进行营销预测的重要依据。姓名/号码准确性57进行数据清洗的人员必须具备以下的能力:对SQL(StructuredQueryLanguage)的认识和实际操作经验。必须能够篇写SQL电脑程序。对客户数据库数据模型和数据字段的了解。在进行清洗工作中,工程师需要在数据库中选择正确的字段。譬如说,客户的地址可能在数据库中由好几个字段结合起来,工程师必需懂得使用正确的字段了解数据清洗原则(如客户分析报告的P57-58清洗的原理。譬如如何去进行错误/无效记录排除,排重,确保姓名/号码准确性等工作)在测试前联通计费部工程师普遍上都拥有1)与2)技能。而技能3)则是通过本项目的执行后获取了这方面的经验。SQL-示例7.潜在客户列表清洗方法
⑤进行数据清洗的人员所具备能力588.潜在客户列表清洗结果
①深圳联通潜在客户数据清洗记录数据来源是深圳登记购房者的数据,数据内容较丰富,主要包括以下数据项:购房者姓名、身份证号、联系、所购楼盘区域、楼盘名称、具体楼号房号房屋销售类型、户型、面积、总价签约日期、付款方式、入住时间等从清洗结果看,数据质量较好,本次直复营销主要以本地呼出为主,经过排错、排除异地固话、姓名排重后得到的数据列表为85269条,初步的符合率大约在75%左右。由于深圳移动获取的数据登记时间是近一年的购房数据民,而深圳固话升位时间是2002年6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 辽宁省锦州市北镇市第一初级中学2025年中考全国统考预测密卷(2)化学试题试卷含解析
- 辽宁省阜新市新邱区阜新二中2025届高三第三次适应性训练历史试题含解析
- 航空发动机原理与构造试题及答案
- 中山市板芙镇湖洲小学功能室专用设备采购第二次招标文件
- 中央电教馆全部高中数学教案-中央电教馆资料(第六章不等式)
- 2025年度信息技术与通信行业软件开发外包服务合同
- 雇主月嫂合同协议模板
- 门购销合同补充协议
- 韵达快递员转让合同协议
- 颗粒土材料供货合同协议
- SL631水利水电工程单元工程施工质量验收标准第1部分:土石方工程
- (正式版)HGT 22820-2024 化工安全仪表系统工程设计规范
- 给水处理厂净水构筑物设计计算示例
- 内蒙古鄂尔多斯达拉特经济开发区(达拉特产业园区块)区域性地震安全性评价报告
- 集体备课 初中英语情态动词讲解 练习及答案
- 突发公共卫生事件流行病学-课件
- 马拉松体检表
- 利巴韦林注射液生产工艺验证方案
- 高中音乐 鉴赏 第五单元《诗乐相彰》第九节 独唱曲 课件
- 恒强文字多纱嘴组设定
- 外科护理学练习题库判断题及答案
评论
0/150
提交评论