下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
利用数据挖掘实现电信行业客户流失分析李军数据仓库之路原创资料://dwway利用数据挖掘实现电信行业客户流失分析随着世界经济的全球化、市场的国际化和我国加入WTO步伐的加速,国际化的市场环境要求国内的公众电信运营企业在经营管理上向国外先进的电信运营企业看齐,以迎接电信运营业的国际化竞争。同时随着国家改革的深化,国内电信业的市场环境已渐趋合理且竞争将日益加剧。国内、国际电信业的如此态势,对公众电信运营企业的服务内容、服务方式、服务质量、经营管理以及服务意识,已提出了严峻的挑战。企业的经营模式和服务体系正以客户的价值取向和消费心理为导向,真正体现“创造需求”、“引导消费”的现代客户服务意识与理念。在电信企业面向市场,面向国内外众多的竞争者,努力创造更高价值的同时,客户流失的不断增加,客户平均生命周期的不断缩短严重影响了电信企业的发展。那么,在激烈的市场竞争和不断变化的市场需求面前,如何最大程度的降低客户的流失率呢?常用的方法之一就是利用数据挖掘技术。数据挖掘技术是目前数据仓库领域最强大的数据分析手段。它的分析方法是利用已知的数据通过建立数学模型的方法找出隐含的业务规则,在很多的行业已经具有成功的应用。在电信行业的应用领域主要有客户关系管理,客户欺诈分析,客户流失分析,客户消费模式分析,市场推广分析等。那么,在客户流失分析系统中,如何应用数据挖掘技术呢?主要方式是根据以前拥有的客户流失数据建立客户属性、服务属性和客户消费数据与客户流失可能性关联的数学模型,找出客户属性、服务属性和客户消费数据与客户流失的最终状态的关系,并给出明确的数学公式。只要知道客户属性、服务属性和客户消费数据,我们就可以计算出客户流失的可能性。市场/销售部门可以根据得到的数学模型随时监控客户流失的可能性。如果客户流失的可能性过高,高于事先划定的一个限度,就可以通过多种促销手段提高客户的忠诚度,防止客户流失的发生,从而可以大大降低客户的流失率。基于严格数学计算的数据挖掘技术能够彻底改变以往电信企业在成功获得客户以后无法监控客户的流失,无法实现客户关怀的状况,把基于科学决策的客户关系管理全面引入到电信企业的市场/销售工作中来。通常一个完整的数据挖掘过程由业务问题定义,数据选择,数据清洗和预处理,模型选择与预建立,模型建立与调整,模型的评估与检验,模型解释与应用等多个步骤组成。这里我们以个人客户流失为例说明各个步骤的功能。1.业务问题的定义业务问题的定义要求非常明确。任何不明确的定义都会严重影响模型的准确和应用时的效果。例如:在客户流失分析系统中,需要明确客户流失的定义。在客户流失分析中,主要有两个核心的变量:1.财务原因/非财务原因;2.主动流失/被动流失。客户的流失类别根据这两个核心变量可以分为四种。其中自愿的、非财务原因的流失客户往往是高价值的、稳定的客户。他们会正常的支付自己的服务费用,并对市场活动有所响应。所以这种客户才是我们真正想保持的客户。而真正在分析客户流失的状况时,我们还必须区分公司客户与个人客户,不同服务的贡献率,或者是不同客户消费水平流失标准的不同。举例来说,对于用一种新服务替代原有服务的客户,是否作为流失客户?又或者,平均月消费额为2000元左右的客户,当连续几个月消费额降低到500元以下,我们就可以认为客户发生流失了,而这个流失标准就不能适用于原本平均月消费额就为500元左右的客户。实际上,在国外成熟的电信行业客户流失分析系统中,经常是根据相对指标判别客户流失。市场调查表明,通常大众的个人通信费用约占总收入的1%-3%,当客户的个人通信费用降低到远远低于此比例时,就可以认为客户流失发生。所以,客户流失分析系统必须针对各种不同的种类分别定义业务问题,进而分别进行处理。2.数据选择数据选择包括目标变量的选择,输入变量的选择和建模数据的选择等多个方面。目标变量的选择目标变量表示了数据挖掘的目标。在客户流失分析应用目标变量通常为客户流失状态。依据业务问题的定义,我们可以选择一个已知量或多个已知量的明确组合作为目标变量。目标变量的值应该能够直接回答前面定义的业务问题。在客户流失分析系统中,我们实际面对的流失形式主要有两种:账户取消发生的流失和账户休眠发生的流失。对于不同的流失形式,我们需要选取不同的目标变量。对于账户取消发生的流失,目标变量直接就可以选取客户的状态:流失或正常。对于账户休眠发生的流失,情况就较为复杂。通常的定义是持续休眠超过给定时间长度的客户被认为是发生了流失。但是,这个给定时间长度定义为多长合适呢?另外一方面,每月的通话金额低于多少就可以认为是客户处于休眠状态?或者要综合考虑通话金额,通话时长和通话次数来划定流失标准?实际上,目标变量的选择是和业务问题的定义紧密关联在一起的。选择目标变量所要面对的这些问题,都需要业务人员给予明确的回答。输入变量的选择输入变量用于在建模时作为自变量寻找与目标变量之间的关联。在选择输入变量时,我们通常选择两类数据:静态数据和动态数据。静态数据指的是通常不会经常改变的数据,包括服务合同属性,如服务类型,服务时间,交费类型等等;和客户的基本状态,如性别,年龄,收入,婚姻状况,受教育年限/学历,职业,居住地区等等。动态数据指的是经常或定期改变的数据,如每月消费金额,交费纪录,消费特征等等。输入变量的选择应该在业务人员帮助下进行,这样才能选择出真正与客户流失可能性具有潜在关联的输入变量。业务人员经常在实际业务活动中深深感觉到输入变量与目标变量的内在联系,但是却无法以量化表示出来。在这种情况下,数据挖掘的工作往往能够得到良好的回报。在一时无法确定某种数据是否与信用卡流失可能性有关联时,应该选取,在后续步骤考察各变量分布情况和相关性时再决定取舍。建模数据的选择通常电信行业客户流失的方向有两种。第一种是客户的自然消亡。例如由于客户的身故,破产,迁徙,移民等原因,导致客户不再存在。或者是由于客户的升级,如GSM升级为CDMA,造成特定服务的目标客户消失。第二种是客户的转移流失。通常指客户转移到竞争对手享受服务。绒显然昨第二机种流喜失的复客户轻才是址电信键企业傍真正释关心怨的,次对企赛业具氧有挽盒留价活值的伐客户蕉。因是此,顷我们器在选土择建沟模数津据时喷必须林选择耀第二粥种流念失的妄客户庭数据报参与箱建模榜,才壳能建掀立出纺较精歉确的句模型规。损3类.骆数据吸清洗彻和预谷处理侧数据俗清洗次和预讽处理耀是建劝模前妹的数悠据准沫备工革作。层数据唤清洗册和预轮处理皇的目您的一经方面庸保证督建模怖的数连据是源正确寺和有吓效的蜡;另巾一方屋面,枕通过历对数脾据格缩式和乞内容怒的调淋整,恋使建位立的遇模型泻更加齐准确忧和有长效。现数据火整理御的主汤要工橡作包咏括对哀数据四的转堵换和叼整合颈,抽业样,充随机帅化,乞缺失绵值的篮处理哭等等色。数齿据转殃换和日整合柱的工肝作目钟的就娇是为柳了保感证数速据的闸质量疫和可复用性撤。例轿如,拣样本嫁数据锯中客托户最叛终流问失的溜数据销比例幻较低闲,只走占全竿部数民据的戏8%俭。用瑞这样收的数膀据建陷模不励容易恋找出恋流失稼了的匙客户纲的特界征,客建立衫精确解的模淋型。物我们蹄可以捆按比穷例抽应取未胜流失秩客户名和流浊失了缓的客配户,主把两谁者合详并构餐成建遇模的切数据工源。闷还有咽,在光建模傻之前览,我音们建鼠议把监样本宝数据贷分为诉两到丑三部互分。矩一部障分用馅来建晨模,宇其他穷数据光用来红对模椒型进英行修刺正和焦检验光。一婚个模亲型在材建立迫以后她,需贿要用济大量换的数缠据对蛙它进冒行检左验。仿只有碍经过帮实际咳数据宏检验趣并被将证明叔正确翻的模斩型才臭能得滔到充践分的名相信炊。如栽果一挨个未讽经检这验的倾模型稻被贸留然推朋广使拘用,电就有啄可能括由于筐模型泡的不五精确慨带来炸应用狸的损鬼失。罗所以梳我们圈通常棋会把镜数据积分为镇两部董分:散2/同3属的数玩据用央来建畜模,话1/缩3晕的数梁据用抬来检讨验。酒4伶.筋模型世选择般与预林建立景到底六哪些咸变量笑和客埋户流洪失概姜率有腿密切般关系吗呢?书我们奖需要踪利用帆数据者挖掘薄工具聚中的预相关吉性比哨较功忌能找秩出每鞭一个脖输入溪变量克和客筐户流漠失概阅率的障相关阀性。缩通过斤这样拾的比萝较选柿择,稍我们逝可以蚂删除耳那些俭和客疲户流讽失概弃率相池关性座不大稀的变趣量,它减少登建模豆变量迹的数限量。眨这样毅不仅钩可以狠缩短狂建立军模型凤的时涌间,艺减小洒模型傍的复练杂程听度,朱而且博有时印还能妹够使循建立岁的模迅型更诱精确轧。肝Or兰ac盾le蠢他的数冶据挖竖掘工蜘具能壮够提欲供包霉括决寻策树阳,神批经网逼络,舅近邻狼学习悉,回娱归,陷关联哲,聚碧类,补贝叶棕斯判污别等猜多种乎建模定方法友。但艺是哪稿种方盼法最俯适合谈用于决信用饭卡流放失分誉析呢榴?我领们可苹以使晓用多挠种建皮模方攻法,春预建锦立多槐个模狠型,栋再比粥较这民些模祥型的合优劣渔,从带而选欣择出滩最适滩合客川户流川失分喂析的阁建模值方法慨。伞Or胸ac旦le北的数灵据挖厕掘工虹具提滋供了枣建模遍方法拐选择鸣的功陶能,职它能付够预旋建立兰决策抓树,院神经竞网络蜓,近竞邻学吹习,惭回归每等多都种方添法,斧十个宿模型去供使负用者愿选择喂。它厨还能福自动美判别俯哪一膛个是猎最优久的模钩型,摧供使纲用者视参考复。在略预建飘模之粉前,灿使用骑者还占能够器改变括模型话的参拿数,东从而舌根据袭实际仇情况尤生成旺更好颜的模渗型。红5.抬瓣模型咱建立驾与调阀整茫模型伙建立辛与调抹整是浑数据办挖掘毛过程免中的添核心结部分元。通畜常这苦部分躲工作谎会由淘专业收的分求析专弯家完疗成。深需要司指出姜的是无,不本同的卡商业考问题钓和不斜同的怠数据绵分布些与属设性,带经常蝇会影摄响到渣模型草建立仓与调倦整的鸭策略滚。而水且在秀建模暮过程臭中还题会使堤用多类种近颂似算娇法来凶简化蓝模型哭的优朝化过依程。已所有发这些提处理桃方法域,对疾模型旨的预葱测结傲果都漫会产返生影灿响。悟所以辛在模侄型建寄立与序调整侦过程锤中,首需要骨业务室专家成参与愉制定宴调整帽策略与,避慈免不松适当恭的优快化导栏致业盗务信晋息的百丢失弄。誉6嚼.间模型食的评注估与取检验糖模型良的评奶估应浪该利绸用未鱼参与也建模龄的数粪据进勺行,进这样还才能补得到说准确基的结筋果。必如果特我们柜使用嚷建模凭的数收据对柄模型冤进行敞检验侵,由围于模六型就禁是按犯照这带些数商据建含立的和,检回验结跌果自丧然会格很好焰。但茧是一闯旦运叶用到亦实际蓬数据远中,视就会正产生寻很大示的偏斜差。霉所以做我们矛必须傅使用童未参协与建他模的茧数据盯对模较型进窗行检妇验。槽检验乞的方输法是房对已烫知客呢户状剪态的宿数据恰利用双模型披进行荒预测筒,得买到模择型的退预测寺值,日和实册际的生客户财状态筑相比讨较。拖预测舌正确算值最馅多的腿模型眉就是蜂最优兼的模延型。贝下图臂就是坐Or挠ac炸le车数据灭挖掘哨工具永的模差型预贵测结坊果比对较图灯,我眼们可糖以通炕过观举察模航型的耗预测撤准确及度曲献线评摇价模余型的爬预测说效果柳:赤7仿.盈模型达解释着与应搬用劈得到维最优歪的模日型以示后,送我们仔需要介业务袖人员紧针对惰得到音的模等型做锅出一哨些合置理的天业务洁解释狗。例张如:劝我们补可能托发现任在开头户时谊长与烈的客疗户的爆流失鲜可能牛性相种关度迷较高纠。那焰么,香业务厚人员芹利用横业务丈知识洽可以残解释它为:挖由于英客户点在使壮用一灾定年毒限后竿需要猪换领钞新给SI鸣M方卡,喉而换乱领新锻SI佣M尸卡的剃手续爹比较狡繁琐援或时从间周伞期过臂长,辫客户饥宁愿仁去申侨请新惯号码女,导震致流宰失可发能性犯上升质量。另通过购对模教型做扩出合辟理的盆业务雀解释由,我请们就亮有可讨能找豪出一洞些以愉前没磨有发潜现,蝴但实收实在晋在存买在的猾潜在衬的业滑务规蒸律。房找出码这些土规律驶后,赶就可报以指蛾导我伐们的康业务确行为绿。另坚一方避面,卸如果鲁真的他能够赠根据督业务逗知识然解释骗我们度得到乳的数欣学模并型,速也说刘明了室这个岛数学港模型后在业缓务上贼的合谁理性积,我馅们就眠更能绣够大霉胆应别用于码业务踢活动荐中了榴。漂模型界的真旁正应励用推耳广必谦须谨屈慎从辨事。饿我们犬可以孟先选陪择一嫂个试附点单徒位应用用模咐型,秆避免忍由于访模型蒸的不泄精确星导致眨高额尊的业职务损本失。撇试点效的时种间可往以界钢定在循半年步到一箱年,舌期间披必须纷随时沿注意后模型辫应用缎的收籍益情歌况。拼一旦红发生燃异常枕偏差沉,应斑该立应即停贴止,熟检查眨偏差补是由滥于模狼型本薯身的垦原因洽还是凡由于怖应用阔环境狸发生撒了重睛大变遣化,羡从而旅导致境模型墓不再效适用搬。如角果是袍由于伟模型努本身礼不准拴确造彼成的志,可申以对拘模型背不精扬确的抱部分忠进行爽修正节。如贼果是功由于池应用槽环境皂发生持了重流大变与化,阻就应艺该
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中英语多义词掌握策略
- 市政管道安装过程质量检查方案
- 财务总监关键绩效指标体系设计方案
- 教师教学评价标准体系建设指南
- 语文教育读后感写作思路及范文模板
- 可再生能源应用与能源管理方案
- 2026年液化石油气瓶市场调研报告
- 银行业监管问题调研报告
- 2026年杯垫项目立项申请报告
- 中小企业企业战略规划范文
- 婴幼儿托育生涯发展展示
- 餐饮行业三方比价制度的创新实践
- 湘教版八年级数学上册压轴题攻略专题18二次根式有关运算压轴题六种模型全攻略(原卷版+解析)
- (正式版)FZ∕T 14004-2024 再生纤维素纤维印染布
- 妈妈咪呀 mamma mia二部合唱简谱
- 初中物理实验目录及相关器材大全
- 歌曲《莫尼山》艺术风格与演唱实践探析
- 谷歌案例分析
- 劳动保障协管员管理办法
- 【课件】7-1 慢充不充电故障诊断与排除
- 透过性别看世界学习通章节答案期末考试题库2023年
评论
0/150
提交评论