版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘文献学习第1页,共20页,2023年,2月20日,星期六文献简介及选择理由DataMiningApplicationsinCustomerChurnManagement
是一篇关于数据挖掘在顾客关系管理(客户流失管理)中的应用的文献综述,主要涉及各种数据挖掘技术和各种技术应用的统计。客户流失管理是客户管理的核心,基于此研究背景贴近生活,易于理解。文中提到的多种数据挖掘方法模型覆盖面广,拓宽学习面。第2页,共20页,2023年,2月20日,星期六文献结构引言:客户流失管理的重要性介绍数据挖掘技术,方法分类统计各种技术应用,研究趋势结论、后续研究方向第3页,共20页,2023年,2月20日,星期六文献主要内容顾客流失管理的重要性
核心市场策略:保持现有客户防止客户流失
获得一个新客户的费用是留住一个客户费用的5-10倍
在很多产业客户粘性增加5%即会带来25%-95%的净利润增加研究背景及现状
关于数据挖掘在客户流失管理的应用的文献综述很少
现有文献,E.W.T.Ngai,LiXiuandD.C.K.Chau,“Applicationofdataminingtechniquesincustomerrelationshipmanagement:ALiteraturereviewandclassification,”是对82篇文章的文献综述,从客户关系维度(客户识别、客户吸引、留住和发展客户)和数据挖掘分类(联合、分类、聚类、预测、回归分析、序列分析、可视化)进行研究。欠缺:研究重点为客户粘性、客户流失管理,没有涉及具体的数据挖掘方法,分类不明确。第4页,共20页,2023年,2月20日,星期六文献主要内容
本文从数据挖掘方法出发对32篇文献进行分类,统计,研究趋势,填充了客户流失管理技术方法的空白数据挖掘方法基本定义:
﹡神经网络或称作连接模型(ConnectionistModel)它是一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。第5页,共20页,2023年,2月20日,星期六数据挖掘方法基本定义决策树(DecisionTrees)一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果。回归分析(LogisticRegression)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。随机森林(RandomForests)是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。可以产生高准确度的分类器,处理大量的输入变量。第6页,共20页,2023年,2月20日,星期六数据挖掘方法基本定义支持向量机方法(SupportVectorMachine)是分类的一个机器学习的过程。这是一种建立在统计学习理论的VC维理论(对一个指标函数集,如果存在h个样本能够被函数集中的函数按所有可能的2h种形式分开,则称函数集能够把h个样本打散;函数集的VC维就是它能打散的最大样本数目h。)和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。第7页,共20页,2023年,2月20日,星期六数据挖掘技术角度(DataMiningPerspective)对近期(03-09年)的32篇reference文献根据所采用的技术方法进行分类,分类如表一table1
对使用最多的前三种方法:神经网络(NeuralNetworks)、决策树(DecisionTrees)、回归分析(LogisticRegression)学习,作简要介绍。第8页,共20页,2023年,2月20日,星期六根据数据挖掘方法对32篇文献进行分类表一给出各方法的使用频数,对于使用最多的前九种方法,选择在较符合各种指标的文献(表中黑体文献),作出简要解释。第9页,共20页,2023年,2月20日,星期六数据挖掘方法神经网络(NeuralNetworks)
【17】P.C.Pendharkar,“Geneticalgorithmbasedneuralnetworkapproachesforpredictingchurnincellularwirelessnetworkservices,”使用遗传算法优化网络权重。研究基于移动通信环境,该文使用交叉验证(最大似然法cross-validationmethod)和精确模拟得出两个功能良好模型。该篇文献采用循环估计的方法,这一方法相对统计方法是一大改进。第10页,共20页,2023年,2月20日,星期六数据挖掘方法决策树(DecisionTree)
【11】J.Qietal.,“ADTreesLogitmodelforcustomerchurnprediction,”根据感受性曲线的单一指标(ROC曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,是在几种不同的判定标准下所得的结果)选择输入变量,再将此变量分组,每个分组作为独立选择决策树模型的输入变量,得出的结果再作为洛基模型(logitmodel-一种回顾分析模型)的输入变量,使用回归特征消除的方法(Recursivefeatureelimination)忽略不相关因素,洛基模型将对客户流失进行预测。第11页,共20页,2023年,2月20日,星期六数据挖掘方法回归分析(LogisticRegression)【6】Y.M.Zhang,J.Y.Qi,H.Y.Shu,andJ.T.Cao,“AHybridKNN-LRClassifieranditsApplicationinCustomerChurnPrediction,”分析了独立性和目标参数之间的复杂关系,并采用K-近邻法(一种数据分类方法:将样本集中的每个样本都作为模板,用测试样本与每个模板做比较,看与哪个模板最相似,就按最近似的模板的类别作为自己的类别)对这种复杂关系进行处理,找到依据单一的输入变量,改变每个独立的特征值。从准确性和感受曲线拟合上,这种方法在处理4个独立数据集时比较贴近。第12页,共20页,2023年,2月20日,星期六根据文献采用方法、发行年份维度对文献进行分类统计
表2:
神经网络一直是研究的重要方法。原因:在处理输入与输出的复杂非线性关系,抗噪(不受输入变量的不同类型干扰)时都十分适用。自适应增量算法,梯度递增机制,线性判别分析等方法使用频率较低,还有待深入探究。第13页,共20页,2023年,2月20日,星期六分类统计柱状图第14页,共20页,2023年,2月20日,星期六出版物中客户流失管理(数据挖掘方法)文献比率
在这一研究领域的活跃出版物是ExpertSystemswithApplications,感兴趣的同学可查阅相关文献,对此做深入研究。第15页,共20页,2023年,2月20日,星期六小结本文从技术和统计角度对于数据挖掘在客户流失管理中的应用作出概述给研究者和生产商提供这一领域的研究重点和趋势,并且出版商对于这一领域的文献越来越关注。本文只涉及少量文献,对于知识挖掘,样本统计,模型评估未作深入探究。第16页,共20页,2023年,2月20日,星期六ThankYou!组员:尹鹏珍SA112040
杨金晶SA11204038袁茜茜SA11204039李璐涵SA11204043赵蕊SA11204040第17页,共20页,2023年,2月20日,星期六References[1]E.W.T.Ngai,LiXiuandD.C.K.Chau,“Applicationofdataminingtechniquesincustomerrelationshipmanagement:Aliteraturereviewandclassification,”ExpertSystemswithApplications,vol.36,2009,pp.2592–2602.[2]K.CoussementandDirkVandenPoel,“Churnpredictioninsubscriptionservices:Anapplicationofsupportvectormachineswhilecomparingtwoparameter-selectiontechniques,”ExpertSystemswithApplications,vol.34,2008,pp.313–327.[3]Bong-HorngChu,Ming-ShianTsaiandCheng-SeenHo,“Towardahybriddataminingmodelforcustomerretention,”Knowledge-BasedSystems,vol.20,2007,pp.703–718.[4]X.Hu,“ADataMiningApproachforRetailingBankCustomerAttritionAnalysis,”AppliedIntelligence,vol.22,2005,pp.47–60,Springer.[5]H.S.Song,J.K.Kim,Y.B.ChoandS.H.Kim,“APersonalizedDefectionDetectionandPreventionProcedurebasedontheSelf-OrganizingMapandAssociationRuleMining:AppliedtoOnlineGameSite,”ArtificialIntelligenceReview,vol.21,2004,pp.161–184.[6]Y.M.Zhang,J.Y.Qi,H.Y.Shu,andJ.T.Cao,“AHybridKNN-LRClassifieranditsApplicationinCustomerChurnPrediction,”Proc.theIEEEInternationalConferenceonSystems,ManandCybernetics,Oct.2007,pp.3265–3269.[7]G.Song,D.Yang,L.Wu,T.Wang,Sh.Tang,“AMixedProcessNeuralNetworkanditsApplicationtoChurnPredictioninMobileCommunications,”Proc.SixthIEEEInternationalConferenceonDataMining-Workshops(ICDMW'06),2006.[8]JamesJ.H.Liou,“Anoveldecisionrulesapproachforcustomerrelationshipmanagementoftheairlinemarket,”ExpertSystemswithApplications,vol.36(3),April2009,pp.4374-4381.[9]M.Zan,Z.Shan,L.Li,L.Ai-jun,“APredictiveModelofChurninTelecommunicationsBasedonDataMining,”Proc.IEEEInternationalConferenceonControlandAutomation,IEEEPress,2007.[10]Yi-FanWang,Ding-AnChiang,Mei-HuaHsu,Cheng-JungLin,IlongLin,“Arecommendersystemtoavoidcustomerchurn:Acasestudy,”ExpertSystemswithApplications,vol.36,2009,pp.8071–8075.第18页,共20页,2023年,2月20日,星期六References[11]J.Qietal.,“ADTreesLogitmodelforcustomerchurnprediction,”AnnulsofOperationsResearch,vol.168,2009,pp.247–265,Springer.[12]Shin-YuanHung,DavidC.YenandHsiu-YuWang,“Applyingdataminingtotelecomchurnmanagement,”ExpertSystemswithApplications,vol.31,2006,pp.515–524.[13]J.ZhaoaandXing-HuaDang,“BankCustomerChurnPredictionBasedonSupportVectorMachine:TakingaCommercialBank'sVIPCustomerChurnastheExample,”Proc.4thInternationalConferenceonWirelessCommunications,NetworkingandMobileComputing,2008(WiCOM'08),Oct.2008,pp.1-4.[14]Y.XieandX.Li,“ChurnPredictionwithLinearDiscriminantBoostingAlgorithm,”Proc.theSeventhInternationalConferenceonMachineLearningandCybernetics,Kunming,July2008.[15]HongmeiShao,GaofengZhengandFengxianAn,“ConstructionofBayesianClassifierswithGAforPredictingCustomerRetention,”Proc.FourthInternationalConferenceonNaturalComputation,IEEEComputerSocietyPress,2008.[16]Y.Xie,X.Li,E.W.T.NgaiandW.Ying,“Customerchurnpredictionusingimprovedbalancedrandomforests,”ExpertSystemswithApplications,vol.36,2009,pp.5445–5449.[17]P.C.Pendharkar,“Geneticalgorithmbasedneuralnetworkapproachesforpredictingchurnincellularwirelessnetworkservices,”ExpertSystemswithApplications,vol.36,2009,pp.6714-6720.[18]K.Coussement,DirkVandenPoel,“Improvingcustomerattritionpredictionbyintegratingemotionsfromclient/companyinteractionemailsandevaluatingmultipleclassifiers,”ExpertSystemswithApplications,vol.36,2009,pp.6127–6134.[19]S.LessmannandS.Voß,“Areferencemodelforcustomer-centricdataminingwithsupportvectormachines,”EuropeanJournalofOperationalResearch,vol.199(2),Dec.2009,pp.520-530.第19页,共20页,2023年,2月20日,星期六References[20]J.BurezandD.VandenPoel,“Handlingclassimbalanceincustomerchurnprediction,”ExpertSystemswithApplications,vol.36,2009,4626–4636.[21]Ding-AnChiang,Yi-FanWang,Shao-LunLeeandCheng-JungLin,“Goal-orientedsequentialpatternfornetworkbankingchurnanalysis,”ExpertSystemswithApplications,vol.25,2003,pp.293–302.[22]G.Zhang,“CustomerRetentionBasedonBPANNandSurvivalAnalysis,”Proc.InternationalConferenceonWirelessCommunications,NetworkingandMobileComputing,2007(WiCom),Sept.2007,pp.3406-3411.[23]W.BuckinxandD.VandenPoel,“Customerbaseanalysis:partialdefectionofbehaviourallyloyalclientsinanon-contractualFMCGretailsetting,”EuropeanJournalofOperationalResearch,vol.164,2005,pp.252–268.[24]B.Larivie`re,D.VandenPoel,“Investigatingtheroleofproductfeaturesinpreventingcustomerchurn,byusingsurvivalanalysisandchoicemodeling:Thecaseoffinancialservices,”ExpertSystemswithApplications,vol.27,2004,pp.277–285.[25]LianYan,MichaelFassinoandPatrickBaldasare,“PredictingCustomerBehaviorviaCallingLinks,”Proc.InternationalJointConferenceonNeuralNetworks,Montreal,Canada,August2005.[26]EXu,S.Liangshan,G.XuedongandZ.Baofeng,“AnAlgorithmforPredictingCustomerChurnviaBPNeuralNetworkBasedonRoughSet,”Proc.the2006IEEEAsia-PacificConferenceonServicesComputing(APSCC'06).[27]“PredictingCustomerBehaviorinTelecommunications,”L.Yan,R.H.Wolniewicz,R.Dodier,IEEEIntelligentSystems,IEEEComputerSociety.[28]N.Glady,B.BaesensandC.Croux,“Modelingchurnusingcustomerlifetimevalue,”EuropeanJournalofOperationalResearch,vol.197,2009,pp.402–411.[29]Jae-HyeonAhna,Sang-PilHanaandYung-SeopLee,“Customerchurnanalysis:Churndeterminantsandmediationef
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 班组安全代表职能与责任培训
- 安全大检查管理办法及典型要求培训课件
- 财产约定分配协议书
- 账户共同管协议书
- 货物调解协议书
- 贫困患者还款协议书
- 阑尾类癌护理查房
- 石油储备项目可行性研究报告
- 史料征集项目可行性研究报告
- 年产500吨高端催化剂及液晶中间体项目可行性研究报告模板-备案审批
- 生命教育与心理健康教育的融合路径研究
- 2025年武汉铁路局集团有限公司招聘笔试参考题库含答案解析
- 2025年高考政治一轮复习统编版选择性必修3《逻辑与思维》必背主观题答题模板
- 【MOOC】人因工程学-东北大学 中国大学慕课MOOC答案
- 火灾现场触电应急处理方案
- GB/T 44736-2024野生动物保护繁育象
- 人教版九年级化学 实验活动2 水的组成及变化的探究(学习、上课课件)
- 国家义务教育质量监测(2024年) 中小学生心理健康测试试卷
- 大学生的生理特点与体育运动以及体育卫生保健
- 【高中语文】《屈原列传》课件++统编版+高中语文选择性必修中册
- 重庆理工809数据结构考纲
评论
0/150
提交评论