




已阅读5页,还剩15页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电信客户关系管理中数据挖掘应用的初步研究目录1绪论11电信客户关系管理研究背景及意义12电信客户关系管理的现状2客户关系管理体系框架21客户关系管理定义211客户关系管理概念212客户的分类22客户关系的选择221客户关系选择类型222企业应用客户关系管理原因23客户关系管理软件功能分析231客户关系管理系统结构232客户关系管理系统架构功能233客户关系管理系统基本模块功能24客户关系管理软件系统功能分析3数据挖掘基础理论31数据挖掘理论在客户关系管理中的研究32数据预处理技术321数据清洗322数据集成和变换33数据挖掘技术的方法(决策树算法为例)34数据挖掘相关理论研究341数据挖掘原语和系统结构342数据挖掘的数据和类型343数据挖掘查询语言DMQL344概念描述35数据挖掘在电信客户关系管理中应用4数据挖掘决策树算法在电信客户关系管理的应用41决策树分类和预测研究411决策树判定归纳42决策树分类算法在电信客户关系管理应用案例决策树算法在电信客户购买3G网络服务实验412决策树剪枝43影响实验因素研究5总结参考文献1绪论11电信客户关系管理研究背景及意义现阶段随着电信运营商激烈的竞争和买方市场的形成,客户对电信产品选择的范围日趋扩大。如何最大限度的争取客户购买产品和服务,成为电信运营商必须面对的问题。市场竞争的一个优势就是对客户的利益最大满足,客户决定企业经营活动。中国电信公司由产品为中心企业经营模式逐渐转变以客户为中心企业经营模式。由此观之,客户关系管理理论对电信企业有重要作用。与此同时,信息技术的快速发展为客户关系管理系统的实现提供了强大的技术支持。中国电信对客户关系管理的建设十分重视,它不断加强自身的客户关系管理理论的研究与应用。而我们知道,客户关系管理是适应企业的发展需要而产生的,现阶段来说,客户已经成为一种决定企业发展的力量1。企业通过对客户进行分析和解释,采取必要的措施,保持客户对企业的忠诚度和满意度。数据挖掘技术为对客户关系管理系统中的客户数据的挖掘提供了强有力的支持,挖掘结果的解释对找到有价值的客户群体也有非常重要的作用,最终这一技术为企业的科学决策提供强有力的数据支持。12电信客户关系管理的现状电信客户关系管理系统是电信运行系统的重要组成部分。中国电信集团公司以数据为中心,以应用为向导逐步实现电信客户关系管理系统。无可厚非,客户关系管理软件在电信企业的实施给企业产生了积极的影响。电信客户关系管理系统开发和建设是漫长的摸索过程,必须经过实践考验和验证。但由于电信客户的分布地域广泛,带来电信客户关系管理系统开发的困难,中国电信客户关系管理系统主要集中在集团公司、省级公司和重点城市的开发和使用,对全部的电信营业网点的使用有所欠缺。研究重点是如何在集团和省级公司应用基础上,发展电信各地方公司自己的客户关系管理系统,更好融合在大的电信客户关系管理系统中。2客户关系管理体系框架21客户关系管理定义211客户关系管理概念在市场竞争日趋激烈的形势下,企业意识到客户对企业的生存和发展起至关重要作用。客户决定企业命运。企业关注重点从产品逐步转换到客户,逐渐形成客户为中心的客户关系管理理念。客户关系管理是信息技术和商业发展过程中得出的理论体系,客户管理需要客户的支持2。以前企业管理的理念是4P因素产品、促销、分销渠道和价格。这四大因素决定企业的发展方向。而现在大量客户信息保存在企业数据库3,客户信息存储在企业资料库中。企业必须对客户信息仔细研究与分析。现代企业主要以客户为中心,客户关系影响因素分别是重视客户需求和欲望、消费者的便利程度和商品的价值满足需要。这些因素将是企业重点解决问题,这些规则应用于客户关系管理系统4。客户关系管理是企业利用信息技术和企业生产销售相结的产物。客户关系管理核心价值就是实现客户价值。客户关系管理利用计算机技术,实现市场信息化、销售自动化过程、对客户分析的全过程。它可以使企业及时了解客户实际情况,企业给客户提供更好产品和服务,增强客户对企业归属感和信任感。客户关系管理是全新的管理客户模式。客户关系管理系统中企业和客户交流手段也是多种多样的。利用客户关系管理系统及时为客户解决问题,通过对客户购买产品分析找到客户需求和消费习惯,针对不同客户的不同需求展开不同服务。客户关系管理将企业资源和客户需求整合在一起。客户关系管理系统能给企业带来新客户的同时,可以更好的留住老客户,得到稳定的客户群体。客户关系管理理论指导和实践下,企业通过客户购买行为和习惯研究,预测未来客户购买趋势。数据挖掘在客户关系管理研究与实践,大大促进客户价值实现。数据挖掘对客户挖掘结果会给企业带来指导意见,决定企业未来发展方向。212客户的分类客户关系管理理论中的客户有狭义和广义之分。狭义客户是指商品和服务的使用者,主要指家庭和个人;广义客户就是接受商品和技术人群。一般而言客户关系管理中的客户概念是指广义客户。同时,客户关系管理的客户也包括中间客户。中间客户是企业和客户之间的中间商,还包括企业内部自己客户。客户是所有跟产品发生联系的全部人员。详见表21。企业内部客户企业员工,他们也是企业产品和服务的使用者中间客户企业和客户之间的经销商商业客户直接使用企业的产品和服务的人员表21客户的概念示意表著名的二八现象告诉我们,企业80利润来自20重要客户。而且,客户对产品满意程度提高5,企业利润将翻倍。所以企业有必要运用一些方法有效提高客户关系,包括客户管理,客户价值分析,企业战略,积极服务机制5。客户满意度对企业极其重要。不同的客户对产品的需求和关注是不一样的,对产品价格和质量的要求也不尽相同。企业必须提供优质产品,增强客户满意度。留住老客户,最重要是提高老客户对企业满意比重。客户满意度对企业争取新客户也很有启发意义。如果对所有客户提供相同的产品和服务是不会使所有客户都满意的。客户关系管理识别客户区别,就是将对客户管理方法合理实施。客户分类是企业生产活动的重要指标。对不同客户提供不同产品和服务,从而提高客户对产品和服务满意度。数据仓库和数据挖掘技术在客户关系管理系统的实施,使得企业为客户提供一对一服务变成现实。22客户关系的选择221客户关系选择类型客户价值就是客户在商品中获得好处和商品成本的差。好价值会被客户认可,高价值产品会提高客户忠诚度。企业和客户之间关系如表22所示。普通类型企业产品和服务的使用者,销售完产品和服务企业不在和客户联系。被动类型销售完产品,客户遇到产品的问题让客户到企业解决。责任类型销售人员主动联系客户,询问产品的使用的情况,把产品的问题报告给企业。主观类型销售人员主动经常联系客户,要求客户对产品和服务评价,把问题报告给企业,企业下次生产产品进行改进。朋友类型销售人员与客户建立长期的友好关系,企业和客户共同解决产品的问题。表22客户与企业之间的关系企业通过对客户和企业关系的研究,得到客户关系管理是一套成熟的规则,是客户关系管理理论在企业管理信息领域的具体应用。随着数据挖掘的快速发展,其在CRM使用将更加深入6。客户关系管理对企业减少销售成本和开拓新市场,提高客户对企业满意度和忠诚度有极大的作用。客户关系管理会使得企业和客户共同受益。222企业应用客户关系管理原因影响企业使用客户关系管理原因比较多。企业在客户关系管理原则是整体构思,分步实现,步步收益。客户关系管理系统的每一个组成部分模块都是对企业深刻分析的结果。影响企业选择客户关系管理系统有以下因素市场规模、销售渠道建立、销售网络推进、产品价格谈判机制、市场广告的发布、品牌战略的实施、媒体公关、企业盈利商业价值判断等。企业对客户关系管理系统选择必须考虑企业日常流程,并对流程优化处理。同时,客户关系管理必须与企业文化相融合。企业文化是企业员工统一思维和行为习惯。要想成功实现应用系统,必须和企业文化有很好一致性。客户关系管理核心价值就是企业决策层和管理层,考虑问题时角度站在客户角度去思考问题和解决问题。客户关系管理对企业文化有非常重要的促进作用,对企业外部资源使用很有帮助。实现客户关系管理问题在于如何定义企业需求和业务流程分析,整体实现系统目标。规划好开放时间。对每一个模块彻底研究和理解,每一步实现目标需要技术支持。客户关系管理是企业和客户之间新型关系。它是把企业的市场营销、技术、产品和服务和客户紧密相连。客户关系管理就是给客户最好产品和服务,吸引购买和影响客户的购买。另一方面通过对企业流程管理,降低企业经营成本。客户关系管理很好的跟踪客户情况,研究客户消费行为,得出客户消费习惯为企业了解客户需求,加快产品更新速度起到参考作用。23客户关系管理软件功能分析231客户关系管理系统结构客户关系管理软件中营销和服务信息化。客户数据采集对快速帮助企业决策者理解市场、客户和产品三者关系很有用处。主要组成部分是客户交流平台管理、市场营销信息化管理、产品和服务信息化管理,电子商务,商业信息智能。图23客户关系管理系统CRM结构示意图和客户接触方式现在主要有电子邮件、在线服务和特殊电话号码呼叫三种。不同信息交流系统集成必须是信息共享。客户呼叫中心是企业和客户全面交流最佳方法。客户呼叫中心提供多种沟通形式极大方便客户和企业交流。同时呼叫中心可以给客户提供最新产品信息和性能介绍,提升企业的影响力。服务信息管理中数据实时展现在系统图形界面上,企业相关人员可以很好提供人性化服务,减少企业对客户服务时间,提升服务效率。CRM系统是企业系统前台部分,通过和ERP和SCM系统互动,为企业经济利益的获取提供强有力保证。客户关系管理的大体功能如下(1)销售和客户信息统一整合;(2)企业为客户提供灵活多变交流方式;(3)利用信息使用智能技术分析产生结果,给企业决策者提供依据。232客户关系管理系统架构功能客户关系管理系统主要包含客户信息管理、产品联系人管理、产品时间管理、潜在客户开发管理、呼叫中心使用、企业合作关系群体管理、商业智能技术、专家系统和电子商务服务管理等一切和客户有联系的管理模块组成。CRM架构分为以下三个关键的部分1)运维型CRM它是指企业销售产品的人员,能共同享有客户信息资源,减少信息间隔点,高效处理信息速度。运维型客户关系管理主要包括市场销售信息化,售后信息化。市场销售信息化是客户关系管理系统最重要核心组成。销售过程中,面对每一次客户购买产品行为进行管理。信息化销售是销售产品时间周期大大缩短,帮助销售成绩快速提升。该模块包括销售活动整体安排和日常工作安排。销售群体确定,客户联系方式管理,产品管理,销售正规合同管理,销售趋势的预测,竞争对手分析和研究,产品价格管理,销售费用预算制定,销售计划审核。客户群体信息管理客户准确信息;企业对客户采取销售手段和客户历史销售记录分析,客户联系人联系方式,订单记录登记在系统,销售合同书管理。产品重要联系人信息管理企业和联系人接触时间和地点管理;联系人活动信息,避免和联系人产生时间冲突,相关安排信息告诉销售人员。潜在买家群体管理寻找和确定潜在客户;销售时机管理。市场销售过程管理客户分析与预测,仔细研究销售群体习惯和爱好,历史数据对现在客户评价;销售区域维护,根据实际销售情况安排好销售优先级;销售技巧管理;销售费用支出管理。市场销售活动就是最大争取潜在买家客户群体,帮助销售人员对市场认识和了解,根据市场信息灵活及时规划市场发展计划,为营销建立好销售模型,执行产品评价基本标准。电话营销的方式现在非常普遍,电话营销是和客户通过联系得到电话信息生成电话信息表。电话信息表和客户信息、业务绑定在一起;电话号码分给销售人员,要求销售人员对电话销售过程仔细记录,生成客户电话销售报表。销售管理对销售行为预先计划有用信息,产品信息、客户、联系人和产品服务建立联系管理;系统能够显示计划完成进度和实时状态图。跟踪客户信息和安排跟客户进一步交流计划。如果成功销售将客户和合同、联系人建立联系。售后服务信息化,已经销售商品进行跟踪调查,对客户意见和建议及时处理。服务要标准化,增强客户满意度,实现企业最大利益。服务功能是服务具体管理,服务请求,服务客户信息登记,服务整体规划。产品质量调查和意见形成报告列表,合同执行情况记录。客户服务管理是企业对客户服务的安排,企业对客户反馈信息反应。形成对客户服务报告,合同执行情况跟进,解决客户对产品出现问题处理。2)协调型CRM它让企业客服人员与客户共同完成任务。商业智能技术的发展,企业可以通过使用商业智能技术可以对客户数据分析,分析结果直接应用在企业经营。协调型客户关系管理针对企业特殊问题提出具体解决方案。企业数据库分析结果对企业未来发展展开预测,支持企业决策。协调型客户关系管理对客户数据研究找到客户购买产品意愿,对不同客户购买产品提供不同服务措施。在客户数据应用挖掘技术,了解客户购买产品需求,以便为下一次客户购买产品提前采取相应措施。协调型客户关系管理对客户分析是前提,分析客户年龄、学历、职业、爱好和习惯就能预测客户购买意愿。客户信息收集是商业机密,必须保证信息准确和数据安全性。分析高品质客户是为高端客户制定个性化服务,以便留住最重要客户。对待不同客户群体采取销售手段是不一样。3)分析型CRM分析型客户关系管理功能主要是企业特色共同需求。企业研究客户对企业把握市场,了解市场的变化有很好帮助作用。市场变化根据广告和对手变化,分析市场竞争对手变化和自身变换情况对比。销售分析是企业对产品数量、周期、地点和利润分析。产品分析根据产品市场占有率和产品质量,客户对产品反应研究,竞争对手研究,企业对产品信息和价格各种研究。通过对销售产品情况研究,预测未来产品销售趋势233客户关系管理系统基本模块功能客户关系管理系统基本模块分为销售模块、产品支持模块和营销模块。客户关系管理系统模块物理逻辑分析如图24和图25所示。图24客户关系管理的模块示意图客户关系管理系统逻辑模块分块如24图所示。客户信息管理系统模块是根据企业具体情况决定,企业科学合理分配使用,才能最大限度把最重要信息整合在一起。客户关系管理软件物理模块客户关系管理系统对企业要求是不同的,所以软件物理模块分析各不相同。如图25是客户关系价值方法。图25客户关系管理的价值模块24客户关系管理软件系统功能分析客户关系管理软件需求分析是应用软件工程理论对客户关系管理系统模块之间关系研究和分析。如图26所示。图26客户关系管理系统关系图客户关系管理系统组成如上图所示,模块间关系是紧密联系。基础是客户信息模块。企业客户信息分析结果才能对企业生产产生作用,企业对结果的了解,仔细研究客户和产品联系,才能科学合理制定营销计划。各个模块具体分析如图27和图28所示客新客户信息录入信息系统模块中,客户包括普通和大客户群体。信息包括销售人员建立的客户数据库;设立客户信息使用的权限和范围;客户名字、客户编号、客户缩写、客户联系方式和电话、客户电子邮件、客户来源、大客户企业信息记录、其他说明事项。户信息查询信息市场销售人员查询客户信息客户编号、客户名称、客户类别、客户性质、营销方式。图27客户信息模块图产品信息企业产品生产信息录入系统相关模块,产品信息对客户十分重要,因为它关系到客户对产品信赖程度。产品信息录入包括产品经企业检查合格以后放到仓库时间、产品到经销商时间、产品销售区域、产品在销售前对产品检查报告、产品销售给客户时间。图28产品信息模块图模块关系是紧密,系统模块介绍客户在模块作用。系统模块实际使用时可以按企业实际情况合理选择模块组成。企业选择客户关系管理软件须遵循以下要求1)企业情报资料汇集利用计算机技术手段,多种渠道收集客户具体信息比如爱好、学历和历史消费记录信息,信息输入到客户数据库。企业客户数据资料统一在安全数据库。客户数据集中有利于企业不同部门对客户信息共享,减少企业部门重复劳动,增加企业部门对客户数据资料利用率。2)建立应用模型利用数据真实性对其进行模型化处理,利用分类理论和工具对客户分类。企业根据市场变化,观察客户对产品反应,研究客户购买产品行为,建立客户行为模型,分清哪些客户是优质客户,哪些是潜在客户。3)市场行为规范企业对客户分类以便更好地研究客户特征。客户关系管理软件必须对客户群体有良好判断能力。4)营销建议客户关系管理软件可以对客户信息分析。利用客户服务中心和呼叫中心反馈结果,适度调整营销计划。销售活动必须和市场销售相适应,企业使用最有限资源投入最需要地方。5)业绩考评客户关系管理软件对营销结果和客户反馈综合研究,建立合理考评指标。业绩考评更好分析销售出现问题,及时解决销售问题。以上过程是逐步实现,形成完整企业流程。只有在正确方法指导下才能让企业在经营中获得效益,维护企业和客户长期良好关系。3数据挖掘基础理论31数据挖掘理论在客户关系管理中的研究数据挖掘可以有效应用企业客户信息,工具软件建立数据挖掘应用模型后进行挖掘处理过程,企业能够从挖掘结果中了解真正客户分布特点。企业获取客户方式多种多样,企业应该在多种渠道接触客户。细分可以让企业从高层次上来观察数据仓库中数据,细分可以让企业级用户使用不同方法,处理处于不同细分群中的客户。基于价值的客户细分基础是客户为企业带来盈利和价值7。数据挖掘中的分类、聚类等技术分析数据仓库中的数据,客户信息复杂多变,企业使用客户信息根据需要合理选择信息。客户细分是企业确定产品和服务的前提,也是建立客户一对一营销基础。如何保持原来老的客户,不让他们流失是关系企业生存的问题。实际应用中,利用数据挖掘工具为已经流失的客户建立挖掘模型,然后利用模型对流失客户进行挖掘处理后可以预测出现在客户中,有流失客户的原因。如何保留现有客户是企业面临的问题8。企业研究客户要求,采取相应措施,防止客户过度流失,稳定客户群体。企业对已经流失客户信息研究,利用已知数学统计模型对这些数据使用得到结果,结果可以具体应用企业经营活动。数据挖掘分类算法对流失客户的挖掘,建立客户流失预测模型9。根据此模型来预测客户流失的可能性。32数据预处理技术数据挖掘是一个反复迭代的过程10。数据挖掘就是对海量数据深刻研究与分析。特别是数据库技术和计算机科学技术的发展和进步,企业可以快速对数据进行分析和研究。在这些企业海量的数据中,蕴藏着大量有用数据信息资源。如果能够对这种海量的数据与客户信息进行有效的深入透彻分析和研究,就能从中找出规律和建立挖掘模型,获取企业急需客户情报信息,帮助企业更好地科学决策。数据挖掘的过程中,企业提取有用的知识是大量的、不完全的11。数据挖掘在企业具体业务要求基础上对企业数据合理应用挖掘算法和技术,挖掘结果直接应用企业经营。数据挖掘可以在挖掘中找到有用知识和规律12。数据挖掘是一个迅速发展的学科,有着广泛的领域。数据挖掘应用于CRMCUSTOMERRELATIONSHIPMANAGEMEN会提高企业的经营水平。数据挖掘是有价值的非有效的提取嵌入在大数据信息量13。数据挖掘与CRM的结合将是全面的,即市场、营销和客户服务,都可以从数据挖掘中获取决策技术。如果能够对海量数据与信息,进行快速深入分析和处理,就能从中找出数据内在规律。通过数据挖掘结果获取所需知识,帮助企业更好地进行企业决策。企业把利润作为自己经营最终目标,客户关系管理是达到这个目标最有效的工具,而数据挖掘是客户关系管理的最佳引擎。数据挖掘可被描述为提取有用信息的结果流程,信息结果对未来做出结果预测。为企业经营决策、市场策划等提供科学依据。321数据清洗数据在数据仓库中进行存储,有必要对数据源中不完整和没有达到数据挖掘标准的数据,进行数据预处理。脏数据对数据挖掘结果有不好影响,必须对脏数据进行清洗工作。数据预处理是在数据挖掘之前必须操作完毕的,这样会大大提高数据挖掘质量和效率。现实世界数据和数据仓库系统中数据不完整性和含有噪音数据是不可避免的,它们出现的原因是多方面。不同算法对数据的标准不一样,所以对数据预处理也是不同。数据的精简是有效的方法。数据挖掘算法对少量数据会产生比较好的结果。若数据是海量或高维的,必须采取一定方法来降低数据量和降低维数,从而尽可能保留原始数据的有用信息。数据预处理第一步就是对数据清洗工作,数据清洗主要包括遗留数值补充、噪声数据平滑、识别、删除干扰数据,统一数据来源和数据标准。数据清洗处理不好会导致数据挖掘任务的失败。脏数据处理遵循数据挖掘预处理方法应用。处理方法是经常填补缺失初始数据,剔除异常数据平滑噪声和数据不一致14。数据预处理是十分必要。虽然数据处理过程麻烦但很有必要。数据在真实世界会产生不一致、不完整性、含有数据噪音的情况发生。这里介绍几种数据净化的方法。1)省略元组标记缺少。数据元组有很多属性数值缺失使用该方法。如果每一个属性值比例很高用该方法是很差的。2)人工填写缺省数值。此方法很费时间。人为处理数据是对数据质量破坏有一定影响。数据是海量的情况下是不能用该方法的。3)利用属性的平均值,填充遗漏值。4)使用与给定元组属性同类所有样本平均值。5)使用系统认可的全局常量填充遗漏值。6)利用最可能值,填充数据遗漏值,使用常规推导工具进行归纳数据变化趋势和产生合理机制。322数据集成和变换数据集成是数据预处理第二种方式。它的主要任务是将不同数据源的数据,进行统一处理,然后放到数据仓库。数据挖掘再对数据仓库中已经处理好的数据进行挖掘。数据的元数据是数据的子数据。元数据避免了模式集成的错误。数据属性的关系由属性之间确定。属性A和属性B,相关性可用下面公式计算其中,N是元组个数,是A的平均值,是A的标准差。同理B。数据预处理第三种方法是数据变换。数据变换就是将数据转换成数据挖掘需要类型。数据变换技术如下平滑技术包括分箱和聚类。平滑主要对有噪音的数据和脏数据进行除噪清洗。聚集对所有数据放在一起,便于集中处理减少数据重复劳动,减少数据处理时间,加快数据更新速度。聚集为多粒度数据构造数据方而进行的前期工作。数据集中为数据方的粒度分析提供良好条件和方法。数据泛化利用高层数据概念对低层数据概念进行分层处理。通过对数据属性和维数分析,去除没有相关性和冗余大的数据。数据处理以后产生最小属性集合,使数据类的数学概率分布接近在原始数据产生的所有属性集合上分布上。这种方法就是贪心算法,在属性探索过程中空间,总是找到最佳解。战略就是做部分最佳选择,期待部分找到全部最优解。贪心算法在实践中应用广泛,很有实践价值。属性子集选择启发方法大概如下(1)逐步向前选择刚开始由空属性集出发,找到原始数据的原始属性集合里最好属性,找到属性加到规约集合,然后进行下一步,每一次迭代上一次,直到没有原属性集出现,找到最好属性增加到我们已经建立好规约集。(2)逐步向后删除就是从整个原始属性集开始,每一步处理以后就把属性集合中不好属性去除掉。保证删除后的属性规约集合保持在最好属性集合。这个方法和第一个方法正好是相反的过程,达到的最好属性规约集效果是一样。使用前两个方法和技术是看数据属性具体实际环境,不可把数据和环境分离开使用。(3)向前选择和向后删除相互结合就是将两个删除策略一起使用方法。每一步找到最优属性,并且在余下属性里去除不好属性方法。两者结合提高数据处理效率,大大方便数据加工技术。(4)决策树归纳就是使用决策树算法实现一种方式。决策树归纳搭建和流程图相似结构,内部节点代表一个属性检查,分枝是检查一个对应输出,外部节点表明一个类的预测。每一个节点就是算法选择最好属性处理,数据分成不同的类。决策树进行子集选择时由已知数据构建一棵树,没有出现在树中的全部属性是没有相关性。树中出现属性形成规约后就是要找属性集合。这个方法结束标志是不一样的。该决策树可以用有度量阈值来终止属性选择过程,具体看数据实际使用情况来决定。33数据挖掘技术的方法(决策树算法为例)决策树算法在实际中应用十分广泛,如CLS、ID3、CHAID、CART、C45、C50、GINI、SLIQ、SPRINT等常用决策树算法。ID3和C45是数据归纳分类算法。给定数据集合中每一个数据记录有相同结构,每一条数据记录可以有几个属性值组成。ID3算法中决策树每一个非叶子节点对应一个属性,树枝表示属性的值。叶子节点表示树根到节点路径对应数据记录里的类属性。决策树中非叶子节点和属性最大信息量有联系,熵是衡量非叶节点信息大小。C45是ID3的改进算法,改进ID3算法的数值缺少、属性值范围、树剪枝和规则的改进。分类与CART是描述已知预测值X在变量条件分布Y方法。分类算法是采取二叉树预测空间递归分解为几个集合,Y在分好集合上分布是均匀。34数据挖掘相关理论研究341数据挖掘原语和系统结构数据挖掘人员使用数据挖掘原语和数据挖掘软件系统建立联系。数据挖掘的数据查询语言给用户提供良好图形界面,方便用户直观理解数据挖掘过程和结果。通过使用挖掘原语的数据挖掘结果有利于专家解释。通过适当数据挖掘算法实现,得到模式兴趣度和用户认可的有用知识。342数据挖掘的数据和类型数据挖掘原语是说明等待挖掘的语言。用户使用数据仓库中小部分数据子集合,用户产生数据放到数据方多维数据仓库。数据方有条件限制,多维数组结构和专业背景关系的数据集合。指定数据属性值提取有用数据就是对数据方的切片或切块。概念分层在抽象层找到数据挖掘对象,使用数据挖掘理论与算法就是知识发现过程。定义由低级概念到高级概念映射关系。分层树叶和原先数据值具体概念一一对应关系,保证数据关系的完整性和整体性。特殊节点做为树的根。343数据挖掘查询语言DMQLDMQL是DATAMININGQUERYLANGUAGE的缩写。DMQL可以在多个抽象层上使用,可以在数据仓库中进行不同类型知识特殊挖掘。DMQL语法采用扩大的BNF。任务有关数据说明语法USEDATABASE或USEDATAWAREHOUSEUSE子句将数据挖掘任务使用已知数据库或数据仓库。FROMWHEREFROM和WHERE子句分别特定有关系表或数据方,定义使用条件找到数据。INRELEVANCETO子句列出要搜索属性和维。ORDERBYORDERBY子句表明计划有关数据排序次序GROUPBYGROUPBY子句表明数据分组标准。HAVINGHAVING子句表明相关数据分组条件。以上语句形成一个SQL查询,收集任务有关数据挖掘语言和数据挖掘原语标准。MSQL是提供数据挖掘查询语言。MSQL有GETRULES和SELECTRULES原语,适用于规则泛化和规则选择。用户通过图形界面和数据挖掘软件系统进行通信和交流。图形界面允许用户说明数据挖掘数据集是什么,编写查询语句,可以对数据进行操作。用户通过界面看见数据所使用模式比如表和图等,界面让用户理解方式呈现在用户面前。用户可以使用概念分层操作,允许用户修改概念分层规则和根据数据分布特点自动调整概念分层策略。用户在界面可以更改阈值。用户通过数据挖掘原语修改数据挖掘条件设置。用户在界面可以上卷、下钻行为。用户可以使用帮助手册进行相关操作。软件系统用户有两类数据挖掘专家和数据挖掘实际操作人员。数据挖掘专家可以对数据进行全部操作。实际操作人员在理解数据挖掘背景,使用合适挖掘模型,运行挖掘软件,得到挖掘结果解释是否有价值和意义,挖掘结果是否和预期结果一致,得出挖掘结果对商业是否有参考依据。344概念描述概念描述数据特点和比较特征描述。描述概念和对象类有关系时称谓类描述。数据特征在数据集合是简单集合。类的区分提供多个数据集合大概描述。属性去除过程开始关系属性有大量不同值,数据属性有泛化操作符。属性处理具体根据客户的具体要求使用。一些用户喜欢将数据属性放在比较低抽象层,另外一些用户喜欢把数据属性泛化到比较高抽象层。这个控制过程叫属性泛化控制。属性泛化阈值控制对全部属性设置一个泛化阈值,或对每一个属性设置具体有实际意义的阈值,阈值设定按用户要求设置。泛化关系阈值在泛化时建立阈值。属性相关分析方法是对数据维上泛化的过程。维相关分析类特征是解析特征。分析类比对是解析比对。相关方法分析相关数据属性。维是属性的关联。35数据挖掘在电信客户关系管理中应用随着计算机技术普及和发展,数据挖掘在电信信息系统中普遍应用。数据挖掘系统和电信系统相互融合。电信运营商面对市场激烈竞争和残酷现实,利用数据挖掘软件对电信客户实时变化情况进行研究与分析。电信企业通过使用数据挖掘软件对客户数据挖掘处理得出结果,可以迅速了解客户需求,及时调整电信市场营销策略,最大限度满足客户需求。电信客户关系管理围绕客户为中心,企业通过对客户数据挖掘,产生出结果分析客户的消费规律,掌握客户的消费趋势,电信企业为客户提供良好产品。客户关系管理系统与数据挖掘系统结合为企业更快实现客户价值提供良好平台。客户关系管理系统对客户忠诚度和满意度分析效果明显。客户关系管理系统对客户科学有效管理,数据挖掘在对客户关系管理系统中客户信息合理挖掘是有用。客户关系管理系统及时进行客户管理,必须利用好数据挖掘结果对客户需求的研究。数据挖掘是客户关系管理系统良好分析工具。数据挖据对客户分类使用聚类和分类15。客户分类是客户数据分析基础。通过分类可以发现不同客户群体的习惯和规律,找到客户价值点,准确预测客户消费方向。客户分类让市场营销活动更有目的性,提高市场营销效率,企业合理配置企业资源。客户分类结果实现客户利益最大化。中国电信集团公司对竞争对手研究,通过对竞争对手的客户消费行为研究与分析,搭建竞争对手模型。通过模型研究市场,利用对竞争对手的客户群体数量和增长情况,推出竞争对手的客户群体。准确定位群体的属性行为,预测对手市场政策和活动规律,提前做好市场竞争准备。4数据挖掘决策树算法在电信客户关系管理的应用数据挖掘在电信企业应用十分广泛。数据挖掘本质就是对数据进行深层次分析,发现客观事物之间内在联系和规律性东西16。数据挖掘理论和方法众多,如何正确使用数据挖掘技术在电信客户关系管理系统中应用是电信企业面对的现实问题。数据挖掘决策树算法在对电信客户数据挖掘使用上有使用价值,决策树技术成熟,使用决策树算法简单易懂,界面友好直观便于企业管理层理解,在电信企业数据挖掘应用有现实意义。决策树中分类是对数据离散值出来而预测连续值函数模型。决策树算法就是利用数据信息增益找到含有最大信息量的数据过程,直到一个完整决策树出现。电信客户数据分析建立在分类模型。数据分类技术有判定树、贝叶斯分类、神经网络、K最临近分类,遗传算法、粗糙集、模糊技术等。预测有线性、非线性、广义线性回归。41决策树分类和预测研究决策树数据分类有两个步骤第一建立模型,电信客户数据类型和概念库有预先规定。分析属性描述数据仓库元组上建立模型。分类是一个重要组成部分和研究在数据挖掘的应用领域17。元组属于一个预先定义好的类叫类标号属性。电信客户数据是电信数据仓库的样本集合。建立模型分析数据元组就是训练数据集。数据每一个元组是分类的训练样本。训练样本有类标号是有指导学习。学习模型有分类规则和数学公式。分类方法预测样本数据与测试数据差距大小。411决策树判定归纳决策树判定是树流程化处理,每一个叶子节点代表类。树顶层是根节点。不知道样本分类必须对属性值检测。路径从根节点到存放样本检测叶子节点。判定树可以转换成分类规则。以下是训练样本归纳判定树的ID3算法算法判定树。已知样本数据训练产生决策树判定输入实验使用样本数据离散化,测试数据特点结合在表里输出决策树判定过程(1)建立样本数据节点数量(2)样本数据同属于类A;(3)用属于类A记号的叶子节点返回;(4)假设测试数据特点表是空;(5)叶节点返回是节点数量,记号样本数据一般类;(6)查找测试数据特点表含有最多信息量数据;(7)记号样本数据数量是测试特点;(8)为每一个测试属性中未知值AI(9)由结点N个数长出一个条件为测试属性AI分枝;设SI是样本中测试属性AI样本集合;(10)否则加上一个由普通决策树SI属性列表测试属性返回结点;决策树核心就是对测试属性选择问题18。判定树归纳就是贪心算法。最顶层向下递归划分控制树构造。算法执行过程是树首先从样本数据训练,节点记号同类是树叶节点,表明节点记号;如果样本记号不用类,选择数据信息增益大小作为数据分类标准。数据特征作为检验节点,全部特征就是分类离散值。连续属性要离散化处理。为了未知数据集,属性值测试取决于决策树19。检测属性有确定值建立分枝,以此划分样本;递归地对每一次划分样本判定树。属性到达一个结点就停止在该结点操作。递归划分终止条件是已知节点全部样本是一样属性;剩下属性没有可以划分样本。用多数决定相关结点换成叶结点,用多数类标记它ID3算法的基本策略20。分枝检测属性没有可以使用样本,多数类建立树叶。ID3算法,测试属性是最大的收益信息价值21。属性选择度量树结点用信息增益度量选择检测属性,做属性选择度量。属性含有信息最大是对节点属性验证,方法对目标分类需要期望测试数目最少,可以找到普通树。A是样本数据A的集合,类记号属性有M个,设M是类各不相同类DI,如果A是DI样本数量,分类期望公式是PI是全部样本随机样本属于DI概率,用AI/A计算,对数函数以2为底,信息是二进位编码。ID3是基于信息熵决策树分类算法22。假设样本数据特点A含有W个不同值A1,AV。样本特点A把S化成V个样本数据子集合S1,SV,SJ包括S样本,数据样本在A上值是AJ。假如A是检验特点,数据样本子集合在大集合节点长出树分枝。SIJ是SJ的类样本数量。A分解子集合熵的公式是其中,是第J的权值,权值是样本集合除以总样本数。A拥有V个不一样值A1,AV。属性A将S分成V个子集S1,SV,SJ包含S一些样本,样本在A上有值AJ。如果A选作检测属性,子集对应于集合S结点成长出现分枝。设SIJ是子集SJ中类CI样本数。根据A划分子集熵,SJ中样本是CI概率。A上分枝拥有编码信息是。GAINA是确定好属性A值从而熵期望缩减。412决策树剪枝树在刚刚建立的时候会有很多数据含有噪音。决策树是一个有向无环图,建立递归分割训练数据,直到所有成员每个分区都属于同一类标签33。剪枝就是对过分适应数据进行剪枝方法。用统计衡量剪去最不信赖分枝,这让会加快分类出现,检测数据精确度有保证。先剪枝中提前停止树的建立,在树上剪枝。停止时节点就是叶子节点,树叶有可能是子集样本中概率分布。树可以评价度量有信息增益评价分类好坏。选择合适阈值是需要经过训练。后剪枝就是在树完全建立以后,在对树剪枝。删除结点分枝,剪除树结点。剪枝树在先剪枝和后剪枝一起使用,后剪枝计算比先剪枝要求多可以很好出现可靠树。树控制规模大小采取提前剪枝和后剪枝及增量树实现。决策树判定抽取规则流程决策树判定表现知识,应用IFTHEN表现分类规则。从树根到树叶各条途径产生不同规则,顺着规定路径每一个属性值建立前件合取项。叶结点有类预测,建立规则后件。已知树很大时,判定树规定最好便于理解。C45用训练样本计算规则精确度。规则精确度估计,该算法是用不好估计来弥补偏差。去除规则前件没有用规则精确度要求,没用规则去除。每个类规则有精确度顺序。对定义样本没有在规则前件里就是把主要类缺省值规则放到规则集合。42决策树分类算法在电信客户关系管理应用案例决策树算法在电信客户购买3G网络服务实验应用决策树分类算法对电信客户数据分析,样本选择属性有全面代表性。增加属性个数,属性相关性分析难度加大影响整体性,信息增益可以解决共性和个性问题。数据挖掘对客户分成不一样的类23。电信客户不同种类选择反映电信客户特点。不同用途选择信息增益计算方法,计算出选择属性信息增益得出信息增益确定值。所有属性阈值和求出值进行比较,小于阈值必须删除。选择属性值优化处理,建立完善评价体系标准。由于电信客户数据是多元和多维,不同数据应用部门使用数据属性是不尽相同,按实际需要合理选择。属性选择也是寻找客户价值所在。而客户价值是CRM的核心24。决策树核心是选择最好划分属性25。假设如果某电信公司数据仓库中电信客户3G网络套餐服务数据已经做过数据清洗、转换、变换等数据预处理操作。ID3和C45是相对小的数据集非常有效26。考虑个人用户使用3G网络套餐实际情况,选取样本数据。使用CLEMENTINE120数据挖掘专业软件处理图选取的电信客户数据。CLEMENTINE120是SPSS公司的一款数据挖掘平台。CLEMENTINE120数据挖掘为使用人员提供人工智能、统计学模型等算法技术,CLEMENTINE120对使用者从挖掘开始到结束提供良好图形界面,有利于使用人员认识和熟悉软件使用。CLEMENTINE具有标准数据挖掘过程1)数据挖掘商业问题理解,商业问题是数据挖掘重要部分,必须对挖掘对象商业目的和商业环境仔细分析,商业挖掘计划充分准备;2)数据理解,挖掘数据认识必须在具体商业环境下应用,挖掘数据特点和性质有比较和总结;3)挖掘数据准备阶段,就是对数据挖掘的数据进行数据预处理。数据挖掘软件应用数据标准化处理;4)数据挖掘模型建立,建立正确数据挖掘模型是非常重要步骤,根据对数据挖掘商业问题具体研究,选择适当挖掘模型,数据样本在挖掘模型运行,运行结束后对结果解释在对模型进行评价;5)挖掘任务评价,必须对使用模型产生结果和预期结果进行比对,评价就是对模型结果进行评价,如果结果和预期相差太大,停止使用模型,建立新模型,原数据挖掘过程重新调整;6)数据挖掘过程部署,建立优良的挖掘模型去解决实践出现的问题。在软件平台可以有监督、维护、产生有用报表、重新评价模型是否合适等步骤。CLEMENTINE120较好的实现以上过程,为数据挖掘工作实施提供标准流程。CLEMENTINE数据挖掘过程是数据流形式展现在软件界面,数据导入和结果显示是流程图方式在软件数据流程区。数据具体流向由箭头表示,每一个节点是挖掘数据不同操作。所有操作集合在一起就是一条挖掘全过程。在选择面板里选择SOURCES选项里,有各种导入CLEMENTINE节点数据流的不同数据方式,可以选择EXCLE电子表格形式,让编辑栏FILE读取电信客户数据。数据文件导入CLEMENTINE软件系统中。在RECORDOPS选择项里选择SELECT记录,在选择节点是对电信客户数据每一条记录进行操作。SAMPLE是电信数据样本读取。TYPE是电信客户数据字段的设置。在MODELING选择栏,有各种可以使用的模型,可以选择决策树C50和CRTREE分类算法。通过数据仓库可以查询电信客户具体数据,研究电信客户特点,通过报表形式展现在界面上。接下来是对电信客户数据样本训练集的选取和电信客户数据的字段选择。运行CLEMENTINE120软件后,我们在通过对年龄、收入、是否是学生和信誉期望信息值比较,得出年龄值是最大。由此得出年龄是树的根节点,如图41。图41电信数据挖掘结果示意图在软件运行后得出年龄期望信息值最大,去年龄是根节点,对于每一个分枝继续重复以上操作,用测试数据得到如下决策树,决策树规则是七条。图42电信客户购买3G网络套餐的决策树示意图图42不是最终结果树,所以必须对进行树剪枝处理。决策树乐观计算会让树的复杂性出现数据过度适合问题。现在树不是最合适树结构,必须对树剪枝操作处理。剪枝有构造树前剪枝和构造树后在剪枝,构造树时建立一个深度阈值,就是树节点到达阈值时树就停止生长和扩展27。限制树的无用盲目生长。构造以后剪枝就是决策树生长结束以后,按一定准则评价树内部节点是否有用,剪掉冗余分枝,剩余节点成为可能需要节点。现在就是用构造以剪枝对树构造如下,标准规则减少5条选择数据增长,数据适应问题就解决很好。剪枝以后决策树如图43。图43剪枝后决策树示意图决策树规则在树剪枝以后处理操作学生身份客户喜欢购买产品,中年人也是够买产品的客户群体,信誉良好老年人喜欢买产品。电信厂商利用对规则理解,企业可以对客户群体细分研究基础上科学营销。生成决策规则发现相比,C50为验证决策树算法28。43影响实验因素研究电信客户候选数据分析,发现样本属性选择非常重要。如何找到适合数据挖掘有代表数据,样本数据的属性一致性是研究的难点。利用信息增益就是很好解决以上出现问题好方法之一。挖掘大部分工作都是对电信客户数据的预处理。数据预处理花费时间巨大,对数据噪声、不完整性、不一致等数据处理是提高数据挖掘质量的关键。数据必要清洗和数据集成等操作,能给数据挖掘节省宝贵时间。使用决策树前必须对电信客户数据清理干净。决策树从没有规律的元组推理出决策树表示形式分类规则。决策树建立树准确度和复杂度要找到一个最佳结合点。训练数据保持一定大小,模式不断调整和适应。决策树方法是一个有用的工具分类问题。决策树是树结构可以自动分类的数据,决策树是知识之树表达,可以直接转换成知识树。模式寻找是要求数据挖掘决策树不断进步过程。构造决策树好与坏最重要是选择好的属性判断NP问题。决策树算法已被引入到解决这个问题。ID3、C45、C50等算法用信息增益概念建立决策树。ID3算法缺点是属性是离散值。真实数据不是完美的,所以数据可能属性字段缺少数值,数据不完整和不正确,含有噪声的数据是错误的。应用决策树算法对数据的使用必须是干净的数据。分类算法对数据的过分拟合。训练数据集评价模型分类精确度可能过度乐观,学习模型对过度适合训练数据。分类算法对连续型属性在训练样本数据进行离散化,ID3是信息论信息增益采取决策属性选取。信息增益对ID3算法算法的执行和效果有决定作用。ID3是非递增学习算法。数据增益问题是对信息增益的改进使用信息增益概率替换信息增益。决策树选择,考虑决策树的每一个可能取值。5总结众所周知,客户是企业最珍贵资源。留住老客户和发展新客户,保持和客户良好关系是企业管理研究的重点课题。而经验表明发展新客户要比留住老客户付出更多。电信市场迅速发展形势下,尽量减少老客户流失是企业必须要采取的措施。电信企业提供客户人性化服务,保持良好客户关系,可以增加客户忠诚度。电信企业通过使用客户关系管理系统,系统在电信信息系统平台下良好运行效果明显。这里电信客户关系管理系统利用数据挖掘理论和方法对电信客户数据深层次全方位挖掘,挖掘结果对找到客户关系有极大意义。主要分析的数据挖据在电信客户关系管理研究与应用如下(1)客户关系管理理论指导下对电信客户关系管理系统架构和模块分析。电信客户关系管理核心价值是客户。系统分析和阐述对实现客户需求有建设性意见。系统和平台对客户数据信息处理流程建立。(2)数据挖掘理论进行阐述,涉及电信企业使用数据挖掘理论和方法。客户关系管理概念和结构进行研究。电信客户关系管理系统架构分析和模块之间关系进行研究和分析。(3)电信客户关系管理系统模块分析,应用数据挖掘决策树理论和算法对电信客户数据挖掘过程描述。决策树分类中信息增益对客户数据应用与研究有应用价值。(4)决策树算法的应用,需要对具体业务数据和电信实际环境结合。算法的应用灵活多变,随着具体环境改变随之变化。客户关系管理核心思想是不会变,就是客户是问题的核心,通过科学合理的数据挖掘技术对数据的挖掘过程和结果的解释对企业未来发展有重要意义。参考文献1吕廷杰,尹涛,王琦客户关系管理与主题分析M北京人民邮电出版社,20022王育欣,安伟,韩江宁面向通信企业客户关系管理的数据挖掘技术研究J科技与企业,2011(3)71723左怀远,米银锁面向CRM的数据挖掘应用研究B兰州中国科技论文在线,20114柳林,涂光平,杨峰基于决策树的数据挖掘方法在CRM中的应用研究J计算技术与自动化,2006(3)67695张晖基于决策树的数据挖掘在电信CRM中的应用研究J电脑开发与应用,2006(734)51526刘鸿沈,徐雅斌数据挖掘技术在客户细分领域的应用J福建电脑
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论