已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学硕士学位论文 摘要 对于现代企业而言,相互之间的竞争已从产品的样式和质量上的竞争转移到 争夺客户的竞争上来了。面对日益激烈的市场竞争,企业逐渐意识到维系与顾客 之间的长久关系的重要性。客户关系管理( c r m ) 就是企业通过对客户的管理 来提升企业市场竞争力的一种全面的电子商务解决方案。它与企业资源计划 ( e r p ) 以及供应链管理( s c m ) 一起构成了企业信息化建设的基本构架。 客户关系管理的核心内容是利用信息技术对客户资源进行集中式管理。把经 过分析和处理的客户信息与有关客户的各种业务领域进行无缝结合,让市场营 销、产品销售、客户服务和技术支持等各部门的管理能共享客户资源,使企业可 以根据客户的喜好和需求提供有针对性的服务,提高客户满意度和忠诚度,最终 提升企业利润。 本文首先介绍了论文的研究背景、国内外的研究现状、客户关系管理的概念 及相关理论,重点分析研究了客户关系管理的基本理念、基本特征和客户关系分 析模型,并从经济学和市场营销学角度阐释了客户关系管理。接着本文介绍了数 据挖掘的基本原理和实际应用模型,在对数据挖掘技术和应用模型进行分析的基 础上,将数据挖掘技术应用于客户关系管理。最后结合一个移动通信公司客户跳 槽原因分析与决策问题,具体说明了数据挖掘深化客户关系管理的实际应用。 论文从客户满意为中心的基本理念出发,明确提出了客户关系管理的三个 衍生理念并分析了三者之间的互动关系。论文还明确提出了客户关系管理的理念 性、机制性和策略性特征,这些概念的形成对于客户关系管理系统的结构设计、 功能分析,对于客户关系管理的实际运作、系统实现及推广应用具有指导意义。 论文重点讨论得几个客户关系分析模型有助于强化客户关系管理的量化指标,并 有利于充分发挥数据挖掘在客户关系管理中的作用。论文关于数据挖掘在客户关 系管理中商业价值的分析和提出的在实施数据挖掘中要解决的几个问题,明确了 数据挖掘在客户关系管理中应用的基本问题。 关键词:客户关系管理,客户价值,营销战略,数据挖掘 武汉理工大学硕士学位论文 a b s t r a c t a sf ha sc o r p o r a t i o n sw e l ec o n c e m e d ,i n s t e 甜o f 也em o d a l i t ya n dq u a l i t yo f p r o d u c t i o n ,t h ec o m p e t i t i o nb e t w e e n t h e mi st os c r a m b l ef o rc o n s 啪e r s t op o s s e s s c o n s u m e r si s t oo w ne v e r ) r t h i n g f a c i n gw i t ht h ed r a s t i cm a r k e tc o n t e s t ,t h e e n t e r p r i s e sa r ew e u a w a r eo ft h ei m p o n a n c ew h i c ha b o u tt h bp e r m a n e n tl c l a t i o n s h i p w i 廿lc l i e n t sa n dt r a n s f e ri t s c o m p e t i t i v es 把l t e g y f 如m p r o d u c t i v e c e n t e r t o c u s t o m e r - c e m e lc u s t o m e rr e l a t i o n s h i pm a n a g e m e n ti sa ne c o m m e r c es 0 1 u t i o nt h a t c a n p r o m o t e t h em a r k e t c o m p e t i t i o na b i l i t yo fe n t e r p r i s eb ym a n a g i n g c u s t o m e r sd a t a b o t hc i t ma n de r p ( e n t e r p r i s er e s o u r c ep l a l l i l i n g ) a n ds c m ( s u p p l yc h a i n m a n a g e m 。m ) b u i l du p 恤e b a s e so f i n f o r m a t i o ni n 疔a s 仃u c t u r eo f a n e n t e r p r i s e t h ec o r eo fc r mi sc e m r a l i z e dm a n a g et h ec u s t o m e rr e s o u r c ew h i c hu s e i n f o r m a t i o nt c c h n o l o g y i tc o m b i n e dt h ea n a l y z e da n dd i s p o s a lc u s t o m e ri n f o r m a t i o n w i t ha l lk i n d so fo p e r a t i o nf l e l d sa b o u tm ec o n s u m e r s t h a tm e a n se v e r yd e p a r t m e n t c o u l ds h a r ec u s t o m e rr e s o u r c es u c ha sm a r k e t i n gd e p a m n e m 、 p r o d u c tp r o m o t i o n 、 c u s t o m e rs e r v i c e s 趴dt e c h n o l o g ys u s t a i n t h ee n t e f p r i s ec 肌p r o v i d et h ep e r t i n e n t s e r v i c e sa c c o r d i n gt oc u s t o m e r sf 打o r i t e sa n dn e e d s i tc o u l dp m m o t e 吐l ec u s t o m e r s a t i s f a c t i o na 1 1 dc u s t o m e rf a i t h f u l n e s sa n db o o s tm e e n t e r p r i s e sp r o f i t s t h ed i s s e r t a t i o ni n t r o d u c e st 1 1 ef u n d a m e m a lt h e o r yo fc r m a tf i r s t ,i tb r i n g so u t t h er e s e a r c hb a c k g r o u n d 、w r i t t e ns i t u a t i o na n d p u t sf o r w a r d 也ed e f i n i t i o no f c r m i t a n a l y s e st h eb a s i cc o n n o t a t i o n 、c h a r a c t e r i s t i c sa n da 1 1 a l y s i sm o d e l s a n de x p a l i a t e c r mf r o me c o n o m i c sa n dm a r k e t i n g f o l l o 、v i n g ,m em e s i si n t r o d u c e st h ep r i n c i p l e s a n dt h ep r a c t i c a lm o d e lo fd a t am i n i n g a n db a s e do nt h ed a t am i n i n gt e c l l l l o l o g y a n d 印p l i c a t i o nm o d e l ,l e td a t am i n i n gt e c h n o l o g y 印p l yo nc r m a tl a s t ,i t a i 、a l y z e sac o n c i e t ee a s ew hi sat e l e c o m m u n 王c a t b nc o m p a n ya n di r d i c a 掂st h a t h o wt oc a r r yo u tc r mw h i c h u s i n g d a t a m i n j n gt e c h n o l o 阱 t h e 1 e s i ss t a r t s 、i t l lb a s i cc o 衄o t a t i o no fc u s t o m e r o r i e n t a l ,a 1 1 db r i n g sf o r w a r d t h r e ec o l l l l o t a t i o n s ,w h i c hd e r i v e df r o n lc r m 孤d a f l a l y s e s 也e i rr e l a t i o n s h i p t h e p a p e ra l s op u tf o n v a r dt h ec h a r a c t e r i s t i c so fc r m : c o 肌o t a t i v e 、m e c h a n i s m 、 s t r a t c g i c t h e s ec o n c e p t sh a v ec o n d u c t i v es i g n i f i c a n tf o rm e s t r u c t u r ed e s 培n e d 、 a n a l y z ec a p a b i l i t y 、p r a c t i c e s 、r e a l i z ea 1 1 dp o p u l a r i z es y s t e m i td i s c u s s e d s e v e r a lc r m a j l a l y s e sm o d e l s c a i lh e l pt oi n t e n s i f yt h eq u a l m c 撕o ni n d e xo fc r m ,a n da 】s o p r o p i t i o u st oe x e r ts u m c i e m l y t h cu s i n go fd m a p p l y i n gi nc r m a sf o rt h ea 1 1 a l y s i s i t 武汉理工大学硕士学位论文 o fc o n l n l e r c i a lv a l u e sa b o u td mi nc i 己ma n ds o m eq u e s t i o n sw h i c hi ne x e r t i n gd m i td e f i n i t u d et h eb a s i sp r o b l e m sw h i c ha b o u td m a p p l i e di nc i m k e y w o r d s :c u s t o m e r r e l a t i o n s h i pm a n a g e m e m ;c u s t o m e r s v a l u e m a r k e t i n gs t r a t e g y ;d a t am i n i n g i i l 武汉理工大学硕士学位论文 1 1 论文研究的背景 1 引论 本课题研究基于数据挖掘( d a t am i n i n g ,d m ) 的客户关系管理( c u s t o m e r r e l a f i o n s h i pm a n a g e m e n t ,c r m ) 的理论和实现问题。 研究的背景是后工业社会发展的事实和现代企业面临激烈市场竞争的局面 给现代企业管理提出的新挑战。 人类社会已发展到后工业社会。后工业社会改变了前工业社会生产能力不足 和商品短缺的状况,出现了全社会生产能力过剩、商品极大丰富的状况,市场竞 争变得异常激烈。 在这样的社会经济背景下,企业管理导向、企业管理目标、企业管理权力、 企业管理技术手段都发生了根本的变化。 ( 1 ) 企业管理导向由前工业社会的产品导向转变为客户导向: ( 2 ) 企业管理目标由前工业社会的成本控制和利润最大化转变为客户满意 和客户忠诚; ( 3 ) 企业管理权力杠杆由前工业社会的向企业倾斜转变为向客户倾斜: ( 4 ) 企业管理的技术手段由前工业社会的手工管理转变为电子信息管理。 这些转变表明:在当前的环境下,市场竞争的焦点已经从产品的竞争、品牌 的竞争、服务的竞争转向客户的竞争。客户就是财富、客户就是资产、客户就是 价值,客户就是企业发展的源动力。与客户建立和保持一种长期的、良好的伙伴 关系,掌握客户资源,赢得客户信任,分析客户个性化需求,提供满意的客户服 务,是企业提高市场占有率,获得最大利润的关键,使得客户关系管理成为现代 企业最重要的企业管理问题之一。 这些转变还表明:在当今社会,谁充分利用了客户信息,谁能从企业大量的 客户信息中挖掘出有意义的知识,发现客户新的价值,并用于企业经营管理决策, 准就可以赢得市场,赢得利润。大量的客户数据一旦被发现成为有意义的信息, 就使企业客户资源成为更宝贵的财富。因此,也使得基于数据挖掘技术的客户关 系管理成为客户关系管理中最受关注的课题。 武汉理工大学硕士学位论文 本文正是从客户和信息挖掘的双重角度进行客户与信息资源的优化组合,使 企业取得市场竞争优势,而提出了基于数据挖掘的客户关系管理的研究课题。 1 2 国内、外研究现状及评价 客户关系管理起源于2 0 世纪8 0 年代初的“接触管理” ( c o n t a c t m a l l a 鼬m e n t ) ,即专门收集整理客户与公司联系的所有信息。到2 0 世纪9 0 年代 初期则演变成为包括电话服务中心与支持资料分析的客户关怀( c u s t o m e rc a r e ) , 后来从重视赢得新客户和处理基础营销工作转移到对客户关系进行有效管理的 客户保持工作上来【”。经历了近二十年的不断发展,客户关系管理逐渐形成了一 套管理理论体系。 从已有的客户关系管理研究成果来看,大体上还可分为侧重人文管理的研究 和侧重信息技术的研究圆。 ( 1 ) 人文管理的研究 早期的研究工作多是从心理学、组织行为学的角度对消费者行为进行研究。 福特( f o r d ) 在1 9 8 0 年概括了买方一卖方关系发展的5 个阶段【3 】,即开始 阶段、早期阶段、发展阶段、成熟阶段和后期阶段。 1 9 8 7 年,格默森( g e s s o n ) 提出【4 】:在工业品市场和组织市场上,企业 营销战略制定者最关心的应该是长期客户关系的管理。这就要求企业必须认识 到:战略优势的获得源自互动关系方法的采用,即对客户关系生命周期的管理, 而不是对产品生命周期的管理。 帕特里夏西博尔德( p a t r i c i as e y b o l d ) 长期以来一直是客户关系管理的倡导 者,在界定客户关系管理的概念和功能方面 3 1 ,她提出了独特而富创新的三大原 则: 客户行为能够得到控制原则; 客户关系至关重要原则; 客户经验不可忽视原则。 科特勒在其营销管理一书中,根据消费者的购物模式把企业和客户之间 的关系分为基本型、反应型、可靠型、主动型和合作型等五种,这是从市场营销 的角度对客户关系的最为明确的分类。科特勒还建议企业应根据客户数量的多 武汉理工大学硕士学位论文 少、利润的高低来选择建立并维持相应水平的客户关系管理。 2 0 世纪8 0 年代末期提出的期望否定理论,是一个被j 。泛接受的、从模型的 角度阐释客户满意是如何形成的理论。在2 0 0 0 版的i s o d i s 9 0 0 0 中,客户满意 被定义为:“客户对某一事项已满足其需求和期望的程度的意见”【2 j 。其中,“某 一事项是指在彼此需求和期望及有关各方对此沟通的基础上的特定时间的特定 事件”。可见,所谓客户满意是指客户的感觉状况水平,这种水平是客户对企业 的产品和服务所预期的绩效与客户的期望进行比较的结果。 如图1 1 所示,如果客户的感知满足甚至超过客户的期望,客户就容易得到 满足;与此相反,如果感知低于期望,客户就容易抱怨或投诉,但如果对客户的 抱怨采取积极措施妥善解决,就有可能使客户的不满意转化为满意,甚至令其成 为忠诚的客户。 t 一 圃弘辫一甲 i 感知 b 的蕴涵式,a 称为前提或左部( l h s ) ,b 称为后续 或右部( r h s ) 。规则的一般形式为“i f 条件成立,t 1 1 e n 结论”。通过关联分析可以 发现3 种规则:有用的、价值不高的、费解的。价值不高的规则往往是一些众所 周知的规则的重现。例如,随着天气逐渐炎热,饮料的消费量会逐渐增加。这样 的规则已为人们所熟知,即使推断出来,也没有什么价值。费解的规则是数据中 武汉理: 大学硕士学位论文 一些偶然的东西。比如,由于夏天的某一天夜晚停电,造成了大量的顾客涌入商 场避暑。对于这样的事件,由于其出现的概率非常低,没有必要对其分析,也没 有必要采取某种商业上的行动。只有事物之间潜在的经常发生的规则才是有用的 规则。“潜在的”说明还没有被发现;“经常发生的”说明规则发生的概率较大, 如果对其采取行动可能会产生较大的收益【2 2 1 。 现在来研究一下如何发现有用的规则。要计算数据库中某个特定项或几个项 的事务出现的概率只要直接在数据库中进行统计即可。某一特定的关联,如铅笔 和橡皮在数据库中出现的频率称为支持度。如1 0 0 0 条记录中有2 0 条记录是铅笔 和橡皮,则此关联的支持度为2 。非常低的支持度意味着此关联不重要,或者 出现了错误数据。 另外还要利用概率论中的条件概率,即当a 发生时,b 发生的概率是多少 来考察规则中项及其组合出现的相对频率。对于上面的例子就是,当一个客户买 了铅笔时,他还会买橡皮的可能行会有多大。在关联规则中,称其为置信度。计 算公式是:( a 与b 同时出现的频率) ( a 出现的频率) 。 假设某一数据库中有1 0 0 0 条,其包含部分内容表3 1 所示: 表3 1 部分数据信息 商品名称购买量 铅笔 1 0 0 橡皮 5 0 练习本 4 0 铅笔和橡皮 3 0 铅笔和练习本 1 5 练习本和橡皮 1 0 铅笔、橡皮和练习本5 可以计算出: “铅笔和橡皮”的支持度= 3 0 1 0 0 0 = 3 “铅笔、橡皮和练习本”的支持度= 5 1 0 0 0 = o 5 “铅笔= 橡皮”的置信度= 3 0 1 0 0 = 3 0 “铅笔= 练习本”的置信度= 1 5 1 0 0 ;1 5 武汉理工大学硕士学位论文 可以看到买铅笔的顾客也买橡皮的可能性( 3 0 ) 是买铅笔的同时也买练习 本的可能性( 1 5 ) 的一倍。并且铅笔和橡皮的关联支持度已足够高了,则意味 着这是一条有意义的关联规则。 由于在关联分析中需要分析众多的组合情况,因此在分析中要使用最小支持 度和最小置信度对组合进行必要的过滤,这样才能降低计算的复杂程度。低于最 小支持度的规则因为事件本身发生的概率很小而被过滤掉;高于最小支持度,但 却低于最小置信度的规则,虽然事件本身发生的概率较大,但是规则成立的可靠 性太低,因此常常会给出错误的答案,也必须滤除。 必须指出,利用数据挖掘得到的关联规则并不是现实生活中的真正规则,它 只是对数据库中的数据之间相关性的一种描述。不能保证利用过去的数据得到的 规律在将来的情况下仍然有效。经过数据挖掘得到的知识要经过进步地分析与 实验,爿能将其付诸实施。 序列模型分析同关联规则类似,但是它更侧重于分析事物之间的因果关系。 在这里就不详细介绍了。 ( 2 ) 聚类分析 聚类就是将数据对象分组成为多个类或簇,在同一个簇中的对象具有较高的 相似度,而不同的簇中的对象差别较大。 聚类分析是一种重要的人类行为。一个人在小的时候,就可以通过不断改进 下意识中的聚类模式来学会区分猫和狗。聚类分析已经广泛的应用在许多应用 中,包括模式识别,数据分析,图像处理等。在商务上,聚类能够帮助市场分析 人员从客户基本库中发现不同的客户群,并且用购买模式来刻画不同的客户群的 特征。 聚类与下面将要介绍的分类不同,它是在事先不规定分组规则的情况下,将 数据按照其自身的特征划分成不同的群组。在开始聚类之前,并不知道要把数据 分成几组,也不知道如何划分。所以,在聚类之后,要有一个对业务非常熟悉的 人来解释这样分类的意义。在很多情况下,一次聚集得到的分类对业务来说可能 并不好,这时需要删除或增加变量已影响分类方式,经过几次反复之后才能最终 得到一个理想的结果。模糊等价矩阵和神经元网络是比较常用的聚集算法2 3 1 。 武汉理工大学硕士学位论文 ( 3 ) 分类和回归 分类要解决问题是为一个事件或对象归类。既可以分析已有的数据,也可以 预测未来的数据【2 5 】。 分类分析首先从完艇的数据集合中划分出一部分数据作为训i 练集合,然后为 这个训练集合中每一个记录分配一个标记,即对训练集合进行一次划分。接着, 检查这些标定的记录,描述具有同类标记的记录子集的特征或者重要的相关因 素。最后,将发现的重要因素运用到数据集合上的整体上,从而完成数据集合的 分类工作。 由于在训练数据集中提供了每个训练样本的类标号,故称作有指导的学习, 而聚类是无指导的学习。 数据集合分类特征的描述可以是组规则也可以是一个数学模型或数据公 式。 回归是通过具有已知值的变量来预测其他变量的值。在简单情况下,回归往 往采用的是线性回归来解决问题。对于非线性的变量,可以采用逻辑回归、决策 树、神经网络等。 ( 4 ) 决策树 决策树提供了一种展示在什么条件下会得到什么值这类规则的方法。它是利 用信息论中的信息增益寻找数据集合中具有最大信息量的属性字段,从而建立决 策树的第一个节点,然后再根据该属性字段的不同取值建立树的分支,这样最初 的数据即被划分出两个数据子集2 4 1 。自上而下分别在两个数据子集上反复使用 上面的方法建立其下层分支节点,直到数据集合不可在分。 如图3 1 所示,决策树有决策节点、分支和叶子组成。决策树中最上面的节 点成为根节点,是整个决策树的开始。此例中的根节点为“年薪 5 0 0 0 0 ”,对此 问题的不同回答产生了“是”和“否”两个分支。决策树每个节点的子节点数与 算法有关,如果每个节点只有两个分支称其为二叉树,多于两个分支的称其为多 叉树。 武汉理工火学硕士学位论文 丈客户 昔遵客户普通客户丈客户 图3 1决策树 在遍历决簧树的过程中,在每一个节点都会遇到一个问题,对每个节点上的 问题的不同回答会导致走向不同的分支,最终到达一个叶子节点。这个过程就是 利用决策树进行分类的过程,利用几个变量来判断所属的类别。最后的叶子就是 所属的类别。 例如某电信公司希望将其客户分成大客户和普通客户两类,就可以利用上面 这棵决策树来判断大客户。年薪 5 0 0 0 0 且工作时间在一年以上的可以认为是大 客户,或者是年薪达不到5 0 0 0 0 但是其达到3 0 0 分者也可称其为大客户。 以上是一个非常简单的例子,即易于理解,也较容易计算。但实际问题往往 复杂得多。如果一个决策树太过于“枝繁叶茂”,会降低决策树的可理解性和可 用性,同时也会使决策树对历史数据的依赖性增大,这样不利于新的数据应用。 称这种情况为训练过度,为防止训练过度,也就是为了使决策树所蕴含的规则具 有普遍意义,同时也为了节省训i 练时间,需要有一种方法停止树的生长。常用的 方法是限定决策树的最大高度来限制树的生长。 决策树非常善于处理非数值型数据。 ( 5 ) 神经网络 神经网络近来越来越受到人们的关注,因为它为解决大复杂度问题提供了一 种相对来说比较有效的简单方法。神经网络可以很容易的解决具有上百个参数的 问题。神经网络常用于两类问题:分类和回归【2 引。 神经元的模型是人们参照人脑细胞的结构建立的。在结构上,可以把一个神 经网络划分为输入层、输出层和隐含层。如图3 2 所示,输入层的每个节点对应 一个个的预测变量,输出层的节点对应目标变量。在输入层和输出层之间是隐含 层,隐含层的层数和每层节点的个数决定了神经网络的复杂度。 武汉理工大学硕士学位论文 输入屡隐含层 输出屡 图3 2 神经元网络 除了输入层的节点,神经网络的每个节点都与它前面的许多节点连接在一 起,每个连接对应一个权重巩,此节点的值就是通过它所有输入节点的值与对 应连接权重乘积的和作为一个函数的输入而得到,把这个函数称为活动函数或挤 压函数。如图4 2 中节点3 输出到节点6 的值可通过如下计算得到: 形,节点1 的值+ ,节点2 的值 神经网络的每个节点都可表示成预测变量( 节点1 ,2 ) 的值或值的组合( 节 点3 6 1 。此时节点6 的值己经不再是节点1 、2 的线性组合,因为数据在隐含层 中传递时使用了活动函数。实际上如果没有活动函数的话,神经元网络就等价于 一个线性回归函数,如果此活动函数是某种特定的非线性函数,那神经网络又等 价于逻辑同归。调整节点间连接的权重就是在建立( 也称训练) 神经网络时要做 的工作。最早的也是最基本的权重调整方法是错误回馈法,现在较新的有变化坡 度法、类牛顿法和遗传算法等。无论采用那种训练方法,都需要有一些参数 来控制训练的过程,如防止训练过度和控制训练的速度。 决定神经网络拓扑结构的是隐含层及其所含节点的个数,以及节点之间的连 接方式。要从头开始设计一个神经网络,必须要决定隐含层和节点的数目,活动 函数的形式以及对权重做哪些限制等。 在诸多类型的神经网络中,最常用的就是前面图示中所描绘的那种前向传播 式神经网络。在只含有一层隐含节点的情况下,错误回馈式训练法的过程如下: 前向传播:数据从输入到输出的过程是一个从前向后的传播过程,后一节点 的值通过它前面相连的节点传过来,然后把值按照各个连接权重的大小加权输入 到活动函数再得到新的值,进一步传播到下一个节点。 回馈:当节点的输出值与预期的值不同,也就是发生错误时,神经网络就要 “学习”。可以把节点间连接的权重看成后一节点对前一节点的“信任”程度。 武汉理工大学硕士学位论文 学习的方法是采用惩罚的方法。如果某一节点输出发生错误,那么它的错误是受 哪些输入节点的影响而造成的,是不是权重最高的节点使他出错,如果是,则要 降低它的权重,惩罚它们,同时升高那些做出正确建议节点的权重。对那些受到 惩罚的节点来说,它也需要用类似的方法来进一步惩罚它前面的节点。就这样把 调节过程一步一步向前传播到输入节点为止。 对训练集中的每一条记录都要重复以上这个步骤。当把训练集中的每一条记 录都运行过一遍之后,则称完成一个训l 练周期。要完成神经网络的训练可能需要 很多个训练周期,训练完成之后得到的神经网络就是在通过训练集发现的模型, 描述了训练集中响应变量受预测变量影响的变化规律。 由于神经网络隐含层中的可变参数太多,如果训练时间足够长的话,神经网 络很可能把训练集的所有细节信息都“记”下来,而不是建立一个忽略细节的只 具有规律性的模型,称这种情况为训练过度。显然这种“模型”对训练集会有很 高的准确率,而一旦离开训练集应用到其他数据,很可能准确度急剧下降。为了 防止训练过度的情况,必须知道在什么时候要停止训i 练。在有些软件中会在训练 的同时用一个测试集来计算神经网络在此测试集上的正确率,一旦这个正确率不 再升高甚至开始下降时,那么就认为现在神经网络可以停止训练了。 神经网络的另一个优点是很容易在并行计算机上实现,可以把它的节点分配 到不同的c p u 上并行计算。 在使用神经网络时有几点需要注意。首先,神经网络很难解释,目前还没有 能对神经网络做出显而易见解释的方法学。其次,神经网络会学习过度,由于神 经网络太灵活、可变参数太多,如果给足够的时间,它几乎可以“记住”任何事 情,在训l 练神经网络时一定要恰当的使用一些能严格衡量神经网络的方法。另外, 除非问题非常简单,训i 练个神经网络可能需要相当可观的时间才能完成。当然, 一旦神经网络建立好了,在用它做预测运行时还是很快的。最后,建立神经网络 需要做的数据准备工作量很大。要想得到准确度高的模型必须认真的进行数据清 洗、整理、转换、选择等工作,对任何数据挖掘技术都是这样,神经网络尤其注 重这一点。 武汉理工大学硕士学位论文 4 数据挖掘在客户关系管理中的应用 数据挖掘是深层次客户关系管理的技术核心。本章首先评价数据挖掘在客户 关系管理中的商业价值,再讨论数据挖掘在客户关系管理中的基本功能,最后说 明在客户关系管理中实施数据挖掘要解决的几个问题。 4 1 数据挖掘在客户关系管理中的商业价值 数据挖掘是整个客户关系管理中最重要的组成部分,是客户关系管理创造商 业价值的关键。 许多企业有数以百万计的历史数据,要经过传统的统计分析方法分析相当困 难,容易错失企业应有的商机。数据挖掘则利用高级统计工具和人工智能技术, 对数据库或其它电子文档提供的庞杂数据进行筛选、推导与模型构造等操作,充 分了解客户购物信息,有效地和客户建立亲密关系,找出恰当的营销模式,正确 掌握未来经营动态,有效地提供营销、销售和服务的决策支持,让企业得到充分 的信息而展开行动。并于最恰当的时间、最恰当的地点,给最恰当的客户提供最 恰当的一对一的产品和服务。 有了数据挖掘,可以更深层次地了解客户,与客户深交,更有效地进行营销, 从而为企业扩大原有商机。 有了数据挖掘,可揭露隐含在数据与模式中的闪光点,从原始数据获取崭新 知识,从而为企业创造新的商机。 有了数据挖掘,可以更准确地预知未来客户、潜在客户,预知未来的需求和 未来的经济状况,大幅提高目标市场营销的准确度,减少无目标的营销策略,从 而较其他竞争者优先获得商机。 总之,正是有了数据挖掘,使企业从大量数据中获得了深层的、隐含的、潜 在的、未来的客户知识,为企业扩大原有商机、创造新的商机、优先获得商机提 供非常有利的条件,进而为企业经营提供更有效的营销、销售和服务的决策支持, 使数据挖掘成为客户关系管理中最重要的也是最关键的一个组成部分。 有很多成功使用数据挖掘的案例,沃尔玛( w a l m a r t ) 使用数据挖掘技术, 其数据库拥有7 0 0 0 兆字节的数据,主要是关于其销售、存货、运输中的商品、 市场统计、顾客统计、财务、商品退货及供应商业绩等1 2 9 1 。挖掘这些数据主要 武汉理工大学硕士学位论文 用于开发沃尔玛3 0 0 0 多分销商店的“个性”,以便管理人员决定每个商店的商品 结构,为沃尔玛剑造了可观的商业价值。 4 2 数据挖掘在客户关系管理中的基本功能 在客户关系管理中,数据挖掘是从大量的客户数据中挖掘出隐含的、先前未 知的、对企业决策有潜在价值的知识和规则。在客户关系管理中数据挖掘功能越 来越丰富,但是最基本的数据挖掘功能是: ( 1 ) 挖掘客户特征:数据挖掘的第一步就是挖出顾客的特征描述。企业在 了解客户信息方面永不满足,他们不仅会想方设法了解顾客的地址、年龄、性别、 收入、职业、教育程度等基本信息,对了解客户的婚姻、配偶、家庭状况、疾病、 爱好等等也是不遗余力。也由于这个原因,在谈到客户关系管理时,个人隐私便 成为一个敏感话题。 ( 2 ) 挖掘“黄金客户”:通过客户行为分析,归类出消费额最高、最为稳定 的客户群,确定为“黄金客户”。针对不同的客户档次,确定相应的营销投入。 对于“黄金客户”,往往还需要制定个性化营销策略,以求留住高利润客户。所 以,不要期待在客户关系管理时代继续人人平等。当然,成功的客户关系管理不 会让顾客感觉到歧视。 ( 3 ) 挖掘客户关注点:通过与客户接触,收集大量客户消费行为信息,通 过分析,得出客户最关注的方面,从而有针对性地进行营销活动,把钱花在“点” 上。同样的广告内容,根据客户不同的行为习惯,有的人会接到电话,有的人就 可能收到信函;同一个企业,会给他们的客户发送不同的信息,而这些信息往往 就是顾客感兴趣的方面。 ( 4 ) 挖掘客户满意度和忠诚度:通过数据挖掘对客户满意度、忠诚度的持 久性、牢固性及稳定性进行分析。对于高满意度客户,要进一步建立信誉,对于 不满意客户,要努力提供更多的面对面的关怀。对于高忠诚度客户,要注意保持 其良好印象,对于低忠诚度客户,要么不要浪费钱财,要么就花大功夫把他们培 养成忠诚客户。 武汉理工大学硕士学位论文 4 3 客户关系管理中实施数据挖掘的步骤 如果进一步将客户关系管理分析应用需求进行技术型整理,我们可以归纳出 以下几类数据挖掘需求。 数据描述和总结:对历史数据描述和总结,可以看清过去发生了什么。 数据分类、市场分割:市场细分,提高可操作性和可管理性。 预测:给出一个或一批预测输入,其结果会如何? 数据相关性发现:一种行为的发生有很大可能触发另一种行为。 数据依赖性分析:一种行为的发生以另一种行为为前提。 下面让我们来看看企业进行数据挖掘时的基本步骤和方法。 整个过程由3 个步骤组成:数据准备、数据挖掘和评估与表示【3 2 】。如图4 1 所示: k 一数据准备叫七一数据挖掘争 一评估与表示刮 图4 1数据挖掘的基本步骤 数据准备阶段是数据挖掘的第一个阶段,此阶段工作的好坏直接影响数据挖 掘的效率和准确性。此阶段可分为:数据清理、数据集成、数据选择和数据变化。 数据清理所作的是消除原始数据中的噪音和不一致性数据。数据集成将多处 据库中运行环境中的数据进行合并处理,解决语义模糊性,处理数据中的遗漏和 洗清脏数据【”】。数据选择就是从企业大量数据中检索与分析与任务相关的数据 子集。这种对数据的精选工作,不仅能减少数据的处理量和提高效率,而且能使 数据更加具有规律性。数据变换就是根据挖掘的需要,将数据变换或统一成适合 挖掘的形式,如通过汇总或聚集操作等。 数据挖掘阶段是运用选定的数据挖掘方法,从数据中提取对用户有价值的信 息。首先,决定如何产生假设,是用户对于数据库包含的知识提出假设,还是通 武汉理工大学硕士学位论文 过机器学习来发现设。前一种称为“验证驱动型数据挖掘”,后一种称为“发现 驱动型数据挖掘”【3 4 】。在问题明确以后,就可以建立模型了。 从上述的过程中可得到_ 系列的分析结果,模式和模型。会得到对目标问题 的不同角度的描述,这就需要根据某种兴趣度度量,识别表示知识的真正有趣的 模式。一种办法是直接使用原来建立的模型样本和数据样本进行检验:另一种办 法是在实际运行的环境中提取新数据进行检验。最后利用可视化技术和知识表示 技术,向用户提供挖掘的知识。这就是评估与表示阶段 4 4 客户关系管理中实施数据挖掘要解决的几个问题 数据挖掘是一个比较复杂的应用。在客户关系管理中实施数据挖掘需要经过 审慎的考虑,才能够实施一个成功的数据挖掘应用,使客户关系管理本身从中受 益。在客户关系管理中创建和实施一个数据挖掘应用需要解决的问题有: ( 1 ) 确定如何使用数据挖掘。数据挖掘是用来优化客户关系管理,提高企 业运营效率的,所以数据挖掘应用必须能够与企业现有客户关系管理流程或客户 关系管理的人工处理过程集成”】。因此,首先需要理解现有的客户关系管理流 程( 包括已经实现的客户关系管理系统的流程和人工处理过程) ,以确定在哪里 可以使用数据挖掘来进行优化。通常在一个客户关系管理系统中实施数据挖掘应 用时,不要同时针对客户关系管理流程的各个环节开发数据挖掘应用,而是首先 针对关键环节,或者需求较为强烈的环节优先开发数据挖掘应用。 ( 2 ) 定义数据挖掘应用的用户。数据挖掘应用的用户组成通常比较复杂, 他们包括经常使用系统但是仅使用一些简单功能的日常工作人员,也包括很少使 用系统但是每次使用系统都需要完成大量分析、挖掘任务的企业高层决策者;包 括精通数据挖掘技术的专业人员,也包括毫无技术背景的普通用户【3 6 】。所以系 统中用户的定义需要经过细致的用户需求分析,充分了解每一种用户的详细信息 ( 技术背景、使用系统的频率、是否具有数据挖掘技术相关知识等等) 、需求和 愿望。 ( 3 ) 定义所使用的数据并进行数据预处理。数据挖掘是否能够获得有价值 的信息,很大程度上取决于输入数据的数量和质量【4 1 1 。实施一个数据挖掘应用。 首先应该针对数据库或数据仓库中的大量数据建立完善的数据字典,或称为元数 武汉理工大学硕士学位论文 据。使用数据字典,可以准确地从数据或数据仓库中找到数据挖掘应用所需的数 据。 ( 4 ) 反复验证。存储在数据库中的数据通常存在数据的不完整、不一致等 一些情况,而且通常包含了许多挖掘时用不到的多余属性。所以,在真正使用这 些数据之前,需要对他们进行反复验证。数据挖掘是一个复杂的应用,对一 个大型数据挖掘应用的验证需要花费大量的时间,所以验证应该从较小的系统开 始。对系统的验证可以纠正其中发生的错误,而且有利于用户对数据挖掘应用的 理解,帮助他们提出更合理、更有创见性的建议。 ( 5 ) 用户培训。它也是非常重要的一环,因为用户才是最终真正使用客户 关系管理系统和其中的数据挖掘应用的人。对用户的培训必须让他们知道对所使 用的客户关系管理系统的整体流程、功能以及数据挖掘应用在其中所起的作用, 了解系统中所使用的数据的具体含义,最后指导他们对挖掘结果进行有效的访问 和可视化【4 2 】。在客户关系管理中实施数据挖掘应用是一个持续的过程,不可能 一蹴而就。随着客户关系管理系统的不断扩展和数据资源的积累,很可能需要重 新建立其中的数据挖掘模型或者创建新的数据挖掘应用。我们相信,数据挖掘和 客户关系管理的结合必然会推动企业的发展,同时也为客户提供更优质的服务。 武汉理工大学硕士学位论文 5 某联通分公司c r m 案例分析 众所周知,移动通信市场是一块利润丰厚的大蛋糕,而中国移动通信的现有 及潜在的用户消费群体是异常庞大的,国内目前拥有六大移动通信运营商:中国 移动、中国联通、中国铁通、中国网通、卫星通信,彼此之间的竞争已趋向白热 化。中国加入世贸以后,随着电信产业的逐步放开,务必将会有更多的服务商( 包 括国内和国外) 参与争夺,竞争可想而知将会进一步加剧。因此,对移动客户跳 槽因素的研究分析,是具有一定的现实意义和指导意义。本章研究一个联通分公 司利用数据挖掘技术分析客户跳槽问题而设计的c r m 系统。 5 1 公司基本经营情况 该联通分公司员工总数约3 0 0 0 人,其中近5 0 为大学以上学历。目前主要 经营的业务有:移动通信( 包括g s m 、c d m a ) 、国际国内长途通信、数据通信 ( a t m 和i p ) 、无线寻呼、互联网与电子商务及各种电信增值业务。 该分公司的移动电话网上用户达4 7 0 万户、寻呼网上用户1 5 1 万户,长途通 信网、数据通信网、i p 电话网及互联网已在全省各地开通并与全国连网,业务 高速增长。目前,已基本形成1 3 0 1 3 1 移动电话、1 2 7 1 2 9 1 9 2 1 9 9 无线寻呼、1 9 3 长途电信、1 7 9 1 0 1 7 9 1 l i p 电话、1 6 5 互联网等综合业务经营的新格局。 该分公司组织结构如图5 1 所示。 武汉理工大学硕士学位论文 分公司总经理 分公司副总经理l1 分公司总经理助理 综合部门 弧 大 客 户 发 展 中 心 技 术 部 移 动 通 讯 事 业 部 生产单元ll 共享部门 无 线 寻 呼 事 业 部 图5 1某联通分公司组织结构图 增 值 业 务 部 基 础 网 络 设 施 部 计 费 信 息 系 统 部 研 发 支 撑 中 心 其生产单元的部门主要是为客户提供各种产品或服务。其共享部门的职能主 要是网络基础建设、技术支持、记录客户使用的服务以及按照收费规则进行计算 客户应付的账单等。综合部门中的大客户发展中心的职能主要是针对大客户提供 优良的、定制化的服务。 用户在该公司任何一个营业厅登记入网后,就可以使用该公司提供的服务。 客户还可以直接通过i n t e h l e t 在该公司的网上营业厅办理登记客户注册入网、变 更业务信息、交费等业务。 5 2c r m 系统的设计目标 为了能够更好的向客户提供服务,提高客户的忠诚度,减少客户的流失,该 公司提出了运用数据挖掘模型深化客户关系管理。给客户关系管理系统的具体目 标是: ( 1 ) 采用该公司的有关当前客户和已跳槽客户详细信息的一个小型数据集 互联网与电子商务业务部 数据与同定通信业务部 武汉理工大学硕士学位论文 作为研究的样本数据集,进行客户群体分析,以便为有价值的客户提供个性化的 定制服务: ( 2 ) 利用数据挖掘的方法辨别出对公司不满意的顾客,与这些顾客进行沟 通,并改善自己的服务,尽一切可能挽留住客户,避免客户尤其是大客户的流失; ( 3 ) 能够尽可能的减少客户的恶意欠费,但同时又要避免与客户特别是那 些大客户发生冲突,即要求在客户不流失的情况下,减少客户的恶意欠费。 ( 4 ) 分析导致客户跳槽的各种因素并理解其重要性,从而提高客户保持率。 5 3c i m 系统功能分析 该系统的功能结构如图5 2 所示。 f := = = = = af := = = = :1e = = = af = = = = = a i 窖脆数据库ll 计费数据库l1 财务数据库i 网营数据库l 、_ _ 。- _ _ _ _ _ 。,_ 一、_ _ 。、_ _ _ _ _ 。,一、_ _ 。- _ _ _ _ _ ,。一、_ _ 。- _ _ - i _ 。,。一 图5 2 客户关系管理功能图 该公司客户服务中心、计费信息中心、财务部门和网管中心都有一套自己的 信息系统,拥有众多的业务数据和分散的客户数据,但每个信息系统的数据库并 不都兼容,这是历史原因造成的。该分公司虽然拥有大量的数据,但是很难跨部 门去取数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届安徽省五校联考高三上学期11月月考历史试题(含答案)
- 2025-2026学年北京版(新教材)二年级上册数学第五单元测试卷(表内除法)附参考答案
- 职业性急性有机磷中毒的护理
- 2026年设备监理师之设备工程监理基础及相关知识考试题库200道附完整答案(各地真题)
- 2026潍坊银行校园招聘备考题库附答案
- 2026秋季中国电科三十六所招聘备考题库附答案
- 2025年商洛公费师范生及优师计划招聘(95人)备考公基题库附答案解析
- 中国铝业集团有限公司2025年春季校园招聘及社会招聘备考题库附答案
- 2025年萍乡市妇幼保健院招聘编外人员(第二批)17人参考题库附答案解析
- 2026年投资项目管理师之投资建设项目实施考试题库200道附参考答案【预热题】
- 稽留流产的课件
- 租车挂靠协议书
- 人民医院改扩建建设项目水土保持方案
- 绿色插画风小蝌蚪找妈妈绘本故事
- 官兵心理健康教育
- 公务员职业生涯发展课件
- GB/T 192-2025普通螺纹牙型
- CRRT授权管理制度
- 中小学劳动教育的策略及实施路径
- 2025-2030中国电缆敷设船行业市场发展趋势与前景展望战略研究报告
- 掘进工区内部管理制度
评论
0/150
提交评论