(计算机软件与理论专业论文)电信客户细分系统的设计与实现.pdf_第1页
(计算机软件与理论专业论文)电信客户细分系统的设计与实现.pdf_第2页
(计算机软件与理论专业论文)电信客户细分系统的设计与实现.pdf_第3页
(计算机软件与理论专业论文)电信客户细分系统的设计与实现.pdf_第4页
(计算机软件与理论专业论文)电信客户细分系统的设计与实现.pdf_第5页
已阅读5页,还剩85页未读 继续免费阅读

(计算机软件与理论专业论文)电信客户细分系统的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京邮电大学硕士学位论文 电信客户细分系统的设计与实现 电信客户细分系统的设计与实现 摘要 客户细分( c u s t o m e rs e 鲫e n t a t i o n ) 是指按照一定的标准将企 业的现有客户划分为不同的客户群。本文基于数据仓库、数据挖掘理 论,提出了两种不同的电信客户细分方法并建立相应的客户细分 模一一统计客户细分模型、聚类客户细分模型,为套餐设计和套餐评 估等工作做了充分的前期数据准备。 本文首先介绍了电信客户细分的基本理论知识,然后依据s p s s 公司出的典型的数据挖掘商业过程模型的步骤,通过商业理解、数据 理解、数据准备过程,详细描述了客户细分模型的建立过程,根据不 同的细分方法建立相应的模型并对其结果进行了评估、比较和验证, 实现客户分群。通过对实际数据的验证,两种不同的客户细分方法对 目前的电信客户细分具有一定的参考性和实用性。在此基础上,通过 对电信套餐分析与管理系统进行了详细的阐述与说明后,重点开始介 绍其子系统一一客户细分子系统。本文详细设计电信客户细分系统的 层次体系架构和功能体系架构,并编码实现该系统的三个主要模 块一一数据准备模块、客户细分模块和预警跟踪模块,将客户细分整 个过程通过自动化的过程描述出来。 本文建立的模型丰富了原有的客户细分方法,是对客户细分理论 的进一步拓展。通过本文的电信客户细分的分析与研究,为电信企业 进行产品设计、拓展市场等工作提供了一定的前提和保障。 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 关键字:数据仓库数据挖掘聚类分析客户细分 北京邮电大学硕士学位论文 电信客户细分系统的设计与实现 d e s i g na n dd e v e i 0 p m e n t0 f c u s t o m e rs e g m e n 咖0 ns y s t e m i nt e l e c o m a b s t r a ( 了r c l l s t o m e rs e g m e n t a t i o ni s s e g m e n t i n gt h ec u s t o m e r si n t o s e v e r a l d i f i e r e n tc o l o n i e sa c c o r d i n gt os o m es t a i l d a r d t h ep a p e rb r i n g sf o r w a r d d i f ! e e r e n tt e l e c o mc u s t o m e r s e g m e n t a t i o nm e m o d s , b a s e do nd a t a w a r e h o u s ea n dd a t am i n i n g ,a l l de s t a b l i s h sc u s t o m e rm o d e l s ,a c c o r d i l l gt o d i f e r e n tm e t h o d s t h em o e h o db a s e do ns t a t i s t i ca n dt h em o t h e db a s e d o nc l u s t e r i n g 1 h em o d e l sc a np r e p a tf mp r o d u c td e s i g na n d 妒o d u c t e v a l u a t i o n f i r s to fa l l ,t h ep a p e ri n t r o d u c e st h eb a s i ct h e o r i e so ft e l e c o m c u s t o m e rs e g m e n t a t i o n t h e nt h f o u g hd e s c r i b i i l gt h ep h a s e sb u s i n e s s u n d e r s t a n d i n g , d a t a u n d e r s t a n d i n g , d a t a p r e p a r a t i o n , b a s e do nc r o s s i n d u s t r y s t a n d a r d p r o c e s s f o rd a t a m i n i n g ,e x p o u n dt h ep r o c e s s o f c u s t o m e r s e g m e n t a t i o nm o d e l s , a n da c c o r d i n gt od i f ! b r e n tm o t h e d s s e t t i n gu pd i f f e r e n tm o d e l s 锄dt h e nc o m p a r i n ga n de v a l u a t i n gt h e m a f t e rv a l i d a t et h ep r a c t i c a ld a t a ,w ec a nc o n d u d et h a tt h ec u s t o m e r s e g m e n t a t i o nm e t h o d sa r ep r a c t i c a l t ot e l e c o mc u s t o m e rs e g m e n t a t i o n a f t e ri n t m d u c i n gt h es y s t e mo ff e e s e ta n a l y s i sa n dm a n a g e m e n t ( f 、a m s ) , t h ea u t h o rd e s c r i b eo n es u b s y s t e mo fr 6 l m s ,t h es y s t e mo fc u s t o m e r s e g m e n t a t i o n ,d e s i g n i n gt h es y s t e m a t i cs t m c t l l r e o ft e l e c o mc u s t o m e r s e g m e n t a t i o ns y s t e m ,a n df e a l i z i n gt h et h r e em a i nm o d u l e s o ft h es y s t e m : d a t ap r 印a r a t i v e ,c u s t o m e rs e g m e n t a t i o n ,d e f e n d i n ga n dt r a c k i n gm o d u l e s , t t l 北京邮电大学硕士学位论文 电信客户细分系统的设计与实现 r e a l i z et h ea u t o m a t i z a t i o no fc u s t o m e rs e g m e n t a t i o n t h em o d e l se n r i c hm ec u s t o m e rs e g m e n t a t i o nm o m e d s i td e v e l o p s t h ec u s t o m e rs e g m e n t a t i o nt h e o r i e s t h r o u g ht h ea y a l y s i sa n dr e s e a r c ho f t e l e c o mc u s t o m e rs e g m e n t a t i o n ,t h ep a p e rs u p p l yt h et e l e c o me n t e r p r i s e w i t hg r o u n d w o r ko np r o d u c t d e s i g n i n ga n de x p l o i t i n gt h en e w m a r k e t s k e y w o r d s :d a t aw a r e h o u s e ,d a t a 1 l l i n i n g ,c l u s t e r i n g ,c u s t o m e r s e g m e n t a t i o n 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 图2 1r 蹦分析 图表目录 6 7 1 1 1 5 1 5 1 6 2 2 2 5 2 6 图2 2 客户价值矩阵分析 图2 3 数据仓库的体系结构 图2 4 典型的数据挖掘系统结构 图2 5 教据挖掘环境框图 图2 一 图2 6 数据挖掘的基本过程和主要步骤 7 数据挖掘商业过程模型c r i s p - 喇 图2 8 c 蹦中数据挖掘的一般过程 图2 9 数据挖掘在c 蹦中的应用模型 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 图4 一 囤 图 图 图 圈 1 套餐使用情况表 2 选择套餐用户的年龄分布图 3 性别与套餐分布情况 4 数据准备过程 5 平均每天通话次数分布图 6 建模过程循环优化示意图 7 聚类分析流程 8 聚类分析建模过程 9 建模前后的指标分布图 10 决策树细分结果图形展示展示 1 1 决策树细分结果字段区间展示 1 2 客户群分类特征图形展示 1 3 在统计细分基础上的亲友国内型用户聚类细分图形展示 1 4 新客户细分处理流程 1 f l l s 系统整体结构图 2f 凇系统功能模块组成图 3f 幡系统工作流程图 4 电信客户细分系统层次架构图 5 电信客户细分系统总体系统架构图 6 数据准备用倒分析 7 统计方法细分用倒 8 聚类方法细分用倒 9 预警跟踪用倒 l o 电信客户细分系统主要实现类 1 1 数据准备模块字段s q l 生成时序图 1 2 统计细分时序图 1 3 聚类细分时序图 1 4 数据流向图 1 5 字段定义流程 1 6 统计方法细分流程 1 7 聚类方法细分流程 1 8 预警跟踪流程 1 概念设计模型c 蹦 2 系统页面1 3 系统页面2 4 系统页面3 5 系统页面4 7 0 7 6 7 6 7 7 7 7 站辩m努竹勰”钉船钉钳拍盯 n舄弘弱鼹弱n配品甜:8铂酊 图图图图图图图图图图图图图图 北京邮电大学硕士学位论文 电信客户细分系统的设计与实现 图5 6 系统页面5 图5 7 系统页面6 图5 8 系统页面7 袁3 一 表3 一 表3 一 表3 一 表3 一 袁3 一 表3 一 袁5 一 表5 一 表5 一 表5 一 表5 1 用于建模的可选择细分变量表 2 用于模型解释的描述变量表 3 标量数据类中和总体数量表示 4 离散化区间 7 8 7 8 7 9 3 2 5 统计细分结果表 6 聚类结果展示 7 统计细分基础上的聚类细分结果展示 l 用户行为特征表 2 统计细分规则表 统计细分规则表 统计细分类别编码表 聚类细分结果表 i 4 0 4 0 4 2 4 4 4 6 7 4 7 4 7 5 7 5 7 5 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:裂拯 日期: i ! 显主! 垫 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释: 本人 导师签名:日期:! ! z :! :! 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 1 1 背景及目的 1 1 1 背景 第一章绪论 随着信息产业的发展,客户对于电信服务的要求日趋理性与严格,对电信服 务的整体质量也提出了更高要求,为此,“把适当的资源以适当的方式提供给适 当的客户”已被作为一种新理念渗透到电信行业的方方面面,成为企业赢得竞争 的一项长久策略。 互联网络的迅猛发展,市场的不断成熟使世界经济进入了电子商务时代,产 品和服务的差异越来越小。以生产为中心、以销售产品为目的的市场战略逐渐被 以客户为中心、以服务为目的的市场战略所取代。谁能掌握客户的需求趋势,加 强与客户的关系,有效发掘和管理客户资源,谁就能获得市场竞争的优势,在激 烈的竞争中立于不败之地。以客户为中心的客户关系管理( c u s t 咖e r r e l a t i o n s h i pm a n a g e m e n t ,简称c 跚) 已经成为产业界、学术界应用和研究的焦 点。 随着对客户关系研究的不断深入,很多学者发现客户保持( 客户保持是指供 应商维持已建立的客户关系,使客户不断重复购买产品或服务的过程) 对公司的 盈利能力有着惊人的影响,客户保持率一个小的提高就能导致利润可观的改善。 r e i c h h e l d 和s a s s e r ( 1 9 9 0 ) 对美国9 个行业的调查数据表明,客户保持率增加 5 ,行业平均利润增加幅度在2 5 - 9 5 之间。客户保持己经成为公司成功最至关 重要的因素。客户保持对公司利润的影响如此之大是因为保持现有客户比获取新 客户的成本低得多,一般可节约4 6 倍( w e l l s ,1 9 9 3 ) ,另外忠诚客户趋向于购 买公司更多的产品、对价格更不敏感( r e i c h h e l d ,1 9 9 6 ) ,被保持的忠诚客户会 主动为公司传递好的“口碑”、推荐新客户、对竞争品牌和广告更少关注、有成 为合作伙伴的潜力。因此,拥有长期忠诚客户的公司比拥有低单位成本、高市场 份额但客户流失率高的竞争对手更有优势。随着市场的成熟,竞争的焦点将会转 移到保持现有客户上。然而,客户保持的目标不是追求零流失,也不是说最大化 客户保持率就等同于最大化企业利润。企业应把有限的资源投入到有利可图的客 户,确定哪些是企业应该保持的客户,对于有效的开展客户保持、增强盈利能力 有着重要的意义。另外,对客户针对性的设计新的产品,以及综合分析客户价值, 都需要对客户进行细分。因此,客户细分是保证企业成功实施战略的关键。 北京邮电大学硕士学位论文 电信客户细分系统的设计与实现 企业要实现盈利最大化,需要依赖两个关键的战略:确定客户正在购买什么, 如何以有效的方式将产品和服务传递给客户。大多数企业都没有通过客户细分来 识别和量化销售机会,企业的不同部门可能会从不同的角度试图去解决这个问 题,如营销部门评估客户需求、财务部门看重产品的盈利能力,人力资源部门制 定销售人员的激励计划等,但是这些专业分工没有充分地把他们的努力集成,以 产生一种有效的营销方法。没有准确的客户定位,没有对目标客户的准确理解, 稀缺的营销资源被投放在无效的、没有针对性的计划上,常常不能产生预期的效 果,并浪费了大量的资源。客户细分能够帮助企业有效地调动各种营销资源,协 调不同部门的行动,为目标客户提供满意的产品和服务。 客户细分( c u s t o m e rs e g i i l e n t a t i o n ) 是指按照一定的标准将企业的现有客 户划分为不同的客户群。客户细分是客户关系管理的核心概念之一,是实施客户 关系管理重要的工具和环节。s u z a n n ed o n n e r 认为:正确的客户细分能够有效 地降低成本,同时获得更强、更有利可图的市场渗透。通过客户细分,企业可以 更好地识别不同客户群体对企业的价值及其需求。以此指导企业的客户关系管 理,达到吸引合适客户,保持客户,建立客户忠诚的目的。 目前,对客户细分已经引起了越来越多人的关注,并出现了不少客户细分的 方法的研究及成果,然而,如何真正的将电信客户细分应用于企业,解决企业目 前的实际困难,仍然是企业急需面对的问题。 1 1 2 目的 本论文的目的是设计一个比较全面的客户细分模型,通过涵盖大部分的客户 消费行为模式,提取出客户的特征,为电信企业的产品开发、发现新的市场机遇 等经营决策提供了有力的支持。除此之外,研究并实现电信套餐分析与管理系统 中的客户细分子系统,一方面将客户细分的方法、过程以及结果通过可视化平台 展现出来,另一方面,将数据准备整个流程以及方法融入系统之中,避免了每次 进行数据处理都需要进行长时间的准备工作,将更多的工作与精力集中于客户细 分之中。 1 2 研究内容与论文成果 本文的主要内容是围绕数据挖掘技术在电信客户细分领域的应用这一实际 问题展开的。主要解决如何使用数据挖掘技术对电信客户进行合理的、有效的划 分这一问题。并通过两种不同解决方案的研究,找到解决这一实际应用最好的方 法。具体来说本文主要包括以下几个方面内容: 2 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 研究客户的各种行为,如通话行为、消费行为等,寻找合适的行为细分 变量,研究细分变量的方法,如细分属性与细分变量的关系( 有汇总关 系、一对一关系等) 。 研究客户细分的方法,比较几种客户分群的效果。如统计方法细分,聚 类方法细分,或在统计细分的基础上进行聚类细分,也可以比较不同的 聚类方法结果,如k m 啪s 方法、神经网络算法等;另外,在利用统计 方法细分时,需要研究采用何种方法来确定权值的大小,如在每天通话 次数在多少次以上才能认为是通话密集型用户。 结合作者完成的客户细分工作,设计并实现了电信客户细分系统,设计 电信客户细分系统的体系结构,各个模块功能和内部流程,以及接口和 信息模型。 结合以上所做的工作,本文所取得的主要成果有: 设计比较全面的客户行为细分模型,模型能够覆盖多种客户类型,为企 业进行产品设计,寻求更好的市场机遇奠定了良好的基础。 设计并实现了电信套餐分析与管理系统中的客户细分子系统,为套餐设 计、预演、及套餐评估做了详细的分析与设计基础。 1 3 论文结构 论文按以下章节组织: 第一章是绪论部分,简要介绍了本论文的相关背景,工作内容以及论文结构。 第二章介绍了客户细分的功能及常见的细分方法,数据仓库与数据挖掘中与 论文相关的理论,数据挖掘商业过程模型以及统计细分方法。 第三章,根据前面介绍的基本内容描述了建立客户细分模型的过程,数据来 源是江西省南昌市联通c 网数据。采用s p s s 公司建模所采用的标准流程方法一一 c r i s p 一删( c r o s s i n d u s t r ys t a n d a r dp r o c e s sf o rd a t am i n i n g ) ,从商业理 解、数据理解、数据准备、建模、评估、发布几个方面进行描述,并对其中出现 的数据更新处理问题进行了详细的描述。 第四章,详细介绍了电信客户细分系统的设计。在描述了系统的体系结构后, 对系统的几个功能模块进行了详细的阐述,最后详细描述了系统各个接口部分。 第五章,对电信客户细分系统的核心功能的实现进行了展示。 第六章,结束语部分,指出论文的优缺点,并提出下一步的工作方向。 文章的最后是参考文献,附录和致谢。 3 北京邮电大学硕士学位论文 电信客户细分系统的设计与实现 第二章相关理论与技术介绍 2 1 客户细分研究综述 前面讲过,客户细分,是指将一个大的客户或消费者群体划分成一个个细分 群体,而这些群体中同属一个细分群的客户或消费者彼此特性相似,而隶属于不 同细分群的客户或消费者是不同的。 客户细分在市场营销、客户保持中具有很大的作用,得到客户细分模式用来 识别具有相似特色的客户组,这样能帮助我们理解客户。最终,利用它做客户本 质分析和市场策略发展。 在移动业务市场中,了解客户是一个好的开始。了解客户群的目的行为,将 能够使市场营销、客户保持策略有更好的针对性。比如说,对于像周末高消费用 户的客户群,可以提供某种价格计划或免去部分通话时间等优惠资费政策。 客户细分可以有许多不同的标准,有基于人口统计学细分、心理学细分、目 的行为性细分。这些标准像简单的年龄,性别,地区,或者是这些变量的组合而 成。数据挖掘技术可以满足了这些复杂的标准。使用什么样的标准依赖于细分客 户的目的是什么和怎样利用这些细分后的结果。当用数据挖掘技术实现客户细分 时,最重要的是,在实际的商业环境中进一步被利用这些结果。 我们进行客户细分,在数据挖掘中实际上是采用聚类算法、统计方法等来实 现的。由数据挖掘产生的细分的目标是发现不同的客户群,我们拥有客户数据, 不是主观判断或划分这些客户群以及这些客户群的特点是什么,这样,通过数据 挖掘分析能够显示真正的商业规则。 如果正确的使用数据挖掘,它将帮助找出尚未发现的客户类型,将必然开辟 新的市场细分的思路,这将提供最合适的方法为你新发现的客户群提供新的营销 思路。 2 1 1 客户细分的作用 ( 1 ) 客户识别与定位 通过客户细分为企业的每一个客户确定其所属的类别,可以使企业管理者在 各种管理与营销活动中,迅速准确地定位每一位客户的典型特征。 ( 2 ) 客户价值预测与忠诚度分析 4 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 客户价值与客户忠诚度是客户概念空间中的两个重要概念维。一般而言,仅 占客户较少部分的高价值客户往往对企业的利润有着极其重要的影响,因此提高 这部分客户的忠诚度等级是一个关系企业成败的关键问题。基于数据挖掘的客户 细分可以提供按客户价值与客户忠诚度分类的方法,通过建立客户价值与客户忠 诚度的分类模型,确定每个客户的价值等级与忠诚度等级。 ( 3 ) 指导新产品开发 通过客户细分可以发现企业客户的偏好倾向,对这些偏好的分析,可以使企 业了解各类客户的需求,并将其体现于新产品的设计中。例如,移动通讯部门通 过基于通讯模式的客户细分,推出相应的服务模式。 ( 4 ) 发现新的市场机会 在客户细分中企业可以了解到不同客户类型的需求特征,并从中发现那些尚 未被充分满足的客户需求,从而为企业的现有产品发现新的市场机会。 ( 5 ) 确定产品与服务的目标市场 通过客户细分可以使企业明确其产品和服务的目标客户群类型,从而可以进 行明确的产品市场定位。 ( 6 ) 设计最优的营销策略 通过客户细分可以使企业根据不同客户群的特点,确定不同市场上的最优营 销策略。 ( 7 ) 为其它客户分析方法提供信息支持 客户细分除可以为企业管理提供很多直接的功能外,还可以为其他的分析功 能提供信息支持。例如,可以在客户细分的基础上进行客户忠诚度分析、客户价 值分析以及客户生命期预测等客户分析。 2 1 工常用的客户细分方法 1 r f m 分析 r 刚分析。是广泛应用于数据库营销的一种客户细分方法。r ( r e c e n c y ) 指上 次购买至今之期间,该时期越短,则r 越大。研究发现,r 越大的客户越有可能 与企业达成新的交易。r 越大,企业保存的该客户的数据就越准确,因为企业拥 有的数据会迅速的失效,每隔一年约有5 0 9 6 的信息变得不准确了。f ( f r e q u e n c y ) 指在某一期间内购买的次数,交易次数越多的客户越有可能与企业达成新的交 易。m ( 帅n e t a r y ) 指在某一期间内购买的金额。越大,越有可能再次响应企业的 产品与服务。r f m 分析的所有成分都是行为方面的,应用这些容易获得的因素, 能够预测客户的购买行为。以最近的行为预测客户的购买行为比用其他任何一种 因素进行预测更加准确和有效。 5 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 进行r f m 分析,所有的客户记录都必须包含特定的交易历史数据,并准确的 标号。r f m 分析给客户的每个指标打分,然后计算r f m 。 在确定r 、f 、m 时,不能采取主观赋值的办法,例如,对于某位客户,他 在过去6 个月内购买了产品,则认为确定该客户的r = 5 ,对r 主观赋值看起来 很好,但后来会带来问题。因此,更好的办法是按照最近的购买日期将客户记录 排序,最近的在顶端,最远的在底端,这样就可以把全部客户分成若干相同的部 分,顶端的赋予高分,依此类推。确定f 、m 的方法与此相同。这样,每个客户 都被定位在有限的一个三维空间里,从( 1 ,l ,1 ) 到( 5 ,5 ,5 ) ,合计有1 2 5 个客户 群。 在计算了所有客户的r f m 后,把计算结果从大到小排序,前面的2 0 是 最好的客户,企业应该尽力保持他们;后面的2 0 是企业应该避免的客户:企业 还应大力投资于中间6 0 客户,使他们向前面的2 0 迁移。向上迁移( m i g r a t eu p ) 的客户提高了他们的消费和忠诚度。另外,企业应关注那些拥有与前面2 0 9 6 的客 户相同特性的潜在客户。 r 踟分析是一种有效的客户细分方法。在企业开展促销活动后,重新计算每 个客户的r f m ,对比促销前后的r f m ,可以清楚的看出每个客户对于该活动的响 应情况,为企业开展更加有效的营销提供可靠的依据。其缺点是分析过程复杂, 需要耗费很多时间,而且细分后得到的客户群过多,如每一种变量有三个取值 就会得到2 7 个客户群,以至于难以形成对每个客户群的准确理解,也就难以针 对每个细分客户群制定有效的营销战略。所以,资金和人力资源有限的中小型企 业开展r f m 分析有一定的困难。r f m 分析的另一个缺点是购买次数( f ) 与同期总 购买额( m ) 这两个变量间存在多重共线性,即一个给定客户每多一次购买,他的 总购买额也相应增加。 , , 最近一次交易距今时间l s 5 1 l5 2 l5 3 l 5 4 l 5 5 l 一, 最近一次交易距今时问= 4 4 l l4 2 14 3 l4 4 14 5 1 , 最近一次交易距今时间1 33 l l 3 2 i3 3 i 弘i3 5 l 最近一次交易距今时间1 22 l i 2 2 i2 3 l 2 4 l2 5 l ,石 最近一次交易距今时问一i l l i 1 2 l1 3 1 1 4 l 1 5 l 膨妗 频颡颡 频频 一 7 率率率率率 :1 3; 图2 1r 两分析 6 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 2 客户价值矩阵分析” 为了消除购买此属于总购买额间的多重共线性,m a r c u s 提出对传统r f m 分 析进行修正,用平均购买额代替总购买额。另外,为了解决传统r 刚分析过多细 分客户群的缺陷,他提出用购买次数( f ) 与平均购买额( a ) 构造的客户价值矩阵简 化细分的结果( 下图) 所示。第三个变量r e c e n c y 在客户价值矩阵中被剔除, r e c e n c y 与其他的变量( 如交易类型、关系的长度与客户价值矩阵) 结合使用。 骚 酥 鼗 霹 单 图2 2 客户价值矩阵分析 形成客户价值矩阵需要的信息有:客户代码、购买日期、日购买额、购买次 数由不同的购买日期的数目确定,日购买额用来计算平均购买额。r e c e n c y 可以 由最近的购买日期确定,其可以用最近的购买日期减最早的购买日期计算得到。 交易类型需要收集产品信息。地理、人口统计学、偏好方面的信息也可以与客户 价值矩阵结合使用。 在i i a r c u s 提出的客户价值矩阵中,确定购买次数与平均购买额的基准是各 自的平均值,一旦确定每一个坐标轴的平均值,每个客户就被定位于客户价值矩 阵的每个象限里。然后,分析每个象限中的客户群的关键差异。 客户价值矩阵的优点在于这种细分方法产生针对每一个客户群的及跨越客 户群的营销战略战术。最好的客户代表了企业的基础,保持是必要的;对于乐 于消费型,最适合的战略是增加他们的购买频率;对于经常性客户,他们通过不 断的购买证明了自己的忠诚,最好的战略是通过交叉销售、向上销售增加他们的 平均购买额;对于不确定型客户,最好的战略可以描述为慎重的精选,把营销努 力集中于不确定型的新客户和那些对某种具体的产品感兴趣的客户。结合其他的 客户信息,客户价值矩阵能够制定跨越客户群的营销战略战术,强化客户保持。 b o c k 等人提出,客户之间存在着至少五种一般类型的差别:对产品利益的偏 7 北京邮电大学硕士学位论文 电信客户细分系统的设计与实现 好、客户相互作用的影响、选择障碍、讨价还价的能力、盈利能力。b o c k 认为, 按这种差别分类能够修正或改进现有的客户细分方法,当一个或多个差别在客户 基础中存在而没有被考虑时,细分是次优的。例如,当一个购买频率很高的客户 被关注时,同时他的平均购买额低,即该客户属于经常性客户,那么这可能是选 择障碍引起的,客户可能由于知识、感知、转移成本、信息处理方式的缺陷而没 有做出高额的购买决策,而这种选择障碍可以由营销者产生、强化、弱化、破坏; 也有可能该不确定型客户为企业推荐了很多其他的客户,即由于客户相互作用影 响的存在带来的口碑宣传,如果忽视了这种情况,企业会损失本应获得的由该客 户带来的很多潜在客户。r f m 分析和客户价值矩阵都没有全面考虑客户之间的这 五种差别。 3 数据挖掘方法 数据挖掘( d a t am i n i n g ,d m ) 是随着计算机的广泛应用和数据的大量积累而 发展起来的,它同数据库知识发现( k n o w l e d g ed i s c o v e r yi nd a t a b a s e ,k d d ) 和数据仓库有着密切的联系。数据挖掘是指从存放在数据库、数据仓库或其他信 息库中的大量数据中自动地发现相关模式、提取有潜在价值的信息、挖掘知识的 过程。从c 跚的角度,数据挖掘应用就是从大量数据中挖掘出隐含的、先前未知 的、对决策有潜在价值的知识和规则,并能够根据已有的信息对未来发生行为作 出结果预测,为企业经营决策、市场策划提供依据。 数据挖掘根据挖掘任务划分,有如下几种知识发现任务:分类知识发现、数 据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、 异常发现和趋势预测等。客户细分是企业开展客户关系管理的第一步,能够根据 客户价值细分客户是客户关系管理成功实施的前提条件。 客户关系管理是对企业和客户之间的交互活动进行管理的全过程,是一种旨 在改善企业与客户之间关系的新型管理机制,其核心思想是将企业的客户( 包括 最终客户、分销商和合作伙伴) 作为最重要的企业资源,通过完善的客户服务和 深入的客户分析来满足客户的要求,保证实现客户的终生价值。 在c 跚中应用的主要技术有:统计、聚类、决策书、神经网络和关联规则。 对于要挖掘的数据,可以是来自传统的关系数据库,也可以建立面向主题的、采 用多维数据立方体组织数据的数据仓库。电信行业数据本身具有多维性,如呼叫 时间、通话时长、呼叫类型等维度,对此类数据的多维分析有助于识别和比较数 据通信情况、用户组行为等,因此用数据仓库组织电信行业数据十分有效,可以 经常使用联机分析处理和可视化上具进行多维分析。 8 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 2 2 数据仓库技术 2 2 1 数据仓库介绍 传统的数据库技术是单一的数据资源,即以数据库为中心,进行从事处理、 批处理到决策分析等各种类型的数据处理且工作。随着计算机技术的发展,人们 对以往计算机的简单数据操作提出了更高的要求,希望计算机能够更多地参与数 据分析与制定决策。目前,数据库处理被大致分为两大类:操作型处理和分析型 处理。这种分类划清了数据处理的分析型环境与操作环境之间的界限,从而由原 来的以单一数据库为中心的数据环境发展为种折环境:体系化环境。这种分离的 结果,导致了数据仓库技术的出现和迅速发展。 业界公认的数据仓库概念创始人w h i n 肿n 在其著作b u i l d i n gt h ed a t a w a r e h o u s e 一书中给予如下描述:数据仓库( d a t aw a r e h o u s e ) 是一个面向主 题的( s u b j e c t0 r i e n t e d ) 、集成的( i n t e g r a t e ) 、相对稳定的( n o n v o l a t i l e ) 、 反映历史变化( t i 鹏v a r i a n t ) 的数据集合,用于支持管理决策制定过程 1 。+ 对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决 策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库 是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据, 而且存放在数据仓库中的数据一般不再修改。 2 2 2 数据集市介绍 数据集市的概念与数据仓库类似,主要区别在于应用的范围。数据仓库是企 业级的,可以为整个企业提供统一的数据视图:而数据集市则主要面向部门。因 此,有人将数据集市称为部门级的数据仓库( d e p a r t 鹏n t a ld a t aw a r e h o u s e ) , 或。小数据仓库”。如果说数据仓库是建立在企业级的数据模型之上的话。那 么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只面 向某个特定的主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。无论 数据集市提供何种功能,它们都必须被设计为主数据仓库的组件,以使数据的组 织、格式和构架在整个数据仓库内保持一致。表的设计、更新机制或维度的层次 结构如果不一致,则可能会使数据无法在整个数据仓库内重新使用,并可能导致 由相同的数据生成不一致的报表。 一般来说,数据集市主要从企业级数据仓库获取数据,是终端用户和企业数 据仓库交互最多的地方。数据集市根据且所有部门的不同需求进行定型。由于各 个部门都拥有自己的数据集市,因此数据集市各不相同。 9 北京邮电大学硕士学位论文 电信客户细分系统的设计与实现 数据集市的核心是各种结构,这些结构为终端用户访问和分析数据而设计。 它们的前端是立方体或多维结构。数据集市必须须涉及建设人员,他们在提交多 数查询程序之前通常会对它们进行合理的组织。 2 2 3 盯l ( e x t r t i 彻t r s f o m t i 1 0 a d ) 过程 e t l 即数据抽取、转换和加载,是数据仓库实现过程中,将数据源系统向数 据仓库系统加载的主要过程2 。e t l 过程关系到数据的质量,构成了数据仓库应 用的基石。根据目前建设数据仓库的经验,e t l 过程一般要占到整个过程时间的 5 0 以上,因此,必须对它给予充分的重视。 典型的数据抽取接口包括数据库接口和文件接口,对于不同数据平台、不同 源数据形式、不同性能要求和业务量的业务系统以及不同数据量的源数据,应采 取不同的数据抽取接口。数据的抽取必须既充分满足决策支持系统的需要,又要 保证不影响业务系统的性能,所以,进行数据抽取时,应制定相应的策略,包括 抽取方式、抽取时间、抽取周期等内容。 数据转换是指对业务系统中抽取的源数据根据数据仓库系统模型的要求,进 行数据的转换、清洗、拆分、汇总等处理,保证来自不同系统、不同格式的数据 的一致性和完整性,并按要求装入数据仓库。 数据转换主要解决了由以下原因造成的数据不一致性问题: 源数据系统同数据仓库系统在模型上的差异性; 源数据系统平台不一致:数据仓库系统的数据源包括基于不同平台的数 据库的数据,存在大量的数据转换工作; 源数据结构的不一致:有些数据源由于历史的原因,导致同一个表在不 同的时期数据结构不一致。 数据加载就是将从数据源系统中抽取、转换后的数据加载到数据仓库系统 中。要求数据加载工具必须具有高效的加载性能。 数据加载技术主要有以下两种: 使用数据仓库引擎厂商提供的数据加载工具进行数据加载; 通过数据仓库引擎厂商提供的a p i 编程进行数据加载。 数据加载策略要考虑加载周期及数据追加策略两方面的内容。数据的追加策 略根据数据的抽取策略以及业务规则确定,一般有以下三种类型:直接追加、全 部覆盖、更新追加。 1 0 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 2 2 4 电信数据仓库的体系结构 电信数据仓库系统是一个包含四个层次的体系结构,具体如图所示,特说明 如下:”4 6 首先数据仓库需要通过适当的数据接口,从外部业务系统抽取和装载数据作 为数据来源,在抽取过程中和入库以后都可以进行数据的清理和转换工作,入库 以后还需要通过适当的汇总处理方式对原始数据进行进一步加工,并生成有明确 业务目标的数据集市数据,外部应用通过数据集市或直接访问数据仓库基础数据 来达到数据的前端展示和应用,这些应用包括构造c u b e ( 数据多维立方体) 以供 多维度分析,或者通过报表工具生成报表,此外数据仓库还可以为数据挖掘应用 提供支持,在企业业务数据比较分散,业务分析逻辑复杂的情况下,采用数据仓 库技术,对企业数据进行整合和加工,能够帮助企业更好的利用企业的信息资源, 做出科学化的业务决策。 e 口 目 口 麓鸯瓣 lo 飘挚瓣舞嚣 口口 擞篝生鸢 躺避工熏 警攀强 箍囊工曩 置矾 图2 3 数据仓库的体系结构 数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内 部信息和外部信息。内部信息包括存放于r d 跏s 中的各种业务处理数据和各类文 档数据。外部信息包括各类市场信息、竞争对手信息和各种手工收集的信息等等。 数据的存储与管理:是整个数据仓库系统的核心。数据仓库的真正关键是数 据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也 决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的 核心,则需要从数据仓库的技术特点具体需求着手分析。针对现有各业务系统的 数据,进行抽取,清理,并有效集成,按照主题进行组织。数据仓库按照数据的 覆盖范围可以分为企业级数据仓库和部门级数据仓库( 通常称为数据集市) 。 o l a p ( o n l i n ea n a l y s i sp r o c e s s ) 服务器:对分析需要的数据进行有效集 成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具 体实现可以分为:r o l a p 、m o l a p 和h o l a p 。r o l a p 基本数据和聚合数据均存放在 1 l 北京邮电大学硕士学位论文 电信客户细分系统的设计与实现 r d b m s 之中:m o l a p 基本数据和聚合数据均存放于多维数据库中;h o l a p 基本数 据存放于r d b m s 之中,聚合数据存放于多维数据库中。 前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工 具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针 对o l a p 服务器,报表工具、数据挖掘工具主要针对数据仓库。 2 3 数据挖掘技术 2 3 1 数据挖掘技术简介 数据挖掘就是对观测到的数据集( 经常是很庞大的) 进行分析,目的是发现 未知的关系和以数据拥有者可以理解并对其价值的新颖方式来总结数据。它通过 特定类型的技术,从大量的数据中辨认和发掘出有价值的信息。由于企业数据在 未经过加工处理之前,通常是庞大、表面上低信息含量的,只有很小的使用价值, 有用的信息往往是隐藏在数据的背后,所以需要通过数据挖掘这样一个途径去发 现其中有价值的信息,使得这些信息能够在企业决策支持、预测、估计等诸多领 域提供帮助。 通过数据挖掘解决商业问题,总体思路是通过对商业问题的充分理解,把商 业问题转化为数据挖掘可以解决的问题,进而通过数据挖掘工具软件求得数据挖 掘问题的结果,然后业务人员解读数据挖掘结果,最终把数据挖掘结果转化为商 业问题解决方案,从而提升企业利润或降低企业成本。 根据数据挖掘发现的模式不同,可以将数据挖掘问题归纳为以下几类: 数据描述和汇总( d a t ad e s c r i p t i o na n ds 嘲i z a t i o n ) 数据描述和汇总是应用统计指标或者图形对数据进行一般性概括。更多时 候,它仅仅是数据挖掘的开始,人们常常可以通过对数据的初步描述和汇总进行 探索性分析,得出一些感性或者有趣的结论,从而可以更好的进行下一步的数据 挖掘工作。同时数据描述和汇总也是用于数据挖掘结果展现的一种比较有效的途 径。 细分( s e 鲫e n t a t i o n ) 细分的目的是把数据拆分成若干个部分,使得不同部分之间的数据特征差距 尽可能的大,而同一部分内部的数据特征尽可能接近。例如:可以根据人们的人 口统计学特征( 年龄、性别、收入等) 和人们的消费习惯特征( 一次购买金额、购 买频次、购买物品等) 进行细分,从而得到不同的购买习惯群体,每一群体具各 大致相同的人口统计学特征和大致相近的购买习惯,那么我们就可以针对这些群 体制定适当的市场营销策略,从而提高市场促销活动的效果,有针对性的吸引新 北京邮电大学硕士学位论文电信客户细分系统的设计与实现 客户或者留住旧客户。 在数据挖掘中,往往通过聚类分析孔2 的方法来实现细分。聚类分析方法至 少有以下几类: 1 ) 系统聚类法:它首先把每条数据记录算作一群,然后把数据特征最接近 的两群首先进行归并,继而再对归并后的群体并根据其间的相似性进行 第二轮的归并,依次类推,直到全部数据被归为一群。在这种方法中, 人们可以按照一定的标准对数据归为多少群进行指定。但是这种方法只 适合在小数据量的时候使用,数据量大的时候速度会非常慢。 2 ) 快速聚类法:也叫k 均值法( k m e a n s ) 。使用者需要首先确定数据分为k 群,该方法会自动确定k 个群的中心位置,继

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论