(管理科学与工程专业论文)基于改进支持向量机的信用卡客户细分模型.pdf_第1页
(管理科学与工程专业论文)基于改进支持向量机的信用卡客户细分模型.pdf_第2页
(管理科学与工程专业论文)基于改进支持向量机的信用卡客户细分模型.pdf_第3页
(管理科学与工程专业论文)基于改进支持向量机的信用卡客户细分模型.pdf_第4页
(管理科学与工程专业论文)基于改进支持向量机的信用卡客户细分模型.pdf_第5页
已阅读5页,还剩80页未读 继续免费阅读

(管理科学与工程专业论文)基于改进支持向量机的信用卡客户细分模型.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于改进支持向量机的信用卡客户细分模型 摘要 l i i l l l111111i l l l1 1 1i itillli i l l u l y 17 3 6 3 5 8 随着我国加入世贸组织以及金融体制改革的逐渐深入,越来越多的世界级外 资银行涌入中国金融市场,银行业的竞争日益激烈。要想在竞争中站稳脚,银行 必须要进行客户细分,将有限的资源用来为有价值的客户服务,并为有价值的客 户提供更优质的服务,实现资源价值最大化。 支持向量机( s u p p o r tv e c t o rm a c h i n e s ,s v m ) 是在统计学习理论基础上开发 出来的一种新的、非常有效的机器学习新方法,能够较好地解决以往困扰很多学 习方法的一系列问题,如非线性、过学习、高维数、局部极小值等实际问题。目 前,s v m 受到了越来越多的学者的关注,正在成为人工智能和机器学习领域新 的研究热点。 , 本文在国内外研究的基础上,深入分析影响客户价值的一系列指标,提出了 一套全面的信用卡客户细分指标体系;将支持向量机分类方法应用到信用卡客户 细分问题中来,并根据信用卡客户细分这个应用问题的存在的一系列问题,如数 据分布不平衡和错分代价不同、模糊隶属、支持向量数多导致的学习速度较慢以 及多类分类这几大问题,提出了相应的解决方案。 本文主要研究工作如下: 第一,构建了一套全面的信用卡客户细分指标体系。考虑到客户的个人特征 影响着其消费行为,以及其消费行为体现出一定的客户价值,因此,本文提出了 从客户个人特征、客户消费行为以及客户贡献度三个角度对客户进行研究,构建 了一套细分指标,并将此作为客户细分的依据。 第二,提出了基于代价敏感学习( c o s ts , m s i t i v el e a r n i n g , c s l ) 的支持向量 机分类方法。传统的基于数据挖掘的分类方法大多是普适性的学习方法,即假定 所有的类别都是同等的,具有相同的误分类代价。然而,在客户细分应用中,这 个假设是不成立的,将低价值客户归入高价值客户的误分类代价与将高价值客户 归入低价值客户的误分类代价是不一样的。正是考虑到这一点,因此本文将代价 敏感学习机制引入客户细分中,并且,与一些研究中依据经验值给定误分类代价 不同的是,在本文中作者利用函数来计算误分类代价。 第三,提出了基于模糊c 均值聚类( f u z z yc m e a n sc l u s t e r , f c m ) 。的支持 向量机分类方法。在客户细分这个实际应用问题中,每类客户之间的划分并不是 那么地绝对,也就是说某个客户可能以不同的程度隶属于多个类,为了能够更好 地表明这个模糊隶属的关系,本文采用了模糊c 均值聚类来处理这个问题。同 时由于银行业务量大,客户数据较多,标准s v m 在进行分类时,产生的支持向 量机数量多,使得分类速度较慢,为了解决这个问题,本文应用模糊c 均值聚 类并不是在s v m 的目标函数中加入隶属度变量,而是用模糊c 均值聚类对样本 进行聚类,取得分布在分类边界的c 个样本对,然后将这c 个样本对作为支持向 量,利用这些支持向量和样本来训练s v m 。该方法可以约简支持向量的个数, 提高s v m 的学习速度。 第四,提出了基于距离二叉树的多分类器支持向量机学习方法。标准的支持 向量机机器学习是基于二类划分的,然而在大多数实际分类问题是多类划分的, 因此,需要将二类支持向量机扩展到多分类支持向量机以满足实际应用需要。本 文采用的基于距离二叉树的多类分类方法解决了传统二叉树的结构生成难问题, 并提高了其泛化能力。 第五,设计了一个基于数据挖掘的客户细分原型系统。在前面研究工作的基 础上,利用所提出的基于代价敏感的多分类支持向量机客户细分模型来设计系 统,实现客户细分功能。 树 关键词:客户细分;支持向量机;代价敏感学习;模糊c 均值聚类;二叉 ac r e d i tc a r dc u s t o m 匝rs e g m 匝n t a t i o nm o d e l b a s e do ni m p r o v e ds u p p o i rv e c t o r 队c h i n e a bs t r a c t m o r ea n dm o r ew o r l d - c l a s sf o r e i g n f u n d e db a n k sh a v ef l o o d e di n t oc h i n e s e m o n e ym a r k e ta f t e rc h i n ae n t e r e di n t ow t oa n dr e f o r m e do ft h em o n e t a r ys y s t e m , w h i c hi n t e n s i f i e st h ec o m p e t i t i o na m o n gb a n k s i fb a n k sd o n tw a n tt ob ed e f e a t e di n t h i sc o m p e t i t i o n , t l l e ys h o u l ds e g m e n tc u s t o m e r sb yt h e i rv a l u e t h e ni tc a l lu s e l i m i t e dr e s o u r c e st os e r v e rf o rt h eh i g h v a l u e dc u s t o m e r s ,r e a l i z i n gm a x i m i z a t i o no f h o w e v e r , f o rt h ee v e r - i n c r e a s i n gn u m b e r so fc u s t o m e r sa n db u s i n e s sv o l u m e ,t h e d a t av o l u m eo fb a n ki sv e r ym a s s i v e t h et r a d i t i o n a lm e t h o d sb a s e do ne x p e r i e n c eo r s i m p l es t a t i s t i c sc a n tm e e tr e q u i r e m e n t l u c k i l y , t h ee m e r g e n c eo fd a t am i n i n g t e c h n o l o g yp r o v i d e sn e ws o l u t i o nf o rc u s t o m e rs e g m e n t a t i o nu n d e rm a s s i v ed a t a v o l u m e , s v m ( s u p p o r tv e c t o rm a c h i n e ) i san e wa n de f f e c t i v em a c h i n el e a r n i n gm e t h o d , w h i c hi sa d v a n c e do nt h eb a s eo fs t a t i s t i c st h e o r y s v mc a nr e s o l v eas e r i e sp r o b l e m s , s u c ha sn o n l i n e a r , o v e r - l e a r n ,h i g h - d i m e n s i o n ,l o c a lm i n i m u mv a l u e n o w , m o r ea n d m o r el e a r n e r sp a ya t t e n t i o nt os v m ,w h i c hn o wb e c o m e st h eh o ti nt h er e s e a r c hf i e l d o f a r t i f i c i a li n t e l l i g e n ta n dm a c h i n el e a r n i n g o nt h eb a s eo fr e s e a r c hi na n do u to fc h i n a , t h ea u t h o ra n a l y z e das e r i e so f i n d e x e sw h i c hw i l li n f l u e n c ec u s t o m e rv a l u e ,a n da d v a n c e daa 1 1 r o u n dc r e d i tc a r d 1 i i c u s t o m e rs e g m e n t a t i o ni n d e xs y s t e m i nt h i sp a p e r , s v mw a sa p p l i e di nc r e d i t c u s t o m e rs e g m e n t a t i o na f t e ri m p r o v e df o rc o n c e r n i n gp r a c t i c a la p p l i c a t i o np r o b l e m s , s u c ha su n b a l a n c e dd i s t r i b u t e dd a t a , d i f f e r e n tm i s c l a s s i f i c a t i o nc o s t ,f u z z y s u b o r d i n a t i o n ,l o wl e a r n i n gs p e e di n t r i g u e db yl a r g en u m b e ro fs u p p o r tv e c t o ra n d m u l t i c l a s sc l a s s i f i c a t i o n t h em a i nr e s e a r c hj o bd o n eb ya u t h o ri sl i s t e da sf o l l o w s : f i r s t l y , c o n s t r u c ta na l l r o u n dc r e d i t c a r dc u s t o m e rs e g m e n t a t i o ni n d i c a t o r s y s t e mf o rp e r s o n a lc h a r a c t e r i s t i cw i l li n f l u e n c ec o n s u m i n gb e h a v i o r , w h i c he m b o d y c e r t a i nc u s t o m e rv a l u e e n h a n c e ,w es u g g e s tc l a s s i f yc u s t o m e r sf r o mt h ev i e wo f p e r s o n a lc h a r a c t e r i z e ,c o n s u m i n gb e h a v i o ra n dc u s t o m e r c o n t r i b u t i o n s e c o n d l y , i n t r o d u c eas u p p o r tv e c t o rm a c h i n ec l a s s i f i c a t i o nm e t h o db a s e do n c o s t s e n s i t i v el e a r n i n g m o s tt r a d i t i o n a lc l a s s i f i c a t i o nm e t h o d sb a s e do nd a t am i n i n g i su n i v e r s a l h o w e v e r , f o rm a n yp r a c t i c a lp r o b l e m s ,d i f f e r e n tm i s c l a s s i f i c a t i o nh a s d i f f e r e n tc o s t t a k i n gt h i si n t oc o n s i d e r a t i o n ,a u t h o ri n t r o d u c e sc o s t s e n s i t i v el e a r n i n g i n t os e g m e n t a t i o n i ti sw o r t ht on o t i c et h a t ,af u n c t i o ni sd e s i g n e dt oc o m p u t e r m i s c l a s s i f i c a t i o nc o s t ,w h i l em o s to fr e s e a r c hs e tm i s c l a s s i f i c a t i o nc o s ta c c o r d i n g e x p e r i e n c e t h i r d l y , a d v a n c es v m b a s e do nf u z z yc - m e a n ( f c m ) c l u s t e r o n ec u s t o m e r m a yb es u b o r d i n a t e dt om a n yc l a s s e sa t t h es a m et i m e t a k et h i sp r o b l e mi n t o c o n s i d e r , a u t h o ra d o p t sf u z z yc - m e a nt or e s o l v et h o s e s t a n d a r ds v m w i l lp r o d u c e m a n ys u p p o r tv e c t o r s ,w h i c hi n t r i g u e dl o wl e a r n i n gs p e e d f o rs o l v i n gt h i sp r o b l e m , t h es o l u t i o ni sn o ta d d i n gav a r i a t i o na sm o s tp a p e rd o n e ,b u tu s i n gf c mt oc l u s t e r s a m p l e t h e nw ew i l lg e tcp a i rs a m p l ed i s t r i b u t e do nt h eb o u n d a r y t a k et h i scp a i r s a m p l ea ss u p p o r tv e c t o r u s et h i ss u p p o r tv e c t o ra n ds a m p l et ot r a i ns v m t h i s m e t h o dc a nr e d u c et h en u m b e ro fs u p p o r tv e c t o r , a n dt h e ni m p r o v el e a r n i n gs p e e d ,f o u r t h l y , a d v a n c eam u l t i - c l a s ss v m b a s e do nd i s t a n c eb i n a r yt r e e s t a n d a r d s v mo n l yc a nc l a s s i f y2c l a s s e s h o w e v e r , m o s tp r a c t i c a l a p p l i c a t i o n s a l e m u l t i c l a s s e sp r o b l e m s e n h a n c e ,w es h o u l de x p a n ds t a n d a r ds v mt om u l t i c l a s s s v mt of i tp r a c t i c a la p p l i c a t i o nr e q u i r e m e n t i nt h i sp a p e r , w ea d o p tb i n a r yt r e eb a s e d o nd i s t a n c et or e s o l v et h es t r u c t u r ep r o b l e mo ft r a d i t i o n a lb i n a r yt r e e ,a n di m p r o v et h e i v g e n e r a l i z e da b i l i t y f i f t h l y , d e s i g nac u s t o m e rs e g m e n t a t i o ns y s t e mw h i c hi sb a s e do i ld a t am i n i n g u n d e rt h eb a s i so fa f o r e m e n t i o n e dc h a p t e r s ,d e s i g nac u s t o m e rs e g m e n t a t i o ns y s t e m b a s e do ni m p r o v e ds v mt os e g m e n tc u s t o m e r s k e y w o r d s :c u s t o m e rs e g m e n t a t i o n ;s u p p o r tv e c t o rm a c h i n e ;c o s t - s e n s i t i v e l e a r n i n g ;f u z z yc - m e a nc l u s t e r ;b i n a r yt r e e ; v 摘要 第1 章绪论 目录 1 i i i 1 1 研究背景及意义:。1 1 1 1 励哮j 焉均孑1 1 1 2 研究煮蟛2 1 2 国内外研究现状2 工2 工薯乒嘶窖笋理r 2 】2 2 喾铅够分4 1 2 。3 数据挖掘在金融界客声分析中的直雨6 1 3 本文主要研究内容7 1 4 本文的组织结构8 第2 章相关理论研究 2 1 客户细分理论。1 0 2 1 1 霉声纫分融理沦力潴二工o 2 1 2 星乒户亨缚写分彳多方辩工2 2 1 3 客乒蚴膨,笮) 锣1 4 2 2 支持向量机1 s 2 2 1 统计学习理论与支持向量祝:i 6 2 2 2s v m 基龆,槽工9 2 2 。3s v m 鸯;典鸵2 2 2 2 4 蔓拗重说钐衫l :府2 3 2 3 本章小结- 。2 4 第3 章客户细分指标体系的构建j s ; 3 1 问题的提出一2 5 3 2 指标选取的原则。2 s 3 3 客户细分指标体系的构建2 6 3 3 1 薯- 户爹久特红缎2 7 3 3 2 客户消费行为维度2 8 3 3 3 莓| 户贡葡莹厘2 9 3 3 4 薯声鲴伤惭缮累。3 0 3 4 本章小结3 l 第4 章基于代价敏感模糊c 均值聚类的多类支持向量机3 2 4 1 问题的提出3 2 4 2 基本概念3 3 4 2 1 广义触最笏分类蓐。j 3 3 4 2 2 彩籀蕈旁r 3 4 4 3 代价敏感学习机制- 3 7 4 3 1 纡笏裁感掌可综送3 7 4 3 2 基- 7 :纡纷癌随芪融奶够廊星扔3 8 4 3 3 买? 黝析3 9 4 4 基于模糊c 均值聚类的支持向量机4 3 4 4 1 秀枣嬲c 均省善窭类。4 4 4 4 。2 基于模糊c 均值聚类的支持向量祝4 s 4 4 3 买? 黝析4 6 4 5 基于距离二叉树的多类支持向量机4 7 4 5 1 娶典分委乞葶j 茅4 7 4 。5 2 基于距离二叉树的多类支持向量祝4 9 4 5 3 买拗祝。:5 4 4 6 本章小结。s 5 第5 章客户细分原型系统的设计与实现5 6 5 1 系统概述。5 6 5 1 1 赛纺万发琢劳5 6 5 1 2 嬲励笛理5 6 5 1 3 莠纺功彪勺嬉粢。5 9 5 2 系统实现。 5 2 1 系缴行访方翟6 0 5 2 2 赛纺荬:彩6 工 5 3 本章小结6 3 第6 章总结和展望h 6 1 皇结6 4 6 2 展望6 s 参考文献6 7 玎 第l 章绪论 1 1 研究背景及意义 1 1 1 研究背景 随着我国加入世界贸易组织( w t o ) 以及金融体制改革的逐渐深入,我国 的金融银行市场逐渐走向开放,国内金融机构同世界级外资银行短兵相接在所难 免。花旗银行、渣打银行、东亚银行、美国银行、恒生银行、汇丰银行、华侨银 行等世界级银行均在我国各大中城市开设分行或与我国国内银行进行项目合作。 面对拥有雄厚资金与先进管理理念的大型外资银行,国内银行感觉到了前所未有 的压力。 一直以来,国内银行业都认为获得新的客户是保持增长的关键,然而随着信 息技术的发展和全球化的进一步推进,银行间产品和服务的透明度越来越高,其 差异性越来越小,单纯以客户数增长为目标的策略也渐渐显露出其缺点。而且我 国的银行业刚从计划经济时期转变过来,对“以客户为中心”的理解一直处于表 面状态,长期以来对客户实行无差别服务,不能够抓住真正有价值的客户。然而, 在竞争目益激烈的银行业,谁能牢牢抓住有价值的客户,谁就能在竞争中站稳脚。 因此,如何区分有价值的客户成为了摆在银行面前的一道难题。 传统的客户细分方法一般是基于经验的分类方法或者是基于统计学的简单 划分,然而随着银行业务量的扩大,积累了大量的业务数据,面对海量数据,传 统的客户细分方法显得力不从心。 数据挖掘技术的出现,为解决海量数据下的复杂客户细分问题提供了新的解 决办法。数据挖掘( d a t am i n i n g ) 技术是一项以人工智能为基础的数据分析技术, 可以在海量数据中自动发现潜在的、有用的知识。数据挖掘中的决策树、神经网 络、关联分类、支持向量机等都可以用来进行客户细分。然而直接将上述方法应 用到客户细分中必然存在着一定的问题,需要根据应用的需要,对算法进行一定 的改进以适应实际应用。 支持向量机是基于统计学习理论的一种新的机器学习方法,能够较好地解决 以往困扰很多学习方法的一系列问题,如非线性、过学习、高维数、局部极小值 等实际问题。目前,已在很多领域被证明优于神经网络等其他分类方法。 然而直接将s v m 应用到客户细分中,同样会存在一些问题。如客户细分应 用存在如下事实:1 数据不平衡,即高价值客户数要远远低于低价值客户数;2 类与类之间的误分类代价不同,将高价值客户划分为低价值客户的误分类代价与 将低价值客户划分为高价值客户的代价是不同的;3 客户划分存在着模糊隶属问 题,即客户可能以不同的程度隶属于多个类;4 数据量过多,导致学习过慢;5 客户细分是个多类划分问题。 1 1 2 研究意义 随着客户关系管理( c u s t o m e rr e l a t i o n s h i pm a n a g e m e n t ,c r m ) 理念日益深 入人心,行业c r m 系统产品的日趋成熟,一些大型国际银行纷纷开始实施c r m 。 我国金融界也开始关注c r m 系统,但由于国内银行刚刚实现数据大集中【l 】,目 前主要处理集中后的相关问题,因此c r m 的成功应用比较少,基本处于起步阶 段。本研究将对客户细分这一客户关系管理中的重要问题,进行理论与方法研究, 研究成果将丰富我国信息系统研究领域在客户关系管理与客户细分方面的研究。 本文主要是针对客户细分问题的特点和现有数据挖掘方法的不足,提出了改 进支持向量机数据挖掘方法以适应客户细分应用的需要。该方法不仅可以应用于 客户细分及客户关系管理,也可以应用其他相类似的分类问题中去。 随着市场竞争的同趋激烈,“以客户为中心的客户关系管理已经成为企业 必然的选择。企业资源有限,只有准确地对客户进行细分,重点关注有价值的客 户,才能以较小的成本收到最大的效益,以较少的成本吸引到更多、更有价值的 客户。 1 2 国内外研究现状 1 2 1 客户关系管理 最早提出客户关系管理概念的是美国著名的管理咨询公司g a r t n e rg r o u p 2 1 , 随后在世界范围内引起了客户关系管理风暴。g a r t n e rg r o u p 认为,客户关系管 理是为企业提供全方位的客户视角,赋予企业完善的客户交流能力和最大化客户 收益所采取的方法。这一概念包含了企业为赢得竞争优势,同客户及销售伙伴通 过多种渠道建立良好关系的全部内容。 2 在国际上,g r o u ph t 3 】认为c r m 是一种管理思想,它通过软件来实现,软件 的实现又需要各种技术支持;j a i s h a n k a r ( 2 0 0 0 ) 【4 】等人则对客户群进行了研究, 指出在满意和忠诚行为方面因为不满意而变更供应商的客户与其他客户组有着 显著的不同;l e m o n k n ( 2 0 0 2 ) 5 1 提出了动态c r m 的概念。 在国内主要以陈旭( 2 0 0 1 ) 【6 】等为代表,通过对c r m 的系统研究主要提出 了c r m 的未来发展趋势和我国加强c r m 的研究与应用的重要性和紧迫性。胡 左浩等( 2 0 0 1 ) 7 1 从关系营销的角度系统论述了顾客生涯价值的概念,从顾客维 持时间、顾客份额和顾客范围三个层次对顾客生涯价值概念的认识进行了扩展。 c r m 系统的产生是客户关系管理思想的一个有效实践,经过多年的发展, 目前市场上出现了众多c r m 产品。据统计,目前全球已开发出自己企业c r m 系统的软件公司共6 0 0 多家,在国内大约有3 0 家一并以较快的速度增长着【8 】。 并且各大计算机厂商都推出了各自的c r m 解决方案,由于它们对c r m 的理解 角度不同,解决方案也各有千秋。 表1 1 总结了国内外几个典型c r m 产品的核心思想和特点【9 , 1 0 , 1 1 , 1 2 】。 表1 - 1c r m 产品 t l b l e1 1c r ms o l u t i o n 厂商理解角度核心内容特点 s i b e l 客户关系管理是识别客户、通过基于i n t e r n e t s i e b e l 公司是目前 获取客户、保持客户的集成的“t o m ”套件、c r m 市场上最大 方法。呼叫中心、销售和的主导型企业,产 服务、营销管理、品多功能全是其 渠道管理等套件主要特点 全面支持识别客 户、获取客户、保 持客户的企业过 程 o r a c l ec r m 有三个目标:为企业通过呼叫中心、电采用客户智能、融 提供3 6 0 读的管理视角;赋子商务、移动设会贯通的交流渠 予企业完善的客户交流能备、智能系统来实道以及基于 力;客户受益最大化。现对市场活动、销i n t e m e t 的应用体 售活动的有效管系结构。 理、为客户提供个 性化的古河和关 怀。 i b m通过提高产品性能,增强客分为三个方面:关自助服务网站,在 户服务,提高客户交付价值系管理,帮助理解前台应用与s i e b e l 和客户满意度,与客户建立客户行为、期望、结盟;系统集成; 长期、稳定、相互信任的密需要等全面关系;客户关系智能,将 切关系。流程管理,灵活实客户信息转化为 施c r m 流程;接业务知识。 入管理,管理企业 和客户的交互方 式。 s a p客户数据管理是实现c r m包括市场管理、销记录各类活动状 客户价值的重要基础,通过售管理、销售支态,建立各类数据 客户数据管理增强对客户持、竞争对象记录的统计模型,覆盖 的理解。与分析几个部分。所有业务功能。 用友将客户作为企业运作的核包括四个方面:将在业务层面,管理 心,在整个客户生命期中,潜在客户变为现层面及决策层面 都以客户为中心。实客户;管理渠对基础、客户、市 道;随时间推移驱场、销售、服务, 动客户;满足不满客户自助等进行 意客户。管理。 1 2 2 客户细分 客户细分( c u s t o m e rs e g m e n t a t i o n ) 的概念是美国市场学家温德尔史密斯 于2 0 世纪5 0 年代中期提出来的【1 3 】。任何高效的客户关系管理都将以扎实的客 户细分为基础 1 4 1 。客户细分是企业在明确的战略、业务模式和特定的市场中根 据客户的属性、行为、需求、偏好以及价值等因素对于客户进行分类,并提供针 对的产品、服务和营销模式的过程f 1 5 1 。2 0 0 2 年,美国的管理咨询公司 4 b a i n & c o m p a n y 对来自世界各地的4 5 1 位高级人员的一项调查表明,客户细分工 具已经成为全球使用率最高的l o 大管理工具之一【1 6 1 。国内外对客户细分的研究 主要集中于用现有的分类方法在某些具体行业与领域的应用1 1 7 j 。这些领域既包 括传统的旅游业、餐饮业、零售业、传媒业,也包括新兴的网络营销、网络服务 及其他电子商务领域。j a e s o ok i m 等研究了神经网络在旅游业客户细分中的应用 【1 引,v e l l i d o 等研究了神经网络在网上客户细分的应用【嘲,h e i l m a n 等研究了利用 客户购买数据进行客户细分的问题【2 0 】;国内众多学者也对客户细分进行了一些 研究,如,叶强提出了基于云模型的动态客户细分模型,该模型将客户细分过程 表示为一个c 过程与一个p 过程,并将描述非确定关系的云模型理论引入到客 户细分的p 过程中,从而实现了客户细分的动态性,提高了模型对客户行为描述 的客观性【2 l 】,王凯提出了将改进的模糊核c 均值算法应用到商业银行客户细分 中来瞄l 。 总的来说,国内对客户细分的应用和研究还比不上国外,作者利用g o o g l e 这个搜索引擎在互联网上进行搜索,结果如表1 2 所示。 表l - 2 谷歌搜索引擎查询结果 t a b l e1 - 2r e s u l tb ys e a r c h i n go ng o o g l es e 关键词返回u r l 数 比率 1 c u s t o m e rr e l a t i o n s h i pm a n a g e m e n t 8 3 ,2 0 0 ,0 0 0 2c r m 4 1 ,6 0 0 ,0 0 0 3 c u s t o m e rs e g m e n t a t i o n 6 ,9 0 0 ,0 0 0 4 客户关系管理 11 , 4 0 0 ,0 0 0 5客户细分 7 ,6 1 0 ,0 0 0 6 【4 】( 【l 】+ 【2 】) 9 1 3 7 【5 3 】 1 l o 2 8 对比叶强在2 0 0 2 年1 2 月2 8 同做的搜索结果,如表1 3 所示。 表1 3 谷歌搜索引擎查询结果 t a b l e1 - 3r e s u l tb ys e a r c h i n go ng o o g l es e 关键词返回u r l 数比率 1c u s t o m e rr e l a t i o n s h i pm a n a g e m e n t 1 ,9 0 0 ,0 0 0 2c r m 3 ,1 5 0 ,0 0 0 5 3c u s t o m e rs e g m e n t a t i o n 1 6 8 ,0 0 0 4 客户关系管理9 1 ,9 0 0 5客户细分 1 , 4 3 0 6 4 】( 【1 】+ 【2 ) 1 8 2 7 5 3 】 0 8 5 从比较表1 2 和表1 3 的查询结果,我们可以看到,国内和国外对客户关系 管理和客户细分的关注程度都有所上升,并且值得欣慰的是,我国对两者的关注 程度的增长速度快于国外,并且在客户细分方面的关注度超过了国外。 1 2 3 数据挖掘在金融界客户分析中的应用 数据挖掘又称知识发现( k n o w l e d g ed i s c o v e r y i nd a t a b a s e ) 是一种从大量 数据中发现潜在规律、提取有用知识的方法和技术。数据挖掘不但能够学习已有 的知识,而且能够发现未知的知识,在众多领域得到了广泛的应用。在金融界, 它能帮助银行实现数据库营销( d a t a b a s em a r k e t i n g ) 、客户群划分( c u s t o m e r s e g m e n t a t i o n & c l a s s i f i c a t i o n ) 、背景分析( p r o f i l ea n a l y s i s ) 、交叉销售( c r o s s s e l l i n g ) 等市场分析,以及客户流失分析( c h u m a n a l y s i s ) 、客户信用评分( c r e d i t s c o r i n g ) 、欺诈识别( f r a u dd e t e c t i o n ) 等客户行为分析。 数据挖掘技术和数据仓库技术在银行领域中应用广泛,比较有代表性的应用 如表1 4 所示【2 4 1 。 表l _ 4 数据挖掘在银行中的典型应用 t a b l e1 - 4t h ea p p l i c a t i o no fd a t am i n i n gi nb a n k 银行或系统名称应用领域 美国m e l l o n 银行 1 提高销售和金融产品定价的精确度 2 分析客户生命周期的费用和收入以判断谁是最具创利 潜能的客户 3 识别并向右较高购买金融产品和服务的客户进行有目 的的营销 美国f i r s t a r 银行根据客户的消费模式预测何时为客户提供何种会融产品 英国b a r c l a y s 银行分析贷款客户过去的历史数据并预测未来的行为,更准 确地了解每位客户的利润贡献度,大大节省了营销成本 6 台湾信托银行对信用卡业务采用基于活动的成本核算,以进一步了解 每位客户的利润贡献度,打打节省了营销成本 f r o s tn a t i o n a l 银行挖掘c r m 数据,对客户的收益率、满意度、产品功效等 进行分析 m o n t r e a l 银行客户分类、跨区销售分析、抵押支付的预测、信用风险 的分析 f i r s ta m e r i c a n根据年利息、年费、信用额度和不同的保险类型将客户 细分成7 5 0 个类型,提供个性化服务 f a l c o n 系统信用卡欺诈识别 e a g l e 系统信用卡欺诈识别 p r o f i t m a x b a n k r u p t c y利用神经网络技术分析每一个持卡者的数据,并预测他 们的破产可能性 、 。 中国工商银行建设了银行数据仓库平台,尚未开展真正意义上的数据 挖掘应用 中国农业银行建设了银行数据仓库平台,尚未开展真正意义上的数据 挖掘应用 一 1 3 本文主要研究内容 本文主要研究工作如下: 第一,构建了一套全面的信用卡客户细分指标体系。考虑到客户的个人特征 影响着其消费行为,以及其消费行为体现出一定的客户价值,因此,本文提出了 从客户个人特征、客户消费行为以及客户贡献度三个角度对客户进行研究,构建 了一套细分指标,并将此作为客户细分的依据。 第二,提出了基于代价敏感学习( c o s ts e n s i t i v el e a r n i n g ,c s l ) 的支持向量 机分类方法。传统的基于数据挖掘的分类方法大多是普适性的学习方法,即假定 所有的类别都是同等的,具有相同的误分类代价。然而,在客户细分应用中,这 个假设是不成立的,将低价值客户归入高价值客户的误分类代价与将高价值客户 归入低价值客户的误分类大家是不一样的。正是考虑到这一点,因此本文将代价 敏感学习机制引入客户细分中,并且,与一些研究中依据经验值给定误分类代价 不同的是,在本文中作者利用函数来计算误分类代价。 7 第三,提出了基于模糊c 均值聚类( f u z z yc j - m e a n sc l u s t e r , f c m ) 的支持 向量机分类方法。在客户细分这个实际应用问题中,每类客户之间的划分并不是 那么地绝对,也就是说某个客户可能以不同的程度隶属于多个类,为了能够更好 地表明这个模糊隶属的关系,本文采用了模糊c 均值聚类来处理这个问题。同 时由于银行业务量大,客户数据较多,标准s v m 在进行分类时,产生的支持向 量机数量多,使得分类速度较慢,为了解决这个问题,本文应用模糊c 均值聚 类并不是在s v m 的目标函数中加入隶属度变量,而是用模糊c 均值聚类对样本 进行聚类,取得分别在分类边界的c 个样本对,然后将这c 个样本对作为支持向 量,利用这些支持向量和样本来训练s v m 。该方法可以约简支持向量的个数, 提高s v m 的学习速度。 ”。 第四,提出了基于距离二叉树的多分类器支持向量机学习方法。标准的支持 向量机机器学习是基于二类划分的,然而在大多数实际分类问题是多类划分的, 因此,需要将二类支特向量机扩展到多分类支持向量机以满足实际应用需要。本 文采用的基于距离二叉树的多类分类方法解决了传统二叉树的结构生成难问题, 并提高了其泛化能力。 第五,设计了一个基于数据挖掘的客户

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论