




已阅读5页,还剩129页未读, 继续免费阅读
(计算机应用技术专业论文)基于数据挖掘的银行客户分析管理关键技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学博士学位论文 摘要 如何将数据仓库及数据挖掘的相关技术应用于金融业客户关系管理,是目前金融行业迫 切需要研究的领域。该领域包括对于数据仓库和数据挖掘技术的研究,c r m 系统的构建, 以及更加有效挖掘算法的设计等方面。本文具体探讨了金融行业的客户关系管理系统在实施 过程的若干关键技术,同时对基于数据挖掘的银行客户关系管理技术进行了研究。 传统的数据挖掘方法在金融行业的应用包括银行客户划分、银行客户流失预警、金融欺 诈分析以及基于数据挖掘的银行信用昔分析等方面,本文对于这些传统的方法进行了总结和 分析,并且结合具体案例进行了说明,给出了自己的结论。 在第三章中,对于银行的客户聚类分析进行了单独论述,比较分析了决策树方法和粗糙 集方法各自的特点,提出了一种基于粗糙集和决策树相结合的多变量决策的银行辑户聚类算 法,实验结果表明这种方法在一定程度上提高了聚类判别的效率。 银行交易时序数据的挖掘分析是目前研究的热点之一。本文尝试将时序数据字符串化, 引入传统的字符串模式匹配相关算法进行金融时序数据的分析。在字符串算法的研究中,经 常会关注给定字符串本身的规律性,如重复性。s e e d 是一种广义的重复性,如果一个给定 字符串的超串能够由它的某个子串以多个串接和( 或) 叠合的形式构成,这个子串就称为给 定字符串的s e e d 。本文对于时间序列预测中的字符串s e e d 求解算法进行了讨论+ 提出了一 个有效的算法来计算长度为n 的字符串的所有s e e d ,时间复杂度为o ( n l o g n ) 。 a g e n t 和多a g e n t 系统( m u l t i - a g e n ts y s t e m s ,简称m a s ) 是正在崛起为人t 智能研究 实用化和分布计算环境f 软件智能化的重要技术。提供具有社会和相关领域知识,能依据心 理状态自主工作,并具有语义互操作和合作行为协调能力的软件实体,作为参与协调合作的 软构件,不仅为实施紧凑一致的协同工作提供有力的支持,也为建立面向分布计算的开放性、 可重构和可伸缩的新型计算环境建立了基础。本文对于基于m a s 的客户关系管理系统的相 关理论进行了研究,尝试将多a g e n t 的协商框架应用于银行间的产品营销竞争,客户金融产 品的交叉销售分析中,提出了一个客户销售的优化协商框架。 在第八章中,针对项目的具体实施和实践过程中的相关问题,从技术和应用的角度展开 数据挖掘相关技术及其实际应用领域的研究,并结合上海浦东发展银行的实际应用背最,提 出了一个银行客户关系分析管理系统的设计方案。 v 浙江大学博士学位论文 论文对于国内金融行业实施结构化和非结构化数据挖掘技术部署企业的商业智能、进 行客户关系管理、市场销售分析、竞争对手分析、市场需求动态分析等各个方面都具有一定 的借鉴和现实指导意义。 关键 司:客户关系管理、数据挖掘、数据仓库、聚类、粗糙集、决策树、时序数据、字 符串、s e e d 、m a s 、协商 v i 一塑坚= :苎兰堕主兰竺堡茎 a b s t r a c t i t i sap r e s s i n gm i s s i o nf o rf i n a n c i a li n d u s t r yt om a k er e s e a r c ho nh o wt o i m p l e m e n td a t aw a r e h o u s ea n dd a t am i n i n g t e c h n o l o g y i n c r m ( c u s t o m e r r e l a t i o n s h i pm a n a g e m e n t ) a s p e c t t h er e l a t e dr e s e a r c h a s p e c t i n c l u d e sd a t a w a r e h o u s ea n dd a t am i n i n gt e c h n o l o g i e s ,c o n s t r u c t i o no fc r m s y s t e m sa n dd e s i g no f m o r ee f f e c t i v ed a t am i n i n ga l g o r i t h m s t h i s p a p e rd i s c u s s e ss o m eo ft h ek e y t e c h n o l o g i e s i nt h e i m p l e m e n t a t i o np r o c e s s o fc r ms y s t e m si nf i n a n c i a l i n d u s t r y ,m e a n w h i l es t u d i e st h eb a n kc r mt e c h n o l o g yw h i c hb a s i n go nd a t a - m i n i n g i nd e t a i l t y p i c a la p p l i c a t i o n so ft r a d i t i o n a ld a t am i n i n gt e c h n o l o g yi nf i n a n c i a li n d u s t r y i n c l u d ec l a s s i f i c a t i o no fb a n kc u s t o m e r s ,p r e c a u t i o no fb a n kc u s t o m e r1 0 s s f i n a n c i a l f r a u da n a l y s i sa n dd a t a - m h a i n gb a s e db a n kc r e d i tc a r da n a l y s i s t h i sp a p e rp r e s e n t sa s u m m a r yo ft h e s ea p p l i c a t i o n sa n da n a l y z e st h o s eu s i n gc o n c r e t ec a s e s t h i sp a l :i e r p r e s e n t sab r i e fs u m m a r ya n da n a l y s i st o w a r dt h e s et r a d i t i o n a la p p l i c a t i o n s a n ds h o w an e wc o n c l u s i o na n ds o l u t i o nb a s i n go i l - t h ep r a c t i c a ls p e c i f i cc a s e t h ec h a p t e r3o ft h ep a p e rf o c u s e so nt h ec l u s t e r i n ga n a l y s i so fb a n kc u s t o m e r s b yc o m p a r i n gt h ed e c i s i o nt r e ea p p r o a c ha n dr o u g hs e ta p p r o a c h , t h i sc h a p t e r p r e s e n t s an e wc l u s t e r i n ga l g o r i t h mf o rb a n kc u s t o m e r sb a s e do nm u l t i v a r i a b l e d e c i s i o n ,w h i c hi sac o m b i n a t i o no fr o u g hs e ta p p r o a c ha n dd e c i s i o nt r e ea p p r o a c h t h et e s tr e s u l t sp r o v et h i sa p p r o a c he n h a n c e st h ee f f i c i e n c yo fc l u s t e r i n ga n a l y s i si n s o m ed e g r e e t e m p o r a ld a t am i n i n ga n da n a l y s i si nf i n a n c i a li n d u s t r yi so n eo ft h e h o tr e s e a r c h a r e a sa tp r e s e n t t h i sp a p e ra t t e m p t st oc o n v e r tt e m p o r a ld a t ai n t os t r i n g sa n du s e s r e l a t e ds t r i n gp a a e mm a t c ha l g o r i t h m si nt h ea n a l y s i so ft h ef i n a n c i a lt e m p o r a ld a t a i nt h er e s e a r c ho fs t r i n ga l g o r i t h m s ,a t t e n t i o n sw i l lu s u a l l yb eg i v e nt ot h er e g u l a r i t i e s i nt h es t r i n g s ,e g r e p e t i t i o n s e e di sag e n e r a lr e p e t i t i o ni nt h a ti fas u p e r - s t r i n go fa g i v e ns t r i n gc a nb ec o n s t r u c t e db yt h ec o m b i n a t i o no ft h es u b s t r i n go ft h i sg i v e n s t r i n g ,t h es u b s t r i n gi sas e e do ft h eg i v e ns t r i n g t h i sp a p e rd i s c u s s e sm ec r e a t i o no f s e e d so fag i v e ns t r i n gi nt e m p o r a ls e q u e n c ep r e d i c t i o na n dp r o p o s e sa l le f f e c t i v e a l g o r i t h mt oc o m p u t ea l lt h es e e d so fag i v e ns t r i n go fl e n g t hn ,w i t hac o m p u t a t i o n c o m p l e x i t yo fo ( n i o g n ) a g e n ta n dm a s ( m u l t i a g e n ts y s t e m s ) a r ec a t c h i n gt h er e s e a r c ha n e n t i o na s i m p o r t a n tt e e h n o l o g i e si nt h ea p p l i c a t i o no fa ia n di n t e l l i g e n ts o f t w a r ei nd i s t r i b u t e d c o m p u t i n g s u p p l y i n gs o f t w a r ee n t i t i e st h a ti n c o r p o r a t ed o m a i nk n o w l e d g e ,a c t a c c o r d i n gt ot h ep s y c h o l o g i c a ls t a t e sa n dp r o v i d es e m a n t i ci n t e r a c t i o n s ,c o o p e r a t i o n a n dc o o r d i n a t i o n ,w i l ln o to n l yp r o v i d es t r o n gs u p p o r t sf o re f f e c t i v ec o o r d i n a t i o nb u t a l s op a v et h eg r o u n df o ran e wd i s t r i b u t e dc o m p u t i n go r i e n t e de n v i r o n m e n tw i t ht h e c h a r a c t e ro fo p e n ,r e c o n s t r u c ta b i l i t ya n ds c a l a b i l i t y t h i sp a p e rs t u d i e sm a s r e l a t e d t h e o r i e sa n dp r o p o s e sac u s t o m e rs a l e sc o o r d i n a t i o nf r a m e w o r kb y a p p l y i n g 浙江大学博士学位论文 m u l f i - a g e mc o o r d i n a t i o nf r a m e w o r k i nc r o s s s a l e sa n a l y s i so f b a n kc u s t o m e r s i nt h ec h a p t e r6o f t h i sp a p e r , a n a l y s e so f t h ed a t am i n i n gr e l a t e dt e c h n o l o g i e sa n d t h e i rp r a c t i c a la p p l i c a t i o nd o m a i n sa r ep r o v i d e df r o mat e c h n o l o g i c a la n da p p l i c a t i o n p e r s p e c t i v et op r o b l e m sa r i s i n gf r o mt h ep r o j e c ti m p l e m e n t a t i o n b yc o m b i n i n gt h e a p p l i c a t i o nb a c k g r o u n do fs h a n g h a ip u d o n gd e v e l o p m e n tb a n k ,t h i sp a p e rp r e s e n t sa d e s i g nf o ra b a n kc u s t o m e ra n a l y s i ss y s t e m t h i sp a p e rp r o v i d e sah e l p f u lg u i d a n c ea n dr e f e r e n c et od i f f e r e n ta p p l i c a t i o n d o m a i n si n c l u d i n ga p p l y i n gs l r u c t u r a la n dn o n - s t r u c t u r a ld a t am i n i n gi nd o m e s t i c f i n a n c i a l i n d u s t r y , d e p l o y i n ge n t e r p r i s ei n t e l l i g e n c e ,c r m ,m a r k e ta n a l y s i s , c o m p e t i t i o na n a l y s i sa n dd y n a m i cm a r k e td e m a n da n a l y s i se t c k e y w o r d s :c r m ,d a t am i n i n g , d a t aw a r e h o u s e ,c l u s t e r i n g ,r o u g hs e t ,d e c i s i o nt r e e , t e m p o r a ld a t a , s t r i n g ,s e e d ,m a s ,c o o r d i n a t i o n v l l i 浙江大学博七学位论文 第1 章绪论 1 1 论文的研究背景和应用前景 本论文以金融业客户关系管理系统的数据仓库及数据挖掘的相关技术为研究背景,探讨 了金融行业的客户关系管理系统在实施过程的若于关键技术,同时对基于数据挖掘的银行客 户关系管理技术进行了研究和有益的探讨。论文在银行的客户聚类,时间序列预测以及金融 产品竞争积客户交叉销售等方嚣做了重点韵分析,提出了一种结合决策树和糨糙集思想的客 户聚类算法,同时对于时间序列预测中的字符串s e e d 求解算法进行了研讨,提出了一个优化 求解算法,并且尝试将多a g e m 的协商框架应用于银行客户的交叉销售分析中,提出了一个 客户销售的优化协商框架。论文针对客户关系管理项目的实施和开发过程中的难点问题,从 技术和应用的角度展开数据挖掘相关技术及其实际应用领域的研究。在论文的最后给出了一 个银行客户分析系统的设计方塞。论文对于国内金融行业实施结构化和非结构化数据挖掘技 术,部署银行的商业智能、进行客户关系管理、市场销售分析、竞争对手分析、市场需求动 态分析等各个方面都具有指导和借鉴意义。 i 2 金融行业客户关系管理简介 客户关系管理( c u s t o m e rr e l a t i o n s h i pm a n a g e m e m ,c r m ) 也被称为客户资源管 理( c u s t o m e ra s s e tm a n a g e m e n t ) 或客户交互管理( c u s t o m e ri n t e r a c t i o n m a n a g e m e n t ) 。c r m t 垂整个银行范围的策略,通过围绕客户细分,进行客户业务流程的 再造,满足客户需求,连接客户和银行产鼎等手段来最大化客户剩渭和客户满意度。 一个银行的c p , m 系统能够使其更好的地了解客户,增加客户的联系渠道的有效性,实现 与客户互动,增强开拓市场能力,提升对客户的销售能力,降低对客户的服务成本,以及实 现客户渠道和银行业务系统后台的无缝的整合,从而打造一个以客户为中心,科学定蹙管理 的有竞争力的企业。 随着中国加入w t o ,中国银行业将面对具有丰富经营管理经验、具备异常强大的资金 实力的外资银行的冲击,国内各家银行都感觉到了竞争的激烈和竞争的压力。迅猛发展的通 信技术和互联网络技术,使世界经济步入了全球化一体、电子化的时代。银行间产品和服务 透明度越来越高,其差异性越来越小,传统的以金融产品为中心的市场战略,正逐渐被以客 1 浙江大学博士学位论文 户为中心、以服务为目标的市场战略所取代。国内银行纷纷通过改革和创新、依托先进的技 术手段推出良好而先进的服务和产品,来维护自己的客户并吸引别人的客户,银行间的业务 竞争演化为市场份额的竞争、客户群体的竞争。不断发展的金融电子化,大大提升了国内银 行的业务处理能力、经营管理水平和客户服务水平。银行的经营模式从单纯追求规模的粗放 型,向集约化效益型转变。应该说,银行客户的大量增加对于金融企业的发展起到了积极的 推动作用,但如何管理和利用这些客户资源,做到金融企业的二次增值,是当前金融行业的 一个研究热点问题。在当前市场环境下,谁能把握客户的需求趋势、有效发掘和管理客户资 源、提升银行与客户的关系,谁就能获得先发优势,在日益白热化的金融市场竞争中立于不 败之地。西藏。客户关系管理( c u s t o m e rr e l 撕o n s i l j pm i m a g e m e n t , c 砌哪也就成为了各家银 行共同关注和研究的焦点,c r m 系统建设的首要步骤 8 是解决:如何发现潜在客户,识别 重要客户,如何度量客户价值( c u s t o m e rv f l u o 等问题。 客户关系管理系统要实现三个基本的目标,即如何获取客户,如何留住客户和如何极人 化客户价值。在这种情况下,对于金融客户数据进行深度的分析也具有了直接而又现实的意 义。一个有意义的研究发现:仅有活期存款的客户在一年内有半可能走掉,同时有活期和 定期存款的客户有三分之一可能走掉,而有三种或以上产品的客户离开的概率可能会下降到 l o 。也就是说,以客户为中心的营销策略,不仅可咀在短期增加金融产品销量,而且可以 长期留住客户,提高客户对银行的忠诚度。客户关系管理的最高境界是:根据客户的整个生 命周期,为客户创造一生的最大价值,并使银行得到犀大的回报。 从技术角度讲,客户关系管理系统包括操作型客户关系管理系统( o p e r a t i o n a lc r m ) 、 分析型客户关系管理系统( a n m ”i c mc r m ) 及协同型客户关系管理系统( c o l l a b o r a t i v e c r m ) 。在此我们所讨论的主要是分析型客户关系管理系统。分析型客户关系管理系统以 数据仓库、o l a p 、数据采握技术及金融学模型为基础。它提供客户分类,可进行营业收入、 风险和成本等的相关因素分析、预测及优化。可以根据事先设定的标准找到符合条件的客户 群,也可以对客户进行聚类分析。让其“自然”分群。我们还可以根据交易行为对客户进行 分类,以确定什么样的客户最有可能购买和使用某种金融产品。 快速发展的信息化技术为金融机构提高金融管理水平提供r 强有力的技术支持手段,也 发展了以客户为中心的市场营销、风险管理、客户服务、计划财务等精细化管理繁略和决策 系统,从而做到在有效控制各种风险和降低成本的前提下,夫量识别、吸引、发展和保留高 端客户。传统的银行业务数据库按产品设置,分成定期存款,活期存款,短期贷款,中长期 贷款等,客户的交易数据库也仅与单一账户关联,而对同一个客户。他名下的存款、贷款、 2 浙江大学博士学位论文 中间业务和利息等账户之间,在银行核心系统数据库中并没有直接联系。为了更好的贯彻以 客户为中心的经营思想,实现客户服务的个性化、差异化。有必要对分散客户信息和业务数 据进行整合,创建完善的客户关系管理系统,分析客户的综合贡献度,是银行改进服务,创 造效益的一个途径。 从应用角度来看,中国的金融企业己经走过了二十多年电子化历程,从八十年代初的计 算机代替手工计帐,l q 现阶段的银行数据大集中的金融信息化,积累了大量的客户数据和帐 户信息,这也为金融企业创建基于数据仓库和数据挖掘相关技术的客户关系管理系统创造了 条件。在数据积累的基础上,采用合理的技术寻找出最有价值的客户,并为其提供更加个性 化的服务和产品的交叉营销,这祷全面提升中国银行业的核心竞争力,应对入世后外资银行 的挑战和防范金融风险的有效措施。 目前,发达国家的大型商业银行纷纷从以公司业务为主转向公司业务与对私业务并重发 展,个人金融业务逐渐成为商业银行盈利的主要渠道。由于个人金融业务市场巨大,每一个 人的金融需求都不尽一样,它就更需要精细化的管理和生产,即把整个生产和管理过程尽可 能的细化,对每一细小环节尽可能的挖掘改进。在精细化管理过程中摄有效的方法和t 具是 数据挖掘技术,也就是对金融机构积累的大量客户数据( 尤其是各种业务的交易数据) 进行 分析,找出各种商业规律,用智能化的客户关系管理系统对复杂的个人金融业务进行批发管 理和生产,形成核心竞争力。 总之,金融客户关系管理是指银行通过分析现有的客户数据和信息,实现与客户有意义 的交流和沟通,理解并影响客户行为,并最终实现吸引客户、留住客户、提高客户忠诚度雨1 客户为银行创利最大化的方法。 1 3 金融行业数据挖掘和数据仓库管理的研究现状 1 3 1 行业现状 国内的金融行业应用数据挖掘技术进行客户关系管理尚在起步阶段。随着市场、客户需 求、竞争对手的变化、技术的进步,银行也也不断的面临着机遇与挑战。在宏观上,产品狄 策、经营决策由经验型向科学型转变;在微观上,银行的经营从以业务为核心的经营管理模 式向以客户为中心的精细化管理模式转变。这也形成了银行对c p , m 系统的迫切需求,同时 金融行业的数据挖掘研究,需甍投入多种层次、多方面的人力、物力资源,包括业务和技术 专家、数据管理员、数据分析人员、业务分析人员、数据挖掘专家形成一个团队,从银行 浙江大学博士学位论文 实际需求出发,摸索适合自己企业的一套研究和开发方法,逐步建立起企业的模型库。一方 面,不同的客户对银行有不同的金融需求,针对银行不同的客户群而建立的模型必需具有实 际应用价值。另一方面,有效的客户挖掘、分析结果,将为银行的产品设计、提供个性化客 户服务、实现经营效益最大化提供依据,也可以为管理层正确的经营决策服务。 在国外几乎所有的商业银行都已经建成了自己的c r m 系统,并通过实践不断的完善其 客户分析管理模型,通过与大学、研究机构、软件开发商的合作不断采用数据挖掘领域的新 技术、新算法,提高客户分析的效率和模型的精确度,在这点上要领先国内5 1 0 年时间。 而目前中国银行业数据管理应用的普遍现状是:银行汇集了大量客户信息和交易数据, 但是缺乏挖掘数据的知识、手段和工具,尽管近两年国内镬行对c r g 的研究持续升温,但缺 乏明确的客户细分战略,也没有制定一套严格的客户分类标准,没有形成全面的项目实施策 略和持续有梯度的推广战略。国内银行业目前仅仅停留在数据挖掘和客户关系管理的理论研 究层次上的研究,有些银行在业务的部分或者局部应用了一些针对于客户价值挖掘的手段和 措施,远没有达到系统化,集成化的程度。可以看到,中国银行业自改革开放以来对于信息 化建设日益重视,这大大缩小了与国外银行在金融核心竞争力即信息化能力的差距,这也使 得国内银行在短短数十年问,取得了令国际同行注目的成绩。但是,一直到了今天,中国加 入w t o ,外资银行纷纷落户中国,中资银行开始与强大对手实际较力的时刻,中国银行业 才发现,实现传统业务电子化处理不是终极目的,这只是保证银行具备核心竞争力的一系列 重要工具之一,而在信息化工具组合中,更为锐利、高效和复杂的数据挖掘工具和技术,还 没有被中国银行业所广泛掌握。 一言以蔽之,中国银行业目前的发展难点和重点在于,如何整合客户数据、整合客户接 触渠道、客户业务流程自动化,把大量客户资料、存贷款帐户、各种渠道的交易数据用于提 :升客户关系、挖掘客户价值、掌握业务规律,将客户信息用于银行决策。目前看来,银行在 管理客户生命周期的各个阶段都可以用到数据挖掘技术:数据挖掘能够帮助银行确定客户的 特点,从而可以为客户提供有针对性的服务;通过数据挖掘,可以发现购买某类金融产品的 客户特征,从而可以扩大客户群;也可以发现流失客户群的特征,并在出现相似特征的客户 还未流失之前,采取针对性的措施:因此在银行的客户维护、产品交叉销售( c r o s s s e l l i n g ) 、 客户关- 阡与保持等方面,数据挖掘工具都将发挥积极重要作用。很显然,在这个过程中,银 行的信息化也从简单到复杂、从低层业务到高层管理不断演化。从业务数据化到q k 务知识化, 数据挖掘在银行必将日益受到重视,这也是与银行对基于数据的知识发现和决策支持系统越 来越强烈的需求是分不开的 1 0 l 。 4 浙江大学博士学位论文 应当说,数据挖掘和数据仓库建设,既是现代商业银行业务与经营管理发展到一定阶段 对银行信息化水平提出的现实要求,又是现代商业银行业务发展与信息技术发展高度融合的 必然趋势。 1 3 2 数据挖掘和数拦仓库技术在金麓业的应用瑗状 一般来看,银行数据挖掘的任务,可以划分成四个层次:数据分析、知识发现、决策支 持和金融智能。如图1 所示: 基于决策支持的数据挖掘层次规划 图1 :银行业数据挖掘层次规划图 基于数据的知识发现( k d d ) 。是伴随着数据挖掘技术,在用户需求的驱动下发展起米 的一门新技术。如何充分利用大量数据,以指导银行营销、销售和竞争,如何从大量数据中 挖掘出适合银行业务人员使用的信息模式和知识,已成为银行信息化领域的热点之一。 决策支持系统( d s s ) 是面向决策者的、以解决半结构化问题为主的应用系统,突出支 持而非代替决策者的决镱行为。银行决镱过程包括了识别经营问题、建立模型、执行模型、 综合评价和反复进行等五个过程。在银行中,d s s 面向不同职能部门,如计划财务部门、 资金运行部门或会计管理部门等,位于运营的层面,以支持银行决策者进行! 仁结构化的决策。 数据挖掘在银行应用的最高阶段是实现决策支持的“智能化”,即实现金融商业智能 ( f i n a n c i a lb u s i n e s si n t e l l i g e n t ,f i ) 。金融智能是对银行掌握的信息进行搜集、分析和管理, 以使银行各级决策者获得洞察力。促使他们做出对企业更有利的决策。金融智能的管理模式 包括基于目标、基于例外和基于事实的管理三种。不同类型的银行或银行内部不同业务部门 可能选用不同的智能管理模式,如侧重于提供个人金融服务的银行多采用基丁产品目标的管 理,侧重于提供投资银行服务的银行,则多采用基于例外的管理模式。 数据分析、知识发现、决策支持和金融智能,不仅是数据挖掘的不同层级的任务,也体 浙江大学博士学位论文 应当说,数据挖掘和数据仓库建设,既是现代商业银行业务与经营管理发展到一定阶段 对银行信息化水平提出的现实耍求。又是现代商业银行业务发展与信息技术发展高度融合的 必然趋势。 1 3 2 数据挖掘和数据仓库技术在金融业的应用现状 一般来看,银行数据挖掘的任务,可以划分成四个层次:数据分析、知识发现、凑策支 持和金融智能。如图l 所示: 基于决策支持的数据挖掘屡次规划 圈1 :银行业数据挖掘层次规划图 基于数据的知识发现( k d d ) ,是伴随着数据挖掘技术,在用户需求的驱动下发展起来 的一门新技术。如何充分利用大量数据以指导银行营销、销售和竞争,如何从大量数摄中 挖掘出适台银行业务人员使用的信息模式和知识,已成为银行信息化领域的热点之一。 决策支持系统( d s s ) 是面向决策者的、以解决半结构化问题为主的应用系统,突出支 持而非代替决策者的决策行为。银行决簸过程包括了识别经营问题、建立模型、执行模型、 综合评价和反复进行等五个过程。在银行中,d s s 面向不同职能部门,如计划财务部门、 资金运行部门或会计管理部门等,位于运营的层面,以支持银行决策者进行半结构化的决策。 数据挖掘在银行应用的最高阶段是实现决策支持的“智能化”,即实现金融商业智能 ( f i n a n c i a l b u s i n e s s i n t e l l i g e n t ,f i ) 。金融智能是对银行掌握的信息进行搜集、分析和管理, 以便银行各级决策者获得洞察力,促使他们做出对企业更有利的决策。金融智能的管理模式 包括基于目标、基于例外和基于事实的管理三种。不同类型的银行或银行内部不同业务部门 可能选用不同的钢能管理模式,如侧重于提供个人金融服务的银行多采用基于产品目标的管 理,侧重于提供投资银行服务的银行,则多采用基于例外的管理模式。 数据分析、知识发现、决策支持和金融智能,不仅是数据挖掘的不同层级的任务,也体 数据分析、知识发现、决策支持和金融智能,不仪是数据挖掘的不同层级的任务,也体 浙江大学博士学位论文 现了银行在开展数据挖掘工作中的规划进度。数据仓库是一个面向主题的、集成的、时变的、 非易失的数据集合,支持管理部门的决策过程。银行早期的数据仓库建设,关注的往往是数 据分析和知识发现的内容,如提供统一及时的业务报表提供集成的客户信息等。当具备了 相应的数据挖掘基础,银行就有可能将数据仓库的应用引入决策支持和金融智能的层面更 关注于提供决策信息支持、辅助业务管理、分析和评价经营业绩等管理主题。 从目前状况看,国内银行的业务需求多集中在界乎知识发现和决策支持之间。以管理为 主的决策支持需求,将在未来一段时闯内成为银行业数据挖掘的重点。 目前:数据挖掘技术在银行业的应用,可以在以下几个方面发挥作用; 银行数据库营销市场管理( d a t a b a s em a r k e t i n gm a n a g e m e n t ) 客户群体划分( c u s t o m e rs e g m e n t a t i o n c l a s s i f i c a t i o n ) 客户背景分析( p r o f i l e a n a l y s i s ) 交叉销售( c r o s s - s e l l i n g ) 客户流失性分析( c h u r na n a l y s i s ) 客户信用评分( c r e d i ts c o r i n g ) 欺诈发现( f r a u dd e t e c t i o n ) 本论文将在第2 章对于数据挖掘在客户群体划分,流失和欺诈发现,以及客户信用评分 等方面的应用进行分析和论述。 银行使用的数据挖掘技术,以数据仓库( d a t aw a r e h o u s e ) 和联机分析处理( 0 l a p ) 为平台,借助银行拥有的海量数据,通过特征提取、清洗、集成、变换、挖掘、模式评估、 知识表示等数据处理方法,发现大量数据间的关联与趋势,探寻独特的、通过其他方法发现 不了的业务规律和模式。目前被广泛应用的统计分析方法包括线性、非线性回归分折、判别 分析、聚类分析、主成分因子分析和时闻序列分析等。所运用的特有分析方法则包括决策 树分析( d e c i s i o nt r e e ) 、准则推断( r u l ei n d u c t i o n ) 、关联探浸r j ( a s s o c i a t i o nd e t e c t i o n ) 、神经网 络( n e u r a ln e t w o r k s ) 和基因算法( g e l l e t i ca l g o r i t h m s ) 等等。 目前,国内外数据挖掘的发展趋势及其主要研究领域有:对知识发现方法的研究进一步 发展如近年来注重对b a y e s ( 叶斯) 方法以及b o o s t i n g 方法的研究和提高;传统的统计学 回归法在k d d 中的应用;k d d 与数据库的紧密结合。在应i e i j 方面包括:k d d 商业软件1 一 具不断产生和完善,注重建立解决问题的整体系统瓶不是孤立的过程。国外很多计算机公 司非常重视数据挖掘的开发应用,i b m 和微软都成立r 相应的研究中心进行这方面的j 一作, 此外,一些公司的相关软件也开始在国内销售,如p l a t i n u m 、b o 、s a s 等。 6 浙江大学博士学位论文 1 4 论文的研究内容和论文框架 1 4 1 研究内容 1 结合我国国情,对于银行业客户关系管理的现状和数据挖掘与数据仓库技术在银行 业的应用状况做了系统的分析和论述。 2 总结论述了数据挖掘的相关技术在银行客户划分,流失与金融欺诈,以及信用昔交 易分析中的应用。 3 基于数据挖掘的方法,对于银行客户聚类分析做了重点论述,提出了一种基于粗糙 集和决策树相结合的银行客户分类方法。 4 对于银行时序数据的数据挖掘技术进行了研究和分析,对比数据挖掘和模式识别中 常用的s e e d 生成算法,提出了一种聚类模式分析中字符串s e e d 生成的优化算法。 5 分析了a g e n t 在银行客户客户关系管理( c r m ) 中的应用,尝试将多a g e n t 的协商 框架,应用于银行产品营销竞争和客户的交叉销售分析中,提出了一个客户销售的西商框架。 6 结合上海浦东发展银行的实际应用背景,提出了一个客户关系分析管理系统的设计 方案。 1 4 2 论文框架 论文的具体框架如下: 第1 章:绪论主要介绍数据挖掘,数据仓库,以及银行客户关系管理的相关概念和应 用背景。 第2 章:银行客户关系管理的相关挖掘技术研究综述。 第3 章:银行客户聚类分析。 第4 章:银行时序数据的高效数据挖掘方法研究。 第5 章:多a g e n t 技术在银行客户关系管理中的应用。 第3 5 章是论文的核心部分,也是论文研究成果的集中体现。 第6 章:基于用户数据仓库的银行客户分析系统设计结合上海浦东发展银行的实际应 用背景,提出一个客户管理分析管理系统的设计方案。 第7 章:总结与展望。 7 浙江大学博士学位论文 第2 章银行客户关系管理的相关挖掘技术研究综述 本章从银行业c r m 系统的理论架构研究出发,对数据挖掘技术在银行客户划分,流失 和金融欺诈,银行信用卡分析的应用等经典方面对于银行客户关系管理技术作一个总结。在 第3 章到第5 章将分别具体分析银行客户聚类,时序数据商效挖掘以及多a g e n t 技术在客户 关系管理中的应用。 2 1 系统的理论架构研究 银行业是一个金融服务行业它与客户有着密切的关系。因此c r m 系统是商业银行为 客户提供金融服务的新载体。银行c r m 系统架构需要由成熟的理论作为支撑,全部系统设 计的实现就是这些理论的现实的反映【9 6 。 2 1 1 统一客户视图理论 客户对银行而言,不同的部门视角不同,服务点不同,关注的内容也不同。历史上各个 业务系统也对客户存在着天然的分割,基本上是以各类账户作为客户的基本单元同时在搜 集客户信息的过程中,存在着局部、片面、重复的现象。 以账户为基础的客户资料,不能够真实地反映客户的全部信息,而只是反映客户与银行 业务局部交互信息。以往的各个业务部门也试图搜集客户资料,但这种搜集往往是局部的。 更重要的是,这些客户资料信息由丁二没有被很好地组织和共享,躅此发挥的作用非常有限。 为了能够完成地,更好地利用客户信息不至于在应用和决策中发生失误,必须建立统一的 客户视图。通过统一的客户编码对其进行描述。 这样做,一方面防止银行内部各个部门出现对客户盲人摸象,只见局部不见森林的现象: 另一方面,通过整合各个业务部门内部的客户信息,同时各个业务部门对客户信息的不断补 充又能够强有力地相互支撑,使得银行内部能够共享客户信息,发挥客户信息的最大价值。 为了分析问题,给出如下客户信息价值模型: 9 浙江大学博士学位论文 厂 m 、 “。撬“n j 。m 川 式中,玎表示银行一个客户信息价值:k 为一个常数:p i 表示一个客户知识点的信息 数表示使肿席息的总次数k 喀nn i j 表示使用叶客户信息的收益艨示 搜集一个客户信息的次数;c 表示搜集一次一个客户信息的平均成本;m x c 表示搜集一个 客户信息的成本。 从上述公式中可以得出以下结论:n i 越大v i 越大;m 越小v i 越大。 考虑一个真实的客户被当作两个客户存储并应用于系统中: v 卜k ( 和n , - m ,c v 一一:k f 窆p j n i1 一m ”c 卢1 那么,对这个真实的客户来说,其客户信息价值: v i + v i = k x f 窆州;+ 羔p j n ,l _ ( m ,+ m 一) c j = l j = l 此时,如果一个真实的客户被当作一个客户存储并应用于系统中( 假定用户总是趋向于 使用更多的客户信息) : = k 隋1 抽。卜1 1 i n ( m ,c i - 可以看到v i v i + v i ”尤其是使用信息越多的时候。 通过上述分析,给出如下统一客户视图理论; 银行的客户是被唯一的,全局性地存储丁c r m 系统中,并在系统中唯一地,全局性地 被应用。不能提供统一客户视图的银行i t 系统不能称为c r m 系统。 统一客户视图理论是整个银行c r m 的核心基础,全部的系统设计是基于这样一个理论。 2 1 2 银行客户细分组合理论 银行每一个客户都是不同的,只是银行有没有必要完全关注这种客户的不同。客户都是 寻求差异化服务的,但是否满足每个客户的需求,对银行来说需要仔细考虑。对银行i 酊言如 l o 浙江大学博士学位论文 果一个客户群越大,那么它所提供的服务成本越低 的服务成本越高。 为了分析问题,给出如下银行客户价值模型: v = ( g 。c i = l 式中。v 表示银行的整体客户收益; g t 表示银行面对的客户群; c 表示g i 客户群的贡献率: 如果一个客户群越小,那么银行所提供 - c o s t 。) c o 鸥表示银行为g i 客户群付出的成本。 i = l ,n ,表示共有n 个客户群。 由于激烈的市场竞争,在银行经营过程中,每个g 会减小,为了赢得客户银行也会被 迫减小c 。因此v 是趋于下降的。为了简化起见,在这里不考虑g 本身的变动因素。如果 银行为了避免出现这种情况,那么就提供差异化的新服务,对一个g 。进行细分,得到两个 客户群:g i l ,g n 。其中g i l ,仍然提供原来的服务,g 口提供新的服务。由于这种新的服务竞 争对手没有,而且客户能够接受,那么c n 就可以大一些;但是由于提供了新的服务c o s t i 2 也会增大,因此如果: ( g i 2 c ,2 一c o s ti 2 ) ( g i 2 c 一c o s ti ) 那么这种细分就是有价值的,即这就是银行客户细分理论。银行客户细分理论说明了 两个道理: 细分客户群,提供差异化服务是经营之道。 细分有目的性,这种目的性体现出银行面对激烈的市场竞争,提升了自己的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大考试题及答案
- 班级考试题及答案
- 中级财务会计(下)(山东联盟)知到智慧树答案
- 市场营销模拟习题(附答案)
- 介入血管外科护理基础理论考试试题与答案
- 2025年餐厅股份转让与可持续发展战略合同范本
- 2025年度食品行业绿色供应链管理合作协议
- 2025版家具产品售后全流程服务协议
- 2025年度电力工程设备采购合同范本
- 2025年度BIM技术在主厂区维修项目中的应用与管理服务合同
- 日光性皮炎的临床特征
- 中建型钢混凝土结构施工方案
- 《头发头皮生理学》课件
- 数据中心暖通培训
- 有限空间专项安全检查表
- 广西桂林旅游文化宣传城市介绍文旅科普美食
- 学校栏杆工程施工方案
- 2025年高考语文备考之名著阅读《红楼梦》与《乡土中国》衔接融合习题含答案
- 2024年锅炉操作工(技师)职业鉴定理论考试题库(含答案)
- 人力资源许可证制度(服务流程、服务协议、收费标准、信息发布审查和投诉处理)
- 外研版(2024)七年级上册英语Starter教学设计
评论
0/150
提交评论