(工商管理专业论文)数据挖掘技术在银行信用卡业务中的应用.pdf_第1页
(工商管理专业论文)数据挖掘技术在银行信用卡业务中的应用.pdf_第2页
(工商管理专业论文)数据挖掘技术在银行信用卡业务中的应用.pdf_第3页
(工商管理专业论文)数据挖掘技术在银行信用卡业务中的应用.pdf_第4页
(工商管理专业论文)数据挖掘技术在银行信用卡业务中的应用.pdf_第5页
已阅读5页,还剩69页未读 继续免费阅读

(工商管理专业论文)数据挖掘技术在银行信用卡业务中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 信用卡业务在中国的发展方兴未艾,竞争也日趋激烈。如何更多地了解客户 的信息,并将这种信息转变成“知识 ,从而更好地为客户提供高质量的个性化 服务,保持和发展高价值的客户,已经成为各银行开展信用卡业务的一个紧迫的 课题。新兴的数据挖掘技术能够从海量的信用卡业务存储数据中发现一些未知 的、有价值的规律,无疑为银行提供个性化的信用卡服务提供了强有力的支持。 本文重点研究信用卡数据集市的建立和数据挖掘技术在信用卡信用评估、客 户、特约商户价值的区分和客户消费偏好中的一些应用。并提出了一些基于数据 挖掘的信用卡营销战略和个性化营销的新方式。本文的研究可以为银行开展信用 卡业务带来新的思路,为国内银行提升信用卡业务的服务水平、获取竞争优势提 供一定的帮助。 本文的主要创新点如下: ( 1 ) 将数据挖掘引入到国内银行的信用卡业务分析中。主要是信用卡信用 评估、客户价值的区分和客户消费偏好中的一些应用。 ( 2 ) 探讨了有关信用卡数据集市建设的问题。 ( 3 ) 在前人关于个人消费信贷研究的基础上完善提出了一个信用卡信用 评分的模型。 ( 4 ) 在前人的基础上补充提出了信用卡的客户价值的模型,还提出了特约 商户的价值的概念和计算公式。 ( 5 ) 提出了一些新的关于信用卡个性化营销的方式。 关键词:信用卡;数据挖掘;数据仓库 a b s t r a c t t h ec r e d i tc a r db u s i n e s sh a sa v e r yg o o dp r o s p e c ti nc h i n a , b u tt h ec o m p e t i t i o n w i l lb e c o m ef i e r c e ra n df i e r c e r t h ep r o b l e mh o wt ou n d e r s t a n df u r t h e rc u s t o m e r s i n f o r m a t i o na n dt r a n s f e rt h e mi n t ot h ek n o w l e d g e ,s oa st op r o v i d ec u s t o m e r sw i t h b e t t e rh i g hq u a l i t yp e r s o n a l i z i n gs e r v i c et or e t a i na n dd e v e l o pv a l u a b l ec u s t o m e r s ,h a s b e c o m eav e r yu r g e n tp r o j e c tw h i c ht h ed o m e s t i cb a n k sa r ef a c i n g t h ed a t am i n i n g t e c h n o l o g yc a nf i n ds o m eu n k n o w na n dv a l u a b l ek n o w l e d g ef r o ml a r g ea m o u n to f c r e d i tc a r db u s i n e s sd a t a i tu n d o u b t e d l yp r o v i d eb a n k s c r e d i tc a r db u s i n e s s 、 ,i t l l p o w e r f u ls u p p o r t t h i st h e s i sm a i n l yr e s e a r c ht h ec r e d i tc a r dd a t am a r te s t a b l i s h m e n ta n dt h e a p p l i c a t i o no fd a t am i n i n gt e c h n o l o g yi nc r e d i ta s s e s s m e n t ,c u s t o m e r sa n dm e r c h a n t s v a l u ep a r t i t i o n ,c u s t o m e r sc o n s u m p t i v ep r e f e r e n c e i na d d i t i o n , t h i st h e s i s b r i n g f o r w a r ds o m en e wc r e d i tc a r d m a r k e t i n gs t r a t e g i e sa n dp e r s o n a l i z i n gm a r k e t i n g m e t h o d sw h i c ha r eb a s e do nd a t am i n i n gt e c h n o l o g y t h er e s e a r c hw i l lp r o v i d eb a n k s o p e r a t i n gc r e d i tc a r db u s i n e s sw i t hn e wi d e a sa n dh e l pd o m e s t i cb a n k si m p r o v ec r e d i t c a r ds e r v i c et oa c h i e v ec o m p e t i t i v ea d v a n t a g e s t h i st h e s i s sm a i ni n n o v a t i o ni n c l u d ea sf o l l o w i n g : i n t r o d u c et h ed a t am i n i n gt e c h n o l o g yi n t ot h ea n a l y s i so fd o m e s t i c b a n k sc r e d i tc a r db u s i n e s s e m p h a s i z eo nt h ea p p l i c a t i o no fd a t am i n i n g t e c h n o l o g yi n c r e d i t a s s e s s m e n t ,c u s t o m e r sa n dm e r c h a n t sv a l u e p a r t i t i o n ,c u s t o m e r sc o n s u m p t i v ep r e f e r e n c e r e s e a r c ht h ep r o b l e mo ft h ec r e d i tc a r dd a t am a r te s t a b l i s h m e n t c o m p l e m e n t a r i l yb r i n gf o r w a r dt h e c a r d i tc a r dc r e d i ts c o r i n gm o d e l w h i c hi sb a s e do no t h e rs c h o l a r sc o n s u m p t i o nc r e d i tr e s e a r c h c o m p l e m e n t a r i l yb r i n gf o r w a r dt h ec r e d i tc a r dc u s t o m e r sv a l u em o d e l a n dt h ec o n c e p to fm e c h a n t sv a l u ea n df o r m u l a b r i n gf o r w a r ds o m en e wc r e d i tc a r dp e r s o n a l i z i n gm a r k e t i n gm e t h o d s k e y w o r d s :c r e d i tc a r d ;d a t am i n i n g ;d a t aw a r e h o u s e 、,、-、,、, 0 q 0 厦门大学学位论文原创性声明 兹呈交的学位论文,是本人在导师指导下独立完成的研究成 果。本人在论文写作中参考的其他个人或集体的研究成果,均在 文中以明确方式标明。本人依法享有和承担由此论文产生的权利 和责任。 声明人( 签名) : 伊飞年 缸荔 月乡e l 厦门大学学位论文著作权使用声明 本人完全了解厦门大学有关保留、使用学位论文的规定。厦 门大学有权保留并向国家主管部门或其指定机构送交论文的纸 质版和电子版,有权将学位论文用于非赢利目的的少量复制并允 许论文进入学校图书馆被查阅,有权将学位论文的内容编入有关 数据库进行检索,有权将学位论文的标题和摘要汇编出版。保密 的学位论文在解密后适用本规定。 本学位论文属于 1 、保密() ,在年解密后适用本授权书。 2 、不保密( ) ( 请在以上相应括号内打“”) 作者签名:绯 导师签名: 日期: 炒8 年5 月;日 日期:年月 日 l 绪论 1 绪论 1 1 引言 信用卡是指由银行、非银行金融机构或专营公司向资信良好的单位、个人签 发的可以在指定的商店或场所进行直接消费,并可在发卡银行及联营机构的营 业网点存取款、办理转帐结算的一种信用凭证和支付工具。信用卡是国际上广泛 流行的、先进的、新型的支付手段与信用工具,是产生于经济发达国家和地区的 一种新型的消费信贷方式。信用卡于1 9 1 5 年起源于美国,随后发展异常迅猛。 目前在国际上主要有维萨国际组织( v i s ai n t e r n a t i o n a l ) 及万事达卡国际组织 ( m a s t e r c a r di n t e m a t i o n a l ) 两大组织及美国运通国际股份有限公司( a m e r i c a e x p r e s s ) 、大来信用证有限公司( d i n e r sc l u b ) 、j c b 日本国际信用卡公司( j c b ) 三家专业信用卡公司。在各地区还有一些地区性的信用卡组织,如欧洲的 e u r o p a y 、台湾地区的联合信用卡中心等等。仅以v i s a 国际组织为例,v i s a 目前有会员单位约2 2 万个,发卡逾1 0 亿张,商户超过2 0 0 0 多万家,联网a t m 机约6 6 万台。2 0 0 1 年,v i s a 处理了总值逾2 兆亿美元的交易,仅在亚太区v i s a 的签账额就比2 0 0 0 年增长了4 4 ,达到3 1 0 0 亿美元。回 我国开展信用卡业务比较晚,1 9 8 6 年中国银行在国内率先成功地推出第一 张信用卡,经过十几年的发展,我国的信用卡业务也取得了长足的进步。目前国 内可以找到的和信用卡最相关的是银行卡的统计数字。据统计 ,截至2 0 0 2 年6 月末,全国银行卡发卡总量达到4 3 8 亿张,比2 0 0 1 年年末增长1 4 ;2 0 0 2 年1 月至6 月银行卡交易总额6 1 万亿元,比2 0 0 1 年同期增长2 5 ;银行卡账户人 民币存款余额5 7 3 1 亿元,比2 0 0 1 年年末增长1 2 1 1 亿元,增长2 6 8 。随着中 国银联公司的成立和跨行交易成功率的提高,银行卡跨行交易量得到了较大幅度 的增长。2 0 0 2 年1 月至6 月共完成跨行交易2 5 亿笔,清算金额7 1 3 亿元,分 别比2 0 0 1 年同期增长8 8 6 和7 4 ,其中,通过银行卡总中心完成的异地跨行交 易达到4 7 3 万笔,清算金额6 7 亿元,分别是2 0 0 1 年全年交易总和的1 6 倍和 1 9 倍。 o 签账额指在销售点消费的销售额以及在a t m 提取的现金的总和。 国v i s a 国际组织会讯,2 0 0 2 年6 月号。 。2 0 0 2 年0 8 月0 2 日北京青年报 数据挖掘技术在银行信用卡业务中的应用 当今商业社会正在以不同寻常的速度在改变。垄断业务的解体、业务的多样 化和全球化等特性已在企业间的竞争中急剧增加。对客户本身而言,绝对忠实的 客户已经不存在。为了回应这种变化,具有竞争力的企业正在摒弃过去的无效的 企业哲学,正在采取创新的方式来维护顾客的忠诚度,从中获取最大的利润,而 不仅是把焦点放在内部问题的考虑,如降低成本和简化操作流程等。在客户效益 概念的引导下,企业正在通过集中精力在客户关系的管理等诸多方面,最大化地 获取利益。企业正在采取一个“以客户为中心”战略,强调客户价值的重要性。 在这个意义重大的从“以产品为中心 的策略到“以客户为中心 策略的转变过 程中,保留现有的又效益的客户正在变得越来越重要,虽然在某些情况下,获得 客户是首要的。随着客户获取的成本的不断提高,同时也认识到分析客户效益的 重要性,许多公司已经意识到,企业成功的关键就是:尽可能地了解你所能了解 的有关这个客户的一切信息,把它转化为知识,进而变成企业竞争的原动力。 转变成“以客户为中心 策略的一个关键步骤是收集足够的信息对客户分类, 并且对不同群体的客户采用针对性和有效的互动交流。通过分析型的分类技术, 客户的信息一- - ! 1 1 人口统计学方面的数据( 个人的背景数据) ,生活方式方面的信 息,与客户历史信息相结合,来帮助确定在不同组别中的客户的行为差异,或者 进行客户的分类。对于重点客户,可以继续进行筛选和区分,最终达到建立单独 的,个别的客户档案,进而为客户提供个性化服务的目的。 但是目前我国国内银行在信用卡业务上的个性化服务还存在不小的差距。本 文探讨以新兴的数据挖掘技术在信用卡业务中的若干应用,希望能对国内银行提 高信用卡业务的竞争能力有所帮助。 1 2 本文的研究主题和意义 随着中国加入w t o ,中国银行业面临着日益激烈的竞争。各大银行纷纷采 用先进的信息技术手段提升自身的服务水平。银行提供给用户的产品有一个显著 的特点就是:同质性。不同银行之间的产品几乎没有什么差别。而另一方面,银 行又存有海量的用户信息数据。通过对这些海量数据的挖掘分析,发现用户不同 的消费偏好,开展有针对性的营销活动,保留高价值客户,创造更多的利润,成 为银行获取竞争优势的一个重要手段。数据挖掘技术的出现,为银行实现这个目 2 l 绪论 标提供了强有力的武器。 信用卡是当今银行发展最快的一项金融业务之一,它是一种可在一定范围内 替代传统现金流通的电子货币。目前我国政府也在大力促进银行卡的推广和普 及。随着信息技术的不断发展,信用体系的不断完善,信用卡的应用将不断得到 普及。国内各大银行纷纷将其作为重点业务加以发展,已经成为各内外资银行的 必争之地。 然而当前国内银行的信用卡业务的服务水平还停留在较落后的水平。中国银 行业与国外银行最大的差距在于服务。在客户关系管理方面,国外已有将近二十 年的历史。西方银行业一直处于比较激烈的竞争状态,在客户服务方面积累了相 当的经验。而中国银行业刚从计划经济时期转变过来,对“以客户为中心 的理 解一直处于表面状态,不能够深入的了解客户的需求,长期以来对客户实行无差 别服务策略,不能够抓住真正的赢利客户,进行区别对待,为客户提供一对一的 服务。银行的数据库中积累了大量的客户信息,但是缺乏一套行之有效的数据挖 掘系统进行信息分析,甚至连同一客户的不同帐户也无从辨别,更不用说为客户 提供一对一的服务。银行的各种数据不能有效结合,形成了很多“信息孤岛”, 使金融机构很难将各种各样的客户信息统一起来,领导决策层也很难搞清楚数据 库系统的整体运作情况,不能有效的提供决策帮助。而随着数据挖掘技术的不 断成熟和完善,完全可以为国内银行开展个性化的信用卡营销提供强大的信息支 持。 本文研究数据挖掘技术在信用卡信用评估、客户价值的区分和客户消费偏好 中的一些应用。 相信本文的研究可以为国内银行开展信用卡业务、提升服务水平提供一点帮 助。 1 3 国内外研究现状 国外数据挖掘学术界对于信用卡的研究主要集中在欺诈模型方面。企业界的 软件厂商主要针对银行业开发客户关系管理软件,数据挖掘是其中的一个模块。 较少有专门针对信用卡开发的全面分析软件。在银行数据挖掘领域比较活跃的软 。曲东荣,浅谈c r m 在中国银行领域中的应用,中国计算机报,2 0 0 0 年5 月1 9 日。 3 数据挖掘技术在银行信用卡业务中的应用 件提供商有:i b m 、s a s 、s p s s 、s y s b a s e 和o r a c l e 等。他们都提出了面向 银行业的解决方案,但没有公开的技术文献。国外的一些大的商业银行也已经开 展了数据挖掘方面的应用,但是因为涉及到商业机密,都没有公开的文献资料的 介绍。 国内几大银行都在上c r m 软件,但目前还是处在业务库数据上移和建立数 据仓库阶段,没有到数据挖掘分析的阶段。相关的公开的技术文献也没有报道。 4 2 信用卡业务和数据挖掘 2 信用卡业务和数据挖掘 2 1 信用卡与数据挖掘概述 2 1 1 信用卡的定义 随着信用卡业务的发展,信用卡的种类不断增多,概括起来,一般有广义信 用卡和狭义信用卡之分。 从广义上说,凡是能够为持卡人提供信用证明、持卡人可凭卡购物、消费或 享受特定服务的特制卡片均可称为信用卡。广义上的信用卡包括贷记卡、准贷记 卡、借记卡、储蓄卡、提款卡( a t m 卡) 、支票卡及赊帐卡等。 从狭义上说,信用卡主要是指由银行或其它财务机构发行的贷记卡,即无需 预先存款就可贷款消费的信用卡,是先消费后还款的信用卡。 根据中国人民银行1 9 9 9 年3 月1 日颁布执行的银行卡业务管理办法的 定义,该办法所称银行卡,是指由商业银行( 含邮政金融机构,下同) 向社会发 行的具有消费信用、转帐结算、存取现金等全部或部分功能的信用支付工具。银 行卡包括信用卡和借记卡。信用卡按是否向发卡银行交存备用金分为贷记卡、准 贷记卡两类。贷记卡是指发卡银行给予持卡人一定的信用额度,持卡人可在信用 额度内先消费、后还款的信用卡。准贷记卡是指持卡人须先按发卡银行要求交存 一定金额的备用金,当备用金帐户余额不足支付时,可在发卡银行规定的信用额 度内透支的信用卡。借记卡按功能不同分为转帐卡( 含储蓄卡,下同) 、专用卡、 储值卡。借记卡不具备透支功能。 本论文所研究讨论的信用卡是指贷记卡和准贷记卡。 2 1 2 使用信用卡的优点 信用卡作为特殊的金融商品、现代化的金融工具,是国际流行的先进结算手 段、支付工具和新颖的消费信贷方式,日益受到人们的青睐。 由于使用信用卡,改现金交易为转帐结算,取代了一定数量的市场流通货币, 减少了货币的发行量,减少了国家每年用于货币印刷、调拨、运输、仓储和投放 所耗费的资金,也加快了社会流动资金周转速度,促进经济发展。信用卡还能促 进商品销售,刺激社会需求。 5 数据挖掘技术在银行信用卡业务中的应用 对于持卡人而言,信用卡的发行和使用,使持卡人通过使用信用卡获得商品 和劳务服务,免除了携带大量现金的不便和风险,同时还可通过透支简便地获得 银行贷款。同时贷记卡持卡人非现金交易还可以享受如下优惠条件:( 1 ) 免息 还款期待遇。银行记帐日至发卡银行规定的到期还款日之间为免息还款期。免息 还款期最长为6 0 天。持卡人在到期还款日前偿还所使用全部银行款项即可享受 免息还款期待遇,无须支付非现金交易的利息。( 2 ) 最低还款额待遇。持卡人在 到期还款日前偿还所使用全部银行款项有困难的,可按照发卡银行规定的最低还 款额还款。 对于特约商户来说,由于有信用卡发卡银行的信用保证,特约商户可以放心 地为持卡人提供商品和服务,从而扩大商品的销售量,并减轻收款、点款工作量, 简化了支付、记帐和结帐的过程。 信用卡的发行,使银行有了一种新的争取特约商户和信用卡客户存款的手 段,有利于扩大银行转帐结算业务,同时增加银行信贷资金的来源,从而获得更 多的利差收入,已经成为银行的重要盈利手段。据统计 ,国外信用卡业务给银 行带来的利润一般占到银行利润的3 0 左右,花旗银行甚至还要高,占5 0 以 上。美国运通公司更是凭籍运通卡成为全球服务、旅游、娱乐业界的巨无霸。 对于银行而言,信用卡业务的收入主要包括年费、结算手续费、透支利息等。 在这几项收人中,年费收入是固定不变的,普通信用卡大约2 0 一4 0 元一年,只 要发卡就会有年费收入,其他几项收入随业务量的大小而变化,结算手续费收入 随卡均消费额的变化而变化,利息收入随透支额的变化而变化。 2 1 3 数据挖掘的产生 随着计算机硬件和软件的飞速发展,尤其是数据库技术与应用的日益普及, 人们面临着快速扩张的数据海洋,如何有效利用这一丰富数据海洋的宝藏为人类 服务,业已成为广大信息技术工作者的所重点关注的焦点之一。与日趋成熟的数 据管理技术与软件工具相比,人们所依赖的数据分析工具功能,却无法有效地为 决策者提供其决策支持所需要的相关知识,从而形成了一种独特的现象“丰富的 数据,贫乏的知识”。为有效解决这一问题,自二十世纪8 0 年代开始,数据挖掘 中国人民银行1 9 9 9 年3 月1 日颁布执行的银行卡业务管理办法 。2 0 0 2 年0 9 月1 8 日1 0 :2 5 发卡分支机构一 省级( 或大区) 分行 产品粒度线: 不同信用卡产品和服务一 客户一 信用卡业务管理员一 发卡分支机 构一 省级( 或大区) 分行 系统中各类指标以上述三种粒度线之一进行汇总,按照目前的一般的数据仓 库系统容量及需求,一般以日为粒度的数据保留半年,日以上粒度已经 汇总,数据量成十倍及以上缩小,故可长期保留。系统提供的下钻( d r i l l d o w n ) 及对应的上卷( d r i l l u p ) 功能即是沿着此三条主要的粒度线进行的。下钻操作即 指从不太详细的数据展开进入下一级较为详细的数据,上卷操作则是下钻操作的 逆操作。 2 3 3 数据集市建模 实体一联系数据模型( e r - m o d e l ) 广泛用于关系数据库设计,数据库模式 由实体的集合和它们之间的联系组成,这种数据模型使用于联机事务处理。数据 仓库的特点要求简明的、面向主题的模式,以便于联机数据分析。数据仓库建模 的许多技术已逐渐形成并且还在继续发展。最流行的多维数据模型以星型模式、 雪花模式以及它们的混合形式存在。 星型模式( s t a rs c h e m a ) :由一个大的包含大批数据和不含冗余的中心表( 事 实表) 和一组小的附属表( 维表) 组成。这种模式很像星星爆发,维表围绕中心 表显示在射线上。本系统中按照各个主题的需要,大量采用了星型模式的设计, 以下以图2 9 一一系统的核心结构之一“客户基本情况分析主题的数据结 构为例说明此模式的应用: 2 4 2 信用卡业务和数据挖掘 图2 9 客户基本情况信息星型模式 可以看出,客户的属性很多,每种属性由一个维表来描述。 基于关系数据库的o l a p 的维表及事实表都是用二维关系表的方式存放的,因 而事实的提取需要通过将维表和事实表的连接来完成,对每个维都需要进行一次 连接操作,因而系统的数据库表间连接操作是性能的关键。 本系统在数据库的存储实现上计划采用o r a c l e8i 的几项面向数据仓库应用的 r d bms 系统优化功能,使整体性能效果达到满意。一是对具有大批数据的事 实表采用数据分区和索引分区( p a r t i t i o n ) 技术,使每个分区块的记录数或索引 数固定,由o r a c l e 来管理分区表,从而使得数据表的性能不随数据量的增加而 下降;二是对于维值数不多的维表与主表的索引采用位图( b i t m a p ) 索引技术, 这样可防止由于常规b + 索引会使二叉树失衡使访问效率大大下降;第三是对于 常用的、需进行大量聚集计算的数据查询,预先进行提炼,用固化视图 ( m a t e r i a l i z e dv i e w ) 进行预加工,从而大大加快了访问速度。这些技术的应用, 其基本策略是相同的,即:以空间换时间,通过大量的预加工来加速数据的访问 速度,计算机技术的飞速发展、硬件成本快速下降使大容量数据仓库建设成为可 数据挖掘技术在银行信用卡业务中的应用 能。同时,基础数据加工的要求是前所未有的,数据的采集、整合、加工花费了 一半以上的项目工作量。 2 4 以客户为中心的数据整合一数据采集系统o d s 的设计与实现 2 4 1 数据e c t l ( e x t r a c t 。c ie a n s e 。t r a n s f o r m 。l o a d ) 过程 由于要抽取的信息分布在信用卡业务系统及相关业务系统中,有些指标需要 复杂的表间链接及归并计算才能得到,标准的数据仓库e c t l 产品工具无法直接 完成处理,必须编程生成以企业为主线的中间表以便于e c t l 处理,同时也为了 建立最基层数据源与数据仓库之间的缓冲,以减少台帐系统底层的变化而引起的 后续处理乃至分析数据和功能的不稳定。 a 处理:即数据采集子系统。以客户为对象,从分散在各业务系统中的相关 客户信息抽取到中间库,然后根据业务逻辑,以客户编号为关联,经过一定的检 测,加工整合形成一致化的、多种粒度的数据。 b 处理:即数据加工子系统。在a 的基础上,再按各个分析主题的需要进行 深度加工,经严格的检测控制加载到数据仓库中。 a ,b 处理形成d b o d s d w 三者结合的体系结构( o d s :o p e r a t i o n a ld a t a s t o r e ) ! t 1 下图2 1 0 所示。 一数据采集子系统 ,一数据加工子系统一i l : 图2 1 0 三层数据体系结构 2 信用卡业务和数据挖掘 2 4 2 数据整合的难点 由于目前我国商业银行的业务处理系统还没有到达以客户为中心的集成化, 因此来自各个子系统的数据具有不同的标识。客户在不同业务系统中拥有格式不 同的帐号,如何将他们的信息关联在一个统一的客户号下是o d s 系统e t c l 过 程乃至数据仓库数据可用与否的关键,通过建立一张“客户编号一帐号一身份证 号码”参照表来解决这一难题,但是建立和维护这一关键数据资源需要花费各相 关业务系统人员的大量收集、整理( 包括手工) 工作量。 2 5 系统的关键技术及实现架构 2 5 1 系统的技术实现架构 系统结构要具有良好的扩充性,一是软件系统的功能扩充,二是硬件设备的 扩充,并能容纳不同厂家的平台。通过采用流行的三层的系统体系结构( d b s e r v e r a p p l i c a t i o ns e r v e r b r o w s e r ) 、分布式对象技术可实现这一目标。值得 一提的是本系统拟采用软总线的设计理念,即将模型、挖掘算法、常用的分析工 具模块以对象的形式构建,以通用的“插件”的形式插在分布式的“软总线”上, 可供不同分析主题的调用,这样随着系统主题的不断扩充,算法的不断丰富,系 统的功能将不断增强,并且不会影响系统的整体结构。示意图如下图2 1 1 所示: 客户分信用卡产品分 商户分 交易地理位置和时 间分析 图2 1 1 技术实现框架 2 7 数据采 数据处理 臼 臼 一 系统监控 一 数据挖掘技术在银行信用卡业务中的应用 2 5 2 系统的关键技术 数据的存储和管理。因为本系统数据量每年都会快速增长,因此支持大容量 数据、高性能的数据库系统是实现数据仓库的首要条件,它必须支持数据的分割 ( 分区) 技术,快速索引技术如位图索引( b i t m a p ) 技术,及针对决策支持查询 的优化技术和支持多维分析的查询模式等。 数据挖掘技术( d a t am i n g ) :d m 涉及分类、聚类、决策树、神经网络等多 种技术,技术含量高。本文的第四部分将重点论述数据挖掘在信用卡业务方面的 应用。 分布式对象技术。可以采用的两种协议是d c o m 和c o r b a 。根据我们的 工程实践经验和本系统的投资规模,采用d c o m 协议。 三层的浏览器服务器体系结构。在三层应用体系结构上,系统结构分为浏 览器、应用服务器、数据库服务器三级,业务逻辑被定位在应用服务器,不再象 传统的两层客户机服务器结构那样将大量业务逻辑分布到客户端的程序中。这 样,系统的扩展能力大大增强,使业务逻辑可以更加方便集中更新维护。 但是,三层体系结构相对复杂,实现时复杂程度也相应增加。如果一个系统 所有模块完全采用三层结构来实现,首先将会给中间层服务器带来过重的压力, 中间层与数据库的连接也容易成为整个系统的瓶颈;其次会将简单模块大大复杂 化,开发、调试、维护工作量将相应加大。综合考虑以上两个方面,本系统部分 拟采用以d c o m 为基础的三层体系结构,如共享程度较高的模块:线性回归、 聚类、决策树模型、神经网络算法等,而相对独立模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论