(金融学专业论文)个人信用评估模型研究.pdf_第1页
(金融学专业论文)个人信用评估模型研究.pdf_第2页
(金融学专业论文)个人信用评估模型研究.pdf_第3页
(金融学专业论文)个人信用评估模型研究.pdf_第4页
(金融学专业论文)个人信用评估模型研究.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(金融学专业论文)个人信用评估模型研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容摘要 1 9 9 9 年,人民银行摊出关于开展个人消费信贷的指导意见, 详细规定了剿内商业银行开展个人消费信贷的蒋于政策,此后,个人 游爨信贷飞速发震,曼务涉及住房及装修贷款、汽车溥费贷款、大颧 耐用消费品贷歉、信用卡消费贷款等多个种类。信贷余额眭l1 9 9 8 年 的4 5 6 亿元增长到了2 0 0 4 年6 月末的1 7 9 5 2 亿元。然而,消费信贷 业务发震的瀚时孱暴露酶信臻风陵润题密对溺费信贷市场麓发展秘 成了威胁。针对我国商业银行信贷资产质量低下和风险加大的客观情 况,建立完善的信用风险管理机制已成为刻不容缓的任务,而信用评 髅作为风险篱灌的第一个环节蠢更需要得鬟妥蛰簿决。壹予我国信臻 体系不完善,商业银行无法全面掌握贷款人信用状况,目前,我国银 行对个人客户信用状况的评价,主要采用等级评分与专家评分相结合 豹方法,将客户豹鑫然状凝、鼗鲎状覆、与镊行关系等方西鼹指标酶 可能取值分威不同的级别,对不同的级别赋值,通过专家对每个指标 各个取值的评定来确定最终的指标评分结果。这种方法存在兰个主要 麓熏:( 1 ) 指标和权重设定依赖专家黪经验,具有先验性,实际簧潺 中某项指标对信用的影响作用可能与此并不一致:( 2 ) 扭曲了信用指 标与信= j 水平之间的真实关系。指标方法大多基予线性方法,而实际 土个久信矮承乎与各信瘸簧素之闯更多是 摹线援以及关袋关系。( 3 ) 实际数据显示,这种方法只能在一定置信区间上做出评价,准确性不 高。这样,缺少科学的个人信用评估技术成为我国商业银行消费信贷 业务发袋鞠魏焱。 在西方圈家,普遍采用定量分析的个人信用评估方法来评价个人 客户的信用:状况,应用数据挖掘技术建立信用评估模型。数据挖掘是 2 匿纪孽0 年代后袈久王智麓和数纛瘁领域兴起盼一种数据处蹬窝翔 识发现( k d d ) 理论,是从大量的、不完全的、有噪声的、模糊的和 随机的实际应心数据中,提取隐含在其中的信息和知识的过程。对数 镞避行分类嚣潆蠢溯是数撅挖掘的 ! 要功隧。数凝挖掘羽,:僖j 露评估的 优势i i 要在r :( 1 ) 能处理和修矿实际数据问题,算法模删具有自榆 验能力,能更准确描述信用要索和信用水平之间的关系特征;( 2 ) 不 先验她建立信耀援剃,瑟是从实倒数据中逐过有整餐学习去发瑷信耀 规则,然后用这些规则去预测新样本的信用风险,更符合解决问题的 科学步骤。数据挖掘中具体应用的建立个人信用评估模型的方法包 括:判剜分析、豳爨分聿厅、k 远邻法、数掌攫划、决策榜法、人= 毒孛 经网络等。 当前,我国个人业务的飞速发展使商业银行积累了一定量的数 据,鹰韭锓行纷纷逐行数据集孛,建立数据仓库,开始应爱数撰挖援 技术建立科学的个人信用评估模型,进面建立完善的个人信用评估机 制,以降低个人信贷业务成本和风险。殿然进行了各种积极的尝试, 毽是我凿镊行垃东个人信用译估模型豹建立帮应耀方面仍处予起步 阶段,对各种方法建立的个人信用评分模型的准确性和适用性的研究 还有待深入。在目前中国个人征信体系不完善,商业银行个人信用信 患不完整熬条件下,翔何建立有一定参考价r f 壹酶个入信爱评估摸型蒌 常有意义。从现有的研究结聚看,还没有致性的结论,有些结论甚 至相互矛盾。本文将对此进行系统研究,并以某商业银行个人信贷数 据为分拆对象,暴耀已有旋数据挖掘算法进行适应憋疆究,壤鬟刿裂 分析法、l o g i s t i c 回归法、k 近邻法、决策树和神经网络分别建立模 型对个人客户进行分类,并比较模型表现。在对个人信用评估模型进 行比较浮价舞,一般应综合考患以下a 个方瑟:模型麓适爱条件,模 型精确度及稳健稔度,模型经济含义解释能力,建横的效率等。对比 结果显示,l o g i s t i c 回归横型是个人信用评估最优模型,该模型的 准确率达劐7 5 以上,诩练样本和确认样本溪判率捆差不丈,模型稳 健性好,易于理解,效率高,推广能力强,是当前商业银行可以采用 的最优模型,值得在实践中摊广。 本文夔醑究方法:采瑷臻论与鼗摄翱结合鼓惑辫,佼嗣定萋分誊厅 的方法,对现有的几种个人信用评估方法进行对比研究。 论文主要分为五章: 第+ 章主要余缨了数蠡挖撼凝念鼓i i 杰个人倍;| 评 壬r | ;的拇 l 。 首先阐述了数据挖搬的基本概念,介绍,数据挖掘的功能和常时技术 以及基本流糕:然后介绍了数据挖掘技术的应用情况及其在商业银行 风险管理方嚣发挥的传耀。 第二章讨论了个人信用评估的基本概念及其发展历程。指出个人 信用评估是对消费信贷中的个人诚实守信的意志和能力做出评价,并 对嚣蔫嚣方黧客滤行凡秽定量方法进行了综述,分缀了这些方法兹基 本原理和前人的研究成聚。最后,分析了国内研究现状,强调了构建 适合我国现状的个人信用评估模型的必要性,指出虽然进行了各种积 辍豹尝试,毽楚我量镊行业在个人信矮评分模型豹建立和应焉方瑟仍 处于起步阶段,对各种方法建立的个人信用评估模型的准确性和适用 性研究还有待深入。本溉的论述为后面进行实证分析奠定理沦基础。 第三章磷究了个人穗雳评估翦熬数据准备| 、薅题。论文磷究艨采矮 的数据是由四川省某商业银行提供的个人客户历史资料数据库的真 实数据,由于建模用的实际数据存在着不完整、不一致、不精确和重 复数据,所以嚣要对其进行疆处璎,本章具体分缮了数据潘洗移转换 的方法和过程;然后,介绍了建模所采用的抽样方法。 第四章应用$ a s 等软件,对样本数据使用判别分析法、l o g i s t i c 瑟 l j 、k 近邻法、决策瓣和神经曩终法具体麴建个久售矮评话模型。 详细介绍了建立模型的过程、算法、判别准则并计算了训练样本和确 认样本的总体误判率及两类错误率。 第五耄对筹霆章中所建立的几种模型进行评位和魄较。分析结果 认为,就本文所使用的数据而言,几种模型建模效果在一定范围内差 别不大。相比较来说,l o g i s t i c 回归模型是个人信用评估最优模型, 蕊得在实黢c | = l 雄广。最焉,提出甍监馒行具体运雳过程中还嚣注意的 几点问题。 本文的主要特点: ( 1 ) 采臻裔监凝行个入信贷真实数据进行实证分析,所建立的 模型更符合现实情况。论文探讨了对有噪声的原始数据进行预处理的 方法和过程,采用适当的手段对数据进行清洗和转换,使其符合建模 昀要求。 ( 2 ) 论史用几种方法对样本数据进行数掘挖掘,找m 客户资信 水平和个人特征信息之间的关系,构建信用评估模型并用于预测。采 磊对魄磺究的方法,对各模型迸 亍评毡跑较。最终联接荐豹模越其有 客观憔强,预测准确高的特点,有较强的信用风险识别能力和预测能 力。 ( 3 ) 本文在逡壤建模方法瞳,采攥了较多的菲参数分析方法, 由于参数分析法建模往往对数据有特殊矮求,如自变量服从正态分布 等,而现实中的数据常常不符合这一假定,非参数法对数据分布没有 特到麴要求,避免了簧绞技术对模型设定黪霾难。本文对毫 参数法在 实际中的应用进行了探讨,为定量分析方法应用予个人信贷风险评估 提供了选择方法和借鉴手段,对加强个人信贷风险蛰理有重要意义。 瓣要指塞的罴,由于所麓收集鞫豹数据有陨;本文对个人信耀靛 评估仅考虑了一些个人基本信息及财务状况,本文只是提供一种分析 问题、建立模型的方法。而在实际业务中,对于个人信用的评价往往 需要翼多豹信惠,囊盐银行霹凭售萁数攥仓摩酶综合信惠获取优势, 为模泌的建立提供更全面的信息支持,在构建模型时,加入其他有价 值的影响因素,同时,在构建成模型之后,还需对模型进行动态调整 蓥正,使英簿会遭务发展的癸求。 关键字:个人信用评估,数据挖掘,判别分析, l o g i s t i c 隧妇,决策瓣 a b s t r a c t t h ep e o p l e :sb a n ko fc h i n ai s s u e dg u i d a n c eo nd e v e l o p i n gp e r s o n a t c o n s u m e rc r e d i ta n ds o m er e l e v a n tc r e d i tp o l i c yi n 1 9 9 9 s i n c et h e n , t h e r eh a sb e e n r a p i dd e v e l o p m e n to ft h ep e r s o n a lc o n s u m ec r e d i t h o w e v e r , t h ec r e d i tr i s kp r o b l e me x p o s e do nt h eb u s i n e s sh a st h r e a t e nt h e d e v e l o p m e n to fc o n s u m ec r e d i tm a r k e t a g a i n s tt h i ss i t u a t i o n ,i ti sa n u r g e n tt a s kt of o r mas o u n dc r e d i tr i s km a n a g e m e n tm e c h a n i s m c f e d i t a s s e s s m e n ti st h ep r i m a r yl i n ks h o u l db ep r o p e r l ys o l v e d a tp r e s e n tc h i n al a c k sa r e l a t i v e l ym a t u r e dc r e d i ts y s t e m i ti s d i f f i c u l tf o rb a n kt oe v a l u a t et h e c r e d i ts t a t e so ft h ep e r s o n a lc l i e n c s a c c u r a t e l y t h et r a d i t i o n a lm e t h o d sh a v em a n ys h o r t c o m i n g ss u c ha s s u b j e c t i v i t y , a p r i o r i t y t h e ys o m e t i m e sd i s t o r tt h er e a l r e l a t i o n s h i p b e t w e e nc r e d i ti n d i c a t o r sa n dt h ec r e d i tl e v e l i nw e s t e r n c o u n t r i e s ,b a n k s g e n e r a l l ya d o p tp e r s o n a lc r e d i t a s s e s s m e n tm e t h o do fq u a n t i t a t i v ea n a l y s i st oe v a l u a t ec r e d i tc o n d i t i o n s o fp e r s o n a lc l i e n t sa n dd e v e l o pc r e d i ta s s e s s m e n tm o d e lb yd a t am i n i n g t e c h n o l o g y d a t am i n i n gi sd e f i n e da st h en o n t r i v i a le x t r a c t i o no fi m p l i c i t , p r e v i o u s l yu n k n o w n ,a n dp o t e n t i a l l yu s e f u li n f o r m a t i o nf r o md a t ao r k n o w na s k n o w l e d g e d i s c o v e r yi nd a t a b a s e s ( k d d ) t od ot h i s ,d a t a m m m gu s e sc o m p u t a t i o n a lt e c h n i q u e sf r o ms t a t i s t i c s ,m a c h i n el e a r n i n g a n dp a t t e r nr e c o g n i t i o ns u c ha sd i s c r i m i n a t ea n a l y s i s ,r e g r e s s i o nm e t h o d , m a t h e m a t i c a lp r o g r a m m i n g ,d e c i s i o nt r e e ,k n e a r e s tn e i g h b o r ,a r t i f c i a l n e u r a ln e t w o r ke t c a l t h o u g hm a n yp o s i t i v ea t t e m p t sa r ed o n e ,t h ed e v e l o p m e n ta n d a p p l i c a t i o no fp e r s o n a lc r e d i ta s s e s s m e n tm o d e li nc h i n e s eb a n ki n d u s t r v i ss t i l li ni t s i n f a n c y t h er e s e a r c h o fa c c u r a c ya n da p p l i c a b i l i t vo f d i f f e r e n tm o d e l sa l s or e q u i r ei n d e p t h s t u d y a tp r e s e n t ,c h i n e s ep e r s o n a l c r e d i t r a t i n gs y s t e mi si m p e r f e c ta n dt h ep e r s o n a lc r e d i ti n f o r m a t i o no f c o m m e r c i a lb a n k si ss t i l li n c o m p l e t e u n d e rs u c hc i r c u m s t a n c e s i ti s v e r y m e a n i n g f u lt od e v e l o pam o d e lt h a th a sr e f e r e n c ev a l u et ot h ep r a c t i c e t h e r ea r en o tc o n s i s t e n tc o n c l u s i o n so fe x i s t e dr e s e a r c h e s 。e v e ns o m eo f t h e ma r ec o n t r a r y i nt h et h e s i s d i f f e r e n tm e t h o d s a p p l y i n g t o p e r s o n a l c r e d i t a s s e s s m e n ta r es t u d i e d ,t h em e t h o d sa r e c o m p a r a t i v e l ys t u d i e db yu s eo f e x p e r i e n t i a ld a t a + t h ee x p e r i m e n t a la n a l y s i ss h o w st h a tt h el o g i s t i c r e g r e s s i o nm o d e li st h em o s ts u i t a b l em o d e lw h i c hi sm o r es t a b l e t h a n o t h e rm o d e l s ,a n di t sf o r e c a s t i n ga c c u r a c yi sh i g h e r t h i st h e s i si sm a i n l yd i v i d e di n t of i v e 。c h a p t e r s : 。 c h a p t e ro n ei n t r o d u c e s d a t am i n i n gt h e o r ya n di t sa p p l i c a t i o n si n c r e d i ta s s e s s m e n t 。f i r s t l y , i te x p l a i n st h eb a s i cc o n c e p to fd a t am i n i n g i t t h e ni n t r o d u c e st h ef u n c t i o no fd a t a m i n i n ga sw e l la s t h em e t h o d s s u b s e q u e n t l yi td i s c u s s e st h eb a s i cp r o c e d u r eo fd a t am i n i n g f i n a l l y , i t d i s c u s s e sd a t am i n i n ga p p l i c a t i o n s 。d a t am i n i n gt e c h n o l o g y p l a y sa n i m p o r t a n tr o l ei nc o m m e r c i a lb a n kr i s km a n a g e m e n t c h a p t e r t w od i s c u s s e st h eb a s i c c o n c e p t o f p e r s o n a l c r e d i t a s s e s s m e n ta sw e l la si td e v e l o p m e n th i s t o r y p e r s o n a tc r e d i ta s s e s s m e n t i st oj u d g et h ec r e d i t w o r t h i n e s so fac r e d i ta p p l i c a n t i nw e s t e r nc o u n t r i e s , t h em e t h o do f q u a n t i t a t i v ea n a l y s i s i si n w i d e l y u s e t h ew r i t e r s u m m a r i z e ss e v e r n l p o p u l a rm e t h o d sa n dt h em a i na c h i e v e m e n t so f p r e d e c e s s o r si nr e c e n ty e a r s i ti sn e c e s s a r yt om a k ead e e p e rr e s e a r c hi n d e v e l o p i n g m o r ea c c u r a t ea n dm o r es u i t a b l em o d e l sf o ro u rp r a c t i c e c h a p t e rt h r e e d i s c u s s e st h e p r o b l e m o fp r e p a r i n gd a t ab e f o r e d e v e l o p i n gm o d e l s t h ed a t au s e di nt h et h e s i si sr e a ld a t af r o mp e r s o n a l c l i e n t h i s t o r y i n f o r m a t i o nd a t a b a s ew h i c hi s p r o v i d e db yc e r t a i n c o m m e r c i a lb a n ki ns i c h u a n p r o v i n c e t h ep r a c t i c a l d a t ai n c l u d e i n c o m p l e t e ,i n c o n s i s t e n t ,i m p r e c i s eo rr e p e a t e dd a t a ,t h u sd a t ac l e a na n d d a t at r a n s f o r ma r en e c e s s a r y t h e n ,i nt h ee n do ft h i sc h a p t e r , t h ea u t h o r i n t r o d u c e st h es a m p l i n gm e t h o du s e di nt h et h e s i s 。 w i t ht h ea i do fr e a lp e r s o n a lc l i e n t sd a t aa n ds a s s o f t w m e ,c h a p t e r f o u rd e v e l o p sp e r s o n a lc r e d i ta s s e s s m e n tm o d e l sb yu s i n gt h ef o l l o w i n g m e t h o d s :d i s c r i m i n a t ea n a l y s i s ,l o g i s t i cr e g r e s s i o n ,k - n e a r e s tn e i g h b o r , d e c i s i o nt r e e ,n e u r a ln e t w o r k t h ew r i t e ri n t r o d u c e st h ep r o c e d u r e si n d e t a i l sa n dc a l c u l a t e st h et o t a lm i s c l a s s i f i c a t i o nr a t ea n dt h et w ok i n d so f m i s c l a s s i f i c a t i o nr a t eo ft r a i n i n gs a m p l ed a t aa n dv a l i d a t i o ns a m p l ed a t a f o re a c hm o d e l c h a p t e rf i v ec o n c e n t r a t e so nt h ea s s e s s m e n ta n dc o m p a r i s o no ft h e s e v e r a lm o d e l sd e v e l o p e di nt h ep r e v i o u sc h a p t e r t h er e s u l ti st h a tt h e l o g i s t i cr e g r e s s i o nm o d e li st h eb e s tm o d e lw h i c hi sw o r t h yo fp r o m o t i n g i nt h ep r a c t i c e m o r e o v e r ,i nt h ee n do ft h i sc h a p t e r , t h ea u t h o rp u t f o r w a r ds e v e r a li s s u e sw h i c hs h o u l db ep a ya t t e n t i o n od u r i n gt h e a p p l i c a t i o n t h et h e s i sh a ss o m en e wi d e a s : ( 1 ) t h et h e s i su s i n gt h e r e a l p e r s o n a l c r e d i td a t at o e m p i r i c a l a n a l y s i s i td i s c u s s e st h ep r e t r e a t m e n tm e t h o d sa n dp r o c e d u r eo fr e a ld a t a ( 2 ) t h et h e s i su s e ss e v e r a lm e t h o d st os a m p l ed a t ai no r d e rt of i n d t h e r e l a t i o n s h i p b e t w e e nc l i e n t s c r e d i tl e v e la n dc l i e n t s i d e n t i t y i n f o r m a t i o n t h e nc o m p a r a t i v es t u d yo fm e t h o d si su s e dt oa s s e s st h e m o d e l s t h ef i n a lm o d e lr e c o m m e n d e di so b j e c t i v i t ys t r o n g ,a c c u r a t e f o r e c a s t so fh i g hc h a r a c t e r ( 3 ) t h et h e s i s u s e sm a n yn o n p a r a m e t r i ca n a l y s i sm e t h o d s t h e s e m e t h o d sh a v en os p e c i a lr e q u i r e m e n t sf o rd a t ad i s t r i b u t i o n ,s ot h e yc a n a v o i dt h es e t t i n gd i f f i c u l t yo ft r a d i t i o n a lm o d e l 。t h et h e s i sd i s c u s s e s a b o u tt h e s ea n dp r o v i d e sa l t e r n a t i v em e t h o d sa n dr e f e r e n t i a lm e a n s w h i c hm a yb eh e l p f u lf o rp e r s o n a lc r e d i tr i s km a n a g e m e n t k e yw o r d s :p e r s o n a lc r e d i ta s s e s s m e n t ,d a t am i n i n g , d i s c r i m i n a t ea n a l y s i s ,l o g i s t i cr e g r e s s i o n , - d e c i s i o nt r e e 嚣南财经大学 学位论文原创性及知识产权声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论 文不含任何其钝个人或集体已经发袭或撰写遥的律晶藏采。对本文薛 研究做出重鼹赏献的个人和集体,均已在文中以明确方式标明。因本 学位论文引起的法律结聚完全由本人承担。 本学位论文成暴归嚣海黠经大学所有。 特此声明 学位论文作者签名:刘征 2 0 0 6 年4 霜1 9 基 前言 在全蘑建设小康社会的战略指导下,我国居民收入增长将继续保 持一个鞍高的速度,居民的消费能力有了较大的增长,传统懿先储蓄 后消费躺生活观念也有了更新,越来越多的居民接受了贷款消费的新 褒念。我国鲍消费信贷市场目前正处于从成长到高遴发展的时期,从 1 9 9 9 年的7 2 6 3 亿元,虱2 0 0 3 年底已达1 5 7 3 6 亿元的规模,缀短5 年增长了2 1 倍多。同时,对于银行来说,零售银行业务有利于分散 风险,提高银行经蘩稳定性,隧着商业锻霉亍竞争意识和风险意识的增 强,个人信贷业务被提升到了镊行的战略高度。截止2 0 0 4 年6 月末, 境内全部金融机构个人消费信贷余额1 7 9 5 2 亿元,占同期全部金融机 梅各项赞款余额鲍l o 6 。与发达国家滚费信贷比例( 2 0 一4 0 ) 相 比,仍有很大瀚发震潜力。 我国商业银行的个人信贷业务仍处于起步阶段,制约其发展的一 个重要豳素就是信嬲风险管莲裰对落后,与发达国家的信鼹风险辫理 相比,差距具体表现在四个缺乏上,鄹缺乏完善的信用立法、缺乏信 用管理的社会服务机构、缺乏全面有效的信用评估、缺乏完善的数量 分砉蜃手段以支持信贷决策,正楚由于这靼个缺乏铡约了我国齑业键行 个入信贷业务成本和风险的降低。 近年来,党中央、国务院高度重视社会信用体系建设,加快信用 立法进程,逐步栽范授信桃梅、鬣信枫构艇行为,铡定对失信行为惩 罚和修复标准,保护授信人的合法权益和进行信用宣传教育,敌藩信 用环境。加快了全网统一的企业和个人信用信息基础数据库建设。由 中基久民银行牵头建设的个人信f j 基秘数据摩已予2 0 0 6 年起实现在 全国商业银行的联嘲运行。对予商业银行来说,不麓坐等市场环境的 改善,应积极改进控制信用风险的方法。h 前,我圈银行耐个人客户 信用状况的评份,主要采翊等级谔分与专家评分矧结余的矗法,萼蟹窑 j :,的l 。i 然状况、职业状况、与银行关系等方而的指标的町能取值分成 不同的级别,对不闸的级别赋值,通过专家对每个指标的各个墩值的 评级来确定最终酶指标评分终袋。这嚣方法主观缝较强,浮定结粟与 客户的真实信用水平存在一定误差。因此,有必要借鉴西方国家成功 经验,使用定量化的评估方法,研究建立适应我国实际情况的个人信 震评估摸型。 本文将采用理论研究结合实证分析的研究方法,采用数据挖掘技 术,使用判别分析法、l o g i s t i o 回归法、k 近邻法、决策树及人工神 经瓣终等方法擒建个入信耀浮佶模型,对客户信爱等级遴霉亍分类、预 测,并对各模型的适用条件,模型精确魔及稳健程度,模型经济含义 解释能力,建模的效率等方面进行对比分析,选择最适合实际业务的 模型,为齑盘银行信褥风险警理提供决策支持。 。 本文从结构上分为五章:第一章介绍了数据挖掘的概念及其在个 人信用风险管理中的应用;第二章介绍了个人信用评估的概念和发展 历史,多拳对禽内井骥究方法和成采送行了综述;篱三肇硬究了个入售 用评估前的数据准备问题;第四章使用判别分析法、l o g i s t i c 回归、 k 近邻法、决策树和神经网络法具体构建个人信用评估模型。第五章 对瑟建立的死耪摸爱遴行评髂和比较著褥毫研究结论窝致篆建议。 第一章数据挖掘及其在个人信用风险管理中熬应用 一、什么是数据挖掘 第一警数据挖掘敲摄念 随着数据库、数据仓库技术靛蓄逮运爱,企盟中积累麓数据大量 增加,在众多数据背后隐藏了很多具有决策意义的信息,人们希望能 够对其进行更离层次的分謇厅,以便更好的利用这些数据。数据挖掘技 术应运两生,并蓬裁发展趣来,越来越显示出强大的生命力。 数据挖掘( d a t am i n i n g ,d m ) 就是从大量的、不完全的、有噪 声懿、模糊的、随枫的实际应用数据中,提取隐含在其中的、人们事 先未稚酸、但又是潜在有瘸的信息和知识的过稷。数据挖掘利用各种 分析工具建立模型和发现数据问关系,这些模型和关系可以用来预 测。这个定义包括好几个层次含义:数据源必须是真实的、大量的、 含噪声的;发现的是用户感兴趣的知识;发现的知识是可接受、可理 孵、可运用的,但不要求发现放之四海皆准的知识,而仅支持特定的 阏题。 二、数据挖掘方法的分类 数据挖撼的模式按功麓可分有两大类:预测性( p r e d i 6 t i v e ) 和 描述往( d e s c r i p ti v c ) 。 描述性模式用于了解某个系统的实际数据存在的特征,其目的是 为预测徽准备。攒述型模式包含了关联( a s s o c i a t i o n ) 模式、序列 ( s e q u e n t i a l ) 模式、聚类( c l u s t e r i n g ) 模式和滤除( d i s t i l l a t i o n ) 模式等。 预测性模式是在搦述分 j i 褥到结鲶的垫捉引:列1 系统的发艇进行 估计,通过预测性分析熊褥到最终需要的结聚,能够为决策者提供矗 接的依据。预测性模式包含分类模式和嘲归模式。分类模式是对某个 事物霹能彗j 属予慕个类裂的糍率遴罨亍瘦燕。回归模式是指预测一个变 量值的变化,与分类模式相似,它们的差别在于分类模式的预测值是 离散的,回归模式的预测值是连续的。 予委溯型模式鬻耀豹数据模型逮括:决策薅( d e c i s i o nt r e e ) 模 型、规贝0 推理模烈和神经网络( n e u r a ln e t w o r k ) 模型。数学模型和 预测的目的不是_ 对应。对于回归型问题,我们可以选择神经网络, 也可以用统计模型,魏l o g i s t i c 回归、镳差分挢、蕊逶线蛙模爱等。 对于分类型问题,我们也可以用神经网络来解决,也可以用决策树做 分类。 三、数攒挖掘酶基本步骤 数据挖掘是一个循环往复的过程,它要从大量数据中不断抽取出 有价彳壹戆信息或知识。麦子每一种数据挖掘技术方法都有垂身懿特点 和实现步骤( 例如,对输入i 输出数据形式的要求不同,模型结构、 参数设置、算法适用领域各囱有不同的要求,模型评价方式存在差 异) ,数据挖提与具体应蘧瀛越密切穗关( 应用数擐挖援瑟要达刭酶 目标、数据收集完整程度、问题领域专家支持程度、算法选择等) , 因此,成功应用数据挖掘技术本身是一件很复杂的嚣情。 蓍先,我 | 、j 需溪定义主题,然后凝搌选择鳇润题建立鼗据挖巍库, 数据挖掘库中的信息可以从数据仓库中掇取,也可以从外部数据源直 接获取。建立数据挖掘库后,对数据进行预处理,以改善数据质量, 提高萁惹数据挖掇过程的精度翻性麓。隧后,逶过削建一拿或多个数 据表进行抽样,使所抽样本数量既要大的足以包含有实际意义的信 息,同时又不至于大到无法处理。然后,通过对数据进行深入探察以 发聚隐藏在数据中预期昀或寒被预鬻的荚系及异常,麸丽获褥对攀携 的理解和概念,拟定初步的数据模型,这包括建啻:、选择变量,转换 变量及对数据进行修改等。在模型初步建立后需要对摸,娌的实用性和 珏j 靠。陵进行评。感,翔巢模型和交际系统鸯较天的溪参,舞l 摸! 疆需要重 新修改,南剑模鹊和实际系统比较接近再对模:j i i 1 , l j 行解释,) v f 41 为辅 助决策信息传递给管理人员。流程见图1 。 幽1 数据挖捌的基本过程 第二节数据挖搦在个人傣雳风险管理中的应焉 数据挖掘技术从一开始就是面向应用的。目前,在很多蓬要的领 蠛,数据挖攘都可以发耀积摄浞透翁作耀。茏其是在翔鼗行、电信、 保险、交通、零售等商业应用领域。数据挖掘能够帮助解决许多典型 的商业问题,其中包括:数据库营销( d a t a b a s em a r k e t i n g ) 、客户群 薅划分( c u s t o m e rs e g m e n t a t i o n ) 、背豢分折( p r o f i l ea n a l y s i s ) 、交叉 销售( c r o s s s e l l i n g ) 等市场分析行为,以及客户流失性分析( c h u m a n a l y s i s ) 、客户信用评分( c r e d i ts c o r i n g ) 、欺诈发现( f r a u dd e t e c t i o n ) 熊 。 w # 在银行领域,控制信贷业务所带来的信用风险直是商业银行最 为关注和棘手的问题。为了保证最大的利润和最小的风险,既鼓励和 隽便客户贷款与透支,又逶免坏帐盼。t 并,齑监镁行在放贷之前,应 根据客户历史信贷资料,客观、全面、准确地评估客户的还款能力和 还欺意愿。k 期以来,1 街, l k 钺行使川传统人1 对个人倍川进行评估, 书仅效率低f 两益准确憾依赖鲎务久英的主魂判鞭。数攥挖瓣技术的 出现,由于其可为银行进行个人信用风险控制提供客观、准确的评估 亵控镂枫裁,因此已或为各麓监键行风险管理中鹃“宠l ”。 利用数据挖掘技术,各商业银行的个人信用管理模式由定性逐步 走向定量化,通过科学地强化对信贷客户的信用评估、风险度测量、 痿赞甄险权重酶篱理,有效圭瞧防范亵控割贷款风险。蘑霹;实襞对不 良贷款的严密监控,加大对信贷资金的分析和分类的频率,提商信贷 决策水平。例如,利用有指导学习中的分类算法,银行对已收集的大 量的客户帐户信息进行辩学麴分辑和羯类,著进行信耀评 吉,扶瑟我 出“好”、“差”不同等级的顾客的特征属性,建立信用等级的履示描 述,从而帮助银行建立信用风险防范的第一道防线:新客户的信用审 批。 。 剩用数据挖掘和统计分析方法建立的个人信用评估模型通过对 个人客户的人口特征、信用历史记录和行为记录等大量的数据进行系 统的分析,挖握数摆中蕴淫黪行为模式翻信焉特征,摅捉瑟吏信崽弱 未来信用表现之间的关系,建立预测性的模型,作为个人信贷管理的 决策依据。 总之,商监锻行应耀数键挖掘技拳,是发掘客户瀣源,实时掌握 市场需求,创新金融产品和服务,迅速提高客户满意度和忠诚度,增 强自身盈利能力的利器。特别是在消费信贷和信用卡业务飞速发展的 薅况下,数据携撼应矮予客户选择与分类,这对控镶风险,提高蕴稳 能力,促进消费具有重要作用。 第二章个人信用评估方法 第一节个人信用评估的概念和发展历史 一、信用:个人倍用翻个人信用评估的概念 根据瑷代经济学理论,“信耀”( c r e d i t ) 是一个经济学词汇,耀 于接述枣场交易中的借贷关系,从属予齑鼎和货币关系的经济范赡。 在市场交易活动中,信用是一种建立在信任基础上的能力,就是不用 立即付款便可以获得资金、物资、服务的能力。这种能力受到一个条 件的约浆,帮受傣人( c r e d i tr e c e i v e r ) 在其应允的时闯期限露为所获 缛昭资金、物资、服务等付款,有时还包括为应付款支付剥慰,露这 个还款时间期限必须德到提供资金、物资、服务的授信人( c r e d i t g r a n t o r ) 的认可。1 信用按照参与主体的不同可分为个人信用和企业信梢。企业信用 是参与主体为金韭的信焉活动,企业信焉不是本文所讨论的对象,这 里不再赘述。个人信爆是掺信用的参与主体中至少有一方为个人的信 用活动。因为个人的行为特征与企业的行为特征有很大的不同,所以 对个人信用的讨论必须充分考虑个人的行为特征。按照上述对信用的 解释,个人信用即是个人与银行之闻,以满足个人生活消费需要、提 高生活水乎为磊斡,建立在诚实守信基础上麓心里承诺与约麓实戥耀 结合的慧志和能力。2 薅要说明的是,这里对个人信用的定义是狭义 的,从广义上讲,个人信用还应该包括个人与企业之间的赊销信用和 个人与银行之间的个人投资贷款,凶这两粪个人信用与论文的讨论没 有赢接的关系,而其自身又有一定的特殊性,所以这里将这两类个人 王争q,粤。宽 ? m i 、01 i ! 瞧 。 n | 薹晡 j 个 n 叶 伊鼹 t +二登i 荽睹 疏,i业羔兰允计路,缡筚峨乍昀举株滗 信用排除在外,本文以个人与商业银行之间的直接以满足个人消费需 要为目的的消费贷款中涉及酶个人信甭为研究对象。 蛰上襞述,个人偿爆是指消赞者与亵业银行之闻以满足个人消费 需要为目的的、建立在诚实守信基础上的心理承诺与约期实践相结合 的意志和能力。 个人信艏评估p 对消费信贷中的这种个人诚实守信的意志和能 力傲警评价。 二、个人信糟评估的发展历史 个人信用评估实质上是将一个总体按照不同的特征分成若干不 同组的种方法。这种将总体划分成不同的维盼思想在统计学中最早 峦f i s h e r 提出露。d u r a n d 第一个意识鄹可以爝囊样瓣方法来区分“好” 的贷款和“坏”的贷款,从丽对贷款的信用风险进行评份。在当时的 美国,些金融机构及直销公司在信用管理方面遇到了困难。是森给 申请人提供贷款或者提供商品是由信用分析人员对申请人进行分析 和判断以后才散瀣决定。由于当时歪处于在第二次世界大战中,大批 信耀分析人员都参加了军队,信尾分析人员奇缺。因此,这些公司就 组织信用分析人员将他 | 、j 在进行信用分撰时的些基本准则写下来, 供没有经验的分析人员参考使用,这可以说是信用评估领域最早的专 家系统。从那时起,些人就开始尝试将统计方法应用与贷款决策。 最早的此类咨询视梅浚b i l l f a i ra n d e a r l i s a a c 予2 0 谨纪5 0 年代初在 l 基金凼建立舱,其客户大多数是金融枫毒句及直销公司。 2 0 世纪6 0 年代后期,随着信用卡的出现和发展,银行及其他信 用卡发卡机构认识到了信用评估的作用及重要性。由于每天申请信用 卡的人数众多,无论从经济的角度还是从人力的角度,镶行郡不可箍 完全依籁入王封f p 请进行审批,必须有一套蠡动豹信臻谮分系统( 信 用评分是对信用评估的结哭划分值来表示) 。当这些金融机构利用评 分系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论