已阅读5页,还剩73页未读, 继续免费阅读
(数量经济学专业论文)基于数据挖掘技术的信用卡申请评分模型研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 我国信用卡业务在经过缓慢的市场培育阶段后,迎来了快速上升的发展阶段。 各大商业银行受信用卡业务的高额利润和巨大市场空| h j 的吸引,都大力加大信用 卡的发行力度。但高利润必然伴随高风险。如何有效地对新申请客户进行信用评 分,防范信用不良的客户申办信用卡,提高银行预防和抵抗信用卡风险的能力, 是所有银行迫切需要解决的问题。因此,对信用卡申请评分的研究具有重要的理 论价值和实际意义。 本文以某商业银行积累的客户数据为研究对象,采用决策树、l o g i s t i c 回归和 神经网络三种主要数据挖掘技术,利用先进的统计和商业智能软件s a s 分析系统, 建立了一个信用卡申请评分模型,实现了对引起个人信用风险的多种复杂混合因 素一定程度上的定量分析。文章首先系统分析了信用卡业务及数据挖掘的基本理 论,研究了数据挖掘方法在信用卡业务各方面的广泛应用。然后运用决策树、 l o g i s t i c 回归和神经网络三种数据挖掘技术,利用相关数据资料分别建立不同的信 用卡评分模型,并对其优缺点进行了比较评价。最后借助模型聚合方法进一步对 前面各模型进行改进和综合,提高了模型的精确性和稳定性,并最终利用稳健的 模型构建了信用卡申请评分规则,实现了高效、客观、准确和一致地对信用卡申 请者做出信用评估。最终实验结果表明,在没有选择最优阂值的情况下,模型的 整体正确率达到8 8 7 3 ,其中“坏客户”被正确分类的比例为8 3 4 4 ,“好客户”被 正确分类的比例为9 2 0 2 。 本文的创新之处主要体现在以下两个方面: 1 分别采用决策树、l o g i s t i c 回归和神经网络建立不同的信用卡申请评分模型 并进行比较评估; 2 运用模型聚合方法综合三个模型的特点,建立稳健的信用卡申请评分模 型。 关键词:信用卡评分;数据挖掘;决策树;l o g i s t i c l 回归;神经网络;s a s i i 一,呈筌尘丝筌些坠堂尘丝坠坚坠。,一 目一“e 日日o o _ ! ! ! ! ! ! ! ! ! ! ! a b s t r a c t a f t e ral o n gm a r k e tc u l t i v a t i o ns t a g e ,c r e d i tc a r db u s i n e s si nc h i n ah a se n t e r e dt h e r a p i d l yr i s i n gd e v e l o p m e n ts t a g e e v e r yc o m m e r c i a lb a n ki n c r e a s e st h ei n t e n s i t yo f t h ei s s u a n c eo fc r e d i tc a r d s ,a t t r a c t e db yt h eh i g hp r o f i t sa n db i gm a r k e ts p a c ei nc r e d i t c a r db u s i n e s s b u th i g hp r o f i tf o l l o w sh i g hr i s k 。i ti sa l lu r g e n ti s s u et od oc r e d i ts c o r i n g e f f e c t i v e l yf o rn e wa p p l i c a n t s ,w h i c hc a l lp r e v e n tb a dc u s t o m e r sa n dr e s i s tc r e d i tc a r d r i s k s oi ti sm e a n i n g f u lb o t ht h e o r e t i c a l l ya n dp r a c t i c a l l yt os t u d yc r e d i ts c o r i n g t h i sp a p e ru s e st h r e ed a t am i n i n gm e t h o d s d e c i s i o nt r e e 、l o g i s t i cr e g r e s s i o na n d n e u r a ln e t w o r ka n da d v a n c e ds t a t i s t i ca n db u s i n e s si n t e l i g e n ts o f t w a r es a st ob u i da c r e d i tc a r da p p l i c a t i o ns c o r i n gm o d e l ,b a s e do nt h ec u s t o m e rd a t ai nab u s i n e s s b a n k ,w h i c he v e n t u a l l ya c h i e v e st h eg o a lt oa n a l y s et h ec o m p l e xf a c t o r sc a u s e dc r e d i t r i s kq u a n t i t a t i v e l y f i s t l y , w ea n a l y s e t h e t h e o r y i nc r e d i tc a r db u s i n e s sa n dd a t a m i n i n g s y s t e m a t i c a l l y , a n dt h e ns t u d yt h ee x t e n s i v eu s eo fd a t am i n i n gi ne v e r ya s p e c t o f c r e d i tc a r db u s i n e s s t h e nw eu s ed e c i s i o nt r e e 、1 0 9 i s t i cr e g r e s s i o na n dn e u r a ln e t w o r k t ob u i da n da s s e s st h et h r e ed i f f e r e n tc r e d i ts c o r i n gm o d e l sb a s e do nr e l e v e n td a t a i n t h ee n dw ea g g r e g a t et h et h r e em o d e l st oi m p r o v et h ea c c u r a c ya n ds t a b i l i t y , w h i c h e v e n t u a l l ya s s e s st h ec r e d i ta p p l i c a n t se f f e c t i v e l y 、o b j e c t i v e l y 、a c c u r a t e l ya n d c o n s i s t e n t l y 1 1 h ef i n a lr e s u l t ss h o w e dt h a ti nt h ea b s e n c eo fs e l e c t i n gt h eo p t i m a lt h r e s h o l d v a l u e ,t h eo v e r a l lc o r r e c tr a t eo ft h em o d e li s8 8 7 3 ,i nw h i c h 8 3 4 4 o f ”b a d c u s t o m e r s ”a n d9 2 0 2 o f ”g o o dc u s t o m e r s ”a r ec o r r e c t l yc l a s s i f i e d 1 1 1 et w om a i ni n n o v a t i o ni nt h i sp a p e ra r ea sf o l l o w s : 1 u s i n gd e c i s i o nt r e e 、l o g i s t i cr e g r e s s i o na n dn e u r a ln e t w o r k t ob u i l da n da s s e s s d i f f e r e n tm o d e l sf o rc r e d i ts c o r i n g ; 2 b u i l d i n gas t a b l e c r e d i tc a r da p p l i c a t i o ns c o r i n gm o d e lu s i n ga g g r a g a t i n g m e t h o di n t e g r a t e dt h ec h a r a c t e r i s t i c so ft h et h r e em o d e l k e yw o r d s :c r e d i ts c o r i n g ;d a t am i n i n g ;d e c i s i o nt r e e ;l o g i s t i cr e g r e s s i o n ; n e u r a ln e t w o r k ;s a s n i 图3 1 图3 2 图3 3 图3 4 图3 5 图3 6 图3 7 图3 8 图3 9 图4 1 图4 2 图4 3 图4 4 图4 5 图4 6 图4 7 图4 8 图4 9 图4 1 0 图4 1 l 图4 1 2 图4 1 3 图4 1 4 图4 1 5 图4 1 6 图4 1 7 图4 ,1 8 图4 1 9 图4 2 0 图4 2 l 图4 2 2 插图索引 决策树示意图,2 3 l o g i s t i c 回归示意图2 3 神经网络示意图2 4 错分率2 7 l o g i s t i c 函数2 9 一个神经网络3 0 带权重的神经网络3 l 神经网络在训练周期增加时准确度的变化情况3 3 l i f t 图举例3 5 变量分布直方图4 0 缺失值替换及s a s r e p l a c e m e n t 节点设置4 2 决策树数据挖掘流程图“ 决策树节点的设置4 5 决策树输出总结4 5 决策规则图( 部分) 4 6 决策树模型结果l i f t 图与r o c 曲线4 7 决策树模型的预侧准确率4 7 l o g i s t i c 回归数据挖掘流程图4 8 经过筛选进入模型的变量4 9 l o g i s t i c 回归节点的设置4 9 l o g i s t i c 回归结果5 0 l o g i s t i c 模型中各解释变量的相对重要程度5 0 l o g i s t i c 模型中各变量的系数估计值。5 1 l o g i s t i c 模型l i f t 图和r o c 曲线51 l o 西s t i c 模型的预侧准确率5 2 神经网络模型流程图5 2 神经网络结构设置5 3 神经网络训练结果5 3 神经网络训练过程5 4 神经网络各连接权重5 4 神经网络模型l i f t 图和r o c 曲线5 5 v i 图4 2 3 图4 2 4 图4 ,2 5 图4 2 6 图4 2 7 图4 ,2 8 图4 2 9 图4 3 0 图4 3 1 图4 3 2 图4 3 3 图4 3 4 图4 。3 5 神经网络模型的预侧准确率5 5 不同模型在不同数据集上的误差率比较5 7 三个模型在验证数掘集上的l i f t 图和r o c 曲线图5 7 三个模型在测试数据集上的l i f t 图和r o c 曲线图5 7 决策树模型的改进流程图5 8 合并树模型和原树模型结果比较5 9 决策树模型和合并树模型在验证数据集上的l i f t 图和r o c 曲线图5 9 决策树模型和b a g g i n g 模型在测试数据集上的l i f t 图和r o c 曲线图6 0 全体模型合并流程图6 0 合并模型与原先三个模型结果比较6 l 三种模型和合并模型在验证数据集上的l i f t 图和r o c 曲线图。6 l 三种模型和合并模型在测试数据集上的l i f t 图和r o c 曲线圈6 2 根据模型建立评分规则6 2 v i i 形t - ,学何论文 附表索引 表2 1 数据挖掘主要技术1 8 表3 1 混淆矩阵3 4 表3 2 混淆矩阵3 6 表4 1原始实验数据属性3 9 表4 2 数据预处理后的所有变量列表4 2 表4 3 决策规则表4 6 v i i i 湖南大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取 得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何 其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献 的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法 律后果由本人承担。 作者签名: 他老 1 日期:铷7 年月f 2 ,日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被 查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编 本学位论文。 本学位论文属于 1 、保密1 2 1 ,在年解密后适用本授权书。 2 、不保密日。 ( 请在以上相应方框内打“”) 作者签名:阵滞日期田年1 1 月i l 日 导师签名:嘲0 家) 乏 , 日期:1 唧年月f 日 w t ! ! ! ! ! ! ! ! ! ! ! 曼 引言 我国信用卡业务在经过缓慢的市场培育阶段后,迎来了快速上升的发展阶段。 信用卡受理环境不断改善、发卡量和消费金额出现井喷式增长,持卡消费渐入人 心。但与国外整体相比,我国信用卡业务整体上仍处于初级阶段,城市居民人均 信用卡不足一张,未来发展空间巨大。各大银行和发卡机构纷纷看好信用卡业务 的发展,投入大量人力物力进行信用卡市场的“圈地运动”,竞争也趋向白热化。 为了加大发卡量,各发卡银行推出了各种各样的优惠条件,却把风险控制机制的 规范性忽略了。 随着信用卡业务的跨越式发展、同业竞争的不断加剧以及信息技术在银行业 广泛而深入的应用,银行业务的经营理念和经营方式发生了很大的转变。例如, 由于网络技术和电子商务的发展,银行业开始重视数据挖掘、明确客户定位,遵 循“将合适的产品在合适的时间以合适的方式推介给合适的客户”的经营理念。在 信用卡业务风险管理方面,银行业依靠信贷人员的经验进行审批贷款的时代已经 成为过去,纷纷建立以数据挖掘和数理统计分析为基础的业务系统,以信用评分 卡为主导的信用管理模式即将到来。随着时间的推移,信用卡业务积累了大量的 业务数据。如何从中发现有价值的信息或知识便成为银行的一项重要任务,从而 数据挖掘技术应运而生。 数据挖掘是指从大量的、不完整的、有噪音的、模糊的和随机的数据中,提 取潜在、有用的信息和知识的过程。数据挖掘技术借助多年来数理统计、人工智 能及知识工程等领域的研究成果,并构建成独立的理论体系,可以集成数据库、 人工智能、数理统计、可视化、并行计算等技术。目前,信用卡数据挖掘的评分 模型在国外发卡行已经得到普遍应用,在内地信用卡业务快速发展的今天,评分 模型必将对信用卡的健康、快速发展发挥重要的作用。 信用评分实际上是评分技术在信用风险管理方面的应用。它是一种用于个人 信用风险控制的数学模型,即是利用数据挖掘技术对发卡行积累的大量客户历史 数据进行分析,寻找出有关客户信用风险的特征值和规律,建立相应的数学模型, 为新的信用申请者或已有的客户进行风险评估。信用评分的建立是以对大量数据 的统计结果为基础,它具有相当高的准确性和可靠性。在信用卡行业,通常使用 的信用评分模型有四种类型:申请信用评分、行为评分、收益评分和收账评分, 它们分别从不同角度为信用卡业务提供不同的信用风险控制。申请信用评分专门 用于对新申请客户的信用评估。它通过申请人填写的有关身份资料,即可快速、 有效地辨别和划分客户的优劣,防范信用不良的客户申办信用卡,提高持卡人的 幕于数根挖杯技术的竹用卡申请订分模型研究 信用水平,实现信用卡业务风险的事前防范,帮助银行建立第一道信用风险安全 网。 本文旨在研究数据挖掘技术在银行信用卡申请评分模型中的应用。通过对客 户申请信用卡填写的基本信息数据和中国人民银行征信系统信息数据的分析,采 用决策树模型、l o g i s t i c 回归模型和神经网络模型三种主要的数据挖掘技术,利用 先进的统计和商业智能软件s a s 分析系统,建立了一个信用卡申请评分模型,实 现了对引起个人信用风险的多种复杂混合因素定程度上的定量分析。同时借助 先进的模型聚合算法进一步修正前面数据分析过程中可能出现的偏差,使最终的 信用评分标准更为准确和合理,尽量减小各种不确定因素的影响,实现高效、客 观、准确和一致地对信用卡申请者做出信用评估。 本文可以划分为5 个部分。第1 部分介绍信用卡及信用评分的现状和发展, 在信用卡概述的基础上,介绍了信用卡的风险表现,接着阐述了我国发行信用乍 面临的主要风险,提出运用信用评分模型进行信用卡信用风险评估的优势。第2 部分数据挖掘技术概述,主要介绍了数据挖掘的概念,和统计学的联系和区别, 数据挖掘的过程、功能和理论,最后说明了数据挖掘技术在信用卡业务中的应用 和利用数据挖掘技术建立信用卡申请评分模型的基本流程。第3 部分详细研究了 本文实验用到的三种主要数掘挖掘方法的理论、数据挖掘方法的评价标准以及实 验采用的数据挖掘工具一s a s 软件。第4 部分利用三种数据挖掘技术分别建立信 用卡申请评分模型,对4 0 0 多例客户数掘进行详细分析并利用其建立、评估模型。 最后采用模型聚合方法对前面模型进行改进和综合,提高了模型的性能和稳定性, 并最终利用稳健的模型构建了信用卡个人信用评分规则,这部分是本文重点。第 5 部分总结和展望,是对全文的总结。 2 ,一;。,。,垩:耋! :! 圣,。,。,。,。,。, 第l 章信用卡及信用评分的现状和发展 1 1 信用卡及其发展历史 “信用卡”( c r e d i tc a r d ) ,按国际通行惯例上的解释,是指具有循环信贷、转账 结算、存取现金等功能和“先消费,后还款”、无须担保人和保证金、可按最低还 款额分期还款等特点的信用工具和支付手段【1 6 _ 7 1 。在中国银行卡业务管理办法 中,这种国际通用的信用卡被称为“贷记卡”,其与准贷记卡合称“信用卡”。按照 银行卡业务管理办法规定:“贷记卡是指发卡银行给予持卡人一定的信用额度, 持卡人可在信用额度内先消费、后还款的信用卡,准贷记卡是指持卡人须先按发 卡银行要求交存一定金额的备用金,当备用金账户余额不足支付时,可在发卡银 行规定的信用额度内透支的信用卡。”在本文中所讨论的信用卡包括贷记卡和准贷 记卡。 。 信用卡的基本功能:一是信用贷款功能。对于使用信用卡的顾客,在其购物 消费过程中,所支付的费用超过其信用卡存款账户余额时,在规定的限额范围之 内,发卡银行允许持卡人进行短期的透支行为,即透支一定数额的款项,这是发 行信用卡的银行向客户提供的信用贷款。使用贷款后,借款人也不必非要每月定 期还款,可在到期日一次还清所使用的信用额度,也可以采用按月分期付款方式, 当自有资金充足时,也可以偿还大部分甚至全部额度,并不会因提前还款而受罚, 另外,银行还普遍提供免息的优惠。二是支付结算功能。信用卡的持有者凭借信 用卡,在指定的商店、饭店购物和消费之后,无需以现金货币支付各种款项,只 需要递交信用卡进行支付结算。拥有了信用卡,消费者出差旅行、外出购物,就 不用携带大量现金,而仅凭一张信用卡就可以到外地购物、消费或支取现金。 信用卡于1 9 1 5 年起源于美国【1 5 j 。最早发行信用卡的机构并不是银行,而是 一些百货商店、饮食业、娱乐业和汽油公司。美国的一些商店、饮食店为招揽顾 客、推销商品以扩大营业额,有选择地在一定范围内发给顾客一种类似金属徽章 的信用筹码,顾客可以在这些发行筹码的商店及其分号赊购商品并约期付款。信 用筹码便是信用卡的雏形。 1 9 5 0 年,美国商人弗兰克麦克纳马拉在纽约招待客人用餐,就餐后发现忘 带了钱包,十分尴尬,所幸的是饭店允许他记帐。由此麦克纳马拉产生了要设计 一种能够证明身份及具有支付功能的卡片的想法。于是,他与其商业伙伴在纽约 创立了大来俱乐部( d i n e r s c l u b ) ,即大来信用卡公司的前身,并发行了世纪上第 一张以塑料制成的信用卡大来卡。 摹十数据挖 屠拈术的信用卡申请评分横,型研究 1 9 5 2 年,美国加利福尼亚州的富兰克林国民银行作为金融机构首先进入发行 信用卡的领域,由此揭开了银行发行信用卡的序幕。1 9 5 9 年,美国美洲银行在加 利福尼亚州发行了美洲银行卡。此后,许多银行加入其行列。到了上个世纪6 0 年代,信用卡很快受到社会各界的普遍欢迎并得到迅速发展,不仅在美国,而且 在英国、日本、加拿大等国也盛行起来。从上个世纪7 0 年代开始,香港、台湾、 新加坡,马来西亚等地区和国家也开始了信用卡业务。在国际上主要有威士国际 组织( v i s ai n t e r n a t i o n a l ) 和万事达卡国际组织( m a s t e r c a r di n t e r n a t i o n a l ) 两大 发卡组织及美国运通国际股份有限公司( a m e r i c a e x p r e s s ) 、大来信用卡有限公司 ( d i n e r s c l u b ) 、只本国际信用卡公司( j c b ) 三家专业信用卡公司。在各地区还 有一些地区性的信用卡组织,如欧洲的e u r o p a y 、中国的银联、台湾地区的联合 信用卡中心等等。 1 2 信用卡发展现状 国际上,以消费信贷为主要功能的信用卡已经成为十分普遍的个人理财工具。 据统计,美国信用卡超过了1 0 亿张,成年人持卡比例超过8 0 ,信用卡占持卡 人日常支出比例为2 5 :在8 0 0 0 万拥有信用卡的家庭中,末清偿的平均欠款为 6 0 0 0 7 0 0 0 美元,并且只有4 0 的持卡人每月偿清信用欠款而享受免息期待遇, 其余6 0 的持卡人都愿意选择最低还款方式承担贷款利息。在我国台湾地区,共 有6 0 家发卡银行,发卡量超过了2 0 0 0 力张,成年人持卡比例达到6 5 ,信用卡 占持卡人r 常支出的比例为9 ,每月有一半以上的持卡人使用信用额度。与此 同时,信用卡己经成为银行业的重要收入来源,如美国花旗银行,其信用卡业务 收益已经占到全部银行收入的6 0 。美国运通公司下属有三家跨国分公司,其中 7 0 的利润来自属下的美国运通旅游服务公司,信用卡业务每年为该公司创造近 2 0 亿美元的纯收益。 在中国,8 0 年代中期,当信用卡刚走进国门时,遇到的是百姓疑惑的目光和 心情;改革开放刚开始,居民储蓄不多:长期以来信奉“量入为出”的理财观,习 惯了“一手交钱一手交货”;银行卡特约商户比例低,分布不均匀,刷卡很不方便。 随后2 0 多年高速发展,人们生活水平的提高,消费理念和习惯得到提升,市场环 境极大改善,信用卡进入快速增长期,小卡片已成为大银行竞争的个“主战场”。 这是因为在逐渐走向成熟的信用卡环境中,各家银行都看到了信用卡业务的高赢 利性和巨大的市场。2 0 0 3 年更是被誉为“中国信用卡元年”,当年贷记卡发行量超 过历年总和。到2 0 0 3 年底,贷记卡总数达到4 8 0 万张,比2 0 0 2 年增长两倍还多。 截至2 0 0 4 年6 月底,我国发卡机构已有1 1 0 多家,累计发行银行卡7 1 4 亿张, 平均两人一张,小小信用卡2 0 0 3 一年就刷去1 8 万亿元。到2 0 0 6 年9 月,贷记卡 4 发卡量达到了2 6 0 0 多万张,4 年罩发卡量增长了约5 倍。加上2 1 0 0 多力张的准 贷记卡,信用卡累计发卡量有4 7 0 0 多万张。信用卡消费金额也同时出现了大幅度 增长,2 0 0 5 年全年达到了2 1 0 0 多亿元,年增长率超过了5 0 。与此同时,信用 卡贷款余额也迅速增长,截至2 0 0 6 年9 月就已经超过了1 8 0 亿元,与2 0 0 4 年同 期相比增长率超过了4 0 ,占个人消费贷款的比重也达到了l o 左右。所有这些 数据表明,信用卡业务迈上了快速发展的上升通道【1 3 】。 1 3 信用卡风险管理 信用卡风险是指因信用卡无担保循环信贷的产品特性和贷款实际发生的非计 划性、无固定场所、授贷个体多、单笔金额小等特点,导致发卡机构产生损失的 可能性。信用卡业务是金融机构各项经营业务中的一种,因此也存在金融机构固 有的各种金融风险。同时,由于信用卡业务自身的特点,信用卡风险较其他业务 风险更为复杂和特殊,融信用风险、欺诈风险、操作风险、经营风险等多种风险 于一体。可以说,信用卡的发展历程,在一定程度上就是有关风险问题逐步暴露、 风险控制能力逐步增强的过程。 我国信用卡业务发展较晚 1 4 1 ,和其他国家和地区一样,经历了一个从初始阶 段到高速发展的过程。大部分银行在信用卡市场开发初始阶段,虽然经验不足, 都采用非常严格的风险管理政策,目标客户以高端客户群为主,盈利并不是主要 目标,各大银行都试探性发展,尽全力控制风险。但随着业务不断扩展,信用卡 业务进入高速成长期。客户规模迅速扩大,导致客户质量参差不齐,信用风险随 之迅速上升。这个时候是最容易出问题的时候,例如韩国从1 9 9 9 年到2 0 0 1 年经 历了一个非常辉煌的发展时期,但由于其采取了专业化、高负债的发卡机构经营 模式,而监管机构却未能及时建立科学、有效的发卡机构监管体系,结果导致了 2 0 0 3 年的“信用卡危机”。这样的例子还有很多,例如香港在2 0 0 2 年爆发信用卡 危机;台湾在2 0 0 4 年爆发信用卡危机。中国作为一仓后发展的国家,应该以之为 鉴。要加大监管力度,发挥导向作用,促使发卡机构运用先进的计量模型和技术 手段,对审批、帐户管理、催款等各个流程进行科学、有效的管理,把风险控制 在合理范围内,实现风险和收益的最佳平衡,使我国信用卡业务j 顿利过渡到成熟 期。 目前我国银行发行信用卡最主要面临的两大风险: 1 信用风险:在信用评级过程中,由于目前出于竞争等因素考虑,发卡机构 通常采用“免担保”的发卡方式,以吸引潜在持卡人。这很大程度依赖于持卡入的 个人信用来保证信用卡业务的安全性,由于我国尚未建立完善的个人诚信体系, 失信现象往往难以得到惩戒,骗取银行信贷资金的现象频频出现。而信用卡“先消 5 堆十教槲挖掘技术的竹用卡中i 卉计分橙掣研宄 费,后还款”的特点,决定了贷款逾期进入催收阶段才能确定风险损失的程度。滞 后的风险确认给风险控制和管理带来难度。 2 操作风险:一方面在于内部控制的失效。某些发卡机构对于信用卡高风险 特点认识不足,采用激进营销策略,在征信审核方面比较粗放,在不了解客户真 实性下盲目批准发卡;另一方面,交易处理风险。由于信用卡交易处理自动化程 度极高。因而,容易出现由于程序不完善、黑客袭击等。 国内发卡银行所自行构建信用卡的业务系统、信息系统大多尚处于基础建设 阶段。因而,大都缺乏统计分析或商业智能系统,这就增加信用卡操作风险产生。 在信用卡坏账、恶意透支发生之后,往往由于电子化手段发展滞后、止付名单传 递速度慢,自动授权设备不完善,业务管理部门管理的漏洞、特约商户审单不严 等原因,发卡银行损失很大。 因此,为了防范信用卡业务风险,我们必须加大科技力量投入,积极采用先 进的技术和方法。信用卡业务是科技含量非常高的新兴银行业务,是计算机技术、 通信技术发展到一定程度的产物,所以技术力量是推行风险管理理念、实施风险 管理整体方案、提高风险管理效率的根本保障。例如,解决透支问题的关键是建 立现代化的授权交换网络系统和资会清算系统,缩短清算时问和止付周期。发卡 行要加大科技力量的投入和应用,不断完善信用卡的操作程序,建立信用评价机 制、信用动态跟踪机制等,在确保安全的前提下简化操作程序和步骤,提高工作 效率。在建起先进的技术平台基础上,积极借鉴国际同业积累的经验,利用各 种先进的技术和方法来控制信用卡业务风险。国外很多银行都采用了模块化的风 险管理技术,例如根据花旗银行的经验,发卡行应在账户丌立时就采取一系列严 格措施以控制信贷风险,该行首先会对通过电话和邮件提出的申请进行预处理, 然后将申请人数据进行输入传送至负面信息检查系统,即通过数据库中的历史资 料审查申请人是否曾经申请过信用卡、是否曾经有过逾期不付等负面行为。然后 通过自动搜索与征信机构的数据库相联,对申请人进行信用评分,对申请人是否 有过欺诈行为进行检查。并对检查的结果进行核实,以决定是否批准或要求申请 人对担保的信用卡反出价,再对批准的信用卡分配信用额度。国外先进同业的经 验说明,在信用卡业务上,先进技术和手段是确保业务发展和安全性的根本保障, 我国商业银行必须通过现代化的科技手段来控制和防范风险发生。 1 4 信用评分及其发展 信用评分模型是欧美消费信贷管理中广泛应用的技术手段,是银行、信用卡 公司、汽车贷款公司、住房贷款公司、个人贷款公司、电信公司、公共事业公司、 保险公司等涉及消费信用的企业实体最重要的核心管理技术之一。信用评分模型 6 运用先进的数掘挖掘技术和统计分析方法,通过对消费者的人口特征、信用历史 记录和行为记录等大量的数据进行系统的分析,挖掘数据中蕴含的行为模式、信 用特征,捕捉历史信息和未来信用表现之间的关系,发展出预测性的模型,以一 个信用评分束综合评估消费者未来的某种信用表现,作为消费信贷管理的决策依 据。如果发展流程科学并掌握正确的应用方法,信用评分模型能给消费信贷管理 人员提供大量的具有高度预测力的信息,帮助管理人员制定行之有效的管理策略, 以较高的精度有效地歼拓市场、控制风险、挖掘收益,实现管理的高效益。 1 4 1 信用评分的发展历史 信用评分实质上是将一个总体按照不同的特征分成若干个不同组的一种方澎2 0 1 。 这种将总体划分成不同的组的思想在统计学中最早是由f i s h e r ( 1 9 3 6 ) 提出的。 d a v i dd u r a n d ( 1 9 4 1 ) 第一个意识到可以用同样的方法来区分“好”的贷款和“坏”的 贷款,从而对贷款的信用风险进行评价。在当时的美国,一些金融机构及直销公 司在信用管理管理方面遇到了困难。是否给申请人提供贷款或者提供商品都是由 信用分析人员在对申请人进行分析和判断以后才作出决定。由于当时正处在第二 次世界大战之中,大批信用分析人员都参加了军队,信用分析人员奇缺。因此, 这些公司就组织信用分析人员将他们在进行信用分析时的一些基本准则写下来, 供没有经验的分析人员参考使用( j o h n s o n ,1 9 9 2 ) ,这可以说是信用评分领域最早 的专家系统。从那时起,一些人就开始尝试将统计方法应用于贷款决策。最早的 此类咨询机构由b i l lf a i r a n de a r li s a a c 于2 0 世纪5 0 年代仞在旧金山建立的,其 客户大多数是金融机构及直销公司。 2 0 世纪6 0 年代后期,随着信用卡的出现和发展,银行及其他信用卡的发卡 机构认识到了信用评分的作用及重要性。由于每天申请信用卡的人数众多,无论 从经济的角度还是从人力的角度,银行都不可能完全依赖人工对申请进行审批, 必须有一套自动的评分系统。当这些金融机构利用评分系统时,它们同时还发现 信用评分系统有着比人工主观判断更好的预测能力利用评分系统后贷款的 违约率降低了5 0 以上( m y e r sa n df o r g y ,1 9 6 3 ) 。1 9 7 5 年及1 9 7 6 年在美国通过的 “公平信用法”标志着信用评分已经被社会所完全接受。 2 0 世纪8 0 年代随着信用评分方法在信用卡领域应用的成功,银行开始将信 用评分方法应用于其他余融产品( 如个人贷款等) ,近几年信用评分方法已丌始在 住房贷款及中小企业贷款中使用。同样地,在2 0 世纪9 0 年代直销市场的快速增 长也使得许多直销公司利用评分方法来改进广告销售中的反应率。在最近这些年 里,信用评分已经开始用于家庭贷款、小型商业贷款、保险申请和续订。 7 早千数槲挖掘技术的竹用卡申请计分樽掣研究 i m 1 4 2 信用评分的分类 信用评分实际上是评分技术在信用风险管理方面的应用。它是一种用于个人 信用风险控制的数学模型,即是利用数据挖掘技术对发卡行积累的大量客户历史 数据进行分析,寻找出有关客户信用风险的特征值和规律,建立相应的数学模型, 为新的信用申请者或已有的客户进行风险评估。 信用评分的建立是以对大量数据的统计结果为基础,它具有相当高的准确性 和可靠性。在信用卡行业,通常使用的信用评分模型有四种类型:申请信用评分、 行为评分、收益评分和收账评分,它们分别从不同角度为信用卡业务提供不同的 信用风险控制【3 3 】。 申请信用评分专门用于对新申请客户的信用评估。它通过申请人填写的有关 身份资料,即可快速、有效地辨别和划分客户的优劣,防范信用不良的客户申办 信用卡,提高持卡人的信用水平,实现信用卡业务风险的事前防范,帮助银行建 立第一道信用风险安全网。 行为评分是通过对现有客户的交易行为进行监控和预测,总结客户的交易规 律,评估客户演变为不良客户从而导致银行发生损失的概率,为银行风险管理部 门提供决策依据,以便在客户变坏以前及时进行风险控制。行为评分模型可用于 信用额度的自动监控和调整以及对坏账的预测。 收益评分是针对可能产生的收益进行计分,按照银行长期积累的数据和客户 的交易习惯,评估客户可能带给银行的收益,从而根据收益调整客户的风险管理 级别,在风险可控的情况下达到收益最大化的目的。一般情况下,收益评分总是 和行为评分或申请评分一起使用。 收账评分是在客户产生了逾期账务或坏账的情况下建立的,它用于预测和评 估对某一笔坏账所采取措施的有效性,例如客户对警告信件或警告电话反映的可 能性。根据预测结果,银行就可以对不同状况的逾期账务采取不同的有效措施进 行处理,从而降低坏账风险,提高回收效率。 不难看出,信用评分模型主要为银行信用风险,尤其是个人信用风险的控制 提供了一个客观、准确的评估和控制机制。以数据统计分析为基础的数据挖掘技 术,能够根据银行的商业政策,通过收集和分析客户的大量行为、信用和背景记 录,归纳总结出”好客户”和”坏客户”的背景特征,包括:年龄、收入、性别、住 房条件、婚姻状况、职业、教育状况等的不同属性,并能准确计算出不同属性值 的客户群所具有的消费能力、还款概率,从而建立起能有效分辨好坏客户的数学 模型,帮助银行树立信用风险防范的第一道防线。对于银行既有的客户,行为评 分模型则能跟踪和监控每个客户的行为、消费和还款数据,并根据相应的模型, 智能化地调整客户的信贷额度,对可能出现的拖欠、坏账提前进行预警。对已经 出现的坏账,由数掘挖掘技术建立的模型则能根据客户的背景、信用纪录,对该 笔坏账的催收成本、回收的概率进行分析计算,帮助银行采取t f 确有效的措施。 1 4 3 信用评分的优势 银行进行消费信贷的审批和管理时,可以依靠业务人员的主观削断和一些初 级的分析来进行,也可以运用先进的数理统计分析,建立信用评分模型作为决策 的依据。相对于主观判断,信用评分模型具备下列好处f 3 6 1 : 1 客观性 信用评分模型是根据从大量数据中提炼出来的预测信息和行为模式制定的, 反应了消费者信用表现的普遍性规律,在实腌的过程中不会因业务人员的主观感 受、个人偏见、个人好恶和情景、情绪等而改变。 2 一致性 信用评分模型在实施的过程中前后一致,任何分支机构、业务人员在任何时 间地点做出的决定,只要用的是同一个模型,其评估和决策的标准就应是一样的。 3 准确性 信用评分模型是依据大数原理和统计技术科学地发展出来的,能够比较准确 地预测消费者某种信用表现的概率。当然,模型的准确性高低与数据的质量、模 型研发人员的技术水平和经验丰富程度密切相关。 4 全面性 在发展信用评分模型时,可以从数据中提炼出大量的具备一定预测能力的衍 生变量,运用一定的统计技术对这些变量进行评估、比较、筛选,最后形成的模 型往往是由代表各个信息维度的多个预测变量所组成,比较全面地评估了消费者 的未来信用表现。 5 效率性 由于信用评分模型可以在计算机系统里自动实施,只要输入相关信息,可以 在几秒钟内得到决策,适用于消费信贷,尤其是信用卡这种业务笔数大、单笔数 额小的产品。如果依赖人工主观地审批成百万上千万的申请审批和账户管理决策, 仅就人工成本和处理速度来讲也是不可取的。 在国外,信用卡行业信息化程度较高,数据库中保留了大量的数据资源,运 用数据挖掘技术建立的各类模型在信用卡业务中的实施非常成功。目前国内信用 卡发卡银行首先利用数据挖掘建立申请评分模型,作为在信用卡业务中应用的第 一步,少部分发卡银行已经用自己的历史数据建立了客户化的申请评分模型。总 体而言,数据挖掘在我国信用卡业务中的应用处于起步阶段。目前,国内信用卡 市场实现数据挖掘的困难在于数据质量问题,难于构建业务模型。随着国内各家 发卡银行已经建立或着手建立数据仓库,将不同操作源的数据存放到一个集中的 萆下数据挖掘技术的竹用卡申请计分模,掣研究 环境中,并且进行适当的清洗和转换。这为数据挖掘提供了一个很好的操作平台, 将给数据挖掘带来各种便利和功能。人民银行的个人征信系统也已上线,在全国 范围内形成了个人信用数掘的集中。在内部环境和外部环境不断改善的基础上, 数据挖掘技术在信用卡业务中将具有越来越广阔的应用前景。 保证数据挖掘成功的有两个关键要素。一是准确的定义所要解决的问题,定 位准确的问题通常会带来最好的回报:二是使用正确的数据,选定所能得到的数 据或者还要从外部购买数据,需要对这些数据做有效的数据整合和转换。那么, 究竟什么是数据挖掘昵? l o 第2 章数据挖掘及其在信用卡行业中的应用 2 i 数据挖掘的界定 为了理解数据挖掘( d a t a m i n i n g ) 的含义【1 1 】,有必要看一下它的字面意思。英 文中挖掘( m i n e ) 就是抽取( e x t r a c t ) ,这个词通常是指从地下抽取隐藏的贵重资源 的挖掘操作。该词和数据之间的联系是:对数据进行深入的研究,目的在于从大量 数据中去发现事先未注意到的额外信息。从科学研究的角度看,数据挖掘是一门 相对较新的学科,主要基于计算科学、市场营销学和统计学等学科的研究。用于 数据挖掘的很多方法来源于两个研究分支,一个是机器学习,另一个是统计学, 特别是多元的计算统计学。 和计算机科学、人工智能相关的机器学习用于发现数据中的关系和规则,这 些关系和规则可以表示成一般规律。机器学习的目的是再现数据生成的过程,允 许分析者从已知数据归纳出新的未知的案例。1 9 6 2 年,r o s e n b l a t t 提出了称为感 知器的第一个机器学习模型,接着神经网络在2 0 世纪8 0 年代后半期得到发展。 与此同时,一些研究者完善了主要用于分类问题的决策树理论,统计学一直用于 建立分析数据的模型并且目前可以用计算机来完成。从2 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年农业设备项目深度研究分析报告
- 2026年中国防水卷材布行业市场前景预测及投资价值评估分析报告
- 系统高可用性设计与实现方案
- 玉柴安特优发动机喷漆线项目环境影响报告表
- 建筑垃圾消纳场绿色施工与低碳排放技术方案
- 以物抵债的合同范本
- 临时股权转让协议书
- 铺货协议商场合同模板
- ppp分包合同范本
- 个人占用土地协议书
- 2025-2030中国金融租赁行业经营动态及前景趋势预测报告
- 核能数字化应用-洞察及研究
- 大学入团考试试题及答案山东
- 内镜护士考试题库及答案 测试卷
- 建筑公司销售管理制度
- 2025年氯化铝铁混合剂项目市场调查研究报告
- 一例肺栓塞患者的护理查房
- 《桂枝香·金陵怀古》
- 线性代数(济南大学)知到课后答案智慧树章节测试答案2025年春济南大学
- 大规模圆覆盖求解-洞察阐释
- 公务车驾驶员安全培训课件
评论
0/150
提交评论