




已阅读5页,还剩101页未读, 继续免费阅读
(计算机软件与理论专业论文)个人信用评估模型比较研究与模型实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
个人信用评估模型比较研究与模型实现 专业:计算机软件与理论 硕士生姓名:赵文纪 指导老师:李磊教授 摘要 当前我国f 在大力加强个人信用制度的建设,个人信用评估是其中一个非常 重要的环节,而个人信用评估的发展趋势是模型化和信息化,因此本文将建立个 人信用评估的量化模型。针对个人信用评估问题,我们探讨了模型建立与实现过 程中的一些问题。模型建立前的数据预处理是提高模型效果必不可少的环节,通 过计算各个评估指标变量的优势率进行了一元探索性数据分析并识别指标变量 与信用类别变量之问的关联性,然后利用这种关联性选取个人信用评估指标,结 果显示它能使标准c - s v m 的分类f 确率提高2 1 1 3 9 个百分点;另外,采用主成 分分析法选取指标,发现后者提高的幅度要稍微好一些,达3 2 3 6 2 个百分点, 但两者提高的幅度均不是很大。为了进一步提高分类效果,我们采用k n n 法对样 本集中的异常数据进行了清洗,发现经过清沈后标准c - s v m 的分类j 下确率有很大 幅度的提高,达7 9 2 1 3 5 个百分点。在数据预处理的基础上,我们分别采用b p 神经网络、小波神经网络和支持向量分类机方法建立个人信用评佶的分类模型, 并测试了它们在数据预处理各个阶段的分类效果,从实验结果来看,支持向量分 类机的效果均是最优的,而且它还能很好地处理两类误分代价不同的情况,具有 很好的灵活性。在所建立的支持向量分类机模型的基础上,采用保序回归的方法 求出违约概率并将其转换成信用分数,这为我们提供了计算个人信用分数的另一 种途径,而信用分数是确定信贷政策的一个十分重要的依据。最后,我们将所建 立的模型实现为一个可操作的原型系统个人信用评估系统。该系统为两层 a s 结构,w i n d o w s 界面。除了c s v m 算法作为核心算法外,数据预处理的各 种算法也会作为辅助算法提高系统的评估效果。 关键字:个人信用评估,优势率,主成分分析,b p 神经网络,小波神经网络, 支持向量分类机,保序回归,违约概率,信用分数 c o m p a r a t i v er e s e a r c ha n di m p l e m e n t a t i o no f p e r s o n a lc r e d i te v a l u a t i o nm o d e l m a j o r :c o m p u t e rs o f t w a r ea n dt h e o r y n a m e :z h a ow e n j i s u p e r v i s o r :p r o f e s s o rl il e i a b s t r a c t n o wo u rc o u n t r yi st r y i n gt ob u i l d i n gp e r s o n a lc r e d i ts y s t e mh a r d l y , p e r s o n a lc r e d i t e v a l u a t i o ni so n eo ft h ev e r yi m p o r t a n tl i n k s ,b u tt h ed e v e l o p m e n tt r e n do fp e r s o n a l c r e d i te v a l u a t i o na r em o d e l i n ga n di n f o r m a t i o n i z a t i o n ,s ot h i sp a p e rw i l lc o n s t r u c ta q u a n t i f i c a t i o n a lm o d e lf o ri t f o rt h ep e r s o n a lc r e d i te v a l u a t i o np r o b l e m ,w ed i s c u s s s o m ep r o b l e m si nt h ep r o c e s so fm o d e lc o n s t r u c t i n ga n di m p l e m e n t a t i o n t h ed a t a p r e p r o c e s s i n gb e f o r eb u i l d i n gm o d e li s a na b s o l u t e l yn e c e s s a r yl i n kf o ri m p r o v i n g m o d e le f f e c t b yc o m p u t i n gt h eo d d sr a t i oo fe v e r yi n d e xv a r i a b l e ,w em a k eu n i t a r y e x p l o r a t o r yd a t aa n a l y s i sa n di d e n t i i yt h er e l e v a n c yb e t w e e ni n d e xv a r i a b l e sa n d c r e d i t c a t e g o r yv a r i a b l e ,a n dt h e nc h o o s et h ep e r s o n a lc r e d i te v a l u a t i o n i n d e x v a r i a b l e sa c c o r d i n gt ot h e r e l e v a n c y t h e r e s u l ts h o w st h a ti tc a nm a k et h e c l a s s i f i c a t i o na c c u r a c yo fs t a n d a r dc s v mi m p r o v e2 ,1 1 3 9p e r c e n t s ;i na d d i t i o n , u s i n gp c am e t h o dt oc h o o s ei n d e xv a r i a b l e s ,i ts h o w st h a tt h ei m p r o v e m e n to ft h e l a t t e ri sal i t t l e h i g h e r t h e nt h ef o r m e r ,w h i c hr e a c h e s3 2 3 6 2 p e r c e n t s ,b u t i m p r o v e m e n t sf o rc l a s s i f i c a t i o na c c u r a c yo ft h et w om e t h o d sa r en o t t o oh i g h t o f u r t h e ri m p r o v ec l a s s i f i c a t i o ne f f e c t ,w ea d o p tk n nm e t h o dt oc l e a nt h eo u t l i e r si n s a m p l e s ,i tr e v e a l st h a tt h ec l a s s i f i c a t i o na c c u r a c yo fs t a n d a r dc s v mc a nb eh i g h l y i m p r o v e d ,w h i c hr e a c h e s7 9 2 1 3 5p e r c e n t s b a s e do nt h ed a t ap r e p r o c e s s i n g ,w e a d o p tb pn e u r a ln e t w o r k ,w a v e l e tn e u r a ln e t w o r ka n dc - s v mm e t h o d st oe s t a b l i s h 譬c l a s s 谢c a “o n m o d e l o f p e r s o n a lc r c m h v a l u 8 硒n r c s p e c t i v e l 弘a n 嘲m c i r c l a s s i f i c a t i o ne f f e c ti n e v e r yp h a s eo fd a t ap r e p r o c e s s i n g t h ee x p e r i m e n tr e s u l t s s h o wt h a tc s v mi st h eb e s t ,a n dc - s v mc a ns u c c e s s f u l l yr e s o l v et h es i t u a t i o ni n w h i c ht w om i s c l a s s i f i c a t i o nc o s t sa r ed i f f e r e n t ,s oi th a sv e r yg o o df l e x i b i l i t y b a s e d o nt h ec s v mc l a s s i f i c a t i o nm o d e l ,w ea d o p ti s o t o n i cr e g r e s s i o nm e t h o dt oc o m p u t e t l t h ep r o b a b i l i t yo fd e f a u l ta n dt r a n s f o r mi tt oc r e d i ts c o r e ,w h i c hg i v eu sa n o t h e r a p p r o a c ht oc o m p u t ec r e d i ts c o r e ,a n dc r e d i ts c o r ei s av e r yi m p o r t a n tb a s i so ff o r m a k i n gc r e d i tp o l i c y f i n a l l y ,w ei m p l e m e n tt h em o d e lt oa no p e r a b l ep r o t o t y p e s y s t e m - - p e r s o n a lc r e d i te v a l u a t i o ns y s t e m t h es y s t e mi sat w ol a y e rc ss t r u c t u r e u s i n gw i n d o w sf o r m si n t e r f a c e ,b e s i d e sc s v ma l g o r i t h mi s u s e da st h ec o r e a l g o r i t h m ,t h ed a t ap r e p r o c e s s i n ga l g o r i t h m sa r ea l s ou s e da sa u x i l i a r ya l g o r i t h m st o i m p r o v et h ee v a l u a t i o ne f f e c to ft h es y s t e m k e yw o r d s :p e r s o n a lc r e d i te v a l u a t i o n ,o d d sr a t i o ,p r i n c i p l ec o m p o n e n ta n a l y s i s ,b p n e u r a ln e t w o r k ,w a v e l e tn e u r a ln e t w o r k ,s u p p o r tv e c t o rc l a s s i f i c a t i o n m a c h i n e , i s o t o n i cr e g r e s s i o n ,p r o b a b i l i t yo fd e f a u l t ,c r e d i ts c o r e i i i 山大学硕十学位论文第章绪沦 第一章绪论 2 0 0 6 年1 月1 6f 1 ,中国人民银行宣布全国统一的个人信用信息基础数据库 于2 0 0 6 年1 月f 式运行。这一数据库目前己收录的自然人数已达到3 4 亿人, 其中有信贷记录的人数约为3 5 0 0 万人。到2 0 0 5 年底,收录个人信贷余额2 2 万 亿元,约占全国个人消费信贷余额的9 7 5 。人民银行副行长苏宁在新闻通气会 上说,有无健全的征信体系,是市场经济是否走向成熟的重要标志。个人信用信 息基础数据库的运行,是我国企业和个人征信体系建设中一件大事,标志着这项 工作迈出了重要的一步。由此可见,我国已经丌始紧跟发达资本主义国家的步伐, 逐步建立起完善的个人信用制度。 市场经济是一种法制经济,也是一种风险经济,归根到底是一种信用经济。 因此,在市场经济发达的西方国家,信用是一个人在社会中生存的“通行证”, 也是个人经济行为能够顺畅进行的根本保障,常常被人称为涉足经济社会的箔二 张“身份证”。在美国,较为正规的个人信用市场最早可以追溯到2 0 世纪初期。 完善的个人信用制度已成为发达国家市场经济f 常运行的坚实基础。而在我国, 个人信用制度的建设起步却比较晚,它是在“九五”末期国内市场出现疲软、内 需不足的形势下提出并开始实施的。直到2 0 9 0 年7 月,上海个人信用联合征信 服务系统正式丌通,标志着我国个人信用制度的建立迈出了第一步。在2 0 0 1 年 底举行的中央经济工作会议上,江泽民同志指出:“要在全社会强化信用意识, 加强诚实守信的道德教育”;在中华人民共和国国民经济和社会发展第十个五 年计划纲要中也提出要“在全社会强化信用意识,整肃信用秩序,建立p “格的 信用制度”。这些都表明,我国政府加大了对信用体系建设的重视程度。同时, 这也是我国在加入w t o 后,为了加快与国际市场经济的接轨必须重视的一个问 题。 而个人信用制度建立过程中的一个重要环节是个人信用评估问题,这也正是 本文要研究的问题。下面,本章将会介绍个人信用评估中的相关概念,个人信用 评估的历史与现状,接着简单讨论一下个人信用评估中常用到的方法,最后说明 一下本文研究的背景与意义,整篇论文的内容与结构安排。 山大学顺十学位| 文 1 1个人信用评估的相关概念 1 】1 信用、个人信用、个人信用制度、个人信用评估等p 邯i ( 1 ) 信用 信用是一种建立在互相信任基础上的能力,即不用立即付款就能获得资金、 物质和服务的能力。这种能力以受益方在其应允许的时问期限内为所获得的资 金、物资和服务而偿还的承诺为条件。这个时间期限必须得到提供资金、物资和 服务的一方即授信方的认可。这种交易过程天生就蕴含着一定程度的风险一客户 信用风险。在商品交换和货币流通存在的条件下,债权人以有条件让渡形式贷出 货币或赊销商品,债务人则按约定的闩期和会额偿还贷款,并支付利息。 对信用分类采取不同的标准会得到不同的结果,但主要来讲,信用可分为公 共信用、私有信用,而私有信用主要有企业信用( b u s i n e s sc r e d i t ) 和个人信用 ( p e r s o n a lc r e d i t l ,以下是夏业良、海闻【4 1 对信用的分类: 表1 】信州的分类 公共信川 中央政府信h j 地方政府信川 银行信h 企业信州 投资信川 产品平| i 商品零售信川 循环信j 4 j 私人信用 零传信川 零售分1 9 | 付款信_ l j 专业服务信h 个人信h j 分期付款贷款 现金信用 单笔贷款 一般川途信川 - 虏地产信_ l f ( 2 ) 个人信用 个人信用即是个人与银行或企业之间,以满足个人生活消费需要、提高生活 水平为目的,建立在诚实守信基础上的心理承诺与约期实践相结合的意愿和能 力。即它包含信用品质和信用能力两方面的含义。 ( 3 ) 个人信用制度 个人信用制度则是指根据居民的家庭收入与资产、已发生的借贷与偿还、信 山大学颁十学位沧文 第章绪沱 用透支、发生不良信用时所受处罚与诉讼情况等,对个人的信用等级进行评估并 随时记录、存档,以便信用的供给方决定是否对其提供信用和提供多少信用的制 度。它使个人不仅单纯根据劳动报酬进行支付,而且也可通过信用方式获得支付 能力。它是整个社会信用制度的重要内容,也是市场经济运行的峰实基础。而在 我国个人信用制度几乎就是空白,因而引发了一系列问题,尤其是在银行的消费 信贷的发展上。消费信贷的事后风险难以控制,银行不得不将大量精力放在贷款 发放前后的风险控制上。因此,个人消费信贷的发展迫切需要建立个人信用制度。 而个人信用制度的建立包括建立个人信用登记制度、个人评估指标体系,个人信 用评估制度、个人信用风险预警、个人信用风险管理和个人信用风险转嫁制度等。 ( 4 ) 个人信用评估 个人信用评估是指通过综合考察影响个人及家庭的内外客观环境,包括经 济、金融、司法、社会、工商税务等过程在内的,使用科学严谨的分析方法,对 个人及其家庭成员的经济履约能力和可信程度进行全面评判与估价,并以一定的 符号或数值表明其信用状况。其功能是通过对以信贷申请书为基础的风险程度进 行数学分析,使信贷决策自动化。 个人信用评估,涉及到个人或家庭的自然信息、信誉信息、行为信息及债务 信息( 个人负债包括短期负债和长期负债) 等,但它涉及到的只是个人( 自然人) 的 部分,或者一个家庭的所有成员,评估内容不是很广。不同于企业评估,它的范 围涵盖了社会的各行各业,是对企业法人的整体评估。个人信用评估一般要经过 评估准备阶段、资料收集阶段、资料处理阶段和等级评定阶段。个人信用评估主 要分为经验式定性信用评估和模型化定量信用评估,但是随着个人信用评估应用 范围的扩大,个人信用评估的工作量越来越大,如果仅仅依靠领域专家进行经验 式定性信用评估,无法满足日益繁重的个人信用评估工作,而且缓慢的评估工作 也会影响它在实际中的应用,如消费信贷,因为这样会延长审批时间。因此迫切 需要能够自动化处理个人信用评估,而模型化定量信用评估正是这一需求下的产 物,它可以利用计算机的快速处理速度,极大地加快整个信用评估的过程,从而 缩短信贷决策的时问。 ( 5 ) 个人信用指标体系 个人信用指标体系是全面反映个人信用风险程度、综合考察个人履行承诺意 3 h 大学顺十学位沦文 愿和能力的各种要素的有机组合。个人信用指标体系是个人信用评分的基础,与 信用f 或违约) 预测模型中的变量紧密联系在一起的,对构建模型的好坏起决定性 的作用。在反映个人信用状况的众多因素中科学地筛选出影响个人信用评分的重 要因素,形成信用评分的指标体系,是合理构建信用评估模型的关键。个人信用 指标分为定性指标和定量指标,定性指标是指无法用数量表示,只能通过文字描 述信用状况某一方面特征的指标,如“婚姻状况”;定量指标是指可以用数量表 示的信用评估指标,如“月收入”。 1 1 2 信用消费【l j 【2 i 信用消费是信用经济下市场中最主要的信用交易形式,表现为商品或服务的 信用销售。信用消费是建立在信用基础上的,即是建立在金融机构、消费品提供 商对消费者个人还款意愿和还款能力信任的基础上的。当前信用消费的主要流行 方式包括信用卡消费、购物卡消费和消费信贷等。从其它发达资本主义国家的信 用消费发展的历史来看,信用消费方式是未来主要的消费方式,也是促进消费增 长,促进经济发展的重要手段。同吲,它也是消费者充分利用自己的个人信用资 源的手段。在信用消费的诸形式中,消费信贷是其中最为重要的一种信用消费形 式。 消费信贷是指消费者在未来收入的基础上提前获取商品和服务,从而满足消 费者当前消费需求的一种融资性活动。根据购买商品的不同,消费信贷可分为: 住房贷款、汽车贷款、助学贷款、装修贷款、大额耐用消费品贷款、旅游度假贷 款等。它在国外已有一百多年的发展历史,在发达国家已是相当成熟的一个行业, 是联系生产制造业、商品零售业、银行保险业和证券业的桥梁。目前,美国是世 界上消费信贷最发达的国家之,其信用制度较为成熟。比较f 规的消费信贷已 有8 0 多年的历史,仅截至1 9 9 8 年底,美国个人住房抵押贷款余额达到4 7 万亿 美元,其他中、短期消费信贷期限5 年以内的余额也达到i 3 万亿美元。我国的 消费信贷市场目前正处于成长到高速发展时期。从1 9 9 9 年的7 2 6 3 亿元计,2 0 0 4 年已达1 5 7 3 6 亿元的规模,短短5 年增长了2 1 倍多,截至2 0 0 4 年1 月,总额已 达1 6 0 9 3 亿元。人均从1 9 9 9 年的5 8 1 9 元增长到2 0 0 4 年的j 2 1 7 7 元,城镇人 均从1 9 1 4 2 元增长到3 0 0 4 4 元。但总体上讲,中国的消费信贷市场发展水平还 比较低。2 0 0 4 年底,消费信贷总额只占到g d p 总额的1 3 多一点,按流量的购 山大学硕十学位沧立 第卓绗沦 买力计,当年新增的消费信贷只占全社会消费品销售额( 包括住房销售) 的9 7 2 ,若剔除住房信贷和住房销售,只占消费品销售额的3 3 7 ,即可估计全社 会还有9 0 以上的消费品是通过现收现付或储蓄购买。 2 0 0 5 年中国消费信贷行 业研究报告 1 2 个人信用评估及其研究现状 ( 1 ) 个人信用评估的发展 3 1 1 8 0 1 年,世界上最早的征信机构英国征信局在布鲁林克成立。 】8 3 0 年,世界上第一家信用服务公司于在英国伦敦成立,主要从事信用调 查服务,其成立的初衷是向贸易双方提供对方背景和信用信息服务,防止交易双 方相互不信任和诈骗行为,减少交易摩擦,促进交易的顺利进行。 1 8 4 1 年,世界上第一家信用评估机构在纽约设立。信用行业也从单纯调查 阶段进入了信用评估阶段。 随着经济与社会的发展,信用评估的对象范围也扩展到各行各业,信用行业 本身也丌始分工细化,并逐渐分为四大类别的信用机构,一类是商业信用评估机 构,就是传统的信用评估机构,其接受一方委托对另一方的信用状况进行调查、 评估,为委托方决策提供信用信息,邓白氏公司就属于这一类:另一类是个人信 用评估机构,也称之为消费者信用评估机构,其主要工作是收集个人信用信息并 对外提供评估报告,美国著名个人信用局( 益佰利公司) 就属于此类;再一类就 是面对资本市场的债券信用评估机构,也就人们所说的信用评级机构,主要是对 债券发行人或债券的信用强度进行评估,这类机构的主要代表有:穆迪、标准普 尔、惠誉;还有一类是信用认证机构,主要是对各类组织的信用状况和信用管理 情况是否符合某种公开的标准进行判断的信用评价机构,这类机构的主要代表是 i c e 8 0 0 0 国际信用监督体系的发起者国际信用评估与监督协会和国际诚信 企业协会。 另外,现实社会的实际需求也是驱动个人信用不断发展的一个因素。2 0 世纪 6 0 年代后期,随着信用卡的出现和发展,银行及其他信用卡的发卡机构认识到 了信用评分的作用及其重要性。由于每天申请信用卡的人数众多,无论从经济上 还是从人力上,银行都不可能完全依赖人工对申请进行审批,必须有一套快速的 大学硕十学位| 文第章绪i 仑 审批模式。这一需求使个人信用评估从定性的人工评估方式转向定量的模型化评 估方式。 如今,个人信用评估在西方发达资本主义国家已经广泛发展起来。例如在美 围,目前已经有2 0 0 0 多家个人信用评估机构每年提供1 亿多份信贷报告,主要采 用计分的方法( 注:在现行使用的各种信用分计算方法中,f i c o 评分模型( f a i r i s a a c 公司的模型) 成为西方发达国家信用评分事实上的标准) ;目前美国最大的 个人信用评估公司之一环联公司拥有全美3 4 亿条个人信用记录,每年为全球6 0 多个国家和地区提供服务并且售出2 亿份咨询回复。而在我国,个人信用评估行 业也在快速发展。1 9 9 9 年6 月中国央行批准上海在全国率先丌展个人信用联合征 信试点,2 0 0 0 年6 月2 8 日中国第一家征信机构在上海成立,7 月lf f 对外查询。1 1 0 万人的信用资料( 仅限上海市) 进入个人信用档案数据中心;1 9 9 8 年,中国人民银 行信贷登记系统建设工作正式启动,至2 0 0 2 年,全国范围内实现了异地联网查询: 2 0 0 6 年1 月1 6 同,中国人民银行宣布全国统一的个人信用信息基础数据库于2 0 0 6 年1 月难式运行。这一数据库日前已收录的自然人数已达到3 4 亿人,其中有信贷 记录的人数约为3 5 0 0 万人,截止2 0 0 5 年底,收录个人信贷余额2 2 万亿元,约占 全国个人消费信贷余额的9 7 5 ,该数据库的运行标志着我国的个人信用评估制 度的发展达到了一个新的早程碑,它将极大地促进我国个人信用评估制度的发 展。 ( 2 ) 个人信用评估的研究现状 个人信用的研究是从2 0 世纪8 0 年代丌始高速发展起来的,关于个人信用的 研究主要分为两大类:信用消费和个人信用评估。信用消费主要包括消费者信用 市场、信用卡市场、个人破产和消费者信用、消费者信用与商业周期、信用量配 给与有限的流动资金、消费者信用心理学等:个人信用评估研究的内容主要包括 信息不对称与信用评分、申请评分、行为评分、利润评分、考虑经济环境因素的 信用评分等。这里我们着重介绍一下个人信用评估研究的有关内容。 信息不对称与信用评分。信用市场中授信主体与受信主体所掌握的信息资源 是不同的,受信主体对自己的经营状况及其信贷资金的配置风险等真实情况 有比较清楚的认识,而授信主体则较难获得这方面的真实信息,他们之问构 成了信息上的不对称。这个研究领域是从信息不对称角度探讨个人信用评分, 山大学侦十学位沦文 第章绪沦 着重解决在信息不对称的条件下,如何通过信用评分来减少授信主体的损失。 个人行为评分。行为评分研究的主要内容是通过预测现有授予信用客户的未 来行为帮助借贷机构在管理客户时作出更好的决策。行为评分模型主要分为 两种方法,一科t 是申请评分模型和额外信息变量的组合,另一种是建立客户 行为的概率模型。 利润评分。利润评分是信用评分领域近几年来的研究热点,它把评分的目标 由违约率最小化转变到利润最大化。利润评分模型虽然蜕是一种战略转变, 它从以前单一的信用风险最小化转变到信用风险较小的条件下利润晟大目 标,但由于利润评分涉及的信息量太大,严重缺乏这方面的数掘,建模的工 具也有限制,尽管取得了很多成果,但并不能应用于实践,目前仅限于理论 上的研究。 考虑经济环境因素的信用评分。这个领域的研究工作就是把经济环境因素考 虑到信用评分中,例如将宏观经济运行指标加入到评估模型中。这种评分模 型也是处于理论研究阶段,尚未应用于实践。 1 3 个人信用评估方法i i 】【6 】【7 】 在早期,个人信用评估最初是采用经验式定性评估方式,判断是否授予信用 所采用的方法是评估人员( 一般是信用分析师) 根据自己的专业技能、主观判断对 影响信用评估决策的某些关键因素进行权衡,通过审查申请表格,决定是否给予 信贷。也就是所谓的专家法,这其中采用的标准丌始是3 c 原则,之后发展到4 c , 5 c 原则,这些原则依次是: 借款人的条件( c o n d i t i o n ) :指借款人基本条件,如户籍、居住稳定性等; 借款人的品德( c h a r a c t e r ) :指借款人的还款意愿,要通过身份证核实其就 业情况,审查其贷款申请的准确性,有无失信汜录等; 借款人的资本金( c a p i t a l ) :指借款人的财富,包括个人住房情况、银行存 款及投资情况; 借款人的能力( c a p a c i t y ) :指借款人获取收入的能力,是个人资信评级的 基础,包括年收入、抚养人口、月还款占收入比率等,通过评价,可以测定借款 人的“支付能力”,从收入的稳定性分析其偿还贷款本息的能力; 7 山大学顺十学位沧文第章绵呛 借款人的担保( c o l l a t e r a l ) :个人消费贷款的担保主要是用融资购买的酬 用消费品,如汽车、住房等,也可以是借款人拼j 有的其他资产,还可以是第三者 的人格担保。担保品要求产权明确,具有相当价值。如为担保人,要有一定支付 能力,能够承担起担保责任。 但是,随着个人信用评估的应用越来越广泛,需要进行信用评估的工作量越 来越大,光靠人工的方式无法胜任,后来采用模型化的方式进行个人信用评估。 各种不同的计量方法也被运用到个人信用评估模型中去,逐渐产生了现代个人信 用评估方法。 现代个人信用评估方法主要是在统计学或运筹学的基础上发展起来的。最早 的个人信用评估方法是引进统计学中方法,直到今天,统计学方法仍旧是一种重 要的方法。常用的统计学方法有:线性判别分析,线性回归,l o g i t 回归,l o g i s t i c 回归等;后来运筹学方法也被考虑进来,主要是一些数学规划方法,例如线性规 划,整数规划;最近一些年,采用各种人工智方法进行个人信用评估,如神经网 络,遗传算法,专家系统等。纵观这些不同的方法,它们主要将个人信用评估看 成两类问题:一类是分类问题,另一类是回归问题。 1 分类问题。这时个人信用评估看作是:根据未知所属类别f 类别可以是 两个或多个) 的若干个贷款申请人的n 个特征指标,去判别一个未知类别的贷款申 请人属于两个( 或多个) 不同类别中的哪一类别。 2 回归问题。这时个人信用评估看作是:根掘未知所属类别的若干个信贷 申请人的1 个特征指标去估计这若干个信贷申请人的违约( 贷款到期未还) 概率或 信用分数。 把个人信用评估问题看作分类问题的研究方法有:线性判别分析,数学规划, 神经网络,遗传算法,专家系统,k 一近邻法,分类树等;把个人信用评估问题 看作回归问题的研究方法有:线性回归,l o g i s t i c 回归等。 1 4 论文的研究背景与意义 目前我固开通的个人信用信息基础数掘库是一个征信系统,该数据库中的信 息涵盖个人基本信息、结算账户玎立信息、银行信贷信息和住房公积金缴存信息 等。它的开通说明了我国已经初步完成个人信用数据的收集。下一步的工作便是 山大学硕+ 学位沦文 第章绪硷 对这些数据进行信用评估,判断客户的信用水平,预测客户的信用风险。因此, 个人信用评估是当前我国当前个人信用制度建设中一项紧迫的任务。 而个人信用评估的信息化和自动化是个人信用评估发展的趋势,它可以加快 信贷决策过程,推动信贷机构个人信用业务的拓展。例如:根掘美国、r 本的情 况,使用个人信用评估之后,信用卡的审批只要一两分钟,甚至几秒钟,2 0 一8 0 的抵押贷款可以在两天之内批复,其中不少贷款项目在4 8 d 时内完成审批。据美 国消费银行协会的最新一份资料,以前不使用个人信用评估,小额消费信贷的审 批平均需要1 2 d , 时,如今使用个人信用评估自动处理程序,这类贷款的审批缩短 至l j l 5 分钟。使用个人信用评估后,6 0 的汽车贷款的审批可以在1 小时内完成【2 l 。 另外,个人信用评估的信息化和自动化可以提高信贷机构在个人贷款业务领域的 竞争能力与贷款管理水平。同时,信贷机构运用科学的评估方法,确定贷款申请 人的信用等级,并施以不同的信贷策略,可以提高对个人贷款决策的科学性和准 确性,从而防范贷款风险,提高贷款质量和效益。 本文选择个人信用评估作为研究的题目,一是我国经济发展的大环境对信用 尤其是个人信用的进一步丌发提出了越来越高的要求,建立我国个人信用评估体 系已是大势所趋。进行个人信用评估的研究将促进我国当前在此领域内研究水平 的发展,推动个人信用评估体系的发展与完善:二是作者研究的方向是数据分析, 个人信用评估问题正是它的研究范围。 1 _ 5 论文研究内容与结构安排 1 5 1 研究内容 当前个人信用评估中面临的一些问题:各种评估模型的评估指标不统一, 造成评估结果不具有可比性,因此各贷款机构只好进行内部评级;个人评估需 要的数据与当前实际收集的数据存在差异,造成个人评估的研究进展缓慢。例如, 当我们设计一个新的指标进行评估时,需要先收集一些指标的特征值,而由于历 史的原因,先前的这些指标没有考虑到个人信用数据的收集中;判断违约与不 违约的准确率不高。 下面,我们将以向信贷机构借贷还贷的生命周期为线索介绍整个模型要做的 山大学倾十学位| 仑文 第章绪沦 工作。 借贷阶段 迁贷阶段违约阶段 信用汗估: 信用分类 信用预测 违约概率 信用分数 幽1 1 借贷还贷周期 呆雌阶段 o 还款 在实际的个人信用评估系统中,用的较多的是b p 神经网络,而且d a v i d w e s t ( 2 0 0 0 ) 对多层感知器、混合专家系统和失真适应响应等五种神经网络算法和 传统方法( 包括参数和非参数方法) 进行了比较分析,结果显示,在所有模型中, 神经网络与l o g i s t i c 模型最优秀,而且就平均水平而言,二者的水平相当,但是 神经网络比l o g i s t i c 模型更稳定。鉴于此,我们将建立b p 神经网络模型,以 便与其它模型进行比较;另外,在综合评价中常用到的一种方法是小波网络,而 且就我目前掌握的资料来看,该方法尚未运用到个人信用评估模型中,因此我们 也将运用它建立个人信用评估模型:最后,我们也将运用最近几年发展起来的一 种方法支持向量分类机建立评估模型,它能有效地解决小样本训i 练集的问 题,具有很强的泛化能力。完成以上三种模型的建立后,我们会将它们作一比较, 并选择最优的一种模型作为我们的个人信用评估系统要实现的模型。 以上三种模型完成剥+ 客户信用进行分类的任务,即判断客户是违约的( 好客 户) 还是不违约的( 坏客户) 。接下来我们将计算客户的违约概率及信用分数,更 进一步反映客户的信用水平。这里采用的方法是保序回归。 最后,我们还将实现以上建立的模型,编写一个个人信用评估系统,来验证 它的实际应用。整篇论文的研究内容可用流程图1 2 表示。 1 5 2 论文结构安排 整篇论文按照个人信用评估的逻辑顺序组织如下: 第一章绪论主要是个人信用评估预各知识的准备。介绍了个人信用评估的相 关概念,个人信用评估的发展历史与研究现状,个人信用评估的方法以及本文要 l u 大学硕十学位沦文 第章绪沦 研究的内容。 计算违约概率及信用分数 f 图1 - 2 论文研究内容框图 第二章介绍评估数据的预处理。这其中包括数据的表示,信用评估指标的选 取,异常数据的删除。 第三章分别运用b p 神经网络,小波网络,支持向量分类机建立个人信用评 估模型,并比较它们的评估效果。 第四章将在第三章研究的基础上,采用保序回归方法计算个人违约概率及信 用分数。 第五章会运用前面建立的模型,将其实现为一个可操作的原型系统。本章会 介绍该系统详细的设计与实现方案。 第六章对整篇论文的研究做出结论与展望。 山大学颤十学位皓文第二章数批顸处理 第二章数据预处理 数掘预处理是个人信用评估中的首先要进行的步骤,良好的数掘预处理能够 提高个人信用评估的效果,因此,它是后面各个步骤得以进行的基础和盼提。通 常情况下,个人信用数据库中的数据不都是数值数据,它还包括许多非数值数据 ( 如分类数据或符号数据) ,而进行评估时需要的是量化数据,这就需要把非数 值数据转化成数值数据,即数据表示的问题;另外,在建立个人信用评估模型时, 通常遇到数据的属性维数很大,属性之间可能存在相关性的情况,这时评估模型 无论是在运行速度上还是评价效果上均会下降,于是需要将数据的属性维进行归 约,即评估模型的指标选取问题;最后,个人信用数据库中存在着不完整、不一 致或不精确的数据,这就涉及到数据预处理中的缺失数据的填补,冗余数掘和噪 音数据的清沈等问题,在下面各节罩,我们会逐一讨论这些问题。 2 1 个人信用评估的过程【: 个人信用评估一般包括三个过程:问题定义和数据准备过程,数据分析与建 立模型过程以及模型应用与验证过程。问题定义和数据准备过程主要完成以下任 务:定义信用评估模型要解决什么样的问题;收集、整理原始数据,确定每 个数掘的类别( 违约还是不违约) ,形成样本数据,建立具有标准格式的个人信 用数据库。数据分析与建立模型过程完成信用评估核心算法的设计、实现,并运 用前阶段得到的数据进行测试,这其中还需要运用一些辅助算法对数据进行预处 理,以提高输入数据的质量和满足评估核心算法的要求。模型应用与验证过程则 是将建立好的模型应用于实际的个人信用评估中,检验模型的实际功效,另外, 随着时问与经济、市场条件的变化,样本数据会过时,为了使模型具有鲁棒形, 需要定期对样本数据更新,并对模型进行重建。个人信用评估的过程用图表示如 下: i i j 大学顺十学位沦文第二章数据颧处理 削2 - 1 个人信h 评估的过群 由此可见,数据预处理处于个人信用评估的第二个过程,主要作用是使输入 数据满足模型核心算法的要求,并提高算法的输出效果。 2 2 数据表示 本文所使用的个人信用数据库一一德国信用数据库( d o w nf r o m h t t p :a x o n e s b y u e d u m a r t i n e z c l a s s e s 4 7 0 m l d b l s t a t l o g g e r m a r d ? c = d & o = a 1 非 常完整,不需要进行数据的填补工作。该数据库中总共有1 0 0 0 个样本点,其中 “l ”类( g o o dc r e d i t ) 样本点7 0 0 个,“2 ”类( b a dc r e d i t ) 样本点3 0 0 个,每个 样本点有2 0 个信用指标( 属性) ,其中1 3 个是定性指标,7 个是定量指标。另外 一个是信用类别属性,各指标的描述如下: 山大学顺十学位硷文第= 章数据顸处理 表2 一l 德国信j | j 数据库各指标揣述 指标编指标名称属性特性 1 1 1 l l s t a t u so fe xs t i n gc h e c k in ga c c o u n t ( 经常帐户状况) 口u a lit a t i v e 2 d u r a t i o ni nm o n t h ( 帐户持续时问)n u m e r lc a l 3c r e d i th is t o r y ( 信川历史状况)q u a i i t a t i v e 4 p u r p o s e ( 贷款朋途) q u a l i t a t i v e 5c r e d i ta m o u n t ( 信t l 额度) 6s a yin g sa c c o u n t b o n d s ( 储蓄存款帐户状况)o u a l i t a t i v e 7p r e s e n te m p l o y m e n ts i n c e ( 现i 作就业时间)o u a l i t a t i v e 8l n s t a l m e n tr a t ei np e r c e n t a g eo fd is p o s a b l ei n e o m e ( 分期付款t i 可支配收入的百分比) 9p e r s o n a ls t a t u sa n ds e x ( 个人状况及性别) q u a l i t a t i v e 1 0o t h e rd e b t o r s g u a r a n t o r s ( 其他债务人或担保者) q u a i t a ti v e l l p r e s e n tr e s i d e n c es i n c e ( 现居处居住时间) 1 2 p r o p e r t y ( 财产状况) o u a l i t a t i v e 1 3 a g ei ny e a r s ( 年龄) n u m e r i c a l 1 4o t h e ri n s t a l l m e n tp l a n s ( 其他分; i 付款计划) q u a li t a t i v e 1 5 h o u s i n g ( 膀犀状况) 0 u a l l t e t i v e 】6 n u m b e ro f e x i s l i n gc r e d i tsa tt h isb a n k ( 枉本银行已有的存款 数目) 1 7 j o b ( 。i 。作状况) o u a l i t a t i v e 1 8 n u m b e ro fp e e p eb e i n g1i a b l et op r o v i d em a i n t e n a n c ef o r ( 应n u m e r i c a l 抚养人数) 1 9 t e l e p h o n e ( 电话) o u a li t a t i v e 2 0 f o r e i g nw o r k e r ( 是否外籍劳i :)q u a i t a t i v e 2 1 c t a s s ( 信川类别) q u a l i t a t i v e 各个定性指标的取值情况如下: 表2 2 德国信_ i 数据库定性指标取值情况 桁 耻 仃史指取禽义 枷、仇标值 ( ( = 2 r e ) i n i yr i s s i g n m e nl sr o rn 【ie t i sl 1 i 11 1 0 ( 1 2 】a 1 2 2 io ro t h e r n o 【in v 0 n i l hl lf i b u t e6 d n c h e c k i n g l u c t 】u nlu n k n o * n n op r o p e lty 1 ocr e d i ista k e n a i icr e d i t sp n i dh a tk l h t iy b a n k i
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 校园安保消防知识培训课件
- 学生暴雨考试题及答案
- 前置胎盘考试题及答案
- 铁路维修考试题及答案
- 教师资格证面试题及答案
- 日语试题试卷及答案
- 税法总论考试题及答案
- 2025年广东省合成氨工艺操作证理论考试练习题库(含答案)
- 2025年阜阳市颍泉区选调区内教师考试笔试试题(含答案)
- 2025年达州市大竹县城区学校考调教师笔试试题(含答案)
- 数学集体备课汇报展示
- 食品生产企业采购管理制度
- 2025年养老护理员职业资格技师培训试题(含答案)
- 《鸿蒙应用开发项目教程》全套教学课件
- 四川省广安市2024-2025学年高一下学期期末考试数学试题(含答案)
- 电缆测试技术课件
- 政协大走访活动方案
- 个人养老金课件
- 2025至2030中国氧化钪行业需求状况及未来趋势前景研判报告
- udi追溯管理制度
- 新能源产业园区厂房物业管理及绿色能源应用合同
评论
0/150
提交评论