已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 中文摘要 信用评分是统计学和运筹学在金融和银行业最成功的应用之一,同时也是最 早开发的金融风险管理工具之一建立信用评分模型的统计学方法有很多。传统 的参数方法有线性回归、l o g i s t i c 回归等,非参数方法有最近邻方法等,但是使 用半参数回归模型的相关文献还很少半参数回归模型自上世纪八十年代诞生以 来一直是被研究很多的一种重要的统计模型,这种模型同时含有参数分量和非参 数分量,具有良好的解释能力和适应性本文在各种文献的基础上,介绍了信用 评分的发展历史、评分方法、评分模型等,在已有的线性回归模型和l o g i s t i c 回 归模型的基础上引入半参数方法,使用广义部分线性模型 e ( y i x ,t ) = i ( x f p + 9 ( r ) ) 对传统的评分卡模型进行改进,其中,( ) 是一个已知函数,p 是未知的参数分 量,9 ( ) 是未知函数然后根据数据的特点使用拟似然方法进行估计,讨论了相 关的估计理论、计算过程、窗宽选择等,最后使用数值模拟将新的评分卡和传统 评分卡作比较,通过对比识别率证明新评分卡的优越性 本文主要成果t 在传统方法中,申请人是好客户的概率被表示为p ( y = s i x ) = ,( x 1 。) ,本文使用广义部分线性模型将这一模型推广到更为一般的情 况,将申请人是好客户的概率被表示为p ( y = s i x ,t ) = f ( x 7 p + 9 ( t ) ) 因此 新的评分模型相对传统方法适应性更强,同时避免了使用最近邻方法等非参数方 法时无法给出特征变量的评价系数的缺点通过模拟研究对新的评分卡在有限样 本下的表现进行评估,通过与传统评分卡作对比证明新的评分卡在识别率方面的 优点本文的创新点:将半参数回归模型应用到信用评分模型中,而传统的方法 大多数是使用参数模型或者非参数模型 关键词t 半参数;拟似然;信用评分 i 山东大学硕士学位论文 a b s t r a c t c r e d i ts c o r i n gi so n eo fm o s ts u c c e s s f u la p p l i c a t i o n so fs t a t i s t i c sa n do p e r a - t i o n a lr e s e a r c hi nf i n a n c ea n db a n k i n gi n d u s t r ya sw e l la so n eo ft h ee a r l i e s tt o o l s o fr i s kc o n t r o l l i n ga n dm a n a g i n gi l lf i n a n c ei n d u s t r y t h e r ea r em a n yp a r a m e t r i c a n dn o n p a r a m e t r i cs t a t i s t i c a lm e t h o d so fe s t a b l i s h i n gc r e d i ts c o r i n gm o d e l ss u c h a sl i n e a rr e g r e s s i o nm o d e l s ,l o g i s t i cr e g r e s s i o nm o d e l s ,k - n e a r e s tn e i g h b o r a n ds oo n h o w e v e rt i l e , 。ea r ef c wr e s e a r c ho fs e m i p a r a m e t r i cm e t h o d si nc r e d i t s c o r i n g s e m i p a r a m e t r i ci sak i n do fi m p o r t a n ts t a t i s t i c a lm o d e lw h i c hd e v e l o p e d f r o m19 8 0 s t h i sk i n do fm o d e lc o n t a i n sb o t hp a r a m e t r i ca n dn o n p a r a m e t r i c c o m p o n e n t sa n dc a nb eu s e dt od e s c r i b em a n yp r a c t i c a lp r o b l e m s i nt h i sp a p e r w ei n t r o d u c et h ed e v e l o p m e n ta n dm e t h o d so fc r e d i ts c o r i n g t h e nw ec o n s i d e r as e m i p a r a m e t r i ca p p r o a c hw h i c hg e n e r a l i z e st h et r a d i t i o n a lm e t h o d w bu s e g e n e r a l i z e dp a r t i a ll i n e a rm o d e 】 e ( y i x ,t ) = ( x 7 p + 夕( 7 1 ) ) t od e s c r i b et h ep r o b a b i l i t yo fac l i e n tb e l o n g i n gt ot h eg r o u po fg o o d ,h e r e ,( ) i sa k n o w nf u n c t i o n ,i sa nu n k n o w np a r a m e t e rv e c t o r ,夕( ) i sa nu n k n o w nf u n c t i o n aq u a s i l i k e l i h o o dm e t h o di su s e dt oe s t i m a t et h em o d e l w bi n t r o d u c er e l a t i v e e s t i m a t et h e o r y , c a l c u l a t i o ns t e p s ,b a n d w i d t hc h o o s i n gm e t h o d s ,a n dt h r o u g h s i m u l a t i o nw ec o m p a r es e m i p a r a m e t r i cm o d e lw i t ht r a d i t i o n a lm o d e l si no r d e rt o s h o wt h ed i f f e r e n c eo fi d e n t i f i c a t i o nr a t e m a i nr e s u l t s :w bg e n e r a l i z e dt h ep r o b a b i l i t yo fac l i e n tb e l o n g i n gt ot h e g r o u po fg o o df r o mp ( y = 1i x ) = f ( x 7 p ) t oap a r t i a ll i n e a ra r g u m e n tp ( y = 1 i x ,t ) = f ( x 1 。p + 夕( t ) ) t h u ss e m i p a r a m e t r i cc r e d i ts c o r i n gm o d e li sm o r ei s m o r ea d a p t i v et h a nt r a d i t i o n a lm o d e l s ,i tc a na l s oa v o i ds o m ed i s a d v a n t a g eo f n o n p a r a m e t r i cm e t h o d s t h r o u g hs i m u l a t i o nw es h o wt h a ts e m i p a r a m e t r i cc r e d i t s c o r i n gm o d e lh a sb e t t e rs e p a r a t i o no fc l i e n t st h a nt r a d i t i o n a lm o d e l s i i k e yw o r d s :s e m i p a r a m e t r i c ;q u a s i - l i k e l i h o o d ;c r e d i ts c o r i n g 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进 行研究所取得的成果除文中已经注明引用的内容外,本论文不包含 任何其他个人或集体已经发表或撰写过的科研成果对本论文的研究 作出重要贡献的个人和集体,均已在文中以明确方式标明本声明的 法律责任由本人承担 论文作者签名。殛 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学校 保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅;本人授权山东大学可以将本学位论文全部或部分内容 编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存 论文和汇编本学位论文 ( 保密的论文在解密后应遵守此规定) 论文作者签名:缝导师签名:论文作者签名:2 垫! 生导师签名:期:2 坐 第一章引言 信用评分是统计学和运筹学在金融和银行业最成功的应用之一,在西方发达 国家信用评分技术已成为重要的风险控制工具之一统计学是最早应用到评分 系统的方法,并且直到现在仍然是信用评分最常用的方法在过去的数十年间, 很多统计学方法被应用到信用评分领域d u r a n d ( 1 9 4 1 ) 第一个将判别分析法应 用到信用评分领域w i l l i a m f a i r & :e a r li s a a c s ( 1 9 5 8 ) 利用判别分析法建立了著名 的f i c o 信用评分系统m y e r s f o r g y ( 1 9 6 3 ) 采用判别分析和回归分析方法, 对零售信贷领域的信用风险作了预测o r g l e r ( 1 9 7 0 ) 首次将线性回归分析引入消 费者贷款的信用风险评估,利用线性回归分析设计了一个评价未偿还贷款的评分 卡f i t z p a t r i c k ( 1 9 7 6 ) 、l u c a s ( 1 9 9 2 ) 、h e n l e y ( 1 9 9 5 ) 等也先后将这种方法用于构建 个人信用评分模型w i g i n t o n ( 1 9 8 0 ) 第一次在信用评分模型中使用了l o g i s t i c 回 归方法,并与判别分析法进行了比较,这一方法已成为现代信用评分最常用的方 法c h a t t e r j e e b a r c u n ( 1 9 7 0 ) 首次将最近邻法用于个人信用评分模型c a r t e r c a t l e t t ( 1 9 8 7 ) 、m e h t a ( 1 9 8 8 ) 等将分类树方法应用到了信用评分领域个人信 用评分模型的研究目标由客户违约率最小化向公司从客户赚取利润最大化转变, 成为国外个人信用评分模型研究的前沿之一,也是信用评分领域近几年来的研 究热点其中一个研究方向就是使用回归方法。把利润表达成申请表格中定性变 量的线性函数l a i y i n g ( 1 9 9 4 ) 进行了这方面的研究半参数回归模型自上世 纪八十年代诞生以来一直是被研究很多的一种重要的统计模型,这种模型同时含 有参数分量和非参数分量,具有良好的解释能力和适应性这些年来国内外关于 半参数模型的研究有了很多重要的成果本文在上述研究的基础上,利用半参数 回归模型对传统的信用评分模型加以改进,使用广义部分线性模型建立新的评分 卡,同时使用拟似然的方法进行估计通过数值模拟我们可以看出新的评分卡的 识别率比传统的线形回归和l o g i s t i c 回归有所改善,因此具有一定的研究价值和 实际意义 1 第二章信用评分 2 1 信用评分的起源和发展 在经济学中,信用( c r e d i t ) 被用来描述市场交易中的借贷行为,从属于商品 和货币关系的范畴在市场交易活动中,信用是一种建立在信任基础上的能力, 就是不用立即付款便可以获得资金、物资、服务的能力这种能力受到一个条件 的约束,即受信人在其应允的时间期限内为所获得的资金、物资、服务等付款,有 时还包括为应付款支付利息,而这个还款时阊期限必须得到提供资金、物资、服 务的授信人的认可信用评分指帮助贷款机构发放消费信贷的一整套决策模型及 其支持技术这些技术决定谁能得到贷款、得到多少贷款,以及提高贷款机构盈 利性的操作战略信用评分通常使用统计学或者非统计学的方法对数据进行定量 分析,从而帮助信息提供者量化和管理包含在信息中的金融风险,为信息提供者 作出决策提供依据信用评分的实质是把总体按照不同特征划分为不同的组这 一思想最早起源于f i s h e r 在1 9 3 6 年提出的一个解决总体分组问题的方法,1 9 4 1 年d u r a n d 将这一技术应用到信用评分,正式系统的提出使用数理统计模型辅助 信贷决策的理论,这是个人信用评分从定性分析转向定量分析的开端在随后的 几十年间,基于这一思想的信用评分技术在美国得到了长足发展 在2 0 世纪2 0 年代的美国,汽车消费的快速增长产生了大量的消费信贷需 求。财务公司雨后春笋般的应运而生,与此同时邮购公司也开始发展,但是在当 时消费信贷主要依靠信用分析员依靠个人的主观经验做出决策2 0 世纪3 0 年代 一些邮购公司开始使用数字评分系统( n u m e r i c a ls c o r i n gs y s t e m ) 来克服信用分 析员在信贷决策中标准不一致的问题在第二次世界大战中,由于有经验的信用 分析员严重缺乏,财务公司和邮购公司要求有经验的信用分析员把做出信贷决策 时应用的原则写在卡片上,其中包括前面提到的数字评分系统以及另外的一些必 须满足的条件,用来帮助非专业的人员做出信贷决策,这就是最早期的专家系统 之一 第二次世界大战结束后,随着金融业和经济的复苏和发展,信贷需求随之增 长人们开始将统计学中的分类( c l a 8 s i 丘c a t i o n ) 技术应用到信贷决策的自动化中, 研究统计学模型在信贷决策中的好处2 0 世纪5 0 年代,b i l lf a i r 和e a r li s a a c 在旧金山成立了第一个咨询公司,通过统计学方法建立了一些模型,用来为财务 公司、零售商和邮购公司之类的客户提供信贷决策的指导这家名为f a i r & i s a a c 3 山东大学硕士学位论文 的公司现在已成为美国最主要的信用评分公司,其评分f i c o 即风险得分也成 为信贷机构的主要参考指标。 2 0 世纪6 0 年代信用卡在美国诞生并产生爆炸性增长,随之而来的是大量 的消费信贷业务和信用卡申请,这些因素从经济上和人力上都迫使银行和其他 授信机构实现授信的自动化。计算机技术的发展提供了技术上的可能性,同时这 些机构发现信用评分比主观判断有更好的预测性,违约比例( d e f a u l tr a t e ) 也下 降了5 0 以上这一特点在m y e r s 和f o r g y 在1 9 6 3 年的报告,以及t 9 7 7 年 c h u r c h i l l 的报告中都有论述。在1 9 7 5 年美国颁布了公平信贷机会法( e q u a l c r e d i to p p o r t u n i t ya c t ) ,为社会完全接受信用评分提供了保障 2 0 世纪8 0 年代信用评分的应用范围从信用卡扩展到个人贷款等领域,数年 之后,信用评分在住房抵押贷款和小企业贷款中也得到广泛应用。9 0 年评分卡 被应用到直销的领域用来提高广告战中的响应率同时计算机技术的进步使评分 的技术得到了发展同样在8 0 年代当今评分技术的两大支柱一逻辑回归和线型 规划也开始应用近年来一些人工智能技术,例如专家系统和神经网络也开始试 用当前研究的重点是将风险管理目标从客户违约可能性最小化调整到如何使公 司从客户赚取的利润最大化另外,信用评分的目的也从最初的评估违约风险, 逐步扩大到评估响应、使用、保持、流失、负债管理,以及欺诈评分 2 2 信用评分的重要意义 信用评分具有很多优点,有效的评分模型能够充分利用客户的已知信息做出 客观准确的分析,避免分析人员主观上的判断失误信用评分可以挖掘数据的深 层信息,最大可能的预测潜在风险。帮助信贷机构根据不同风险实行更为准确的 定价策略,对于运营的效率和稳定性有重要的意义同时信用评分有助于简化判 别过程,减少人工干预和经济成本,实现授信决策的自动化还可以根据不同的 信用等级设置不同的授信额度,对客户进行更为有效的分类管理此外信用评分 对于诚实守信的受信人给予较高的评分,使其能够获得更高的额度或者更长的 贷款期限,获得经济上的利益,对于社会的诚信建设具有重要的促进作用近年 来金融业的高速发展和国际竞争日益激烈对信用评分体系的建立和完善提出了 迫切的要求,但是我国信用评分制度引入比较晚,体系建设还很不完善,而在国 外已经发展了5 0 年的信用评分是以计算机技术为核心的,以取代人力为特征的 大规模自动化处理方法,是发达国家普遍采用的能够有效控制风险、节省人员数 4 山东大学硕士学位论文 量、提高审批效率的商业银行革命性措j l 氲之一因此信用评分的研究对于我国的 信贷行业具有重要的意义 2 3 信用评分的方法 信用评分按照技术层面可以分为简单的分类模型、预测评分模型和决策评分 模型三个阶段,按照评分的类型可以分为申请评分、行为评分、利润评分和考虑 经济环境因素的评分本文主要讨论申请评分卡 在申请评分中授信机构利用客户提交的申请表中的特征变量建立评分模型, 然后计算申请人的评分并与设定的标准评分进行比较,判断该申请人违约的可能 性,从而确定是否授信以及授信额度建立一个评分卡模型的步骤一般如下:首 先把一组过去客户的样本按照他们的行为进行分组,在申请评分卡中我们的关心 的决策行为只有“接受”和。拒绝”两种,因此可以把申请人的行为划分为“好一 和“坏”两类,接下来我们从客户的申请表数据以及信用记录中收集数据,数据 的来源可以是申请表、征信局等,申请表中可以采用的数据按照各国的规定可能 包括申请人的年龄、性别、收入情况、教育水平、住房情况等,征信局报告一般 含有可获取的公共信息、以往的查询记录、其他信贷机构共享的信息、信息匹配 情况和欺诈预警等在获得数据后使用统计学或者其他定量分析的方法建立信用 评分模型 建立信用评分模型可以运用的方法非常多,目前主要的信用评分方法是以统 计学或运筹学方法为基础统计学方法的优点在于我们能够在信用评分的背景下 利用关于样本估计量的性质、置信区间、假设检验等方面的知识我们就可以对 所建立的评分卡的判别能力以及评分卡中所使用的特征变量的相对重要性进行 评价统计技术使我们能够识别并删除那些在进行判别时不重要的特征变量,并 保证所有重要的特征变量保留在信用评分卡中,建立一个简洁的信用评分卡在 信用评分的统计学方法中主要是判别分析式,其本质上是一种线形回归。以及后 来发展的l o g i s t i c 回归和分类树方法运筹学方法是线性规划的各种类型近年 来非参数方法和人工智能方法也被应用到信用评分领域以下是一些主要的信用 评分方法: ( 1 ) 判别分析( d i s c r i m i n a n ta n a l y s i s ) 判别分析是信用评分方法中历史最久、最常用的统计学方法这一方法主 5 山东大学硕士学位论文 要基于f i s h e r ( 1 9 3 6 ) 最初关于线性判别函数的研究,其主要思想就是寻找变量 的一个组合使得这一组合能够将两个不同的组尽可能的区分开来d u r a n d ( 1 9 4 1 ) 将判别分析方法用于信用评分,他使用这一方法对消费贷款的偿还情况进行预 测1 9 5 8 年w i l l i a mf a i r e a r li s a a c s 利用判别分析法建立了著名的f i c o 信 用评分系统。m y e r s & f o r g y ( 1 9 6 3 ) 对采用判别分析和回归分析方法,对消费信 贷中的信用风险进行了预测o r g l e r ( 1 9 7 0 ) 首次将线性回归分析引入消费信贷的 信用风险评估,利用线性回归分析建立了一个评分卡f i t z p a t r i c k ( 1 9 7 6 ) 、l u - c a s ( 1 9 9 2 ) 、h e n l e y ( 1 9 9 5 ) 等也先后采用这种方法建立了信用评分模型尽管由线 性判别函数产生的评分卡的评价结果很稳健,但这类方法通常需要很严格的假 设,比如样本为多元正态分布、样本等协方差、变量之间没有很强的相关性等 这些假设在现实当中往往显然是不成立的由于f i s h e r 判别分析使用的是线性 判别函数,人们尝试使用其他的假设较弱的非线性判别方法,其中最为成功的就 是l o g i s t i c 回归方法 ( 2 ) l o g i s t i c 回归( l o g i s t i cr e g r e s s i o n ) l o g i s t i c 回归方法由w i g i n i t o n ( 1 9 8 0 ) 首次应用到信用评分中在l o g i s t i c 回归方法中,将概率发生比的对数表示成特征变量的一个线性组合由于这种方 法假设响应变量为伯努利分布,因此没有变量正态性的假设要求同时由于这种 方法使用的假设前提比较少,因此得到的信用评分模型具有很好的准确性和稳 健性,被认为是最适合信用评分模型的理论s r i n i v a s a n k i m ( 1 9 8 7 ) 将l o g i s - t i c 回归方法和其他评分方法进行了比较s t e e n a c k e r s & g o o v a e r t s ( 1 9 8 9 ) 使用 l o g i s t i c 回归方法对个人信贷的信用风险进行了分析l e o n a r d ( 1 9 9 3 ) 将l o g i s t i c 回归方法应用到商业贷款的信用评价相对于线性回归方法,l o g i s t i c 回归需要 使用极大似然估计来估计回归系数,因此需要使用n e w t o n - r a p h s o n 迭代算法求 解似然方程,在计算机技术高速发展的现在这已不是什么问题在处理分类问题 时,理论上l o g i s t i c 回归方法要优于线性回归方法,但是从实践结果来看,两种 方法的差异不是很大这是因为线性回归使用特征项的线性组合去拟合违约概率 p ,l o g i s t i c 回归使用特征项的线性组合去拟合i nt 笔这两种拟合方法只有在p 很接近0 或者1 的时候才会存在明显的差异,而对于违约概率非常高或者非常 低的申请人我们很容易做出判断对于在难以做出预测的区域( p = 0 5 ) 附近, 两种方法的结果是非常相似的尽管如此,在信贷领域当中即使违约率降低一点 也意味着能够带来大量的利润,因此l o g i s t i c 回归取代了线性回归成为现代信用 6 山东大学硕士学位论文 评分最为常用的统计学工具之一 ( 3 ) 分类树( c l a s s i f i c a t i o nt r e e s ) 分类树方法,也被称为递归分割法( r p a ) 这方法是一种基于统计理论的 非参数识别方法,其基本思想是将信用申请人按照申请表中的回答划分为互不相 交的组,按照不同组中好、坏客户的多少来确定该组是好客户组或者坏客户组 通过这样的分组尽可能使每个组当中的申请者具有相似的违约风险,同时与其 他组的申请者具有明显的区别,以达到期望损失最小的目的分类树方法最早由 m a k o w s k i ( 1 9 8 5 ) 应用到信用评分当中c o f f m a n ( 1 9 8 6 ) 将决策树方法与判别分析 方法进行了比较,发现当变量存在相关性时,决策树方法的表现较好c a r t e r c a t l e t t ( 1 9 8 7 ) ,m e h t a ( 1 9 8 8 ) 以及b o y l e ( 1 9 9 2 ) 等对这一方法在信用评分中的应 用作了进一步研究分类树方法由于非线性和允许变量相关的特点,相对传统的 线性模型具有一定优势这种方法的缺点在于为一种非参数方法无法给出特征变 量的评分。这就令使用者无法了解评分系统是怎样运作的同时分类树通常会随 着样本的增加变得非常庞大,使用者不容易了解和修改 ( 4 ) 最近邻方法( k - n e a r e s tn e i g h b o r ) 这一方法f i x h o d g e s ( 1 9 5 2 ) 提出的,它是一种标准的非参数分类技术,通 常被用来解决概率密度函数的估计和分类问题这一方法的基本思想就是把过去 的样本( 申请人) 分为两类,在样本的数据空间中选择一种距离来度量两个样本 的分离程度当一个新的样本加入时,考察与该样本最近的k 个邻居,然后根据 这k 个邻居当中两个类别的比例将其划为其中一类c h a t t e r j e e b a r c u n ( 1 9 7 0 ) 首次将最近邻法用于个人信用评分模型h a n d ( 1 9 8 1 ) 利用家庭贷款的数据对最 近邻法与决策树进行了比较,结果最近邻法得到了相当高的预测精度h e n l e y h a n d ( 1 9 9 6 ) 利用一家大型邮购公司的数据对最近邻方法进行了进一步的研究, 他们重点研究了最近邻方法中距离的定义和最近邻个数的选择最近邻方法在实 际使用当中有个很大的优点,它可以通过加入新的样本和剔除老化的样本对训 练样本进行动态更新在现代计算机的帮助下,最近邻方法所需要的大量运算问 题已经被解决但是最近邻方法和分类树方法一样无法给出特征变量的评分,同 时这种方法在定义度量距离的时候和回归方法类似,因此很多信用评分人员在实 践当中选择传统的方法 7 山东大学硕士学位论文 ( 5 ) 线性规划( l i n e a rp r o g r a m m i n g ) m a n g a s a r i a n ( 1 9 6 5 ) 第一个意识到线性规划方法可以应用到分类问题f r e e d g l o v e r ( 1 9 8 1 a ) 和h a n d ( 1 9 8 1 ) 在他们的研究中使用了这一方法,并且指出最小 化绝对误差( m s a e ) 和最小化最大误差( m m e ) 这样的目标函数,即使要判别的 两个组不是完全可分的,线性规戈q 方法也能应用于判别分析的问题这一方法的 基本思想是建立样本特征变量的一个线性组合k = 0 , 1 1 x 14 - u j 2 x 24 - + , 以及临界点c 和一组非负变量a t ,满足对于好客户( 假设他们是前i t g 个客户) 有k c a i ,i = 1 ,n g ,而对于剩下的i t b 个坏客户有k c4 - a j ,歹= 船+ 1 ,n g4 - n b 然后寻找一组权重使得m a s e = 帆4 - a 2 + 4 - n 竹g 枷b 达到最小f r e e d & g | o v e r ( 1 9 8 6 a ,1 9 8 6 b ) 对这一问题作了进一步的探讨,他们 加入了内部偏差e f ,提出了一种最为一般的线性规划模型。j o a c h i m s t h a l e r & s t a m ( 1 9 9 0 ) 就这一领域的7 0 多篇文献进行了综述e r e n g u c & k o e h l e r ( 1 9 9 0 ) 和 n a t h ,j a c k s o n & j o n e s ( 1 9 9 2 ) 对线性规划和回归方法应用于分类问题时进行了 比较,他们的研究结果表明统计学方法要优于线性规划的方法另外一些学者比 如h a r d ) r a d r i a n ( 1 9 8 5 ) 则认为线性规划的效果和统计学相同线性规划方法 的优点在于不会受到变量相关性的影响,但是它的缺点也很明显,就是缺乏统计 学理论基础以及统计学方法所具有的直观性 ( 6 ) 整数规划( i n t e g e rp r o g r a m m i n g ) 线性规划方法的准侧是使错误分类的偏差之和达到最小,另一种更实用的准 则就足使错误分类的样本数达到最小或者错误分类的总损失达到最小,因此一些 变量就需要取整数,这时候需要使用整数规划的方法e r e n g u c k o e h l e r ( 1 9 9 0 ) 使用整数规划建立了一个评分卡模型j o a c h i m s t h a l e r s t a r e ( 1 9 9 0 ) 以及e r e n - g u c & k o e h l e r ( 1 9 9 0 ) 指出这一模型要优于线性规划方法r u b i n ( 1 9 9 7 ) ,d u a r t e s i l v a & s t a m ( 1 9 9 7 ) 对这类问题的分类结构进行了研究另一些研究人员对整数 规划模型进行了改良,相关的研究成果可以参见g l e n ( 1 9 9 9 ) 、b a j g i e r h i l l ( 1 9 s 2 ) 、p a v a r ,w a n a r a t l o u c o p o p u l u s ( 1 9 9 7 ) 、以及r o b i n ( 1 9 9 0 ) 尽管整数规划要优 于线性规划,但是整数规划的算法比线性规划复杂很多,因此只能适用于规模较 小的样本,这使得整数规划很少被使用在商业信用评分当中 ( 7 ) 神经网络( n e u r a ln e t w o r k ) 神经网络是使用计算机模拟人脑的结构,用许多小的处理单元模拟生物的神 8 山东大学硕士学位论文 经元,用算法实现人脑的识别、记忆、思考过程的一种智能化信息处理技术这 种方法具有高度的自组织性、自适应性和学习能力同时这种方法对数据的分布 并不严格,因此具有很好的准确性和稳健性o d o m ( 1 9 9 0 ) 首次将神经网络方法 应用到信用风险评估中r o s e n b e r g g l e i t ( 1 9 9 4 ) 研究了神经网络和相关的分类 方法d e s a ie tm ( 1 9 9 6 ,1 9 9 7 ) 、w e s t ( 2 0 0 0 ) 等人使用神经网络方法构造了个人信 用评分模型,在他们的研究中指出特征变量呈复杂的非线性关系时,神经网络方 法具有明显的优势。另一方面在d a v i s ( 1 9 9 2 ) 也指出了神经网络训练样本时间较 长、分类不当的情况下错判率很高的缺点,同时a l t m a n ( 1 9 9 4 ) 等也对这一方法 缺乏直观性的缺点提出了质疑 ( 8 ) 遗传算法( g e n e t i ca l g o r i t h m s ) 遗传算法是计算数学中用于解决最优化的搜索算法,是进化算法的一种这 一方法最早是h o l l a n d ( 1 9 7 5 ) 提出的。f o g a r t y i r e s o n ( 1 9 9 3 ) 最先将这种方法 应用于线性评分a l b r i g h t ( 1 9 9 4 ) 首次将遗传算法应用于信用联盟评分卡的开 发m i c h a l e w i c z ( 1 9 9 6 ) 对这一方法作了进一步研究d e s a ie ta 1 ( 1 9 9 7 ) 将遗传算 法和神经网络方法在信用评分中的应用作了比较y o b a s ,c r o o k ,r o s s ( 1 9 9 7 ) 使用了不同的函数对遗传算法在信用评分中的应用作了研究 ( 9 ) 专家系统( e x p e r ts y s t e m ) 专家系统是个基于人工智能的计算机程序系统,其内部含有大量的某个领 域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该 领域问题它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供 的知识和经验建立一套规则,按照这些规则进行推理和判断,模拟人类专家的决 策过程这一方法在信用评分领域的的主要研究有z o c c o ( 1 9 8 5 ) ,d a v i s ( 1 9 8 7 ) , l e o n a r d ( 1 9 9 3 a1 9 9 3 b ) ,t e s s m e r r i c h e y ( 1 9 9 7 ) 等d a v i s ,e d e l m a n & g a m m e r - m a n ( 1 9 9 2 ) 将b a y e s i a n 专家系统应用到信用卡申请者的分类问题,并将结果与神 经网络方法的结果进行了比较t a l e b z a d e h ,m a n d u t i a n u & w i n n e r ( 1 9 9 4 ) 利用 专家系统建立了名为c l u e s 的个人信用评分模型,这一系统包含了1 0 0 0 多条规 则,已经被全国基金公司( c o u n t r y w i d ef u n d i n gc o r p o r a t i o n ) 所接受j a m b e r ( 1 9 9 1 ) 使用专家系统建立了一套用于企业评价的系统l e o n a r d ( 1 9 9 3 a1 9 9 3 b ) 成功的将 专家系统应用到信用卡用户的欺诈预警h a n d ,m c c o n w a y , & s t a n g h e l l i n i ( 1 9 9 7 ) , s e w a r t w h i t t a k e r ( 1 9 9 8 ) 等则论述了运用绘图的方法可以更容易确定个人信用 9 山东大学硕士学位论文 风险的全部因素相对于神经网络,专家系统的规则具有很强的解释能力,同时 当决策者面临的问题是多重的、有顺序的或者并行的,以及由于决策的多重性使 得问题不是很清晰时,专家系统特别有效 1 0 第三章半参数回归模型 3 1 回归模型的介绍 在客观世界中,普遍存在着变量之间的依赖关系例如两个变量x 和y ,由 x 可以部分地决定y 的值,但是这种关系不是确定性的,即无法由x 严格准确 的确定y 的值变量之间的这种关系称为“相关关系”在这类问题中y 通常称 为因变量或响应变量,影响l 厂的因素x 称为自变量或者解释变量回归就是通 过给定的数据组 ( 置,k ) ,i = 1 ,2 ,n ,找出一个响应变量x 和解释变量y 之间的关系,使之满足 k = m ( x i ) + 白,l c t ( x ) = e ( y i x = z ) ,i = 1 ,2 ,似,( 3 。1 ) 其中 ) = e ( y i x = z ) 为回归函数,氏为随机误差回归就是研究相关变量 之间的统计规律当我们假设t i 。( x ) 具有某种已知的参数结构m ;目) 时,( 3 1 ) 称为参数回归模型其中最为常用的一种模型就是线性回归模型,在线性回归模 型中假设( 3 1 ) 中m ( z ) 有如下的线性结构t m ( x ) = 风+ 阮x l + 侥恐+ + 伟,i = 1 ,2 ,n ,( 3 2 ) 在线性回归模型中只有p + 1 个参数扁,风,伟是未知的线性回归模型在过 去的数十年间被广泛应用于生物、医学、经济、管理、工农业以及工程技术等领 域。成为现代统计学应用最广泛的模型之一在参数回归模型中,通常总体的分 布形式或分布族是给定的或者假定的,除了有限个未知参数之外其他的都是已知 的,因此模型比较容易处理参数回归模型通常对回归函数有基本假设,这些基 本假设使用了大量的额外信息,这些信息一般来自经验或者历史数据,因此在假 设模型成立时其推断具有较高的精度,但是当模型假设与现实相背离时,拟合效 果就会变得很差因此,当我们事先对回归函数的形式没有很多了解的情况下, 非参数回归模型是一种很好的选择非参数回归模型是上世纪七十年代诞生的一 种回归方法。在非参数回归模型中我们通常仅需要 。( z ) 的光滑程度作出假设而 不是它的具体形式,因此这种方法具有很好的适应性非参数回归模型的一般形 式为 k = r ( x i ) + 岛,i = 1 ,2 ,咒,( 3 3 ) 1 1 山东大学硕士学位论文 自从s t o n e ( 1 9 7 7 ) 提出非参数回归的权函数估计方法之后,人们对这一方法进行 了深入的研究。近几十年来权函数方法如核估计、近邻估计、局部多项式估计等 方法得到不断地完善,理论和应用的研究取得了很大的进展但是非参数方法不 能很好的利用经验信息和历史信息,因此当这些信息可用的时候会降低一部分解 释能力。因此在处理某些问题的时候,人们考虑采用两种方法的结合,使用如下 形式的回归: k = x ,p + 9 ( 乃) - fe i ,i = 1 ,2 ,:n ,( 3 4 ) 其中响应变量y 依赖于p 维解释变量x 和1 维解释变量丁,9 ( ) 是凡1 上的未知 函数,p 是p 维待估参数分量,y 与x 之间存在线性关系,y 与丁之间存在非 线性关系,毛为误差项这一模型被称为部分线性模型( p a r t i a ll i n e a rm o d e l ) , 足e n g l e 等在研究气象条件对电力需求影响时这一实际问题时提出的一种半参 数回归模型。这一模型同时具有参数结构和非参数结构,其中参数分量可以用来 描述函数关系明确的那一部分,非参数分量用来描述函数关系不明确的部分,所 以该模型在处理一类问题的时候可以很好地保留参数部分的解释能力,同时具有 良好的适应性半参数回归模型由于同时具有参数分量和非参数分量,因此在处 理这种模型的时候需要融合参数方法和近几十年来发展起来的非参数方法,但也 并非这两种方法的叠加近几十年来国内外的学者对半参数回归模型大量深入的 研究,这些研究主要集中在以下几个方面:一是在基本模型下,基于各种不同的 估计方法或者基于误差的不同设定,探讨参数、非参数部分以及误差方差估计量 的强相合性、弱相合性、p 阶平均相合性及其收敛速度,以及参数、误差方差估 计量的渐近正态性等;二是把模型推广,探讨存在数据污染、存在数据截断或数 据删失时,模型的估计及相应的估计量的性质;再就是实证与应用研究下面我 们介绍一下部分线性回归模型以及其相关理论 3 2 部分线性模型 部分线性模型( p a r t i a ll i n e a rm o d e l ) 是e n g l e 等( 文献) 在研究气象条件 对电力需求影响时这一实际问题时提出的一种半参数回归模型近几十年来学者 们对这一模型作了大量深入的研究,并且取得了丰富的研究成果在部分线性模 型中响应因变量y 依赖于p 维解释变量x 和d 维解释变量t ,y 与x 之间存 在线性关系,y 与t 之间存在非线性关系,部分线性模型的一般形式为; k = 霹p + s ( 互) + i ,e ( y i x , ,霞) = x f + g ( 砚) ,i = 1 ,2 ,n ,( 3 5 ) 】2 山东大学硕士学位论文 其中五= ( x i l ? x i 2 ,z p ) r 和正= ( t i a ,t i 2 ,) 分别是p 维和d 维解释 变量,( ,正) 可以是独立同分布( i i d ) 的随机设计,也可以是固定设计,卢= ( p t ,仍,体) 7 是p 维未知参数分量,9 ( ) 是某个铲h 跄1 的未知函数,矗为 i i d 的误差序列,并且有 e ( 龟) = 0 ,0 砰i i - e ( ;) 0 在这种情形下 锄可以表示为 知扎g ( 型甓铲) ( 3 2 1 ) 但是p 无法获得显式解,需要使用迭代的方法求解。 在另外一些情形下,鲐和p 都无法获得显式解,比如 ( s ) = e x p s 0 + e x p s ) ,y ( 肛) = p ( 1 一肛) ,0 s ) 因此如果曲线越接近 x 轴,表明这种方法接受坏客户的概率更低,这种方法就更加优越两张图中实 线和虚线分别表示传统方法的识别率曲线和半参数方法的识别率曲线我们可以 看出在大多数情况下,虚线都位于实线的下方这说明半参数评分模型相对传统 的评分模型具有更高的识别率在接受比率很低和很高的情况下两条曲线几乎重 合,这是因为在较低的接受比率下,接受客户几乎都是评分接近于1 的客户,而 在较高的接受比率下,只有分数极低的客户才会被拒绝,这两类客户在大多数方 法中都是很容易被识别的 山东大学硕士学位论文 图5 1 :线性评分模型和半参数评分模型对比 图5 2 :l o g i s t i c 评分模型和半参数评分模型对比 第六章结论 本文在传统的信用评分模型基础上引入了半参数方法,将线性结构的评分卡 推广到了部分线性结构的形式通过数值模拟的方法证明了新的评分模型比传统 模型具有更高的识别率虽然我们的研究表明了半参数信用评分模型在某种程度 上比传统方法具有优越性,但是仍有很多问题值得进一步思考。 问题l t 因为金融行业商业数据的保密性,我们的研究是基于模拟数据的,因 此假设数据服
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年嘉兴南洋职业技术学院单招职业适应性考试题库附参考答案详解(研优卷)
- 2026年合肥财经职业学院单招综合素质考试题库及答案详解(新)
- 2026年吉林电子信息职业技术学院单招职业技能考试题库及参考答案详解(新)
- Web应用渗透测试流程揭秘
- 住院儿童护理风险防范
- 劳动合同法实施中的工会工作
- 继续医学教育评估工作方案
- 人工气道阻塞原因与处理
- 5.7任务七 库存商品业务核算与应用
- 不同分期压疮的护理策略
- 西昌市2026年面向全国公开考调在编在职教师(30人)考试参考题库及答案解析
- 2025年通辽职业学院单招综合素质考试试题及答案解析
- 2026年莱芜职业技术学院综合评价招生《素质测试》模拟题及答案
- 2025年医师定期考核试题库及答案
- 2026年南京交通职业技术学院单招职业技能测试题库带答案详解(完整版)
- 2025年秋季学期期末考试学科质量分析报告与后续教学改进策略建议书
- 2026年及未来5年市场数据中国有效载荷系统市场全面调研及行业投资潜力预测报告
- 10KV架空线路安全施工方案
- 医院评审条款落实个案护理-慢性阻塞性肺疾病急性加重期合并Ⅱ型呼吸衰竭患者护理
- 膝关节旷置术护理指南
- 妊娠合并肝炎的围产管理及阻断策略
评论
0/150
提交评论