消费者信用评分-风险管理的基础工具_第1页
消费者信用评分-风险管理的基础工具_第2页
消费者信用评分-风险管理的基础工具_第3页
消费者信用评分-风险管理的基础工具_第4页
消费者信用评分-风险管理的基础工具_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,风险管理的基础工具-信用评分,Agenda,信用评分的定义、分类及简要历史信用评分模型开发流程数据准备变量定义及分组模型分组建立评分卡的方法度量评分卡的表现评分卡的实施、监测与跟踪,信用评分的定义、分类及简要历史,定义分类简要历史,信用评分的定义、分类及简要历史定义,信用评分指帮助放贷机构发放消费信贷的一整套决策模型及其支持技术。这些技术决定谁能得到贷款、得到多少贷款、以及提高放贷款机构盈利性的操作战略(Lyn C. Thomas etc., 2002)个人信用评分是预测贷款申请人或现有借款人违约可能性的一种统计方法,它利用贷款人的历史数据和统计方法及其他定量方法对贷款申请人的不同特征对申请人拖欠和违约行为的影响进行分析。信用评分对不同的申请人产生不同的“分数”,商业银行可以利用这一分数对贷款申请人或借款人的违约风险进行排序(Lewis,E.M,1992),信用评分的定义及简要历史-定义,评分卡(scorecard)的一个例子,信用评分的定义、分类及简要历史定义,信用评分的基本思想信用评分是一种用来预测借款人违约可能性的方法。其实质是模式识别中的一类分类问题-将借款人划分为履约(如能够按期还本付息,即“好”客户)和违约(即“坏”客户)两类具体做法是根据历史上每个类别(履约、违约)的若干样本,从已知的数据中考察借款人的哪些特征对其拖欠或违约行为有影响,从而总结出分类的规则,建立数学模型,用以测量新的借款人的违约风险,信用评分的定义、分类及简要历史定义,利用信用评分进行决策优点速度-审批过程自动化-节省信贷审批时间,提高审批效率一致性-减少贷款审批过程中的主观性准确性-贷款机构在进行信贷决策时可以同时考虑多种因素,信用评分的定义、分类及简要历史定义,“信用评分技术极大地减少了信用评估的成本,改善了信贷决策的一致性、速度和准确性” “(信用评分技术的应用)已经远远超出了它们原来仅用于信用风险评估的目的。现在信用评分技术已被应用于评估帐户关系的风险调整获利能力、用于确定借款人初始及后来的信用额度、用于贷款欺诈的预防、拖欠干预以及减少不良贷款损失等多方面。信用评分系统的广泛应用在促进提高决策效率及扩展信贷供给系统等方面扮演了一个重要的角色,它扩大了贷款机构愿意提供信贷服务并且能够产生盈利的客户总体”格林斯潘2002年10月在美国银行家协会(American Banker Association)的一次演讲,信用评分的定义、分类及简要历史-分类,从信贷决策过程看申请评分行为评分从建立评分模型所使用的数据来源看“通用化评分”(generic scoring) -利用征信局数据;或:几个小的贷款机构数据合并到一起-一般不针对单个信用产品“定制化评分”(custom scoring)-一般针对某个信用产品开发-建模数据来自征信局及贷款机构内部,信用评分的定义、分类及简要历史-简要历史,学术界:Durand(1941): 第一个将判别分析的思想应用到信贷领域。他在美国经济研究局的一个分析报告中提出可以用判别分析的方法来区分“好”的贷款和“坏”的贷款,从而对贷款的信用风险进行评价商业界:20世纪30年代,美国一些从事邮购业务的公司就开始引入数量化的信用评分系统来克服信用分析人员在进行信用决策时的不一致性-基于经验而不是数学模型第二次世界大战开始:金融机构及直销公司开始引入数量化的评分系统20世纪50年代初:Bill Fair and Earl Isaac 在旧金山最早建立此方面的咨询公司,信用评分的定义、分类及简要历史-简要历史(续),20世纪60年代后期:信用卡出现。由于每天申请的人数众多,银行不可能完全依赖人工对申请进行审批,必须有一套自动的评分系统。当这些金融机构利用评分系统时,它们同时还发现信用评分系统有着比人工主观判断更好的预测能力-利用评分系统后贷款的违约率降低了50%以上!20世纪80年代开始:随着信用评分方法在信用卡领域应用的成功,银行开始将信用评分方法应用于其他金融产品在其他领域:20世纪90年代开始,许多直销公司利用评分方法来改进广告销售中的反应率。实际上,西尔斯公司在20世纪50年代就开始用评分模型来决定将其商品目录寄给哪些客户从而提高回复率。,信用评分模型(评分卡)的开发流程,数据准备变量定义及分组模型分组建立评分卡的方法度量评分卡的表现评分卡的实施、监测与跟踪,评分卡的开发流程数据准备,确定建模总体-从何处抽取建模的数据? 要求:(1)建模总体与未来可能的信用申请人总体(through-the-door population)类似;(2)应该包括足够多的不同类型的还款行为(好客户、坏客户)两者有一定矛盾!,评分卡的开发流程数据准备,定义“好客户”和“坏客户”-取决于开发评分卡的目的、管理需要和市场策略好客户:授信机构预期这些客户能够按时还本付息,愿意为其提供消费信用;坏客户:授信机构预期这些客户不能按期还本付息从而不愿意为其提供消费信用在一个建模总体中,定义了坏客户并不意味着其余的都是好客户(或者相反)。通常至少还存在两类其他类型的客户:不能确定好坏的客户;没有足够经历的客户,评分卡的开发流程数据准备,定义“好客户”和“坏客户”一个循环账户的例子好客户:(1)在帐户系统中至少存在10个月;(2)在最近10个月中至少有6个月是活动的;(3)在过去的24个月中至少3次消费了50元以上;(4)在过去的24个月中没有一次拖欠超过30天坏客户:(1)50元以上的未偿还余额的拖欠时间超过90天;(2)在过去12个月中50元以上未偿还余额至少3次拖欠超过60天;(3)破产,评分卡的开发流程数据准备,抽取样本-遵循的总体原则样本代表性-对不同的客户类型有代表性;样本充分性-足够多的样本,太大或太小均不合适 Lewise(1992)建议:1,500个好客户和1,500个坏客户就够了;Makuch(1999):一旦有100,00个好客户样本,就没有必要增加更多好客户的信息。 因此一个典型的情形是:将所有的坏客户都选入样本中,选取的好客户数在100,00个以内样本的时效性-样本的观察期越近越好。但:观察期太近则 可能表现期较短,客户的表现(好、坏)可能看不出来,或坏客户样本不够,评分卡的开发流程数据准备,抽取样本-遵循的总体原则(续)样本的排除性-由于政策原因而不会被发放贷款的客户应该从样本中剔除(如:年龄不够、破产、在征信局没有记录的人)-那些将会自动发放贷款的客户也不应该包括在样本中(如:具有某种特别储蓄产品的客户、本贷款机构的雇员、其他重要客户等),评分卡的开发流程数据准备,抽取样本-方法 一般采用按照几个重要指标分层随机抽样方法,评分卡的开发流程数据准备,拒绝推论(reject reference)问题问题的引起:对总体中那些过去的申请被拒绝的客户,我们不能判断他们是好客户还是坏客户。若将这部分客户简单地从样本中剔除,那么样本就不能反映“入门总体,模型会产生拒绝偏差(reject bias)。如何处理这一问题?是各开发信用评分系统的商业机构寻求竞争优势的领域。处理的方法(1)构造一个无拒绝的全样本。难以被银行所接受(2)定义为坏客户。太简单、粗糙(3)数理统计方法:外推、增补、混合分布,等(4)三向分组法(好、坏、被拒绝),评分卡的开发流程-变量定义及分组,评分模型的中变量:表现变量(因变量),可以是分类变量,如好/坏、响应/不响应、激活/不激活等,也可以是连续变量,如:收益、损失.特征变量(预测变量)-即是建模时使用的,也用于未来的预测,评分卡的开发流程-变量定义及分组,可利用的特征变量申请人填写的申请表征信局的查询账户的交易记录-仅针对行为评分,评分卡的开发流程-变量定义及分组,可利用的特征变量之一-申请表链接三家机构的申请表.doc注意申请表中信息的陷阱:如:申请人职业。有很多种职业,因此很难对它进行编码。一种处理方法是对职业设定特征项,如:高级主管人员、体力劳动者、经理人员,等等。即使这样处理,“经理人员”这样的项也会产生很多问题,因为一个经理人员可能管理的是一个有几千个雇员的工厂,另一个却可能收入:每年or每月?家庭总收入or 申请人收入?,评分卡的开发流程-变量定义及分组,可使用的特征变量-征信局的查询贷款机构共享的信息以前的查询记录汇总信息欺诈预警征信局增值信息可获取的公共信息(如:选举名册、法院判决等)*在中国,法院判决可从相关司法网站查到!,评分卡的开发流程-变量定义及分组,账户的交易记录 -反映交易特征的变量:最常用的-帐户上个月、过去6个月或12个月的平均余额、最大和最小余额、信用交易总额、负债总额等-反映消费者不当行为的变量,如:在使用信用卡时超过信用额度的次数、给消费者发提示信的次数等。 从交易数据中可以生成大量的变量,这些变量之间可能有很强的相关关系,确定保留哪些变量和忽略哪些变量需要一定的艺术。,评分卡的开发流程-变量定义及分组,特征变量的粗分组-将特征变量的可能回答(即特征项)划分成数目相对较少的类别分组的必要性:对分类型特征变量,可能存在太多的回答选项(或特征项),这可能使得个别特征项的样本数目太少从而影响分析的稳健性;对连续性特征变量,风险可能是非线性的;评分卡的习惯,评分卡的开发流程-变量定义及分组-例子,10,000个客户样本,好、坏发生比(Odds)=9:1链接居住状况计数结果.doc重新分组的原则将样本容量少的特征项进行合并将“发生比”较接近的特征项予以合并分组的结果应便于理解并满足和符合管理的需要,评分卡的开发流程-变量定义及分组-例子,分组的方法计算个特征项的好客户发生比(Odds)链接居住状况计数结果.doc将三个样本数量小的特征项- “未知”、“分期付款购买公寓”、“自己拥有公寓”-合并成一组,称为“其他”“租赁无家具住房”和“租赁有家具住房”的好客户Odds很接近,我们将它们也合并成一组,称为“租赁住房”“分期付款购买住宅”和“自己拥有住宅”的发生比也较接近,将它们合并成一组,称为“自有住宅”重新分组后的结果(表3)链接居住状况计数结果.doc,评分卡的开发流程-变量定义及分组-例子,分组的方法特征项“其他”的好客户数和坏客户数仍然较少,我们可以进一步考虑将该特征项合并到前两个特征项中方法一:将“其他”与“租赁住房”合并(表4)方法二:将“其他”与“自有住宅”合并(表5)哪种合并方法较好?可以用统计学方法检验:(1) 卡方统计量(2)信息价值( information value),评分卡的开发流程-变量定义及分组-例子,评分卡的开发流程-变量定义及分组-例子,评分卡的开发流程-变量定义及分组-例子,评分卡的开发流程-变量定义及分组-例子,连续型特征变量(如年龄、收入、在现住址住居时间等)的分组:在特征变量取值范围内将特征变量划分成若干组(10组甚至100组),每组所包含的客户数占全部客户数的百分比相等,例如将年龄分成10组,第一组为最年轻的10%的客户,第二组为次年轻的10%的客户,等等。做了这样的分组后,就相当于将连续型特征变量转化成了分类型特征变量。我们利用上面介绍的方法考虑是否将临近的组进行合并。,评分卡的开发流程-变量定义及分组-例子,评分卡的开发流程-变量定义及分组-例子,评分卡的开发流程-变量定义及分组-例子,评分卡的开发流程-变量定义及分组,选择进入评分卡的特征变量专家咨询法。也就是充分利用专家的经验和知识,确定哪些变量应该进入到模型中统计学中的逐步回归(stepwise regression)或逐步判别(stepwise discriminant)等方法通过测度某特征变量i中“好” “坏”客户的风险分布之间的差异来确定该变量是否可以进入模型,例如:信息价值(information value,IV),评分卡的开发流程-变量定义及分组-IV,评分卡的开发流程-模型分组(Segmentation),模型分组-将总体划分成几个子总体,然后对不同的子总体分别建立评分卡,由于贷款政策或统计上的原因统计上的原因:例如,在行为评分卡中,常常对最近的客户和存在时间较长的客户建立不同的模型,这仅仅是由于一些特征变量(如:帐户上6个月平均余额)对于后者是可以得到的,对于前者则可能得不到贷款政策:例如贷款机构希望对年轻的顾客(如:大学生)和年纪稍大的顾客的申请有不同处理方法,这时可能针对25岁以下和25岁以上的客户分别建立评分卡,评分卡的开发流程建立评分卡的方法 判别分析:将两个组区分开,评分卡的开发流程建立评分卡的方法 判别分析:将两个组区分开,建立评分卡的方法-线性回归法:直接估计违约概率,建立评分卡的方法:Logistic回归估计(好客户or 坏客户)发生比(Odds),建立评分卡的方法:Logistic回归估计(好客户or 坏客户)发生比(Odds),建立评分卡的方法:分类树法非线性评分卡,基本思想:按照某个特征变量的取值将客户分成两个子组,使得在同一组内客户的违约概率尽量一致,而不同组之间客户的违约概率差距尽量地大。然后再将这些子组进行进一步的划分,并不断重复这一过程直到达到一定的要求才终止(最后的子组成为终端节点)。最后可以将每个终端节点按一定的规则划分为“好”客户或“坏”客户。整个过程可以用一个树状结构来表示。,建立评分卡的方法:分类树法非线性评分卡,建立评分卡的方法:线性规划法,建立评分卡的方法:线性规划法,建立评分卡的方法:神经网络,神经网络:模仿人脑信息加工过程的智能化信息处理技术。神经网络模型的类型较多,目前已不下数十种。其中多层感知器(Multilayer perceptron,MLP)网络在分类问题中使用最多。信用评分实际上是一个分类问题,因此我们也使用这一模型。 一个典型的多层感知器(MLP)由一个输入层、一个或若干个隐含层、一个输出层组成,每个层中又包含若干个节点。每个节点处理自身的输入并产生一个输出,并将此输出传递到下一层的节点,建立评分卡的方法:神经网络有一个隐含层的感知器神经网络,建立评分卡的方法:专家系统,仿效专家决策行为的过程的集合。组成部分:首先,有一个知识库,其中通常包含规则;其次,有一个推理机,在推理机中有一系列的事实与规则相匹配,从而提供推荐的行动程序。推理机可以对推荐的行动进行解释,系统中也可以有一个工具对知识进行更新。规则(通常称为产生式规则,production rule)可以是“如果,那么”这样的形式。例如,一个规则可能是“如果每年的支付超过年收入的50%,那么这笔贷款将不会被偿还”。专家系统在预测信用卡使用者中的欺诈行为方面有较多应用,度量评分卡的表现-混合矩阵,度量评分卡的表现分离度统计量(Separation Statistics),度量评分卡的表现分离度统计量,度量评分卡的表现K-S统计量,例子链接表 客户信用分数分布表及K.docK-S统计量是区分度统计量的最大值(见下页图),度量评分卡的表现K-S统计量,度量评分卡的表现K-S统计量,K-S统计量的经验法则(Mays, E.,2001)(1)K-S小于20:模型可能无使用价值;(2)K-S在2040之间:不错;(3)K-S在4150之间,好;(4)KS在5160之间,很好;(5)K-S在6175之间,非常好;(6)K-S在76以上:太好,值得怀疑。,度量评分卡的表现ROC曲线和Gini系数,评分卡的实施与跟踪,实施评分卡时要考虑的一些问题临界分值(Cutoff)的选择人工修正初始信用额度的确定怎样处理“流水线(pipeline)”客户?,实施评分卡时要考虑的一些问题-临界分值(Cutoff)的选择,临界分值:若申请人的信用得分在该分数之上,评分系统建议批准该申请人的贷款申请;若申请人的信用得分在该分数之下,评分系统建议拒绝申请人的贷款申请理论上:如果从一个好客户帐户所得到的净利润是已知的,一个坏客户帐户所造成的损失也是已知的,那么我们只要计算多少个好客户的利润才能弥补一个坏客户造成的损失,好客户与坏客户的这一比率所对应的分数就是合适的临界分值但实际上:从一个好客户得到的净利润和一个坏客户造成的损失往往很难确定的,实施评分卡时要考虑的一些问题-临界分值(Cutoff)的选择,解决办法:办法之一:评分卡运行初期,临界分值应使得贷款申请批准比率基本上与模型使用前的批准比率保持一致。待模型的表现取得了管理层的信任后,我们就可以更容易地调整临界分值从而满足管理目标办法之二:临界分值使得预测的坏帐率与当前的坏帐率相等,实施评分卡时要考虑的一些问题-临界分值(Cutoff)的选择,实施评分卡时要考虑的一些问题-人工修正,人工修正:指贷款机构作出的决策与评分系统所建议的相反高端人工修正(HSOs)是指尽管申请人的分数超过临界值,但仍然不给予贷款;低端人工修正(LSOs)是指尽管申请人的分数低于临界值,仍然给予贷款,实施评分卡时要考虑的一些问题-人工修正,为什么会有人工修正呢?贷款机构对这些客户掌握了更多的信息贷款机构的政策发生了变化,实施评分卡时要考虑的一些问题-人工修正,人工修正的三种类型-之一信息类人工修正(不太常见):贷款审批人掌握了建立信用评分模型时所不具有的信息。如:一个申请人的信用得分很高,但是刚刚因为犯罪被投进了监狱;一个信用得分低于临界分值的申请人,贷款审批人知道他(她)刚刚得到了一份新的工作,如果用这一新的收入对此申请人进行评分,其总分数会超过临界分值,这时就应该接受其贷款申请。 在实际中,这种信息类人工修正发生的机会较少。尽管如此,信贷部门也应该对这种情况作出安排,将这种案例记录下来,以便于以后对评分模型的表现进行分析。,实施评分卡时要考虑的一些问题-人工修正,人工修正的三种类型-之二政策类人工修正。当管理部门为某些特定类型的申请人制定特殊的审批政策时,就可能产生政策类人工修正。例如,如果授信机构确定长期来看当地大学的学生可能是一个潜在的客户群体,即使按目前的状况他们的信用得分不能达到临界分值,授信机构也可能批准这些未达到临界分值的学生中的一部分人的申请以期培养一些忠诚的客户政策类人工修正时应该有一套完整的规则。例如,银行可以制定这样的政策:对于在本银行开设帐户的企业,若帐户中的余额超过100万元,那么公司中任何高级管理人员申请信用卡都会批准;若帐户中的余额在10万100万元之间,那么仅对企业总裁的申请实行人工修正;若帐户中的余额小于10万元,那么可以对企业高级管理人员的信用得分加15分,而对其他职员加5分,加分后达到临界值的就批准其申请,否则不予批准,实施评分卡时要考虑的一些问题-人工修正,人工修正的三种类型-之三制度类人工修正。这是一种使用最普遍但是最没有明确理由的人工修正。当贷款审批人感到申请人有某种不能解释的“弱点”时,他的判断和经验告诉他批准该申请是不明智的,此时审批人会采用人工修正。当然也存在相反的情形:当审批人感到申请人“很强”时,尽管其信用得分低于临界值,也会考虑批准其申请。在这两种情况下,审批人都不能解释做出这种决定的明确理由,只是宣称作出这样的决定是基于自己的经验,实施评分卡时要考虑的一些问题-初始信用额度的确定,在大多数信用评分系统的建立过程中,对于好、坏帐户的定义都只是考虑了贷款机构对帐户的表现是否满意而没有考虑信用额度问题,因此不能仅仅将信用评分作为确定信用额度的唯一依据。 在安装信用评分系统之前,每个贷款机构都有自己确定信贷额度的政策,在一些情形下给每个借款人同样的额度,在另一些情形下则根据借款人的某种特征给予不同的额度。这些政策不应该因为安装了新的信用评分系统而发生改变。相反,由于建立信用评分模型所使用的数据总体中客户的信用额度是按照当前的政策确定的,所以应该坚持当前确定信用额度的政策。,实施评分卡时要考虑的一些问题-如何处理流水线客户,在许多情况下,当我们实施新评分卡时,有一些客户正处在流水线上。两种处理方法:仍然采用原来的决策(在有些情况下,如果银行答应了给某人提供贷款,而在他的状况没有发生变化时又撤消了,这时我们将处于不利的地位),并且在开始的几个星期接受那些边缘客户的申请(这可能要求对那些通不过的客户有一个系统的人工修正方法使他们能够通过)另一种选择是严格地坚持新的评分卡的评价结果,出现与原来的决策相反时,通知申请人 总之,在实施新的评分卡之前,需要制定一定的规则来处理这些问题。,评分卡的监测,监测什么?评分卡的使用是如我们所预期的那样吗?对评分卡的人工修正是否保持在一个尽可能低的水平?人工修正有确实的理由吗?最普遍的理由是哪些?评分卡对贷款风险的排序是否与所期望的一致,或者评分卡的表现是否出现退化?好、坏客户发生比(或坏客户比率)与我们实施评分卡时的预期是否一致?贷款申请人的特征是否发生了变化?是否有更多分数低的消费者申请贷款但是被拒绝了?他们的特征是什么?帐户的信用分数的分布是否发生了变化?,评分卡的监测,运行监测报告前端跟踪报告(front-end reports),在评分卡开始实施时就产生,分析有关帐户的表现(如好客户和坏客户的发生比率),而是分析申请人分数的分布以及进入评分卡中的特征变量的分布情况 总体稳定性报告; 特征变量分析报告; 人工修正比率报告; 人工修正原因报告,评分卡的监测,运行监测报告(续)后端跟踪报告(back-end reports):用于度量评分卡的有效性,对帐户的表现进行评估(是好客户还是坏客户),往往需要在评分卡实施几个月之后才能进行这样的分析 好客户/坏客户区分报告 早期表现分数报告,etc.,评分卡的监测-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论