基于随机森林模型的信用风险预测_第1页
基于随机森林模型的信用风险预测_第2页
基于随机森林模型的信用风险预测_第3页
基于随机森林模型的信用风险预测_第4页
基于随机森林模型的信用风险预测_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

表6.5所示,运用SMOTE过采样技术处理数据后,开始对不同分类模型的预测性能进行对比分析,结果说明,决策树、逻辑回归以及支持向量机模型整体预测准确率尚可,但在识别高风险客户方面存在不足,不能有效区分信用风险的高低程度。相比之下,随机森林模型性能更优,在各项关键评估指标上表现突出,可更精准地识别高风险客户。此实验结果说明,在不平衡的金融风控数据集中,单纯依靠准确率可能致使错误的模型评估,而F1分数和召回率更能体现模型对高风险客户的识别能力,随机森林结合SMOTE过采样技术在这个任务中表现最佳,可作为信用风险预测的有效办法,未来的研究可以探寻不同的数据采样策略和集成学习方法,以此提升模型的稳定性和泛化性能。6.2关键发现6.2.1SMOTE对少数类识别率的提升程度在信用风险评估模型中,少数类样本(违约客户)的识别至关重要。未采用SMOTE过采样处理时,模型受样本不均衡影响,几乎将所有样本判定为正常客户,对违约客户的精确率、召回率和F1分数均为0。而经过SMOTE过采样处理后,违约客户(少数类)的精确率提升至0.93,召回率达到0.94,F1-score也为0.93。这表明SMOTE过采样处理极大地改善了模型对少数类样本的识别能力,使模型能够有效捕捉违约客户的特征,显著提升了少数类识别率,让模型在实际信用风险评估中更具实用价值。6.2.2过采样对整体准确率的影响图6.SEQ图6.\*ARABIC7SMOTE过采样前后评估指标对比如REF_Ref195908050\h图6.7所示未进行SMOTE过采样时,模型整体准确率较高,达到99.02%,但这是由于大量正常客户样本主导,模型简单将样本预测为正常客户类别就获得了高准确率,实际对违约客户识别能力不足。经过SMOTE过采样处理后,整体准确率降至93.47%。虽然整体准确率有所下降,然而此时模型对两类客户(正常客户和违约客户)都具备了较为均衡的识别能力,不再过度依赖某一类样本。相较于未过采样时的“虚高”准确率,过采样后的准确率更能反映模型在实际信用风险评估场景中的真实性能,是模型对样本分类能力更加平衡、有效的体现。图6.SEQ图6.\*ARABIC8信用评估关键特征重要性TOP10针对模型特征关键性展开分析,从中筛选出排名处于前十位的特征,在这些特征里,revol_bal凭借0.0941的分数占据首位,它在模型评估环节中有非常关键的地位,dti紧跟其后,其关键性分数是0.0931,revol_util以0.0866的分数位列第三。annual_inc、total_pymnt等特征也依照顺序进入了前十,这些特征可从还款能力、信用状况等多个维度反映出相关信息,可为金融信用评估以及风险管控决策给予关键的支持。总结与展望7.1总结本文聚焦于P2P网贷平台信用风险预测展开相关研究,考虑到传统信用风险评估方法在应对复杂数据时存在一定局限性,同时P2P行业因信用风险问题遭遇诸多挑战,故而研究采用随机森林模型来构建信用风险预测模型,选取LendingClub平台2018年第二季度的借贷数据作为研究对象,经过数据筛选、缺失值处理以及数据转换等一系列预处理工作,并且运用SMOTE技术来解决样本不平衡问题,以此为模型训练奠定基础。实验结果显示,未经SMOTE处理的随机森林模型在训练集和测试集上呈现出较高准确率,然而对违约客户的识别能力严重欠缺,存在过拟合现象,经过SMOTE处理之后,模型在精确率、召回率、F1分数等评估指标方面有了明显提升,对违约客户的识别能力大幅提高,泛化性能得到有效改善。与决策树、逻辑回归、支持向量机等模型相比较,采用SMOTE过采样的随机森林模型在信用风险预测中表现更佳,还识别出循环信用余额、债务收入比等关键风险评估特征,为P2P平台及金融机构的信用风险管控提供了关键依据。7.2展望虽然本研究已经取得了一些成果,不过仍然以及可以优化的地方,未来的研究可从以下几个方向着手:探寻更多种类的数据采样策略,试着把不同的过采样方法搭配起来使用,或者和欠采样技术相结合,以此优化样本的分布情况,对随机森林模型的参数优化方法做更深入的研究,探索和其他机器学习算法融合的方式,构建出更加高效的集成模型,拓展数据的维度,纳入更多和借款人信用有关的变量,让特征体系更加丰富,构建动态的信用风险评估模型,达成对信用风险的实时监测以及预警,强化研究成果与金融机构实际业务的结合程度,开发出实用的信用风险评估系统,提高金融行业风险管控的水平。参考文献周毓萍,陈官羽.基于机器学习方法的个人信用评价研究[J].金融理论与实践,2019,(12):1-8.姜琳.美国FICO评分系统述评[J].商业研究,2006,(20):81-84.DOI:10.13902/ki.syyj.2006.20.025.骆君.基于属性坐标分析的个人信用风险评估模型[J].电脑知识与技术,2011,7(16):3821-3823+3828.陈昕.商业银行个人信用风险的实证分析[J].现代审计与经济,2008,(03):37-38.张国政,陈维煌,刘呈辉.基于Logistic模型的商业银行个人消费信贷风险评估研究[J].金融理论与实践,2015,(03):53-57.杨雨,史秀红.个人信用风险计量:双边抗体人工免疫概率模型[J].系统工程理论与实践,2009,29(12):88-93.王春峰,万海晖,张维.基于神经网络技术的商业银行信用风险评估[J].系统工程理论与实践,1999,(09):24-32.DurandD.Riskelementsinconsumerinstalmentfinancing[J].NberBooks,1941.AltmanEI.Financialratios,discriminantanalysisandthepredictionofcorporatebankruptcy[J].Thejournaloffinance,1968,23(4):589-609.EisenbeisRA.Pitfallsintheapplicationofdiscriminantanalysisinbusiness,finance,andeconomics[J].Thejournaloffinance,1977,32(3):875-900.EisenbeisRA.Problemsinapplyingdiscriminantanalysisincreditscoringmodels[J].JournalofBanking&Finance,1978,2(3):205-219.张雪丽,朱天星,于立新.基于判别分析的商业银行个人信用风险评价模型研究[J].工业技术经济,2011,30(10):131-138.徐少锋.FISHER判别分析在个人信用评估中的应用[J].统计与决策,2006,(02):133-135.OdomMD,ShardaR.Aneuralnetworkmodelforbankruptcyprediction[C]//1990IJCNNInternationalJointConferenc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论