版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器学习之线性分类模型及应用研究指导老师:答辩人:目录CONTENTS实验过程研究思路选题背景总结进一步实验选题背景国内外研究现状选题背景
信用是现代市场经济的一个基本构成要素,由于国外的一些国家,尤其是发达国家关于信用评估方向已经有一百多年的研究历史,所以信用评估的方法、模型以及指标体系都相当成熟,这正是我国金融领域所欠缺的。因此,对于我国来说,迫切需要借鉴国外的一些先进研究技术,在此基础之上,建立一个适合本国运行的信用评估体系。选题背景
随着计算机技术的快速发展,人工智能系统发展的越来越成熟,于是把人工智能应用到信用风险评估方面是水到渠成的事情,本文提出神经网络、支持向量机以及决策树三种模型应用于信用评估工作中,通过在同一平台上应用这三种算法,进行比较分析,选出精确度较高的算法,为金融机构提供准确的决策依据,使信用风险管理和商业银行信贷经营更合理、更科学。选题背景国内现状
国内近几年没有出现关于个人信用方面的著作,市面上的作品大多来源于国内学者对外国个人信用评估方法方面文章的翻译。相对好一点的学者会在借鉴国外方法经验的基础上,根据国内行情,建立一个具有中国特色的个人信用评估体系,总的来说,我国信用风险评估的研究起步较晚。但是,一切的转变从改革开放开始。随着中国打破“闭关锁门”的国策,国内经济与全球经济接轨后,国内经济迅速发展,在信贷业务上也实现了从零到有的局面,信贷产品从零星到多样化,不断进步与壮大。对用户信用风险评估的精确度直接关系到贷款的质量与银行的风险,因此,国内迫切需要建立一个科学、完善的评估体系。目前,传统的主观判断客户信用水平的方法已失去了其先前的优越性,国外一些较完善的个人信用评分方法在我国又缺乏运用条件,而且在预测精度和效果的稳定性方面存在较大争议。鉴于我国复杂的社会环境和人文环境,国内各大商业银行通常利用DecisionTree算法构建判断规则。国外关于个人信用评估方面的研究已经有近百年的历史,出现过大量优秀的学者对于进行近似疯狂的探讨与分析。最早的线性判别方法是在19世纪40年代由DavidDurand提出。个人信用评估的研究自Fisher在1936年的一项开创性实验开始,经历了萌芽期、发展期和成熟期。于20世纪80年代,个人信用研究进入稳定发展阶段,目前这方面已经出版了许多颇有影响的著作,关于个人信用方面的学术文章也层出不穷,这些研究成果极大地推进了个人消费市场规模的扩展,高效的促进了各国经济的发展。因为影响信用评估问题的因素繁多且复杂,国外的学者虽然作出了很多优秀的研究与作品,但仍然不能交出一份令人满意的答卷。多数学者局限于模型的设计而忽略的信用数据本身的特性。近年来,针对信用数据的线性特征,国外一批学者尝试将统计学、数据挖掘以及机器学习等数据挖掘领域的最新成果,如多元判别分析、遗传算法、神经网络技术和支持向量机等算法应用于个人信用评分研究的[5]各个环节中。大致归纳出的指标包括:年龄、性别、婚姻状况、工作性质、工作行业、工作稳定性、工作时间、文化程度、剩余授信透支额度值、贷款金融、每月还款金额等。VS国外现状研究思路研究思路
本篇论文的研究思路是:选取当今最为广泛应用的三种算法NeuralNet、SVM、DecisionTree,通过RapidMiner工具建立三种学习模型,最后用交叉验证算法分析和验证模型的”好“”坏“,得出结论,在信用评估风险这一模块,哪种算法最适用。研究思路数据处理导入数据建立模型验证模型结果分析实验过程实验过程搜集数据,预处理数据处理好的数据导入RapidMiner工具中三种算法依次建立模型,得出模型结果用交叉验证分析模型,得出结论是”好“或”坏“01020304导入数据选择数据表导入数据设置参数角色建立模型神经网络具体权重(隐含层)具体权重(输出层)支持向量机具体权重决策树模型决策树模型图交叉验证结果分析NeuralNetSVMDecisionTree神经网络SVM决策树精确度79.30%81.30%82.00%实验问题与猜想进一步实验操作结果分析实验结论进一步实验“
前面所做的实验有一个共同的问题,不管哪一种算法,对于”0“类的处理精确度极高,相反的,对于”1“类的精确度极差。我们猜测,可能是数据量的问题导致问题的出现,所以我们接下来用不同的数据量再次做实验。实验的问题以及进一步的实验实验问题与猜想“
我们数据量的值取五组,分别是50、100、300、500、1000个数据,”0“、”1“类均分。再次用NeuralNet、SVM、DecisionTree三种算法建立模型,验证模型,算出精确度。进一步的实验数据量取1000:NeuralNetSVMDecisionTree数据量取500:NeuralNetSVMDecisionTree数据量取300:NeuralNetSVMDecisionTree数据量取100:NeuralNetSVMDecisionTree数据量取50:NeuralNetSVMDecisionTree结果分析1000组500组300组100组50组神经网络60.70%60.00%54.00%54.00%48.00%SVM65.10%65.20%57.33%61.00%50.00%决策树62.00%49.40%48.00%59.00%70.00%模型准确率样本数实验结论
上述实验中,我们可以得出结论:SVM处理大数据效果好,决策树处理小数据效果好,当数据量较小时,决策树对处理其中某一类值的效果好,数据量较大时,SVM对处理其中某一类值的效果好。总结总结
在个人信用风险评估这一模块,我们通过大量的实验证明,SVM和决策树对于处理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 旅行社计调员岗位面试要点介绍
- 吸痰护理的适应症与禁忌症
- 应届毕业生就业方向指南
- 法治教育演讲模板
- 旅游公司策划部总经理助理的职责与挑战
- 客户回访与满意度提升案例分析
- 护理工作沟通技巧
- 零售连锁店总经理的招聘面试技巧
- 乐高玩具市场部专员招聘面试流程解析
- 护理信息技术应用与趋势
- 2026年及未来5年中国UPS电池行业市场全景监测及投资战略咨询报告
- 2025年新《煤矿安全规程》知识竞赛试题及答案
- 2026年常州纺织服装职业技术学院单招职业技能考试题库附参考答案详解(夺分金卷)
- 2026年通信安全员ABC证考试题库及答案
- 2026年温州永嘉县国有企业面向社会公开招聘工作人员12人考试备考题库及答案解析
- 2026小学教师资格证考试《综合素质》能力测试试题含答案
- 小区公共食堂经营管理办法
- 家长夜校实施方案
- 2026年武汉启云方科技有限公司校园招聘-备考题库参考答案详解
- 北京协和医学院攻读医学科学(理学)硕士学位研究生培养方案
- 船舶绿色制造技术
评论
0/150
提交评论