银行信贷问题数学建模优秀论.doc_第1页
银行信贷问题数学建模优秀论.doc_第2页
银行信贷问题数学建模优秀论.doc_第3页
银行信贷问题数学建模优秀论.doc_第4页
银行信贷问题数学建模优秀论.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2015高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的参赛报名号为(如果赛区设置报名号的话): 3 所属学校(请填写完整的全名): 延安大学西安创新学院 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2015年 8 月 4 日赛区评阅编号(由赛区组委会评阅前进行编号):2015高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):银行信贷业务问题摘要银行信贷业务是银行最基本、最重要的资产业务,通过发放银行贷款收回本金和利息,扣除成本后获得利润。银行为了获得更大的利润,对每一位顾客的信息进行分类,然后对不同的顾客采用不同的方案。针对问题一本文应用SPSS软件对附件bank1中的部分数据进行二元Logistic回归分析。建立Logistic回归方程,并将数据带入计算出比值,当比值时,此客户有贷款;当比值时,此客户无贷款。针对问题二本文应用SPSS软件构造决策树模型对有贷款和无贷款的模型进行细分,只选取题中所给数据bank1中贷款、工作、婚姻状况、年平均余额等数据,把有无贷款定义为因变量,贷款、工作、婚姻状况、年平均余额定义为自变量,画出决策树。把决策树的每一个分支作为一个分类,由此本文把有贷款的和无贷款的各分为五类。针对问题三本文将其分为两个小问题来解决,(1)任意给出一个客户信息通过问题一所建立的模型判断此客户是否可能购买贷款产品,当时,客户有贷款,可能购买贷款产品;当时,客户无贷款,不可能购买贷款产品。(2)根据问题二构造的决策树模型,判断出此客户应该购买相应的贷款产品。关键词:Logistic回归分析 决策树 比值判别法一、 问题的重述银行信贷业务是银行最基本、最重要的资产业务,通过发放银行贷款收回本金和利息,扣除成本后获得利润。一般来说,银行信贷业务是银行赢利的重要手段,所以很多银行都推出了很多新的业务来满足更多人士的贷款需求。从银行信贷业务的分类来说,可以分为法人信贷业务、个人信贷业务。其中法人信贷业务包括项目贷款、流动资金贷款、小企业贷款、房地产企业贷款等;个人信贷业务包括个人住房贷款、个人消费贷款、个人经营贷款等。银行信贷业务同时也是风险性较大的一种业务。按照贷款期限来说,银行信贷业务分为短期贷款,即一年以内;中期贷款,即一年以上五年以下;长期贷款,五年以上等三种类型。按保障条件来分,银行信贷业务可以分为信用贷款、担保贷款和票据贴现等三个类别。某银行为了对客户提供更好的信贷服务,对信用卡客户进行了详细的分析和调查。调查主题是对某种家庭和个人背景的用户成为银行信贷的潜在客户的可能性进行分析与判断。问题一:建立能够描述有贷款和无贷款的客户的基本背景数据模型;问题二:对有贷款和无贷款的客户群进行细分建模;问题三:给定一个客户的背景,判断其是否可能购买贷款产品,如果可能的话建议其购买哪种贷款产品。二、 问题的分析2.1问题一的分析问题一要求我们建立能够描述有贷款和无贷款的基本背景的数据模型,本文首先将bank1中的数据进行处理(数据见附录一),然后把数据导入SPSS中进行二元Logistic回归分析。假设是否贷款只与age、工作、婚姻状况、受教育程度、是否有房贷有关。回归分析时因变量为是否贷款,协变量为age、工作、婚姻状况、教育程度、是否有房贷,并且设置进入概率为,分类标准值为0.5,分析贷款与自变量之间的关系,建立Logistic回归模型,从而描述客户的背景。2.2问题二的分析问题二要求我们对有贷款和无贷款的客户群进行细分建模。首先在题中所给数据bank1表格中选取贷款、工作、婚姻、年平均余额的数据,并将这些数据导入SPSS软件中,构建决策树模型。2.3问题三的分析问题三要求我们给定一个客户的背景,判断其是否可能购买贷款产品,如果可能的话建议其购买哪种贷款产品,在这一问中我们把它分为两小问来处理。(1)给定一个客户的信息判断其是否可能购买贷款产品,然后把个人信息代入到问题一所建立的模型中,得出他是否会购买贷款产品。(2)首先我们把问题二中得到的有贷款的客户细分类进行贷款产品配对,然后把客户信息代入问题二的模型中,看出应该给他推荐哪一类贷款产品。三、 模型假设与符号说明3.1模型假设1.假设有无贷款只与age、工作、婚姻状况、教育程度、是否有房贷有关,与其他因素无关。2.假设客户购买贷款产品只与家庭背景有关。3.2符号说明符号符号含义预测概率比值工作婚姻状况教育程度有无住房贷款工作所对应的系数教育程度所对应的系数婚姻状况所对应的系数有无住房所对应的系数四、 模型的建立与求解4.1问题一的分析与处理问题一要求我们建立能够描述有贷款和无贷款的基本背景的数据模型,本文首先将bank1中的数据进行处理(见附录一),然后把数据导入SPSS中进行二元Logistic回归分析1-2。假设是否贷款只与age、工作、婚姻状况、受教育程度、是否有房贷有关。回归分析时因变量为是否贷款,协变量为age、工作、婚姻状况、教育程度、是否有房贷,并且设置进入概率为,分类标准值为0.5,分析贷款与自变量之间的关系,从而描述客户的背景。以下是利用SPSS软件进行Logistic回归分析得:表1 案例处理汇总未加权的案例aN百分比选定案例包括在分析中4521100.0缺失案例0.0总计4521100.0未选定的案例0.0总计4521100.0表1给出了案例处理汇总摘要。从该表可以得到参与回归分析的样本数据共有4521个,没有缺失案例,参与率为100%。表2 因变量编码初始值内部值No0Yes1表2给出了因变量在迭代运算中的编码表,从该表可以看出无贷款的编码0,有贷款的编码是1。表3 分类表a,b已观测已预测贷款百分比校正noyes步骤 0贷款no38300100.0yes6910.0总计百分比84.7a. 模型中包括常量。b. 切割值为 .500表3给出了模型中只有常数项而无自变量时,正常预测的百分率为84.7%。也就是说,原数据的4521个观察个体中,无贷款的有3830人,有贷款的有691人,如果每一个个体均分布到无贷款中,则可以的到正确预测百分率为84.7%。表4 方程中的变量BS.E,WalsdfSig.Exp (B)步骤 0常量-1.712.0411716.6961.000.180表4给出了模型中只有常数项而无自变量时的回归参数及其检验结果。这里,为参数的渐进标准误,为卡方值在自由度为1时对应的检验值。表5 未在方程中的变量得分dfSig.步骤 0变量age.5721.449工作47.19111.000工作(1)2.6751.102工作(2)1.1991.273工作(3).3521.553工作(4)4.7381.030工作(5)8.0131.005工作(6)1.3441.246工作(7).1811.670工作(8).0321.859工作(9)11.2101.001工作(10)2.1501.143工作(11)5.8161.016婚姻10.8802.004婚姻(1)4.7081.030婚姻(2)10.6331.001教育39.7983.000教育(1)1.2421.265教育(2)8.5291.003教育(3)27.6041.000住房housing(1)1.5391.215总统计量83.01718.000表5为单变量分析结果。在将每个变量放入模型之前,采用得分检验方法,检验某一自变量与应变量之间有无联系。由表可看出,自由度,相应的值为0.002。又因为检验标准为0.05,说明模型全局性检验有统计学意义。表6 Hosmer 和 Lemeshow 检验的随机性表贷款= no贷款= yes总计已观测期望值已观测期望值步骤 11428428.8292625.1714542413404.8214250.1794553392396.9726257.0284544386389.3506561.6504515391385.2346166.7664526381379.7777172.2234527373372.1477777.8534508360366.3019184.6994519349361.15410390.84645210357345.41593104.585450表7 分类表a已观测已预测贷款百分比校正noyes步骤 1贷款no38300100.0yes6910.0总计百分比84.7a. 切割值为 .500表8 方程中的变量BS.E,WalsdfSig.Exp (B)EXP(B) 的 95% C.I.下限上限步骤 1aage-.008.0052.4311.119.992.9821.002工作27.84111.003工作(1)-.038.245.0241.876.963.5951.557工作(2)-.210.228.8461.358.811.5191.267工作(3)-.123.227.2971.586.884.5671.378工作(4)-.033.229.0201.886.968.6181.515工作(5)-.327.363.8121.368.721.3541.469工作(6).541.2713.9981.0461.7181.0112.920工作(7)-.606.3572.8831.090.545.2711.098工作(8)-.093.295.1001.752.911.5111.625工作(9)-1.6011.0402.370261.548工作(10).078.238.1081.7431.081.6791.722续BS.E,WalsdfSig.Exp (B)EXP(B) 的 95% C.I.下限上限步骤 1a工作(11)-2.6471.0316.58410.010.0710.0090.535婚姻9.03720.011婚姻(1)-0.4010.1556.66610.010.670.4940.908婚姻(2)-0.0930.1290.51810.4720.9110.7081.173教育23.57430教育(1)-0.3040.1374.92210.0270.7380.5640.965教育(2)-0.3160.1286.08710.0140.7290.5680.937教育(3)-1.5980.39316.531100.2020.0940.437房贷(1)0.0550.0890.38110.5371.0570.8871.259常量-0.9860.3289.04110.0030.373a. 在步骤 1 中输入的变量: age, 工作, 婚姻, 教育, 房贷.由表8可建立Logistic预测概率模型,其中、分别表示12种工作,失业、管理人员、蓝领、自由职业者、技术员、企业家、服务、行政管理、学生、女仆、退休、未知的,、分别表示结婚、单身、离婚,、分别表示初级的、高等的、中级的、未知的, 、分别表示无住房贷款、有住房贷款。、分别表示十二种工作所对应线性回归的系数,、分别表示结婚、离婚,、分别表示教育程度初级的、高等的、中级的,、分别表示无住房贷款、有住房贷款由表可知,B为这些变量对应的标准化回归系数,建立的模型为 假设建设了如下的Logistic回归方程:对于变量,如果有则为1,无为0,比如:客户工作为蓝领,其他变量为0,以此类推。比值3:当比值时,客户有贷款;当比值时,客户无贷款。4.2问题二的分析与处理问题二要求我们对有贷款和无贷款的客户群进行细分建模。首先在题中所给数据bank1表格中选取贷款、工作、婚姻、年平均余额的数据,并将这些数据导入SPSS软件中,然后应用决策树分析建立模型1-2。本文以贷款为因变量,工作、婚姻、年平均余额为自变量而建立的模型,以下是该模型的结果。表9 模型汇总指定增长方法CHAID因变量贷款自变量工作, 婚姻, 年平均余额验证无最大树深度3父节点中的最小个案100子节点中的最小个案50结果自变量已包括年平均余额, 婚姻, 工作节点数8终端节点数5深度3由表9可知,本文选用的生长方法为分类与分类树,因变量为贷款,自变量为工作、婚姻、年平均余额为自变量,最大树深为3层结果共有8个结,终末结有5个,树深实际为2个。表10 风险估计标准 误差.153.005增长方法:CHAID 因变量列表: 贷款表11 分类表已观测已预测noyes正确百分比No38300100.0%Yes6910.0%总计百分比100.0%.0%84.7% 增长方法:CHAID 因变量列表: 贷款表11显示了有无贷款所占的比例。图一 系统分类树结构图图一是系统分类树结构图,根结中无贷款的占84.7%,共有3830例;有贷款的占15.3%,共有691例;通过年平均余额分类,年平均余额归类为节点1,年平均余额归类为节点2,年平均余额为则归类为节点3;通过婚姻状况分类,结婚和离婚的归类为结点4,单身的分类为结点5,再更加工作是否自由将工作分为两类,第一类工作有:失业、管理人员、技术员、服务、行政管理人员、学生、女仆、未知的;第二类工作有:蓝领、自由职业者、企业家、退休,结构图中还计算出各类所占的比例和这类的人数。根据分类树结构图和终末结的分类规则(规则见附录三),将有贷款分为五类,无贷款的分为五类有贷款:第一类:年平均余额的人第二类:年平均余额的人第三类:年平均余额为,结婚和离婚的人第四类:年平均余额为单身的第一类工作者第五类:年平均余额为单身的第二类工作者无贷款:第一类:年平均余额的人第二类:年平均余额的人第三类:年平均余额为,结婚和离婚的人第四类:年平均余额为单身的第一类工作者第五类:年平均余额为单身的第二类工作者4.3问题三的分析与处理银行信贷业务是风险较大的一种业务,按照贷款期限来说,银行信贷业务可分为短期贷款、中期贷款、长期贷款,按保障条件来分,银行信贷业务可以分为信用贷款、担保贷款、票据贴现等三个类别。问题三要求我们给定一个客户的背景,判断其是否可能购买贷款产品,如果可能的话建议其购买哪种贷款产品。首先,针对客户是否可能购买贷款产品,我们先将客户背景代入问题一所建立的模型中,计算比值,当时,客户有贷款,可能购买贷款产品;当时,客户无贷款,不可能购买贷款产品。我们任取一个客户资料:年龄,43、工作,服务、婚姻状况,结婚、受教育程度,初级、有住房贷款、年平均余额,-88。由客户的信息可以知道,我们将、其他变量为0代入到问题一所建立的模型中,计算得到,所以该客户有贷款,有可能购买贷款产品。然后,根据客户的背景,建议其购买那种贷款产品。对于这个问题,由本文问题二可以知道将有贷款的客户和无贷款的客户细分为十类,由此我们建议他们购买不同的贷款产品,具体建议如下图二所示。有贷款年平均余额 =724.0 1短期的信用贷款贷款2短期的信用贷款贷款结婚、离婚单身第一类工作3中期的信用贷款第二类工作4中期的票据贴现5长期的票据贴现图二 贷款分类图根据上述建议,该客户应该购买短期的信用贷款。五、 模型评价5.1模型优点:1)本文运用Logistic回归模型,此模型首先考虑的是选择变量进入模型,先选定一个回归变量,然后逐个引入其他回归变量,这样就将对结果影较小的变量淘汰,所以此模型计算量小。2)这个模型有相应的软件支持,可信度高。决策树阶段明显,便于理解。5.2模型缺点:影响因素考虑不够全面。六、 参考文献1 宇传华.与统计分析M.北京:电子工业出版社,2007.2 陈胜可.统计分析从入门到精通(第二版)M.北京:清华大学出版社,2013.3 k1h2d33. 百度文库./view/8bcaa5bafd0a79563c1e720f.html?qq-pf-to=pcqq.discussion.2015-8-2.七、 附录附录一问题一bank1中的数据处理结果:附录二问题二bank1中的数据处理结果:附录三这是每一个终末结的分类规则:STRING pre_001 (A3)./* Node 1 */.DO IF (VALUE(年平均余额) LE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论