版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS-二元Logistic 回归结果分析2011-12-02 16:48身心疲惫,睡意连连,头不断往下掉,拿出耳机,听下歌曲,缓解我这严重的睡意吧!今天来分析二元Logistic 回归的结果 分析结果如下:案例处理汇总相瞰的案例.N百分比选定案例包括在分析中48957.5缺失案例0工总计48957.5未选定的案例3G14 2.5总计350100.03.如果极重有致谙参见分至表总装得案例总因森量桐口3初始值否0是1分类变量缢碍频生萋数温碍(D(4)教言水平未完成高中2691 000,GOO,000.000高中134,0001.0SO,000.000大专68,000oao1.000.000大学
2、25000.000.0001.000研究生3,000.050,000.0001:在“案例处理汇总”中可以看出:选定的案例 489个,未选定的案例361个,这个结果是根据设定的validate = 1出“违约”的两种结果“是”或者“否”得到的,在“因变量编码”中可以看分别用值” 1 ”和“0”代替,在“分类变量编码”中教育水平分为5类,如果选中“为完成高中,高中,大专,大学等,其中的任何一个,那么就取值为1 ,未选中的为0,如果四个都未被选中,那么就是"研究生“频率分别代表了处在某个教育水平的个数,总和应该为489个分类表%伫己观测已预测选定案例口未选定的案例b,是否曾经连约百分比桢正
3、是否曾俎违约百分比梭正否H 但否日毋 口是否曾妊违坊否是 总计百分比:36012900100.0.073.B1575400WO.O,074.4a已选定的案例mlidMeEQIb,未选定的案例丫曲d*eNE1c由于自费髭中书城失值'或分类变量中的值超出选定案例的范围,所以未时某些未选定的案例迸行分片“ 山根型中包括常量,P切割值对,5Q0右旌中的变量BSE,WalsdfSig.以口 (B)求骤口 常量1.026,103100,0291000.3581:在“分类表”中可以看出:预测有360个是“否”(未违约)有129个是“是”(违约)2:在“方程中的变量”表中可以看出:最初是对“常数项”记
4、性赋值,B为,标 准误差为:那么wald =( B/2=2 =,跟表中的“几乎接近,是因为我对数据进行的向下舍入的关系,所以数据会稍微偏小,B和Exp(B)是对数关系,将B进行对数抓换后,可以得到:Exp(B) = eA =, 其 中自由度为1, sig为,非常显著不在方程中的变量再分时领步辑0 变量 年髓7.46C1.006教育3,9944,061教育E.O0G1.014教育1.1451.2E5教育2.2241,13S>教育网2.5161,113工聆367461.000地址S.4331002收人1.1071一期负债率7B,41S1.000信用卡负债35,3231OOD其他员债12,52
5、11.000总统计量:U7.55711.0001:从“不在方程中的变量”可以看出,最初模型,只有“常数项”被纳入了模型,其它变量都不在最初模型内 表中分别给出了,得分,df , Sig三个值,而其中得分(Score)计算公式如下:的8% 二2,J月两W工区-X)(公式中(Xi- X)少了一个平方)卜面来举例说明这个计算过程:(“年龄”自变量的得分为例)从“分类表”中可以看出:有129人违约,违约记为“1”则违约总和为129 ,选定案例总和为489那么:y = 129/489 =x = 16951 / 489 =所以:E (Xi -x - )2 =y 1-y )= * ()=则:y (1-y )
6、*E(Xi -x )2 = * = 5则:小Xi(yi - y )A2 =所以:士与一亍斤$3% =.Jw巩12工区-f)=/ 5 =(四舍五入)计算过程采用的是在EXCEL里面计算出来的,截图如下所示:A=(A486-AV2RAGE口$1;A$ 483)厂2r aECDFG23136. 06339990-6. 067492758. 7425450一7. 1227340. 41417219730-a 96S38350, 11247862125. 766S724113.73415550-6. 3312948177. 8323150-12. 66262675. 07566880-6. 858930
7、21. 75869539122. 08589361. 7832352660-9. 4969321136. 72188560-5. 53988340. 4417219730-9. 96933350.11247862125, 76687350.1124;78620-9. 2331334R441721973125, 03067332. 7709653270-8. 705523021.758695390-7. 9141124113.73415550-6. 3312947152. 16155840-12. 398853336.1860993139* 018422ISO. 39Z61220-5. 8036
8、8361.783235266126. 503072932. 03793874;0-7. 65031332. 7709653270-8. 7055245106. 82004:510-IL 8712169513007k 997%0. 26380443570, 3从“不在方程的变量中”可以看出,年龄的“得分”为,刚好跟计算结果吻合! ! 答案得到验证! ! ! !块1:方法=向前步进(似然比)模型系数的综合检髓卡方dfSig.步骁1宓骁74,0521.000块74C521,000慢型74.C521,DOO冬蕊2 步骤44,5431,000块11B.5952,000候型11日西羽2,000步骤3 毋察
9、40B191,000块108.4143,000馒型169,4143,000沙臊4 步骤0 6771,002竣178.0914,DOO睡T7B.0914,000馁型汇总步誉-2因数似然值Gok& S riel IF? 方N西日譬r在R1,141.2052A45加睢215.315315£抑2Q143S6213e305.446a因为参题估计的更改范围小于001,所以估计在送 代次数4处终止b因勾参颤估计的史改范围小于001 ,所原伯让在送 耨次敢与也终工°C11fhq+SL附由小忖由l、-r 门 PM 年1:从“块1”中可以看出:采用的是:向前步进 的方法,在“模型系数的
10、综合检验”表中可以看出: 所有的SIG几乎都为“ 0”而且随着模型的逐渐步进,卡方值越来越大,说明模型越来越显著,在第 4步后,终止,根据设定的显著性值 和自由度,可以算出 卡方临界值, 公式为:=CHIINV(显著性值,自由度),放入excel就可以得到结果2:在“模型汇总”中可以看出:Cox&SnellR方 和Nagelkerke R 方拟合效果都不太理想,最终理想模型也才:和,最大似然平方的对数值 都比较大,明显是显著的似然数对数计算公式为:计算过程太费时间了,我就不举例说明计算过程了Cox&SnellR方的计算值 是根据:1:先拟合不包含待检验因素的Logistic模型
11、,求对数似然函数值INL0(指只包含“常数项”的检验)2:再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InLB(包含自变量的检验)=1 - 0 nCox&SnellR再根据公式:C即可算出:方的值!=Hosmer 和 Lemeshow 般=步骞卡方dfSig.17.5678,47725J418,72133.312e.S13411.Q1S.155Hoshi er和Lente马口网检验的随机性安臬否曾经违约二苦呈也曾经违约二里总计己观测期望值己观加I朗望做步骤114444.30854.61249?4542.3444工6664934141.107T0.5134B4374C
12、,52G117.4S0485454C.20148.79949&3937.607g10.39348T3335.142151Z65343合3332.5901616,4104。93427.2172521.78349101917.5063334.49452步潺214847.54111.4594924646.0443)弼4934544.25844J4249442*2.49475.50B4953940.3851 19.61549曲3537.955U11J464gT3834.3301114.17049g35前.562U1B.43S4Sg力23.5642825.43643101212.1653635
13、53548用唇力 14Q1R fi1 dn抽国提示: 将Hosmer和Lemeshow检验 和“随机性表” 结合一起来分析1:从 Hosmer和Lemeshow检验表中,可以看出:经过4次迭代后,最终的卡方统计量为:, 而临界值为:CHINV,8)= 卡方统计量 < 临界值,从SIG角度来看: > , 说明模型能够很好的拟合整体, 不存在显著的差异。2:从Hosmer和Lemeshow检验随即表中可以看出:”观测值“和”期望值“几乎是接近的,不存在很大差异,说明模型拟合效果比较理想,印证了 “Hosmer和Lemeshow检验”中的结果 而“Hosmer和Lemeshow检验”表中
14、的“卡方”统计量,是通过“ Hosmer和Lemeshow检验随即表”中的数据得到的(即通过“观测值和”预测值“)得到 的,计算公式如下所示:x2 (卡方统计量)=E (观测值频率-预测值频率)人2 /预测值的频率举例说明一下计算过程:以计算"步骤1的卡方统计量为例”1:将“Hosmer和Lemeshow检验随即表”中“步骤1 ”的数据,复制到excel中,得到如下所示结果:AC | DE4444.3690.C033854545.3440.0632494141.4870.0057143740,5200.3X)5729454O.2A10.5728743S37.6070.05160833
15、35.142513051?13332.5900.0051662427.2170.3801773国17.5060.127566154.6190.032576245.6560.484724376.513Q. 0363961117.碘1.656082548.7592. C173643g10送30958<5.35673侪16.4150.01025892521 .7630. 47S004S334.4940.C6473917.566565A =SUCC1:C2O)C21从“Hosmer和Lemeshow检验”表中可以看出,步骤1的卡方统计量为:,在上图中,通过excel计算
16、得到,结果为(四舍五入),结果是一致的,答案得到验证! !已观测已顿测选定案例未选定的案例2是否曾经建的百分比较正是否曾经违约百分比校正否是否是小襄1 是否曾经违约否 是 总计百分上匕340952034S4.426.476.51504271295.522276月小骤2是否曾经通约否是 息计百分比335742555S3.142.679.8r627E小骤3是否曾经违典否是 总计百分比333ea276532.5皿461.4142:33152190.43G.S773步骤4是否曾经违狗否是总计百分比337562371S3.655.0«3.41413&162U8
17、9.S37.C76.5,已选定的案例validate EO 1b未诙定的案例validate NE 1c由于自娈星中有矢值,嬴分类爽量中的值超出选定案例的范围所以未对某些未选定的案例迸行分类.。切割值为.5001:从“分类表”一“步骤1”中可以看出:选定的案例中,”是否曾今违约” 总计:489个,其中 没有违约的360个,并且对360个“没有违约”的客户进 行了预测,有340个预测成功,20个预测失败,预测成功率为:340 / 360 =%其中“违约”的有189个,也对189个“违约”的客户进行了预测,有 95 个预测失败,34个预测成功,预测成功率:34 / 129 = %总计预测成功率:(
18、340 + 34 ) / 489 = %步骤1的总体预测成功率为:% 在步骤4终止后,总体预测成功率为:, 预测准确率逐渐提升 %-%-%-。的预测准确率,不能够算太高,只能够说还如果移去项则建模变量模型对救似然 性在-2对救似然 中的廖改df更改的显著性手骡1 负债率-Z82.15274,0521£00与骁2 M龄-345.12644 5431.000免债率-260 995762921.000捋骡3 工的-Z42.09690,1021£00负债率-205.80415 8771ooa信用卡负债-222 95549S1 91.000步骡4 工箫-234 "583,3
19、381,000地址-1S7.94596771.00?负债率-200.67215,1301.00&信用卡负债-221.19456V41,000方睚中的变量BSE.步骤V m值率,129,cie常量-2500,328步骤加工的-131022向他率,140,016常量-1 695,256步残邛工鹉252033负债率口83,021信用卡负债544.099常量-).161,275步骤4d 工龄-249.034地址-.069023负债率081,021信用咔负债,594.102常量-7G8,904日一在步骤1中输入的麦量:负俵率.h在于骤2中乐天的变量:工酷.c.在宓辖2中输入的变量.信用咔负痛.乩
20、在步骤4中输入的变量:地址.Wals第Sig,Exp <B)61,7771.0001.133113电421.00008234 8501.0008"61.0741.0001.15D42.0511.000.194577441.DOD77715 了初1rose31.0901JOO172318.5051.DOD,30754卬71JOO.7009.0271,003,933! 4.8931.0001.08533,6501JOO1 811G3761,on4E5从“如果移去项则建模”表中可以看出:“在-2对数似然中的更改”中的数值是不是很眼熟,跟在“模型系数总和检验”表中“卡方统计量 &quo
21、t;量的值是一样 的! !将“如果移去项则建模”和 “方程中的变量”两个表结合一起来看1:在“方程中的变量”表中可以看出:在步骤1中输入的变量为“负债率”,在”如果移去项则建模“表中可以看出, 当移去“负债率”这个变量时,引起了的数值更改,此时模型中只剩下“常数项”为常数项的对数似然值在步骤2中,当移去“工龄”这个自变量时,引起了的数值变化(简称:似然比统计量),在步骤2中,移去“工龄”这个自变量后,还剩下“负债率”和“常量”,此时对数似然值 变成了:,此时我们可以通过公式算出“负债率” 的似然比统计量:计算过程如下:似然比统计量=2 (+)=答案得到验证! ! !2:在“如果移去项则建模”表
22、中可以看出:不管移去那一个自变量,”更改的显著性”都非常小,几乎都小于,所以这些自变量系数跟模型显著相关, 不能够剔去! ! 3:根据”方程中的变量”这个表,我们可以得出logistic 回归模型表达式:1 / 1+ eA- (a+E B I*Xi)们假设z =同+£催1即*我那么可以得到简洁表达式:P(Y) = 1 / 1+eA (-z)将”方程中的变量“一步骤4中的参数代入模型表达式中,可以得到 logistic 回归模型如下所示:P(Y) = 1 / 1 + e A -(+*信用卡负债率+*负债率*地址*功龄)收入.4301512其他负债.0121.914总制量12707S,1
23、22手疆4 变量 年龄2.0231,155r教言1.2334.973教育.3471,556教百.0501,313敬言7T21380敬青.1951,712收入.005146其他负旃.1311718总加M曼3 6137,323从”不在方程中的变量“表中可以看出:年龄,教育,收入,其它负债,都没有纳入模型中,其中:sig值都大于,所以说明这些自变量跟模型显著不相关。St5p number: 4Observe d Croups an i Predicted Proto at il Etie580 +FIIR SQ +EIIQ1IUIIE 40+0+N10IC10IY 1000I20 +000 0+10
24、00001IIOOOOOOLO 01011000 0 1 1 01I1000000000000000000000 000010 00 1 100 1100 0000 1111 111 1 1 1 1 111Predicted -,工 ,G . r . 8,91Pr6t: 0,1.2,3Croup: 00000000000000000000000000000000000000000000000000111111111111111Predicted Prob a b ilitv is of Membership For 喳 The Cut Value is ,50Symbols:。-杏I -星Ea
25、ch STnbol R电p士电E Cass.在”观察到的组和预测概率图”中可以看出:1: the Cut Value is ,此处以 为切割值,预测概率大于,表示客户“违约”的概率比较大,小于表示客户“违约”概率比较小。2:从上图中可以看出:预测分布的数值基本分布在“左右两端”在大于的切割值中,大部分都是“1”表示大部分都是“违约”客户,( 大约230个违约客 户)预测概率比较准,而在小于的切割值中,大部分都是“0”大部分都是“未违约”的客户,(大约500多个客户,未违约)预测也很准在运行结束后,会自动生成多个自变量,如下所示:preddeflpreddef2preddefvalidatePREJCCQ_100339788G4213041.00.8422g.019:.19830.12846.436901 00.18937一 0口2:H.0100400299.141021 00
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机房UPS故障火灾应急演练脚本
- 1月劳动关系协调员(4级)试题(附参考答案解析)
- 安全阀定期校验记录表
- 记录仪维护规程
- 桥梁养护车辆事故应急演练脚本
- 体检机构感染防控管理标准
- 《高盐雾环境用冷却塔防腐设计与维护手册》
- 建筑施工安全教育培训计划
- CN119868323A 双硫仑和盐酸决奈达隆在制备缓解肝损伤药物中的应用
- 冠状病毒感染护理查房指南
- 《马克思主义社会研究方法在人口老龄化问题中的应用研究》3300字
- 五月天所有专辑歌词【全】
- 超声波流量计
- 9第九讲 世界文明体系阿拉伯文明
- 钳工实训与技能考核训练项目三-凹凸体锉配-课件
- 水库防汛抢险应急预案编制大纲
- LY/T 3259-2021极小种群野生植物水松保护与回归技术规程
- LY/T 1558-2017仁用杏优质丰产栽培技术规程
- 山西中考数学计算真题汇总(历年)
- 重庆市专业技术人员继续教育登记卡(2022版)
- 清创缝合-课件
评论
0/150
提交评论