SPSS—二元Logistic回归结果分析_第1页
SPSS—二元Logistic回归结果分析_第2页
SPSS—二元Logistic回归结果分析_第3页
SPSS—二元Logistic回归结果分析_第4页
SPSS—二元Logistic回归结果分析_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS-二元Logistic回归结果分析2011-12-0216:48身心疲惫,睡意连连,头不断往下掉,拿出耳机,听下歌曲,缓解我这严重的睡意吧!今天来分析二元Logistic回归的结果分析结果如下:案例处理汇整未加权的案冽N百分比诙定案例包括在分析中48967.5故失案例0.0总计48957.5未选定的案例36142.5总计950100.03况果后重育胃,清等灵寿工表以获僵案例总.因薰量渠料初始值否0是分类费量编喳频率参数犒礴(1)(%教育水邛未完成高中2691万而0a0,C00.000高中134,OCO1.00000Q.000大背53,D00,OUG1.C00,000大学25,DC0rO

2、OO.C001.000研究生3,M0,000,CD0.0001:在“案例处理汇总”中可以看出:选定的案例489个,未选定的案例361个,这个结果是根据设定的validate=1得到的, 在“因变量编码”中可以看出“违约”的两种结果“是”或者“否”分别用值“1”和“0”代替,在“分类变量编码”中教育水平分为5类,如果选中“为完成高中,高中,大专,大学等,其中的任何一个,那么就取值为1,未选中的为0,如果四个都未被选中,那么就是研究生“频率分别代表了处在某个教育水平的个数,总和应该为489个e切割值用.501方程中的变量BSE,WalsdfSig.E加田】生强口常量026.103100.02S1,

3、000.3561:在“分类表”中可以看出:预测有360个是“否”(未违约)有129个是“是”(违约)2:在“方程中的变量”表中可以看出:最初是对“常数项”记性赋值,B为-1.026,标准误差为:0.103那么wald=(B/S.E)2=(-1.026/0.103)2=99.2248,跟表中的“100.029几乎接近,是因为我对数据进行的向下舍入的关系,所以数据会稍微偏小,B和Exp(B)是对数关系,将B进行对数抓换后,可以得到:Exp(B)=eA-1.026=0.358,其中自由度为1,sig为0.000,非常显著下在方程中的爽量得分dfSig.如糕0变量年胎7.4601.006独言8,934

4、4.051教苜6.0091.014己观测选定案例日未选定的是否曾姓违约百弁比桢正是否曾经辞苔OH7E指覆0是否曾拄通坊否是总计百分比3601Z901D0.0,C73.615754分类表d启a已选定的案例valigteEQ1b.未选定的案例同idwteNE1J 由于量中方设失值,居殳关变量中的脑比出选定案例的范国,所以未因整些未选定的案例进彳d模型中包括常量,敦音1U51.285款言2.2241136会普网2.51S1m工凿3674S1.000地址9.4631002收入1.1D71.292负俵军76,4181.000信用卡负债35,3291000其他负倭125311.000息统计量1475571

5、1.0001:从“不在方程中的变量”可以看出,最初模型,只有“常数项”被纳入了模型,其它变量都不在最初模型内表中分别给出了,得分,df,Sig三个值,而其中得分(Score)计算公式如下:二/G-j-v)f上一1(公式中(Xi-X)少了一个平方)下面来举例说明这个计算过程:(“年龄”自变量的得分为例)从“分类表”中可以看出:有129人违约, 违约记为“1”129,选定案例总和为489那么:y=129/489=0.2638036809816x=16951/489=34.664621676892所以:E(Xi-x)2=30074.9979y1-y)=0.2638036809816*=0.19421

6、129888216WJ:y一(1-y)*E(Xi-x)2=0.19421129888216*30074.9979=5840.9044060372则:EXi(yi-y)A2=43570.8则违约总和为(1-0.2638036809816)所以:1工工心Scorei-一Jy(l印工(-r)=43570.8/5840.9044060372=7.4595982010876=7.46(四舍五入)计算过程采用的是在EXCEL里面计算出来的,截图如下所示:B-G品I=(A486-AVERAGE(&$1娱$转9)*2A1.B)CDEFG23136.06339990-6.06748275乱R6425记0

7、-7.1227340.4417219730 -8.96933350.112479G21 25.7668724113,河虹5550 -6.331294B 177.8323150 -12,66262675,07566880-6.85893021.768695891 22.08589361.7832352660 -9.4969321186.72188560 -5.53988340.44:17219730 -8.9693335X112478621 25,76687350.110 -9.23313340.44=17219731 25.03067332.770565327Q -8.705523021.75

8、8695390 -7.9141124113.73115550-6.3312947152.16155840 -12.398853336.1860983139.0154221&0.39264220 -5.30368,361.7932352661 26.503072932.087538740 M6503133Z.7709553270 -8.7055245106.82004510 -11.87121695130074.997960.26380443570.8从“不在方程的变量中”可以看出,年龄的“得分”为吻合!答案得到验证!7.46,刚好跟计算结果块1:方法=向前步进(似然比)模型系数的综合检

9、监卡方*8ig苏骁1步艰740521.000块74C521.oon像型740521.000步糠?步兼44,5431,000岐11S,5962模型118,5952.000小蜀3步善*819;1口口口族1SS.4143.000模型168,4143.000步糠4步骤1002快17S,C914.000模型V9,C914.000馍型汇总步辍-2对数似然值Coo(&SnellR方NagelherkeF?方140OJ51-.141,7052445709b215,3153我工明加.291,4264266213*.305a因对英渤I估计的更戚范围小于.口口1,所以估计在这代收数4批玲止=to 因为支散估

10、计的更政范围小于,001J所以估可在这代母5命终止-c 工1七二部什#4-4工心1声口,rW由J、Tnni.HUkl44;J-f-E斗1:从“块1”中可以看出:采用的是:向前步进的方法,在“模型系数的综合检验”表中可以看出:所有的SIG几乎都为“0”而且随着模型的逐渐步进,卡方值越来越大,说明模型越来越显著,在第4步后,终止,=CHIINV(显著性值,自由度),放入excel就可以得到结果2:在“模型汇总”中可以看出:Cox&SnellR方和NagelkerkeR方拟合效果都不太理想,最终理想模型也才:0.305和0.446,最大似然平方的对数值都比较大,明显是显著的根据设定的显著性值

11、和自由度,可以算出卡方临界值,公式为:似然数对数计算公式为:计算过程太费时间了,我就不举例说明计算过程了Cox&SnellR方的计算值是根据:1:先拟合不包含待检验因素的Logistic模型,求对数似然函数值值!=Hosmer和Lemeshow检第=步辑嗦方dfSig175678.477253418.72133.3120.913411.91S8.155INL0(指只包含“常数项”的检验)2:再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InLB(包含自变量的检验)再根据公式:0aL(此士的R三二1-月即可算出:Cox&SnellR方的Hosnicr和Lemes

12、hor检验的随机性表熠否曾经违地;否是杏曾经通约二是思计己观测期望他己观测期望值步骤114444;30354.61-24Q24543.34445656493di41.467T6.51348+40.550117.4504654540.2014879S49G3937,607310,39348T3335.1421512,85646&3332,59015佰41。49q2427.21725217S3+9101917.5003334,49452邮214847.541114694924632.9564g34544.258447424944241494T6506的53340.2G511e.6-154-

13、G353丁配51411,14549T3331.33011141704953530,562U16,4364g92123.564292543E4g101212.4653G35,53548盛野11EQidR1d在山。提示:将Hosmer和Lemeshow检验和“随机性表”结合一起来分析1:从Hosmer和Lemeshow检验表中,可以看出:经过4次迭代后,最终的卡方统计量为:11.919,而临界值为:CHINV(0.05,8)=15.507卡方统计量0.05,说明模型能够很好的拟合整体,不存在显著的差异。2:从Hosmer和Lemeshow检验随即表中可以看出:”观测值“和”期望值“几乎是接近的,不

14、存在很大差异,说明模型拟合效果比较理想,印证了“Hosmer和Lemeshow检验”中的结果而“Hosmer和Lemeshow检验”表中的“卡方”统计量, 是通过“Hosmer和Lemeshow检验随即表”中的数据得到的(即通过“观测值和”预测值“)得到的,计算公式如下所示:x2(卡方统计量)=E(观测值频率-预测值频率)A2/预测值的频率举例说明一下计算过程:以计算步骤1的卡方统计量为例”1:将“Hosmer和Lemeshow检验随即表”中“步骤1”的数据,复制到excel中,得到如下所示结果:_C21,A=SOCCl:C20)AECDE4444.3690.0033854543.5440.0

15、6324941414870.0057143740.5200.3)57294540.2010.5728743937.6070.0516083335.L420.1305173332.5900,0051662427.217 0.3B0177311917.5060.12756654.5120.03257624558 0.484724376.5130.Q36096117.480 1.656082548.799 Z617364r3g0S590.35671616.4100.0102589El.763 0.4750043驾34.4940.0647391工566569从“Hosmer和

16、Lemeshow检验”表中可以看出,步骤1的卡方统计量为:7.567,在上图中,通过excel计算得到,结果为7.5665697.567(四舍五入),结果是一致的,答案得到验证!分类表 d己观测I已理测选定案例B未选定的是否曾经遇的百分比校正是否曾经逼的否ja否a步骤1是否曾经违的否是总计百分比34095203494426476515042步骤2是否曾经通约否是思计百分比33574255593142.67Se14739步骤3是否曾经连的否是思计百分比333642765925504914U233步骤4是否曾妊速的否是总计百分比33753237193E55.003.4U134白一已选定的案例val

17、idateEQ1b一未选定的案例validateNE1c由于自变量中有域先值,或分类娈量中的值超出选定案例的范围所以未对某些未迭定的案例道彳d切制值为.5001:从“分类表”一“步骤1”中可以看出:选定的案例中,”是否曾今违约”总计:489个,其中没有违约的360个,并且对360个“没有违约”的客户进行了预测,有340个预测成功,20个预测失败,预测成功率为:340/360=94.4%其中“违约”的有189个,也对189个“违约”的客户进行了预测,有95个预测失败,34个预测成功,预测成功率:34/129=26.4%总计预测成功率:(340+34)/489=76.5%步骤1的总体预测成功率为:

18、76.5%,在步骤4终止后,总体预测成功率为:83.4,预测准确率逐渐提升76.5%79.8%81.4%83.4。83.4的预测准确率,不能够算太高, 只能够说还行。如果移去项则建俣上量模型对敌似然性在-2对儆似然中的亘改dT史改的显著性揖膘1负债率-28215274,0521,000班2工龄-245.126445431,000免债率-260.995762021.000捋骡3T於-242.99690,1021,000负债率-205.8841587F1000信用卡负债-222.85549,9191.000沙臊4工髅-234776日3,33号1DOO地址-197.945967T1,002负债率-2

19、00.57215,1351,000信用卡负债-221,19456,1741,000方程中的变量从“如果移去项则建模”表中可以看出:“在-2对数似然中的更改”中的数值是不是很眼熟?,跟在“模型系数总和检验”表中“卡方统计量量的值是一样的!BS.E.步骤1日由债军129,016常量-2.500228步腰加理-131022优网,140,018常量-1695,259步理3。工-752.033负新,0S3,021信用卡负债.$44,0Q9常量1181.275步骏4dH 龄-249,034也止-069,023负俵率0810;1信用卡负债594J02常量-763,304日一在步骡1中野入的变量:负胃率.,在

20、步转2中辅入的变量:工舲.c.在步骤3中输入的变邕信用卡负债.也在步骁中输入的变量:地址.WalsdfSig.Exp曲G17771.000113811994S1.coo.09234B5d1.000.87761,9741.0001.150430511xoo.19457,7441.000777157281XQO1.03S31,0901xoo1.723185051.000.307$4.91xoo.7809.0271.933U.8931.0001.03533.S501TOO1.8116,3/61X12.4651:在“方程中的变量”表中可以看出:在步骤1中输入的变量为“负债率”,在”如果移去项则建模“表

21、中可以看出,当移去“负债率”这个变量时,引起了74.052的数值更改,此时模型中只剩下“常数项”-282.152为常数项的对数似然值在步骤2中,当移去“工龄”这个自变量时,引起了44.543的数值变化(简称:似然比统计量),在步骤2中,移去“工龄”这个自变量后,还剩下“负债率”和“常量”,此时对数似然值变成了:-245.126,此时我们可以通过公式算出“负债率”的似然比统计量:计算过程如下:似然比统计量=2(-245.126+282.152)=74.052答案得到验证!2:在“如果移去项则建模”表中可以看出:不管移去那一个自变量,”更改的显著性”都非常小,几乎都小于0.05,所以这些自变量系数

22、跟模型显著相关,不能够剔去!3:根据方程中的变量”这个表,我们可以得出logistic回归模型表达式:那么可以得到简洁表达式:P(Y)=1/1+eA(-z)将”方程中的变量“一步骤4中的参数代入模型表达式中,可以得到logistic回归模型如下所示:P(Y)=1/1+eA-(-0.766+0.594*信用卡负债率+0.081*负债率-0.069*地址-0.249*功龄)将“如果移去项则建模”和“方程中的变量”两个表结合一起来看1/1+eA-(a+EBI*Xi)我们假设Z收入4301.512其他质债0121.914总统计量127078,122步骤4变星年整20231.155敬育1.2334.67

23、3敬言,3仃1.556缴胃0561.613额百7721.380敦育1361712收入,0051.S+5其他负俵,1311.719总限计量3.6137.323从”不在方程中的变量“表中可以看出:年龄,教育,收入,其它负债,都没有纳入模型中,其中:sig值都大于0.05,所以说明这些自变量跟模型显著不相关。自Frtumber:4ObservedGroupsandPredictdProbabilities804-20+00001000001IEOOOOOOLO0101100001101000000000000000000000000010001100110000001111111|1-wfwrFW,

24、nBProb:0.1.2.3.4.5.G.7.8.91Group:OOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOl:PredittcfProbabilityisofM*mb5rshipforTheCurVa!ueis.SOSymbols:0-否11是EachSymbolRgpr占总 FIES5C二匕电a在”观察到的组和预测概率图”中可以看出:1:theCutValueis0.5,此处以0.5为切割值,预测概率大于0.5,表示客户“违约”的概率比较大,小于0.5表示客户“违约”概率比较小。2:从上图中可以看出: 预测分布的数值基本分布在“左右两端”在大于0.5的切割值中, 大部分都是“1”表示大部分都是“违约”客户,(大约230个违约客户)预测概率比较准,而在小于0.5的切割值中,大部分都是“0”大部分都是“未违约”的客户,(大约500多FREQuEr-iQ40+010101000个客户,未违约)预测也很准在运行结束后,会自动生成多个自变量,如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论