逻辑回归分析课件_第1页
逻辑回归分析课件_第2页
逻辑回归分析课件_第3页
逻辑回归分析课件_第4页
逻辑回归分析课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、逻辑回归分析7.8.1 统计学上的定义和计算公式7.8 逻辑回归分析 定义:逻辑回归分析是对定性变量的回归分析。 可用于处理定性因变量的统计分析方法有:判别分析(Discriminant analysis)、Probit分析、Logistic回归分析和对数线性模型等。在社会科学中,应用最多的是Logistic回归分析。Logistic回归分析根据因变量取值类别不同,又可以分为Binary Logistic回归分析和Multinomi-nal Logistic回归分析。 与任何概率一样,似然的取值范围在0,1之间。2LL的计算公式为1-2对数似然值(-2 log likelihood,-2LL)

2、Predicted(预测值)01Percent Correct (正确分类比例)Observed(观测值)0n00n01f01n10n11f1Overall(总计)ffClassification Table for Y3Cox和Snell的R 2(Cox&Snells R-Square)5伪R 2(Psedo-R-square) 伪R2与线性回归模型的R2相对应,其意义相似,但它小于1。6Hosmer和Lemeshow的拟合优度检验统计量(Hosmer and Lemeshows Goodness of Fit Test Statistic) 与一般拟合优度检验不同,Hosmer和Lemes

3、how的拟合优度检验通常把样本数据根据预测概率分为10组,然后根据观测频数和期望频数构造卡方统计量(即Hosmer和Lemeshow的拟合优度检验统计量,简称H-L拟合优度检验统计量),最后根据自由度为8的卡方分布计算其值并对Logistic模型进行检验。 如果该p值小于给定的显著性水平(如=0.05),则拒绝因变量的观测值与模型预测值不存在差异的零假设,表明模型的预测值与观测值存在显著差异。如果值大于,我们没有充分的理由拒绝零假设,表明在可接受的水平上模型的估计拟合了数据。 研究问题 在一次关于某城镇居民上下班使用交通工具的社会调查中,因变量y =1表示居民主要乘坐公共汽车上下班;y=0表示

4、主要骑自行车上下班;自变量x1表示被调查者的年龄;x2表示被调查者的月收入;x3表示被调查者的性别(x3=1为男性,x3=0为女性)。试建立y与自变量间的Logistic回归,数据如表7-7所示。7.8.2 SPSS中实现过程表7-7使用交通工具上下班情况序号x1(年龄)x2(月收入:元)x3(性别)y1188500022112000032385001423950015281200016318500073615000184210000194695001104812000011551800011256210001135818000114188501015201000101625120010172

5、71300101828150010193095011203210001021331800102233100010233812001024411500102545180011264810001027521500112856180011 实现步骤图7-24 “Logistic Regression”对话框图7-25 “Logistic Regression:Options”对话框 (1)第一部分输出结果有两个表格,第一个表格说明所有个案(28个)都被选入作为回归分析的个案。 7.8.3 结果和讨论 第二个表格说明初始的因变量值(0,1)已经转换为逻辑回归分析中常用的0、1数值。 (2)第二部分(B

6、lock 0)输出结果有4个表格。 (3)Omnibus Tests of Model Coefficients表格列出了模型系数的Omnibus Tests结果。 (4)Model Summary表给出了-2 对数似然值、Cox和Snell的R2以及Nagelkerke的R2检验统计结果。 (5)Hosmer and Lemeshow Test表格以及Contingency Table for Hosmer and Lemeshow Test表格给出了Hosmer和Lemeshow的拟合优度检验统计量。 (6)Classification Table分类表说明第一次迭代结果的拟合效果,从该表

7、格可以看出对于y=0,有86.7%的准确性;对于y=1,有76.9%准确性,因此对于所有个案总共有82.1%的准确性。 (7)Variables in the Equation表格列出了Step 1中各个变量对应的系数,以及该变量对应的Wald 统计量值和它对应的相伴概率。从该表格中可以看出x3相伴概率最小,Wald统计量最大,可见该变量在模型中很重要。 (8)Correlation Matrix表格列出了常数Constant、系数之间的相关矩阵。常数与x2之间的相关性最大,x1和x3之间的相关性最小。 (9)图7-26所示是观测值和预测概率分布图。该图以0和1为符号,每四个符号代表一个个案。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论