第13章-无序多分类逻辑斯蒂回归模型_第1页
第13章-无序多分类逻辑斯蒂回归模型_第2页
第13章-无序多分类逻辑斯蒂回归模型_第3页
第13章-无序多分类逻辑斯蒂回归模型_第4页
第13章-无序多分类逻辑斯蒂回归模型_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元回归中的几种重要模型,第一部分:多重共线情况的处理第10章岭回归分析(RidgeRegression)第二部分:自变量中含定性变量的处理第11章自变量中含有定性变量的回归分析第三部分:因变量中含有定性变量情况的处理第12章二项Logistic回归第13章多项Logistic回归第14章有序回归(等级回归分析)第15章Probit回归(概率单位回归)第16章最佳尺度回归本章总结,Logistic回归,因变量,二项Logistic回归,多项Logistic回归,有序回归,Probit回归,第13章多项Logistic回归(无序多分类Logistic回归),13.1无序多分类Logistic回归的基本思想13.2无序多分类Logistic回归的案例分析,13.1无序多分类Logistic回归的基本思想,设因变量有k个取值水平,可以对其中的k-1个取值水平各做一个回归方程。设因变量第i个水平的Logistic回归模型:这样对于每一个模型都可以获得一组回归系数。根据因变量(响应变量)类型的不同,分两种情况:因变量为定性名义变量:各类之间地位相等因变量为定性有序变量:各类之间存在程度、先后之分,13.1无序多分类Logistic回归的基本思想,当名义因变量(响应变量)有多个类别时,一般通过一种叫广义Logit模型的方法进行。即:多项Logistic模型采取把每个类别与一个参考类别配成对,通常取最后一类为基线/参照类别,称为基线-类别Logistic,,预测变量为x的基线-类别logit模型为:模型共有J-1个方程,每个方程有不同的参数,这些效应依据与基线配对的类别而变化;不管哪个类别作为参照,对于同一对类别都会有相同的参数估计;即参照类别的选择是任意的。,以Y分三类情形为例。假定因变量Y为分类变量,类数为3,各类之间无顺序之分,且假定Y的取值分别为a、b、c,选Ya为b和c的共同参照组,则有以下模型:Pa+Pb+Pc=1,实质上通过两个二维逻辑回归方程就可以处理三分类情形。如果希望比较b和c两组,则直接将上述两方程相减即可得到相应函数。,13.2无序多分类Logistic回归的案例分析,例题:研究不同学校和不同课程计划对学生学习方式偏好的影响,得到数据如下表。试进行logistic回归分析。数据文件:“学习偏好.sav”,SPSS操作步骤:1、建立数据文件;2、数据加权个案3、分析回归多元logistic回归4、学习方式因变量;学校、课程计划因子5、确定(其他选项默认),13.2无序多分类Logistic回归的案例分析,默认参考类别为最后一类,也可重新设定因变量和因子都必须为分类变量,协变量:不能够控制和不感兴趣的变量。例如,当研究学习时间对学习绩效的影响,学生原来的学习基础、智力、学习兴趣就是协变。在实验的设计中,协变量是一个独立变量(解释变量),不为实验者所操纵,但仍影响实验结果。例如,研究教学方法对学生成绩的影响,学生原来的学习基础就是你所不能控制的,只能尽量消除其影响。协变量可以为分类变量和连续变量,用于设置区分类别的顺序,升序则取值最小的类为第一类,降序则取值最小的类为最后一类,指定模型主效应:表示模型中只包含些变量和因素变量的主效应全因子:表示模型中包含所有主效应以及它们之间所有可能的交互效应设定/步进式:由用户自行选择使用哪些效应进行分析,选中之后激活下面的选项强制输入项:进入的效应强制出现在模型中步进项:选入此列表的效应将以逐步回归的方式加入模型建立项:用来指定效应的种类,可供选择的有6种步进法:给出了4种步进方法,输出逐步回归的判别标准,输出Akaike信息标准(AIC)和施瓦兹-贝叶斯信息标准(BIC),越小越好,用于指定一个小于1的正数,此数将被添入分类变量交叉标的空单元格中,有助于稳定算法,防止出现较大的估计偏差,对所有因自变量和协变量计算单元概率,并进行拟合优度检验,把观测记录按照因变量进行分类的估计概率,因变量有几个水平就保存几个变量,保存模型的预测响应分类,保存最大的预测响应概率,保存预测正确时的估计响应概率,该表为总模型的似然比检验结果,可见最终模型和只含有常数项的初始模型相比,-2LL值从78.128下降至51.303,下降了26.825,似然比卡方检验的P-值小于0.05,说明模型整体是显著的。,伪R2指标,此处因只有分类变量,所以三个决定系数都非常低,不过在Logistic模型分析中它们的用处不太大。,拟合优度检验:检验的零假设是模型能很好的拟合原始数据,从sig.看,均远大于0.05,不能否定原假设,即最终模型的显著成立。,似然比检验该表结果表明,在5%的显著水平下,两个变量的作用都是显著的。,其中:school=3和program=2为参照,因此其参数为0。,变量“school1”回归系数为负值,显著不为零,表明:自修与上课两种学习方式相比,学校1的学生比学校3的学生更容易选择上课学校2与学校3的学生的选择则没什么差别。常规课程计划的学生比附加学习计划的学生更容易选择自修学习方式;常规课程计划的学生更偏好小组学习。,冗余参数:研究者不感兴趣的参数,此处是被固定参考类别,在实际应用中,分类自变量(如婚姻状况)各哑变量的偏回归系数可能其中某一(几)个有统计学意义,而其他的没有统计学意义(Pa)。此时建议保留该自变量。,分类表:是根据观测频率和预测频率统计得到的。对角线上的单元个代表判断正确的个数或概率,非对角线则为判错的个数或概率。可以看出,模型仍有改进的余地。,观测频率和预测频率:较为接近,拟合不错,练习:早餐习惯受生活方式、性别等因素的影响。某块三公司为了提高其早餐的市场份额,对880名消费者做了一次调查,见数据“早餐偏好调查数据.sav”,问卷提出了年龄段、性别、生活方式、早餐、婚否等问题,其中早餐=1表示不吃,=2表示吃麦片,=3表示吃谷物。试分析各因素对早餐的影响。,13.2无序多分类Logistic回归的案例分析,练习:小布什为捍卫家庭荣誉与民主党总统候选人克里围绕新一届总统大选进行“殊死搏斗”以试图打破“赢了战争却丢了总统宝座”的怪圈。这里回顾一下老布什与克林顿在1992年进行的较量,当时还有独立候选人佩罗先生。数据文件为“vote.sav”,变量有:pres92,所欲选的总统候选人;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论