第13章 无序多分类逻辑斯蒂回归模型_第1页
第13章 无序多分类逻辑斯蒂回归模型_第2页
第13章 无序多分类逻辑斯蒂回归模型_第3页
第13章 无序多分类逻辑斯蒂回归模型_第4页
第13章 无序多分类逻辑斯蒂回归模型_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元回归中的几个重要模型是第一部分:多重共线状况的处理第10章岭回归分析(RidgeRegression ) 第2部分:自变量包含定性变量的处理第11章自变量包含定性变量的回归分析第3部分:变量包含定性变量的状况的处理第12章第2项Logistic回归第13章多项Logistic回归第14章秩序回归(等级回归分析)第15章Pro bit回归(概率单位回归)第16章最佳Logistic回归、变量、2项Logistic回归、多项Logistic回归、有序回归、Probit回归、第13章多项Logistic回归(无秩序多分类Logistic回归) 13.1无秩序多分类Logistic回归的基本思想1

2、3.2无秩序多分类logi 13.1无序多分类Logistic回归的基本思想是,假定变量有k个取值级别,可以对其中的k-1个取值级别建立回归方程。 设置第I级变量的Logistic回归模型。 这样就可以为每个模型获得一组回归系数。 根据原因变量(应答变量)的类型,可以分为两种情况:变量为定性的名义变量:各级之间地位相等的原因变量为定性的秩序变量:各级之间的存在度、前后得分、13.1无序的多分类Logistic回归的基本思想、名义变量(应答变量)有多个类别即,多个Logistic模型使各类和一个参照类成对,通常将最后的类称为基线/参照类,将基线-类Logistic,预测变量为x的基线-类logi

3、t模型中,模型是j - 无论您引用的类别取决于与基线成对的类别,这些效果对同一对的类别都具有相同的参数估计,也就是说,参照类别是可选的。 以y被分成三类的情况为例。 假定变量y是分类变量,类数为3,各类之间有没有顺序的点,假设y的取法分别为a、b、c、Ya为b和c的共同参照组,则有Pa Pb Pc=1的模型,实质上能够用两个二维逻辑回归式处理三分类。 如果想比较b和c两组,直接减去上述两个方程式就能得到对应的函数。 13.2无序多分类Logistic回归的案例分析、例题:研究不同学校和不同课程计划对学生学习方式喜好的影响,数据见下表。 尝试了logistic回归分析。 数据文件:“学习喜好.

4、sav”、SPSS操作步骤: 1、数据文件的创建2、数据加权情况3、分析回归多元logistic回归4、学习方式因素变量学校、课程计划因子5、确定(其他选项为默认)、13.2无序多分类logi 默认的参考类别是最后一类,要因变量和因子都必须是分类变量、协变量:也可以重新设置无法控制的、不感兴趣的变量。 例如,研究学习时间对学习成绩的影响,学生原来的学习基础、智力、学习兴趣是协调的。 在实验的设计中,协调变量是独立变量(解释变量),虽然没有被实验者操作,但影响了实验结果。 例如,研究了教育方法对学生成绩的影响,学生本来的学习基础是你无法控制的,只能尽可能地消除其影响。协变量可以是分类变量和连续变

5、量。 设定分类变量的顺序,以升序值最小的类为第一类,以降序值最小的类为最后一类,指定模型的主效果:表示模型中只包含部分变量和元素变量的主效果的所有因子:在模型中设定所有主效果及其之间的可能的相互效果/。 输入的效果强制出现在模型中的步骤项目:选择此列表的效果以阶段性回归的方式追加模型建立项目。 指定效果的种类,可以选择的步骤方法有6种。 给出四种步骤方法,输出逐步回归的判别标准,并输出Akaike信息标准(AIC )和施华兹信息标准(BIC )。 为了指定小于1的正数,该数被添加到分类变量的交叉空的单元格中,使算法稳定,不产生大的估计偏差,对所有的因素参数和协调变量计算单位概率,进行适合度检查

6、,并按每个因素变量对观测记录进行分类由于有几个变量,保存了一些变量,保存了模型的预测响应分类,保存了最大的预测响应概率,保存了预测正确时的估计响应概率,此表是所有模型的似然比检验结果,最终模型与仅包含常项的初始模型相比,-2LL值为78.12851. 另外,由于伪R2指标在这里只有分类变量,所以3个判定系数非常低,但在Logistic模型分析中不是很有用。 适合度检查:检查的零假说是模型能很好地适合原数据,从sig .来看,都远大于0.05,不能否定原假说,也就是最终模型的显着成立。 似然比检验结果表明,在5%的显着水平下,两个变量的作用都是显着的。 因为参照了:school=3和progra

7、m=2,所以其参数为0。、变量“school1”的回归系数为负值,显着地不为零,表示自修比上课的两种学习方式,学校1的学生比学校3的学生更容易选择上课学校2和学校3的学生。 普通课程计划的学生比添加了学习计划的学生更容易选择自学学习方式的普通课程计划的学生优先于团队学习。冗馀参数:研究者不感兴趣的参数,这里是固定的参考类别,在实际应用中,分类参数(婚姻状况等)的各伪变量的偏回归系数中,有(数)可能有统计学意义,而其他(Pa )没有统计学意义。 在这种情况下,最好保留参数。 分类表:根据观测频率和预测频率统计得出。 对角线上的单元个数表示正确的个数和概率,对角线以外表示错误的个数和概率。 可知模

8、型还有改进的馀地。 观测频率和预测频率:比较接近,拟合好,练习:早餐习惯受生活方式、性别等因素的影响。 某公司为了提高早餐的市场份额,对880名消费者进行了调查。 看了数据“早饭优先调查数据. sav”,问卷提出了年龄层、性别、生活方式、早餐、有无结婚等问题。 早饭=1不吃,2吃面粉,3吃谷物。 分析一下各因素对早餐的影响。 13.2回归无秩序多分类Logistic的案例分析、练习:布什为了保护家族的名誉,与民主党总统候选人凯利围绕新的总统选举进行了“拼命的格斗”,想打破“战争中失去了总统的座位”的奇怪圈子。 现在让我们来回顾一下布什和克林顿在1992年进行的竞争。 当时,还有独立候选人佩罗老师。 数据文件为“vote.sav”,变量为:pres92,您想选择的总统候选人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论