统计分析与方法-第七章回归分析5-罗吉斯蒂克回归.ppt_第1页
统计分析与方法-第七章回归分析5-罗吉斯蒂克回归.ppt_第2页
统计分析与方法-第七章回归分析5-罗吉斯蒂克回归.ppt_第3页
统计分析与方法-第七章回归分析5-罗吉斯蒂克回归.ppt_第4页
统计分析与方法-第七章回归分析5-罗吉斯蒂克回归.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 回归分析6 罗吉斯蒂克回归,回归分析的类型,因变量与自变量都是定量变量的回归分析即我们常做的回归分析 因变量是定量变量,自变量中有定性变量的回归分析即含有哑变量的回归分析 因变量是定性变量的回归分析Logistic回归分析,因变量是定性变量 的回归分析 Logistic回归分析,从多元线性回归到Logistic 回归,例7.4 这是200个不同年龄和性别的人对某项服务产品的认可的数据(logi.sav). 其中: 年龄是连续变量,性别是有男和女(分别用1和0表示)两个水平的定性变量,而变量“观点”则为包含认可(用1表示)和不认可(用0表示)两个水平的定性变量。,从这张图可以看出什么呢?,从这张图又可以看出什么呢?,从多元线性回归到Logistic 回归,这里观点是因变量, 只有两个值;所以可以把它看作成功概率为p的Bernoulli试验的结果. 但是和单纯的Bernoulli试验不同,这里的概率p为年龄和性别的函数. 必须应用Logistic回归。,多元线性回归不能应用于定性因变量的原因,首先,多元线性回归中使用定性因变量严重违反本身假设条件,即: 因变量只能取两个值时,对于任何给定的自变量值,e本身也只能取两个值。这必然会违背线性回归中关于误差项e的假设条件。,其次,线性概率概型及其问题: 由于因变量只有两个值;所以可以把它看作成功概率p,取值范围必然限制在01的区间中,然而线性回归方程不能做到。 另外概率发生的情况也不是线性的。,Logistic函数,Logistic的概率函数定义为:,我们将多元线性组合表示为:,Logistic函数,于是,Logistic概率函数表示为:,经过变形,可得到线性函数:,这里,事件发生概率=P (y=1) 事件不发生概率=1-P (y=0) 发生比: 对数发生比:,这样,就可将logistic曲线线性化为: 从P到logit P经历了两个步骤变换过程: 第一步:将转换成发生比,其值域为0到无穷 第二步:将发生比换成对数发生比,其值域科为 经过转换, 将P logit P,在将其作为回归因变量来解释就不再有任何值域方面的限制了,即可线性化!,Logistic回归系数的意义,以logit P方程的线性表达式来解释回归系数,即: 在logistic回归的实际研究中,通常不是报告自变量对P的作用,而是报告自变量对logit P的作用。,Logistic回归系数的意义,以发生比 的指数表达式来解释回归系数 与logit P不同,发生比 具有一定的实际意义,代表一种相对风险。 因此对logistic回归系数的解释通常是从发生比的指数表达式出发的。,Logistic回归系数的意义,例如:在取得了logistic回归系数的各bi 的解以后,将其带入 函数, 如果分析x 变化一个单位对于 的影响幅度,可以用(x +1)表示,并将其待入上式,得到新的发生比,Logistic回归系数的意义,将两个发生比集中在一起有: 将此称为发生比率,它可测量自变量一个单位的增加给原来的发生比所带来的变化, 一般表达式为: 说明在其他情况不变的情况下,x一个单位的变化使原来的发生比扩大 倍。,Logistic回归系数的意义,比如,原来的 为6:4(比值为1.5),如果一个自变量变化一个单位导致的发生比率为exp(0.693)=2,即表示这一变化将会导致新发生比值 为原来的2倍,即新发生比将是12:4(比值为3)。 我们也可用发生比率减1的差来表示发生比的增长率,如发生比率为2.3,就可以说自变量一个单位的变化会使原发生比增加1.3倍(2.3-1=1.3).,Logistic回归系数的意义,当logistic回归系数为负数时,发生比率小于1。这时的表达要特别小心。 比如发生比率为0.8时,表示新发生比只有原来的80%,那么下降的倍数则是(1-0.8=)0.2.,Logistic回归应用,以例7.4为例,说明logistic回归分析 SPSS选项: Analyze RegressionBinary logistic,Logistic回归的SPSS输出结果,Logistic模型的检验与评价,对于整体模型的检验 Logistic回归方程求解参数是采用最大似然估计方法,因此其回归方程的整体检验通过似然函数值,表示为: -2 Log Likelihood 该值越大,意味着回归方程的似然值越小,模型的拟和程度越差。反之,拟和程度越好。,Logistic模型的检验与评价,在评价或检验一个含有自变量的Logistic回归模型时,通常是将其含有自变量的Logistic的-2 Log Likelihood与截距模型的相比较。两者之差服从卡方分布,进行卡方检验。 所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论