logistic回归模型_第1页
logistic回归模型_第2页
logistic回归模型_第3页
logistic回归模型_第4页
logistic回归模型_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、宁夏医科大学流行病与卫生统计学系 乔慧宁夏医科大学流行病与卫生统计学系 乔慧v 内容提要内容提要 非条件非条件logistic回归回归模型简介模型简介简单分析实例简单分析实例哑变量设置哑变量设置自变量的筛选方法与逐步回归自变量的筛选方法与逐步回归模型拟合效果与拟合优度检验模型拟合效果与拟合优度检验模型的诊断与修正模型的诊断与修正 条件条件logistic回归回归宁夏医科大学流行病与卫生统计学系 乔慧对分类变量的分析,当考察的影响因素较少,且也为分类对分类变量的分析,当考察的影响因素较少,且也为分类变量时,常用列联表(变量时,常用列联表(Contingency Table)进行整理,)进行整理,

2、并用并用 2检验或分层检验或分层 2检验进行分析,但存在以下局限性:检验进行分析,但存在以下局限性: 无法描述其作用大小和方向,更不能考察各因素间是否无法描述其作用大小和方向,更不能考察各因素间是否有交互作用;有交互作用; 当控制的分层因素较多时,将导致检验结果不可靠;当控制的分层因素较多时,将导致检验结果不可靠; 2检验无法对连续性自变量进行分析检验无法对连续性自变量进行分析(致命缺陷)(致命缺陷)。模型简介模型简介宁夏医科大学流行病与卫生统计学系 乔慧logistic回归模型适合于应变量为二项分类的资料,回归模型适合于应变量为二项分类的资料,在医学研究领域中的应用广泛。如流行病病因学研在医

3、学研究领域中的应用广泛。如流行病病因学研究(包括队列研究、病例对照研究、横断面研究究(包括队列研究、病例对照研究、横断面研究等)、临床疗效研究(如疗效与治疗方法、患病轻等)、临床疗效研究(如疗效与治疗方法、患病轻中重等因素关系)、卫生服务研究(如是否就诊与中重等因素关系)、卫生服务研究(如是否就诊与性别、年龄、文化程度的关系)等等。性别、年龄、文化程度的关系)等等。模型简介模型简介宁夏医科大学流行病与卫生统计学系 乔慧011log()ppit PXX011011exp()1exp()ppppXXPXX011111exp()ppPXX模型简介模型简介v logistic回归模型:回归模型:宁夏医

4、科大学流行病与卫生统计学系 乔慧 反应变量为二分类变量或某事件的发生率;反应变量为二分类变量或某事件的发生率; 自变量与自变量与logit(P)之间为线性关系;)之间为线性关系; 残差合计为残差合计为0,且服从二项分布;,且服从二项分布; 各观测间相互独立。各观测间相互独立。模型简介模型简介适用条件适用条件v logistic logistic回归模型应该使用最大似然法来解决方程的回归模型应该使用最大似然法来解决方程的估计和检验问题,不应当使用以前的最小二乘法进行参数估计和检验问题,不应当使用以前的最小二乘法进行参数估计。估计。宁夏医科大学流行病与卫生统计学系 乔慧例例1 某医师希望研究病人的

5、年龄某医师希望研究病人的年龄age、性别、性别sex(0为女性、为女性、1为男性)、心电图检验是否异常为男性)、心电图检验是否异常ecg(ST段压低、段压低、0为正常、为正常、1为轻度异常、为轻度异常、2为为重度异常)与冠心病重度异常)与冠心病ca是否有关,数据见是否有关,数据见logistic_binary.sav。简单分析实例简单分析实例宁夏医科大学流行病与卫生统计学系 乔慧简单分析实例简单分析实例宁夏医科大学流行病与卫生统计学系 乔慧选入应变量选入应变量选入自选入自变量变量简单分析实例简单分析实例宁夏医科大学流行病与卫生统计学系 乔慧Dependent Variable Encoding

6、01Original Value未患病患病Internal Value简单分析实例简单分析实例结果分析结果分析v 此表为应变量取值水平编码,此表为应变量取值水平编码,SPSSSPSS默认取值水平默认取值水平高的为阳性结果。高的为阳性结果。宁夏医科大学流行病与卫生统计学系 乔慧简单分析实例简单分析实例结果分析结果分析v 本表输出当前模型的本表输出当前模型的-2log-2log(似然值)和两个伪决(似然值)和两个伪决定系数,但对于定系数,但对于logisticlogistic回归而言,通常看见的伪决回归而言,通常看见的伪决定系数不像线性回归模型中的决定系数那么大。定系数不像线性回归模型中的决定系数

7、那么大。Model Summary86.811a.237.316Step1-2 Log likelihoodCox & Snell R SquareNagelkerke R SquareEstimation terminated at iteration number 5 because parameter estimateschanged by less than .001.a. 宁夏医科大学流行病与卫生统计学系 乔慧Variables in the Equation1.356.5466.1621.0133.882.873.3845.1621.0232.395.093.0357.00

8、01.0081.097-5.6421.8069.7571.002.004sexecgageConstantStep1aBS.E.WalddfSig.Exp(B)Variable(s) entered on step 1: sex, ecg, age.a. 简单分析实例简单分析实例结果分析结果分析v 此表输出模型中的各自变量的偏回归系数及其标准此表输出模型中的各自变量的偏回归系数及其标准误、误、Wald Wald 2 2、自由度、自由度、P P 值、值、OROR值(即值(即expexp(B B)。)。宁夏医科大学流行病与卫生统计学系 乔慧 Forward:Conditional (最可靠)(最可

9、靠) Forward:LR Forward:Wald (应当慎用)(应当慎用) Backward: Conditional (最可靠)(最可靠) Backward:LR Backward:Wald(应当慎用)(应当慎用)v 6 6 种筛选自变量的方法种筛选自变量的方法逐步回归逐步回归宁夏医科大学流行病与卫生统计学系 乔慧多重共线性的对偏回归系数的影响与线性回归模型中的表现多重共线性的对偏回归系数的影响与线性回归模型中的表现一致,如增加或删除一条记录,模型中偏回归系数值发生较一致,如增加或删除一条记录,模型中偏回归系数值发生较大变化,专业上认为有意义的因素无统计学意义等等。大变化,专业上认为有意

10、义的因素无统计学意义等等。如果在进行如果在进行logisticlogistic模型分析中,尤其是在向模型中引入交模型分析中,尤其是在向模型中引入交互作用项时出现了回归结果反常现象,则自变量之间的多重互作用项时出现了回归结果反常现象,则自变量之间的多重共线性是需要排除的一种可能。共线性是需要排除的一种可能。模型的诊断与修正模型的诊断与修正v 多重共线性的识别:多重共线性的识别:宁夏医科大学流行病与卫生统计学系 乔慧目前目前SPSSSPSS的的logisticlogistic过程中尚没有关于多重共线性过程中尚没有关于多重共线性诊断的结果输出,代替方法之一是运用相同的反应诊断的结果输出,代替方法之一

11、是运用相同的反应变量与自变量,拟合线性回归模型,并进行相应的变量与自变量,拟合线性回归模型,并进行相应的共线性诊断。共线性诊断。模型的诊断与修正模型的诊断与修正v 多重共线性的识别:多重共线性的识别:宁夏医科大学流行病与卫生统计学系 乔慧匹配设计匹配设计(matched design)是在设计阶段控制混杂因素的)是在设计阶段控制混杂因素的一种方法。当得到一名研究病例后,选择一名或多名非病例一种方法。当得到一名研究病例后,选择一名或多名非病例作为对照,选择相应对照的条件是:某些需要控制的混杂因作为对照,选择相应对照的条件是:某些需要控制的混杂因素与该病例之间相同或相似,从而形成一个匹配的对子。一

12、素与该病例之间相同或相似,从而形成一个匹配的对子。一个匹配的对子可以只有个匹配的对子可以只有 1个病例和个病例和1个对照,称个对照,称1:1匹配;匹配;当病例很罕见时,常采用当病例很罕见时,常采用 1个病例,多个对照,此时称为个病例,多个对照,此时称为1:m匹配,常用的匹配,常用的 m一般小于等于一般小于等于4,不同的对子,不同的对子,m可以不同;可以不同;还可设计还可设计m:n匹配,即不同对子的病例与对照个数均可不同,匹配,即不同对子的病例与对照个数均可不同,这样的设计增加了收集资料的灵活性。这样的设计增加了收集资料的灵活性。条件条件logistic回归回归简介简介宁夏医科大学流行病与卫生统

13、计学系 乔慧对于这类匹配设计资料,如果采用以上介绍的非条件对于这类匹配设计资料,如果采用以上介绍的非条件 logisticlogistic回归方法,将会降低检验效能。而应当采用回归方法,将会降低检验效能。而应当采用条件条件logisticlogistic回归模型回归模型(conditional logistic conditional logistic regression modelregression model)又称配对又称配对logisticlogistic回归模型进行回归模型进行分析。分析。条件条件logistic回归回归简介简介宁夏医科大学流行病与卫生统计学系 乔慧 用变量差值拟合

14、:用变量差值拟合:只适用于只适用于1:1配对的情况,用配对的情况,用Multinomial logistic 过程实现;过程实现; 用分层用分层Cox模型拟合:适用范围非常广。模型拟合:适用范围非常广。条件条件logistic回归回归v SPSS SPSS中的拟合方法:中的拟合方法:宁夏医科大学流行病与卫生统计学系 乔慧例例4 Mack等人预考察服用雌激素与患子宫内膜癌的关等人预考察服用雌激素与患子宫内膜癌的关系,对退休居住在社区的妇女进行病例对照研究。除服系,对退休居住在社区的妇女进行病例对照研究。除服用雌激素以外,研究的自变量还包括肥胖、胆囊病史、用雌激素以外,研究的自变量还包括肥胖、胆囊

15、病史、服用其他非雌激素药物。数据见服用其他非雌激素药物。数据见1_1_logistic.sav。条件条件logistic回归回归实例分析实例分析宁夏医科大学流行病与卫生统计学系 乔慧compute case = case1 - pute age = age1 - pute est = est1 - pute gall = gall1 - pute nonest = nonest1 -nonest2.execute.由于本例是由于本例是1:1配对,可以使用变量差值方式加以拟合。配对,可以使用变量差值方式加以拟合。首先运用首先运用compute过程产生配对过程产生配对logistic回归的分析变量

16、,回归的分析变量,或用以下程序予以实现:或用以下程序予以实现:条件条件logistic回归回归实例分析实例分析宁夏医科大学流行病与卫生统计学系 乔慧条件条件logistic回归回归实例分析实例分析宁夏医科大学流行病与卫生统计学系 乔慧条件条件logistic回归回归实例分析实例分析v 把自变量全部把自变量全部选入选入CovariateCovariate框,框,不能选入不能选入factorfactor框!框!宁夏医科大学流行病与卫生统计学系 乔慧默认情况下该复默认情况下该复选框选中,应该选框选中,应该去除该复选框去除该复选框条件条件logistic回归回归实例分析实例分析宁夏医科大学流行病与卫生

17、统计学系 乔慧WarningsThe dependent variable has only one valid value. A conditional logistic regressionmodel will be fitted.条件条件logistic回归回归结果分析结果分析v 这是系统给出的警告,说明由于反应变量只有一这是系统给出的警告,说明由于反应变量只有一个水平,因此个水平,因此SPSSSPSS将拟合条件将拟合条件logisticlogistic回归模型。回归模型。宁夏医科大学流行病与卫生统计学系 乔慧Model Fitting Information87.33753.17834

18、.1594.000ModelNullFinal-2 Log LikelihoodModel Fitting CriteriaChi-SquaredfSig.Likelihood Ratio Tests结果分析结果分析条件条件logistic回归回归v 对模型中所有对模型中所有偏回归系数是否均为偏回归系数是否均为0进行似然比进行似然比检验,结果说明他们不全为检验,结果说明他们不全为0。宁夏医科大学流行病与卫生统计学系 乔慧Pseudo R-Square.419.558.391Cox and SnellNagelkerkeMcFadden结果分析结果分析条件条件logistic回归回归v 输出了输

19、出了三种三种伪决定系数,本伪决定系数,本例的伪决定系数例的伪决定系数还比较大。还比较大。宁夏医科大学流行病与卫生统计学系 乔慧Likelihood Ratio Tests53.658.4801.48872.01318.8361.00058.7705.5921.01853.279.1021.750Effectageestgallnonest-2 Log Likelihood ofReduced ModelModel Fitting CriteriaChi-SquaredfSig.Likelihood Ratio TestsThe chi-square statistic is the diffe

20、rence in -2 log-likelihoods between the finalmodel and a reduced model. The reduced model is formed by omitting an effectfrom the final model. The null hypothesis is that all parameters of that effect are 0.结果分析结果分析条件条件logistic回归回归v 输出从模型中分别剔除每一自变量后拟合新的条件输出从模型中分别剔除每一自变量后拟合新的条件logisticlogistic回归回归模型的模型的-2-2倍似然对数值,用于考察是否可以从当前模型中剔除该自变倍似然对数值,用于考察是否可以从当前模型中剔除该自变量,提示可以进一步采用逐步回归对当前模型中自变量进行筛选。量,提示可以进一步采用逐步回归对当前模型中自变量进行筛选。宁夏医科大学流行病与卫生统计学系 乔慧Parameter Estimates.277.403.47

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论