logistic回归模型简介.ppt_第1页
logistic回归模型简介.ppt_第2页
logistic回归模型简介.ppt_第3页
logistic回归模型简介.ppt_第4页
logistic回归模型简介.ppt_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

logistic回归模型简介,易洪刚,DepartmentofEpidemiology_Iage_1omitted)LogitestimatesNumberofobs=1976LRchi2(5)=151.47Probchi2=0.0000Loglikelihood=-643.06749PseudoR2=0.1054-y|Coef.Std.Err.zP|z|95%CI-+-x|1.385176.25053235.530.000.89414171.87621_Iage_2|1.138362.47697192.390.017.20351462.07321_Iage_3|1.934401.45838814.220.0001.0359772.832825_Iage_4|2.648059.44977355.890.0001.7665193.529599_Iage_5|3.194293.44753267.140.0002.3171454.07144_cons|-4.36985.4347941-10.050.000-5.222031-3.517669-,16南京医科大学流行病与卫生统计学系,logistic回归结果,.xi:logisticyxi.agefw=fi.age_Iage_1-5(naturallycoded;_Iage_1omitted)LogitestimatesNumberofobs=1976LRchi2(5)=151.47Probchi2=0.0000Loglikelihood=-643.06749PseudoR2=0.1054-y|OddsRatioStd.Err.zP|z|95%CI-+-x|3.9955281.0010095.530.0002.4452366.528714_Iage_2|3.1216521.488942.390.0171.2257037.950304_Iage_3|6.9198973.1719984.220.0002.81785716.9934_Iage_4|14.126596.3537655.890.0005.85045234.11027_Iage_5|24.3929110.916627.140.00010.1466658.64136-,17南京医科大学流行病与卫生统计学系,传统方法与logistic回归的关系,单因素病例对照研究的OR,与logistic回归等价;分层病例对照研究的ORMH,与logistic回归结果近似。logistic回归是传统方法的扩展。,18南京医科大学流行病与卫生统计学系,logistic回归,模型简介传统方法与logistic回归的关系回归系数的解释模型的估计与假设检验建模策略正确应用,19南京医科大学流行病与卫生统计学系,3回归系数的解释,logistic回归中的系数,与OR有关!一个暴露因素(x)时,当暴露为1,非暴露为0时,ln(OR),20南京医科大学流行病与卫生统计学系,回归系数的解释,一个暴露因素时,当暴露为c1,非暴露为c0时,,21南京医科大学流行病与卫生统计学系,回归系数的解释,一个暴露因素:暴露为1,非暴露为0。一个混杂因素时:水平数分别为:1,2,,当x2固定时(取某个值的前提下):,22南京医科大学流行病与卫生统计学系,例食道癌危险因素研究,在食道癌危险因素研究中,采用病例-对照设计,调查了200个食道癌患者和788个非食道癌患者,调查因素及编码如下。,23南京医科大学流行病与卫生统计学系,logistic回归系数的解释,24南京医科大学流行病与卫生统计学系,回归系数的解释,等级变量:一般以最小等级或最大等级作为参考组,并按等级顺序依次取为0,1,2,。此时,exp()表示X增加一个等级时的优势比,exp(k)表示增加k个等级时的优势比。连续性变量:表示增加1(个计量单位)时的优势比。,25南京医科大学流行病与卫生统计学系,回归系数的解释,多分类变量:哑变量(dummyvariable)x1时:D10,D20,D30表示A型血x2时:D11,D20,D30表示B型血x3时:D10,D21,D30表示AB型血x4时:D10,D20,D31表示O型血exp(1)表示B与A比之OR;exp(2)表示AB与A比之OR;exp(3)表示O与A比之OR。,26南京医科大学流行病与卫生统计学系,logistic回归,模型简介传统方法与logistic回归的关系回归系数的解释模型的估计与假设检验建模策略正确应用,27南京医科大学流行病与卫生统计学系,4模型的估计及假设检验,线性模型时,用最小二乘估计(LSE)logistic回归模型,用极大似然估计。(maximumlikelihoodestimate,MLE),28南京医科大学流行病与卫生统计学系,Wald检验,Wald检验实际上是比较估计系数与0的差别来进行的,其检验统计量为:,29南京医科大学流行病与卫生统计学系,似然比检验(likelihoodratiotest),似然比检验是通过比较两个相嵌套模型的对数似然函数统计量G(又称Deviance)来进行的,其统计量为:GGPGK2ln(LP)+2ln(LK)其中,模型P中的变量是模型K中变量的一部分,另一部分就是我们要检验的变量(模型P嵌套在模型K中)。G服从自由度为K-P的2分布。,30南京医科大学流行病与卫生统计学系,例分层四格表资料与logistic回归,按年龄分层的心肌梗死与近期口服避孕药的关系,31南京医科大学流行病与卫生统计学系,可能的模型,Model1:logitP=常数项Model2:logitP=常数项+口服药Model3:logitP=常数项+口服药+年龄Model4:logitP=常数项+年龄,32南京医科大学流行病与卫生统计学系,年龄为哑变量的模型,.logityxage2-age5fw=fLogitestimatesNumberofobs=1976LRchi2(5)=151.47Probchi2=0.0000Loglikelihood=-643.06749PseudoR2=0.1054-y|Coef.Std.Err.zP|z|95%CI-+-x|-1.385176.2505323-5.530.000-1.87621-.8941417age2|-1.138362.4769719-2.390.017-2.07321-.2035146age3|-1.934401.4583881-4.220.000-2.832825-1.035977age4|-2.648059.4497735-5.890.000-3.529599-1.766519age5|-3.194293.4475326-7.140.000-4.07144-2.317145_cons|4.36985.434794110.050.0003.5176695.222031-.lrtest,saving(0),33南京医科大学流行病与卫生统计学系,不包含年龄的模型,.logityxfw=fIteration0:loglikelihood=-718.80399Iteration1:loglikelihood=-716.28407Iteration2:loglikelihood=-716.18551Iteration3:loglikelihood=-716.18543LogitestimatesNumberofobs=1976LRchi2(1)=5.24Probchi2=0.0221Loglikelihood=-716.18543PseudoR2=0.0036-y|Coef.Std.Err.zP|z|95%Conf.Interval-+-x|-.5211354.2176934-2.390.017-.9478068-.0944641_cons|2.059114.074164227.760.0001.9137552.204474-.lrtestLogit:likelihood-ratiotestchi2(4)=146.24Probchi2=0.0000,34南京医科大学流行病与卫生统计学系,检验年龄能否以线性形式进入模型,.logityxagefw=fIteration0:loglikelihood=-718.80399Iteration1:loglikelihood=-651.41522Iteration2:loglikelihood=-644.33827Iteration3:loglikelihood=-644.2107Iteration4:loglikelihood=-644.2106LogitestimatesNumberofobs=1976LRchi2(2)=149.19Probchi2=0.0000Loglikelihood=-644.2106PseudoR2=0.1038-y|Coef.Std.Err.zP|z|95%Conf.Interval-+-x|-1.336405.246982-5.410.000-1.820481-.8523292age|-.7087472.0657999-10.770.000-.8377125-.5797818_cons|4.645473.276615816.790.0004.1033165.18763-.lrtestLogit:likelihood-ratiotestchi2(3)=2.29Probchi2=0.5152,35南京医科大学流行病与卫生统计学系,三个变量的logistic回归结果,36南京医科大学流行病与卫生统计学系,12个logistic回归模型及其对数似然函数值,37南京医科大学流行病与卫生统计学系,似然比检验,检验变量ALC是否有统计学意义:模型3与模型1G2-494.74421(-422.42460)144.6392,=1,P0.001,检验在控制AGE的影响后,变量ALC是否有统计学意义:模型5与模型2G2-451.09778(-375.674484)150.8466,=1,P0.001,检验在控制AGE和TOB两变量的影响后,ALC是否有统计学意义:模型7与模型8G2-416.34959(-365.15673)102.3858,=1,P0.001,38南京医科大学流行病与卫生统计学系,logistic回归,模型简介传统方法与logistic回归的关系回归系数的解释模型的估计与假设检验建模策略正确应用,39南京医科大学流行病与卫生统计学系,5建模策略,任一建模过程均应从详细的各变量的单因素分析开始。对性质相同的一些自变量进行部分多因素分析,并探讨自变量纳入模型时的适宜尺度,及自变量间的必要的一些变量变换。在单变量分析和相关自变量分析的基础上,进行多因素的逐步筛选,在多因素筛选模型的基础上,考虑有无必要纳入变量的交互作用项。,40南京医科大学流行病与卫生统计学系,低出生体重儿调查,在中国出生缺陷监测网上进行的低出生体重儿(体重2500g)发生率的调查。分层整群抽样。一年内所抽医院所有的新生儿。共监测2367例无其它系统畸形的新生儿。其中低体重儿为110例,总发生率为4.65。同时调查了一些可疑因素。目的是探讨哪些因素与新生儿的出生体重有关。,41南京医科大学流行病与卫生统计学系,调查的有关因素,42南京医科大学流行病与卫生统计学系,单因素分析结果,43南京医科大学流行病与卫生统计学系,变量选不进的原因:暴露率过低,44南京医科大学流行病与卫生统计学系,母亲年龄与低体重发生率的关系,变量选不进的原因:非线性关系,45南京医科大学流行病与卫生统计学系,母亲年龄与低体重发生率的关系,年龄分组,0,1,2,3,4,0,5,10,15,20,25,发生率(%),46南京医科大学流行病与卫生统计学系,父亲年龄与低体重发生率的关系,变量选不进的原因:非线性关系,47南京医科大学流行病与卫生统计学系,选择变量的尺度,48南京医科大学流行病与卫生统计学系,同类性质指标的多元分析,49南京医科大学流行病与卫生统计学系,多元逐步回归,LogLikelihood=-365.50715,50南京医科大学流行病与卫生统计学系,母亲年龄与低体重发生率的关系,51南京医科大学流行病与卫生统计学系,建模策略,任一建模过程均应从详细的各变量的单因素分析开始。对性质相同的一些自变量进行部分多因素分析,并探讨自变量纳入模型时的适宜尺度,及自变量间的必要的一些变量变换。在单变量分析和相关自变量分析的基础上,进行多因素的逐步筛选,在多因素筛选模型的基础上,考虑有无必要纳入变量的交互作用项。,52南京医科大学流行病与卫生统计学系,不同的模型,不同的分析思维、不同的统计方法所得模型可能不一样,应该允许多个模型并存,只要他们真正较好地反映了病因与疾病间的联系。,53南京医科大学流行病与卫生统计学系,logistic回归,模型简介传统方法与logistic回归的关系回归系数的解释模型的估计与假设检验建模策略正确应用,54南京医科大学流行病与卫生统计学系,6正确应用,logistic回归模型的应用条件独立性。各观察对象间是相互独立的。logitP与自变量的关系是线性关系。队列资料,建议用Poisson回归。,55南京医科大学流行病与卫生统计学系,回归系数的检验,似然比检验:最可靠Wald检验:未考虑各因素的综合作用,当存在共线性时,结果不可靠。故在筛选变量时应慎重。可信区间是基于Wald统计量计算的。在对混杂因素进行分析时,如协变量对回归系数的影响较大(比如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论