logistic回归分析04789ppt课件_第1页
logistic回归分析04789ppt课件_第2页
logistic回归分析04789ppt课件_第3页
logistic回归分析04789ppt课件_第4页
logistic回归分析04789ppt课件_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,第十六章logistic回归分析,logistic回归为概率型非线性回归模型,是研究分类观察结果(y)与一些影响因素(x)之间关系的一种多变量分析方法,.,问题提出:医学研究中常研究某因素存在条件下某结果是否发生?以及之间的关系如何?因素(X)疾病结果(Y)x1,x2,x3XK发生Y=1不发生Y=0例:暴露因素冠心病结果高血压史(x1):有或无有或无高血脂史(x2):有或无吸烟(x3):有或无,.,研究问题可否用多元线性回归方法?,1.多元线性回归方法要求Y的取值为计量的连续性随机变量。2.多元线性回归方程要求Y与X间关系为线性关系。3.多元线性回归结果不能回答“发生与否”logistic回归方法补充多元线性回归的不足,.,Logistic回归方法,该法研究是当y取某值(如y=1)发生的概率(p)与某暴露因素(x)的关系。P(概率)的取值波动01范围。基本原理:用一组观察数据拟合Logistic模型,揭示若干个x与一个因变量取值的关系,反映y对x的依存关系。,.,第一节logistic回归一、基本概念,1.变量的取值logistic回归要求应变量(Y)取值为分类变量(两分类或多个分类)自变量(Xi)称为危险因素或暴露因素,可为连续变量、等级变量、分类变量。可有m个自变量X1,X2,Xm,.,2.两值因变量的logistic回归模型方程,一个自变量与Y关系的回归模型如:y:发生=1,未发生=0 x:有=1,无=0,记为p(y=1/x)表示某暴露因素状态下,结果y=1的概率(P)模型。,或,模型描述了应变量p与x的关系,.,P概率,1,0.5,Z值,0,1,2,3,-1,-2,-3,图16-1Logistic回归函数的几何图形,为正值,x越大,结果y=1发生的可能性(p)越大。,.,几个logistic回归模型方程,.,logistic回归模型方程的线性表达,对logistic回归模型的概率(p)做logit变换,,截距(常数),回归系数,Y(-至+),线形关系,方程如下:,.,在有多个危险因素(Xi)时,多个变量的logistic回归模型方程的线性表达:,或,公式16-2,.,2.模型中参数的意义,0(常数项):暴露因素Xi=0时,个体发病概率与不发病概率之比的自然对数比值。,.,的含义:某危险因素,暴露水平变化时,即Xi=1与Xi=0相比,发生某结果(如发病)优势比的对数值。,P1(y=1/x=1)的概率,P0(y=1/x=0)的概率,.,危险因素Yx=1x=0发病=130(a)10(b)不发病=070(c)90(d)a+cb+d危险因素Yx=1x=0发病=1p1p0不发病=01-p11-p0,有暴露因素人群中发病的比例,.,反映了在其他变量固定后,X=1与x=0相比发生Y事件的对数优势比。回归系数与ORX与Y的关联=0,OR=1,无关1,OR1,有关,危险因素1,OR1,有关,保护因子事件发生率很小,ORRR。,多元回归模型的的概念,.,二、logistic回归模型的参数估计,1.模型中的参数(i)估计通常用最大似然函数(maximumlikelihoodestimate,MLE)估计,由统计软件包完成。(讲义259页),,,,,.,2.优势比(OR)及可信区间的估计,如X=1,0两分类,则OR的1-可信区间估计公式,为回归系数的标准误,(公式16-10),.,例:讲义表16-1资料,一个研究吸烟、饮酒与食道癌关系的病例对照资料(886例),试作logistic回归分析。变量的赋值,.,经logistic回归计算后得b0=-0.9099,b1=0.8856,b2=0.5261,,方程表达:,控制饮酒因素后,吸烟与不吸烟相比患食管癌的优势比为2.4倍,.,OR的可信区间估计,吸烟与不吸烟患食管癌OR的95%可信区间:,饮酒与不饮酒OR的95%可信区间:,.,三、Logistic回归模型的假设检验,1.检验一:对建立的整个模型做检验。说明自变量对Y的作用是否有统计意义。检验方法(讲义260-261页)1)似然比检验(likelihoodratiotest)2)Wald检验3)计分检验(scoretest),.,例表16-1吸烟、饮酒与食管癌资料(SAS软件计算),1.对建立的整个模型做检验。TestingGlobalNullHypothesis:BETA=0TestChi-SquareDFPr似然比68.54572.0001计分检验67.07122.0001Wald检验64.27842.0001,.,2.检验二:,检验模型中某是否对Y有作用。检验假设:检验统计量:主要为Wald检验(SAS软件)例;在大样本时,三方法结果一致。,公式16-13,=1的2,.,例表16-1资料,对各x的做检验(wald检验),参数估计值标准误Chi-SquaPr常数-0.90990.135844.8699.0001吸烟0.88560.150034.8625.0001饮酒0.52610.157211.2069.0008,OddsRatioEstimatesPoint95%WaldEffectEstimateConfidenceLimits吸烟x12.4241.8073.253饮酒x21.6921.2442.303,.,似然比检验(讲义),对某个做检验,检验统计量(G),包括p个自变量的对数似然函数,包括l个自变量的对数似然函数,G服从自由度(d)=p-l的2分布,.,似然比检验对做检验,例:X1为吸烟,X2为饮酒,检验饮酒与食管癌关系,H0:2=0,H1:20,G3.84,p0.05,说明调整吸烟因素后,饮酒与食管癌有关系。,.,四、变量筛选,目的;将回归系数有显著意义的自变量选入模型中,作用不显著的自变量则排除在外。变量筛选算法有:前进法、后退法和逐步法(stepwise)。例:讲义例16-2,用逐步法选入变量的显著水准为0.10,变量保留在方程的水准为0.15例:16-2讲义261-263页,.,表16-4进入方程的自变量及参数估计,变量SbWald2P标准OR常数-4.7051.549.300.0023年龄0.9240.4773.760.05250.4012.52X51.4960.7444.040.04430.4064.46X63.1361.2496.300.01210.70323.06X81.9470.8475.290.02150.5237.01标准回归系数(b)比较各自变量对Y的相对贡献,.,第二节条件Logistic回归,概念:用配对设计获得病例对照研究资料,计算的Logistic回归模型为条件Logistic回归。成组(未配对)设计的病例对照研究资料,计算的Logistic回归模型为非条件Logistic回归。例:见265页区别:条件Logistic回归的参数估计无常数项(0),主要用于危险因素的分析。,.,第三节logistic回归的应用及注意事项,一、logistic回归的应用1.疾病(某结果)的危险因素分析和筛选用回归模型中的回归系数(i)和OR说明危险因素与疾病的关系。例:讲义例16-1,16-2,16-3适用的资料:前瞻性研究设计、病例对照研究设计、横断面研究设计的资料。三类研究计算的logistic回归模型的意义是一致。仅常数项不同。(证明略),.,Logistic回归的应用,2.校正混杂因素,对疗效做评价在临床研究和疗效的评价,组间某些因素构成不一致干扰疗效分析,通过该法可控制非处理因素,正确评价疗效。3.预测与判别预测个体在某因素存在条件下,发生某事件(发病)的概率,为进一步治疗提供依据。,.,表5-4甲乙两疗法某病治愈率%比较,病型甲疗法乙疗法病人治愈治愈病人治愈治愈数数率数数率普通型30018060.01006565.0重型1003535.030012541.7合计40021553.840019047.5,例:,例1,.,表5-5直接法计算标准化治愈率,病型标准甲疗法乙疗法治疗原治预期原治预期人数愈率治愈数愈率治愈数普通型40060.024065.0260重型40035.014041.7167合计800380427调整率(标准化率):,.,X1疗法(甲=0,乙=1)X2病情(轻=1,重=0)Y疗效(Y=1有效,Y=0无效),LOGISTIC回归计算StandardWaldParameterEstimateErrorChi-SquaPrIntercept-0.64530.165315.24.0001疗法0.24820.16992.130.1442病情0.99000.169933.93ChiSqDeviance13.42020.0644Pearson13.42180.0643,.,4.多分类的Logistic回归,Logistic回归可处理:1)应变量(Y)为有序的多分类资料如结果为:治愈、显效、好转、无效2)应变量(Y)为无序的多分类资料例:研究阑尾炎类型与危险因素关系阑尾炎类型有:卡他型、坏疽型、腹膜炎型多分类Logistic回归方法(略),.,结果的表达,一般logistic回归分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论