




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
-,1,Logistic回归分析,公共卫生学院,-,2,一、前言,应变量为分类指标的资料线性回归分析:应变量为连续计量资料,-,3,二、Logistic回归模型,Logistic回归的分类二分类多分类条件Logistic回归非条件Logistic回归,-,4,Logit变换也称对数单位转换logitP=,-,5,流行病学概念:设P表示暴露因素X时个体发病的概率,则发病的概率P与未发病的概率1-P之比为优势(odds),logitP就是odds的对数值。,-,6,Logistic回归模型Logistic回归的logit模型Logistic回归模型,-,7,三、参数估计,最大似然估计法(Maximumlikehoodestimate)似然函数:L=Pi对数似然函数:lnL=(lnP)=lnP1+lnP2+lnPn非线性迭代方法Newton-Raphson法,-,8,四、参数检验,似然比检验(likehoodratiotest)通过比较包含与不包含某一个或几个待检验观察因素的两个模型的对数似然函数变化来进行,其统计量为G(又称Deviance)。G=-2(lnLp-lnLk)样本量较大时,G近似服从自由度为待检验因素个数的分布。,-,9,比分检验(scoretest)以未包含某个或几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数为零,计算似然函数的一价偏导数(又称有效比分)及信息距阵,两者相乘便得比分检验的统计量S。样本量较大时,S近似服从自由度为待检验因素个数的分布。,-,10,Wald检验(waldtest)即广义的t检验,统计量为uu服从正态分布,即为标准正态离差。Logistic回归系数的区间估计,-,11,上述三种方法中,似然比检验最可靠,比分检验一般与它相一致,但两者均要求较大的计算量;而Wald检验未考虑各因素间的综合作用,在因素间有共线性时结果不如其它两者可靠。,-,12,五、回归系数的意义,单纯从数学上讲,与多元线性回归分析中回归系数的解释并无不同,亦即bi表示xi改变一个单位时,logitP的平均变化量。,-,13,流行病学中的一些基本概念:相对危险度(relativerisk):RR=P1/P2比数Odds=P/(1-P)比数比OR=P/(1-P)/P/(1-P)在患病率较小情况下,ORRR,-,14,Logistic回归中的常数项(b0)表示,在不接触任何潜在危险保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。Logistic回归中的回归系数(bi)表示,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即OR的对数值。,-,15,Logistic回归系数的意义,分析因素xi为二分类变量时,存在(暴露)xi,不存在(未暴露)xi,则Logistic回归中xi的系数bi就是暴露与非暴露优势比的对数值即OR=exp(bi)=e(bi),-,16,分析因素xi为多分类变量时,为方便起见,常用1,2,k分别表示k个不同的类别。进行Logistic回归分析前需将该变量转换成k-1个指示变量或哑变量(design/dummyvariable),这样指示变量都是一个二分变量,每一个指示变量均有一个估计系数,即回归系数,其解释同前。,-,17,分析因素xi为等级变量时,如果每个等级的作用相同,可按计量资料处理:如以最小或最大等级作参考组,并按等级顺序依次取为0,1,2,。此时,e(bi)表示xi增加一个等级时的优势比,e(k*bi)表示xi增加k个等级时的优势比。如果每个等级的作用不相同,则应按多分类资料处理。分析因素xi为连续性变量时,e(bi)表示xi增加一个计量单位时的优势比。,-,18,多因素Logistic回归分析时,对回归系数的解释都是指在其它所有自变量固定的情况下的优势比。存在因素间交互作用时,Logistic回归系数的解释变得更为复杂,应特别小心。,-,19,根据Wald检验,可知Logistic回归系数bi服从u分布。因此其可信区间为进而,优势比e(bi)的可信区间为,-,20,六、Logistic回归分析方法,基本思想同线性回归分析。从所用的方法看,有强迫法、前进法、后退法和逐步法。在这些方法中,筛选变量的过程与线性回归过程的完全一样。但其中所用的统计量不再是线性回归分析中的F统计量,而是以上介绍的参数检验方法中的三种统计量之一。,-,21,为计算方便,通常向前选取变量用似然比或比分检验,而向后剔除变量常用Wald检验。,-,22,七、条件Logistic回归,对配对/比调查资料,应该用条件Logistic回归分析。对于配比资料,第i个配比组可以建立一个Logistic回归:,-,23,假设自变量在各配比组中对结果变量的作用是相同的,即自变量的回归系数与配比组无关。配比设计的Logistic回归模型其中不含常数项。,-,24,可以看出此回归模型与非条件Logistic回归模型十分相似,只不过这里的参数估计是根据条件概率得到的,因此称为条件Logistic回归模型。条件Logistic回归的回归系数检验与分析,和非条件Logistic回归完全相同。,-,25,八、Logistic回归的应用,危险/保健因素的筛选,并确定其作用大小。预测:预测某种情况下或者某个病例,某
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广州交通标志牌施工方案
- 2025年高一必修地理试卷及答案
- 遵义速冻冷藏库施工方案
- 酒吧设计接待方案范本
- 2025企业数据中心助管聘用合同
- 2025年无为市属事业单位考试试卷
- 三沙安全员a证考试题库及答案解析
- 2025青岛房屋租赁合同范本
- 2025年朔州消防培训考试题及答案
- 交通安全员c2考试题库及答案解析
- 2025至2030全球及中国两轮组合仪表行业产业运行态势及投资规划深度研究报告
- 工业机器人讲课件
- 2025年屏山炒青茶市场分析报告
- 部编版三年级语文上册日积月累
- 第11章综合与实践低碳生活课件人教版七年级数学下册
- 税务师事务所管理制度
- 建设工程监理专业教学标准(高等职业教育专科)2025修订
- 心理治疗师考试试题及答案
- 兵团职工考试试题及答案
- 老年人70岁驾考三力测试题库
- 2025年中路高科交通科技集团有限公司-企业报告(供应商版)
评论
0/150
提交评论