




已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Logistic回归分析,胡利人 流行病与卫生统计学教研室,2019/10/11,2,回归分析的分类,多个因变量 (y1,y2,yk),一个因变量 y,2019/10/11,3,医学研究中常碰到应变量的可能取值仅有两个(即二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多重线性回归的条件,什么情况下采用Logistic回归?,2019/10/11,4,logistic回归(logistic regression)是研究因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。 在分析疾病与各种危险因素间的定量关系,同时为了能真实反映暴露因素与观察结果间的关系,需要控制混杂因素的影响,已知主要控制混杂的方法包括:分层分析和多重回归。,2019/10/11,5,控制混杂因素的方法,(1)Mantel-Haenszel分层分析:适用于样本量大、分析因素较少的情况。 当分层较多时,由于要求各格子中例数不能太少,所需样本较大,往往难以做到; 当混杂因素较多时,分层数也呈几何倍数增长,这将导致部分层中某个格子的频数为零,无法利用其信息。,2019/10/11,6,2019/10/11,7,按饮酒与否分层计算OR值,2019/10/11,8,(2)线性回归分析: 由于因变量是分类变量,不能满足其正态性要求;有些自变量对因变量的影响并非线性。,2019/10/11,9,logistic回归:研究某个二分类(或无序及有序多分类)目标变量与有关因素的关系,不仅适用于病因学分析,也可用于其他方面的研究 。 logistic回归的分类: (1)二分类资料logistic回归 非条件logistic回归 条件logistic回归(配对或配比资料) (2)多分类资料logistic回归,2019/10/11,10,非条件logistic回归,用途,探讨二项分类结果变量发生概率的主要影响因素, 临床上常用于筛选与疾病预后的主要影响因素,评价治疗措施的效果,应用条件,应变量为二项分类变量,自变量可以是定量变量 ,也可以是分类变量,2019/10/11,11,2019/10/11,12,RR(相对危险度relative risk):表示暴露组与非暴露组发病率(或死亡率)的比值。也称为危险比(risk ratio)。反映了暴露与疾病发生的关联强度。 RR表明暴露组发病或死亡的危险是非暴露组的多少倍。,2019/10/11,13,2019/10/11,14,相对危险度RR的本质是暴露组与非暴露组发病率之比或发病概率之比。但病例对照研究不能计算发病率,只能计算比值比OR值。 OR与RR的含义是相同的,也是指暴露组的疾病危险性为非暴露组的多少倍。当疾病发病率小于5%时,OR是RR的极好近似值。,OR1,说明 该因素使疾病的危险性增加,为危险因素;OR1,说明 该因素使疾病的危险性减小为保护因素.,2019/10/11,15,Logistic回归模型的构造,设x1, x2 , , xp为一组自变量,y为应变量。当y是阳性反应时,记为y=1;当y是阴性反应时,记为y=0。用P表示发生阳性反应的概率;用1-P就是发生阴性反应的概率,2019/10/11,16,logistic回归模型,上式中, 0 为常数项, j为偏回归系数,2019/10/11,17,2019/10/11,18,优势(Odds): 优势比(Odds ratio) 表示一个暴露水平与另一个暴露水平相比,所引起某种结局的危险度之比 OR 与j 之间的关系:,偏回归系数j 的流行病学意义,在其他自变量固定不变的情况下,自变量 xj 的暴露水平每改变一个测量单位时,所引起的优势比OR 的自然对数改变量,2019/10/11,19,2019/10/11,20,2019/10/11,21,对于发病率很低的慢性疾病如心脑血管病、恶性肿瘤等,优势比可作为相对危险度(relative risk , RR)的近似估计。 即:,2019/10/11,22,参数估计与假设检验,参数估计:构造似然函数,采用极大似然函 数法求解 假设检验,似然比法 Wald 检验法,2019/10/11,23,2019/10/11,24,观察例数,2019/10/11,25,2019/10/11,26,2019/10/11,27,logistic回归模型的假设检验,2019/10/11,28,2019/10/11,29,对所拟合模型的假设检验:,2019/10/11,30,变量筛选,2019/10/11,31,实例分析,2019/10/11,32,2019/10/11,33,2019/10/11,34,SAS程序,data a; input x1 x2 x3 x4 x5 x6 x7 y; cards; 0 0 1 5.65 2.34 3.61 1.98 0 0 0 0 6.23 3.89 2.11 0.99 0 1 0 1 5.14 2.73 2.88 1.02 0 0 0 0 4.3 1.79 2.64 1.3 1 1 1 0 3.35 0.81 1.68 1.3 1 1 1 0 4.78 1.4 2.15 0.99 1 1 1 0 5.23 1.12 3.69 1.03 1 1 1 0 2.89 1.2 1.95 1.39 1 ; proc logistic des; model y=x1-x7; run;,2019/10/11,35,2019/10/11,36,2019/10/11,37,逐步回归分析,proc logistic des; model y=x1-x7/stb selection=stepwise sle=0.1 sls=0.1; run;,用逐步回归法拟合模型,变量选入和剔除水平均为0.10,2019/10/11,38,2019/10/11,39,2019/10/11,40,2019/10/11,41,logistic逐步回归分析筛选出三个有统计学意义的变量为x2、x4和x7,回归系数分别为1.7324、-2.1630和4.2578。 吸烟(x2)的优势比5.645,表示在控制其他因素后吸烟者 (x2=1)发生该病的危险性是不吸烟者(x2=0)的5.645倍胆固醇(x4)是保护因素,表示控制其他因素影响后,胆固醇每增加一个单位发生该病的危险性是原来的0.115倍。,2019/10/11,42,结果中还给出了标准化偏回归系数,高密度脂蛋白(x7)引起腔隙性脑梗死多发的危险性大于吸烟(x2),而胆固醇(x4)是保护因素。,2019/10/11,43,2019/10/11,44,logistic回归的应用及其注意事项,一、logistic回归的应用 1. 流行病学危险因素分析 logistic回归分析参数的流行病学含义清楚,即得到某一危险因素的回归系数 后,可以方便的估计出该因素在不同水平下的OR值或近似RR值,非常适合于流行病学研究。 在流行病学危险因素研究中,为了排除混杂因素的影响,可以通过拟合包含多变量的logistic回归模型,得到调整后的优势比。,2019/10/11,45,2. 临床试验数据分析 临床评价某种药物或治疗方法的效果,非处理因素在试验组和对照组间分布不均衡,就有可能夸大或掩盖实验组的治疗效果。 尽管在分组时要求按随机化原则分配,但由于样本含量有限,非处理因素在试验组和对照组间的分布仍可能不均衡,需要在分析阶段对构成混杂的因素进行调整,当评价指标为两分类变量时,可以利用logistic回归分析得到调整后的药物或某种治疗方法的评价结果。,2019/10/11,46,3预测与判别 Logistic回归模型是一个概率型模型,对非条件Logistic回归,在给定的条件下可通过logistic回归模型计算某事件发生的概率。因此可以利用它预测某事件发生的概率。在临床上也可以根据疾病与临床检查指标资料,建立logistic回归模型,对新的对象可根据其临床检查指标,计算其患某种疾病的概率的大小,进行判别分析。,2019/10/11,47,某患者吸烟(x2=1),胆固醇水平(x4=5.7) 高密度脂蛋白(x7=2.0) ,则该患者多发腔隙性脑梗死的概率是P=?,2019/10/11,48,二、注意事项 1、数值变量资料的赋值 若自变量是数值变量,最好将其按变量值的大小分成几组,按顺序赋值为1,2,3k,否则参数的实际意义可能不明确。 例如,对于年龄变量,如果利用实际数值则求出的OR值表示年龄每增加一岁时的优势比,实际意义不大。,2019/10/11,49,如果将年龄分成几个不同的水平(年龄段),就比较容易解释,处理上也比较灵活,分析时既可以按得分处理,也可以将其化作k-1个哑变量(dummy variable),哑变量法强调参数解释,其他各水平的恰为相对水平1的优势比;任意两水平的优势比可以由相应的回归系数之差得到。,2019/10/11,50,年龄(岁)xage,2019/10/11,51,2、因变量赋值 与分类变量赋值方法相同,但需注意“阳性反应”的赋值,如果因变量赋值的顺序相反,回归系数绝对值不变,但符号相反。在SAS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国合金刀具磨刀机市场调查研究报告
- 2025年中国双效薄膜蒸发器市场调查研究报告
- 2025年中国单芯冷缩户外终端头市场调查研究报告
- 2025年中国前罩式洗杯机市场调查研究报告
- 2025年中国仪表磁石市场调查研究报告
- 2025年中国中西成药市场调查研究报告
- 2025年中国三节韩式特粗长画筒市场调查研究报告
- 2025年中国PVC装饰片市场调查研究报告
- 2025年中国CE2市场调查研究报告
- 《细胞核结构》课件
- 2025年杭州市高三语文二模作文题目“科技与相互理解”写作指导
- 小学生摄影课件
- 2025(标准)承包清工劳务合同协议书范本
- 合伙入股协议合同范本
- 急救与心理技能(视频课)知到智慧树章节测试课后答案2024年秋中南大学
- DG-TG08-12-2024 普通中小学建设标准
- 冀教 七年级 下册 数学 第7章《平行线的性质》课件
- 《新媒体文案创作与传播(第2版微课版)》全套教学课件
- 征信异议申请书
- 隧道反坡排水、施工通风专项施工方案
- 2024年05月北京北京银行博士后科研工作站招考(514)笔试历年参考题库附带答案详解
评论
0/150
提交评论