




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,第十八章 logistic回归分析,(logistic regression),2,例18-1 在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该医院所有的AMI患者,共200例,研究危险因素为X1(抢救前是否休克); X2(抢救前是否心衰); X3(抢救前是否超过12小时)等。 研究目的:分析影响抢救成功的主要因素。,3,医学研究中常碰到应变量的可能取值仅有两个(即二分类变量)或多个,如生存与死亡、发病与未发病、阳性与阴性、治愈与未治愈、暴露与未暴露等.,5,而我们在研究中, 又经常要分析应变量结果的产生与哪些因素有关。 例如:生存与死亡, 发病与未发
2、病, 阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、体质、遗传等许多因素有关。,如何找出其中哪些因素对结果的产生有显著性影响呢? 显然这类资料不满足多重线性回归的条件 。 Logistic回归分析能较好地解决这类问题。,7,目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。 资料:1. 应变量为反映某现象发生与不发生的二值变量;2. 自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。,8,例18-1 在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该医院所有的AMI患者,共200例,研究危险因素为
3、X1(抢救前是否休克); X2(抢救前是否心衰); X1(抢救前是否超过12小时)等。 研究目的:分析影响抢救成功的主要因素。,9,10,用途:研究某种疾病或现象发生和多个危 险因素(或保护因子)的数量关系。 单因素 用 检验的局限性: 只能研究1个危险因素; 只能够定性。,卡方检验,11,outline,Logistic回归模型的基本结构与建立 条件logistic回归 Logistic回归的应用与注意事项,12,第一节 logistic回归模型的 基本结构与建立,13,,,在m个自变量的作用下阳性结果发生的概率记作,一、 基本概念,14,Logistic回归模型的构造,若因变量y为连续型正
4、态定量变量时, 可采用多元线性回归分析y与变量 X1, X2, , Xp之间的关系: y0+1X1+2X2+pXp,现y为发病或未发病,生存与死亡等定性分类变量,不能直接用上模型进行分析。,能否用发病的概率P来直接代替 y呢? p0+1X1+2X2+pXp,15,等式左边 变化范围,P 发病概率 0 P1,1P 不发病概率 0 P1,p/1-p 比数 (ratio) 0 p/1-p+,ln(p/1-p) 对数比 (ratio) - ln(p/1-p) +,16,Logistic 回归模型为: lnP/(1-P)=0+1X1+pXp. 定义:logit(P)= lnP/(1-P)为 Logist
5、ic变换, Logistic 回归模型为: logit(P)=0+1X1+pXp ;,概率P:01,logitP:。,取值范围,经数学变换可得:,概率预报模型,18,19,Logistic回归模型是一种概率模型, 它是以疾病,死亡等结果发生的概率为因变量, 影响疾病发生的因素为自变量建立回归模型。 它特别适用于应变量为二项, 多项分类的资料。 在临床医学中多用于鉴别诊断, 评价治疗措施的好坏及分析与疾病预后有关的因素等。,20,模 型 参 数 的 意 义,21,流行病学衡量危险因素作用大小的比数比例指标。计算公式为:,优势比 OR(odds ratio),22,23,与logisticP的关系
6、:,24,25,二、logistic回归模型的参数估计,参数估计 原理:最大似然(maximum likelihood )估计,26,2. 优势比估计 可反映某一因素两个不同水平(c1,c0)的优势比。,对于二分类,27,三、logistic回归模型的假设检验,1.似然比检验 基本思想:比较在两种不同假设条件下的对数似然函数值,看其差别大小。 具体方法:先拟合一个不包含待检因素在内的logistic模型,求出它的对数似然函数lnL0(包含l个自变量),然后把需要检验的因素加入,模型中去再配合,得到新的对数似然函数lnL1(包含p个自变量), G=1( lnL1- lnL0) 服从自由度= p-
7、l的 分布 既适合单个自变量的假设检验又适合多个自变量的假设检验(常用于整个模型)。,28,三、logistic回归模型的假设检验,2.,大于3.84,有统计学意义,比较适合单个自变量的检验,29,例18-1 在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该医院所有的AMI患者,共200例,研究危险因素为X1(抢救前是否休克); X2(抢救前是否心衰); X1(抢救前是否超过12小时)等。 研究目的:分析影响抢救成功的主要因素。,30,31,例18-1的参数估计与Wald检验结果,logit(P)=-2.0858+1.1098X1+0.7028X2+0.9
8、751X3,32,方法:前进法、后退法和逐步法。检验统计量:不是 F 统计量,而是似然比统计量、 Wald 统计量和计分统计量之一。,四、自变量筛选,例18-2 为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,各因素的说明及资料见表18-1和表18-2。试用logistic 逐步回归分析方法筛选危险因素。,33,表18-1 冠心病8个可能的危险因素与赋值,34,表18-2 冠心病危险因素的病例对照调查资料,35,表18-3 例18-2进入方程中的自变量及有关参数的估计值,学会看结果!,36,37,第二节 条件logistic回归,38,一、原理,此时,每一匹
9、配组内病例和对照是可比的, 而匹配组间无可比性.,39,表18-5 1: M 条件logistic回归数据的格式,* t = 0 为病例,其它为对照,40,条件 logistic 模型,41,参数估计 原理:最大似然(maximum likelihood )估计,综合n个匹配组后的条件似然函数:,对L取自然对数后,用Newton-Raphson迭带方法求得 参数j的估计值bj(j=1,2,3,m),42,二、应用实例,43,表18-7 喉癌1:2配对病例对照调查资料整理表,44,表18-8 例18-3进入方程中的自变量及有关参数的估计值,采用逐步法,6个危险因素 变量筛选 4个进方程,结果见表
10、20-8。,45,第三节logistic回归的应用及注意事项,46,一、logistic回归的应用,1流行病学危险因素分析 logistic回归得到某一因素的回归系数bj后,可以很快估计这一因素在不同水平下的优势比或相对危险度,非常适用于流行病学研究(包括病例对照研究、队列研究、横断面研究)。,47,一、logistic回归的应用,2校正混杂因素 流行病学中常存在一些混杂因素,logistic可以很方便的控制混杂因素的影响,得到校正后的优势比。 比Mantel-Haenszel应用方便的多。,48,一、logistic回归的应用,3预测与判别 如: 通过例20-1建立的模型,根据AMI患者的危
11、险因素暴露情况,预测AMI抢救成功的概率。 对于条件logistic回归,常数项得不到估计,不能用于预测。 有的情况下,模型的常数项没有多大实际意义。 对于病例对照研究的病例和对照的比例是人为选定的,不能代表自然人群的病例和非病例的比例,因而建立的模型常数项没有实际意义,也不能直接用于预测。 大规模的队列研究和横断面研究中,不同暴露层的发病率(或患病率等指标)与研究人群分布一致,常数项才有意义,可用来预测。,49,二、logistic回归应用的注意事项,1、变量的取值形式: 数值变量 转化为有序分类,便于结果解释。 无序分类 为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻
12、情况,而1表示阳性或较严重情况。 多分类(k个)无序分类常用k-1个(0,1)哑变量代替。 有序分类 可以直接按得分处理,也可以转化为k-1个 (0,1)哑变量(dummy variable)代替。,西、中西、中三种疗法哑变量化,原资料,哑变量化,无序分类资料,分k类,转化为k-1个(0,1)哑变量(dummy variable),51,无序分类资料,分k类,转化为k-1个(0,1)哑变量(dummy variable),b1 :相当A 型相对于O 型的差别 b2 :相当B 型相对于O 型的差别 b3 :相当AB 型相对于O 型的差别,52,b1,b2,b3分别反映中学、大学、大学以上相对于小学文化程度者经济收入差别的大小,等级资料,将K个等级转换为K-1个(0,1)哑变量(dummy variable),53,采用此种哑变量赋值方法,主要在于强调参数的解释。 要注意的而是,关于”阳性反映“的定义,如果反应变量Y的编码顺序相反,相应的回归系数的绝对值不变,正负号相反。,54,2、样本含量 样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论