




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十六章
logistic回归分析
(LogisticRegression)
9/14/20231医学统计学第十六章
logistic回归分析
ContentLogisticregression
Conditionallogisticregression
Application
9/14/20232医学统计学ContentLogisticregression8/5讲述内容:第一节logistic回归第二节条件logistic回归第三节logistic回归的应用及其注意事项9/14/20233医学统计学讲述内容:8/5/20233医学统计学目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。资料:1.应变量为反映某现象发生与不发生的二值变量;2.自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。9/14/20234医学统计学目的:作出以多个自变量(危险因素)估计应变量(结果因素)的l用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。用检验(或u检验)的局限性:1.只能研究1个危险因素;2.只能得出定性结论。9/14/20235医学统计学用途:研究某种疾病或现象发生和多个危8/5/20235医种类:1.成组(非条件)logistic回归方程。2.配对(条件)logistic回归方程。9/14/20236医学统计学种类:8/5/20236医学统计学第一节
logistic回归
(非条件logistic回归)9/14/20237医学统计学第一节
logistic回归8/5/20237医学统计
一、基本概念,在m个自变量的作用下阳性结果发生的概率记作:9/14/20238医学统计学一、基本概念,在m个自变量的作用下阳性结果发生的概率记作:若令:
回归模型概率P:0~1,logitP:-∞~∞。
取值范围
9/14/20239医学统计学若令:回概率P:0~1,logitP:-∞~∞。取值范围图16-1logistic函数的图形9/14/202310医学统计学图16-1logistic函数的图形8/5/20231模型参数的意义常数项
表示暴露剂量为0时个体发病与不发病概率之比的自然对数。回归系数表示自变量改变一个单位时logitP的改变量。9/14/202311医学统计学模常数项表示暴露剂量为0时个体发病与不发病概率之流行病学衡量危险因素作用大小的比数比例指标。计算公式为:优势比OR(oddsratio)9/14/202312医学统计学流行病学衡量危险因素作用大小的比数比例指标。计算公式为:优势与logisticP的关系:9/14/202313医学统计学与logisticP的关系:8/5/202313医学统计9/14/202314医学统计学8/5/202314医学统计学二、logistic回归模型的参数估计
参数估计
原理:最大似然(likelihood)估计
9/14/202315医学统计学二、logistic回归模型的参数估计参数估计8/5/
2.优势比估计可反映某一因素两个不同水平(c1,c0)的优势比。9/14/202316医学统计学2.优势比估计可反映某一因素两个不同水平(c1例16-1表16-1是一个研究吸烟、饮酒与食道癌关系的病例-对照资料,试作logistic回归分析。
确定各变量编码
9/14/202317医学统计学例16-1表16-1是一个研究吸烟、饮酒与食道癌关系的病表16-1吸烟与食道癌关系的病例-对照调查资料
9/14/202318医学统计学表16-1吸烟与食道癌关系的病例-对照调查资料8/5经logistic回归计算后得:的95
可信区间:
9/14/202319医学统计学经logistic回归计算后得:的95可信区间:8/5
三、logistic回归模型的假设检验
2.1.似然比检验9/14/202320医学统计学三、logistic回归模型的假设检验2.1.似然比检验方法:前进法、后退法和逐步法。
检验统计量:不是F统计量,而是似然比统计量、
Wald统计量和计分统计量之一。四、变量筛选例16-2
为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例
对照研究,各因素的说明及资料见表16-2和表16-3。试用logistic逐步回归分析方法筛选危险因素。9/14/202321医学统计学方法:前进法、后退法和逐步法。
检验统计量:不是F统计量表16-2冠心病8个可能的危险因素与赋值9/14/202322医学统计学表16-2冠心病8个可能的危险因素与赋值8/5/2023表16-3冠心病危险因素的病例
对照调查资料
9/14/202323医学统计学表16-3冠心病危险因素的病例对照调查资料8/5/2表16-4例16-2进入方程中的自变量及有关参数的估计值
学会看结果!9/14/202324医学统计学表16-4例16-2进入方程中的自变量及有关参数的9/14/202325医学统计学8/5/202325医学统计学一、原理
第二节条件logistic回归
9/14/202326医学统计学一、原理第二节条件logistic回归8/5/2表16-51:M
条件logistic回归数据的格式
*t=0为病例,其他为对照
9/14/202327医学统计学表16-51:M条件logistic回归数据的格式条件logistic模型9/14/202328医学统计学条件logistic模型8/5/202328医学统计学二、应用实例9/14/202329医学统计学二、应用实例8/5/202329医学统计学表16-7喉癌1:2配对病例
对照调查资料整理表
P344:9/14/202330医学统计学表16-7喉癌1:2配对病例对照调查资料整理表P34表16-8例16-3进入方程中的自变量及有关参数的估计值
采用逐步法
6个危险因素变量筛选4个进方程,结果见表16-9。
9/14/202331医学统计学表16-8例16-3进入方程中的自变量及有关参数的估计值一、logistic回归的应用1.流行病学危险因素分析logistic回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比或近似相对危险度,因此非常适合于流行病学研究。logistic回归既适合于队列研究(cohortstudy),也适合于病例-对照研究(case-controlstudy),同样还可以用于断面研究(cross-sectionalstudy)第三节logistic回归的应用及其注意事项9/14/202332医学统计学一、logistic回归的应用第三节logistic回归2.临床试验数据分析临床试验的目的大多是为了评价某种药物或治疗方法的效果,如果有其他影响效果的非处理因素(如年龄、病情等)在试验组和对照组中分布不均衡,就有可能夸大或掩盖试验组的治疗效果。尽管在分组时要求按随机化原则分配,但由于样本含量有限,非处理因素在试验组和对照组内的分布仍有可能不均衡,需要在分析阶段对构成混杂的非处理因素进行调整。当评价指标为二值变量时(如有效和无效),可以利用logistic回归分析得到调整后的药物评价结果。对于按分层设计的临床试验可以用相同的方法对分层因素进行调整和分析。9/14/202333医学统计学2.临床试验数据分析8/5/202333医学统计学3.分析药物或毒物的剂量反应
在一些药物或毒物效价的剂量-反应实验研究中,每一只动物药物耐受量可能有很大的不同,不同剂量使动物发生“阳性反应”的概率分布常呈正偏态,将剂量取对数后则概率分布接近正态分布。由于正态分布函数与logistic分布函数十分接近,如果用P表示在剂量为X时的阳性率,可用下述模型表示它们之间的关系用这一模型可以求出任一剂量的阳性反应率传统的一些方法往往对实验设计有严格的要求,如剂量按等比级数排列,各剂量组的例数必须相同等,采用logistic回归的方法则没有这些限制。
9/14/202334医学统计学3.分析药物或毒物的剂量反应用这一模型可以求出任一剂量的4.预测与判别
logistic回归是一个概率型模型,因此可以利用它预测某事件发生的概率。例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。关于判别问题见第十八章。9/14/202335医学统计学4.预测与判别8/5/202335医学统计学二、logistic回归应用的注意事项9/14/202336医学统计学二、logistic回归应用的注意事项8/5/202336医本章小结:目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。资料:1.应变量为反映某现象发生与不发生的二值变量;2.自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。
种类:1.成组(非条件)logistic回归方程。2.配对(条件)logistic回归方程。9/14/202337医学统计学本章小结:目的:作出以多个自变量(危险因素)估计应变量(结果课后应用思考题:
为了分析影响医院抢救急性心肌梗死(AMI)患者能否成功的因素,某医院收集了5年中所有的AMI患者的抢救病史(有关因素很多,由于篇幅有限,本例仅列出3个),共200例见下表。其中P=0表示抢救成功,P=1表示抢救未成功而死亡;X1=1表示抢救前已发生休克,X1=0表示抢救前未发生休克;X2=1表示抢救前已发生心衰,X2=0表示抢救前未发生心衰;X3=1表示患者从开始AMI症状到抢救时已超过12小时,X3=0表示患者从开始AMI症状到抢救时未超过12小时。
请问最好采用哪种分析方法?为什么?分析结果有哪些?9/14/202338医学统计学课后应用思考题:8/5/202338医学统计学AMI患者的抢救危险因素资料P=0(在医院抢救成功)
P=1(在医院抢救未成功而死亡)X1X2X3N
X
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论