logistic回归ppt课件_第1页
logistic回归ppt课件_第2页
logistic回归ppt课件_第3页
logistic回归ppt课件_第4页
logistic回归ppt课件_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,Logistic回归,.,筛选影响因素校正混杂效应进行疾病预测,医学研究,线性回归,因变量连续定量变量,自变量与应变量为线性关系,Logistic回归,因变量为分类变量,自变量与因变量为非线性关系,.,目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。,Logistic回归,适用范围,资料:1.应变量为反映某现象发生与不发生的二值变量;2.自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。,.,Logistic回归,适用范围,用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。用检验(或u检验)的局限性:1.只能研究1个危险因素;2.只能得出定性结论。,.,分类,Logistic回归,多分类资料logistic回归:因变量多分类变量,二分类资料logistic回归:因变量二分类变量,多项分类logistic回归模型或有序分类logistic回归模型,非条件logistic回归-非配比病例-对照研究或队列研究,条件logistic回归-配对或配比资料,.,统计学概念,队列研究,相对危险度(RR),病例对照研究,危险度,比数比或优势比(OR),.,队列研究,也称前瞻性研究、随访研究等。是一种由因及果的研究,在研究开始时,根据以往有无暴露经历,将研究人群分为暴露人群和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率或死亡率。如果两组人群发病率或死亡率差别有统计学意义,则认为暴露和疾病间存在联系。,Logistic回归,.,相对危险度,Logistic回归,RR(相对危险度relativerisk):表示暴露组与非暴露组发病率(或死亡率)的比值。也称为危险比(riskratio)。反映了暴露与疾病发生的关联强度。RR表明暴露组发病或死亡的危险是非暴露组的多少倍。,.,相对危险度,Logistic回归,RR1:表示该因素为危险因素,使发病危险度增大RR1:表示该因素为保护因素,使发病危险度减小RR=1:表示该因素对疾病的发病无影响。,.,病例对照研究,Logistic回归,一种由果及因的回顾性研究,先按疾病状态确定调查对象,分为病例和对照两组,然后利用已有的记录、或采用询问、填写调查表等方式,了解其发病前的暴露情况,并进行比较,推测疾病与暴露间的关系。,.,比数比,Logistic回归,.,比数比,Logistic回归,相对危险度RR的本质是暴露组与非暴露组发病率之比或发病概率之比。但病例对照研究不能计算发病率,只能计算比值比OR值。OR与RR的含义是相同的,也是指暴露组的疾病危险性为非暴露组的多少倍。当疾病发病率小于5%时,OR是RR的极好近似值。,OR1,说明该因素是疾病的危险性增加,为危险因素;OR1,说明该因素是疾病的危险性减小,为保护因素;,.,举例,Logistic回归,例:为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,调查记录了8个可能的危险因素,试用Logistic逐步回归分析方法筛选危险因素,并分析各自变量的作用大小。,.,举例,Logistic回归,冠心病8个可能的危险因素与编码说明,.,举例,Logistic回归,冠心病危险因素病例对照研究原始数据,.,模型,Logistic回归,在m个自变量的作用下阳性结果发生的概率记作:,.,举例,Logistic回归,Logistic模型还有另一种线性化表达形式,称为Logit模型:,.,模型,Logistic回归,常数项:表示暴露剂量为0时个体发病与不发病概率之比的自然对数。回归系数:表示自变量改变一个单位时Logitic(P)的改变量。,.,比数比(OR),Logistic回归,流行病学衡量危险因素作用大小的比数比指标。计算公式为:,.,OR与Logitic(P)的关系,Logistic回归,j表示ORj的自然对数值。,.,模型意义,Logistic回归,.,模型意义,Logistic回归,对于发病率很低的慢性疾病如心脑血管病、恶性肿瘤等,优势比可作为相对危险度(relativerisk,RR)的近似估计。即,.,假设检验,Logistic回归,检验假设为:H0:所有H1:,常用的检验方法有以下三种:似然比检验Wald检验记分检验,.,似然比检验,Logistic回归,原理:最大似然(likelihood)估计,-2lnL近似服从分布G=2(lnL1-lnL0)=2ln(L1/L0)=p-l,自变量X引入回归方程L0、L1若L0/L1=1,则接受H1,拒绝H0.,.,似然比检验,Logistic回归,具体方法是:先拟合不包含待检验因素的logistic模型,求对数似然函数值;再拟合包含待检验因素的logistic模型,求另一个对数似然函数值;比较两个对数似然函数值差别的大小,.,Wald检验,Logistic回归,.,记分检验,Logistic回归,以未包含某个或几个变量的模型计算保留模型中参数的估计值,并假设新增参数为零,计算似然函数的一价偏导数及信息距阵,两者相乘便得比分检验的统计量S。n较大时,S近似服从自由度为待检因素个数的分布。,.,比较,Logistic回归,以上三种方法中,在多数情况下,似然比检验是最有效的检验,记分检验一般与它相一致。但两者计算量均较大;Wald检验主要用于对单个回归系数的检验,但是Wald检验未考虑各因素间的综合作用,比较保守,在因素间有共线性存在时,结果不像其它两者可靠。,.,一般过程,Logistic回归,变量的选择建立logistic回归模型时,要求进入模型的自变量应对反应变量有解释能力。通常研究者根据专业知识和研究的问题,首先确定要研究的反应变量和自变量单因素分析(变量的粗略选择)用单因素分析对自变量进行筛选:卡方检验、t检验或单因素的logistic回归,.,一般过程,Logistic回归,.,条件logistic回归,Logistic回归,病例与对照匹配即要求对照在某些因素或特征上与病例保持一致,目的是对两组比较时排除混杂因素的干扰。匹配分为成组匹配和个体匹配。,.,条件logistic回归,Logistic回归,1、成组匹配(categorymatching):匹配的因素所占的比例,在对照组和在病例组一致。如病例组中男女各半,65岁以上者占1/3,则对照组也是如此。2、个体匹配(individualmatching):以病例和对照的个体为单位进行匹配叫个体匹配,每一个病例与M个与它条件相一致的对照形成一个匹配组。1:1匹配又叫配对(pairmatching),1:2,1:m匹配时称为匹配。匹配的特征必须是已知的混杂因子,或者有充分的理由怀疑其为混杂因子,否则不应匹配。,.,条件logistic回归,Logistic回归,.,应用,Logistic回归,矫正混杂因素筛选影响因素疾病预测和预后,.,ROC曲线,.,涵义与起源,ROC曲线,ROC【receiver(relative)operatingcharacteristic的缩写,译为“接受者工作特征”】ROC曲线研究历史1950s雷达信号观测能力评价1960s中期实验心理学、心理物理学1970s末与1980s初诊断医学,.,诊断试验评价四格表,ROC曲线,灵敏度:真阳性率,表示实际患病者且被待评价的诊断方法诊断为患者的概率,反映了待评价的诊断方法检出患者能力Se=a/(a+c)特异度:真阴性率,表示实际未患病患者且被待评价的诊断方法诊断为非患者的概率,反映了待评价的诊断方法检出非患者的能力Sp=d/(b+d),.,ROC曲线,ROC曲线,1-特异度,灵敏度,ROC曲线分析中将不同诊断分界点下的灵敏度和(1-特异度)确定为曲线上的一个操作点,灵敏度为纵坐标,(1-特异度)为横坐标。,参考线,.,曲线下面积,ROC曲线,ROC曲线下面积(AUC):用于定量地反应诊断试验的准确性大小。取值范围0.51.,ROC曲线下面积(Area)与诊断准确度高低高0.90-1.00=excellent(A)中0.80-0.90=good(B)0.70-0.80=fair(C)低0.60-0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论