生存分析与Cox回归.ppt_第1页
生存分析与Cox回归.ppt_第2页
生存分析与Cox回归.ppt_第3页
生存分析与Cox回归.ppt_第4页
生存分析与Cox回归.ppt_第5页
免费预览已结束,剩余76页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生存分析与Cox回归,曹,流行病学与健康统计系,2020/6/1,生存分析与Cox回归,2,生存分析与Cox回归,生存数据概述生存分析的基本概念;生存数据的统计描述生存曲线的比较Cox回归,2020/6/1,生存分析和Cox回归,3,1,生存数据概述,例如,一位医生分别用中药和西药治疗了40例急性肝炎患者。结果如下表所示。哪种药有好的治疗效果?2020/6/1,生存分析和Cox回归,4,1,生存数据概述,随访研究(随访研究)是医学研究中常用的设计方法。后续研究不仅要考虑观察对象的结果,还要考虑结果发生的时间。生存数据(生存分析)等数据是一种统计方法,将观察到的结果与结果发生的时间结合起来。2020/6/1,生存分析和Cox回归,5,1,生存数据概述,医学随访研究通常有两种类型的受试者同时进入研究(观察的起始时间相同)。例如,队列研究、动物随访观察、受试者逐个进入研究(不同的观察开始时间)。例如,由于资金和时间的限制,临床随访研究不能无限期延长最终观察时间。2020/6/1,生存分析和Cox回归,8,1。基本概念、开始事件和结束事件开始事件反映主体生存过程开始特征的事件。终结事件也称为失败事件或死亡事件研究者所关注的研究对象的特定结果,它可以标志某种治疗措施的失败或失败。特征事件的初始事件和结束事件由研究目的决定。它们在设计时有明确的定义,并严格遵守,在研究期间不能随意更改。2020/6/1,生存分析和考克斯回归,9,1。基本概念,举例说明以下研究的初始和最终事件。骨髓移植后,急性白血病患者将评价骨髓移植的效果,有无复发。职业性铅中毒的危险因素(从职业暴露开始到发生铅中毒症状)冠心病患者两次发病之间的时间间隔。结直肠癌患者术后的生存状况(手术、死亡)。青少年戒烟复吸健康教育的影响因素分析:接受某种保险方法后中途退保的分析。2020/6/1,生存分析和Cox回归,10,1。基本概念,生存时间或失败时间。存活时间是指观察到的存活时间。公共符号T表示生存时间是生存分析中的重要信息。开始事件和结束事件时间的测量单位(年、月和日)必须准确清晰地指定,2020/6/1。生存分析和考克斯回归,11,1。基本概念,整个研究的观察时间由于有初始事件发生时间、结束事件发生时间、观察开始时间和观察结束时间,生存数据分为完全数据和截断数据,2020/6/1,生存分析和Cox回归,12,1。基本概念,完整数据:指从观察起点到死亡事件发生的时间,生存时间完整准确。删失数据或删失值,也称为删失值或最终校验值。生存时间观察过程的截止不是由于死亡/终点事件,而是由其他原因引起的。从观察起点到截止点的生存时间称为截止数据。通常在生存时间的右上角标记 来表示2020/6/1,生存分析和Cox回归,13,1。基本概念。截断的主要原因是:撤:失去联系,如没有回复来信和来访,没有回复电话采访,没有在挨家挨户的采访中找到人,没有留下搬迁的地址等。退出:例死于非研究因素或非治疗因素,退出研究,如死于意外或其他疾病;由于:设计规定的研究时限已过,观察终止,但研究对象仍活着;2020/6/1,生存分析和Cox回归,16,1。基本概念、完整的数据提供了观察对象的确切生存时间,是过多的截断数据会影响生存分析的效果。可以删除截断的数据吗?2020/6/1,生存分析和考克斯回归,17,1。基本概念,生存数据的两个误差分析丢弃删失数据,仅考虑精确数据丢失样本内容,丢失信息,删失数据提供部分信息,解释将删失数据视为一定时间前的精确数据低估了平均生存时间水平,删失数据中存在生存时间较长的数据,如果丢失,结果将有偏差,2020/6/1,生存分析和Cox回归,18,1。基本概念,分析删失数据是生存分析的一个重要特征。在生存分析中,结果变量通常表示为1表示结束,0表示审查。因变量包括2 :生存时间T和结果变量(0-1),2020/6/1,生存分析和Cox回归,19,2。生存数据的特征,1)包含关于结果和时间的信息;(2)结果是两类互斥事件;(3)一般通过随访收集,随访观察通常从某个统一的时间点开始(经过诊断、入院或手术等一定的治疗措施后),在某个特定的时间点结束。(4)一些受试者的生存时间数据往往因漏访等原因而不完整。(5)分布类型复杂。生存分析,2020/6/1,生存分析和Cox回归,20,3。生存数据的数据形式,2020/6/1,生存分析和Cox回归,21,4。生存分析的基本内容,生存过程描述:研究生存时间的分布特征,估计存活率及其标准误差,绘制生存曲线等。例如,根据乳腺癌患者手术后的生存率数据,不同时间点的生存率及其标准误差,如1年生存率、3年生存率、5年生存率等。可以进行估计,并且可以绘制生存曲线来观察乳腺癌患者手术后的生存过程。常用方法包括产品极限法和寿命表法。2020/6/1,生存分析和Cox回归,22,4。生存分析的基本内容,生存过程的比较:在获得存活率的估计值及其标准误差后,可以比较两组或多组生存曲线(生存过程)。例如,通过比较两种不同治疗方法治疗的恶性肿瘤患者的生存曲线,可以知道哪种治疗方法更好,从而为临床决策提供依据。常用的方法是对数秩检验。2020/6/1,生存分析和Cox回归,23,4。生存分析的基本内容。生存过程的影响因素分析例如,为了改善鼻咽癌患者的预后,应首先了解可能影响患者预后的因素,如年龄、病程、病情、术前健康状况、有无淋巴结转移、术后感染、辅助治疗措施、营养状况等。通过随访收集患者术后生存时间及上述因素的数据,然后通过多因素生存分析方法确定影响患者预后的主要因素,从而为手术前后的预防或干预提供参考依据。常见的多变量生存分析方法:Cox比例风险回归模型,2020/6/1,生存分析和Cox回归,24,生存分析的基本方法,统计描述统计指标:生存率,中位生存时间列表和绘制:生存曲线统计推断参数方法:指数分布,威布尔分布和其他非参数方法:对数秩检验(单因素分析)半参数方法:Cox回归(多变量分析),2020/6/1,生存分析和Cox回归,25,2,生存数据的统计描述, 生存率及其标准误差中值生存曲线,2020/6/1,生存分析和Cox回归,26,基本概念,2020/6/1,生存分析和Cox回归,27,基本概念,2020/6/1,生存分析和Cox回归,28,基本概念,2020/6/1,生存分析和Cox回归,29,基本概念,2020/6/1,生存分析和Cox回归,30,基本概念,2020/6/1,生存分析产品极限法也称为K-M法(Kaplan-Meier法),用于小样本数据或大样本非分段(未按时间分组)数据,life table法用于大样本分段(按时间分组)数据,2020/6/1,生存分析和Cox回归,33,1。 未分组数据(产品极限法/卡普兰-迈耶法),2020/6/1,生存分析和考克斯回归,36,2。分组数据(生命表法),中位生存时间为2.3,生存数据统计描述SPSS实现例1,生存数据统计描述SPSS实现例2,2020/6/1,生存分析和Cox回归,45,3,生存曲线比较(单因素分析),2020/6/1,生存分析和Cox回归,46,上述病例分析中的两种错误方法:错误1:用平均生存时间代替中位生存时间表达平均水平错误2:常规T检验或方差分析用于组间比较。2020/6/1,生存分析和Cox回归,48,3,生存曲线比较(单因素分析),2020/6/1,生存分析和Cox回归,49,3,生存曲线比较(单因素分析),2020/6/1,生存分析和Cox回归,52,生存数据分析样本的基本要求应通过随机抽样获得。为了保证一定的样本含量,死亡人数不应太少,截断病例数不应太多,存活时间应尽可能准确。2020/6/1,生存分析和Cox回归,53,对数秩检验(log-rank)注意事项属于单因素分析方法,适用于两组和多组之间的比较,并可用于时间不分组的数据。它也可用于比较各组时间分组数据之间的存活时间。根据每组生存曲线的高度和中位生存时间,需要满足生存数据的基本要求。此外,各种样品的存活曲线不能交叉。如果生存曲线交叉,这表明可能有混合因素。应使用分层对数秩检验或Cox比例风险回归模型进行分析。生存曲线用SPSS软件进行比较,实现例3,2020/6/1。生存分析和Cox回归,56,4,Cox回归,当对生存时间数据进行单因素分析(对数秩检验)时,要求所有的比较组在非加工因素上是平衡的和可比较的,但在实际工作中很难做到。许多因素会影响生存时间,这需要多因素分析。Cox回归,也称比例风险模型(proportional hazard model),是一种常用的生存数据多元分析统计方法,2020/6/1,生存分析与Cox回归,57,4,Cox回归,解释Cox回归模型的一般形式回归系数,应用条件回归系数估计Cox回归,以及假设检验Cox回归分析中应注意的问题。2020/6/1,生存分析和Cox回归,58,1。Cox回归模型的一般形式,2020/6/1,生存分析和Cox回归,60,1。Cox回归模型的一般形式,2020/6/1,生存分析和Cox回归,61,2。回归系数的解释,相对风险RR:两个风险函数的比率(比率)(风险比率)当Xi存在或不存在某个风险因素(0-1变量)时,2020/6/1,生存分析和Cox回归,62,2。回归系数的解释,当其他自变量固定时,相对误差的对数值RR=exp()0,RR1风险因子=0,RR=1无影响0,RR1保护因子RR的解释与独立变量的编码有关,2020/6/1,生存分析和Cox回归,65,3.Cox回归的应用条件,独立比例风险比与时间无关,恒定独立变量的值和作用大小不随时间变化例:在研究10中,患有糖尿病的心脏病风险总是比没有糖尿病的高3倍。对数线性:自变量与对数风险比呈线性关系,2020/6/1,生存分析和Cox回归,69,4。回归系数估计和假设检验,回归系数估计-最大似然法(偏似然函数)假设检验法似然比检验瓦尔德卡方检验分数得分检验用统计软件估计回归系数。假设检验,SPSS软件:分析/生存/Cox回归,2020/6/1,生存分析和Cox回归,70,5。Cox回归分析中应注意的问题等比例风险的假设影响因素(协变量)的生存曲线无交叉

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论