survive-analysis.ppt_第1页
survive-analysis.ppt_第2页
survive-analysis.ppt_第3页
survive-analysis.ppt_第4页
survive-analysis.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计分析方法,一统天下工作室,生存分析,SurvivalAnalysis,主要内容,什么是生存分析?生存分析的基本概念生存分析的基本方法非参数分析方法Cox比例风险回归分析方法生存分析的注意事项,数据的收集方式:横断面数据(cross-sectionaldata)在同一个时间点上收集的数据;纵断面数据(longitudinaldata)在连续的若干个时间点上收集的数据。-随访数据:50个人的术后存活时间-时间序列数据:近20年每年的肺癌死亡率,随访研究(follow-upstudy)是一种前瞻性研究,是医学研究中常用的设计方法。如观察比较两组肾移植病人手术后的生存时间和结局。在该研究中除考虑随访对象的结局(生存或死亡)外,还应考虑随访对象的“生存时间”,因为即使结局相同,而发生结局的快慢不同,仍可提示两组间存在差异。,经典的统计分析方法不能同时分析“结局”和“生存时间”。另外,更重要的一点是,随访研究过程中研究对象可能会失访,或死于其他疾病,或因研究经费和时间的限制不可能等到所有的观察对象都出现结局才停止实验,这种现象称为截尾(censoring)或终检,截尾数据所提供的信息是不完全的,但不考虑或不利用这类数据又使信息损失。,生存分析是既考虑结果,又考虑生存时间的一种统计方法,并可充分利用截尾数据所提供的不完全信息,对生存时间的分布特征进行描述,对影响生存时间的主要因素进行分析。,一、什么是生存分析?,二、生存分析的基本概念,生存时间生存时间数据的类型生存时间数据的特点生存分析资料的收集方法描述生存时间分布规律的函数生存分析的主要研究内容,生存时间(survivaltime):生存时间又称寿命,生存分析中称为时间变量,从狭义的角度讲,生存时间是指患某种疾病的病人从发病到死亡所经历的时间,从广义的角度讲,从某种起始事件开始,到被观察对象出现某种终点事件所经历的时间称为生存时间或失效时间。,例如:在临床研究中,急性白血病患者从骨髓移植治疗开始到复发为止之间的时间间隔。某病从治疗开始到痊愈;从病症缓解到恶化。冠心病患者在两次发作之间的时间间隔。在流行病学研究中,从开始接触某危险因素到发病所经历的时间。在动物实验研究中,从开始给药到发生死亡所经历的时间。由此可见,“生存”是一广义的概念,并非真正意义上的生存,而是某事件某状态的持续,“死亡”亦非通常意义上的死亡,而是某终点事件的发生。,注:生存时间是一个时间区间,它有一个起点和终点。在实际问题中,起点和终点必须有严格的定义,否则可能会给计算生存时间带来困难。如观察某种治疗方法对某病的疗效,起点是从“起病”算起,还是从“开始治疗”算起?终点是“病人感觉好”还是“某检验指标正常”?事先必须严格定义。,B)生存时间数据的类型完全数据(completedata):它准确地度量了观察对象实际生存的时间。截尾数据(censoreddata):它没有准确地度量观察对象实际生存的时间。例如,在随访过程中某些观察对象失访;或死于其它原因;或在规定的研究过程结束时观察对象的终止事件还未发生。,C)生存时间数据的特点:1)所有观察值取值非负2)存在截尾数据生存分析资料的收集方法:1)确定随访内容(指标变量)2)确定随访人数(样本数)3)确定随访的起始和终止时间同时开始,同时结束不同时间开始,同时结束不同时间开始,不同时间结束,E)描述生存时间分布规律的函数:1、生存函数2、死亡函数3、死亡密度函数4、风险函数,生存函数S(t):观察对象的生存时间T大于某时刻t的概率称为生存函数(survivalfunction)。S(t)满足条件:S(0)=1,S()=0,且0S(t)1。,死亡函数F(t):观察对象的生存时间T不大于某时刻t的概率称为死亡函数(failurefunction)。F(t)满足条件:F(0)=0,F()=1,且0F(t)1。,死亡密度函数f(t):观察对象在某时刻t的瞬时死亡率称为死亡密度函数(failuredensityfunction)。,风险函数h(t):生存到时刻t的观察对象在时刻t的瞬时死亡率称为风险函数(hazardfunction)。,常见风险函数:,h1,h2,h3,h4,h5,h1是一种稳定的风险率,与时间无关,如20-30岁的人,其死亡风险稳定在一个很低的水平.h2是一随时间而减少的风险率.如交通意外受伤的人,在手术成功之后的死亡风险是越来越小.h3是一随时间而增加的风险率.如治疗无好转的肿瘤患者,其死亡风险越来越大.h4是一u型风险函数,又成浴盆曲线.开始时死亡风险较大,并逐渐减少,随后进入一稳定的较低的风险水平,但最后风险逐渐增大.如人类的一生所经受的死亡风险就是这样一种情况.很多电子产品的失效率也具有这种形式.h5是一山峰形风险函数.开始时逐渐增大,到最大风险后逐渐降低,如结核病人,开始时风险增高,治疗后逐渐下降.,F)生存分析的主要研究内容:1、描述生存过程2、比较生存过程3、分析危险因素4、建立数学模型,1、描述法2、非参数分析法3、参数分析法4、半参数分析法,三、生存分析的基本方法,1、描述法:根据样本观察值提供的信息,直接用公式计算出每一时间点或每一个时间区间上的生存函数、死亡函数、风险函数等,并采用列表或绘图的形式来显示生存时间的分布规律。优点:方法简单,且对数据的分布无要求。缺点:1)不能比较两组或多组生存时间分布函数的区别;2)不能分析危险因素对生存时间的影响;3)不能建立生存时间与危险因素之间的关系模型。,例1、某研究者收集了两组急性淋巴细胞性白血病患者治疗后的随访资料,其中,有淋巴结浸润组(LA)18人,无淋巴结浸润组(NLA)25人。生存时间T(月)的数据如下。协变量为淋巴结状态(SLN),负数代表截尾数据。LA组:1,2,3,4,5,7,8,9,10,11,13,14,15,18,-19,-20,-21,23NLA组:1,2,3,4,5,7,8,9,10,11,13,14,15,18,19,-20,21,23,26,28,31,37,66,73,-124,StandardNumberNumberTSurvivalFailureErrorFailedLeft0.0001.0000000181.0000.94440.05560.05401172.0000.88890.11110.07412163.0000.83330.16670.08783154.0000.77780.22220.09804145.0000.72220.27780.10565137.0000.66670.33330.11116128.0000.61110.38890.11497119.0000.55560.44440.117181010.0000.50000.50000.11799911.0000.44440.55560.117110813.0000.38890.61110.114911714.0000.33330.66670.111112615.0000.27780.72220.105613518.0000.22220.77780.098014419.000*.14320.000*.14221.000*.14123.00001.00000150,LA组生存时间分布规律,StandardNumberNumberTSurvivalFailureErrorFailedLeft0.0001.0000000251.0000.96000.04000.03921242.0000.92000.08000.05432233.0000.88000.12000.06503224.0000.84000.16000.07334215.0000.80000.20000.08005207.0000.76000.24000.08546198.0000.72000.28000.08987189.0000.68000.32000.093381710.0000.64000.36000.096091611.0000.60000.40000.0980101513.0000.56000.44000.09931114,NLA组生存时间分布规律,StandardNumberNumberTSurvivalFailureErrorFailedLeft14.0000.52000.48000.0999121315.0000.48000.52000.0999131218.0000.44000.56000.0993141119.0000.40000.60000.0980151020.000*.15921.0000.35560.64440.096616823.0000.31110.68890.094217726.0000.26670.73330.090618628.0000.22220.77780.085719531.0000.17780.82220.079320437.0000.13330.86670.070821366.0000.08890.91110.059622273.0000.04440.95560.0433231124.000*.230,NLA组生存时间分布规律(续),SurvivalFunctionEstimates1.0+*|*SDF|*N|L*N|L*NN0.5+LLNNN|LLNNNN|LLLNNN|L-LN-N-N|N-N-N0.0+LN-+-+-+-+-+-+-+-+-+-+-+-0102030405060708090100Time,无淋巴结浸润患者(N)比有淋巴结浸润患者(L)的平均生存时间长。,两组急性淋巴细胞性白血病患者治疗后的生存时间比较,2、非参数法:估计生存函数时对生存时间的分布没有要求,并且检验危险因素对生存时间的影响时采用的是非参数检验方法。例如,乘积极限法和寿命表法。优点:1)可以估计生存函数;2)可以比较两组或多组生存布函数;3)可以分析危险因素对生存时间的影响;4)对生存时间的分布没有要求。缺点:不能建立生存时间与危险因素之间依存关系的数学模型。,两种非参数生存分析方法,乘积极限法(PL法):适用于离散数据,它用于建立时刻t上的生存函数。PL法是根据t时刻及其之前各时间点上的条件生存率的乘积来估计时刻t的生存函数S(t)和它的标准误SE(S(t)。,累积生存率:,标准误:,例如:P260,表18.1,寿命表法(LT)法:LT法适用于区间数据,它用于建立时间区间t,t+t)上的生存函数。LT法是根据时间区间t,t+t)左端点的生存率及其之前各区间左端点生存率之积来估计区间t,t+t)的生存函数S(t)和它的标准误SE(S(t)。,累积生存率:,标准误:,例如:P263,表18.3,参数法:根据样本观察值来估计假定的分布模型中的参数,获得生存时间的概率分布模型。生存时间经常服从的基线分布有指数分布、Weibull分布、对数正态分布、对数Logistic分布和Gamma分布。优点:1)可以估计生存函数;2)可以比较两组或多组生存布函数;3)可以分析危险因素对生存时间的影响;4)可以建立生存时间与危险因素之间依存关系的模型。缺点:需要事先知道生存时间的分布。,(1)指数分布:S(t)=exp(-t)(2)Weibull分布:S(t)=exp(-t)(3)对数正态分布:,半参数法:不需要对生存时间的分布作出假定,但却可以通过一个模型来分析生存时间的分布规律,以及危险因素对生存时间的影响。例如:Cox比例风险回归模型。优点:1)可以估计生存函数;2)可以比较两组或多组生存布函数;3)可以分析危险因素对生存时间的影响;4)可以建立生存时间与危险因素之间依存关系模型。5)不需要事先知道生存时间的分布。,Cox比例风险回归模型,(1)数学模型:设x=(x1,x2,xk)是影响生存时间t的k个危险因素。设h(t,x)表示受危险因素x的影响下,在时刻t的风险率,又设h0(t)表示在不受危险因素x的影响下,在时刻t的风险率。显然h0(t)=h(t,0),并称h0(t)为基准风险率或基准函数。Cox比例风险回归模型是:,其中,1,2,k是待估未知参数,h0(t)是未知表达式。,因为对于任意一时刻t,都有:,所以,个体在任何时刻的风险率都正比于基准风险率,比例因子为:,可见,RH(x)不随生存时间t的变化而变化。所以这个模型又称为比例风险模型。而且,RH(x)表示个体在因素x影响下的风险率相对于基准风险率之比。,参数的估计方法-最大似然法参数的显著性检验方法:似然比检验法,Wald检验法和比分检验法等。H0:j=0vsH1:j03.模型的显著性检验:似然比卡方检验法H0:1=k=0vsH1:j0,(2)Cox比例风险模型参数和模型的检验,(3)Cox比例风险模型参数的解释,对于一元Cox模型,如果因素x的取值为1和0,分别表示暴露与非暴露于危险因素之下,那么,e表示受x影响与不受x影响的相对风险。,对于一元Cox模型,如果因素x为连续变量,e表示相邻两个水平的风险率之比(相对风险率)。,对于多元Cox模型,ej表示在其它因素不变的情况下,因素xj的相邻两个水平的风险率之比。,例3:为研究某种药物是否会改进急性白血病人的预后,延长其缓解时间。将确诊病人随机给予不同的治疗。一组为用药组(传统治疗加某药),另一组为对照组(传统治疗)。治疗前检测病人白细胞计数(wbc),经一定时间随访,白血病病人的缓解时间列在下表中,其中带-号的是截尾数据。试作Cox模型回归分析。本例以缓解时间长短来衡量治疗效果。缓解时间越长,效果越好。这里的缓解时间是生存分析中的生存时间t,其起点是接受某治疗开始,其终点是缓解结束。,令treat=1表示治疗组,treat=0表示对照组;wbc表示白细胞计数,是连续变量。为了减少内部变异的影响,将白细胞计数取自然对数。,datad1;doi=1to20;dotreat=1,0;inputtimewbc;iftimeRiskVariableDFEstimateErrorChi-SquareChi-SquareRatioLowerUpperTREAT1-1.3479400.428839.880340.00170.2600.1120.602LGWBC10.6692810.13963

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论