医学统计学生存分析详解演示文稿_第1页
医学统计学生存分析详解演示文稿_第2页
医学统计学生存分析详解演示文稿_第3页
医学统计学生存分析详解演示文稿_第4页
医学统计学生存分析详解演示文稿_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学生存分析详解演示文稿当前第1页\共有55页\编于星期六\22点(优选)医学统计学生存分析当前第2页\共有55页\编于星期六\22点

上述生存资料若按通常的方法进行分析,有两方面的问题:

1.n年生存率有时出现后一年大于前一年的现象。当前第3页\共有55页\编于星期六\22点表1某地1974—1981年胃癌根治术后随访记录年份例数生存年数12345678197429282523191817171719752624191818181616197624211916141413197732272321181619782523201616197936312926198025231919814636合计24321315412085664633171974年~1981年共手术243例,1974年手术29例,术后1年内死亡1例,活满1年的28例,到1982年末,活满8年的17例。以次类推。

当前第4页\共有55页\编于星期六\22点观察满1年的243例,活满1年的213例:

1年生存率=观察满2年的病例243-46=197例,活满2年的共154例:2年生存率=6年生存率=58.23%7年生存率=60.00%8年生存率=58.62%当前第5页\共有55页\编于星期六\22点

由于失访或死于其它疾病而终止观察等原因,分析时,当作存活或本病死亡均不合理,当作未观察病例则损失信息。因此,在观察例数较少同时截尾数据较多时,此法很不理想。

当前第6页\共有55页\编于星期六\22点

2.

某时点生存率不能反映整个生存过程,比较时可能出现不正确的结论。当前第7页\共有55页\编于星期六\22点

分析生存资料的统计方法称为生存分析(survivalanalysis)。它是将事件的结局和发生这种结局所经历的时间两个因素综合起来分析的一种统计方法。它能够处理截尾数据,并对整个生存过程进行分析或比较。

当前第8页\共有55页\编于星期六\22点生存分析在临床和公共卫生应用广泛:

1.临床治疗方案或处理措施的效果评价。如恶性肿瘤手术或化疗后(转移或死亡前)生存时间、肾移植术后生存时间、心脏起搏器的保留时间、种植牙的保留时间等。

2.疾病危险因素分析和疾病预后的影响因素分析。如肺癌发病危险因素分析、肾移植手术效果的影响因素分析等。当前第9页\共有55页\编于星期六\22点3.特殊人群卫生保健措施的效果评价。如中老年糖尿病预防效果评价、青少年控制吸烟的健康教育干预试验效果评价、食管癌高发区干预措施的效果评价、不同种类宫内节育器的节育效果评价(宫内保留时间或有效避孕时间)、某疫苗接种效果评价(观察抗体滴度了解免疫力持续时间或某病发病率)等。当前第10页\共有55页\编于星期六\22点生存分析的几个概念:

一.终点事件终点事件(terminalevent)又称失效事件(failureevent)或“死亡”事件(deathevent)

,泛指标志某种措施失败或失效的事件,反映治疗效果特征的事件,是根据研究目的确定的。如乳腺癌术后死亡、白血病化疗后复发、肾移植术后的肾衰等,均可作为“死亡”事件。当前第11页\共有55页\编于星期六\22点二.生存时间生存时间(survivaltime)也是一个广义概念,泛指所关心的某现象的持续时间,即随访观察持续的时间,常用符号t表示。当前第12页\共有55页\编于星期六\22点表26例乳腺癌患者术后随访记录

患者编号观察记录生存天数t开始日期终止日期结局(死=1,生=0)原因

102-09-0302-12-290死于肺癌118+

202-09-1002-12-081转移死亡90

302-09-1402-12-310研究终止108+

402-08-2502-11-290失访96+

502-10-0102-11-280死于车祸59+

602-10-0402-12-281复发死亡86

当前第13页\共有55页\编于星期六\22点生存时间分为两种类型:1.完全数据(completedata):指从观察起点到发生“死亡”事件所经历的时间。提供了观察对象确切的生存时间。2.截尾数据(censoreddata):亦称截尾值(censoredvalue)或终检值。指从观察起点到发生非“死亡”事件所经历的时间。当前第14页\共有55页\编于星期六\22点截尾原因大致有三种情况:

1.失访:未继续就诊、拒绝访问或搬迁而失去联系。2.死于与研究疾病无关的原因:由于其他原因死亡。3.研究终止:研究结束时终点事件尚未发生。

截尾数据不能提供完全的信息,真实的生存时间未知,只知道比观察到的截尾时间长,常用符号“+”表示。当前第15页\共有55页\编于星期六\22点生存资料的特点:

1.有生存结局、生存时间2.有不确定数据(截尾数据)3.分布呈指数分布、Weibull分布、对数正态分布、对数logistic分布等当前第16页\共有55页\编于星期六\22点三.死亡概率死亡概率(probabilityofdeath)表示单位时间段开始存活的个体,在该段时间内死亡的可能性。符号q表示。当前第17页\共有55页\编于星期六\22点四.生存概率生存概率(probabilityofsurvival)表示单位时间段开始存活的个体,到该段时间结束时仍存活的可能性。符号p表示。当前第18页\共有55页\编于星期六\22点五.生存率生存率(survivalrate,survivalfunction)表示观察对象经历tk个单位时间段后仍存活的可能性。。若无截尾数据,则当前第19页\共有55页\编于星期六\22点若有截尾数据,须分时段计算生存概率。假定观察对象在各个时段的生存事件独立,应用概率乘法定理:

pi某时段的生存概率,故生存率又称累积生存概率(cumulativeprobabilityof

survival)。当前第20页\共有55页\编于星期六\22点图1生存概率与生存率示意图0231第1年生存概率第2年生存概率第3年生存概率1年生存率2年生存率3年生存率当前第21页\共有55页\编于星期六\22点

生存率也是一个广义概念,研究者定义的“死亡”事件不同,其含义亦不同。

白血病化疗的失败事件是白血病复发,生存率即为缓解率;预防接种腮腺炎疫苗后,接种儿童发生腮腺炎为失败事件,此时生存率为疫苗有效率;安放宫内节育器,失败事件定义为因节育器引起的腹痛、出血过多、感染等副作用,或带环受孕导致取出节育器,此时生存率即为节育器保留率。当前第22页\共有55页\编于星期六\22点六.生存曲线生存曲线(survivalcurve):以生存时间为横轴,将各个时点所对应的生存率连接在一起的曲线图。图2生存曲线当前第23页\共有55页\编于星期六\22点七.中位生存时间中位生存时间(mediansurvivaltime):又称半数生存期,表示恰好有50%的个体尚存活的时间。估计方法:图解法

线性内插法当前第24页\共有55页\编于星期六\22点统计描述:计算生存率、绘制生存率曲线、计算中位生存时间等。统计推断:估计总体生存率的可信区间、生存率曲线的比较。

生存分析主要内容:

影响因素、预测当前第25页\共有55页\编于星期六\22点生存分析基本方法:

1.非参数法:特点是不论资料是什么样的分布类型,只根据样本提供的顺序统计量对生存率进行估计,常用乘积极限法和寿命表法。2.参数法:特点是假定生存时间服从于特定的参数分布,根据已知分布的特点对影响生存的时间进行分析,常用指数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析法。当前第26页\共有55页\编于星期六\22点3.半参数法:介于参数法和非参数法之间,一般属多因素分析方法,用于探讨生存过程的主要影响因素,其经典方法是Cox比例风险回归模型。当前第27页\共有55页\编于星期六\22点随访研究的几个问题:

一、随访内容

1.开始随访的时间:入(出)院时间、确诊时间、开始治疗时间等可作为随访开始的时间。如乳腺癌的乳腺切除术后第一天或出院日、白血病化疗后缓解出院日等,也可规定开始治疗日为随访开始时间。当前第28页\共有55页\编于星期六\22点2.随访的结局和终止随访的时间随访的结局可能有以下几种:(2)失访:拒绝随访、失去联系或中途退出等。终止随访时间为最后一次访问时间。

(1)“死亡”:泛指处理措施失败的事件。如肿瘤化疗后的复发、肾移植因肾衰或与之有关的原因而死亡等。终止随访时间为“死亡”时间。当前第29页\共有55页\编于星期六\22点(3)

死于与研究疾病无关的原因:终止随访时间为死亡时间。

(4)研究终止。研究终止时观察对象仍然存活。终止随访时间为研究终止时间。3.影响生存的有关因素:如患者年龄、病情、病程、术前健康等情况,以便分析这些因素对生存率的影响。

当前第30页\共有55页\编于星期六\22点二、随访方式

1.全部观察对象同时接受处理措施,观察到最后一例出现结果或事先规定的随访截止时间。

图3随访资料常见形式示意图当前第31页\共有55页\编于星期六\22点

2.观察对象在不同时间接受处理措施,完成一定数量随访病例或按事先规定的时间停止随访。

图4随访资料常见形式示意图当前第32页\共有55页\编于星期六\22点生存率的估计与生存曲线:

一、乘积极限法

乘积极限法(product-limitestimate)又称Kaplan-Meier法,适用于未分组生存资料的分析。

例16-1

14例膀胱肿瘤<3.0cm患者和16例膀胱肿瘤≥3.0患者的生存时间(月)如下,试估计两组各时点生存率及其标准误、各时点总体生存率的95%可信区间、中位生存时间,并绘制生存曲线。当前第33页\共有55页\编于星期六\22点肿瘤<3.0cm14192628293236404244+4553+5459+肿瘤≥3.0cm67910111213202325273034374350表3肿瘤<3.0cm组生存率及标准误的计算生存时间t死亡数dt期初病例数nt截尾数ct死亡概率qt生存概率pt生存率S(t)生存率标准误SE[S(t)]1411401/14=0.07140.92860.92680.06881911301/13=0.07690.92310.85720.09352611201/12=0.08330.91670.78580.10972811101/11=0.09090.90910.71440.12072911001/10=0.10000.90000.64290.1281321901/9=0.11110.88890.57150.1323361801/8=0.12500.87500.50010.1336401701/7=0.14290.85710.42860.1323421601/6=0.16670.83330.35710.1281440510/5=0.00001.00000.35710.1281451401/4=0.25000.75000.26780.1233530310/3=0.00001.00000.26780.1233541201/2=0.50000.50000.13390.1130590110/1=0.00001.00000.13390.1130当前第34页\共有55页\编于星期六\22点生存率的计算

1.生存时间t:由小到大排列,遇非截尾和截尾值相同,截尾值排后。2.死亡数dt:与生存时间t对应。注意:截尾值对应的个体未发生“死亡”事件,故死亡数为0。3.期初病例数nt,表示恰好在该时刻以前的病例数。如n29为10,表示恰好在29月时点前有10人存活。

4.死亡概率qt,表示t月前的观察对象恰好在t月时点死亡的概率。

当前第35页\共有55页\编于星期六\22点

5.生存概率pt,表示t月前的观察对象恰好在t月时点存活的概率。6.生存率S(t)。表示该人群恰好活过t

时刻的概率。它为小于和等于t

时刻的各时点生存概率的乘积。

7.生存率的标准误SES(t)

。当前第36页\共有55页\编于星期六\22点

假定生存率近似服从正态分布,某时点总体生存率的(1-a)%可信区间,公式为:总体生存率的可信区间

本例28月总体生存率的95%可信区间:

即膀胱肿瘤<3.0cm患者28月生存率的95%可信区间为47.78%~95.10%。生存曲线尾部的生存率不适合于用该法计算总体生存率的可信区间。当前第37页\共有55页\编于星期六\22点

由表3可见,中位生存时间估计在36月。中位生存时间采用内插法计算:找到与生存率50%相邻的上下两个生存率及其生存时间利用线性比例关系求解中位生存时间。

若各时间点生存率均大于50%,则无法估计中位生存时间。若生存率0.5处所对应的曲线与X轴平行,则中位生存时间不止一个。当前第38页\共有55页\编于星期六\22点图5肿瘤<3.0cm组生存曲线死亡时点生存率,Kaplan-Meier法生存曲线为阶梯形曲线。拐点的纵坐标值在下一个台阶曲线高度&下降坡度当前第39页\共有55页\编于星期六\22点图6肿瘤<3.0cm组和肿瘤≥3.0cm生存曲线当前第40页\共有55页\编于星期六\22点二、寿命表法

适用于分组的生存资料。①实际工作中,随访结果常常没有每个观察对象确切的生存时间,只能获得按随访时间分组的资料。②当样本较大(如n≥50)时,采用乘积极限法估计生存率及其标准误较为繁琐。当前第41页\共有55页\编于星期六\22点例16-2

收集374名某恶性肿瘤患者随访资料,取时间区间均为1年,结果间下表,试估计生存率及其标准误,中位生存时间,并绘制生存曲线。序号确诊后年数期内死亡数期内截尾数期初病例数10~90037421~76028432~51020843~251215754~20512065~799576~497987~136698~3562109~102554表4某恶性肿瘤患者随访资料大样本、分组(生存时间粗略)、截尾当前第42页\共有55页\编于星期六\22点生存率的计算1.确诊后年数t~:“0~”表示从确诊日起不满一年,“1~”表示确诊后1年至不满2年,依次类推。3.期内截尾数ct:泛指具有截尾数据的人,表示随访已满t年,但在未满t+1月期间失访的人。2.期内死亡数dt

:指期内死于某恶性肿瘤的人数。4.期初观察例数n’t

:指时刻t以前的人数。

5.期初有效例数nt:相当于实际观察人时数。在各年年初观察人数中减去同年截尾数的一半。

当前第43页\共有55页\编于星期六\22点

6.死亡概率qt,指活满t年的病人在t+1年内死亡的的概率。

7.生存概率pt,指活满t年的病人在t+1年内存活的概率。8.生存率S(t),表示活过t年的概率。它为小于和等于t

时刻的各时点生存概率的乘积。

9.生存率的标准误SES(t)

。当前第44页\共有55页\编于星期六\22点确诊后年数t期内死亡数dt期内截尾数ct期初病例数n’t期初有效例数nt死亡概率qt生存概率pt生存率S(t)生存率标准误SE[S(t)]0~900374374.090/374.0=0.24060.75940.75940.02211~760284284.076/284.0=0.26760.73240.55620.02572~510208208.051/208.0=0.4520.75480.41980.02553~2512157151.025/151.0=0.16560.83440.35030.02484~205120117.520/117.5=0.17020.82980.29070.02395~799590.57/90.5=0.07730.92270.26820.02356~497974.54/74.5=0.05370.94630.25380.02337~136664.51/64.5=0.01550.98450.24990.02338~356259.53/59.5=0.05040.94960.23730.02329~10255451.52/51.5=0.03880.96120.22810.0232表5寿命表法估计生存率计算表当前第45页\共有55页\编于星期六\22点图7某恶性肿瘤生存曲线(寿命表法)折线形曲线,各组段对应的生存率在上限处每组内两个时点生存率不相同,不祥其变化规律。中位生存时间图解法当前第46页\共有55页\编于星期六\22点线性内插法当前第47页\共有55页\编于星期六\22点(1)样本由随机抽样方法获得,并应有足够的数量;(2)死亡例数不能太少(≥30);(3)截尾值比例不能太大;(4)生存时间尽可能精确到天数,因为多数生存分析方法都在生存时间排序的基础上作统计处理的,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果。生存资料的基本要求:当前第48页\共有55页\编于星期六\22点生存曲线的比较:

例16-3

比较膀胱肿瘤<3.0cm患者和16例膀胱肿瘤≥3.0患者的生存曲线是否有差别。秩和检验?当前第49页\共有55页\编于星期六\22点log-rank检验

对数秩检验,非参数检验法,其零假设为两总体生存曲线相同,但检验过程一般不估计生存率,而利用死亡数和死亡率函数作统计推断。当前第50页\共有55页\编于星期六\22点基本思想:当H0成立时,根据t时点的死亡率,计算出各组的理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论