生存分析1PPT课件_第1页
生存分析1PPT课件_第2页
生存分析1PPT课件_第3页
生存分析1PPT课件_第4页
生存分析1PPT课件_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第一节生存时间资料的特点 第二节小样本生存率的kaplan-Meier估计 第三节大样本生存率的寿命表法估计 第四节 生存曲线比较的假设检验 第1页/共44页 第一节生存时间资料的特点 一、数据结构 二、统计描述指标 三、资料要求 第2页/共44页一、数据结构一、数据结构 在临床医学中, 对病人疗效考查:1. 治疗结局?2. 生存时间? 第3页/共44页 “ 生存时间生存时间”的概念的概念 开始事件开始事件 终点事件终点事件 生物生存生物生存 死亡死亡 电脑开始使用正常 出现故障 疾病产生 治愈疾病治愈 复发 阴性 阳性第4页/共44页生存时间的三个要点生存时间的三个要点 一、起始事件二、

2、终点事件三、生存时间 第5页/共44页医学例子:起始事件医学例子:起始事件 随访时间随访时间 终点事件终点事件 疾病确诊 死亡 治疗开始 死亡治疗开始 痊愈接触危险物 出现反应治愈出院 复发广义的广义的“生存时间生存时间”也可为医也可为医疗费用(元)、疗费用(元)、医疗设备使用次数、车辆行驶总医疗设备使用次数、车辆行驶总里程里程(公里公里)等等 第6页/共44页随访(随访(follow-up)资料的记录资料的记录 生存资料一般通过随访收集, 记录的项目: (起始与终止)随访事件 生存时间(开始观察日期与终止观察日期)(年、月、天、小时、分、秒等) 分组变量(处理方法) 和其它协变量(性别、年龄

3、、职业、文化程度等)第7页/共44页月 份(2000年)图12-1 生存时间原始记录示意 (+截尾)789101112130.01.02.03.04.05.06.07.0No. 1 2 3 4 5 天 数图12-2 生存时间排序整理数据示意03060901201501800.01.02.03.04.05.06.07.0No. 5 4 1 2 33396158 01167第8页/共44页生存时间资料的特点生存时间资料的特点 2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等)删失(截尾)数据:在规定的观察期内,对某些观察对象由于某种原因未能观察到死亡结局,并不知道确切的生存时间

4、,称为生存时间的删失数据(censored data)。如表12-1中的1号和 3号病人未观察到底,不知他们究竟能活多长时间。 产生结尾原因:(1)迁移 (2)死于其他原因 (3)因其他客观原因中途退出 (4)研究结束时终点事件尚未发生分布类型复杂:生存时间分布不服从正态分布,常常呈正偏态分布、Weibull分布、Gamma分布或更为复杂的分布,因此要用特殊的统计方法。第9页/共44页 2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等)错误1:忽略生存时间,采用Logistic回归分析死亡率错误2:忽略结局,采用t检验、线性回归分析生存时间第10页/共44页 得不到确切的生

5、存时间,但它们提供的生存时间长于观察期的时间,这种数据为不完全数据。或截尾数据、删失数据或终检值。 (如有确切的生存时间,则这种数据称为完全数据。) 两种错误的做法:错误1:丢弃截尾数据,只考虑确切数据。(损失了信息)错误2:将截尾数据当作确切数据处理。(低估了生存时间的平均水平)。截尾截尾( (删失删失) )数据或终检值数据或终检值(censored data)(censored data)第11页/共44页 两种错误的做法:错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间 )正

6、偏正偏态态(positive skewnesspositive skewness)数据数据第12页/共44页二、生存分析的统计描述指二、生存分析的统计描述指标标1.死亡概率、生存概率死亡概率、生存概率2. 生存率及其标准误生存率及其标准误3. 半数生存期(中位数)半数生存期(中位数) 及四分位数间距及四分位数间距第13页/共44页例1 手术治疗60例肺癌病人,术后每年死亡10例,无删失。试求基本生存分析指标。N=60 ;术后 年内 年内 年初 年 死亡死亡 死亡死亡 生存生存 (t+1)年年 年 死亡 截尾 观察 平均 率率 概率概率 概率概率 生存率生存率 数 例数 例数 例数 例数 p=1

7、-q t d c n0 n=no-d/2 m=d/n q=d/n0 (n0-d)/n0 (n0-d)/N (1) (2) (3) (4) (5) (6) (7) (8) (9) 0 10 0 60 55 . 181 . 167 . 833 . 833 1 10 0 50 45 . 222 . 200 . 800 . 667 2 10 0 40 35 . 286 . 250 . 750 . 500 3 10 0 30 25 . 400 . 333 . 667 . 333 4 10 0 20 15 . 667 . 500 . 500 . 167第14页/共44页 1 . 死亡率、死亡概率、生存概率

8、 (1) 死亡率 (mortality rate,death rate) 表示某单位时间内的死亡强度。 年平均人口数=(年初人口数+年末人 口数)/20001000年平均人口数年内死亡人数年死亡率m第15页/共44页 (2) 死亡概率 ( mortality probability ) 是指单位时段开始时存活的个体到该时段结束时死亡的可能性,即死于某时段tt+n内的概率。 d/n0 年内有删失,分母用校正人口数: 校正人口数= 年初人口数删失例数 / 2 n0c/2 年初观察例数年内死亡人数年死亡概率 q第16页/共44页 (3) 生存概率 ( survival probability ) 指

9、某单位时段开始时存活的个体到该时段结束时仍存活的可能性的大小。 (n0-d)/n0 分子为年末尚存人数, 若年内有删失,分母用校正人口数。qp死亡概率年生存概率1年初人口数该年活满一年的人数第17页/共44页生存率 (survival rate) ( 累积生存概率 cumulative probability of survival ) 指病人经历t个单位时间后仍存活的概率。 生存概率指单个时段的概率, 生存率指从0t多个时段的积累概率。 2. 生存率及其生存率及其标准误标准误第18页/共44页 生存率与生存概率仅一字之差,含义却是不同的。 生存概率是针对单位时间而言的,生存率是针对某个较长时

10、间段的,它是生存概率的累积结果。 如评价肿瘤预后常用的5年生存率,是指第1年存活、第2年也存活,直至第5年仍存活的累积概率,而这5年间每1年有不同的生存概率。 第19页/共44页如数据中无删失,生存率可用下式计算 如果有删失数据,则需分时段计算不同单位时间的生存概率Pi(i=1,2,t),然后利用概率乘法原理将Pi相乘得到t时刻生存率。 S ( t ) = P (T tk ) = p1 p2 pk 时刻内观察总例数时刻仍存活例数tttTPtS)()(第20页/共44页 例如手术治疗50例肺癌病人,术后1,2,3年的 死亡数分别为10,10,10例,无截尾数据。 试求各年的 生存概率和3年生存率

11、。 解: 各年生存概率 p1 = ( 50 10 ) / 50, p2 = ( 40 10 ) / 40, p3 = ( 30 10 ) / 30 3 年生存率 S(3) = P(T 3) (n0-d)/N = ( 50 30 ) / 50 = 0.4000 或 S(3) = p1 p2 p3 = 0.4000 第21页/共44页 生存率的标准误 生存率置信区间 kjjjjjkkjjjjkkdnndtSnpqtStSSE10010)()()()(2( ) ( )S tZSE S t第22页/共44页 生存曲线 以生存时间为横轴,生存率为纵轴绘制的曲线 (a)研究终止在475天 (b) 研究终止

12、在474天图12-3 乘积极限法生存曲线(阶梯形阶梯形)及其半数生存期(Md=158天)0100200300400500t (day)0.00.20.40.60.81.0S(t)S(132)=0.50100200300400500t (day)0.00.20.40.60.81.0S(t)Md=158012345t (year)0.00.20.40.60.81.0S(t)Md=1.7图12-4 寿命表法生存曲线(折线折线)及其半数生存期(Md=1.7年)第23页/共44页生存曲线给我们的信息生存曲线给我们的信息 阶梯状;每一级阶梯代表一个死亡时间点 (在截尾时间点无阶梯);如果最大时间点是截尾则

13、生存曲线不与曲线相交(见下图),否则与横轴相交。0.00.10.20.30.40.50.60.70.80.91.00123456Time (Years)DeathCensored第24页/共44页 Median Survival0.00.10.20.30.40.50.60.70.80.91.00123456Time (Years)1.8 Years生存曲线给我们的信息第25页/共44页 3. 半数生存期及四分位数间距 半数生存期也称中位生存期(median survival time), 即生存时间中位数,表示恰好有50%的个体活过此时间,即生存率为时对应的生存时间(集中趋势指标)。其数值可借

14、助生存曲线进行粗略的图表法估计,或用线性内插法求解精确的数值。删失数据超过样本量的50%时,无法估计中位生存时间。此时较为实际的做法是使用生存时间超过一给定时间长度的概率(如3年生存率或5年生存率)生存期的四分位数间距生存期的四分位数间距tt,反映离散程度大小反映离散程度大小第26页/共44页三、资料的基本要求三、资料的基本要求 1. 死亡例数(或死亡比例)不宜太少,否 则宜出现偏性; 2. 截尾原因无偏性; 3. 生存时间尽可能记录精确 第27页/共44页常用的两种方法常用的两种方法:1.1.乘积极限法,即乘积极限法,即kaplan-Meierkaplan-Meier法法 (小样本时)(小样

15、本时)2.2.寿命表法寿命表法 (大样本时)(大样本时) 第28页/共44页 第二节小样本生存率的kaplan-Meier估计 第29页/共44页 乘积极限法(product-limit method)又称Kaplan-Meier 法,由Kaplan和Meier于1958年提出 ,主要针对小样本资料,也可用于大样本,是一种非参数方法。基本思想:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。 第30页/共44页11名接受名接受“手术手术+化疗化疗”治疗的乳腺癌患者的生存时间:治疗的乳腺癌患者的生存时间:10,14,15,16+,19,19,20

16、,20+,24,26,28序序号号时间时间(月月)死死亡亡数数删删失失数数期初例期初例数数生存概率生存概率生存率生存率标准误标准误itidiciniPi=(ni-di)/niS(ti)SE(S(ti)110101110/11=0.90910.90910.086721410109/10=0.90000.81820.11633151098/9=0.88890.72730.1343416+0188/8=1.00000.727307=0.71430.519505=0.80000.41560.1562720+0144/4=1.00000.41560.1

17、5628241032/3=0.66670.277102=0.50000.13850.124510281010/1=0.00000.0000-第31页/共44页1952.19,5 . 05195. 04196. 05195. 0192019mmtt中位生存期3911.24,75. 08182. 07273. 08182. 01415147575tt7503.14,25. 02771. 01385. 02771. 02426242525tt第32页/共44页例例 12-2 一 组 病 人 的 存 活 时 间 为一 组 病 人 的 存 活 时 间 为 79, 133, 18

18、5, 475, 133, 238+天 ,天 ,试 用试 用 Kaplan-Meier 法 估 计 生 存 率法 估 计 生 存 率 。 表表 12-3 乘积极限法估计生存率计算表乘积极限法估计生存率计算表 序序 号号 存活时存活时 间间(天天) t 时刻时刻 死亡数死亡数 t 时刻时刻 截 尾 数截 尾 数 t 时刻期时刻期初例数初例数 死亡死亡 概率概率 生存生存 概率概率 生存率生存率 标准误标准误 j t d c n0 q=d/n0 p=1-q S ( t) S E S ( t) (1) (2 ) ( 3 ) (4 ) (5 ) (6 ) (7 ) (8 ) (9) 1 7 97 9 1

19、 0 6 1/6 5/6 (5/6)0.833 0.152 2 1 3 31 3 3 2 0 5 2/5 3/5 (5/6)(3/5)0.500 0.204 3 1 8 51 8 5 1 0 3 1/3 2/3 (5/6)(3/5)(2/3)0.333 0.193 4 2 3 82 3 8 0 1 2 0/2 2/2 (5/6)(3/5)(2/3)(2/2)0.333 0 5 4 7 54 7 5 1 0 1 1/1 0/1 (5/6)(3/5)(2/3)(0/1)0.000 0 kjjjjjkkjjjjkkdnndtSnpqtStSSE10010)()()()(第33页/共44页 (a)研究

20、终止在475天 (b) 研究终止在474天图12-3 乘积极限法生存曲线(阶梯形阶梯形)及其半数生存期(Md=158天)0100200300400500t (day)0.00.20.40.60.81.0S(t)S(132)=0.50100200300400500t (day)0.00.20.40.60.81.0S(t)Md=15800第34页/共44页第三节 大样本生存率的寿命表法估计 寿命表法(life-table method)的应用早于KaplanMeier法,它是KaplanMeier法的近似方法(频数表法) 第35页/共44页10100( (1)(1)(1)()kjkkjjjkjkj

21、jjjqSE S tS tp ndS tnnd第36页/共44页图图12-4 寿命表法生存曲线寿命表法生存曲线(折线折线)及其半数生存期及其半数生存期(Md=1.7年)年)012345t (year)0.00.20.40.60.81.0S(t)Md=1.7寿命表法只估计时段右端点的生存率右端点的生存率,省略了时段内的生存率估计 第37页/共44页 第四节 生存曲线比较的假设检验1.Log rank(时序) 检验(也称为Cox-Mantel检验) 2.Breslow检验(也称Breslow广义Wilcoxon检验 ) 第38页/共44页21例乳腺癌患者两种疗法的生存时间(月)例乳腺癌患者两种疗法的生存时间(月)手手术术组组691315181919

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论