生存时间资料的非参数分析方法.ppt_第1页
生存时间资料的非参数分析方法.ppt_第2页
生存时间资料的非参数分析方法.ppt_第3页
生存时间资料的非参数分析方法.ppt_第4页
生存时间资料的非参数分析方法.ppt_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二章 生存时间资料的 非参数分析方法,5 December 2005,宇传华(),目 录,第一节 生存时间资料的特点 第二节 小样本生存率的kaplan-Meier估计 第三节 大样本生存率的寿命表法估计 第四节 生存曲线比较的假设检验,第一节 生存时间资料的特点 一、数据结构 二、统计描述指标 三、资料要求,一、数据结构,在临床医学中, 对病人疗效考查: 治疗结局? 生存时间?,“ 生存时间”的概念 开始事件 终点事件 生物生存 死亡,生存时间,电脑开始使用正常 出现故障,疾病产生 治愈,疾病治愈 复发,阴性 阳性,生存时间的三个要点,一、起始事件 二、 终点事件 三、生存时间,医学例子:起始事件 随访时间 终点事件,疾病确诊 死亡,治疗开始 死亡,治疗开始 痊愈,接触危险物 出现反应,治愈出院 复发,广义的“生存时间”也可为医疗费用(元)、 医疗设备使用次数、车辆行驶总里程(公里)等,随访(follow-up)资料的记录,生存资料一般通过随访收集, 记录的项目: (起始与终止)随访事件 生存时间(开始观察日期与终止观察日期)(年、月、天、小时、分、秒等) 分组变量(处理方法) 和其它协变量(性别、年龄、职业、文化程度等),01,167,生存时间资料的特点,2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等) 截尾数据:如表12-1中的1号和 3号病人未观察到底,不知他们究竟能活多长时间。 产生结尾原因: (1)迁移 (2)死于其他原因 (3)因其他客观原因中途退出 (4)预定终止结果迟迟不发生 分布类型复杂:生存时间分布常呈正偏态分布,2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等) 错误1:忽略生存时间,采用Logistic回归分析死亡率 错误2:忽略结局,采用t检验、线性回归分析生存时间,What is Censoring?(截尾问题),X indicates event 0 indicates loss to follow-up,得不到确切的生存时间,但它们提供的生存时间长于观察期的时间,这种数据为不完全数据。或截尾数据、删失数据或终检值。 (如有确切的生存时间,则这种数据称为完全数据。) 两种错误的做法: 错误1:丢弃截尾数据,只考虑确切数据。(损失了信息) 错误2:将截尾数据当作确切数据处理。(低估了生存时间的平均水平)。,截尾(删失)数据或终检值(censored data),两种错误的做法: 错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。 错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间 ),正偏态(positive skewness)数据,二、生存分析的统计描述指标,1.死亡概率、生存概率 2. 生存率及其标准误 3. 半数生存期(中位数) 及四分位数间距,例1 手术治疗60例肺癌病人,术后每年死亡10例,无删失。试求基本生存分析指标。N=60 注意:死亡率与死亡概率的分子相同,但分母不同; 生存概率与生存率的分子相同,但分母不同,1 . 死亡率、死亡概率、生存概率 (1) 死亡率 (mortality rate,death rate) 表示某单位时间内的死亡强度。 年平均人口数=(年初人口数+年末人 口数),(2) 死亡概率 ( mortality probability ) 指死于某时段内的可能性大小。 d/n0 年内有删失,分母用校正人口数: 校正人口数= 年初人口数删失例数 / 2 n0c/2,(3) 生存概率 ( survival probability ) 指某单位时段开始时存活的个体到该时段结束时仍存活的可能性的大小。 (n0-d)/n0 分子为年末尚存人数, 若年内有删失,分母用校正人口数。,生存率 (survival rate) ( 累积生存概率 cumulative probability of survival ) 指病人经历t个单位时间后仍存活的概率。 生存概率指单个时段的概率, 生存率指从0t多个时段的积累概率。,2. 生存率及其标准误,公式1 用于完全数据 (n0-d)/N 公式2 用于 删失数据以及完全数据 S ( t ) = P (T tk ) = p1 p2 pk,例如 手术治疗50例肺癌病人,术后1,2,3年的 死亡数分别为10,10,10例,无截尾数据。 试求各年的 生存概率和3年生存率。 解: 各年生存概率 p1 = ( 50 10 ) / 50, p2 = ( 40 10 ) / 40, p3 = ( 30 10 ) / 30 3 年生存率 S(3) = P(T 3) (n0-d)/N = ( 50 30 ) / 50 = 0.0004 或 S(3) = p1 p2 p3 = 0.4000,生存率的标准误 生存率置信区间,生存曲线 以生存时间为横轴,生存率为纵轴绘制的曲线,(a)研究终止在475天 (b) 研究终止在474天 图12-3 乘积极限法生存曲线(阶梯形)及其半数生存期(Md=158天),图12-4 寿命表法生存曲线(折线)及其半数生存期(Md=1.7年),生存曲线给我们的信息,阶梯状;每一级阶梯代表一个死亡时间点 (在截尾时间点无阶梯);如果最大时间点是截尾则生存曲线不与曲线相交(见下图),否则与横轴相交。,Death,Censored,Median Survival,1.8 Years,生存曲线给我们的信息,Source: SEER 1992-2000, from Patel et al, Gynecologic Oncology. May 2005; 97(2):550-558.,56% (A-A),68% (Non-H),71% (H),5-year Survival,生存曲线给我们的信息,3. 半数生存期及四分位数间距 半数生存期 也称 中位生存期(median survival time) 即生存时间中位数,表示50%的个体可存活的时间 即生存率为时对应的生存时间(集中趋势指标)。,生存期的四分位数间距, 反映离散程度大小,三、资料的基本要求,1. 死亡例数(或死亡比例)不宜太少,否则宜出现偏性; 2. 截尾原因无偏性; 3. 生存时间尽可能记录精确,生存率估计常用的两种方法: 1. 乘积极限法,即kaplan-Meier法 (小样本时) 2. 寿命表法 (大样本时),第二节 小样本生存率的kaplan-Meier估计,乘积极限法又称Kaplan-Meier 法 适用于小样本资料。 基本思想:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。,(a)研究终止在475天 (b) 研究终止在474天 图12-3 乘积极限法生存曲线(阶梯形)及其半数生存期(Md=158天),0,0,第三节 大样本生存率的寿命表法估计 寿命表法(life-table method)的应用早于KaplanMeier法,它是KaplanMeier法的近似方法(频数表法),图12-4 寿命表法生存曲线(折线)及其半数生存期(Md=1.7年),寿命表法只估计时段右端点的生存率,省略了时段内的生存率估计,第四节 生存曲线比较的假设检验 Log rank(时序) 检验(也称为Cox-Mantel检验) Breslow检验(也称Breslow广义Wilcoxon检验 ),共19例(其中大细胞肺癌10例),其中有两个42天 通过KaplanMeier方法得到: 大细胞肺癌组中位生存时间为115天,95置信区间为42186天; 鳞状细胞肺癌组为254天,95置信区间为165458,期初人数,图 Kaplan-Meier生存曲线,绘制Kaplan-Meier生存曲线的常见错误: 在图中不标记删失的数据点。,实现Kaplan Meier方法与log-rank检验 PROC LIFETEST METHOD=km PLOTS=(S); TIME time*censor(1); STRATA group; RUN;,data a; input time group censor ; cards; 11 1 0 115 1 0 60 0 0 254 0 0 32 1 1 124 1 0 102 0 0 281 0 0 42 1 0 174 1 1 165 0 0 295 0 1 42 1 0 186 1 0 189 0 1 458 0 0 71 1 0 278 1 0 200 0 0 ; PROC LIFETEST METHOD=km PLOTS=(S); TIME time*censor(1); STRATA group; RUN;,The SAS System 20:09 Friday, December 3, 2005 4 The LIFETEST Procedure Stratum 1: group = 0 Product-Limit Survival Estimates Survival Standard Number Number time Survival Failure Error Failed Left 0.000 1.0000 0 0 0 9 60.000 0.8889 0.1111 0.1048 1 8 102.000 0.7778 0.2222 0.1386 2 7 165.000 0.6667 0.3333 0.1571 3 6 189.000* . . . 3 5 200.000 0.5333 0.4667 0.1733 4 4 254.000 0.4000 0.6000 0.1738 5 3 281.000 0.2667 0.7333 0.1590 6 2 295.000* . . . 6 1 458.000 0 1.0000 0 7 0 NOTE: The marked survival times are censored observations.,Summary Statistics for Time Variable time Quartile Estimates Point 95% Confidence Interval Percent Estimate Lower Upper) 75 458.000 200.000 458.000 50 254.000 165.000 458.000 25 165.000 60.000 254.000 Mean Standard Error 256.467 51.862,The SAS System 20:09 Friday, December 3, 2005 4 The LIFETEST Procedure Stratum 1: group = 1 Product-Limit Survival Estimates Survival Standard Number Number time Survival Failure Error Failed Left 0.000 1.0000 0 0 0 10 11.000 0.9000 0.1000 0.0949 1 9 32.000* . . . 1 8 42.000 . . . 2 7 42.000 0.6750 0.3250 0.1551 3 6 71.000 0.5625 0.4375 0.1651 4 5 115.000 0.4500 0.5500 0.1660 5 4 124.000 0.3375 0.6625 0.1581 6 3 174.000* . . . 6 2 186.000 0.1688 0.8313 0.1431 7 1 278.000 0 1.0000 0 8 0 NOTE: The marked survival times are censored observations.,Summary Statistics for Time Variable time Quartile Estimates Point 95% Confidence Interval Percent Estimate Lower Upper) 75 186.000 71.000 278.000 50 115.000 42.000 186.000 25 42.000 11.000 124.000 Mean Standard Error 123.725 32.003,Summary of the Number of Censored and Uncensored Values Percent Stratum group Total Failed Censored Censored 1 0 9 7 2 22.22 2 1 10 8 2 20.00 - Total 19 15 4 21.05,The LIFETEST Procedure Testing Homogeneity of Survival Curves for time over Strata Rank Statistics group Log-Rank Wilcoxon 0 -3.3724 -42.000 1 3.3724 42.000 Covariance Matrix for the Log-Rank Statistics group 0 1 0 2.79637 -2.79637 1 -2.79637 2.79637 Covariance Matrix for the Wilcoxon Statistics group 0 1 0 475.000 -475.000 1 -475.000 475.000 Test of Equality over Strata Pr Test Chi-Square DF Chi-Square Log-Rank 4.0670 1 0.0437 Wilcoxon 3.7137 1 0.0540 -2Log(LR) 2.1213 1 0.1453,data a; input time group censor ; cards; 2 1 0 12 1 1 10 2 0 26 2 1 2 1 0 19 1 1 13 2 0 30 2 1 3 1 0 25 1 0 13 2 1 39 2 1 3 1 0 32 1 1 14 2 1 41 2 1 5 1 1 36 1 1 14 2 1 51 2 1 9 1 0 42 1 1 19 2 1 57 2 1 9 1 1 2 2 0 19 2 1 61 2 1 10 1 0 5 2 1 25 2 1 ; PROC LIFETEST METHOD=km PLOTS=(S); TIME time*censor(1); STRATA group; RUN;,Stratum 1: group = 1 Product-Limit Survival Estimates Survival Standard Number Number time Survival Failure Error Failed Left 0.0000 1.0000 0 0 0 14 2.0000 . . . 1 13 2.0000 0.8571 0.1429 0.0935 2 12 3.0000 . . . 3 11 3.0000 0.7143 0.2857 0.1207 4 10 5.0000* . . . 4 9 9.0000 0.6349 0.3651 0.1308 5 8 9.0000* . . . 5 7 10.0000 0.5442 0.4558 0.1401 6 6 12.0000* . . . 6 5 19.0000* . . . 6 4 25.0000 0.4082 0.5918 0.1579 7 3 32.0000* . . . 7 2 36.0000* . . . 7 1 42.0000* . . . 7 0 NOTE: The marked survival times are censored observations. Summary Statistics for Time Variable time Quartile Estimates Point 95% Confidence Interval Percent Estimate Lower Upper) 75 . 25.0000 . 50 25.0000 3.0000 . 25 3.0000 2.0000 25.0000 Mean Standard Error 15.9410 3.0221,Stratum 2: group = 2 Product-Limit Survival Estimates Survival Standard Number Number time Survival Failure Error Failed Left 0.0000 1.0000 0 0 0 17 2.0000 0.9412 0.0588 0.0571 1 16 5.0000* . . . 1 15 10.0000 0.8784 0.1216 0.0807 2 14 13.0000 0.8157 0.1843 0.0963 3 13 13.0000* . . . 3 12 14.0000* . . . 3 11 14.0000* . . . 3 10 19.0000* . . . 3 9 19.0000* . . . 3 8 25.0000* . . . 3 7 26.0000* . . . 3 6 30.0000* . . . 3 5 39.0000* . . . 3 4 41.0000* . . . 3 3 51.0000* . . . 3 2 57.0000* . . . 3 1 61.0000* . . . 3 0 NOTE: The marked survival times are censored observations. Summary Statistics for Time Variable time Quartile Estimates Point 95% Confidence Interval Percent Estimate Lower Upper) 75 . . . 50 . . . 25 . 10.0000 . Mean Standard Error 12.1647 0.7870,The LIFETEST Procedure Summary of the Number of Censored and Uncensored Values Percent Stratum group Total Failed Censored Censored 1 1 14 7 7 50.00 2 2 17 3 14 82.35 - Total 31 10 21 67.74,Test of Equality over Strata Pr Test Chi-Square DF Chi-Square Log-Rank 4.5376 1 0.0332 Wilcoxon 4.1298 1 0.0421 -2Log(LR) 5.9609 1 0.0146,用寿命表法估计例12-3资料(表12.4)的生存率,DATA samp12_3; INPUT t censor f ; CARDS; 0 1 76 0 0 9 1 1 68 1 0 8 2 1 42 2 0 3 3 1 18 3 0 1 4 1 9 4 0 0 5 1 0 5 0 24 ; PROC PRINT; PROC LIFETEST METHOD=lt PLOTS=(s) WIDTH=1; TIME t*censor(0); FREQ f; RUN;,The LIFETEST Procedure Life Table Survival Estimates Conditional Effective Conditional Probability Interval Number Number Sample Probabil

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论