部分1生存分析_第1页
部分1生存分析_第2页
部分1生存分析_第3页
部分1生存分析_第4页
部分1生存分析_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

引例 现用新旧两种方法治疗某癌病患者各100人,结果如下表,试评价其疗效 表3 新旧两种方法治疗某癌病 死亡人数 新法组 旧法组 RR 一年 16 15 1.01,二年 25 35 0.70,五年 40 80 0.50 *,引例 假定用甲、乙两种药物治疗某病,其治愈率均为,能否说两种疗效一致?,还应考虑时间效应问题,如果甲药平均天治愈,而乙药平均天治愈,则可以认为甲药比乙药的疗效好。,Survival analysis and Cox regression analysis,生存分析与Cox回归分析,内容:,一、生存分析 Survival Analysis,1.生存分析简介,(1)生存分析中的基本概念,生存时间(survival time):疾病治疗的预后情况,一方面看结局好坏,另一方面还要看出现这种结局所经历的时间长短。所经历的时间称为生存时间。 完全与不完全数据 一部分研究对象可观察到死亡,从而得到准确的生存时间,所提供的信息是完全的,称为完全数据;另一部分病人由于失访、意外事故、或到观察结束时仍存活等原因,无法知道确切的生存时间,它提供了不完全的信息,称为不完全数据(截尾数据、删失数据:censor data)。,始点 终点,“ 生存”的概念 生物生存 与死亡,仪器始使正常 与出现故障,疾病产生 与治愈,疾病治愈 与复发,阴性 与阳性,起始事件 随访时间 终点事件,疾病确诊 死亡,治疗开始 死亡,治疗开始 痊愈,接触危险物 出现反映,截尾数据的处理,因为不太好处理截尾数据,很多临床研究工作者常常将失访或中止等原因造成的截尾数据在分析时抛弃。截尾数据提供的信息虽然是不完全的,但也很有价值,不应随便删掉它。,例某研究者追踪100名病人经治疗后的生存情况,第1年有30人死亡,第3年时,有20人死亡,有40人失访(退出观察), 10人存活。试估计其生存率。 表4 是否去掉截尾数据不同情况 去掉截尾数据 不去掉截尾数据 n=60 n=100 生存数 生存率 生存数 生存率 1年 30 30/60=50% 70 70/100=70% 3年 10 10/60=13% 10 ?,随访记录表,随访资料记录 记录的项目通常包括处理组别,开始观察日期,终止观察日期,结局,生存时间等。,9例病人的随访记录,病号 性别 开始日期 终止日期 结局 处理 1 男 08/31/82 10/31/89 死亡 手术 2 男 08/31/82 08/28/86 失访 非手术 3 女 10/30/83 03/31/90 死亡 非手术 4 男 12/01/84 10/01/87 死亡 非手术 5 女 01/01/84 10/01/88 死亡 手术 6 男 07/01/85 10/01/88 死亡 手术 7 男 08/31/87 12/30/90 生存 手术 8 女 07/11/86 12/17/90 死亡 手术 9 男 08/31/86 10/01/90 死亡 非手术,9例病人随访记录的数据库,n sex time outcome treat 1 1 7 1 1 2 1 4 0 0 3 0 6 1 0 4 1 3 1 0 5 0 4 1 1 6 1 3 1 1 7 1 3 0 1 8 0 4 1 1 9 1 4 1 0,死亡概率 (mortality probability),是指死于某时段内的可能性大小.记为q,年死亡概率计算公式为: 某年内死亡数 q 某年年初人口数 若年内有删失,则分母用校正人口数: 校正人口数年初人口数 1/ 2 删失数,()生存资料常计算的几种率,生存概率(survival probability),表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小,记为p。年生存概率计算公式为: 活满某一年人数 p 1q 某年年初人口数 若年内有删失,则分母用校正人口数。,生存率与生存函数,生存率是研究对象存活时间长于t的概率,它是时间t的函数 。,若令s(t)为任意时刻t的生存率,T为生存期,得s(t)=p(Tt) 0t ,称s(t)为生存率函数,简称生存函数,()生存分析的主要内容,第一,描述生存过程 研究生存时间的分布特点,估计生存率,生存曲线; 第二,比较生存过程(假设检验) 对两组或多组生存率进行比较; 第三,影响生存时间的因素分析 了解影响生存过程的主要因素为改善预后提供指导。,例在对资料进行描述时: 5名癌症患者存活时间(月) 6 10 14 20 20 n=5 平均生存时间, mean=18 ,median=,7 8+ 25 35 + 50 当有截尾数据时,?,.生存率估计(描述),医学研究中的生存资料分布常常不规则、不确定或未知分布,因而常用非参数法估计生存率。 根据样本含量的大小可分别选择乘积极限估计法(小样本时);寿命表法(大样本时)。,(1)乘积限估计法 Product-limit method,简称积限法或PL法,它是由统计学家Kaplan和Meier于1958年首先提出的,因此又称为Kaplan-Meier法. 基本思想:将生存时间(包括截尾数据)逐个由小到大依次排列,并对其中的每个死亡点进行死亡概率、生存概率和生存率估计。 应用条件:数据个数较少时。,步骤:,1)对生存时间从小到大进行排序 2)列出各时点ti死亡例数di 3)列出各时点ti起始病例数,即期初例数ni 4) 计算死亡概率qi和生存概率pi qi=di/ni ,pi=1-qi 5) 计算生存率s(ti) s(ti)= p0 p1 p2 pi,例1 随访用一种新治疗方法对淋巴癌患者的治疗结果,资料见表5。,存活时 死亡 终检 期初 死 亡 生 存 生存率 间(年) 人数 人数 人数 概 率 概 率 t d c n q=d/n p=1-q S(t) 3 2 1 9 2/9 7/9 7/9 =77.8% 4 3 1 6 3/6 3/6 7/9*3/6 =38.9% 6 1 0 2 1/2 1/2 7/9*3/6*1/2=19.9% 7 1 0 1 1 0 =0,表5 乘积极限法估计生存率计算表,(2)寿命表法 (Life table method),简称LT法。 基本思想:随访时间划分成若干个时间区间,t时刻的生存率为t时刻前各时间区间生存概率的乘积。 应用条件:数据个数多,经分组时应用。,术后 期内死 期内删 期初观 校正年 死亡 生存 t+1年 年数t 亡人数 失人数 察人数 初人数 概率 概率 生存率 0 7 3 104 102.5 0.068 0.932 0.932 1 3 6 94 91 0.033 0.967 0.901 2 1 11 85 79.5 0.013 0.987 0.889 3 3 8 73 69 0.043 0.957 0.851 4 5 5 62 59.5 0.084 0.916 0.779 5 10 1 32 52 36 0.027 0.973 0.758 15 0 14 19 12 0 1 0.758 20 0 4 5 3 0 1 0.758,例2 某院普外科1957年至1977年甲状腺癌患者104例,资料见表6,试计算其各年生存率。,表6 104例甲状腺癌患者其各年生存率,例3P297 某医生收集到35例白血病患者治疗后的生存时间(月),仔细观察后发现这些病人中有一部分人出现了白细胞(WBC)倍增的现象。现将他们按是否出现WBC倍增分成组如下,试用生存分析方法分析患者有无WBC倍增,对其生存时间长短有无影响。 (注:负值代表删失数据),,A组(有WBC倍增):2,-2.5,3.5,4,4,-5,6,-6,7,-7,8,-9,10.5,12.5,19; B组(无WBC倍增):2.5,5,7,-8.5,9,-10,11,-11,12,13,-14,15,-16,17,-18,19,-20,21, 24,32。,DATA abc; INPUT lt ; IF _N_16 THEN group=high-wbc; ELSE group=low-wbc; IF lt0 THEN censor=1; ELSE censor=0; t=ABS(lt); cards; 2 -2.5 3.5 4 4 -5 6 -6 7 -7 8 -9 10.5 12.5 19 2.5 5 7 -8.5 9 -10 11 -11 12 13 -14 15 -16 17 -18 19 -20 21 ;,PROC LIFETEST METHOD=PL; /*乘积极限法*/ TIME t*censor(1); STRATA group; RUN; PROC LIFETEST METHOD=LIFE; /*寿命表法*/ TIME t*censor(1); STRATA group; RUN;,Product-Limit Survival Estimates GROUP = high-wbc Survival Standard Number Number T Survival Failure Error Failed Left 0.0000 1.0000 0 0 0 15 2.0000 0.9333 0.0667 0.0644 1 14 2.5000* . . . 1 13 3.5000 0.8615 0.1385 0.0911 2 12 4.0000 . . . 3 11 4.0000 0.7179 0.2821 0.1198 4 10 5.0000* . . . 4 9 6.0000 0.6382 0.3618 0.1304 5 8 6.0000* . . . 5 7 7.0000 0.5470 0.4530 0.1400 6 6 7.0000* . . . 6 5 8.0000 0.4376 0.5624 0.1487 7 4 9.0000* . . . 7 3 10.5000 0.2917 0.7083 0.1550 8 2 12.5000 0.1459 0.8541 0.1290 9 1 19.0000 0 1.0000 0 10 0,Summary Statistics for Time Variable T Point 95% Confidence Interval Quantile Estimate Lower, Upper) 75% 12.5000 8.0000 19.0000 50% 8.0000 4.0000 12.5000 25% 4.0000 3.5000 8.0000 Mean 9.0775 Standard Error 1.6768,Product-Limit Survival Estimates GROUP = low-wbc Survival Standard Number Number T Survival Failure Error Failed Left 0.0000 1.0000 0 0 0 18 2.5000 0.9444 0.0556 0.0540 1 17 5.0000 0.8889 0.1111 0.0741 2 16 7.0000 0.8333 0.1667 0.0878 3 15 8.5000* . . . 3 14 9.0000 0.7738 0.2262 0.0997 4 13 10.0000* . . . 4 12 11.0000 0.7093 0.2907 0.1103 5 11 11.0000* . . . 5 10 12.0000 0.6384 0.3616 0.1199 6 9 13.0000 0.5675 0.4325 0.1258 7 8 14.0000* . . . 7 7 15.0000 0.4864 0.5136 0.1314 8 6 16.0000* . . . 8 5 17.0000 0.3891 0.6109 0.1365 9 4 18.0000* . . . 9 3 19.0000 0.2594 0.7406 0.1396 10 2 20.0000* . . . 10 1 21.0000 0 1.0000 0 11 0 * Censored Observation,Summary Statistics for Time Variable T Point 95% Confidence Interval Quantile Estimate Lower, Upper) 75% 21.0000 15.0000 21.0000 50% 15.0000 11.0000 21.0000 25% 11.0000 5.0000 15.0000 Mean 14.6057 Standard Error 1.5111,寿命表法结果,Life Table Survival Estimates GROUP = high-wbc Conditional Effective Conditional Probability Interval Number Number Sample Probability Standard Lower, Upper) Failed Censored Size of Failure Error 0 5 4 1 14.5 0.2759 0.1174 5 10 3 4 8.0 0.3750 0.1712 10 15 2 0 3.0 0.6667 0.2722 15 20 1 0 1.0 1.0000 0 Survival Median Median Interval Standard Residual Standard Lower, Upper) Survival Failure Error Lifetime Error 0 5 1.0000 0 0 9.1270 2.4177 5 10 0.7241 0.2759 0.1174 6.5000 2.1213 10 15 0.4526 0.5474 0.1440 3.7500 2.1651 15 20 0.1509 0.8491 0.1322 . .,Evaluated at the Midpoint of the Interval PDF Hazard Interval Standard Standard Lower, Upper) PDF Error Hazard Error 0 5 0.0552 0.0235 0.064 0.031588 5 10 0.0543 0.0263 0.092308 0.051855 10 15 0.0603 0.0312 0.2 0.122474 15 20 0.0302 0.0264 0.4 0,Life Table Survival Estimates GROUP = low-wbc Conditional Effective Conditional Probability Interval Number Number Sample Probability Standard L, U) Failed Censored Size of Failure Error 0 5 1 0 18.0 0.0556 0.0540 5 10 3 1 16.5 0.1818 0.0950 10 15 3 3 11.5 0.2609 0.1295 15 20 3 2 6.0 0.5000 0.2041 20 25 1 1 1.5 0.6667 0.3849 Survival Median Median Interval Standard Residual Standard Lower, Upper) Survival Failure Error Lifetime Error 0 5 1.0000 0 0 16.2457 2.0634 5 10 0.9444 0.0556 0.0540 11.7320 2.0354 10 15 0.7727 0.2273 0.1000 8.2353 1.9948 15 20 0.5711 0.4289 0.1244 5.0000 2.0412 20 25 0.2856 0.7144 0.1321 . .,Evaluated at the Midpoint of the Interval PDF Hazard Interval Standard Standard Lower, Upper) PDF Error Hazard Error 0 5 0.0111 0.0108 0.011429 0.011424 5 10 0.0343 0.0180 0.04 0.022978 10 15 0.0403 0.0207 0.06 0.034249 15 20 0.0571 0.0264 0.133333 0.072577 20 25 0.0381 0.0282 0.2 0.173205,Kaplan-meier生存率曲线图,.生存过程的比较(假设检验),非参数方法: 时序(log-rank)检验对数秩检验 广义Wilcoxon检验 似然比(Likelihood ratio)检验 (SAS可提供7种),生存率组间比较实际上是对两条或多条生存曲线的分布情况比较(齐性检验),参数法要求生存时间已知服从于某种概率分布;非参数法对资料的分布没有要求,适用面比较广。,应用范围,均为两组或多组生存率比较的方法,但: 对数秩检验 Logrank test ,且近似服从 Weibull分布, 数值较小的失效时间所起的作用较大,(是SAS默认的选项检验方法); 广义Wilcoxon检验,最适合数值较大的失效时间所起的作用较大。 似然比(Likel

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论