第十四章生存分析的SAS实现_第1页
第十四章生存分析的SAS实现_第2页
第十四章生存分析的SAS实现_第3页
第十四章生存分析的SAS实现_第4页
第十四章生存分析的SAS实现_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十四章 生存分析的SAS实现例14-2 McKelvey et al(1976)收集了3期的某型淋巴瘤患者的生存时间(天)。分别是6,19,32,42,42,43+,94,126+,169+,207,211+,227+,253,255+,270+,310+,316+,335+,346+。SAS分析程序data ch14_2; 定义数据集名input t c; 输入生存时间变量t和截尾情况变量ccards; 开始输入数据6 1 19 1 32 1 42 1 42 1 43 0 94 1 126 0 169 0 207 1 211 0 227 0 253 1 255 0 270 0 310 0

2、316 0 335 0 346 0;proc lifetest plots=(s); 利用lifetest过程进行生存分析并作生存函数图time t*c(0); 指定时间变量和截尾变量并指出数据截尾时截尾变量的取值run;SAS软件输出结果Product-Limit Survival Estimates Survival Standard Number Number t Survival Failure Error Failed Left 0.000 1.0000 0 0 0 19 6.000 0.9474 0.0526 0.0512 1 18 19.000 0.8947 0.1053 0.0

3、704 2 17 32.000 0.8421 0.1579 0.0837 3 16 42.000 . . . 4 15 42.000 0.7368 0.2632 0.1010 5 14 43.000* . . . 5 13 94.000 0.6802 0.3198 0.1080 6 12 126.000* . . . 6 11 169.000* . . . 6 10 207.000 0.6121 0.3879 0.1167 7 9 211.000* . . . 7 8 227.000* . . . 7 7 253.000 0.5247 0.4753 0.1287 8 6 255.000* .

4、. . 8 5 270.000* . . . 8 4 310.000* . . . 8 3 316.000* . . . 8 2 335.000* . . . 8 1 346.000* . . . 8 0 NOTE: The marked survival times are censored observations. Summary Statistics for Time Variable t Quartile Estimates Point 95% Confidence Interval Percent Estimate Lower Upper) 75 . . . 50 . 94.000

5、 . 25 42.000 32.000 . Mean Standard Error 181.701 24.497 NOTE: The mean survival time and its standard error were underestimated because the largest observation was censored and the estimation was restricted to the largest event timeSummary of the Number of Censored and Uncensored Values Percent Tot

6、al Failed Censored Censored 19 8 11 57.89SAS软件输出结果解释该结果包含四个部分:第一部分用乘积极限法估计了生存率(Survival), 死亡率(Failure),生存率的标准误(Survival Standard Error),死亡例数(Number Failed)和该时间点前的生存例数(Number Left)。其中带有*号的表示截尾;第二部分给出了关于生存时间的描述性统计量,包括75%,50%和25%分位数以及相应的95%的可信区间(95% Confidence Interval),还有均数(Mean)和标准误(Standard Error)从结

7、果可以看出平均生存时间为181.701天;第三部分列出了完全数据(Failed),截尾数据(Censored)的例数,以及截尾数据占全部数据的百分比(Percent Censored)。最后是生存曲线图。教材中的说明现用Kaplan-Meier法计算生存率,步骤如下:(1)将所有生存时间按从小到大顺序排列(见表14-2第(2)列)并标上序号(第(1)列)。(2)列出各t时点前的存活病例数n(第(3)列)、各个时间点的死亡人数d(第(4)列)和截尾人数c(第(5)列)。(3)计算各t时刻的死亡概率(第(6)列)。例如生存时间为32天时,死亡概率为。(4)计算各t时刻的生存概率(第(7)列)。例如

8、生存时间为32天时,生存概率为。(5)计算各t时刻的生存率(第(8)列)。例如生存时间为32天时,生存率为,由此验证了在没有截尾数据的情况下,式(14-4)与式(14-5)是相同的。(6)以时间t为横指标,生存率为纵指标,作生存曲线图(图141)。表14-2 Kaplan-Meier法计算生存率的计算用表 (1)(2)(3)(4)(5)(6)(7)(8)序号生存天数t时刻前的例数nt时刻死亡数dt时刻后截尾人数c死亡概率q生存概率p生存率S(t)1619100.0526320.9473680.94736821918100.0555560.9444440.89473733217100.05882

9、40.9411760.84210544216200.1250000.8750000.73684264314010.0000001.0000000.73684279413100.0769230.9230770.680162812612010.0000001.0000000.680162916911010.0000001.0000000.6801621020710100.1000000.9000000.612146112119010.0000001.0000000.612146122278010.0000001.0000000.612146132537100.1428570.8571430.524

10、696142556010.0000001.0000000.524696152705010.0000001.0000000.524696163104010.0000001.0000000.524696173163010.0000001.0000000.524696183352010.0000001.0000000.524696193461010.0000001.0000000.524696图14-1 例14-2的生存曲线图例143 下面是来自于Berkson & Gage(1950)的一个研究队列。为了叙述方便,把原来的出院后的生存时间改称为某恶性肿瘤术后生存时间。共有374名患者进入研究队列。

11、表143 寿命表法计算生存率的计算用表(1)(2)(3)(4)(5)(6)(7)(8)(9)序号术后生存年数期初观察例数期内死亡期内截尾人数校正期初人数死亡概率生存概率生存率tndcnc=n-c/2q=d/ncp=1-qS(t)103749003740.2406 0.7594 0.7594 212847602840.2676 0.7324 0.5561 322085102080.2452 0.7548 0.4198 4315725121510.1656 0.8344 0.3503 54120205117.50.1702 0.8298 0.2907 65957990.50.0773 0.9227

12、 0.2682 76794974.50.0537 0.9463 0.2538 87661364.50.0155 0.9845 0.2498 98623559.50.0504 0.9496 0.2372 109542551.50.0388 0.9612 0.2280 1110472126340.6176 0.3824 0.0872 SAS分析程序data ch14_3; 定义数据集名do c=0 to 1; 定义截尾变量do i=1 to 11;input t f; 输入时间变量和频数变量output;end;end;cards;0 90 1 76 2 51 3 25 4 20 5 7 6 4

13、7 1 8 3 9 2 10 210 0 1 0 2 0 3 12 4 5 5 9 6 9 7 3 8 5 9 5 10 26 ;proc lifetest data=ch14_3 利用lifetest过程进行生存分析method =life width=1 plots=(s); 采用寿命表法并作生存函数图time t*c(1); 指定时间变量和截尾变量并指出数据截尾时截尾变量的取值freq f; 指定频数变量run;SAS软件输出结果The LIFETEST Procedure Life Table Survival Estimates Conditional Effective Condi

14、tional Probability Interval Number Number Sample Probability Standard Lower, Upper) Failed Censored Size of Failure Error Survival Failure 0 1 90 0 374.0 0.2406 0.0221 1.0000 0 1 2 76 0 284.0 0.2676 0.0263 0.7594 0.2406 2 3 51 0 208.0 0.2452 0.0298 0.5561 0.4439 3 4 25 12 151.0 0.1656 0.0302 0.4198

15、0.5802 4 5 20 5 117.5 0.1702 0.0347 0.3503 0.6497 5 6 7 9 90.5 0.0773 0.0281 0.2907 0.7093 6 7 4 9 74.5 0.0537 0.0261 0.2682 0.7318 7 8 1 3 64.5 0.0155 0.0154 0.2538 0.7462 8 9 3 5 59.5 0.0504 0.0284 0.2498 0.7502 9 10 2 5 51.5 0.0388 0.0269 0.2372 0.7628 10 . 21 26 34.0 0.6176 0.0833 0.2280 0.7720

16、Evaluated at the Midpoint of the Interval Survival Median Median PDF Hazard Interval Standard Residual Standard Standard Standard Lower, Upper) Error Lifetime Error PDF Error Hazard Error 0 1 0 2.4118 0.1896 0.2406 0.0221 0.273556 0.028564 1 2 0.0221 2.5771 0.3242 0.2032 0.0208 0.308943 0.035013 2 3

17、 0.0257 3.5599 0.8576 0.1364 0.0177 0.279452 0.038747 3 4 0.0255 . . 0.0695 0.0134 0.180505 0.035954 4 5 0.0248 . . 0.0596 0.0129 0.186047 0.041421 5 6 0.0239 . . 0.0225 0.00837 0.08046 0.030386 6 7 0.0235 . . 0.0144 0.00712 0.055172 0.027576 7 8 0.0233 . . 0.00393 0.00392 0.015625 0.015625 8 9 0.02

18、33 . . 0.0126 0.00718 0.051724 0.029853 9 10 0.0232 . . 0.00921 0.00645 0.039604 0.027999 10 . 0.0232 . . . . . . Summary of the Number of Censored and Uncensored Values Percent Total Failed Censored Censored 374 300 74 19.79 NOTE: There were 3 observations with missing values, negative time values

19、or frequency values less than 1.SAS软件输出结果解释本例结果主要包含三个部分:第一部分给出了时间区间的下限和上限,死亡例数(Number Failed),截尾例数(Number Censored),期初观察人数(Effective Sample Size),生存率(Survival), 死亡率(Failure),生存率的标准误(Survival Standard Error)等;第二部分列出了完整数据(Failed),截尾数据(Censored)的例数,以及截尾数据占全部数据的百分比(Percent Censored)。最后是生存曲线图。教材中的说明根据表14

20、3的生存率估计,则以生存时间为横坐标,生存率为纵坐标,各个点的生存率用折线连接,构成寿命表法的生存率曲线(图14-2)。图142 例14-3的生存曲线图生存率估计同样存在抽样误差,往往需要估计标准误和95%可信区间。对于上述两种生存率计算方法均可以用Greenwood(1926)提出方法计算标准误 (14-6)例如34年这一段的生存率的标准误为:Kalbfleisch & Prentice,1980提出对生存率进行转换后估计生存率的95%可信区间可以保证可信区间的范围在(0,1)内,所以被广泛使用,具体计算公式如下: ,其中 (14-7)例如对于34年这一组段的95%可信区间计算为 ,则95%

21、可信区间为 。 两种方法的比较:寿命表法适用于大样本或无法准确得知研究结果出现时间的资料,Kaplan-Meier法可以用于小样本,也可以用于大样本,但要求每个观察对象都有确切的死亡时间和截尾时间。寿命表法是按照指定的时段来分段,估计的是时间区间右端点上的生存率;Kaplan-Meier法是根据死亡时点分段,逐个估计死亡时点的生存率。寿命表法没有确切的死亡时间和失访时间,假定在每个时间段中的“死亡发生时间”和“失访发生的时间”分别呈均匀分布,因此在每个时间段中的生存率呈线性变化,故各个组段间的生存率用直线相连接,Kaplan-Meier法的生存曲线是右连续的阶梯型曲线。当样本量较大及死亡时点较

22、多时,阶梯形就不明显了。例144 在例143中介绍了McKelvey et al收集了19名3期淋巴瘤病人的生存资料,该研究者还同时收集了4期淋巴瘤病人的生存数据共61例:4,6,10,11,11,11,13,17,20,20,21,22,24,24,29,30,30,31,33,34,35,39,40,41+,43+,45,46,50,56,61+,61+,63,68,82,85,88,89,90,93,104,110,134,137,160+,169,171,173,175,184,201,222,235+,247+,260+,284+,290+,291+,302+,304+,341+,3

23、45+。要比较3期淋巴瘤患者和4期淋巴瘤患者的生存率是否有差异。SAS分析程序data ch14_4; 定义数据集名do c=1 to 2; 定义分组变量input n; 输入每组观察次数do i=1 to n;input time censor ; 输入时间变量和截尾变量output;end;end;cards;196 1 19 1 32 1 42 1 42 1 43 0 94 1 126 0 169 0 207 1 211 0 227 0 253 1 255 0 270 0 310 0 316 0 335 0 346 0614 1 6 1 10 1 11 1 11 1 11 1 13 1

24、17 1 20 1 20 1 21 1 22 1 24 1 24 1 29 1 30 1 30 1 31 1 33 1 34 1 35 1 39 1 40 1 41 0 43 0 45 1 46 1 50 1 56 1 61 0 61 0 63 1 68 1 82 1 85 1 88 1 89 1 90 1 93 1 104 1 110 1 134 1 137 1 160 0 169 1 171 1 173 1 175 1 184 1 201 1 222 1 235 0 247 0 260 0 284 0 290 0 291 0 302 0 304 0 341 0 345 0;proc lif

25、etest plots=(s); 利用lifetest过程进行生存分析time time*censor(0); 指定时间变量和截尾变量strata c; 指定分层变量run;SAS软件输出结果解释The LIFETEST Procedure Testing Homogeneity of Survival Curves for time over Strata Rank Statistics c Log-Rank Wilcoxon 1 -8.6870 -396.00 2 8.6870 396.00 Covariance Matrix for the Log-Rank Statistics c 1 2 1 11.2471 -11.2471 2 -11.2471 11.2471 Covariance Matrix for the Wilcoxon Statistics c 1 2 1 30749.5 -30749.5 2 -30749.5 30749.5 Test of Equality over Strata Pr Test Chi-Square DF Chi-Square Log-R

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论