版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、温州医学院公共卫生学院温州医学院公共卫生学院 叶晓蕾叶晓蕾2一、生存分析的意义一、生存分析的意义34观察某观察某“手术或化疗手术或化疗”对恶性肿瘤病人的疗效,可对恶性肿瘤病人的疗效,可将将“手术或化疗手术或化疗”代替代替“出生出生”,用生存分析来分,用生存分析来分析接受该处理患者的生存时间以及活过某时点的概析接受该处理患者的生存时间以及活过某时点的概率。率。以第一次心肌梗死代替以第一次心肌梗死代替“出生出生”,以第二次心肌梗,以第二次心肌梗死代替死代替“死亡死亡”,用生存分析可以预计在多少年或,用生存分析可以预计在多少年或月内发生第二次心肌梗死的概率。月内发生第二次心肌梗死的概率。一般而言,能
2、够明确划分一般而言,能够明确划分的现象,即凡涉的现象,即凡涉及事物寿命现象的问题,均可以用生存分析的原理和及事物寿命现象的问题,均可以用生存分析的原理和方法来进行研究。方法来进行研究。5二、生存分析的基本概念二、生存分析的基本概念6(一)生存分析的基本术语(一)生存分析的基本术语1、“死亡死亡”事件或称失败事件事件或称失败事件(failure event) 2、截尾值、截尾值(censored value) 3、生存时间、生存时间(survival time)4、生存率、生存率(survival rate)71、“死亡死亡”事件或称失败事件事件或称失败事件(failure event) :表示
3、观察到随访对象出现了我们所规定的结局,是表示观察到随访对象出现了我们所规定的结局,是反映处理因素失败或失效的特征。如乳腺癌病人手反映处理因素失败或失效的特征。如乳腺癌病人手术后复发、肾移植病人肾功能衰竭、白血病患者化术后复发、肾移植病人肾功能衰竭、白血病患者化疗后的复发等。疗后的复发等。 失败事件的认定是生存分析的基石,必须绝对失败事件的认定是生存分析的基石,必须绝对准确。准确。注意:注意:失效事件应当由研究目的而定,并非一定是失效事件应当由研究目的而定,并非一定是死亡,而死亡也并非一定是失败事件。死亡,而死亡也并非一定是失败事件。82、截尾值、截尾值(censored value) :删失值
4、。:删失值。 有的观察对象终止随访不是由于失败事件发生,有的观察对象终止随访不是由于失败事件发生,而是由于而是由于中途失访、死于其它原因、随访截止中途失访、死于其它原因、随访截止。由由于不知道这些观察对象发生失败事件的时间,他们于不知道这些观察对象发生失败事件的时间,他们的资料不能提供完全的信息,这些对象的观察值称的资料不能提供完全的信息,这些对象的观察值称为截尾值,常用符号为截尾值,常用符号“+”表示。如表示。如140+天。天。 93、生存时间、生存时间(survival time) 即随访观察持续的实足时间,按失败事件发生或即随访观察持续的实足时间,按失败事件发生或失访前最后一次的随访时间
5、记录。按天、周、月、失访前最后一次的随访时间记录。按天、周、月、年等时间单位记录,常用符号年等时间单位记录,常用符号t表示。表示。 一般情况下较细的时间单位准确性较高,应尽量一般情况下较细的时间单位准确性较高,应尽量以个体为单位采用较细的时间单位来记录。但在许以个体为单位采用较细的时间单位来记录。但在许多大型的随访中,不可能做到按个体记录,常见的多大型的随访中,不可能做到按个体记录,常见的是按固定时间段(如一月一次等)记录有多少人失是按固定时间段(如一月一次等)记录有多少人失访及多少人发生失败事件,此为分组生存资料。访及多少人发生失败事件,此为分组生存资料。10l如某病人如某病人1990年年2
6、月月1日进入随访,日进入随访,1992年年4月间发生月间发生失败事件,他的生存时间为失败事件,他的生存时间为t=26月;月;l 又如某白血病患者化疗又如某白血病患者化疗3月后失去联系,他的随访月后失去联系,他的随访结果为一截尾值,生存时间记为结果为一截尾值,生存时间记为t=3+月;月;l 安放心脏起搏器患者术后安放心脏起搏器患者术后2年因意外事故死亡,他年因意外事故死亡,他的随访结果也为一截尾值,生存时间记为的随访结果也为一截尾值,生存时间记为t=2+年。年。l某医院对某医院对100100例原发性肝癌例原发性肝癌生存情况随访结果生存情况随访结果114、生存率、生存率(survival rate
7、) 实际应当是生存概率,指某个观察对象活过实际应当是生存概率,指某个观察对象活过t时时刻的概率,常用刻的概率,常用P(Xt)表示。如表示。如P(X10)表示某对表示某对象活过象活过10天天(或或10月、月、10年年)的概率。的概率。 根据不同随访资料的失败事件,生存率可以是根据不同随访资料的失败事件,生存率可以是缓解率、有效率等。缓解率、有效率等。 12(二)随访内容(二)随访内容1、每个观察对象有明确的开始随访时间、每个观察对象有明确的开始随访时间2、随访结局和终止随访时间、随访结局和终止随访时间3、记录影响生存的有关因素、记录影响生存的有关因素13随访结局和终止随访时间随访结局和终止随访时
8、间(1)“死亡死亡”:即处理失败,终止随访时间为:即处理失败,终止随访时间为“死死亡亡”时间。时间。(2)中途失访:如失去联系、中途退出等,终止随)中途失访:如失去联系、中途退出等,终止随访时间为最后一次访问时间为准。访时间为最后一次访问时间为准。(3)死于其它与研究疾病无关的原因,终止随访时)死于其它与研究疾病无关的原因,终止随访时间为死亡时间。间为死亡时间。(4)随访截止:随访研究结束时观察对象仍存活,)随访截止:随访研究结束时观察对象仍存活,终止随访时间为研究结束时间。终止随访时间为研究结束时间。14记录影响生存的有关因素记录影响生存的有关因素 如病人年龄、病程、健康状况、经济、文化、如
9、病人年龄、病程、健康状况、经济、文化、职业等因素,以便分析这些因素对生存率的影响。职业等因素,以便分析这些因素对生存率的影响。15随访资料数据的特点:随访资料数据的特点:(1)应变量有两个,即生存时间(天数)和结局(死亡与否)。)应变量有两个,即生存时间(天数)和结局(死亡与否)。(2)生存时间存在观察不完全的数据。)生存时间存在观察不完全的数据。16(三)随访方式(三)随访方式1、全体观察对象同时接受处理,观察到最后一例、全体观察对象同时接受处理,观察到最后一例出现结果,或者事先规定的随访截止时间。出现结果,或者事先规定的随访截止时间。2、全体观察对象在不同时间接受处理,根据完成、全体观察对
10、象在不同时间接受处理,根据完成一定数量随访病例决定随访截止时间,或者按事先一定数量随访病例决定随访截止时间,或者按事先规定的时间停止随访。这种方式较为常见。规定的时间停止随访。这种方式较为常见。17“”表示表示“死亡死亡”;“o”表示失访退出研究或死于与本处理无关的表示失访退出研究或死于与本处理无关的其它原因。其它原因。18(四)生存分析的主要内容和基本方法(四)生存分析的主要内容和基本方法1、描述生存过程、描述生存过程 研究人群生存状态的规律,如生存时间的分布特研究人群生存状态的规律,如生存时间的分布特点,计算某个时点的生存率、生存率曲线的变动趋势点,计算某个时点的生存率、生存率曲线的变动趋
11、势等。等。 例如根据白血病化疗后的缓解年数资料,可以估例如根据白血病化疗后的缓解年数资料,可以估计不同年数的缓解率计不同年数的缓解率P(Xt),如,如P(X3)、P(X5)等,等,也可以获得这些病人的缓解率曲线。也可以获得这些病人的缓解率曲线。 常用方法:常用方法:和和。192、比较生存过程、比较生存过程 两组或多组生存曲线比较。两组或多组生存曲线比较。 常用方法:常用方法:对数秩检验对数秩检验、Gehan比分检验、比分检验、Breslow检验。检验。203、生存过程的影响因素分析、生存过程的影响因素分析 比较不同亚人群的生存状况,进行两组或多组生比较不同亚人群的生存状况,进行两组或多组生存率
12、比较,以了解哪些因素会影响目标人群的生存过存率比较,以了解哪些因素会影响目标人群的生存过程,这是生存分析方法最重要的研究内容,在临床医程,这是生存分析方法最重要的研究内容,在临床医学中应用非常广泛。学中应用非常广泛。 例如分析影响乳腺癌病人手术后预后的因素,可例如分析影响乳腺癌病人手术后预后的因素,可以是病人的年龄、病程、术前健康状况、有无淋巴结以是病人的年龄、病程、术前健康状况、有无淋巴结转移、术后有无感染、辅助治疗措施、营养等。转移、术后有无感染、辅助治疗措施、营养等。 。21三、生存资料的统计描述和生存三、生存资料的统计描述和生存率的区间估计率的区间估计例:某种治疗方案治疗例:某种治疗方
13、案治疗期肺癌患者期肺癌患者11例,随访时间例,随访时间(月月)记记录如下:录如下:l,2,3,5,6,9+,11,13,16,26,37+试估计各时点生存率及其标准误。试估计各时点生存率及其标准误。 220.1030.1030.10910.10911 10 01 10 037+37+0.1030.1030.10910.10911-1/21-1/21/21/22 21 126260.13640.13640.21820.21821-1/31-1/31/31/33 31 116160.1550.1550.32730.32731-1/41-1/41/41/44 41 113130.16380.1638
14、0.43640.43641-1/51-1/51/51/55 51 111110.15010.15010.54550.54551 10 06 60 09+9+0.15010.15010.54550.54551-1/71-1/71/71/77 71 16 60.1450.1450.63640.63641-1/81-1/81/81/88 81 15 50.13430.13430.72730.72731-1/91-1/91/91/99 91 13 30.11630.11630.81820.81821-1/101-1/101/101/1010101 12 20.08670.08670.90910.909
15、11-1/111-1/111/111/1111111 11 1(7)(7)(6)(6)(5)(5)(4)(4)(3)(3)(2)(2)(1)(1)Sp(xt)p(xt)qxnxdxx生存率的生存率的标准误标准误生存率生存率条件生存条件生存概率概率条件死亡条件死亡概率概率期初病例数期初病例数死亡数死亡数生存时间生存时间( (月月) )0.1030.1030.10910.10911 10 01 10 037+37+0.1030.1030.10910.10911-1/21-1/21/21/22 21 126260.13640.13640.21820.21821-1/31-1/31/31/33 31
16、116160.1550.1550.32730.32731-1/41-1/41/41/44 41 113130.16380.16380.43640.43641-1/51-1/51/51/55 51 111110.15010.15010.54550.54551 10 06 60 09+9+0.15010.15010.54550.54551-1/71-1/71/71/77 71 16 60.1450.1450.63640.63641-1/81-1/81/81/88 81 15 50.13430.13430.72730.72731-1/91-1/91/91/99 91 13 30.11630.1163
17、0.81820.81821-1/101-1/101/101/1010101 12 20.08670.08670.90910.90911-1/111-1/111/111/1111111 11 1(7)(7)(6)(6)(5)(5)(4)(4)(3)(3)(2)(2)(1)(1)Sp(xt)p(xt)qxnxdxx生存率的生存率的标准误标准误生存率生存率条件生存条件生存概率概率条件死亡条件死亡概率概率期初病例数期初病例数死亡数死亡数生存时间生存时间( (月月) )xp 23(1 1)死亡数()死亡数(d dx x):与生存时间对应的发生死):与生存时间对应的发生死亡时间的人数。亡时间的人数。(2
18、2)期初病例数()期初病例数(n nx x):恰好在):恰好在X X时刻以前的病时刻以前的病例数。例数。(3 3)条件死亡概率()条件死亡概率(q qx x):恰好在):恰好在X X月前的观察月前的观察对象在对象在X X月时点死亡的概率。月时点死亡的概率。(4 4)条件生存概率:恰好在)条件生存概率:恰好在X X月前的观察对象活月前的观察对象活过过X X月时点的概率。月时点的概率。xxxndq xxxxnd1q1p 24(5 5)生存率)生存率 P(XP(Xt)t):即观察对象活过某时点:即观察对象活过某时点的概率。的概率。 某时点的生存率为某时点的生存率为t t时刻的各时点条件生时刻的各时点
19、条件生存率的乘积。存率的乘积。xx) tx(pdn) tx(p1) tx(ps 7273. 0p p p )3x(pp ) tx(p321x 如如:(6)生存率的标准误:)生存率的标准误:25Survival Analysis for TIME Survival Analysis for TIME 随访时间(月)随访时间(月) 死亡数死亡数 生存率生存率 生存率标准误生存率标准误 累积死亡数累积死亡数 期末存活数期末存活数 1 1 .9091 .0867 1 10 1 1 .9091 .0867 1 10 2 1 .8182 .1163 2 9 2 1 .8182 .1163 2 9 3 1
20、.7273 .1343 3 8 3 1 .7273 .1343 3 8 5 1 .6364 .1450 4 7 5 1 .6364 .1450 4 7 6 1 .5455 .1501 5 6 6 1 .5455 .1501 5 6 9 0 9 0 5 5 5 5 11 1 .4364 .1547 6 4 11 1 .4364 .1547 6 4 13 1 .3273 .1497 7 3 13 1 .3273 .1497 7 3 16 1 .2182 16 1 .2182 .1337 8 2.1337 8 2 26 1 .1091 .1021 9 1 26 1 .1091 .1021 9 1 3
21、7 0 9 0 37 0 9 0 Number of Cases: 11 Censored: 2 ( 18.18%) EveNumber of Cases: 11 Censored: 2 ( 18.18%) Events: 9nts: 9 Survival Time Standard Error 95% Confidence Interval Survival Time Standard Error 95% Confidence Interval 平均存活时间平均存活时间: : 1313 4 ( 6, 20 ) 4 ( 6, 20 ) (Limited to 37 ) (Limited to
22、37 ) 中位存活时间中位存活时间: : 1111 5 ( 2, 20 ) 5 ( 2, 20 ) 26Survival Table11.909.08711021.818.1162931.727.1343851.636.1454761.545.1505690.55111.436.15564131.327.15073161.218.13482261.109.10291370.901234567891011TimeStatusEstimateStd. ErrorCumulative ProportionSurviving at the TimeN ofCumulativeEventsN ofRem
23、ainingCases27Means and Medians for Survival Time12.7823.5215.88219.68211.0004.6421.90120.099EstimateStd.ErrorLower BoundUpper Bound95% Confidence IntervalEstimateStd.ErrorLower BoundUpper Bound95% Confidence IntervalMeanaMedianEstimation is limited to the largest survival time if it is censored.a. 2
24、829生存率曲线阶梯曲线生存率曲线阶梯曲线(Kaplan-Meier曲线)曲线)Survival Function随访时间(月)4035302520151050Cum Survival1.21.0.8.6.4.20.0Survival FunctionCensored30 由图可直观地比较各样本的生存率曲线,由图可直观地比较各样本的生存率曲线,也可对某一病例任意时刻的生存率作出估计,也可对某一病例任意时刻的生存率作出估计,反之亦可由任意生存率估计生存时间。反之亦可由任意生存率估计生存时间。 本例本例中位生存时间中位生存时间为为1111个月。个月。 中位生存时间常用于比较随访资料。中位生存时间常
25、用于比较随访资料。 31)()(txpsutxp 公式为:公式为:8397. 01501. 096. 15455. 096. 1)6(2513. 01501. 096. 15455. 096. 1)6()6()6( xpxpsxpsxp上限:上限:下限:下限:323334例某医院对例某医院对100100例原发性肝癌患者确诊后进行随例原发性肝癌患者确诊后进行随访,得资料见下表,根据此资料进行分组资料生存率访,得资料见下表,根据此资料进行分组资料生存率和标准误的计算。和标准误的计算。 353637Survival FunctionCases weighted by 人数生存时间1086420Cum
26、 Survival1.21.0.8.6.4.20.0生存率曲线生存率曲线与未分组资料的生存率与未分组资料的生存率曲线的不同之处是:曲线的不同之处是: 生存率的各点在各生存率的各点在各组段的上限处,用折线组段的上限处,用折线连接各点。连接各点。38用正态近似原理估计某时点总体生存率的可信区用正态近似原理估计某时点总体生存率的可信区间。间。00pnnsup 如本例如本例3个月时生存率的个月时生存率的95%可信区间为:可信区间为:3620. 00457. 096. 12724. 0 1828. 00457. 096. 12724. 0 : 上限:上限:下限下限3940411 )(22 组数组数 TT
27、Ax4243Survival Functions观察时间(月)50403020100Cum Survival1.21.0.8.6.4.20.0组别 2 2-censored 1 1-censored两组生存率曲线的比较两组生存率曲线的比较44H H0 0:单放疗组与放化疗组的生存率曲线分布相同:单放疗组与放化疗组的生存率曲线分布相同H H1 1:单放疗组与放化疗组的生存率曲线分布不同:单放疗组与放化疗组的生存率曲线分布不同 = 0.05= 0.05计算检验统计量:计算检验统计量:X X2 2 = 4.65= 4.65, 得得 P=0.03P=0.03按按 = 0.05= 0.05水准,拒绝水准
28、,拒绝H H0 0 ,接受,接受H H1 1 ,故认为,故认为单放单放疗组与放化疗组的生存率曲线分布不同疗组与放化疗组的生存率曲线分布不同。45五、生存分析的注意事项五、生存分析的注意事项1.生存资料的基本要求:生存资料的基本要求: 样本由随机抽样方法获得,并应有足够的数量;样本由随机抽样方法获得,并应有足够的数量; 截尾值比例不能太大;截尾值比例不能太大; 生存时间尽可能精确到天数;生存时间尽可能精确到天数; 缺项要尽量补齐。缺项要尽量补齐。462. 生存率比较注意事项:生存率比较注意事项: 当比较不同治疗方案的治疗效果时,仅比较某个时点的当比较不同治疗方案的治疗效果时,仅比较某个时点的生存
29、率,有时可能出现不正确的结论。事实上,每一种生存率,有时可能出现不正确的结论。事实上,每一种防治措施的效果都是一条防治措施的效果都是一条时间效应曲线时间效应曲线,所以评价该措,所以评价该措施的效果应对这条时间效应曲线进行施的效果应对这条时间效应曲线进行全面评价全面评价,而不是,而不是仅对某个时点的生存率进行评价。仅对某个时点的生存率进行评价。 对数秩检验要求各组生存曲线不能交叉;若有交叉提示对数秩检验要求各组生存曲线不能交叉;若有交叉提示存在混杂因素,应采用分层处理或多因素分析来校正混存在混杂因素,应采用分层处理或多因素分析来校正混杂作用。杂作用。 47手术疗法和化学疗法治疗乳腺癌的疗效比较手
30、术疗法和化学疗法治疗乳腺癌的疗效比较48图图8-1 8-1 两组病人生存率曲线示意两组病人生存率曲线示意Cox风险比例回归风险比例回归(Cox regression)50一.Cox回归简介v用途:用途:专门用于生存时间的多变量分析法。专门用于生存时间的多变量分析法。v模型结构:模型结构:设共有设共有n例病人,第例病人,第i(i=1,2,n)例病人的生存时例病人的生存时间为间为ti,并且有并且有p个预后因素个预后因素Xi1,Xi2,Xip。该病人生存到时间该病人生存到时间ti时死亡风险函数(时死亡风险函数(hazard function)hi(t)是基准风险函数是基准风险函数h0(t)与预后因素
31、)与预后因素函数函数f(jX)的乘积,而预后因素函数为:的乘积,而预后因素函数为:f (jX)=exp(1Xi1+2Xi2+pXip)51vCox回归假定病人的风险函数为:回归假定病人的风险函数为:hi(t)=h0(t) exp(1Xi1+2Xi2+pXip)式中:式中:hi(t)风险函数,又称风险率或瞬间死亡率风险函数,又称风险率或瞬间死亡率(instantaneous failure rate)H0(t)基准风险函数,是当所有预后因素都处于基准风险函数,是当所有预后因素都处于0(或标准)状态下的风险函数(或标准)状态下的风险函数X观察变量观察变量j回归系数(回归系数(j=1,2,p)52对上式进行变换,可得:对上式进行变换,可得:ipp2i21i10iXXX) t (h) t (hln 由此可知,由此可知,j的临床意义是:的临床意义是:在其它预后因素固定不变的情况下,预后因素在其它预后因素固定不变的情况下,预后因素Xj每改变一每改变一个观察单位时所引起的相对风险度改变量的自然对数值。个观察单位时所引起的相对风险度改变量的自然对数值。当当j0时,时,Xj增加使相对风险度增加,是危险因素;增加使相对风险度增加,是危险因素;当当j0时,时,Xj增加使相对风险度减少,是保护
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GA/T 2347-2025信息安全技术网络安全等级保护云计算测评指引
- 注册会计师税法中个人所得税法应纳税所得额专项扣除专项附加扣除的计算方法
- 浙教版小学信息科技四年级下册每课教学反思
- 2026河北保定交通发展集团有限公司招聘27人备考题库及答案详解【名师系列】
- 2026陕西西安临潼博仁医院招聘11人备考题库及参考答案详解(综合题)
- 2026黎明职业大学招聘编制内博士研究生学历学位教师24人备考题库(福建)附参考答案详解ab卷
- 2026湖南永州市江永县城乡农贸市场服务有限公司招聘5人备考题库(第二次)附参考答案详解(a卷)
- 2026广西百色市平果市气象局城镇公益性岗位人员招聘1人备考题库附参考答案详解(夺分金卷)
- 2026中共北京市丰台区委党校面向应届毕业生招聘2人备考题库附参考答案详解(夺分金卷)
- 2026陕西西安交通大学教务处文员招聘1人备考题库附参考答案详解(a卷)
- 儿童发热全程管理专家共识2026
- 2026年天津市和平区高三下学期一模语文试卷和答案
- 2026年冀教版(新版)三年级下册数学全册教案(完整版)教学设计含教学-新版
- 2025-2030档案管理行业现状调研与发展方向研究报告
- 妇产科面试题目及答案
- 2026年1月浙江省高考(首考)历史试题(含答案)
- 鞋厂介绍教学课件
- 雀斑激光治疗课件
- 铁死亡课件教学课件
- 剑突下纵隔肿瘤切除术
- 补钙补维生素课件
评论
0/150
提交评论