




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、肿瘤登记资料的统计分析 -生存分析,河南省肿瘤防治研究办公室 孙喜斌 电话13838063621 Email ,生存率分析,内容: 基本概念 观察生存率 相对生存率 统计学检验,基本概念,生存分析是一类时间到事件变量数据的分析 (analysis of time-to-event data)。 医学研究中用生存分析这一术语(工业工程 中则称作寿命时间分析或失效时间分析)。 时间到事件变量三个基本限定: 1)起点的时间是明确的。 2)指标单位(时、天、月、年)要统一。 3)事件发生的界定要明确。,时间-事件变量由于存在截尾数据及反应变量往往呈非正态分布,故应用标准的
2、统计方法处理是不合适的。 生存率是一比例(不是率),但习惯上称作率。 生存率是肿瘤登记数据的常用统计指标。 临床疗效评价中常用的痊愈率、有效率、病死率等百分率指标,其统计效能较差。,例子1,人群1 10000人随访3年 15人在1年内死亡 9985人在随访结束时存活 死亡率=5/10000(年),人群2 10000人随访3年 15人在3年内死亡 9985人在随访结束时存活 死亡率=5/10000(年),例子2,人群1 10000人随访3年 15人在1年内死亡 9985人在随访结束时存活 死亡率=5/10000(年),人群2 10000人随访3年 15人在3年内死亡 9985人在随访结束时存活
3、其中有10人在结束时失访 死亡率=5/10000(年),生存(失效)时间的界定,癌症诊断到死亡的时间 癌症临床实验中随机分组到死亡的时间 随机分组到癌症复发的时间 淋巴瘤治疗期间缓解到复发的时间 HIV感染到死亡的时间 电灯(可)使用的时间 各学科中均涉及这类变量的处理。,生存分析应用,研究群体的率在观察期内不一致(动态) 关心生存时间的长短 截尾观察存在,生存时间的计算,时间=开始的日期到: 1.研究(观察)结束的日期(研究对象仍存活) 2.退出研究的日期 3.死亡日期(如果对象在随访研究结束前死亡),终检(Censoring,截尾),截尾记录:被观察的个体在整个随访期间未有关注的事件(死亡
4、、复发等)发生。 截尾生存时间发生原因: 1.观察期限已到 2.失访,随访不完整 3.不相关的事件发生(如,在癌症研究中,观察对象在随访期间死于意外伤害) 失访终检(有信息性),终末终检(非信息) 终检要尽量避免,尤其是失访终检,生存分析所需信息,观察对象的确定(癌肿、性别、地区、时期) 起始点的限定 终点事件的限定(二项变量) 观察终点的确定(截至日期) 观察对象的生存时间,随访方法,死亡证书(生命统计系统) 人口登记系统 临床记录 信访 电话随访 家访,观察生存率的计算方法,直接法 寿命表法(Life-table method, actuarial method) 极限乘积法(Kaplan
5、-Meier method),直接法,随访期结束时存活病人的比例 每个观察对象均要随访够限定的期限(如5年,除非死亡事件发生) 失访病例除外(不能处理截尾数据) 不考虑存活时间长短 信息丢失 该方法基本不用,如果观察对象中没有终检病例,该法得到的生存率结果与寿命表法和K-M法的结果相同。 中位生存时间:50%病人存活过的时间。,生存概率计算,假如34例病例在观察期间(5年)有10例死 亡,24例存活,那么死亡概率为: q=10/34=0.29=29% 生存概率: p=24/34=0.71=71% 死亡概率+生存概率=1 q+p=1 P=1-0.29=0.71=71%,寿命表法,考虑到每个观察对
6、象的生存过程 包含终检观察数据,失访的注释(保险统计的假定),失访可定为截至日期前终检:失访终检 失访终检是有信息的,越低越好。 (保险统计)假定: 1、平均考虑,在一随访时段内,失访病例将存活一半的时 间。 2、这一时段内,每一失访病例贡献1/2的生存时间。 3、失访病例的后续生存经历与该时段内随访完整病例的相同。 4、将1/2的失访病例看作完整数据。,寿命表(LT)法公式: i=1,2,.,m; 用 n(ti)、d(ti)、w(ti) 分别表示在时间或随访区间t的期初存活病例数、期内死亡数、期内终检数。,有效观察病例数,总的生存人数是计算死亡概率的分母。 失访减少了分母的数量。 有效观察数
7、 ni=ni-wi/2,寿命表数据: 某市某区1972-79年期间男性肺癌新病例随访结果 (截止时刻1979年12月31 日) 确诊日期起 期内死亡 其中死于 其中死于其他 生存者随访未满 随访期间 总例数 肺癌 因的例数 个期间的例数 (包括期内失访) d w (1) (2) (3) (4) (5) 0月 291 290 1 34 3月 210 210 0 12 6月 138 138 0 27 9月 92 92 0 12 1年 206 203 3 21 2年 45 45 0 9 3年 8 8 0 11 4年 4 4 0 11 5年 21,寿命表格式: 某市某区1972-79年期间男性肺癌观察
8、生存率的计算 确诊日期起 期初观 期内死亡 有效观 死亡概率 生存概率 累积生存概率 随访期间 察例数 总例数 察人数 n d n q p SR (1) (2) (3) (4) (5) (6) (7) 0月 1152 291 1135 0.2564 0.7436 0.7436 3月 827 210 8210.2558 0.7442 0.5534 6月 605 138 591.50.2333 0.7667 0.4243 9月 440 91 434 0.2120 0.7880 0.3343 1年 336 206 325.50.6329 0.3671 0.1227 2年 109 45 104.50.
9、4306 0.5694 0.0699 3年 55 8 49.5 0.1616 0.8384 0.0586 4年 36 4 30.5 0.1311 0.8689 0.0509 5年 21 0.74360.74420.76670.7880=0.3343,估计各个时段的生存概率: 期内死亡概率=死亡数/有效观察人数 0 期初人数1152(n1) 期内死亡人数291(d1) 期内终检人数34(w1) 期内有效观察人数 n1=1152-34/2=1135 该时段死亡概率 q1=291/1135=0.2564 该时段生存概率 p1=1-0.2564=0.7436 下一时段的期初人数=上一期初人数-上一期内
10、死亡人数-上期内终检人数 如:3 期初人数=1152-291-34=827 以此类推。,计算步骤,计算累计生存概率(生存率) 各个时段的生存概率相乘即得(各年的)生存率。 生存率(Survival rate)=pnpn-1pn-2.p2p1 如上表中的9个月生存率= 0.74360.74420.76670.7880=0.3343 步骤: 1、计算各时段死亡概率 2、计算各时段生存概率 3、计算累计生存概率,SPSS软件输出的寿命表结果,累积生存率,极限乘积(K-M)法,KM法计算公式: i=1,2,.,m; 用 n(ti)、d(ti)、分别表示在时间t的期初存活病例数、期内死亡数。,Kapla
11、n-meier 法计算(黑色素瘤)观察生存率,* 非黑色素瘤死亡,KM法说明,病例生存时间升序排列。 区间的样本量渐进于0,分割区间数量倾向无穷大。 区间的长度取决于生存时间度量精度(年、月、天、小时)。 计算时仅考虑有事件发生或终检发生的区间,忽略其他区间。 终检数据只对分母有贡献(包括在分母内)。,Kaplan-Meier生存率曲线,寿命表法与KM法比较,基本相同 寿命表法较适用于成组数据 生存指标的刻度连续,选用KM法 两种方法都是计算出“观察生存率” KM法的生存曲线是阶梯状的,每一阶梯代表发生了限定的事件;寿命表法的曲线是平滑的。,生存率的“竞争”死因调整,原因别生存(Cause-s
12、pecific survival) (校正生存- corrected survival rate; 净生存-Net survival) 相对生存(relative survival),原因别生存率,估计限定的癌症独立于其他死因的生存概率(仅计算由于该种癌症死亡作为事件结局的生存率)。 总体(观察)生存率 终点=死亡 原因别(观察)生存率 终点=死于特定的原因 计算方法同总体生存率一样,只是将死于其他(非特定)原 因的病例作为终检观察数据处理(?)。 这类指标在临床试验研究中运用较多(死亡原因易确定)。,人群为基础的肿瘤登记数据计算原因别生存率存在难度: 死亡原因(死亡证书): 未获得 不准确
13、编码错误 用相对生存率表达原因别生存指标,相对生存率(relative survival rate),较多地应用于人群为基础肿瘤登记资料 调整了竞争死因 不需要死因信息 运用人口统计寿命表,相对生存率定义,相对生存率=(观察生存率/期望生存率)100 观察生存率为限定诊断时期内、限定性别、癌症种类及年龄的一组病人的观察生存率(可由寿命表法及KM法计算获得)。 期望生存率是除了未患癌症外,其他因素(时期、年龄、地区等混杂因素)与癌症组病人相同的普通人群(暴露于全部死因风险)的生存率(该生存率从人口统计寿命表中计算获取),即该组癌症病人的期望生存率。,相对生存率计算,区间相对生存率: ri=pi/
14、ei pi:区间观察生存率,ei :区间期望生存率 累计相对生存率: 计算方法类似累计生存率的算法,各期间相对生存率的乘积,即得相应时间的相对生存率。,累计相对生存率,1ri=ri= (pi / ei )= pi / ei,简单计算说明,例如某地一组男性患者的诊断时间集中在1982年 或相邻年份内,从人口寿命表得知,相当于48- 52岁患者(假定用50岁代表这组患者)的一般男 性的五年生存概率为1-0.034089=0.965911,相 当于53-57岁患者(假定用55岁代表这组患者) 的一般男性的五年生存概率为1-0.064116= 0.935884,余类推。将一般人口寿命表内查得的 生存概
15、率求其平均数,就得到该组患者的五年期 望生存率。,简单算法,设Pi为相当于第i个(i=1,2,n)患者的一般人群的五年生存概率,则所求的该组患者五年期望生存率(P)为: 再设n个患者的五年观察生存率为P,则五年相对生存率为:,例如:某地一组19901994年诊断的3565岁乳腺癌病人的5年观察生存率为0.57(57%),该地区相应时期3565岁一般人群女性的5年期望生存率为0.94。 那么这组乳腺癌病人的5年相对生存率为: 相对生存率=(观察生存率/期望生存率)100 =0.57/0.94100=61%,期望生存率的计算(Edeer),各病人5年累计期望生存率=各年期望生存概率的乘积 =0.9
16、49000.94338-0.93257=0.7391 35例病人的5年累计期望生存率=各期望生存率合计/病人总数 =(0.7391+0.5834+0.7351+-+0.9729)/35=0.8159,期望生存率的计算(Edeer),各年的期望生存率=每一病人的各年期望生存概率相加/相应的病人总数 1年期望生存率=(0.94900+0.92014+-+0.99527)/35=33.7398/35=0.96399 2年期望生存率=(0.97501+0.97943+-+0.99531)/27=25.95746/27=0.96139 35例病人的5年累计期望生存率=各年期望生存率的乘积 = 0.963
17、99 0.96139 0.95859 0.955430.95847=0.81355,各年的期望生存率 0.96399 0.96139 0.95859 0.95543 0.95847,Hakulinen 法,首先生成期望寿命表,Hakulinen 法,计算区间的期望生存概率(与寿命表相同) 计算总计的期望生存概率,Hakulinen 法,如果计算大于10年的相对生存率,这要用Hakulinen法计算期望生存率(可靠、稳定?)。 计算时较复杂 统计程序的应用,芬兰1985-1994年男性皮肤黑色素瘤5年观察生存率(p)、期望生存率(p*)及相对生存率(r),上海市区肺癌生存率(全人群): 1988
18、-1991 观察生存率OSR 相对生存率RSR 1年3年5年1年3年5年 男性31.512.59.932.613.912.0 女性29.712.19.830.513.111.3,生存率曲线,表 6-11 某市某时期男性膀胱癌生存资料的相对生存率 I n d w n P CP CR 2*SECR SR 2*SESR E1R 0- 754 224 0 754.0 0.70292 0.70292 0.72415 0.03429 0.72415 0.03429 0.72415 1- 530 106 0 530.0 0.80000 0.56233 0.59755 0.03840 0.59755 0.03
19、840 0.59755 2- 424 85 0 424.0 0.79953 0.44960 0.49394 0.03981 0.49394 0.03981 0.49394 3- 339 59 0 339.0 0.82596 0.37135 0.42261 0.04005 0.42261 0.04005 0.42261 4- 280 21 1 279.5 0.92487 0.34345 0.40563 0.04085 0.40563 0.04085 0.40562 5- 258 17 0 258.0 0.93411 0.32082 0.39360 0.04172 0.39360 0.04172
20、0.39357 6- 241 21 0 241.0 0.91286 0.29287 0.37384 0.04233 0.37384 0.04233 0.37379 7- 220 17 0 220.0 0.92273 0.27024 0.35964 0.04307 0.35964 0.04307 0.35957 8- 203 13 0 203.0 0.93596 0.25293 0.35152 0.04403 0.35152 0.04403 0.35143 9- 190 10 0 190.0 0.94737 0.23962 0.34826 0.04522 0.34826 0.04522 0.34
21、814 10- 180 8 4 178.0 0.95506 0.22885 0.34843 0.04664 0.34843 0.04664 0.34826 11- 168 7 48 144.0 0.95139 0.21772 0.34782 0.04837 0.34779 0.04836 0.34761,P-观察生存率(期间), CP-观察生存率(累积) CR-相对生存率, SR-相对生存率, E1R-相对生存率,期望生存率,不同方法(E、及Hakulinen method)所得结果有所差别,应用时要标明。 相对生存率的计算关键在可比一般人群(性别、年龄、时期、地区的一致)寿命表的选取及期望生
22、存率的计算。 我国期望生存率的计算?,相对生存率的解释,相对生存率是癌症病人去除其他死亡危险(死亡竞争风险)后),评价癌症所产生的超额死亡率的综合指标。 相对生存率等于1表示观察生存与期望生存相等,没有造成超额死亡。 时间t时的累计相对生存率可解释为假定只有该癌症为可能死亡原因时,病人至少存活到t时的比例。 尽管计算期望生存率时,所考虑的癌症死亡也包括在一般人群的死亡风险中,实际估计时其影响很小,可以忽略不计。 相对生存率不是“粗率”,但也不是完全的年龄调整率。该指标只是对分母部分做了年龄调整,未对分子部分进行调整。,生存率的标准误和可信区间,标准误是评价(计算)生存率不准确性的指标。 95%
23、(99%)可信区间是取值范围,表示重复100次研究,所得指标有95(99)次所在的区间范围。 直接法: P=限定年数的生存率; n=观察总数 95% 可信区间= p1.96Se(p),如一组30例病人的观察生存率 57% 则: Se(p)= =0.09 95%区间= 0.571.960.09 =0.390.75,寿命表法标准误的计算: Pi* i年累计观察生存率;qi 区间死亡概率;ri 区间有效人数;di 区间死亡数 置信区间估计: 95%CI pi*1.96 Se(pi*),相对生存率的标准误,Se(ri)=Se(pi*) 期望生存率 95%可信区间:相对生存率1.96Se(ri),统计学检验,生存率比较 生存期比较,生存率比较 U(Z)检验,两组一年生存率:45%,40% 两组一年生存率的标准误:0.1250,0.1130 P0.05 (U=1.96, P=0.05),生存曲线(分布)比较 :Logrank检验 (适用于寿命表和KM法),2 0.05 O:观察期内实际死亡人数 E:观察期内期望死亡人数,期望死亡数,第一组期望死
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论