已阅读5页,还剩67页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,肿瘤登记资料的统计分析-生存分析,河南省肿瘤防治研究办公室孙喜斌电话0371-6558734613838063621Emailxbsun21,.,2,生存率分析,内容:基本概念观察生存率相对生存率统计学检验,.,3,基本概念,生存分析是一类时间到事件变量数据的分析(analysisoftime-to-eventdata)。医学研究中用生存分析这一术语(工业工程中则称作寿命时间分析或失效时间分析)。时间到事件变量三个基本限定:1)起点的时间是明确的。2)指标单位(时、天、月、年)要统一。3)事件发生的界定要明确。,.,4,时间-事件变量由于存在截尾数据及反应变量往往呈非正态分布,故应用标准的统计方法处理是不合适的。生存率是一比例(不是率),但习惯上称作率。生存率是肿瘤登记数据的常用统计指标。临床疗效评价中常用的痊愈率、有效率、病死率等百分率指标,其统计效能较差。,.,5,例子1,人群110000人随访3年15人在1年内死亡9985人在随访结束时存活死亡率=5/10000(年),人群210000人随访3年15人在3年内死亡9985人在随访结束时存活死亡率=5/10000(年),.,6,例子2,人群110000人随访3年15人在1年内死亡9985人在随访结束时存活死亡率=5/10000(年),人群210000人随访3年15人在3年内死亡9985人在随访结束时存活其中有10人在结束时失访死亡率=5/10000(年),.,7,生存(失效)时间的界定,癌症诊断到死亡的时间癌症临床实验中随机分组到死亡的时间随机分组到癌症复发的时间淋巴瘤治疗期间缓解到复发的时间HIV感染到死亡的时间电灯(可)使用的时间各学科中均涉及这类变量的处理。,.,8,生存分析应用,研究群体的率在观察期内不一致(动态)关心生存时间的长短截尾观察存在,.,9,生存时间的计算,时间=开始的日期到:1.研究(观察)结束的日期(研究对象仍存活)2.退出研究的日期3.死亡日期(如果对象在随访研究结束前死亡),.,10,终检(Censoring,截尾),截尾记录:被观察的个体在整个随访期间未有关注的事件(死亡、复发等)发生。截尾生存时间发生原因:1.观察期限已到2.失访,随访不完整3.不相关的事件发生(如,在癌症研究中,观察对象在随访期间死于意外伤害)失访终检(有信息性),终末终检(非信息)终检要尽量避免,尤其是失访终检,.,11,生存分析所需信息,观察对象的确定(癌肿、性别、地区、时期)起始点的限定终点事件的限定(二项变量)观察终点的确定(截至日期)观察对象的生存时间,.,12,随访方法,死亡证书(生命统计系统)人口登记系统临床记录信访电话随访家访,.,13,观察生存率的计算方法,直接法寿命表法(Life-tablemethod,actuarialmethod)极限乘积法(Kaplan-Meiermethod),.,14,直接法,随访期结束时存活病人的比例每个观察对象均要随访够限定的期限(如5年,除非死亡事件发生)失访病例除外(不能处理截尾数据)不考虑存活时间长短信息丢失该方法基本不用,如果观察对象中没有终检病例,该法得到的生存率结果与寿命表法和K-M法的结果相同。中位生存时间:50%病人存活过的时间。,.,15,.,16,生存概率计算,假如34例病例在观察期间(5年)有10例死亡,24例存活,那么死亡概率为:q=10/34=0.29=29%生存概率:p=24/34=0.71=71%死亡概率+生存概率=1q+p=1P=1-0.29=0.71=71%,.,17,寿命表法,考虑到每个观察对象的生存过程包含终检观察数据,.,18,失访的注释(保险统计的假定),失访可定为截至日期前终检:失访终检失访终检是有信息的,越低越好。(保险统计)假定:1、平均考虑,在一随访时段内,失访病例将存活一半的时间。2、这一时段内,每一失访病例贡献1/2的生存时间。3、失访病例的后续生存经历与该时段内随访完整病例的相同。4、将1/2的失访病例看作完整数据。,.,19,寿命表(LT)法公式:i=1,2,.,m;用n(ti)、d(ti)、w(ti)分别表示在时间或随访区间t的期初存活病例数、期内死亡数、期内终检数。,.,20,有效观察病例数,总的生存人数是计算死亡概率的分母。失访减少了分母的数量。有效观察数ni=ni-wi/2,.,21,寿命表数据:某市某区1972-79年期间男性肺癌新病例随访结果(截止时刻1979年12月31日)确诊日期起期内死亡其中死于其中死于其他生存者随访未满随访期间总例数肺癌因的例数个期间的例数(包括期内失访)dw(1)(2)(3)(4)(5)0月2912901343月2102100126月1381380279月92920121年2062033212年4545093年880114年440115年21,.,22,寿命表格式:某市某区1972-79年期间男性肺癌观察生存率的计算确诊日期起期初观期内死亡有效观死亡概率生存概率累积生存概率随访期间察例数总例数察人数ndnqpSR(1)(2)(3)(4)(5)(6)(7)0月115229111350.25640.74360.74363月8272108210.25580.74420.55346月605138591.50.23330.76670.42439月440914340.21200.78800.33431年336206325.50.63290.36710.12272年10945104.50.43060.56940.06993年55849.50.16160.83840.05864年36430.50.13110.86890.05095年210.74360.74420.76670.7880=0.3343,.,23,估计各个时段的生存概率:期内死亡概率=死亡数/有效观察人数0期初人数1152(n1)期内死亡人数291(d1)期内终检人数34(w1)期内有效观察人数n1=1152-34/2=1135该时段死亡概率q1=291/1135=0.2564该时段生存概率p1=1-0.2564=0.7436下一时段的期初人数=上一期初人数-上一期内死亡人数-上期内终检人数如:3期初人数=1152-291-34=827以此类推。,计算步骤,.,24,计算累计生存概率(生存率)各个时段的生存概率相乘即得(各年的)生存率。生存率(Survivalrate)=pnpn-1pn-2.p2p1如上表中的9个月生存率=0.74360.74420.76670.7880=0.3343步骤:1、计算各时段死亡概率2、计算各时段生存概率3、计算累计生存概率,.,25,SPSS软件输出的寿命表结果,累积生存率,.,26,极限乘积(K-M)法,KM法计算公式:i=1,2,.,m;用n(ti)、d(ti)、分别表示在时间t的期初存活病例数、期内死亡数。,.,27,Kaplan-meier法计算(黑色素瘤)观察生存率,*非黑色素瘤死亡,.,28,KM法说明,病例生存时间升序排列。区间的样本量渐进于0,分割区间数量倾向无穷大。区间的长度取决于生存时间度量精度(年、月、天、小时)。计算时仅考虑有事件发生或终检发生的区间,忽略其他区间。终检数据只对分母有贡献(包括在分母内)。,.,29,Kaplan-Meier生存率曲线,.,30,寿命表法与KM法比较,基本相同寿命表法较适用于成组数据生存指标的刻度连续,选用KM法两种方法都是计算出“观察生存率”KM法的生存曲线是阶梯状的,每一阶梯代表发生了限定的事件;寿命表法的曲线是平滑的。,.,31,生存率的“竞争”死因调整,原因别生存(Cause-specificsurvival)(校正生存-correctedsurvivalrate;净生存-Netsurvival)相对生存(relativesurvival),.,32,原因别生存率,估计限定的癌症独立于其他死因的生存概率(仅计算由于该种癌症死亡作为事件结局的生存率)。总体(观察)生存率终点=死亡原因别(观察)生存率终点=死于特定的原因计算方法同总体生存率一样,只是将死于其他(非特定)原因的病例作为终检观察数据处理(?)。这类指标在临床试验研究中运用较多(死亡原因易确定)。,.,33,人群为基础的肿瘤登记数据计算原因别生存率存在难度:死亡原因(死亡证书):未获得不准确编码错误用相对生存率表达原因别生存指标,.,34,相对生存率(relativesurvivalrate),较多地应用于人群为基础肿瘤登记资料调整了竞争死因不需要死因信息运用人口统计寿命表,.,35,相对生存率定义,相对生存率=(观察生存率/期望生存率)100观察生存率为限定诊断时期内、限定性别、癌症种类及年龄的一组病人的观察生存率(可由寿命表法及KM法计算获得)。期望生存率是除了未患癌症外,其他因素(时期、年龄、地区等混杂因素)与癌症组病人相同的普通人群(暴露于全部死因风险)的生存率(该生存率从人口统计寿命表中计算获取),即该组癌症病人的期望生存率。,.,36,相对生存率计算,区间相对生存率:ri=pi/eipi:区间观察生存率,ei:区间期望生存率累计相对生存率:计算方法类似累计生存率的算法,各期间相对生存率的乘积,即得相应时间的相对生存率。,.,37,累计相对生存率,1ri=ri=(pi/ei)=pi/ei,.,38,简单计算说明,例如某地一组男性患者的诊断时间集中在1982年或相邻年份内,从人口寿命表得知,相当于48-52岁患者(假定用50岁代表这组患者)的一般男性的五年生存概率为1-0.034089=0.965911,相当于53-57岁患者(假定用55岁代表这组患者)的一般男性的五年生存概率为1-0.064116=0.935884,余类推。将一般人口寿命表内查得的生存概率求其平均数,就得到该组患者的五年期望生存率。,.,39,简单算法,设Pi为相当于第i个(i=1,2,n)患者的一般人群的五年生存概率,则所求的该组患者五年期望生存率(P)为:再设n个患者的五年观察生存率为P,则五年相对生存率为:,.,40,例如:某地一组19901994年诊断的3565岁乳腺癌病人的5年观察生存率为0.57(57%),该地区相应时期3565岁一般人群女性的5年期望生存率为0.94。那么这组乳腺癌病人的5年相对生存率为:相对生存率=(观察生存率/期望生存率)100=0.57/0.94100=61%,.,41,期望生存率的计算(Edeer),各病人5年累计期望生存率=各年期望生存概率的乘积=0.949000.94338-0.93257=0.739135例病人的5年累计期望生存率=各期望生存率合计/病人总数=(0.7391+0.5834+0.7351+-+0.9729)/35=0.8159,.,42,.,43,期望生存率的计算(Edeer),各年的期望生存率=每一病人的各年期望生存概率相加/相应的病人总数1年期望生存率=(0.94900+0.92014+-+0.99527)/35=33.7398/35=0.963992年期望生存率=(0.97501+0.97943+-+0.99531)/27=25.95746/27=0.9613935例病人的5年累计期望生存率=各年期望生存率的乘积=0.963990.961390.958590.955430.95847=0.81355,各年的期望生存率0.963990.961390.958590.955430.95847,.,44,.,45,Hakulinen法,首先生成期望寿命表,.,46,Hakulinen法,计算区间的期望生存概率(与寿命表相同)计算总计的期望生存概率,.,47,Hakulinen法,如果计算大于10年的相对生存率,这要用Hakulinen法计算期望生存率(可靠、稳定?)。计算时较复杂统计程序的应用,.,48,芬兰1985-1994年男性皮肤黑色素瘤5年观察生存率(p)、期望生存率(p*)及相对生存率(r),.,49,上海市区肺癌生存率(全人群):1988-1991观察生存率OSR相对生存率RSR1年3年5年1年3年5年男性31.512.59.932.613.912.0女性29.712.19.830.513.111.3,.,50,生存率曲线,.,51,表6-11某市某时期男性膀胱癌生存资料的相对生存率IndwnPCPCR2*SECRSR2*SESRE1R0-7542240754.00.702920.702920.724150.034290.724150.034290.724151-5301060530.00.800000.562330.597550.038400.597550.038400.597552-424850424.00.799530.449600.493940.039810.493940.039810.493943-339590339.00.825960.371350.422610.040050.422610.040050.422614-280211279.50.924870.343450.405630.040850.405630.040850.405625-258170258.00.934110.320820.393600.041720.393600.041720.393576-241210241.00.912860.292870.373840.042330.373840.042330.373797-220170220.00.922730.270240.359640.043070.359640.043070.359578-203130203.00.935960.252930.351520.044030.351520.044030.351439-190100190.00.947370.239620.348260.045220.348260.045220.3481410-18084178.00.955060.228850.348430.046640.348430.046640.3482611-168748144.00.951390.217720.347820.048370.347790.048360.34761,P-观察生存率(期间),CP-观察生存率(累积)CR-相对生存率,SR-相对生存率,E1R-相对生存率,.,52,期望生存率,不同方法(E、及Hakulinenmethod)所得结果有所差别,应用时要标明。相对生存率的计算关键在可比一般人群(性别、年龄、时期、地区的一致)寿命表的选取及期望生存率的计算。我国期望生存率的计算?,.,53,相对生存率的解释,相对生存率是癌症病人去除其他死亡危险(死亡竞争风险)后),评价癌症所产生的超额死亡率的综合指标。相对生存率等于1表示观察生存与期望生存相等,没有造成超额死亡。时间t时的累计相对生存率可解释为假定只有该癌症为可能死亡原因时,病人至少存活到t时的比例。尽管计算期望生存率时,所考虑的癌症死亡也包括在一般人群的死亡风险中,实际估计时其影响很小,可以忽略不计。相对生存率不是“粗率”,但也不是完全的年龄调整率。该指标只是对分母部分做了年龄调整,未对分子部分进行调整。,.,54,生存率的标准误和可信区间,标准误是评价(计算)生存率不准确性的指标。95%(99%)可信区间是取值范围,表示重复100次研究,所得指标有95(99)次所在的区间范围。直接法:P=限定年数的生存率;n=观察总数95%可信区间=p1.96Se(p),.,55,如一组30例病人的观察生存率57%则:Se(p)=0.0995%区间=0.571.960.09=0.390.75,.,56,寿命表法标准误的计算:Pi*i年累计观察生存率;qi区间死亡概率;ri区间有效人数;di区间死亡数置信区间估计:95%CIpi*1.96Se(pi*),.,57,相对生存率的标准误,Se(ri)=Se(pi*)期望生存率95%可信区间:相对生存率1.96Se(ri),.,58,统计学检验,生存率比较生存期比较,.,59,生存率比较U(Z)检验,两组一年生存率:45%,40%两组一年生存率的标准误:0.1250,0.1130P0.05(U=1.96,P=0.05),.,60,生存曲线(分布)比较:Logrank检验(适用于寿命表和KM法),20.05O:观察期内实际死亡人数E:观察期内期望死亡人数,.,61,期望死亡数,第一组期望死亡数=(区间内第一组死亡数+区间内第二组的死亡数)/(区间内第一组存活数+区间内第二
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025贵州安顺镇宁县总工会招聘工会社会工作者2人历年真题汇编带答案解析
- 2026中央纪委国家监委机关直属单位招聘24人模拟试卷带答案解析
- 2026陕西省面向北京师范大学招录选调生历年真题汇编带答案解析
- 2025山东菏泽市公安局招录警务辅助人员心理素质测评备考题库附答案解析
- 2025重庆三峡学院招聘4人参考题库附答案解析
- 中国水利水电第四工程局招聘模拟试卷附答案解析
- 甘孜州人民政府国防动员办公室关于2025年公开选调事业单位工作人员历年真题库带答案解析
- 2025四川宜宾市高县事业单位下半年考核招聘工作人员37人备考题库附答案解析
- 贵州国企招聘:2025贵州省盘州市物资贸易总公司招聘历年真题汇编带答案解析
- 安远县2025年公开遴选乡镇敬老院院长参考题库带答案解析
- GB/T 4957-2003非磁性基体金属上非导电覆盖层覆盖层厚度测量涡流法
- GB/T 28864.2-2012软磁铁氧体磁心术语定义第2部分:尺寸标注
- GB/T 16714-2007连续式粮食干燥机
- 最新《工会基础知识》试题库及答案1000题【完美打印版】
- 行政事业单位无形资产管理办法模板
- GB 18564.1-2006道路运输液体危险货物罐式车辆第1部分:金属常压罐体技术要求
- 《烹饪美学》教学课件-项目四-烹饪造型艺术
- 广州版英语四年级上册单词表
- 防溺水防溺水课件
- 人教版小学二年级语文上册期末考试试卷
- 大学生毕业论文写作指导课件
评论
0/150
提交评论