统计学:生存分析_第1页
统计学:生存分析_第2页
统计学:生存分析_第3页
统计学:生存分析_第4页
统计学:生存分析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学:生存分析(survivalanalysisoffollow-upmedicaldata)要求1.掌握生存分析的基本概念2.会用乘积极限法和寿命表法计算生存率3.了解对数秩检验4.了解Cox回归分析第一节生存资料的特点

在临床实验和动物试验研究中,常对各个观察对象进行随访观察,记录各个时点上某事件的发生情况而获得资料,称为随访资料(follow-updata),以评价临床疗效。如:

*某病经治疗开始到痊愈*某病经治疗开始到死亡*患者从手术到复发*患者从出院到死亡这类现象的共性是:效应和时间。在比较不同疗法的疗效时,不仅要考虑是否有效,还要考虑从试验开始到产生疗效的时间。假定用甲、乙两药治疗某病,其治愈率均为80%,我们不能笼统地说两种药物的疗效一致,因为还有一个时间效应问题。如果甲药平均3天治愈80%,而乙药平均7天治愈80%,则可以认为两药的疗效有差别。生存分析(survivalanalysis)是将事件的结果和出现这一结果所经历的时间两个因素结合在一起的一种统计分析方法,它能充分利用所得到的研究信息,更加准确地评价和比较随访资料。一、生存分析的基本概念1.随访资料的记录某医师收集1992年1月1日到2001年12月31日10年间共346例大肠癌患者术后的资料,研究因素有:性别、年龄(岁)、从确诊到进行手术的时间dtime(月),资料如下:表20-1346例大肠癌患者手术后的生存时间记录数据特点:①应变量有2个,生存时间和结局;②生存时间存在观察完全的数据和观察不完全的数据(称为删失值),如2号和4号和5号。编号性别年龄dtime手术时间终止随访时间结局生存时间1男32101994.01.231994.12.24死亡112女48121998.02.141999.01.01失访10+3女2661992.03.041995.04.12死亡374男5531999.08.202001.09.21死于其他25+5女5882001.03.102001.12.31存活9+……………………2.起始事件与终点事件

终点事件(outcomeevent)又称死亡事件、失效事件,它是研究者所关心的特定结局,而起始事件是反映研究对象生存过程的起始特征事件。这两者是相对的,由研究目的决定。如:起始事件可以是患者接受某种特定治疗、铅作业工人开始职业性铅接触等,相应的终点事件为患者死于该病、工人发生重症铅中毒症状等。一项研究可以把开始治疗作为起始事件,痊愈为终点事件;另一项研究可以把痊愈作为起始事件,复发为终点事件。生存时间示意图3.生存时间

是指观察到的存活时间,有两种类型:(1)完全数据(completedata)指从起点至死亡所经理的时间,如表20-1中11月,37月。(2)截尾数据(censoreddata)指由于失访、改变防治方案、研究工作结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。从起点到截尾点所经历的时间,称为截尾数据,如表20-1中的10月、25月和9月天。4.死亡概率、生存概率(1)死亡概率

q

(mortalityprobability):

指死于某时段内的可能性大小。它是一个随时间上升的函数q(t),当时间趋于无穷大时,死亡概率等于1。年死亡概率公式为

死亡概率不同于死亡率,区别在于分母不同,死亡率的分母为年中平均人口数,而死亡概率的分母是年初人口数。(2)生存概率

p(survivalprobability)p=1-q5.生存率、生存曲线(1)生存率

(survivalrate),记作S(tk)指病人经历tk个时间单位后仍存活的概率。若无截尾数据,则

(2)生存率估计的概率乘法原理假定病人在各个时段生存的事件独立,生存概率为p,生存率估计公式为:

S(tk)=P(T≥tk)=p1p2···pk注意:生存率与生存概率在意义上有差别,生存概率只指某个时段内的p,而生存率是指从0→tk多个时段。(3)生存曲线(survivalcurve)以t为横坐标轴,S(t)为纵坐标轴,将各时点的生存率连接在一起的曲线。6.半数生存期(mediansurvivaltime)指只有50%的个体存活的时间(寿命的中位数)。二、算法步骤(1)列出序号:i=1,2,3,…,生存时间排序:将t从小到大排列,重复数据只列一次。当遇到数值相同的完全数据与删失数据时,删失数据排在完全数据之后。(2)列出ti时刻的死亡例数di,其中删失数据对应的死亡例数为0。(3)列出ti时刻期初期观察例数ni,即该时刻之前的生存例数。(4)计算各时段生存概率pi。Pi=(ni-di)/ni(5)求出ti时刻的生存率:S(ti)=P1×P2×P3×…×Pt(6)求出ti时刻的生存率的标准误:(7)总体生存率的置信区间:三、生存率的估计

例20-1

将符合手术治疗的21例乳腺癌患者随机分为2组,一组10;一6单纯接受手术治疗,另一组11例手术后+化疗,其生存时间(月)见下表,试估计两种疗法的生存率及生存曲线。手术组691315181919202224手术+化疗10141516+19192020+242628例20-1的结果序号存活时间死亡数初期例数生存概率生存率标准误ittidinnippiS(tk)SE11011110/110.90910.08672141109/10(10/11)(9/10)=0.81820.1163315198/90.8182×8/9=0.72730.1343416+088/80.7273×1=0.72730.1343519275/70.7273×5/7=0.51950.1569620154/50.5195×4/5=0.41560.1562720+044/40.4156×1=0.41560.1562824132/30.4156×2/3=0.27710.1537926121/20.2771×1/2=0.13850.12451028110/10.1385×0=0.1385_四、生存资料分析的基本要求1.样本由随机抽样方法获得,并应有足够的数量2.死亡例数不能太少(≥30)3.删失值比例不能太大4.生存时间尽可能精确到天数,因为多数生存分析方法都在生存时间排序的基础上作统计处理的,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果5.缺项要尽量补齐第四节Cox回归分析1972年英国生物统计学家D.R.Cox提出了半参数方法,称为比例风险模型(proportionalhazardmodel),亦称为Cox回归模型。

Cox回归模型是将生存时间和影响生存时间的因素之间建立回归方式,使两者之间的关系以数量来表达,Cox回归主要解决多因素(如年龄、职业、吸烟、病情、治疗等)对生存期的影响。由于生存数据不仅包含生存时间t,同时还有截尾数据,这就造成了用回归方法来研究生存时间的困难,因此Cox将协变量对生存期的影响表现为它对危险函数的关系上,以危险度h(t)作为因变量(时间变量),解决了截尾的困难,使具有生存资料的多因素分析成为可能。CoxregressionanalysisCox模型的基本形式例20-3

某医药公司与中山医科大学协作,研究天花粉注射治疗绒癌的疗效问题。将16只体表接种绒癌成功的裸鼠分为4组,其中一组作空白对照,其余三组分别注射天花粉、甲药和乙药,实验记录和整理数据见表,试作Cox回归分析。编号NO变量观察记录整理带瘤天数td瘤体大小V0天花粉tr1甲药tr2乙药tr3维生素CvitC开始日期Date0终止日期Date1结局(死)d生存天数day11925000189-05-2089-05-281821716000189-05-2089-05-291931937000189-05-2089-05-281841619000189-05-2089-05-281851425100189-05-2089-05-0701861318100189-05-2089-05-0611771625100189-05-2089-05-031148910100189-05-2089-05-041159922010189-05-2089-05-04115101025010189-05-2089-05-31111111425010189-05-2089-05-02113121237010189-05-2089-05-01112131737001189-05-2089-05-2919141429001189-05-2089-05-01112151313001189-05-2089-05-01112161731001189-05-2089-05-30110裸鼠绒癌疗效观察数据单因素Cox回归分析SAS程序Datalx177;Inputtdv0tr1tr2tr3vitcdayd;Cards;1925000181171600019119370001811619000181142510011801318100117116251001141910100115192201011511025010111114250101131123701011211737001191142900111211313001112117310011101;Procphreg;(调用Cox模块)modelday*d(0)=td(day为时间变量,y为截尾变量,变量值0表示截尾数据,td为单因素)/selection=forward;(向前法筛选,score检验,只考虑变量td,同理可替换tr1,tr2,tr3,v0)run;单因素Cox回归分析结果单因素Cox回归分析统计结果变量统计描述单独效应例数最小值最大值均数标准差

2统计量自由度P值d160.001.000.93750.2500day168.0018.0011.93753.2193td169.0019.0014.31253.21914.703310.0301tr1160.001.000.25000.44726.631810.0100tr2160.001.000.25000.44720.009110.9238tr3160.001.000.25000.44721.198510.2736v01610.0037.0024.62508.26941.423810.2328多因素Cox回归分析SAS程序Datalx177;Inputtdv0tr1tr2tr3vitcdayd;(考虑剔除tr2和vitC)Cards;1925000181171600019119370001811619000181142510011801318100117116251001141910100115192201011511025010111114250101131123701011211737001191142900111211313001112117310011101;Procphreg;(调用Cox模块)modelday*d(0)=tdv0tr1tr3(day为时间变量,y为截尾变量,变量值0表示截尾数据)/selection=stepwise;(逐步法筛选)run;多因素Cox回归分析结果ParameterStandardWaldPr>RiskVariableDFEstimateErrorChi-SquareChi-SquareRatiotd10.4201200.162966.646680.00991.522tr11-2.9399281.071397.529670.00610.053VariableNMeanStdDevMinimumMaximumtd1614.31250003.21908379.000000019.0000000v01624.62500008.269421610.000000037.0000000tr1160.25000000.447213601.0000000tr2160.25000000.447213601.0000000tr3160.25000000.447213601.0000000y160.93750000.250000001.0000000day1611.93750003.21390218.000000018.00000003.风险效应指标4.Cox回归生存率Cox回归未定义基准风险函数h0(t),因而未能明确定义生存函数,常用近似法估计生存率,其中Bresslow法应用最广。设n为样本例数,d为死亡例数,ti为死亡时刻,m为死亡时刻数目。在例17.7中,n=16,d=15,ti=8、9、10、11、12、13、14、15、17天,m=9;定义ti时刻的基准生存率的估计式为:Cox回归生存率的统计描述1.样本生存率以每个病人的变量值分别估计生存率,用以绘制生存率与生存时间的散点图,反映样本生存率的变动情况(n个)。2.平均生存曲线以变量的平均值估计ti时刻的生存率(m个),反映样本生存率的平均水平。3.按变量分类生存曲线以指定的变量水平估计ti时刻的生存率(每类m个),用于变量不同水平组之间的比较。4.预后指数分类生存曲线记x’1,x’2,…,x’k为经标准化变换的变量,b’1,b’2,…,b’k是Cox回归的标准化回归系数,即:PI=0代表危险率处于平均水平;PI<0表示危险率低于平均水平;PI>0表示危险率高于平均水平称为预后指数(prognosticindex)Cox回归生存率的估计t2=9t3=10…t3=17表20-3Cox回归分析生存率估计生存天数样本生存率生存日数基准生存率平均生存率变量分类预后指数分类dayS(t)dayS0(t)SMtr1=0tr1=1PI≤-1-1<PI≤1PI>180.3277301.00001.00001.00001.00001.00001.00001.000090.3108380.99960.92810.85580.99181.00001.00000.500080.3277390.99910.83430.68540.98021.00001.00000.166780.72883100.99850.75070.54990.96891.00000.99990.0000180.14419

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论