医学统计学生存分析_第1页
医学统计学生存分析_第2页
医学统计学生存分析_第3页
医学统计学生存分析_第4页
医学统计学生存分析_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生存分析(2),由于生存曲线只是对样本生存过程的统计描述样本生存率或生存曲线不同也可能是抽样误差所致,在生存分析中一个重要的问题是进一步对总体的生存曲线进行假设检验,log-rank检验,属于非参数方法该法并不指定生存时间服从某种特定的分布所比较的是整个生存时间的分布,而不是仅仅比较某个特定时间点的生存率,例23-3 就例23-1数据,比较甲乙两疗法组脑瘤患者的生存率有无差别?两种治疗方式的脑瘤患者生存曲线相同两种治疗方式的脑瘤患者生存曲线不同,两组在不同时点的期初观察例数列于第3、第7列,其合计列于第11列不同时点两组的死亡人数,分列于第4、第8列,其合计 列于第12列注意到不同时点期初观察例数等于上一时点期初观察例数减去上一时点的死亡数与删失数之后按下式计算各组期望死亡人数并分列于表中第5、第9列,由于假设成立时,两组的生存分布相同,故可把两组的数据合并计算合并的死亡概率,以此计算相应的期望死亡人数,故将两组的完全生存时间混合排序列在表23-5第2列相同生存时间只列1次,k=1,2 表示在每个时点,当两组的死亡率相等且均为该时点的总死亡数除以该时点的总观察数时,按照各组期初例数计算的期望死亡人数,分别将两组各时点期望死亡人数相加列在第5、第9列合计处,而两组实际总死亡数为第4、第8列合计如果两组各时点生存率都相等,那么两组总的期望死亡数和总的实际死亡数相差不大,注意事项,(1)以上介绍的是log-rank检验的近似法,计算简便,但其结果较精确法(一般统计软件中输出精确法计算结果)保守。log-rank检验精确法 统计量计算公式为:wi为权重,对log-rank检验,wi=1,即该检验给任意时间点处两组间死亡的差别相同的权重。当比较的两总体生存曲线呈比例时,检验效能最大;wi=ni 则对应Gehan检验(1965)或Wilcoxon检验,该检验给两组间死亡的早期差别更大的权重,(2)对于大样本频数表形式的生存曲线比较,基本方法与上述相同。另外,该法很容易推广到多个组的比较,在此不赘述。需要强调的是,生存曲线的比较也和前面均数、率的比较一样,要求组间具有可比性,最好是按照比较因素进行随机化分配之后再比较。如果是未经随机化分配的观察对比资料,要考虑是否有混杂因素干扰,若存在混杂因素,可进行分层分析或采用多因素分析方法(见本章第四节)。,(3)当假设检验发现组间生存曲线有差别时,可通过中位生存期、相对危险度RR(relative risk)等指标评价其差别。相对危险度是两个对比组相对死亡比的比值,而相对死亡比是实际死亡数与期望死亡数之比,于是,第i组相对于第j组的相对危险度为:,(4)log-rank检验用于整条生存曲线的比较,若比较两组某时间点处的生存率,则按下式计算:如比较多个时间点处生存率,检验水准可取Bonferroni校正,以保证总的I型错误概率不超过,趋势检验,多组生存率比较时,若分组变量是等级变量,如肿瘤分期为期、期、期,或连续变量等级化分组,如年龄(岁)30、30、40、50,在log-rank检验组间生存率差别有统计学意义后,还可作趋势检验(trend test),分析危险率是否有随分组等级变化而变化的趋势。即是否有肿瘤分期越高,预后越差,或年龄越大(或越小),预后越差的情况。,(1)按某种因素影响大小将病人分组 可采用临床上该因素的自然分组,如疾病的分期等,组数一般取奇数,如3组或5组。(2)计算每组的实际死亡数 与期望死亡数 。(3)进行趋势检验。,Cox比例风险回归模型,log-rank检验属于生存时间比较的单因素分析方法,应该注意的是生存分析中的单因素比较在实验设计方面和均数、率的比较一样,要求对比组之间在非处理因素方面具有可比性。一般而言,经过随机化分配处理的实验设计数据在处理组之间可比性较好在实际工作中多见的观察对比资料其可比性通常不能满足或者研究者关心的影响生存时间的因素不止一个,此时应采用适当的多因素分析方法,由于生存分析问题中反应变量比较特殊,是事件结局以及出现这一结局所经历的时间,普通的线性回归和logistic回归通常并不适用。如果仅考虑生存时间作为反应变量进行线性回归,由于生存时间通常并不是正态分布,不满足线性回归的模型要求;仅考虑某一时点事件结局作为反应变量进行logistic回归,生存时间长短的信息又未能充分利用;生存时间资料中还有删失数据的问题,上述两种模型都不能够利用这种不完全数据提供的信息,模型结构,式中x的 表示研究者认为可能影响生存的诸因素,也称协变量(covariates),这些变量在随访期间的取值不随时间变化而变化,例如根据研究目的可以是随访对象的年龄、性别、接受的不同治疗方式等。 t表示生存时间,好h(t,x) 称为具有协变量x 的个体在t 时刻的风险函数(hazard function),表示生存时间已达 的个体在 t时刻的瞬时风险率, h0(t)称为基线风险函数(baseline hazard function),表示所有 x都取值为0时的个体在t 时刻的瞬时风险率或死亡率。风险函数定义为具有协变量 x的个体在活过t 时刻以后在 t到 t+t这一段很短时间内死亡概率与 t之比的极限值,参数 为回归系数,其估计值 可以从样本计算得出。由于模型右侧的基线风险函数不要求服从特定分布形式,具有非参数的特点,而指数部分的协变量效应具有参数模型的形式,故Cox回归属于半参数模型(semi-parametric model)。,参数的统计学意义,模型假定,参数估计与假设检验,模型中的回归系数可借助部分似然函数(partial likelihood function)用最大似然估计方法得到。对回归模型的假设检验通常采用得分检验(score test)、wald检验和似然比检验(maximum likelihood ratio test),这些检验统计量均为卡方分布,自由度为模型中待检验的协变量个数。得分检验常用于模型外新变量的入选,wald检验常用于模型中变量的剔除;似然比检验用于不同协变量模型的比较,既可用于变量入选也可用于变量剔除。多因素分析时协变量的筛选策略与其他回归模型类似,通常可采用逐步法。,注意到上面的表23-9中和表23-10上都出现了-2ln(L)的数值,其中的L就是现有模型的部分似然函数值(L取值在0到1之间,其对数ln(L)称为对数似然函数,取值在负无穷大到0之间)。按照Cox模型的最大似然估计原则,当模型中增加自变量时,L将增大而-2ln(L)将减小,在自变量个数即模型的自由度一定时,-2ln(L)取值最小的模型最好,这一点类似于前述多重线性回归中的剩余平方和。可以根据模型的-2ln(L)数值大小来考虑自变量的筛选策略。,表达式右边指数部分取值越大,则风险函数 越大,预后相对越差,故称为预后指数(prognostic index,PI)。本例预后指数 。例如,1号患者age66,dtime33,则预后指数 0.23387660.444603330.1072。可按适当的预后指数分位数将观察对象分成若干组(25组),如低危组、中危组和高危组,以考察预后指数范围不同,其生存率的差异,对制定更合理的个体化治疗方案,正确指导病人的治疗,提高长期生存率有着重要意义。,Cox回归应用中的注意事项,Cox回归分析结论的正确性要以科学的设计、有代表性的抽样为前提。如果样本例数过少(多因素分析中死亡例数一般应在自变量个数的10倍以上),或者抽样不随机而使得某些变量在其各个水平上分布极端,很难得到真正的结果。有时回归分析得到的相对危险度与专业知识相悖,并非是什么专业上的新发现,而是设计上的缺陷造成。通过计算机软件进行模型拟合只能保证计算上的准确,由不合理的设计得到的数据计算出的结果只能是错得更复杂。另外,虽然它可以利用删失数据的信息,但过多的删失数据很可能会带来分析结果的偏倚。,数据的编码,可能会严重地影响结论的可解释性。对于某些数值型协变量,根据专业上的考虑转换为等级编码更恰当一些,否则会得到譬如红细胞每减小一个,患者的死亡风险会增加若干倍的夸大解释;对于无序的多分类协变量,应设置哑变量进入模型,例如4种血型可转换为3个0-1型变量拟合模型,并且这3个变量应作为一个因素整体进出模型,人为地将血型编码为1,2,3,4会造成回归系数或相对危险度解释上的困难。,本章介绍的Cox回归必须满足PH假定,如果某个协变量不同水平的Kaplan-Meier曲线有明显交叉,协变量与时间的交互作用项在Cox回归模型中有统计学意义,则不能使用本章介绍的比例风险模型,考虑拟合各种扩展Cox模型,如分层Cox模型或时变协变量的Cox模型等。,自变量的筛选事实上是一个复杂的建模过程,除了考虑以上问题,需要指出的是各种逐步方法只是一个计算手段,并不能保证总是得到最好的模型。变量筛选时首先要进行专业上的充分考虑,很重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论