




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生存分析(2) 由于生存曲线只是对样本生存过程的统计 描述 样本生存率或生存曲线不同也可能是抽样 误差所致, 在生存分析中一个重要的问题是进一步对 总体的生存曲线进行假设检验 log-rank检验 属于非参数方法 该法并不指定生存时间服从某种特定的分 布 所比较的是整个生存时间的分布,而不是 仅仅比较某个特定时间点的生存率 例23-3 就例23-1数据,比较甲乙两疗法组 脑瘤患者的生存率有无差别? 两种治疗方式的脑瘤患者生存曲线相同 两种治疗方式的脑瘤患者生存曲线不同 由于假设成立时,两组的生存分布相同, 故可把两组的数据合并 计算合并的死亡概率,以此计算相应的期 望死亡人数,故将两组的完全生存时间混 合排序列在表23-5第2列 相同生存时间只列1次 k=1,2 表示在每个时点,当两组的死亡率相等且 均为该时点的总死亡数除以该时点的总观 察数时,按照各组期初例数计算的期望死 亡人数 分别将两组各时点期望死亡人数相加列在 第5、第9列合计处,而两组实际总死亡数 为第4、第8列合计 如果两组各时点生存率都相等,那么两组 总的期望死亡数和总的实际死亡数相差不 大 注意事项 (1)以上介绍的是log-rank检验的近似法,计 算简便,但其结果较精确法(一般统计软件中 输出精确法计算结果)保守。log-rank检验精 确法 统计量计算公式为: wi为权 重,对log-rank检验,wi=1,即该检验 给任意时间点处两组间死亡的差别相同的权 重。当比较的两总体生存曲线呈比例时,检验 效能最大;wi=ni 则对应Gehan检验(1965)或 Wilcoxon检验,该检验给两组间死亡的早期差 别更大的权重 (2)对于大样本频数表形式的生存曲线比较 ,基本方法与上述相同。 另外,该法很容易推广到多个组的比较,在此 不赘述。 需要强调的是,生存曲线的比较也和前面均 数、率的比较一样,要求组间具有可比性,最 好是按照比较因素进行随机化分配之后再比 较。 如果是未经随机化分配的观察对比资料,要考 虑是否有混杂因素干扰,若存在混杂因素,可 进行分层分析或采用多因素分析方法(见本章 第四节)。 (3)当假设检验发现组间生存曲线有差别 时,可通过中位生存期、相对危险度RR( relative risk)等指标评价其差别。 相对危险度是两个对比组相对死亡比的比 值,而相对死亡比是实际死亡数与期望死 亡数之比,于是,第i组相对于第j组的相对 危险度为: (4)log-rank检验用于整条生存曲线的比较 ,若比较两组某时间点处的生存率,则按 下式计算: 如比较多个时间点处生存率,检验水准可 取Bonferroni校正,以保证总的I型错误概率 不超过 趋势检验 多组生存率比较时,若分组变量是等级变 量,如肿瘤分期为期、期、期,或 连续变量等级化分组,如年龄(岁)30 、30、40、50,在log-rank检验组间 生存率差别有统计学意义后,还可作趋势 检验(trend test),分析危险率是否有随 分组等级变化而变化的趋势。即是否有肿 瘤分期越高,预后越差,或年龄越大(或 越小),预后越差的情况。 (1)按某种因素影响大小将病人分组 可 采用临床上该因素的自然分组,如疾病的 分期等,组数一般取奇数,如3组或5组。 (2)计算每组的实际死亡数 与期望死亡数 。 (3)进行趋势检验。 Cox比例风险回归模型 log-rank检验属于生存时间比较的单因素分析 方法,应该注意的是生存分析中的单因素比较 在实验设计方面和均数、率的比较一样,要求 对比组之间在非处理因素方面具有可比性。 一般而言,经过随机化分配处理的实验设计数 据在处理组之间可比性较好 在实际工作中多见的观察对比资料其可比性通 常不能满足 或者研究者关心的影响生存时间的因素不止一 个,此时应采用适当的多因素分析方法 由于生存分析问题中反应变量比较特殊,是事件结 局以及出现这一结局所经历的时间,普通的线性回 归和logistic回归通常并不适用。 如果仅考虑生存时间作为反应变量进行线性回归, 由于生存时间通常并不是正态分布,不满足线性回 归的模型要求; 仅考虑某一时点事件结局作为反应变量进行logistic 回归,生存时间长短的信息又未能充分利用; 生存时间资料中还有删失数据的问题,上述两种模 型都不能够利用这种不完全数据提供的信息 模型结构 式中x的 表示研究者认为可能影响生存的诸因素, 也称协变量(covariates),这些变量在随访期间的 取值不随时间变化而变化,例如根据研究目的可以 是随访对象的年龄、性别、接受的不同治疗方式 等。 t表示生存时间,好h(t,x) 称为具有协变量x 的个体在 t 时刻的风险函数(hazard function),表示生存时 间已达 的个体在 t时刻的瞬时风险率, h0(t)称为基线风险函数(baseline hazard function) ,表示所有 x都取值为0时的个体在t 时刻的瞬时风 险率或死亡率。 风险函数定义为具有协变量 x的个体在活过t 时刻以 后在 t到 t+t这一段很短时间内死亡概率与 t之 比的极限值 参数 为回归系数,其 估计值 可以从样本计算得出。 由于模型右侧的基线风险函数不要求服从 特定分布形式,具有非参数的特点,而指 数部分的协变量效应具有参数模型的形式 ,故Cox回归属于半参数模型(semi- parametric model)。 参数的统计学意义 模型假定 参数估计与假设检验 模型中的回归系数可借助部分似然函数(partial likelihood function)用最大似然估计方法得到。 对回归模型的假设检验通常采用得分检验(score test)、wald检验和似然比检验(maximum likelihood ratio test),这些检验统计量均为卡方分 布,自由度为模型中待检验的协变量个数。 得分检验常用于模型外新变量的入选,wald检验常 用于模型中变量的剔除;似然比检验用于不同协变 量模型的比较,既可用于变量入选也可用于变量剔 除。 多因素分析时协变量的筛选策略与其他回归模型类 似,通常可采用逐步法。 注意到上面的表23-9中和表23-10上都出现了-2ln(L )的数值,其中的L就是现有模型的部分似然函数值 (L取值在0到1之间,其对数ln(L)称为对数似然 函数,取值在负无穷大到0之间)。 按照Cox模型的最大似然估计原则,当模型中增加 自变量时,L将增大而-2ln(L)将减小,在自变量个 数即模型的自由度一定时,-2ln(L)取值最小的模 型最好,这一点类似于前述多重线性回归中的剩余 平方和。 可以根据模型的-2ln(L)数值大小来考虑自变量的 筛选策略。 表达式右边指数部分取值越大,则风险函数 越大,预后相对越差,故称为预后指数( prognostic index,PI)。 本例预后指数 。例如,1号患者age66, dtime33,则预后指数 0.2338766 0.444603330.1072。 可按适当的预后指数分位数将观察对象分成若 干组(25组),如低危组、中危组和高危组 ,以考察预后指数范围不同,其生存率的差异 ,对制定更合理的个体化治疗方案,正确指导 病人的治疗,提高长期生存率有着重要意义。 Cox回归应用中的注意事项 Cox回归分析结论的正确性要以科学的设计、有代表性 的抽样为前提。 如果样本例数过少(多因素分析中死亡例数一般应在自 变量个数的10倍以上),或者抽样不随机而使得某些变 量在其各个水平上分布极端,很难得到真正的结果。 有时回归分析得到的相对危险度与专业知识相悖,并非 是什么专业上的新发现,而是设计上的缺陷造成。 通过计算机软件进行模型拟合只能保证计算上的准确, 由不合理的设计得到的数据计算出的结果只能是错得更 复杂。 另外,虽然它可以利用删失数据的信息,但过多的删失 数据很可能会带来分析结果的偏倚。 数据的编码 可能会严重地影响结论的可解释性。 对于某些数值型协变量,根据专业上的考虑转 换为等级编码更恰当一些,否则会得到譬如红 细胞每减小一个,患者的死亡风险会增加若干 倍的夸大解释; 对于无序的多分类协变量,应设置哑变量进入 模型,例如4种血型可转换为3个0-1型变量拟 合模型,并且这3个变量应作为一个因素整体 进出模型,人为地将血型编码为1,2,3,4会 造成回归系数或相对危险度解释上的困难。 本章介绍的Cox回归必须满足PH假定, 如果某个协变量不同水平的Kaplan-Meier曲 线有明显交叉, 协变量与时间的交互作用项在Cox回归模型 中有统计学意义,则不能使用本章介绍的 比例风险模型, 考虑拟合各种扩展Cox模型,如分层Cox模 型或时变协变量的Cox模型等。 自变量的筛选事实上是一个复杂的建模过程,除了考虑 以上问题,需要指出的是各种逐步方法只是一个计算手 段,并不能保证总是得到最好的模型。 变量筛选时首先要进行专业上的充分考虑,很重要的自 变量不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能家居网络连接故障排查考核试卷
- 隧道工程的生态智慧城市技术发展考核试卷
- 金属玩具的智能制造系统优化考核试卷
- 新生儿呼吸窘迫综合征影像学
- 慢性阻塞性肺疾病膳食管理要点
- 学前教育毕业设计
- 自主呼吸诱发的肺损伤
- 电子行业点评报告:大厂自研三两事系列从哲库到玄戒手机APSoC自研的启示
- 2025年环保型家居产品研发申请报告
- 2025年功能性饮料在健身房会员活动中的市场推广策略研究报告
- 2025年文秘类的考试试题及答案
- 第五单元 第5节 跨学科实践:制作望远镜 教学设计-2024-2025学年人教版物理八年级上册
- 2022-2023学年湖南省岳阳市城区人教版六年级下册期末测试数学试卷(原卷版+解析)
- 电力输电线路施工安全培训
- 应用型本科高校建设现状的调研报告
- 单位保洁协议合同范本
- 高新技术产品贸易销售合同
- 空调维保服务项目质量保障措施
- 人工智能算法开发合作合同
- 2025年重点高中自主招生考试数学试卷试题(含答案详解)
- 客服主管岗位周工作计划
评论
0/150
提交评论