




已阅读5页,还剩62页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生存分析SurvivalAnalysis 主讲 杨永利单位 公共卫生学院卫生统计学教研室 前边介绍的logistic回归只考虑终点事件的出现与否 但在恶性肿瘤 慢性病或其他情况的随访研究中 有时除考虑终点出现与否 还需考察观察对象达到终点所经历的时间长短 生存分析是将终点事件的出现与否和达到终点所经历的时间结合起来进行综合分析的一种方法 源于古老的寿命表 讲授内容 第一节生存分析基本概念第二节生存曲线的估计第三节生存曲线的比较第四节cox回归分析 生存时间生存分析常用描述指标 第一节生存分析基本概念 在临床医学中 对病人疗效考查 治疗结局 生存时间 一 生存时间 问题1某肿瘤患者5年生存率观察人数生存人数A组 200B组 200OR 一 生存时间 问题2如何计算平均数1 手术到死亡时间371520252630平均生存时间mean 182 39152025 2730 中位生存时间median 203 39 152020 2630 生存时间 问题3如何综合评价 两组间的比较 A36810222630 30 B68102030 30 30 30 生存时间 完全数据的均数 Mean A 12 5Mean B 11 0 以30天为界的分类结果 死亡生存A62B44 生存时间的概念 终点事件死亡出现故障治愈复发 起始事件生物生存电脑开始使用正常疾病产生疾病治愈 生存时间 survivaltime 可以广泛地定义为从规定的观察起点到某一特定终点事件出现的时间长度 生存时间三要素 观察起点终点事件时间的度量 随机对照临床试验的观察起点通常是随机化分组的时间 观察性研究中 观察起点可以是发病时间 第一次确诊时间或接受正规治疗的时间 终点事件可以是某种疾病发生 某种处理的反应 疾病的复发或死亡等 随访研究 follow upstudy 示意图 例题 某医院泌尿外科医师选择1996 2000年间经手术治疗的膀胱肿瘤患者 对可能影响膀胱肿瘤术后生存的因素进行了调查 随访截止日期为2000年12月30日 事件 event 研究者所规定的生存时间的终点 完全数据 随访研究中 在规定的观察期内 对某些观察对象如观察到了终点事件发生 从起点到终点事件所经历的时间 称为生存时间的完全数据 completedata 删失数据 censoreddata 又称截尾 随访研究中 在规定的观察期内 对某些观察对象由于某种原因未能观察到终点事件的发生 并不知道确切的生存时间 左删失 终点事件发生在某一时点之前 期间删失 终点事件发生在某两时点之间 右删失 终点事件发生在最后一次随访观察时刻的右方 删失必须调整 否则导致偏倚 产生删失数据的原因有 1 失访 2 研究结束时终点事件尚未发生 3 死于其它原因 4 由于严重药物反应而终止观察或改变治疗措施 随访研究 表21 2 患者进入期间 生存时间资料的特点 1有2个效应变量 1 生存时间 天数 2 结局 死亡与否 是否阳性等 2截尾数据 如表21 1中的1号 3号和4号病人未观察到底 不知他们究竟能活多长时间 处理截尾数据时两种错误的做法 错误1 丢弃截尾数据 只考虑确切数据 损失了信息 错误2 将截尾数据当作确切数据处理 低估了生存时间的平均水平 生存时间资料的特点 3 分布类型复杂 生存时间常呈正偏态分布 在处理正偏态分布数据时两种错误的做法 错误1 采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平 错误2 采用常规t检验或方差分析进行组间比较 应采用log rank检验比较几组生存时间 二 生存分析的统计描述指标 1 死亡概率 生存概率2 生存率及标准误3 半数生存期 中位数 及四分位数间距 1 死亡概率 生存概率 1 死亡概率 probabilityofdeath 表示某时段开始存活的个体 在该时段内死亡的可能性 计算 注意 如果年内有删失 则分母用校正人口数 校正人口数 年初人口数 删失例数 2 2 生存概率 单位时段开始时存活的个体到该时段结束时仍然存活的可能性 p 某年活满一年人数 某年年初人口数注意 若年内有删失 分母用校正人口数 2 生存率及标准误 生存率 survivalrate 0时刻存活的个体在t时刻仍存活的可能性 生存概率是针对单位时间而言的 生存率是针对某个较长时段的 是生存概率的累计结果 生存率 survivalrate 又称为累积生存概率 cumulativeprobabilityofsurvival 生存率的标准误 例 手术治疗50例肺癌病人 术后1 2 3年的死亡数分别为10 10 10例 无截尾数据 试求各年的生存概率和3年生存率 各年生存概率p1 50 10 50p2 40 10 40p3 30 10 303年生存率S 3 P T 3 50 30 50 0 4 1 半数生存期 也称中位生存期 mediansurvivaltime 即生存时间中位数 表示50 的个体可存活的时间 即生存率为 时对应的生存时间 集中趋势指标 中位生存期越长 表示疾病的预后越好 2 生存期的四分位数间距 反映离散程度大小 3 半数生存期及四分位数间距 寿命表法 lifetablemethod 乘积极限法 Kaplan Meiermethod 第二节生存曲线的估计 一 寿命表法 lifetablemethod 应用范围 样本含量较大时 例21 1 收集374名某恶性肿瘤患者的随访资料 取时间区间均为1年 整理结果见表21 3中 1 5 栏 试估计各年生存率 期初有效例数 期初病例数 期内删失数 2死亡概率 期内死亡数 期初有效例数生存概率 1 死亡概率 恶性肿瘤患者确诊后5年内生存率下降较块 5年后生存率下降较平缓 说明确诊后5年内该恶性肿瘤患者的死亡威胁较大 寿命表法曲线为折线 该法只估计时段右端点的生存率 省略了时段内的生存率估计 二 乘积极限法 Kaplan Meiermethod Productlimitmethod 应用于样本含量较小时 基本思想 将生存时间由小到大依次排列 在每个死亡点上 计算期初人数 死亡人数 死亡概率 生存概率和生存率 Kaplan Meier法生存曲线为阶梯形曲线 Group 1代表 3cm 2代表 3cmTime 生存时间Status 0代表删失 1代表完全数据 结局事件 第三节生存曲线的比较 Logrank检验 例21 3 比较上例中膀胱肿瘤小于3 0cm患者和肿瘤大于或等于3 0cm患者的生存曲线 就总体而言 两个生存函数是否有差别 小结 Log rank检验属于非参数检验的方法 Log rank检验可用于两组或多组生存曲线的比较 Log rank检验属于单因素分析方法 其应用条件是除比较因素外 影响生存率的各混杂因素在不同的组间均衡 否则 可采用cox回归 第四节cox回归 1 多重线性回归模型 反应变量为定量资料 且服从正态分布 2 Logistic回归模型 反应变量为定性资料 3 生存资料同时考虑生存结局和生存时间 生存时间往往不服从正态分布 且可能含有删失 错误1 忽略生存时间 采用Logistic回归分析死亡率 错误2 忽略结局 采用t检验 线性回归分析生存时间 Cox模型是由英国伦敦大学的Cox于1972年提出的 它是一种半参数模型 Cox模型以生存结局和生存时间为因变量 可同时分析众多因素对生存期的影响 分析带有删失数据的资料 且不要求资料服从特定的分布类型 Cox模型主要用于研究多个因子对生存时间的影响 Cox模型表达式 Cox回归模型的模型假定 任两个个体风险之比不随时间的变化而变化 Assumptionofproportionalhazard PH假定 Cox回归中PH假定的判定 1 Cox回归中PH假定的判定 2 案例讨论 某研究者观察了确诊后采取同样方案进行化疗的26例急性混合型白血病患者 欲了解某种不良染色体是否会影响患者病情的缓解 于是将治疗后120天内症状是否缓解作为结果变量y 缓解 0 未缓解 1 有无不良染色体chr有 l 无 0 作为研究因素 数据收集后 详细数据见表20 9 进行一系列统计分析 请结合以下问题 对分析结果进行恰当的评价 1 按照有无不良染色体分组比较缓解率 考虑到例数较小 采用Fisher精确概率法 得到P值为0 667 此时的结论如何 2 考虑到有无不良染色体并非研究人员可以随机化分配的处理 所以比较组之间其它影响患者缓解的因素不一定均衡 因而需要考虑平衡其他可能的影响因素的作用 于是该研究者进一步查阅了相关文献 追加记录了患者的年龄age 岁 骨髓原幼细胞数分组bl 大于等于50 1 小于50 0 CD34表达cd 阳性 1 阴性 0 性别sex 男 l 女 0 这几个变量 采用多因素logistic模型来分析 经逐步法按a 0 10准得到表20 10中的结果 此时的结论又如何 3 有临床医生指出 对于这种患者只要能使缓解时间提前临床上就可以认为有一定疗效 所以仅考虑是否缓解还不够 如果进一步利用缓解时间的长短来进行分析 信息会利用得更充分 费了很大辛苦 幸好查到了所有患者的缓解时间 于是采用log rank检验比较了有无不良染色体的两个组病人的生存曲线 得到 2 1 28 P值为0 2579 此时的结论如何 4 有统计学家提醒研究者 生存时间的比较仍然需要考虑组间的可比性 这种观察对比得到的数据还需要做多因素的生存分析 结论会比单因素Iog rank检验可靠 于是进行多因素Cox回归分析 逐步回归结果列在表21 12 此时 因为chr的P值大于0 05 所以认为有无不良染色体并没有什么关系 综合上述分析过程 你对此项研究的设计 资料收集及统计分析方法的选择有何评论 案例解析 首先 结果变量的选取应充分考虑专业上的要求 对于白血病等一些难以完全治愈的较为凶险的疾患 延长患者的生存时间在临床上是有现实意义的 故而结果变量应选取结局 病情是否缓解 以及出现结局的时间 缓解时间 这样 仅以病情是否缓解为结果变量的单因素Fisher精确概率结果以及多因素logistic模型结果就不很恰当 案例解析 其次 在使用生存分析方法时 应考虑到影响缓解时间的因素 除了研究者所关心的是否存在不良染色体以外 还有其它影响因素无法通过实施随机化达到组间非研究因素的均衡性 那么单因素log rank检验的结果就无法控制非研究因素的影响
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全体安全培训课件安排
- 江西省九师联盟开学考试2026届高三上历史试卷(含答案)
- 偏远岗位安全培训内容课件
- 保密知识培训会主持词课件
- 西藏拉萨市那曲二中2025-2026学年高三物理第一学期期末质量跟踪监视模拟试题
- 研学旅行活动安全应急预案
- 2025公共基础知识题库与参考答案
- 埃及旅游资源
- 企业管理人员的安全培训课件
- 伪状态对抗性防御-洞察及研究
- 2025年广西中考道法真题卷含答案解析
- 婚介专业红娘培训课件
- 物业员工冬装采购方案(3篇)
- 网店客服教案网店客服岗前准备ITMC网店客户服务实训系统介绍
- 全球臭氧变化趋势-第1篇-洞察及研究
- 全国大学生职业规划大赛《石油工程》专业生涯发展展示
- 国际经济法课件马工程版
- 2025-2030中国测绘行业经营模式与未来应用前景研究报告
- 胰十二指肠切除术并发症及防治
- 留学生中国文化课课件
- (完整版)抛丸机安全操作规程
评论
0/150
提交评论