生存分析PPT课件.ppt_第1页
生存分析PPT课件.ppt_第2页
生存分析PPT课件.ppt_第3页
生存分析PPT课件.ppt_第4页
生存分析PPT课件.ppt_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

19生存分析 1 回归分析 1个因变量Y 1个自变量X 2个以上自变量X Y是数值变量 Y是分类型变量 常用的回归分析 2 主要特点 考虑到了每个研究对象出现某一结局所经历的时间长短 生存分析 survivalanalysis 将终点事件和出现终点时间所经历的时间结合起来分析的一类统计分析 3 例 某医院泌尿外科医师对可能影响膀胱肿瘤术生生存的因素进行了调查 选择1996 2000年间手术治疗的膀胱肿瘤患者30例 随访截止日期2000年12月30日 表19 230例膀胱肿瘤患者生存资料的原始记录表 4 对缺损数据无法处理 Logistic分析的缺陷 只考虑终点事件的出现与否 但在研究中 还需要考察对象到达终点时所经历时间的长短 也就是说研究者对医学事件发生 发展所经历的时间感兴趣 如恶性肿瘤 慢性病等各个观察对象随访各时间点的发生情况 以评价临床疗效和控制的好坏 生存分析 5 6 19 1概述 19 2生存率的估计 19 3生存曲线的比较 19 4Cox比例风险回归模型 7 19 1生存分析的概述 8 三要素 1 生存时间 survivaltime 从规定的观察起点到某一特定终点事件出现的时间长短 终点事件 生存时间 观察起点 生存分析中的基本概念 9 随机对照临床试验研究 观察起点通常是随机化分组的时间 观察性研究 观察起点可以是发病时间 第一次确诊时间或接受正规治疗的时间 终点事件可以是某种疾病发生 某种处理的反应 疾病的复发或死亡等 10 观察性研究 11 合格的研究对象 出现结果尚未出现结果失访 脱落 随访研究 follow upstudy 示意图 随机对象的临床试验研究 12 随访研究 时间 研究截止时点2000 12 30 死于冠心病 生存时间 13 完全数据 在规定的观察期内 对某些观察对象观察到了终点事件发生 从起点到终点事件所经历的时间 称为生存时间的完全数据 completedata 用符号 t 表示 删失数据 截尾数据 规定的观察期内 对某些观察对象 由于某种原因未能观察到病人的终点事件发生 并不知道其确切的生存时间 就象病人生存时间在未达到规定的终点就被截尾一样 称为生存时间的删失数据 又称截尾数据 用符号 t 表示 2 生存数据类型 14 产生删失数据的常见原因有 研究结束时终点事件尚未发生 失访 死于其它原因 由于严重药物反应而终止观察或改变治疗措施 15 生存分析的特点 特点 同时考虑生存结局和生存时间可能含有删失数据 censor 生存时间分布不正态 非负且右偏 生存分析 生存资料 可处理删失数据 可处理生存时间分布不正态的问题 处理删失 截尾数据时两种错误的做法 错误1 只考虑确切数据 丢弃截尾数据 损失信息 错误2 将截尾数据当作确切数据处理 低估了生存时间的平均水平 16 在处理正偏态分布数据时两种错误的做法 错误1 采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平 错误2 采用常规t检验或方差分析进行组间比较 应采用log rank检验比较几组生存时间 17 针对单位时间的 18 死亡概率 probabilityofdeath 表示某单位时段开始存活的个体 在该时段内死亡的可能性 如年死亡概率 注意 如果年内有删失 则分母用校正人口数 校正人口数 年初人口数 删失例数 2 19 生存概率 probabilityofsurvival 单位时段开始时存活的个体 到该时段结束时仍然存活的可能性 注意 若年内有删失 分母用校正人口数 20 生存率 survivalrate 0时刻存活的个体经历tk时个单位时间段后仍存活的可能性 若资料中无删失数据时 21 解 1 各年生存概率p1 50 10 50 0 80p2 40 10 40 0 75p3 30 10 30 0 672 3年生存率S 3 P T 3 50 30 50 0 4 p1 p2 p3 举例 手术治疗50例肺癌病人 术后1 2 3年的死亡数分别为10 10 10例 无截尾数据 试求各年的生存概率和3年生存率 22 故生存率又称为累积生存概率 cumulativeprobabilityofsurvival 它是随着时间的变化而变化着的 是关于时间的函数 称为生存函数 survivalfunction 23 若资料中有删失数据 则须分段计算生存概率 再应用概率乘法定理将分时段的生存概率相乘得到生存率 区分 生存率 生存概率生存概率是针对单位时间而言的 生存率是针对某个较长时段的 是生存概率的累计结果 24 生存率的标准误 第j个时间段内死亡人数 第j个时间段期初人口数 25 生存期的四分位数间距 Q P75 P25是反映离散程度大小的指标 中位生存期及四分位数间距 中位生存期 mediansurvivaltime 也称半数生存期 是生存时间中位数 M P50 表示恰有50 的个体存活的时间 即生存率为50 时对应的生存时间 是描述集中趋势的指标 中位生存期越长 表示疾病的预后越好 26 风险函数 hazardfunction t时刻存活的个体在t时刻的瞬时死亡率 h t 近似地等于t时刻存活的个体在此后一个单位时段内的死亡概率 27 生存分析的基本步骤 估计生存率 生存函数 估计生存曲线 评价生存时间影响因子的效果 生存时间分布的组间比较 在不考虑其它混杂因素的情况下 可用寿命表法和Kaplan Meier法作 Cox回归模型 Logrank检验 28 21 2生存曲线的估计 29 生存率估计 或称乘积极限法 productlimitmethod 大样本资料 寿命表法 小样本资料 kaplan meier法 30 19 2 1寿命表法 lifetablemethod 例21 1收集374名某恶性肿瘤患者的随访资料 取时间区间均为1年 整理结果见下午表 试估计各年生存率 31 解析 该生存资料为大样本 生存时间粗略且含有删失数据 方法原理 1 计算期初有效例数 注意删失数据期初有效例数 期初病例数 期内删失数 22 计算死亡概率 生存概率死亡概率 期内死亡数 期初有效例数生存概率 1 死亡概率3 计算生存率 4 作生存曲线 寿命表法 32 寿命表法 33 寿命表法曲线为折线 该法只估计时段右端点的生存率 省略了时段内的生存率估计 恶性肿瘤患者确诊后5年内生存率下降较快 5年后下降较平缓 说明确诊5年内该恶性肿瘤患者的死亡威胁较大 中位生存期 34 电脑实现 SPSS 1 数据录入 频数形式 生存分析 寿命表法 Time 生存时间 年 Status 0 删失数据1 完全数据 死亡 Freq 频数 35 2 加权 36 3 SPSS过程 37 38 39 4 结果及结果输出 40 41 19 2 2乘积极限法 kaplan meier法 例19 2按下表数据 14例膀胱肿瘤 3 0cm患者和16例膀胱肿瘤 3 0cm患者的生存时间 月 如下 试估计两组生存率 42 解析 以 3 0cm 组为例 n 14 样本含量较小且含删失数据 方法原理 1 将生存时间由小到大依次排列 2 在每个时间区间上 计算死亡人数 删失人数 期初人数 死亡概率 生存概率和生存率 3 作生存曲线 乘积极限法 kaplan meier法 43 44 Kaplan Meier法生存曲线为阶梯形曲线 45 19 2 3生存率的区间估计 假定标准误近似正态分布 则标准误的1 置信区间为 Greenwood法求生存率的近似标准误 46 2020 1 9 47 电脑实现 SPSS 1 数据录入 生存分析 Kaplan Meier Group 1 3 0cm 2 3 0cm dtime 生存时间 月 Status 0 删失数据1 完全数据 结局事件 48 2 SPSS过程 49 3 结果及结果输出 50 51 52 19 3生存曲线的比较 Logrank检验 53 例19 3 比较上例中膀胱肿瘤 3 0cm患者和肿瘤 3 0cm患者的生存曲线 就总体而言 两个生存函数是否有差别 54 19 2 2乘积极限法 kaplan meier法 例19 2按下表数据 14例膀胱肿瘤 3 0cm患者和16例膀胱肿瘤 3 0cm患者的生存时间 月 如下 试估计两组生存率 55 检验过程 56 57 58 59 注意事项 Log rank检验可用于整条生存曲线的比较 也适用于寿命表资料及多组生存率间的比较 Log rank检验属于单因素分析方法 其应用条件是除比较因素外 影响生存率的各混杂因素在不同的组间均衡 否则 可采用Cox回归 可计算两组死亡的相对危险度 relativeratio RR 肿瘤 3 0组对肿瘤 3 0组 意义 肿瘤 3 0组的死亡风险是对肿瘤 3 0组的2 69倍 60 19 4Cox比例风险回归模型 61 举例 30例膀胱肿瘤患者的随访记录 62 几种分析模型用于生存资料分析的缺陷 Log rank检验属于单因素分析法 一次只能分析一个因素 那么对影响因素较多的情况就无法应对 Logistic回归模型 可以事件的结局 定性资料 为反应变量 可以解决各因素对结局的影响 但不能解决生存期时间长短的问题 多重线性回归模型 它要反应变量为定量资料 且服从正态分布 而生存时间通常不呈正态分布 63 Cox回归模型 是由英国伦敦大学的Cox于1972年提出的 它是一种半参数模型 Cox模型以生存结局和生存时间为因变量 可同时分析众多因素对生存期的影响 分析带有删失数据的资料 且不要求资料服从特定的分布类型 主要用于研究多个影响因子对生存时间的影响 64 风险函数 hazardfunction t时刻存活的个体在t时刻的瞬时死亡率 h t 近似地等于t时刻存活的个体在此后一个单位时段内的死亡概率 65 Cox模型表达式 h t 表示具有协变量X1 X2 Xp的个体在t时刻的风险函数 表示t时刻存活的个体在t时刻的瞬间死亡率 h0 t 基准风险函数 baselinehazard 表示当X1 X2 Xp 0时 个体在t时刻的风险函数 1 2 p 各协变量所对应的回归系数 66 任两个群体风险函数之比 即风险比 riskratio RR或hazardratio HR 或 67 RR值与h0 t 无关 也与时间t无关 即模型中的自变量效应不随时间而改变 所以称为比例风险模型假定 又称PH假定 j的实际意义 在其他自变量固定不变的条件下 变量Xj每增加一个单位所引起的风险比的自然对数 68 Cox回归模型拟合的基本步骤 估计参数 0 1 2 i logistic回归方程的假设检验 回归方程的统计应用 极大似然法 列出回归方程 回归系数的区间估计 69 举例 30例膀胱肿瘤患者的随访记录 试进行患者生存情况的影响因素分析 70 电脑实现 SPSS 1 数据录入 生存分析 Coxanalysis 71 2 SPSS过程 72 3 结果及结果输出 列出Cox回归方程 风险函数表达式 73 预后指数 Prognosticindes PI 其取值越大 则风险函数的取值越大 预后越差 74 Cox回归的基本假定是比例风险假定 PH假定 即模型中的自变量效应不随时间而改变 只有在满足该假定前提下 基于此模型的分析预测才是可靠有效的 PH假定的判断 最简单的是观察Kaplan Meier生存曲线 三 Cox回归中PH假定及判断方法 75 Cox回归中PH假定的判定方法 1 76 Cox回归中PH假定的判定方法 2 77 19 5结果报告 78 结果报告 生存率的估计 报告生存率估计方法 生存曲线及中位生存期 生存曲线比较 报告生存曲线 生存曲线的比较方法 检验统计量及其P值 影响因素分析 报告变量筛选方法 检验水准 各变量RR值 RR值的95 置信区间及其P值 79 附图 肿瘤 3 0cm组和 3 0cm组生存曲线 K M法 以Kaplan Meier法估计肿瘤 3 0cm组和 3 0cm组的生存率 生存曲线如图1所示 其结果显示 两组中位生存期分别为20个月和36个月 经log rank检验 两条曲线的差别有统计学意义 肿瘤 3 0cm组的生存率高于肿瘤 3 0cm组的 结果报告1 80 结果报告2 膀胱肿瘤死亡的影响因素分析见附表示 经多变量Cox比例风险回归分析显示 肿瘤分级 RR 5 367 95 CI2 540 11 340 P 0 001 肿瘤大小 RR 2 939 95 CI1 193 7 242 P 0 02 以及是否复发 RR 2 662 95 CI1 080 6 560 P 0 05 与死亡有关 81 小结 生存分析是将终点事件和达到终点事件所经历的时间结合起来分析的一种统计学方法 可用于生存率的估计 生存曲线比较 影响因素分析和生存预测 生存曲线的非参数估计方法和寿命表法和Kaplan Meier法 前者适用于大样本的分组资料 后者适用于小样本或大样本未分组资料 两者均利用概率乘积法定理计算生存率 Log rank检验是两条或多条生存曲线比较的非参数方法之一 因其能对各组生存曲线作整体比较 实际工作中应用研究较多 Cox模型属比例风险模型 乘法模型 Cox可用于影响因素分析 校正混杂因素后的组间比较以及多因素生存预测 82 区分多重线性回归 logistic回归和Cox回归的异同 83 案例分析 一 某医师收集30例肺癌术后患者的生存情况 有1例由于电话和地址错误无法随访到患者 他设计了以下几种处理方法 把该病例去掉 把这例患者写入SPSS数据 但末次随访时间空白 让SPSS自动去分析 因为某一天 比如2006年9月1日 想随访这例患者但是没有随访到 所以将末次随访时间写为随访当天的日期 另欲分析肺癌术后患者的中位生存期 计算结果为10个月 但是检查原始数据发现 生存时间为10个月的这个患者一直存活到随访结束 似乎与中位生存期的定义相矛盾 84 请问 1 该医师对这例失访患者的处理是否恰当 为什么 正确的处理方法是什么 2 另有1例患者死于脑梗死 生存分析时应如何处理 3 该医师的发现是否与中位生存期的定义相矛盾 为什么 85 答案 1 该医师对这例失访患者的三种处理都不恰当 应作为删失病例 删失生存时间的计算为从手术切除到最后一次随访的时间 2 死于脑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论