生存分析.ppt_第1页
生存分析.ppt_第2页
生存分析.ppt_第3页
生存分析.ppt_第4页
生存分析.ppt_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

余红梅 Department of Health Statistics School of Public Health, Shanxi Medical University 生存分析 Survival Analysis To be or not to be is only a part of the question. The question also includes how long to be. o生存分析(survival analysis)是将事件 的结果(终点事件)和出现这一结果所 经历的时间结合起来分析的一种统计分 析方法。 o生存分析不同于其它多因素分析的主要 区别点就是生存分析考虑了每个观测出 现某一结局的时间长短。 前 言 第一节 生存分析基本概念 一、生存时间 ( survival time,failure time ) o终点事件与起始事件之间的时间间隔。 o终点事件指研究者所关心的特定结局。 o起始事件是反映研究对象生存过程的起 始特征的事件。 生存时间举例 起始事件 终点事件 服药 痊愈 手术切除 死亡 染毒 死亡 化疗 缓解 缓解 复发 o终点事件和起始事件是相对而言的 ,它们都由研究目的决定,须在设 计时明确规定,并在研究期间严格 遵守,不能随意改变。 生存时间的类型 1. 完全数据(complete data) 从起点至死亡(死于所研究疾病)所经历 的时间。 2. 截尾数据(删失数据,censored data) 从起点至截尾点所经历的时间。 截尾原因:失访、死于其它疾病、观察结 束时病人尚存活等。 例如,某肿瘤医院调查了1991-1995年间经手 术治疗的大肠癌患者150例,对可能影响大肠 癌术后生存时间的因素进行了调查,如性 别、年龄、组织学分类、肿瘤大小、DureS 分期等。随访截止日期为2000年12月30日, 随访记录见下表。 大肠癌患者的随访记录 编号 性别 年龄 手术日期 随访终止日期 随访结局 生存时间(天) 1 男 45 1991.05.20 1995.06.04 死亡 1476 2 男 50 1992.01.12 1998.08.25 死亡 2417 3 女 36 1991.10.24 1994.03.18 失访 876+ 4 男 52 1994.11.02 2000.12.30 存活 2250+ 5 女 56 1994.06.25 1995.03.17 死亡 265 6 女 60 1993.12.05 1996.08.16 死于其它 985+ 生存时间 o生存时间的度量单位可以是年、月、 日、小时等。常用符号t表示,截尾数据 在 其右上角标记“+”。 o生存资料的主要特点: n含有截尾数据。 n截尾数据的特点:真实的生存时间未知, 只知道比观察到的截尾生存时间要长。 n生存时间的分布一般不呈正态分布。 二、条件生存概率、生存率、生存曲线 o条件生存概率: (conditional probability of survival) 表示某单位时段开始时存活的个体,到 该 时段结束时仍存活的可能性。 年条件生存概率表示年初尚存人口存 活满1年的可能性。 o生存率: (survival rate, survival function ) 指观察对象经历t个单位时段后仍存活的 可能性。 条件生存概率和生存率的计算 例:手术治疗100例食管癌患者,术后1 、 2、3年的死亡数分别为10、20、30,若 无 截尾数据,试求各年条件生存概率及逐 年 生存率。 生存率计算方法: n直接法 n概率乘法定理 由例子可看出,生存率与条件生存概 率不同。条件生存概率是单个时段的 结果,而生存率实质上是累积条件生 存概率(cumulative probability of survival),是多个时段的累积结果。 例如,3年生存率是第1年存活,第2年 也存活,第3年还存活的可能性。 o生存曲线(survival curve) 以观察(随访)时间为横轴,以生存率 为纵轴,将各个时间点所对应的生存率 连接在一起的曲线图。 o生存曲线是一条下降的曲线,分析时 应注意曲线的高度和下降的坡度。平缓 的生存曲线表示高生存率或较长生存 期,陡峭的生存曲线表示低生存率或较 短生存期。 某医师收集20例脑瘤患者甲、乙两疗法 治疗的生存时间(周)如下: 甲疗法组 1 3 3 7 10 15 15 23 30 乙疗法组 5 7+ 13 13 23 30 30+ 38 42 42 45+ 三、中位生存期 o中位生存期(median survival time) 又称半数生存期,表示恰好有50的 个体尚存活的时间。 o中位生存期越长,表示疾病的预后越 好;中位生存期越短,预后越差。 o估计中位生存期常用图解法或线性内 插法。 生存资料统计学处理方法 (一)设计 o目的:专业目的:据专业知识确定。 统计学目的: n估计:根据样本生存资料估计总体生 存率及其它有关指标(如中位生存期 等),如根据脑瘤患者治疗后的生存 时间资料,估计不同时间的生存率、 生存曲线以及中位生存期等。 n比较:对不同处理组生存率进行比较, 如比较不同疗法治疗脑瘤的生存率,以 了解哪种治疗方案较优。 n影响因素分析:目的是为了探索和了解 影响生存时间长短的因素,或平衡某些 因素影响后,研究某个或某些因素对生 存率的影响。如为改善脑瘤病人的预后 ,应了解影响病人预后的主要因素,包 括病人的年龄、性别、病程、肿瘤分期 、治疗方案等。 n预测:具有不同因素水平的个体生存预 测,如根据脑瘤病人的年龄、性别、病 程、肿瘤分期、治疗方案等预测该病人t 年(月)生存率。 o方法:前瞻性队列研究 回顾性队列研究 o确定起始事件、终点事件、随访终止日 期、生存时间、截尾。 o确定可能的影响因素、水平以及量化方 法。 大肠癌影响因素量化表 变量名 因素 量化值 病例数 构成比(%) X1 性别 女=0 32 48.5 男=1 34 51.5 X2 年龄(岁) 0,RR1,说明变量X增加时,危 险率增加,即X是危险因素。 o0,RR1,说明变量X增加时,危 险率下降,即X是保护因素。 o=0,RR=1,说明变量X增加时,危 险率不变,即X是危险无关因素。 二、参数估计与假设检验 (一)参数估计 最大似然法 (二)假设检验 n似然比检验(likelihood ratio test) n得分检验( score test) nWald检验(Wald test) 三、因素筛选与最优模型的建立 o变量筛选方法 n向前引入法(前进法)Forward n向后剔除法(后退法)Backward n逐步引入-剔除法(逐步法)Stepwise o检验水准 n初步的、探索性的研究,或变量数较少 时,可取0.10。 n设计严谨的、证实性的研究,或变量数 较多时,可取0.05或0.01 。 n检验水准包括引入的检验水准和剔除的 检验水准。一般地,剔除引入。 分析结果(结果解释) o与生存相关的因素 o因素作用大小及方向:保护因素还 是危险因素、相对危险度的大小。 o因素作用大小排序:标准化回归系 数的绝对值。 分析结果(结果解释) p个体的预后指数及预后分组: 预后指数(prognostic index,PI) = 预后指数越小,预后越好; 预后指数越大,预后越差。 分析结果(结果解释) n例如: 传统治疗方式,淋巴结转移,PI2.6929 传统治疗方式,淋巴结无转移,PI1.7616 新治疗方式,淋巴结转移,PI0.9313 新治疗方式,淋巴结无转移,PI0 n据PI的大小可将病人分为不同的危险组,常见 分三组(即低危组、中危组、高危组)或五组 。绘制分组的生存曲线,直观比较各危险组的 生存情况,如中位生存期、t年生存率等。 六、Cox模型的注意事项及应用范围 (一)注意事项 o设计阶段应注意的问题 o模型配合时应注意的问题 应用条件:除生存资料的基本要求外,还要求 因素对生存时间的作用不随时间变化(比例 风险假定)。如观察年限超过10年时,癌症 手术后放疗的治疗作用可能逐渐消失,从而 不满足这一要求。 o因素分析时应注意的问题 n筛选变量时,考虑该指标是否容易收 集、是否费用较高等临床因素。 n对连续变量,看其分布,如服从偏态 分布,一般进行对数变换后参与计算 。 n选入模型的变量是统计学上的有关变 量,不一定都与生存时间有因果关系 。其中某些变量可能只是伴随关系而 已,未选入模型的变量不一定全是无 关变量,要考虑是否模型内的某些变 量代替了它的作用,或因例数不够, 或试验中对该变量进行了控制而引起 。 n检查可能的交互作用项是否显著(方法: 一次引入一个交互作用项,看其对应的回 归系数是否为0)。 n模型拟合优度考察:据预后指数PI分组, 比较各组基于Cox模型的生存曲线与基于 kaplan-Meier法估计的生存曲线,如两组 曲线吻合较好,表明Cox模型拟合较好。 n生存率分析:生存曲线不能随意延长,也 不能轻易用于预测预报,经过大量研究所 得的生存曲线才有可能推广应用。 (二)适用范围 o因素分析 logistic回归模型可以作多因素分析,并可进行 相对危险度估计,但不考虑生存时间的长短, 不能处理随访中常见的截尾数据。Cox比例风 险回归模型具有logistic回归模型的所有优点; 同时考虑生存结局和生存时间的长短,可处理 截尾数据;且不考虑基准风险的分布。 o生存预测 n强调设计的重要性 n专业知识角度:选择疾病种类、终点事件 、影响因素及结果的专业解释等。 n统计学角度:样本例数、因素的赋值、生 存时间准确到天数、因素筛选方法、结果 的统计学解释等。 小结(论文报告中应写明) 1材料与方法 o病例来源、起始事件、终点事件、观察终止 时间、截尾情况、随访结果的获得方法,样 本含量、截尾例数及百分比(%)。 o建立数据库方法 o统计学处理方法 Kaplan-Meier法估计生存率 log-rank检验进行组间生存率比较 Cox模型进行多因素分析 2结果 o估计:Kaplan-Meier生存率及生存曲线。 o比较:log-rank检验卡方值及其P值。 o因素分析及预测: n变量赋值(数量化方法)表 n变量统计描述: 各组病例数和构成比(分类变量) 均数和标准差(数值变量) n变量筛选方法及检验水准 nCox回归结果及统计解释 Cox回归与多元线性回归、logistic回归的比较 多元线线性回归归logistic回归归Cox回归 数据类类 型 Y数值变值变 量Y分类变类变 量Y二分类变类变 量+时时 间间 X数值变值变 量、分类变类变 量、等级变级变 量 模型结结 构 变变量筛筛 选选 前进进法;后退法;逐步法 参数估 计计 最小二乘法最大似然法最大似然法 参数检检 验验 F-test t-test 似然比检验检验 Wald检验检验 score检验检验 似然比检验检验 Wald检验检验 score检验检验 参数解 释释 回归归系数b优势优势 比ORRR 样样本含 量 至少变变量数的10倍至少变变量数的20倍非截尾例数至少变变 量数的10倍 应应用因素分析 预测预报预测预报 Y 因素分析 预测预测 、判别别P(Y 1) 因素分析 生存预测预测 S(t) 案例分析 某研究者观察了确诊后采取同样方案进行化疗 的26例急性混合型白血病患者,欲了解某种不 良染色体是否会影响患者病情的缓解,将治疗 后120天内症状是否缓解作为结果变量(缓解 0;未缓解1),有无不良染色体作为研究 因素。整理资料见下表。 有无不良染色体与缓解的关系 不良染色体 缓解 未缓解 合计 缓解率() 有 5 13 18 27.8 无 3 5 8 37.5 合 计 8 18 26 30.8 o考虑到例数较小,采用Fisher确切概率法, 得到P0.667,尚不能认为不良染色体影响 病情的缓解。 o这种情况下的结果并不可靠,原因是两个 比较组之间其它影响患者病情缓解的因素 不一定均衡,因而需要考虑平衡其它可能 的影响因素如年龄(岁)、骨髓原幼细胞 分组(501;500)、CD34表 达(阳性1;阴性0)、性别(男1 ;女0)的作用。 多因素logistic回归分析结果 因素 回归系数 Wald卡方 P OR 染色体 1.457 1.161 0.281 4.29 骨髓原幼 2.961 4.778 0.029 19.2 细胞分组 o采用多因素logistic回归分析,经逐步法按 0.10水准,平衡骨髓原幼细胞分组后,有 无不良染色体不影响患者的缓解(P 0.281)。 o有一位临床医生指出,仅考虑是否缓解还 不够,如果进一步利用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论