




已阅读5页,还剩75页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生存分析 Survival Analysis,第四军医大学西京医院神经内科 刘学东,第一节 概述 第二节 生存时间资料的特点 第三节 小样本生存率的Kaplan-Meier估计 第四节 大样本生存率的寿命表法估计 第五节 生存曲线比较的假设检验 第六节 Cox比例风险回归模型 第七节 实例分析,第一节 概述,一 基本概念 生存分析:是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。 二 特点 含有截尾数据 生存时间一般不呈正态分布,三 历史 最早可上溯至十九世纪的死亡寿命表 现代的生存分析则开始于二十世纪三十年代工业科学中的相关应用 二次世界大战:武器装备的可靠性研究,这一研究兴趣延续到战后。此时生存分析都集中在参数模型。,二十世纪六七十年代:医学研究中大量临床试验的出 现,要求方法学有新的突破,生存分析研究开始转向非参数方法。 D.R. Cox在72年提出的比例风险模型为此做出了划时代的贡献。 现在,生存分析方法的在医学领域得到了广泛的应 用,而通过医学研究要求的不断提高。,四 主要研究内容 描述生存过程 比较生存时间 分析影响生存时间的因素,五 基本方法 1 非参数法:不考虑资料的分布形式,只根据样本提供的 顺序统计量对生存率进行估计,常用有K-M 法、Life table法 2 参数法: 假定生存时间服从特定的参数分布,根据已 知分布特点对影响生存时间的因素进行分析, 常用有:指数分布法、对数正态回归分析法 3 半参数法:兼有参数法和非参数法的特点,分析影响生 存时间和生存率的因素,常用有Cox比例风险 回归模型,第二节 生存时间资料的 特点及描述,一、起始事件与失效事件 起始事件:研究对象生存过程的起始特征事件 失效事件(终点事件、死亡事件):研究者关心的特定结局 相对而言的,都由研究目的决定,失效事件并非一定死 亡,死亡也并非一定发生了失效事件。 分析的基石,二、生存时间( survival time) 任何两个有联系事件之间的时间间隔,用t表示 狭义:发病至死亡的时间跨度 广义:起始事件到终点事件的时间间隔 起始事件 终点事件 服药 痊愈 手术切除 死亡 出院 复发,三、 完全数据与删失数据 完全数据:可获得准确的生存时间,所提供信息完全 删失数据(截尾值):随访中未能观察到病人的 终点事件,右上角加“+” 原因:失访 死于其它疾病 观察结束时病人尚存活,四、数据结构 生存信息 起始时间 终点时间 结局及原因 失访 存活 死亡,预后信息 一般信息 个人史及既往史 临床资料 检验结果 组织病理 分子生物学 影像学,与 亚饭店,五、资料特点 1 含截尾数据 2 分布类型复杂 六、资料的基本要求 1. 终点事件例数不宜太少 2. 截尾原因无偏性 3. 生存时间尽可能记录精确,七、统计描述指标 1. 死亡率、死亡概率、生存概率 2. 生存率及其标准误 3. 生存曲线 4. 中位生存时间及四分位数间距,1 . 死亡率、死亡概率、生存概率 (1) 死亡率 (mortality rate,death rate) 表示某单位时间内的死亡强度。 年平均人口数=(年初人口数+年末人口数)2,(2) 死亡概率 ( mortality probability ) 指死于某时段内的可能性大小。 d/n0 年内有删失,分母用校正人口数: 校正人口数= 年初人口数删失例数 / 2 n0c/2,(3) 生存概率 ( survival probability ) 指某单位时段开始时存活的个体到该时段结束时仍存活的可能性的大小。 (n0-d)/n0 分子为年末尚存人数, 若年内有删失,分母用校正人口数。,60例肺癌病人,术后每年死亡10例,无删失。N=60,术后 年内 年内 年初 年 死亡 死亡 生存 (t+1)年 年 死亡 截尾 观察 平均 率 概率 概率 生存率 数 例数 例数 例数 例数 p=1-q t d c n0 n=no-d/2 m=d/n q=d/n0 (n0-d)/n0 (n0-d)/N (1) (2) (3) (4) (5) (6) (7) (8) (9) 0 10 0 60 55 . 185 . 167 . 833 . 833 1 10 0 50 45 . 222 . 200 . 800 . 667 2 10 0 40 35 . 286 . 250 . 750 . 500 3 10 0 30 25 . 400 . 333 . 667 . 333 4 10 0 20 15 . 667 . 500 . 500 . 167 注意:死亡率与死亡概率的分子相同,但分母不同; 生存概率与生存率的分子相同,但分母不同,2. 生存率 生存率 (survival rate) ( 累积生存概率 cumulative probability of survival ) 指病人经历t个单位时间后仍存活的概率。 生存概率指单个时段的概率, 生存率指从0t多个时段的积累概率。 反映了病人的疾病严重程度、进展快慢或凶险程度等。,公式1 用于完全数据 公式2 用于删失数据以及完全数据 S ( t ) = P (T tk ) = p1 p2 pk,3 生存曲线(survival curve) 以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。 描述生存过程 比较生存过程 中位生存期,(月),4 中位生存时间(median survival time) 即生存时间中位数,表示50%的个体可存活的时间 (集中趋势) 计算:图解法 线性内插法 :找出两个生存率S(ti-1)和S(ti), 使 S(ti-1) 0.5, S(ti) 0.5。,例: t=8, P(X8)=0.565, t=10, P(X10)=0.478 (8-10):(8-t)=(0.565-0.478):(0.565-0.5), t=9.494(月) 生存率的计算方法,第三节 小样本生存率的 Kaplan-Meier估计,Kaplan-Meier法(K-M法、乘积极限法) Kaplan-Meier法由Kaplan和Meier于1958年提 出,直接用概率乘法定理估计生存率,故称乘 积极限法(product-limit method),是一种 非参数法,适用于小样本和大样本。,基本思想:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。 本法只估计死亡时点的生存率,(a)研究终止在475天 (b) 研究终止在474天 图12-3 乘积极限法生存曲线(阶梯形)及其半数生存期(Md=158天),第四节 大样本生存率的 寿命表法估计,寿命表法 (Life Tables) 基本原理:是先求出病人在治疗后活过n年后再活过下一年的可能性,统计学上称为生存概率,根据概率论的乘法定律将逐年生存概率相乘即可得出一定年限的生存率。 适用于大样本资料,K-M法和Life table法比较,第五节 生存曲线比较的 假设检验,log-rank检验(对数秩检验、时序检验) 基本原理:对每组生存数据根据其在各个时刻中尚存活的对象数计算期望死亡数,然后将期望死亡总数与实际死亡数进行比较 将生存曲线作为整体对曲线与曲线间的差异进行比较,偏重于远期疗效评价,属非参数检验,比较两组或多组生存曲线,实为一单因素分析 要求各组生存曲线不能交叉,如交叉提示存在混杂因 素,应采用分层分析方法或多因素方法来校正 当假设检验有统计意义时,可从以下几方面来评价各 组效应大小:生存曲线图目测判断、中位生存期比较,第六节 Cox比例风险 回归模型,一 概述 简称Cox回归模型,是一种允许资料有“删失(或截 尾)”数据存在的,可以同时分析众多因素对生存 时间影响的多变量生存分析方法,是一种半参数方法。,该模型由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。 优点: 多因素分析方法 不考虑生存时间分布 利用截尾数据,二 基本形式 h(t,X)t时刻风险函数、风险率或瞬时死亡率 h0(t)基准风险函数,即所有协变量都取0时t时刻风险函数。 X1、X2、Xp协变量、影响因素、预后因素。 1、 2、 p回归系数。,p : 在其它协变量不变的情况下,协变量Xp每改变一个测 定单位所引起相当危险度的自然对数的改变量 RR: 相当危险度,两个分别具有协变量Xi与Xj的病人其风 险函数(危险度)之比 RR=expj(xi-xj),如协变量treat的 = -1.617,RRtreat=0.199,表示treat变量水平2与1比较,treat=2的危险度是treat=1的0.199倍,提示治疗方案2优于治疗方案1。而age的 =0.119,RRage=1.127,表明年龄每增加一岁,死亡的可能性增加1.127倍。,0,RR1,说明变量X增加时,危险率增加,即X是危险因素。 0,RR1,说明变量X增加时,危险率下降,即X是保护因素。 =0,RR=1,说明变量X增加时,危险率不变,即X是危险无关因素。,三 参数估计与假设检验 参数估计 最大似然法 假设检验(模型中变量的剔除和引入) 似然比检验 得分检验 Wald检验,四 因素筛选与最优模型的建立 因素初步筛选 2 检验 、log-rank检验等 单变量Cox模型分析(P=0.10) 直接进行逐步Cox模型分析,最佳模型建立 1、Enter 2、Forward: Conditional 3、Forward: LR 4、Forward: Wald 5、Backward: Conditional 6、Backward: LR 7、Backward: Wald,五 检验水准 检验水准包括引入的检验水准和剔除的检验水准。一般地,剔除引入 初步的、探索性的研究,或变量数较少时,可取0.10或0.15。 设计严谨的、证实性的研究,或变量数较多时,可取0.05。,六 统计描述 1 回归系数和标准回归系数 标准回归系数:观察值经过标准化变换后所求得。 相对值,比较自变量对模型贡献,反映因素对生存时间 影响强度 2 相对危险度及可信区间 无序分类变量,转换亚变量分析,3 个体预后指数(PI) PI= 预后指数越小,预后越好; 预后指数越大,预后越差。 据PI的大小可将病人分为不同的危险组,绘制分组 的生存曲线,直观比较各危险组的生存情况。,例如: 传统治疗方式,淋巴结转移,PI2.6929 传统治疗方式,淋巴结无转移,PI1.7616 新治疗方式,淋巴结转移,PI0.9313 新治疗方式,淋巴结无转移,PI0,七 分析结果(结果解释) 与生存相关的因素 因素作用大小及方向:保护因素还是危险因素、相对危险度的大小。 因素作用大小排序:标准化回归系数的绝对值。,八 结果报告 1 起始时间与终止时间 2 结局事件 3 删失数据的种类与原因 4 生存率估计值、置信区间及其统计学方法,5 生存率比较的统计学方法 (如log rank法)及其p 值 6 给出Cox回归模型,呈现解释变量与风险之间的联系 风险比(hazard ratio)及其置信区间,九 应用范围 因素分析 具有logistic回归模型的所有优点 同时考虑生存结局和生存时间,可处理截尾数据 不考虑基准风险的分布,生存预测 强调设计的重要性 专业知识角度:选择疾病种类、终点事件、影响因素及结果的专业解释等。 统计学角度:样本例数、因素的赋值、生存时间准确 、因素筛选方法、结果的统计学解释等。,十 注意事项 应用条件 除生存资料的基本要求外,还要求因素对生存时间的 作用不随时间变化(比例风险假定)。 设计阶段 资料的代表性和可靠性 将尽可能的因素都包括在调查分析中,筛选变量 容易收集 费用 明确规定生存时间 样本量为观察协变量的520倍 模型拟合 多元共线性:自变量间不独立,相互间有一定线性依 存关系, 选入模型的变量是统计学上的有关变量,不一定都与生存时间有因果关系。其中某些变量可能只是伴随关系而已,未选入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代替了它的作用,或因例数不够,或试验中对该变量进行了控制而引起。, 模型拟合优度考察:据预后指数PI分组,比较各组 基于Cox模型的生存曲线与基于kaplan-Meier法估计的生存曲线,如两组曲线吻合较好,表明Cox模型拟合较好。 生存率分析:生存曲线不能随意延长,也不能轻易用于预测预报,经过大量研究所得的生存曲线才有可能推广应用。,十一 常见问题 1 生存时间的计算和选择 2 生存率计算方法使用不当 3 忽略结局,采用t检验、线性回归分析生存时间 4 忽略生存时间,采用Logistic回归分析死亡率,5 采用平均生存时间表示生存时间的平均水平 6 采用常规t检验或方差分析进行组间生存时间比较 7 丢弃截尾数据,只考虑确切数据 8 将截尾数据当作确切数据处理,例 某研究者追踪100名癌症患者,经治疗后的生存情况, 随访第1年有30人死亡,随访第2年时,有20人死亡, 有40人无法联系失访。 方法一:去掉截尾数据 方法二:不去掉截尾数据 总例数N=60 N=100 生存数 生存率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 冷藏货车租赁及冷链物流服务协议书
- 茶园资源整合与品牌推广承包合同
- 跨区域交通枢纽车辆收费员派遣服务协议
- 餐饮企业合伙人合作协议书及知识产权保护条款
- 河南省南阳市六校2024-2025学年高一下学期第二次联考历史试题(含答案)
- 专业彩钢棚安装与售后保障服务合同
- 互联网采购合同签订与电商交易安全保障
- 高铁站餐饮区承包管理合同
- 金融资产配置与投资财务顾问合同
- 欧洲足球俱乐部球员劳务引进及管理合同
- 儿童抽动障碍共患焦虑抑郁障碍诊治2025
- 2024年山东省初中学业水平考试语文试题(文字版-含答案)
- 2024-2025教科版一年级下册科学期末考试卷附参考答案 (三套)
- 高血压药的类型
- 家规家训课件
- 《深圳音乐厅解析》课件
- 2025届河南省鹤壁市淇县第一中学高三下学期联合考试英语试题含解析
- 2025年中考语文作文押题预测课件
- 建办质202463号危险性较大的分部分项工程专项施工方案严重缺陷清单宣贯(雄安)
- 设备电气接线规范
- 胃管非计划拔管的原因分析及预防措施课件
评论
0/150
提交评论