




已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生存分析 10号 21160311055侯笛 目录 概述 定义 生存分析是研究生存现象和响应时间数据及其统计规律的一门学科 由于最初研究的关键事件是死亡 故称为生存分析 生存分析是统计科学的重要分支 其研究的两个重要变元为 事件 和 寿命 事件 生存分析中定义的事件有死亡 损坏 失败 解雇 病发等等 例如病人的死亡 产品的失效 疾病的发生 职员被解雇 寿命 从记录开始到事件发生的时间 特点 生存分析的优点在于其能够处理删失数据 生存分析的统计资料以生存时间为反应变量 此类资料的生存时间变量大多不服从正态分布 且由于删失值的存在 不适合用传统的分析方法处理 此时就应选用生存分析的方法 研究内容 生存分析研究的内容主要有以下两个方面 一对生存过程的描述二分析生存过程的影响因素并对生存的结局加以预测 应用领域 生存分析虽然源自医学领域 但其在生物学 保险学 可靠性工程学 经济学 教育学 社会学等领域都有广泛的应用 比如 医疗科学中病人的去世保险行业中的赔偿可靠性工程中产品的失效金融领域中银行账户从开立到取消的时间的研究教育行业中学生的中途退学客户关系管理中的客户流失 常用术语 生存数据 生存分析中所分析的数据通常称为分析数据 一般度量的是某个事件发生所经历的时间长度 生存数据可以分为完全数据和删失数据 完全数据 指提供了完整信息的数据 例如 在研究产品的失效时间时 某个样品从进入研究直到失效都在我们的观察中 可以得到该样品的具体失效时间 这就是一个完全数据 删失数据 是指在观测期内 我们并没有看见个体的状态发生改变 无法确定个体具体的生存时间 又分为左删失数据 右删失数据 区间删失数据 删失数据示意图 起始观测时间区间终止 死亡 死亡 死亡 未知 退出 完全数据 A 观测期内死亡右删失数据 B 观测未终止时因故退出C 观测终止时尚未死亡左删失数据 D 死亡时间在某一时刻之前 具体时间未知区间删失数据 E 死亡时间位于某一区间 具体时间未知 生存函数 生存函数 survivalfunction 又称为累积生存率 我们用符号T表示个体的生存时间 从开始记录到事件发生的时间 用t表示观测时间 将生存函数记作S t 是指个体生存时间大于t的概率 S t P T t 显然S t 是非升函数 且S 0 1 S 0 风险函数 风险函数 hazardfunction 又称为瞬时死亡率 记作h t 是指在t时刻存活的个体 在t t时刻死亡的概率 显然 h t 非负 且无上限 分析方法 按照是否使用参数 可以将生存分析中的分析方法分为三类 参数方法 若已经证明某事件的发展可以用某个参数模型很好地拟合 就可以用参数方法做该事件的生存分析 常用的参数模型有指数分布模型 对数分布模型 正态分布模型 威泊分布模型等 非参数方法 当被研究事件不能被参数模型很好地拟合时 可以采用非参数方法研究它的生存特征 常用的非参数方法包括生命表分析和K M分析 半参数方法 它比参数模型灵活 与非参数方法相比更容易对分析结果进行解释 生存分析中使用的半参数模型是Cox比例风险模型 非参数方法 生命表分析K M分析 生命表分析 生命表分析将观测时间分成时间段 按时间段逐个统计事件发生的情况 以此估计生存函数 假设共有k个时间段 t0 t1 t1 t2 tk 1 tk 每个区间中事件发生的次数分别为d1 d2 dk 每个区间中的个体总数分别为n1 n2 nk 所以在第i个区间个体存活的概率为 ni di ni 而个体可以从第一个区间存活到第i个区间的概率 累积生存率 为 i 1 2 k 且S t 为递减函数 K M分析 Kaplan Meier分析 也称为乘积极限分析 是Kaplan和Meier在1958年提出的一种估计生存函数的非参数方法 与生命表分析不同 K M分析以事件发生的时间点将观测区间分段 用来估计生存函数 下举例说明其具体的分析过程 下表记录了5个实验对象的存活时间 其中F代表失效 S代表存活 2和4为右删失数据 用S t 表示实验对象的累积存活概率 分时间段计算如右 t 0 31 此区间5个实验对象均存活 故S t 5 5 1 31 65 个体1在31小时死亡 故本区间S t 1 4 5 0 8 65 150 个体2在65小时退出实验 本区间无个体死亡 S t 0 8 4 4 0 8 150 220 个体3在150小时死亡 S t 0 8 2 3 0 53 220 300 个体4在220小时退出实验 本区间无个体死亡 S t 0 53 2 2 0 53 t 300时 个体5死亡 S 300 0 以SPSS对上例进行K M分析 结果如下 1 输入数据 2 进行K M分析 参数设置 输出结果 K M分析生存函数图 生命表分析与K M分析的比较 生命表分析适用于大样本的情况 特别是没有个体数据的情形 主要优点是对生存时间的分布没有要求 K M分析中时间区间的划分是以事件的发生为依据的 因此必须知道每个个体的生存时间数据 适用于小样本的情况 半参数方法 生存分析中我们常常遇到个体的生存状况受到多种因素影响的情况 这些对生存时间有影响的变量称为协变量 在分析生存数据时要将协变量的影响考虑进去 Cox半参数模型就很好地解决了这个问题 它假定风险函数由两部分构成 基准风险函数和协变量线性组合的指数 Cox半参数模型又分为独立协变量比例风险模型和时间相依性协变量比例风险模型两种 二者的区别在于协变量的取值是否和时间有关 Cox独立协变量比例风险模型 该模型可写成如下形式 式中 Z1 Z2 Zm为协变量 这里的协变量与时间无关 1 2 m为对应协变量的未知参数 h0 t 是基准风险函数 实际应用中常比较两个不同个体风险函数的比率 即危险率 可以证明危险率为常数 因此该模型又称为比例风险模型 当协变量与时间有关时 危险率将不再是常数 此时称为时间相依性比例风险模型 案例分析 两组小白鼠用来检验癌症的治疗状况 一组使用传统治疗方法 另一组使用试验方法 试验人员记录了小白鼠的存活时间及状态 Days为存活时间或观测时间 Status表示生存状态 取值1表示死亡 0表示存活 Group表示治疗方法 取0表示传统疗法 取1表示试验疗法 共有64组数据 原始数据如下 首先用生命表分析方法对数据进行处理 1 输入数据 2 选择生命表分析 3 设置参数 4 输出结果 可以看出 大约在200天时两种治疗方法的生存函数相交 在200天以前传统治疗方法的存活率较高 而在200天以后试验方法的治疗效果明显优于传统治疗方法 中位数生存时间是生存率为50 时 生存时间的平均水平 从中位数生存时间来看 传统治疗方法的中位数为241天 试验方法的中位数为266天 明显高于传统治疗方法 可以判断试验方法的疗效相比传统治疗方法有所提高 用K M方法对数据进行处理 结果如下 生存函数分布和生命表分析的结果相似 K M方法可以记录删失数据 且由于分段较多整体呈现密集的锯齿 而生命表分析的分布则较为平缓 在结果检验上 不同检验方法结果有所差异 其中LogRank检验的p值小于0 05 表明两种治疗方法有显著性差异 除了治疗方法对小白鼠的生存状况有影响 其他因素如性别 年龄 体重等都可能对其生存时间造成影响 加入这些数据后 用Cox独立协变量比例风险模型重新分析 1 输入数据 2 设置参数 3 输出结果 分类变量是指不连续的变量 此例中治疗方法的值只取0和1 性别只取F和M 不同于体重 年龄这些连续变量 分类变量在计算风险比例时以参考类别作为参照 如在本案例中治疗方法这一因子以试验方法作为参照 计算结果为传统方法的风险率相对于参考的倍数 上表为模型系数的综合检验结果 可以看到p 0 小于0 05 说明这些因素中有些变量对白鼠的生存时间有显著影响 此表给出了各个变量的单个模型系数检验结果 可以看到体重变量的p 0 说明体重对风险函数有极显著影响 体重每增加1 盎司
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 交通运输行业安全生产检查标准
- 八年级英语期中考试真题
- 初中英语单词记忆法及课堂应用
- 初中期中考试表彰大会发言稿模板
- 装配式建筑施工质量管理措施
- 机械制造业成本核算实务案例
- 初三学生中考复习计划模板
- 市场竞争策略与案例分享
- 2025茶叶店门面转让合同
- 2025网约车服务承包合同范本
- 承包商全流程安全培训
- 养生店国庆节活动方案
- 古代文学史杜牧课件
- 7.1促进民族团结 课件 2025-2026学年统编版道德与法治九年级上册
- 西宁市供热管理暂行办法
- 静脉血栓护理课件
- 造口患者叙事护理
- 2020ESPEN专家建议:围手术期营养管理
- 《教育心理学》课程教学大纲
- 学校健康食堂学生营养餐带量食谱
- 中西医结合导论第一章中西医结合导论
评论
0/150
提交评论