版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
优选生存分析概述及实例分析现在是1页\一共有36页\编辑于星期日目录1概述2常用术语3分析方法4案例分析现在是2页\一共有36页\编辑于星期日概述现在是3页\一共有36页\编辑于星期日定义生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。由于最初研究的关键事件是死亡,故称为生存分析。生存分析是统计科学的重要分支,其研究的两个重要变元为“事件”和“寿命”。事件:生存分析中定义的事件有死亡、损坏、失败、解雇、病发等等。例如病人的死亡,产品的失效,疾病的发生,职员被解雇。寿命:从记录开始到事件发生的时间。现在是4页\一共有36页\编辑于星期日特点生存分析的优点在于其能够处理删失数据。生存分析的统计资料以生存时间为反应变量,此类资料的生存时间变量大多不服从正态分布,且由于删失值的存在,不适合用传统的分析方法处理。此时就应选用生存分析的方法。现在是5页\一共有36页\编辑于星期日研究内容生存分析研究的内容主要有以下两个方面:
一对生存过程的描述
二分析生存过程的影响因素并对生存的结局加以预测现在是6页\一共有36页\编辑于星期日应用领域生存分析虽然源自医学领域,但其在生物学,保险学,可靠性工程学,经济学,教育学,社会学等领域都有广泛的应用。比如:医疗科学中病人的去世保险行业中的赔偿可靠性工程中产品的失效金融领域中银行账户从开立到取消的时间的研究教育行业中学生的中途退学客户关系管理中的客户流失现在是7页\一共有36页\编辑于星期日常用术语现在是8页\一共有36页\编辑于星期日生存数据生存分析中所分析的数据通常称为分析数据,一般度量的是某个事件发生所经历的时间长度。生存数据可以分为完全数据和删失数据。完全数据:指提供了完整信息的数据。例如,在研究产品的失效时间时,某个样品从进入研究直到失效都在我们的观察中,可以得到该样品的具体失效时间,这就是一个完全数据。删失数据:是指在观测期内,我们并没有看见个体的状态发生改变,无法确定个体具体的生存时间。又分为左删失数据,右删失数据,区间删失数据。现在是9页\一共有36页\编辑于星期日ABCDE删失数据示意图起始观测时间区间终止死亡死亡死亡未知退出完全数据:A,观测期内死亡右删失数据:B,观测未终止时因故退出C,观测终止时尚未死亡左删失数据:D,死亡时间在某一时刻之前,具体时间未知区间删失数据:E,死亡时间位于某一区间,具体时间未知现在是10页\一共有36页\编辑于星期日生存函数生存函数(survivalfunction),又称为累积生存率,我们用符号T表示个体的生存时间(从开始记录到事件发生的时间),用t表示观测时间,将生存函数记作
S(t),是指个体生存时间大于t的概率。S(t)=P(T>t),显然S(t)是非升函数,且S(0)=1,S(∞)=0,现在是11页\一共有36页\编辑于星期日风险函数风险函数(hazardfunction),又称为瞬时死亡率,记作h(t)。是指在t时刻存活的个体,在t+∆t时刻死亡的概率。显然,h(t)非负,且无上限。现在是12页\一共有36页\编辑于星期日分析方法现在是13页\一共有36页\编辑于星期日按照是否使用参数,可以将生存分析中的分析方法分为三类:参数方法:若已经证明某事件的发展可以用某个参数模型很好地拟合,就可以用参数方法做该事件的生存分析。常用的参数模型有指数分布模型、对数分布模型、正态分布模型,威泊分布模型等。非参数方法:当被研究事件不能被参数模型很好地拟合时,可以采用非参数方法研究它的生存特征。常用的非参数方法包括生命表分析和K-M分析。半参数方法:它比参数模型灵活,与非参数方法相比更容易对分析结果进行解释。生存分析中使用的半参数模型是Cox比例风险模型。现在是14页\一共有36页\编辑于星期日非参数方法生命表分析K-M分析现在是15页\一共有36页\编辑于星期日生命表分析生命表分析将观测时间分成时间段,按时间段逐个统计事件发生的情况,以此估计生存函数。假设共有k个时间段[t0,t1),[t1,t2),…,[tk-1,tk),每个区间中事件发生的次数分别为d1
,d2,…,dk,每个区间中的个体总数分别为n1,n2,…,nk,所以在第i个区间个体存活的概率为(ni-di
)/ni
,而个体可以从第一个区间存活到第i个区间的概率(累积生存率)为:
i=1,2,…,k,且S(t)为递减函数。现在是16页\一共有36页\编辑于星期日K-M分析Kaplan-Meier分析,也称为乘积极限分析,是Kaplan和Meier在1958年提出的一种估计生存函数的非参数方法。与生命表分析不同,K-M分析以事件发生的时间点将观测区间分段,用来估计生存函数。下举例说明其具体的分析过程。现在是17页\一共有36页\编辑于星期日个体编号生存状态存活时间/小时1F312S653F1504S2205F300下表记录了5个实验对象的存活时间,其中F代表失效,S代表存活,2和4为右删失数据。用S(t)表示实验对象的累积存活概率,分时间段计算如右:t[0,31):此区间5个实验对象均存活,故S(t)=5/5=1.[31,65):个体1在31小时死亡,故本区间S(t)=1×4/5=0.8[65,150):个体2在65小时退出实验,本区间无个体死亡,S(t)=0.8×4/4=0.8.[150,220):个体3在150小时死亡,S(t)=0.8×2/3=0.53.[220,300):个体4在220小时退出实验,本区间无个体死亡,S(t)=0.53×2/2=0.53.t=300时,个体5死亡,S(300)=0现在是18页\一共有36页\编辑于星期日以SPSS对上例进行K-M分析,结果如下:1.输入数据2.进行K-M分析现在是19页\一共有36页\编辑于星期日参数设置现在是20页\一共有36页\编辑于星期日输出结果K-M分析生存函数图现在是21页\一共有36页\编辑于星期日生命表分析与K-M分析的比较生命表分析适用于大样本的情况,特别是没有个体数据的情形,主要优点是对生存时间的分布没有要求。K-M分析中时间区间的划分是以事件的发生为依据的,因此必须知道每个个体的生存时间数据,适用于小样本的情况。现在是22页\一共有36页\编辑于星期日半参数方法生存分析中我们常常遇到个体的生存状况受到多种因素影响的情况。这些对生存时间有影响的变量称为协变量。在分析生存数据时要将协变量的影响考虑进去。Cox半参数模型就很好地解决了这个问题。它假定风险函数由两部分构成:基准风险函数和协变量线性组合的指数。Cox半参数模型又分为独立协变量比例风险模型和时间相依性协变量比例风险模型两种。二者的区别在于协变量的取值是否和时间有关。现在是23页\一共有36页\编辑于星期日Cox独立协变量比例风险模型该模型可写成如下形式:式中,Z1,Z2,…Zm为协变量,这里的协变量与时间无关,β1,β2,…βm为对应协变量的未知参数。h0(t)是基准风险函数。实际应用中常比较两个不同个体风险函数的比率,即危险率。可以证明危险率为常数,因此该模型又称为比例风险模型。当协变量与时间有关时,危险率将不再是常数,此时称为时间相依性比例风险模型。现在是24页\一共有36页\编辑于星期日案例分析现在是25页\一共有36页\编辑于星期日
两组小白鼠用来检验癌症的治疗状况。一组使用传统治疗方法,另一组使用试验方法,试验人员记录了小白鼠的存活时间及状态:Days为存活时间或观测时间;Status表示生存状态,取值1表示死亡,0表示存活;Group表示治疗方法,取0表示传统疗法,取1表示试验疗法,共有64组数据。现在是26页\一共有36页\编辑于星期日原始数据如下:现在是27页\一共有36页\编辑于星期日首先用生命表分析方法对数据进行处理:1.输入数据2.选择生命表分析现在是28页\一共有36页\编辑于星期日3.设置参数现在是29页\一共有36页\编辑于星期日4.输出结果可以看出,大约在200天时两种治疗方法的生存函数相交,在200天以前传统治疗方法的存活率较高,而在200天以后试验方法的治疗效果明显优于传统治疗方法。中位数生存时间是生存率为50%时,生存时间的平均水平。从中位数生存时间来看,传统治疗方法的中位数为241天,试验方法的中位数为266天,明显高于传统治疗方法。可以判断试验方法的疗效相比传统治疗方法有所提高。现在是30页\一共有36页\编辑于星期日用K-M方法对数据进行处理,结果如下:生存函数分布和生命表分析的结果相似。K-M方法可以记录删失数据,且由于分段较多整体呈现密集的锯齿,而生命表分析的分布则较为平缓。在结果检验上,不同检验方法结果有所差异,其中LogRank检验的p值小于0.05,表明两种治疗方法有显著性差异。现在是31页\一共有36页\编辑于星期日除了治疗方法对小白鼠的生存状况有影响,其他因素如性别,年龄,体重等都可能对其生存时间造成影响。加入这些数据后,用Cox独立协变量比例风险模型重新分析。1.输入数据2.设置参数现在是32页\一共有36页\编辑于星期日3.输出结果
分类变量是指不连续的变量,此例中治疗方法的值只取0和1,性别只取F和M。不同于体重、年龄这些连续变量,分类变量在计算风险比例时以参考类别作为参照。如在本案例中治疗方法这一因子以试验方法作为参照。计算结果为传统方法的风险率相对于参考的倍数。现在是33页\一共有36页\编辑于星期日现在是34页\一共有36页\编辑于星期日上表为模型系数的综合检验结果。可以看到p=0,小于0.05,说明这些因素中有些变量对白鼠的生存时间有显著影响。现在是35页\一共有36页\编辑于星期日此表给出了各个变量的单个模型系数检验结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030牙科急救箱行业发展趋势分析与未来投资战略咨询研究报告
- 2025合同范本合作伙伴协议书样本
- 护理学导论护师考试题库及答案解析
- 19年江苏建筑安全A考试题库及答案解析
- 2025-2030绿色建筑节能门窗技术革新与市场竞争力分析报告
- 2025-2030绿色建筑技术应用与可持续发展实践分析
- 2025-2030绿色建材认证体系与建筑行业低碳转型路径研究报告
- 2025-2030绿色低碳科技园规划设计与可持续发展评估报告
- 2025-2030绘本分级阅读体系构建与教学实践验证
- 2025-2030纳米高岭土在橡胶复合材料中的性能优化研究
- 2023年4月全国自学考试04729大学语文试题
- 脉管系统理论知识考核试题及答案
- 第1单元-输电线路阶段式继电保护
- SIM卡基础技术规范
- 护理查房胎盘早剥
- GB/T 2504-1989船用铸钢法兰(四进位)
- 《轴承的失效分析》教学课件
- 新形态一体化教材建设的探索与实践课件
- 2022年石家庄交通投资发展集团有限责任公司招聘笔试试题及答案解析
- 机械结构设计(行业专业)课件
- 《园林花卉学》课后题及答案
评论
0/150
提交评论