




已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生存分析,(10号) 21160311055侯笛,目录,概要,定义,生存分析是研究生存现象和响应时间数据及其统计规律的学科。 首次研究的重要事件为死亡,故称为生存分析。 生存分析是统计科学的重要分支,其研究的两个重要因素是“事件”和“寿命”。 案件:生存分析定义的案件有死亡、破损、失败、解雇、发病等。 例如患者死亡、产品故障、生病、解雇职员等。 寿命:从记录开始到事件发生的时间。特征、生存分析的优点是能够处理丢失的数据。 生存分析的统计资料以生存时间为反应变量,这类资料的生存时间变量往往不符合正态分布,而且值丢失,传统的分析方法无法应对。 此时应该选择生存分析的方法。研究内容、生存分析研究内容主要有两个方面:分析一对生存过程描述2生存过程的影响因素,预测生存结局,应用领域、生存分析来源于医学领域,但广泛应用于生物学、保险学、可靠性工程、经济学、教育学、社会学等领域。 例如,医疗科学中患者死亡保险业的赔偿可靠性工程中产品失效金融领域的银行账户从开设到取消的时间研究教育业中学生中途退学顾客关系管理中的顾客流失、常用术语、生存数据、生存分析的数据通常称为分析数据,一般测量的是某事件发生的时间长度生存数据可以分为完整的数据和丢失的数据。 完整资料:提供完整资讯的资料。 例如,在研究产品的故障时间时,一个样本进入研究到故障在我们的观察中,可以得到该样本的具体故障时间,这是完整的数据。 删除数据:观测期间,个体状态未见变化,个体具体生存时间无法确定。 并且,分为左删除数据、右删除数据、区间删除数据。删除数据图像、最初的观测时间区间结束、死亡、死亡、未知、退出、完全数据: a、观测期间中死亡的右删除数据: b、观测结束时为c、观测结束时未死亡的左删除数据: d、到有死亡时间为止具体时间未知的区间删除数据: e, 在具有死亡时间的某个区间内,具体的时间未知,也称为生存函数生存函数(survivalfunction )是指以符号t表示个体的生存时间(从记录开始到事件发生为止的时间),以t表示观测时间,以S(t )表示生存函数,则个体的生存时间大于t的概率。 S(t)=P(Tt ),显然S(t )是非上升函数,且也称为S(0)=1,S()=0,风险函数,风险函数(hazardfunction ),瞬时死亡率,记为h(t )。 是指t时活着的个体在t时死亡的概率。 很明显,h(t )不是负的,没有上限。 根据是否使用、分析方法、参数,生存分析中的分析方法可以分为三类:参数方法:如果证明某个事件的发展能够在某个参数模型中顺利拟合,则可以用参数方法对该事件进行生存分析。 常用的参数模型有指数分布模型、对数分布模型、正态分布模型、威泊分布模型等。 非参数方法:当所研究的事件不能很好地适应参数模型时,可以用非参数方法研究其生存特性。 一般参数以外的方法有生命表分析和K-M分析。 半参数方法:比参数模型灵活,比非参数方法更容易解释分析结果。 用于生存分析的半参数模型是Cox比例风险模型。 非参数方法、生命表分析K-M分析、生命表分析和生命表分析通过将观测时间划分为时间段,按时间段统计事件发生情况来估计生存函数。假设k个时间段t0,t1、t1,t2、tk-1、tk,在各区间内发生事件的次数分别为d1、d2、dk,各区间内的个体总数分别为n-1、n-2、nk,则在第I个区间内个体存在的概率为(ni-di)/ni,个体是最初的区间吗.K-M分析、Kaplan-Meier分析也称为积极性分析,是Kaplan和Meier推测1958年提出的生存函数的非参数法。 与生命表分析不同,K-M分析在事件发生时划分观测区间,推断生存函数。 下面,举例说明其具体的分析过程。下表记录了5个被实验者的生存时间,f是失效,s是生存,2和4是右边的删除数据。 另外,在S(t )中表示被试验者的累积生存概率,因为按时间段存在右:t,t,0,31 ) :这样的区间的5名被试验者,所以s (t )=5/5=1. 31,65 :个体1在31小时内死亡,因此本区间s(t)=14/5=0.865,个体2在65小时内退出实验,本区间个体未死亡的s (t )=0. 84/4=0.8. 150,220 :个体3在150小时内死亡,s(t)=0.82/3=0.53.220, 300:个体4在220小时内退出实验,在本区间内没有个体死亡,在S(t)=0.532/2=0.53.t=300的情况下,个体5死亡,在S(300)=0. SPSS下对上例进行K-M分析的结果为:1.输入数据、2.K-M分析、参数设定、输出结果、K-M分析生存函数图, 生命表分析与k-m分析的比较,生命表分析应用于大样本,特别是在没有个体数据的情况下,主要优点是对生存时间的分布没有要求。 K-M分析中的时间区间划分是以事件的发生为基础的,因此需要知道每个个体的生存时间数据,适用于小样本的情况。在半参数法、生存分析中常常遇到个体生存状况受各种因素影响的情况。 影响这些生存时间的变量称为协调变量。 在分析生存数据时,必须考虑协调变量的影响。 Cox半参数模型很好地解决了这个问题。 假定风险函数由基准风险函数和协变量的线性组合的指数这两部分构成。 Cox半参数模型分为独立共变比例风险模型和时间依赖共变比例风险模型。 两者的区别在于协变量的值是否与时间有关。 公式中,Z1、Z2、zm是协变量,其中协变量与时间无关,1、2、m可写为对应于协变量的未知参数。 h0(t )是基准风险函数。 在实际应用中总是比较两个不同的个体风险函数的比率,即危险率。 由于可以证明危险率是常数,该模型也称为比例风险模型。 协变量与时间相关时,危险率不是常数,称为时间依赖性比例风险模型。 个案研究,检查两组小鼠癌症的治疗情况。 一组采用传统治疗方法,另一组采用试验方法,试验者记录大鼠的生存时间和状态: Days表示生存时间或观测时间Status表示生存状态,值1表示死亡,0表示生存的Group表示治疗方法,0表示传统疗法,1表示试验疗法,共计64组数据。原始数据如下:首先用生命表分析方法处理数据:1 .输入数据,2 .选择生命表分析,3 .设置参数,4 .输出结果,约200天内两种治疗方法的生存函数交叉,到200天前传统治疗方法的生存率较高,200天后实现中值生存时间是生存率为50%时生存时间的平均水平。 从中位生存时间来看,传统治疗方法中值为241天,试验方法中值为266天,明显高于传统治疗方法。 可以判断试验方法的疗效比传统治疗方法有所提高。 用K-M法处理数据,生存函数分布与生命表分析结果相似。K-M法可记录缺失数据,段多呈整体密集锯齿,生命表分析分布缓慢。 结果检查显示,不同检查方法的结果不同,其中LogRank检查的p值小于0.05,两种治疗方法存在显着差异。治疗方法除影响小鼠生存状况外,性别、年龄、体重等因素可能影响小鼠生存时间。 加入这些数据后,采用Cox独立协调变量比例风险模型进行了再分析。 1 .输入数据,2 .设定参数,3 .输出结果,分类变量指的是不连续的变量,在本例中疗法的值只取0和1,性别只取f和m。 与体重和年龄等连续变量不同,分类变量在计算风险比例时参考类别。 本病例中治疗方法这一因素参考了试验方法。 计算结果表明,传统方法的风险率为参考的倍数。上表为模型系数的综合检验结果。 p=0,小于0.05,表明这些因素中对大鼠的生存时间有显着影响。这表示各变量的各个模型系数的检查结果,体重变量的p=0,显示体重对风险函数有显着的影响
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《祝福》课件四课时
- 我能打败怪兽绘本解读
- 广东省湛江市麻章区2023-2024学年高一上学期第一次月考数学考点及答案
- 公司新厂房布局规划课件
- 早期胃癌名词解释护理
- 2025绿洲集团商品房代理销售合同
- 2025年电子设备全国分销代理合同范本
- 骨科个案护理比赛案例汇报大纲
- 2025工程担保的合同范本
- 2025车辆租赁合同范本
- 肾小管酸中毒的药物治疗原则及用药时机
- 2025年《幼儿园区角活动》标准课件
- 2025年公路路面修复劳务承包合同
- SJG 55-2019 建筑起重机械防台风安全技术规程
- 业务连续性管理体系程序文件
- 新能源充电桩合作协议书(2篇)
- 论文发表怎么隐藏作者信息
- 2025年云南德宏州州级事业单位选调工作人员历年高频重点提升(共500题)附带答案详解
- 书法教育与心理健康结合的方案
- 赣州市第一届职业技能大赛-分赛场-32-中药炮制-技术文件
- 智慧养老智能化方案
评论
0/150
提交评论