




已阅读5页,还剩87页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2,主要内容,第一节 生存资料的特点及基本概念,第二节 生存曲线的估计,第三节 生存曲线的比较,第四节 生存资料影响因素分析,3,第一节 生存资料的特点及基本概念,第二节 生存曲线的估计,第三节 生存曲线的比较,第四节 生存资料影响因素分析,主要内容,表18.1 甲、乙两组方案治疗肺癌病人的临床随访结果,4,开始观察时间:1992.01.01 终止随访时间:2001.12.31,5,一、生存资料的特点,两个效应变量 结局变量 (生存或死亡、阳性或阴性等) 生存时间 (年、月、日、小时等)存在不完全数据(截尾数据)生存时间的分布一般呈非正态分布,6,两个效应变量错误1:忽略结局,采用多元线性回归分析生存时间与各Xi 的关系。错误2:忽略生存时间,采用logistic回归分析死亡与否与各Xi 的关系。,对生存资料的错误处理,7,不完全数据错误1:丢弃不完全数据,只考虑完全数据,损失了部分信息。错误2:将不完全数据当作完全数据处理,低估了生存时间的平均水平。,对生存资料的错误处理,8,非正态分布数据错误1:采用平均生存时间而非中位生存时间表示生存时间的平均水平。 错误2:采用常规 t 检验或方差分析进行 各组间生存时间的比较。,对生存资料的错误处理,9,生存分析是将事件的结果和出现这一结果所经历的时间结合起来分析的一种统计分析方法,又称事件时间分析(time-to-event analysis)。既可以分析完全数据的资料,也可以分析包含不完全数据的资料。,生存分析的作用,10,二、生存分析基本概念,1. 起始事件 与失效事件起始事件(initial event):由研究目的确定的观察起点,如疾病确诊、手术、用药等。失效事件(failure event) :表示随访对象出现了研究所规定的结局,如疾病复发、死亡。又称为终点事件(terminal event) 。根据研究目的在设计时明确规定,研究期间严格遵守,不得随意改变。,11,二、生存分析基本概念,2. 生存时间 (survival time) 从某起始事件到终点事件所经历的时间间隔,常用符号 t 表示。,12,二、生存分析基本概念,3. 生存资料的类型完全数据(complete data):观察对象在观察期内出现终点事件,所记录时间信息是完整的。不完全数据(censored data) :又称截尾数据/删失数据,由于某种原因停止了随访,未观察到研究对象出现终点事件,所记录的时间信息是不完整的。,13,二、生存分析基本概念,删失的主要原因1. 失访:观察对象失去联系,如信访无回信、未继续就诊、搬离原地址等。 2. 退出:指退出研究,如意外死亡、死于其他疾病,医生改变治疗方案而中途退出研究。 3. 终止:研究终止时,未出现终点事件,如仍然存活。,14,右删失:感兴趣的终点事件未发生,或不知是否发生,真实的生存时间长于观察时间。,二、生存分析基本概念,删失值删失比例不宜太大。 非删失例数至少是影响因素的10倍。 右删失数据记为:t + 时间(t)= 删失日期 起始日期 例:如某患者随访时间为1个月,且为删失个体,其生存时间记为:t =1+(月),15,二、生存分析基本概念,4. 随访研究模式所有观察对象同时进入研究,即研究起始日期相同(起点相同),研究终点固定。多见于队列研究、动物实验。 观察对象逐个进入研究,即研究起始日期不同(起点不同),研究终点固定。多见于临床随访研究。,16,二、生存分析基本概念,4. 随访研究模式,17,二、生存分析基本概念,5. 生存概率生存概率(probability of survival)表示某时段开始时存活的个体,到该时段结束时仍存活的可能性,用 p表示,18,p = 活满某时段的人数 该时段初期观察人数,二、生存分析基本概念,6. 生存率生存率(survival rate),又叫累积生存概率或生存函数, 表示观察对象其生存时间T大于t时刻的概率。实际工作中,如无截尾数据,则有删失时刻生存率等于前一个非删失时刻生存率。,19,()= 生存时间大于的病例数 患者总数,二、生存分析基本概念,7. 死亡概率死亡概率(probability of survival)表示某时段开始时存活的个体,在该时段内死亡的可能性,用q表示,q=1-p。,20,q = 某时段内死亡的人数 该时段期初观察人数,二、生存分析基本概念,7. 累计死亡概率表示观察对象从开始到时间t为止的累积死亡概率,用F(t)表示,F(t)=1-S(t),21,8. 死亡密度函数F(t)的导数,表示所有观察对象在t时刻的瞬时死亡率,用 f (t)表示。,二、生存分析基本概念,22,8. 风险函数指 t 时刻尚存活的研究对象死于t 时刻后一瞬间的概率,用 h (t)表示。风险函数是生存分析的基本函数,反映研究对象在某时点的死亡风险大小。,二、生存分析基本概念,23,一般来讲,生存函数、死亡密度函数和风险函数具有以下关系,描述生存过程:估计患者生存率及平均存活时间,绘制生存曲线等,如估计服用某药物的HIV阳性患者的生存率和中位生存时间;,生存分析研究的主要内容,24,比较生存过程:对各样本的生存率进行比较,以探讨各总体的生存率是否有差别,如两种方法肾移植病人术后生存率的比较,以判断哪种方法较好;,影响因素分析:通过生存分析模型来探讨影响生存时间的因素,如收集肝癌患者的生存时间、生存结局及影响因素,探讨影响预后的主要因素,为在手术前后预防或干预提供参考。,第二节 生存曲线的估计,一、 Kaplan-Meier法 适用于小样本资料,要求每个观察对象都有确切的死亡时间和截尾时间。 二、 寿命表法 适用于频数表、样本量较大,或者无法确切得知研究结果出现时间的资料。,25,第二节 生存曲线的估计,一、 Kaplan-Meier法的生存率估计 生存率的计算常用乘积极限法(product-limited method)法,由Kaplan和Meier提出,故又称为Kaplan-Meier法,简称K-M法。 利用条件概率和概率乘法的原理计算生存率。条件概率即某时刻生存概率或死亡概率,26,生存率的计算公式,S(t)表示某时刻 t 的生存率,p为某时刻生存概率,该公式表示某时刻生存率为之前各时刻生存概率与该时刻生存概率的连乘。,生存率标准误,nj:时点 j的期初例数;dj:时点 j的死亡数,27,第二节 生存曲线的估计,一、 Kaplan-Meier法的生存率估计例18.3 某大学附属医院肿瘤科在胃癌的生存研究中收集到22例淋巴结远端转移胃癌病例的临床随访资料。生存时间定义为胃癌手术日期到病人死亡日期的时间跨度,得到的生存时间(月),见表18.3第(1)栏,其中有“”者是截尾数据,表示病人仍生存或失访。试计算各时点(t)的生存率与标准误。,28,29,表18.3 淋巴结远端转移胃癌病例生存率计算,生存曲线(survival curve),以生存时间为横轴,生存率为纵轴绘制所得曲线为生存曲线,又称K-M曲线,用以描述生存过程。可根据两条或多条生存曲线的高低,直观地比较不同状态下生存过程的情况。,30,补例1 为了比较不同手术方法治疗肾上腺肿瘤,某研究者随机将43例病人分成两组,甲组23例、乙组20例的生存时间(月)如下: 甲组: 1, 3, 5(3), 6(3), 7, 8, 10(2), 14+, 17, 19+, 20+, 22+, 26+, 31+, 34, 34+, 44, 59 乙组:1(2), 2, 3(2), 4(3), 6(2), 8, 9(2), 10, 11, 12, 13, 15, 17, 18 。,31,补图1 甲种手术治疗方法术后病人生存曲线,32,补图2 两种手术治疗方法术后病人生存曲线的比较,33,中位生存时间(median survival time),又称生存时间的中位数,表示有50的个体其存活时间大于该时间。反映生存时间的平均水平,其值越大,即中位生存期越长,表示疾病的预后越好,反之,表示疾病的预后越差。,第三节 生存曲线的比较,35,补图2 两种手术治疗方法术后病人生存曲线的比较,第三节 生存曲线的比较,通过对不同组别(两组或多组)生存曲线的比较,说明不同组别生存率的差别。 检验假设 H0:各总体的生存率相同; H1:各总体的生存率不同或不全相同。,36,常用方法:log-rank检验 敏感性较高,应用广泛,生存曲线比较的log-rank检验,基本思想是进行实际死亡数与期望死亡数的比较对不同处理组的生存率做整体的比较非参数检验方法,用于两组或多组生存率的比较,补例1 为了比较不同手术方法治疗肾上腺肿瘤,某研究者随机将43例病人分成两组,甲组23例、乙组20例的生存时间(月)如下: 甲组: 1, 3, 5(3), 6(3), 7, 8, 10(2), 14+, 17, 19+, 20+, 22+, 26+, 31+, 34, 34+, 44, 59 乙组:1(2), 2, 3(2), 4(3), 6(2), 8, 9(2), 10, 11, 12, 13, 15, 17, 18 。,38,问两种手术后病人的生存率有无差别?,log-rank检验步骤1建立假设,H0:两种手术后病人的总体生存率相同;H1:两种手术后病人的总体生存率不同;检验水准:=0.05,log-rank检验步骤2计算检验统计量,首先将两组病人的生存时间统一排序;计算每个时间点两组合计的期初观察病人数和死亡数;计算每个时间点期望死亡数;,表17-4 两种手术生存率比较的log-rank检验计算表,log-rank检验步骤2计算检验统计量,计算判断实际死亡数和期望死亡数是否一致的检验统计量2值。2值计算的近似公式为:自由度的计算公式为: =组数1本例: 2=7.56, =2-1=1,2值精确计算公式(用任意一组数据):本例: 2=8.75, =2-1=1,log-rank检验步骤2计算检验统计量,通过合计数计算理论频数,若H0为真,则两组实际频数与理论频数均应相差不大:|d1i-T1i|=|d2i-T2i|。故任选一组计算统计量,log-rank检验步骤3确定P值下结论,2=8.753.84 P0.05结论:在=0.05水准处,拒绝H0,接受H1,两组总体生存率的差异有统计学意义。可以认为甲种手术方法的预后效果好于乙种手术方法。,log-rank检验的注意事项,两组生存率的比较有近似法和精确法两种,统计软件中常用精确法,小样本时两种方法结果稍有不同。要求两条生存曲线不能有交叉。有交叉提示存在混杂因素,需用分层或多因素的方法校正混杂因素。,SPSS实现 K-M法生存率估计,47,48,50,51,52,53,54,SPSS实现 Log-rank检验,56,定义3个变量: ntime12:生存时间 zhuany:组别,1=转移组,0=未转移组 sta1012:截尾情况,0=完整数据,1=截尾数据,57,58,59,60,61,62,63,64,65,结论:根据生存曲线的比较,淋巴结未转移患者的生存时间长于转移患者。,第四节 生存资料影响因素分析,例18.5 为了探索影响儿童急性淋巴细胞白血病长期生存的预后因素。采用回顾性队列研究,对1990年1月1日至1995年12月30日期间在某地附属儿童医院血液科就诊,治疗时间大于2周,年龄0,表示当Xj增大时,h(t) 也增大,即病人死亡的风险增大,说明该自变量是死亡的危险因素。j=0,表示Xj的取值不会引起病人死亡风险的改变,说明该自变量与死亡风险无关。j0,表示当Xj增大,h(t) 则减小,即病人死亡的风险减小,说明该自变量是死亡的保护因素。,71,相对危险度 (relative risk, RR),表示其他自变量不变的情况下,某自变量从某个值变化为另一个值时,风险函数的变化情况。也称风险比(hazard ratio, HR),是一个与时间无关的统计量。计算公式为:,72,假定自变量Xj的取值为0和1时,其相对危险度为相对危险度的可信区间:如果相对危险度的可信区间包含1,说明该自变量不会影响危险函数;如果大于1,则是危险因素;如果小于1,则是保护因素。,相对危险度,73,因素的筛选和最佳模型的建立,通过单变量分析筛选有价值的自变量。常用的方法有2检验、log-rank检验、单因素的Cox模型分析等。采用前进法、后退法和逐步回归法筛选进入模型的自变量,建立最佳模型。,74,因素的筛选和最佳模型的建立,初步的、探索性的研究,或变量数较少时,可取0.10 设计严谨的、证实性的研究,或变量数较多时,可取0.05或0.01 进行逐步回归时,引入剔除,保证有意义的自变量都留在方程中,75,例18.5的Cox回归变量筛选结果:,初诊wbc:RR=2.44,95%CI为1.533.90,说明初诊wbc高的患者死亡风险是wbc较低的患者的2.44倍。 脾大:RR=1.92,95%CI为1.153.22,说明脾脏(肋下)5cm患者的死亡风险是脾脏(肋下)0,表示患者危险度高于平均水平;PI0,表示患者危险度低于平均水平;,77,SPSS实现 Cox回归,78,79,每个患者为一行;各个影响因素、生存时间、随访结局各占一列,80,81,82,选择入选标准和剔除标准,输出RR的95可信区间,84,Cox模型的注意事项,设计阶段应注意的问题样本的代表性要好(样本量一般在40例以上,通常要求是协变量数的15-20倍,且截尾率不宜太高)。 考虑危险因素要全面,避免遗漏重要因素和加入无关因素。,85,Cox模型的注意事项,模型拟合时应注意的问题多重共线性问题。当变量间存在高度相关时,可采用主成分分析或聚类分析进行消除。 Cox模型要求各危险因素间不存在交互作用。 Cox模型要求病人的死亡风险与其基础
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工厂安全培训目标课件
- 工厂安全培训的重要性
- 浙江银行招聘-2026年平安银行宁波分行秋季校园招聘备考考试题库附答案解析
- 四川省成都市双流区九江初级中学2025年教师招聘备考考试题库附答案解析
- 2025年宁夏回族自治区宁安医院公开招聘合同制工作人员备考考试题库附答案解析
- 2025广西南宁市金凯路小学招聘体育学科编外教师备考考试题库附答案解析
- 三维运动合成方法-洞察及研究
- 光电材料的光驱动物件研究-洞察及研究
- 基于大数据的鲜花运输调度策略-洞察及研究
- 金融科技中的宏观视角与智能算法结合-洞察及研究
- GB/T 24861-2024水产品流通管理技术规范
- 一年级古诗70首(拼音打印)
- DZ∕T 0283-2015 地面沉降调查与监测规范(正式版)
- 人事专员简历模板
- 围手术期安全管理
- 幼儿园食堂6T培训
- 《人类简史》读书分享交流
- 供应商质量管理工程师SQE培训材料课件
- 小孩子受伤调解协议书
- 公务员考试的数学备考指导
- 2024年纺织服装培训资料
评论
0/150
提交评论