版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十九章生存分析医学统计学目录生存资料的特点及基本概念1生存曲线的估计2生存曲线的比较3生存资料影响因素分析4第一节生存资料的特点及基本概念生存资料的特点生存分析中的基本概念一、生存资料的特点
例19.1
肺癌病人用两种不同治疗方案治疗后的临床随访资料见表19.1,问:①用何种方法比较两种治疗方案的疗效?②该资料与以前所学的资料有何异同?分组编号开始治疗日期终止日期结局生存日数生存率(%)平均生存日数甲101.5.2105.5.15生1454
甲202.6.1502.10.15死120
甲301.6.1701.9.15死88甲403.6.2005.5.15生695
甲501.7.2505.5.15生139060.0749乙602.6.1305.5.15生1067
乙701.7.105.5.15生1414乙801.7.303.6.13死710
乙901.8.905.5.15生1376
乙1001.9.502.4.11死22160.0958表19.1甲(手术组)、乙(手术+放疗)两组治疗方案肺癌病人临床随访结果疗效指标既有结局变量又有时间变量随访研究中研究对象可能会失访或死于其他疾病由于研究经费和时间限制不可能等到所有观察对象都出现结局才终止研究一、生存资料的特点生存分析(survivalanalysis)将事件的“结局”与出现这一结局所经历的“时间”结合起来分析的一类统计分析方法。例:
估计HIV阳性患者的生存时间。两种肾移植方法下病人术后生存时间和生存率的比较。
探讨影响肝癌患者预后的因素,收集了患者的生存时间、生存结局及影响因素。二、生存分析中基本概念生存时间(survivaltime)是任何两个有联系事件之间的时间间隔,常用符号t表示。从狭义的角度来讲,生存时间指患某种疾病的病人从发病到死亡所经历的时间。广义的生存时间定义为从某种起始事件到终点事件所经历的时间。肾移植病人从手术到死亡所经历的时间戒烟开始到重新吸烟之间的时间从接触毒物到出现毒性反应时间HIV病毒感染到症状发作所经历的潜伏期假牙的装入到破损的时间二、生存分析中基本概念终点事件(terminalevent)一般是指反映治疗效果特征的事件,比如死亡、复发、痊愈等。它是根据研究目的所确定,因此在研究设计时必须明确规定,并在研究的实施中严格遵守。起始事件(initialevent)是反映生存时间起始特征的事件,如疾病的确诊、治疗开始、接触毒物等,设计时也需要明确规定。二、生存分析中基本概念截尾数据(censoreddata)指随访过程中,由于某种原因未能观察到病人的明确结局(终点事件)或称删失、终检。尽管截尾数据提供的生存时间信息是不完整的,但它提示该病人至少在已经观察的时间长度内没有死亡,其真实的生存时间只能长于观察到的时间而不会短于这个时间。截尾的主要原因:失访:指失去联系,如信访无回信,上门采访不见人,电话采访不答理,外出或搬迁没留地址等;退出:是指退出研究,如意外死亡、死于其它病、临时改变治疗方案等而中途退出研究;终止:指研究时限已到而终止观察,临床试验和动物实验都常见此情况。生存概率(probabilityofsurvival):表示某时段开始时存活的个体,到该时段结束时仍存活的可能性,用p表示。如:年生存概率
表示年初尚存人口存活满1年的可能性。10二、生存分析中基本概念生存率(survivalrate):指观察对象自研究起点,经历t个时段后仍存活的可能性,即生存时间大于等于t的概率,用P(T≥t)表示。生存函数(survivalfunction):生存率通常随时间t的变化而变化,是时间t的函数,记为S(t)。生存函数在某时间点的函数值就是生存率11S(t)=P(T≥t)二、生存分析中基本概念12生存率的计算若前t个时段没有删失值:二、生存分析中基本概念13若观察期内存在删失值:
Kaplan-Meier法(K-M法):假定观察对象在各个时段的生存事件相互独立,其生存概率分别p1,p2,p3,…,pt,根据概率的乘法原理可得:
生存率又称为累计生存概率,即将时刻t尚存活看成是前t个时段一直存活的累积结果。二、生存分析中基本概念死亡概率(probabilityofdeath):表示某时段开始时存活的个体,在该时段内死亡的可能性,用q表示,q=1-p。如:年死亡概率
表示年初尚存人口在今后1年内死亡的可能性。14p:生存概率二、生存分析中基本概念死亡概率密度函数(deathprobabilitydensityfunction):表示所有观察对象在t
时刻的瞬时死亡率,记为
f(t)。15无截尾数据时,
t=1时,表示所有患者在t~t+1时段内的死亡概率。二、生存分析中基本概念16
t=1时,表示时刻t尚存活的个体在t
时刻后一个单位时段内的死亡概率(风险)。二、生存分析中基本概念风险函数(hazardfunction)指t
时刻尚存活的研究对象死于t
时刻后一瞬间的概率。即已生存到t时刻的条件下,在t~t+∆t这一非常小的时段内死亡的概率,常用h(t)来表示,又称为危险率函数。二、生存分析中基本概念生存分析研究的主要内容描述生存过程
研究生存时间的分布特点,估计生存率及平均存活时间,绘制生存曲线等。
比较生存过程
可通过生存率及其标准误对各样本的生存率进行比较,以探讨各总体的生存过程是否有差别。影响生存时间的因素分析其重点是通过生存分析模型来探讨影响生存时间的因素。生存分析的基本方法非参数法
常用方法有乘积限法和寿命表法参数法
常用方法有指数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析法等半参数法
典型方法是Cox回归第二节生存曲线的估计估计生存率的常用方法一、Kaplan-Meier法要求每个观察对象都有确切的死亡时间和截尾时间。二、寿命表法(不要求)适用于频数表、样本量较大,或者无法确切得知研究结果出现时间的资料。
由Kaplan和Meier于1958年提出,又称乘积极限法(product-limitedmethod),简称K-M法。活过某时点ti的生存率是第i时点及以前各时点的生存概率连乘:生存率标准误的计算:21Kaplan-Meier法nj:时点j的期初例数;dj:时点j的死亡数。例19.3某大学附属医院肿瘤科在胃癌的生存研究中,收集到22例淋巴结远端转移胃癌病例的临床随访资料。生存时间定义为胃癌手术日期到患者死亡日期的时间跨度,得到的生存时间(月),见补表2第(1)栏,其中有“+”者是截尾数据,表示患者仍生存或失访。试计算各时点(t)的生存率与标准误2223序号i时间(个月)t期初人数
n死亡人数d死亡概率q=d/n生存概率p=1-q生存率S(t)标准误Sp172210.0460.9540.9540.0442112110.0480.9520.9080.0613132010.0500.9500.8630.073…………10291310.0770.9230.5440.10611301220.1670.8330.4530.1061232+1000.0001.0000.453-1335910.1110.8890.4030.106…………1954+200.0001.0000.126-2062111.0000.0000.0000.000表19.3淋巴结远端转移胃癌病例生存率计算以生存时间为横轴,生存率为纵轴绘制的阶梯状图形,可描述生存过程。若以K-M法估计生存率,进而绘制生存曲线,则称为K-M曲线。生存曲线(survivalcurve)生存率为了比较不同手术方法治疗肾上腺肿瘤,某研究者随机将43例病人分成两组,甲组23例、乙组20例的生存时间(月)如下:
甲组:1,3,5(3),6(3),7,8,10(2),14+,17,19+,20+,22+,26+,31+,34,34+,44,59
乙组:1(2),2,3(2),4(3),6(2),8,9(2),10,11,12,13,15,17,1825生存曲线的应用:可根据两条或多条生存曲线的高低,直观地比较不同状态下的生存过程。生存曲线(survivalcurve)两种手术治疗方法术后患者生存曲线的比较26由图可见:随着生存时间的递增生存曲线从1到0逐渐呈阶梯状下降,乙法曲线下降迅速;甲法生存曲线高于乙法,且无交叉,直观表明甲法生存率高于乙法;甲法删失个体多,散布在第2、3两年,乙法无删失;甲法的两年生存率约为0.43,而乙法为0;中位生存时间甲法约为10个月,乙法约为6个月。生存率log-rank检验:一种非参数检验方法,常用于两组或多组生存曲线的比较。基本思想:比较实际死亡数与理论死亡数是否有差别。27log-rank检验第三节生存曲线的比较生存曲线的比较序号123456789生存时间2427+3636+4447+484849序号101112131415161718生存时间5556575959606177119+例19.4
结合例19.3,该肿瘤科医生又调查了18名无远端淋巴结转移胃癌患者的随访资料,带有“+”者为截尾对象。见表19.7(数据集:例19-04,)。试比较远端淋巴结是否转移胃癌病例其生存曲线是否有差异?表19.718名无远端淋巴结转移胃癌患者的随访资料1.建立假设,确定检验水准。H0:远端淋巴结胃癌病例转移与未转移病例的生存曲线相同H1:远端淋巴结胃癌病例转移与未转移病例的生存曲线不同
=0.0529log-rank检验的一般步骤计算方差估计值和检验统计量
2值(转移组)。
302.计算检验统计量。i:时间点方差估计值:反映实际死亡总数与理论死亡总数的差别通过合计数计算理论频数,若H0为真,则两组实际频数与理论频数均应相差不大:|Σd1i-ΣT1i|=|Σd2i-ΣT2i|。故任选一组计算统计量。本例,
2=12.411,P<0.0001(软件结果)结论:在
=0.05水准处,拒绝H0,两组生存曲线差别有统计意义,认为远端淋巴结胃癌病例转移与未转移病例的生存曲线不同。313.确定P值,下结论。32图18.4两组生存率曲线情况生存率第四节生存资料影响因素分析例19.5为了探索影响儿童急性淋巴细胞白血病(ALL)长期生存的预后因素。采用回顾性队列研究,对1990年1月1日至1995年12月30日期间在某地附属儿童医院血液科就诊,治疗时间大于2周,年龄<15周岁,获得有效随访的118例ALL初诊患儿进行生存分析。研究的起始事件为ALL确诊,终点事件为患者死亡;研究的终止日期为2000年6月30日。变量赋值表34变量含义量化值sex性别1=男;2=女age1发病年龄1=“<1或>9岁”;0=“1-9岁”wbc1初诊白细胞1=“≥25×109/L”;0=“<25×109/L”riskALL类型1=“高危”;0=“标危”fabFAB细胞分型1=“F1”;2=“F2”re缓解治疗期是否复发1=“复发”;0=“未复发”msps1脾肿大(肋下)1=“≥5cm”;0=“<5cm”score1缓解及强化期治疗积分1=“≥20”;0=“<20”health是否死亡1=“死亡”;0=“截尾”time生存时间连续型变量(年)基本概念Cox比例风险回归模型(Cox’sproportionalhazardsregressionmodel),简称Cox回归模型。由英国统计学家Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。其优点:多因素分析方法不考虑生存时间的分布利用删失数据35风险函数:指t
时刻尚存活的研究对象死于t
时刻后一瞬间的概率。即已生存到t时刻的条件下,在t~t+∆t这一非常小的时段内死亡的概率,用h(t)表示。以风险函数(hazardfunction)为应变量,以各影响因素为自变量,建立自然指数回归方程。基本概念Cox回归方程的表达式为:37Xi:可能影响生存的各因素,也称协变量(covariates)t:生存时间h(t,x):具有协变量x的个体在t时刻的风险函数(瞬时风险率)h0(t):基线风险函数,表示所有x都取值为0时的个体在t时刻的瞬时风险率。通常未知,不做任何分布、形状上的假定或限制
i:总体回归系数,其估计值记为bi基本概念38模型的其他表达方式:或基本概念39假定只有一个暴露因素x1(1=暴露,0=未暴露),则有
任意两个风险率(又称为危险度)之比称为相对危险度(relativerisk,RR)或风险比(hazardratio,HR)。基本概念40HR的可信区间:如果HR的可信区间包含1,说明该因素对疾病的预后无影响;如果大于1,则是危险因素;如果小于1,则是保护因素。风险比(HR)其中,bj为
j的估计值。基本概念回归系数—β1、β2、…、βm
βi表示在其他因素不变的情况下,自变量Xi每改变一个单位时所改变的风险比(HR)的自然对数值。基本概念方法:前进法(Forward)、后退法(Backward)和逐步回归法(Stepwise)42因素的筛选和最佳模型的建立检验水准的确定初步的探索性研究,或变量数较少时,可取0.10设计严谨的证实性研究,或变量数较多时,可取0.05或0.01进行逐步回归时,α引入
α剔除,严进严出,保证有意义的自变量都留在方程中Cox模型筛选的危险因素及参数估计43VariablesintheEquation
BSEWalddfSig.Exp(B)95.0%CIforExp(B)LowerUpperStep1wbc11.019.23219.3251.0002.7701.7594.363Step2wbc11.032.23319.5451.0002.8061.7764.435msps1.648.2596.2481.0121.9121.1503.179Step3wbc1.948.23416.4061.0002.5801.6314.081msps1.596.2605.2531.0221.8151.0903.023re.681.2885.5671.0181.9751.1223.477Step4wbc1.892.23913.9401.0002.4391.5273.896msps1.654.2636.1821.0131.9221.1483.218score1.652.3693.1251.0771.920.9323.957re.655.2895.1331.0231.9261.0923.395初诊wbc:HR=2.44,95%CI为1.53~3.90,说明初诊wbc高的患者死亡风险是wbc较低的患者的2.44倍。脾大:HR=1.92,95%CI为1.15~3.22,说明脾脏(肋下)
5cm患者的死亡风险是脾脏(肋下)<5cm患者的1.92倍。……
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国检验认证集团河南公司招聘30人笔试历年参考题库附带答案详解
- 2025山西晋中昔阳县文化旅游发展有限责任公司社会招聘15人笔试历年参考题库附带答案详解
- 2025山东济钢集团有限公司招聘48人笔试历年参考题库附带答案详解
- 2025安徽阜阳市太和国投集团下属子公司太和县鸿泰港口服务有限公司暂停招聘笔试历年参考题库附带答案详解
- 2025宁夏环保集团有限责任公司招聘4名财务人员笔试历年参考题库附带答案详解
- 2025国网中兴有限公司高校毕业生招聘(第二批)笔试历年参考题库附带答案详解
- 2025四川长虹电子科技有限公司招聘主管电路设计工程师等岗位10人笔试历年参考题库附带答案详解
- 2025四川科瑞软件有限责任公司招聘投标专员等岗位3人笔试历年参考题库附带答案详解
- 2025四川南充临江建设发展集团有限责任公司员工招聘22人笔试历年参考题库附带答案详解
- 2025北京首发集团拟聘人员笔试历年参考题库附带答案详解
- 2025年AP考试物理C真题
- 2025课堂惩罚 主题班会:马达加斯加企鹅课堂惩罚 课件
- 施工现场交通安全课件
- Maya 2024三维设计基础教程(全彩微课版) 课件全套 来阳 第1-10章 初识Maya 2024 -综合实例
- 2025年天津市高考英语试卷(含答案及解析)
- 城市供水调研报告(老旧小区改造调研内容)
- 工业企业精益智造成熟度评价规范
- 2025年中国地质调查局招聘面试题预测与备考指南
- 农业生产资金管理规定
- 【《人脸识别技术中个人信息保护的法律规制探析》10000字】
- 山西省寿阳县2025年上半年事业单位公开招聘试题含答案分析
评论
0/150
提交评论