版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
疾病预后研究及生存分析概述一、疾病预后及预后研究的概念预后(prognosis):指疾病发生后,对将来发展为不同结局(痊愈、复发、恶化、伤残、并发症、死亡等)的预测或事前估计,通常以概率表示,如治愈率、有效率、5年生存率等。概述二、疾病预后研究的意义1.了解疾病的发展趋势和后果;2.通过对影响疾病预后的各种因素的研究,找出主要因素,进行有效干预,有助于改变疾病的结局;3.正确评价干预措施的效果概述三、疾病的自然史和临床病程
疾病的自然史是指疾病在没有任何医学干预的情况下,从发生、发展到结局的整个过程。1.生物学发病期2.临床前期3.临床期4.结局
病程是指疾病从开始出现症状、体征到最后结局所经历的全过程,其中可经历不同医疗干预措施。概述四、影响疾病预后的因素疾病本身的特点医疗条件和干预的方式与程度患者身体素质社会因素与家庭因素疾病预后研究的设计与实施一、疾病预后研究的方法队列研究临床试验病例对照研究描述性研究…疾病预后研究的设计与实施二、预后研究设计的主要内容1.明确研究目的2.确定研究对象3.疾病预后的评定指标病死率、治愈率、缓解率、复发率、生存率4.明确研究结局及其判断标准5.进行随访,收集相关资料6.疾病预后研究设计的注意问题疾病预后研究中的偏倚与控制一、常见偏倚1.失访偏倚2.领先时间偏倚3.集合偏倚4.存活队列偏倚5.迁移偏倚6.测量偏倚7.混杂偏倚疾病预后研究中的偏倚与控制一、偏倚的控制1.随机化方法2.限制3.匹配4.分层5.标准化6.多因素分析一些医学事件所经历的时间:从开始观察到事件发生的时间,不是短期内可以明确判断的乳腺癌病人术后生存时间幼儿乳牙萌出的时间白血病病人化疗后缓解持续的时间两种方法治疗某慢性病产生疗效的时间针对这类生存资料的分析方法:生存分析生存分析:将终点事件的出现与否和达到终点所经历的时间结合起来分析的一类统计分析方法。生存资料生存资料图102名黑色素瘤患者的生存时间分布time(Month)051015202530354045010203040生存分析的目的1.估计:根据样本生存资料估计总体生存率及其它有关指标(如中位生存时间等),如根据脑瘤患者治疗后的生存时间资料,估计不同时间的生存率、生存曲线以及中位生存期等。2.比较:对不同处理组生存率进行比较,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。生存分析的目的3.影响因素分析:目的是为了探索和了解影响生存时间长短的因素,或平衡某些因素影响后,研究某个或某些因素对生存率的影响。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。4.预测:具有不同因素水平的个体生存预测,如根据脑瘤病人的年龄、性别、病程、肿瘤分期、治疗方案等预测该病人t年(月)生存率。第一节生存资料概述一、起始事件与终点事件起始事件:反映研究对象生存过程的起始特征的事件。如确诊、手术、开始采取措施,开始观察。终点事件(outcomeevent):指研究者所关心的特定结局,又称死亡事件、失效事件(failureevent)。如死亡、复发、痊愈等。二、生存时间(survivaltime)
指从某起始事件开始到被观测对象出现终点事件所经历的时间,用t表示。研究号(1)姓名(2)术后开始随访时间(3)终止随访时间(4)结局(5)生存天数(6)1赵××00-01-1600-09-01失去联系229+2钱××00-01-2601-03-18局部复发死亡4173孙××00-02-0501-12-25车祸死亡689+4李××00-02-1902-10-01研究终止955+5王××00-03-0700-11-11局部复发死亡2496刘××00-03-2002-01-24远处转移死亡675例1:某医师从2000年1月1日起到2002年10月1日对6名肺癌患者进行跟踪观察,记录其结局。1234562000-01-012002.10.01三、删失(censor)又称截尾,主要有3种情况:①失访:指失去联系,如信访未回信,上门不见人,电话采访不答理或搬迁未留新地址等原因;②退出:指退出研究,如因其他非此次研究疾病死亡,临时改变治疗方案而中途退出研究;③终止:指研究时限已到而终止观察。
第一节生存资料概述生存时间有2种类型:(1)完全数据(completedata):是指被观测对象从观察起点至出现终点事件所经历的时间。(2)不完全数据(censoreddata):是指在出现终点事件前,被观测对象的观测过程终止了。由于被观测对象所提供的信息是“不完全的”,只知道他们的生存时间超过了截尾时间。常用229+、689+、955+来表示不完全数据(删失数据)。
第一节生存资料概述例2:某临床试验对32名晚期肺癌患者患者进行随访研究,截止到研究期结束,记录的生存随访资料如下表,试计算100周生存率。12.815.617.824.0+26.429.230.030.8+39.242.049.358.4+72.0+76.9+77.282.485.086.887.2+90.694.4+96.597.2+98.6+106.0+114.8+117.2+140.0+168.0+170.5+196.0198.5+注:+表示该数据为删失数据(不完全数据)四、死亡概率(q)
死亡概率(mortalityprobability):记为q,是指在某段时间开始时存活的个体在该段时间内死亡的可能性大小。若无删失数据,死亡概率的估计公式为:第一节生存资料概述四、死亡概率(q)
第一节生存资料概述当存在删失数据时,假定失访等删失事件在观察时段的各个时间点是等机会发生的,故分母改用校正观察例数。五、生存概率(p)
生存概率(survivalprobability):记为p,是指在某段时间开始时存活的个体至该时间结束时仍存活的可能性大小。生存概率的公式为:第一节生存资料概述第一节生存资料概述六、生存率(survivalrate)
用S(tk)表示,是指病人经历tk个单位时间后仍存活的概率。若无删失数据,则
但如果资料中含有删失数据,分母必须按时段进行校正,此公式则不再适用,此时生存率的计算公式应为
第一节生存资料概述六、生存率(survivalrate)
生存率的标准误生存率的可信区间估计(正态近似法)第二节生存率的寿命表法适用于大样本资料数据按时间区间分组利用删失资料信息,按删失资料对进行校正区间中的删失个体折算为半个人时第二节生存率的寿命表法一、生存率计算
例3:某医院对100名恶性肿瘤术后病人进行随访所获得的资料如下表术后年数t~(1)期初观察例数n0(2)期内死亡例数d(3)删失例数c(4)校正期初例数nc=n0-c/2(5)死亡概率q=d/nc(6)生存概率p=1-q(7)t+1年生存率S(t+1)(8)生存率标准误SE(S(t+1))(9)0~1001001000.10000.90000.90000.03001~90150900.16670.83330.75000.04332~75168710.22540.77460.58100.05013~51124490.24490.75510.43870.05204~3514731.50.44440.55560.24370.04845~147710.50.66670.33330.08120.0390第二节生存率的寿命表法二、生存曲线
生存曲线(survivalcurve):以时间为横轴,生存率为纵轴,将各个时点的生存率连接在一起的曲线图。
图1100例恶性肿瘤患者术后生存曲线
第二节生存率的寿命表法三、中位生存时间
中位生存时间(MedianSurvivalTime):又称为半数生存期,即当累积生存率为0.5时所对应的生存时间,表示有且只有50%的个体可以活过这个时间。要注意中位生存期通常不等于生存时间的中位数(除非在这个时间点之前没有删失值存在)。第二节生存率的寿命表法三、中位生存时间
寿命表法由于默认组段内生存率的变化是均匀的,因此可以直接在生存曲线上进行内插,如例3,3年生存率为0.5810,4年生存率为0.4387,当生存率为0.5000时,中位生存时间为:第三节生存率的乘积极限法Kaplan-meier法(K-M法),直接用概率乘法定理估计生存率,故又称乘积极限法(Product-LimitMethod,简称PL法),由Kaplan和Meier在1958年提出,多用于样本量较小,难以将生存时间按组段划分,此时是利用tk时刻之前各时点上生存概率的乘积来估计在时刻tk的生存率,不需要对被估计的资料分布作任何假设。
这是一种非参数法,大样本时若知道每个对象的生存时间,也能用该法。第三节生存率的乘积极限法例4:一组病人的生存时间(日)如下,用Kaplan-Meier法估计其生存曲线(+代表删失)。3,5,5,6+,8,16+,22,30,47+,71(1)将所有生存时间按从小到大排列(t),包括完全和截尾生存时间。(2)列出各期初暴露病例数(n),它是指在t时刻前仍存活的病例数。(3)将各期内死亡例数(d)和删失例数(c)分别写在第(3)、(4)列。第三节生存率的乘积极限法存活时间(天)期初暴露数期内死亡例数期内删失例数死亡概率生存概率生存率生存率标准误tndcq=d/np=1-qS(tk)SE(S(tk))(1)(2)(3)(4)(5)(6)(7)(8)310100.10000.90000.90000.094959200.22220.77780.70000.14496+7010.00001.00000.70000.144986100.16670.83330.58330.161016+5010.00001.00000.58330.1610224100.25000.75000.43750.1747303100.33330.66670.29170.166647+2010.00001.00000.29170.1666711101.00000.00000.0000.第三节生存率的乘积极限法(4)计算各期的死亡概率q,q=d/n,删失数不参加计算,结果见第(5)列。例如生存时间为5天时,q=2/9=0.2222。(5)计算各期的生存概率p,p=1-q,例如生存时间为5天时,p=10.2222=0.7778,计算结果见第(6)列。(6)计算各t时刻的生存率S(tk)。计算tk时刻生存率时可以用小于和等于tk时刻的各时点生存概率的乘积得到,计算结果见第(7)列。
生存曲线(survivalcurve):以时间为横轴,生存率为纵轴,将各个时点的生存率连接在一起的曲线图。
第三节生存率的乘积极限法图2Kaplan-Meier法对10名病人的生存率估计
两种方法的比较
①寿命表法适用于大样本或无法准确得知研究结果出现时间的资料,Kaplan-Meier法主要用于小样本,也可以用于大样本。②寿命表法是按照指定的时段来分段,估计的是时间区间右端点上的生存率;Kaplan-Meier法是根据死亡时点分段,逐个估计死亡时点的生存率。③寿命表法不能确切得知死亡时间,假定每个时间段中的“死亡”是呈均匀分布,生存率为线性变化,故简单化以直线相连接;K-M法其生存曲线是连续的阶梯型曲线,间断点的纵坐标在下一阶处,当样本量较大及死亡时点较多时,阶梯形就不明显了。第四节生存曲线的比较H0:S1(t)=S2(t),两组总体生存曲线相同
H1:S1(t)≠S2(t),两组总体生存曲线不同第四节生存曲线的比较log-rank检验(对数秩检验、时序检验)该方法的基本思想是当H0成立时,根据ti时点的死亡率,可计算出ti时点上各组的理论死亡数;将所有时点的理论死亡数累加,便得到各组的理论死亡总数Tg;将Tg与各组的实际死亡总数Ag作比较,就得到以下的log-rank检验的统计量:第四节生存曲线的比较log-rank检验(对数秩检验、时序检验)
该检验属非参数检验,用于比较两组或多组生存曲线或生存时间是否相同。检验统计量为卡方值,自由度=组别数-1。若P≤0.05,两组或多组生存曲线有统计学差异;若P>0.05,两组或多组生存曲线的差别无统计学意义。H0:两组病人的生存率相同H1:两组病人的生存率不相同df=组数-1=1故P>0.05,拒绝无效假设,认为两种治疗方式生存率的差别无统计学意义。第四节生存曲线的比较log-rank检验(对数秩检验、时序检验)此检验比较两组或多组生存曲线,实为一单因素分析方法。要求各组生存曲线不能交叉,如交叉提示存在混杂因素,应采用分层分析方法或多因素方法来校正混杂因素。当假设检验有统计意义时,可从以下几方面来评价各组效应大小:生存曲线图目测判断、中位生存时间比较等。第四节生存曲线的比较log-rank检验用于整条生存曲线的比较,若比较两组某时间点处的生存率,则按下式计算:
如比较多个时间点处生存率,检验水准应取Bonferroni校正,即,其中k为比较的次数,以保证总的I型错误概率不超过。
第五节Cox回归
Cox比例风险回归模型(Cox’sproportionalhazardsregressionmodel),简称Cox回归模型。
该模型由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。其优点是:1.多因素分析方法2.不考虑生存时间分布3.可利用截尾数据Cox比例风险回归模型h(t,X):t时刻风险函数、风险率或瞬时死亡率(hazardfunction)h0(t):基准风险函数,即所有变量都取0时t时刻的风险函数X1、X2、…、Xp:协变量、影响因素、预后因素β1、β2、…、βp:回归系数Cox比例风险回归模型β>0,RR>1,说明变量X增加时,危险率增加,即X是危险因素。β<0,RR<1,说明变量X增加时,危险率下降,即X是保护因素。β=0,RR=1,说明变量X增加时,危险率不变,即X是危险无关因素。参数估计与假设检验(一)参数估计最大似然法(二)假设检验似然比检验(likelihoodratiotest)得分检验(scoretest)Wald检验(Waldtest)因素筛选与最优模型的建立变量筛选方法1.向前引入法(前进法)Forward2.向后剔除法(后退法)Backward3.逐步引入-剔除法(逐步法)Stepwise检验水准1.初步的、探索性的研究,或变量数较少时,可取0.10。2.设计严谨的、证实性的研究,或变量数较多时,可取0.05或0.01。3.检验水准包括引入的检验水准和剔除的检验水准。一般地,剔除α≥引入α。Cox回归分析时应注意的问题1.除生存资料的基本要求外,还要求因素对生存时间的作用不随时间变化(比例风险假定)。如观察年限超过10年时,癌症手术后放疗的治疗作用可能逐渐消失,从而不满足这一要求。2.筛选变量时,考虑该指标是否容易收集、是否费用较高等临床因素。3.对连续性自变量,看其分布,如服从偏态分布,一般进行对数变换后参与计算。对多项无序分类自变量应设置哑变量。Cox回归与logistic回归logistic回归模型可以作多因素分析,并可进行相对危险度估计,但不考虑生存时间的长短,不能处理随访中常见的截尾数据。Cox比例风险回归模型具有logistic回归模型的所有优点;同时考虑生存结局和生存时间的长短,可处理截尾数据;且不考虑基准风险的分布。Cox回归与多元线性回归、logistic回归的比较多元线性回归logistic回归Cox回归数据类型Y数值变量Y分类变量Y二分类变量+时间X可为数值变量、分类变量、等级变量模型结构略变量筛选前进法;后退法;逐步法参数估计最小二乘法最大似然法最大似然法参数检验F-testt-test似然比检验Wald检验score检验似然比检验Wald检验score检验参数解释回归系数b优势比ORRR样本含量至少变量数的10倍至少变量数的20倍非截尾例数至少变量数的10倍应用因素分析预测预报Y因素分析预测、判别P(Y=1)因素分析生存预测S(t)1.常使用的研究类型前瞻性队列研究回顾性队列研究生存分析的设计和实施2.研究开始时应确定起始事件、终点事件、随访终止日期、生存时间、截尾。3.确定可能的影响因素、水平以及量化方法。1.常使用的研究类型前瞻性队列研究回顾性队列研究生存分析的设计和实施2.研究开始时应确定起始事件、终点事件、随访终止日期、生存时间、截尾。3.确定可能的影响因素、水平以及量化方法。大肠癌影响因素量化表变量名因素量化值病例数构成比(%)X1性别女=03248.5
男=13451.5X2年龄(岁)<40=11015.140-60=23756.1≥60=31928.8X3组织学分类乳头状腺癌=02030.3
管状腺癌=1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农贸市场安全协同治理
- 业务办理服务规范标准讲义
- 2026苏教版三年级下册数学期中测试卷(附答题卡和答案)
- 2025-2026学年东莞市高三六校第一次联考化学试卷(含答案解析)
- 麻纺企业能源消耗监控细则
- 某家具厂生产成本核算细则
- 2026年智能工厂建设项目管理与实施
- 四川省字节精准教育联盟2026届高三下学期4月期中考试生物学试卷(含答案)
- 耐腐蚀泵检修规程
- 垃圾清运火灾应急演练脚本
- 外来人员进厂安全培训
- 幼儿园培训教师晨午检
- T/CTRA 07-2024橡胶粉改性沥青碳减排核算
- 百年五四精神与当代青年的使命传承课件
- led显示屏维保协议书范本
- 血液透析心跳骤停应急预案
- 便利店内部布局及设备投资方案
- 护理一病一品汇报
- 江苏南通醋酸纤维有限公司招聘真题
- 2024年建筑八大员(九大员)住房城乡建设领域现场专业人员考试-预算员笔试考试历年典型考题及考点含含答案
- 中小型水利工程红火蚁的危害分析及防治策略
评论
0/150
提交评论