




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、研究生医学统计学生存分析1 19 19 研究生医学统计学生存分析2 生存分析的目的生存分析的目的 1. 1. 估计:根据样本生存资料估计总体生存率及其他有关指标估计:根据样本生存资料估计总体生存率及其他有关指标 (如中位生存期)等。(如中位生存期)等。 2. 2. 比较:对不同组生存率进行比较。比较:对不同组生存率进行比较。 3. 3. 影响因素分析:为探索和了解影响生存时间长短的因素,或平影响因素分析:为探索和了解影响生存时间长短的因素,或平 衡衡 某些因素后,研究某个或某些因素对生存的影响。某些因素后,研究某个或某些因素对生存的影响。 4. 4. 预测:对具有不同因素、不同水平的个体进行生
2、存预测。预测:对具有不同因素、不同水平的个体进行生存预测。 研究生医学统计学生存分析3 第一节生存时间资料的特点第一节生存时间资料的特点 第二节小样本生存率的第二节小样本生存率的kaplan-Meierkaplan-Meier估计估计 第三节大样本生存率的寿命表法估计第三节大样本生存率的寿命表法估计 第四节第四节 生存曲线比较的假设检验生存曲线比较的假设检验 研究生医学统计学生存分析4 第一节生存时间资料的特点第一节生存时间资料的特点 一、数据结构一、数据结构 二、统计描述指标二、统计描述指标 三、资料要求三、资料要求 研究生医学统计学生存分析5 一、数据结构 在临床医学中在临床医学中, ,
3、对病人疗效考查:对病人疗效考查: 治疗结局?治疗结局? 生存时间?生存时间? 研究生医学统计学生存分析6 “ 生存时间生存时间”的概念的概念 开始事件开始事件 终终 点事件点事件 生物生存生物生存 死亡死亡 电脑开始使用正常 出现故障 疾病产生 治愈 疾病治愈 复发 阴性 阳性 研究生医学统计学生存分析7 生存时间的三个要点生存时间的三个要点 一、起始事件一、起始事件 二、二、 终点事件终点事件 三、生存时间三、生存时间 研究生医学统计学生存分析8 医学例子:起始事件 随访时间 终点事件 疾病确诊疾病确诊 死亡死亡 治疗开始 死亡 治疗开始 痊愈 接触危险物 出现 反应 治愈出院 复发 广义的
4、广义的“生存时间 生存时间” ”也可为医疗费用(元)、也可为医疗费用(元)、 医疗设备使用次数、车辆行驶总里程医疗设备使用次数、车辆行驶总里程( (公里公里) )等等 研究生医学统计学生存分析9 随访(follow-up)资料的记录 生存资料一般通过随访收集,生存资料一般通过随访收集, 记录的项目:记录的项目: (起始与终止)随访事件(起始与终止)随访事件 生存时间(开始观察日期与终止观察日期)(年、月、生存时间(开始观察日期与终止观察日期)(年、月、 天、小时、分、秒等)天、小时、分、秒等) 分组变量(处理方法)分组变量(处理方法) 和其它协变量(性别、年龄、职业、文化程度等)和其它协变量(
5、性别、年龄、职业、文化程度等) 研究生医学统计学生存分析10 月 份(2000年) 图12-1 生存时间原始记录示意 (+截尾) 78910111213 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 No. 1 2 3 4 5 天 数 图12-2 生存时间排序整理数据示意 0306090120150180 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 No. 5 4 1 2 3 3396158 0101167167 研究生医学统计学生存分析11 生存时间资料的特点生存时间资料的特点 2 2个效应变量个效应变量(1 1)生存时间)生存时间( (天数天数) ),
6、(,(2 2)结局)结局( (死亡与死亡与 否、是否阳性等否、是否阳性等) ) 删失(截尾)数据删失(截尾)数据:在规定的观察期内,对某些观察对象在规定的观察期内,对某些观察对象 由于某种原因未能观察到死亡结局,并不知道确切的生存时间,由于某种原因未能观察到死亡结局,并不知道确切的生存时间, 称为生存时间的删失数据(称为生存时间的删失数据(censored datacensored data)。如表)。如表12-112-1中的中的1 1号号 和和 3 3号病人未观察到底,不知他们究竟能活多长时间。号病人未观察到底,不知他们究竟能活多长时间。 产生结尾原因:产生结尾原因:(1)(1)迁移迁移 (
7、2)(2)死于其他原因死于其他原因 (3)(3)因其他客观原因中途退出因其他客观原因中途退出 (4) (4)研究结束时终点事件尚研究结束时终点事件尚 未发生未发生 分布类型复杂分布类型复杂:生存时间分布不服从正态分布,常常呈正偏态生存时间分布不服从正态分布,常常呈正偏态 分布、分布、WeibullWeibull分布、分布、GammaGamma分布或更为复杂的分布,因此要用特分布或更为复杂的分布,因此要用特 殊的统计方法。殊的统计方法。 研究生医学统计学生存分析12 2 2个效应变量个效应变量(1 1)生存时间)生存时间( (天数天数) ),(,(2 2) 结局结局( (死亡与否、是否阳性等死亡
8、与否、是否阳性等) ) 错误错误1 1:忽略生存时间,采用:忽略生存时间,采用LogisticLogistic回归分析死亡率回归分析死亡率 错误错误2 2:忽略结局,采用:忽略结局,采用t t检验、线性回归分析生存时间检验、线性回归分析生存时间 研究生医学统计学生存分析13 得不到确切的生存时间,但它们提供的生存时间长于得不到确切的生存时间,但它们提供的生存时间长于 观察期的时间,这种数据为观察期的时间,这种数据为不完全数据不完全数据。或截尾数据、删。或截尾数据、删 失数据或终检值。失数据或终检值。 (如有确切的生存时间,则这种数据称为(如有确切的生存时间,则这种数据称为完全数完全数 据据。)
9、。) 两种错误的做法:两种错误的做法: 错误错误1 1:丢弃丢弃截尾截尾数据,只考虑确切数据。(损失了信息)数据,只考虑确切数据。(损失了信息) 错误错误2 2:将将截尾截尾数据当作确切数据处理。(低估了生存时数据当作确切数据处理。(低估了生存时 间的平均水平)。间的平均水平)。 截尾截尾( (删失删失) )数据或终检值数据或终检值(censored data)(censored data) 研究生医学统计学生存分析14 两种错误的做法:两种错误的做法: 错误错误1 1:采用平均生存时间而不是采用采用平均生存时间而不是采用中中 位生存时间位生存时间来表示生存时间的平均水平。来表示生存时间的平均
10、水平。 错误错误2 2:采用常规采用常规t检验或方差分析进行检验或方差分析进行 组间比较。(应采组间比较。(应采用用log-ranklog-rank检验检验比较比较 几组生存时间几组生存时间 ) 正偏正偏态态(positive skewnesspositive skewness)数据数据 研究生医学统计学生存分析15 二、生存分析的统计描述指标二、生存分析的统计描述指标 1.1.死亡概率、生存概率死亡概率、生存概率 2. 2. 生存率及其标准误生存率及其标准误 3. 3. 半数生存期(中位数)半数生存期(中位数) 及四分位数间及四分位数间 距距 研究生医学统计学生存分析16 例例1 1 手术治
11、疗手术治疗6060例肺癌病人,术后每年死亡例肺癌病人,术后每年死亡1010 例,无删失。试求基本生存分析指标。例,无删失。试求基本生存分析指标。N N=60=60 ; 术后 年内 年内 年初 年 死亡死亡 死亡死亡 生存生存 ( (t t+1)+1)年年 年 死亡 截尾 观察 平均 率率 概率概率 概率概率 生存率生存率 数 例数 例数 例数 例数 p=1-q t d c n0 n=no-d/2 m=d/n q=d/n0 (n0-d)/n0 (n0-d)/N (1) (2) (3) (4) (5) (6) (7) (8) (9) 0 10 0 60 55 . 181 . 167 . 833 .
12、 833 1 10 0 50 45 . 222 . 200 . 800 . 667 2 10 0 40 35 . 286 . 250 . 750 . 500 3 10 0 30 25 . 400 . 333 . 667 . 333 4 10 0 20 15 . 667 . 500 . 500 . 167 研究生医学统计学生存分析17 1 . 1 . 死亡率、死亡概率、生存概率死亡率、死亡概率、生存概率 (1) (1) 死亡率死亡率 (mortality rate(mortality rate,death death rate)rate) 表示某单位时间内的死亡表示某单位时间内的死亡 强度强度。
13、 年平均人口数年平均人口数=(=(年初人口数年初人口数+ +年末人年末人 口数口数)/2)/2 00 0 1000 年平均人口数 年内死亡人数 年死亡率m 研究生医学统计学生存分析18 (2) (2) 死亡概率死亡概率 ( mortality probability )( mortality probability ) 是指单位时段开始时存活的个体到该时段结是指单位时段开始时存活的个体到该时段结 束时死亡的可能性,即死于某时段束时死亡的可能性,即死于某时段t tt+nt+n内的概内的概 率率。 d/n0 年内有删失,分母用校正人口数:年内有删失,分母用校正人口数: 校正人口数校正人口数= =
14、年初人口数年初人口数删失删失例数例数 / 2/ 2 n n0 0c c/2/2 年初观察例数 年内死亡人数 年死亡概率 q 研究生医学统计学生存分析19 (3) (3) 生存概率生存概率 ( survival probability )( survival probability ) 指某单位时段开始时存活的指某单位时段开始时存活的 个体到该时段结束时仍存活的可能性的大个体到该时段结束时仍存活的可能性的大 小。小。 (n0- d)/n0 分子为年末尚存人数,分子为年末尚存人数, 若年内有删失,分母用校正人口若年内有删失,分母用校正人口 数。数。 qp死亡概率年生存概率1 年初人口数 该年活满一
15、年的人数 研究生医学统计学生存分析20 生存率生存率 (survival rate)(survival rate) ( ( 累积生存概率累积生存概率 cumulative cumulative probability of survival )probability of survival ) 指病人经历指病人经历t t个单位时间后仍存活个单位时间后仍存活 的概率。的概率。 生存概率指单个时段的概率,生存概率指单个时段的概率, 生存率指从生存率指从0 0t t多个时段的积累概率多个时段的积累概率。 2. 2. 生存率及其标准误生存率及其标准误 研究生医学统计学生存分析21 生存率与生存概率仅一
16、字之差,含义却生存率与生存概率仅一字之差,含义却 是不同的。是不同的。 生存概率是针对单位时间而言的,生生存概率是针对单位时间而言的,生 存率是针对某个较长时间段的,它是生存概存率是针对某个较长时间段的,它是生存概 率的累积结果。率的累积结果。 如评价肿瘤预后常用的如评价肿瘤预后常用的5 5年生存率,年生存率, 是指第是指第1 1年存活、第年存活、第2 2年也存活,年也存活,直至,直至 第第5 5年仍存活的累积概率,而这年仍存活的累积概率,而这5 5年间每年间每1 1年年 有不同的生存概率。有不同的生存概率。 研究生医学统计学生存分析22 如数据中无删失,生存率可用下式计算如数据中无删失,生存
17、率可用下式计算 如果有删失数据,则需分时段计算不同单位如果有删失数据,则需分时段计算不同单位 时间的生存概率时间的生存概率P Pi i(i=1,2,(i=1,2,t),t),然后利用然后利用 概率乘法原理将概率乘法原理将P Pi i相乘得到相乘得到t t时刻生存率。时刻生存率。 S ( t ) = P (T tk ) = p1 p2 pk 时刻内观察总例数 时刻仍存活例数 t t tTPtS)()( 研究生医学统计学生存分析23 例如手术治疗例如手术治疗5050例肺癌病人,术后例肺癌病人,术后1 1,2 2,3 3年的年的 死亡数分别为死亡数分别为1010,1010,1010例,无截尾数据。例
18、,无截尾数据。 试求各年的试求各年的 生存概率和生存概率和3 3年生存率。年生存率。 解:解: 各年生存概率各年生存概率 p p1 1 = ( 50 10 ) / 50, = ( 50 10 ) / 50, p p2 2 = ( 40 10 ) / = ( 40 10 ) / 40, 40, p p3 3 = ( 30 10 ) / = ( 30 10 ) / 3030 3 3 年生存率年生存率 S(3) = P(T 3) S(3) = P(T 3) ( (n n0 0-d-d)/)/N N = ( 50 30 ) / = ( 50 30 ) / 50 = 0.400050 = 0.4000
19、或或 S(3) = S(3) = p p1 1 p p2 2 p p3 3 = 0.4000 = 0.4000 研究生医学统计学生存分析24 生存率的标准误 生存率置信区间 k j jjj j k k j jj j kk dnn d tS np q tStSSE 1 00 1 0 )( )( )()( 2 ( ) ( )S tZSE S t 研究生医学统计学生存分析25 生存曲线 以生存时间为横轴,生存率为纵轴绘制的 曲线 (a)研究终止在475天 (b) 研究终止在474天 图12-3 乘积极限法生存曲线(阶梯形阶梯形)及其半数生存期(Md=158天) 0100200300400500 t
20、(day) 0.0 0.2 0.4 0.6 0.8 1.0 S(t) S(132)=0.5 0100200300400500 t (day) 0.0 0.2 0.4 0.6 0.8 1.0 S(t) Md=158 012345 t (year) 0.0 0.2 0.4 0.6 0.8 1.0 S(t) Md=1.7 图12-4 寿命表法生存曲线(折线折线)及其半数生存期(Md=1.7年) 研究生医学统计学生存分析26 生存曲线给我们的信息 阶梯状;每一级阶梯代表一个死亡时间点阶梯状;每一级阶梯代表一个死亡时间点 ( (在截尾时间点无在截尾时间点无 阶梯阶梯) );如果最大时间点是截尾则生存曲线
21、不与曲线相交(见;如果最大时间点是截尾则生存曲线不与曲线相交(见 下图),否则与横轴相交。下图),否则与横轴相交。 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0123456 Time (Years) Death Censored 研究生医学统计学生存分析27 Median SurvivalMedian Survival 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0123456 Time (Years) 1.8 Years 生存曲线给我们的信息 研究生医学统计学生存分析28 3. 半数生存期及四分位数间距
22、半数生存期及四分位数间距 半数生存期也称中位生存期(半数生存期也称中位生存期(median survival median survival time)time), 即生存时间中位数,表示恰好有即生存时间中位数,表示恰好有50%50%的个的个 体活过此时间,即生存率为时对应的生存体活过此时间,即生存率为时对应的生存 时间(集中趋势指标)。其数值可借助生存曲线时间(集中趋势指标)。其数值可借助生存曲线 进行粗略的图表法估计,或用线性内插法求解精进行粗略的图表法估计,或用线性内插法求解精 确的数值。删失数据超过样本量的确的数值。删失数据超过样本量的50%50%时,无法估时,无法估 计中位生存时间。
23、此时较为实际的做法是使用生计中位生存时间。此时较为实际的做法是使用生 存时间超过一给定时间长度的概率(如存时间超过一给定时间长度的概率(如3 3年生存率年生存率 或或5 5年生存率)年生存率) 生存期的四分位数间距生存期的四分位数间距t t t t, , 反映离散程度大小反映离散程度大小 研究生医学统计学生存分析29 三、资料的基本要求三、资料的基本要求 1. 1. 死亡例数(或死亡比例)不宜太少,死亡例数(或死亡比例)不宜太少, 否否 则宜出现偏性;则宜出现偏性; 2.2. 截尾原因无偏性;截尾原因无偏性; 3.3. 生存时间尽可能记录精确生存时间尽可能记录精确 研究生医学统计学生存分析30
24、 常用的两种方法常用的两种方法: : 1.1.乘积极限法,即乘积极限法,即kaplan-Meierkaplan-Meier法法 (小样本时)(小样本时) 2.2.寿命表法寿命表法 (大样本时)(大样本时) 研究生医学统计学生存分析31 第二节小样本生存率的第二节小样本生存率的 kaplan-Meierkaplan-Meier估计估计 研究生医学统计学生存分析32 乘积极限法乘积极限法(product-limit method)(product-limit method)又称又称 Kaplan-Meier Kaplan-Meier 法,由法,由KaplanKaplan和和MeierMeier于于
25、 19581958年提出年提出 ,主要针对小样本资料,也可,主要针对小样本资料,也可 用于大样本,是一种非参数方法。用于大样本,是一种非参数方法。 基本思想:将生存时间由小到大依次排列,基本思想:将生存时间由小到大依次排列, 在每个死亡点上在每个死亡点上,计算其期初人数、死亡,计算其期初人数、死亡 人数、死亡概率、生存概率和生存率。人数、死亡概率、生存概率和生存率。 研究生医学统计学生存分析33 11名接受“手术+化疗”治疗的乳腺癌患者的生存时间: 10,14,15,16+,19,19,20,20+,24,26,28 序序 号号 时间时间 ( (月月) ) 死死 亡亡 数数 删删 失失 数数
26、期初例期初例 数数 生存概率生存概率生存率生存率标准误标准误 i it ti id di ic ci in ni iP Pi i=(n=(ni i-d-di i)/n)/ni iS(tS(ti i) )SE(S(tSE(S(ti i) 1 110101 10 0111110/11=0.909110/11=0.90910.90910.90910.08670.0867 2 214141 10 010109/10=0.90009/10=0.90000.81820.81820.11630.1163 3 315151 10 09 98/9=0.88898/9=0.88890.72730.72730.13
27、430.1343 4 41616+ +0 01 18 88/8=1.00008/8=1.00000.72730.72730.13430.1343 5 519192 20 07 75/7=0.71435/7=0.71430.51950.51950.15690.1569 6 620201 10 05 54/5=0.80004/5=0.80000.41560.41560.15620.1562 7 72020+ +0 01 14 44/4=1.00004/4=1.00000.41560.41560.15620.1562 8 824241 10 03 32/3=0.66672/3=0.66670.277
28、10.27710.15370.1537 9 926261 10 02 21/2=0.50001/2=0.50000.13850.13850.12450.1245 101028281 10 01 10/1=0.00000/1=0.00000.00000.0000- 研究生医学统计学生存分析34 1952.19, 5 . 05195. 0 4196. 05195. 0 19 2019 m m t t 中位生存期 3911.24, 75. 08182. 0 7273. 08182. 0 14 1514 75 75 t t 7503.14, 25. 02771. 0 1385. 02771. 0 24
29、 2624 25 25 t t 研究生医学统计学生存分析35 k j jjj j k k j jj j kk dnn d tS np q tStSSE 1 00 1 0 )( )( )()( 研究生医学统计学生存分析36 (a)研究终止在475天 (b) 研究终止在474天 图12-3 乘积极限法生存曲线(阶梯形阶梯形)及其半数生存期(Md=158天) 0100200300400500 t (day) 0.0 0.2 0.4 0.6 0.8 1.0 S(t) S(132)=0.5 0100200300400500 t (day) 0.0 0.2 0.4 0.6 0.8 1.0 S(t) Md=
30、158 0 00 0 研究生医学统计学生存分析37 第三节第三节 大样本生存率的大样本生存率的 寿命表法估计寿命表法估计 寿命表法寿命表法(life-table method)(life-table method)的的 应用早于应用早于KaplanKaplanMeierMeier法,它是法,它是KaplanKaplan MeierMeier法的近似方法法的近似方法( (频数表法频数表法) ) 研究生医学统计学生存分析38 1 0 1 00 ( (1)(1) (1) () k j kk j jj k j k j jjj q SE S tS t p n d S t nnd 研究生医学统计学生存分析
31、39 图图12-4 12-4 寿命表法生存曲线寿命表法生存曲线( (折线折线) )及其半数生存期(及其半数生存期(Md=1.7Md=1.7年)年) 012345 t (year) 0.0 0.2 0.4 0.6 0.8 1.0 S(t) Md=1.7 寿命表法只估计时段右端点的生存右端点的生存 率率,省略了时段内的生存率估计 研究生医学统计学生存分析40 第四节第四节 生存曲线比较的假设检验生存曲线比较的假设检验 Log rank(Log rank(时序时序) ) 检验检验(也称为(也称为Cox-MantelCox-Mantel检验)检验) BreslowBreslow检验检验(也称(也称BreslowBreslow广义广义WilcoxonWilcoxon检验检验 ) 研究生医学统计学生存分析41 2121例乳腺癌患者两种疗法的生存时间(月)例乳腺癌患者两种疗法的生存时间(月) 手手 术术 组组 6 69 913131515181819191919202022222424 手手 术术 + + 化化 疗疗 组组 10101414151
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学生会创业实践部工作总结模版
- 人类命运共同体心得体会模版
- 有关消防法的试题及答案
- 永旺消防考试题目及答案
- 肿瘤免疫逃逸机制与干预策略
- 垂体腺瘤护理要点解析
- 阳江公务员考试题及答案
- 宣城国企面试题库及答案
- 信阳市公务员试题及答案
- 中外合资企业分析师职位聘用协议
- 2024年西安曲江二小教师招聘真题
- 四川省2025届高三第二次联合测评-英语试卷+答案
- 新版《医疗器械经营质量管理规范》(2024)培训试题及答案
- 【MOOC】运动与健康-湖北大学 中国大学慕课MOOC答案
- 中考英语688高频词大纲词频表
- 一年级下册口算题卡大全(口算练习题50套直接打印版)
- 清产核资基础报表(模板)
- 传感器与测试技术课程设计1
- 航空公司《维修工作程序》维修工时管理程序
- 钢结构有限公司安全生产标准化全套规章制度
- 简约风世界博物馆日宣传教育PPT专题汇报
评论
0/150
提交评论