生存分析统计学(课堂PPT)_第1页
生存分析统计学(课堂PPT)_第2页
生存分析统计学(课堂PPT)_第3页
生存分析统计学(课堂PPT)_第4页
生存分析统计学(课堂PPT)_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.1复复 习习 LogisticLogistic回归模型是一种概率模型,适合于病例对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类的。 可用影响结果变量发生的因素为自变量与因变量建立回归方程。.2复复 习习 1. Logistic回归分析的数据结构 2. Logistic回归分析的模型 3. 筛选变量的常用方法 4. Logistic回归分析的结果解释.3目的:目的:作出以多个自变量(影响因素)估计应变量(结果变量)的logistic回归方程资料:资料:1. 应变量为反映某现象发生与不发生的二值变量;2. 自变量(影响因素)可能是二值数据或等级资料或计量资料。分类变量

2、要数量化用途:用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系.41. Logistic1. Logistic回归模型的数据结构 设资料中有一个因变量Y、p个自变量X1, X2,Xp,对每个实验对象共有n次观测结果,可将原始资料列成表1形式。.5 表1. LogisticLogistic回归模型的数据结构实验对象 Y X1 X2 X3 . XP 1 Y1 a11 a12 a13 a1p 2 Y2 a21 a22 a23 a2p 3 Y3 a31 a32 a33 a3p n Yn an1 an2 an3 anp 其中:Y取值是二值或多项分类.6 表2. 肺癌与危险因素的调查分析

3、例号 是否患病 性别 吸烟 年龄 地区 1 0 1 0 30 0 2 0 0 1 46 1 3 1 0 0 35 1 30 1 0 0 26 1 是否患病:1代表否, 0代表是 性 别:1代表男, 0代表女 吸 烟:1代表吸烟,0代表不吸烟 地 区:1代表农村,0代表城市 .7 表3. 配对资料(1:1)对子号 病例 对照 X1 X2 X3 X1 X2 X3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0注:X1蛋白质摄入量,取值:0,1,2,3 X2不良饮食习惯,取值:0,1,2,3 X3 精 神 状 况,取值:0,1,2 .

4、82 2、 LogisticLogistic回归模型回归模型 令: Y=1 发病(阳性、死亡、治愈等) Y=0 未发病(阴性、生存、未治愈等) 将发病(Y=1)的概率记为P,它与自变量x1, x2,xp之间的Logistic回归模型为: )exp(1)exp(110110ppppXXXXP ppXXPP 110)1/(ln.9定义:为Logistic变换,即: )1/(ln)(PPPLogitppXXPLogit 110)(2.Logistic2.Logistic回归的模型回归的模型.103.3.筛选变量的常用方法筛选变量的常用方法 向前法(forward selection) 后退法(bac

5、kward selection) 逐步回归法(stepwise selection).11Variables in the Equation.143.0479.3881.0021.1541.0531.265-6.0431.9669.4481.002.0023.0211.3754.8301.02820.5051.386303.296.149.0547.7201.0051.1611.0451.289-7.4032.5228.6151.003.001X3ConstantStep1aX2X3ConstantStep2bBS.E.WalddfSig.Exp(B)LowerUpper95.0% C.I.f

6、or EXP(B)Variable(s) entered on step 1: X3.a. Variable(s) entered on step 2: X2.b. 4.Logistic4.Logistic回归的结果解释回归的结果解释.124.Logistic4.Logistic回归的结果解释回归的结果解释 设第i个因素的回归系数为bi,表示当有多个自变量存在时,其它自变量固定不变的情况下,自变量Xi每增加一个单位时,所得到的优势比的自然对数。也就是其它自变量固定不变的情况下,自变量Xi每增加一个单位时,影响因变量Y=0发生的倍数 设第i个因素的回归系数为bi 当bi0时,对应的优势比ORi=

7、exp(bi)1,说明该因素是危险因素; 当bi0时,对应的优势比ORi=exp(bi)4)=P1=32/35=0.914286第二行的生存率S(T5)=P1P2=32/3530/32=0.8571437.计算各生存率的标准误。说明抽样误差的大小,式中n为样本含量,i为秩次, .57编秩编秩(1)生 存 月生 存 月数数(2)期 初 病期 初 病例数例数(3)死 亡 例死 亡 例数数(4)死 亡 概死 亡 概率率(5)生 存 概生 存 概率率(6)生 存 率生 存 率(7)生存率标生存率标准误准误(8)1-343533/3532/350.9142860.0473184-553222/3230/

8、320.059149683011/3029/300.8285710.0637057-992933/2926/290.7428570.07387610102611/2625/260.7142860.07636011112511/2524/250.6857140.07846912-14122433/2421/240.6000000.0828081512+2100/2121/210.6000000.08280816132011/2019/200.5700000.08392617141911/1918/190.5400000.08470118-19161822/1816/180.4800000.085

9、25620171611/1615/160.4500000.085042表表8.Kaplan-meier法计算生存率法计算生存率0.857143如第二行和第九行如第二行和第九行 有截尾值时(有截尾值时(12+12+),计算),计算sp(T13)sp(T13)时不累计时不累计1/(n-1/(n-15)(n-15+1)15)(n-15+1)0591485. 0) 1535)(535(1.) 1235)(235(1) 1135)(135(18571429. 0)5(2/1Tsp0839260. 0) 11635)(1635(1) 11435)(1435(1.) 1235)(235(1) 1135)(1

10、35(15700000. 0)13(2/1Tsp.59编秩编秩(1)生 存 月生 存 月数数(2)期 初 病期 初 病例数例数(3)死 亡 例死 亡 例数数(4)死 亡 概死 亡 概率率(5)生 存 概生 存 概率率(6)生 存 率生 存 率(7)生存率标生存率标准误准误(8)1-343533/3532/350.9142860.0473184-553222/3230/320.059149683011/3029/300.8285710.0637057-992933/2926/290.7428570.07387610102611/2625/260.7142860.07636011112511/25

11、24/250.6857140.07846912-14122433/2421/240.6000000.0828081512+2100/2121/210.6000000.08280816132011/2019/200.5700000.08392617141911/1918/190.5400000.08470118-19161822/1816/180.4800000.08525620171611/1615/160.4500000.085042表表8.Kaplan-meier法计算生存率法计算生存率0.857143.60编 秩编 秩(1)(1)生存月生存月数数(2)(2)期初病期初病例数例数(3)(3

12、)死亡例死亡例数数(4)(4)死 亡死 亡概 率概 率(5)(5)生存概生存概率率(6)(6)生 存 率生 存 率(7)(7)生 存 率生 存 率标 准 误标 准 误(8)(8)2121191915151 11/151/1514/1514/150.4200000.4200000.0844980.08449822-2322-23202014142 22/142/1412/1412/140.3600000.3600000.0823930.0823932424222212121 11/121/1211/1211/120.3300000.3300000.0808040.080804252523+23+

13、11110 00/110/1111/1111/110.3300000.3300000.0808040.0808042626242410101 11/101/109/109/100.2970000.2970000.0791760.079176272724+24+9 90 00/90/99/99/90.2970000.2970000.0791760.07917628-2928-2926268 82 22/82/86/86/80.2227500.2227500.0747900.074790303030+30+6 60 00/60/66/66/60.2227500.2227500.0747900.07

14、4790313132325 51 11/51/54/54/50.1782000.1782000.0718860.071886212136364 41 11/41/43/43/40.1336500.1336500.0662970.06629733-3533-3536+36+3 30 00/30/33/33/30.1336500.1336500.0662970.066297PjPj小样本生存分析小样本生存分析 Kaplan-MeierKaplan-Meier方法在方法在SPSSSPSS中的实现中的实现生存状态:生存状态:1 1死亡,死亡,0 0截尾截尾SPSS SPSS 软件实现方法软件实现方法

15、FileOpenFileOpen相应数据文件相应数据文件 Analyze SurvivalKaplan-Meier Analyze SurvivalKaplan-Meier Time(Time(时间时间)Status Define event )Status Define event single value(1) Continue OKsingle value(1) Continue OKM Me ea an ns s a an nd d M Me ed di ia an ns s f fo or r S Su ur rv vi iv va al l T Ti im me e246.6677

16、5.00699.654393.679133.00043.27448.182217.818EstimateStd. ErrorLower BoundUpper Bound95% Confidence IntervalEstimateStd. ErrorLower BoundUpper Bound95% Confidence IntervalMeanaMedianEstimation is limited to the largest survival time if it is censored.a. 2.2.寿命表法寿命表法(Life table methodLife table method

17、) 简称LT法。 基本思想:基本思想:随访时间划分成若干个时间区间,t时刻的生存率为t时刻前各时间区间生存概率的乘积。 应用条件:应用条件:数据已总结成若干时段的频数表形式,或样本量较大。 例1:某临床试验对20名第III或第IV期黑色素瘤的患者进行随访研究,截至研究期结束,记录的生存资料见下表,试计算100周的生存率。(大样本)(大样本)2.2.寿命表法寿命表法(Life table methodLife table method).68表表1. 201. 20名第名第IIIIII或第或第IVIV期黑色素瘤的患者的期黑色素瘤的患者的治疗后的生存时间(周)治疗后的生存时间(周)12.8077.

18、2015.6082.4024.00+87.20+26.4094.40+29.2097.20+30.80+106.00+39.20114.80+42.00117.20+58.40+140.00+72.00+168.00+.69 建立数据文件“生存分析.sav.sav” 定义两个变量: 反应变量,即生存时间变量,“time”time” 分类变量,即生存状态变量,“status”status”.70AnalyzeSurvivalLifeTables.71.72L Li if fe e T Ta ab bl le ea a20020.0002.10.90.90.0718217.0003.18.82.7

19、4.1013112.5001.08.92.68.1111110.5001.10.90.62.12937.5001.13.87.53.13533.5000.001.00.53.13202.0000.001.00.53.13211.5000.001.00.53.1311.5000.001.00.53.13Interval Start Time020406080100120140160NumberEnteringIntervalNumberWithdrawingduring IntervalNumberExposedto RiskNumber ofTerminalEventsProportionTe

20、rminatingProportionSurvivingCumulativeProportionSurviving atEnd of IntervalStd. Error ofCumulativeProportionSurviving atEnd of IntervalThe median survival time is 160.0000a. .07.005.003.01.00.10.008.004.01.01.11.003.003.00.00.12.003.003.01.00.13.004.004.01.01.13.000.000.00.00.13.000.000.00.00.13.000

21、.000.00.00.13.000.000.00.00Std. Error ofCumulativeProportionSurviving atEnd of IntervalProbabilityDensityStd. Error ofProbabilityDensityHazard RateStd. Error ofHazard Rate本例题的本例题的100100周周生存率为生存率为53%53%.73.74非参数方法非参数方法: 对数秩检验对数秩检验 ( (log-rank test)log-rank test) 广义广义WilcoxonWilcoxon检验检验 似然比(似然比(Likel

22、ihood ratio)Likelihood ratio)检验检验生存率组间比较实际上是对两条或多条生存曲线生存率组间比较实际上是对两条或多条生存曲线的分布情况比较(齐性检验)的分布情况比较(齐性检验)参数法要求生存时间已知服从于某种概率分布;非参数法对资料的分布没有要求,适用面比较广。 例题:22例非小细胞肺癌患者在不同日期经随机化分配到放疗组和放化疗联合组,从缓解出院日开始随访,随访时间(月)见下表,试比较放疗和放化疗联合两种治疗方案的生存率曲线有无差别。 甲(放疗组):1,2,3,5,6,9+,11,13,16,26,37+ 乙(放化疗联合组):10,11+,14,18,22,22,26,32,38,40+,42+选择检验方法选择检验方法Log-rankt

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论