医学统计学:随机资料的生存分析_第1页
医学统计学:随机资料的生存分析_第2页
医学统计学:随机资料的生存分析_第3页
医学统计学:随机资料的生存分析_第4页
医学统计学:随机资料的生存分析_第5页
已阅读5页,还剩57页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/10/1812023/10/182复习Logistic回归模型是一种概率模型,适合于病例—对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类。可用影响结果变量发生的因素为自变量与因变量,建立回归方程。2023/10/183

设资料中有一个因变量y、p个自变量x1,x2,…,xp,对每个实验对象共有n次观测结果,可将原始资料列成表1形式。Logistic回归模型的数据结构2023/10/184

表1Logistic回归模型的数据结构实验对象y

X1X2X3….XP

1y1a11a12a13…a1p

2y2a21a22a23…a2p

3y3a31a32a33…a3p

nynan1an2an3…anp

其中:y取值是二值或多项分类5

定义:Logistic变换,即:

2023/10/186SPSS操作步骤:Analyze-----Regression-----BinaryLogistic-----Dependent框(y)-----Covariates框(x1,x2,…)------ok782023/10/189引例现用新旧两种方法治疗某癌病患者各100人,结果如下表,试评价其疗效表3新旧两种方法治疗某癌病治疗方法死亡人数新法组旧法组RR一年16151.01二年2535

0.70

五年40800.50*2023/10/1810

第二十二章随访资料的生存分析一、基本概念本章主要授课内容二、生存资料常计算的几种率三、生存率估计(描述)

五、Cox回归分析(Coxregression)四、生存率的比较(假设检验)2023/10/1812一、基本概念生存时间(survivaltime):疾病治疗的预后情况,一方面看结局好坏,另一方面还要看出现这种结局所经历的时间长短。所经历的时间称为生存时间。完全与不完全数据一部分研究对象可观察到死亡,从而得到准确的生存时间,所提供的信息是完全的,称为完全数据;另一部分病人由于失访、意外事故、或到观察结束时仍存活等原因,无法知道确切的生存时间,它提供了不完全的信息,称为不完全数据(截尾数据、删失数据:censordata)。2023/10/1813始点终点2023/10/1814始点终点2023/10/1815生存分析(survivalanalysis):生存时间一般是通过随访收集。不完全数据提供了部分信息。须要用专门的方法进行统计处理,这类统计方法起源于对寿命资料的统计分析,故称为生存分析。2023/10/1816

“生存”的概念

生物生存与死亡

仪器始使正常与出现故障疾病产生与治愈疾病治愈与复发

阴性与阳性 2023/10/1817起始事件

随访时间

终点事件

疾病确诊 死亡治疗开始 死亡 治疗开始痊愈 接触危险物出现反映 2023/10/1818

截尾数据的处理

因为不太好处理截尾数据,很多临床研究工作者常常将失访或中止等原因造成的截尾数据在分析时抛弃。截尾数据提供的信息虽然是不完全的,但也很有价值,不应随便删掉它。2023/10/1819

例某研究者追踪100名病人经治疗后的生存情况,第1年有30人死亡,第3年时,有20人死亡,有40人失访(退出观察),10人存活。试估计其生存率。表4是否去掉截尾数据不同情况去掉截尾数据不去掉截尾数据

n=60n=100

生存数生存率生存数生存率

1年3030/60=50%7070/100=70%

3年1010/60=13%10?2023/10/1820随访记录表

随访资料记录记录的项目通常包括处理组别,开始观察日期,终止观察日期,结局,生存时间等。

2023/10/1821表49例病人的随访记录病号性别开始日期终止日期结局处理

1男08/31/8210/31/89死亡手术

2男08/31/8208/28/86失访非手术

3女10/30/8303/31/90死亡非手术

4男12/01/8410/01/87死亡非手术

5女01/01/8410/01/88死亡手术

6男07/01/8510/01/88死亡手术

7男08/31/8712/30/90生存手术

8女07/11/8612/17/90死亡手术

9男08/31/8610/01/90死亡非手术2023/10/1822表59例病人随访记录的数据库nsextimeoutcometreat1171121400306104131050411613117130180411914102023/10/1823表6膀胱肿瘤患者生存资料变量赋值表变量(1)因素(2)分组及赋值(3)age年龄岁grade肿瘤分级I级:1;II级:2;III级:3size肿瘤大小(cm)<3.0:0;≥3.0:1relapse是否复发未复发:0;复发:1start手术日期月/日/年end终止观察日期月/日/年t生存时间月status生存结局删失:0;死亡:12023/10/1824表76例膀胱肿瘤患者生存资料原始记录表id(1)age(2)grade(3)size(4)relapse(5)start(6)end(7)t(8)status(9)结局(10)16210002/10/199612/30/2000590存活26410003/05/199608/12/2000541死亡35220104/09/199612/03/1999440失访46010006/06/199610/27/2000530死于其它55921007/20/199606/21/1998231死亡65911108/19/199609/10/1999371死亡2023/10/1825

生存分析的主要内容

第一,描述生存过程

研究生存时间的分布特点,估计生存率,生存曲线;

第二,比较生存过程(假设检验)

对两组或多组生存率进行比较;

第三,影响生存时间的因素分析

了解影响生存过程的主要因素为改善预后提供指导。2023/10/1826例在对资料进行描述时:

5名癌症患者存活时间(月)

610142020n=5平均生存时间,mean=18,median=1478+2535

+50

当有截尾数据时,?2023/10/1827

死亡概率

(mortalityprobability)是指死于某时段内的可能性大小.记为q,年死亡概率计算公式为:某年内死亡数

q=───────某年年初人口数

若年内有删失,则分母用校正人口数:校正人口数=年初人口数-1/2删失数

二、生存资料常计算的几种率2023/10/1828死亡概率(2)死亡概率是指已活满t时刻的个体,在此后一段时期内(t至)死亡的可能性。死亡概率的计算公式为2023/10/1829若t至内有截尾值,上式的死亡概率也偏低,可对分母加以调整,为:如果很短,即时,死亡概率为t时刻的瞬时死亡概率,或称为危险函数(hazardfunction,h(t)),其意义为刚刚活过t时刻的个体在t时刻死亡的概率。2023/10/1830

生存概率

(survivalprobability)表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小,记为p。年生存概率计算公式为:活满某一年人数

p=1-q=────────某年年初人口数若年内有删失,则分母用校正人口数。2023/10/1831若在t至时段内有截尾值,也应计算调整生存概率生存概率与死亡概率之间有以下关系:p=1-q2023/10/1832生存率与生存函数累积生存概率,简称生存率,是指病人经过t个时间单位之后仍存活的概率。若令s(t)为任意时刻t的生存率,T为生存期,得s(t)=p(T≥t)0≤t<∞,称s(t)为生存率函数,简称生存函数2023/10/18332023/10/1834三、生存率估计(描述)

医学研究中的生存资料分布常常不规则、不确定或未知分布,因而常用非参数法估计生存率。根据样本含量的大小可分别选择乘积极限估计法(小样本时)寿命表法(大样本时)2023/10/18351.乘积限估计法

Product-limitmethod简称积限法或PL法,直接用概率乘法原理估计生存率,它是由统计学家Kaplan和Meier于1958年首先提出的,因此又称为Kaplan-Meier法.基本思想:将生存时间(包括截尾数据)逐个由小到大依次排列,并对其中的每个死亡点进行死亡概率、生存概率和生存率估计。应用条件:数据个数较少时。2023/10/18362.寿命表法

(Lifetablemethod)

简称LT法。基本思想:随访时间划分成若干个时间区间,t时刻的生存率为t时刻前各时间区间生存概率的乘积。应用条件:数据个数多,经分组时应用。2023/10/18373.Kaplan-meier法计算生存率此法计算生存率时,先将每个个体的生存时间按照由小到大的顺序排列,排序时若截尾值与非截尾值的观察时间相同,则规定非截尾值小于截尾值,排在截尾值之前。然后依次计算出各时段的死亡概率、生存概率,进而计算从观察开始至各时刻的生存率及其标准误。2023/10/1838某研究者对肺癌病人嗜酸粒细胞(EC)阳性与阴性病病人的生存情况进行了分析,26名EC阴性与35名EC阳性病人的生存时间资料如下,试计算两组病人的生存率。26名EC阴性患者观察期内全部死亡,其生存月数数分别为:0.3,1,2,2,3,3,4,4,4,4,6,6,6,7,7,7,7,8,8,11,12,12,14,18,21,2435名EC阳性患者观察期内28人死亡,另外人生存时间为截尾值。生存月数分别为:

4,4,4,5,5,8,9,9,9,10,11,12,12,12,12+,13,14,16,16,17,19,20,20,22,23+,24,24+,26,26,30+,32,36,36+,36+以35名阳性患者的生存率计算过程为例,见下表。39编秩1生存月数2期初病例数3死亡例数4死亡概率5生存概率6生存率7生存率标准误81-343533/3532/350.9142860.0473184-553222/3230/320.8571430.059149683011/3029/300.8285710.0637057-992933/2926/290.7428570.07387610102611/2625/260.7142860.07636011112511/2524/250.6857140.07846912-14122433/2421/240.6000000.0828081512+2100/2121/210.6000000.08280816132011/2019/200.5700000.08392617141911/1918/190.5400000.08470118-1916

1822/1816/180.4800000.08525620171611/1615/160.4500000.085042表8Kaplan-meier法计算生存率2023/10/1840编秩1生存月数2

期初病例数3死亡例数4死亡概率5生存概率6生存率7

生存率标准误821191511/1514/150.4200000.08449822-23201422/1412/140.3600000.08239324221211/1211/120.3300000.0808042523+1100/1111/110.3300000.08080426241011/109/100.2970000.0791762724+900/99/90.2970000.07917628-2926822/86/80.2227500.0747903030+600/66/60.2227500.0747903132511/54/50.1782000.0718862136411/43/40.1336500.06629733-3536+300/33/30.1336500.0662972023/10/1841计算步骤病人按生存时间由小到大依次排列并编秩。计数各时段开始观察时的病例数,如第三列。此列可由下至上累计计数。写出各时段的死亡例数,截尾值因患病没有死,所以都是0计算。计算各时段的死亡概率q,得第五列。按式p=1-q计算各时段的生存概率,得第六列2023/10/18426.计算病人从观察开始活过各时点t的生存率S(t)。从观察开始至某时点的生存率为此前各阶段的生存概率的连乘积,按式第一行的生存率S(T>4)=P1=32/35=0.914286第二行的生存率S(T>5)=P1×P2=32/35×30/32=0.8571437.计算各生存率的标准误。其说明抽样误差的大小,式中n为样本含量,i为秩次,2023/10/1843小样本生存分析Kaplan-Meier方法在SPSS中的实现生存状态:1死亡,0截尾2023/10/1844SPSS软件实现方法

File→Open→相应数据文件→Analyze→Survival→Kaplan-Meier→Time(时间)→Status→Defineevent→singlevalue(1)→Continue→OK2023/10/18452023/10/1846选择选项2023/10/18472023/10/1848例1:某临床试验对20名第III或第IV期黑色素瘤的患者进行随访研究,截至研究期结束,记录的生存资料见下表,试计算100周的生存率。4.大样本寿命表法2023/10/1849表120名第III或第IV期黑色素瘤的患者的治疗后的生存时间(周)12.8077.2015.6082.4024.00+87.20+26.4094.40+29.2097.20+30.80+106.00+39.20114.80+42.00117.20+58.40+140.00+72.00+168.00+2023/10/1850建立数据文件“生存分析.sav”

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论