




已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生存分析的SAS编程操作,薛富波2006/05/21,1,生存分析的有关概念,事件时间(time-to-event,TTE):又称为生存时间(survivaltime)或失效时间(failuretime),是指从研究开始到相应事件发生的时间。删失值(censoredvalue):是指TTE在某些观测上其确切的取值是未知的,所能知道的仅仅是其测量值肯定大于或小于某个特定值(即其取值的下限或上限),或者位于某个特定的取值范围内(取值区间)。右侧删失:反映真实值下限的数据。左侧删失:反映真实值上限的数据。区间删失:反映真实值所在区间的数据。,2,生存分析的方法分类,非参数法:乘积极限法、寿命表法等;参数法:指数分布法、威布尔分布(WeibullDistribution)法、对数正态回归分析法以及对数logistic回归分析法等;半参数法:Cox模型分析方法。,3,生存分析方法的SAS过程,非参数法:lifetest过程;参数法:lifereg过程;半参数法:phreg过程。,4,生存分析的非参数方法,5,非参数法生存分析示例1,45例乳腺癌患者中,免疫过氧化物酶检测结果显示9例阳性、36例阴性,比较其生存时间分布的SAS程序如下。,proclifetestplots=(s);timetime*censor(1);strataimmuno;run;,6,非参数法生存分析示例2,proclifetestdata=valungmethod=lt;timesurvtime*censor(1);stratacell;run;,一项有关肺癌患者生存天数的临床研究数据。应变量survtime表示患者生存天数,其中的负值表示删失值;协变量包括cell(细胞类型)、治疗方法therapy(标准方法和试验方法)、既往治疗prior(0-无,10-有)、年龄age(岁)、诊断月数diagtime(确诊至入组时的以月为单位的时间间隔)、KPS评分kps等。数据中产生一个删失值指示变量censor(取1表示删失,取0表示非删失),一个治疗分组变量treatment(0表示标准方法,1表示试验方法)。,7,lifetest过程,用以对右侧删失类型的时间数据进行时间分布的描述以及多组间时间分布的比较(检验两个或多个样本是否来自具有同一个生存函数的总体);提供两种秩检验方法和一种似然比检验方法来检验多组生存函数的同一性,两种秩检验方法为包括广义Savage(指数得分)检验(即log-rank检验)和Wilcoxon检验。,8,lifetest过程可包含的语句,9,proclifetest语句,proclifetest语句为调用lifetest过程的开始,其主要语句选项及其可执行的功能见下表。,10,proclifetest语句的主要选项,11,intervals=选项的设置方法,端点值间以空格分隔,如“intervals=10305070”;端点之间以逗号分隔,如“intervals=10,30,50,70”;“atob”的形式,如“intervals=1to7”;“atobbyc”的形式,如“intervals=1to7by2”;混合方式,如“intervals=1,3to7,10”。,12,plots=选项的绘图类型,13,strata语句,strata语句的作用是指定用以分层的变量;lifetest过程根据strata变量的非缺失值对输入数据进行分层;如果要将strata变量的缺失值也作为一个合法的水平用以分层,可在strata语句中设置“missing”选项;strata语句中可指定多个分层变量,分层情况将由各分层变量水平的组合来决定;对于数值型分层变量,若为其设置分层区间端点列表,该变量的水平与形成的区间一一对应,设置方式与proclifetest语句的“intervals=”选项中类似;对于数值型分层变量,若为其设置分层区间端点列表,该变量的水平与形成的区间一一对应。所划分的区间均为半开半闭区间,第一个区间总是以-为下界,最后一个区间总是以为上界。,14,strata语句分层区间端点列表设置方式,端点值间以空格分隔,如:strataage(5102030);端点之间以逗号分隔,如:strataage(5,10,20,30);“atob”的形式,如:strataage(5to10);“atobbyc”的形式,如:strataage(5to30by10);混合方式,如:strataage(5,10to50by10);举例:stratawt(50to80by10);此时变量wt将按照如下的5个区间划分成5个水平:,15,test语句,test语句指定需要与生存时间进行关联性分析的协变量;test语句中的变量必须为数值型;对于test变量,lifetest过程将通过两类秩检验统计量来检验它们与生存时间的关联性;每一个test变量的单变量检验的统计量也将被给出;一个有关协变量联合效应的统计量列表也将被给出,此统计量列表的顺序和各协变量对联合效应贡献的大小顺序相一致。,16,time语句,time语句为调用lifetest过程所必需,用以指定代表生存时间的变量。time语句具有如下的形式:timevariable;其中“variable”即为生存时间变量的名称,此变量名称必须指定;随后的星号“*”及“censor(list)”项可有可无,用来表示数据的删失值情况。“censor”为代表删失值状况的变量名称,“(list)”为该变量的部分取值列表(须为数值型,且不是缺失值),如果此变量取该列表中的值,则该观测上的生存时间为删失值;此处的删失值均表示右侧删失值。,17,生存分析的半参数方法,18,半参数法生存分析示例1,procphregdata=Myeloma;modelTime*VStatus(0)=LogBUNHGBPlateletAgeLogWBCFracLogPBMProteinSCalc/selection=stepwiseslentry=0.15slstay=0.15details;run;,一项有关骨髓瘤患者生存时间的研究数据,治疗了65例患者,研究中48名患者死亡,17名存活。变量time表示患者从确诊之日起的生存时间;变量vstatus表示患者的生存状态,0代表存活,1代表死亡。怀疑与生存函数有关的变量包括logbun(确诊时BUN对数值),hgb(确诊时HGB),platelet(血小板,0-异常,1-正常),age(年龄),logwbc(确诊时白细胞对数值),frac(确诊时骨折发生,0-无,1-有),scalc(确诊时血清钙含量)。分析目的在于从该9个解释变量中鉴别出重要的预后因素。,19,phreg过程,phreg过程针对生存数据执行基于Cox比例风险模型(Coxproportionalhazardsmodel)的回归分析;可以检验有关回归参数的线性假设;针对配对病例-对照研究执行条件logistic回归分析过程;创建包含有关统计量的输出数据集等。,20,phreg过程可包含的语句,21,procphreg语句,procphreg语句为调用phreg过程的开始,语句中可设置的语句选项较少,其设置方法及功能详见下表。,22,procphreg语句选项,23,model语句,model语句用来指定作为失效时间的变量、可选的删失值状态变量以及自变量等。model语句可设置为两种不同的形式:modelresponse=variables;model(t1,t2)=variables;第一种类型适用于仅有一个应变量的情况,第二种类型适用于计数过程输入方式的两个应变量的情况;model语句的第一种类型中,等号前的“response”项代表作为失效时间的变量,如果包含删失值,则须指定“censor”项,以表示删失值状态;model语句的第二种类型中,表示失效时间的变量为两个,构成一个半开半闭区间,表示观察对象处于危险状态的时间区间。phreg过程要求删失值状态变量和自变量必须为数值型变量,失效时间变量不能取负数值。如果失效时间的取值为负数,相应的观测将被剔除。,24,model语句的主要选项,25,编程语句(programmingstatements),是指可用于phreg过程的其它SAS语句(主要为data步的常用编程语句),用来创建新的自变量的取值,或修改自变量的已有取值;此类语句尤其在拟合包含时间依赖型自变量的模型时非常有用;它们还可被用于创建新的非时间依赖型自变量;data步的各种函数也可在phreg过程中使用,其用法也完全相同,执行完全相同的功能。,26,可用于phreg过程的data步语句,27,编程语句的操作示例,考察血压对生存时间的影响,在研究期间的多个时间点上测量受试者的血压。血压可看作时间依赖型自变量,拟合模型时可以在每一时点上应用最近测量的血压值,而不是全部应用最初的或最后的血压测量值。针对每一位受试者,右侧变量的取值均被测量,如果无条件或无法测出,则以缺失值取代。,Time生存时间Censor删失值状态(0表示删失值)BP0受试者进入研究时的血压T1时刻1BP1时刻1的血压测量值T2时刻2BP2时刻2的血压测量值,28,strata语句,比例风险假设不一定对所有的数据均适用,如果确实如此,对数据进行分层分析就十分必要和合理;strata语句用来指定用以分层的变量,phreg过程根据strata变量的非缺失值(除非语句中设置“missing”选项)对输入数据进行分层。,29,半参数法生存分析示例2(条件logistic回归模型),一项有关低体重儿出生情况的调查数据,共189位受访妇女,59例分娩出低体重儿,其余130例分娩正常体重儿。可能的危险因素包括:妇女末次月经时体重-weight,高血压情况-ht,孕期吸烟-smoke,尿激惹症状-ui等。妇女年龄作为配对因素进行m:n配对的logistic回归分析。,procphregdata=LBW;modelTime*Low(0)=LWTSmokeHTUI/ties=discrete;strataAge;run;proclogisticdata=lbw;classSmokeHTUI/ref=first;modellow(event=1)=LWTSmokeHTUI;strataAge;run;,30,练习1,数据集males为有关男性心绞痛患者生存率的调查数据,其中包含3个变量,years为确诊后的生存时间,censored为删失值指示变量(1-删失,0-未删失),freq为每个时间点的频数。请以此数据绘制寿命表(1年为单位),以寿命表法进行每个时间点的生存函数估计,计算其中位生存时间及其可信区间,并绘制生存分布函数对时间变化的生存曲线图。,31,练习2,为探讨某恶性肿瘤的预后,收集了63例患者
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论