生存分析结课论文.docx_第1页
生存分析结课论文.docx_第2页
生存分析结课论文.docx_第3页
生存分析结课论文.docx_第4页
生存分析结课论文.docx_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生存分析结课论文关于乳腺癌术后生存情况与患者年龄的研究 班级: 姓名: 学号:2016年 5月 7日目 录摘 要本文讨论45岁以上乳腺癌患者的术后生存状况。对44名45岁以上的乳腺癌患者的资料进行回顾性分析,按年龄分为两组,其中A组(50岁,25例),B组(50岁,19例),探讨乳腺癌患者术后生存情况与患者年龄间的关系。结果 有统计学意义(P001)。年龄是乳腺癌的一个独立预后变量,但乳腺癌的其他影响患者生存状况因素如:临床分期、淋巴结转移、病理类型、手术方式对乳腺癌患者的影响也是不容忽视的。关键词 生存分析 乳腺癌 年龄 Kaplan-Meier估计 Nelson-Aalen估计 Cox模型1.问题的提出乳腺癌是女性最常见的恶性肿瘤之一。且发病率呈逐年上升的趋势,在欧美国家,乳腺癌占女性恶性肿瘤的25%-30%.乳腺癌常发病于停经妇女,我国则常见于绝经前妇女,4550岁发病率较高。中老年妇女是乳腺癌发病的主要对象。发病年龄较欧美国家年轻10岁左右。由文献报道年龄是一个对复发率有影响的独立因素,年龄在45-50岁的患者复发率增加,为比较不同年龄乳腺癌术后生存状况的差别。本文从生存状况变化的角度做生存性分析,探讨乳腺癌术后生存情况与患者间年龄关系。2.数据的来源选取患乳腺癌的44名妇女,初治均为手术治疗,分为两组。A组为年龄在45岁到50岁的患者,B组为年龄在 50岁以上的患者。5年后得到下列复发时间。时间(月)数据来源于生存数据分析的统计方法 A组 4 5 9 16 12 13 10 23 28 29 31 32 47 41 41 57 62 74 100 139 20+ 258+ 269+B组 8 10 10 12 14 20 48 70 75 99 105 162 169 195 220 161+ 199+ 217+ 245+3.模型方法介绍和总结3.1 生存时间函数 描述生存时间分布规律的函数主要有生存函数、死亡概率函数、概率密度函数和危险率函数。为了后文叙述方便,这里主要介绍生存函数和危险率函数。3.1.1 生存函数 在描述生存规律的数量指标中,以往常用的指标是某个特定时间的生存率(例如:3年生存率、5年生存率)。这一指标的主要缺陷为不能反映整个生存规律,一个理想的指标应该是任意时间的生存率,即生存率是任意时刻t的函数。其意义是研究个体生存时间长于t的概率。若令T为生存期,s(t)为任意时刻t的生存率,得 (3.1)则称为生存率函数,简称生存函数。从T的分布函数可知, (3.2)将对在直角坐标系作图画出生存率曲线,陡峭的生存曲线表示低的生存率或的生存时间。另外,从图上可粗略估计出中位生存时间,即生存曲线上取生存率为50%时所对应的时间。3.1.2 危险率函数(Hazard Function)如果我们考虑已活到t时刻的患者,在时间t附近的瞬间死亡危险性,根据数学上极限性质,可表示为:h(t)= (3.3)则称h(t)为危险率函数。即相当于条件瞬间死亡率。3.1.3 S(T)与h(t)的关系 其中,称H(t)为累计危险率函数。生存函数和危险率函数在不同的生存时间分布中(例如Weibull、log logistic等)有着特定的函数形式。3.2.1 生存函数的估计非参数法对生存数据的分布型没有相应的要求,因而适用面比较广。医学研究中,大量的生存数据其分布是不规则、不确定或未知分布,因而常用非参数法估计生存率。根据样本含量的大小可分别选择寿命表法或乘积限估计法。Nelson-Aalen估计在有删失的情况下,可以根据累积死亡率与生存函数的关系来估计累积死亡力函数H(t)。这时估计式为:。另外有一个累积死亡 力估计式,它与以乘积限估计式为基础的估计式相比,具有更好的小样本性质,这一估计式由Nelson建议,然后由Aalen重新发现并加以改进,这就是Nelson-Aalen估计式,即在最大的时间观察范围内的定义如下:该估计式的方差可以从下式得到:以累积死亡率的Nelson-Aalen估计式为基础,生存函数的另一个估计式为:。Nelson-Aalen估计式在分析数据时主要有以下两方面的应用,其一是在选择事件发生时间的参数模型方面的应用,其二是为死亡率h(t)提供粗估计,这些估计值是Nelson-Aalen估计式的斜率。3.2.1.2 乘积限估计法当数据个体较少时,为充分利用每个数据的信息,必须采用更为精确的估计方法。这些估计方法中应用最多、效率较高的是Kaplan-Meier在1958年提出的乘积限估计(Product-limit estimator)。因而此法又称Kaplan-Meier法。乘积极限法适用于离散数据,它用于建立时刻t上的生存函数。它的原理是根据时刻及其之前各时间点上的条件生存率的乘积,来估计时刻的生存函数和它的标准误。设代表个观察对象的生存时间,设为时刻之前生存的个体数目,即危险集的大小,再设表示生存时间的截尾性质,。又令表示观察对象在时刻的条件生存率,即对于,有:,其中那么,观察对象在时刻时的条件死亡率如下:对于,Kaplan-Meier法定义时刻上的生存函数和它的标准误的估计公式如下: 该法的基本思想与寿命表法基本相同,所不同的是将生存时间(包括截尾数据)逐个由小到大依次排列,并对其中的每个死亡点进行死亡概率、生存概率和生存率进行估计。3.2生存率估计与组间比较3.2.2 生存率的组间比较 在医学随访研究中,通常将病人按随机化方法分配到两种或多种治疗组中,然后随访观察和比较其生存时间的长短和生存率的大小,以此来考察各种治疗方案的优劣;或者分析和比较同一治疗方案下具有不同特征病人的生存率的大小,以此来探讨影响这种疗法的因素。因此,生存率组间比较实际上是两条或多条生存曲线的比较。生存率的假设检验方法有参数法和非参数法两类。参数法要求生存时间已知服从于某种概率分布,对实际资料拟合分布并求得其相应的参数,然后通过比较不同组的分布参数来比较生存率是否相同。非参数法对资料的分布没有要求,适用面比较广。常见的有Log-rank 检验、Wilcoxon检验(Gehan检验)和似然比检验,似然比检验要求资料服从指数分布才有效。这里主要介绍Log-rank检验和Wilcoxon检验两种方法。1. 对数秩和检验log-rank 检验Log-rank检验是Mantel等人在1966年提出的,这种方法是在组间生存率相同的检验假设(H0)下,对每组生存数据依据在各个时刻尚存活的患者数和实际死亡数计算期望死亡数,然后将期望死亡数与实际死亡数进行比较,作假设检验。这种方法可适合两组或多组生存率比较。这种方法在两组生存率比较时,计算比较简单。Log-rank检验的渐进平均值E和方差V:分别为实验组和对照组在第K时间间隔第i个病人死亡前生存的人数,分别为实验组和对照组在第K时间间隔第i个病人死亡前的死亡危险率,为第k个时间间隔的死亡人数。设,则,其中,将log-rank统计量的分布视作N(E,1),有:根据区间上两组概率分配向量中的治愈率,很容易求出所需总样本含量:式中,为试验组和对照组的事件发生率。在随访研究中,样本含量除受统计学要求及治疗效果影响外,还有许多不确定性影响因素,例如患者入组、失访、治愈时间的分布,患者在试验阶段的依从性,以及是否满足比例风险等等。Log-rank检验除考虑最后结局,还考虑了出现结局的时间,并充分利用失访资料所提供的不完全信息。对于具体的试验,本法都能拟合一个独特的生存过程,较好反应实际情况,应用灵活,因此是一种有效、可行的样本含量估计方法,能更好适应临床试验的复杂性和多样性,巧妙解决多种复杂因素并存对样本含量的影响问题。2. Wilcoxon检验法当g=1,2,g,m时, Wilcoxon检验法2统计量计算公式仍可表示为:2=sv-1s =m-1其中s=(s1,s2,sg,sm-1), s为向量s的转置。Sg的计算公式为:sg= (11.21)V为(m-1)(m-1)矩阵,记为V=Vgh(m-1)(m-1) Vgh的计算公式为:Vgh= (11.22)上面sg和vgh计算公式中wi为权重,这里wi=nI。3. 两种检验方法的比较 Logrank检验法和Wilcoxon检验法实际上可以用统一公式来表示,即Wilcoxon检验法的公式,公式中的权重wi=1时为Logrank检验法,wi=ni时为Wilcoxon检验。因而可以发现,Logrank检验对生存时间较长的个体在检验中权重较大,对生存时间较短的个体在检验中权重较小,在生存率(曲线)比较中,这种方法对尾部较为敏感;而Wilcoxon检验则与Logrank检验相反,对生存时间较短的个体在检验中权重较大,比较中对数据的头部的差别较为敏感。从理论和实践中均发现,当生存资料的各死亡点的危险率在两组或多组间成比例时,Logrank检验的效率高于Wilcoxon检验法,宜选用Logrank检验。当生存资料各时点的危险率服从其他状态时,Wilcoxon检验法效率高于Logrank检验,宜选用Wilcoxon检验法。4.Cox模型像通常的回归分析一样,人们也希望能建立起生存时间(因变量或反映变量)随危险因素(自变量或协变量)变化的回归过程,以便对危险因素的作用大小有一个全面的了解和掌握,并根据危险因素的不同取值对生存概率进行预测。由于很难获得准确的生存时间,前述目的较难直接实现。1972年Cox提出了比例危险模型,简称Cox模型。由于此模型在表达形式上与参数模型相似,但在对模型中的各参数进行估计时却不依赖于特定的假设,所以又称为半参数模型。设是影响生存时间t的k个危险因素。设为i名受试者在时刻t的风险率,即t时刻外后一瞬间的死亡速率。又设表示不受危险因素x的影响下,在时刻t的风险率,又称为基准风险率或基准函数。其模型的具体形式如下:式中,为第i名受试者生存到t时刻的危险率函数,是当所有的危险因素(即)不存在时的基础危险率函数,是可能与生存时间有关的m个危险因素所构成的向量。4. 4 SAS程序及结果输出1.Kaplan-Meier和Nelson-Aalen程序:data a; input t; if t0 then censor=1; else censor=0; /*如果时间小于0,为删失变量赋值为1,否则赋值为0*/ if _n_20 then group=A; else group=B; /*前二十五个数据为A组,剩下的为B组*/ t=abs(t); /*t的标准化*/ cards; 4 5 9 16 12 13 10 23 28 29 31 32 47 41 41 57 62 74 100 139 -20 -258 -269 8 10 10 12 14 20 48 70 75 99 105 162 169 195 220 -161 -199 -217 -245; proc lifetest method=pl nelson plots=(s,ls,lls);/*利用lifetest过程进行生存分析并作生存函数图,pl为Kaplan-Meier,nelson为Nelson-Aalen*/ time t*censor(1); /*制定时间变量和删失变量,指出删失变量时删失变量的取值*/ strata group;/*指定分组变量*/ run; 结果第一列至第八列分别是生存时间、累积生存率、死亡概率、累计生存率标准误、累积危险率、累积危险标准误差、已观测到的失效时间的例数、尚未观测到的失效或截尾例数。有*号者表示截尾观测值。给出A组生存时间四分位数、点估计及95%可信区间,生存时间均数及其标准误。结果表示,A组患者的平均生存期为33.368个月。给出B组生存时间四分位数、点估计及95%可信区间,生存时间均数及其标准误。结果表示,平均生存期为122.731个月。为两者患者总人数、死亡数、截尾数和截尾百分比。 层间等效检验中,p值均小于0.0001,拒绝原假设(),认为方差不齐性。以下是Kaplan-Meier法作出的生存函数图:为两组患者的生存分布函数曲线。两条曲线在开始时重叠,A组在100个月终止,B组在260个月终止。A组生存率下降显著高于B组,说明B组比A组生存时间长。是-LogS(t)对生存时间T的散点图,呈非直线趋势,说明生存时间不呈指数分布。是Log(-LogS(t))对LogT的散点图,两条线分别近似直线,说明生存时间近似呈Weibull分布。是各组生存函数曲线齐性检验。依次给出秩次统计量、Log rank统计量的协方差矩阵、Wilcoxon统计量的协方差矩阵、各组生存函数一致性检验结果等。总结论:结果表明此资料不服从指数分布,近似服从Weibull分布,故宜选用log rank 法的结果,两条生存曲线分布有显著性差异(p0.05)。B组患者的生存时间显著长于A组患者。 2.cox模型data a; /*定义数据集*/ input group month; ce

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论