cox模型局部拟合效果的评价_第1页
cox模型局部拟合效果的评价_第2页
cox模型局部拟合效果的评价_第3页
cox模型局部拟合效果的评价_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

cox模型局部拟合效果的评价

优异成绩测试在统计理论中发挥着特殊的作用。它不仅是统计基础的组成部分,而且与实际应用密切相关。众所周知,为进行参数估计和假设检验,总是假定某种总体分布或选定一统计模型,然后按该总体或模型的理论处理实际问题。那么,实际数据是否满足该总体或模型的要求?换言之,是否可用已知分布或模型拟合现实数据?拟合好坏的标准是什么?这就是拟合优度检验研究的问题。KarlPearson在他的讲义MathematicalcontributionstotheTheoryofEvolution中,提出了如何检验用分布拟合试验数据好坏的问题。1900年,Pearson提出了χ2检验。直到今日,χ2检验及与其有关的检验仍是应用最广的检验。Pearson提出了χ2检验后,引起广大学者对拟合优度检验的兴趣,发展了各种检验方法及相应理论。拟合优度检验统计量大体上可分为χ2型、基于经验分布的EDF(EmpiricalDistributionfunction)型和积分变换型检验,以及针对常用分布(例如正态分布、指数分布、均匀分布等),体现分布特征的检验统计量。目前截尾数据的拟合优度检验较多的用χ2检验。χ2检验的基本思想是比较理论频数和观察频数的差异,用统计量χ2=k∑i=1(Ei-Οi)2/Eiχ2=∑i=1k(Ei−Oi)2/Ei其中Ei为理论频数,Oi为观察频数。为评价Cox模型的拟合效果,可用χ2及对应的P值。但目前的方法仅针对模型的整体拟合效果。很多时候,模型整体的拟合效果好,在局部(尤其是边沿部分)的拟合效果不理想。这时候,仅评价模型的整体拟合效果是不够的。本文给出了评价Cox模型的局部拟合效果的公式。观察局部拟合效果设(T,u,v)分别表示生存时间、进入队列时已生存时间、退出队列时的生存时间,λ(t)为风险率。已知在u时刻生存,在(u,v]时间内死亡的条件概率记为m=P(T≤ν|T>u)可以证明m的估计为ˆm=Τ∧ν∫uλ(s)ds(1)mˆ=∫uT∧νλ(s)ds(1)这里T∧v表示T与v中最小值。ˆmmˆ是瞬时风险率与相应的观察人年数的积,是按风险率λ(t)计算的理论死亡数,因此Ei=Τi∧νi∫uiλi(s)dsEi=∫uiTi∧νiλi(s)ds为观察对象i的理论死亡数。E=ΣEi为合计理论死亡数。设Oi=I(ui<T≤vi)(2)表第i个观察对象在(ui,vi]的死亡次数,其中I为示性函数。则O=ΣOi指观察死亡数。由鞅理论,可以证明(O-E)E-1/2近似服从标准正态分布,因此G=(O-E)2/E(3)为自由度为1的χ2分布,它表示观察死亡数与理论死亡数的差,可以检验模型的拟合效果。将上述结果用于检验Cox模型的拟合优度。Cox模型可表为:λi(t)=λ0(t)exp(ziβ)(4)其中zi为观察对象i的p维协变量向量。ˆββˆ为p维系数β的估计,观察对象i的理论死亡数为Ei=Τi∧νi∫uiλi(s)ds=Τi∧νi∫uiλ0(s)exp(ziˆβ)ds=exp(ziˆβ)[ˆΛ0(Τi∧νi)-ˆΛ0(ui)](5)Ei=∫uiTi∧νiλi(s)ds=∫uiTi∧νiλ0(s)exp(ziβˆ)ds=exp(ziβˆ)[Λˆ0(Ti∧νi)−Λˆ0(ui)](5)其中ˆΛΛˆ0(t)为累积基础风险函数Λ0(t)的估计,Λ0(t)=t∫0λ0(s)dsΛ0(t)=∫0tλ0(s)ds。将各观察对象的理论死亡数求和E=ΣEi,代入公式(3),所得的G值可以评价Cox模型的整体拟合效果。很多时候整体拟合效果好的模型在某些局部区域,特别是两端部分,拟合效果不理想。因此仅评价模型的整体拟合效果是不够的。下面给出评价局部拟合效果的公式。为观察局部的拟合效果,我们比较各风险点上的理论死亡数与观察死亡数。设s1<s2<…<sd为肺癌发生的时间,即比较(0,s1],(s1,s2],(s2,s3],…(sd-1,sd]上的观察死亡数及理论死亡数。风险点sk上的死亡病例只可能源自风险集R(sk)={j:uj<sk≤Tj∧vj},因此为计算(sk-1,sk]上的理论死亡数,只需考虑风险集R(sk)中的观察。若观察对象i在R(sk)中,其在(sk-1,sk]上的理论死亡数为Aik=min(Τi∧vi,Sk)∫max(ui,s(k-1)λi(s)ds=min(Τi∧vi,Sk)∫max(ui,s(k-1)λ0(s)exp(ziˆβ)ds=exp(ziˆβ)[ˆΛ0(Τˆivˆisk)-ˆΛ0(max(ui;sk-1))](6)Aik=∫max(ui,s(k−1)min(Ti∧vi,Sk)λi(s)ds=∫max(ui,s(k−1)min(Ti∧vi,Sk)λ0(s)exp(ziβˆ)ds=exp(ziβˆ)[Λˆ0(Tiˆviˆsk)−Λˆ0(max(ui;sk−1))](6)由于观察对象i属于R(sk),Ti∧νi≥sk,Ti∧νi∧sk=sk,因此ˆΛ0(Τi∧νi∧sk)=ˆΛ0(sk)Λˆ0(Ti∧νi∧sk)=Λˆ0(sk)又ˆΛ0(max(ui,sk-1))={ˆΛ0(sk-1)ifui≤sk-1ˆΛ0(ui)ifsk-1<ui<sk(7)Λˆ0(max(ui,sk−1))={Λˆ0(sk−1)ifui≤sk−1Λˆ0(ui)ifsk−1<ui<sk(7)ˆΛΛˆ0(t)为阶梯函数,其跳跃点在s1,s2,…,sd上,并且若sk-1≤t<sk,则有ˆΛ0(t)=ˆΛ0(sk-1)Λˆ0(t)=Λˆ0(sk−1),因此ˆΛ0(max(ui,sk-1))=ˆΛ0(sk-1)(8)由(6),(7),(8),得Aik=exp(ziˆβ)[ˆΛ0(sk)-ˆΛ0(sk-1)]Ak=∑i∈R*(Sk)Aik=(ˆΛ0(sk)-ˆΛ0(sk-1))∑i∈R*(Sk)exp(ziˆβ)(9)Ak为(sk-1,sk]上的理论死亡数,与对应区间上的观察死亡数比较,代入公式(3),所得的各G值可以评价Cox模型的局部拟合效果。cox模型拟合在模型的拟合优度检验中,尽管模型的整体拟合效果较好,但某些局部的拟合效果较差(简称坏点)。下面的拟合试验说明本文给出的公式(9)可以准确找出这些坏点。针对这些坏点的再分析和处理可为模型的进一步改善提供可能。x1,x2分别取自均匀分布U(0.5,5),U(1,6),t时刻的风险函数满足:λ(t,x)=λ0(t)exp(-0.4x1-0.5x2)λ0(t)服从风险率为2的指数分布。抽1000个样本,并有25.9%被均匀分布U(0,40)截尾。将所有观察时间小于0.8的观察所对应的时间改为它们的平均值0.36,因此风险点0.36是一个坏点。这样的数据用Cox模型拟合后,其整体拟合效果仍然不差,G=0.069,p=0.793。(A)模拟试验;(B)某矿资料利用公式(9),可以计算出各风险点上的理论死亡数,与观察死亡数比较,求出对应的G值。结果见图1A。其中横轴为风险点,纵轴为对应点上的G值(见式(3))。从图上我们可以发现一个明显的坏点,即风险点0.36,其他点的理论死亡数与观察死亡数几乎没有差别。局部拟合效果检验某矿是世界知名的职业性肺癌高发地区,现有职工几万人,从50年代以来已有二千多例肺癌发生,至今每年仍有新发病例80~100人,为国际上罕见的大型肺癌防治研究现场。本资料取自1992~1996年建立的高危人群队列,1992~1996年,共有10141个观察对象进入队列。其中875个只采集了生物样品,而没有其他任何资料,有详细调查资料的观察对象有9266个,将其中不符合队列定义的观察对象剔除,最后可用于分析的观察对象有8209例,其中338例确诊为肺癌。将公式(5)中的各理论死亡数求和可得总的理论死亡数为338.8662,实际观察的死亡数为338例,G=0.0022,P=0.96,可以认为总的拟合效果很好。为了解模型的局部拟合效果,考查各风险点上的理论死亡数及观察死亡数,结果见图1B。其中横轴为风险点,纵轴为对应点上的G值。风险点652月(观察的病例数为8例,理论的病例数为8.107例)的G=1.419704e-003最大,拟合效果最差,但所对应的P值仍为0.97,因此即使在该点,模型拟合效果仍可以接受。表1是各风险点上的拟合优度检验的统计量G及对应的P值分布,分别给出G及P的最小值、1/4分位点、中位数、均数、3/4分位点、最大值。总体及局部的拟合效果显示,Cox模型很好地拟合了该资料,基于该模型的预测及估计是可靠

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论