




已阅读5页,还剩47页未读, 继续免费阅读
硕士论文:Cox回归比例风险假定的考察和影响点的识别及其SAS和SPSS实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山西医科大学 硕士学位论文 cox回归比例风险假定的考察和影响点的识别及其sas和spss实 现 姓名:马振中 申请学位级别:硕士 专业:流行病与卫生统计学 指导教师:余红梅 20070508 摘要 目的:用s a s8 2 和s p s s1 1 5 软件包对生存资料c o x 回归中比例风险假定和影响 点进行考察与识别,并比较两者输出结果的异同。 方法:比例风险假定的考察采用比较k a p l a n m e i e r 生存曲线、l o g 一l o g s ( t ) 对t 曲线和时协变量法正规检验;影响点的识别采用s c h o e n f e l d 残差、加权s c o r e 残差、鞅 残差、剩余残差、似然距离和最大影响曲率等统计量及其统计图。统计软件的实现采用 s a s8 2 和s p s s1 1 5 。 结果:图示法和检验法都能够在一定程度上检查c o x 回归比例风险假定,除了s a s 实现l o g 一l o g s ( t ) 对t 曲线较需要自编程序外,其它方法s a s 和s p s s 软件实现非常方 便和快捷。对影响点的识别,s a s 可输出所有的影响诊断统计量,包括s c h o e n f e l d 残差、 加权s c o r e 残差、鞅残差、剩余残差、似然距离和最大影响曲率,而s p s s 只能输出 s c h o e n f e d 残差和加权s c o r e 残差,s p s s 下的p a r t i a lr e s i d u a l s 相当于s a s 下的 s c h o e n f e l d 残差。 结论:生存资料拟合c o x 回归有必要考察比例风险假定和检查影响点。s a s 和s p s s 的诊断功能基本相近,比例风险假定的考察s p s s 略优于s a s ,影响点的识别s a s 优于 s p s s 。 关键词生存分析,c o x 回归,比例风险,影响点 i i i 两医 大卞硕 学雠论史 i a b s t r a c t l 0 b j e c t i v et h ep r o p o r t i o n a lh a z a r d sa s s u m p t i o na n dt h ei n f l u e n t i a lc a s e si nc o xr e g r e s s i o n f o rs u r v i v a ld a t aw e r ea s s e s s e dw i t h s o f t w a r ep a c k a g e ss a s8 2a n ds p s s1 1 5a n d c o m p a r i s o no f t h ed i f f e r e n c e sb e t w e e nt h et w or e s u l t sw e r em a d e m e t h o d st h ea s s e s s i n go fp r o p o r t i o n a lh a z a r d sa s s u m p t i o nu s e d k a p l a n m e i e rs u r v i v a l c u r v e ,t h ec u r v eo fl o g 一j o g s ( t ) 】t ota n dt i m e c o v a r i a t et e s t s c h o e n f e l dr e s i d u a l ,w e i g h t e d s c o r er e s i d u a l ,m a r t i n g a l er e s i d u a l ,d e v i a n c er e s i d u a l ,l i k e l i h o o dd i s p l a c e m e n ta n dm a x i m u m i n f l u e n c ec u r v a t u r ew e r eu s e dt oi d e n t i f yi n f l u e n t i a lc a s e s s o f t w a r ep a c k a g e ss a s8 2a n d s p s s1 1 5w e r ep e r f o r m e d r e s u l t st h eg r a p h i c a lm e t h o d sa n df o r m a lt e s t sc a na s s e s st h ep r o p o r t i o n a lh a z a r d s a s s u m p t i o nt os o m ee x t e n t ,o t h e rm e t h o d sw e r ev e r yq u i c ka n dc o n v e n i e n te x c e p tt h em e t h o d o fl o g 一l o g s ( t ) t otw h i c hn e e d e de x t r as a sp r o g r a m s a sc a no u t p u ta l ld i a g n o s t i c st o i d e n t i f yi n f l u e n t i a lc a s e si n c l u d i n gs c h o e n f e l dr e s i d u a l ,w e i g h t e ds c o r er e s i d u a l ,m a r t i n g a l e r e s i d u a l ,d e v i a n c er e s i d u a l ,l i k e l i h o o dd i s p l a c e m e n ta n dm a x i m u mi n f l u e n c ec u r v a t u r e ,w h i l e s p s sc a no n l yo u t p u ts o m eo ft h e s ed i a g n o s t i c s t h ep a r t i a lr e s i d u a lo fs p s si st h e s c h o e n f e l dr e s i d u a lo f s a s c o n c l u s i o ni tw a sn e c e s s a r yt ot e s tt h ep r o p o r t i o n a lh a z a r d sa s s u m p t i o na n dt od e t e c tt h e i n f l u e n t i a le a s e si ns u r v i v a ld a t a t h ee f f i c a c yo fd i a g n o s t i c sw a sb a s i c a l l yt h es a m ef o rs a s a n ds p s s s p s sw a sb e t t e rt h a ns a si nt e s t i n go fp r o p o r t i o n a lh a z a r d sa s s u r e 【p t i o n ,b u ti n d e t e c t i n gt h ei n f l u e n t i a lp o i n t ss a s w a sb e t t e r 【k e yw o r d s 】s u r v i v a la n a l y s i s ,c o xr e g r e s s i o n ,p r o p o r t i o n a lh a z a r d ,i n f l u e n t i a le a s e 刖 舌 统计诊断是近2 0 多年迅速发展起来的一门统计学分支,它以强烈的应用背景、新颖 的统计思想、广泛的研究内容和丰富的实际成果在广大统计工作者面静展现出一个理论与 应用紧密结合的崭新领域。顾名思义,统计诊断就是对实际问题中收集起来的数据和提炼 出的模型以及由此出发所作的统计推断方法的合理性进行细致的分析,通过一些诊断量柬 检查数据和模型及其推断方法中可能存在的“毛病”,并提出相应的“治疗”措施,也就是 说对统计方法解决问题的全过程进行诊断。大量的理论研究和应用实践使人们对统计诊断 的意义和价值有了肯定而明确的认识,现今已广泛应用于各种统计问题和许多统计模型, 成为统计学使用过程中不可缺少的一个重要分析步骤,部分成熟渗断方法被编入许多统计 软件包,如s a s 和s p s s 等,并正在受到统计界和广大实际工作者越来越多的重视。 任何统计模型都是对客观复杂过程的一种近似描述,它不可避免地要包含某些假定。 人们自然有理由要问:我们选择的模型究竟能不能大体反映所要研究的实际问题? 它是否 与数据集中绝大多数的数据相一致? 我们所得到的数掘集中会不会有个别数据由于收集或 整理过程中的疏忽和失误或其它种种原因而出现较大的误差? 这些数据会不会严重干扰我 们对问题所作的结论? 另外,数据集中各个数据点对我们进行统计推断的影响是否大致相 仿,会不会有某些点的影响特别大? 等等。在使用统计方法解决具体问题的过程中。人们 必须慎重地回答上述种种问题,才能作出更加符合客观实际的结论。这一点,在以往的统 计分析中常常被忽视,从而有可能得到与实际情况严重不符合的分析结果。 统计诊断就是针对上述种种问题而发展起来的一种分析方法,通过统计诊断,可以找 出对于统计推断影响特别大的点,即所谓影响点( i n f l u e n t i a lp o i n t ) ;对数据进行这些初步 诊断后,还需要尽可能研究“治疗”方案j 。 c o x 回归模型是一种多因素的生存分析方法,可以分析带有截尾尘存时问的资料,同 时分析众多因素对生存期的影响,且不要求估计资料的生存函数的分布类型。由于c o x 模 型适用范围广,实际应用中分析者常忽视了它的应用条件,如比例风险假定等,造成摸型 拟合结果与观察结果相背离的不良后果。同时,当资料中存在影响点时,可能会对模型参 数估计及预测产生影响,直接影响到该模型的稳定性,所以影响点的识别应是c o x 模型分 析中的一个重要组成部分。因此,建立稳健、可靠、有效的c o x 模型是一项既具有理论意 义、又具有实用价值的研究课题,这方面的研究也是有关c o x 模型方法学及应用研究中的 一大热点。本研究主要探讨c o x 比例风险回归模型拟合中以下二个方面的问题。 ( 1 ) 比例风险假定的考察。 ( 2 ) 影响点的识别。 为了使本课题研究内容在医学科研中得到方便的应用并考虑到计算结果的准确性,在 s a s 和s p s s 系统环境下开发出实现回归诊断方法,为在医学和其它科研领域中推广本课题 成果创造了条件,具有较好的应用前景“3 。 “阻人学硕t 学竹论文 第一章c o x 回归比例风险假定的考察及 其s a s 和s p s s 实现 1 1 前言 随着世界经济的增长,卫生保健事业的发展,疾病谱的变化和平均寿命的提高,有关 肿瘤、慢性病、老年性疾病的临床试验和流行病学方面的随访研究越束越重要,越来越多, 这些临床试验和随访研究的资料都可整理为生存资料。目前对生存资料的多因素分析最常 用的方法仍然是c o x 比例风险回归模型( p r o p o r t i o n a lh a z a r d sr e g r e s s i o nm o d e l ) ,简 称c o x 模型。该模型是一种多因素的生存分析方法,可以分析带有截尾生存时间的资料, 同时分析众多因素对生存期的影响,且不要求估计资料的生存函数的分布类型。由于上述 优良性质,该模型自英国统计学家d r c o x 于1 9 7 2 年提出以来,在医学随访研究中得到 广泛的应用i ”。 基本c o x 模型表达式为 ( f ) = h o ( t ) e x p ( 届x l + 殷x 2 + + 以x ,) ( 1 1 ) 式中置、x ,、x 。为协变量或影响因素,一般包括研究开始时个体的年龄、性别、 临床及生化指标等;厅( ,) 为具有协变量一、x 2 、x 。的个体在f 时刻的风险函数,近 似地表示,时刻存活的个体在,时刻之后一个单位时段内的死亡概率;h o ( ,) 为,的未知函数, 即x l = x 2 一_ x ,= 0 时f 时刻的风险函数,称为基准风险函数( b a s e l i n eh a z a r d ) ;屈、 厉、为各协变量所对应的回归系数,需由样本资料做出估计。 任两个个体风险函数之比,即风险比( r i s kr a t i o ,r r ) 或相对危险度( r e l a t i v er i s k ,r r ) r 月:鱼盟:鱼! ! ! ! 堕鱼兰:! 垒兰! ! :丝兰! ! h | q 、h 0 ( t ) e x p ( f l x d + p 2 x 吐+ + pp x i 3 = e x p l f l j ( x ,i x j , ) + 履( ,2 一x j 2 ) + + 成( x p x ”) 1 ( i - 2 ) f ,j = 1 , 2 ,” 该比值与( ,) 无关,在时间,上为常数,即模型中协变量的效应不随时间而改变,称 为比例风险假定( a s s u m p t i o no fp r o p o r t i o n a lh a z a r d ) ,简称p h 假定,比例j x l 险模型由此 得名。 式( 1 2 ) 又可表示为 i n h , ( t ) 一i n h j ( ,) = 届( x ,i x ,1 ) + 仍( x ,2 一x ,2 ) + 。+ ,( x 垆一爿0 ) ( 1 3 ) 如图1 1 所示,两个个体风险函数的对数应严格平行。 图1 - | 比例风险假定示意图 简单地,对o - l 变量c o x 模型,0 组的风险函数为h ( t ;x = o ) = h o ( i ) ( 即基准风险) ,1 组的 风险为h ( t ;x = 1 ) = h ( f ) = h o ( t ) e x p ( f 1 ) ,则 糍一郇, 。,4 , 即两组风险函数之比在时间上是常数,或两组风险函数成比例。 本研究采用统计软件对生存资料分别运用图示法和检验法来检查各协变量是否满足 p h 假定,并且详细介绍了软件实现的全部过程,为实际工作者利用c o x 回归提供了一定 的参考。 1 2 方法 1 2 i 比较k a p l a n m e i e r 估计的生存曲线 该方法最早由c o x 本人在1 9 7 2 年“回归分析与寿命表”中提出,如两条曲线趋势基 本一致,且无交叉,表明满足p h 假定。该法可用于连续变量、二值变量( 即o 一1 变量) 、等 级变量5 1 。对于二值变量和等级变量生存资料可分别比较各组的k a p l a n m e i e r 法生存曲 线。对连续变量将该变量离散化后,比较各组的k a p l a n m e i e r 法生存曲线。 1 2 2i o g l i o g s ( t ) l 对t 的曲线 由于对o 一1 变量( 即两样本生存资料) ,p h 假定满足时,下列表达式成立: h ( t ) = h o ( t ) e x p ( 肛) ( 1 - 5 ) h ( t ) = h o ( t ) e x p ( 肛) ( 1 - 6 ) l o g h ( t ) = l o g h o ( ,) + 厨 ( 1 - 7 ) i o g - l o g s ( t ) 】- l o g 一l o g s o ( ,) 】+ 肛 ( 1 - 8 ) 故作l o g 一l o g s ( t ) 对t 的图,两条曲线大致平行或等距。如果出现交叉,提示违反 p h 假定。 1 2 3 时协变量法 c o x ( 1 9 7 2 ) 提出c o x 模型时,曾提出通过引入一个构造的时协变量检查p h 假定的方 法,即在模型中加入一个含时间的交互作用项,如x l o g ( t ) ,然后检验该交互作用项的显 著性。得出各协变量与时间交互作用的p 值,依据检验水准( 一般旺取0 0 5 ) 判定是否满 足p h 假定。 1 3s a s 和s p s s 实现 1 3 1k a p l a n m e i e r 法生存曲线 ( 1 ) s a s 过程旧” 采用l i f e t e s t 过程。l i f e t e s t 过程中的基本语句为: p r o cl i f e t e s t ; 必需的语句 t i 她v a r i a b l e :【必需的语句】 s t r t av a r i a b l e : p r o cl i f e t e s t 语句中的选项: m e t h o d = - p l i k m i l t i l i f e i a c t ,指定生存率估计方法。p l 和i c m 表示乘积极限法或 k a p l a n m e i e r 法( 缺省值) ;l t 、l i f e 和a c t 表示寿命表法。当使用寿命表法时,s a s 可自动生成生存时间的分组区问,也可用w i d t h = 人为指定区删宽度,或用i n t e r v a l s = ( a t o b b yc ) ,a 、b 、c 分别表示区问的初值、终值和区问的宽度。 p l o t s = ( ) ,要求绘图。其中s u r v i v a l ( 或s ) 表示生存率s ( ,) 对生存时间,的图 形,即生存曲线;l o g s u r v ( 或l s ) 表示一l o g s ( t ) 对t 的图形,用于检查指数分布,图 形应呈过原点的直线;l o g l o g s ( 或l l s ) 表示l o g 一l o g s ( t ) 】对l o g t 的图形,用于检查 w e i b u l l 分布,图形应呈直线;h a z a r d ( 或h ) 表示累积危险率疗( ,) 对t 的图形。只有当使 用寿命表法时,才出现h a z a r d 图形。 ( 2 ) s p s s 过程9 “。0 1 打丌s p s s 后的界面如图1 2 所示,然后选择菜单栏a n a l y s e 下的s u r v i v a l 过程中的 k a p l a n m e i e r 过程,k a p l a n m e i e r 过程主对话框、d e f i n ee v e n t 子对话框和o p t i o n s 子对话 框如图1 3 、图1 - 4 和图1 5 所示。k a p l a n m e i e r 过程主对话框和o p t i o n s 子对话框晚明见 表l l 和表l 一2 。 曲睦人乍硕l 学位论文 图1 - 2s p s s 主界面 图1 - 3k a p i a n - m e i e r 过程主对话框图1 - 4k a pj a n - m e i e r 过程d e f i n ee v e n t 子对话框 表1 - 1k a p i a n - m e i e r 过程主对话框说明 1 1 i 撕医科大学顿l 学位论文 图1 _ 5k a p i a n - m e i o r 过程o p t i o n s 子对话框 袭卜2k a p i a n - m e i e r 过程o p t i o n s 子对话框说明 1 3 2i o g l l o g s ( t ) 对t 的曲线 ( 1 ) s a s 过程“” 采用p h r e g 过程。可以在p h r e g 过程中使用的语句: p r o cp h r e g = v a r i a b l e ( o p t i o n s ) : 必需语句 o u t p u t 2 6 0 t h e na g e = 1 ;2 3t i m et s t a t u s ( 0 ) ; 1 2e l s ea g e = o : 2 4s t r a t ar e l a p s e ; 2 5r u n ; 程序0 1 至0 8 行为数据步,程序0 9 一1 2 行将数值变量年龄a g e 转换为二分类变量( 6 0 岁) 。程序1 3 2 4 行调用四次l i f e t e s t 过程,进行四个变量的生存曲线k m 法估计。 程序卜2t o g - l o g s ( t ) 对t 的曲线( 以变量年龄为例) 行号程序行号程序 0 1 d a t a a ; 2 5d a t a a 3 ; 0 2i n p u ta g eg r a d es i z er e l a p s ets t a t u s ;2 6s e ta i o u t ; 0 3c a r d s ; 2 7 h a z a r d = - i o g ( s 1 ) ; 0 46 2 1005 9 02 8 l g h l = i o g ( h a z a r d ) ; 0 56 4 10 05 4 l 2 9p r o cs o r t d a t a = a 3 ; 0 6 3 0b y t : 0 75 43l 16l 3 ld a t aa 4 ; 0 8 ; 3 2s e ta 2 0 u t ; j 曲医科大学碗t 学付呛文 0 9d a t aa l :3 3 h a z a r d 2 2 一i o 烈s 2 ) ; j os e ta :3 4j g h 2 = j o g ( h a z a r d 2 ) ; 1 1i fa g e = 6 0t h e nd e l e t e ;3 5p r o cs o r td a t a = a 4 ; 1 2d a t aa 2 ;3 6b y t ; 1 3s e ta : 3 7d a t a a s ; 1 4 i fa g e 6 0t h e n d e l e t e ; 3 8s e ta 3a 4 ; 1 5p r o c p h r e gd a t a = a 1 :3 9 s y m b o l1i = s t e p l ji = 1 c = r e dv = d o th = 0 0 8 ; 1 6m o d e lt s t a t u s ( 0 _ 户a g e : 4 0 s y m b o l 2i = s t e p l j1 = 4c = b l u ev = c i r c l eh = 0 0 8 , l7b a s e l l n eo u t = a lo u ts u r v a k = s 1 : 4 1p r o c g p l o td a t a = a s ; l8p r o cs o r td a t a = a l o u t ;4 2a x i s l l a b e l ( 。l o gc u mh a z a r d lw i d t h 2 2l e n g t h = 2 5 1 9b v m i d o r = n o n e ; 2 0p r o c p h r e gd a t a = a 2 : 4 3a x i s 2m i n o r = n o n ew i d t h = 2l e n g t h = 6 0 : 2lm o d e l p s t a t u s ( 0 i = a g e ; 4 4p l o t i g h l + t = - ii g h 2 t 2 2 ,f h m ev a x i s 2 a x i s l 2 2b a s e l i n eo u r = a 2 0 u t s u r v i v a l = s 2 ; h a x i s = a x i s 2o v e r l a y ; 2 3p r o cs o r td a t a = a 2 0 u t ;4 5r u n : 2 4 b y t ; 程序1 3 时协变量法 行号程序行号程序 0 1d a t aa :1 lp r o cp h r e g ; 0 2i n p u ta g eg r a d es i z er e l a p s ets t a t u s ;1 2m o d e lt + s t a t u s ( o 户g r a d eg r a d e t ; 0 3 c a r d s ;1 3 g r a d e r = g r a d e + l o g ( t ) ; 0 46 2 1005 901 4p r o cp h r e g : 0 56 4j0 05 4 l1 5m o d e lt s t a t u s ( o ps i z es i z e t ; 0 61 6 s i z e t = s i z e + l o g ( t ) ; 0 75 43jl611 7p r o cp h r e g ; 0 8p r o cp h r e g :18m o d e lt + s t a t u s ( 0 pr e l a p s er e l a p s e r ; 0 9m o d e lt s t a t u s ( 0 ) = a g ea g e t ;1 9 r e l a p s e t = r e l a p s e l o g ( t ) ; 1 0 a g e t 2 a g e + l o g ( t ) ; 2 0 r u n ; 2 明医科大学碗j 学位电文 s a s 输出的k a p l a n m e i e r 生存曲线见下图: 一一。,m mi f 竺二。唑嚣? 一 a 年龄b 肿瘤分级 一一 ”- - h h c 肿瘤大小d 是否复发 图1 - 9k a pl a t l m e i e r 法估计4 个变量的生存曲线 l o g - l o g s ( t ) 对t 的曲线见图卜1 1 。 时协变量法结果见下表。 表卜7 膀胱肿瘤数据四个变量p h 假定考察 四个变量的k a p l a n m e i e r 生存曲线和l o g 一l o g s ( t ) 对t 的曲线未见明显交叉,时协 变量法各变量对应p 值均大于0 0 5 ,说明该资料满足p h 假定。 s p s s 过程 k a p l a n m e i e r 生存曲线: a n a l y z e s u r v i v a l k a p l a n m e i e r t i m e 框:t s t a t u s 框:s t a t u s 匝五互固:s i n g l ev a l u e = l :区亘习 f a c t o r 框:a g e o k l o g 一l o g s ( t ) 对t 的曲线: a n a l y z e 寸s u r v i v a l - - c o xr e g r e s s i o n t i m e 框:t s t a t u s 框:s t a t u s 匮五互圃:s i n g l ev a l u e :1 :函 c o v a r i a t e s 框:a g e 巨a t e g o r i c a l : c a t e g o r i c a lc o v a r i a t e s 框:a g e 圈 p l o t :_ l o g m i n u s l o g :圈 囡 指定生存时间变量为t 选入生存结局变量 “1 ”表示死亡 比较不同协变量的生存曲线 指定生存时问变量为t 选入生存结局变量 选入所欲进行回归分析的协变量 把a g e 定义成分类变量 输出l o g 一l o g s ( t ) 对t 的曲线 膀胱肿瘤数据中,年龄为定量变量,将年龄转化为两分类变量( c o n t i n u e m e t h o d 下拉列表:f o r w a r dl r s a v e :舻苎。8 e i a 酽旦配置d h c t r m l 舻b 甜i i a ir e 妯d ll 矿鲫e t 球l c o n t i n u e o k s a s 与s p s s 相比。s a s 输出结果比较全面,可输出全部诊断统计量,而s p s s 则只 能输出其中的一部分,s p s s 输出结果中的p a r t i a lr e s i d u a l s 相当于s a s 下的s c h o e n f e l d 残 差,两者的输出结果完全一致。 【例2 2 】p b c 数据( 见附表2 ) 。原发性胆汁性肝硬变( p r i m a r yb i l i a r yc i r r h o s i s ,p b c ) 是一种进行性、最终致命的肝脏疾病,目前还不能治愈,肝脏移植是唯一挽救生命的治疗 措施。数据为设安慰剂对照双盲随机化临床试验,3 1 2 例p b c 资料中,随访结束时死亡1 2 5 例,其中死于p b c 者1 1 4 例,中位生存时间3 9 个月。1 l 例非肝硬化死亡,3 例失访,1 9 例行肝移植,继续生存者1 6 0 例,中位随访时间7 6 个月。 表2 - 4v a r i a b l e si nt h ee q u a t i o n 本例中有1 1 个预后指示变量,经c o x 分析,引入的变量有五个,分别是a g e ( 年龄) 、 e d e m a ( 浮肿) 、b i l i r u s ( 胆红素) 、a l b u m i n ( 白蛋白) 和p r o t i m e ( 凝血酶原时问) 。年龄 越高,生存时问越短;有浮胂者生存时间较短;胆红素水平越高,生存时侧越短;白蛋白 水平越高,生存时间越长;凝血酶原时问越长,生存时间越短。 为考察影响a g e ( 年龄) 、e d e m a ( 浮肿) 、b i l i r u s ( 胆红素) 、a l b u m i n ( 白蛋白) 和p r o t i m e ( 凝血酶原时间) 的观测点,在拟合五因素的c o x 模型基础上,用s a s 和s p s s 软件计算 了】3 2 例5 变量p b c 自然史模型下所有的影响诊断量,包括s c h o e n f e l d 残差、加权s c o r e 残 差、鞅残差、剩余钱差、似然距离l d ,及最大影响曲率,一。 s a s 过程程序如下: 程序2 2 行号程序行号 程序 1d a t ad l ; 1 0m o d e lt i m e c e n s o r ( i ) = a g ee d e m ab i l i r u 2i n p u ta g ee d e m ab i l i ma l b u m i np r o t i m et i m ea l b u m i np r o t i m e ; c e n s o r ; 1 1 o u t p u to u t = o u t 3 x b e t a = x b c t a 3 c a r d s ; r e s s c h = s c h r e s is c h r e s 2s c h r e s 3 s c h r e s 4 45 8 7 6 5 21 0 01 4 5 02 6 01 22 04 0 0 0 0s c h r e s 5r e s m a i l t = m a r tr e s d e v = r c s d 1 o o1 2r e s s c o = 诧s s c 0 1r e s s c 0 2r e s s c 0 3 r e s s c 0 4 55 4 4 4 6 30 01 1 04 1 41 0 6 0r e s s c 0 5d f b e t a = b e t a lb e t a 2b e t a 3b e t a 4 4 5 0 0 0 0 0 0b e t a 5 6 1 3w t r e s s c h = w t r e lw t r e 2 w t r e 3w o e 4w u - e 5 73 3 1 5 2 60 06 4 03 7 91 0 8 0l d = i dl m a x = m a x ; 7 8 8 0 00 01 4p r o cp r i n t ; 8 1 5 r u n ; 9p r o cp h r e g d a t a = d lc o v o n t o i l t e s t = o u t e s t ; 从五个变量的s c h o e n f e l d 残差,加权s c o r e 残差可以看出,年龄变量、浮肿和凝血酶原 时间各有一个影响点,分别是2 9 3 和1 0 7 号观测点,对年龄和浮肿变量,影响最大的是2 9 3 号观测,是一女性患者,生存预后差,白蛋白较低,胆红素和凝血酶原时间较大,经利尿 治疗浮肿仍然存在,但随访3 年半后仍然存活。对凝血酶原时间,1 0 7 号观测的影响最大, 该6 2 岁女性的白蛋白和胆红素相当好,且没有出现浮肿,虽凝血酶原时问最长,随访长达 9 年依然存活。 as c h o e n f e l d 残筹年龄 bs c h o e n f e l d 残筹浮肿 i jj 两医科大学硕土学位论文 cs c h o e n f e l d 残差凝血时间 e 加权s c o r e 残差浮肿 g 鞅残著 似然距离 d 加权s c o r e 残差年龄 f 加权s c o r e 残差凝血时间 h 剩余残差 也k 。姒l k 瓤 图2 - 3p b c 数据影响诊断量图 j 最人影响曲率 e , 撕垃 l ,、乎磅一l 午f j 也上 似然距离 图i - f o 最大影响曲率 图j 】提示1 0 7 、2 9 3 号观测为异常点,这两个异常点的 原始数据及其对模拟结果的影响分别见表2 5 和2 - 6 。 经详细的数据复查,2 9 3 号观测的原始数据没有发现误差,而另一观测的数据输入有 误,1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 八级上册数学期中测试题及答案
- 测血糖的考试题及答案
- 测井考试题及答案完整版
- 藏族剧目考试题及答案大全
- 照相机与照相设备装配调试工质量追溯知识考核试卷及答案
- 半导体分立器件封装工抗压考核试卷及答案
- 制造企业安全生产责任制及执行方案
- 推广坚果节能减排技术创新创业项目商业计划书
- 火锅麻辣烫店营销方案
- 建筑垂直绿化创新创业项目商业计划书
- 【人教版化学】选择性必修1 知识点默写小纸条(空白默写版)
- 2024-2030年中国沙拉汁市场面临的发展商机及投资竞争力分析报告
- 高中英语新课标3000词汇表
- 体育训练安全应急预案
- 《航空保险》课件
- 《欧洲联盟》课件
- 肺部感染与抗生素使用课件
- 脊柱侧弯中医治疗
- 简化版房屋租赁合同模板
- IEC 62368-1标准解读-中文
- 15J403-1-楼梯栏杆栏板(一)
评论
0/150
提交评论