(概率论与数理统计专业论文)半参数广义线性模型若干问题的研究.pdf_第1页
(概率论与数理统计专业论文)半参数广义线性模型若干问题的研究.pdf_第2页
(概率论与数理统计专业论文)半参数广义线性模型若干问题的研究.pdf_第3页
(概率论与数理统计专业论文)半参数广义线性模型若干问题的研究.pdf_第4页
(概率论与数理统计专业论文)半参数广义线性模型若干问题的研究.pdf_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的研究成 果。据我所知,除文中已经注明引用的内容外,本论文不包含其他个人已经发表或 撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明 确说明并表示谢意。 作者签名皇鳖啉卫业 学位论文使用授权声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学校有权保留学 位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版。有权将学位论 文用于菲赢利目的的少量复制并允许论文进入学校图书馆被查阅。有权将学位论文 的内容编入有关数据库进行检索。有权将学位论文的标题和摘要汇编出版。保密的 学位论文在解密后适用本规定。 学位论文作者签名:曾赫苎 导师签名 日期: 。争,廖 日期:p 中、ft 坚 f淳 币 华东师范大学博士学位论文( 2 0 0 4 ) i 摘要 当我们把数据集纳入到某一回归模型进行研究的时候,必然要做一些假定,如 方差齐性等等,甚至模型本身也是一种假定,如果假定不成立,模型的估计和其他 统计推断结果会受到很大的影响,从而人们展开了对回归模型的统计诊断及方差齐 性检验的研究,它们是处理回归问题的重要步骤,在理论和应用上都有十分重要的 意义。八十年代中期,g r e e n 等( 1 9 8 5 ) 在研究农业试验和e n g l e 等( 1 9 8 6 ) 在研究 气候条件对电力需求的影响这两个实际问题时分别独立地提出了一种重要的统计模 型,即半参数回归模型。该模型既含有参数分量,又含有非参数分量,它可以概括 和描述众多实际问题,较参数和非参数回归模型更接近真实,更能充分利用数据中 提供的信息。而半参数广义线性模型则是半参数回归模型与广义线性模型的自然推 广,本论文针对半参数广义线性模型,探讨了它的统计诊断及方差成分检验问题, 现将主要内容概述如下: 1 第一章首先简单地介绍了半参数回归模型和选择光滑参数的交叉核实法 ( c r o s sv a l i d a t i o n ,简称c v ) 以及广义交叉核实法( g e n e r a l i z e dc r o s sv a l i d a t i o n ,简 称g c v ) ,本论文均采用g c v 法选择光滑参数。其次,介绍了统计诊断的背景及 研究现状。第三,针对一般回归模型,广义回归模型及纵向数据模型,介绍了方差 成分检验的背景及研究现状。最后介绍了方差成分检验中普遍采用的s c o r e 检验统 计量。本论文的方差成分检验问题及异常点的检验问题均采用s c o r e 检验统计量。 2 第二章系统地研究了半参数广义线性模型的统计诊断及影响分析问题。主要 内容有:第一,基于光滑样条的估计方法,证明了数据删除模型与均值漂移模型的 等价性定理,并定义了广义c o o k 距离等诊断统计量第二,研究了异常点的s c o r e 检验统计量,得到了一系列诊断统计量的简洁计算公式。第三,研究了该模型的局 部影响分析,分别对加权扰动模型,响量变量扰动模型,自变量扰动模型得到了影 响距阵的计算公式。最后,通过两个实际例子( 老鼠药物试验数据及老人小便失禁 数据) 验证了这些方法的可行性与有效性。 3 第三章系统地研究了半参数广义线性随机效应模型的统计诊断及影响分析 问题。首先进行了诊断模型分析,证明了数据删除模型与均值漂移的等价性定理, 得到了一些诊断统计量如残差,杠杆值,广义c o o k 距离等的简洁计算公式。其次研 究了异常点的s c o r e 检验统计量。接着研究了该模型的局部影响分析,分别对加权 扰动模型,响应变量扰动模型得到了影响距阵的计算公式。最后通过一个实际例子 华东师范大学博士学位论文( 2 0 0 4 ) 2 ( 小孩呼吸感染数据) 证实了本文提出方法的可行性。 4 第四章系统研究了半参数广义线性模型的方差成分检验。在离散型情形,用 随机效应法研究了该模型的方差成分检验问题,得到了检验的s c o r e 统计量。在连 续型情形,分别对离差参数变异,回归系数随机,离差参数变异且回归系数随机三 种情况研究了该模型的方差成分检验,得到了s c o r e 检验统计量。实际例子和模拟 研究显示,这些检验方法是较为有效的。 5 第五章系统研究了基于纵向数据的半参数广义线性模型的方差成分检验。在 离散型情形,用随机效应法研究了该模型的方差成分检验,得到了检验的s c o r e 统 计量。在连续型情形,对离差参数变异,随机效应的影响及两者同时具有时三种情 况研究了该模型的方差成分检验问题,得到了s c o r e 检验统计量。实际例子和模拟 研究显示,这些检验方法是较为有效的。 综上所述,本文首先系统地研究了半参数广义线性模型及半参数广义线性随 机效应模型的统计诊断与影响分析,提出了若干有效的诊断统计量,推广和发展了 c o o k ( 1 9 7 7 ) ,c o o k ( 1 9 8 6 ) ,韦博成等( 1 9 9 1 ) ,z h o n g & w e i ( 1 9 9 9 ) ,k i m ,e ta i ( 2 0 0 2 ) 等人 的结果。实例验证表明,本文得到的结果与方法简洁有效。其次,本文首次较为全 面地研究了半参数广义线性模型与基于纵向数据的半参数广义线性模型的方差成分 检验问题,得到了一系列新的成果,推广和发展了c o o k & w e i s b e r g ( 1 9 8 3 ) ,j a c q m i n - g a d d a & c o m m e n g e s ( 1 9 9 5 ) ,l i n ( 1 9 9 7 ) ,l i n & w e i ( 2 0 0 1 ) ,林金官( 2 0 0 2 ) ,韦博成,林 金官( 2 0 0 2 ) ,z h u ( 2 0 0 4 ) ,冉吴,朱仲义( 2 0 0 4 ) 等人的工作。这些成果不仅在理论上很 有意义,而且也具有广泛的应用价值,实例和随机模拟表明,这些结果与方法简洁 有效。 关键词;半参数广义线性模型,光滑样条,g c v 法,c v 法,统计诊断,广义 c o o k 距离,局部影响,影响矩阵,l a p l a c e 展开,s c o r e 检验统计量,方差成分检 验,离差参数,随机效应,纵向数据 华东师范大学博士学位论文f 2 0 0 4 ) a b s t r u e t w h e nw eb r i n gd a t as e ti n t oo n er e g r e s s i o nm o d e l ,s o m ea s s u m p t i o n sa r eu s e d f o r e x a m p l e ,h o m o g e n e i t yo fv a r i a n c e ,e ta l e v e nt h em o d e li t s e l fi sa na s s u m p t i o ni ft h e a s s u m p t i o n sa r e n tt r u e ,t h ee s t i m a t ea n d o t h e rs t a t i s t i c a li n f e r e n c ew i l lb ei n f l u e n c e ds o t h ep e o p l eb e g i nt os t u d yt h ed i a g n o s t i c sa n dt h et e s t i n go fh o m o g e n e i t yo fv a r i a n c ef o rr e g r e s s i o nm o d e l s ,w h i c ht h e ya r ei m p o r t a n tp r o c e d u r e s o n d e a l i n g w i t hr e g r e s s i o np r o b l e m s a n dh a v ei m p o r t a n t s i g n i f i c a t i o ni nt h e o r ya n dp r a c t i c e i nt h em i d d l eo f1 9 8 0 s ,g r e e n ,e t a 1 ( 1 9 8 5 ) ,w h i l es t u d y i n ga g r i c u l t u r ee x p e r i m e n t s ,a n de n g l e ,e ta 1 ( 1 9 8 6 ) ,w h i l es t u d y i n g t h er e l a t i o nb e t w e e nw e a t h e ra n de l e c t r i c i t ys a l e s ,p r o p o s e di n d e p e n d e n t l ya ni m p o r t a n t s t a t i s t i c a lm o d e l ,t h a ti ss e m i p a r a m e t r i cr e g r e s s i o nm o d e l t h e r ea r et h ep a r a m e t r i cp a r t a n d n o n p a r a m e t r i cp a r ti nt h em o d e l a l o to fa c t u r a lp r o b l e m sc a nb ed e s c r i b l e dt h r o u g h t h i sm o d e l t h ei n f o r m a t i o n so fd a t ac a nb eu s e d f u l l ya n d i ti sm o r et r u et h a np a r a m e t r i c m o d e l sa n d n o n p a r a m e t r i cm o d e l s t h es e m i p a r a m e t r i cg e n e r a l i z e dl i n e a rm o d e l sa r et h e n a t u r a le x t e n s i o no ft h es e m i p a r a m e t r i cr e g r e s s i o nm o d e l sa n dg e n e r a l i z e dl i n e a rm o d e l s i nt h i sp a p e r ,t h es t a t i s t i c a ld i a g n o s t i c sa n dt h ev a r i a n c ec o m p o n e n tt e s t i n ga r es t u d i e d f o rt h e s em o d e l s t h em a i nr e s u l t so ft h i sp a p e ra r ea sf o l l o w s : 1 i nt h ef i r s tc h a p t e rw e g i v eab r i e fd e s c r i p t i o no fs e m i p a r a m e t r i cr e g r e s s i o nm o d e l s , t h ec r o s sv a l i d a t i o na n dt h eg e n e r a l i z e dc r o s sv a l i d a t i o no f c h o o s i n gt h es m o o t h i n gp a - r a m e t e r g e n e r a l i z e dc r o s sv a l i d a t i o ni su s e di nt h i sp a p e r t h eb a c k g r o u n da n d p r e s e n t c o n d i t i o n sf o rs t a t i s t i c a ld i a g n o s t i c sa r ei n t r o d u c e d s e c o n d l y , w ea l s oi n t r o d u c et h e b a c k g r o u n da n dp r e s e n tc o n d i t i o n sf o ro r d i n a r yr e g r e s s i o nm o d e l s ,g e n e r a l i z e dr e g r e s s i o n m o d e l sa n dl o n g i t u d i n a ld a t am o d e l s a tt h el a s t ,t h es c o r et e s ts t a t i s t i c sa r ei n t r o d u c e d t h es c o r et e s ts t a t i s t i c sf o rv a r i a n c ec o m p o n e n tt e s t i n ga n do u t l i e ra r eu s e di nt h i sp a p e r 2 i nt h es e c o n dc h a p t e r w es t u d ys y s t e m a t i c a l l yt h es t a t i s t i c a l d i a g n o s t i c sa n d i n f l u e n c ea n a l y s i sf o rs e m i p a r a m e t r i cg e n e r a l i z e dl i n e a rm o d e l s t h em a i nr e s u l t sa r ea s f o l l o w s :u n d e rt h ee s t i m a t eo f s m o o t h i n gs p l i n e ,w ef i r s ts h o w t h a tt h ec a s ed e l e t i o nm o d e l i se q u i v a l e n tt om e a ns h i f to u t l i e rm o d e la n dt h ed i a g n o s t i cs t a t i s t i c ss u c ha 8c o o kd i s t a n c e ,e ta la r ei n t r o d u c e d t h e s c o r et e s ts t a t i s t i c sf o ro u t l i e rt e s t sa r ed e r i v e da n das e r i e s o fs i m p l ec o u n t i n gf o r m u l a sf o rd i a g n o s t i cs t a t i s t i c sa r eo b t a i n e d t h e nt h el o c a li n f l u e n c e n l e a s u r e sa r ed i s c u s s e da n dt h ec o u n t i n gf o r m u l a so fi n f l u e n c em a t r i c e sf o rc a , s e w e i g h t s 华东师范大学博士学位论文( 2 0 0 4 j 4 d e r t u r b a t i o nm o d e l ,n l e a ns h i f tp e r t u r b a t i o nm o d e la n da r g u m e n t sp e r t u r b a t i o nm o d e l a r eo b t a i u e d f i n a l l y 、t w on u m e r i c a le x a m p l e s ( t h ed a t ao fm i c em e d i c i n ee x p e r i m e n t s a n d t h ed a t ao fo h t m a nu r i n a r yi n c o n t i n e n t ) a r eu s e dt oi l l u s t r a t et h a to u rm e t h o d i sa v a i l a b l e 3 i nt h et h i r dc h a p t e r ,w es t u d ys y s t e m a t i c a l l yt h es t a t i s t i c a ld i a g n o s t i c sa n d i n f l u - e n c ea n a l y s i sf o rs e m i p a r a m e t r i cg e n e r a l i z e dl i n e a rm i x e dm o d e l f i r s t l y ,t h ee q u i v a l e n c y o fc a s ed e l e t i o nm o d e la n dm e a ns h i f to u t l i e rm o d e li si n v e s t i g a t e da n ds o m ed i a g n o s t i c s t a t i s t i c ss u c ha sr e s i d u a l s ,l e v e r a g ea n dc o o kd i s t a n c e ,e ta la r eo b t a i n e d t h es c o r et e s t s t a t i s t i c sf o ro u t l i e rt e s t sa r ea l s os t u d i e d s e c o n d l y , t h el o c a li n f l u e n c ef o rt h em o d e l si s i n v e s t i g a t e da n d t h ec o u n t i n gf o r m u l a so fi n f l u e n c em a t r i c e sf o rc a s ew e i g h t sp e r t u r b a t i o n m o d e la n dm e a ns h i f tp e r t u r b a t i o nm o d e la l eo b t a i n e d a tl a s t ,ar e a le x a m p l e ( t h ed a t a o fc h i l d r e nr e s p i r a t o r yi n f e c t i o n ) i sp r o v i d e dt oi l l u s t r a t et h a to u rm e t h o di sa v a i l a b l e 4 i nt h ef o u r t hc h a p t e r ,t h et e s t i n go fv a r i a n c ec o m p o n e n ti ns e m i p a s a m e t r i cg e n - e r a l i z e dl i n e a rm o d e li ss t u d i e d f o rd i s c r e t er a n d o me f f e c tm o d e l ,t h et e s t i n go fv a r i a n c e c o m p o n e n ti ss t u d i e da n dt h es c o r et e s ts t a t i s t i c s a r eo b t a i n e d f o rc o n t i n u o u sm o d e l , w es t u d yi t sv a r i a n c ec o m p o n e n tt e s t i n gf o rn o n c o n s t a n td i s p e r s i o np a r a m e t e r ,r a n d o m r e g r e s s i o nc o e f f i c i e n t sa n d t w os i t u a t i o n sr e s p e c t i v e l ya n dt h es c o r et e s ts t a t i s t i c sa r eo b t a i n e d t h em e t h o d o l o g yi ss e e nt op e r f o r mb e t t e rf o rs m a l la n dm o d e r a t es a m p l es i z e s t h r o u g h s i m u l a t i o n sa n dar e a le x a m p l e 5 i nt h ef i f t hc h a p t e r ,t h et e s t i n go fv a r i a n c ec o m p o n e n t i ns e m i p a r a m t r i c g e n e r a l i z e d l i n e a rm o d e lf o rl o n g i t u d i n a ld a t ai ss t u d i e d f o rd i s c r e t er a n d o m e f f e c tm o d e l ,t h et e s t i n g o fv a r i a n c ec o m p o n e n ti ss t u d i e da n dt h es c o r et e s ts t a t i s t i c sa r eo b t a i n e d f o rc o n t i n u o u s m o d e l ,w es t u d yi t s v a r i a n c ec o m p o n e n tt e s t i n gf o rn o n c o n s t a n td i s p e r s i o np a r a m e t e r , e x i s t e n tr a n d o me f f e c ta n dt w os i t u a t i o n sr e s p e c t i v e l ya n dt h es c o r et e s ts t a t i s t i c sa x e o b t a i n e d ar e a le x a m p l ea n ds o m es i m u l a t i o n sa r ep r o v i d e dt os h o wt h a to u rt e s tm e t h o d s a r ea v a i l a b l e i ns u m m a r y , t h es t a t i s t i c a ld i a g n o s t i c sa n di n f l u e n c ea n a l y s i sa r es t u d i e ds y s t e m - a t i c a l l yf o rs e m i p a r a m e t r i cg e n e l i z e dl i n e a rm o d e l sa n ds e m i p a r a m e t r i cg e n e l i z e dl i n e a r m i xm o d e l sf o rt h ef i r s tt i m ei nt h i sp a p e r s o m ea v a i l a b l ed i a g n o s t i cs t a t i s t i c sa r ep r o - p o s e d t h er e s u l t so fc o o k ( 1 9 7 7 ) c o o k ( 1 9 8 6 ) ,w e i ,bc ( 1 9 9 1 ) ,z h o n g w e i ( 1 9 9 9 ) , k i m ) e ta 1 ( 2 0 0 2 ) a r ee x t e n d e da n di m p r o v e d t w oe x a m p l e sa r eu s e dt oi l l u s t r a t e t h a t 华东师范大学博士学位论文( 2 0 0 4 j 5 o i l ri n e t h o d sa r ea v a i l a b l e s e c o n d l y ,t h et e s t i n go fv a r i a n c ec o m p o n e n t i sa l s os t u d i e df o r s e l i p a r a n m t r i cg e n e r a l i z e dl i n e a r m o d e la n ds e m i p a r a m e t r i cg e n e r a l i z e dl i n e a rm o d e lo f 1 0 n g i t u d i n a ld a t af o rt h e f i r s tt i m ei nt h i sp a p e r ,as e r i e so fn e wr e s u l t sa r eo b t a i n e da n d t h er e s u i t so fc o o k w e i s b e r g ( 1 9 8 3 ) ,j a c q m c n g a d d a & c o m m e n g e s ( 1 9 9 5 ) ,l i n ( 1 9 9 7 ) , l i n w e i ( 2 0 0 1 ) ,w e i ,bc l i n ,j g ( 2 0 0 2 ) ,z h u ( 2 0 0 4 ) ,w e i ,b c l i n ,j g ( 2 0 0 2 ) , r a n ,h & z h u ,z y 2 0 0 4 ) a r e e x t e n d e d t h e s er e s u l t sa r en o to n l yu s e f u li nt h e o r y b u t a l s os i g n i f i c a n ti np r a c t i c e e x a m p l e sa n ds o m es i m u l a t i o n sa r ep r o v i d e dt oi l l u s t r a t et h a t o u rm e t h o d sa r es i m p l ea n da v a i l a b l e k e yw o r d s :s e m i p a r a m e t r i cg e n e r a l i z e dl i n e a rm o d e l ,s m o o t h i n gs p l i n e ,g c v ,c v , s t a t i s t i c a ld i a g n o s t i c s ,c o o kd i s t a n c e ,l o c a li n f l u e n c e ,i n f l u e n c em a t r i c e s ,l a p l a c ee x p a n - s i o n ,s c o r et e s ts t a t i s t i c s ,v a r i a n c ec o m p o n e n tt e s t i n g ,d i s p e r s i o np a r a m e t e r ,r a n d o me l - f e c t s ,l o n g i t u d i n a ld a t a 第一章序言 统计学研究的出发点是一个数据集,该数据集往往是根据在实际工作中逐步积 累起来的历史资料或围绕某一特定目标收集起来的数据经初步加工整理而成。人们 经常通过数据集去研究实际问题,而回归分析是数理统计学中与实际问题联系最为 密切,应用范围最为广泛的统计方法,是分析数据,寻求变量之间关系最有力的工 具,通常有线性回归、非参数回归,半参数回归等等。但是,我们选择的模型能不能 大体上反映所要研究的实际问题,它是否与数据集中绝大多数的数据相一致,我们 所得到的数据集中会不会有个别数据由于收集或整理过程中的疏忽和失误或其他种 种原因而出现较大的误差,这些错误数据会不会严重干扰我们对问题的结论等等, 这些都是值得质疑的问题。统计诊断就是通过一些诊断统计量来检验数据、模型及 推断方法中可能存在的“毛病”,进丽提出治疗方案。另一方面,回归模型对随机误 差的方差也做了一些假定,如通常设它们的方差相同当假设不成立时,就会产生 很大的偏差,甚至导致错误的结论丽在实际中出现了方差不同的现象,人们因此 对方差齐性的假设产生怀疑,从而展开了对回归模型方差成分( v a r i a n c ec o m p o n e r t ) 检验的研究。本文就半参数广义线性模型的统计诊断与影响分析、方差成分的检验 等问题展开研究。1 1 对半参数回归模型及光滑参数作了简单的阐述;5 1 2 介绍 了统计诊断的背景及研究现状;1 3 介绍了方差成分检验的背景及研究现状;5 1 4 对方差成分检验中普遍采用的s c o r e 检验统计量作一简单介绍;l _ 5 介绍本文的主 要工作。 1 1 半参数回归模型 人们在研究实际问题中,通常假设实际数据来自某一参数模型或非参数模型, 然而许多实际问题不能简单地拟定为参数或非参数模型来讨论,例如影响考察对象 ( 指标y ) 的因素( 解释变量) 可分为两部分,即。h 1 ,孙及t ,根据经验或历史 资料可以认为因素。1 1 ,x p 是主要的,而且y 同z 1 1 ,是线性的;而t 则是某种 干扰因素( 或看作协变量) ,它同y 的关系是完全未知的,而且没有理由将其纳入 误差项,此时如用非参数回归加以处理,则会失去太多的信息,若采用线性回归一 般拟合情况很差,比较自然会采用线性回归及非参数回归的“混合”,称之为半参 6 圭查塑堇盔堂堕圭堂垡堡查 ! ! ! 型 7 数回归模型。e n g l e ,g r a n g e r 等( 1 9 8 6 ) 曾讨论气象条件对供电量的影响,就适合 这种情况。 半参数回归模型的一般形式可表示为 y i = z ,卢+ g ( t 。) + e ,i = 1 ,n ,( 11 ) 其中叭为响应变量,= ( q ”。x i p ) t ,卢= ( 卢l ,岛) 丁( p 1 ) ,( 嗣,t ,) 是i 谢随机设 计或固定非随机设计点列,e i 是i 涮随机误差,且e e ;= 0 ,e e ;= o - 2 0 , ( 1 4 ) 其中l ( f f ,g ) 为( 1 3 ) 式表示的对数似然函数,a 是一个光滑参数。a 的选择是否 适当对估计量的性质影响很大。选择 的方法有很多,文献中广泛采用交叉核实法 华东师范大学博士学位论文f 2 0 0 4 j 8 ( c r o s sv a l i d a t i o n ,简称c v ) 或广义交叉核实法( g e n e r a l i z e dc r o s sv a l i d a t i o n ,简称 g c v 法) 得到。本文均采用g c v 法来选择光滑参数。 设珙1 为去掉第i 个数据点后,由剩下的数据估计出响应变量在( t 。) 处的 拟合值,则c v 法的选择标准就是选择光滑参数a 使得 e y ( a ) = n _ 1 ( 肌一) 2 , 达到最小。设矿= ( 玑,。) 为由数据得到的拟合值,若存在矩阵h ,使得p = h y , 则称矩阵h 为帽子矩阵( h a t , m a t r i x ) ,设h ,。为矩阵h 的第i 个对角元素。e 。= y i 一吼, 由删除原理c v ( a ) 又可表示为 洲壮n 一蚤n 甄e i ) 2 1 = l 而g c v 法就是选择 使得 g 刚炉n _ 若蒜舔, 达到最小。若所有的h , 相等,则两种方法一致 关于光滑参数a 的选取及其有关性质可参见s t o n e ( 1 9 7 4 ) ,w a h b a & w o l d ( 1 9 7 5 ) , c r a v e n & w a h b a ( 1 9 7 9 ) ,w a h b a ( 1 9 8 5 ) ,h a r d l e ( 1 9 9 0 ) 等等。而关于光滑样条估计的一 些性质可参见e u b a n k ( 1 9 8 8 ) ,g r e e n s i l v e r m a n ( 1 9 9 4 ) 等等。 1 2 统计诊断 统计诊断是7 0 年代中期发展起来的一门统计学新分支,二十多年以来它以强 烈的应用背景,新颖的统计思想,广泛的研究内容越来越受到大家的重视。 由于任何统计模型都只能是对客观复杂过程的一种近似描述,它不可避免地要 包含某些假定,甚至模型本身也就是一种假定,所以当我们把数据集纳入到某一方便 有效的统计模型进行研究的过程中,存在许多值得思考的问题,例如数据集中各个 数据点对我们进行统计推断的影响是否大致相仿,会不会有某些点的影响特别大, 即所谓强影响点( i n f l u e n t i a lp o i n t ) ,有没有严重偏离既定模型( p o s t u l a t e dm o d e l ) 的 数据点,即所谓异常点( o u t l i e r ) ,有没有远离数据主体的点,即所谓高杠杆点( h i g h l e v e r a g ep o i n t ) 等等 华东师范大学博士学位论文f 2 0 0 4 ) 9 统计诊断就是针对上述种种问题而发展起来的一种分析方法。它是对统计方法 解决问题的全过程进行诊断。识别,判定和检验异常点是统计诊断的重要内容。它 的另一重要内容就是影响分析,每个数据点对回归模型的统计推断( 如估计,检验, 预测等) 都有一定的影响,但并非每个数据点的影响都一样,通过统计量定量刻画 数据点影响的大小,从而找出强影响数据点,这也是统计诊断的重要内容。另外, 统计诊断还包括残差分析、数据变换等内容。值得注意的是,图法( g r a p h i c s ) 在统计 诊断中占有非常重要的地位,通过诊断图,人们可以更简单、更直观地进行思考, 作出判断。 二十多年来,对于线性回归诊断,c o o k ( 1 9 7 7 ) ,c o o k w e i s b e r g ( 1 9 8 2 ) ,韦博成 等( 1 9 9 1 ) 做了系统的研究。对某些非线性模型也有许多结果,例如p r e g i b o n ( 1 9 8 1 ) , w i u i a m s ( 1 9 8 7 ) ,m c c u l l a g h n e l d e r ( 1 9 8 9 ) ,韦博成等( 1 9 9 1 ) ,d a v i s o a t s a i ( 1 9 9 2 ) , w e i ( 1 9 9 8 ) ,w e i ,e ta l ( 1 9 9 8 ) ,对非参数回归模型,也有许多作者讨论,例如e u b a n k ( 1 9 8 4 ,1 9 8 5 ) ,s i l v e r m a n ( 1 9 8 5 ) ,e u b a n k ,e ta 1 ( 1 9 8 6 ) ,t h o m o s ( 1 9 9 1 ) ,k i m ( 1 9 9 6 ) ,k i m ,e ta l ( 1 9 9 8 ) ,k i m ,e ta 1 ( 2 0 0 1 ) ,而朱仲义,韦博成( 2 0 0 1 ) 基于光滑样条系统研究了半参数 非线性模型的诊断和影响分析的方法,k i m ,e ta 1 ( 2 0 0 2 ) 详细讨论了半参数回归模型 的诊断方法。对于半参数广义线性模型的统计诊断研究在文献中至今还未见到,本 文将作系统研究。 另一方面,随机效应模型即方差分量模型,也是目前重要的研究课题之一。 王松桂( 1 9 8 6 ) 对随机效应模型作了系统的概括和总结。由于随机效应模型在生物 育种、心理学、工业控制和计量经济等领域有着广泛的应用,一直受到人们的重 视,发展很快,文献很多,例如h a r v i l l e ( 1 9 7 7 ) ,m i l l e r ( 1 9 7 7 ) ,王静龙( 1 9 8 7 ) ,z e g e r & k a r i m ( 1 9 9 1 ) ,s c h a l l ( 1 9 9 1 ) ,l 如b i n s o n ( 1 9 9 1 ) ,d a v i d i a n g i l t i n a n ( 1 9 9 5 ) ,v o n e s h ( 1 9 9 6 ) , z h u a n m a o ( 1 9 9 6 ) ,z h a n g ,e ta 1 ( 1 9 9 8 ) ,z h o n g & z h u ( 1 9 9 8 ) ,z h o n g w e i ( 1 9 9 8 ) ,l i n z h a n g ( 1 9 9 9 ) ,b r e s l o w c l a y t o n ( 1 9 9 3 ) ,m c g i l c h r i s t ( 1 9 9 4 ) ,l i n & b r e s l o w ( 1 9 9 6 ) ,y a u k u k ( 2 0 0 2 ) 等等。因而对这一类模型的统计诊断也是一个值得研究的问题。 对于线性随机效应模型的诊断已经得到很大的发展,例如b e c k m a n ,e ta 1 ( 1 9 8 7 ) , c h r i s t e n s e n & p e a r s o n ( 1 9 9 2 ) ,x i a n g s h i ( 1 9 9 4 ) ,石磊等( 1 9 9 6 ) ,b a n e r j e e f r e e s ( 1 9 9 7 ) , l e s a f f r e v e r b e k e ( 1 9 9 8 ) ,z h o n g & w e i ( 1 9 9 9 ) 而对于其它模型( 非线性随机效应模 型、广义线性随机效应模型) 的统计诊断,也有不少研究成果,如w e i z h o n g ( 2 0 0 1 ) , p r e i s s e r q a q i s h ( 1 9 9 6 ) ,o u w e n s ,e ta 1 ( 2 0 0 1 ) ,x i a n g ,e ta 1 ( 2 0 0 3 ) 等等。f u n g ,e ta 1 ( 2 0 0 2 ) 华东师范大学博士学位论文( 2 0 0 4 ) 1 0 基于光滑样条研究了半参数混合模型的影响分析及异常点的检验。而半参数广义线 性随机效应模型是半参数回归模型与广义线性随机效应模型的自然推广,它的一般 形式可表示为 仇= ,( p 。) = z 弘+ g ( t ;) + = , r、 p l ( y d ) = e x p 粥们一b ( o d c ( 玑) 】 , 其中币为离差参数,( ) 为一元单调联系函数,g ( ) 为未知光滑函数,卢为p 维 未知参数,( z ,巧,t i ,y d 为第i 个数据点,p i ( y d u ) 为y i 的条件密度函数,u 为随 机效应向量,一般设u 服从正态分布,且p l ( y l l u ) ,p l ( y n l u ) 条件独立。 对于该模型的统计诊断研究,在文献中至今还未见到,本文将尝试作一些研 究。 1 3 方差成分检验 1 3 1 一般回归模型的方差成分检验 在回归分析中,观测值的方差齐性是一个很通常的假定。如果假定不成立,模 型的估计和其他推断结果都会受到很大的影响。虽然可以通过数据变换方法和其它 一些处理方法来使得方差齐性,但是必须先检验数据的方差齐性,否则,将会在默 认方差齐性模型下来讨论问题。因而模型的方差齐性检验是一个十分重要的问题。 对于一般的回归模型,通常可以表示成如下的形式 y i = 妒( 。,芦) + i ,i n ( o ,r y 2 ) ,i = 1 ,2 ,n ( 1 5 ) 其中卢为p 维回归系数向量,岛为随机误差,0 2 为随机误差的方差若c l o ( z i ,卢) = 。 卢, 则模型( 1 5 ) 为线性回归模型。 但y i 的方差可能与i 有关,即方差非齐次,这时可表示为 v a r ( y i ) = , i = 1 ,2 ,n ( 1 6 ) 从而回归模型( 1 5 ) 的方差齐性检验可表示为 n o :口? = o * 2 ;h 1 :盯? 口2 ( 1 7 ) 兰查堕薹盔堂垫主堂焦堡塞望! ! 型 在( 1 6 ) 的假设下,由于未知参数有n + p 个,而观测值只有n 次 计很困难,通常的做法是将a ? 参数化,即假设 口? = 口2 m ( h l ,_ ) , i = 1 ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论