(概率论与数理统计专业论文)可加模型异方差与广义可加模型变离差的检验.pdf_第1页
(概率论与数理统计专业论文)可加模型异方差与广义可加模型变离差的检验.pdf_第2页
(概率论与数理统计专业论文)可加模型异方差与广义可加模型变离差的检验.pdf_第3页
(概率论与数理统计专业论文)可加模型异方差与广义可加模型变离差的检验.pdf_第4页
(概率论与数理统计专业论文)可加模型异方差与广义可加模型变离差的检验.pdf_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 回归模型的异方差检验与广义回归模型的变离差检验是统计诊断的重要课题 在经典的回归分析中,观测值的方差齐性是一个很基本的假定在此假定下,方可进 行常规的统计推断当假设不成立时。就会产生很大的偏差,甚至导致统计推断的 错误,因此对于观测数据的方差齐性检验是十分必要的近年来,对于线性模型,非 线性模型,半参数模型等回归模型方差成分检验的研究已有很多,而可加模型作为 一类重要的回归模型,其方差检验的研究却未见报导因此本文主要对一般可加模 型的异方差检验与广义可加模型的变离差检验问题进行系统研究 第二章系统地研究了一般可加模型的异方差检验问题基于光滑样条的估计方 法,得到了检验的s c o r e 统计量,并通过m o n t ec a r l o 随机模拟和实际例子说明了检验 方法的有效性及其应用 第三章系统地研究了连续型广义可加模型的变离差检验问题针对离差参数的 变异,研究了该模型的方差成分检验,得到了s c o r e 检验统计量,并通过随机模拟验 证了检验方法的正确性 第四章系统地研究了离散型广义可加模型的变离差检验问题本章利用随机效 应法研究了此模型的方差成分检验,得到了检验的s c o r e 统计量随机模拟和实际饲 子的结果表明,这个检验方法是较为有效的 综上所述,本文首次较为全面系统地研究了可加模型的异方差与广义可加模型 的变离差检验,得到了一系列新的成果,这些成果不仅在理论上很有意义,而且也具 有广泛的实际应用价值本文的数值实倒和随机模拟分析说明,得到的结果与方法 是简洁的有效的 关键词:可加模型;广义可加模型;异方差;变离差;s c o r e 检验;m o n t ec a r l o 随机 模拟 中图分类号:0 2 1 2 2 分类号a m s ( 2 0 0 0 ) :6 2 j 0 5 ;6 2 f 1 0 a b s t r a c t t h et e s t i n gf o rh e t e r c s c e d a s t i e i t yi nr e g r e s s i o nm o d e l sa n dv a r y i n gd i s p e r s i o ni ng e n e r a l - i z e dr e g r e s s i o nm o d e l si sr 1 1i m p o r t a n tp r o b l e mi ns t a t i s t i c a ld i a g n o s t i c s i nc l a s s i c a lr e g r e s s i o n a n a l y s i s ,t h eh o m o s c e d a s t i c i t yo fo b s e r v a t i o n si sav e r yb a s i ca s s u m p t i o n u n d e rt h i sa s s u m p - t i o n ,i ti sf e a s i b l et om a k er o u t i n es t a t i s t i c a li n f e r e n c e w h e nt h ea s s u m p t i o nf a i l s ,i tm a yc a u s e b i gd e v i a t i o n ,e v e nw r o n gs t a t i s t i c a li n f e r e n c e t h e r e f o r ei t i sa b s o l u t e l yn e c e a r i l yt ot e s tt h e h o m o s e e d a s t i c i t yo ft h eo b s e r v a t i o nd a t ai nr e c e n ty e a r s ,t h e r ea r em a n yr e s e a r c hp a p e r sa b o u t t h et e s t so fv a r i a n c ec o m p o n e n ti nr e g r e s s i o nm o d e l ss u c h l i n e a rm o d e l s n o n l i n e a rm o d e l s a n ds e m i - p a r a m e t e rm o d e l sa n ds oo n b u ta sa ni m p o r t a n tk i n do fm o d e l s ,t h er e s e a r c ho n t h ev i m i a n c ec o m p o n e n to fa d d i t i v em o d e l sh a sn o tb e e nr e p o r t e d s ot h i st h e s i sm a i n l ys t u d i e s t h et e s t so fh e t e r o s c e d a s t i c i t yi na d d i t i v em o d e l sa n dv a r y i n gd i s p e r s i o ni ng e n e r a l i z e da d d i t i v e m o d e l s i nc h a p t e r2 ws y s t e m a t i c a l l ys t u d yt h et e s tf o rh e t e r c s c e d a s t i c i t yi na d d i t i v em o d e l s b a s e do nt h ee s t i m a t i o no fs m o o t hs p l i u e s ,w eo b t a i nt h et e s ts t a t i s t i co fs c o r e t h e nw e i n v e s t i g a t et h et e s tp o w e rb ym o n t ec a r l os i m u l a t i o n s ,w h i c hd i 8 p l ”t h a tt h ep r o p o s e dt e s th a s n i c ep o w e r s a n d p r a c t i c a le x a m p l ei sa l s og i v e nt oi l l u s t r a t et h ea p p l i c a t i o no fo u rr e s u l t s i nc h a p t e r3 ,w es y s t e m a t i c a l l ys t u d yt h et e s tf o rv a r y i n gd i s p e r s i o ni nc o n t i n u o u sg e n e r - a u z e da d d i t i v em o d e l s t h et e s tf o rv a r i a n c ec o m p o n e n ti ss t u d i e dw h e n d i s p e r s i o np a r a m e t e r v a r i e s a n dt h et e s ts t a t i s t i co fs c o r ei sd e r i v e d t h e nw ei i l u s t r a t et h ec o r r e c t n e s so fo u rt e s t m e t h o db ym o n t ec a r l os i m u l a t i o n s i n c h a p t e r 4 ,w e s y s t e m a t i c a l l ys t u d y t h e t e s t f o r v a r y i n g d i s p e r s i o n i n d i s c r e t e g e n e r a l i z e d a d d i t i v em o d e l s w bi n v e s t i g a t et h et e s tf o rv a r y i n gd i s p e r s i o nb yr a n d o me f f e c tm e t h o da n d o b t a i n t h e t e s t 就a t 斌i c o f s c o r e t h e r e s u l t s0 fs t o c h a s t i cs i m u l a t i o n s a n d t h e n u m e r i c a l e x a m p l e s h o wt h a tt h et e s ts t a t i s t i ci se f f e c t i v e i ns u m m a r y , t h i st h e s i sc o m p r e h e n s i v e l ya n ds y s t e m a t i c a l l ys t u d i e st h et e s t sf o rh e r - e r o s c e d a s t i c i t yi na d d i t i v em o d e l sa n dv a r y i n gd i s p e r s i o ni ng e n e r a l i z e da d d i t i v em o d e l s ,a n d g e t sas e r i e so fn e wr e s u l t s t h er e s u l t sa f f en o to n l ys i 斟l i f i c a t i v ei nt h e o r y , b u ta l s ov a l u a b l e i np r a c t i c e p o w e rs i m u l a t i o n sa n dn u m e r i c a le x a m p l e se r eu s e dt oi l l u s t r a t et h ec o n c i s i o n a n dv a l i d i t yo fo u rr e s u l t sa n dm e t h o d s k e yw o r d s :a d d i t i v em o d e l s ;g e n e r a l i z e da d d i t i v em o d e l s ;h e t e r c e c e d a s t i c i t y ;v a r y i n gd i s p e r - s i o n ;s c o r et e s t ;m o n t sc a r l os t o c h a s t i cs i m u l a t i o n 东南大学学位论文 独创性声明及使用授权的说明 一、学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果尽我所知,除了文中特别加以标明和致谢的地方外,论文中不包含其他人 已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或 证书而使用过的材料与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意 二、关于学位论文使用授权的说明 东南大学中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论 文的复印件和电子文档,可以采用影印缩印或其他复制手段保存论文本人电子文 档的内容和纸质论文的内容相一致除在保密期内的保密论文外,允许论文被查阅 和借阅,可以公布( 包括刊登) 论文的全部或部分内容论文的公布( 包括刊登) 授权 东南大学研究生院办理 签名;导师签名:日期; 第一章绪论 人们在解决实际问题时,常常要去研究两个随机变量y 与x 之间的关系,称 f ( x ) = e ( y x = z ) 为回归函数当回归函数的形式已知,而其中仅仅存在一些未知参 数,我们常可以运用非参数回归的方法估计其中的未知参数但是在实际应用中,回 归函数的形式常常是未知的,此时常常使用非参数回归模型( n o n p a r a m e t r i cr e g r e s s i o n m o d e l s ) 所谓非参数回归是不对未知的函数形式做任何具体的假定,而是假定( z ) 具有某种属性,如,( z ) 为一个光滑的函数等即假定 y = f ( x ) + e , ( 1 1 ) 其中,( ) 为未知函数,具有一定的光滑性,( = 0 ,e e 2 = 户) 为随机误差非参数 回归的优点是稳健性( r o b u s t n e s s ) ,永远不会错误地估计,) 理论上讲,模型( 1 1 ) 中回归变量x 可以是向量,一元非参数回归的估计方法可 以真接推广到多元非参数回归但实际上,常用的非参数估计方法估计多元的非参数 回归函数,需要大量的数据,并且估计极不稳定,人们称这种现象为“维数祸根”( t h e c l l i 3 e o f d i m e n s i o n a l i t y ) 不过在近代统计中,我们常常面临的是高维数据,因此高维数 据的回归分析是一个非常热门的话题许多统计学工作者都在努力探索y 与高维变量 x 之间的回归关系,其最终目的就是寻找结构简单、易于估计、容易解释的回归模型 而可加模型( a d d i t i v em o d e l 8 ) 单指标模型( s i n g l e - n d e xm o d e k ) 投影追踪( p r o j e c t i o n p e r s u i t ) 部分线性模型( p a r t i a l l yl i n e a rm o d e h ) 、变系数模型( a r y i n g - c o e f f i c i e n tm o d e l s ) 等就是他们所取得的成果 回归模型的异方差检验与广义回归模型的变离差检验是统计诊断的重要课题 在经典的回归分析中,观测值的方差齐性是一个很基本的假定在此假定下,方可进 行常规的统计推断当假设不成立时,就会产生很大的偏差,甚至导致错误的统计 推断而在实际问题中经常出现方差非齐性的现象,人们因此对方差齐性的假设产 生怀疑,从而展开了对回归模型的异方差或变离差检验的研究而可加模型与广义 可加模型作为一类重要的回归模型,也存在着异方差与变离差的同题。因此,本文 下面将对可加模型与广义可加模型的方差成分进行研究本章第一节对可加模型与 广义可加模型以及光滑参数的选取作一简要的阐述;第二节介绍方差成分检验的背 景及研究现状;第三节对方差成分检验中普遍采用的s c o r e 检验统计量作简要的介 绍;第四节介绍本文的主要研究工作 1 东南大学砸士学位论文第一章绪论2 1 1 可加模型与广义o - i 力。模型 可加模型与广义可加模型是由h a s t i ea n dt i b s h i r a n i 最早提出的许多模型,如 一般的线性回归模型、一元非参数回归模型、半参数回归模型等都可以看作是可加 模型的特殊情形下面我们就简要地介绍一下可加模型,广义可加模型以及光滑参 数的选取方法 1 1 1 可加模型 h a s t i ea n dt i b s h i r a n i ( 1 9 8 6 ) 提出了如下可加模型 y = n + f ( x ) + 9 ( z ) + t ,( 1 2 ) 其中函数”) 和g ( ) 未知,且假定e f ( x ) = e 9 ( z ) = 0 ,u 为随机误差他们还提出模型 的如下估计方法;首先得到参数n 的估计为a = p ,其次对模型y a = f ( x ) + ”进行 局部核最小二乘估计,得到函数几) 的估计为,( ) ,然后对模型y a 一,伍) = 9 ( z ) + ” 进行估计,得到函数9 ( ) 的估计为( ) ,最后得到模型( 1 2 ) 中随机误差项u 的估计为 豆= y a h x ) 一( z ) ,h a s t ka n dt i b s h 幽a i ( 1 9 9 0 ) 给出了可加模型的更一般形式 p 鼽= 口+ 办( ) 十矗,i = 1 ,2 ,n ( 1 3 ) j = l 其中口= 协,如) t 为响应变量,= 慨l ,。咖) r ( i = 1 ,2 ,为回归变量, 办( ) o = 1 ,2 ,p ) 为一元光滑函数,矗之间相互独立,且e ( z i ) = 0 ,v a t 慨) = 口2 我 们知道,线性模型有一个特点使得它在统计推断方面很受欢迎,那就是它在预测效 应上是可加的如果数据可以用线性模型进行拟合,我们就可以单独研究每个回归变 量的预测效应从模型( 1 3 ) 可以看出,可加模型保留了线性模型的这个重要特点, 且形式更一般化,因此受到了广泛的应用 1 1 2 广义可加模型 模型( 1 3 ) 可进一步推广为广义可加模型,它们可表示为 f 9 ( 埘) = a + 办( 。巧) ,i = l ,2 ,- 一,n ( 1 4 ) j = 1 其中9 ( ) 是已知的单调联系函数,p i = e ( y 1 ) 且y i 服从指数族分布,其密度函数为 1 p ( m ) = p 巩一6 ( 巩) 一c ) 卜;慨,毋) ) ( 1 5 ) 对于可加模型与广义可加模型的参数估计的方法有很多,如回切法,核估计、 局部多项式估计、光滑样条估计等h a s t i ea n dt i b s h i r a n i ( 1 9 9 0 ) 提出了回切法,详细 东南大学硕士学位论文第一章绪论3 研究了估计的收敛性g r e e na n ds i l v e r m a n ( 1 9 9 4 ) 利用光滑撵条方法对该模型进行了 估计本文均采用光滑样条估计方法,即对 ,j ) 求下述极大问题的解 :l ( o ,) 一;壹b 八( z ) ) 2 d x , ( 1 6 ) 。j = 1 。 其中l ( o ,为( 1 3 ) ,( 1 5 ) 式表示的对数似然函数,o = 1 ,2 ,p ) 是光滑参数有 关可加模型与广义可加模型的参数估计可参见h a s t i ea n dt i b s h i r a n i ( 1 9 9 0 ) ,g r e e na n d s i l v e r m a n ( 1 9 9 4 ) ,m a g n ea l d r i n ( 2 0 0 6 ) 等 可加模型与广义可加模型作为一类重要的统计模型,在生物、医学、经济,金 融等领域有着广瑟的应用 1 1 3 光滑参数的选取 光滑参数b 的选择是否适当对估计量的性质影响很大选择如的方法很多, 文献中广泛采用交叉证实法( c r o s sv a l i d a t i o n ,简称c v ) 或广义交叉证实法( g e n e r a l i z e d c r o s sv a l i d a t i o n ,简称g c v ) 得到但对于可加模型与广义可加模型来说,应用这两种方 法选择光滑参数计算量较大,于是h a s t i ea n dt i b s h i r a n i ( 1 9 9 0 ,c h a p t e r9 ) 提出了b r u t o 法现对这三种方法做一简单的介绍, ( 1 ) c v 法设斑1 ) 为去掉第i 组数据点后,由剩下的数据估计出响应变量在 扛m ,z 咖) 处的拟合值,则c v 法的选择标准就是选择参数如使得 c y ( a l ,t ,b ) = ;( 戮一友一4 ) 2 , ( 1 7 ) 。i = 1 达到最小 ( 2 ) g o v 法设矿= ( 口1 ,蟊) 为由数据得到的拟合值,若存在矩阵h ,使得 穸= h y ,贝9 称矩阵h 为帽子矩阵设自= 嚣一蟊,则g o v 法就是选择砖使得 ;1 量哿 g c y ( 。,) 2f 嚣研,( 1 8 ) 达到最小 ( 3 ) b r u t o 法 j 曼 弧一墨五,( z 巧) ) : n 一j ,1 、一,j g c v b ( a 1 ,x p ) = 兰百j 兰一 ( 1 9 ) ( 1 一( 1 + ( t r 岛( ) 一1 ) l n ) 2 j = j 其中五,为由数据得到的拟合值,s s 为光滑矩阵 东南大学硕士学位论文 第一章绪论4 由于对于可加模型与广义可加模型来说,帽子矩阵不易求得,因此采用c v 法 或g c v 法来求光滑参数就比较困难从上面的式子可以看出,g c v 法与b r u t o 法 的区别主要在于分母上,g c v 8 是用1 + t r 岛( ) 一1 ) 代替了g c v 中的t r ( h ) ,这 j = 1 种近似只需要o ( n ) 次计算,而不是o ( n 3 ) 次,使得计算速度有了很大的提高本文 均采用b r u t o 法来选取光滑参数 有关光滑参数的选取及其有关性质可参见c r a v e na n dw a h b a ( 1 9 7 9 ) ,w 拙a ( 1 9 8 5 ) , h a r d l e ( 1 9 9 0 ) ,h a s t i ea n dt i b s h i r a n i ( 1 9 9 0 ) 等等 1 2 方差成分检验的问题及研究现状 1 2 1 普通回归模型异方差检验的问题 在经典的回归分析中,观测值的方差齐性是一个很基本的假定在此假定下, 方可进行常规的统计推断如果方差非齐且未知,则回归分析将遇到诸多的问题,因 而在统计诊断中,观察数据的方差齐性检验是一个十分重要的问题普通回归模型 的一般形式是 挑= f ( x 4 ,国+ 矗, 矗一n ( 0 ,矿) , = 1 ,2 ,n ( 1 1 0 ) 其中卢为p 维回归系数向量,矿为方差参数若,( ,卢) = 露卢,则模型( 1 1 0 ) 为线性 回归模型但实际上,对于比较复杂的数据,鼽的方差可能与i 有关,即v a r ( y 1 ) = 砰,江1 ,2 ,l ,此时称模型( 1 1 0 ) 存在异方差从而普通回归模型的异方差性检验 可表示为 o :砰= ,;h 1 :砖户( i i i ) 对于异方差回归模型,由于未知参数有n + p 个,参数估计的问题变得较为复杂, 甚至可能是。不可识别”的h , t l e ya n dj a y a t i n a k e ( 1 9 7 3 ) 在以严格正值的约束条件 下,对于正态线性回归模型,求出了参数的极大似然估计但在实际应用中,人们很 少采用这种不等式约束的求解方法目前比较流行的方法是把砰参数化,即假设 考= 0 2 m ( 忍,7 ) i = 1 ,2 ,n ( 1 1 2 ) 其中盈为协变量,1 为未知参数,并且假定存在一常数 7 0 ,使得m ( 盏,1 b ) = 1 对一切i 成立从而模型( 1 1 0 ) 的异方差性检验转化为如下假设检验问题 凰:1 = 7 0 ;h a :,y 加( 1 1 3 ) b r e u s c ha n dp a g a n ( 1 9 7 9 ) 在砰= 0 2 e x p 彳7 ( 对数线性方差函数模型) 假设下,利用 l a g r a n g e 乘数检验( 即s c o r e 检验) 研究了线性回归模型的异方差性检验;c o o ka n d 耋南大学硕士学位论文第一章 绪论5 w e i s b e r g ( 1 9 8 3 ) 在更一般的假设( 1 1 2 ) 下得到了线性回归模型异方差性检验的s c o r e 检 验统计量;在c o o ka n dw e i s b e r g ( 1 9 8 3 ) 的基础上,s i m o n o f fa n dt s a i ( 1 9 9 4 ) 利用c o xa n d r e i d ( 1 9 8 7 ,1 9 9 3 ) 关于参数正交化的思想,构造了检验异方差的调整的似然比和调整的 s c o r e 统计量,并通过随机模拟证明其功效优于未调整的检验统计量;韦博成( 1 9 9 5 ) 给出了非线性回归模型异方差性检验的s c o r e 检验统计量及其调整形式 除了线性和非线性回归模型外,非参数和半参数回归模型的异方差检验也有了 不少研究e u b a n ka n dt h o m a s ( 1 9 9 3 ) ,d e t t e ra n dm u n k ( 1 9 9 8 ) 研究了非参数回归模型的 异方差检验,即 执= 9 ( t d + 矗,i = 1 ,2 ,n ( 1 1 4 ) 其中v a r ( y 1 ) = 砰他们研究了砰的齐性检验,给出了检验统计量的极限分布,并通 过随机模拟研究了检验的功效冉吴、朱仲义( 2 0 0 4 ) 研究了半参数线性回归模型的 异方差性检验,即 挑= 卢- 4 - 9 ( 缸) + 矗,i = 1 ,2 ,n ( 1 1 5 ) 其中v a r ( e | ) = 砖他们在假设( 1 ,1 2 ) 下得到了s c o r e 检验统计量,并证明了检验统计 量的大样本性质 本文在上述文献的基础上,进一步研究了可加模型的异方差检验,从而推广了 以上作者的工作 1 2 2 广义回归模型的变离差检验 对于广义回归模型,它们的一般形式为 9 ( 雎) = ,所i = 1 ,2 ,n ( 1 1 6 ) 其中9 ( r ) 是已知的单调联系函数,肌= e ) 且弘服从指数族分布,其密度函数为 1 p 妣) = e z p 币i g i o i 一6 ( 巩) 一c b i ) j 一;o ( 轨,奶) ( 1 1 7 ) 其中毋称为离差参数若,卢) = 印风则为广义线性模型通过简单推导可知_ i = 联动= 5 段) v a r ( y 1 ) = - 1 , ( s d ,其中妒- 1 5 ( 铀称为甄的名义离差( n o m i n a ld i s p e r s i o n ) 易见在广义回归模型中,方差v a r ( y ) 总是非齐的( 5 ( 巩) = 1 的正态情形除外) ,因而 不存在异方差检验问题但其方差问题仍然存在,也可能与i 有关,即离差参数产 生变异,这时v a r ( y 1 ) = 虻1 5 慨) ,v a r ( y i ) 偏离名义离差则称模型存在变离差( v a r y i n g d i s p e r s i o n ) 此种情形下。将会对广义回归模型的统计推断产生很大的影响,因而广义 回归模型的变离差检验也是一个重要问题 东南大学硕士学位论文第一章绪论 6 对于广义回归模型的变离差检验问题,首先应考虑离差参数的变异( w e i e t a l ,1 9 9 8 ) , 这时模型的变离差检验问题可表示为 h o :也= ;皿:也 与普通的回归模型类似,可将离差参数a 参数化,即设也= 加。k ,1 ) ,t = 1 ,2 ,n m 伍,们的含义与( 1 1 2 ) 相同,因此模型的变离差检验问题可转化为 h o :1 = 怕;玩:1 7 0 w e ie ta l ( 1 9 9 8 ) 应用这种方法研究了指数族非线性回归模型的变离差检验,得到了检 验的似然比和s c o r e 统计量及它们的调整形式 除了离差参数的变异外,许多文献( c ,1 9 8 3 ;s m y t h ,1 9 8 9 ;b r e s l o w ,1 9 9 0 ;d e a n ,1 9 9 2 ; s m i t ha n d h e i r j a n ,1 9 9 3 ) 还认为随机效应对9 ) 的影响也是产生变离差的重要原因随 机效应法是假设模型中的某参数受到随机因素的影响,从而导致名义离差的偏离, 然后检验这种随机影响的显著性利用随机效应法研究模型的变离差,对于常见的 离散型指数族分布( 二项分布p o i s s o n 分布、负二项分布等) 尤为必要因为这时它 们的离差参数也z1 ,研究机的变异问题是不可能的但是在这类模型中,变离差问 题仍然存在,此时模型的变离差经常表现为偏大离差( o v e r d i s p e r s i o n ) ,有时也表现为 偏小离差( u n d e r d i s p e r s i o n ) 用随机效应法研究广义回归模型的变离差问题,有关的 文献非常多如j a c q m i n - g a d d aa n dc o m n e n g e s ( 1 9 9 5 ) ,l i n ( 1 9 9 7 ) 用随机效应法研究了广 义线性模型的变离差和偏大离差问题;s m i t ha n dh e i t j a n ( 1 9 9 3 ) 研究了回归系数随机 化的广义线性模型的变离差检验问题;韦博成、林金官( 2 0 0 2 ) 研究了广义非线性混合 效应模型的变离差检验问题;林金官,韦博成( 2 0 0 3 ) 同时用随机效应和离差参数的参 数化方法,给出了指数族广义非线性回归模型的变离差检验的更一般的方法曾林 蕊( 2 0 0 4 ) 全面研究了半参数广义线性模型的方差成分检验,得到了一系列的s o o r e 检 验统计量有关回归模型中异方差或变离差检验问题综述可参见韦博成等( 2 0 0 3 ) 在利用随机效应法研究模型的变离差和偏大离差检验时,将似然函数进行l a p l a c e 展开是一个重要的方法,检验统计量的推导都是在似然函数的主都上展开的( d e a n a n dl a w l e s s ,1 9 8 9 ;d e a n ,1 9 9 2 ;s m i t ha n dh e i r j a n ,1 9 9 3 ;l i n ,1 9 9 7 ;l i nj i n - g u a ne ta l ,2 0 0 6 辱) 本文将针对离差参数的变异,系统研究连续型广义可加模型的变离差检验问 题,同时利用l a p l a c e 展开方法,系统研究随机效应对离散型广义可加模型变离差的 影响这些工作文献中都未见报导 综观上述文献,无论是普通的回归模型,还是广义回归模型在进行方差成分的 检验时都普遍采用了s c o r e 检验方法,有关s c o r e 检验统计量的一般原理我们将在下 一节简单介绍 东南大学硕士学位论文 第一章 绪论 7 1 3 s c o r e 检验统计量 s c o r e 检验统计量是广义似然比检验统计量的一种特殊形式,它主要应用于含有 多余参数的复合假设检验问题s c o r e 检验与似然比检验相比,其最大的优点是只需 计算在原假设条件下参数的极大似然估计,而不需要计算在很多复杂的备择条件下 参数的极大似然估计;另一方面,在给定的正则条件下,s c o r e 检验统计量与似然比 检验统计量的渐近分布相同,检验功效相当所以,该统计量近年来在文献中经常被 引用计算s c o r e 统计量的一般方法如下: 设y = ( 口1 ,鲰) r 的各分量相互独立,其密度函数为p ( y ,口) ,0 0c 舻,假设0 有内点y 的对数似然函数记为l ( o ) = l o g p ( v ,p ) 设0 t = ( 卵,醪) ,0 1 ,0 2 分别为p l 维和 仡维分量今考虑以下假设检验问题: h 0 :0 1 = 0 1 0 ;1 :0 1 0 1 0 ( 1 1 8 ) 假设0 的最大似然估计为矿= ( 印,露) 当0 - = 0 1 0 时,。0 2 的极大似然估计为瓦= j 2 ( 0 1 0 ) , 并记矿= ( 蠕,醪( 0 1 0 ) ) 则检验问题( 1 1 8 ) 的大样本检验函数可根据以下w i l k s 定理得 到: l r = 2 l ( 0 ) 一工( i ) 】+ 妒( p 1 ) ( 1 1 9 ) 如果( 1 1 9 ) 式所要求的正则条件( 陈希孺,1 9 8 1 ) 成立,利用t a y l o r 展开方法, 假设检验问题( 1 1 8 ) 式的检验函数( 1 1 9 ) 式可近似表示为以下两个渐近等价公式: s c = 一【丽o lj t l l l ( ,、堋o l 诂( 口l o 磊p ,。) ) _ 妒( p 1 ) , ( 1 2 0 ) 或 = f 丽o l ,t x i ( 5 ) ( 差) l 拓砒o ) ) 一x 2 ( 1 2 1 ) 其中 却,= l n ( 0 :l 1 2 ( o ) ) ,脚,= l n ( 8 ;l 1 2 ( 0 ) ) , - ,c = 西【- c 一,= ( 羔: 2 笔 2 ) ,- ,一1 c = d l l ( 0 ) 箸 2 ) 有关s c o r e 统计量的详细论述可参阅c “a n dh i n k l e y ( 1 9 7 4 ) ,韦博成等( 1 9 9 1 ) 本文第 二章、第三章、第四章将引用( 1 2 0 ) ,( 1 2 1 ) 进行方差成分的检验 衷南大学硕士学位论文第一章绪论8 1 4 本文的主要工作 本文对可加模型的异方差与广义可加模型的变离差检验进行了全面系统的研 究,具体有以下几个方面成果t 一、第二章首次研究了一般可加模型的异方差检验问题,首先简要介绍可加回 归模型,给出f i s h e r 信息阵的表达式;然后基于光滑样条的估计方法,得到了检验的 s c o r e 统计量;最后通过实例和随机模拟,说明了检验方法的正确性及其应用本文 的研究类似于韦博成、冉吴、e u b a n ka n dt h o m a s 等人的工作,但是本文研究的模型 与他们研究的模型有着重要的区别;主要是模型形式更一般化,结论更好地验证了 前人工作的正确性 二、第三章主要研究了连续型广义可加模型的变离差检验问题针对离差参数 的变异,研究了该模型的方差成分检验,得到了s c o r e 检验统计量,并通过随机模拟 验证了检验方法的正确性 三,第四章首次系统研究了离散型广义可加模型的变离差检验问题利用l a p l a c e 展开方法,研究了随机效应法对此模型的方差成分检验,并得到了检验的s c o r e 统计 量通过随机模拟研究了检验的功效,并用一个实例说明了结果的应用 综上所述,本文首次较为全面系统地研究了可加模型的异方差与广义可加模型 的变离差检验,得到了一系列新的成果,这些成果不仅在理论上很有意义,而且也具 有广泛的实际应用价值本文还通过数值实例和随机模拟,说明得到的结果与方法 是简洁的、有效的 第二章可加模型的异方差检验 2 1 引言 在参数和非参数回归模型中。关于异方差检验问题已经有了许多研究,如c o o k a n d w e i s b e r g ( 1 9 8 3 ) 研究了线性回归模型异方差性的s c o r e 检验,得到了很好的结果; 韦博成( 1 9 9 5 ) 把c o o ka n dw e i s b e r g ( 1 9 8 3 ) 的结果推广到非线性回归模型,得到了模型 方差齐性检验的s c o r e 统计量及其调整形式;e u b a n ka n dt h o m a s ( 1 9 9 3 ) 研究了非参数 回归模型的异方差检验;冉昊等( 2 0 0 4 ) 讨论了半参数回归模型方差齐性检验的s c o r e 统计量,并证明了该统计量的渐近x 2 性质本文在上述文献的基础上,首次对可加 模型的异方差检验问题进行系统地研究第二节给出模型的参数估计以及模型的惩 罚对数似然函数关于参数的f i s h e r 信息阵,第三节得到了模型异方差性检验问题的 s c o r e 统计量,第四节通过随机模拟和实际例子,说明了检验方法的有效性 。2 2 模型及其基本性质 本文讨论如下的可加模型 y i = ( 毛1 ) + + 矗( z 咖) + 矗, i = 1 ,2 ,一,t 1 ( 2 1 ) 其中f = ( p 1 ,鲰) 7 为响应变量,黾= ( z m ,。咖) 7 ( i = 1 ,2 ,n ) 为回归变量, 乃( ) d = l ,2 ,p ) 为一元光滑函数,矗之间相互独立。且矗一n ( o ,矿帆) ,佻= m ( 聋,1 ) ,江1 ,2 ,m 沪是未知尺度参数,1 是口1 维未知参数向量,z 是协变向 量,m ( ,) 是关于参数1 有二阶连续可导的已知函数,且存在一 7 0 ,使得m ( 磊,1 0 ) = 1 , 对一切i 成立因此模型( 2 1 ) 的异方差检验问题可表示为 h o :一r = 加;玩:7 加 ( 2 2 ) 显然,如果原假设成立,那么模型( 2 1 ) 具有方差齐性;若凰被否定,则模型( 2 1 ) 具 有异方差性 将厶( z ) 在观测点。巧,锄参数化,并记方= ( 厶扛u ) ,j ( 。埘) ) t ,d = 1 ,2 ,力 则模型( 2 1 ) 中的参致为巩= ( 印,謦,矿,) t 在对( 2 2 ) 进行检验时,将7 看成有 兴趣参数, ,厶,矿看成多余参数 由h a s t i ea n dt i b s h i r a n i ( 1 9 9 0 ) 知,模型( 2 1 ) 的惩罚对数似然函数为 m 卜抛矾一;薹一薹攀一;耋之m z 渤 东南大学磺士学位论文第二章可加模型的异方差检验1 0 其中o , j = l ,2 ,p 为光滑参数,令 吻 j 是。巧,锄经过 排序的一组不相等数列,屿为n 卿关联矩阵,其元素为 鲥= r “坊篆三k 1 2 痂 记毋= ( 毋拈1 j ) ,一,毋( s 田j ) ) to = 1 ,2 ,一,p ) ,e = ( e l ,一,e n ) 7 ,口= ( g t ,一,鳝,矿,7 t ) t , m = d i a g m 1 ,) ,则f = t j 毋+ e ,所以( 2 3 ) 式又可表示为 工( 口) 一;f 凹( 2 ”户) 一;娄f o 蚋一刍( ”一妻啊毋) r m 。白一粪毋) 一;奏a j 旁坞毋 仁1 j = 1j o ,= i ( 2 4 ) 其中玛仅与设计点锄 有关,且醪玛毋= f 彰( z ) ) 2 出 假设光滑参数砖d = 1 ,2 ,力已用( 1 + 9 ) 式估计得到,令o = ( 9 f ,谚,2 ) 7 ,则 l ( o ) 关于参数a 的s c o r e 函数为 百o l ( o ) = 击珊- - i e _ _ 丸渊,2 ,p 警= 一刍+ 2 - z t m 对己( 口) 关于参数a 求二阶偏导数,取数学期望并在凰成立时计值,得蓟关于参数n 的f i s h e r 信息阵为 f 告峨n 1 + 、l x lz 1 孵 i 1n 。t n l嘉呀2 + 沁鲍 ,( 口) = l 告峨n 1 o 击孵2 0 去哦 丢趣 1 孵p + b 坞 0 。0 1 i( 2 5 ) o 。j 珏j 由此可得估计负,知,矿的g a u 日s - n e w t o n 迭代公式可表示为 n l + 1 = 0 + j - 1 ( ) 三( ) ( 2 6 ) 实际中,取一个合适的初值,( 2 6 ) 式的迭代过程收敛是相当快的( g r e e n ( 1 9 8 7 ) ) 假定一1 一矗,则a 为在1 = 加时n 的极大惩罚似然估计本文以下关于鲰,卯,矿 的估计均采用上述光滑样条的估计方法 2 3s c o r e 检验统计量 定理2 1 设= 口一妻岛,u 为( 鲁铲) n 一,萨= 量n 。t 2 n ,n = 智,t = l ,2 ,n 令d = ( d 1 ,巩) r ,西= 一1 1 7 n ) d ,厶为n 阶单位阵,1 为 1 维全1 向量 东南大学硕士学位论文 第= 章 可加攫型的异方差检验 1 1 s c = ;尸d ( 矿西) 一1 西丁矿( 2 7 ) s c _ ( 筹) 7 x - c a 筹) 僦 ( 2 8 ) a ,。l _ i 咭南:;d t ( u 一1 ) c 2 9 ) p 1 咭南2j 一1j 将f i s h e r 信息阵j 写成分块矩阵形式 胛,= 蚓 ( 锄a na a m 2 ) = m x a 1 3 = 0 , 如= 去- 强如= i 1 。砸 s c = 1 ( u 一1 ) t d ( d r z s ) 一1 d r ( u 一1 ) = ;u r d ( j 多t 西) 一1 西t u 带 其中f l ( z d = ;s m ( 1 缸 ) ,h ( t d = 一弘32 ,一n ( 0 ,1 ) ,岛一矿( 一2 ,2 ) ,矗一n ( 0 ,矿他) ,矿= 0 i 具体模拟过程如下;首先产生随机数矗,厶,矗,再由f l c x d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论