




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
单指标模型的异方差检验 摘要 在回归分析中,观测值的方差独立、齐性是一个很通常的假定。如果假定不 成立,有关此模型的统计推断等都会受到很大的影响,因此在某些情况下检验数 据的方差齐性成为采用模型之前非常重要的一步。在参数和非参数回归模型中。 关于方差齐性的检验问题都有很多的研究。在这篇文章里,主要利用p 样条方 法,研究了单指标模型的异方差问题、一阶自回归问题以及附加变量等检验问题。 从这个思想出发,第二章中简单介绍了p 一样条的的估计方法,以及节点的 选取和相应的惩罚似然函数,并简单介绍了所用的s c o r e 统计量的一般形式。然 后利用上面这些工具,分别得到了三种情况下的s c o r e 检验统计量。并且通过 计算机模拟结果得到相应的s c o r e 检验统计量比较适合做异方差检验和一阶自 回归检验,特别是样本量大于5 0 的检验。对于附加变量检验,效果不是很好, 即使增加样本量也不能达到很好的效果。同时对实际的例子建立了单指标模型, 检验其异方差问题、一阶自回归问题,与前人的结果达到了一致,此方法的可行 性和有效性得到了证实。 本文第三章从理论上给出了异方差问题、一阶自回归问题s c o r e 检验统计 量的大样本性质,证明了其渐近卡方性质,并给出了计算机模拟的结果在两种 不同的样本量下,对单指标模型分别是线性、指数和正弦函数的情况进行模拟, 结果说明单指标模型的形式不影响其渐近卡方性,与理论结果保持一致。 关键词:z 2 分布,异方差,阶自回归,附加变量,p 样条,s c o r e 检验,单 指标模型, t h et e s tf o rh e t e r o s c e d a s t i c i t yi ns i n g l e i n d e xm o d e l a b s t r a c t i nt h e r e g r e s s i o na n a l y s i s ,i t i sc o m m o nt oa s s u m et h e i n d e p e n d e n t h o m o s c e d a s t i c i t yo nt h ee r r o rt e r m i ft h ea s s u m p t i o ni sv i o l a t e d ,i tw i l lh a v eg r e a t i m p a c t o nt h es t a t i s t i c a li n f e r e n c e h e r e b y , t h es t e pt ot e s tt h eh o m o s c e d a s t i c i t yo ft h e e r r o rb e c o m et h e k e ys t e p b e f o r e s e t t i n gu p t h em o d e l i n p a r a m e t r i c a n d n o n p a r a m e t r i cr e g r e s s i o nm o d e l s ,t h ep r o b l e mo ft e s t i n gh e t e r o s c e d a s t i c i t y w a s d i s c u s s e dw i d e l y i nt h i sp a p e lt h et e s to f t h eh e t e r o s c e d a s t i c i t y 、a u t o c o r r e l a t i o na n d t h eo m i s s i o no fa ni m p o r t a n tv a r i a b l ei nt h es i n g l e - i n d e xm o d e lw e r er e s e a r c h e dw i t l l t h em e t h o do fs c o r et e s t s t a r t i n gw i t ht h eb a s ei d e o l o g y , i nc h a p t e r2 ,s c o r et e s t s a r ed e r i v e df o rt h r e e p o t e n t i a lm i s s p e c i f i c a t i o n so f t h es i n g l ei n d e xm o d e l :h e t e r o s c e d a s t i c i t yi nt h ee r r o r s , a u t o c o r r e l a t i o ni nt h ee r r o r s ,a n dt h eo m i s s i o no fa ni m p o r t a n tv a r i a b l ei nt h el i n e a r i n d e x t h e s et e s t sh a v eas i m i l a rs t r u c t u r et o c o r r e s p o n d i n gt e s t s f o rn o n l i n e a r r e g r e s s i o nm o d e i s s i m u l a t i o n sd e m o n s t r a t e t h a tt h ef i r s tt w ot e s t sh o l dt h e i rn o m i n a l s i z ew e l l ,a n dh a v eg o o dp o w e rp r o p e r t i e si n i d e n t i f y i n gm o d e lv i o l a t i o n s ,o f t e n o u t p e r f o r m i n go t h e rt e s t s ,t e s t i n g f o rt h en e e df o ra d d i t i o n a lc o v a r i a t e sc a nb e e f f e c t i v e ,b u ti sm o r ed i f f i c u l t t h es c o r et e s t sa l ea p p l i e dt ot w or e a ld a t as e t s , d e m o n s t r a t i n gt h a t t h et e s t sc a r l i d e n t i f ri m p o r t a n tm o d e l v i o l a t i o n st h a ta f f e c t i n f e r e n c e ,a n dt h a ta p p r o a c h e st h a td on o tt a k em o d e lm i s s p e c i f i c a t i o n si n t oa c c o u n t c a nl e a dt ov e r yd i f f e r e n tr e s u l t s i nf i n a l ,w ee s t a b l i s ht h ea s y m p t o t i cp r o p e r t i e so fs c o r et e s ts t a t i s t i c sf o rt h e h e t e r o s c e d a s f i e i t ya n da u t o c o r r e l a t i o no ft h es c o r et e s t ,w h i c hi si l l u s t r a t e db yt h e c o r r e s p o n d i n gs i m u l a t i o n k e yw o r d s :d i s t r i b u t i o n ;a u t o c o r r e l a t i o n :h o m o s c e d a s t i c i t y ;p - s p l i n e ;s c o r e t e s t i n g ;s i n g l ei n d e x m o d e l 。 毖重蝰硕士学位论文答辩委员会成员名单 姓名职称单位备注 王静龙教授上海市华东师范大学统计系主席 濮晓龙副教授上海市华东师范大学统计系 汤银才副教授上海市华东师范大学统计系 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的研究成果据 我所知,除文中已经注明引用的内容外,本论文不包含其他个人已经发表或撰写过的研究 成果对本文的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意 作者签名:日期:塑! ! 嗲 学位论文授权使用声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版。有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅有权将学位论文的内容编入有关数据库进 行检索。有权将学位论文的标题和摘要汇编出版。保密的学位论文在 解密后适用本规定。 学位论文作者签名:f 反雠 导师签名: 日期:l 盟卫_ 日期:卫丛邀 第一章绪论 回归分析是数理统计中应用非常广泛的统计分析方法之一。过去,人们在回 归分析的理论和应用研究中通常假设模型的响应变量关于模型中的未知参数是线 性,然而事实证明这个条件太苛刻,于是提出非线性回归模型,然后又提出了广 义线性模型。 虽然如此,还有很多模型是无法用已知的参数模型来衡量的,人们将拟合模 型的空间进一步扩展,于是就产生了非参数、半参数模型。对模型函数的形状不 预先确定,仅仅给予较少的限制。比如用p 阶光滑样条拟合时,考虑函数空间为 所有二阶可微的光滑函数,然后通过惩罚似然的方法以及采用数据的方法( c v 、 g c v ) 来得到模型函数的光滑拟合。随着近年来非参数、半参数分析方法在农业、 生物、经济等领域的广泛应用,关于非参数、半参数的统计推断方法引起了理论 与应用工作者的广泛重视。h e c k m a n ( 1 9 8 6 ) 提出了光滑样条估计方法,并得到了估 计的相合性和渐近正态性。s p e c k m m a ( 1 9 8 8 ) 提出了核与最小二乘估计方法,并 研究了估计的渐近性质。r u p p e r t & c a r r o l l ( 1 9 9 7 ) 提出了惩罚回归样条的方法;对 于单指标模型y a n y u ( 2 0 0 4 ) 年提出了p 一样条的方法,也得到了估计的相合性和 渐近正态性。e u b a n k ( 1 9 8 8 ) ,g r e e n & s l i v e r m a n ( 1 9 9 4 ) 系统地讨论了非参数、 半参数模型的统计推断理论及其应用。 在回归模型研究发展的同时人们注意到对于普通的回归模型,模型的误差 分布通常被假定为独立、服从正态分布,更为特殊的情况,服从期望为0 ,方差齐 次的正态分布。这个假设在实际应用中往往很难实现,而且如果仅考虑到方差的 独立、齐性而事实上又存在方差异性的话,往往会对统计推断的结果产生很大的 影响。所以人们对随机误差的方差的一些假定提出了质疑,从而展开了回归模型 的异方差检验的研究。 本文主要研究了单指标回归模型的异方差检验问题。 1 1 研究的背景 在回归分析中,观测值的方差独立、齐性是一个很通常的假定。如果假定不 成立,以后模型的估计和其它计算结果都会受到很大的影响,因此在某些情况下 检验数据的方差齐性成为采用模型之前非常重要的一步。对于一般的回归模型, 可以表示成如下的形式: y | = g t x + s | ( o ,盯2 )f = 1 ,盯 ( 1 1 ) 其中为p 维回归系数,一为自变量,为误差,盯2 为误差方差。g ( # ) 可以是 线性的,也可以是非线性的,甚至可以是非参数的。 如果方差非齐次,即数据表示为 v a r ( y , ) = 矿,f = 1 ,z 此时,未知参数有n + p 个,因为只有n 次观测,直接估计参数很难,一般处理方 法是将盯? 参数化或者非参数化,即假设曰= ( ,y ) ,z 。为与方差相关的协变量, ,为与方差相关的未知系数,可以通过估计得到,的值,从而得到方差的估计。 可以看出如果模型存在异方差,模型的统计推断将会比方差齐性的时候复杂 得多,并且到现在为止还没有有效的处理方法。虽然可以通过数据变换和其它一 些处理方法来使得方差齐性,比如通过b o x - - c o x 变换能够明显改善数据的异方 差性、非对称性和正态性。但是,只有在检验出数据存在方差异性的时候才会考 虑采用数据变换和其它方法,否则的话,我们会认为方差是齐性的,在方差齐性 的模型下来解决问题。 虽然,方差异性的表现方式有很多种,最近,z h a n g & w e i s s ( 2 0 0 0 ) 把弓l 起 数据产生方差异性的原因归纳为两类:一类由随机效应产生的方差异性称为不可 解释性方差,另一类为方差可表示为协变量的函数时的情况称为可解释性方差。 冉吴、朱仲义( 2 0 0 4 ) 讨论了两种情况下的异方差问题。本文主要研究单指标回 归模型的方差表现为可解释性形式时的检验问题。 如果方差不独立,即数据表示为 v a r ( e l ,巳,氏) = 盯2 其中,= 叫l ,此时若p 0 ,则随机误差不独立,此时如果我们仍当作方差 独立,齐性参数或非参数来估计,则可能造成不可弥补的损失。s i m o n o f f & t s a i ( 2 0 0 2 ) 利用局部多项式讨沦了单指标模型的异方差、一阶自回归以及附加变量 的s c o r e 检验并通过计算机模拟证明其有效性;c h i & r e i n s e l ( 1 9 9 1 ) 从理论 上证明了随机效应带有a r ( 1 ) 误差的自回归模型的s c o r e 检验统计量的大样本性 质。 1 2 研究的现状 具有异方差的普通线性回归模型的一般形式为: y i = + ,= 1 ,门 f = ( q ,岛,f n ) e e = 0 ,v a r ( e ) = 仃2 口= p l - j l , f j ,口= ,江j 检验模型方差是否齐次就是在p = 0 时,检验h o :,= 盯2 。早期研究这个问题的 有h a r r i s o n m c c a b e ( 1 9 7 9 ) ,b i c k e l ( 1 9 7 8 ) 等。b r e u s c h p a g a n ( 1 9 7 9 ) 通 过对方差建立对数线性模型一= e v ,采用s c o r e 检验方法,研究了线性回归模 型的异方差检验。c o o k w e i s b e r g ( 1 9 8 3 ) 采用方差结构化的方法,提出了更加 一般的方差模型。即 蠢= 盯2 w ( z 。,口) ,i = l ,疗 其中口为结构参数,w ( z ,口) 为方差权函数,并且假定存在某一常数使得 w ( t ,g o ) = 1 ,f = l ,疗,并得到检验异方差的s c o r e 检验统计量。s i m o n o f f t s a i ( 1 9 9 4 ) 利用c o x r e i d ( 1 9 8 7 ) 关于参数正交化的思想,构造了检验异方差调 整的似然比和调整的s c o r e 统计量,并且通过随机模拟证明了调整后的统计量有 更好的功效。 检验模型是否一阶自回归就是在口= 时,检验h 。:p = 0 。t s a i ( 1 9 8 6 ) 研究 了异方差和一阶自回归同时检验,即h o :p = o ,口= ,其s c o r e 检验统计量正好 是两种情况下s c o r e 检验统计量的和。 s c o r e 检验不仅在线性模型中,而且在其它模型中也得到了长足的发展,近年 来,统计学家对于非参数、半参数模型中可能出现的异方差检验,一阶自回归检 验以及附加变量检验也做了不少工作。e u b a n k t h o m a s ( 1 9 9 3 ) 根据c o o k w e i s b e r g ( 1 9 8 3 ) 的方差结构化方法,提出了在非参数光滑样条模型下方差异性 检验方法,并且从理论上证明了检验统计量的极限分布,通过模拟研究了检验的 功效:韦博成( 1 9 9 5 ) 研究非线性回归的异方差分析问题:冉吴,朱伸义( 2 0 0 4 ) 利用惩罚样条研究了半参数线性回归模型的异方差检验问题;最近s i m o n o f f & t s a i ( 2 0 0 2 ) 利用局部多项式方法研究了单指标模型在异方差、一阶自回归、附加 变量情况下的s c o r e 检验。 随着s c o r e 统计量的广泛应用,很多统计学家开始研究s c o r e 统计量在大 样本情况下的性质,特别是在非标准条件时的性质。s e l f & l i a n g ( 1 9 8 7 ) 研究了 极大似然估计和似然比检验当参数的真值在参数空阃的边界上时的渐近分布, s i l b a p u l l e & s i l b a p u l l e ( 1 9 9 5 ) 提出了在单边假设检验时的s c o r e 统计量。s t r a r n & l e e ( 1 9 9 4 ) 得到了在线性混合模型条件下检验零方差分量的似然比函数的渐近 性质,并且指出渐近分布比丌方分布更集中于0 。冉吴,朱仲义( 2 0 0 4 ) 利用惩罚 样条研究了半参数线性回归模型的异方差检验问题,得到了相应的检验统计量, 并从理论上证明了其渐近开方性质。z h u & f u n g ( 2 0 0 4 ) 将其方差部分的参数变 量扩展到了多维时的情形。并研究了混合半参数模型方差成分的检验。 1 3 本文工作 本文主要研究了单指标模型的异方差的检验问题、一阶自回归及附加变量的 检验问题。在y a h ( 2 0 0 2 ) 、( 2 0 0 4 ) ,s i m o n o f f & t s a i ( 2 0 0 2 ) 文章的基础上,利用 p 样条方法,研究了单指标模型的上述检验,分别得到了三种情况下的s c o r e 检 验统计量,并从理论上证明了在异方差、阶自回归情况下其s c o r e 检验统计量 的大样本性质,最后给出计算机模拟和实际例子,证实了我们方法的可行性和有 效性,推广和发展了e u b a n k & t h o m a s ( 1 9 9 3 ) 。韦博成( 1 9 9 5 ) ,s i m o n o f f & t s a i ( 2 0 0 2 ) 的工作。 第二章单指标模型的异方差检验 2 1 引言 当回归模型出现异方差而且方差与某个协变量有某种函数关系时,我们就可以 采用方差权函数的方差来对这种异方差进行分析。而对于一阶自回归,我们通常 假定是在等方差的情形下讨论,本文没有将其两者一起讨论。 应用方差权函数进行统计分析由来已久。c o o k w e i s b e r g ( 1 9 8 3 ) 利用方差 权函数对线性模型进行s c o r e 统计检验,并且得到了较好的结论;此后e u b a n k ( 1 9 9 3 ) 将这一方法推广到非参数回归模型,同时研究了s c o r e 检验统计量的大 样本性质。韦博成( 1 9 9 5 ) 研究非线性回归的异方差分析问题;最近s i m o n o f f t s a i ( 2 0 0 2 ) 币q 用局部多项式方法研究了单指标模型的s c o r e 检验:冉吴,朱仲义( 2 0 0 4 ) 利用惩罚样条研究了半参数线性回归模型的异方差检验问题;z h u f u n g ( 2 0 0 4 ) 将其方差部分的参数变量扩展到了多维时的情形。 本章把上述方法推广到如下单指标模型 m = g ( 爿) + t , f = 1 ,门 ( 2 1 1 ) s = ( 毛,巳) 7 其中 j 为解释变量,葺r ”f 服从正忿分确? ,e ( 0 = o v a r ( 占) = 盯2 , 口= 卜“,f :z 口= ,f = j ,g ( s ) 暇k g :g “绝对连续,i = o ,m 一1 ,且 g 平方可积j 的未知函数,p 为p 维未知参数。本文只考虑= 2 的情况。 如果p = 0 ,w j = l ,f = l ,珂,则估计p ,g ( s ) 是通过最小化 q 一( 臼) = 门_ i m g ( ) ) 2 “忠州i n ( x 爿 2 ( g o ) ) 2 凼 ( 2 1 2 ) i = i 得到的。如果存在i 使得w f l ,p 0 。则模型( 1 1 ) 出现异方差,且不独立, 那么采用( 1 2 ) 得到的p ,g ( j ) 的估计就不再渐近有效。五是光滑参数,一般由最 小化g c v 或c v 方法得到。 单指标模型是一类非常广泛的统计模型,对浚模型的拟合分两步进行。第一 步估计单指标变量j = x 7 1 p ,也即估计p ;第二步在已知s 的基础上估计g 。对于 归的估计,可以用最小二乘估计;因子s 给定时g 的估计,s i m o n o f f ( 1 9 9 6 第五 章) 讨论了不同的方法,本文选用了p 一样条方法,详见y a n ( 2 0 0 2 ) e s 。 本章主要利用p 一样条的方法研究关于模型( 2 1 1 ) 的异方差、一阶自回归 以及附加变量检验,得到了s c o r e 检验函数。 2 2s c o r e 检验统计量 以下引入本文所讨论的问题,以及若干记号和公式。记 g ( 6 ) = ( g ( 6 1 ) ,g ( 岛) g ( 乞) ) 7 - 考虑( 1 1 ) 的一般形式 y = g ( 届+ 吃及) + 7 占 占n ( o ,仃2 i ) ( 2 2 1 ) 其中五,x 2 分别为n p 。,n p :的己知的预测矩阵,f l , ,屐分别为p l ,p :l 的未 知参数 pp 2 p ”。 w 2p p ”一2 p ”pw ( 2 2 2 ) 其中一l p 。口用平均残差平方和估计。节点取单指标变量o = x p 的等分位点,在迭代算法中节点是不固定的。在下面的模拟中取1 0 个节点。 图卜3 分别总结了异方差检验、一阶自回归检验以及附加变量检验的结果。 每部分检验包含了六个图,分别对不同的样本量、不同g 的形式以及不同的s n r 给出了模拟的功效。每个图分别对应不同的样本量,月= 5 0 对应于高的功效。反 之即样本量为门= 3 0 。检验水平等于0 0 5 ,即图中的水平线。 图1 异方差检验的结果。从图像可以看出检验功效随着l 口i 递增而递增,g 的形式 对检验的结果并没有影响,在零点拒绝的概率不超过0 0 6 。这两点跟 5 的检验结 果相同。在最大值l 口 2 处,n = 5 0 时,拒绝的比例不低于0 9 9 ,比 5 方法优: 但订= 3 0 时达不到文献 5 中的0 9 ,样本量的大小对功效的影响很明显,这一点 是由用p 一样条拟合时参数的个数较多决定的。从图象也可以看出s n r = i o 时的检验 比s n r = i 的检验功效要好图像上升的趋势较快。特别是对正弦函数( s n r = i 0 ) 的检验,在 5 中其检验功效很差,而本文的图形与线性、指数函数的检验图形相 似,这说明本文的方法要优于文 5 的方法。 j r 弋产彳 :f 、,71 著:。j i v i | j 图1 两种不同的样本量、不同的s n r 希f 不同的g 的结构对应的异方差 检验s c o r e 统计鬣的势函数图形。轲i 线:n = 5 0 ;细线:n = 3 0 2 _ n 一 呻 一 蚪 图2 一阶自回归检验,其结果跟异方差检验相同,只是在零点处拒绝的比例 不超过0 ,0 5 相对于文献 5 。同样对正弦函数( s n r = 1 0 ) 的检验做了比较好的 修正。 图2 两种不同的样本餐、不同的s n r 雨i 不同的g 的结构对应的一阶自 回归s c o r e 统计爱的势函数图形。籼线:n = 5 0 ;蜀| l 线:n = 3 0 图3 附加变量检验,其结果比异方差检验和一阶自回归检验更复杂,与 5 一致。 原因有两个:其一是因为s c o r e 检验是在原假设为真的情况下计算的,而在各择 假设为真的情况下模型被错误的假定了,此时g 就不是e ( y ) 的相合估计,线性指 标也不是真正线性指标的相合估计、而g 的一阶导数也就不是相合估计了:其二、 虽然理论上估计g 和g 导数估计用不同的光滑参数,但是实际中我们用了估计g 的光滑参数估计g 的阶导数,导致了g 的一阶导数不是相合估计。如果用不同 的光滑参数估计g 的导数用于s c o r e 统计中,估计的功效应该随着b 的增大渐进 趋于1 。从图上可以看出,此方法用于检验附加变量准确率不高,在实际中应小心 使用。 - 删_ 图3 两种不同的样本量、不同的s n r 币j 不同的g 的结构对应的附加变 量模型s c o r e 统计量的势函数幽形。 :线:n = 5 0 :细线:n = 3 0 从上三图可以得知s c o r e 检验统计量比较适合做异方差检验和一阶自回归检验, 特别是样本量大于5 0 的检验。对于附加变量检验,效果不是很好,即使增加样本 量效果也不是很好。 4 二、实例分析 例1 汽车价格数据。此数据来源于1 9 9 9 年消费者报告的汽车购买调查( c o n s u m e r r e p o r t s ,1 9 9 9 ) ,样本量为4 1 。此数据包括了4 】种汽车的价格,其中汽车的价格 ( 以美元计) 与四个变量有关:发动机功率五( 以马力为单位) 、车身重量t ( 千 磅) 、车的容量与( 立方英尺) 和信誉度x 。( i - 5 ,1 表示最差,5 表示最好) 。对 这组数据用单指标线性模型进行拟合, y t = g u :p ) + 6 i 我们采用y a n y u ( 2 0 0 2 ) p - 样条方法进行拟合,得到了图4 ( a ) 与s i m o n o f f , j s & t s g ;,c l ( 2 0 0 2 ) 的拟合图象相似。相应的参数估计为盯= 1 6 9 6 8 , = ( 2 3 9 7 0 6 ,1 6 1 6 4 ,一0 2 1 2 ,一0 9 2 5 ) ,并且g c v 选择光滑参数a = 1 0 ,此时相 当于多项式估计。对结点的个数进行调整( 分别驳5 i 0 个) 的时候拟合图变化 不大。假设方差模型矿( 薯j 乞) = = c r 2 e x p ( a z , ) ,z 取线性指标的预测值( 文献 1 1 ) 。此时的异方差检验的s c o r e 统计量等于5 4 9 3 4 ,相应的p = o 0 1 8 0 ,拒绝 原假设,说明数据方差不齐次,更进一步说明了我们的结果的合理性结论。图4 右为相应的残差图 。厂一f ”j , ”f ,。 。 j ,i:? i - 一 o r 一 l 。:、, ; : 2 二jij j i 咄f 一 ;r _ i f 一一一一一: 1 。 1 f f 。 : 1 -、 、,一 | 、 。 _ 。、1 j ” : 图4 对汽车价格数据采川单指标模型方法拟合得到的函数图形和残差圈 在0 0 5 水平下,该单指标模型存在异方差,结果与s i m o n o f f , j s & t s a i ,c l ( 2 0 0 2 ) 相同。由此,在做数据拟合的时候,必须考虑异方差问题。 例2 一氧化碳散发数据。该数据记录了美国从1 9 6 0 年到1 9 8 9 年一氧化碳的散发 情况。一氧化碳的散发主要有两个来源:一、汽油的燃烧:二、森林大火。线性 模型说明了解释变量与一氧化碳散失总量有很强的相关性( r 2 = 0 9 1 3 ) ,由 d - w = o 7 也说明了残差的自相关性。对这组数据用单指标线性模型进行拟合g c v 选择a = 1 07 ,绳到图( 5 ) 的拟合图,与s i m o n o f f , j s & t s a i ,c l ( 2 0 0 2 ) 相似:相应 的参数估计为= ( o o l ,1 4 8 9 7 ,0 3 2 4 ) ,盯= 9 4 2 3 。同样的对节点的个数进行调 整( 分别取5 1 0 个) 的时候拟合图变化不大。一阶自回归检验s c o r e = o 3 3 5 ,相 应的p = o 4 3 8 不能拒绝原假设,与s i m o n o f f , j s & t s a i ,c l ( 2 0 0 2 ) 一致。从拟合 图也可以看出,此数据用单指标模型拟合是合适的 ”厂 蚕露 j 勘厂、 i 妒i 、) 渺ii:v州i 图5 一氧化碳数据采_ i j i j 单指标模型方法拟合得到的函数图形和残差图 粗线:单指标模型:自 线;线性模型 右图是线性模型和单指标模型的残差图的比较,波动较大的为线性模型。可以看 出自1 9 7 3 年后一氧化碳散失开始减少,这是由于七十年代空气净化行动见效了。 从这点看单指标模型还是适合的,可能还存在别的一氧化碳散发的重要因素我们 没有考虑到。 6 jf+!:j 0 , 一 。尊 盲 , 一 y,、 一 , 矿 卜 _ 一 | | 。 丁 : 一 o , , _ r 打 一一 一 1lll|l戛_j_illi叫li暂 第三章s c o r e 检验统计量的大样本性质 y a h ( 2 0 0 4 ) 在证明模型( 2 1 1 ) p - 样条估计的大样本性质时,假设均值函数 连续且归0 = 1 ,且对于任意的屈,有o 屈 1 ,也即屈为其内点。本文也作类似 假设。并对作参数变换,为此设为p - 1 维参数,o 为的参数空间,且 ( ) = 乒丙碉 藕 ; 九一一 同时,我们记钐= ( 矽7 ,万7 ) 7 ,否则口= ( 7 ,万7 ) 7 。岛为目的真值,则单指标模 型( 1 1 ) 变为 y ,= g ( p 7 ( 矽) x ,) 十e , 其相应的均值函数表示为 ( ,目) = 57 n ( p 7 _ ) , ( ,吼) = 8 t a ( p 7 ( ) _ ) 。 则均值函数关于只的一阶导数可表示如下 c ,( 工,。) :f 万7 b “( 7 ( ) z ) - ( 1 ,- 1 1 1 1 2 ) 一7 2 :一- x 。 lb ( 7x )j 为了获得所需要的渐近性质,我们需要下面三个假定条件: ( 川) 去善日( 7 ( ) 巧) b ( 7 ( 矽+ ) 耵对于v ,+ 吨一致收敛,且v 吨 只( ,矿) 存在且正定,其中 尺( 矽,矽) 。:鳃寺善b ( 7 ( 痧) ) b ( 7 ( 痧) # ) 7 且尸( 痧) = 尺( 九,晚) 一足( 眈,矽) 尺一( 声,矽) 尺( 破,) ,当且仅当= 疙时,j d ( ) = 0 。 ( a 2 ) 当0 在o o 的领域内,均值函数( x ,0 ) 二阶连续可导,且 q ( 岛) = 1 1 ,三( 一;岛) ( ;岛) 7 ”n 百 存在且非奇异,其一阶导数以及 去喜鬻和i 1 驴n ( 护) z o ) ( 删j , k = 1 - d i m 在铱的领域内一致收敛。 3 ) 丑= o ( n 一5 ) 以上三个条件完全同y a h ( 2 0 0 2 ) 、y a n ( 2 0 0 4 ) 所需的条件一致。 3 1 并7 ) - 左位技琥订重6l i 嗣新逝分伸 由定理1 ,单指标模型的异方差检验的s c o r e 检验统计量为 s c i = 西( 矿石) _ l 矿“ 现类似z h u & f u n g ( 2 0 0 4 ) ,设 q :咖( 掣,掣:l - ,g , d d ;d 口; 咖( q l i , q 2 i , q n i ) = e q , 一l i , 删卜1 一m u , ( e “o 一7 q j 一扣吡7 c 2 0 “ 2 , ) = p | q j 一二l 护( q j ) e ( 2 ) , 则 u ( 珏急:反刈砌,( 甜。 又将f i s h e r 信息阵j 分块表示为: 地缈呐= i j 如a a 名) , 其中也。对应于口,厶对应于掌:( r ,5 t , 0 2 ) t 。则相应的f i s h e r 信息为 由此,s c , 又可表示为 j 。一扩k 1 屯= 毛毋西。 s c i = u7 ( o o ) ( j o u ( e o ) 。 利用上述表达式,我们可证明下述定理。 定理4 :考虑模型( 1 1 ) ,在( 一1 ) ( 爿3 ) 满足的条件下,侣r , 使得 m ,a x iq oi r m a x , 存在正定矩阵z ,使得 在原假设口= o f o 成立的条件下有 ! 鳃以一厶= 以 s c j = 去“7 历( 矿乃) 一矿“上寸z 2 ( q ) , 其中与表示依分布收敛z 2 ( g ) 表示自由度为q 的z 2 分布。 证明:在假定条件下,由y a n ( 2 0 0 4 ) ,最小化( 2 1 3 ) 得到的相合估计色。 ” , “ 由此可得仃= ( ,) 办为盯2 的相合估计,即有盯2 一叮2 = o ,( 1 ) ,所以我们不妨 假设仃2 已知,不失一般性,设其等于1 。 对任意给定的q 维的常向量f = ( - ,r q ) 7 ,且l = 1 ,有 f 7 u ( 谷) = 圭:。 :。( q 一1 彪i 护( q f ) ) 】p a :妻妻( 圭r ,g ,) ( 乃一( 蕾,谷) ) z = 喜窆( 窆- q f ) ( y i - p ( 一,o o ) + ( 薯,o o ) 一( 一,各) ) z l h 口n口 = 寺( o ) 酽+ x ( z 。r ,q f ) ( ( t ,o o ) 一( _ ,各) ) 9 + 妻窆( 窆r j q 。) ( l ( 一,o o ) 一( _ 铆 = 互1c l + c 2 + 互1 c , 下面我们分别证明当以寸o 。时,有c 2 i = o ,( 1 ) 、c 3 万= d ,( 1 ) 。首先我们 考虑 c :1 4 ;= 喜( c 蔷q c 鹕c 锄旬少 = 喜( c 蔷q rjq拟和c掰x,)-5等删班相聃一51 强矿州,知 = i ( 口) ( 磊7 b ( 掰7 b ( 厨一) + 巧7 b ( 厨) 一7 b ( 7 ) ) qi o ,o i 、2 i :窆( 窆。g ,) ( 皖一吾) r b ( 厨) 。从 + 窆( 壹r 胁) 争( b ( 彤葺) 一b ( 矿_ ) ) q 肚 = c 2 l + c 2 2 在( 爿1 ) ( 彳3 ) 满足的条件下,由y a n ( 2 0 0 4 ) ,i ( 各一o o ) 7 = o p ( 1 ) , :。b ( 7 x , ) s , n 当卢在风的领域内,几乎处处一致收敛到0 。由此 靠( 吾一8 0 ) = q ( 1 ) ,打( 多一z o ) = q ( 1 ) , ( 3 1 1 ) 由定理条件m i , a l x i 劬i 0 ,使得当门_ 0 3 时,有 专斟扣轷c 扔,卜。 另一方面,由定理的条件,我们有 可擎 窆( 羔o 辫 z ( r i q 口) = ! :1 2 :q ! 一n = 丽1 蔷q 。善( 掣可1 二掣 = 上2 n 如) 2 = 矧扣 2 :! r r 以r 寸r r 以r 因此由李雅普诺夫中心极限定理,( 3 1 7 ) 得证,定理得证。 冉昊、朱仲义( 2 0 0 4 ) 对半参数模型的异方差检验统计量,在q = 1 的情况下, 证明了其渐近z 2 分布,z h u f u n g ( 2 0 0 4 ) 将之推广的到半参数混合模型的情形。 在这里,对单指标模型的异方差检验,我们也得到了相同的结论。 3 2 一阶自回归检验统计量 由定理2 ,得到单指标模型的a r ( 1 ) 检验的s c o r e 检验统计量s c 2 ,下面 证明s c 2 的渐近性质。 定理5 :在( 爿1 ) ( a 3 ) 满足的条件下,考虑模型( 1 1 ) ,在原假设p = o 成立的条 件下有 = 叠一- 沙- ,与以玑 证明:类似于定理4 ,我们不妨假设盯2 = 1 ,。由此,为证明定理,我们仅需证明 宝磊一,而 ( o ,1 ) ; 一 因为 z e a :芝( 只一( 一,国肌一卢,由) i = 2i = 2 = ( + ( ,g ) - 4 x , ,目) ) ( e 一+ ( 一,岛) 一( 一,9 ) ) i = 2 月h a = 岛一+ t ( ( 一一。,岛) 一( 一一,目) ) i = 21 = 2 + t 一。( 卢( _ ,铱) 一( 一,口) ) i - 2 + 宅( ( 薯一,o o ) 一2 ( x , ,刍) ) ( ( ,o o ) 一( _ ,各) ) i = 2 = 一l + 爿2 + 4 + 一4 类似于定理4 的证明,我们分别证当拧_ 时,有 4 门一1 = o ,( 1 ) ,4 4 一1 = o p 。( 1 ) ,以以一1 0 。 ,r 。一 一 ,r 一 首先我们考虑 爿:4 ;r i = 姜( 鹏刊i 刳卢 =窆(磊7b(掰葺)一驴b(肼)+争口(露誓)一争b(箩7一)qn-尿-ii=2 :窆( 瓯一吾) 7 b ( 厨t ) 加j + j 7 ( b ( 雕一) 一b ( 7 一) ) 历 = a 2 l + a 2 2 在( 4 1 ) 一( j 4 3 ) 满足的条件下,由y a h ( 2 0 0 4 ) , 门( 口岛) 7 = o p ( 1 ) , 1 2 2 b ( f 1 7 x i ) e ,n 当在屈的领域内,几乎处处一致收敛到0 ,由( 3 1 1 ) 4 l2 d 。( 1 ) 又由中值定理a :, a 2 2 忑( 屏一多) 7 芝争趴7 圳脚占加一1 ) 其中p 介于和风之间,由( 3 1 i ) ,2 ( 一) = o p ( 1 ) ;又( x ,口) 一阶导数 连续,由一致收敛性即可证 喜争( 7 一心弓门一- ) b 喜( 喜。) ( 厨葺垮门一) , 则同鸣,= o p ( 1 ) ,类似可证 4 2 2 = o p ( 1 ) 。 ( 3 1 3 ) 同理可证4 历= o p ( 1 ) 。 下证4 ,z l 一0 。 4 历2 娄( 盹叫( 私) ) ( 盹叫,刍) ) 卢 羔( ( 薯一,a o ) 一( t 一,各) ) :j i j ,- 2 + 窆( ( ( t ,a o ) 一( 誓,各) ) ) z i 丁 0 0, = a 4 - t - a 4 2 由( 3 1 5 ) 、( 3 1 6 ) ,又因为由条件( a 3 ) 去窆以一,印) ( 卢川( t ,印) ) 7 ,z 百 、7 一致有界。且万( 各一a o ) 7 = o 口( 1 ) ,则 爿4 i = d p ( 1 ) ,一4 2 = o p ( 1 ) 下面只需证明喜喊。卢与( 0 ,1 ) 。在原假设成立的条件下怖f = 1 ,玎 独立同标准正态分布, 则f t 乞一; ,i = 2 ,娌,是平稳2 一阶相依的。且相邻两个随 机变量是不相关的。又 e ( :q = o ,哳( o = 门一1 。+ 由平稳m 阶相依中心极限定理 则定理得证 3 3 计算机模拟 芝钆加西山( o ,i ) i = 2, 本节通过计算机模拟来检验s c o r e 统计量豹有限样本的分布与渐近分布的接 近程度。 我们选择了不同的样本量,同时选择g 的不同的形式,考察对s c o r e 检验统 计量的影响。分别取样本量为,2 = 5 0 ,1 0 0 。对模型 y = g ( p , x i + 履x 2 + 屈玛) + 6 x e x p ( z a 2 ) ,其中属= 及= 岛= l 3 ,z 服从标准 正态分布,s n ( o ,1 ) 模拟异方差检验统计量的经验分布函数;对模型 y = g ( 届+ 及屯+ 历玛) + 占,其中属= 屐= 屈= v v 3 ,e n ( 0 ,o - 2 ) 模拟一阶 自回归检验统计量的经验分布函数。五,如,毛分别为( 0 ,1 ) 空间上的均匀设计点, g 分别取线性、指数和正弦函数。每次实验重复1 0 0 0 次,得到相应的s c o r e 检验 统计量的经验分布函数。 在实际计算中。采用p 阶光滑样条方法对单指标模型g ( ) 进行拟合,( 光滑参 数的五的选取用g c v 方法) 。盯用平均残差平方和估计。节点取单指标变量j = x 的等分位点,在迭代算法中节点的位置是不固定的。在下面的模
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 棉花保管员理论知识考核试卷及答案
- 胶合板胶合工理论知识考核试卷及答案
- 三氯氢硅合成工招聘考核试卷及答案
- Reading A说课稿-2025-2026学年高中英语沪外版2020选择性必修第四册-沪外版2020
- 智能家居电机安防市场细分领域分析报告
- 凿岩工质量管控考核试卷及答案
- 生态旅游产品市场细分创新策略研究分析报告
- 工艺品雕刻工技能比武考核试卷及答案
- 果品采收标准分析报告
- 船体结构损伤检测方法分析报告
- 2025年煤矿企业主要负责人安全生产理论考试笔试试题含答案
- 苗族舞蹈课件
- 监狱公选面试题库及答案
- 具有法律效应的还款协议书6篇
- T-AOPA0062-2024电动航空器电推进系统动力电机控制器技术规范
- 2025年全国企业员工全面质量管理知识竞赛题及参考答案
- FZ/T 60029-2021毛毯脱毛测试方法
- 质量月知识竞赛题库
- 状态-特质焦虑问卷STAI
- hsp运营高感训练家长手册
- 罐车司机培训试题含答案
评论
0/150
提交评论