(概率论与数理统计专业论文)线性协变量调整模型的参数估计.pdf_第1页
(概率论与数理统计专业论文)线性协变量调整模型的参数估计.pdf_第2页
(概率论与数理统计专业论文)线性协变量调整模型的参数估计.pdf_第3页
(概率论与数理统计专业论文)线性协变量调整模型的参数估计.pdf_第4页
(概率论与数理统计专业论文)线性协变量调整模型的参数估计.pdf_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 线性回归模型是统计学中最重要的模型之一,其参数的估计有许多良好的性质。但 在许多应用问题中,待处理的数据,通常并不像经典回归分析中那样直接测量。或者即 使可以直接测量但是却包括影响实验结果的非处理因素,这些非处理因素被统称为协变 量。在对数据的处理过程中,若不合理考虑协变量的影响,常常会导致结论的偏倚乃至 错误。因此,在回归分析中要审慎地对待这一问题,在对测量数据进行回归分析处理 时,应该考虑到协变量的影响,对回归分析进行适当的调整,以达到处理效果最佳。这 就是协变量调整回归模型所要讨论的问题。 对线性协变量调整模型的参数进行估计通常可分两步完成。首先把线性协变量调整 模型转化成关于协变量的变系数线性回归模型,用己知观测数据估计变系数线性模型的 函数系数,然后用估计出的变系数模型的系数函数在协变量各观测点的函数值的加权平 均数来估计原来的线性协变量调整模型的未知系数。现有关于线性协变量调整模型的估 计方法大多是基于局部多项式最小二乘法估计或者把观测数据组按照协变量取值分组后 再估计。本文考虑用b 样条函数估计变系数模型的函数系数,然后求出协变量调整模型 的相合参数估计量,证明参数估计量的渐进j 下态性,以及给出其极限正态分布的方差的 相合估计量,从而得到线性协变量调整模型参数的近似正态分布置信域。 本文分为以下四个部分: 第一章,引言。对本文所选课题的研究意义、国内外研究现状以及文章拟解决的问 题进行讨论。同时对b 样条进行简单介绍,为以后章节做铺垫。 第二章,b 样条最小二乘估计。主要介绍基于b 样条最小二乘法的参数估计方法,并 证明了统计量的收敛速度。 第三章,b 样条m 估计。主要介绍基于b 样条m 估计的参数估计方法,并证明了统计 量的收敛速度。 第四章,估计量的渐进性质。证明了统计量的渐进j 下态性,介绍了当正态分布方差 未知时方差的估计及估计的相合性。从而可以用正态分布近似建立参数置信域。 关键词:协变量调整回归模型,变系数模型,b 样条,最小二乘估计,m 估计,渐 进正态性 a b s t r a c t l i n e a rr e g r e s s i o nm o d e li so n eo ft h em o s t i m p o r t a n t m o d e l si ns t a t i s t i c s ,w h i c hi s e x t e n s i v e l ya p p l i e di nm a n ya r e a s b u ti np r a c t i c e ,t h ea c t u a lp r e d i c t o r sa n dr e s p o n s e a r en o to b s e r v a b l e i n s t e a d fo n eo b s e r v e sc o n t a m i n a t e dv e r s i o n so ft h e s ev a r i a b l e s ? w h e r et h ed i s t o r t i o ni sm u l t i p l i c a t i v e ,w i t haf a c t o rt h a ti sas m o o t hu n k n o w nf u n c t i o n o fa no b s e r v e dc o v a r i a t e t h es i m u l t a n e o u s d e p e n d e n c eo fr e s p o n s ea n dp r e d i c t o r so n t h es a m ec o v a r i a t em a yl e a dt oa r t i f i c i a lc o r r e l a t i o na n d r e g r e s s i o nr e l a t i o n s h i p sw h i c h d on o te x i s tb e t w e e nt h ea c t u a lh i d d e np r e d i c t o ra n d r e s p o n s ev a r i a b l e s s oa t t e n t i o n m u s tb ep a i dt ot h i sc o n d i t i o n t h et h e m eo ft h i sp a p e ri st oe x p l o r es u c hc o n f o u n d i n g i nr e g r e s s i o na n dt od e v e l o p a p p r o p r i a t ea d j u s t m e n tm e t h o d s w ed e m o n s t r a t eh o wt h e r e g r e s s i o nc o e f f i c i e n t sc a n b ee s t i m a t e d 。t h e p r o p o s e de s f i m a t o r sa r ec o n s t r u c t e di nt h ef o l l o w i n gm a n n e r f i r s tw ee s t a b l i s ha m u l t i p l ev a r y i n g c o e f f i c i e n tm o d e lw h i c hc o n n e c t sw i t ht h ec a rm o d e la n de s t i m a t et h ev a r y i n gc o e f f i c i e n t sf u n c t i o n sf i r ( ) i n ( 2 2 ) t h ec o e f f i c i e n t s ( ;= oa r e t a r g e t e di nt h es e c o n ds t e p ,w i t h w e i g h t e da v e r a g e so ft h ee s t i m a t e d 屏( ) ,m a k i n gu s eo ft h er e l a t i o n sb e t w e e n 屏( ) a n d * g i v e nb y ( 2 1 ) a n dt h ei d e n t i f i a b i l i t yc o n d i t i o n s t h ep r o p o s e dm e t h o d sa r eu s i n gt h e m e t h o do fl p m o d e l i n g f o rt h ee s t i m a t i o no f 屏( t ) i nt h ef i r s ts t e p b u ti nt h i sp a p e rw e p r o p o s et w on e we s t i m a t i o np r o c e d u r e sw h e r ei nt h ef i r s tp r o p o s e dm e t h o d ,t h el o c a l l e a s t s q u a r e si se x p l o r e di np l a c eo fs m o o t h i n gs p l i n e s t h et h e s i si so r g a n i z e da sf o l l o w s : ( 1 ) l o o k sb a c ks o m eb a c k g r o u n d so ft h ec o v a r i a t e a d j u s t e dr e g r e s s i o nm o d e l ,p r e s e n t s t h ep r e v i o u si n v e s t i g a t i o n sa n dc o v e r ss o m ep r e l i m i n a r y k n o w l e d g e ( 2 ) p r o p o s e s an e we s t i m a t i o np r o c e d u r ew h e r ei nt h ef i r s ts t e pt h ee s t i m a t i o np r o c e d u r e sa r eb a s e do nb s p l i n e sl e a s ts q u a r e sa n dp r o o f st h ec o n s i s t e n c ya n dc o n v e r g e n c e r a t e so ft h i se s t i m a t o n ( 3 ) p r o p o s e san e we s t i m a t i o np r o c e d u r ew h e r ei nt h ef i r s ts t e pt h ee s t i m a t i o np r o c e d u r e sa r eb a s e do nb s p l i n e sm - e s t i m a t ea n dp r o o f st h ec o n s i s t e n c ya n dc o n v e r g e n c e r a t e so ft h i se s t i m a t o r ( 4 ) p r o p o s e st h ea s y m p t o t i cn o r m a l i t yo ft h ep a r a m e t e re s t i m a t o r s ,a n dp r e s e n t s c o n s i s t e n te s t i m a t e so ft h ea s y m p t o t i cv a r i a n c e , w h i c ha r eu s e df o rt h ec o n s t r u c t i o no f i i 浙江大学硕士学位论文 i i i a s y m p t o t i cc o n f i d e n c ei n t e r v a l sf o rt h er e g r e s s i o nc o e f f i c i e n t s k e yw o r d s :c o v a r i a t e - a d j u s t e dr e g r e s s i o n v a r y i n g c o e f f i c i e n tm o d e l | b s p l i n e 。 l e a s ts q u a r e se s t i m a t e , m e s t i m a t e ,a s y m p t o t i cn o r m a l i t y 第1 章引言 1 1问题的引入 1 1 1问题的来源和应用背景 线性回归模型的参数估计问题一直是统计学研究的重点。当样本直接可观坝0 时,目 前,我们有很多方法可以有效的估计出模型参数。然而,在应用到实际问题中时,待处 理的数据,通常并不可以直接测量,或者即使可以直接测量但是却常常包括影响实验结 果的非处理因素,也就是说我们所得到的观测样本往往是受到其他潜在变量的影响。所 以,当观测样本受到其他变量污染时,如何有效的估计出模型参数有很强实际应用背 景,是统计学者要面临的问题。在这篇文章中,我们主要研究线性协变量调整回归模型 ( c o v a r i a t e a d j u s t e dr e g r e s s i o n ) 的参数估计问题以及估计量的性质。 协变量调整模型t 扫s e n t i i r k 和m t i l l e r ( 2 0 0 5 a ) 提出,它主要研究当响应变量和因变量 不是直接可以观测时,线性回归模型的参数估计问题。线性回归模型是统计学中最重要 的模型之一,其参数的估计有许多良好的性质。但在许多应用问题中,待处理的数据, 通常并不像经典回归分析中那样直接测量。或者即使可以直接测量但是却常常包括影响 实验结果的非处理因素,这些因素被统称为协变量。在对数据的处理过程中,若不合理 考虑协变量的影响,常常会导致结论的偏倚乃至错误( k a y s e ne ta t 2 0 0 3 ) 。因此,在 回归分析中要审慎地对待这一问题,在对测量数据进行回归分析处理时,应该考虑用协 变量对其进行适当的调整,以达到处理效果最佳。这就是协变量调整回归模型所要讨论 的问题。 这一问题有广泛的实际背景。如在医学数据研究中,用临床试验数据研究某些疾病 特征时,除了我们考察的因素外,常常包括影响试验结果的非处理因素,如年龄,体重 指数( b m i ) 或疾病持续时间、严重程度等。在分析处理过程中,若不合理考虑这些协变 量的影响,常常会导致结论的偏倚乃至错误。因此,在分析临床试验数据时要审慎地对 待这一问题,在对测量数据进行回归分析处理时,应该考虑用协变量对其进行适当的调 整,以达到处理效果最佳。 1 1 2 问题的描述和研究状况 考虑多元线性回归模型: y = y o + 笔1 墨十e 1 ( 1 1 ) 浙江大学硕士学位论文 2 其中x 1 ,x p 是自变量;y 是响应变量:是满足e ( e ) = 0 ,v a r ( e ) = 盯2 o 的不可观 测的随机变量,称为误差项,并假定e n ( o ,盯2 ) ;加,是待估计的未知参数。 在我们要考虑的模型中y 和墨( r = l ,p ) 不能直接观测。但是我们可以观测到受 单个污染变量u 污染的观测值( y ,x ”,u ) ,同时( y ,x 1 ,) 与( y ,x 1 ,u ) 满 足如下关系式 y ( u ) = 妒( ) v墨( u ) = ( u ) 墨( r = 1 ,p )( 1 2 ) 其中拆和妒是关于u 的未知光滑函数,并且满足 e 妒( 【,) = 1 ,e ,( u ) = 1( 7 = 1 ,p ) ( 1 3 ) 上面( 1 1 ) 一( 1 3 ) 式称为乘积污染模型或者协变量调整模型( c a r ) ,o d s e n t f i r k 和m f i l l e r ( 2 0 0 5 a 出。 对于上述协变量调整模型的参数估计问题,常分两步完成。首先把线性模型转化成 关于协变量的变系数线性回归模型的系数函数,用已知观测数据估计变系数线性模型, 然后用估计的变系数模型参数加权平均值来估计原来的线性模型。 s e n t f i r k 矛h m f i l l e r ( 2 0 0 5 a ) 给出了一种基于协变量定义区间的等距分割估计方法,简 称e b ( e q u i d i s t a n t b i n n i n g ) 并给出了估计的存在性和相合性证明。随后s e n t t i r k s b m f i l l e r ( 2 0 明了该方法得到估计的渐进正态性。s e n t f i r k 和n g u y e n 给出了两种新的估计方法,基 于协变量定义区间的观测值邻近区域分割估计方法,简称为n b ( n e a r e s t - n e i g h b o r b i n - n i n g ) ;基于局部多项式模型的估计方法,简称为l p ( 1 0 c a lp o l y n o m i a lm o d e l i n g ) 。并给 出了两种估计量的相合性和渐进正态性证明。详见s e n t t i r k 和n g u y e n ( 2 0 0 5 ) 。n b f 一 l p 估 计是对e b 估计的极大改进,他们计算更加简单,并且有较小的m s e 。 1 2 本文的主要工作 现有关于协变量调整模型的研究大多数基于局部多项式最小二乘法。本文考虑到样 条函数回归计算简单,并在非参数分位数回归、部分线性模型、混合部分线性模型和变 系数模型中,非参数的b 样条估计分别得到了最优的收敛速度。因此我们用b 样条函数估 计变系数模型,并得出了协变量调整模型的参数估计量,并且证明了参数估计量的收敛 速度和渐进正态性。 文章首先对于新引进的两个估计方法给出详细的介绍。并通过计算证明得出,在一 定的条件下协变量调整模型系数估计量坼,( r = 0 ,p ) 满足: 雨= + o pr , - 1 2 ) + 0 p ( k m ) 浙江大学硕士学位论文 3 在文章的最后一章,证明了估计量的渐进正态性,即瓶( 雨一) 兰n ( o ,盯;) ,0 r p 。并给出了当正态分布方差未知时,方差的相合估计。从而可以用正态分布近似建 立参数置信域r 士z l 一暑舞。 1 3 b 样条简介 所谓样条函数( s p l i n ef u n c t i o n ) 就是具有一定光滑性的分段函数或分片定义的 多项式函数。各相邻段( 片) 上的多项式之问又具有某种连接性质。因而它 既保持了多项式的简单性和逼近的可行性,又在各段之间保持了相对独立的局 部性质。1 9 4 6 年,i j s c h o e n b e r g 较为系统地建立了一元样条函数的理论基础。但 是,s c h o e n b e r g 的i 作刚开始时并未得到重视。从上世纪6 0 年代开始,随着电子计算机 技术的飞速发展,样条函数得到了飞速地发展和广泛的应用。现在,样条函数在函数逼 近、微分方程数值解、计算几何、计算机辅助几何设计、有限元及小波等领域均有较为 重要的应用。 本节将有选择地样条函数作一些简要介绍,以便为后续章节做铺避。 1 3 1b 样条定义 给定一个非负的整数z 和一个正整数k ,令n = z + k ,称a = t o t 1 k = 6 是a ,6 区间上及o 拟均匀的分割( s 0 - q u a s i u n i f o r mp a r t i o n s ) ,若对于某个常数o l 0 m a x ( t t t i 一1 ) m i n ( t i t i 一1 ) 耋o l 0 , 0t 并且称a = 8 1 = = 8 1 + 1 ,= 8 1 + 2 = t l ,s z + h = t k 一1 ,8 1 + 惫。+ 1 = = 8 2 l + 。+ 1 = b 为 一个扩展的分割。 称7 r ( ) = ( 7 r 1 ( ) ,7 r ( t ) ) 下为上述分割对应的b 样条基,若死( 亡) ,i = 1 ,是z 次 多项式,并且满足 ( 1 ) 死( ) = 0 ,t 【a ,如】u t i + + l ,h i ; ( 2 ) 死( 亡) 0 ,t i t , ,如+ 件1 】,且件h 17 r i ( t ) d t = 1 。 几( ) 可以写成 仉( ) = ( 一幻) l + j = i 设t = ( 1 ,k ) ,则区间 o ,6 上的上述分割对应的f 次样条函数空间为 s ( z ,t ) = s c 卜1a ,6 】:s 在t i + 1 】上是f 次多项式, 在节点屯处具有f l 阶连续的导函数, 浙江大学硕士学位论文 其中a ,6 】为区问 n ,h i 上具有2 1 阶有界连续可导的函数集。 f 次样条函数由节点t 唯一确定,所有节点为t 的f 次行条函数的集合s ( z ,z ) 构成一个线 性空间,其中维数为。对于任意的s ( t ) s ( 1 ,) ,存在o l r ,使得 s ( t ) = 7 r 丁( 亡) , 其中7 r ( ) = ( 7 r i ( ) ,7 r ( ) ) 1 。,s ( ) 称为z 次b 样条函数。 1 3 2b 样条性质 由上面一节的介绍容易得出,f 次b 样条函数基具有如下性质 ( 1 ) 0 0 。并且 妒( u ) ,佴( ) c ma ,6 】,其中c ma ,6 】表示区间 o :h i 上具有m 阶有界连续导数的函 数集。 c 4 在区间【口,h i 上,t l ,t k 。为样条函数的内部节点,设t o = a ,t k + 1 = b ,= 如一屯一,h2 1 器。( 玩) 。存在一个常数尬,使得 高尬,m a x lh t + l - h il _ 0 ( 去) c 5 贾= ( 童1 ,) 7 ,矿是随机的,u 的边际密度函数是连续的,q ( 面lu ) 为给定u , 又的条件分布函数。e ( x x 。下lu ) = g ( u ) ,( u ) = ,娩奶d q ( 矛iu ) 为g ( u ) 的 ( i ,歹) 元素,存在常数m 3 ,尬,坞,使得 g i j ( u ) m 3 入m g ( i n u 入g 娶m 3 其d p ,a c ( n u ) ,a g ( u 分别是g ( u ) 的最小,最大特征根。 注释2 1 :假设c 1 ,c 2 是对变量独立和u 有界性的一些限制,c 3 是对污染函数的 一些限制,这是比较弱且易实现的。c 4 是对节点的一些限制,当我们取均匀节点时, 假设c 4 显然成立,满足条件c 4 的节点也称为拟均匀节点,它对节点分布的限制是比较 弱的。假设c 5 是对回归变量又,【厂的限制。当( u ) 为 o ,6 】上的连续函数时,假设c 5 成 立。 定理2 1 :假设c 1 一c 5 成立,则协变量调整模型的b 样条最小二乘估计坼,( r = 0 ,p ) 满足: 儡= + o p ( n 。2 ) + q ( k m ) 为证明上述定理,下面我们引用参考 2 1 1 中的定理,得独立场合下变系数模型b 样条 估计具有下述性质: 9 引理2 2 :假设c 1 c 5 成立,则对于任意给定的t z ( t ) 一( ) l i = q ( k m ) 其中k 是样条函数的内部节点数,m 是样条函数的次数,p ( t ) = ( z o ( t ) ,伟( t ) ) 7 。,l l ai i 为矩阵a 的2 范数。若a 为m 他的矩阵,| | a1 1 = ( 入怒) ;若矩阵a 为对称的方 阵,l ial i 为a 的最大特征根;若a 为m 1 的向量,l ial l 为欧氏范数。 其中 证明:相关证明可以参阅参考1 2 1 1 中定理4 1 。 下面给出定理2 1 的证明。 证明: 由于= 袁耋丢屏( 现) 毫i 所以: 噩= 易= = l 当x r 产i = 1 三 戽( 阢) 2 r t 一竹l = i 去喜三戽( 玩) 疋一三z r i = 1 三n 屏( 阢) 繇+ 当x r 产i = 1 三n 屏( 以) 磊一7 r i s i 去喜丢屏( 阢) 一三x r i = 11 n 屏( 以) i + i 当x r 产i = ,三n 屏( 阢) 盛i 一i 三正+ 疋 l 可1 x , l :i 1 x , i 亨1 x , 麦z , - ( u 0 2 , - , 一i 对于乃由引理2 2 ,等价地可以得到 去喜( 讹) 刊e 毫= o p ( 又由中心极限定理易得: 三喜( 凰也) 刮n _ 1 2 ) ( 2 9 ) ( 2 1 0 ) n x 、l , 巩屏 1 一n “住僦成三毫 一 屏 r 一 霹 卜 劭 阢 ,l r 默 洱 。斟n甜n汹 浙江大学硕士学位论文 1 0 从而,由上面( 2 9 ) ( 2 1 0 ) 式以及条件c 2 ,c 3 ,c 5 得 乃= l 当x r 妻i = l 拟阢) 一屏( 阢) ) 繇l i 当x lei=l(房(阢)一屏(以)e毫l+l圭l皖i=ia1 ( 房( 阢) 一屏( 阢) ) ( 毫t e 毫) i lt = o a k ;m ) + o p ( n 一1 2 ) ( 2 1 1 ) 对于死由于屏( 以) = 妒( 阢) 拆( 以) ,所以: 疋= i 圭喜麦粥凰刊 一iz 1 - 1 勰姒啪t 刊 = l 当x ,于i = 11 n 垆( 既) 墨i 一竹i 再由于e ( 毫) = e ( 办( u ) 坼) = e ( 墨) ,e ( 妒( u ) 墨) = e ( x ,) ,由大数定律及中心极限定 理,可以得到: 疋= o pn 1 2 ) r b ( 2 1 1 ) 和( 2 1 2 ) 式,得当r = 1 ,p 时 当r = 0 时 证毕。 坼一+ d pn 一1 2 ) + 0 p ( k m ) = 几- 1 扁( 巩) t = 1 = 他- 1 ( 或一p ,( 阢) 元,一良( 巩) 毫p ) t = 1 = y 一1 x 1 一x p p = e 矿一e * + 0 p ( n - 1 7 2 ) + q ( k m ) r = 1 = 7 0 + 0 ( 扎一1 2 ) + q ( k 仇) ( 2 1 2 ) 第3 章b 样条m 估计 上章给出了协变量调整模型的一种估计方法,b 样条最小二乘估计。并证明了参数 估计量的相合性。这对于估计协变量调整模型有重要的理论意义。但是在上面的问题讨 论中,我们均假设观测误差服从正态分布。但是客观实际并非如此,观测值中常常含有 粗差,粗差往往带来不良的后果,影响估计结果的正确性。众所周知,最小二乘法对含 粗差的观测值相当敏感,稳健估计正是针对最小二乘法抗误差干扰提出的,其目的在于 构造某种估计方法,使其对于模型误差特别是粗差具有较强的抵抗能力。为了解决上述 问题,1 9 6 4 年h u b e r 提出了m 估计理论。作为上述b 样条最小二乘估计的改进,我们研 究协变量调整模型的b 样条m 估计理论,并证明参数估计量的相合性。 3 1 函数系数的估计 函数系数的b 样条m 估计,与2 2 节的估计方法类似。首先我们假设( e ,坼) ( r = 1 ,p ) 相互独立。则矿关于 震) 笔。的回归可以表示为: e ( z i x “,u ) = 阮( u ) + 屏( u ) 毫 其中 胛m 们( 班器 ( 3 1 ) 从而,我们得: 矿= 岛( u ) + 屏( u ) 需+ ( 3 2 ) 其中 三妒( ) e 用b 样条m 估计方法估计协变量调整模型的参数,就是在考虑模型( 3 2 ) 的系数函数 的估计时,用b 样条函数来近似逼近函数系数,使得参数的估计值满足: m l n o l r e r n ,r = l , 叩善以沪_ 下( 蚴o 0 - - x l i t f t ) a l + + x p i 7 r r 川 ( 3 3 ) 其中,j d ( ) 是一个凸损失函数,当p ( z ) = x 2 时,对应的是均值回归,也就是上章研究的 内容,当p ( z ) = izl 时,对应的是中位数回归。为了控制异常观测值的影响,一般选择 具有有界导函数的j d ( z ) 。 1 1 浙江大学硕士学位论文 1 2 通过上面( 3 3 ) 式得出模型( 3 2 ) 的系数函数估计,记为屏( ) ,其中r = 0 ,p 。 由( 1 2 ) ,( 1 3 ) 及( 3 1 ) 式我们得: e 风( u ) = 加 和 e 屏( 矿) 墨= 竹e 妒( u ) x r = 竹e ( 墨) = e ( x ,) 从而得c a r 模型系数坼的估计为: 铂= n - 1 妻麂( 阢) 钆= 軎壹三屏( 阢) 葛t ( 3 4 ) i = 1 ri = 1 其中i :n 一壹毫。 由上面的叙述我们可以看出,b 样条m 估计是b 样条最d , - 乘估计的推广和改进, 当p ( z ) = x 2 时,b 样条最d , - 乘估计是b 样条m 估计的一个特例。考虑到m 估计的稳健 性,把m 估计方法引入本文是有很强的实际意义的。下面我们证明基于b 样条m 估计方 法的( 3 4 ) 式估计量的相合性。 3 2 函数系数估计性质 在给出结论之前,我们先做如下假设: c 1 一, c 4 与2 3 节假设相同。 c 5 任意给定的t ,又( ) 具有有限的四阶矩。 c 6p ( ) 是凸函数,( s ) = 妒( s ) 有界,且满足 e 砂( 岛) = 0 e 矽2 ( 岛) = a i ,s u pia ii 0 ,存在一个充分大的l ,当礼_ 时,下式成立。 p k i n 忙f li 1 莩 忍( 水t 一忌y 2 召q 一霹r ) 础t 一霹剐) 一础2 刃q 矽c 嘲 。) 1 一 其中e 表示给定以,宠的条件数学期望。 1 5 证明:由条件c 7 i n :f l 忐莩匠( ,) ( e t 一后i 2 零q 一露r ) 一,( 邑一霹r ) ) = 。! 狴l 去莩上毫( 。i r - 一2 ( 詹r y i 2 2 7 q + 戈? 忍砂c e t + s ,d s ) = 秸锥l 去莩6 i ( 丢( 础2 召q ) 2 + 硝2 召q 霹r ) ( 1 + 。( 1 ) ) 三 i n l l :f l a + b ) ( 1 + 。( 1 ) ) 其中a 三j i i 。zb t ( j ( 后y 2 刃q ) 2 ,b 三瓦1 玩( 彬2 刃a 霹咒) 由条件c 7 i j i 理( 3 3 ) 得: a 2 瓦1 莩6 t 互1 ( 炼1 2 刃) 2 = 丢 莩玩q 下乞刁a ) = o p ( k , , ) i i q1 1 2 。( 3 “) 由条件c 5 ,c 7 ,( 3 8 ) ( 3 1 0 ) ( 3 1 2 ) 得: b i = l k 1 7 2 ( o l 7 五) ( 霹尼) 玩 i 晰1 7 2 ia 7 磊i i2 ;r tl i 6 k 1 7 2 i iql f ( 刃五) 1 7 2 ( 霹咒) 1 7 2 ( r 。t 咒) 1 7 2 o ( n ) v 2 b k 9 1 2 k , n 7i i ni i x :x , = l l 口i id p ( 砩2 ) ( 3 1 5 ) 由( 3 1 4 ) ( 3 1 5 ) 式得: i n :f 工瓦1 莩忍( p ( 鼠一础2 刃a 一霹兄) 一j 9 ( 毛一霹尼) ) o p ( k 三2 一k 1 2 己) ( 3 1 6 ) 另一方面,对任意小的6 0 由条件c 6 和( 3 1 3 ) 式得: 展( 莩南姚,) _ 0 慨( 南莩撕) ) = 去莩驰五 浙江大学硕士学位论文 从而得: 尬驴1 莩召五 = 舰驴1 莩五刃 = o p ( 1 ) 壶及7 。磊始) = 啡( 后钏qi i ) ( 3 1 7 ) 几n t 由上面( 3 1 6 ) ( 3 1 7 ) 式得,对于充分大的l ,任意小的6 0 当n 一0 时,下式成立: | | q i l i n :f l 忐莩 层( 绯i 一碍2 z q 一霹玩) 一础i 一霹危) ) 一硝2 刃a 妒( d p ( l 2 一k l 2 l 一磋l ) 0 从而引理成立。 引理3 6 : 在定理给定条件下,模型( 3 2 ) 的函数系数估计矽( t ) 满足: 三n 壹妻( 反( 职) 一熊( 职) ) 2 :怫( k z m )兰( 反( 职) 一熊( 职) ) = 怫( k 2 m k = oi = 1 证明: 由( 2 1 ) ( 3 1 1 ) 式得: 三壹壹( 反( 小粥) ) 2 = _ :( 丌下( 以) a 七一丌r ( u 3 0 k + 丌r ( 阢) 巩一风( 阢) ) 2 。”k = 0i = 1 姜( 丌r ( 阢) a 七一丌r ( 玩) 如) 2 + 丢( 矿( 巩) 以一觑( 以) ) 2 k = ot = 1k = o = 1 募t f r ( 巩) 觑一丌下( u ) o k ) 2 + o ( k 2 m ) 。k = oi = 1 由于m 1 2 要证明( 3 1 8 ) 式。只需证明: p 7 1 ( 丌r ( 以) a 七一丌r ( 职) 以) 2 = o p ( k n ) k = oi = l 而由( 3 7 ) ( 3 9 ) 式得: ( 3 1 8 ) ( 3 1 9 ) 电 d v 玩 丌一 七 口 r q r 丌 竹澍 p 脚 1 7 = ( 丌r ( 巩) ( & 一p ) ,丌下( 以) ( 岛一钐) ) ( 丌r ( 玩) ( a - 一拶z ) ,万7 ( 弘) ( & p 一铭) ) r i = 1 = ( a 口) 7 ( a 一0 ) 另一方面,由( 3 2 ) ( 2 1 ) ( 3 3 ) 式 q r r 噙,p 萎p ( 犰一( 丌? ( 以mx 丌r ( u d 时+ v r ( 以刚 = 呼p ( 珑一霹,k t 。丌r ( v d ,口) = p ( 犰一枉+ o 丌7 ( 以) a ) = 1 = p ( 犰一2 , z ( v d + 2 , z ( v d 一霹+ 1 。丌r ( 阢) 0 i = 1 + 霹+ l 圆7 r 7 ( 阢) p 一霹厶+ 1 7 r 7 ( 巩) a ) = p ( 鼠一霹r 一召( a 一百) ) 又因为,由引理( 3 4 ) ( 3 5 ) 可得,对于任意的6 0 ,存在l ,当n 一o o 时有: p “i n 忙f l 。p ( e i - k y 2 召q 一霹剐 莩雕i 一霹尼) ) 1 一e 由凸函数的性质易得: p k i n 怆f l 莩础t 础2 召一霹蚴 莩水t 一霹忍) ) l 一 由上面( 3 2 0 ) k ,可得: p 壹壹7c v i ) - 7 1 t ( 7 1 - ( v d o k ) l 2 k , 。k = 0i = 1) p 7 ( lj = p 卅一百l l :e 墨+( 佗一l 2 ) + q ( k m ) r = l = 伽+ o p ( n _ 1 2 ) + o p ( k m ) ( 3 2 4 ) 到此,我们证明了协变量调整模型b 样条m 估计的收敛性。这一估计保留了m 估计 的稳健性特点。对协变量调整模型参数估计的研究具有很大的意义。 第4 章估计量的渐进性质 上面两章我们详细给出了b 样条最小二乘估计和b 样条m 估计的表达式和其相合性 质。下面我们证明估计量的渐进正态性。并给出了当正态分布方差未知时,极限分布方 差的相合估计量,从而可以得出原协变量调整模型系数的渐进置信区间。 由引言中b 样条函数的介绍可以知,m 次的b 样条函数由其节点唯一确定。在b 样条 回归中,选择节点的数目的标准常见的有两种:交叉验证( c v g c v ) 和信息准则,参见 卢一强( 2 0 0 3 ) ,在这里我们假设当n _ 。o 时,啬_ o 。因 t t 1 ,所以上述假设是很普 遍的。 4 1 估计量的渐进正态性 下面定理介绍c a r 模型b 样条m 估计量的渐进正态性。 定理4 1 :在第三章假设c 1 c 7 成立条件下,设协变量调整模型系数的b 样条m 估 计量为儡( r = 0 ,p ) ,则佛( 7 = 0 ,p ) 满足: 其中 何( 镌一) 马n ( o ,砖) ,0 r p , 碚= 镌y n r 妒( u ) ) ,( 4 1 ) 晖2 :地型塑盟止黑关警蚴幽幽,1 r 鲰( 4 2 ) 1 e ( 墨) ) 2 1 一二pp 一7 证明:首先证明当r = 0 时的情况: 由:n - - 1 妻麂( 以) ,z o ( u ) :妒( 沙

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论