(概率论与数理统计专业论文)截断数据场合下部分线性模型的参数估计连续时间下局部线性估计的收敛性.pdf_第1页
(概率论与数理统计专业论文)截断数据场合下部分线性模型的参数估计连续时间下局部线性估计的收敛性.pdf_第2页
(概率论与数理统计专业论文)截断数据场合下部分线性模型的参数估计连续时间下局部线性估计的收敛性.pdf_第3页
(概率论与数理统计专业论文)截断数据场合下部分线性模型的参数估计连续时间下局部线性估计的收敛性.pdf_第4页
(概率论与数理统计专业论文)截断数据场合下部分线性模型的参数估计连续时间下局部线性估计的收敛性.pdf_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

序言 作为硕士学位论文,本文在内容上包含了两部分的研究工作,分别考虑了半参数模型和 非参数模型中的两类问题第一部分研究了离散情况下截断数据场合下部分线性模型的参 数估计,通过对模型中的“讨厌”参数作分层处理并利用基于残差秩的统计方法求得相应 的参数估计。对于这一类分层方法,我们在本文中还重点研究了该方法在数值模拟情况下的 效果,并对分层的方法作了改进。第二部分内主要研究了连续时间下回归函数局部线性估计 的收敛性质,在适当的条件下,我们证明了均方积分误差( m i s e ) 意义下局部线性估计的收 敛性 本文从选题到细节推敲,从数值模拟想法的提出到实施,直到最后成稿的整个过程均得 到了沈家副教授的悉心指导和热忱关怀;同时在复旦求学的七年时光里,作者也于沈先生的 谆谆教导中得益非浅在此作者道向沈先生表示深深的敬意和谢忱l 包括郑祖康教授在内 的统计系全体教师对本文的最终定稿提出了不少宝贵的建议和指导;统计系2 0 0 0 级硕士班 的同学们也提供了很多有益的思路在此一并表示衷心的感谢 限于作者水平。本文中可能仍有不少纰漏和缺点存在,欢迎各位老师专家批评指正 2 第一部分 截断数据场合部分线性模型的参数 估计 截断数据场合部分线性模型的参数估计 作者:陈文骏指导教师:沈家 复旦大学统计学系上海2 0 0 4 3 3 摘要 本文对截断数据场合下的部分线性模型作研究。首先通过对“讨厌参数”作分屡处理来降 低干扰然后利用基于残差秩的统计方法得到模型中的参数估计;并指出了所得估计的一些大 样本性质同时提出利用一种重抽样方法用于获敢所得估计的渐近分布这一估i 十方法在计算 上是可行和方便的。我们因此以数值模拟对所提出研究的方法作计算机实现,证实了该方法爰 所得估计的有效性所用分屡方法可在连续变量的情形下怍适当改进,我们对此也在模拟工作 的基础上作了讨论 关键词t 匍f j 线性模型l 基于残差秩的估计( r a n ke s t i m a t i o n ) 1 分屡 r a n k b a s e de s t i m a t i o no fap a r t i a l l n e a rm o d e lw i t hc e n s o r e dd a t a b yc h e nw e n j u l a s u p e r v i s o r :s h e nj i a d e p to fs t a t i s t i c s f u d a nu n i vs h a n g h a i a b s t r a c t :w i t ha p p l y i n gs t r a t i f i c a t i o no l ln u i s a a c ev a r i a b l e ,w ei n v e s t i g a t eas i m p l er a n k b a s e de s t i m a t i o nm e t h o df o rr e g r e s s i o np a r a m e t e rv e c t o ri nap a r t i a ll i a e a rm o d e lw h e nt h e r e s p o n s ev a r i a b l ei ss u b j e c tt or a n d o mr i g h tc e n s o r s h i pt h er e s u l t i n ge s t i m a t o ri ss h o w nt o b ez s y n t p t o t i c a l l y1 1 0 1r e a l n e r e l t c ( ! i sc ;l s i l yo b t a i n e dt h r o u g har e s a m l | i n gs c h e m ew h i c h a 1 ) p i o x h n a t e st h ed i s t r i b u t i o no ft h ee s t i m a t o ri i la d d i t i o n ,w ei m p r o v et h es t r a t i f i c a t i o n m e t h o dt oe l h 8 3 _ | c et h ee 晶e c i e n c yo fs u c hr a n k b a s e d t i m a t o r ,e s p e c i a l l yw h e nt h es a m p l e s i z ei ss m a l l b o t ht h ep a r a m e t e re s t i m a t i o na n dt i mr e s a m p l i n gs c h e m ec a l lh ec o n d u c t e d v i al i n e a rp r o g r a m m i n gm a dt h u sa r ee a s yt oi m p l e m e n tn u m e r i c a l l ye x t e n s i v es i m u l a t i o n s a r ec a r r i e do u tt os u p p o r tt h et h e o r y k c y w o r d s :p a r t i a ll i n e a rm o d e l ;r a n ke s f i m a t i o n is t r a t i f i c a t i o n 5 第一章绪论 线性模型是现代统计方法中极重要的组成部分也是研究统计问题中最常用的手段之 一线性模型形式直观而易于理解,并且相关的参数估计具有良好的性质,因而在生物学、 医学和经济学等自然科学和社会科学的各个领域得到广泛的应用作为线性模型的一种简 单而直接的推广一一部分线性模型( 有时也叫作半参数模型) 也日益受到学者们重视尤其 是当我们所研究的统计问题中响应变量同某个白变量之间的关系较为模糊,而其之间的关 系又恰非我们感兴趣的重点一一该情形下建立相应的部分线性模型往往要比单纯的线性模 型更能概括问题也更倾向于被接受部分线性模型可以写作如下形式: ( 11 )y = x 十h ( w ) + e 其中,是因变量( 响应变量) ,x 和分别是p 维和1 维的自变量( 解释变量) e 是与 ( x ,) 独立的随机误差;口是p 维的未知参数( 通常被称为p a r a m e t e ro fi n t e r e s t ) , ( j 是某个光滑的函数,在模型中h ( w ) 被看作“讨厌”参数( n u i s a n c ep a r a m e t e r ) 对上述模型的解释是,在响应变量同自变量的关系中我们主要想研究x 的变动对y 的 影响,并假定他们具有某种线性关系;但同时也必须考虑自变量w 通过未知函数 ( ) 所带 来的干扰作用,尽管后者不属我们所感兴趣之列;我们总希望尽量降低干扰而准确的估计参 数口 完全样本场合下,形如( 1 1 ) 的部分线性模型已得到广泛研究,降低或消除7 z ( ) 带来 的干扰成为解决问题的关键,见e n g l e ,g i a n g e r ,r i c e w e i s s ( 1 9 8 6 ) ,h e c k m a n ( 1 9 8 6 ) 。 c h e n ( 1 9 8 8 ) ,pm r o b i n s o n ( 1 9 8 8 ) 和b a s q s h e n ( 1 9 9 8 ) 等等其中e n g l e ,g r a n g e r , r i c e w e i s s ( 1 9 8 6 ) 提出了通过对 ( ) 作样条光滑从而得到口估计的方法,并讨论了该估 计的收敛性质;p m r o b i n s o n ( 1 9 8 8 ) 和b o s q s h e n ( 1 9 9 8 ) 则利用基于对部分线性模 型取条件期望的办法来消除 ( ) 的影响,因而把部分线性模型转化为线性模型来研究,井进 一步得到口的估计;此外,b o s q s h e n ( 1 9 9 8 ) 还讨论了样本观测之间具有自相关的情形 相比完全数据场合从实践的角度看截断数据场合下统计问题的研究更为实际,对部 分线性模型的研究而言同样如此这一点。在部分线性模型应用于生存分析及寿命数据研究 的情形更为常见但是由于截断数据的存在也使得截断数据场合下的部分线性模型的研究 变得复杂和困难,进展也相对缓慢,专述该问题的文献目前尚不多见本文旨在研究一种基 于模型残差秩的统计方法来估计p 。用于解决部分线性模型在截断数据场合的参数估计问 题 如同线性模型一样,部分线性模型应用于在生存分析及寿命数据研究,往往可以同该领 域里一类加速失效时间模型( a f t ,a c c e l e r a t e df a i l u r et i m e ) 联系起来:在模型( 1 1 ) 中若 令t = e o 表示某一个体的寿命时间,则原模型即可看作t 关于x 和所形成的a f t 模 型( 对二:a f t 模型,我们会在下一章里作介绍) 特别当 ( 】为常数时。部分线性模型退 化为线性模型,估计p 即是线性回归中的参数估计问题在生存分析领域,截断数据场台 下的线性模型自上世纪8 0 年代起已经得到了充分的研究,其中,b n c k l e y j a m e s ( 1 9 7 9 ) 及p r e n t i c e ( 1 9 7 8 ) 分别提出了截断数据的最小二乘估计( l s e ) 方法和基于残差秩的估计方 6 法( r a n ke s t i m a t i o n ) ;黎子良、郑祖康( 1 9 9 3 ) 中对截断数据的回归分析作了很好的概括和 介绍。 对于线性模型下基于残差秩的估计方法,一个显而易见的优点是由于利用了秩统计量, 因而得到的估计稳健性好不易受到异常数据干扰r i t o v ( 1 9 9 0 ) 、t s i a t i s ( 1 9 9 0 ) 、l a i y i n g ( 1 9 9 1 a ,b ) 、y i n g ( 1 9 9 3 ) 和j i n ,l i n ,w e i y i n g ( 2 0 0 2 ) 对秩估计的理论和方法做了深 入的研究和发展特别的,j i n ,l i n ,w e i y i n g ( 2 0 0 2 ) 提出利用线性规划方法求解这一类 估计i 可题,并采用一类重抽样方法用以获得该估计的渐近分布,克服了截断数据秩估计方法 在计算上的复杂性, 基于上述学者的工作,我们在本文中研究截断数据场合部分线性模型的参数估计问题 的方法是;首先对作分层处理达到降低干扰的目的,然后利用基于残差秩的估计方法得 到参数口的估计卢;与此同时,利用重抽样得到的数值模拟的结果也证实了所用分层方法 及所得估计的有效性。需要说明通过上述方法所得估计芦的太撑本性质的建立已收录在 与本文并行的另一篇学术论文中( 见f 5 】) 。我们在本文中略去了证明,仅加以叙述 本文结构安排大致如下t 第二章回顾了加速失效时间( a f t ) 模型及相关的基于残差秩 的参数估计方法;第三章包含了对部分线性模型在截断场合下利用分层处理得到参数估计 的基本方法及相关估计的渐近正态性;第四章里我们将提出对分层方法的一些改进;数值模 拟结果的讨论见第五章 7 第二章关于a f t 模型和秩估计方法的回顾 如前所述,本文中解决截断数据部分线性模型中的参数估计问题借鉴了生存分析中加 速失效时间( a f t ) 模型及相关的基于残差秩的估计方法( r a n ke s t i m a t i o n ) ,因此在引入分 层方法和相关结果之前。有必要先对a f t 模型和秩估计方法作一些介绍 2 1加速失效时间( a f t ) 模型 在生存分析和寿命数据的研究中,除了从基于寿命自身的研究着手外,通常还假定寿命丁 同一些外部或内部的因素有关,c o x 把这些因素称为协变量协变量可能是多维的,不妨记z 为p 维的协变量我们通常把t 的分布函数记作f ( ;z ) ,密度函数记作,( t ;z ) ,相应的失效率 函数记作a ( ;。) ,用以表示对z 的依赖关系;其中,失效率函数 ( t ;z ) = ,( ;x ) ( 1 一f ( z ) ) , 衡量了个体寿命衰老、受损或失效的速度 在生存分析中,基于失效率函数建立的模型在研究中是非常有用的,比如著名的比例失 效率模型( p r o p o r t i o n a lh a z a r dm o d e l ) ,也称作c o x 模型c o x 将协变量引入失效率函数 内,提出模型 ( t ;z ) = 2 o ( ) , 其中卢是p 维的回归参数,a o ( t ) 被称为基准失效率函数( b a s e l i n eh a z a r df u n c t i o n ) ;通过 边际似然等方法可以得到p 的估计这一类模型被广泛应用于医学和生物统计领域 另一类在寿命数据研究中被广泛应用的即是加速失效时间( a f t ) 模型它将线性模型 直接应用于失效率模型的研究中,为解决截断数据的回归问题提供了另一条有效的途径 c o x 也指出,u 卡日对于比例失效率模型,加速失效时问( a f t ) 模型在诸多场合更引人驻足, 因它具有非常贴切的直观解释”( 见r , e i d ,1 9 9 4 ) 对于a f t 模型可以叙述如下:令r 为某个体寿命,z 为与t 相联系的p 维协变量, a ( ;z ) 为r 在t 时刻的失效率函数由t 及协变量z 所构成的a f t 模型假设t 服从对数 线性模型,即】,= l o g t 服从线性模型 】7 = 口。+ e 其中e 为随机误差具有密度,对上式两端取指数我们得到 t = e 口。z , 其中= e 注意到上式中若p z 0 ,则个体寿命t 要短于,我们称协变量z 加速 了的失效。进一步令 o ( ) 为蜀的失效率函数,这被称作基准失效率函数;mt 的表 达简单推导后即得到丁的失效率函数 ( ;z ) = a o ( e 一口。) e 一口。 如前所述,失效率函数衡量了个体寿命的失效速度,因此从上式表达可见协变量。及 相关参数卢的存在所带来的效果是加快或减缓了r 的失效速度。故加速失效时间( a f t ) 模 8 型得名于此( 见k a l b f l e i s c h p r e n t i c e ,1 9 8 0 ) 2 2基于残差秩的估计方法( r a n ke s t i m a t i o n ) 在寿命数据及相关a f t 模型的研究中,由于数据截断普遍存在,因此截断数据场合 下a f t 模型中参数估计的问题自上个世纪8 0 年代起得到了广泛研究b u c k l e y 和j a m e s ( 1 9 7 9 ) 提出了适用于截断数据的最小二乘估计( l s e ) 方法,p r e n t i c e ( 1 9 7 8 ) 以及后来的诸 多学者利用基于残差秩的估计方法研究了截断场合下a f t 模型的参数估计这里,我们将 先抛开a f t 模型及截断场合,试图从更一般的角度来诠释基于残差秩的估计方法 考虑线性模型 k = x 。+ q ,i = 1 ,2 ,n 其中k 和x :分为1 维和p 维的因变量和自变量,口为p 维待估参数,e 为随机误差与 ! 独立, ( x 。,k ) 为对应模型的第i 个观测令y = ( h ,碥) ,x = ( x ,x 。) 不 火一般性,不妨设x 为中心化令n f 为由x 的列向量所张成的线性空间,我们的意图 是,通过最小化】到n f 上的一类距离来求得未知参数口的估计对y 到n ,上的距离可 有多种定义,如果定义为欧氏距离,则上述问题即为求卢的最小二乘估计;这里我们采用 h e t t m a n s p e r g e t 。( 1 9 9 8 ) 里的论述,以下式表示距离( 见【9 】,1 4 6 - 1 4 7 ) : 删,= n ( r ( 吨) ) t = 1 其中r ( 地) 表示仇在( ”,”。) 中的秩;a ( i ) 是一列非降的分值,由某个函数妒所产生( 通 常有a ( i ) = 妒( + 1 ) ) 等形式) 且a ( i ) = 0 ,其中分值函数妒( “) 为某个定义在( 0 ,1 ) 上 平方可积函数。 定义d ,( 卢) = d ,0 1 , n f ) = i i l ,一x f l l ,于是卢的估计即为 口= a r g m i n d 9 ( fn f ) = a r g m i n l l y x 硎* 最小化d 。( 口) 可通过求解在p 方向上的梯度为零得到,故p 的估计卢亦是如下方程的解, n v d p ( 卢) = 一x l a ( r ( y x 卢) ) = 一x i n ( r ( h 一8 x i ) ) = 0 t = 1 其中n ( 几( y x s ) ) = ( n ( r ( m 一x 1 ) ) ,o ( r ( m 。一墨,) ) ) 注意到这一估计所考察的距 离和求解口所得的梯度方程事实上都可看作是由模型残差的秩所构成的线性秩统计量,因 此也叫作基于残差秩的估计( r a n ke s t i m a t i o n ) 2 3 截断数据a f t 模型基于残差秩的参数估计 如前文所言截断数据场合下a f t 模型中参数估计得到了广泛研究,基于残差秩估计参 数的想法也被应用于截断数据场合。利用计数过程及鞅理论,r i t o v ( 1 9 9 0 ) 、t s i a t i s ( 1 9 9 0 ) 、 9 l a i y i n g ( 1 9 9 1 a ,b ) 、y i n g ( 1 9 9 3 ) 和j i n ,l i n ,w e i y i n g ( 2 0 0 2 ) 等学者对p r e n t , i c e ( 1 9 7 8 ) 提出的秩估计的方法作了丰富和发展特别的,j i n ,l i n ,w e i y i n g ( 2 0 0 2 ) 在概括了该领 域的研究的同时,还提出利用线性规划方法求解这一类估计问题,并采用一类重抽样方法用 以获得该估计的渐近分布,克服了截断数据场合秩估计方法在计算上的复杂性这些细致和 完善的工作,无疑为本文解决部分线性模型中的参数估计问题提供了有益的启发和借鉴的 嵌据 关于截断数据a f t 模型基于残差秩的参数估计可以叙述如下( 见j i n ,l i n ,w e i y i n g 2 0 0 2 ) ,设a f t 模型为 l o g 正= 口x :+ ,i = 1 ,2 ,” 其中瓦为第i 个观测的失效时问,x 。为相对应的p 维自变量,口为p 维待估参数 e 。( i = 1 ,n ) 为独立的随机误差,具有某未知分布令0 是噩的截断时刻。g 与正关 于x 。条件独立,于是观测所得数据为( 或,。x 。) ,其中疵= m i n ( t i ,g ) ,a 。= 1 ( 以c ) 令e 。( 口) = l o g t i 一口x t ,m ( 卢,) = 1 ( 。,( 口) t ) ;记 则( 口,) = n _ 1 m ( 口,) ,s 1 ( 卢,) = n 一1 m ( 卢,t ) 噩, i = 1i = 1 此时一类基于残差秩的的加权估计式形如 n u s ( f 1 ) = 。o 归,e ,( 卢) ) ( x 一贾( 口,e 。( 卢) ) ) , t = l 而相应口的估计即被定义为( 口) = 0 的解;其中贾( 口,t ) = s ( 1 ( 口,t ) s o ) ( 卢,t ) ,是某 个依赖于数据( d a t a - d e p e n d e n t ) 并满足适当条件的权函数j i n ,l i n ,w e i y i n g ( 2 0 0 2 ) 还 指出,常见的廿的两种取法= 1 和= s ( ,所得的( 卢) 分别对应了l o g - r a n k ( m a n t e l , 1 9 6 6 ) 和g e h a n ( 1 9 6 5 ) 统计量两种形式特别当= s ( o ) 时,( 口) 具有如下形式, nn ( 2 1 ) u ( f 1 ) = n 一1 i ( x l x j ) l 州雕q ( 口) ) i = 1d = l 在下文中,我们将借鉴j i n ,l i n ,w e i y i n g ( 2 0 0 2 ) 在= s ( o ) 时,对形如g e h a n 统计 世的( 21 ) 的处理方法。稍后将会看到,这一形式的统计量形式较为简洁,有利于我们在部 分线性模型下的讨论 1 0 第三章分层处理的方法及相关结果 在大致了解基于截断数据场合基于残差秩的估计方法后,现在我们可以转入截断数据 场合部分线性模型的讨论 ( 3 1 ) 3 1 模型定义 类似于模型( 11 ) ,设随机变量( p ,x ,we ) 服从部分线性模型 y = x + h ( w ) + e 其中y 是响应变量,x 和分别是p 维和1 维的自变量,e 是与( x ,) 独立的随机误 差;p 是p 维的待估参数,a ( ) 是某个光滑的函数,称作“讨厌”参数( n u i s a n c ep a r a m e t e r ) 令c 为截断变鳝,g 与】7 关于( x ,w ) 条件独立 令( k ,x 。,q ,a ) ,t = 1 ,n 为来自( y ,x ,啊e ,c ) 的独立同分布随机变量由于截 断的存在,我们实际得到样本观测为( 】,x i ,d 。) ,i = 1 ,n ,其中丑= 1 f 豇g ) ,k = r a i n ( k ,g ) 我们希望尽量降低干扰而对感兴趣的参数口做出准确的估计 对于上述模型一个特殊的情形是 ( ) 为常数时,模型( 3 1 ) 即退化为线性回归模型 一般的,若令t = e y ,则原模型也可看作t 关于x 和w 所形成的a f t 模型这一类模 型的应用常见于医疗试验和生物统计领域,比如在分析某类药剂疗效的试验中,我们所感兴 趣的因子( 如药剂量,病情、病期等) 可作模型( 3 1 ) 的参数部分x 来研究而一些混入模 型的因子( 如年龄、性别等) 带来的干扰则可作模型中非参数部分h ( w ) 考虑 3 2分层方法及目标函数求解 考虑模型( 3 1 ) ,我们要对口作估i - i ;由于“讨厌”参数,。( ) 的存在带来一定的干扰。 别此我们提出采用一种分层的方法来降低h ( t ) 的影响具体来说,即将所有的n 个观测归 入个组中,以,k 。;使得对1 k f ,m ;) ) 钟 v ( t ) o f ( ) ) 十f f ( o i p ( c t l w ) d t , 其中e = 0 一晶x 一 ( 1 4 ,) ,( - ) 和f ( ) 分别为f 的密度函数和分布函数。b 。2 = 6 6 上述命题建立了卢的渐近正态性,对于导出该性质所假定的条件1 - 5 ,可以作一些简略 的注释。 条件2 规定 ( ) 必须比较光滑,结合所用的分层方法,这一条件保证了分层处理的有 效性。 条件3 对分层的具体实施作了一些限制,不难看出,这些限制事实上是非常宽松的首 先它允许w 可以是离散的,或以属性数据的形式出现;这时的分层即遏化到种传统的形 式,取值相同的或者相同属性的观测被归入同组;对于连续形的,条件3 要求组 内w 波动不要太大而限制在o ( n 1 2 ) ,这也是较为温和的加以该限制的动机是使得我们 在对口作信计韵过程中可以忽略由分层而日i 起的偏差一一如果分层带来幻偏差同估计参数 过程中的偏差相当或无法忽略时这样的分层是无效或者有损原模型的 条件4 的引入是为了得到l 和z 的表达以便进一步分析口的渐近方差;若去除该限 制,则所得渐近正态性仍然成立,但渐近方差可能会发散 3 工重抽样及置信区间的构造 3 4 1 重抽样方法 上文中我们已对模型( 3 ,1 ) 中参数的估计卢的渐近正态性作了叙述,尽管我们从理论上得 到了渐近方差的表达,但要准确信爿出该渐近方差仍有较大难度为克服估计中出观的计算 上的复杂性,我们考虑利用重抽样技术来得到渐近方差的数值估计,并近似得到n t 肛( g 一岛) 的渐近分布 】3 定义新的目标函数 k ” ( 3 4 ) l + ( 卢) = 民 k 一巧一一玛) j 一6 = 1i , j e j k 其中矗,( i = 1 ,n ) 是独立同分布的正随机变量具有 i n 的均值和方差( 均为1 ) ,e ( = ”o r ( = 1 ;6 同时也与( m ,置,眦,尻) ,i = 1 , 独立新定义的目标函数( 3 4 ) 实际 上是在原目标函数( 3 3 ) 上施加了一系列扰动变量矗( i = 1 ,n ) 容易看到,求解r ( 卢) 最小化与前文中求解l ( f 1 ) 最小化是类似的也可通过线性规划及软件来实现令声为使 l ( p ) 最小化的解,则我们可以得到,给定m ,x i ,w i ,也) ,i = 1 ,虬条件分布 f 3 5 ) n 1 2 ( 声4 一口) _ n ( o ,e i l l ( e :) 一1 ) , 即n 1 2 ( 口一声) 与n 1 2 ( 卢一3 0 ) 有相同的渐近分布 受到上述结果的启发,我们不难得出一种重抽样的方法: 固定实际观测( k ,墨暇,民) ,i = 1 ,n 不变,我们可通过重复产生多次的随机样本 ( f 矗) ,得到n 1 2 ( 口+ 声) 的分布即可用来近似n 1 2 ( 口一3 0 ) 的分布,相应方差的估计也 可用n 1 2 ( 口+ 一声) 的经验方差代替 这一类重抽样技术由r a o z h a o ( 1 9 9 2 ) ,p a r z e n ,w e i y i n g ( 1 9 9 4 ) ,j i n ,y i n g w e i ( 2 0 0 1 ) 和j i n ,l i n ,w e i y i n g ( 2 0 0 2 ) 等学者作了细致研究,在诸多场合的应用中被证 明是准确和有效的上文所采用的重抽样方法即是j i n ,l i n ,w e i y i n g ( 2 0 0 2 ) 基于a f t 模 型提出的重抽样技术在部分线性模型情形下的继承;( 3 5 ) 的得出也是j i n ,l i n ,w c i y i n g ( 2 0 0 2 ) 处理类似情况所得结果的延伸,这里我们略去了证明尽管如此,在稍后的数值模拟 部分中我们将实证( 3 5 ) 这一结果的准确性 3 4 2 置信区域的构造 通过上文所采用的重抽样方法来近似7 , 1 2 ( 声一岛) 的分布相应的置信水平的定义问题 很自然地引起我们的注意。 在一维的情形下,问题比较简单,尽管还存在其他形式的疑信区间的构造。但总的来说 利用重抽样得到n - :( 声一芦) 的经验分布来构造w a l d 类型置信区间的办法令人信服一一形 式简洁而易于理解这一类置信区间的构造如下: 任给置信水平0 o z 1 ,令为条件分布n i 2 ( 口+ 一口) 的a 分位数,则卢的水平为 1 一d 的置信区闻即由下式所定义 p ( q 0 5 核函数( ) 对称、连续、有界,且满足如下条件: 0 y2rk(y)dy 0 ,有忙1 扎+ 5 o o ,及 ( i + 1 ) 4 7 2 1 晰) 】6 洲) 0 若有i i 詹n , d t l l o o 。b 是任意正整数,则有 刊 1 i ;+ i 1 = 1 一;,则 c o v ( x ,y ) i 2 p ( 2 。) 1 9 i l x l 。i l y l l , 其中。是( ( x t ,k ) ) 的混合系数 证明3 见b o s q ( 1 9 9 8 ) 吣一、 0 引理4 ( b o c h n e t 引理j 假设k ( u ) 和9 ( 。) 是b o l e l 可测函数满足条件t n ,( ) 有界;。,:| ( “) i d “ 0 ) ,于是上式有以下分解: e 。( :t t 舯础) 2 ( 41 4 ) = o , t l n e ,c o v x ( y t m ( x ) ,k m ( x s ) ) 叫s d s 出 + 。r 【i 。o ,t l :n 。 c o v x ( y t r n ( x t ) ,k r n ( x s ) ) ”t ”- d s d 其中c o y x ( ,- ) 表示条件协方差 对( 4 1 4 ) 的第一项, c o v x ( k m ( z ) ,k m ( x 。) ) 一d s d t d o ,t l2 n e r c 0 , t :a e t l ”t w 。i a s 出 ( 4 1 5 ) 其中 c s m ( z ) h - r 2 + lz 7h 圳 _ 州z ) d s + c 札- ( z ) h - r 2 + 2 上7 卜。i 知。,( z ) d s f i t , s , 0 = 击厂”( 竿础, 如= 赤厂”i 半瞰宰) d f 令l p ( s ) = 菇。o ( z ) 一e 白柙( z ) ,利用h i i l d e r 不等式可得 e t 1 w , i 妒( s ) d s ) 4 e ( z 7 w :a s ) 2 ( z 7 扩c s ,“s ) 2 记口,“;d s = a r ,眉( s ) d s = b t 对a t ,以w 。= ( ! j ) ( s 即一扛一x s ) s t ,】代入 利用求口w 。d s 的方法可得 对b y ,注意到 e c 且;,z = e c b ;,= t 4 e ( z 7 ;妒2c s ,a s ) 4 利用均匀分布u ( o , ) 上的期望及j e n s e n 不等式可得 e b ;,= t 4 ef z 7 ;妒2c s ,出 叫e z 7 犰) 出 卅1 7 咖灿 1 d o+l 7 3 盯 sd 2 , 山 r r ,h 、 再由引理2 得到ec l o s ( s ) = o ( h 机) ,从而e ( 目 ) 2 = o ( t 4 h 4 2 ) ,根据( 4 2 ) 可写作b = 0 2 ( f 2 h 2 ”,) ,所以 e ( z 7t 以a s ) 2 ( z t 妒2c s ,a s ) 2 = f a 姊= 。c t 8 护n + “, 于是 ,t l 圳。i _ p ( s ) d 8 = 0 4 ( t 2 i t ( n + 7 2 ) 注意到r 2 1 时e 知 o ( z ) = o ( 1 ) ,因此( 4 i s ) 第一项 s ”( z ) 一+ 1 1 w d ,t 。o ( z ) d s :帅( 。) 一+ ,7 妒( 。) d f 7 e b 扫) a s = 帅( 。) 扩州o1 w , i 妒( s ) d 8 + 8 t , 2 h - r 2 + l 上e 血印扫 = 0 2 ( t 3 h o r , - 2 ) 2 ) + 0 2 ( t 3 h s - r a ) 类似的做法应用于( 4 1 5 ) 第二项。我们得到与第一项相同的结果 s 丁1 ( 卅 一r :+ 2 t l w s i 矗而1 扛) d s = 0 2 ( t 3 h ( 1 5 - r :) 2 ) + 0 2 ( r 3 8 一n ) 。u 因此, c o y x ( k m ( x t ) ,k m ( x 。) ) t d s d t j 【o 。t 】2 n e r ( 4 1 6 ) = d 2 ( t 3 ( 1 5 一功) ,2 ) + 0 2 ( t 3 h 8 7 2 ) 接下来我们要考虑( 41 4 ) 分解的第二项,利用引理3 ( d a v y d o v 不等式) ,对p 0 w g o u m - m 似也* m ( 托”妣嘶叫i ,【o ,州2 n f i c i d ( t s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论