(概率论与数理统计专业论文)删失数据下的变系数模型的回归分析.pdf_第1页
(概率论与数理统计专业论文)删失数据下的变系数模型的回归分析.pdf_第2页
(概率论与数理统计专业论文)删失数据下的变系数模型的回归分析.pdf_第3页
(概率论与数理统计专业论文)删失数据下的变系数模型的回归分析.pdf_第4页
(概率论与数理统计专业论文)删失数据下的变系数模型的回归分析.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(概率论与数理统计专业论文)删失数据下的变系数模型的回归分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 非参数回归作为现代统计分析的主要方法之一,它对模型的假设很 少,其最主要的优点就是模型具有稳健陛,因此得到广泛的应用非参数 回归方法本质上是局部估计,当回归变量x 为一维变量时,非参数回归 函数用这些方法一般都能得到很好的估计但当回归变量是多维时,由于 x 的局部邻域包含很少的数据,用这些估计方法,很难估计出一般的多元 非参数回归函数,人们把这种现象成为维数祸根( t h ec u r s eo fd i m e n s i o n ) 可是实际中我们经常遇到的是高维数据,因此,高维数据分析是统计学 家一直关心的问题而变系数模型( v a r y i n g - c o e f f i c i e n tm o d e l s ) 是解决维 数祸根问题的一个有效方法 本文考虑变系数模型 p y = 芝二( u ) + s = ,( u ) x + , ( 掌) 5 = 1 o ( ) = ( a l ( ) ,n p ( ) ) tn z ( u ) ,唧( t ) 是未知的需要估计的光滑函数,y 是 实值变量,x = ( 溉,k ) r 是随机向量,u 是随机变量,其密度函数为 ,( ) ,s 是一随机误差,且e ( e i 以x ) = 0 ,y a r ( l 阢x ) = c r 2 ( 阢x ) 然而在现实问题中,如可靠寿命实验、医药追踪及生存分析等领域 的研究中y 常常因为删失而不能被直接观测到设c 表示截断随机变 量,y 与c 在给定u 和x 条件下是独立随机变量,记t = r a i n ( y , c ) ,正= 砸n ,c ) ,也= ,( 玑c i ) ( i = 1 ,2 ,n ) ,其中h ) 表示某事件的示性函 数,当没有出现删失时6 = 1 ,当出现删失时6 = 0 我们只能观测到 ( 阢,x ,正,盈) ;i = 1 ,礼) 由于响应变量存在删失,不能直接运用完全数 据下的统计方法,因此需要对删失数据进行变换 本文对删失数据采用的变换方法是c l a s s - k 方法即把数据点( 配x ,z6 ) t 变换成( 配x ,y + ) 其中 y = 砸l ( 仉x ,t ) + ( 1 一j ) 2 ( 配x ,t ) 妒1 ( ) 和九( ) 为变换函数,且e w i 配x ) = m ( y l u , x ) 本文主要采用局部多项式回归这一非参数方法及c l a s s - k 方法对模型 ( 幸) 在数据删失情况下进行回归分析对模型( 水) 的系数函数光滑程度相 同和不同时的情况分别进行详细讨论: ( 一) 当系数函数光滑程度相同时,用局部线性函数对其进行估 计,并证明了其渐近偏差、渐近方差和渐近正态性 ( 二) 当系数函数光滑程度不相同时,一般的估计方法就不能达到 最优收敛速度,于是就对光滑程度较高的系数函数用局部m 次多项式进 行估计,而对其它光滑程度较低的用局部线性函数对其进行估计并证 明了收敛速度、渐近偏差和渐近方差 关键词:变系数模型,删失,局部多项式回归,c l a s s - k 方法,最优收敛 速度,渐近偏差,渐近方差,渐近正态性 i i a b s t r a c t t h en o n p a r a m e t r i cr e g r e s s i o na n a l y s i si so n eo ft h el e a d i n gm e t h o d so ft h er o o d - e r ns t a t i s t i c a la n a l y s i s ,i tn e e l :i sf e wh y p o t h e s e sa n di t sm a i na d v a n t a g ei st ob ev e r y r o b u s t s oi ti sw i d e l ya p p l i e d t h ee s s e n c eo ft h et h en o n p a r a m e t r i cr e g r e s s i o n a n a l y s i sm e t h o d si sl o c a le s t i m a t o ro rl o c a ls m o o t h i n gt e c h n i q u e 。i ng e n e r a l ,t h en o n - p a r a m e t r i cr e g r e s s i o nf u n c t i o ni s w e l le s t i m a t e db yt h en o n p a r a m e t r i cr e g r e s s i o n a n a l y s i sm e t h o d sw h e nt h ev a r i a b l ex i so n ed i m e n s i o n b u tt h em u l t i v a r i a b l en o n - p a r a m e t r i cr e g r e s s i o nc o u l dn o tb ew e l le s t i m a t e db yt h el o c a le s t i m a t o r sb e c a u s e t h e r ei so n l yal i t t l ed a t ai nt h el o c a lf i e l d so ft h eh i g hd i m e n s i o nr e g r e s s i o nv a r i a b l e x t h i sp h e n o m e n o ni ss a i dt ob e t h ec u r s eo fd i m e n s i o n d u et oal o to ft h e h i g hd i m e n s i o nd a t ai so f t e nh a p p e n e d ,t h ea n a l y s i so fh i g hd i m e n s i o nd a t ai so n eo f t h ea s p e c t si nw h i c hal o to fs t a t i s t i c i a n sa r ei n t e r e s t e d h o w e v e r ,v a r y i n g - c o e f f i c i e n t m o d e l si sae f f e c t i v em e t h o dt os o l v et h ep r o b l e mo f t h ec u r s eo fd i m e n s i o n i nt h i sp a p e r ,w ec o n s i d e rv a r y i n g - c o e f f i c i e n tm o d e l si nt h i sf o r m p y = a a u ) x ,+ = a t ( u ) x + e , ( 牵) j = 1 w h e r en ( ) = ( a l ( ) ,唧( ) ) ta l ( a ) ,n p ( t ) i su n s p e c i f i e ds m o o t h i n gf u n c t i o n t h a tn e e d st oe s t i m a t e ,yi sr e a lv a r i a b l e ,x = ( 墨,而) ? i sr a n d o mv e t o r ,ui s r a n d o mv a r i a b l e ,a n di t sd e n s i t yf u n c t i o ni s ,( 越) ,i sr a n d o me r r o r ,a n de ( e i 识x ) 一 0 ,v a r ( e l u , x ) 一0 - 2 ( 阢x ) h o w e v e r ,i nt h er e a lp r o b l e m s ,f o re x a m p l e ,i nt h ef i e l d so fr e l i a b l el i f e s p a ne x - p e r i m e n t ,m e d i c i n et r a c k ,s u r v i v a la n a l y s i sa n ds oo n ,yc a n n o tb eo b s e r v e db e c a u s e i ti sc e n s o r e d 1 e tcd e n o t e st h ec e n s o r i n gr a n d o mv a r i a b l e ,ya n dca r ei n d e p e n d e n t r a n d o mv a r i a b l eu n d e rt h ec o n d i t i o nt h a tua n dxa r eg i v e n 。t = m i n ( y , e ) ,五= m i 铊( 坎,c ) ,蠡= j ( 臻c ) g = l ,2 ,n ) ,w h e r ej ( ) d e n o t e st h es i g nf u n c t i o no f ae v e n t ,i fyi sn o tc e n s o r e d ,t h e n6 = 1 ,i f yi sc e n s o r e d ,t h e n6 = 0 w ec a no n l y i l l o b s e r v e ( 磁,鼍,露,最) ;i = 1 ,嚣,。b e c a u s er e s p o n d i n gv a r i a b l ea r ec e n s o r e d ,w e c a nn o tu s et h em e t h o d sd i r e c t l yw h i c hw eu s eo nf u l ld a t a s ow es h o u l dt r a n s f o r m t h ec e n s o r e dd a t a i nt h i sp a p e r ,c l a s s km e t h o di su s e dt ot r a n s f o r md a t a w et r a n s f o r md a t a ( 配x ,艿) t od a t a ( 配x ,y ) ,w h e r e y + = 6 妒l ( e x ,t ) 十( 1 一艿) 也( 配x ,r ) 妒l ( ) a n d 锄( - - ) a r et r a n s f o r m a t i o nf u n c t i o n s ,a n de ( y i u , x ) = 西( y | 戤x ) 。 融t h i sp a p e r ,t h ee s t i m a t i o no fm o d e l ( , ) w i t hc e n s o r e dd a t ai sc o n s t r u c t e d b yl o c a lp o l y n o m i a lr e g r e s s i o na n dc l a s s - km e t h o d a n dw er e s p e c t i v e l yd i s c u s s m o d e l ( , ) w h o s ed i f f e r e n tc o e f f i c i e n tf u n c t i o n sa d m i tt h es a m ed e g r e eo fs m o o t h n e s s a n dd i f f e r e n td e g r e e so fs m o o t h n e s si nd e t a i l f i r s t ,i fd i f f e r e n tc o e f f i c i e n tf u n c t i o n so fm o d e l ( , ) h a v et h es a n l ed e g r e eo fs m o o t h - n p _ s 8 ,w ee s t i m a t em o d e l ( , ) b yl o c a ll i n e a rf u n c t i o n a s y m p t o t i cb i a sa n dv a r i a n c e a r eo b t a i n e d ,a n da s y m p t o t i cn o r m a l i t yi sa l s oe s t a b l i s h e d s e c o n d ,d i f f e r e n tc o e f f i c i e n tf u n c t i o n so fm o d e l ( , ) a d m i td i f f e r e n td e g r e e so f s m o o t h n e s s i fw eu s eo r d i n a r ye s t i m a t i o nm e t h o d st oe s t i m a t ei t ,w ee a r ln o ta c h i e v e t h eo p t i m a lr a t eo fc o n v e r g e n c e 。t h e nw ee s t i m a t ec o e f f i c i e n tf u n c t i o n sw i t hh i g h e r d e g r e eo fs m o o t h n e s sb yl o c a lmd e g r e ep o l y n o m i a l a n dw ee s t i m a t eo t h e r sb yl o c a l l i n e a rf u n c t i o n t h eo p t i m a lr a t eo fc o n v e r g e n c ec a r lb ea c h i e v e da n d a s y m p t o t i cb i a s m u dv a r i a n c ea r ea l lo b t a i n e d k e y w o r d s :v a r y i n g - c o e f f i c i e n tm o d e l s ,c e n s o r i n g ,l o c a lp o l y n o m i a lr e g r e s s i o n ,c l a s s - k m e t h o d ,o p t i m a lr a t eo fc o n v e r g e n c e ,a s y m p t o t i cb i a s ,a s y m p t o t i cv a r i a n c e ,a s y m p - t o t i cn o r m a l i t y 湖南师范大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进 行研究所取得的研究成果除了文中特别加以标注引用的内容外,本论文 不包含任何其他个人或集体已经发表或撰写的成果作品对本文的研究 做出重要贡献的个人和集体,均已在文中以明确方式标明本人完全意识 到本声明的法律后果由本人承担 学位论文作者签名王占缉 膦咖分日 湖南师范大学学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅本人授权湖南师范大学可以将学位论文的全部或部分 内容编人有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保 存和汇编本学位论文 本学位论文属于 1 、保密口,在年解密后适用本授权书 2 、不保密口 ( 请在以上相应方框内打q 、井) 作者签名:王占祥 新鹕2 川砖 日期彩卅月f 日 日期:守艿月卿 删失数据下的变系数模型的回归分析 1 绪论 回归分析就是探求随机变量y 与另一个变量z 之间的关系,参数回 归假定回归方程e ( 可l z ) = ,( z ;p ) 的函数形式已知,p 为未知的参数,即模 型为 y i = ,( 鼢;p ) + 鼠, 其中e 矗= 0 ,v a r e = a 2 为随机误差,由数据( 玑,戤) 翟。估计未知的参数p 及其推断,这为参数回归当回归模型f ( x ;z ) 为真正的模型或非常接近 真正的模型时,参数回归具有计算量小,估计效率高,需要的样本容量小 等特点由于参数模型对回归结构假设比较严格,当假设不成立时就会 产生很大的模型偏差,甚至导致错误的结论而实际中人们往往很难对 模型做出具体的假设,从统计学的观点,许多统计学工作者认为实际中 可能根本不存在真正的模型,很可能所有的模型都是错的但模型有好 坏之分,人们只是寻找一个较好的模型去逼近描述数据,如何建立一个 好的统计模型一直是统计学家追求的努力目标 随着当今计算技术和计算能力的飞速发展,许许多多复杂计算得以 实现,允许人们对客观总体的描述提出了更高的要求,为了减少参数回 归的模型偏差,统计学家提出了一个假设更宽松更自由的模型非参 数回归模型假定回归函数f ( x ) = e ( y x ) 属于一个广泛的函数类,如光 滑函数,模型为 玑= ,( 以) + 旬,( 卜1 ) 其中f ( x ) ,= 具有某种属性的函数类) ,e e i = 0 ,v a r 6 i = 扫2 ,e 1 ,s n 互不相关 非参数回归分析的基本目标就是基于数据( y i ,x i ) 坠。估计非参数回归 函数f ( x ) 及其推断。非参数方法对模型的结构假设很少,尽量让数据为 - 】 硕士学位论文 自己说话( n o n p a r a m e t e rm e t h o d s l e tt h ed a t as p e a kf o rt h e m s e l v e s ) ,因此非参 数的方法具有稳健( r o b u s t ) 的优点,但相对于参数模型,非参数模型需要 的样本容量较大,计算更复杂可如今人们常常面临大量的数据,并且飞 速发展的计算技术,以使昔日认为不可能的计算变得容易,因此非参数 方法近来受到人们的普遍关注 1 1 光滑方法 光滑是统计学中非常本质的概念,广义上讲,光滑就是从数据中提取 系统的本质特征,而摒弃杂乱的无序信息( t om a k es y s t e m a t i cf e a t u r e so ft h e d a t am o r ea p p a r e n ta n dt or e m o v ed a t av a r i a b i l i t yt h a th a sn oa s s i g n a b l ec a u s e ) 常见的光滑方法有核估计,局部多项式估计,光滑样条估计,b 样条估计 等,下面我们简单介绍一下常见的几个光滑方法 ( 1 1 1 ) 核光滑( k e r n e ls m o o t h i n g ) 核估计有许多不同的形式,下面介绍的是n a d a r a y - w a s t o n 核估计( n a d a - r a y ( 1 9 6 4 ) 1 a n dw a s t o n ( 1 9 6 4 ) 2 ) 模型( 1 1 ) 中回归函数,( z ) 的n w 核估计 定义为 咒垆黼,( i - 2 ) 产( z ) = 笔冀鬻, 其中k ( ) 为核函数,一般的核函数为对称的,具有紧支撑的密度函数( 1 _ 2 ) 式中的h 为大于0 的常数,称为窗宽( w i n d o ww i d t h ) 在核估计中,不同 核函数对核估计的效果影响不是很大,而窗宽h 在估计的偏差与方差之 间起平衡的作用,控制着核估计产( z ) 的光滑程度- ,因此窗宽的选择是至 关重要的 ( 1 1 2 ) 局部多项式估计( l o c a lp l o y n o m i a le s t i m a t o r s ( f a na n dg i j b e l ( 1 9 9 6 ) ) 3 ) f f 果模型( 1 - 1 ) 中回归函数( x ) 具有d 阶可导,则( x ) 在z 的邻域可 2 - 删失数据下的变系数模型的回归分析 局部展开 m ) 训卅,( 1 恸u 刊+ + 掣( u 叫d 设 啪,矧2 ( 玑一岛咧x - - x i ) 一仇( x - - x i ) d ) 2 k ( 警) , 其中k ( ) 为核函数,h 0 为常数,称为窗宽令 叉乙= ( :三二三;:二二三:) , 矾瑚叼( k ( 罕) ,k ( 罕) ) , 最小化d 愉,伟) 得 矽= ( 恐睨恐) 一1 霹帆y 设e l 表示第z 个元素为l ,其余元素均为0 的d + l 维列向量,则,( z ) 的 q 阶导数,( a ) 的估计为 弘( z ) = q ! e 矗。p 特别地的f ( x ) 局部多项式估计为 l p ( x ) = e f p 当,( z ) 局部0 阶展开时( d = o ) ,所得到的局部多项式估计即为n w 的核 估计( 卜2 ) ,常用的局部多项式估计为局部线性估计,局部线性估计修正 了n w 核估计的边界问题,比n w 核估计有更好的边界估计效果,详细 的局部多项式估计及其性质可参考文献( f a na n dg i j b e 1 ( 1 9 9 6 ) 3 ) ( 1 1 3 ) 光滑样条( s m o o t h i n gs p l i n e ) ( g r e e na n ds i l v e r m a n ,1 9 9 4 1 4 ) 3 。l , 硕士学位论文 设【o ,1 】- g ( x ) :9 ( z ) 连续两阶可导,且詹 9 ,( z ) 】2 o o ) ,设( 玑,甄) 各。 为来自于模型( 1 1 ) 的数据,任意的f 【o ,1 】,设 踟) 2 寺善愀吖( 瓤) ) 2 上m ) 】2 d x ,( 1 - 3 ) 其中a 为常数,称为惩罚系数模型( i i ) 中f ( x ) 的光滑样条估计为 ,唧( z ) = a r g m i n f e w 2 o ,1 】风( n 上式第一项n - 1 器。( 歇一f ( x 。) ) 2 可以作为函数g ( x ) 拟合数据的度量而第 二项a 爿1 【,1 ( z ) 】2 d x 度量函数光滑的程度,常数a 反映了拟合数据和待估 函数光滑程度之间的相对重要性,入越小,意味着拟合更重要,入越大,意 味着光滑更重要,当a = 0 时,产印( 甄) = 纨( i = 1 ,n ) 估出的函数经过每 一个数据点;当入叶o 。时,s 肇( z ) 是一条直线,相当于线性回归因此, 光滑样条估计,唧( z ) 的光滑程度随着入在( 0 ,o o ) 之间变化而变化,入起 着光滑参数的作用 事实上,可以证明光滑样条估计,唧( z ) 是以数据点,z n 为节点的 自然立方样条函数( n a t u r a lc u b i cs p l i n e ) 当观察数据很多的时候,待估向 量,= ( f ( x ,) ,( z n ) ) 7 维数明显增多,而实际中,若用立方样条函数来 估计回归函数,常常不需要那么多节点r u p p e r t ,d ( 2 0 0 2 ) 1 s 1 和e i l e r s p h c a n dm a r x ,b d ( 1 9 9 6 ) 6 】提出用惩罚样条( p e n a l i z e ds p l i n e ) 来估计回归函数 具体有关惩罚样条估计的方法及性质可参看上述文献 ( 1 1 4 ) b 样条估计 设z = ( z l ,z k ) r ,0 z 1 c i 纱= t | ,x = z ) 由于我们是根据变换后的数据( ux ,y ) 进行推断的,因此变换函数 咖。和也应该满足一些条件,其中一个基本条件是满足式( 2 - 3 ) ,即无偏变 换例如可以选取b u c k l e y - j a m e s 变换 l ( 牡,z ,y ) = y ,也( u ,z ,y ) = e ( y i y ! ,u = t ,x = z ) ,( 2 - 4 ) 易知式( 1 ) 等价于。 e ( 痧1 ( x ,y ) g ( y i u , x ) + 也( ux ,c ) t ( c l v , x ) ) i 以x = e ( y i u , x ) ,( 2 - 5 ) 为了简单起见,假定召( 1 u ,z ) 连续而且我们处理的随机变量都是非负的, 这样式( 2 _ 5 ) 可表示为对所有铭,z 和y 都有 f + 鼬似 【妒l ( u ,z ,y ) 召c v l ,z ) 一也( t ,z ,c ) 召( c i u ,z ) 一v l 疗( v l - ,z ) = 0 , ( 2 - 6 ) ,0 ,0 根据式( 2 娟) 可知变换函数。和也应该满足:对所有u ,z 和y 都有 ;妒1 ( u ,z ,v ) c ( y l 仳,z ) 一也( t ,z ,c ) 吞( c i u ,z ) 一y = 0 , ( 2 - 7 ) 显然变换函数,和如仅仅依赖于条件删失分布函数因此这类变换相 对来说容易实施,特别在条件删失分布函数与协变量无关时,下面讨论 某些简单的变换 设也( t ,z ,y ) = 咖l ( t ,z ,可) + 妒( u ,z ,y ) ,对所有的t ,。都有妒( 乱,$ ,0 ) = 0 ,易知 式( 2 7 ) 可表示为 龇训) = z 可矿k l u , x ) d t + z 掣咖,州) 矿川u 痢,( 2 - 8 ) 锄( t ,z ,可) :厂挈否一1 ( t l u , x ) d t + 厂可妒( u , x , t ) o - 1 ( t l u , x ) d o ( t l u , x ) + 妒( u ,z ,) , ,0,o ( 2 - 9 ) 删失数据下的变系数模型的回归分析 通过繁杂的直接计算可以得到条件方差 口2 ( u ,o ) = v a r ( y + i r = t t ,x = z ) = 口2 ( u ,z ) + o + 2 o yz ”g ( s i u ,。) 召一1 ( s i u ,。) d s d t , + 【2 0 一v ) v ( i s ,z , ) 虿1 ( l u ,z ) 一l ,0 2 ( u ,z ,v ) d 露c v l u ,x ) d f ( y u ,z ) ( 2 - 1 0 ) 磊其中f ( i t l ,。) 和g ( l u ,z ) 分别为随机变量y 和c 在给定u = t ,x = z 下的 条件分布函数,选取不同的( ) 将会得到不同的变换 2 2 估计 现根据变换后的数据【( 阢,咒,。) ;i = 1 ,佗 ,来估计真实的系数函数 ( ) o = 1 ,p ) ,对每个固定点让,在u 的某个邻域作t a y l o r 展开,取一 阶近似 a j ( z ) a j ( u ) + ( z 一牡) 三a s + ( 名一札) , ( 2 - 1 1 ) 其中z 在u 的邻域这样从局部来说,求解( ) o = 1 ,p ) 等价于求解 一阶近似回归线的截距( ) 0 = 1 ,p ) ,局部邻域由核函数k 窗宽k 确定为了避免数据点稀疏性引起的问题,可选取能够自适应于数据点 设计的窗宽这里我们选用阶自适应可变窗宽,并假设观测值已按以 值大小排序 k ( t i ) = ( 仉+ 量一阢一k ) 2 ,( 2 - 1 2 ) 其中k 是给定的一个正整数,它是一个平滑参数,可用交叉确认( c r 0 8 8 - v a l i d a t i o n ) 法选取本章在局部建模时使用相同的平滑参数k z 表示最接 近钍的设计点阢的指标注意到k 依赖n ,可记为,本章中交替使用 k 和k 根据( 2 - 1 1 ) 估计( ) d = 1 ,p ) 的问题就变为局部最小二乘法问题: - 1 7 硬壬学链论文 求a 和b 使下面式子达到最小 拜竹 e 一( + 幻( 阢一t 1 ) ) 2 坛。( 拈) ( 阢一仳) ,( 2 - 1 3 ) i = li = l 其中a = ( a 一,嘞) 2 ,矗= 渤,如) ? ,本章定义玩( ) 一( h ) ,玩( - ) 是非负的加权函数记 y = ( w ,k ) tp = ( ,b t ) t , w = d i a g ( k h k ( u ) f 玩- u ) ,蚝。( 一t i ) ) , z 是竹2 p 矩阵,它的第i 行是( 霹,似一“) 砰) ,容易求得局部最小二乘 问题( 2 - 1 3 ) 的解为 参( 簦) = ( z r w z ) 。z r w y ,( 2 - 1 4 ) 基于局部线性逼近方法,系数函数奄似j 一1 ,p ) 盼估计定义为奄( 粗) = 鳓= 蟊( 牡) ,而砖( 钍卜茸一( 钍) 是一阶导数( 珏) 的估计,其中蠡 是2 p 1 单位向量,它的第j 个位置为1 ,蟊,劫是2 p 1 单位向量,它的 第歹+ p 个位置为1 0 = 1 ,p ) 2 3 主要结果 我们首先给出由( 2 - 1 4 ) 定义的估计p ( u ) 的偏差和方差的渐近表达式 设知表示协变量u 的边缘密度。注意到由( 2 - 1 2 ) 定义的窗宽k ( 牡) 是 可变的,其中是一个平滑参数这里引用f a n 和g i j b e l s 关于可变窗宽 k ( t t ) 的一个结果作为引理。 引理2 1 假设向( ) 是正的且在紧区间f a ,6 】上连续,j i :,i _ 使得 舞_ 0 ,则对u 陋,6 1 一致有k ( 仳) = 【k n ( n f v ( u ) ) ( 1 + o p ( 1 ) ) ( 见f a n 和 g i j b e l s 定理5 ) 记h = h k ( 赶) = k ( n 知( “) ) 根据引理2 1 在必要时总可以用h 代 替k ( 弛) ,下露引入一些记号,记d = 玩,玩,砰,霹) ? ,鳓= f u j k ( u ) d u ,吻= f u j k 2 ( u ) d u ,h = d i a g ( 1 ,h ) o 易,q e ( x 固2 i t s t ) ,q 。= - 1 8 - 删失数据下的变系数模型的回归分析 e ( x 。2 盯以( 阢x ) l u = t t ) ,n ( ) = ( n :( ) ,( ) ) ? ,其中( ) 表示函数吩( ) 的 一阶导数类似定义n ”( ) ,口( ) s = ( :竺) ,s + = ( :) ,= c 而c u ,一1 c s - i s * s - 1 ,pc q 一1 q + q 一1 , 其中x 。2 = x x r ,x 刚= ( x x t ) ( x x r ) ,a p b 表示a 和b 的k r o n e c k e r 乘积,两个矩阵a b 表示a 中每个元素小于等于b 中对应的元素,易 是p 阶单位矩阵 定理2 1 假设 ( 1 ) 尼( ) 在正的且在紧区间上连续 ( 2 ) 矩阵q ,甜都是非奇异的,并且它们中的每一个元素都有界且在 点让连续 ( 3 ) a j ( ) 0 = 1 ,p ) 的前三阶导数都是有界函数,且都在点u 连续 ( 4 ) e ( x 固4 i u = ) 和e ( x 固4 盯“( 配x ) l u = ) 中的每一个元素都有限的 ( 5 ) k - ( ) 一致l i p s c h i t z 连续并且具有紧支撑 ( 6 ) 如果n _ 0 0 ,k _ 0 0 ,使得k 加_ 0 则p ( 札) 的条件偏差为 b a i s ( 3 ( u ) l d ) = 2 - * h 2 h 一1 s 一1 ( p 2 ,u 3 ) t o ,( u ) + 6 1 h 3 h 一1 s 一1 ( p 3 ,乒4 ) r o ”( t 正) + o ,( 3 ) , ( 2 - 1 5 ) 特别地,当k ( ) 是对称概率密度函数时,则有 撕s ( 删d ) 一( 旷m a ( 饥( ) ( u ) 1 6 2 他) ) h 2 + o p ( h 3 ) ,( 2 - 1 6 ) 定理2 2 假设定理2 1 的条件成立,则p ( u ) 的渐近条件方差为 v a r ( p ( u ) l d ) = ( 仉 ) 一1 h 一1 e h 一1 ( 1 + d p ( 1 ) ) ,( 2 - 1 7 ) 硬壬学位论文 特别地,当k ( ) 是对称概率密度函数时 惭却矿1 似蝴以( 魄勉沈v l 炉h p 店2 夕? ( q 一1 q + q 一1 ) ( 羔+ 吩( 1 ) ) , ( 2 - 1 8 ) 定理2 3 假设定理2 1 的条件成立,并假设对某个7 0 ,e ( i y + 1 2 l c ,= 牡,x = ) 在点( t ,茁) 连续,则有 磊 曩( 盆( 钍) 一厣) 一2 - 1 舻s 0 , 2 ,鳓) t a s ( t 1 ) 一6 - 1 m 8 1 ( p 3 ,弘4 ) r 圆7 ( 钍) + 咚( 1 1 3 ) 三n ( o ,) ,( 2 - 1 9 ) 特别地,当x ( 1 ) 是对称概率密度葫数时,则有 俪鳓u m ) 一( 纵苏? 瓣t l 、1 2 脚) 舻十d p ( ,2 ( 0 向,( 2 _ 2 0 ) 其中 嘲删q ( 0 2兹) 固e f l - l q * n - 1 , 2 4 定理的证明 定理2 重的谖明 记翰一妻( 弛一珏) 砰2 致h 釉( 矾一珏) ,l = o ,l ,2 ,因为l 拳e ( s 棒 | ) + 锦( 弼碗) , 根据定理的假设条件和引理2 1 ,容易得到 鹭s 社j ) = n e ( u i 一珏) 5 x ? 2 k h h f 杜) ( 氓一牡) = 嚣掰+ 1 允( 钍) g ( x l 矿= 铭) k 8 ) 蹴( 1 。( 1 ) ) = 珏+ 1f u ( u ) , u t q ( 1 o ( 1 疆 一2 0 _ 因此有 鼷失数据下的变系数模登的回舞分析 v a r ( s n ,1 ) 一n v a , ( v l 一牡) x p 2 k h 。o , ) w 1 一乱) ) 托烈( 班一锯) 2 。砰4 霹h ( u ) ( 妩一狂) 一礼 锹1 南( 珏) f e ( x p 4 1 秽= t ) 翟必2 。) 出( 1 + 秽( 1 ) ) 一o ( n h 2 h 1 ) 。 8 n , 1 = 托 。+ 1 知( u ) m f l ( i 。( 1 ) ) 。 汐z 一瑚舯) 邪圆呷( 1 圳1 ) ) 注意到e ( y i u , x ) = 跺la j ( u ) x j = a r ( u ) x 和式( 粥) ,由t a y l o r 展开式可 得 e ( 矽( t ) l d ) = ( z t w z ) _ 1 z t w e ( y i u , x ) = ( z r w z ) 一1 z t w e ( y i u , x ) = p4 - ( z r w z ) z t w r 其中r = r l + r 2 , 壹( 铭) ( 觇一铭) 2 蕊j j = 上 j 杰( 锃) ( 叫2 其中已在阢与t l 之间,i = 1 ,2 ,n 从而得到 ( 2 - 2 3 ) ( 2 4 ) ( 扣2 5 ) b a i s ( p ( u ) l d ) = ( z r w z ) 一1 z t r l 十( z r w z ) 一1 z r w r 2 ( 2 - 2 6 ) _ 2 l 、i,、l, l 2 2 2 一 一 2 2 ,fl、,f 、;jl0夕 u 哪 勋 胎 3 3 妨 一 一 n ; l 嘻 悠 海 w 吩 拼吩 p 傅 p 似 ,f。一 = 您 硬士学位论文 根据定理2 1 的假设条件,类似可证明 z ? w n = 壶( | | | 墨:二:i 麓: 夏二:;: 二;) = 2 - 1 h 3 f u ( u ) ( 芦2 ,h z 3 ) ? o ( f l a 8 ( 链) ) ( 1 + 唧1 ) ) ,( 拢7 ) 护w 镌= 丢( 耋篆:二:i 乏:夏二:二芝;) = 6 - 1 n h 4 知( 就) ( p 3 ,毳肛4 ) ? o ( q ( 珏) ) ( 1 + 绵( 1 ) ) , ( 2 - 2 8 ) 根据( 2 - 2 2 ) ,( 2 - 2 6 ) ,( 2 - 2 7 ) 和( 2 - 2 8 ) ,并注意到当( ) 是对称概率密度函 数时擞= 鳓= 0 ,便可以得到定理2 1 的结论。 定理( 2 2 ) 的证明 注意到v a r ( y 4 i u , x ) = 拶谨( 致x ) ,有 v a r ( 声( u ) t d ) = ( z r w z ) 一1 ( z r s + z ) ( z t w z ) ( 2 - 2 9 ) 其中 4 = d i a g ( a + 2 ( 巩,x 1 ) g n 2 h ( 巩一缸) ,0 - * 2 ( ,) 吃( 玩一雠) ) = ( 阢一t | ) 2 砰2 ( 氓,x ) 盯砣( 阢,x ) 磕。( ( 阢一t | ) ,1 = o ,1 ,2 , 粤z 一位剐 根据定理的条件,类似于定理2 。1 的证明,有 e ( a “,1 ) = 佗酬( 矾一心) x ? 2 玎吨( 巩,溉) 嚷蝴( 巩一锯) = 钆+ 1 城如( t 善) q 。( 1 + o ( 1 ) ) , ( 2 - 3 1 ) 嬲失数据下酶变系数模型薛回超分析 y 口r ( n ,1 ) 一n v a t ( u 1 一h ) 。砰2 2 ( 阢,五) 磁k ( u ) ( 阢一) 一礼h 2 1 + l 允m ) 曰( x 刚巧“( 阮,x ) l u = 班篮耳4 ( 幻出( 1 + 口( 1 ) ) = o ( n h 2 1 + i ) ,( 2 - 3 2 ) 因此得到 瓠,t e ( a 砧) + 0 p ( 币两 一礼玲+ 1 耽如( “) q 。( 1 + d p ( 1 ) ) ,( 2 - 3 3 ) 根据式( 2 - 2 2 ) 、( 2 - 2 9 ) 、( 2 _ 3 0 ) 和( 2 - 3 3 ) ,并注意到当k ( ) 是对称概率密度 函数时p 。= p s = 0 ,便可以得蓟定理2 2 的结论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论