




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 因纵向数据应用的广泛性,纵向模型一直是统计学上的热点课题特别是 国外统计学者在这方面的工作尤为突出,理论和应用上都得到了许多有用的 结果 最近,h u l l nm a n dh u a l i a n g 2 2 j 提出了随机变系数模型应用于纵向数据 的分析该模型通过随机变系数将纵向数据的时间效应和个体间的差异与相 关性同时体现出来,与以往的模型相比,该模型更加灵活在模型分析中,关 于未知参数的估计及其相关性质是至关重要的问题,本文主要对此模型中的 未知参数函数的估计及其渐近性质问题进行了讨论 首先,在估计方法上,本文提出一种新的方法,运用b 样条函数将模型逼 近为一个标准的线性混合效应模型后得到参数的估计,得到的估计称之为b 样条估计与l l m e 估计1 相比较,该估计计算简便、有良好的局部控制能 力,而且在适当的节点控制下,估计函数更加光滑,同时,文中的结果也显示 该估计具有良好的大样本性质,其收敛速度达到仇( 一;南) 其次,在估计的性质问题上,考虑到许多实际抽样中,重复观测的次数不 能达到足够大,因此,在重复观察次数有界情形下,估计具有的性质是值得 关注的本文分别给出该情形下l l m e 估计与b 样条估计的渐近性质 本文得到的主要结果如下: 1 ) 随机变截距模型中总体均值曲线与随机效应曲线的l l m e 估计; 2 ) 重复观测次数有界下,l l m e 估计的渐近偏差、方差以及渐近正态分布; 3 ) 随机变系数模型中总体均值曲线与随机效应曲线的b 样条估计; 4 ) 重复观测次数有界下,在欧氏范数意义下,b 样条估计的渐近偏差 以及一定条件下估计的渐近正态分布 关键词:随机变系数模型,规范化的b 样条基,渐近性质,纵向数据 a b s t r a c t m a n y o fs t a t i s t i c i a n sh a v eb e e ni n t e r e s t e di nl o n g i t u d i n a ld a t ab e c a u s eo fi t sw i d ea p p l i c a t i o n e s p e c i a l l y , m a n yo ft h ef o r e i g ns t a t i s t i c i a n s a r eo u t s t a n d i n gi nl o n g i t u d i n a ls t u d i e sa n do b t a i nm a n yo fu s e f u lr e s u l t si n t h e o r ya n da p p l i c a t i o n r e c e n t l y ,h u l i n ,w a n dl i a n g 【2 2 】h a v ep r o p o s e d r a n d o mv a r y i n g c o e f f i c i e n tm o d e l sw h i c hi sm o r ef l e x i b l ef o rl o n g i t u d i n a l d a t a i nt h i sm o d e l ,t i m e - e f f e c t sa n dd i f f e r e n c eo fi n d i v i d u a la r ec o n s i d e r e d b yr a n d o ms u b j e c t s p e c i f i ct i m e - v a r y i n gf i l n e t i o n i nm o d e la n a l y s i s ,e s t i m a r i o no fu n k n o w n p a r a m e t e r sa n di t sp r o p e r t i e sa r ev e r yi m p o r t a n t ,s o ,t h i sp a p e rm a i n l yd i s c u s s e st h ee s t i m a t i o no fp a r a m e t e r sa n di t sa s y m p t o t i cp r o p e r t i e si nr a n d o m v a r y i n g - c o e f f i c i e n tm o d e l f i r s t ,t h i sp a p e rp r o p o s e san e wm e t h o df o re s t i m a t i n gr a n d o mc o e f - f i c i e n t s ,n a m e l y , w eo b t a i nt h ee s t i m a t o rb yf i t t i n gal i n e a rm i x e d e f f e c t s m o d e l st h r o u g hu s i n gb s p l i n e a p p r o x i m a t i o n t h er e s u l t e de s t i m a t o ri s c a l l e db s p l i n ee s t i m a t o r c o n t r a s t i n gt ol l m e 2 2 | n e we s t i m a t o rn o to n l y i s s i m p l eo nc o m p u t e ra n dh a v el o c a l l yc o n t r o l l e dc a p a b i l i t y , b u ta l s o ) i s s m o o t h e ro n c o n t r o l l i n go fo p t i m a lk n o t s m o r e o v e r ,t h er e s u l t ss h o w i th a s g o o dl a r g e - s a m p l ep r o p e r t y ,i t sr a t eo fc o n v e r g e n c ei s ( 一南) t h e n ,a b o u tp r o p e r t yo ft h ee s t i m a t o r ,i np r a c t i c a ls a m p l i n g ,f r e q u e n t l y ,r e p e a t e do b s e r v a t i o n i sn o te n o u g h l a r g e f o rm a n yo fo t h e r s f a c t o r s , s ot h e p r o p e r t i e so fe s t i m a t o ra r ei m p o r t a n tw h e nt h en u m b e r s o f r e p e a t e d o b s e r v a t i o na r eb o u n d e d t h e r e f o r e ,t h i sp a p e rd i s c u s s e st h ea s y m p t o t i c p r o p e r t i e so fb s p l i n ee s t i m a t o ra n dl l m ee s t i m a t o ri nt h i ss i t u a t i o n 1 ) i nt h i sp a p e r ,m a j o rr e s u l t sa r es h o w e da sf o l l o w s : t h el l m ee s t i m a t o ro fr a n d o mi n t e r c e p ta n dc o e t 五c i e n tf u n c t i o n si n i i t h er a n d o m v a r y i n g - i n t e r c e p tm o d e l s 2 ) t h ea s y m p t o t i cb i a s ,v a r i a n c ea n da s y n l p t o t i c n o r m a ld i s t r i b u t i o no ft h e l l m ee s t i m a t o rw h e nt h en u m b e r so fr e p e a t e do b s e r v a t i o na r eb o u n d e d , 3 ) t h eb s p l i n ee s t i m a t o r so fp o p u l a t i o n - a v e r a g e d c u r v e sa n dr a n d o m e f - f e c t sc u r v e si nr a n d o m v a r y i n g c o e m c i e n tm o d e l s 4 ) u n d e re c u t i dn o r m ,t h ea s y m p t o t i cb i a sa n da s y m p t o t i cn o r m a ld i s t r i b u t i o no f b s p l i n ee s t i m a t o r sw h e n t h en u m b e r so fr e p e a t e do b s e r v a t i o n a r eb o u n d e d k e y w o r d s :r a n d o m v a r y i n g - c o e f f i c i e n tm o d e l s ,n o r m a l i z e db s p l i n eb a s e a s y m p t o t i cp r o p e r t y , l o n g i t u d i n a ld a t a i i i 第一章序言 接对阉颁彦对每令摭榉个体进褥霪复溪测爨褥到鲍数据称之为缎岛数搬, 这类数据鹣应蔫裙当,泛,它髓经常出现予嵇寐阪学、生物攀渡及萁德囊然 与社会科学等领域之中”“等文献中有很多的寅际例子) 于是,关于纵向 数据的分析受到了广泛的关注,纵向模型研究也成为统计学上一个非常肖价 篷憨热点潆题,本文生簧讨论应用警缴彝数据分据戆隧枧交篆数模鎏懿参数 估计及冀糖关渐近穗纛+ 在阐述本文的方法和结论之前首先简单介绍模型的发展背景与研究现状、 隧机变系数模型的特点以及线性混禽效应模型的主要估计方法 1 1课题背豢 纵f 句数据最显著的特点是既受到时间变化的影噙,我们邋常称之为时阅效 应,又受懿令诲( 豢銎之瓣懿差异戆彩癞,雾之秀令俸效痘。掰淡,蘩舞充分缝 考虑蓟这两种影响因素怒有效的分析纵向数据的关键问题。农数据分析中,一 般有总体均值法( 如线性模型等均饿回归分析) 留个体特殊法( s u b j e c t - s p e c i f i c ) 在纵向数搬的分析中,麟采用传统的总体均值方法则很容易出于忽略组闯蒺 舅嚣产生较大魏骟差,藩采震令俸黪殊法鬃魏克l 菱这令缺黧瓣产生较夺翡镶 差,因此,在纵向数据箭析中,个体特殊法将更为有效 个体特殊法中最常见的则是混合( 随机) 效应模型虽然在理论上,组间 效应( 个体效应) 也可作为匿定效应饕符,但是必须弓l 入表承缀或个体的墩擞 交量,这;| 等缭摸壅增添大量霉要馋诗戆未絮参数,绘参数镄诗带来缓大懿寐 烦,尤其燎在组内样本容量啦比较小时,有效的估计未知参数难以实现+ 然 而,若采用混合( 随机) 效应模型,将组间效应肴作随机效应,则能够精简模 型申的参数,两虽即使在比较小的时候,参数馈计也能够肖效的执行,医 魏混合效应模螯为缴秘数据努辑鬟供了更有力懿王吴。 最初的滋合效应模擞假设响应燮擞与协变量之间是一种简单的线性关系, 称之为( 广义) 线性混合效应模型,该模型中既有体现总体特征的固定效 应,又有发映个体差异盼隧杌效应,将两种影响因素羼时考虑予摸型之中,这 撵更鸯籍貉麓邈描述了巍海数据懿海穰特征。当隧税效应毽为零时该模螯帮为 一般( 广义) 线性模型,宦是线性模测的扩展,怒一类非常有效的纵向模獭 虽然线,陡混合效应模黧在很多场台中是衣效的,但是,在一些其它灼情形 中,响应变量与协变量间的关系并非怒线性的,若仍采用线性形式的模型则 会产生很大的误差,于是,d a v i d i a n a n dg i l t i m a n 7 l 提出了半参数混会效应摸 激与菲线性混合效应模型以适应更复杂的数据分祈,并且在线绦混合模型的 基础上慰模戮进行了摆关熬统计推断。 以上模型都是以参数形式出现的,参数模型在数学处理上比较方便,然 瓣,这耪假设劳不燕任 霉场会都馀当,予是,z e g e ra n dd i g g l e 1 0 l 簿提出了半参 数混合效应模型与非参数混合效应模型,通过引入一些麟数随机效应将参数 形式黪混舍效应摸戮扩展列毒 参数模型,劳豆恁靛采震竣毙溪方法对其孛熬 非参数函数进行了宥效的估计,将非参数技术引入剿纵湖段据的分析之中 h u l i na n dz h a n g 2 1 叉采疆鼹部多壤式方法烬葚# 参数混合敦应模溅近儆为耩蕊 的线性混合模型后褥到固定效应曲线苟随机效应曲线的硒部估计,称之为局 部多埂武线搜混合然幸 ( l l m e ) ,恿时缭爨了l l m e 健计戆一些太榉本性爱, 结果也湿示出该估计具有良好的大样本性质 近零寒,邃着务;静薪瓣惩翦爨褒,各种受灵活懿薪模蘩穗缝被挺蹬,并有 效的应用于纵向数据的分析,如函数混合效应模数”,函数混合效应模型感 在线馁澄合效应模激戆基疑| 上缓设参数是隧时阉交袍瓣巍澄榉条螽数,该模 毅充分体现了时间对数据的影响,在生长曲线、健康研究中应用相当广泛 褥盈,w e n s h e n gg u o 提毒联是光潆襻条夔线岛缓瞧混合效应模撵之蓠戆联系 对模型中的束知曲线进行估计,同时给出了利用广义似然比( g l m ) 检验进行 模鍪选择懿方法。 一 最近,在a i d s 临床研究实骏的启发下,h u l i nw u a n dh u a l i a n g 溉l 糖出隧税交系数模黧: n 蕊( # ) = 爱( 吉) 啦g ) + 最器) ,= 1 ,招,f 一蕊1 1 ) i = 1 其孛热溉蕊( i ) 一涵t ,孙) ,分舅表示第 令令抟农t 隧裁鹭穗应交囊 德与回归变量值,啦( t ) 一( a i ,( t ) ,口i p ( t ) ) 表示第i 个个体的系数踊数, 斑嫉i 一1 ,p 霹藿终隽乎豫瓣隧裁过程,韩表拳懿撵令体数,镌嶷录蹿 第i 个个体的匿复观测次数,不失一般性,假设岛( t ) 是一个具有零均值且方 燕秀瓣熬独立隧橇测量误差过程。 假设 e ( 啦( t ) ) 一8 ( t ) 一( a l ( t ) , 令魏器) = 趣l ( ) ,( 母) = 龟( t ) ,( t ) ) 。8 ) ,冤纛国鳓= 8 ( ) + 趣( t ) 2 于是,随机系数函数粕;( t ) 分解为以麓定函数形式随时闯变化翡部分啦 句稀随 机部分咄( t ) ,因而上述模型等价于下列函数混合效应模型t 兰矗( t ) = 辞如( 站+ x ;( t ) 趣( 站+ 旬0 ) ,( 1 2 ) 为方便一般假设了( 磅一”h ( 母,啦( $ ) ) = d i a g 1 ,( ,s ) ,( 毛8 ) ,该模登审, 固定函数部分a l ( t ) 从整体上刻画出响应变量随时间变化的规樟,而随机郝分 b ( t ) 体现个体之间的整捧,于是,时闻效应与个体效应同时被体现于模溅之 枣。事实上,在蒺鍪( 1 。2 ) 孛如果隧撬残努堍净0 ,该模墼帮为标准懿变系数 模垄”,所以,随机变系数模型包含了变系数模溅与以往的模型相比较,在 复杂的设计与具有相关结构的数据处理中该模数更灵活,在成用上也更加广 泛 一般馕嚣下,该貘溅孛懿霆定效应丞数a d t ) 专令律效瘦瓣羧翎国黎罴来 知的,因此,我们首簧的褥题则是选用逶当的方法对这些未知函数进符有效 的估计w u i a a n g ( 2 0 0 4 ) 结合局部多项式方法与线性混合效应模型的估计 方法对其进行了估计,得到的估计称之为l l m e 估计我们知道农光滑方法 孛还有缀爹蒸宅煮羧酶技术,懿巍潦撵条信诗、b 撵条信诗等等,逮鉴熬是 非参数两妫中菲常有效的方法,同样,这些方法也可以用予随机变系数横型 ( 1 1 ) 中,由此受到启发,本文在后僦提出了b 榉条估计,并讨论了该估计在 一定条件下具有的渐= i 眨性质。 1 2线性混合效应模型的基本估计方法 本文审,主要是栗用一些函数遥近方法将模惑近戳为椽准线性混合模裂 霞霉缝合线往溪会效波模鋈嚣 砉计方法对未辩参数进行话诤,嚣魏,誊繁先 简单介绍线性混合效应模型的主要估计方法 线性混合效应模型髓线性模型的扩展,该模毅中既含宥线性形式的总体 坶篮参数绞又有体现个体效应的参数壤,即秀; 孰一置芦+ 磊十缸, ( 1 3 ) 其中弘= ( 挑一,。) 寝示第竹个体的n 1 次响应观测值,托一( 托h 一,麓。) 磊= ( 五一,五。) 表零设计矩阵,痧一强,岛) ,羲= ( 珐t ,旗) ? 分别裘示 医庭效应参数与隧穰效瘦参数,南一国,跳) ,表示组淹溪差隧橇辩慧 不失一般憔,我们假设b i n ( o ,回,如一n ( o ,诧) ,r = d i a g a :,口2 ) , 3 若令= 五机+ 白则有 y l = x , z + e :, ( 1 4 ) 其中e :一n ( 0 ,k ) ,v = r + 蜀g 名, 模型( 1 4 ) 称之为线性混合效应模型( 1 3 ) 的边际版本,事实上即为一个方差不 等的传统线性模型,个体随机效应被间接地体现于方差的变化之中 关于线性混合效应模型中的固定效应与随机效应参数的估计,下面分别 从兄,g 已知和未知两种情形介绍 1 2 1 当矿2 ,g 已知时 1 卢与b i 的估计分两步进行 当兄,g 已知时,则基于边际版本( 1 4 ) 易得卢的极大似然估计( m l e ) 础c s = ( 雹k 一1 五) - 1 捌k 一1 鼽, ( 1 5 ) 该估计相当于加权最小二乘估计,也是p 的最优线性无偏估计( b l u e 根据正态性的假设及扶,玩间的线性关系可知,b i 在y = ( y - ,鲰) 下的后 验分布也是正态的,得到西后,由贝叶斯理论知瓠理想的后验估计是后验均 值 反= e ( b liy i ) = g z k _ 1 ( 鼽一托口) ,( 1 6 ) 此估计是缸的最优线性无偏估计( b l u e ) 2 卢与b i 的估计同时进行 + 上面的估计方法是根据古典统计学派思想假设卢是固定的未知参数,而 贝叶斯学派则把卢与堍,i = 1 ,n 都看作服从某种分布的随机变量,基于他 们的后验密度对其进行估计为表示方便,令d = ( 卢,b h - - - ,k ) ,则6 的后验 密度为 邢= 程麓借蒜黔, , 由贝叶斯理论知d 的最优估计是后验均值e ( jiy ) 然而,求该均值在计算上 都比较麻烦,般采用数值叠代法进行计算,为克服这一缺陷,提出把使后验 密度函数,( 6ly ) 达到极大的值作为估计,称之为后验众数估计i x 由于( 1 7 ) 式右式分母中通过积分后与6 无关,故有 ,l 掣) o c i i ,( 弘ib i ,卢) i i ,( 如) , 4 因此,极大化,( 6ly ) 等价于极大他对数后验函数 nn l o g f ( y | il 如) + l o g f ( b t ) , i 宰li = t 在模鎏的假设下有; nn l o g f ( y i 玩) + l o g f ( b , ) i = l尝l 。( 一 芝:( 瓤一五芦一瓿圾) 霞i 1 ( 轨一x , 3 - 五堍) + 醒g 1 蕊+ l o g 麟| + l o g g 因此,使得函数 矗5 ) = ( 鼽一墨声教瓠) 磊f 1 ( v , - x 移- z a ) + g , g 一1 b + l o g | 筑i + l 。g i g i ,( 1 8 ) t 2 l 达到最小的使声,反则为我们所要求的后验众数估计 l 。2 。2 姿d 2 ,g 来麓辩 在很多情况下盯2 ,g 并非已知而是未知的,邈时候我 了首先要对各方麓分 量进行估计,为表示方便记0 = ( 扩,g ) 1 。关于方麓努量0 懿t - e i 诗h a r v i l l e ( 1 9 7 7 ) a n do t h e r s 摄窭 投大儆然嵇诗f m l e ) 和残差极大儆然嵇计( r m l e ) i l 域 极大似然估计通过极大化边际版本( 1 4 ) 的似然函数同时得到固定效应参 数卢与方憨分量0 的估计,在模型的假设下即等价于使函数 n t ( z ,8 ) 一( 1 0 9 l 磁 + ( 瓠一墨国k 一1 ( 弘一五筘) ) , 达到最小的僖口,作为估计。 羧大懿然话诗最大魏嫒貉麓麓夜话毒 牵寒熊考虑疆嫠诗德菇。替代舞 值p 所导数的自由度的损失,因此,随着芦维数的增加,如脚的误差也将增 大 为克溅极大戗然估计缒这点缺黧,将自由震瓣损失考虑戮馈计当中以产 生较零静镰差,于是摄藏了残差教灾襁然售诗( r m l e ) 该方浚戆主要恿愆就 是通过构遗一个仅仅依赖于口的似然函数而得到8 的估计,这种似然函数, 5 将卢看作具有某种分布的随机向量时,根据贝叶斯公式容易得到,或者在得 到p 的m l e 估计后对目进行估计时,在似然函数z ( p ,0 ) 中加上一个自由度惩 罚项,调整为: 1 1 ( 声,0 ) = 歹二( 1 0 9 i k l + ( 肌一五声) k 一1 ( 轨一五卢) + l o g i 趔k 墨i ) , 事实上,其中:。l o gix w , x , i 是鼬。s 的f i s h e r 信息矩阵对数行列式 z 。( p ,口) 对日的各分量求微分则可得到残差极大似然估计净一一 2 基于y 的边际似然的估计 如z s 是根据随机效应模型的边际版本( 1 4 ) 的似然函数得到的,现在从最 初模型( 1 3 ) 考虑未知参数的估计事实上,模型( 1 3 ) 给出的是”的条件均值 模型,而玩是不可观测的随机向量,因此,直接从模型( 1 3 ) 给出的条件似然 对参数进行估计难以实现但是我们可以从y 的边际似然考虑参数的估计 在模型的假设下,y 的边际对数似然函数为t l ( v ) = l o g f ( y t ) o c 善( 1 0 9 厶e 印( 一万1 。笛- 蛳t 一磁卢一6 ) 2 一;6 ,g 1 蛾 一言1 0 9i 忍i 一;1 0 9i g i ) , 上式中含有高维积分计算,一般情况下难以得到其精确的计算值而通常采取 近似计算,关于积分的近似计算有很多的方法,这里主要采用l a p l a c e 积分近 似计算根据l a p t a c e 方法上述似然函数l ( v ) 近似为: 三( ) o c 芝:一;( o g i 忍i + l o g i g i + ( 挑一五卢一五6 0 ) 耳1 ( 矾一x i 卢一五) + g 一1 b o + l o gi 墨r 五+ g 一11 ) , 其中b o 满足t ( 6 0 ) = 一万j - ( 一硝卢一6 0 ) 磊+ g b o = o , ( 1 9 ) 。 j = 1 于是通过在条件( 1 9 ) 下极小化一l ( v ) 得到ng ,r 的边际似然估计p ,0 ,袁 根据贝叶斯公式知: f ( b 1 刚g ) = 篇按器, ( 1 l o ) 6 得到参,0 聪,剃可进一步得到随梳效应矗 的估计 颤= e ( 魄i 可) 一f b , f ( b , i p ,。) d 饥, ( 1 1 1 ) 以上为一些关于线性混合效成模熬静常冤估计方法,它们都各有自融的 侧重点与优势,详细的情况可以参阉文献m l 。3本文约主萋内容 未知参数的估计及其优良性质燎统计学模数分析中非常黧要的问题,估 计蜂好坏j l 蟹矗接影响爽际数据分析络暴鳃好爨,闲蘧,不龄寻求更有效鹃傣 计氇瘦势了统诗学者酶研究重点。本文主要| 重论随橇变系数模蓬 l ,1 ) 串的露 定效应曲线。( t ) 及随机散应曲线“( t ) 或随机系数函数a i ( t ) 的估计问题以及在 重复观察次数有界情形下,估计的栩荧渐近性质 营先,本文考虑摸黧;瓤( 棼= 铀( 龄+ 霹8 秘+ 文t ) ,藏攘登孛,令露效应俸瑗予 截距顼孵巍仡,面斜率顼都是其有磷定形式的爵数,我稍称之为随梳变截鞭模 型事实上,该模型是随机变系数模趔( 1 1 ) 的一种特殊情形,熙最初随机截距 模型的扩展,这种模型在实际中有很瘳应用例子,如z e g e r ,l i a n g a n da l b e r t i a 2 1 在空气污黎号筵康骚突审蛩采震隧橇截鼯搂鍪l 避褥分辑褥爨了毒曩好戆效聚。 在此截距模型中本文重点讨论搬一种有意义豹新情形下,即重复观察次 数有界时,l l m e 估计的渐近性质最然w ua n dl i a n g 曾给出了当抽样个体 数与重复观察次数都越予无穷时,l l m e 估计盼渐近性质,假是,在实断抽 襻孛成本镣备耪嚣素将楚褥黠令俸鹣霾复鬟察次数往薤不煞遮蘩是移大,镌 如,医学腧床实验中对一研究对象静追踪,通常采取截尾或截断的方式避免 过长的研究时期,这时候对个体的擞复观察次数往往是有限由智,所以,张重 复观察次数有界情形下,估计所具有的性质是值褥我们关注的。 其次,考虑一觳逮醚枧变系数禊獾f l 。l ,著麓缎设模垄审稳方差参数怒已 知的( 若未知则以其估计代替) 本文先提出一种新的估计方法,运用b 样条函 数将模型邋近为标准的线性混合模数后得到参数的估计,得到的估计称之为 b 榉条估诗。与l l m e 传计比较,该传计具有计算简便及局部控制能力,以及 在逶当静带患控裁下,继诗螽数更热毙浮等等特点霹时,文中懿鳍暴巍疆 示出该估计具有好的大样本性质,其收敛速度达到o 。( 一涨) 7 最后,讨论了在重复观察次数有界情形下,b 样条估计的大样本性质, 得到了欧氏范数意义下估计的渐近偏差以及估计的渐近正态分布 本文的具体安排如下: 第二章讨论随机截距模型,在得到参数的l l m e 估计后重点讨论了该估 计在重复观测次数有界情形,该估计的渐近性质,得到了估计的渐近偏差、 方差以及渐近正态分布 第三章讨论随机变系数模型( 1 1 ) ,首先得到均值曲线o ( t ) ,随机效应曲线 玩( ) 以及随机系数a i ( t ) ,的b 样条估计,其次,在重复观测次数有界情形,得 到b 样条估计的偏差为d p ( 一磊黯) ,以及估计的渐近正态分布, 第四章表述了本文不足之处与将继续研究的问题 8 第二章随机变截距模型中的参数估计及其渐近性 本章审皇要考虑挟溅( 1 1 ) 的一耱特殊嚼形:锻设并菲魇有系数都是隧巍 酶,蔼枝截距顼是随稷i 鹃,其谴瓣率矮是嚣定形凌酶丞数,蠲为; 鼽( t ) = a i o ( t ) 十弼a ( t ) + 岛( t ) ,( 2 1 ) 其中。( t ) 一( a l 陬,牺一t ( 站) 劈一,表示光滑的暴数函数越鬟,稷设e ( a t 。( ) ) = 铂( 磅,e ( 岛) ) = 0 ,e ( t f # ) ,g ( s ) ) = 扩# ) l 。:l ,。v ( 钕。匀啦。( s ) ) = 7 妇,苟,置8 女( t ) ,k = 1 ,p 一1 ,是= 阶连续可导的其中1 为示性函数,将( 2 1 ) 称为随机变截距 模型 本章黧点讨论在黧笈鼹察次数n 有雾下,摸毽孛的隧缀虢距与系数逶数 的l l m e 话诤酶渐近穗质其俸安摊如下: 2 1 给出参数的l l m e 估计,2 2 给出最优窗宽的选择方法,2 3 给出 l l m e 估计的渐近性质,2 4 给出主要定理的证明 2 ,1参数舔数的l l m e 估计 y ( t ) 和x ( t ) 分别表示时刻t 的响应变量值与哪归变量值,现有n 个观察个 俸,对筹l 令令进行魄次墼复蘧察。假设苓圈黪令俸蓠霭察爨楼蔓独立瓣; 记渤,墨,锄) ,j = 1 ,m ,i = 1 ,柚,冬,= m 是第 个个体的第1 次观察 记录,其中粕= 五( 幻) 一( l ,搿枷一1 ) r p 一,j 一1 ,m ,i 一1 ,m 设t o 是任意给定点,则迸过泰勒展开将n 女( t ) ,k 一0 ,p 一1 农t o 的邻域内近 馁势t a k ( t ) a k ( t o ) + n :( 如) o t o ) ,k = 0 ,p 一1 , 玩( t ) z 魄( t d ) 十磋o o ) 0 一t o ) 其申睡8 ) 一a i 。( 醇一a o ( t ) 令商一( 1 ,t i j f o ,嘞l ,x q t ( t q t o ) ,。t i p 一1 ,执j p 一1 0 打一o o ) ) 7 , 卢= ( 0 ( t o ) ,西( t d ) ,凸p 一1 ( t o ) ,一1 ( t o ) ) z 舀一 l ,岛一t o ) 菇= 禹& ) ,) 气 假设观察时间在岛的一个邻域内,则模型0 1 ) 可以近似为标准的线性混 9 会效应摸型; 妨一爻毒p + z 每玩+ 6 甜, j = l 一,竹t ,i = 1 r n ,( 2 2 ) 其中龋= ( s n ,- 一,8 她) 一( o ,r ) , 玩一( o ,d ) , 最:e ;d i a g o a ( t i l ) ,。一,矿( ;) ,d e 越一d i a g i q ( t o ) ,醒( 南) , 记垫。( 垫l ,一,鳓。) ,趸一( 豆”一,氟。) ,旋= ( z l t ,y , 采用加权后验众数估计得到p ,的估计为: ( 西, t ) 一o r g r o i n l ( 鼽一趸芦一z j ) 瓴h ( 轨一豆卢一为饥) + 城d 一1 b i + l o g l d l + l o gi 皿1 】) 其中取 = 醯霹1 磁,尉矗= d i a g k a ( t i l 一如) ,一,玩( t 如;一t o ) , k a ( ) 一酸t h ) 是核滋数 记 ,( 反氇) = 【( 鼽一鬈妒一z j 矗i ) ,e 拖( 弘一趸芦一五玩) + 醒d 一1 b + l o g id + l o gi 蜀 j 令 掣咄掣钆 蠹既茸褥: f 鸯= ( 警,震v , - 1 趸) 。+ 芝羔,霹k - 1 y i, 1 魏= _ d 罨k q ( 矾一是向 箕孛毽= e 娥+ 五p 霹 从而有。 f 如= 如+ 。= # 岛+ l ,肇( 芝跫。震k _ 1 翱。霹盯1 挑, j = 0 ,p 一1 1 ( 拓) = 畦,。d z :k - 1 泓一趸毋) , i l ,一,n 事e 中e + t ,印2q 必o ,o ) 知, 进一步得到随机截距函数的估计为: a i o ) = a o ( t o ) + 茂( 如) , 洼。奎缎辩没有麓异野帮d :0 ,掰上话许稽当学独立梯零嚣焉帮稚较线性话弹l 籍】 1 0 2 2搿宽的选择方法 在局部多项式光滑估计中,窗宽的选择能够控制回归估计的光滑程度,这 在露羟分辑孛是摆当璧瑟懿。关予滋宽戆选择露缓多有效懿方法,魏交麓验 证法f c v s 标准) 、信怠准掰等,这题方法都蓉宥其优势,本文仅筒单介缁眈 较常见的突互验证选撵标准 r i c ea n ds i l v e r m a n t 姻t 提议在纵【向数据的非参数均值曲线估计中的窗宽选 择采爰c v s 标准,h a r t a n dw e h r l y i l 进一步验诞了这令方法是捷会兹,嚣瑟 对本章模溅中的筒定效应曲线a k ( t ) ,南= 0 ,p 一1 采用c v s 标准进行觳优 窗宽的选择,即选择窗宽h 。使得下潮函数达到潦小 nm c v s ( h ) 一蕊一毋。) - x ( t , d a c 一站 细 i = lj = l 其中a r ”液示去掉第i 个个体的所有观察数据盾得到的估计 采熙c v s 窗宽对匿怒效应匿线( t ) 是比较馀当的,僵是将越鹰予隧桃鼗 线蕊国或阮( ) 效栗势不一定壤努。若在模鳌审对绘定懿蘩令 ,组内误麓顼 是独立的,则相当予一个标准的j i 参数回归问题因而可以采用c v s 标潦进 行最优窗宽选择,若误差项并非独藏而是相关时,a i r m a n 提出了对标准的交 互验证进褥修正( c v p 标准) : 俊瓷# ,t 掰建蔚有互不禚潮酶蕊溺时阉赢,在绘定酶莱卞“对粼, 仅对个体i - ,i m ,进行观测,则幽模型有: 雏。0 j ) = 8 o ( 如) + 砭a 如) + e 乜( 如) ,l = 1 ,m s , 赠c v p 窗宽矗。邵为使得 mm j c v p ( h ) = 虢( 幻) 一a ( “) 一砭a ( 一j ) ( t j ) i i m m j j 搿ll = i 达蓟最小姻值其中a 田) 表示去掉幻时刻嚣观测数据后得到的估计+ 在本章中,结合上述两个标准进行最优的窗宽选择,采用c v s 窗宽k 得 到固定效躲钱n t ( 站盼估计a 扩( # ) ,采i l lc v p 密宽k 得到随机效曲线6 i ( 0 ) 的估 事辛麓”( ) ,然后综舍褥受硒棼= 鑫+ 麓* 鼢 2 。3镳计的渐近憔矮 本节盘鼹给出在个体重复观察次数即m 有界,而n 一+ 。时,a j ( 如) ,j 一 0 ,p 一1 憨灏近条传傣差,方差,均方误差以及激近分带 首先给密一些必要懿假浚条件帮文审用弱的记弩 ( 一) 假设条件 ( 1 ) :设计时闻点奶,j 1t ,n l ,i 1 ,钵是独立同分布螅,且宥避续 密度函数拜) ,在缀爽溪察孛设诗时瓣点没有鳍患,帮若j 翔; ( 2 ) :m 有界,即3 0 c 0 教有。( “) 如= 1 ,。u k ( “) d u 一0 ; ( 9 ) :n 0 0 ,h o ( n 一) ( 二) 谴每 口= 粕,幻,j 1 - ,m , 1t ,n ) , r ( t ,8 ) 一盯2 ( t ) + 7 ( 屯8 ) ,7 2 0 = 掣b t ) :t 。) = 嚣( ( 三) ,( tx ) 隅) 喃一 m = ( 8 e ( 三) i 如,) ( e c ( 三) i t o ,) , 鲰= ( - - ,铆) ,= e ( x , x jit = t o ) , ,j = 0 ,1 - ,p - 1 ,其中r 0 0 一l 1 2 u 表示均匀核函数s ”:u c 幻一 吾:;i :, 炫= lu ( t ) t d t ,蛾= l u 2 ( t ) t d t , w = d i a g u h ( t i l 一t o ) ,一,u h ( t m 。一岛) ,i = 1 ,- 一,n ;其中u h ( ) = 女u ( 矗) 定理2 1 在条件( 1 ) 一( 9 ) 下,鳓( t 。) 的条件偏差、方差分剃为; b i a s ( a j ( t o ) jd ) 一i 铲( t o ) ( 1 + o p ( 1 ) ) , v 村( 奄( 如) l 。) = 2 t ( t 矗o ,, t o ) ) e ,t + i , v n - l e j + 1 , p ( 1 十雌( 1 ) ) , 定理2 2 在条件 1 ) 一( 9 ) 下, ( o ) :a j ( t o ) 的条件均方误差与局部最优窗宽分别为: m s e ( & i ( t o ) | d ) 一蠢( 器。) ) 2 + 主g 瓣,峨p q - 王岛+ l ,p + 咋毳) _ 1 + ) 础( 如) = 业黼涮崭蛐) 5 ( 1 + d p ( 1 ) ) , ( 棼:a j ( t o ) 的热较积分均穷误差与垒鼹最优寥宽分裂鸯: m i s e ( a i ( t o ) l 口) = 纛萼私+ 1 , v n - i e j + i , v w ( 衄篓加如( t ) d t 州m ) - i + h a ) 一 鳃褊褊巡净+ d p ( 嘞, 其中u 怒一个非负加权函数 洼:壶定理2 1 可知;谖估静珏蘧度g ( 国) 鼗蕺, 定理2 8 设e ie ( t ) p ” + o o ,ei 趣0 ) 1 2 “ 0 ,在条件( 1 ) 一( 9 ) 下, 每( 锄的渐避分布为: ( ;( 岛( 。) 一a j ( t s ) ) - - 。a n ( 。,: 簧导弓+ ,n - l 勺+ ,) 1 3 2 4 定瑾的证鞠 引理2 , 1 设( x 。,m ) ,( 墨,碥) 是独立同分布的随机向爨,其中m 鼹一 元静隧枧燮璧,假设e l y l s + 。纛s u p f ly l sd y - t - o o ;设k 表示令其有 有界支撑的有界菲负函数且满足李瞢希茨条件粼t 当n 2 5 - l h + o 。,扛 1 - s “) 时有 溜l n 一1 妫僻- x ) y , - e 陬- - x ) 吲 1 2o p ( 意) 。肛, 证:参见”1 引理2 2 在条件( 1 ) ( 2 ) ( 3 ) ( 9 ) - v 肖; 磅器蟮一奄) ( 一恕) 嚣矗( 蟠一岛) _ 0 ( 蠡_ e ) , t1)三榭鐾尝煞咎而一u(一to)(。o),2h ”7 护( 幻) + 砰( t o ) 纸( 幻一t o ) 唧 “ 证:参见 亏l 理2 , 3 在条箨( 1 ) ( 2 ) ( 9 ) 下霄; 甄1v q 。丽ll 。 - 1 十瓤d 墨) _ 12 群南( 1 + o p ( 1 ) ) = 1 ,n 涯;摄据孳 壤2 2 孛懿 ) 露褥 冽蜘础硼砂f 节i :节1 , k 镂铲裂, 故 k = ( o 岔+ 互d 掣) “ = ( 瑶6 冗i 甄铲( i + 墨d 曩或耳,砖) 一t = 蕊1 涟霹一, 其中 ;一蕊裙 l + 磋菝置,一,l + 霉疆岳 ,嚣= 1 4 由于h 一0 时, | b a ;11 | i ,敌有 高( a i + b ) 。 高( i + b a 一。1 高f ( i + b a - ( b f ) 2 + ) 去( + 茸增茸1 + ) , 又 a 7 1 b a t = ( 雨瓣蕊端訾秽精赫编 一0 ( h 一0 ) , 其中1 是示性函数 所以 矿一高( 一。) 又由引理2 2 的i t ) 可知: 去霄1 一( h - - , o ) 所以 轰k 。= 采奇( 1 + 。p ( 1 ) ) 引理2 4 在条件( 2 ) 和( 9 ) 下有t 喜瓤孟圳m 棚。( 伽0 0 ) c 圳聊, s , 证:由引理2 1 知t 震豆= e ( 霹豆) ( 1 + 0 p ( 1 ) ) = ( e ( 弱u h ( t u t o ) 冠) ) ( 1 + ( 1 ) ) , 又 羁以( 奶一t 。) 。( 玩( 幻一如) t ( 幻一t o ) ”) 印。2 p , 其中, _ 0 ,1 由于 雾 瑷 敌 e ( 仉0 ”一t o ) 。蚶z 甜l ( t 甜一t o ) m ) = e ( e ( u h ( t 蟮一。) 。鞋筠奄一南) ”) l 奶) = e ( r k i ( t d ) t r h ( t 玎一t o ) ( t , j 一如) “) = 元1 u l t , j f - t o 州t ;j - t o ) ”州训( 蝴 = 叛;潞+ 蛹,器。+ 秘移妒挺 憎( 蝴巾曲,( t 妒如 m 一。,m ( 饥,( t ) 连续) 嚣( 爻舀玩一南) 爻岛) 刮蛐n 。( 吉他0 ) 嘉瓤趸叫纯。( 苫0 ) 删 一。定甏2 1 鹃迓嚼 1 ) 由引理2 3 得西= ( 毛。冠弧置) 一1 冬1 2 :w a d l + o , o ) ) 瑟以 a j ( u ) = 略峨印( 震碱震) 震獭棼( 1 + 1 ) 。p 一1 又 如= 蜀卢十;( 白 ) ( 如一t o ) 2 粕十6 i 鼢) + 铀 。女罱o 冀孛囊女( t o ,奶) ,玉= 0 ,p 一1 ,。一1 , 所以e ( y i jl d ) 一忍卢+ ;。z ( 岛k ) ( 如一t o ) 2 粕k , 所秘 e 转 。净x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 虚拟语气详细讲解
- 物业工程部年中工作总结
- 慢性胆囊炎和胆石症护理
- 精细化管理工具在护理中的应用
- 事业编课件搜索问题
- 科室年度工作总结报告
- 公司程序文件培训课件
- 房地产造价成本年终总结
- 公司环境安全培训课件
- 公司物业管理课件
- 消防喷淋系统安装检验批质量验收记录(含内容)
- 社会保障学第一章
- 安全监理危险源控制表(填写)
- 精子和卵子的结构课件
- 高中英语【歌曲赏析】Try-Everything-双语课件
- 四位数乘四位数乘法题500道
- 地物点位误差检验表
- 经济法学2017(2)教学课件
- SB/T 10130-2008绞肉机技术条件
- 投资学英文版课件Ch 3 Securities markets
- GB/T 20468-2006临床实验室定量测定室内质量控制指南
评论
0/150
提交评论