(应用数学专业论文)含右删失数据模型的随机效应存在性问题.pdf_第1页
(应用数学专业论文)含右删失数据模型的随机效应存在性问题.pdf_第2页
(应用数学专业论文)含右删失数据模型的随机效应存在性问题.pdf_第3页
(应用数学专业论文)含右删失数据模型的随机效应存在性问题.pdf_第4页
(应用数学专业论文)含右删失数据模型的随机效应存在性问题.pdf_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

含右删失数据模型的随机效应存在性问题 中文摘要 随着现代科学技术的迅猛发展,系统工程思想和方法得到了r 益广泛的应用同时, 系统分析理论也在不断发展和完善在系统分析过程中,建立数学模型是十分重要的研究 课题,如炼钢厂的工程师们希望有一个炼钢过程的数学模型,以实现计算机自动控制; 气象研究工作者要根据气压、雨量、风速的数学模型来预报天气;从事城市规划工作的 专家们更需要建立一个包括人口、交通、能源、污染大系统的数学模型,为领导者做出 城市发展规划决策提供科学依据在复杂系统中,具有很多不确定性的因素,建立数学模 型时经常需使用概率统计模型;从而统计推断方法成为系统分析中极其重要的分析方法 通常人们习惯应用回归分析的手段来处理这类问题回归分析的理论及方法发展得非常 快,它不仅已成为统计学的一个重要分支,而且也被人们广泛地应用于各个领域随着回 归分析理论的不断发展,随机效应模型己成为目前重要的研究课题 本文讨论了非线性随机效应模型和右删失数据模型,并对含有右删失数据的非线性 模型中的随机效应存在性进行了研究重点在于似然比检验和限制似然比检验 第二章系统地讨论了极大似然比检验和约束似然比检验来检验线性混合模型中的随 机效应存在性并且给出了随机效应参数的估计和检验统计量 第三章将非线性模型的随机效应模型转化成一般线性混合模型并讨论了随机效应存 在性问题最后用实例验证了方法的可能性 第四章对具有右删失数据的正态非线性随机效应模型进行了探讨,用l a p l a c e 展开 方法,给出该模型中固定效应参数的估计以及g a u s s n e w t o n 选代算法这些结果是 r o b i n s o n ( 1 9 9 1 ) ,l e ea n dn e l d e r ( 1 9 9 6 ) 等人的工作的进一步推广和发展 关键词:非线性模型;右删失数据;参数估计;随机效应 t h ee x i s t e n c eo fr a n d o me f f e c t sf o r t h e n o n l i n e a rm o d e lw i t hi u g h l 卜c e n s o r e dd 蜩r a a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fs c i e n c ea n dt e c h n o l o g y , t h et h e o r ya n dm e t h o do fs y s t e m a n a l y s i sa l eb e i n gi n c r e a s i n g l ya n de x t e n s i v e l yu s e d m e a n w h i l e ,t h et h e o r yo fs y s t e m sa n a l y s i s i sc o n t i n u o u s l yd e v e l o p e da n di m p r o v e d m a n yc o m p l e xs y s t e m su s u a l l yc o n t a i nu n c e r t a i n l y , t h e np r o b a b i l i s t i ca n ds t a t i s t i c a lm o d e l sa r eo f t e nu s e d ,a n dh e n c et h em e t h o d so fs t a t i s t i c a l i n f e r e n c eb e c o m et h ei m p o r t a n ta n a l y s i sm e t h o d si ns y s t e m sa n a l y s i s m a n ys y s t e ma n a l y s i s r e s e a r c h e r sa n ds t a t i s t i c i a n sh a v ep a i dg r e a ta t t e n t i o nt ot h er a n d o me f f e c tm o d e l sb e c a u s eo f t h e i rw i d ea p p l i c a t i o n i nt h i sp a p e r , w ed i s c u s s e st h en o n 1 i n e a rr a n d o me f f e c t sm o d e la n d r i g h tc e n s o r e dd a t am o d e l a n dr i g h t - c e n s o r e dd a t a 、析t hn o n 1 i n e a rm o d e lo ft h ee x i s t e n c eo f r a n d o me f f e c t sw e r es t u d i e d f o c u so nl i k e l i h o o dr a t i ot e s ta n dr e s t r i c t e dl i k e l i h o o dr a t i ot e s t t h em a i ni d e a so ft h ep a p e ra r ea sf o l l o w : c h a p t e r2d e s c r i b e st h es y s t e mu s i n gt h em a x i m u ml i k e l i h o o dr a t i ot e s ta n dr e s t r i c t e d l i k e l i h o o dr a t i ot e s t t o t e s tt h ee x i s t e n c eo fr a n d o me f f e c t sf o rl i n e a rm i x e dm o d e l a n dt h e r a n d o me f f e c t s & s t a t i s t i c sa r eg i v e nt h ee s t i m a t e dp a r a m e t e r s c h a p t e r3i n t r o d u c e s t h en o n l i n e a rr a n d o me f f e c t sm o d e lo fh o wt h ee x i s t e n c eo ft h e p r o b l e mi n t oag e n e r a ll i n e a rm i x e dm o d e lo fr a n d o me f f e c t so ft h ep r o b l e mt h e r e f i n a l l y , e x a m p l e si l l u s t r a t e st h a to u rm e t h o di sa v a i l a b l e c h a p t e r4s t u d i e st h en o n l i n e a rr a n d o me f f e c tm o d e l sw i t hc e n s o r e dd a t a t h e nt h el a p l a c e m e t h o d si s e m p l o y e dt o d e a lw i t ht h e s em o d e l s b a s e do nt h i sm e t h o d ,t h ef i x e de f f e c t p a r a m e t e re s t i m a t e sa n dg a u s s n e w t o nf o r m u l aa l eo b t a i n e d k e y w o r d s :n o n l i n e a rm o d e l ;r i g h t - c e n s o r e dd a t e ;p a r a m e t e re s t i m a t e ;r a n d o me f f e c t 扬州人学硕f j 论文3 4 扬州大学学位论文原创性声明和版权使用授权书 学位论文原创性声明 究成果除文中已经标明引用的内容外,本论文不包含其他个人或集体已经发表的 研究成果对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明本声 一躲聿舔 签字日期:。夕年陟月s - 日 | 学位论文版权使用授权书 本人完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向 国家有关部门或机构送交学位论文的复印件和电子文档,允许论文被查阅和借阅 本人授权扬州大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可 以采用影印、缩印或扫描等复制手段保存、汇编学位论文同时授权中国科学技术 信息研究所将本学位论文收录到中国学位论文全文数据库,并通过网络向社会 公众提供信。g n , 务 学位论文作者签名: 签字日期: a o7 年 i 寺雅 导师签名: 易只厂日 签字日期: 喜摩季 呷年匆月厂日 第一章绪论 在工农业生产,社会生活和科学研究过程中,经常会遇到各种类型的不同的实验数 据,这些实验数据为我们认识客观世界的内在规律,研究变量值间的关系,预测客观世 界的发展,提供了丰富的材料和科学的依据但是,要想从这样一些庞大的数据对中找到 有用的东西,得到可靠的结论,就必须对实验数据进行认真的整理和必要的检验,从而 便于揭露问题中存在的矛盾,找到解决问题的可能途径 随着现代科学技术的迅猛发展,统计分析理论也在不断的发展和完善,在统计分析 过程中,建立数学模型是十分重要的研究课题,如炼钢厂的工程师们希望有一个炼钢过 程的数学模型,以实现计算机的自动控制;气象研究工作者要根据气压、雨量、风速的 数学模型来预报天气再复杂系统中,具有很多不确定性的因素,建立数学模型时经常需 要使用概率统计模型,从而统计推断方法成为系统分析中极其重要的分析方法,通常人 们习惯应用回归分析的手段来处理这类问题回归分析的理论及方法发展的非常快,它不 仅已成为统计学的一个重要分支,而且也被人们广泛的应用于各个领域 1 1问题的提出 随机效应模型的研究可以说始于许宝禄先生( 1 9 3 8 ) 关于线性模型的方差估计的著名 论文由于这个模型在生物育种、心理学、工业控制和计量经济等领域有着广泛的应用, 因此近六十年来一直很受人们重视,发展很快,文献很多随机效应模型即方差分量模型 是回归分析很重要的研究内容,我们首先从遗传学上的一个例子谈起y o u n g 等人为了研 究母鼠的母性能力( 用所生小鼠的体重来度量) ,从四个母鼠生下的出生十天的小鼠中各 取六只,用k 表示第f 只母鼠生下的第j 只小鼠的体重,我们可以用单向分类模型 = + q + , f = 1 ,4 , 2 1 ,6 , 来描述这组数据,其中为总平均,q 为第f 只母鼠的效应如果是比较特定的四只母鼠, 则,就是固定效应,则上述模型便是固定效应模型,即普通的回归模型但是 y o u n g 等人要研究的是,母鼠总体中,母性能力的变化程度即母性能力的方差现在的这 四只母鼠是从母鼠总体中抽取的随机样本,相应的口。就是母鼠效应总体中的随机样本, 它们也是随机变量,则称上述模型为随机效应( r a n d o me f f e c t ) 模型如果小鼠用三种不 扬州入学硕一j :论文 2 同的饲料来喂养,试验的目的除了考察母性能力的变化程度之外,还想比较这三种饲料 的优劣,则模型应为 y t j k = + 口f + 一+ , j = 1 ,42 1 ,2 ,3七= 1 ,6 , 这里y u k 为第f 只母鼠生的且喂第种饲料的第k 只小鼠的体重,q 为第f 只母鼠的效 应,它是随机效应,为第种饲料的效应,是固定效应将上述既有固定效应又有随机 效应的模型也称为随机效应模型,有些文献中亦称上述模型为混合模型( m i x e dm o d e l ) 1 2 国内外研究现状 1 2 1 生存分析与有关的统计问题 生存分析就是对一个或者多个随机变量进行统计分析,即根据观测到的数据对一个 或者多个非负随机变量进行统计推断非负随机变量常用来表示自然界,人类社会或技术 过程中某种状态的持续时间一种最常见的情况是,用非负随机变量表示“寿命 ( 技术产 品的寿命或人、生物的寿命) 因而生存分析可以看成是对寿命的研究,是对寿命数据进 行分析生存分析对于产品寿命的评估、人和生物寿命的研究,手术后人的寿命的预测等 等都十分重要,因而生存分析的理论和方法在工程上以及医学,生物学上都有广泛的应 用价值,日益受到人们的重视生存分析不是孤立的研究某个个体的寿命,而是研究一批 个体的寿命任何个体的寿命多长都带有偶然性,而一批个体的寿命多长就有一定的规律 性我们用t 来表示任何个体的寿命,把t 看作是随机变量,t 的值依赖于个体寿命数据 有时是有意识的安排试验来获得的,有的则是通过现场调查来得到的,数据一般含有删 失数据 什么是“删失数据”呢? 删失分为“右删失”,“左删失 和区间数据,在进行观测或 调查时,一个个体的确切寿命不知道,但只知道寿命大于l ,则称该个体的寿命再l 是右 删失的,并说l 是有删失数据;若个体的确切寿命不知道,但只知道寿命小于l ,则称该 个体的寿命在l 是左删失的,并说l 是做删失数据;区间数据是指仅知观测数据落在某 一区间中( 常用记号f 表示l 是右删失数据,f 表示l 是左删失数据) 右删失的情形在 寿命观中极为常见,其他的类型则出现较少在工程和医学上还有一种情形是事先规定实 验或观测截止时间l 有的个体在试验或观测截止时寿命并未终结,这时称该个体的寿命 在l 被截尾,我们把这种情况归于“右删失” 怎样分析这些含有删失的数据呢? 由于删失的引入,情况大为复杂普通的统计学未 讨论这些数据,它主要讨论完全数据,生存分析的特点,就是讨论含有删失数据的情形, 因而发展出许多新的统计方法,形成独特的理论与方法 和普通统计学一样,生存分析的方法主要分为两大类当寿命总体知之甚少或毫无所 知时,采用非参数统计方法当总体的分布类型已知,只是若干个( 有限个) 参数未知时, 采用参数统计方法此外,还有半参数模型及相应的半参数方法,这是比较新的分支,方 兴未艾一般说来,参数性方法可用于较小的样本,使用非参数方法则必须有较大的样本 对于参数性方法而言,小样本情形的方法理论比较完善,而对于非参数方法来说,有效 的方法理论主要基于大样本理论 1 2 2 随机效应模型研究回顾 国外关于随机效应模型方差分量估计较早的工作有h e n d e r s o n ( 1 9 5 3 ) ,h a r t l e ya n d r a o ( 1 9 6 7 ) ,p a t t e r s o na n dt h o m p s o n ( 1 9 7 1 ) 大量的研究工作是始于本世纪七十年代, 对于线性随机效应模型参数估计及方差分量估计的文献有h a r t l e y ( 1 9 7 3 ) ,c o r b e i la n d s e a r l e ( 1 9 7 6 ) ,j e n n r i c ha n ds a m p s o n ( 1 9 7 6 ) ,h a r r v i l l e ( 1 9 7 6 ,1 9 7 7 ) 等特别是 h a r v i l l e ( 1 9 7 6 ) 首先提出了约束最大似然估计( r e s t r i c te s t i m a t i o no fw a x i m u m l i k e li h o o d ) 方法即r e m l 估计方法,对方差分量估计的研究有着深刻的影响对于模型 的参数估计,h e n d e r s o n ( 1 9 8 4 ) 得到了最优线性无偏估计h a r v i l l e ( 1 9 9 0 ) ,h e n d e r s o n ( 1 9 9 0 ) ,r o b i n s o n ( 1 9 9 1 ) 概括总结了h e r d e r s o n 的方法,并将其应用到动物育种领域 对于线性随机效应模型的参数估计及方差分量估计的算法与计算机实现,有关的论文有 l a i r da n dw a r e ( 1 9 8 2 ) ,l a i r d ,l a n g ea n ds t r a m ( 1 9 8 7 ) ,j e n n r i c ha n ds c h l u c h t e r ( 1 9 8 6 ) 等以上都是关于线性随机效应模型的研究s e a r l e ,c a s e l l aa n dm c c u l l u c h ( 1 9 9 2 ) 在他们的著作中对线性随机效应模型的参数估计及方差分量的估计作了系统的概 括和总结这本著作标志着线性随机效应模型研究的基本完善 线性随机效应模型的一般形式可写成 y = x p + z h + s , 其中l ,是门维观察向量,x ,z 分别为n xp ,n xq 阶设计矩阵,参数为p 维未知参数( 固 定效应) u 是期望为0 ,方差为盯2 的随机变量( 随机效应) 占为胛维随机误差,且 一n ( o ,盯2 厶) 与甜独立 扬州人学硕1 :论义 4 国内学者在这方面也做了大量的工作,王松桂( 2 0 0 4 ) 在他的线性模型引论著 作中对随机效应模型作了系统的概括和总结,吴启光( 1 9 8 3 ) 、王静龙( 1 9 8 7 ) 讨论了线性 随机效应模型方差分量的可容许性;周明华,王静龙( 1 9 9 5 ) 讨论了方差分量模型的二次 型估计,童恒庆( 1 9 9 5 ) 研究了方差分量模型的广义岭估计但对于非线性随机效应模型, 有关的研究工作还比较少,有待人们进一步的努力 广义线性和非线性随机效应模型是线性随机效应模型的直接推广,广义线性随机效 应模型在m c c u l l a g ha n dn e l d e r ( 1 9 8 9 ) 关于广义线性模型的著作问世后,已经成为统计 试验设计与理论研究的热门课题w i l l i a m s ( 1 9 8 2 ) ,b r e s l o w ( 1 9 8 4 ) 研究了二项分布和 普阿松分布的广义线性随机效应模型b r e s l o wa n dc l a y t o n ( 1 9 9 3 ) ,l e ea n dn e l d e r ( 1 9 9 6 ) ,l i n ( 1 9 9 6 ,1 9 9 7 ) ,l i ua n dp i e r c e ( 1 9 9 3 ) 研究了分组广义线性随机效应模 型的估计问题。以上文献的基本思路是应用l a p l a c e 展开的思想,避免了求边缘密度时复 杂的积分计算,由于这种方法得到的估计具有良好的性质,因而具有广泛的实际应用价 值 广义线性随机效应模型的一般形式可写成 g ( ) = 7 = x p + 历, 其中g ( ) 为联系函数,j ,为刀维观测向量,其均值为j u ,x ,z ,“的定义如一般 的线性随机效应模型 关于该模型的方差分量的估计,s c h a l l ( 1 9 9 1 ) 讨论了其r e m l 估计,并给出了具体 的迭代算法在广义线性随机效应模型发展的同时,非线性随机效应模型也在不断的发 展,但相比较而言,这方面的研究工作还相当薄弱,研究工作见于报道的尚不是很 多r a c i n e p o o n ( 1 9 8 5 ) ,d e y ,e ta 1 ( 1 9 9 7 ) 从贝叶斯( b a y e s ) 的观点研究了非线性 随机效应模型l i n d s t o r ma n db a t e s ( 1 9 9 0 ) , v o n e s h ( 1 9 9 2 ) 分别研究了重复测量数据 的非线性随机效应模型与一般的非线性随机效应模型v o n e s h ( 1 9 9 6 ) 给出了一般重复测 量数据非线性随机效应模型的边缘似然函数的l a p l a c e 逼近公式,这对非线性随机效型 的研究带来了极大的方便 常见的非线性随机效应模型有两种形式,一种形式为 】,= f ( x ,) + z u + 占, 另一种形式为 y j = 厂( t ,谚) + ,2 = a , p + e “ 其实第二种形式与第一种形式基本上是一致的v o n e s h ( 1 9 9 2 ) 讨论了第二种形式,且可 改写成 y = f ( x ,) + z ( p ) u + 占 非线性回归模型是统计学的重要热门课题之一指数族非线性模型( e x p o n e n t i a l f a m i l yn o n l i n e a rm o d e l s ,简记为e f n m ) 首先由c o r d e i r oa n dp a u l a ( 1 9 8 9 ) 和c o o ka n d t s a i ( 1 9 9 0 ) 提出,它实际上是一种常见的广义非线性模型;是广义线性模型( g l m ) 和正 态非线性模型的自然推广w e i ( 1 9 9 8 ) 详细讨论了该模型的统计推断、几何方法以及统计 诊断如果数据可以重复测量,经常需要考虑随机效应的影响 1 3 本文的主要研究工作 基于以上综合分析,本文对带右删失数据非线性随机效应模型中的随机效应是存在性 问题进行较为深入的研究 第二章系统地介绍了利用极大似然比检验和约束似然比检验来检验线性混合模型中 的随机效应是否存在;并且给出了随机效应参数的估计以及检验统计量 第三章主要介绍了将非线性模型的随机效应存在性问题怎样转化成一般线性混合模 型的随机效应存在性问题最后用实例验证了方法的可能性 第四章对具有右删失数据的正态非线性随机效应模型,用l a p l a c e 展开方法,给出 该模型中固定效应参数的估计以及g a u s s - n e w t o n 选代算法并且利用前面的方法检验随 机效应的存在性 综上所述,本文较为系统地研究了带右删失数据非线性随机效应模型的随机效应存在 性问题,用一阶泰勒近似的展开方法,将模型中的非线性部分线性化在此基础上,利用 线性混合模型的随机效应存在性的检验方法来检验带右删失数据非线性随机效应模型的 随机效应存在性问题 扬州人学硕l :论文6 第二章带右删失数据线性混合模型随机效应的存在性检验 假设y 是一个刀+ 聊维的响应向量,甜是g 维的随机效应因子,假设服从正态分布 n ( 0 ,盯2 a ) ,kl 材,芝恤,匕+ 。k 相互独立,且服从正态分布( 以,万2 l + 。) ,不失一般性, 我们考虑最后m 个生命时间数据由于试验的终止却未寿终而删失了r i 甜在随机效应下的 均值为: “= # + 彳“,i = 1 ,2 ,咒+ m , ( 2 1 ) 其中是p x l 未知固定效应向量 令 舭,= 击唧t 一务舻弘叭= 学“加筹, 联合似然函数方程由下式给出 上= 专珥i x 她) 职n + m 比) 南e x p 一专“w 协, c 2 对数似然函数可以写成: 邶,仃2 ,“) = 一半l 。9 2 z c r 2 一昙羔乍+ n + ml 。酬伊去抓一甜, ( 2 3 ) l i = l1 = 1 7 + l u 上式方程对求导,可得 易= 吉喜地一x j 纠小孑,n 袢+ m ) 薯 = 吉善抛一抄相了1x 7 ( g 爿刊, ( 2 4 ) 其中 g = ( 蜀,9 2 ,g 。+ 。) 7 , f r ,i = 1 ,聆 岛2 t 仃s ( f ,) + z j + z r u , i = n + l ,疗+ 聊。 将( 2 3 ) 对扰求导,可得 = 孑1t 闰互( r z j 一巧“) + 孑1 茎刁印) 1 a - 1 甜 寺喜抛一抄翻一7 1a 1 删。 历= ( z7 z + 人一) 1 z r ( g x7 ) , ( 2 5 ) 代入到( 2 4 ) 得: 万o l = 7 1 x r q - 1 ( g x 7 ) ,q = ,+ z a z 7 , 则模型等价于 g = f ( f 1 ) + e ,e n ( 0 ,盯2 q ) , ( 2 6 ) 其中g 中的“形式上用历表示这样化为普通的线性回归模型处理 接下来考虑带右删失数据的线性混合模型: = x + z r 6 + s ,e 三 = 三: ,c ,d v 三 = 曼:l , c 2 7 , 其中0 x 是元素全为0 的k 维列向量,是己知的k xk 阶对称正定矩阵,l 是n 维单位 矩阵,参数为p 维固定效应参数,b 是k 维随机效应向量,占为刀维随机误差,( 6 ,占) 服 从正态分布由上述条件得到: e ( w ) = x p ,c o v ( w ) = 巧, 其中旯= 吒2 ,= l + 2 z e z7 ,力是响应向量的维数参数五可以看作是信噪比, 因为露决定着由e w6 = x f l + z b 给出的“信号”这里露= 0 当且仅当旯= 0 ,五的参数 空间是 0 ,0 0 ) 考虑下列假设: 风:屏小。= 群小。,屏= 群,露= o ( 五= o ) , q :屏+ l - g 群+ l - qo r ,d ,辟辟,o ,蠢 o ( 名 o ) ( 2 8 ) 如果q = 0 ,我们得到检验方差是否为零的重要特例: 扬州人学顾l j 论文 8 风:露= o ( a = o ) w q :西 o ( z o ) ( 2 9 ) 由于在零假设条件下参数位于参数空间的边界上,在备择假设下响应变量不是相互 独立的,所以检验( 2 8 ) 并不标准 检验( 2 9 ) 的广义形式是: h o :元= 磊 v 8 q :见人c 【o ,0 0 ) , ( 2 1 0 ) 其中人可以是 o ,o o ) 的任意子集我们考虑人下列的情况:固定的 ) , 凡,( 凡,0 0 ) 和 五凡:名【o ,) 这种形式的检验可以转化为求兄的置信区间 我们通过寻找似然比检验( l r t ) 统计量的有限样本分布来检验上述假设为了简单起 见,我们首先利用l r t 来检验假设( 2 8 ) 对于约束似然比检验可以类似得到模型( 2 7 ) 的对数似然函数形式如下: l。g三(,五,。詈)=丢一,zl。g。三一l。gii一!竺二二二竺竺二产), ( 2 1 1 ) 且l r t 定义如下: l r t = 2 s u p l ( f l ,见,2 ) 一2 s u p l ( f l ,见,吒2 ) 在备择假设下,通过固定兄,且和吒2 满足一阶最小条件,我们可以得到似然估计: 夕( 五) = ( x7 1 匕一1 x ) 一1 x r 1 w ,( 五) = 形一彳夕( 兄) ) r 巧1 一x 夕( 五) ) 刀, 将这两个表达式带入( 2 9 ) 式,得到 ”( 力) = - l o gv l - n l o g ( w 7 巧1 只) , 其中只= 厶一x ( x r 巧1 x ) 。1 x 7 1 吁1 在零假设下,模型变为标准线性回归模型,令五为矩阵x 的前p - q 列列向量构成, s = l 一五( 五7 墨) 1 矸,则l r t 统计量为: l r t = s u p nl o g ( w7 1 s ) 一nl o g ( w7 巧吁1 只) 一l o gv i1 丑乏o 下面给出检验假设( 2 8 ) 的r 瓦统计量的谱分解表达式定义: 胛印l o g 1 + 器) 一驴k ( 1 + 帆a 其中圯( 五) 和见( 兄) 在定理2 1 中给出定义 定理2 1 若t 和皇。分别是矩阵2z r r z 2 和2z 7 z 2 的k 个特征值,其中 t o = 厶一x ( x7 1 x ) 一x7 1 ,则 锻幺叶嚣卜s 脚u p 胁 其中u 。n ( 0 ,1 ) i i d ,s = 1 ,k ,q n ( 0 ,1 ) i i d ,s = 1 ,n - p ,记号= 表示同分布, 必) = 喜丧霹州伽删0 9 s 石2 + ,茎,霹 由式( 2 1 2 ) 表示的分布取决于两个k k 阶矩阵的特征值段埘和点,。只要我们计算 出这些特征值,很快就能模拟出该分布下面我们给出一个简便的算法来模拟l r t 的有限 样本分布 算法: s t e p1 选取z 可能的值,定义0 = 五 厶; s t e p2 模拟k 个服从彳分布的随机变量彳,咴2 令& - - e 7 ,。霹; s t e p3 与s t e p1 无关,枞a n - p - k 个服从靠p f 分布的随机变量咴2 小,罐p , 以 p = 三西; s t e p4 与s t e p1 , 2 无关,模拟帜从局2 分布的随机变量“? ,2 ,x q = :l “:; s t e p5 对每个丑计算 牝,= 喜最圳轳喜击峨即 s t e p6 在a ,丸中找出使得z ( 丑) 取得最大值的九。; s t e p7 计算 朋驴烈u 棚l o g ( 1 + 毒专) s t e p8 重复s t e p s2 7 该算法一个重要的特征是它的运算速度取决于随机效应数k ,而不是观测数刀与l r t 类似地,我们给出限制似然比检验( r l r t ) ,限制对数似然函数的形式如下i , ”( 五) = 一去 l o gi l + l o g x7 一x l 一( 门一p ) l o g ( w 7 只7 巧。1 只) ) 扬州人学颂l :论文 1 0 r l r t 的定义方法与l r r 类似,l r r 是通过似然函数,而r l r t 是通过限制似然函 数由于魁r 乙是在拟合出固定效应后利用残差的似然,因此限制似然比检验适合于在零假 设和备择假设下固定效应都相同的情况所以在假设( 2 9 ) 下我们给出: 赳尺乙= d 掣( 唧) l o g 1 + 粼) 一善kl o g ( 1 + ) 】 ( 2 1 3 ) 这里的记号与定理2 1 中的一样与l r l 情况类似,r l r t 的有限样本分布也可以通过有效 的模拟算法得到 第三章非线性模型的随机效应存在性检验 非线性回归模型的应用的出现源自根本理论原则或由受过训练的主观选择的统计员 从拟合优度检验的角度来看,这些都是零假设模型一旦数据可用,统计检验科用于证实 或废止原先的假设 现在,主要有三种方法说明拟合优度检验是一个零假设回归模型,标准的做法就是 巢空参数模型为各模( 有时称为全面模型) 即假设真实的和使用似然比检验( l r t s ) 这种做法是在线性回归中是非常流行的当一个j 下确的各模是可用的时候,这种做法是有 意义的然而在某些情形下,是不可能找到一个正确的选择参数模型 第二种方法就是根据零假设模型和基准测试的统计数据估计残值来获得残值的回归 分析b r o w n ,d u r b i n 和e v a n s ( 1 9 7 5 ) 提出了著名的基于递归残差的c u s u m 统计量以及 和c u s u m 统计量类似的1 9 6 9 年由g a r d n e r 提出基于最4 , - 乘估计残差的q s 统计量1 9 7 8 年,m a c n e i l l 对g a r d n e r 的结果进行了推广1 9 9 1 年p e r r o n 为了检验偏离多远趋势的时 间序列对m a c n e i l l 的结果又进行了一次推广s t u t e ( 1 9 9 7 ) 介绍了基于残差的应用显著 经验过程的检验,随后d i e b l o t 和z u b e r ( 1 9 9 9 ) 介绍了非线性异方差回归模型的检验 另一类基于残差的检验的v o nn e u m a n n 型统计量由h a r t 于1 9 9 9 年提出的这类检验的优 点是不需要一个规范的替代模型,希望能检验到缺乏合适一般形式的模型然而,如果检 验仅基于零假设而忽略了可能的备择方法的话就有可能失去关于参数检验方面的权威 我们的方法就是把参数回归嵌入到一个更大的,半参数族( 例如,参数非线性回归模 型加上非参数样条) c l e v e l a n d 和d e v li n ( 1 9 8 8 ) ,a z z a li n i 和b o w m a n ( 1 9 9 3 ) ,h a r t ( 1 9 9 7 ) , h a r d l e ,m a m m e n 和m u l l e r ( 1 9 9 8 ) ,c r a i n i c e a n u 和r u p p e r t ( 2 0 0 3 ) ,c r a i n i c e a n u ,r u p p e r t , c l a e s k e n s 和w a n d ( 2 0 0 3 ) 都利用这种方法来检验多元回归模型但是将这种方法推广到非 线性回归还不够完善由于在零假设情况下,全参数和检验统计量的分布通常是容易获得 的通过指定一个灵活的半参数替代的权威检验可以做进一步的改进因此需要一个权威 的比较来证实这个猜想 在这里,我们将要研究似然比和限制似然比检验针对非参数的一般备择模型来检验 非线性回归模型的零假设对于非线性模型意味着响应向量的条件均值有一个关于参数的 非线性函数形式我们将利用基函数( 例如,截断的幂函数或惩罚样条的b 样条) 我们将 使用非线性函数的一阶泰勒近似来获取近似的线性模型,然后利用线性模型的l r t 或r l r t , 比如,参考c r a i n i c e a n u 和r u p p e r t ( 2 0 0 3 ) 的研究由于m l e 低估了惩罚样条的光滑参数, 扬州人学硕 :论文 1 2 我们会发现l r t s 作用很小因此我们使用r l r t 而不是用l r t 利用非线性m l e 的条件均值的一阶泰勒展开来线性化非线性模型是获取近似的回归参 数区间的标准方法无论这种检验对于一个特定的基于参数检验非嵌套竞争机型是否成 立,我们都使用泰勒近似作为零假设模型的拟合优度检验程序我们把这两条曲线画在同 一个数据图上,一般情况下,这两个图像在视觉上是有很大差别的假设足够大的样本是 可用的,并且这个非线性曲线足够光滑我们针对半参数备择模型关注近似的线性模型 3 。1 针对一般替代的非线性回归模型的检验 这一部分介绍检验零假设的参数非线性回归函数和一般的非参数备择模型 假设我们要检验 凰:】,= l r + f ( x ,艿) + g , ( 3 1 ) 其中三是进入线性模型的矩阵变量,厂( x ,万) = 厂( 置,万) ,厂( 矗,万) 7 ,厂( x ,万) 是关于参数 万的非线性函数,玎是观测值总数x 的第l 行向量是# 1 ,s n ( 0 ,2 ) 定义= ( y r , 67 1 ) 7 ,磊= ( 群,劈) 为( 3 i ) 中i 拘m l e 首先我们在舌。处用一阶泰勒展开模型( 3 i ) 中的非线。l 生部分f ( x ,万) ,厂( x ,万) 的线性 泰勒展开近似的等价于: 聊( 耶) = 小,最) + 昙m ,) ) 7 1 ( 万一杰) ( 3 2 ) 模型( 3 1 ) 中的线性部分回归是不变的,这是由于一阶泰勒近似并不影响线性函数下面 我们设定是个常数,m ( x ,万) 是关于万的线性函数用如下零假设检验代替( 3 1 ) : h o :】,= l y + m ( x ,万) + g , ( 3 3 ) 其中m ( x ,8 ) = 聊( 而,万) ,聊( ,万) 7 1 ,令r 参数万的数量,矽是刀f 的空间矩阵且行向量 有如下的等价形式: 吩 矗地籼告盹瓤 且j ,= 】,一厂( x ,文) + 杰,则假设检验( 3 3 ) 近似的等价于如下的线性模型: ) ,= 三y 4 - 矽占4 - 占( 3 4 ) 第二步我们把函数m ( x ,艿) 嵌入到一个更大的函数族里并且针对一般替代利用 r ( l r t ) s 方法来检验,线性部分( 3 2 ) 需要定义r l r t s ,不过在作l r t s 时可以忽略它接下 来我们将要考虑在假设条件下l r t s 存在的严重问题,而使用r l r t s 时是可取的 为了简单起见,我们假设变量是一维的并且记为x 来代替x ,多元的情形我们稍后作 讨论为了实现模型的替代,我们将要考虑具有足够灵活性的一大类样条函数和适合检验的 一类样条函数: s ( x ,p ) = + q + 件x p + b k ( x - k , ) f , ( 3 5 ) 其中秒= ( a o ,口一,6 1 ,k ) r 为回归效应的向量,毛 乞 0 , 可以证明在这种情形下的l r t 分布实际上指向0 ,这是因为极大似然估计几乎处处识 别零假设模型c r a i n i c e a n u ,r u p p e r t 和v o g e l s a n g 计算了当吒2 保持不变,2 增大时,l r t 指向0 的概率并证明这个概率慢慢的趋向于0 ,这意味着m l 把错误的零假设模型看做真正 的模型,因此这个是不可取的另一个问题是当零假设模型的分布渐进于0 时是很难给出口 水平检验的其中一个解决办法就是把模型替代作为二次的而不是线性样条: r h a :】,= y o 4 - y l x - - 口2 x 2 + b k ( x - - k k ) :+ 占

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论