(应用数学专业论文)带右删失数据的非线性随机效应模型异方差性检验.pdf_第1页
(应用数学专业论文)带右删失数据的非线性随机效应模型异方差性检验.pdf_第2页
(应用数学专业论文)带右删失数据的非线性随机效应模型异方差性检验.pdf_第3页
(应用数学专业论文)带右删失数据的非线性随机效应模型异方差性检验.pdf_第4页
(应用数学专业论文)带右删失数据的非线性随机效应模型异方差性检验.pdf_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

张君芹带右删失数据1 线随机效应模型的异方差性检验 里 扬州大学学位论文原创性声明和版权使用授权书 学位论文原创性声明 本人声明:所呈交的学位论文是在导师指导下独立进行研究工作所取得的研 究成果。除文中已经标明引用的内容外,本论文不包含其他个人或集体已经发表 的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。 本声明的法律结果由本人承担。 学位论文作者签名:躲纤 签字日期:og 年6 月荔日 学位论文版权使用授权书 本人完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向 国家有关部门或机构送交学位论文的复印件和电子文档,允许论文被查阅和借阅。 本人授权扬州大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学 技术信息研究所将本学位论文收录到中国学位论文全文数据库,并通过网络 向社会公众提供信息服务。 一虢獬于 签字日期: 矽8 年6 月吵日 导师签名痞信季 签字日期:舻年6 月i 日 张君芹带右删失数据非线随机效应模型的异方差性检验三 带右删失数据的非线性随机效应模型异方差性检验 中文摘要 随着现代科学技术的迅猛发展,统计分析理论也在不断发展和完善。在统计 分析过程中,建立数学模型是十分重要的研究课题,如炼钢厂的工程师们希望有 一个炼钢过程的数学模型,以便实现计算机自动控制;气象研究工作者要根据气 压、雨量、风速的数学模型来预报天气;从事城市规划工作的专家们更需要建立 一个包括人口、交通、能源、污染大系统的数学模型,为领导者做出城市发展规 划决策提供科学依据。在复杂系统中,具有很多不确定性的因素,建立数学模型 时常常使用概率统计模型,从而统计推断方法成为系统分析中极其重要的分析方 法。通常人们习惯应用回归分析的手段来处理这一类的问题。回归分析的理论及 方法发展的非常快,它不仅成为统计学的一个重要分支,而且被人们广泛的应用 于各个领域。随着回归分析理论的不断发展,随机效应模型已成为目前重要的研 究课题。 随机效应模型包括线性随机效应模型和非线性随机效应模型,随机效应模型 的方差包括受试群体内部及受试群体之间两项方差,近年来有大量的文献研究混 合线性效应模型的参数估计、统计诊断、影响分析等问题,在这些研究中,方差 齐性的假设是经常被采用的。s e b e r 和w i l d ( 1 9 8 9 ) 年通过研究几个实例,指出在回 归分析中方差齐性的假设有时是不合适的,因而要对方差的齐性作检验。对线性 和非线性回归模型作方差齐性的检验已有许多结果。z h a n g 和w e i s s 讨论了线性混 合效应模型的异方差性的假设检验问题;非线性混合效应模型是线性混合效应模 型的自然推广,由于非线性混合效应模型的数学处理比较困难,因而非线性混合 效应模型的研究成果不是很多,但一直有学者在探索。而本文则主要讨论了在非 线性随机效应模型的基础上发展而来的含右删失数据的非线性随机效应模型的参 数估计以及方差齐性的假设检验问题。 扬州人学硕士学位论文 2 一 本文第一章主要讨论了随机效应模型的发展历程,由此引出带右删失数据的 非线性随机效应模型,并概括介绍本文所研究的工作。 第二章对带右删失数据的非线性随机效应模型中的参数进行了估计,并给出 了参数的性质,最后还给出了改进后的g a u s s n e 叭o n 迭代算法。 第三章讨论了带右删失数据的随机效应模型的异方差性检验,分别讨论了群 体内、群体间和多变量的异方差性的检验问题,得到了检验的s c o r e 统计量,并讨 论了三种情形下,相应的s c o r e 函数之间的关系,最后给出了一个数值例子。 关键词:非线性;右删失;参数估计;方差齐性;s c o r e 统计量 张君芹带右删失数据非线随机效应模型的异方差性检验 v a r l a n c en o m o g e n e l t ve x a m l n a t l o n0 i t 了jj n o n l i n e a rr a n d o me f f e c tm o d e l sw i t h 砌g h t c e n s o r e dd a t a a b s t r a c t 3 一 w i t hm er a p i dd e v e l o p m e n to fs c i e n c ea i l dt e c h n o l o g y ,t h et h e o r ya j l dm e t h o do f s t a t i s t i c a la 1 1 a l y s i sa r ec o m i n u o u s l yd e v e l o p e d i nm ep r o c e s so fs t a t i s t i c a la n a l y s i s ,i ti s av e 巧i m p o r t a n tr e s e a r c ht o p i ct oe s t a _ b l i s ham a m e m a t i c 矾m o d e l f o re x 锄p l e ,t h e e n g i n e e r s o fs t e e l 、v o r k sw a n tt oh a v eam a t h e m a t i c a lm o d e la b o u tt h e p r o c e s so f s t e e l m a l ( i n gt oi r n p l e m e mc o m p u t e ra u t o m a t i cc o n l i r o l ;w e a t i l e rr e s e a r c h e r sw a i l tt o h a v eam a t h e m a t i c a lm o d e la b o u td e p r e s s i o i l ,r a i n f a l la u l d 丽n ds p e e dt of 0 r e c a s t w e a t h e r ; t h ee x p e r t so nm a np l 砌n gw a n tt o1 1 a v eam a t h e m a t i c a lm o d e la b o u ta 1 a r g es y s t e mi n c l u d i n gp o p u l a t i o n ,t r a m c ,e n e r g ya i l dp o l l u t i o nt op r o v i d em es c i e n t i f i c b a s i st o h e l pl e a d e r s l l i pt o m a l 【eu r b a nd e v e l 叩m e mp l a i l :n i n ga n dd e c i s i o n - m d 虹n g m a n yc o m p l e xs y s t e m su s u a l l yc o n t a i nu i l c e n a i n t ) ,s op r o b a b i l i s t i ca 1 1 ds t a t i s t i c a l m o d e l sa r ec o m m o n l yu s e d ,h e n c et 1 1 em e t h o d so fs t a t i s t i c a li n f e r e n c eb e c o m et 1 1 e i m p o r t 雒tm e t h o d si ns y s t e m sa n a l y s i s u s u a l l yp e o p l eu s e dt 0u s er e g r e s s i o na 1 1 a l y s i s t od e a l 淅t hm e s ep r o b l e m s i tn o to n l yb e c o i i l ea l li m p o m u l tb r a i l c ho fs t a t i s t i c s ,b u t a l s ow i d e l yu s e di no t h e rf i e l d s w i t ht h ed e v e l o p m e n to fr e g r e s s i o nt h e o 巧,t h e 啪d o m e f f e c t sm o d e lh a sb e c o m ea ni m p o r t a n tr e s e a r c ht o p i c r a n d o me f f e c t sm o d e li n c l u d e sl i n e a ra n dn o n l i n e a rm o d e l t h ev a r i a n c eo f 姗d o m e f f e c t sm o d e l i n c l u d e s 、) r i m i n d i v i d u a la n di m e r i n d i v i d 吼1v a r i a b i l i 够i nr e c e my e a r s , t h e r ei sa1 a r g en u m b e ro fl i t e r a t u r e so nt h ep a r 锄e t e r se s t i m a t e ,s t a t i s t i c sd i a g n o s i s , i m p a c ta 1 1 a l y s i si nl i n e a rm i x e de f 佗c t sm o d e l s ,i nt h e s es t u d i e s ,t h eh o m o g e n e i 够o f v a r i a i l c ea s s 啪p t i o ni so r e nu s e d s e b e r 锄dw i l d ( 1 9 8 9 ) s t u d i e ds e v e m le x 锄p l e s , 扬州大学硕士学位论文 4 一 p o i n t i n go u tt h a tt h eh o m o g e n e i t yo fv a r i a n c ea s s u m p t i o ni so r e ni n a p p r o p r i a t ei nt h e r e g r e s s i o na n a l y s i s t h e r e f o r e ,、v em u s tt e s tt h e i rh o m o g e n e i 锣o fv a r i a n c e t h e r ea r e m a n yr e s u l t so nm eh o m o g e n e i t yt e s to fv a r i a i l c ei nt h e1 i n e a ra i l dn o n l i n e a rr e 铲e s s i o n m o d e l z h a n ga 1 1 dw e i s sd i s c u s s e dt h eh e t e r o s c e d a s t i c i t yh y p o t h e s i st e s t i n go f l e l i n e a rm i x e dm o d e l t h en o l l l i n e a rm i x e de f f e c t sm o d e l i sm o r ed i m c u n ,a 1 1 dt h e r ea r e n o tt o om a n yr e s e a r c hr e s u l t s t h i sp a p e rm a i l l l yd i s c u s s e st h et e s to fh o m o g e n e i t ) ro f v a r i a l l c ep r o b l e m si nt h en o n l i n e a rr a n d o me f f e c t sm o d e l 、研t hr i g h t c e n s o r e dd a :t a , w h i c hi sd e v e l o p e df - r o mt h en o i l l i n e a rr a n d o me f f e c t sm o d e l c h a p t e r im a i n l yi n t r o d u c e st h en o m i n e a rr a m d o me f f e c t sm o d e l 谢t hr i 出一c e n s o r e d d a t a a n ds u m m a r i z e so u ri e s e a r c h 、 ,o r k t h es e c o n dc h a p t e rd i s c u s s e sp a r 锄e t e r se s t i m a t ei nt h en o n l i n e a rm d o me f 佗c t s m o d e lw i t ht h er i 曲t - c e n s o r e dd a t a ,a n dt h eg a u s s - n e 讯o ni t e r a t i v ea l g o r i t h mi sg i v e n , m e a n 枉l et h ei m p r o v e dg a u s s 埘e o ni t e r a t i v ea l g o r i t l u i li sd e v e l o p e d c h a p t e ri i i c o v e r sh e t e r o s c e d a s t i c i t ) rt e s ti nt h et h er a i l d o me f f e c t sm o d e lw i t h r i g h t - c e n s o r e d 出妇 s e v e r a lf r a m e w o r k so f h e t e r o s c e d a s t i c i t ) ,t e s t , s u c ha s w i t h i n - d i v i d 砌a 1 1 di n t e r - i n d i v i d 砌h o m o g e n e 时s c o r es t a t i s t i c sa r eg i v e n a tl a s t ,a n 啪e r i c a le x a n l p l ei sg i v e nt oi l l u s t r a t e l ea v a i a b l i 够o fo u rr e s u l t s k e yw o r d s :n o n l i n e a r ;r i g h t c e n s o r e d ;p a r 锄e t e re s t i m a t i o n ;h o m o g e n e i t ) ,o fv a r i a n c e ; s c o r es t a t i s t i c s 张君芹带右删失数据非线随机效应模型的异方差性检验三 第一章绪论帚一早 三百了匕 在工农业生产、社会生活和科学研究过程中,经常会遇到各种类型的不同的 实验数据,这些实验数据为我们认识客观世界内在规律,研究变量之间的关系, 预测客观世界的发展,提供了丰富的材料和科学的依据。但是,要想从这样一些 庞大的数据堆中找到有用的东西,得到可靠的结论,就必须对实验数据进行认真 的整理和必要的检验,从而便于揭露问题中存在的矛盾,找到解决问题的可能途 径。 随着现代科学技术的迅猛发展,统计分析理论也在不断发展和完善,在统计 分析过程中,建立数学模型是十分重要的研究课题,如炼钢厂的工程师们希望有 一个炼钢过程的数学模型以实现计算机自动控制;气象研究工作者要根据气压、 雨量、风速的数学模型来预报天气;从事城市规划工作的专家们更需要建立一个 包括人口、交通、能源、污染大系统的数学模型,为领导者做出城市发展规划决 策提供科学依据。在复杂系统中,具有很多不确定性的因素,建立数学模型时经 常需使用概率统计模型。 1 1问题的提出 生存分析就是对一个或多个非负随机变量进行统计分析,即根据观测到的数 据对一个或多个非负随机变量进行统计推断。非负随机变量常用来表示自然界、 人类社会或技术过程中某状态的持续时间。一种最常见的情况是,用非负随机变 量表示“寿命”( 技术产品的寿命或生物、人的寿命) 因而生存分析可以看成是 对寿命进行研究,是对寿命数据进行分析。生存分析对于产品寿命的评估、人和 生物寿命的研究、手术后人的寿命的预测等等都十分重要,因而生存分析的理论 和方法在工程上以及医学、生物学上都有广泛的应用价值,日益受到人们的重视。 生存分析不是孤立的研究某个个体的寿命,而是研究一批个体的寿命。任何个体 的寿命多长带有偶然性,而一批个体的寿命多长就有一定的规律性。我们用t 表 示任何个体的寿命,把t 看作随机变量,t 的值依赖于个体。寿命数据有时是有意 扬州大学硕士学位论文 6 一 识地安排实验获得的,有的则是通过现场调查得到的,数据一般含有删失数据。 什么是“删失数据 呢? 删失分为“右删失、“左删失 和区间数据,在 进行观测或调查时,一个个体的确切寿命不知道,但只知道寿命大于l ,则称该个 体的寿命在l 是右删失的,并说l 是右删失数据;若个体的确切寿命不知道,但 只知道寿命小于l ,则称该个体的寿命在l 是左删失的,并说l 是左删失数据;区 间数据是指仅知观测数据落在某一区间中。右删失的情形在寿命观中极为常见, 其它的类型出现较少。怎样分析这些数据呢? 由于删失的引入,情况大为复杂。 普通的统计学只是讨论每个数据都是完全数据的情形。生存分析的一大特点,就 是讨论含有删失数据的情形,因而发展出许多新的统计方法,形成许多新的理论。 和普通统计学一样,生存分析的方法也主要分为两大类。当寿命总体知之甚少或 毫无所知时,采用参数方法。此外,还有半参数模型及相应的半参数方法,这是 比较新的分支,方兴未艾。一般说来,参数性方法可用于较小的样本,使用非参 数方法则必须有较大的样本。对于参数性方法而言,小样本情形的方法理论比较 完善,而对于非参数方法来说,有效的方法理论主要基于大样本理论。 1 2 国内外研究现状 1 2 1 随机效应模型研究回顾 国外关于随机效应模型方差分量估计较早的工作有h e n d e r s o n ( 1 9 5 3 ) ,h 弧l e y a n di t a o ( 1 9 6 7 ) ,p a t t e r s o na i l dt 1 1 0 m p s o n ( 1 9 7 1 ) 大量的研究工作是始于本世纪七十 年代,对于线性随机效应模型参数估计及方差分量估计的文献有h a n l e y ( 1 9 7 3 ) , c o r b e i la n ds e a r l e ( 1 9 7 6 ) ,j e n n r i c ha n ds 锄p s o n ( 1 9 7 6 ) ,h a r v i l l e ( 1 9 7 6 ,1 9 7 7 ) 等。特别是 h a n 哳1 1 e ( 1 9 7 6 ) 首先提出了约束最大似然估计( r e s t r i c te s t i m a t i o no f m a x i m u m l i k e l i h o o d ) 方法即r e m l 估计方法,对方差分量估计的研究有着深刻的影响。对于 模型的参数估计,h e n d e r s o n ( 1 9 8 4 ) 得到了最优线性无偏估计。h a r v i l l e ( 1 9 9 0 ) , h e n d e r s o n ( 1 9 9 0 ) ,r a b i n s o n ( 1 9 9 1 ) 概括总结了h e r d e r s o n 的方法,并将其应用到动物 育种领域。对于线性随机效应模型的参数估计及方差分量估计的算法与计算机实 张君芹带右删欠数据1 卜线随机效应模型的异方著性检验z 现。有关的论文有l a i r da i l dw a r e ( 1 9 8 2 ) ,l a i r d ,l a n g ea n ds t r 锄( 1 9 8 7 ) ,j e i u l r i c ha i l d s c l l l u c h t e r ( 1 9 8 6 ) 等。以上都是关于线性随机效应模型的研究。s e a r l e ,c a s e l l aa n d m c c u l l u c h ( 1 9 9 2 ) 在他们的著作中对线性随机效应模型的参数估计及方差分量的 估计作了系统的概括和总结。这本著作标志着线性随机效应模型研究的基本完善。 但对于非线性随机效应模型,有关的研究工作还比较少,对其研究的主要文献 有:韦博成,胡跃清( 1 9 9 4 ) 研究了非线性回归模型和异方差检验;韦博成( 1 9 9 5 ) 对加权非线性回归模型的s c o r e 检验及其局部影响作了分析;韦博成、宗序平 ( 2 0 0 1 ) 关于随机效应模型的影响分析;林金官、韦博成( 2 0 0 2 ) 非线性随机效应模 型的异方差检验等。 对于含有删失数据的研究国内外有大量的文献,b e t e n s k y ( 2 0 0 2 ) ,c a ia i l d b e t e n s k y ( 2 0 0 3 ) 研究了危险模型的区间删失数据,j i n ( 2 0 0 6 ) 研究了带有删失数据 的最小二乘回归模型,l i n ( 2 0 0 7 ) 对含有删失数据的小波估计量的极小化极大估计 量做了探讨、j i a n ( 2 0 0 8 ) 对含多种删失数据的半参数模型研究了其加权经验似然。 从以上可以看出,多数文献只对非线性模型和带删失数据的模型进行了单一 的研究,而对带右删失数据的非线性随机效应模型的研究较少。 常见的非线性随机效应模型有两种形式,一种形式为 y = j 嶙,p 、) + z u + s 另一种形式为 y i = f b i ,e l 、) + s i ,9 t = a l p + b i l l 其实第二种形式与第一种形式基本上是一致的。v o n e s h ( 1 9 9 2 ) 讨论了第二种形式, 且可改写成 】,= 厂( 彳,) + z ( ) “+ s 非线性回归模型是统计学的重要热门课题之一。指数族非线性模型 ( e x p o n e n t i a lf a m i l yn o n l i n e a rm o d e l s ,简记为e f n m ) 首先由c o r d e i r oa n dp a u l a ( 19 8 9 ) 和c o o ka i l dt s a i ( 1 9 9 0 ) 提出,它实际上是一种常见的广义非线性模型;是广义线性 模型( g l m ) 和正态非线性模型的自然推广。w e i ( 1 9 9 8 ) 详细讨论了该模型的统计推 扬州大学硕+ 学位论文 断、几何方法以及统计推断。如果数据可以重复测量,经常需要考虑随机效应的 影响。 1 3 本文的研究工作 基于以上综合分析,本文对带右删失数据非线性随机效应模型建立一套较为 系统和行之有效的统计理论与方法。 第二章讨论了非线性随机效应模型和右删失数据模型,对既有随机效应又有 右删失数据的非线性模型进行了研究,给出以上模型中固定效应参数的估计以及 g a u s s - n e o n 迭代算法和改进的g a u s s - n e 吼o n 迭代算法。 第三章讨论了带右删失数据的随机效应模型的异方差性检验,分别讨论了群 体内、群体间和多变量的异方差性的检验问题,得到了检验的s c o r e 统计量,并讨 论了三种情形下,相应的s c o r e 函数之间的关系,最后给出了一个数值例子。 综上所述,本文较为系统地研究了非线性随机效应模型的统计分析方法,用 随机展开方法,给出模型中固定效应的参数估计以及迭代算法,最后给出了带右 删失数据非线性随机效应模型的异方差检验的s c o r e 统计量。 张君芹带右删失数据非线随机效应模型的异方著性检验! 第二章带右删失数据的非线性随机效应模型的 参数估计 本章讨论了非线性随机效应模型和右删失数据模型,并对既有随机效应又有 右删失数据的非线性模型进行了研究。 2 1带右删失数据非线性模型的参数估计 假设y 是一个+ 垅) 维的响应向量,“是g 维的随机效应因子,假设“服从正 态分布( o ,盯2 人) ,m i 甜,y :1 y 。脚i “相互独立,且y 。k ( ,盯2 ) ,不失一般 性,我们考虑最后聊个生命时间数据由于试验的终止却未寿终而删失了。z 阢在随 机效应下的均值为 f = ( x ,) + z j “, f = 1 ,2 ,刀+ 肌 ( 2 1 1 ) 其中是p 1 未知固定效应向量,令 舢,= 去唧; 缈( y ) = l 矽( ,) 出; w 仁学; 咖,= 筹, 盯够iy ) 联合似然函数方程由下式给出 三= 专鼽,鼠加,志唧 专m 1 “) , 亿, 对数似然函数可以写成 = 一半l 0 9 2 舸2 一三喜“g 一专m 饥 ( 2 m ) 上式方程对求导,可得 扬州大学硕十学位论文 易= 吉喜等泸c 只一厂c ,一和,+ 吉茎f n ,等泸 1 0 2 吉喜警( g f 川枷心m = 扣( g - m 脚刊,( 2 1 4 ) 其中g = ( 9 1 ,9 2 ,g 脚+ 。) 7 ,彳= 可( x ,) 筇r , y f ,f _ 1 ,2 ,行 g ,21 田( ,) + 厂( x 。,) + z 伽:,2 + 1 ,+ 肌 ( 2 1 4 ) 对“求导,可得 昙= 吉喜“g ,一厂( 薯脚一和) + 吉,茎,钗t ) 一古人- l “ = 古融驴m 胁和一吉胁:o ; 历= ( z r z + 人- 1 ) - 1 z7 ( g 一厂( x ,) ) , 代入到( 2 1 4 ) 得: 易= q - 1 ( 吖励, 叫+ 抛7 , 则模型等价于 ( 2 1 5 ) g = ( ) + p ,p ( o ,盯2 q ) , ( 2 1 6 ) 其中g 中的“形式上用历表示。这样化为普通的非线性回归模型处理。 前面介绍了带右删失数据的非线性随机效应模型,参数的推断可以,( ) 为 基础,下面来讨论参数的估计方法及其有关性质。 引理2 1 对于j 下态非线性随机效应模型( 2 1 5 ) ,似然函数,( ) 关于参数夕 的s c o r e 函数与观察信息矩阵分别是 张君芹带右删欠数据= | f 线随机效应模型的异方著性检验旦 咿) = 易寺瓶l ( g 讹绷; ( 2 1 7 ) - j ( 历= 一器= 吉。7 1 。一古k 7 q - 1 矽】, ( 2 8 ) 毒中d = 彭! 1 8 、) 8 p t ,e = g f b ,p 、) ,砬= 砭! l | 3 、) ,w = 8 2f 0 | b 、) a l i b 8 p t 为n xp xp 立体阵,q = ,+ z 人- 1 z7 1 ,方括号乘积l i 】可参见w e i ( 1 9 9 8 ) q : 杉:j ,( f ,) o ) + 矽z ( f ,) f = 1 ,2 ,z 杉2 盟掣,:置0 所 l0 2 ( ,) p 肘l ,肼扰 证明:由以上公式可知 和,= 吉障警亿砒叫 :占d r ( z 一厂( x ,) ) :三d r p ; 盯 协蚓一警铲+ 警讹叫 + 蚓掣地揣掣c 一吉铲m ,訾io 考丢8 p 国1q i 、)、a a p i 。 、“8 p 8 | b i :一土l 争堑! 兰! :旦堑堡:旦+ 亨笪堕:旦翌堑! 尘g2 受堑1 2 堑! 兰! ! 壁! i 盯2i 鲁 筇筇7 1。,象,筇 2 ( f ,)筇rl 扬州大学硕十学位论文 1 2 _ 一 + 吉融砒脚,警+ 。篓晔m 册m ,警 = 一古d 7 q 。1 。+ 吉k 7 p 】 2 2算法 根据引理2 1 ,的参数估计采用改进g a u s s n e w t o n 迭代法,具体的算法如 下: ( 1 )首先给出参数的初始值o ,o 不妨取为( d7 1 d ) 1d r 】,; ( 2 )极大似然估计矽满足以下条件 7 ( 夕) = o ; ( 2 2 1 ) ( 3 ) 求解参数,由t a y l o r 展开,可得 ,( 夕) ,( ) + j ( ) ( 夕一) , ( 2 2 2 ) 由( 2 2 1 ) ( 2 2 2 ) 可得 夕+ ( 一j ( ) ) 一1 ,( ) 以去d r 代替一j 。( ) ,则g a u s s n e w t 。n 迭代公式为 。+ ( d7 1 q 一1 d ) 一1d r ( z 一厂( x ,) ) k :p , ( 2 2 3 ) 若l 川一,| 小于给定的精度,则停止迭代,否则重复上述( 3 ) 步骤,直至达到 给定的精度。 由以上方法得到的结果可能会不收敛,则可使用以下改进的g n 迭代法。参 见韦博成( 2 0 0 6 ,只。) 改进的g n 迭代法的基本思想是希望,( ) 能尽快地向,( ) 的最大值,( 夕) 逼 张君芹带右删失数据非线随机效应模型的异方差性检验 里 近,直观上,应当要求,( ) ,( 川) 逐步增加,直至,( 夕) 。但是上述普通的 g n 迭代法不一定具有单调递增性质,及以下不等式不一定成立: ,( 川) :,( + d ( ,) ) ,( ) ,d ( ) : - 。( ) r 1p ( ) 】 在改进的g n 迭代法中,改取万川= + 丑d ( 。) ( 取适当的乃) 使得 ,( ) ,( 川) 恒成立,即,( 分川) 保持递增性。以下引理说明:存在丑,使得这一 递增性质恒成立。 引理2 2 若一? 。( ) o ( 即正定) ,( ) o ,d ( ) = 【- j ( ) r 1 【( ) 】,则必存 在五 o ,使得当万= + 加( ) 时,有,( 万) = ,( + 加( ) ) ,( ) 证明:令g ( 兄) = ,( + 加( ) ) ,则由微分公式可得 ,( 夕) 一,( ) = g ( 五) 一目( o ) = 口( o ) 旯+ 觑= k ( o ) + 口k , ( 2 2 4 ) 其中当力一o 时,有口专o ,为求g ( 五) 的导数,把向量+ 肋( ) 和d ( ) 的 第,个分量用其下标表示,则牙( 0 ) 可表示为 们,= 喜 参华l = 喜争即, :p ( ) r d ( ) = p ( ) 7 1 - ,( ) r 1p ( ) o , 因此当五充分小的时候必然有口( 0 ) + 口 o ,由( 2 2 4 ) 式可得: ,( 夕) 一,( ) = 瞄( o ) + 口p o , 扬州人学硕士学位论文 1 4 _ 一 ,( 夕) = ,( + 见d ( ) ) ,( ) 证毕。 由改进的g - n 法,得到以下算法: ( 1 ) 首先给出参数的初值o ,计算域= d ( o ) ,其中 d ( ) :【7 ( ) 础取九使 ,( 。+ 九d 。) 2 畏籍,( 。+ 弛) ,( 。) ; 由引理2 2 知这样的厶必存在。 ( 2 ) 取1 = o + 厶d 0 ,计算d 。= d ( 1 ) ,取 使 ,( 1 + 五d ,) 2 理嚣7 ( 1 + 加) ,( 1 ) ( 3 ) 取2 = 1 + 磊d l ,计算d := d ( 2 ) ,求如 继续以上步骤,则必有 ,( o ) ,( 1 ) ,( 2 ) ,( ) z ( “1 ) y 。 令 扬州人学硕士学位论文 船,= 赤唧 一孥) 伊( y ) = l 矽( f ) 衍: w 仁谱; 毗,= 器, o m i 9 y ) 1 6 一 联合似然函数方程由下式给出 三= 古舭,飘砸,志唧 杀m 1 “) , m , 对数似然函数可以写成 咿办卜半崦2 砸2 一三和”喜嘉柏2 + 莹删卜寺“ 一半嵫2 舾2 一喜扣 净+ ,- 寺玑 , 上式方程对求导,可得 易= 古喜击等泸c y ,一厂c ,一和,+ 吾茎,塑泸 = 吉喜去等幢讹棚_ 班专职吖舻妣( 3 ) 其中g = ( g l ,9 2 ,g 。+ 。) 7 ,么= 矽( x ,) 筇厂, iy ,f 1 ,2 ,z g f 2 1 田( f ,) + 厂( x ,) + z - “,f _ 即+ l ,棚+ 朋 ( 3 1 4 ) 对“求导,可得 张君芹带右删失数据非线随机效应模型的异方著性检验旦 鲁= 吉喜吉杈y ,一厂c 励一衫“,+ 吉茎去弘 ,一古人一1 “ 专喜扣圹m 册和,专矶一o , 石= ( z7 m 。1 z + 人- 1 ) 。1 z7 m 。1 ( g 一厂( x ,) ) , ( 3 1 5 ) 代入到( 3 1 4 ) 得: 易= 弘q _ 1 ( 吖例, q = m + 抛7 , 则模型等价于 g = 厂( ) + p ,p ( 0 ,盯2 q ) , ( 3 1 6 ) 其中g 中的甜形式上用万表示。这样化为普通的非线性回归模型处理。 下面讨论的主要内容在于:m 的对角线元素是否全相等,即方差的齐性假设 检验。通常情况下,常用的模型为: = 厂( ,) + z ;“,+ 毛,“,( o ,盯2d f ) ,占f ( o ,盯2 聊口) , ( 3 1 7 ) 其中勺与“,相互独立,f _ 1 ,2 ,刀;= 1 ,2 ,2 ,= ,z ,为p 维固定效应 向量,“,为g 维随机效应系数,勤,z 分别为p ,g 维设计向量,厂为已知的两阶可 微函数,d ,为g g 正定矩阵若厂( ,) = x ;时,即为线性混合效应模型,其异 方差检验问题见 3 2 ;若b = o 且,2 。= 1 即为加权非线性回归模型,其异方差检验 问题见 6 有右删失数数据。 模型可写成如下向量形式: ”= ( 置,) + z j “,+ q , ( 3 1 8 ) 其中以= ( 。,只:,y 以) 丁,厂( x ,夕) = 驴( x n ,) ,厂( x ,:,) ,厂( x ,) y , 扬州大学硕士学位论文 x ,= g :,x 五,x :e 。p ,z ,= ( z j ,z 二,z :,e 。,s ,= g ,。,s ,:,占加,y 此处咒中含若干右删失数据,不妨设其后后,个数据为右删失数据,此模型即为模 型( 3 1 1 ) ,相同讨论知:该非线性随机效应模型可归结为: 岛= 厂( 薯,) + q ,p ,( 0 ,盯2 q ,) 以下讨论带右删失数据的非线性随机效应模型异方差检验的三种情形: 1 ) 受试群体内部的异方差性即受试群体之间的方差保持不变: d f = d ,f = 1 ,2 ,z ,只有m ,的对角元素间可能不同,这时:q 。= m ,+ z 。d z 厂, 其中m ,= 坊昭( m 订,聊f 2 ,聊【册+ 。) 。) 为方差的权函数,且设研。= 聊( ,y ) ,为 尼阶已知向量,y 为七阶参数向量假设存在,使m ( ,) = 1 因此随机误 差的方差齐性问题可化为如下假设检验问题: 日。:y = 若d = 0 ,即随机效应部分不存在,该模型即化为 3 2 讨论的问题。 2 ) 受试群体之间的异方差性即受试群体内部的方差保持不变,而受试群体之 间的方差p 不一定相同,这时有: 吲删,蝎珥皿= 2 甜 其中d 1 。,= 聊,q 。,q l ,为g 。g 。阶矩阵,聊,= 肌( u ,y ) ( d ,为尼阶已知向量) 假设存 在,使对一切f 有:肌( q ,7 。) = 1 因此随机误差的方差齐性问题可化为如下假设 检验问题:h 。:y = 3 2 讨论的检验问题中,假设d ,= 聊,d 及p 的对角元素 相等均是本节讨论的一般假设情形的特例 3 )多变量异方差性既存在受试群体内部的方差异性也存在受试群体之间的 方差异性 本节讨论: 张君芹带右删失数据非线随机效应模型的异方差性检验 竺 妒珥弘匮甜 m f = 旃昭( f l ,聊1 f 2 ,聊1 咖+ 。) ,) ,且聊l p = 聊1 ( ,厂) ,d 1 = 耽2 ,d 1 1 , 聊2 f = 聊2 ( q ,y ) 且存在,使对一切f 有:聊1 ( ,) = 肌( 2 ( q ,) = 1 因此随机 误差的方差齐性问题可化为如下假设检验:日。:y = ;该情形也是z h a n g 和 w e i s s 所讨论的第三种假设的推广 记秒= ( y ,盯2 ,九( 口,6 = 1 ,2 ,g ,口6 ) ) ,d = ( 叱) 删,7 为兴趣参数, 其它为多余参数则秒的似然函数为: 妒m 一铷 三釉q ,| - 专喜倒印 其中c 为常数,q = 岛一厂( 置,) 通过,( 9 ) 即可求假设检验风的统计量 对三种检验问题,在假设日o :7 = 7 。成立的条件下,矽的f is h e r 信息阵的形 式均可表示为: ,j ,( 乡) = “ o 0 ,2 2 厶l 0 ,4 1 0 i l 3i l 4 0o i ”i 弘 i 惦l 诅 从而关于凰:7 = 的s c o r e 检验统计量为: c = ( 茜 r ,( 若 ) 蚕;,= c 厶。一厶,;1 。, c 3 - 9 , 其中若称为s c 。r e 函数,表示,( 目) 的逆阵耳1 ( 臼) 中与“所对应的子块, 厶= c ,。,厶= 2 ; 莎表示日。成立时参数秒的极大似然估计,由 1 3 , 扬州人学硕士学位论文 在日。成立时,近似地有:贮jz 2 ( 后) 2 0 - 一 设模型只存在受试群体内部的方差异性,而受试群体之间的方差保持不变, 即上面的问题1 ) ,此时有:q ,= m ,+ z ,d z _ ,其中m ,= 历昭( 聊f l ,z ,脚咖+ 卅) ) , = 肌( ,厂) 检验方差齐性即检验假设:h 。:y = 对,( 9 ) 求偏导数有: 等2 击善豫岫飞一丢喜唰蚴一1 ,2 ,矗; 等专耖吼;警一鲁+ 专挈吼; 筹= 专喜倒z 删吼一丢喜删z 成确, 口,6 = 1 ,2 ,g ,口6 矾= 券- ( 乳训风叫,m ( 铲l n , e 二表示第口行第6 列的元素为1 ,其余元素为。的 + 肌) ,( 刀+ 胴) ,阶矩阵令上 式为0 即得参数的极大似然估计所满足的方程,万表示臼在日。成立时的极大似 然估计,从而可得检验的三r 统计量为: 胀2 防砸籼。g f 筝 , ( 3 2 ) 蛳2 = 苷晦如净蚪“孬= 两断诤c 砌, 张君芹带右删失数据非线随机效应模型的异方差性检验 龟= g i f q l ,酗,a l = i 。n 。叭+ z l 西z :,蕊l = 豌l + z ? 西z j 由于在三尺检验中,同时需要计算歹和痧,而歹在实际计算中较难求出因而 在回归分析中,通常采用更加实用的s c o r e 检验统计量,它只需计算痧,它们都 以z 2 ( 七) 为渐近分布 下面推导日。的s c o r e 检验统计量 根据( 3 1 9 ) ,为了计算s c o r e 检验统计量,继续对,( 9 ) 求二阶导数有: 焘= 三薯帼i 1 矾蚪矾) 一丢喜帼i 1 儿) + 击莩衫掣虬掣q 一吉事蚪岫i 蛳 川,6 - l ,2 ,矗; 嚣= 一吉静蚪t + 吉喜时k 】; 辫= 参专挈咄; a p 2 ) 2 2 盯4 仃6 鲁_ “_ 矗= 三喜唰z ,删q 心删) 杀势叱删叱即p , 一古喜以q 1 酗爿q - 1 z ,或和- 1 ) 印咖户1 ,2 ,删轧矧; 矗一专喜 警卜蛐 ,;饥瞩2 盯2 鲁i 瞩厂矿1 1 黑:一击笠p q - 】竹爿“ 一= 一一 7p 土2,w土2p: a 7 。a 口2 2 仃4 鲁一“一7 矗= 三喜删酗z 耐蚴一言静q 椰z q m 地, a 2 , a p :a , a 2 , 8 p ,a d 。 a 2 , a 矿a d 。 扬州人学硕士学位论文 s ,f = 1 ,2 ,g ,j f ; 1疗+ 胂厂 一上丫i ,r 2 厶l o f = l 一上警 2 盯4 鲁 可( x ,) 矿( x 。,) 、r lq - l p ,; 1 p 酗- 吼 p q - l z ,耳,z ,7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论