




已阅读5页,还剩63页未读, 继续免费阅读
(概率论与数理统计专业论文)bartlett校正和校正经验似然的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要 大样本或渐近统计方法是统计推断中常用的统计方法,这是因为估计或检验统计量的 精确分布通常很难确定,我们必须利用其极限分布来作统计推断。基于一阶渐近分布的 大样本方法的精确性在样本量较小时可能较差,所以统计学中一个重要的问题是如何改 进这一方法。在这一论文,我们将考虑两种改进方法:b a r t l e t t 校正和校正经验似然。 我们首先对于生存分析中的c o x 比例风险模型,考虑其回归系数的w a l d 检验的 b a r t l e t t 型校正,证明了校正后的检验统计量收敛于卡方分布的速度为d ( n _ 1 ) ,并通过模 拟验证了它对w a l d 检验在小样本时的改进;然后,我们利用校正经验似然的方法来构造 c o x 比例风险模型中回归系数的置信域,证明了校正经验似然统计量的分布收敛于卡方 分布,通过模拟和基于一阶渐近分布的置信域进行比较,验证了前者对后者在小样本时 的改进。最后,我们将校正经验似然的思想应用于其他的非参数似然,给出了校正指数 型经验似然和校正指数型倾斜似然,证明了校正后的统计量收敛到极限分布) ( 2 的速度都 为o ( n 2 ) ,而我们的模拟结果也表明校正后统计量的置信域的覆盖率与校正前相比有较 大的提高。 关键词:b a r l e t t 校正c o x 比例风险模型w a l d 检验经验似然指数型倾斜似然指数型 经验似然 英文摘要 a b s t r a c t l a r g e8 a m p l eo ra s y m p t o t i cm e t h o d sa r ec o m m o nm e t h o d su s e di ns t a t i s t i c a li n f e r e n c e , s i n c et h ee x a c td i s t r i b u t i o n so ft h ee s t i m a t o r so rt e s ts t a t i s t i c sa r eu s u a u yd i 伍c u l tt o 矗n d , a n d r eh a et ou s et h e i ra s y m p t o t i cd i s t r i b u t i o i l sf o rs t a t i s t i c 越i n f 色r e n c e t h ea c c u r a c y o ft h el a ,r g es a m p l em e t h o d sb a s e do nt h ef i r s to r d e ra s y m p t o t i cd i s t r i b u t i o nm a vb e1 0 w t h e r e f o r e ,o n ei m p o r t a n tp r o b l e mi ns t a t i s t i c si sh o wt oi m p r o v et h e s em e t h o d s i nt h i s t h e s i s ,w ec o n s i d e rt w oo ft h em e t h o d ss u g g e s t e dt oi m p r o v et h e m :b a r t l e t tc o r r e c t i o na n d a d i u s t e de m p i r i c a ll i k e l i h o o d 。 1 v v 色f i r s tc o n s i d e rt h eb a r t l e t tt y p ec o r r e c t i o nt ow a l dt e s tf 6 rt h er e g r e s s i o nc o e m c i e n t i 1 1c o x p r o p o r t i o n a lh a z a r dm o d e l i t sp r o v e dt h a tt h ed i s t r i b u t i o no ft h eb a r t l e t tc o r r e c t e d t e s ts t a t i s t i cc o n v e r g e st oc h i s q u a r ed i s t r i b u t i o ni na no r d e ro fd ( n 一1 ) m o n t e - c a r l os i m u 1 a t i o 璐a r ep e r f o r m e dt ov e r i 如t h ei m p r o v e m e n to fb a r t l e t tc o r r e c t e dw a l dt e s tw h e nt h e s a m p l es i z ei ss m a l l w bt h e na p p l yt h ea d j u s t e de m p i r i c a l l i k e l i h o o dm e t h o dt oc o n s t r u c t c o n f i d e n c er e g i o n sf o rt h er e g r e s s i o nc o e 伍c i e n ti nc o xp r o p o r t i o n a lh a z a r dm o d e la n d s h o w t h a tt h ed i s t r i b u t i o no fa d ju s t e de m p i r i c a ll i k e l i h o o ds t a t i s t i cc o n v e r g e s 乞oc h i s q u a r ed i s t r i b u t i o n m o n t 争c a r l os i m u l a t i o n sa r ea l s op e r f o r m e dt ov e r i 知t h ei m p r o v e m e n to fa d j u s t e d e m p i r i c a ll i k e l i h o o dc o n 丘d e n c er e g i o n st ot h a tb a 5 e do nf l r s to r d e ra s y m p t o 乞i cd i s t r i b u t i o n f i n a l l y 、v ea p p l yt h ei d e ao fa d ju s t e de m p i r i c a ll i k e l i h o o dm e t h o dt oo t h e rt y p e so fn o i 卜 p a r a m e t r i cl i k e l i h o o d i t ss h o w nt h a tt h ea d j u s t e de x p o n e n 七i a le m p i r i c a l1 i k e l i h o o da n d a d ju s t e de x p o n e n t i a lt i l t i n gs t a t i s t i c sw es u g g e s t e dc o n v e r g et oc h i s q u a r ed i s t r i b u t i o ni na n o r d e ro f0 ( n 一2 ) s i m u l a t i o ns t u d i e sw ep e r f o r m e da l s os h o wt h a tt h ec o v e r a g ep r o b a b i l i t y o ft h ec o n f i d e n c er e g i o n sb a s e do na d j u s t e dm e t h o d sa r em 。r ea c c u r a t et h a nt h o s eb a s e do n u n a d j u s t e dm e t h o d s k e y w o r d s :j e 7 0 n f e 毵c d 仃 e c 抚d 礼,( 珀zp r o p d 庀i o n 副 o z o 厄m o d e 2 ,w 么2 d e s t ,e m p i 死c o ff i 娩屁危d d d , e 叼,d n e 礼抚口ft i f t i 7 姆,e 5 印d 佗e 钆抚0 2e 唧西吨c 口2f i 七e f i d d d i i 中国科学技术大学学位论文相关声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作 所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任 何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究 所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即:学 校有权按有关规定向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 保密的学位论文在解密后也遵守此规定。 9 口二2 , f 、 作者签名: 年月日 第1 章绪论 第1 章绪论 假设检验和置信区间是统计推断的两大主题。通常由于检验统计量的精确分布 很难确定,我们会利用其一阶渐近性质进行假设检验,因此统计量大样本性质的 研究是统计推断中一个重要的研究课题。一个在统计理论及其应用中都很重要的 问题是我们能否改进基于一阶渐近性质的大样本检验。我们可以有两种做法:一 是寻找一种新的分布,使之在零假设下比一阶渐近分布更接近于检验统计量的真 实分布,例如基于e d g e w 0 吡展开的高阶渐近分布;二是寻找一个新的检验统计 量,使其分布在零假设下更接近于一阶渐近分布。b a r t l e t t 校正就是第二种方法的 典型代表。 b 甜t l e t t ( 1 9 3 7 ) 在方差齐次检验中,针对对数似然比检验统计量提出一种改进统 计量,使之在零假设下更接近于极限卡方分布。随后,这种方法被命名为b 砒1 e t t 校正。在之后的时间里,许多统计学家研究了不同检验统计量的b a r t l e t t 校正 问题,并应用于各个不同的领域。有趣的是,并不是所有的检验统计量都可以 b a r t l e t t 校正。例如,得分检验统计量( s c o r et e s ts t a t i s t i c ) 和w 矾d 检验统计量在一 般情形下就无法简单的b a r t l e t t 校正,但可以通过一种类似的校正方法达到同样的 效果,之后被人们称为b a r t l e t t 型校正。 自c 0 x ( 1 9 7 2 ) 提出偏似然方法以来,c o x 比例风险模型就成为了生存分析中最重 要的模型之一。在实际应用中,针对回归系数的假设检验是人们经常需考虑的问 题。通常,人们有三种检验方法可选择:似然比检验;得分检验和w a l d 检验。g u z h e n g ( 1 9 9 3 ) 研究了对数似然比检验统计量的b 叭l e 七t 校正问题;n ,s h i ,c h e n , w u ( 2 0 0 5 ) 导出了得分检验统计量的b a r t l e t t 型校正。很自然地,我们会考虑上述检 验中w 址d 检验统计量的b a r t l e t t 型校正问题。这是本论文中的第一个研究课题, 研究这一课题的方法是导出零假设下w a l d 检验统计量分布的e d g e w o r t h 展开,与 卡方分布比较,看能否进行b a r t l e t t 型校正。 经验似然是构造置信域一种极为有效的非参数方法。与其他方法相比,经验 似然构造置信域除了有域保持性,变换不变性及置信域的形状由数据自行决定 第1 章绪论 外,还有b a r t l e t t 校偏性及无须构造轴统计量等优点。该方法自o w e n ( 1 9 8 8 ) 提出 以来,被广泛地应用于各种统计模型。经验似然的一个缺点在于计算的复杂性。 在实际应用中,人们需要计算截面经验似然比函数( p r o f l l ee m p i r i c a l1 i k e l i h o o dr a t i o f u n c t i o n ) ,该函数是关于观测值的一种条件极值,而当样本量不是很大或是定义 参数的估计方程的维数大于参数的维数时,该条件极值很有可能无解。针对该问 题,c h e n ,m u l a y a t h ,a b r a h 锄( 2 0 0 8 ) 提出一种校正经验似然方法。该方法通过增加 一个虚拟点的方法确保任何情况下,条件极值都存在并且不影响经验似然的大样 本性质。 本论文的第二个研究课题就是利用校正经验似然方法构造c o x 比例风险模型中 回归系数的置信域。通常人们可以利用回归系数的渐近正态性来构造置信域,但 当样本量不是很大或删失率很高时效果并不理想。这里我们试图利用校正经验似 然方法构造置信域并与基于渐近正态性的方法( 有时称为w | a l d 方法) 进行比较, 看看是否在小样本或高删失情形,我们的方法会有所改进。 经验似然是非参数统计推断的一个自然工具,同时也是某类非参数似然中的一 员。该类非参数似然具有同样的一阶渐近性质。其中,指数倾斜似然( e x p o n e n t i a l t i l t i n gl i k e l i h o o d ) 被证明比经验似然更稳健,但没有经验似然有效。一些统计学 家提出一种混合似然,称为指数型的倾斜经验似然( e x p o n e n t i a l l yt i l t e de m p i r i c a l m 【e l i h o o d ) ,也叫指数型经验似然( e x p o n e n t i a le m p i r i c 出l i k e l i h o o d ) 。这种混合似然的 优点在于是既稳健又有效,缺点是无法象经验似然一样b a r t l e t t 校正。我们第三个 研究问题是,考虑能否利用校正经验似然的思想,类似地定义校正指数型经验似 然,并通过虚拟点的选择,使校正后的似然可以达到b a r t l e t t 校正后的高阶收敛速 度。 以上就是本论文中研究课题的背景和主要内容介绍。本论文的结构安排如下: 第一章,我们主要介绍b a r t l e t t 校正的历史及在c 0 x 比例风险模型中的研究现状; 第二章,介绍经验似然的定义,它的b a r t l e t t 校正性,在估计方程中的应用及校正 经验似然的思想。在接下来的三章里,我们将分别给出对于前面三个课题的研究 结果,即c o x 比例风险模型中w 龃d 检验统计量的b a r t l e t t 型校正;校正经验似然 在c o x 比例风险模型中的应用;校正指数型经验似然的高阶置信域。 2 第2 章统计检验的b a l r t l e t t 校正 第2 章统计检验的b a r t l e t t 校正 假设检验是统计推断的一个重要部分,它被广泛应用于医学,经济等领域。因 为通常检验统计量的精确分布很难得到,所以在实际应用中,经常使用的是大样 本检验,而大样本检验要依赖于检验统计量的渐近分布。统计学中一个重要的研 究问题是改进基于一阶渐近性质的简单大样本理论。我们可以从两个不同的角度 来考虑这个问题。其一,我们可以试图寻找一个新的分布,使之在零假设下比该 一阶渐近分布更接近于检验统计量的真实分布。其二,我们可以寻找一个新的检 验统计量,使之在零假设下更接近于该一阶渐近分布。基于e d g e w o r t h 展开的高阶 渐近分布是第一种方法的典型代表,而b 疵l e t t 和b a r t i e t t 型校正是第二种方法的 典型代表。在这一章我们将介绍b 盯t l e t t 校正的历史和它的一些应用。 2 1b a r t l e t t 和b a r t l e t t 型校正的历史 似然比检验,得分检验和w a l d 检验是著名的三大大样本检验。在一般正则性 条件下,可以证明这些检验统计量的一阶渐近分布都是卡方分布,但这一分布逼 近检验统计量真实分布的精确度较低。我们下面分别介绍他们各自的b a r t l e t t 校正 或b a r t l e t t 型校正,它们可用来改进卡方分布逼近的精确度。 2 1 1对数似然比检验统计量的b 盯t l e t t 校正 通常来讲,利用似然比检验进行统计推断的困难不在于推导它的具体表达形 式( 如果该形式存在的话) ,而在于寻找它的精确分布,或者至少是一个好的渐 近分布。卡方分布在通常情形下可用来逼近其真实分布,但精确度较低。b a r t l e t t ( 1 9 3 7 ) 提出一种改进的对数似然比统计量。具体如下:记l 冗为对数似然比统计 量,假定在零假设下,我们有e ( l 冗) = g 1 + 6 n + ( ) ( n 一2 ) ) ,其中6 为某常数,佗 3 第2 章统计检验的b a l r t l e t t 校正 是样本量,口是对立假设与零假设下参数空间的维数之差,那么b a r t l e t t 建议:一 种改进统计量l r = l r ( 1 + 6 礼) 会比l r 更接近于极限分布) ( :。随后这种方法被 称为b a r t l e t t 校正,1 + 6 肪被称为b a r t l e t t 校正因子。他证明了在方差齐次检验中 l 舻与x :的前三阶半不变量( t h ef i r s 七t l l r e ec u i n u l a n t s ) 之差为d 一3 2 ) ,这使人们有 理由相信l 彤的密度有可能比l r 更接近于) ( :。 b 似( 1 9 4 9 ) 利用b a r t l e t t 上述结果进一步研究了对数似然比统计量在下述几种情 形下矩的一般表达式:忌个p 元抽样的协方差不变性检验,以及尼个残差独立性的 w i 墩检验。他证明了至少在上述情况下校正统计量l 彤会比l 兄更接近于x :。 对一般情形,l a w l e y ( 1 9 5 6 ) 导出了对数似然函数的某些导数的矩的表达形式, 并指出对复合假设检验问题b a r t l e t t 校正统计量的所有半不变量与卡方分布的半不 变量之差为d 一3 2 ) 。 随后这一校正方法被应用到其它一些统计问题,如主成分分析( a u d e r s o n ,1 9 6 3 ) 和马尔可夫链的统计推断( s h a r p ,1 9 7 5 ) 。 关于对数似然比检验统计量的b a r t l e t t 校正的迸一步研究来自于h a y a 妇帆 ( 1 9 7 7 ) ,他指出针对复合零假设和复合对立假设情形,对数似然比统计量的分布函 数具有下述展开式: p r 陋r z 】= 岛( z ) + ( 2 4 n ) 一1 【a 2 岛+ 4 ( z ) 一( 2 a 2 一a 1 ) 局+ 2 ( z ) + ( a 2 一a 1 ) 局( z ) 】+ d ( 仃一1 ) , ( 2 1 ) 其中b ( ) 是自由度为s 的卡方随机变量的分布函数,4 1 ,a 2 是关于半不变量的函 数。b a r n d o r 毋n i e l s e n h a u ( 1 9 8 8 ) 证明了上述展开式的误差项是o ( n 一2 ) ,而不是 ( ) 唧一3 2 ) 。然而由于之前l a w l e y 指出b a r t l e t t 校正因子p = 1 + ( 1 2 死g ) 一1 a 1 ,因此两 者的结果相矛盾除非( 2 1 ) 中a 2 = o 。1 0 年之后,h a r r i s ( 1 9 8 6 ) 指出( 2 1 ) 中不应出现 a 2 ,几乎同时c o r d e i r ( 1 9 8 7 ) 提出a 2 应为o ,但c h e s h e r s l i t h ( 1 9 9 4 ) 给出一个例 子,其中a 2 o 。当a 2 = o 时,等式( 2 1 ) 的一个主要贡献在于它给出了一个相对 简单的论证来说明l r = l 冗厅会以o - 2 ) 的速度收敛到) ( :。 2 1 2 得分检验统计量的b a r t l e t t 型校正 并不是所有的统计量都可以b a r t l e t t 校正的,对于得分检验统计量和下一节要 4 第2 章统计检验的b a r t l e t t 校正 讨论的w 矾d 检验统计量就是其中的例子。对于得分检验,c o x ( 1 9 8 8 ) 提出种类似 于b a r t l e t 七的校正。1 0 年之后,c o r d e i r o f e r r a r i ( 1 9 9 1 ) ;c h a j l d r a m u k e r j e e ( 1 9 9 1 ) 针对几种特殊情形得出了更一般性的结果。我们这里主要介绍c o r d e i r o f e r r a r i ( 1 9 9 1 ) 的结果。 h a r r i s ( 1 9 8 5 ) 给出零假设下得分检验统计量s 的分布的渐近展开: p r s 名】= 晶( z ) + ( 2 4 礼) 一1 【a 3 岛+ 6 + ( a 2 3 以3 ) 岛+ 4 ( z ) + ( 3 a 3 2 a 2 + a 1 ) + 2 ( z ) + ( a 2 一a 1 + a 3 ) 如( z ) 】+ o ( n 一1 ) ,( 2 2 ) 其中a 1 ,a 2 ,a 3 是关于对数似然半不变量的函数。同时他给出得分检验统计量前三 阶半不变量的表达式 k 1 ( s ) = 口+ 去+ 。( 钆。) 尤2 ( s ) = 2 口+ 垒学+ 。( 礼一1 ) k 3 ( s ) :8 口+ 型兰生掣+ 。( n 一1 ) 由于代1 ( ) ( ;) = q ,k 2 ( ) ( ;) = 2 9 ,k 3 ( x ;) = 8 口,因此如果我们知道a 1 ,a 2 ,a 3 的表达 式,便可以与x :统计量的半不变量进行比较。等式( 2 2 ) 对简单或复合假设都成 立。更重要的是,上述结果意味着不存在一个标量变换( s c a l 盯t r a l l s f o r m a t i o n ) , 使得变换后的得分检验统计量类似于b a r t l e t t 校正的对数似然比统计量一样达到 d 一1 ) 收敛速度,也就是说得分检验统计量无法简单地被b a r t i e t t 校正。 c o r d e i r o f e r r a r i ( 1 9 9 1 ) 对得分检验统计量提出如下的一种的变换 1 3 伊= s 【1 一寺。 , ( 2 3 ) 其中,y 1 = ( a 1 一a 2 + a 3 ) ( 1 2 9 ) ,y 2 = ( a 2 2 a 3 ) 【1 2 9 ( g + 2 ) 】,他= a 3 1 2 9 ( 口+ 2 ) ( 口+ 4 ) 】, 他们证明了伊收敛于) ( :的速度是o 一1 ) 。若a ,t = 1 ,2 ,3 中存在未知参数,当这 些未知参数用零假设下他们的极大似然估计替代时,仍然可以保持上述收敛速 度。注意到( 2 3 ) 中的校正因子是关于s 的函数,因此这种校正不是经典意义下的 b 盯t l e t t 校正。上述校正被命名为b 砒l e t t 型校正。 同时,c o r d e i r o f e r r 盯i ( 1 9 9 1 ) 获得了如下更一般的结果:假设丁是一个渐近 5 第2 章统计检验的b 甜t l e t t 校正 x ;分布的统计量。根据c h a n d r a ( 1 9 8 5 ) 结果,在一定条件下,有 , 七 n p z 】= 岛( 2 ) + 寺a i 局+ 2 i ( z ) + d m _ 2 ) ( 2 - 4 ) t = u 令地= 2 r ( 1 + g 2 ) r ( g 2 ) ,其中r ( ) 是g 锄m a 函数,胁是x :分布的t 阶原点 矩。c o r d e i r o f e r r a r i 指出校正统计量 七七 r = 丁 1 2 ( ) ( 胁) 一1 一一1 ) o z ,、z , j ,、,j 仁1j = t 会以d ( 礼- 2 ) 的速度收敛于x :。 2 1 3w a l d 检验统计量的b a r t l e t t 型校正 w a l d 检验对于些用参数的非线性函数定义的假设检验是一种很好的方法,因 为它不需要对零假设下的模型进行估计,因此也避免了非线性估计。w a l d 检验的 一个缺点在于有时对于零假设的一些等价变换,w a l d 检验并不是相同的。p h i l l i p & p a r k ( 1 9 8 8 ) 给出带有非线性限制零假设下w 越d 统计量的e d 踟r t h 展开 p 7 【w z 】= 岛( z ) + 寺【0 3 f g + 6 ( z ) + 口2 岛+ 4 ( z ) + 口l 局+ 2 ( z ) + 。( z ) + 6 0 凡( z ) 】+ 。( n 1 ) , ( 2 5 ) 其中,s ( ) 是自由度为s 的卡方分布的密度函数。注意到上述展式与( 2 4 ) 不同, 因为它包含凸。凡( ) 项。在p h i l l i p p a r k ( 1 9 8 8 ) 考虑的所有例子中6 0 = o 。当6 0 o 时,f e r r a r i c r i b a r i n e t o ( 1 9 9 3 ) 提出了如下的b a r t l e t 七型校正w 址d 检验统计量: 1 3 = 1 一寺- 1 ) 并证明了p 7 z 】= p r 嘲名】+ d ( n 一1 ) ,其中叼,j i = 1 ,2 ,3 由下式得到 1 3 p r 【z 】= r ( z ) 一矗( z ) :夕+ 。( n 1 ) j 2 u 最后,我们要指出通常的b 甜t l e t t 型校正定义为对= t ( 1 一b n ) ,其中b 是关于未校正统计量t 的多项式。但也有其他形式的等价定义,例如露= 6 第2 章统计检验的b a r t l e t 乞校正 叫( 1 + b 凡) ,碍= te x p j e 7 n ) 。对不同分布下三种b a r t l e t t 型校正统计量的功效 模拟表明,并不存在一种最优的b a r t l e t t 型校正形式。 2 2c o x 比例风险模型下检验统计量的b a r t l e t t 校正问题 自c o x ( 1 9 7 2 ) 提出偏似然方法以来,c o x 比例风险模型便成为分析删失数据最有 力的工具。设饥= ,q ,磊) ,i = 1 ,n 独立并与可= ( t ,c ,z ) 同分布,其中t 代 表死亡时间,c 是删失时间,z 是定义于冗的一个有界子集上的协变量,并且假 定t 和c 关于z 条件独立。c o x 比例风险模型是指给定z ,t 的风险函数具有下述 形式: a ( t i z ) = 入o ( t ) e ) ( p z )( 2 6 ) 其中入o ( t ) 是某一未知函数,p 称为关于协变量z 的回归系数。我们考虑如下的检 验问题 风:p = 凤v e r s l l s 日1 :阮, 其中阮已知。由于潜在的删失问题,我们实际观测的数据具有下面形式 五= m 伽( 死,q ) ,函= j ( 五g ) ,t = 1 ,2 ,n 令m ( t ) = j ( 墨t ) ,7 r ( ) = 踊( t ) = p 7 x 1 t 。假定对某已知常数丁,满足 丌( 丁) 0 ,那么该观测数据的偏似然函数为 堋= 默曼n 丽茹p , 恐s 下,仁1 ,n 厶j 2 l r 、一j7 、一j 一一7 对数偏似然函数为 k ( 萨善小z t _ 1 0 邸) ( 夙叻m ) 定义偏似然得分函数( p a r t i a l1 i k e l i h o o ds c o r ef u n c t i o n ) 为 阶酎”端) 删, 其中a r ( t ,国= 7 l 一1 銎1z ;e x p ( p 忍) ,( 研t ) ,r = o ,1 ,2 第2 章统计检验的b a r t l e t t 校正 定义 枷,= 警= 新c 溯一c 渊) 2 】删, 其中m ( 亡) = ,( 托t ,魂= 1 ) ,s u ) ( ,t ) = n 一1 警1 霉e x p ( p 磊) k ( t ) ,歹= o ,1 ,2 。极 大偏似然估计矽定义为 p = 口7 9 m o z 口f n ( p ) 或等价于 ( 两= 警_ o 针对上述问题的三大检验分别为 ( 1 ) 似然比检验:拒绝凰,如果伽= 2 ( f n ( 口) 一f n ( 扇) 】 ; ( 2 ) 得分检验:拒绝,如果伽= ( 凤) 2 厶( 阮) 一1 ; ( 3 ) w a l d 检验:拒绝凰,如果叫= ( p 一凤) 2 厶( p ) 以。 在零假设下,上述三大检验的极限分布皆为) ( ;( t s i a t i s1 9 8 1 ,a n d e r s e n g i u1 9 8 2 , f 1 e m i n g h a r r i n 卧o n1 9 9 1 ) ,并且该极限的收敛速度为0 ( n 一1 ) ( g u1 9 9 2 ,s t r a w d e r m a n 1 9 9 7 ) 。g u z h e n g ( 1 9 9 3 ) 及n ,s 1 1 i ,c h e n ,w r u ( 2 0 0 5 ) 分别讨论了对数偏似然比检验 统计量的b a r 七l e t t 校正和得分检验统计量的b a r t l e t t 型校正。以下我们介绍他们的 主要结果。 2 2 1 c o x 比例风险模型中对数偏似然比检验统计量的b a r t l e t t 校正 g u & z h e n g ( 1 9 9 3 ) 研究了上述对数偏似然比检验统计量的b a r t l e t t 校正问题。 他们证明了如下结果: 定理2 1 令叫= 2 ( p ) 一f n 愉) 】,在上述模型的条件假设下, 州叫鲥:+ 瓣一吾一等啪一等+ 吾+ 务; + 警) ( 猢+ o ( 几叫2 ) , 其中a ,f 皆为常数,定义可参见原文。 值得指出的是,他们并没有给出b a r t l e t t 校正统计量的具体形式。 8 2 2 2 c o x 比例风险模型中得分检验统计量的b a r t l e t t 型校正 n ,s h i ,c h e n ,w u ( 2 0 0 5 ) 研究了c o x 比例风险模型下得分检验统计量的b a r t l e t t 型校正。他们首先定义了 = 石1 2 愉) ( 阮) , 并证明了如下定理: 定理2 2 在与定理2 1 同样的条件。下, 尸r z j 凰) = 圣( z ) + 壶+ 扣p 2 1 ) ) + 三 譬z + 鲁( 3 z 一霸+ 鲁( z 5 + 1 时一1 5 硎似) + 咖- 1 ) 其中西( ) ,( ) 分别为( o ,1 ) 的分布和密度函数,l ,歹:1 ,2 的定义见原文。 由上面的定理,我们容易知道在零假设下,得分检验统计量的分布具有如下的 e d g e w - o r t h 展开: 研 z l 凰) = 尸r z 1 2 i 凰 一n 一z 1 2 】- = p r 饼z ) + 扣- z 1 2 + 警( 3 2 1 2 一川 + 等( 。2 + 1 叫2 1 5 2 ) m 2 ) + d ( n 1 ) 由上述w - a l d 检验统计量的e d g e w o r t h 展开以及c o r d e i r 。f e r r a r i ( 1 9 9 1 ) 关于得分检 验统计量的b a r t l e t t 型校正的结果,可得到下面的定理。 其中 定理2 3令 崂2 而蒜, 七2 3 ( 3 6 n ) , ( 3 尼2 2 1 0 蛔) ( 3 6 礼) , ( 一1 2 尼2 1 3 克2 2 + 5 乜3 ) ( 1 2 佗) , 9 第2 章统计检验的b a r t l e t t 校正 则 p r 孵( z 口2 ) 2 凰) = q + d ( 仃一1 ) 统计量篇即为c o x 比例风险模型下得分检验统计量的b a r t l e t t 型校正。 1 0 第3 章经验似然 3 1引言 第3 章经验似然 经验似然是o w e n ( 1 9 8 8 ) 提出的一种非参数统计推断方法,它有类似于b o o t s t r a p 的统计特性。这一方法与其它统计方法比较有许多突出的优点,例如用经验似然 方法构造置信区间除了有域保持性,变换不变性及置信域的形状由数据自行决定 外,还有b a r t l e t t 可校正性及无须构造轴统计量等优点。正因为如此,这一方法引 起了许多统计学家的兴趣,他们将这一方法应用到各种统计模型及各种领域。 3 2经验似然的来历 对一随机变量x r ,定义分布函数为 f ( z ) = p r ( x z ) , z 冗 同时定义f 扛一) = p 7 ( x o ,则置信域g ,订为一凸集, 且当n _ 。o , 一2 l o g 冗( 瑚) 三x ; 由定理3 1 ,我们可构造均值弘的置信水平为1 一q 的置信域为 _ p l 一2 1 0 9 7 已( 肛) 以) , 其中q 是) ( ;的上q 分位数。 3 4经验似然的b a r t l e t t 校正性 与经典的b 0 0 t s t r 印方法相比,经验似然的优点在于它的置信域形状完全由数据 来决定;可以很容易的加入关于参数的限制;还有一点很重要的是经验似然是可 以b a r t l e t t 校正的。 设置,x 2 ,是独立同分布的r 元随机向量,分布函数为昂,均值为p o , 具有非奇异的协方差阵e o 。设p 为g 维参数( g r ) ,可表示成关于均值的光滑函, 数,即日o = p ( p o ) ,其中p ( ) 是一光滑函数。令 = 一2 l o g 冗( p o ) , 则有 吼三x 可以证明 p r ( z ) = p r ( x ;sz ) + d ( 死一1 ) , 即收敛到) ( ;的速度是d 1 ) 。 d i e i c c i o ,h a l l ,r o m a n o ( 1 9 9 1 ) 证明了是可以b a r t l e 乞t 校正的,即存在常数口, 使得 尸7 饧( 1 一m 一1 ) z ) = p 7 x ;冬z + ( ) ( 礼一2 ) 1 3 第3 章经验似然 假设o = ,关于常数。的表达式,需要引入如下记号 l 旅= e ( x f l x f 2 ) ,嘭。靠= 器l p :加, 其中耐及分别代表x 1 和p 的第歹个分量。定义e = ( 孵) ,是一个g r 的矩 l 车,令q = ( e e 丁) 一1 ,m = e 下q e ,= e r q , h = 轴一m 3 “m 细m t o t 2 = 削q m 加 夕凫m f m m n o t 3 = 削m m j 惫m 2 m “= m m j u n ( j m ) m 七( ,一m ) 以 如= q u 咏口 ( ,一m ) 批( ,一m ) h + 2 ( ,一m ) j 2 ( ,一m ) 七m 】, 其中重复的下标应对所有可能的情形求和,则 b = g 一1 ( 鲁z 一2 2 2 + 三z 3 一如+ 三据) 若o ,只需要函数妒( 入) = p ( :2 a ) 来替代函数p ( 入) 即可。 特别地,当7 = 口= 1 ,口= p = 以时, 归鑫一箍 3 5经验似然和估计方程 估计方程提供了一种更加宽泛的方法来描述参数和相应的估计的统计量。一般 地,对一随机变量x ,参数p 钟,函数9 ( x ,6 ) 胪。假设参数拶可通过下 列方程来定义: 的( x ,护) = o ( 3 4 ) 通常当口= m 以及给定夕( x ,p ) 和f 一些相应的条件下, 此时真值舶可通过下面方程的根舀来估计 净枷) - o 方程( 3 4 ) 存在唯一的解。 ( 孓5 ) 第3 章经验似然 通常方程( 3 5 ) 被称为估计方程,夕( x ,6 i ) 被称为估计函数。对于由估计方程定义的 参数p ,可同样类似定义其截面似然比函数 nn礼 冗( 口) = s u p n 咧阢9 ( 托,p ) = o ,耽= 1 卜 ( 孓6 ) i = 1t = 1t = 1 q i n & l a w l e s s ( 1 9 9 4 ) 对于由估计方程定义的参数p ,证明了如下的渐近性质。 定理3 2 设x 1 ,拖,为独立同分布的随机向量,共同分布为局。 对口e 冬r 口,9 ( x ,p ) r m ,设真值e 使得y a 7 ( 9 ( x ,p ) ) 有限,且有秩p o 。 若p o 满足句( x ,铂) = o ,则对由( 3 6 ) 定义的冗( 伊) ,有 一2 l o g 冗( 曰o ) 三x : 通过估计方程定义的参数有很多,例如之前提到的均值参数9 = p ,可取 夕( x ,口) = x 一目;对参数p = p 7 ( x a ) ,可取夕( x ,p ) = 奴a ;对具有连续分布的一 元随机变量x 及口r ,函数夕( x ,目) = j s 刎一q 定义口为x 的q 分位数等等。 将经验似然应用到线性模型进行统计推断是0 w e n ( 1 9 9 1 ) 的另一个重要贡献。 有趣的是,这一重要情形,也是估计方程的特例。具体如下:考虑线性模型 y = x r 口+ ,t = 1 ,2 ,钆 其中x 是设计阵,y 是观察变量,p 是未知参数,e 是独立同分布,均值为。的随 机误差向量。对这一线性模型,使得引( 取p ) 2 】达到最小的p 是 p = 【e ( x r x ) 】- 1 e ( x 7 。y ) , 即p 满足下面的泛函方程 驯x ( y x 下卢) 】= o , 对应于夕( x ,卢) = x ( y x 7 。p ) 关于线性回归和分位数的经验似然统计推断细节,可分别参见o w e n ( 1 9 9 1 ) ; a d i m a r i ( 1 9 9 8 ) 3 6校正经验似然 设我们有一列独立同分布的向量取值的观测值剪1 ,抛,共同分布为f 。我 第3 章经验似然 们感兴趣的问题是对某口维参数口= 日( f ) 做统计推断,假设9 由下面泛函方程唯一 确定e 9 ( y p ) :f ) = 0 ,其中9 ( ) 是一个m 维函数( 仇口
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 济南市2025-2026学年九年级下学期语文月考测试试卷
- 集安市2025-2026学年九年级上学期语文期末模拟试卷
- 高速铁路道岔结构课件
- 电芯活化知识培训内容总结
- 医保局学习教育总结评估报告范文
- 电脑板焊接基础知识培训课件
- 高考场景课件
- qa考试试题及答案
- office考试试卷及答案
- 陕西省渭南市澄城县2022-2023学年九年级上学期期中化学试题(含答案)
- 羽毛球馆创业计划书范文
- 种子企业质量管理制度
- 医学影像技术操作规范阅读题集
- 高中生的抑郁现状调查及危机干预对策
- 口腔工艺管理课件
- 固定矫治器粘接的护理流程
- 2025年《数据采集与处理》课程标准
- 混凝土垫层厚度强度检测要求
- EXCEL实操应用培训
- DB32/T 4322-2022家政职业经理人培训规范
- 零时工合同协议书
评论
0/150
提交评论