已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 生存分析是目前统计学的热门之一。它不仅能妥善的处理现实生活中常 见的截断数据问题,而且在解决实际问题的同时,揭示了一些更为复杂的理 论问题,促进了数理统计理论的发展 本文研究了带有随机右删失数据的非线性模型的中位数回归问题第一章 将完全数据线性回归模型中的二l 方法推广到带有随机右删失数据的非线性模 型回归参数的估计问题中,提出了一种估计非线性模型回归参数的半参数方 法,并得到了估计量的强相合性和渐近正态性 第二章将经验似然方法应用到带有随机右删失数据的非线性模型的中位 数回归问题中,得到了经验似然比函数的渐近分布,但此极限分布是x 2 分布 的加权和而不是标准的x 2 分布,经验似然方法为回归参数置信区域的构造提供 了一个有效的方法。 关键词删失数据,非线性模型,中位数回归 a b s t r a c t s u r v i v a la n a l y s i s w h i c hc a nd e a lw i t hc e n s o r e dd a t ac o n f r o n t e di nd a i l yl i f e l 翩l y , i s o l l eo f t h em o s tp o p u l a rf i e l d si ns t a t i s t i c sn o w a d a y s m e a n w h i l e ,i th a s r e v e a l e d8 0 m em o r ec o m p l i c a t e da c a d e m i cp r o b l e m sa n da c c e l e r a t e st h ed e v e l o p m e n t o f s t a t i s t i c s m e d i a nr e g r e s s i o nf o rn o n l i n e a rm o d e lw i t hr a n d o m l yr i g h tc e n s o r e dd a t ai s s t u d i e di nt h i sp a p e r , l 1i n f e r e n c e ,w h i c hi so f t e nu s e di nl i n e a rm o d e lw i t hc o m p l e t e o b s e r v a t i o n s , i se x t e n d e dt om e d i a nr e g r e s s i o nf o rn o n l i n e a rm o d e iw i t h n c o m p l c t e o b s e r v a t i o n si nc h a p t e rl 。as e m i p a r a m e t r i cp r o c e d u r ei sp r o p o s e dt oe s t i m a t et h e p m a m e t e ri nn o n l i n e a rm e a nr e g r e s s i o nm o d e lw i t hr a n d o m l yr i g h tc e n s o r e dd a t a 1 1 1 es t r o n gc o n s i s t e n c ya n da s y m p t o t i cn o r m a l i t yo f t h ee s t i m a t o ra r ca l s oo b t a i n e d i nc h a p t a r2 ,e m p i r i c a ll i k e l i h o o di sd e v e l o p e dt om e d i a nr e g r e s s i o nf o rn o n - l i n e a rm o d e lw i t hr a n d o m l yr i g h tc e n s o r e dd a t a t h ea s y m p t o t i cd i s t r i b u t i o no fe m p i r i c a ll i k e l i h o o dr a t i of u n c t i o ni so b t a i n e d a n di ti sw e i g h t e dc h i - s q u a r ed i s t r i b u t i o n b u ts t a n d a r dc h i - s q u a r e d 弛a p p r o a c hp r o v i d e sa na d m i r a b l et o o lt oc o n s t r u c tc o n - f i d e n e er e g i o n so f r e g r e s s i o np a r a m e t e r k e y w o r d s c e n s o r e dd a t a ,n o n l i n e a rm o d e l ,m e d i a nr e g r e s s i o n , 学位论文独创性声明 本人郑重声嘲: 1 、坚持以“求实、创新”的科学精神从事研究工作。 2 、本论文是我个人在导师指导下进行的研究工作和取得的研究成果。 3 、本论文中除引文外,所有实验、数据和有关材料均是真实的。 4 、本论文中除引文和致谢的内容外,不包含其他人或其它机构已经发表 或撰写过的研究成果。 5 、其他同志对本研究所做的贡献均已在论文中作了声明并表示了谢意。 作者签名: 日期: 学位论文使用授权声明 本人完全了解南京师范大学有关保留、使用学位论文的规定,学校有权 保留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版; 有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查 阅:有权将学位论文的内容编入有关数据库进行检索;有权将学位论文的标 题和摘要汇编出版。保密的学位论文在解密后适用本规定。 作者签名: 日期: 刖吾 c e n s o r 一词原为审查、删改之意,近2 0 多年来,广泛的出现于统计学中 我们经常会碰到类似下面的一些数据;海底光缆受地震影响而无法正常工作 已经持续了4 8 d , 时;灯泡在长达5 0 0 d , 时的寿命实验中没有毁坏;机器从昨 天上午9 时到现在已经出现了5 次毛病等上述数据的特点是:我们不知道它 们的确切数值,但知道大于等于某个数,它们由于某种原因被截断了我们 能得到的信息仅仅是:海底光缆无法正常工作的时间大于4 8 4 时,灯泡的寿 命大于5 0 0 d 、时,在统计中如何利用这种信息呢? 这就是生存分析所 要研究的问题从某种意义上讲,有一个统计问题,就可能有相应的删失数 据的统计问题从实践的角度看,后者更近乎实际,生存分析研究对象之广 泛可见一斑 回归分析是统计学中经典课题之一同样,删失数据的回归分析也是众 多统计学者的研究热点对于带有删失数据的线性回归模型的参数统计推断, 已经有一大批学者给出了众多的既有理论价值且又实用的解决方法其中比较 有代表性的有:b u c k l e y - j a m e s 估计,k _ s - v 估计,和c l a s sk 估计等这些估计 方法有一个共同的前提条件,那就是误差项的期望( 或条件期望) 等于0 , 在此基础上,对删失数据进行某种替换后使用最小二乘法,从而得到未知 参数的估计上述回归问题都属于均值回归领域,虽然误差项的期望为0 的 假设在很多情况下是符合实际情况的,但也非处处敬如人意例如,要从样 本x 1 1 一,一n ( a ,盯2 ) 来估计均值n ,两种常用的方法是样本均值叉和中位 数m 设样本中有个别值因有过失误差( g r o s se r r o r ) 而变的异常的大,则它 对叉有相当的影响,而使估计结果偏高,但对m 影响甚小因此,对上述假设 的一个合理的变换就是假设误差项的中位数( 或条件中位数) 为0 ,这就是 近来非常流行的另一个研究热点一中位数回归问题注意到前人的研究主要 集中在线性回归模型的研究上,而且随着实践的需要、科技的进步,在更广 泛的条件下研究更为复杂的问题已经迫在眉睫本文将对带有删失数据的非线 性模型的中位数回归问题做深入的研究,期望得到一些有实际价值的结论 众所周知,最小一乘方法在很多情况下较最小二乘方法更为稳健在 生存分析中,最小一乘方法较最小二乘方法的最大的优势在于前者无需替 换数据,可以直接利用样本数据进行统计推断因此,对删失数据回归问 题,l a d 估计应该比l s e 估计更好第一章以己1 方法研究了带有删失数据的 非线性中位数回归模型,提出了一种估计非线性中位数回归模型参数的半参 数方法,并得到了估计量的强相合性和渐近正态性第二章利用了近来统计学 界非常流行的方法一经验似然方法研究了带有删失数据的非线性中位数回归 模型,为模型参数的统计推断又提供了一个有力的工具 第一章得到了参数估计量的渐近正态性,这可以用来构造参数的蜀信区 域,而经验似然方法也主要用于参数置信区域的构造,这两种方法得到的置 信区域哪一个更好? 本文并没有做讨论,这个问题可以做进一步的研究 第1 章删失非线性模型中位数回归的l l 方法 1 1 引言 删失数据回归模型是生存分析中一个很有价值且常用的模型- 带有右删失数据 的参数回归模型为 五= ,( 卢,五) + e l , i = 1 ,2 ,仃,( 1 1 1 ) 其中卢是孵中未知的参数向量,x l ,五;是协变量,e l ,e 。是独立同分 布的误差项由于删失的存在,观测值为m = m i n ,g ) 和魂= j ( 正sg ) 而非五,其中j f 州为集合a 的指示函数,a ,c k 为独立同分布的随机删失 变量,且与噩,独立在删失线性回归模型( 即在模型( 1 1 1 ) 中,( p ,五) = 咒) 下,文献 1 】【5 】等给出了参数卢的众多最小二乘估计( 简称l 2 估计) 这些 估计方法大部分都需要调整删失数据,然后对调整后的数据使用普通最小二 乘 曾有文献对删失数据已知时回归模型( 1 1 1 ) 的l l 估计做过研究文献 6 】- 【8 】研究了观测数据为m = r a i n ( 五,0 ) ,即删失点固定且为0 时的删失线性 回归模型参数的l l 估计,并证明了该模型参数的l l 估计的渐近正态性文 献【9 】在误差项8 的条件中位数为0 的条件下,针对删失线性回归模型参数的 统计推断,提出了一个估计方程的方法,并证明了该统计量的强相合性和 渐近正态性文献【l o 】研究了在随机删失变量g 均已知的条件下删失回归模 型( 1 1 1 ) 的l 1 估计,并证明了参数l 1 估计量的渐近正态性 本章考虑回归模型( 1 1 1 ) ,并假设删失变量a ,g 有相同的连续生存 函数g ,岛是参数p 的真值我们将文献【9 】中提出的估计方程的方法应用于回 归问题( 1 1 1 ) ,并研究了该模型参数估计量的渐近性质 在下节中,我们给出参数卢估计量( 记为尻) 的一个合理的解释在第三节 中给出本章的假设条件和主要结论,其中包括阮的强相合性和风一风的渐近 正态性最后一节给出了主要结论的证明 1 2 估计方程 为得到参数卢的估计,首先回顾文献 9 】中的方法该文考虑在无删失且误 差项e l 的条件中位数为0 的条件下,线性回归模型( 即模型( 1 1 1 ) f ( 3 ,咒) = 卢咒) 参数的l 1 估计在这种情况下,参数p 的工l 估计是极小化问题 的解该问题等价于 吗n i 五一腿 鼍乒 j ( 噩2 五) 一;) ( 五一五) 其中记号“”代表“”,本文中将一直使用此简便记号注意到上述问题的 解是方程 【k ( p ) = 5 - :- ,( 五五) 一i i ,x f 0 ( 1 2 1 ) i z o 的根这里使用“z ”是因为c ( p ) 是卢的不连续函数一般而言,当误差e 的分 布连续时,( 1 2 1 ) 式的根可以使巩为0 0 ) 由于给定咒时巩( 岛) 的条件期望 为0 ,所以( 卢) 是p 的一个合理的估计函数其次对于无删失非线性回归模 型( 1 1 1 ) ,参数卢的l l 估计是极小化问题 的解它等价于 略n i t , 一f ( 3 ,五) 毋n j 仍,( 卢,五) ) 一;) 亿一f ( 3 ,五) ) 我们将上式改写为 呼 ,僻2 ,( p ,五) ) 一;) 一,五) 一v f ( 3 0 ,置) 一岛) 一函( 屈岛,置) ) 其中 也( 卢,f l o ,五) = f ( f l ,五) 一,愉,咒) 一v f ( f l o ,五) 7 一岛) 当p 和风充分接近且n 充分大时,在一定条件下, ,( 正f ( f l ,咒) ) 一 ) d f ( p ,岛,五) 对上述问题解的影响与 ,慨,( 凤冠) ) 一) ( 正一,( 岛,五) 一 v f ( 岛,) 7 一风) ) 相比就会充分小因此参数卢的估计可以重新定义为极小 化问题 呼 j 慨,( p ,五) ) 一;) 慨一,洒,恐) 一v f ( f l o ,咒) 7 一肺) ) 的解注意到上述问题的解在一定条件下是方程 玩( 卢) = ,置) ) 一;) v ,愉,x i ) “0 的根由于上式中岛未知,我们重新定义参数p 的估计为方程 瓦( p ) = ,佤,( 芦,) ) 一;) v ,( p ,五) “o 的根对于删失非线性回归模型( 1 1 1 ) ,观测值为k 而非正在条件a 1 下,因为 e ,做,五) ) i 五】= ;g ( ,五) ) 所以参数口的一个自然的估计方程为 跚) = 莩 错一撕觚) 0 , ( 1 2 3 ) 其中0 是g 的乘极限估计方程( 1 2 3 ) 的根反定义为0 & ) i l 的极小值点,0 0 为r p 中欧氏范数 1 3 假设条件和主要结论 首先假设参数卢的真值岛在有界凸区域_ d 的内部,其次给出下列条件 第1 牵删失非线州授掣叶1 俯数m 门的,方法 a 1 e l ,e n 独立同分布给定蕊时e f 的条件生存函数记为日,它连续, 未知但中位数为0 x 1 ,k 是独立同分布的协变量 a 2 a ,g 为独立同分布且具有连续生存函数g 的非负随机删失变 量,并与乃,死独立函数g 和h ,分别为1 一g 和1 一h 的密度函数,均一致 有界 a 3 ,( p ,咒) 在p = 岛处对于p 连续可微,且,( 岛,五) 20 ,f = 1 ,2 ,佗存在风的邻域岛使得对一切p b o ,下式成立 且 f ( 3 ,冠) 一,( 岛,五) 一v ( 届o ,五) 7 ( p 一岛) i n ( 岛) i i p 一岛i i 1 i j i 砰( 岛) o 和f ( 3 ,x ) t 0 几乎处处成立,这里6 也是常量 a 5 假定矩阵e v f ( j 3 0 ,x ) v f ( 岛,x ) 7 h ( o i x ) i i e 定,这里 ( i x ) 是给 定x 时日的条件密度函数 注条件a 2 、a 3 中分别要求删失变量g 以及,( 风k ) ,i = 1 ,2 ,扎非 负仅仅是为了叙述上的方便,这两个假设可以很容易的拓宽为c :i 一k ,( 肺,x i ) 一七,i = 1 ,2 ,n ,其中七为任意的有限正常数 主要结论为如下三个定理: 定理1 在条件a 1 a 5 下,麂瞥岛,其中“苎车意为几乎处处收敛 定理2 在条件a i - a s 下,对任意的e 0 , & ( p ) = 愉) + n a ( 1 3 一岛) 4 - 唧( m a x ( 佗j x + e ,佗忪一岛m 成立,其中 a = e ,( 岛,x ) v ,( 岛,x ) 7 ( 0 i x ) 】 定理3 令 础) = 熙:瞒t ) , q ( ) = 一l i m 。1 n f i ( f ( f l o ,扬) t ) v ,( 岛,x j ) 在条件a 1 a 5 下, 反一岛三n ( o ,n 一1 ( a 一1 ) i ( a 一1 ) 7 ) , 其中 r = 恕:莩 驾舅器铲一和c 觚阿c 眦) ,+ 圻篝铲划d “三,意为依分布收敛,a g 是删失变量c 的累积失效率函数 1 4 定理的证明 首先,我们证明反的强相合性令 翕( p ) = 日( ,( p ,五) 一,( 岛,魁) ) 一;) v ,( 卢,五) 因为( 文献 1 l 】) g t - - t : j e 0 s u pl g ( t ) 一a ( t ) l = o ( n 一;“)o 矗,( 1 4 1 ) 所以对一切口d 以概率l 有下式成立 跚m = 莩 酱删邶卅眦) ) ) v ,慨矧 : ! 号;渊一p ( 噩,( p ,咒) l a 磁) ) v j ,( 卢,五) = 7 一一r l t j i , j l tj ,vi p , t , 上lg ( ,( p ,弼) ) j ” : 麓掣- p ( 正f ( 1 3 ) v 邶周 。夸t 乏瓦可瓦了i 万一一,u 甜l “纠,。,l 肼“甜 + d + c ) = g ( ,( p ,五) ) 一1 ,麟,( 卢,五) ) 一p m f ( 9 ,五) j 五) ) v f ( f l ,五) + d + e ) 依据重对数定律及条件a 3 ,有 器吕| i 莩g ( ,( 芦,五) ) - 1 ,饿,( p ,五) ) 一p 似,( 卢,墨) i 五) ) v ,x , ) l l = d m ;+ ) d s 因此 s u pi i 礼一1 & ( 卢) 一n - i 炙( 卢) 0 = o ( n 一 + ) n s ( 1 4 2 ) 令 如( 仂= :品鼻( 国= :莩 ( ,( 尻恐) 一,愉,五) ) v ,( 展蜀) v ,( p ,五) + : 日( ,( 屈咒) 一,五) ) 一;) 品v ,( 成五) 则a 。( 岛) 一a 以概率1 成立,其中a 是正定矩阵由于露( z o ) = 0 ,故对充分大 的n ,如果p 历且p b o ,则存在常量。 0 ,使得 n - - i 文( 卢) 0 a 。 0 ( 1 4 3 ) 由反的定义及等式( 1 4 2 ) 可得 胁一& ( 反) 0si i n 一1 岛( 风) 1 l = o ( n 一 + ) o 所以 怖一1 岛( 反) 0sl i n 一1 岛( 反) 一佗一- & ( 反) 0 + l i n 一1 岛( 反) 0 = o ( n 一;+ ) n 羔 ( 1 4 4 ) 依据( 1 4 3 ) 和( 1 4 4 ) ,知反苎车p ,定理l 证毕 其次,为证明定理2 ,需要下面的引理: 引理1 设“为连续可微函数,则对任意e 0 , 8 u pl p ( 0 ( ) ) 一p ( g o ) ) 一_ ( 0 ( s ) ) + t t c g ( s ) ) l = o p ( n 一+ ) t s t o 证明由等式( 1 4 1 ) 知引理的结论显然 以下是定理2 的证明令 - = ( p ) 一【g ( ,( 卢,五) ) 一1 ,惭2 ,( 鼠五) ) 一: v ,( p ,咒) 一p ( ,愉,咒) ) - g ( f ( 届o ,托) ) 一1 j ,( p ,咒) ) v ,( p ,五) , 则 l = ,慨,恐) ) r v ,( p ,咒) i 。( ,( 卢,五) ) 一g ( ,( 展k ) ) 一o ( ,愉,五) ) 一1 + g ( ,愉,五) ) 一1 由引理1 及条件a 3 知 8 1 0 = 唧m 枉) - 9 第1 章删大作线竹校掣中仲敬川旷1 的l l 方法 成立因此 岛( p ) = g ( ,( p ,咒) ) 一l ,慨,( p ,五) ) 一翔v ,( p ,五) + o ( ,( 岛,x d ) 一g ( f ( f l o ,x d ) 一1 瞒邶,x , ) ) v f ( f l ,五) + d p ( 几;+ ) = & 汹) + c ( f ( f l ,置) ) 一l ,m ,( 卢,咒) ) 一; v ,( p ,五) 一 g ( ,( 岛,五) ) 一1 聪,( 风,x d ) 一i v f ( f l o ,五) + g ( ,愉,咒) ) 一1 ,f ( f l o ,五) ) v ,( 岛,托) 一g ( f ( f l o ,五) ) 一1 j 慨2f ( 3 ,x i ) ) v f ( f l ,五) + 0 ( ,( 风,五) ) 一1 j ( m f ( a ,x i ) ) v f ( ,五) 一o ( ,( 岛,五) ) 一1 ,( k ,( 风,咒) ) v ,( 肺,磁) + o p m 如) = :& ( 岛) + 一五十b 一五+ 厶一1 6 + o p ( 礼;+ ) 依据条件a 3 , r 等式( 1 4 1 ) 可得 令 0 厶一1 6 1 1 = d p ( n ;扣) 0 如一1 4 1 1 = d p ( n + 6 ) ( 1 4 5 ) ( 1 4 6 ) 一 g ( f ( f l ,五) ) 一1 p ( m ,( p ,x dl x t ) 一; v f ( f l ,墨) , 则 z = g ( ,( p ,x d ) v f ( 3 ,置) ,惭,( p ,咒) ) 一p m ,( p ,托) i 五) 一g ( f ( f l o ,x 3 ) v ( a , ,五) ,慨,愉,五) ) 一p 似,汹,五) i 咒) ) 依据重对数定律及条件a 3 知 i i z x 2 i i = o p ( n + ) 故 一五= z g ( f ( f l ,墨) ) 一1 p ( k ,x 3 1 x , ) 一; v f ( f l ,砥) + 吻;+ ) 一童,( 卢) + m 粕) ( 1 ,4 7 ) 由( 1 4 5 ) 一( 1 4 7 ) 知 岛( 卢) = s ( f l o ) + 翕( 卢) + o p ( n “) ( 1 4 8 ) 从而,在( 1 4 ,8 ) 中对岛) 在阮处用泰勒展式即得& ( p ) 的局部线性性质定 理2 证毕 最后为证明定理3 ,即反一岛的渐近正态性,我们首先证明竹一;岛( 岛) 渐近于正态分;t i n ( 0 ,r ) ,然后由定理2 知,定理3 的结论显然为证 明竹一& ( 岛) 的渐近正态性,我们需要下面的两个引理: 引理2 。定义m 为 聊) = 眦) 一r y ( s ) d a g ( s ) 笙! 耋塑互兰垡丛璧j :士芝鏊21 2 塑圭:互圣 则m 是 0 ,o o 】上的平方可积鞅,其可料二次变差过程( m ,m ) 由 ( m ,删牡r y ( s ) d a g ( s ) 给定,其中 ( t ) = ,( m t ,盈= o ) ,y ( t ) = ,( k t ) it 证明见文献【1 2 】,第二节 引理3 对一切t 0 ,有下式成立 器o c t 小j ( 揣g ( s ) y ( s 删s ) 厶) 。 证明见文献【t 2 】,第二节 以下是定理3 的证明方法是用一列独立的零均值随机变量和逼 近竹一;& 湎) 令 妒蝴卜; 滞铲一扣c 懈一 则 。= 一竹z 0 。气! 善聂妥竽d q c t , 其6 p q ( t ) = n e ij ( ,愉,置) m i n ( t ,k ) ) v ,五) 由引理3 得 s = 饨z ”r 反意南蜊 = 佗z ”,”揣d q c 功d m c s , 一”竺型筹蠼埘mjo =佗f _ = = _ := = 二二二_ 出d i s l g ( s ) y 【s ) ;骈些坐笔鬻蒹掣 叮( k s ,蠡= o ) 一,( k s ) d a g ( s ) ) 易证 s = ;莓j ( ”鬻 d ,( m “也- 0 ) 叫k 判州s ) ) + 必 其中 小) = 熙:瞒 s ) , 如) = 热;w ( 岛,玛) s ) v f ( , o o ,x a 因此,n 一5 & 涵) 渐近等价于佗一。莩以2 :7 + 1 8 ,其中 几= 篱黜一扣( 风,x o + ;z 。器m kg 尻- 0 ) 叫m 纠州力) 在给定咒的条件下 e 矗= 0 , y o r 岛= y 。r f 鼍轰群一; v ,( 岛,磁) ) = e 卷掣一 2v f ( f l o 圳- 一( 岛,x o v t 7 ) 2 丘t 【1 冠7 西i 了i 万一一 j l p o , 第l 章删发1 i - 技 t l 横掣中伸数州门的工l 方法 = 熙:莓 笺器铲一手v 舳v 舳斛 由引理2 及定理4 ( 文献 1 3 】) 知 e b = ;盯沁 z ”器州铲j ( ”器d j ( y ( s ) ( s ) ) = 0 , c o y ( 1 7 ,厶) = :e ( b 最) = 扣玎雨i t q ( t ) 删) =0 惭矗= 去讹r 忻器例) = 去e 昕器删z 。籍删) = e ( f o ”器删) = :z ”筹划n 从而,依据多元中心极限定理,n - ;& ( 岛) 渐近于正态分布( o ,r ) ,其中 r = 熙:军 簧群一1 2 v 舳v 舶圳 + :z 。筹 审砸1 千丝 第2 章删失非线州横刊中倚数旧门的纾_ 黔_ c l = 【然方法 第2 章删失非线性模型中位数回归的经验似然 方法 2 1 引言 本章受文献f 1 4 】的启发,将使用经验似然方法来进行删失非线性模 型( 1 1 1 ) 回归参数的统计推断,相关变量的解释同前文所述经验似然方法 由o w c f l 首创( 文献 1 5 】一【1 6 】) 这种方法的优越性已经得到了充分的肯定并 被广泛地应用于各种研究之中如:线性模型( 文献 1 7 】) ,广义线性模型( 文 献 1 8 】) ,分位数估计( 文献【1 9 】) ,偏样本模型( 文献 2 0 1 ) ,部分线性模型( 文 献【2 l 】) 及中位数回归模型( 文献【1 4 】) 等经验似然方法最吸引统计研究人员的 特点在于该方法所产生的置信区域的性状完全由样本数据决定关于经验似然 方法更多优良性质的讨论请查阅文献 2 2 】 本章结构如下在下节中我们将简要回顾第一章的主要结论并给出模 型( 1 1 1 ) 参数回归的经验似然方法第三节中,将给出本章的主要结论及必要 的假设条件关于主要结论的证明将在最后一节中给出 2 2 模型与方法 对于删失数据回归模型( 1 1 1 ) ,在仅有数据( 弼,k ,蠡) 的条件下,最小一乘 方法无法直接应用于模型( 1 1 1 ) 参数向量p 的统计推断为解决这一问题,在 第一章中,我们注意到 e p ( m ,( 肺圳) 1 咒】= 掣 其中岛是参数向量p 的真值,g 是删失变量e 的生存函数从而提出了如下的 估计方程 2 ; 鬻一撕觚) 0 , 叫) 其中0 是g 的乘极限估计方程( 2 2 1 ) 的一个根庞定义为0 & ( 卢) | f 的极小值点, 其中0 i l 为r p 中欧氏范数这里反是参数向量p 的点估计,且反可以由网格搜 釜:至型耋j :鉴型鉴土笠鍪【:= ! 盟塑丝鉴竺鉴立垄 索法( 文献 9 】) 计算得出在一定条件下,可以证明 佗( 反一风) 三( o ,a 一1 i a 一1 ) , 其中“三”意为依分布收敛,矩阵a 和r 将在本章第三节中给出这可以用于参 数向量口的统计推断 下面将仅关注参数向量口统计推断的经验似然方法 令 睨( p ) = ! :;渊一;】v ,( 卢,磁) ,i - - - - 1 , 2 , - , n 易证在给定序列五的条件下,e 睨( 岛) = 0 ,i = 1 ,2 ,几从而检验口是否为 真实参数就等价与检验e w , ( z ) = 0 是否成立,i = 1 ,2 ,竹由文献 1 6 】知, 此问题可以用经验似然方法解决令p l ,伽,加非负且鼽= 1 ,则经验似 i 然函数定义为 三( 卢) = s u p 鼽:a = 1 ,鼽鹏( p ) = o ) i = 1li 由于g 未知,三( p ) 不能直接用于参数向量卢的统计推断解决此问题的一个直 接的办法就是用0 代替g 因此,经验似然函数重新定义为 其中 工( 卢) = 肌p 鼽:鼽= 1 ,鼽眠( p ) = o ) , i = 1 it w n i ( f 1 ) = ! 罢瓣一;】v ,( p ,砥) ,t = - ,z ,札 依据拉格郎日乘子法,可证以的最优解为 a = :( 1 + , v w n 舻) ) 一,江1 ,2 , 釜:耋型盔苎垡盟鉴! 士芝墼【= ! 坚塑丝鉴坚竺互垄 其中a 是方程 :;毒1 = 。 , 乱年+ a 7 i i ( p ) 。 一7 的根受条件e a = l 约束,n 釜l a 勘= l t _ 1 处达到其最大值, n - n 因此, 在口处的经验似然比函数定义为 相应的对数似然比函数定义为 = - 2 1 0 9 r ( a ) = 2 l o g ( 1 + a 7 眠( 矾 i 其中a 是方程( 2 2 2 ) 的解 2 3 条件和主要结论 值得一提的是f ( 卢) 中的序列- ( 芦) 既不独立也不同分布,这与标准的对 数经验似然函数不同正因为如此,f ( p ) 的渐近分布不再是标准的妒分布为得 到z ( p ) 的渐近分布,首先假设参数的真值岛在有界凸区域d 的内部,其次给 出下列条件: a i e 1 ,e 。独立同分布给定五时e t 的条件生存函数记为日,它连续, 未知但中位数为0 x 1 ,j 是独立同分布的协变量 a 2 a ,g 为独立同分布且具有连续生存函数g 的非负随机删失变 量,并与乃,独立函数9 和h ,分别为1 一g 和l h 的密度函数,均一致 有界 a 3 f ( a ,咒) 在卢= 风处对于p 连续可微,且,愉,五) 0 ,i = 1 ,2 ,礼存在岛的邻域玩使得对一切口b o ,下式成立 且 ,( 卢,磁) 一y ( g o ,磁) 一v f ( 舟o ,托) 7 ( 一风) l n ( 岛) i l p 一风l l 以 p 凡+ q 。汹 i l 以 n 。:l 纯 。:l = p r 第2 章删大1 f 线t 1 模掣中f | 彀州门的纾- 盼似然方法 藏碍( 岛) o 和,( p ,x ) 知几乎处处成立,这里6 也是常量 a 5 假定矩阵e v f ( 1 3 0 ,x ) v f ( 岛,x ) 7 九( o i x ) 】正定,这里 ( i x ) 是给 定x 时日的条件密度函数 令 p ( f ) = 撬:瞒t ) , q ( t ) = 熙:耵( 岛,玛) 2 t ) v ,( 岛,x a , r = i 14 - i 2 , 其中 r l - 熙i 莩 错一和( 眦m ( 眦) , r 。= 圻祥划线 a g 是删失变量c 的累积失效率函数下面的定理给出t t ( 届o ) 的极限分布,我 们将在最后一节中给出它的证明 定理4 在条件a 1 - a 5 下,若阮是p 的真值,则当n o 。时, z ( 岛) d 叫l x i ,1 + 伽2 x 2 ,2 + + 牡j p x i 巾 其中“三 意为依分布收敛,伽1 ,坼是r 1 r 的特征值,x i ,l ,x 2 p 是相 互独立且自由度为1 的x 2 随机变量 若未知权重序列锄可以由估计得出,定理4 就可以用来构造岛的置信区 域在定理4 的条件下,可得极限协差阵r 1 ,r 2 ( 从而r ) 的相合估计 f 。= : 滁掣1 1 2 2 jv 脶圳v 舷僦( 2 3 1 ) 冗乍lg ( ,( 风,墨) ) ”、 睡去莩”反) 鼍等掣r 鲫, 其中对于任意的向量。有0 02 = 7 从而可得序列坝的相合估计序列硪,其 中啦是哥1 p 的特征值,且f t = 1 + 2 真值岛的置信区域可以依下面的方法构造,令 厶。( f 1 ) = 舻:t ( f 1 ) g ,。 , ( 2 3 3 ) 其中c 忭 口是加权x 2 分布面l x ,l4 - 4 - 物x 2 l ,p 的1 一。分位数在定理4 的条件下, 可得当竹_ 。o 时, p ( 岛e 厶,。) 一1 一口 2 4 定理的证明 为证明定理4 ,给出下面3 个引理: 引理4 在定理4 的条件下,有 ( i ) n 一愉) 三n ( o ,r ) ,( i i ) 反一肺= d p ( n 一) t 证明见定理3 的证明过程 引理5 在定理4 的条件下,有 ( i ) n 一1 t 么( 岛) - ( 岛) 三r 1 , ( i i ) 亡l 三r 1 ,( i i i ) f 三r t 其中“三”意为依概率收敛 9 一 第2 章删太竹线r l 模甲巾f 敬几1 门的纤验似然方法 证明令 f - n = n “眠( 风) 眠( 凤) 7 , i r l 。= n 一1 ( 岛) m ( 岛) i 易见 r l = l i r ar l n , 为证明( i ) ,仅需证明亡l 。= r l 。+ d p ( 1 ) 对任意的口e 孵,有 口,( f - 。一r - 。= :( 以t ( 风) 一m ( 岛) ) ) 2 + ;( - 班( 厢) ) ( ( - ( 肺) 一- k ( 岛) ) ) = : + 2 下面我们将证明 和厶均为唧( 1 ) 首先注意到 口7 ( 既( 岛) 一m ( 肺) ) = d v i ( 届o ,茏) ! 堕兰! 鱼! 垄 0 ( ,( 阮,咒) ) ) ) ,垡三垫:垄2 2 g ( ,愉,五) ) = ( g ( ,( 眦) ) - 酊( 眦) ) ) 盟恶拶 1 + 盟嗡法塑x 4 ) 幽 l g ( ,( 岛, 1 在条4 - a 4 t ,w ;( 岛) = a v f ( 1 3 0 ,j 匕) o _ ( 1 ) 从而依据条件3 、a 4 和乘极限估 计的重对数收敛性知 耶c 1 铷s u p1 0 ( 旷g f 1 + 姆s u p 。 等产l h 莩缨裟幂捌 = o p ( 1 ) , 其中a 是有限常数类似可以证明 = o n ( 1 ) 从而可得f 1 。= r l 。+ d p ( 1 ) ,即 引理5 ( i ) 证毕 第2 牵剿失谁线r if 刑十付敏门的纤黔f 【l 然方法 为证明引理5 ( 田,仅需证明f 1 = f 1 。- i - o p ( 1 ) 令 j i = 篙器铲一错,江,胁 = _ :一一_ :一, z2 1 ,z ,。,n g ( ,( 风,五) )g ( ,( 岛,) ) 对任意的ne 舻,有 ( f 1 - 肛;莩( 唧( 眦) ) 2 坪+ ;f v 舶删 鼍豸器铲一翔 同样依据条件彳3 、一4 和乘极限估计的重对数收敛性知 卅l 一口l m a , x ( a v f ( 3 0 ,五) ) 2 :毋 + 峄v 舳删;础旆( 铷s u pl 等产 c 2 睦算+ :啡 其中国是有限常数易见 ,g ( ,( 风,咒) ) ,( 风,咒) ) 一j m ,( 岛,咒) ) j i = = = 一一 g ( ,( 风,五) )g ( ,( 风,咒) ) g ( ,( 风,x i ) ) g ( ,涵,五) ),( m ,汹,五) ) g ( ,愉,五) ) g ( ,( 肺,五) ) g ( ,( 风,置) ) g ( ,汹,五) ) ( 0 ( ,( 反,五) ) 一o ( f ( 3 0 ,咒) ) ) 从而 ( 1 + 嚣i 等产i ) 噬巡掣并幽 + a 其中伤是有限常数在条件爿3 ,引理4 ( i i ) ,和文献【9 】中( a 7 ) 式即 + 0 p ( 1 ) l ,2 ,( 庞,五) ) ) 一j m ,汹,x d ) l = d p ( n 2 7 3 ) t 同时成立下,依据乘极限估计的重对数收敛性可得 :a :l j m ,( 良,置) ) ) 一,m ,( 岛,x d ) l + o p ( 1 ) 0 9 1 ) 和 :莩露s :础厕1 + 丽i 厕) ( 1 + s 蜥u p l 等笋1 ) s g :i 也 = o p ( 1 ) , 其中a 和凸均为有限常数因此( f l f 1 。) 口= 唧( 1 ) 从而于l = 于l 。+ 唧( 1 ) , 引理5 ( i i ) 证毕类似可证,亡2 是r 2 的一个相合估计,再联合引理5 ( i i ) 可证引 t 里5 ( i f i ) 从而引理5 证毕 引理6 令y 三2 v ( o ,厶) ,其中品是p p 单位矩阵,u 为p p 的非负定矩阵且 特征值为f l ,知则, y 矿y 三f l x i ,1 + + f p x i 护, 其中x ;i 的定义同定理4 证明略 现在我们证明定理4 记a = 矽,其中p 0 ,l i o l l = 1 由引理5 2 ( i ) 的证明 过程可知f l 。= r l n + 唧( 1 ) ,从而f 1 。0 = r l 。o - i - o p ( 1 ) 成立在条件4 3 、a 4 t , 易得 竹吨翻i ( 笺器铲一互1 册( 眦) 4 _ d ( 1 ) 从而,应用文献 1 7 】中同样的方法可证 i i , x l l = 0 p ( n 一1 2 ) ( 2 4 1 ) 依据条件爿3 、4 彳知 m a x i l w i ( 舟o ) l l 叫堕酱器努趔1 1 (1+懋i等铲”互1to t峄m 眦) t ( “【j = o ( 1 ) ( 2 ,4 ,2 ) 成立对( 2 2 3 ) 应用泰勒展式,易得 j ( 岛) = 2 l o g 1 + 眠i ( 岛) ) = 2 a w 矗( 岛) 一;( w 岳( 岛) ) 2 ) + h ii ( 2 4 3 ) 其中 i r i 舔i a 7 ( 岛) 1 3 依概率成立,g 是有限常数故 由于 isc b n l i a i l 3 ( m 斜l i w ( 岛) l ) 3 t = ( 竹1 2 ) ( 2 4 4 ) 莩尚= 莩眠c 岛,m c 舭躜踹 第2 章删欠北线性 芟掣巾他敬州门的纤验似然方注 = ( 阮) 一 眠t ( 风) t ( 风) p ti r 慨;( 岛) ( a i ( 岛) ) 2 么,1 + n 么( 岛) 成立,依据( 2 2 1 2 ) ,( 2 4 1 ) ,( 2 4 2 ) 和引理5 2 ( i ) ,可得 a = 眠t ( 阮) 眠( 踟) , - 1 ( 风) + 唧( n - v 2 ) ( 2 4 5 ) 由( 2 2 2 ) 知 。= 莩嵩蹁 = 莩( 肺) - y ; j a t ( 岛) ) 2 + 莩享举罢;岳笳r c z a s , 成立再次利用( 2 4 1 ) ,( 2 4 2 ) 得 由( 2 4 6 ) ,( 2 4 7 ) 知 黜叫n - l ,2 )1 + a w 么( 岛) 1 、 ( 2 4 7 ) a 7 i ( 风) = ( a - 矿矗( 肺) ) 2 + 铷( 1 ) ( 2 4 8 ) li 成立,联合( 2 4 t 3 ) ,( 2 4 4 ) ,( 2 4 5 ) ,( 2 4 8 ) 和引理5 2 ( i ) 可证 t ( f l o ) = a 7 i ( 廓) - t 么( 国) 7 a + d p ( 1 ) t = n - v 2 眠( 廓) 卜一1 眠( 岛) 既( 岛) ,】- 1 卜叫2 眠t ( 岛) + o p ( i ) = f - l l i n - l l l ;眠慨) f 1 2 f _ 1 r v 2 】 r 一卢旷
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合伙投资股票协议书
- 出售房屋委托协议书
- 酒店临时用工协议书
- 冰箱陈列协议书
- 房贷离婚协议书
- 产品分配协议书
- 货架技术协议书
- 车辆转让经营协议书
- 电子邮件传送协议书
- 广告牌制作安装协议书
- 2026年初级经济师之初级经济师人力资源管理考试题库500道及答案【全优】
- 2025-2030民办国际化学校发展现状与未来机遇研判
- 2025年温州平阳县县属国有企业公开招聘61人备考考试题库附答案解析
- 2025至2030中国冷冻机油行业项目调研及市场前景预测评估报告
- 码头环保宣传培训
- 2025年新疆第师图木舒克市公安局招聘警务辅助人员公共基础知识+写作综合练习题及答案
- 下丘脑和垂体
- 2023年云南驰宏锌锗股份有限公司招聘笔试题库及答案解析
- 中科大《无机化学》课件1气体、液体和溶液的性质
- 江苏省中等职业学校学业水平考试商务营销类(营销方向)技能考试测试题
- Q∕SY 1419-2011 油气管道应变监测规范
评论
0/150
提交评论