




已阅读5页,还剩73页未读, 继续免费阅读
(概率论与数理统计专业论文)关于区间数据的分布函数估计问题.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 f 。 随机变量的区间观察值是指在随机试验中,我们只知道随机变量x 是否落 l 入某一已知区间( 五,靠】( 该区间可以是来自某个已知或未知的二维分布,也可 以是常数区间) ,但不知道随机变量z 的具体观察值这类问题不同于以往讨论 过的左截断,右截断或双侧截断问题在医学研究和经济指标分析中常常会遇到 这类数据,研究这类问题具有重要的理论意义和实际意义九十年代以来,不完 全数据的统计分析开始注重这一闻题的研究。一部分问题已经得到了解决,但这 一领域还有很多问题有待研究本文研究第二类区间数据的分布函数估计问题, 全文共分四章第一章首先介绍了区间数据问题的背景,然后将所见到的一 些关于分布函数的最新研究成果作了一个简要介绍,最后指出了本文研究的主要 问题是估计分布函数,所用的方法是利用随机逼近的办法估计一个离散均匀分布 随机变量的所有可能取值,再利用连续函数离散化的办法给出了连续型随机变量 分布函数的估计;第二章对两点均匀分布的情况作了详细的讨论,不仅给出了未 知点的估计方法,而且证明了估计量的收敛速度可以接近o ( ,l 叶) ;第三章把第二 章的结论推广到m 个点的情况( m 是大于2 的自然数) ,在一定的条件下,证明 了向量( x 1r :,) 的估计量也有接近口0 一;) 的收敛速度;第四章在第三章 结论的基础上,利用连续函数离散化的办法给出了连续型随机变量分布函数的估 计,并获得了该估计量的最优收敛速度为o ( n 一争。) 关键词区间;矗磊,非参数寝矢似然估计,自 目吾括计,随瓶备近法 a b s t r a c t a nl m e r v a lc e n s o r e do b s e r v a t i o nm e a n st h a t 彳i sk n o w ne i t h e rt ol i ei n s i d ea n i m e r v a l 慨,以】,o rt o l i eb e l o w x o ra b o v e 以b u t ,w ea r e n o ta b l et o o b s e r v et h ee x a c tv a l u eo f t h es u r v i v a lt i m exa ta 1 1 t h i sq u e s t i o ni sd i f f e r e n tf r o m t h eu s u a lr i g h tc e n s o r i n g ,l e f tc e n s o r i n go rd o u b l e c e n s o r i n g i ti sv e r yi m p o r t a n tb o t h i np r a c t i c ea n di nt h e o r yt os t u d yt h i sk i n do f d a t a , f o ri to f t e no c c u r si nm e d i c a l r e s e a r c ha n de c o n o m i c a n a l y s i s f r o m1 9 9 0 s ,t h i sk i n do f q u e s t i o ni su n d e rd i s c u s s i o n , a n ds o m eo ft h e mh a v eb e e ns o l v e d b u t ,t h e r ea r em a n y q u e s t i o n st ob er e s o l v e di n t h i sf i e l d i nt h i s p a p e r , w et r yt os t u d yt h ep r o b l e mo fe s t i m a t i n gad i s t r i b u t i o n f u n o t i o nw i t hi n t e r v a ic e n s o r e dd a t a i n c h a p t e r1 ,b a c k g r o u n d o fi m e r v a lc e n s o r e dd a t ai si n t r o d u c e dt h e d i s t r i b u t i o nf u n c t i o nt h e o r y , w h i c hw ec o u l d g e tf r o mp e r i o d i c a l o rm a g a z i n e s ,i s s k e t c h e d ,a n dw ep o i n to u tt h em a i np r o b l e mt ob er e s o l v e di no u r p a p e r , a s i ss h o wi n t h ec o m i n gc h a p t e r , w eu s es t o c h a s t i ca p p r o x i m a t i o nt og e tv a l u e s ( w ea s s u m et h a t xi sm e a s u r e di nd i s c r e t eu n i t sa n dt a k e st h e s ev a l u e s ) i nc h a p t e r2 ,b a s e do na t w o p o i n t d i s c r e t eu n i f o r md i s t r i b u t i o n , w eo b t a i nan e wp r o c e d u r et oe s t i m a t ea d i s t r i b u t i o nf u n c t i o nw i t hi m e r v a lc e n s o r i n g a n dt h i se s t i m a t i o nh a sac o n v e r g e n c e r a t eo fo ( n 一7 ) ;c h a p t e r3f o l l o w sas i m i l a rp a t ha st h ec h a p t e r2 ,b u tt h i st i m ef o r m p o i n td i s c r e t eu n i f o r md i s t r i b u t i o n ac o n t i n u o u sd i s t r i b u t i o ni sd i s c u s s e di n c h a p t e r4 ,a n dw eg e tas a t i s f i e dr e s u l t k e y w o r d s :i n t e r v a lc e n s o r e dd a t a ; n o n - p a r a m e t r i cm a x i m u m l i k e l i h o o de s t i m a t i o n ; s e l f - c o n s i s t e n te s t i m a t i o n , s t o c h a s t i ca p p r o x i m a t i o n 博士学位论文 第一章引言 第一章引言 1 问题的背景 在寿命问题研究中,由于客观原因,有时不能获得准确的寿命数据x ,而只 能知道x 是否位于某一时间区间内,这种数据称为区间截断数据( 简称区间数 据) 例如,研究人员发现,血友病患者的发病机理是由于患者早期接受了被h i v 污染的血液制品给病人输入被h i v 污染的血液制品后,病人的血液将在未来 一段时间内被h i v 感染,从而成为血友病患者,但被感染的时间z 是不确定的 为了估计随机变量x 的分布,每隔一段时间就对这一高发病人群作检查,观察其 中的个体是否已经是h i v 感染者,一个h i v 感染者,被感染的时间j 应该位于 两次检查之间;但我们并不知道确切的时间此外,有些患者在第一次检查时已 被确定为h i v 感染者,此时患者被感染的时间x 是左截断的;也可能有些患者 在整个检查中仍未被h i v 感染,也就是说在直到整个试验结束时,仍然不是h i v 感染者,此时患者被感染的时间x 是右截断的,无论哪种情况都可以看成区 间数据的特例 区间数据的研究可以追溯到很久以前,六十年代的按时问分组数据研究可 视为它的一种特殊情况生物医学的数据处理中常按时间顺序a o q a 。 o o ,把时间分成若干段 a o ,a 。) , a ia :) ,【口。,m ) ,然后看看被考察对象( 如寿 命长度、药物起作用的时间等) 出现在哪个时段中,或者说考虑每一时段中被考 察对象的个数,然后作出统计推断g u n n a rk u l l d o r f f ( 1 9 6 1 ) 对这种分组数据的参 数估计作过研究,他主要是研究指数分布的同类的研究也一直受到人们的关注 从现在的观点看,区间数据研究的主要问题是:如何从观察到的区间数据去估 计肖的分布函数( 或分布函数的函数与泛函) 设五,五,以独立同分布,服 从未知分布f ( x ) ,区间数据的处理主要有如下两种类型: 类型l :设 z ) 是一列独立随机变量( 也可以是常数) 序列,它是可以被观 媾学位谂文 第一章弓l 言 黼令 纠,= 蚀蓍,嚣 我们虽然不能鼹察到置,健却貔残察到( 互,露) ,i = l ,2 ,n 程实践中 互) 经挂 是试验时刻,试验到正为止我们常假定 1 ) 是同分布的,r r , 与x 。独立 类墨2 :设( 弛,一) 是一列独立网分帮疆撬离量廖列,共嗣熬分枣函数为 h ( u ,v ) ,满足p ( o k ) = 1 ,r ( u ,k ) 与置独立我们将观察到x ,是小于 坼,在。k ) 之闻,还是大予辑令莓= ,瓴砸 ,苁= q q 瑙l 为糖应集会戆零 性随数,则我们获得的观察值为( u ,巧,瓯,“) ,i = 1 , 2 ,h 区闼数据蜒题雩寻到不少作卷豹磺定,下瓤灸绍近年来关于分蛮姻数估计方疆 豹一些簪 究 2 近年来关于分布函数估计的二些研究 2 1 非参数极大似然估计法 墩器我钓总骰定x i ,x :,x 。是独立弱努毒糖枫变爨序列,服从来知连续 分布函数f ( x ) 希望从( 7 :) 或( u 。,k ) 的观察来估计f ,般而言,我们可以把 这瓣题视为送阕秸诗闯邂的反溺题我织翘道,如岽己熟分南滋数f ( x ) ,鄹 么我们可以求出爿的踅信水平为l 一口的鬣信区间,反之f ( x ) 未知,但我们观察 到包禽疆枫变量x 豹些戆壤区阗五,j 2 ,。六,从这些璇规蘧阅基发去悠计来 知分布函数f ( x ) ,使得估计值庶( x ) 在某种标准下尽可能靠近f 非参数极大 议然髂计必我们提供了一种求嗣酶方法,这种方法是用一个右连续不降的羧 梯函数去估计用,实质j 二是将总质麓1 分配到区间数据以,j :,j 。的端点上, 搜褥戏察健豹织然露数最大,如果我们在最大理察点( 当f 连续对,在该点的值 一定小于1 ) 蠡勺表铡羚不攒定余下麴庚量鹣具体位置,那么f 豹嚣参数掇大似然 估计建难一扮, 博士学位论文篱一喾s 害 我们先讨论类型1 的情况,f 的似然函数为 n 舀= n 酽( 五) 】焉 1 f 曦耳q ( 1 1 ) 或对数似然遵数 l o g l ,= p 。l n f 幔) + ( 1 8 , ) i n ( 1 一f 幔) ) , ( 1 ,2 ) 设夏,) 夏:) 夏) 为,t ,l 次序统计重,蛾1 ) ,。) ,”,屯) 为相应的示性函 数,并令f o 耱只 式为- - 0 0 下面的定理给出了,y :, 儿) 的充分必要条件 定理1 1 ( r o e k a f e l l a r ( 1 9 7 0 ) ) 设& 1 ) = i 量葶( 町= 0 ,儿,以) 使( 1 3 ) 式 最大的充分必要条件是 以及 意氇一鼢:o毪一普甄= o = l i = l ,2 ,1 1 且p 。y :,虬) 由( 1 + 4 ) 式和( 1 5 ) 式唯一确定 也可戳麸届俦角度融发给出瓴,耽,以) 的舅一种表示形式 ( 1 4 ) ( 1 5 ) 定理1 2 ( a y e r e t a l ( 1 9 5 5 ) 可参见r d b 鳅s o n 娃a l + ( 1 9 8 8 ) ) 设目是眩拧】土的 滚数,对 f o ,黯】 3 搏士学位论文第一肇引言 厝f ) 哪u p 胃( 玲:符( f ) 蔷岛力鲥峨露p ) = e ,磋下凸函数 t j 捌j 若苁必掰农点p ,丢嚷”) 处的友导数,那么镟,岁:,只) 使褥( 1 3 ) 式最大_ 事实上由上述定理1 2 在平面上将点瓴薹峨力) 的折线圈作出帮得 胪砜) :嘴噢麓 s , ( 1 6 ) 式嚣上去比较复杂,但当竹不太大时却很简单,下面给出一个例子 铡l 拧= 5 ,磊) :) 墨3 ) 0 ,记 g ,( f ) = l 协,f q ) - 2 蛾( x f ,“) + k 。 f 似) 一y ( t ) ) 2 蛾( f ,”) + 。h ;, f ( ”) 一f ( r ,) ) 一2 正匕( 墨f ,甜) 1 印以,。 1 一f ) ) 4 c 妃( t f :“) ; v a t ) 2 ( f ) + i o f 1 ,( f 狮o ,) 定理1 4 ( g r o e n e b o o m a n d w e l l n e r ( 1 9 9 2 ) ) 设刁) 对应着某个弘,使, 五蚋 = 1 , 且最大的次序统计星) 对应着某个使j 即巧 = l ,则只使( 1 8 ) 最大化的充分 搏士学位论文 第一章暑l 言 必要条传是:囊是幽点 弓= 姆p ( n ) ,。( p l 质构成豹下凸嚣数( 该函数与定理1 2 中的爿+ 构造一样) 的友导数( 其中只= ( o ,0 ) 且五) e 以,j = l ,2 ,r a ) 可惜览筹没有显式可发达,只毙通过递接迭代的方法获得,如用凸弱算法, 获菜一内点出发,每步褥二次函数遴近等。这蒌不樽详述当嚣缀,l 、时,直接爵激 由定理i 3 城定理1 ,4 算出 i 例l ”= 4 ,观察值为:( u i ,m ,1 ,o ) ,( u 2 ,吒,o ,1 ) ,( 一鸭巧,0 ,o ) ,( 一q 攻,0 ,0 ) ,( 其 串强 蜗以 蚝 ) ,爵舅褥 只( u 1 ) = 只( u 2 ) = 只( 圪) = , 毫( 酩) = 或 致) = 毒 2 2 自相合估计法 自相合估计是从另外一个角度来考虑吼题,自相合估计一般有如下形式: 竞( f ) = & 蛾( t ) i q :o ) 其巾c 是观察信患,( f ) 是不可观察随机变量z 。砭,以的经验分布函数,与 自相合估计法相应的是e m ( 迭代) 算法,上妓从形式上嚣,似乎更有启发性也更有 会理性。在塞棚合传计法的计算中,键往要利用极大似然原理,从嚣其解也会与 菲参数极大 娃然髅 重会。 我们先考虑类型l ,设t r ,定义丞数 伯斗嘭 豁丈蒜: 这里封月,“a t = m i n u ,t ) 当,为分布函数时,对任意小于1 的难数h ,f + m 墩蔻分摩舔数琵黠基( 1 2 ) 式霹褥 妒( f ) 皇1 弹1 。g 岛= f c ,敝。 l a f ( t ) + b l n ( 1 一即) ) 地融f ) , 1 ) 博士学位论文第一章引言 其中p n ( x , t ) 是点( 肖。,正) ,1 i 的经验概率测度注意到妒在方向a ,上的导数 为 l i m 翌堕丝! 二! 盟 = m 圳坐铲,坐铲k c 圳 如果妒( f ) 在f 处取得最大,则上式应为0 ,从而得到 眦计怔。,每警_ 圳鬻卜n 它又可以写成 只o ) = i f ) i t , ,五,l ;4 ,占:,巧。) ( 1 1 3 ) 因此,对固定的r ,t ( f ) 是经验分布函数c 在给定条件正,五,l ;五,占:,艿。 下的条件期颦 f 皿考虑类型2 ,记 q p p ( x ,甜,皇, 。;。 i n f ( u ) + ,扣。柳 l n f ( v ) 一f ) 】+ ,扣, i n 1 一f ( 】 由上式及( 1 8 ) 式可得 y ( f 卜1 玎1 。g l f2 丘,9 ,( 圳,v 比( v ) ( 1 1 4 ) 其中只( x ,甜,v ) 是点( 置,u ,k ) ,1 i 门的经验概率测度注意到妒在方a 。上的 导数为 l i m 竺竺丝! 二竺盟 = 计晒 f ( u t ) l r f ( t ) - f ( u ) + ,t s ,:! :! :! _ 1 2 :! ! :! ;j :j ! ;:j :_ ! ! :1 2 _ :! :坳 7 博士学位论文 第一章引言 + , 圳蝼攀笺产型卜n 如果y ( f ) 毛z f 处取得最大,则上式应为0 ,从而得到 眦计,气警_ 。州若毒舞产 + , ,篙k 力 它又可以写成 e ( f ) = e e ( f ) i u ,u 2 ,u 。;k ,v ;一,占,j 。; ,y :,y 。 ( 1 1 5 ) 2 3 瞰) 估计量的大样本性质 首先考虑类型1 ,由( 1 6 ) 式可以定义f ( 功的估计量 e ( 功= 0 , x 【o ) x e ( t 。) ) ,x 【t i ) ,t ) ) i = 1 , 2 ,万一1 只( i 。) ) ,x 咖) g r o e n e b o o ma n d w e l l n e r ( 1 9 9 2 ) ; 1 j 用测度弱收敛理论证明了下列定理 定理1 5 ( g r o e n e b o o ma n dw e l l n e r ( 1 9 9 2 ) ) 设f ( x ) 和g ( 曲都连续,( 这里x 的分布为f ( x ) ,t 的分布为g ( x ) ) ,且满足下列条件之一: 则 ( 1 ) p f 关于圪绝对连续( 表示h 产生的测度) ; ( 2 ) g ( 功严格增加, 、。l i ms。up7(t)一f(oltlim s u p 7 ( t ) = o ) = l 。一m 廿0 - 1 ( 1 1 6 ) w a n g ( 1 9 9 6 ) 毛e f 和g 均是严格增加的连续函数( f 0 ) 的条件下,利用非参 数极大似然估计的自相合性也证明了( i 1 6 ) v a nd eg e e r ( 1 9 9 3 ) 用第三种方法也 证明t ( 1 1 6 ) ,其方法是利用h e l l i n g e r 相合性和逼近论的s 一熵,虽然方法很有 博士学位论文 第章引言 特点,但用到一个证明尚需完善的定理与定理1 5 相关的问题是:定理中的条 件能否减弱? 对于非参数极大似然估计的极限分布,有下列结果 定理1 6 ( 研o e n e b o o m ( 1 9 8 7 ) ) 驶定理1 5 的条件成立,1 7 玎且x 有密厦,? 。 有密度g ,设t 。满g o 0 ,则 讯抄f ( f 0 形 0)弛。)严df(to)(1-f(t)g(t 。) ) 厂( f 0。) 弦 d 1 其中寸表示依分布收敛,z = s u p t t :口( f ) 一t 2 = s u p b ( u ) 一”2 ) ,t 0 ,b ( f ) 是零 l j 关于均值m ,= f t d f ( t ) 的估计有下列定理 定理i 7 ( g r o e n e b o o m a n d w d l n e r ( 1 9 9 2 ) ) 在定理1 6 的条件下,有 矗 羽一只( f ) ) 出一m ,岿矿 其中:,= 【o ,m 】为f 的有界支撑,密度f 和g 有正的下界,v 的分布为n ( o ,仃2 ) 且仃:f f ( 1 - f ) d t 其次考虑类型2 ,g r o e n e b o o ma n dw e l l n e r ( 1 9 9 2 ) 利用测度弱收敛理论证明 了f 的非参数极大似然估计在一定条件下的强相合性,v a nd eg e e r ( 1 9 9 3 ) 利用 h e l l i n g e r 相合性和逼近论的占一熵也证明了这一结论另外,g e s k u sa n d g r o e n e b o o m ( 1 9 9 9 ) 在较复杂的条件下证明了f 的泛函估计的下列结果 定理1 8 ( g e s k u s a n d g r o e n e b o o m ( 1 9 9 9 ) ) 设放d 为f 在h e l l i n g e r 距离下的 可微线性泛函,则威( t ) 一丘旷) ) 旦哼( o ,i i o - , i r :, ) ,( - - - - ) 0 0 ) 9 媾士学位论文第一肇辱l 言 3 。本文研究戆翊题 从上面酶介绍情况来看,关于第一类医简截断数据( 类整1 ) 弱统讳推断所取 得的最新成果是:随机变量x 的非参数极大似然估计e 具有瑕相台性( 定理1 5 或w a n g ( 1 9 9 6 ) ) ,农一定的条l 孛下,毙够求港毫豹极限分毒( 定理l + 6 ) ,涟枫变爨 z 的均值估计具有渐避正态性( 定理1 7 ) 然而,与类型l 相比,类型2 研究成果较少,到目前为止,关于第二类区间 截断数据的统计推断所取得的最新成果是:随机变量x 的非参数极大似然估汁 览具鸯强耀会性( g r o e n e b o o m w e l l n e r ( 1 9 9 2 ) g 建v a nd eg e e r ( 1 9 9 3 ) ) ;f 豹某些 可微泛函的估计具有渐近正态性( 定理1 8 ) 值是t 的渐近分布如何,是迄今未 勰决的难题北姚,c - r o e n e b o o m ( 1 9 9 1 ) 猜测,当 ,啦蠢正豹分毒密度射,寰的 收敛速度为伽i n 一) ,但没有给出证明 由此可见,在区间截断数据的统计推断方两还有不少问题有待进一步研究, 本文研究第二类区间裁断数据的分布函数估计闯题 我 】先考虑x 秀离教分布嚣馕嚣设膨。为己知正数,茗在寿疆区闼融磁】 上取卅个值0 x l x 2 , h ,当这m 个值x 1 ,x 2 ,x 。都已知时,记 p ,= 尹( x = t ) ,烈f ( 玲= 。p ,因越髂计f 等徐手链诗囊量( 罗,p :,p 。) 假设观察值为( ,k ,坑,n ) ,i = 1 ,2 ,聍t u m b u l l ( 1 9 7 4 ) 获得了下列自相含估计 方程 驴丢喜豢, 其中烈咿,扛,哦闻 = 搔 彳i = y ,q + 0 瓯- 7 ,) k ; _ 妻= 最翟+ ,。嚣+ ( 1 一筑一芦,毛, j = 1 , 2 ,搠( 1 1 7 ) 觏 墨,矗 幸知,芒礁,矗】 1 0 摊学链论文第一掌辱l 言 但方程组n 1 7 ) 的求解是十分困难的c h i n s a nl e e ( 1 9 9 9 ) 利用这个方程组采用迭 弋蛇方法去继计彝璧,p :,p 。) ,字# 橡造了一令瓮模型来迸明这撵的叠 弋是 收敛的,讴是也只能证孵分布函数的估计鳖具有弱相合性 方程( 1 1 7 ) 是在的取假毛,x :,x ,都已知的情况下,估计概率p ,= p i x = 苫,) ,这是比较经典鼢敲法,然藤,沿蒜这条路线臻l 三l 求爨分毒潘数嵇计 量的收敛速度其实我们饭可以从另一个角度来考虑这个问题:在方程( 1 1 7 ) 中, 如祟所有的p ;都是已知的,是否可以估计鼻的取值x ;,x 2 ,呢? 我秣在本文串主要讨论这个滔题我稻锻设x 魏离散均勾分布,静 p j = p ( = r ,) = 二,- ,= 1 , 2 ,i ( 卅为融知,但1 7 1 个值x l , 如,x 。都照未知。 m 的) 我们发现利用随机逼近的方法,可以求出这姥点的估计。我们得到的结论 是:在适当弱条件下,不钗鸯售计量毫,是,以) a s 收敛到其真瞧墨,x :, ,x 。) ,而且该估计量有接近于d ( 拧强) 收敛速度( 定理3 2 ) 另外,当x 为连续 分布时,我们浑q 用连续函数离散化的方法,也能绘出x 的分搬函数的估计量, 丽益该倍 中量静l | 受敛速度掰戳接近于0 ( 站铂) ( 定理41 ) 下面几章的讨论过程是这样的; 第二章详细研究了。2 的情况篇一节列出了一些必要的假设;第= 节讨 论自相合估计方程( 1 ,1 7 ) ,从而获得了随机逼近所需要的公式;第兰节给出了用 随机逼近法求来知点的估计方法;第暇节l 正明了 矗计量的瑞善收敛性;第五节获 得了储计羹有接遥于d 和一嚣) 较敛速度( 定褒2 薅) ;最后一节敲了一份模羧报告 第三章研究了n l 为任一给定自然数的情况第一节列出了一些必要的假设: 第二节给出了用随机遇近法求未知点的估计方法;第三节证明了估计麓的d 矗收 敛性,共讨论了继计量有接近予| 场) 收敛遮度( 定理3 芍 第豳章考虑石为连续分布静情况,第一繁剜邀了一螫必要的假设;第二带 是嗣用第三章的缩采给出了分布溺数的估计,并证明了该估计量的最优收敛速 度是0 1 p ) ( 定理4 1 ) 第三节绘出了一份模拟报告 博士学位论文 第二章关子两点分布的情况 第二章关于两点分布的情况 本章总假设随机变量x 为两点均匀分布,即p ( x = 而) = p ( x = x :) = ,在 一和x :都为未知的情况下,讨论怎样利用样本( ,k ,4 ,n ) ,( i = 1 , 2 ,胛) 去 估计x 和x :2l 列出了对未知随机变量x 、截断随机变j t ( u ,v ) 和随机试验 的一些假设;2 2 讨论了t u m b u i l ( 1 9 7 4 ) 给出的自相合方程,并利用这个方程构 造出求估计量所需要的一个表达式;2 3 给出了求和的估计的步骤;2 4 证明了估计量的a 矗收敛性;2 5 获得了估计量的收敛速度,这一速度十分接 l k i o ( n 铂) 2 6 给出了一份模拟报告 2 1 一些假设和说明 下面的几个假设是本章统计推断的基础,本章总假设t x :,用毫表示的 估计,用x l ( t ) 表示对一的第七次估计,类似地理解量:和x :” 假设2 1 随机变量x 在( o ,m 。) 内取值( m ,为已知) ,即 p ( o x 0 , ,d n ,d n = 妇,v ) :o h v 肼l 假设2 4 随机变量z 与随机向量( 矿) 相互独立 假设2 5 随机向量序列,k ) 独立同分布,共同的分布函数为h ( “,v ) ,x , 是独立同分布随机变量序列,共同的分布函数为f ( 的( 未知) 盯次独立随机试验 1 2 博士学位论文第= 章关予两点分毒蜘攮掇 所得到的样本观察值是( 职,巧,嗔,y ;) ,( f = l ,2 ,封) ,其中嗔= , 墨s u i , 九= 联u f x ,s 一 均两示性函数,而墨惩不对以翳察的这一假设的嶷蕊意义 是:第i 次试验后,虽然我们不能观察剿五的值,但悬我 f 】能够知道置位于三 个随e , i x i e ( o ,u i 】,( 汐。】和( 彰,j i ) 中的哪一个 下颟一些符号也是本章中经常用到的 1 ) ( 礁,】表示籀f 次试验蘼得到懿怒含置翡一个醛极嚣阂、由骰设2 5 知,样奉( 阢,k ,1 ,o ) 提供的信息是置在( o 以 内;样本( 弘,k ,0 ,1 ) 撼供的信息是 置在 ,】惠# 搀本双,班,馥提供静僖患是置程彤,m i ) 内;在这三季幸情况 中,( z i ,j ;】分剐怒( o ,以】,( u ,k 】和叱,m ,) ,塞5 - x 。i 和以有下列表示 x i = y ;秽,+ l 一一芦, x ;= 4 u + ,巧+ ( 1 一正- y ,) 材,( 2 ,1 ) 且p 红芒( 最,嬲】) = 1 ,因褥下嚣靛称( 墨,墨】舞第i 次试验褥到豹确定区瓣 ( 2 ) 口;或口晖,) 是个示性函数,( f = 1 , 2 ,订;j = 1 ,2 ) 定义如下: 咖烈驴怀阮剐= 长嚣譬裟 z , 显然 g 瓴x x :势豹取值只有三稀情嚣:0 ,( o 1 ) 或( 1 ,1 ) 眈弼0 ,o ) 的 禽义是第f 次试验得到豹确定区间中只包含墨,不包含也 在以上弦设郄籀号翡基磷上,我匍来回顾一下t a m b u l l ( 1 9 7 4 ) 的鑫稻合估计 蕊2 2 白楣合估诗 h n l b u j l ( 1 9 7 4 ) 曾考虑过区间数攒问惩,对予一般的两点分布,他假设x 、和 屯都已知,求乃= ,( z = b ) 的估计, 博士学位论文第二蕈荚予两点玲档豹攮况 样本( 够,k ,最, ) ( j = l ,2 ,鲋) 的极丈似然为 l ( p ,p 2 ) = n 【,( ) p 【f ( ) 一f ( q ) r 【l f ( ) 】。 i = l 记g ( p 1 ,p 2 ;且) = i o g l ( p l ,p 2 ) + a ( 热+ p 2 1 ) ,虫 或 霹得 虽出于 塑亟:意2 塑:o 印t 塑照! 怨笾:o 印2 a g ( p l , p 2 ;i t ) :o 争塑业+ 旯:e 缸2 “1 a 。( x j ) p , ,;l 争。焦! 一+ 五:o“2 。 “1 鹎) 尹, ,:l p l + p ,= 1 | a = 言喜蚓 江= i 1 台n 铥8 jx ) 溪刳; 一喜蘸糟嘉一喜高辫潮 一喜高黯赫一喜剥翱嘉 ( 2 3 ) ( 2 4 ) 出苓等式( q 2 ) 匹韪2 ) 匹a a ) 2 知t 该矩黔为= 阶受定的,因她筹,:;矗) 、;, 货 :同 ,。,。k 。n黼 l i 、;, 韪: 靠删 ,;。,l 。n l f 搏土学佼论文 蒜二章关乎藕蕊分枣的馕强 在点( a ,觑) 处取极大值,这就是说由 2 4 ) 式绘出的解,:) 楚f 2 ,3 ) 式的擞大馑 点由于( 2 4 ) 式中含有未知的参数n 和p :,因此不能称( 2 4 ) 式给磁的解( 反,反) 是参数( 双,p :) 的极大似然估计,根据自期会佑计定义( 见第一章簇二节,p 6 ) , ( 2 4 ) 式给崮的解( a ,p 。) 是参数( p 。,p :) 的自稻含估计自桶含估计求解常常采用 e m 算法,对于两点分谁,c h i n s a n l e e ( 1 9 9 9 ) 默代法褥到了尹;和p :驰售诗,蒡 构造了一个瓮模型涯明了结诤麓的弱藕合往 自褶合估计有一个直观的解释:假设对爿作了n o :独立观察,每次观察戍 当分到墨数矮爨,如果菜一次鼹察键刭的臻定送阕熬包含一个鼍,粼 的震羹全 部绘这个;如果巢一次观察褥到的确定区间包含了和x :,则击的质量应当按 权踅p t 和p :寒加权分配绘鼍积x :,即分醚士 ,= l ,2 ) 苷哆蚓 ;, 丢喜) q 5 ) 式等( 2 4 ) 式恰好一敬 在( 2 4 ) 式中,当p 。= 仍= 时。有 赢= 寺喜魄瑚 如蒜铝) ( 2 6 ) ( 2 6 ) 式也能照上述质量分配观点来雠释,但不需要由q 权分配,被随机区同覆盖的 点同等对待当置和南部已知时,( 2 6 ) 式是绕计量,右边为独立释均镶,箕期 鬟 培士学位论文 第二章美等两点势毒的 蠢况 望为圭,方蒸为畦) ,热_ 鞠多:的濒近分毒均为正悫分布,这慰稷设检验缀麓愆r 本文不讨论这个阚题 当x ,和x :都为未知时,( 2 ,6 ) 式不是统计量,但是一旦给出x 。和工:的估计囊 和:, 健计向量( 五,) ( 1 ,当为融知时,估计墨 步骤如下: 第一步取黾的韧傻估计,记为一,由第一节的约定,应该取墨档= ( o r :) 第二步取实数列 哝) , c 。) 满足以下条件 l 吒5 , l c 月2 r 一, 力p 小; 玎( 三3 占十三6 占) ( 2 7 ) ( 2 ,8 ) 第三步对并作两次独立观察,第一次键到样本( 以,k ,瑗,扎) ,由( 2 1 ) 式撄 至g 确定嚣闼晖i ,职】,计算崮( 2 2 ) 式定义的示往函数偿1 吨m + q ) 和搿1 :) 的值, 并用下式估计a 1 6 博士学位论文第二章关于两点分布的情况 讯x i ( 1 ) + c l ,= 蠢 第二次得到确定区间( e ,露】,计算相应的口2 ( 一。一c 。) 和口2 ( x :) 的值,并用下 式估计a 第四步取 a ( x l ( 0 - - c i ) = 硒a2(ixt。)丽-q) 一2 1 2 1 1 + 生c l 【p - ( x - 1 + c ) 一p - ( ”一c - ) 】 ( 2 9 ) 第五步重复第三步,得到p 。( _ 2 + c :) s u b 。( 薯”一c :) , 类似第四步,取 系 讯x l ( 2 ) + c i ,= 蠢糕 a ( x l ( 2 ) _ c z ) = 瓦a 4 ( 瓦x ( 2 1 丽- c 2 ) o ”蹦t 。、觯) + c 2 ) 咱( 铲l 啪】 第六步重复以上第三步至第五步,对x 作聍= 2 k 次独立观察后,由递推关 一= x i ( k - d + 等哦( _ 髀1 + c ) 一声l ( 一“一c k - t ) 】 ( 2 1 0 ) 。k - 1 我们得到序列一”,x l ”,x l ” 下一节将证明,在一定条件下,序列x 。”,一“,以概率1 收敛到( 定理2 1 ) ( 2 ) 当x :为未知时,估计的方法 当x :为未知时,取x :的估计x :”,然后,利用第一种情况下的六步估计法估 计_ ( 在六步估计中,x :1 是固定不变的) ,得到序列 1 7 博士学键论文第= 章关手辑点努春匏慵嚣 薯( “,薯, 在定理2 , 2 中,我嚣 姆逐聪它以摄率1 收敛裂墨 f 2 。1 t ) 3 ) 当墨帮x 2 , 鄂耀帮聪,估计网蠡( 墨,毪 步骥如下: 第步取( 鼍,第:) 的初值估计( ”,如渤) 第二:步取两缝实数歹棼 嚷 ,和。) 满慧班下条件 吼= 嘉,s ( 致9 ; = r 1 , 智嘿3 2 + ;1 ,i 1 一s ) ,歹= l 2 t ( 2 1 3 ) 。r n 2 - , r j , 智曩3 订w 歹一,2 2 1 3 第三步对x 作两次独立溉察,第一次褥戮样本( 秽,巧,艿;,i v ,) ,出( 2 i ) 式褥弼 确定区闯 x l ,碟】,计算由( 2 2 ) 式寇义的示性函数口1 ( 鼍辨+ q 1 ) 和群( # 2 辩十c :) 瓣德,并用下式估计最和恁 熊m 柏= 磊锷淼; 蹦x l ( t ) , x z ( z ) + c x ,= 瓦舞- p 番 “l i,“i j _十0 。j 第二次得裂确定区溺( 砭,砩】,计算攘斑韵a 2 ( x ;o 一c ,;) 鞴口2 :一c :;) 的馇, 并掰下式结计荔 讹c 1 ) - - 0 1 1 , x l ( 1 ) ,= 瓦避; 蹦x l ( t ) | ,x 2 ( 1 ) - - c ,i ) = 瓦案警 博士学位论文第二章燕子蒋点分毒的情况 x l ”= x # 旦p ,耐”+ c l l , x 2 一芦 耐”一。l l ,x 2 ) 】 c 1 1 o ”爿:。毒陵“”硝) + h :对”吖:i ) 】 第蠢步熏复第三步t 得到a ( 一2 生q :) 和多:( x :2 士# :) , 类似第四步,取 焱瓴( 2 ) + c 1 2 ,x 2 ( 2 ) ) = 氙a 3 瓦( x f f 瓦十q 而2 ) 巧: 堪。l x ,+ c 。,) + 口。i x ,l p 2 ( x t ( 2 ) , x 2 ( 2 ) + c 2 2 ) = 蔽a 3 ( 鬲x 2 ( 2 瓦) + c i 2 2 ) 孬; 描1 l 蔓。 + 搿” 矗+ 删“飞移:) = 忑a f 4 ( x , o i ) 湎- c n ) 丽 癌 鼍。一a , gl x , 编o ) , x 2 ( :d - - c ”,= 蠢热 饼t 鼍十搿l x 一“ 酽k 毒l 椭驻_ 屯一2 卜棘蔓嗡一m o ”) 】; 叫2 乏哦衅r ) + h 、弹,如。) - c n ) l ( 2 t 4 ) ( 2 1 5 ) ( 2 1 6 ) ( 2 1 7 ) 舞;六步黧复以上第三步踅第聂多,对z 作# = 2 k 次独立躐察后,虫递攘关 k 矿毒液种) + 柏咱( 叫m 柏】; 2 1 8 ) “”= 矿) + 毒哦酽秽) 十) 嗡硝”嘞) 】 ( 2 1 9 ) 我 】褥副序列( 墨m ,岛钟) ,( 为”,如2 ) ,文“,屯婶) 下一节憋诞明,在一定象件下,序列( t ,屯”) 以概率1 收敛到( t ,x :) ( 定 理2 3 1 1 9 博士学位论文 第二章关于两点分布的情况 2 4 估计量收敛性的证明 本节证明上节三种情况下由( 2 1 0 ) 式、( 2 z 1 ) 式、( 2 1 8 ) 式及( 2 1 9 ) 式定义的序 列都以概率1 收敛到它们各自的真值为此,先给出几个引理 引理2 1 设非负实数列 以,盱= 1 , 2 ,) 当刀n o 时,满足不等式 b n + l ( 1 一争”手 其中0 j 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教育科技企业产品迭代策略:2025年教育行业市场动态研究报告
- 教育直播平台师资力量培养与2025年人才战略研究报告
- 2025年医师资格考试真题及答案
- 2025年标准公路运输安全员考试题库及答案
- 2025年护士节护理知识竞赛考试模拟题库及答案解析
- 智能小区物业房屋使用权及管理服务协议书
- 未售商品房物业费合同范本5篇
- 智能化公寓租赁合同标的物使用管理协议
- 知识产权保护合同中的专利权质押担保实践
- 离婚协议书:夫妻共同债务分担及清偿合同
- 第2课 第二次鸦片战争 课件 部编版2024八年级上册历史
- 艾梅乙信息安全管理制度
- 心包疾病患者的护理
- 高校援建人才管理办法
- 企业创新激励机制与绩效评价体系研究
- 《老年人能力评估实务》健康养老服务专业全套教学课件
- 橡胶环境损伤机理与寿命预测模型构建研究
- 腹腔镜子宫肌瘤护理查房
- 2025年卫生类事业单位招聘考试护理学专业知识外科护理试卷
- 个人养老金微课课件
- 肿瘤患者心理抑郁护理
评论
0/150
提交评论