(概率论与数理统计专业论文)多重删失数据分布函数的估计及其强相合性.pdf_第1页
(概率论与数理统计专业论文)多重删失数据分布函数的估计及其强相合性.pdf_第2页
(概率论与数理统计专业论文)多重删失数据分布函数的估计及其强相合性.pdf_第3页
(概率论与数理统计专业论文)多重删失数据分布函数的估计及其强相合性.pdf_第4页
(概率论与数理统计专业论文)多重删失数据分布函数的估计及其强相合性.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(概率论与数理统计专业论文)多重删失数据分布函数的估计及其强相合性.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

r m a s t e rd i s s e r t a t i o no fy e a r2 0 11 u n i v e r s i t yi d :1 0 2 6 9 s t u d e n ti d :5 1 0 8 3 0 0 1 0 9 3 d i s t r i b u t i o nf u n c t i o ne s t i m a t ew i t hm u l t i p l e c e n s o r e dd a t aan d d e p a r t m e n t m a j o r i t ss t r o n gc o n s i s t e n c y s c h o o lo ff i n a n c ea n ds t a t i s t i c s p r o b a b i l i t ya n dm a t h e m a t i c a ls t a t i s t i c s r e s e a r c hd i r e c t i o nm a t h e m a t i c a ls t a t i s t i c s a u t h o r d a t e a s s o c i a t ep r o f e s s o rb a n g j u sd i n g a p r i l ,2 0 1 1 郑重声明:本人呈交的学位论文多重删失数据分布函数的估计及其强相合 性,是在华东师范大学攻读顸左博士( 请勾选) 学位期间,在导师的指导下进 行的研究工作及取得的研究成果。除文中已经注明引用的内容外,本论文不包含其 他个人已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体, 均己在文中作了明确说明并表示谢意。 作者签名:剑睦 日期凶ff 年月乡日 华东师范大学学位论文著作权使用声明 t ) = 1 一f ( t ) 对生存函数 和分布函数的估计通常是失效时间数据分析中的重点关注对象删失把分析失效时间数 据与其他统计领域区分开来由于其复杂性,用于其他类型数据的方法通常对删失数据 是不适用的下面几节我们将介绍本文出现的删失数据类型 1 2 2 右( 左) 删失失效时间数据 删失是失效时间数据的一种独特的表现形式在实际中会出现不同类型的删失,但 是文献教科书里大多讨论的是右删失数据右删失是指我们所感兴趣的生存时间是确切 值要么大大于某个删失时间产生右删失的一个典型例子是生存试验中的某个体由于时 间或者资源的限制不得不终止试验对于那些在试验结束时还没发生失效事件的个体, 我们只知道他们的生存时间大于试验结束的时间但不知道其确切值,这里的生存时间就 是右删失的 事实上,试验结束时间可以因个体而不同,有些个体会因为一些原因在试验结束之 前离开试验,这样对每一个个体都存在一个代表右删失时间的删失随机交量如果生存 变量小于删失变量,我们得到确切的观测,否则就得到右删失观测我们可以假设感兴趣 的生存变量为x ,删失变量为c 五受到与之独立的随机变量g 的干扰,使得五不能被观 测到而代之以正= 厕n ( x ,c :c ) ,反= j ( 五a ) ( 当五g 时,& = 1 ,生存时间为真实 观测;当x g 时,文= 0 ,生存时间为右删失观测) 这种类型的右删失叫做随机删失 除了随机删失以外,右删失还有其他的删失机制若试验中所有个体在相同的时间 点上停止试验,我们称这样的删失机制为i 型删失若在事先设定数量的个体失效后停止 试验,我们就称这样的删失机制为i i 型删失这种删失机制普遍出现在工程技术领域本 - 3 - - 1 2 删失数据类型 文在下面研究的右删失是i 型右删失 图1 1i 型右删失图1 - 2i i 型右删失 图1 。1 和图1 2 都是包含有四个研究对象的i 型和i i 型右删失的例子第一个个体的 生存时间t 1 = x 1 ( 其死亡时间) ,6 l = 1 ;第二个个体的生存时间t 2 = g 2 ( 其右删失时 间) ,如= o ;第三个个体的生存时间t s = 恐( 其死亡时间) ,如= 1 ;第四个个体的生存时 间t 4 = c , - d 其右删失时间) ,矗= 0 删失机制是多种多样的以上三种是比较常见且较容易处理的情况如果研究对象 在时刻c 开始接受观测,在此之前我们感兴趣的事件已经发生,换句话说,已知研究个体 的生存时间x 4 , 于删失事件c ,但不知道其确切时间,这种删失又叫做左删失本文研究 的左删失是此处定义的左删失 1 2 3 区间删失失效时间数据 如果我们不是在连续的时间点上观测( 研究) 个体,我们只能观测到某事件发生的时 间落在一个时间区间内而观测不到确切时间这样的数据称为区间删失区间删失型数 据的典型例子是在临床试验或纵向数据研究中的患者进行周期性跟踪研究时,通常某事 件发生在两次检查之间换句话说,若感兴趣事件发生的时间位于某一区间陋,r 】内( l 为 左删失端点,冗为右删失端点) ,这就产生了区间删失数据事实上,前面所讲的右( 左) 删 失数据都是区间删失数据的特殊情况因为若r = co ( 或l = o ) ,就可以得到右( 左) 删失 数据删失数据的研究有着广泛的实际应用背景,并越来越受到人们的关注成为统计学 的重要研究领域 令t 是一个代表失效时间的非负随机变量若不能观测到t 的确切值,只能观测到区 - 4 第一章引言 间( 厶捌,使得 t ( l ,捌, 这里p ( l r ) = 1 若l = r e p 为真实观测,若冗= o o 即为右删失观测,若l = o a p 为左 删失观测现在被大家接受的区间删失类型有四种,它们分别是:i 类区间删失失效数据, i i 类区间删失失效数据,多重删失失效时间数据和面板计数数据 在i 类区间删失失效数据中,所有观测到的区间要么包含0 要么包含0 0 换句话说,每 个个体的失效时间观测要么左删失要么右删失,即l = 0 或r = 当每个研究个体被观 测一次,生存时间要么大于要么小于观测时间,这就产生了i 类区间删失失效数据这种 数据可以表示成 g6 = 如墨回) ,c 表示观测时间,j 是示性函数i 类区间删失失效数据 也叫做当前状态数据这种数据不同于右( 左) 删失数据,因为它不含确切观测到的失效时 间,具体表述如下: 设正是一列独立随机变量( 也可以是常数序列) ,它是可以被观察到的令 氐= 厶墨茎正,= 三:耋羔三茎: 我们不能观察到五,但能观察到亿,盈) ,i = 1 ,2 ,n 在实践中, 正) 往往是试验时刻, 试验到正为止我们常假定 正) 是同分布的 i i 类区间删失失效数据中至少包含一个有限区间( 厶捌,即( 厶捌c ( 0 ,o o ) 我们可 以把这种数据表示成 阢k 矗= i t ( t ,如= i c v t v ) ,如= 1 一曲一如) ( 1 - 1 ) 这里每个个体被观测了两次,其中矽和y 是两个随机变量且满足v 1 - 1 的一个推广 是,每个个体被观测k 次,观测时间为仉巩己k ,这里k 是一个随机整数这种 数据叫做k 类删失失效数据可以表示成 ( k 码,岛= ,( 巧一1 t ) ) ,j = 1 ,k ( 1 - 2 ) 其中u o = 0 如果一个生存试验中需要考虑两个相关事件令x 和s 分别表示这两个事件发生的 时间,且x s 定义t = s x ,假定t 是我们感兴趣的生存时间若x 是包含区间 删失和右删失的,s 是包含右删失和左删失的,我们考察的生存时间t 就是多重删失失 效时间数据我们观测不到x 和s 的真实值,只能观测到它们所处的区间 厶,忍,五,凡) , 5 一 1 3 分布函数的估计的处理方法 和 ( k ,盈,) ) ,且= 1 ,则五 l i ,p 4 ,x 是区间删失的;如果凡= 0 ,则x 【厶,o o ) , 五是右删失的如果盈= 一1 ,佻= 0 ,( 足,纠,k 是左删失的;如果文= o 并且佻= 1 , k ( t 3 ,o o ) ,是右删失的;如果盈= 1 并且竹= 1 ,( t 2 ,t a ) ,是精确观测的其 中丸= 厶风 和& = 厶t : 厶,并不知道第二个事件的信息 ( 2 ) 第一个事件是区间删失的,并且第二个事件是精确观察值,即九= 1 ,盈= 1 ,讯= 1 ,对于这类数据我们知道l i 五r ,互( 2 ,t a ( 3 ) 第一个事件是区间删失,第二个事件是右删失值,即凡= 1 ,氏= 0 ,讯= 1 ,对于 这类数据我们知道厶x 足,磊 如 ( 4 ) 第一个事件是区间删失,第二个事件是左删失值,即= 1 ,盈= 一1 ,佻= 0 ,对 于这类数据我们知道厶x r ,互 o ) 0 和 b n = s u p x 0 ,l ( z ) 编钏,d = o 或一1 ) , 并用下面式子估计q ( ) ,即: o c t ) = 国瓴) _ 丙1 萎n 棚 然后将o c t ) ,包( t ) 代, k ( 3 - 1 ) i i ,就可以计算出生存函数s ( t ) 的估计并且, c h a n g g l y a n g ( 1 9 8 7 ) 阻】得到了如下结论:对任意的t ( 0 ,o o ) ,有 p ( 舰。器,i 氨卅刚i o ) “ 即这种方法得到的x 的生存函数的估计氨是强相合的又由分布函数和生存函数的关系 一1 1 3 2 给出g 的估计 可得到f 的初始估计为:帮( ) = 1 一氨( t ) ,并且由靠( t ) 的强相合性可以得到船的强 相合性 3 2 给出g 的估计 给定初始分布函数帮,则得x 的边际似然函数工( g ,船) 如下: 即席,= 垂攀簇裂鬻筹 :仟! 垡尘! 二! 型兰箜塑丝堕! 篮尘! 二兰型堂塑丝堕! ! 二兰 昔 e tfi t :_ t 厶1 d 拶( t ) d g ( z ) ( 3 - 2 ) 令钉l ,是指初始分布函数砖在区间陬,尼】的跳,则上式可变换为如下形式: 即席,= 垂堕丝型篆拦等黜焉盟塑型 并乏1i t :一弛】船( 妣) ( 璧d g ( z ) ) k ( ed g ( z ) ) ( 1 一k ) 1 仁1 l 翟1 缸,吨厶1 帮( 妣) - 嚣。d g ( x ) 一抖翟1 几。一仇l 。】帮( 妣) 【g ( 足) 一g ( 厶) 卜【1 一g ( 厶) 】( 1 一k ) 1 扛1 1篷l 几。一圳船( 妣) 【1 一g ( t 2 一) 】 ( 3 - 3 ) 其中,户( o ( 妣) 就是f 在点魄处的跳,a p :户( o ( 妣) = 户( 钉) 一户( 扣一) 下面定义两个 数据集l 。,见: l 。= 厶:i = 1 ,) 见= 尼:t = 1 ,) u 【如一 l p l i :k = 1 ,仇) 通过对上面似然函数( 3 3 ) 的分析,要想使似然函数l ( g ,船) 达到极大值,则有: ( 1 ) 当z r s 时,g ) 尽可能的大 ( 2 ) 当z l 8 时,g ) 尽可能的小 下面构造一个由一些凸的闭区间组成的集合s ,并且s 中的区间满足其左右端点分别 在集合l 和兄中,而区间内不包含厶或见中的任何其他点,并且每个小的闭区间至少包 - 】2 第三章估计及性质 含于一种删失的数据集内【1 9 】 3 1 把这些闭区间记为如下形式: 【9 1 ,p 1 】,k ,沈】,【g j ,p j 】,q l p l q 2 i 0 2 计算心( s o ) ,( s o ) ,则可得到m ( s o ) ( 3 ) 下面计算s 的一步估计s ;, n 弓= ( s 。) + ( s o ) ) 肛( s 。) ,j = 1 ,j i = 1 ( 4 ) 回到第二步,用s 1 代替s 0 的值继续计算 ( 5 ) 当估计值达到了预定的精度就停止运算 若易d = 1 ,t ,) 是式( 3 - 5 ) 的估计值则由岛,我们可以得到g 的第一步估计式: 。碍cz,=圣+易,薹圣三毒彩+。, 由此的出g 的估计台品就是极大化似然函数l ( g ,船) 得到的估计 3 3 给出f 的估计 由第二步给出的武和慨,足】,则可得到t 的条件似然函数: 厶础) = ( nf = 1 璧f c d ( y t z ) ) 鲫( 如) 璧【1 - f ( t 吃一z ) 】鹤恤) 、a 民讯 ) 璧【1 一f ( 一z ) 】o 妒( d z ) 、k 1 - 氐h 璧【l f ( t 2 一z ) 】o 器) 璧f m z ) 掣( 出) 、水训1 。帕 璧【1 一f ( t 2 - 。弁,墨! 鱼坌堡竖二竺! 二竺! 兰二丝塑、知氐似 一封善l i d j , 莳 1 一f ( t 2 一( 彩+ p a 2 ) 】 ,刍1 岛岛【1 一f ( 一( g j + p a 2 ) i k u 一刚饥 x 霹j 丽f 币i 面丽可 ,刍。岛南p ( 一口j ) 一f ( 一p j ) 】、k 一氐1 佻 x 哥j 荔f 瓦f 面丽 其中岛= h b ,乃】c 阮,r 】) 1 4 - ( 3 - 6 ) 第三章估计及性质 下面用类似g 6 m e z i f c a l l e 7 提出的方法,给定i ,定义变i :l o 和如下: ( 1 ) 如果 q j ,乃】陬,忍】并且氏= 1 或民= 一1 时,定义= m 一扔和= 一q j ; ( 2 ) 如果【g j ,乃】阻,r 】并且氏= o 时,定义= k 一( 彩+ p j ) 2 和= 0 0 同样,我们定义以下两个数据集: 厶= l i j :i = 1 ,n ;j = 1 ,以 以= :i = 1 ,n ;j = 1 ,t ,) u 岛一( q j + p j ) 2 ,j = 1 ,j ) 构造t u m b u l l 凸闭区间的集合 陋1 , l 】,】,阻切,h z ,y 3 1 h i t 晚7 1 2 四c ,1 ,。 州鼢= 锷篙桀描学 第三章估计及性质 。,rd p ( 1 ) 、f 2 1 一f o ( t 3 一z ) 】础( 如) 锄( 厶r ;焉,。妒) 2z 亨盖三j i o 瓦端n j 工幢l 、吃4 ,j 。“o , 阮鳓= 舞一 由础的强相合性的性质,则有: p 恕驾i 掣p ) 一g l _ 0 ) = 1 并且,由强大数定理得p 几乎处处收敛于p 因此,存在集合b 使得p ( b ) :1 ,并且满足: n 陆- - v o s z u p 0l 础阮u ) 一a ( x ) l = o ,v w eb j c f i p n ,;。,;u ) 弱收敛于p 对于固定的u b 和估计函数序列砖( ;u ) ,由h e u y c 瑚_ p a c t 蛸s 定理可得,存在序列制( ;u ) 收敛于f 如果局= f ,则磺收敛于f 下面 证明昂= f ,类似 1 2 1 6 理4 3 的证明方法由孓1 1 可得: 厶 _ l ,0 ,岍冀兰一一3 , + a ( 一回( 1 7 ) 专耋黼) 口( 三,冗;入,正,y ) 1 婶工。 厂,衄墨;晶,g o ) 1 2 。( 厶r ;f o ,g 0 ) 】2 如h “厶r 景嫠名:然皿汜g o ) ( 3 - 一 + 甥嬲l d h ( l ,聊,( a - 1 4 ) 。 九( l ,r ;只g o ) , 一呐 则下面证( 3 - 1 4 ) 式严格大于l ,当且仅当f = 晶时,洚1 4 ) 式等于1 令: 口:鐾鱼坠二塑墅竺! 璧【1 一f o t 2 一z ) 】戗( 如) 6 = 毋凑 1 9 - 3 4 估计量的性质 因为对于任何两个实数满足,0 n b 1 和0 z 1 9 8 8 ,在此处为了下面程序 容易进行,此处选择的尺度参数还满足x 1 9 9 5 ,这是因为研究的发病时间主要是集中 在i x f e - - j 1 9 8 8 ,1 9 9 5 1 2 _ 侑j ,并且还为下面构造区间做准备,对于右删失的数据,在程序中会 根据删失比例产生的所以本试验选择的参数,7 2 标准如下所示: t 7 2 = 针面( t 赢2 - 硐t 1 ) 25 r t ( s e e 回 产生好这两参数后,下面就是构造删失数据本模拟试验删失数据的产生也是随机化的, 即给定删失比例,随机生成删失数据,并且对区间删失来说,区间删失的长度也是随机化 - 2 1 4 2 结果及结论 的,这里假设是每个季度检查一次,也就是区间长度是0 2 5 的整数倍,记为d ,由于区间删 失数据 l ,捌c 【1 9 8 8 ,1 9 9 5 ,所以d 2 8 则在程序中d 的生成如下所示: d = f l o o r ( 1 + 2 7 r a n u n i ( s e e d ) ) 若随机变量x 区间删失比例为只,右删失比例为b ,且只+ 只1 ,则x 观察值的产生如 下所述: ( 1 ) 先产生个在( o ,1 】上服从均匀分布的随机数u ,及个1 n 2 7 的整数d ; ( 2 ) 若u r ,则x 的观测是区间删失的,令厶= 五一互1 d ,尼= 五十互1 d i ,九= 1 ; 若l i 1 9 9 5 ,则令足= 1 9 9 5 ; ( 3 ) 若u 1 一只,则x 的观测是右删失的,令厶= 五,风= ,丸= o ; ( 4 ) 若p c u 1 一只,则x 是精确观测的,令l t = 五,忍= 厶,凡= 1 x 的观察值构造好以后,下面构造y 的观察值,这里左删失比例记为只管,右删失比例 记为只 则y 的观测值构造如下: ( 1 ) 先产生个在( 0 ,1 1 上服从均匀分布的随机数y ; ( 2 ) 若v p z 可,则y 的观测是左删失的,令五= ( t 2 一忍) ,氏= - 1 ,佛= o ; ( 2 ) 若v 1 一只可,则y 的观测是右删失的,令磊= t 3 ,氏= 0 ,催= 1 ; ( 3 ) 若 v 2 0 0 5 ,则五= 1 9 9 5 + ( 2 0 0 5 1 9 9 5 ) 2 ; 在模拟试验中,随机变量x 和t 的形状参数是自己设定的,为了做比较,t 的形状参 数分别选择了以下三个值:0 5 ,1 和4 之所以这样选择参数值是因为这三个参数的危险 率函数分别是减函数,常函数和增函数,这么选择是为了做个比较,看一看不同形状的 危险率函数对估计是否会有所影响对x 的形状参数我们没有比较,因为这里主要是考 虑t 的分布的,所以对x 分布的形状参数,在模拟中只选择了一个,令岛= 3 在本模拟试 验中,可以任意设定删失比例,为了比较不同删失比例的影响,我分别选择了三组删失比 例进行了比较关于上面这段计算过程,见附录a 本模拟试验对三组不同的删失比例只,耳,只管,岛及三个不同的形状参数角= 0 5 ,1 ,4 分别进行了1 0 0 0 次模拟,在下面一节中我们只把t = 2 ,t = 4 ,t = 6 ,t = 8 ,t = 1 0 ,t = 1 2 ,t = 1 4 ,t = 1 6 的结果列出来,供参考 4 2 结果及结论 从模拟结果我们可以得到如下结论: 一2 2 - 第四章模拟分析 表垂1 不同形状参数的三组删失比例平均均方误的比较t = 2 ,t = 4 卢1只只b f岛 五1 :1m s 岛 = 2 )熹:。m s e ;t ( t = 4 ) 0 70 10 10 20 0 5 1 00 0 5 1 1 0 50 3o 10 30 2o 0 4 7 40 0 4 9 5 0 10 30 40 10 0 4 8 80 0 5 0 3 0 70 10 10 20 0 5 2 60 0 5 1 9 1 0 3 0 1 0 30 20 0 5 0 4 0 0 4 8 5 o 1 0 3 0 40 1 0 0 5 1 5 0 0 4 9 8 0 70 1 0 1 0 20 0 5 1 60 0 5 1 2 40 30 10 3o 20 0 4 8 60 0 4 4 7 0 10 30 40 10 0 5 1 40 0 5 1 5 表垂2 不同形状参数的三组删失比例平均均方误的比较t = 6 ,t = 8 卢1 只只 忍f岛击:1 m s e i ( t = 6 );1 :1r n s e :( t = 8 ) 0 70 10 10 20 0 4 9 40 0 5 1 6 0 5o 30 10 30 20 0 4 8 60 0 4 6 4 0 10 30 40 10 0 5 0 20 0 4 9 2 0 70 10 10 20 0 5 1 80 0 5 2 3 10 30 10 30 20 0 4 8 00 0 5 0 8 0 1 o 3 0 4o 10 0 5 2 20 0 5 1 7 0 7 o 1 0 1 0 20 0 5 1 60 0 5 0 5 4o 30 10 3o 20 0 5 0 30 0 4 9 4 0 1o 30 40 10 0 5 2 20 0 5 0 9 表垂3 不同形状参数的三组删失比例平均均方误的比较t = 1 0 ,t = 1 2 卢1只只 元1 :1r n s e ( t = 1 0 )元1 :1 m s e i ( t = 1 2 ) 0 70 1o 1 0 20 0 5 2 20 0 5 0 8 0 50 30 1 0 3 0 20 0 4 9 20 0 4 8 1 0 10 30 40 10 0 5 1 00 0 5 1 5 0 70 10 10 20 0 5 2 10 0 5 2 3 10 30 10 30 2 0 0 5 0 20 0 5 1 0 0 10 3 0 4 0 10 0 5 1 70 0 5 1 1 0 70 10 10 20 0 5 2 80 0 5 1 4 40 30 10 30 20 0 5 1 10 0 4 9 2 0 10 30 40 10 0 5 1 40 0 5 1 8 2 3 4 2 结果及结论 风r只 b 可岛 ;1e l l m s e ;i ( t = 1 4 )元1e :1 m s e i ( t = 1 6 ) 0 70 10 10 2 0 0 5 1 60 0 5 0 6 0 50 30 10 30 20 0 4 9 20 0 4 9 5 0 1 0 30 40 10 0 5 2 10 0 4 9 9 0 70 10 10 20 0 5 1 70 0 4 9 8 1o 30 1o 30 20 0 5 0 60 0 4 8 3 0 10 30 40 10 0 5 1 40 0 4 9 4 0 7o 10 10 2 0 0 5 2 10 0 5 1 7 40 3 0 1 0 30 20 0 5 1 60 0 5 0 9 o 10 3o 40 10 0 5 1 00 0 5 1 9 ( 1 ) 对不同的形状参数尻,从模拟结果可以看出,均方误差的平均都在0 0 5 左右,整 体上说均方误不大,也就是说本文的方法对不同形状的危险率函数都是可以使用的 ( 2 ) 给定只,则从结果可以看出,如果r 很大,即使b ,最v ,只管都很小,但估计量多 次平均的均方误仍然会比较大,若只很小,b 也比较小时,估计量多次平均的均方误会比 较小 ( 3 ) 从给出的不同时n t = 2 ,t = 4 ,t = 6 ,t = 8 ,t = 1 0 ,t = 1 2 ,t = 1 4 ,t = 1 6 来 看,估计量多次平均的均方误的差别不是很大,也就是说t 值的大小并不影响估计量的效 果 2 4 第五章小结 第五章小结 这篇文章讨论了多重删失数据分布函数的非参数估计问题,现有的对多重删失数据 分布函数的研究基本都致力于非参数或半参数法这是因为对参数法来说,首先需要对 模型进行诊断,但是这个诊断对多重删失数据是比较难的,特别是对艾滋病潜伏期的研 究,因为研究的时间比较短,所以模型诊断就更加困难所以,现在的方法还是定位与非 参数法,但当研究进一步成熟后,可以考虑用参数估计,因为参数估计法直观并且容易理 解,现有的渐进性质都可以直接应用 本文是研究两个事件之间持续时间的分布,但是有很多纵向数据研究中会出现一系 列事件持续时间分布函数的估计,所以可以考虑推广本文的方法,使两事件持续时间的 研究发展为多事件之间持续时间的研究 本文的估计方法是融合了t u r n b u l l 自相合估计方法 1 s l 和g 6 m e zc a l l e ( 1 9 9 9 ) 7 的两 步算法,从模拟结果可以看出,这个算法估计量的偏差不是很大从估计量的性质上,本 文也证明了估计量的强相合性,因此从模拟和理论上都说明了估计的效果相对【7 】中的 两步算法,本文使数据的删失机制更加一般化,扩大了数据的研究范围但本文采用分别 对边际似然函数和条件似然函数求极大值,在估计的效率上比较低相对于单一删失数 据而言,多重删失数据还需要进一步的研究,对估计量的性质也仍需进一步的探讨 一2 5 - j 附录a 随机模拟部分程序 l i b n a m el i b e :毕业论文程序,; 7 皿a c r ot a b l ( b i t a l = ,b i t a 2 = ,s e e d = ,t l = 。t 2 = ,t 3 = ,1 【- ) ; 宰随机产生随机变量x 和t 分布函数的尺度参数e t a l ,e t a 2 ; j c l e te t a l = 8 g a 珊s a ( 1 + l & b i t a l ) + ( 1 0 g a m m a ( 1 + l & b i t a l ) 一8 g a m m a ( 1 + b i t a l ) ) * r a n u n i ( & s e e d ) l e te t a 2 = c 立t 2 一i 吃1 ) 2 g a 皿a ( 1 + 1 b i t a 2 ) r a m m i ( & s e e d ) ; 生成观察数据集a k k : d a t aa k k ; d oi = 1t o1 0 0 ; u - - r a n u n i ( & s e e d ) ; v - - r a n u n i ( & s e e d ) : x = 翻cl + r a n d ( w e i b u l l ,& b i t a 2 ,& e t a 2 ) ; t - - r a n d ( w e i b u l l ,& b i t a l ,& e t a l ) ; p c = 0 7 ;p r = o 1 ; p l y = o 3 ;p r y = o 3 ; d - - - = f l o o r ( 1 + 2 7 * r a n u n i ( & s e e d ) ) ; i fu l p rt h e nd o ; r = 3 0 0 0 ; i l = o ; i fx 翻c 2t h e n1 啄; e l s el = 丘t 2 ; e n d ; i fp c u p rt h e nd o ; l - - x ; r : - 2 6 附录a 随机模拟部分程序 i 1 = 1 ; e n d ; i fv = l 。- p r ya n di 1 = 1t h e nd o ; z = t 3 : i 2 - - 0 ; i 3 = 1 ; e n d ; i fp l y v 七t 3t h e nz = k t 2 + ( 量t 3 2 0 0 0 ) 2 ; i fz 蕾t 2t h e nz = k t 2 + ( 2 0 0 0 - 量t 2 ) 2 ; e n d ; i fi 1 = 0t h e nz = ; o u t p u t ; e n d ; 7 t a b 2 ( 1 1 = 1 ,r l = l ,i i l = i l ,i i 2 = i 2 ,1 1 3 = 1 3 ,z l = z ) * 计算估计量的宏函数幸 r u n ; 7 皿e n dt a b l ; 幸随机模拟的主程序宰 7 a a c r om i n i ; d ok = lt o1 0 0 0 ;1 0 0 0 是模拟的次数 t a b l ( b i t a l = o 5 b i t a 2 = 3 ,s e e d = 1 2 3 4 5 ,1 1 = 1 9 8 8 ,1 2 = 1 9 9 5 ,t 3 = 2 0 0 5 ,k - 坎) d a t al i b h a ; s e tl i b a k k ;l * a k k 是t a b 2 产生的数据集幸 e n d ; 7 , m e n dm o n i ; 7 讧n o n i 一2 7 - 参考文献 参考文献 【1 】a l i o u ma ,c o m m e n g e sd ,ap r o p o r t i o n a lh a z a r d sm o d e lf o ra r b i t r a r i l yc e n s o r e d a n d t r u n c a t e dd a t a ,b i o m e t r i c s5 2 :5 1 2 5 2 4 ,1 9 9 6 【2 】d e g r u t t o l av ,l a g a k o ss w ,a n a l y s i so fd o u b l y - c e n s o r e ds u r v i v a ld a t a ,w i t ha p p l i c a t i o n t oa i d s ,b i o m e t r i c s4 5 :1 1 2 ,1 9 8 9 【3 】f r y d m a nh ,an o t eo nn o n p a r a m e t r i ce s t i m a t i o no ft h ed i s t r i b u t i o nf u n c t i o nf r o m i n t e r v a l - c e n s o r e da n dt r u n c a t e dd a t a ,jr o y a ls t a ts o cs e r i e sb5 6 :7 1 7 4 ,1 9 9 4 【4 】g r o e n e b o o m ,p - ,w e l l n e r ,j a ,i n f o r m a t i o nb o u n d sa n dn o n p a r a m e t r i cm a x i m u m l i k e l i - h o o de s t i m a t i o n ,b i r k h r a n s e rv e r l a g ,b a s e l ,1 9 9 2 【5 】g r o e n e b o o mp ,l e c t u r c so i li n v e r s ep r o b l e m s i n :l e c t u r e so np r o b a b i l i t yt h e o r ya n d s t a t i s t i c s ,l e c t u r en o t e si nm a t h e m a t i c s ,s p r i n g e r ,1 9 9 6 【6 】g 6 m e zg ,l a g a k o ss w ,e s t i m a t i o no ft h ei n f e c t i o nt i m ea n dl a t e n c yd i s t r i b u t i o no fa i d s w i t hd o u b l yc e n s o r e dd a t a ,b i o m e t r i c s5 0 :2 0 4 2 1 2 ,1 9 9 4 【7 】g d m e zg ,c a l l em l ,n o n - p a r a m e t r i ce s t i m a t i o nw i t hd o u b l yc e n s o r e dd a t a ,ja p p ls t a r 2 6 :4 5 5 8 ,1 9 9 9 i s h u d g e n sm g ,o nn o n p a r a m e t f i ci n a x i i n u i nl i k e l i h o o de s t i m a t i o nw i t hi n t e r v a lc e n s o r i n g a n dt r u n c a t i o n ,jr o y a ls t a ts o cs e r i e sb 6 7 ( 4 ) :5 7 3 5 8 7 ,2 0 0 5 【9 】k a p l a ne l ,m e i e rp n o n p a r a m e t r i ce s t i m a t i o nf r o mi n c o m p l e t eo b s e r v a t i o n s ,ja m s t a r a s s o c5 3 :4 5 7 4 8 1 ,1 9 5 8 【1 0 l a it z ,y i n gz ,e s 七i m a t i l l g ad i s t r i b u t i o nf u n c t i o nw i t ht r u n c a t e da n dc e n s o r e dd a t a ,a n n s t a t1 9 :4 1 7 4 4 2 ,1 9 9 1 【1 1 1 l a wc g ,b r o o k m e y e rr ,e f f e c t so fm i d - p o i n ti m p u t a t i o no nt h ea n a l y s i so fd o u b l yc e n s o r e d d a t a ,s t a tm e d1 1 :1 5 6 9 1 5 7 8 ,1 9 9 2 【1 2 】p - g r o e n e b o o m ,j o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论