(应用数学专业论文)区间数据下指数分布的矩估计和检验.pdf_第1页
(应用数学专业论文)区间数据下指数分布的矩估计和检验.pdf_第2页
(应用数学专业论文)区间数据下指数分布的矩估计和检验.pdf_第3页
(应用数学专业论文)区间数据下指数分布的矩估计和检验.pdf_第4页
(应用数学专业论文)区间数据下指数分布的矩估计和检验.pdf_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 在许多学科领域,如医学、生物学、保险精算学、可靠性工程学、公共卫生 学、经济学以及人口统计学等领域,都存在对某给定事件发生的时问进行估计和 预测的问题从得到的数据资料来看,这些数据有一共同属性,即其中的观测结 果要么是删失的、要么是截尾的,特别是当我们只知道事件在某一给定时间段内, 而不知道确切的时间点时,称之为区间删失数据( 简称区间数据) 区间数据的 存在使得许多传统理论无法直接应用,所以无论从实际应用还是理论研究的角度 出发,对区间数据的相关问题进行研究是很有意义的 对区间数据的研究已有二三十年的历史,大多数的研究都是基于非参数极大 似然的方法进行的,h u a n g 和w e l l n e r 1 j 对此有详细的介绍,但是利用极大似然 方法进行区间数据的研究也存在不足,求解非参数似然方程的过程非常繁琐,常 常只能通过迭代计算的方法得到似然方程的近似解,实际操作难度很大利用无 偏转换( u n b i a s e dt r a n s f o r m a t i o n ) 的方法处理右截断数据问题,最早出现在 b u r k l e y 和j a m e s 2 。、k o u l 和s 址砒1 3 j 的文章中z h e n g 4 】对此进行系统研究,并提 出了c l a s sk 的方法,并把它推广到区间数据的研究中无偏转换( u n b i a s e d t r a n s f o r m a t i o n ) 的主要思路:构造出一个和被截断随机变量值相同的统计量,然 后用传统的统计方法进行研究 本文受c l a s s k 方法的启发,主要做了三项工作:第一,在区间数据下,对 指数分布的平均寿命进行矩估计;第二,在区间数据下,对指数分布的平均寿命 进行单边假设检验;第三,在区间数据下,提出秩检验的模型 关键词:区间数据;无偏转换:单边假设检验;矩估计 a b s t r a c t i nm a n yb r a n c h e so fs c i e n c e ,s u c ha sm e d i c i n e ,b i o l o g y ,i n s u r a n c e ,r e l i a b i l i t y e n g i n e e r i n gp r o j e c ts c i e n c e ,p u b l i ch y g i e n e ,e c o n o m i c s ,d e m o g r a p h i c se t c ,p r o b l e m s o f e s t i m a t i n ga n df o r e c a s t i n gt h et i m eo fc e r t a i ne v e n t so c c u re x i s t f r o mt h eo b t a i n e d d a t a ,t h e s ed a t ah a v eac o m m o nc h a r a c t e r i s t i ct h a tt h er e s u l t so fs u r v e y i n ga r ee i t h e r c e n s o r e do rt r u n c a t e d e s p e c i a l l yw ec a l li ti n t e r v a l - c e n s o r e dw h e nw eo n l yk n o wt h e e v e n th a p p e n si nc e r t a i nt i m ea r e a w h e ni n t e r v a l c e n s o r i n ga r i s e s ,a l m o s ta l l t r a d i t i o n a ls t a f i s t i c a lm e t h o d sc a n 执, v o r ka n ym o r e 1 r i l e r ei sa na l o r m o u sa m o u n to fl i t e r a t u r eo nt h ei n t e r v a lc e n s o r e dd a t a i n t h e s es t u d i e s ,n o n p a r a m e t r i cl i k e l i h o o de s t i m a t i o n ( n p m l e ) a r ew i d e l yu s e d ;b u ti t s l i m i t a t i o ni st h a ti ti sc o m p l i c a t e dt ow o r ko u tt h ef u n c t i o n sa n di nm o s ts i t u a t i o n sw e c a no n l yu s ei t e r a t i v eo p e r a t i o n st og e ta na p p r o x i m a t es o l u t i o n i nt h i sp a p e r , 1w i l l u s eu n b i a s e dt r a n s f o r m a t i o nm e t h o dt os o l v es o m ee s t i m a t i n ga n dh y p o t h e s i z i n g p r o b l e m so fi n t e r v a lc e n s o r e dd a t a b a s e do nt h eo b s e r v a t i o n sw ec o n s t r u c tas e r i e s o fn e wv a i l a b l e st os u b s t i t u t et h ec e n s o r e dv a r i a b l e t h e s en e wv a r i a b l e sh a v et h e s a m ee x p e c t a t i o na st h ec e n s o r e dv a r i a b l e s u g g e s t e db yt h ei d e ao fc l a s s km e t h o d ,ih a v em a i n l yd o n et h r e et a s k s : f i r s t ,w es t u d i e dt h et w om o m e n te s t i m a t i n gp r o b l e mf o rt h ee x p o n e n t i a ld i s t r i b u t i o n b a s e do nt h ei n t e r v a lc e n s o r e dd a t a b o t h 磊a n d ( ,4 ) a r eu s e dt oc o n s t r u c t e d s a m p l em o m e n t ;s e c o n d ,w es t u d i e dt h eo n es i d eh y p o t h e s i st e s t i n gp r o b l e mf o rt h e a v e r a g el i f eo fe x p o n e n t i a ld i s t r i b u t i o nb a s e do nt h ei n t e r v a lc e n s o r e dd a t at ;i nt h e t h i r ds e c t i o n ,w ec o n s i d e rt h em o d e lr a n k e dt e s t i n gp r o b l e mb a s e do nt h ei n t e r v a l c e n s o r e dd a t a k e yw o r d s :i n t e r v a lc e n s o r e dd a t a ;u n b i a s e dt r a n s f o r m a t i o n ;o n es i d eh y p o t h e s i s t e s t ;m o m e n te s t i m a t e 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得或其他教育机构的学位或证书而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表 示谢意。 学位论文作者签名:虑林乞签字日期:沙辞 ) ( 1 一巧) 来代替被截断的随机变量v ,显然有e f = e y , = 口+ 触,这样就可以用最d x - 乘 法估计出口,夕。 b u r k l e ya n dj a m e s 开g ) j t 利用无偏转换解决统计问题的先例,但没考虑估计量 的收敛速度和和生存变量的分布函数有关,k o u ls u s a r l aa n dv a nr y z i n ( 1 9 8 1 ) 解决了上述问题,从而使无偏转换的方法达到理论的高度。 3 硕士学位论文 在前人工作的基础上,z h e n g ( 1 9 8 4 ) 提出:把无偏转换的方法应用到区间数 据的研究中,命名为c l a s s k 方法。这种方法的主要思想是:当z 被截断时,应 对它作一些补偿,当未未被截断时,也要作一些调整。 4 区间数据下指数分布的矩估计和检验 第二章区间数据样本下指数分布平均寿命的矩估计 z h e n g 在区l 司数据中引入无偏转换 假定】,是一个非负随机变量,有连续的分布函数f ( ) ,但分布函数的具体形 式未知,e y 口是有直观的意义:用于截断的变量的平均寿命不能小于试验对象的平均寿 命在实际观测时,只能得到样本( ) ,f - 1 2 力,其中,4 = 毪轰。 因为 所以 即 2 1 以4 构造矩估计 即) _ f 0 0 出鼻v v 2 f 加1 目覃12 矗 岛 口 ( ! 窆i = 1 训曰+ o o ) = 岛。 否= 孚锻梅丢静 d 刀百 对一般情况下的矩估计,通常只能考虑它的大样本性质:结合以下两定 理。 定理1 :设墨,以为独立同分布变量系列,e l x l f 更是相合估计;( 3 ) e ( x i ) 2 ( 互一1 ) e o 时可的渐近方差大。在o ( ;一1 ) 岛时渐近方差比可的渐 o o 一 ,一 、 近方差小,x 是无偏估计且0 o ,t o ,都有p ( xj , s + t l x ,) s ) ,则称该元件老化。 如果对任意的s o ,t o ,都有尸( x s + t l x f ) = p ( 石 s ) ,则称该元件无老化。 若x 取参数统计结构,月艮从w e i b u l l 分布,其分布函数为即) = 1 _ 唧 一爿, 则有 凇叫= e x p 一等 凇忖) = 等若产= 错 一 一半) 显然,在口= 1 时,s 4 = ( s + f ) 4 一t , a a f f f f p ( x s + t l x ,) = 尸( x s ) ,元件无老 化: 而在口 1 时,j 4 s + t l x ,) s ) ,元件老化。故 上述检验问题在w e i b u l l 分布就转化为形状参数口的检验问题,原假设h o :口= 1 v s 备择假设h l :口 1 在生存分析中,由于客观条件的限制,往往的数据是不完全数据,如右截断数据 左删失数据,丢失数据,区间数据等等。下面区间数据作出理论上的研究: 硕士学位论文 3 1 在i 型区间数据中进行无偏转换 假定y 是一个非负随机变量,有连续的分布函数f ( ) ,但分布函数的具体形 式未知,e y 凡时e ( 】,) 2 o o 1 2 区间数据下指数分布的矩估计和检验 令 则有 证明 因为 要使 只需 又因为 所以 ( 五) = 1 ) 厢( 兄) _ n ( o ,1 ) 2 ) 日( 五) 在( 2 凡,) 关于旯单调递增 1 ) 由引理2 可证 矿 令日( a ) 2 南埘z ( 允) 舯 q ( 五) 2 而1 一万1 皿( 五) = l 彳 型:二14 三:塾! 苎二查1 2 二兰: d 2 a o ( a 一九) 2 。五3 a o ( a 一厶) 五3 兰型丑 o d 五 2 a ( a 一九) 2 w 名3 oa ( 凡,) ! 上三掣:4 凡五一4 凡:一3 2 : o d 五 e p h :( 名) 在( 2 无,0 0 ) 是单调递增函数 h ( 2 ) 在( 2 2 0 ,0 0 ) 内是单调递增函数 e y = j 1 则令护= 万1 则h ( 彳) = g ( p ) 。 g c 惦( 。去) 内是单调递减函数 现考虑假设检验: 3 2 在l 型区间数据下的假设检验 h o :0 o o v s :0 吼 显然,检验的拒绝域形式:y 。c 下面确定临界值c 尸 当风为真时拒绝h 。) = 岛 尹c ) 其中c = 而c o + o o = 胁c o ) = 岛 g ( 吼) c o ) 气岛 g ( 口) c 0 ) 上面不等式成立是因为g ( 目) 是口的单调递减函数,所以当0 - o o 时 事件 g ( 岛) c o ) c o ( o ) c o ) 1 4 区间数据下指数分布的矩估计和检验 所以,要控制p 当乩为真时拒绝h 。) 口,只要令 g ( 口) c o ) = 口 即 尸 - g ( 曰) - c o ) = 口 因此c o = 争 其中乙为服从标准正态分布的上口分位数 以 于是得检验的临界值 c r :五f 阜+ 岛: - q n 为方便建立检验的临界值表,对检验统计量进行改进,即令 矿:旦 岛 则检验的拒绝域为 y g其中g = 同理可得检验: 的拒接域为 综上得如下定理: 为: z 车4 - 1 打 务+ 岛 毛:p 岛 v s q :口 t , o ,若x l i = 五j , 一l ,若x “ 鼍j f 以及 u :艺至, i = 1 = l 那么,当母体1 与母体2 的分布相同时, u e u 丽一 b ( o ,1 ) 秩检验的切入点是样本值在整个样本中的位置,在完全数据下,这一点是很容易 区间数据下指数分布的矩估计和检验 做到,但在区间数据下,样本的实际观测值没能得到,这样依据现有的样本数据 很难确样本秩;在无偏转换的启示下,我考虑变量的代换,只考虑大样本性质。 设置。,五:,五,非负独立同分布,具有分布函数e ( ) :y i lr :,k , ( 巧,露) , e = 西( 巧) 岛+ 欢( 巧) ( 1 0 ) 鼢碧 下面我们来考虑m a n t e l h a n s e l 检验。先回顾一下独立样本四分联立表的一 般形式,记 p l = p ( 特征丁i 母体1 ) 仍= 尸( 特征丁i 母体2 ) 我们要检验 1 9 硕士学位论文 h o :p l2p 2 母体1 母体2 特征t特征t ab 啊 cd 疗2 刀 码 通常的方法是考虑统计量 y 2 :n ( a d - b e ) 2 , 惕栉2 惕m 2 在现讨论数据的区间的m a n t e l h a n s e l 检验,用e 代替,处理的方式和 右截断数据的m a n t e l h a n s e l 检验一样。 参考文献 1 h u a n gj a n dw e ll n e rj a ( 19 9 7 ) ,i n t e r v a lc e n s o r e ds u r v i v a ld a t a : ar e v i e wo fr e c e n tp r o g r e s s ,p r o c e e d i n go ft h ef i s ts e a t t l es y m p o s i u mi n b i o s t a t i s t i c s :s u r v i v a la n a l y s i s ( d o l a na n dt f l e m i n ga d s ) , m s p r i n g e r , n e wy o r k l2 3 - 17 0 2 b u c k l e yj ,j a m e sirl i n e a rr e g r e s s i o nw i t h c e n s o r e dd a t a j b io m e t r i k a ,19 7 9 ,6 6 :4 2 9 4 3 6 3 k o u lh ,s u s a r l av ,v a nr y z i nj r e g r e s i o na n a l y s i sw i t hr a n d o m l y r i g h t c e n s o r e dd a t a j a n ns t a t i s t ,1 9 8 1 ,9 :1 2 7 6 1 2 8 8 4 z h e n gzk ac la s s e s t i m a t o r sf o rt h ep a r a m e t e r si nli n e a r r e g r e s s i o nw i t hc e n s o r e dd a t a j a c t e dm a t h e m a t i c a la p p l i c a t i v es i n i c a , 1 9 8 7 ,3 :2 3 1 2 4 1 5 h o e l ,d g ,w a l b u r g ,h e ,1 9 7 2 s t a t i s t i c a la n a l y s i so fs u r v i v a l e x p e r i m e n t j n a t i o n a lc a n c e ri n s t 4 9 ,3 6 1 3 7 2 6 k e i d i n g ,n ,19 9 1 a g e s p e c i f i c i n c i d e n c ea n dp r e v a l e n c e :a s t a t i s t i c a lp e r s p e c t i v e ( w i t hd i s c u s s i o n ) j r o y s t a t i s t 1 2 ,3 6 7 3 9 5 7 邓文丽关于区间数据的若干问题研究, 复旦大学博士学位论文 2 0 0 4 8 丁邦俊,关于区间数据的分布函数的估计,复旦大学博士学位论文, 2 0 0 2 9 z u k a n gz h e n gc l a s so fe s ti m a t o r so ft h em e a ns u r v i v a lt i m ef r o m i n t e r v a lc e n s o r e ds u r v i v a ld a t aw i t ha p p l i c a t i o nt o1 i n e a rr e g r e s s i o n , m a n u s c r i p t 1 0 峁诗松,高等数理统计 m 北京:高等教育出版社,1 9 9 8 11 陈希孺,数理统计引论 m 浙江:科学出版社,1 9 8 1 1 2 z u k a n gz h e n g ( 1 9 9 2 ) ,ac l a s sko fe s t i m a t o r so fm e a n1 i f e t i m e w i t ha p p l i c a t i o n s ,t h ed e v e l o p m e n to fs t a t i s t i c s :r e c e n tc o n t r i b u t i o n s f r o mc h i n a 。p i t m a nr e s e a r c hn o t e si nm a t h e m a t i c s ( s e r i e s 2 5 8 ,2 8 9 2 9 8 ) j 。l o n g m a ns c i e n t i f i c & t e c h n i c a l ,1 9 9 2 1 3 】郑祖康,丁邦俊,关于区间数据的分布函数估计问题,生存分析与可 靠性学术研讨会邀请报告,北京大学, 2 0 0 0 1 4 p g r e e n r o o m ,a s y m p t o t i cf o ri n t e r v a lc e n s o r e do b s e r v a t i o n s , t e c h n i c a lr e p o r t ,8 7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论