




已阅读5页,还剩15页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 在经典统计分析中,数据被假定为真实值但实际的观测数据总存在某种程度的近 似,例如由于受测量装置的精确度的影响,时间被记录到最接近的秒本文主要考虑的 是四舍五入后得到数据的统计分析问题如果忽略四舍五入情况,则得到的估计一般不 满足相合性著名的s h e p p a r d 分析提供了一种对估计的修正但是s h e p p 口d 修正要求分 布满足严格的条件,而这种条件在实际中大都不能达到所以,我们寻找另一种方法解 决这个问题特别地,本文集中讨论当数据是来自参数未知的正态分布四舍五入后的数 据,均值和方差的联合置信集通过比较传统方法和四舍五入( 注一) 数据的似然方法, 一般似然方法是提供一个同时估计均值和方差的可靠方法。 关键词:四舍五入,似然方法,似然比检验,置信区域,覆盖率 a b s t r a c t i ns t a n d a r ds t a t i 8 t i c a la n 出y s e s ,d a t aa r ea s s u m e dt ob ee s s e n t i 蛆l y b u ti n d e e dt h e ya r e o f t e no b t a i n e df r o mar e l a t i v e l yc r u d eg a g i n gm e t h o da n da r et h u si n t r i n s i c a l l y ”r o u n d e d ” t os o m en e a r e s tu n i t f o re x a m p l e l b e c a u s eo ft h ep r e c i s i o no ft h em e a s u r i n gd e v i c e ,t h e t i m eb e t w e e nt r a d e si sr e c o r d e dt ot h en e a r e 8 ts e c o n d i fw ei g n o r e ”r o u n d e d ”,t h ee a t i m a t o r w h i c hw eo b t a i nd o n ts a t i 8 f y 址l ec o n s i s t e n c y t h ef a m o u sa n a l y s i 8o fs h e p p a r dp r o v i d e s a p p r o x i m a t er e l a t i o n s h i p sb e t w e e nt h em o m e n t so fac o n t i n u o u sd i s t r i b u t i o na n dt h o s eo f ac o r r e s p o n d i n ga p p r o x i m a t i n gd i s c r e t ed i s t r i b u t i o n b u tt h i sc o r r e c t i o nn e e dv e r ys t “c k c o n d i t i o na b o u td i s t r i b u t i o n s ow es e e ka n o t h e rm e t h o dt os o l v et h i sp r o b l e m i np a r t i c u 一 1 a r ,w ef o c u sd i s c u s s i o no nj o i n tc o n f i d e n c es e t so ft h ep a r a m e t e rm e a na n dv a r i a n c ew h e n ar o u n d e ds a m p l ec o m e sf r o mt h en o r m a ld i s t r i b u t i o nw i t hb o t hp a r a m e t e r su n k n o w n t h et r a d i t i o n a lm e t h o da n dar o u n d e d d a 七a1 i k e i i h o o d 。b a s e dm e t h o da r ec o m d a r e d 、7 v 色 f i n dt h a tt h e1 i k e l i h o o d b a s e dm e t h o dp r o v i d e sar e l i a b l em e a n so fe s t i m a t i n gm e a na n d v l r i a n c e k e yw o r d s :r o u n d i n g ,l i k e l i h o o d b a s e dm e t h o d ,l i k e l i h o o dr a t i ot e s t ,c o n f i d e n c er e g i o n ,c o v e r a g e p r o b a b i l i t y i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果据我所知, 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得东北师范大学或其他教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究 所做的任何贡献均已在论文中作了明确的说明并表示谢意 学位论文作者签名:j l ;i i 三_ 一 日期: p j 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权 保留并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论文被查阅和借阅本人授权东北 师范大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复 制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:垃指导教师签名:邋 日 期:趣鳋【。丝 日期:渔鲤! :乡 学位论文作者毕业后去向: 工作单位:塑鲍麴鎏蟹豳蜃盘监,电话:胆鱼! ! 呈型p ) , 通讯地址:塞垄螬豳堑! ! 绝邮编:五塑i ! 翌 引言 通常给出参数的点估计和相应的置信区域时,假定数据是精确的但在实际中,有 时获得台辱数据是经过粗略的记录的例如称量物体时,我们经常记下最近的克数,称这 样的数据为四舍五入数据( r o u n d e dd a t a ) 当分析r o u n d e d 数据时会产生如下问题对于四舍五入数据,传统估计方法还适用 吗? 如果不适用,该怎么办呢? 通过模拟易知用这样的数据得到的估计不具有相合性 著名的s h e p p a f d 分析提供一种近似,l e e 和d e m 讨论了当样本是来自p 和口都未 知的正态分布四舍五入后的值时,参数p 和a 的置信区间 本文先考虑s h 印p ”d 分析和b r b 修正,因为这惮修正简单方便通过模拟的方法 验证这种近似的可行陛和普遍性然后考虑了当观测值是来自参数未知的正态分布四舍 五入后的数据时,参数“和a 的联合置信集比较两种方法:一是把观测值当作精确数 据,用似然比统计量构造置信集二是求出四舍五人数据的似然函数,再用似然比得出 置信区域第一部分是正态分布的s h e p p d 修正分析和b r b 修正第二部分是一类特 殊离散分布的s h e p p a r d 修正分析和b r b 修正第三部分给出基于四舍五入数据,正态 分布恰当的似然函数和似然比检验第四部分是比较似然方法和传统方法。最终的结论 分布恰当的似然函数和似然比检验第四部分是比较似然方法和传统方法。最终的结论 在第五部分 1 正态分布的s h e p p a r d 修正和b r b 修正 著名的s h e p p ”d 分析提供了在连续分布和相应的近似离散分布的矩之间的一种近似 关系例如,如果x 的概率密度为f ( x ) ,【x 】是x 四舍五入后的整数,则s h e p p a r d 分析建 议 1 y 。r x 2 y n r 【x 一壶 ( 1 ) 这表明四舍五入数据增加方差。如果q = 【x 】_ x ,q u ( 一0 5 ,o 5 ) 且q 与x 独立,那么 ( 1 ) 式成立。进而对于估计均值,有 e x e f x 】( 2 ) 而b r b 修正与之正好相反:当q 与 x 】独立时, y 。r x z y 。r x 】+ 去 ( 3 ) 当x 服从( 弘,0 2 ) ,通过模拟,比较s h e p p a r d 修正和b r b 修正。对a 估计模拟结果 如下表所示: 分布样本值v o r x y o r x s h e p p a r d 修正b f u 3 修正 ( o ,1 ) 2 51 1 6 8 9 41 3 1 8 41 2 3 5 0 6 71 4 0 1 7 3 3 ( o ,1 ) 2 0 0o9 3 2 3 4 51 0 7 7 5o 9 9 4 1 6 71 1 6 0 8 3 3 ( 一43 ,3 6 ) 2 54 20 8 1 8 5 24 2 0 7 3 64 1 9 9 0 2 6 74 2 1 5 6 9 3 3 ( 4 3 ,3 6 ) 2 0 03 3 5 6 4 4 2 6 3 3 4 4 3 3 3 5 6 6 6 73 3 5 2 3 3 3 3 更一般的模拟是从( o ,1 ) 中连续抽1 0 组1 0 0 0 个随机数作为样本,对方差的估计结 果如下表: v x v a 硝x 】s h e p p a t d 修正b r b 修正 09 6 0 1 7 01 0 6 6 8 3 10 9 8 3 4 9 81 1 5 0 1 6 4 o 9 7 2 5 4 21 0 5 6 9 9 9o 9 7 3 6 6 61 1 4 0 3 3 2 o9 7 6 3 4 01 0 5 0 6 3 9o 9 6 7 3 0 61 1 3 3 9 7 2 1 0 0 3 4 8 51 0 8 3 9 8 41 0 0 0 6 5 11 1 6 7 3 1 7 09 1 3 3 9 0o 9 7 0 7 7 5o ,8 8 7 4 4 21 0 5 4 1 0 8 1 0 5 9 8 1 61 1 3 8 9 9 91 0 5 5 6 6 612 2 2 3 3 2 1 0 2 1 6 6 81 0 8 3 5 1 6 1 0 0 0 1 8 3 1 1 6 6 8 4 9 0 9 9 3 1 9 61 0 6 9 6 3 lo9 8 6 2 9 81 1 5 2 9 6 4 1 0 7 7 7 6 01 1 6 0 8 7 91 0 7 7 5 4 612 4 4 2 1 2 0 9 5 8 6 1 21 0 3 4 9 5 109 5 1 6 1 81 1 1 8 2 8 4 从( 一4 3 ,3 6 ) 中连续抽1 0 组1 0 0 0 个随机数作为样本,对方差的估计结果如下表 2 v w x v 蔚【x 】s h e p p a r d 修正b r b 修正 3 4 5 6 6 1 2 83 4 5 3 3 6 7 13 4 4 5 0 3 3 83 4 6 1 7 0 0 4 3 5 0 1 1 5 0 73 5 1 8 3 2 3 93 5 0 9 9 9 0 63 5 2 6 6 5 7 2 3 5 1 4 8 2 3 53 5 1 8 4 7 5 13 5 1 0 1 4 1 83 5 2 6 8 0 8 4 3 6 1 2 5 4 7 63 6 1 7 7 9 0 03 6 0 8 4 5 6 73 6 2 6 1 2 3 3 3 2 8 8 2 0 2 33 2 9 4 7 4 7 13 2 8 6 4 1 3 83 3 0 3 0 8 0 4 3 8 1 5 3 3 6 33 8 2 1 9 9 9 93 8 ,1 3 6 6 6 63 8 3 0 3 3 3 2 3 6 7 8 0 0 4 53 6 8 8 5 7 7 53 6 8 0 2 4 4 23 6 9 6 9 1 0 8 3 5 7 5 5 0 5 53 5 8 4 2 7 6 43 5 7 5 9 4 3 13 5 9 2 6 0 9 7 3 8 7 9 9 3 5 33 9 0 5 2 7 7 53 8 9 6 9 4 4 23 9 1 3 6 1 0 8 3 4 5 1 0 0 3 53 4 5 5 3 6 0 03 4 4 7 0 2 6 73 4 6 3 6 9 3 3 观察这个表格发现,当x 一( o ,1 ) ,且样本数较大时,s h e p p a r d 修正是比较好的; 当样本数较小时,无论是s h e p p ”d 修正,还是b r b 修正,对方差的估计都不是很好如 果分布不是标准正态,样本数较大时,b r b 修正要好于s h e p p a r d 修正;小样本时,两种 修正差不多 对估计的模拟结果如下表: 分布样本数 e x e x ( 0 ,1 ) 2 5o 1 2 4 7 0 5一o 0 4 ( o ,1 ) 2 0 0一o0 3 4 2 1 l0 0 5 ( 一4 3 ,3 6 ) 2 55 0 4 8 2 2 95 0 8 | v ( 一4 3 ,3 6 ) 2 0 045 0 5 2 6 945 若从正态分布中抽1 0 组1 0 0 0 个样本,估计均值结果如下 ( 0 ,1 ) e x( o ,1 ) e 【x 】( 一4 3 ,3 6 ) e x ( 一4 ,3 ,3 6 ) e 陋】 0 0 1 8 7 6 30 0 1 3 0 0 04 1 8 7 4 2 2 4 1 7 7 0 0 0 0 0 0 2 8 9 1o 0 0 1 0 0 04 3 1 7 3 4 9一4 3 1 9 0 0 0 00 2 2 7 5 4 o 0 1 9 0 0 044 3 6 5 2 7一4 4 4 3 0 0 0 00 1 2 5 3 0 o 0 0 4 0 0 04 3 7 5 1 7 7一4 3 9 0 0 0 0 一o 0 2 8 2 0 3一0 1 5 0 0 04 4 6 9 2 1 7一4 4 7 7 0 0 0 o0 1 0 9 3 3o 0 0 1 0 0 04 2 3 4 4 0 2一4 2 5 1 0 0 0 0 0 0 9 8 1 2o 0 2 2 0 0 04 2 4 1 1 3 14 2 3 5 0 0 0 o 0 3 2 5 1 0 o 0 3 7 0 0 04 1 0 4 9 3 94 1 0 6 0 0 0 o 0 0 6 1 6 9 o 0 1 1 0 0 04 2 6 2 9 8 6一4 2 6 5 0 0 0 0 0 2 0 0 0 8 o 0 0 7 0 0 04 4 2 0 0 4 8一4 4 2 0 0 0 0 从表中看出,当分布是正态分布,均值的s h e p p ”d 修正较准确 3 2 具有直方图密度的s h e p p a r d 修正和b r b 修正 y o r d e m 。n ( 2 0 0 4 ) 指出当随机变量具有直方图密度( 即,( z ) 在区间0 一o 5 ,i + o 5 ) 上 是常数,其中i 为任意整数) ,则【x 】与q 独立,所以( 3 ) 式成立,b r b 修正表现良好 若x b ( n ,p ) + u ( 一o 5 ,o 5 ) + 6 ( 其中n ,6 是常数,p 是参数未知) ,则x 具有直方图密 度。我们有的样本值是四舍五入后的数据,把这些值当作精确值,用极大似然估计得到 多然后计算方差通过模拟,设样本数为1 0 0 0 ,分别抽十组,比较两种修正 分布为b ( 1 0 ,o 5 ) + u ( 一o 5 ,o 5 ) ,方差为2 5 8 3 3 3 3 ,结果如下 v a r x v a r x 】s h e p p a r d 修正b r b 修正 25 9 6 3 0 72 4 8 9 6 3 12 4 0 6 2 9 82 5 7 2 9 6 4 2 7 0 2 0 4 92 6 0 6 3 7 5 2 5 2 3 0 4 2 2 6 8 9 7 0 8 2 6 2 8 4 5 12 5 6 5 9 0 02 4 8 2 5 6 72 6 4 9 2 3 3 26 4 7 4 5 72 5 3 0 8 4 42 4 4 7 5 1 12 6 1 4 1 7 7 25 5 8 7 1 l2 5 5 3 6 0 02 4 7 0 2 6 72 6 3 6 9 3 3 2 6 1 9 1 4 22 5 5 3 8 8 4 24 7 0 5 5 12 6 3 7 2 1 7 26 8 3 3 3 82 5 5 9 3 7 524 7 6 0 4 22 6 4 2 7 0 8 2 4 11 3 4 62 3 6 7 9 7 522 8 4 6 4 2 2 4 5 1 3 0 8 25 4 6 5 5 0 2 4 7 5 4 0 02 3 9 5 0 6 7 25 6 1 7 3 3 25 4 9 1 3 524 3 7 7 4 42 3 5 4 4 112 5 2 1 0 7 7 v a r x v ” x s h e p p a r d 修正b r b 修正 25 9 6 3 0 72 6 9 6 7 3 62 6 1 3 4 0 327 8 0 0 6 9 27 0 2 0 4 928 5 0 9 7 527 6 7 6 4 2 2 9 3 4 3 0 8 2 6 2 8 4 5 12 7 0 0 4 9 62 6 1 7 1 6 32 7 8 3 8 2 9 26 4 7 4 5 7 2 6 9 2 9 7 52 6 0 9 6 4 22 7 7 6 3 0 8 2 5 5 8 7 1l2 6 5 8 5 5 92 5 7 5 2 2 62 7 4 1 8 9 2 26 1 9 1 4 22 7 2 8 1 5 12 6 4 4 8 1 828 1 1 4 8 4 2 6 8 3 3 3 92 7 9 2 8 7 62 7 0 9 5 4 32 8 7 6 2 0 9 24 1 1 3 4 62 4 8 4 7 9 62 4 0 1 4 6 32 5 6 8 1 2 9 2 5 4 6 5 5 02 6 3 9 6 0 02 5 5 6 2 6 72 7 2 2 9 3 3 25 4 9 1 3 526 8 1 4 3 6 2 5 9 8 1 0 32 7 6 4 7 6 9 下 分布为b ( 1 0 ,o 5 ) + u ( 一o 5 ,o 5 ) + o 7 5 ,结果如下 4 v x v 缸【x 】s h e p p ”d 修正b r b 修正 2 5 9 6 3 0 72 7 6 1 6 0 02 6 7 8 2 6 72 8 4 4 9 3 3 2 7 0 2 0 4 92 7 7 9 3 4 42 6 9 6 0 1 12 8 6 2 6 7 7 2 6 2 8 4 5 12 7 6 2 4 0 02 6 7 9 0 6 7 2 8 4 5 7 3 3 2 6 4 7 4 5 72 7 9 1 1 0 02 7 0 7 7 6 72 8 7 4 4 3 3 2 5 5 8 7 1 l2 6 1 5 4 3 62 5 3 2 1 0 32 6 9 8 7 6 9 2 6 1 9 1 4 22 7 2 5 5 6 42 6 4 2 2 3 12 8 0 8 8 9 7 2 6 8 3 3 3 82 7 8 2 5 9 12 6 9 9 2 5 82 8 6 5 9 2 4 2 4 1 1 3 4 62 5 1 8 4 0 02 4 3 5 0 6 72 6 0 1 7 3 3 2 5 4 6 5 5 02 6 2 9 3 1 92 5 4 5 9 8 62 7 1 2 6 5 2 2 5 4 9 1 3 52 6 3 2 6 3 92 5 4 9 3 0 62 7 1 5 9 7 2 从中发现:当x b ( n ,p ) + u ( 一o 5 ,o 5 ) 1 b r b 修正要远远好于s h e p p a r d 修正;当 x b ( n ,p ) + u ( 一o 5 ,o 5 ) + o 2 5 ,s h e p p a r d 修正比较好当x b ( n ,p ) + 矿( 一o 5 ,o 5 ) + o 7 5 ,s h e p p a r d 修正比较好 综合1 ,2 两部分,我们看出基于四舍五入数据参数的估计问题,针对不同的分布,简 单的修正已经不好使了。所以,在实际中,不能随便修正。在下一节我们通过四舍五入 数据的似然估计,给出了基本正态数据的p ,a 联合置信集。 5 3 基于r o u n d e d 正态数据的弘,盯联合置信集 有两种方法能得到置信水平为1 一a 关于参数“o 的联合置信区域:传统方法和基 于似然方法 3 ,1 传统方法 传统方法是我们忽略四舍五入的状况,把这些四舍五入的数据当作精确真实的正态 数据,那么根据以往的统计分析方法( 详见参考文献( 1 】) ,似然比为 心( p 川= ( 霎2e x p 刍娄一舻一刍娄一 一2 l n f k ( p ,盯) x 2 ( 2 ) 所以,对于较大的n ,似然比检验置信区域为 m n 荽+ 喾+ 嗡掣一n 1 时,似然方程有解,此时的解血,子是p , 6 极大似然估计下面的定理说明西,子是肛,盯相合估计 引理3 2 1 令矗( 。) 是目的一个相合估计,如果g 是口的一个连续函数,则9 ( 霸) 是 g ( 口) 的一个相合估计 证明见参考文献 1 6 引理3 2 2 ( 隐函数定理) 设f ( z ,弘“,口) ,g ( z ,u , ) 在点p ( z o ,珈,u o ,如) 的某一邻域 内具有对各个变量的连续偏导数,又f ( 。o ,珈,u o ,珈) = o ,g ( 。o ,珈,u o ,咖) = o ,且偏导数 所组成的函数行列式( 雅可比行列式) : ,一幽一l 籍筹 扣而万2 篆嚣 在点p ( z o ,o ,u o ,) 不等于零,则方程组f ( z ,“,口) = o ,g ( z ,“, ) = o 在( z o ,珈,“o ,如) 的 某一邻域内恒能唯一确定一组单值连续且存在连续偏导数的函数让= u ( z ,9 ) ,”= ”( z ,) , 它们满足条件o = u ( z o ,珈) ,u o = ( z o ,如) 定理32 3 若x 一( p ,口2 ) ,其中一。 o l ( p ,盯j 、 取标准正态分布的1 0 0 0 个样本,通过模拟,发现似然比统计量渐近自由度为2 的卡 方分布,模拟的直方图如下: 下面给出理论证明。 证明首先证咖( :) 渐近磕设吲 n 虻硝如y 根据定理32 3 知丘,子是“a 的相合估计, 则似然方程的解一口o( p ) 。 根据参考文献【1 8 中的定理2 5 , ( 耄) 一( 剐= ( 其中 将器在p o 处展开,得 舒祭h 如詹盎h 川如 詹貉h 叫出詹象k 如 1f 旷加1 盯一盯o p 4 = 肛o + ( 肛肛o ) z ,盯+ = 盯o + ( 盯一盯o ) z 取目= d ,代入上式得: 一( 剐= 匏:乏丢钦划引 此时, p + = o + ( 豇一p o ) z ,盯+ = 盯o + ( 子一盯o ) z 一而:h 善孰豢名戥剖而( 圳詹貉h 如 、矛一o r o ( 6 ) 因为 。 z = l n p t ,鼽= l 所以器i 钆,象i 为独立同分布变量和 设 酶卜玩( 孰戮) 根据积分中值定理,存在z i + ( o ,1 ) 使得 z 1 髻k 如= 器b 川, 同理,存在z + ( o ,1 ) ,z r ( o ,1 ) 使得 z 1 盎h 如= 啬b 以下z 1 氖v i ) d z = 筹b 疗, 其中 又因为 芦;+ = p o + ( 血一卢o ) z ;+ ,盯;+ = 口b 十( 子一盯o ) 。;+ p ;+ = 芦o + ( 应一卢o ) z ;,盯;= 盯o + ( 占一盯o ) 。;+ 子+ 盯o ( p ) 成一“o ,西+ 一印( p ) 其中# 1 ,2 ,3 由强大数定律知, :( 善躲! ;名戥剖一。”詹器h 如詹器b 如一叫 _ 叫 因为 f 斟1 :f a a l 舶 = 【 = i f = l =0 9 赢嚣b ( ) o “( 日o ) 础“l 。u , 南玺1 钆p z ( ) 戮)玺川 孰) 剐 ( 8 ) 小 由中心极限定理,有 而去( 剐一印跏, 把式( 8 ) ,( 9 ) 带入式( 7 ) 中,再应用s l u s t k e y 定理,得 而( :) 州叭- l ( , 下面证: 一2 陋( p ,盯) 一( 卢,占) 】,) ( 2 ( 2 )( l ) 将对数似然函数z ( p o ,印) = ( 口o ) 在= ( 忍疗) 7 处t a y l o r 展开,则有 卫( 日o ) =l ( 舀) + ( p o 一百) 7 ( 扫) + ;( 臼。一百) 7 7 ( 口+ ) ( 口。一旁) = ( 自) + 去( 一6 ) 7 e ( 口。一5 ) 其中g = ( ( 矿) ) ,a ,( 日) = 一;各1 帮 这里口+ = 6 + q ( 6 一日o ) ,o q 茎1 贝4 有 _ 2 l n 渊= 2 暇驴即o ) = ( 口。一百) 7 g ( 臼。一百) = d ( 日o ) 7 g d ( 臼o ) 其中d ( 口o ) = 、,伍( 一目o ) 因为口+ 一日o( p ) 所以由大数定律知 g 一( 日o )( p ) 又因为 ,j ( 目o ) d ( ) 一( 0 ,1 ) ( l ) 所以 d ( 日o ) 7 g d ( 口o ) 一x 2 ( 2 )陋) _ 2 1 n 面忑等等丽一2 瞰 ) 叫 ) 卜娥2 ) 8 t z p “r s 札p 口 o l l p ,盯) 证毕 使用该定理,得到基于似然( p ,a ) 的联合置信集为 _ 2 l n 瓦蠹 0 l i p ,盯) p 一 1 0 ( 1 0 ) 4 模拟 4 1 似然方法的置信区域 我们使用m o n t ec a r l o 方法,假设样本来自( o ,1 ) ,分别取样本数n 为1 0 ,2 5 1 0 0 o = 0 1 图l :样本数n = 1 0 ,基于似然方法( “,口) 的渐近联合置信区域如下: 图2 :样本数n = 2 5 ,基于似然方法( “一) 的渐近联合置信区域如下 图3 :样本数n = l o o ,基于似然方法( p ,口) 的渐近联合置信区域如下 图3 :样本数n = l o o ,基于似然方法( p ,口) 的渐近联合置信区域如下 4 2 比较两种方法对真值的覆盖率 q = 0 1 如下表1 : 区域类型 n = 1 0n = 2 5n = 1 0 0 似然方法 o 8 8o 8 9o 9 8 传统方法 0 8 60 8 5 0 9 1 置信水平 0 90 90 9 q = 0 0 5 如下表2 区域类型 札= 1 0 死= 2 5礼= 1 0 0 似然方法 o 9 30 9 50 9 9 传统方法 0 9 10 9 40 9 8 置信水平 o 9 5o 9 5 0 9 5 从这两个表中可以看出,当样本数较小时,似然方法的覆盖率接近名义水平1 一o , 要好与传统方法当样本数很大时,似然方法的覆盖率要大于置信水平,而传统方法接 近名义水平。 4 3 比较两种方法置信区域的面积的大小 由于置信区域是不规则图形,所以我们从图中观察比较 样本数为2 5 ,q = 0 1 时,比较图为: 纩 飞 心乡夕 样本数为1 0 0 ,a = o 1 时,比较图为 飞。 =t 从图中看出,两种方法的区域面积大小几乎相等 1 3 具有直方图密度的似然修正 当x b ( n ,p ) + u ( 一0 5 ,o 5 ) + 6 ( 其中n ,6 是常数,p 是参数未知) ,则分布函数为 n f ,p ) = p ( x ) = c :p ( 1 一p ) “一p ( 厂 z 一一6 ) k = 0 其中z 一6 一o 5 z 一6 + 0 5 取四舍五入后的样本n 个,则似然函数为 n o 。 l 扛;p ) = n f ( 她+ o 5 ,p ) 一f ( 磁一o5 ,p ) 】= f ( j + o 5 ,p ) 一f 0 一o 5 ,p ) 。 l = l“ 对数似然函数为 l ( z ;p ) = n 芝:最忉慨) t = 一。 其中赢= 鲁,胁= a ( p ) = f ( + o 5 ,p ) 一f 0 一o 5 ,p ) 由此得出p 的极大似然估计f 定理5 1 萝一p ( n s ) 证明根据参考文献【1 9 中的定理2 1 ,易知:( 1 ) 参数空间是紧的( 2 ) 在真值p o ,对于 所有p ,罂一。p 。( p o ) f o 卯。( p ) 存在。( 3 ) 真值参数p 0 是唯一对数似然期望的最大值 又容易验证a ) 关于p 是凹函数,所以 证明由参考文献 1 9 中的定理22 易证 下面给出似然方法修正的模拟结果。 v a r x v a “x 】s h e p p a r d 修正b r b 修正似然修正 2 5 9 6 3 0 72 4 8 9 6 3 l2 4 0 6 2 9 82 5 7 2 9 6 42 5 7 6 7 2 3 2 7 0 2 0 4 92 6 0 6 3 7 52 5 2 3 0 4 22 6 8 9 7 0 8 25 9 0 6 6 0 2 6 2 8 4 5 12 5 6 5 9 0 02 4 8 2 5 6 72 6 4 9 2 3 32 5 7 1 6 9 4 2 6 4 7 4 5 72 5 3 0 8 4 4 24 4 7 5 1 12 6 1 4 1 7 72 5 9 6 3 5 2 2 5 5 8 7 1 12 5 5 3 6 0 024 7 0 2 6 72 6 3 6 9 3 3 2 5 8 8 5 6 8 26 1 9 1 4 22 5 5 3 8 8 42 4 7 0 5 5 12 6 3 7 2 1 725 6 2 0 1 2 26 8 3 3 3 82 5 5 9 3 7 52 4 7 6 0 4 22 6 4 2 7 0 82 5 9 0 2 3 8 2 4 1 1 3 4 62 3 6 7 9 7 52 2 8 4 6 4 22 4 5 1 3 0 8 2 5 5 4 8 2 8 25 4 6 5 5 024 7 8 4 0 02 3 9 5 0 6 725 6 1 7 3 32 5 7 8 4 5 7 2 5 4 9 1 3 52 4 3 7 7 4 42 3 5 4 4 1 12 5 2 1 0 7 72 5 6 6 4 7 0 从中看出无论分布是什么,似然方法修正都眼好于其他修正,并且接近真值 1 4 。一 硝黼件有条具 结论 当样本量不太大时,虽然似然方法和传统方法的置信区域面积差不多大,但是似然 方法的真值覆盖率更接近置信水平所以,在实际中遇到四舍五入数据,我们不能随便 修正,应该按照基于似然方法给出参数的置信集 1 5 参考文献 f 1 b a r r yc , a r n o l da l l dr o b e r ms h a v e 】j e j o i mc o n 矗d 朗c es e t sf o rt h em e a r ia n d r i a n c eo fa n o r m a ld i s t r i b u t i o n 【j 】t h ea m e r i c a ns t a t i s t i c i a n 。 1 9 9 8 , 5 2 ( 2 ) : 1 2 5 【2 】l e ec h i a n 哥s h e n g ,v a r d e m a n 。 s t e p h e nb i n t e r v a le s t i m a t i o no fan o r m a lp r o c e s sm e a nf r o m r o u n d e dd a t a 【j 1 j o u r n a l0 fq u a l i t yt e c h n o l o g y , 2 0 0 l , 3 3 5 :1 - 3 1 【3 】l e ec h i a i l g - s h e n g ,v a r d e m a n , s t e p h e nbi n t e r v a le s t i m a t i o no fan o r m a lp r o c e s ss t a n d a r dd e v i a t i o nf r o mr o u n d e dd a t a f j l c o m m u n i c a t i o n si ns t a t i s t i c s ,2 0 0 2 : 1 3 3 4 【4 】l e ec h i a n g s h e n g ,v a r d e m a n ,s t e p h e nb c o n 6 d e n c ei n t e r v a l sb a s e do nr o u n d e dd a t af r o mt h e b a l 柚c e do n e w a yn o r m a lr a n d o me c t sm o d e l 【j 】c o m m u n i c a t i o n si ns t a t i s t i c s , 2 0 0 3 ,3 2 ( 3 ) ; 8 3 5 8 5 6 【5 v a r d e m a n ,s t 印h e nb s h e p p a r d sc o r r e c t i o nf o rv a r i a n c e sa n dt h e ”q u a n t i z a t i o nn o i s em o d e l ”f j l c o m m u n i c a t i o n si ns t a t i s t i c s , 2 0 0 4 ( 3 ) :1 2 3 f 6 】v a r d e m a n 。s t e p h e nb , l e ec h i a n g - s h e n g l i k e l i h o o d - b a s e ds t a t i s t i c a le s t l m a t i o nf i o mq u a n t i z e d d a t a fj 】j o u r n a lo fq u a l i t yt e c h n o l o g y ,2 0 0 2 ,3 5 ( 1 ) : l 一1 8 7 j b yj , b u r “d g e an o t eo nm a x i m u ml i k e l i h o o de s t i m a t i o nf o rr e g r e s s i o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年南昌市劳动保障事务代理中心招聘统计监测劳务外包工作人员1人考前自测高频考点模拟试题附答案详解(突破训练)
- 2025江苏苏州高新区(虎丘区)机关车队公益性岗位招聘3人模拟试卷附答案详解
- 2025年河北张家口市专职消防队伍管理中心第一批政府专职消防员招聘160名模拟试卷及参考答案详解一套
- 2025年北京师范大学海口附属学校春季面向全国招聘78人考前自测高频考点模拟试题完整参考答案详解
- 小学英语单词拼写练习题汇编
- 张根硕的课件
- 分布式账本技术在能源交易中的应用-洞察及研究
- 2025广西那坡县农业机械化服务中心基层农技推广体系改革与建设补助项目招募特聘农技员2人考前自测高频考点模拟试题附答案详解(典型题)
- 分布式并行算法研究-洞察及研究
- 2025杭州高新区(滨江)教育局所属事业单位直接考核招聘幼儿园聘用制教师13人模拟试卷及完整答案详解
- 2025年上海电力股份有限公司招聘笔试参考题库含答案解析
- 安全生产法律法规汇编(2025版)
- 养老服务合作协议
- 《埃菲尔铁塔唯美》课件
- 依诺肝素钠课件
- 道路交通安全培训课件
- 教材验收合格报告范文
- GB/T 23450-2024建筑隔墙用保温条板
- 2022年海南省中考语文试卷
- 福建医学临床“三基训练”护士分册2012版1-726题
- DB11T 1785-2020 二氧化碳排放核算和报告要求 服务业
评论
0/150
提交评论