




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随机变量的分组观察值是指在随机试验中,我们只知道随机变量x 是否落入 某一已知区间陬+ r ,) ,而不知道随机变量x 的具体观察值。在医学研究和经济 指标的分析中常常会遇到这类数据,因此研究这类数据具有重要的理论意义和实 际意义。近年来,对于这类数据的分析研究得到了越来越多的关注,一部分问题 已经得到解决,但这一领域还有很多问题有待研究。本文研究基于分组数据的若 干常见寿命分布族的参数估计问题。 当数据来自指数分布时,这类问题已得到解决。本文将考虑若数据来自某些 更为常见的寿命分布,如威布尔分布、对数正态分布,这类问题该如何解决。 全文共分为五章。第一章首先介绍分组数据问题的背景以及如何利用经典的 统计方法对分组数据进行分析,并指出分析过程中所遇到的困难;第二章将介绍 种处理不完全数据时的常用算法,附算法,并说明利用这种算法所得到的估 计具有良好的收敛性;第三章将利用e m 算法对基于分组数据的威布尔分布和对 数正态分布进行参数估计,并进行模拟表明此方法的可行性与有效性。第四章将 介绍e m 算法的一种随机变例,m e m 算法,并说明利用这种算法所得到的估计具 有良好的收敛性。第五章将利用m e m 算法对基于分组数据的威布尔分布和对数正 态分布进行参数估计,并进行模拟表明此方法的可行性与有效性。 关键字:分组数据,e m 算法,m e m 算法,参数估计 i i a b s t r a c t ag r o u p e do b s e r v a t i o nm e a n st h a tx i sk n o w ne i t h e rl i e si n s i d ea n i n t e r v a l r y l ,0 ) ,o r n o t b u t ,w ea r en o ta b l et oo b s e r v et h ee x a c tv a l u e o ft h es u r v iv a lt i m exa ta 1 1 i ti sv e r yi m p o r t a n tb o t hi np r a c t i c ea n d i n t h e o r y t o s t u d yt h i s k i n do fd a t a ,f o ri to f t e no c c u r si nm e d i c a l r e s e a r c ha n de c o n o m i ca n a l y s i s r e c e n t l yt h i sk i n do fq u e s t i o ni su n d e r d i s c u s s i o n ,a n d s o m eo ft h e mh a v eb e e n s o l v e d b u t ,t h e r e a r em a n y u n r e s o l r e dq u e s t i o n si nt h i sf i e l d i nt h i sp a p e r ,w et r yt os t u d yt h e p r o b l e mo fe s t i m a t i n gp a r a m e t e r si ns o m ei i f ed i s t r i b u t i o nb yg r o u p e d d a t a w h e nd a t ac o m ef r o me x p o n e n t i a ld i s t r i b u t i o n ,t h i sp r o b l e mh a sb e e n s o l r e d 1w i l li n t r o d u c eam e t h o dt os o l v et h i sp r o b l e mw h e nd a t ac o m e f r o ms o m ec o m m o n1 i f e d i s t r i b u t i o n ,s u c ha sw e i b u l ld i s t r i b u t i o na n d l o g n o r m a ld i s t r i b u t i o n i nc h a p t e r1 ,w ei n t r o d u c eb a c k g r o u n do fg r o u p e dd a t aa n dh o wt o a n a l y z e t h e mw i t hc l a s s i c a lm e t h o d s i n c h a p t e r2 ,w e i n t r o d u c ee m a l g o r i t h ma n ds h o wt h a tt h ee s t i m a t i o no ft h ep a r a m e t e r sg e tt h r o u g ht h i s a l g o r i t h mi sc o n v e r g e n tu n d e rc e r t a i nc o n d i t i o n s i nc h a p t e r3 ,w eu s e e ma l g o r it h mt oe s t i m a t e p a r a m e t e r si nw e i b u l ld i s t r i b u t i o na n dl o g n o r m a l d is t r i b u t i o n b yg r o u p e dd a t aa n dt h es i m u l a t i o ns h o w st h i sm e t h o di s a v a il a b l e i nc h a p t e r4 ,w ei n t r o d u c em e ma l g o r i t h ma n ds h o wt h a tt h e e s t i m a t i o no ft h ep a r a m e t e r sg e tt h r o u g ht h i s a l g o r i t h mi sc o n v e r g e n t u n d e rc e r t a i nc o n d i t i o n s i nc h a p t e r5 ,w eu s em e ma l g o r i t h mt oe s t i m a t e p a r a m e t e r si nw e i b u l ld i s t r i b u t i o na n dl o g n o r m a ld i s t r i b u t i o nb yg r o u p e d d a t aa n dt h es i m u l a t i o ns h o w st h jsm e t h o di sa v e j a b 】e k e yw o r d s :g r o u p e dd a t a , e ma l g o r i t h m ,m e ma l g o r i t h m ,p a r a m e t e re s t i n a a t i o n i t i 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若干参数分布族的参数估计 第一章引言 1 1 问题的背景 实际中,在得到样本以后,我们最关心的问题之一便是想知道是分布族中哪 一个分布产生出此样本,即要从样本推断总体分布或其各种特征数。英国著名统 计学家r a f i s h e r 把统计推断归纳为三个方面:抽样分布,参数估计与假设检 验。本文所要研究的是参数估计中的点估计问题。 当随机样本的观测值为一个确定的数值,即所面对的是完全数据时,我们可 以利用经典统计分析的方法得到参数的点估计而且得到的估计具有良好的性质。 其中常用的方法有r a f i s h e r 在1 9 1 2 年提出的最大似然法,k p e a r s o n 在1 8 9 4 年提出的矩法等。 从2 0 世纪8 0 年代后期开始,随着社会的进步与科学研究的发展,对数据统 计的要求不断提高,如何处理不完全数据已经成为了一项热点课题。而在日常的 数据处理工作中,我们经常会遇到的一种不完全数据就是截断数据。 截断数据的形式是多种多样的,比较常遇见有第一类截断,第二类截断和随 机截断三种。这三种截断情况都属于右截断,即虽然不知道样本的确切数值,但 知道它大于某个数。对于右截断隋况下的数据,一般可用类似经典的方法来获得 参数的最大似然估计,详见参考文献( 7 ) 。 在实际研究中,另一类常见的截断数据是区间截断数据( 简称区间数据) , 即样本的具体观察值无法得知,而只知道样本是否位于某一时间区间。例如,研 究人员发现,血友病患者的发病机理是由于患者早期接受了被h i v 污染的血液制 品。给病人输入接受了被h i v 污染的血液制品后,病人的血液将在未来一段时间 内被h i v 感染,从而成为血友病患者,但被感染的时间z 是不确定的。为了估 计随机变量工的分布,每隔一段时间就对这一高发病人群作检查,观察其中的 个体是否已经是h i v 感染者,一个h i v 感染者被感染的时间x 应该位于两次检 查之间;但我们并不知道确切的时间。此外,有些患者在第一次检查是被确定为 h i v 感染者,此时患者被感染的时间是左截断的;也可能有些患者在整个检查期 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若干参数分布族的参数估计 间都未被h i v 感染,也就是说直到整个试验结束时,仍然不是h i v 感染者,此时 患者被截断的时间爿是右截断的,无论哪一种情况都可以看成区间数据的特例。 区间数据的研究可以追溯到很久以前,六十年代按时间分组数据的研究可以 视为它的一种特殊情况。在生存分析中常按时间顺序0 :瓦c 正 0 时,现有的参数估计值为0 耻。, 。生成m 。个独立同分布服从条件密度,( z l y ;o “1 ) 的随机样本乏,乏卅,定义 1 4 0 1 2 0 2 5 0 3 9 杨艺幕于分组数据的若干参数分布族的参数估计 瓯妒) :_ 1 m k1 。g ,( 少,乏,;臼) 。 卅i 百 ” 。根据第k 次转移核幺( 口( k - 1 ) ) 产生一个暂定值p ,并以概率c 。 ( k - 1 ) ,o ,五) 接 受臼( ) = o 。 c 女( 臼( k - 1 ) ,o ,2 :) = 1 a e x p m 女【s ( p ) 一s k ( o ( k - i ) ) , 其中z k = ( z k ,五。) 3 ,重复步骤2 ,直到满足停止条件为止。 在第k 次迭代中,如果s k ( 口) s k ( 0 “1 ) ,n o 被自动接受,从这个角度来 说,m e m 算法模仿了广义e m 算法。而另一方面,当( 口) s k ( 口“1 ) 时,臼7 仍能 以一个正概率被接受。这个特性是m e m 算法跳出局部极值点的关键。 4 2m e m 算法的收敛性 如果序列( ) 以对数级增长,则m e m 算法将收敛到一个以似然函数g ( y ,臼) 的 最大值点为支撑的分布上。详见如下引理: 引理:假设以下条件成立 1 参数空间 是r ,上的非空紧集。 2 对数似然函数l o g g ( y ,o ) 在参数空间o 上连续,并在有限个内部点上取到 它的极大值,称为研,0 :。进一步,h e s s i a n 矩阵 j ( 印) = 一导l 。g g ( y ,钏目:目。 在每个矿上为正,i = 1 ,r 。 3 对于某个j 1 以及所有k 1 , 巧( q 0 + l q 0 + 2 q f b ) d l 。 6 ( p ) 为d o b r u s h i n 紧缩系数。 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若干参数分布族的参数估计 4 存在( o ,1 ) 使序列( m 。) 满足下列条件之一, ( a ) m * 百l i n ( i k + 五2 丽) 并且图形t 斗1 聊t 为凸。 哪拦嵩棚t 。警 则,0 2 的分布。弱收敛于概率测度万。,定义为 其中v = d e t j ( o ;) 】2 。 证明:见参考文献 1 。 :。v ,z 伊( d 口) 卜i 1 6 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若干参数分布族的参数估计 第五章m e m 算法进行参数估计 在这一章中将利用m e m 算法对基于分组数据的威布尔分布和对数正态分御 进行参数估计,并利用计算机产生的随机数进行模拟。 5 1 当样本来自威布尔分布时的参数估计 为了便于表述,记随机变量x ,全体为x ,其总数为n ;我们所观测到的是 随机变量f ,记r 全体为】,。 对于落入区间 1 + 1 ) 的随机变量置,其基于观测结果,】:的条件密度如下: 川,绷。f,2fl而(2t)瓦p-exp丽(-(at)p)exp(dt 。印( m ) ”1 一( m ) 9 ) = - - - - - - - - e x p ( - - - - - 一 _ ( m ) 胪1一( m ) 4 ) e x p ( - ( a t j 一1 ) 4 ) 一e x p ( 一( 一) 9 ) 于是我们添加缺失数据z = 托,i = 1 , 2 n ,满足z ,服从参数为( a ,p ) 的威布尔分 布且z 。iy ,厂( i 兄,p ,i ) 。则可得完整数据x = ( y ,z ) 的似然函数如下 l o g f ( x ;, a ,卢) = l o g f ( y ,z ; ,卢) = l o g a f l ( a z ,) p 1e x p ( 一( a z ) 9 ) 下面,给出算法所涉及到的一些定义: 1 给定参数初始值( 名“,p o ) 其中乏,= 1 , 2 ,m 。为独立同分布随机变量,是根据条件密度,( zl 五,p ,y ) 随机产生的缺失数据。 1 7 国玩y八昭 m 一 义 糙 埘 n & 芍 + 酞 取 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若干参数分布族的参数估计 3 在第k 次迭代中,定义暂定参数值为 = i 一1 + 毛l ,卢爿卢一1 + f 2 其中( k - i ) ,p “1 ) 为在第k 一1 次迭代得到的参数迭代值,( s ,s :) 是两个独立 同分布的正态随机变量,均值为0 ,方差为o 1 。 根据以上定义即可对参数进行估计。 5 2 当样本来自威布尔分布时的模拟 记z ,i = 1 , 2 ,n 为独立同分布随机变量,其密度函数为五段埘舢e x p ( - ( 2 x ) 4 ) , 五= 0 2 ,卢= 1 。而瓦= 0 ,正= 2 ,疋= 4 ,正= 5 ,瓦= 6 ,瓦= 7 ,瓦= 1 1 ,正= 0 0 。 取参数初值o ) = 1 ,口o = 4 ,每次模拟均取2 0 0 0 个随机数。我们取最后5 次迭 代所得到的参数迭代值的平均值作为对真实参数的估计。进行5 次模拟后,我们 得到互的均值为0 2 1 2 5 ,方差为4 1 3 3 x 1 0 ;毋的均值为0 9 7 4 3 ,方差为 2 l o 。 再取参数值旯= 0 2 ,卢= 2 ,其余条件保持不变,进行5 次模拟后。我们得到 五的均值为o 1 9 7 6 ,方差为9 3 4 5 1 x 1 0 _ 6 ;彦的均值为1 9 9 6 1 ,方差为3 4 x 1 0 。 由以上模拟可以看出,在样本数较多的情况下,利用m e m 算法能得到对参 数五和口的不错的估计。下面,我们接着看看在样本较小情况下用m e m 算法估 计参数的效果。 取参数兄= 0 2 ,= 2 的威布尔分布,分别产生8 0 0 ,3 0 0 个随机数。重复以 上的模拟过程。当样本数为8 0 0 时,进行5 次模拟后,我们得到五的均值为0 2 0 3 7 , 方差为1 1 0 。4 。岔的均值为2 0 4 2 0 ,方差为6 3 x 1 0 。当样本数为3 0 0 时,进行 5 次模拟后,我们得到互的均值为0 2 0 7 1 ,方差为l x l 0 。4 。西的均值为2 1 2 6 6 方差为1 0 5 1 0 。 o i 2 0 2 5 0 3 9 杨艺 摹于分组数据韵若干参数分布族的参数估计 从以上模拟过程,不难看出对于服从威布尔分布的分组数据,无论是样本较 大还是样本较小的情况,利用由m e m 算法都可以得到比较满意的参数估计值。具 体模拟结果见附录3 。 5 3 当样本来自对数正态分布时的参数估计 已随机变量x 。全体为x ,其总数为n ,观测结果为岩,戤为落入区问 【巧+ ) 的随机变量,h = 1 , 2 , ,。记随机变量u ,全体为u ,其总数为n ,观测 结果为y ,“巾为落入区间【巧+ 巧) 的随机变量,h = 1 2 ,吩。 对于落入区间c r , + t ) 的随机变量u ,其基于观测结果f 的条件密度如下: f ( t l ,盯,r ) = 去e 。e 斗譬卜 e 冲卜警 只唧 一譬卜 于是我们添加缺失数据z = 瓴,i = 1 , 2 ,满足z ,服从参数为( 口,盯) 的正态分御 且z iy ,( 1 口,盯,z ) ,。则可得完整数据“= ( 弘2 ) 的似然函数如下: 崦m 儿小崦m 石叩,= 缸去唧 一鱼手 下面,我们给出算法所涉及到的一些定义: 1 给定参数初始值( 口“,盯。) 1 9 q o 型舻 卫 一 l 瓜盯 0 1 2 0 2 5 0 3 9 杨艺摹于分组数据的若干参数分布族的参数估计 2 取m 女= l o g ( k + 2 ) 3 ,并定义 班去芸- 。g ,( 妮 其中乏j ,_ ,= 1 2 一m 。为独立同分布随机变量,是根据条件密度f ( zi “,盯,y ) 随机产生的缺失数据。 3 在第k 次迭代中,定义暂定参数值为 a = 口一1 + q ,盯= l 仃2 1 + 毛j 其中( k - 1 ) o ( k - i ) ) 为在第k - 1 次迭代得到的参数迭代值,( s 。,s :) 是两个独立 同分布的正态随机变量,均值为0 ,方差为0 1 。 根据以上定义即可对参数进行估计。 5 4 当样本来自对数正态分布时的模拟 记置,f = l ,2 ,”为独立同分布随机变量,其密度函数为二去e 斗坐嘉2 ) , 其中a = o ,盯= l 。而瓦= 0 ,瓦= 2 ,疋= 4 ,五= 5 ,瓦= 6 ,墨= 7 ,瓦= 1 1 , 正= o 。取迭代初值a = 0 5 ,o - ( o ) = 1 5 ,每次模拟均取2 0 0 0 个随机数。取最后 5 次迭代所得到的参数迭代值的平均值作为对真实参数的估计。进行5 次模拟后, 得到a 的均值为o 0 0 5 7 3 ,方差为8 2 4 1 x 1 0 。;彦的均值为o 9 9 1 5 4 8 ,方差为 1 0 3 6 1 0 。 再取参数值a = 1 ,盯= 2 ,其余条件保持不变,进行5 次模拟。得到a 的均值 为1 0 1 7 4 5 2 ,方差为9 4 6 x 1 0 - 4 ;子的均值为1 3 7 8 4 6 ,方差为3 1 1 3 1 0 3 。 由以上模拟可以看出,在样本数较多的情况下,我们利用m e m 算法能得到 对参数a 和盯的较好的估计。下面我们接着看看在样本较小的情况下用m e m 算 法估计参数的效果。 2 0 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若干参数分布族的参数估计 取参数a = 0 ,口= 1 ,分别产生8 0 0 ,3 0 0 个随机数。重复以上的模拟过程。 当样本数为8 0 0 时,进行5 次模拟后,我们得到a 的均值为。0 0 1 0 7 2 ,方差为 2 6 x 1 0 ;占的均值为1 0 3 6 0 3 ,方差为7 2 1 2 2 x 1 0 一。当样本数为3 0 0 时,进行 5 次模拟后,我们得到a 的均值为o 0 7 2 1 4 9 ,方差为2 5 3 5 1 4 1 0 2 。毋的均值为 1 0 4 9 0 6 ,方差为2 4 6 0 2 1 0 。 随着样本数的减少,估计值与参数真值的偏差有所增大,特别是估计值的方 差明显增大,但仍不失为一种有效的估计。 从以上模拟过程,可以看出对于服从对数f 念分布的分组数据,无论是样本 较大还是样本较小的情况,利用m e m 算法都能够得到比较满意的参数估计值。具 体模拟结果见附录4 。 0 1 2 0 2 5 0 3 9 杨艺基十分组数据的若干参数分布族的参数估计 附录1 :利用e m 算法对戚布尔分确蹄屯行参数估计的模拟结果 当样本数为2 0 0 0 时的模拟结果 丑6 数值偏差数值偏差 n o l0 2 0 0 70 3 5 1 0 1 9 91 9 9 n 0 2o 1 9 3 53 2 5 0 9 9 3 2o 6 8 n 0 30 1 9 6 41 8 0 1 0 0 1 50 1 5 n 0 40 2 0 4 22 1 0 1 0 2 1 42 1 4 n 0 50 1 9 4 82 6 0 0 9 9 6 60 3 4 n 0 60 1 9 7 61 2 0 0 9 5 1 14 8 9 n 0 7o 1 8 9 25 4 0 9 61 0 0 4 60 4 6 n 0 80 2 0 5 72 8 5 1 ,0 3 3 63 3 6 n 0 90 1 9 2 73 6 5 0 9 9 3 3o 6 7 l o0 1 9 8 20 9 0 1 0 0 1 6o 1 6 均值 2 4 1 1 4 8 当样本数为2 0 0 0 时的模拟结果二 兄 8 数值偏差数值偏差 n o l0 2 0 2 11 0 5 1 9 6 4 63 5 4 n 0 2o 1 9 5 82 1 0 2 0 4 5 64 5 6 n 0 30 2 0 1 00 5 0 1 9 9 3 20 6 8 n 0 40 2 0 2 71 3 5 1 9 6 9 83 0 2 n 0 50 2 0 0 2o 1 0 1 9 1 3 58 6 5 n 0 60 1 9 8 30 ,8 5 1 9 8 5 71 4 3 n 0 70 2 0 2 01 0 0 1 9 6 2 93 7 1 n 0 80 1 9 9 60 2 0 2 0 0 5 50 5 5 n 0 90 2 0 1 60 8 0 9 61 9 4 7 55 2 5 n o l o0 1 9 6 61 7 0 2 0 6 5 36 5 3 均值0 9 6 3 7 9 0 1 2 0 2 5 0 3 9 杨艺 基于分组数据的若干参数分布族的参数估计 当样本数为8 0 0 时的模拟结果 五 8 n = 8 0 0 数值偏差数值偏差 n 0 10 2 0 6 53 2 5 2 0 3 8 61 9 3 n 0 20 2 0 4 82 4 0 2 0 3 2 41 6 2 n 0 30 1 9 6 71 6 5 1 9 5 8 82 0 6 n 0 40 2 0 4 62 3 0 1 9 8 2 60 8 7 n 0 50 2 0 3 91 9 5 1 9 3 5 63 2 2 n 0 6o 2 0 0 1o 0 5 1 9 5 6 72 1 6 n 0 7o 1 9 6 61 7 0 2 0 7 1 93 5 9 n 0 80 1 9 8 40 8 0 1 9 9 3 10 3 4 n 0 90 1 9 3 93 0 5 1 9 2 8 83 5 6 n o l o0 1 9 90 5 0 1 8 7 2 86 3 6 均值 1 7 7 2 。5 7 当样本数为3 0 0 时的模拟结果 a口 n = 3 0 0 数值偏差数值偏差 n 0 10 2 0 0 40 2 0 2 0 3 4 91 7 5 n 0 20 1 9 5 52 2 5 2 0 5 4 92 7 5 n 0 30 1 9 5 92 0 5 1 7 9 8 91 0 0 6 n 0 40 1 8 6 86 6 0 1 ,9 8 3 60 8 2 n 0 50 1 9 0 54 7 5 1 b 8 1 65 9 2 n 0 60 1 9 5 22 4 0 1 9 2 9 93 5 1 n 0 70 1 9 5 51 7 5 1 7 1 0 31 4 4 9 n 0 80 1 8 1 19 4 5 1 9 3 1 43 4 3 n 0 90 1 8 8 25 9 0 1 8 4 8 97 5 6 n 0 1 00 1 8 3 18 4 5 1 7 2 4 91 3 7 6 均值4 3 8 6 4 0 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若干参数分布族的参数估计 附录2 :利用e m 算法对对数正志分布进行参数估计的模拟结果 当样本数为2 0 0 0 时的模拟结果一 a盯 10 0 2 1 2 01 0 0 4 0 9 20 0 0 0 1 30 9 7 5 5 5 3- 0 0 0 2 6 01 0 0 6 0 8 40 0 1 5 2 01 0 4 1 1 5 50 0 0 2 2 00 9 7 5 5 0 60 0 0 6 5 010 1 7 2 5 70 0 0 0 9 00 9 9 7 9 5 80 0 1 4 5 00 9 9 4 4 3 9- 0 0 1 9 5 01 0 0 1 5 0 1 00 0 1 8 2 00 9 8 9 6 0 均值0 0 0 0 2 71 0 0 0 0 4 方差 0 0 0 0 1 80 0 0 0 3 8 当样本数为2 0 0 0 时的模拟结果二 口盯 11 0 0 1 6 01 3 8 5 8 2 21 0 1 6 0 01 3 9 6 7 l 30 9 7 3 5 01 4 0 6 9 8 41 0 4 0 9 01 4 0 0 3 9 50 9 6 6 3 01 4 0 6 9 1 61 0 0 2 4 01 4 0 8 7 9 71 0 2 7 9 01 4 0 6 3 8 81 0 3 2 2 01 3 9 2 5 2 91 0 2 9 4 01 4 0 6 3 4 1 00 9 6 5 7 01 4 1 8 8 7 均值1 0 0 5 9 91 4 0 2 9 7 方差0 0 0 0 8 10 0 0 0 0 9 2 4 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若干参数分布族的参数估计 当样本数为8 0 0 时的模拟结果 n = 汾吣 d盯 10 0 2 4 8 01 0 1 1 9 8 20 0 2 5 6 01 0 3 0 0 5 30 0 2 7 5 01 0 1 0 2 0 40 0 7 0 2 00 9 7 2 9 3 5- 0 0 3 6 1 01 0 4 9 4 8 60 0 0 7 9 01 0 4 3 4 6 70 0 4 1 l o1 0 1 4 8 9 80 0 0 4 3 01 0 3 8 2 2 90 0 0 0 9 31 0 1 9 2 6 1 00 0 0 2 0 01 0 4 2 3 1 均值0 0 1 1 8 61 0 2 3 2 8 方差 0 0 0 0 9 600 0 0 5 2 当样本数为3 0 0 时的模拟结果 一i ;扬 口仃 l- 0 0 0 2 9 01 0 6 4 2 8 20 0 3 6 7 01 0 1 7 5 0 30 0 1 2 0 01 0 4 6 6 6 4- 0 0 0 0 6 81 0 4 4 0 8 50 0 7 8 7 01 0 5 8 3 0 6- 0 0 0 2 3 01 0 0 3 2 9 70 0 0 7 6 01 0 7 4 7 1 8- 0 0 6 4 0 01 0 2 0 6 4 90 0 2 6 7 01 0 0 3 7 4 1 0- 0 0 7 2 1 01 0 2 4 5 5 均值0 0 1 2 2 31 0 3 5 7 8 方差0 0 0 1 8 l0 0 0 0 6 4 0 1 2 0 2 5 0 3 9 杨艺 基于分组数据的若干参数分布族的参数估计 附录3 :利用i v i e w 算法对戚布尔分布进行参数估计的模拟结果 图1 图1 8 图1 b 注:图1 中给出了取2 0 0 0 个随机数,参数真值为兄= 0 2 ,卢= 1 时一次模拟的迭代走势。 图1 a 表示参数a 的迭代走势,图1 b 表示参数的迭代走势。其中的横线表示参数真值。 图2 图2 a 图2 b 注:图2 中给出了取2 0 0 0 个随机数,参数真值为旯= 0 2 ,卢= 2 时一次模拟的迭代走势。 图2 a 表示参数a 的迭代走势,图2 b 表示参数,的迭代走势a 其中的横线表示参数真值。 0 1 2 0 2 5 0 3 9 杨艺 基于分组数据的若干参数分布旗的参数估计 图3 图3 f l , 图3 b 注:图3 中给出了取8 0 0 个随机数,参数真值为丑= 0 2 ,p = 2 时一次模拟的迭代走势。 图3 a 表示参数 的迭代走势,图3 b 表示参数p 的迭代走势。其中的横线表示参数真值。 图4 图4 a 图4 b 注:图4 中给出t i r3 0 0 个随机数,参数真值为 = 0 2 ,卢= 2 时一次模拟的迭代走势。 图4 a 表示参数五的迭代走势,图4 b 表示参数芦的迭代走势。其中的横线表示参数真值。 0 1 2 0 2 5 0 3 9 杨艺 基于分组数据的若干参数分布族的参数估计 附录4 :利用m e m 算法对对教正态分布进行毒l 数估计的模拟结果 图1 图1 a 图1 b 注:剀1 中给出了取2 0 0 0 个随机数,参数真值为口= 0 ,盯= 1 时一次模拟的迭代走势。 到1 a 表示参数口的迭代走势,图1 ,b 表示参数盯的迭代走势。其中的横线表示参数真值。 图2 图2 a 图2 b 注:图2 中给出了取2 0 0 0 个随机数,参数真值为c t :1 ,盯:j 时一次模拟的迭代走势。 图2 a 表示参数日的迭代走势,图2 b 表示参数盯的迭代走势。其中的横线表示参数真值。 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若干参数分布族的参数估计 图3 图3 a 图3 b 注:图3 中给出了取8 0 0 个随机数,参数真值为口= 0 ,盯= l 时一次模拟的迭代走势。 图3 a 表示参数a 的迭代走势,图3 b 表示参数盯的迭代走势。其中的横线表示参数真值。 图4 图4 a 图4 。b 注:图4 中给出了取3 0 0 个随机数,参数真值为日= 0 ,盯= l 时一次模拟的迭代走势。 图4 a 表示参数a 的迭代走势,图4 b 表示参数盯的迭代走势。其中的横线表示参数真值。 0 1 2 0 2 5 0 3 9 杨艺基于分组数据的若十参数分布族的参数估计 参考文献: ( 1 ) :c a r l og a e t a na n dj i a n f e n gy a o ( 2 0 0 3 ) ,an m l t i p l e i m p u t a t i o nm e t r o p o l i s v e r s i o n o f t h ee m a l g o r i t h m b i o m e t r i k av o i t t m e9 0 ,i s s u e3 ,s e p t e m b e r2 0 0 3 ,6 4 3 - 6 5 4 ( 2 ) :d a n i e l r a b i n o w i t z ,a n a s t a s i o st s i m i sa n dj o r g ea r a g o n ( 19 9 5 ) ,r e g r e s s i o n w i t h i n t e r v a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年农业产业集群农业产业园区产业园区农业科技园区土地管理与规划机制研究报告
- 装修后补合同(标准版)
- 保险代理人合同(标准版)
- 阜阳小型宴会厅施工方案
- 酒店招租招商方案范本
- 安注箱安装施工方案
- 道路护栏推销方案范本
- 屋面楼顶防水施工方案书
- 建筑物打磨整改施工方案
- 小儿推拿培训课程
- 2024江苏苏州市常熟农商银行网络金融部招聘4人笔试历年典型考题及考点剖析附带答案详解
- 钢结构主体验收评估报告
- 人教版历史与社会七下第八单元第三课《中华文明探源》教学设计
- 更换钢板施工方案
- 大学生职业规划大赛《机械电子工程专业》生涯发展展示
- 家政三方合同协议范本
- 预制双层不锈钢烟道及烟囱技术规程
- DB32T 5079-2025城镇供水水表安装及维护技术规程
- 行业法律法规解读
- 大学生就业心理调适与应对
- 中考数学复习计划的个性化调整
评论
0/150
提交评论