




已阅读5页,还剩49页未读, 继续免费阅读
(运筹学与控制论专业论文)基于区间数据的非参数bayes估计及其应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
_ l i i iii i ii i ii l llli ii il 17 4 13 2 0 2 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发 表或撰写过的研究成果。参与同一工作的其他同志对本研究所做的 任何贡献均已在论文中作了明确的说明并表示了谢意。 签名:虽煎蓥日期:塑乜厶! ! 垡 本论文使用授权说明 本人完全了解上海大学有关保留、使用学位论文的规定,即:学 校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校 可以公布论文的全部或部分内容。 ( 保密的论文在解密后应遵守此规定) 上海大学理学硕士学位论文 基于区问数据的非参数b a y e s 估计 及其应用 姓名周丽萍 导师何幼桦副教授 学科专业运筹学与控制论 上海大学理学院 二零一零年四月 一令一苓,牛四月 ad i s s e r t a t i o ns u b m i t t e dt os h a n g h a iu n i v e r s i t yf o rt h e d e g r e eo fm a s t e ri no p e r a t i o n a lr e s e a r c ha n dc y b e r n e t i c s n o n p a r a m e t r i cb a y e s i a ne s t i m a t i o nb a s e do ni n t e r v a l c e n s o r e dd a t aa n di t sa p p l i c a t i o n m d c a n d i d a t e :z h o ul i p i n g s u a s s o c i a t ep r o f h ey o u h u a b u p e r v l s o r :a s s o c i a t ef r o l l i eo u h u a m a j o r :o p e r a t i o n a lr e s e a r c ha n dc y b e r n e t i c s d e p t m a t h e m a t i c s ,s h a n g h a iu n i v e r s i t y a p r i l ,2 0 1 0 摘要 本文基于d i r i c h l e t 过程为先验分布,给出了区间数据下总体分布非参 数b a y e s 估计的表达式讨论了d i r i c h l e t 过程先验分布中超参数q 的两种确定 方法最后给出本文所构造的方法在加速寿命试验中的应用实例 全文共分为四章: 第一章主要介绍区间数据下非参数b a y e s 估计的发展及研究的意义,并说明 了本文的创新之处 第二章基于d i r i c h l e t 过程为先验分布,给出了区间数据下总体分布非参 数b a y e s 估计的表达式通过对常用分布的随机模拟,阐述了几类先验分布对估 计效果的影响;最后与参数极大似然法比较,本文所构造的方法与之具有相近的 估计效果部分内容已录用于上海大学学报( 自然科学版) 第三章主要研究超参数q 的两种确定方法:一是极小化积分均方误 差( i m s e ) 二是含罚项的缺一交叉验证法 第四章主要是给出本文所构造的方法在加速寿命试验中的应用 关键词:d i r i c h l e t 过程;区间数据;b a y e s 估计;非参数估计;缺一交叉验证;极小 化积分均方误差;超参数 a b s t r a c t t h i sp a p e rf o c u s e so nn o n p a r a m e t r i cb a y e s i a ne s t i m a t i o nw i t hi n t e r v a lc e n - s o r e dd a t a b a s e do nt h ed i r i c h l e tp r o c e s sa sap r i o rd i s t r i b u t i o n ,t h ep a p e rg i v e s t h en o n p a r a m e t r i cb a y e s i a ne s t i m a t i o no fp o p u l a t i o nd i s t r i b u t i o n ,a n dd e s c r i b e s t w od e t e r m i n i n gm e t h o d sf o rt h eh y p e r - p a r a m e t e rno fd i r i c h l e tp r o c e s s o u r m e t h o di sa p p l i e di nt h ea c c e l e r a t e dl i f et e s ta tl a s t t h i sp a p e rc o n s i s t so ft h ef o l l o w i n gp a r t s :i nc h a p t e r1 ,w er e c a l lb r i e f l yt h e d e v e l o p m e n ta n dt h eh i s t o r yo fr e l a t e dw o r ko fn o n p a r a m e t r i cb a y e s i a ne s t i m a - t i o nw i t hi n t e r v a lc e n s o r e dd a t a i na d d i t i o n ,w ei l l u s t r a t et h ei n n o v a t i o n so ft h e p 印e r i nc h a p t e r2 ,w eg i v et h en o n p a r a m e t r i cb a y e s i a ne s t i m a t i o no fp o p u l a t i o n d i s t r i b u t i o nw i t hi n t e r v a lc e n s o r e dd a t ab a s e do nd i r i c h l e tp r o c e s sa sap r i o r d i s t r i b u t i o n b yr a n d o ms i m u l a t i o nf o rs o m ed i s t r i b u t i o n s ,w ed i s c u s st h ee f f e c t s o fs o m ep r i o rd i s t r i b u t i o n so ne s t i m a t e dr e s u l t s f i n a l l y , w ec o m p a r eo u rm e t h o d w i t hp a r a m e t r i cm a x i m u ml i k e l i h o o dm e t h o d ,i ti ss h o w nt h a tt h e yh a v es i m i l a r e s t i m a t i o ne f f e c t s i ti sp a r t l yp r o m i s e db yj o u r n a lo s h a n g h a iu n i v e r s i t y ( n a t r u a ls c i e n c ee d i t i o n ) i nc h a p t e r3 ,w ee x p l o r et w od e t e r m i n i n gm e t h o d sf o rt h eh y p e r - p a r a m e t e r qo fd i r i c h l e tp r o c e s s o n ei si n t e g r a lm e a ns q u a r ee r r o r ( i m s e ) m e t h o d ,t h e o t h e ri sl e a v e - o n e - o u tc r o s s - v a l i d a t i o nw i t hp e n a l t yf u n c t i o n i nc h a p t e r4 ,w eg i v et h ea p p l i c a t i o ne x a m p l ei nt h ea c c e l e r a t e dl i f et e s tb y u s i n gt h em e t h o dc o n s t r u c t e di nt h ep a p e r k e y w o r d s :d i r i c h l e tp r o c e s s ;i n t e r v a lc e n s o r e dd a t a ;b a y e s i a ne s t i m a t i o n ;n o n - p a r a m e t r i ce s t i m a t i o n ;l e a v e - o n e - o u tc r o s s - v a l i d a t i o n ;i n t e g r a lm e a ns q u a r ee r - r o r ;h y p e r - p a r a m e t e r 目录 1 1 区间数据的研究背景 1 2 b a y e s 方法及其应用 1 2 1 b a y e s 方法简介 1 2 2 b a y e s 方法的应用 1 3 问题的提出及意义 1 4 论文的结构 第二章基于区间数据的b a y e s 估计 2 1 d i r i c h l e t 过程 2 1 1 d i r i c h l e t 分布 2 1 2 d i r i c h l e t 过程 2 2 区间数据的b a y e s 估计 2 2 1 有限空间上基于区问数据的概率分布估计 2 2 2 区问数据的总体函数估计 2 3 数值模拟 2 3 1 对常见分布的数值模拟 2 3 2 与参数方法比较。 i 1 上1 j 1j,上1上1上 i 一 一 l l 2 2 3 4 5 7 7 7 8 d d 屉7 7 9 目录 第三章 3 1 3 2 第四章 4 1 4 2 超参数q 的确定 极小化积分均方误差( i m s e ) 3 1 1 数值模拟 含罚项的缺一交叉验证法 加速寿命试验中的应用 加速寿命试验研究背景 计算实例 附录a 计算程序 a 1 数据x 转化为区间数据计算程序 a 2 区间数据的非参数b a y e s 分布估计计算程序。 a 3 区间数据的参数极大似然估计计算程序 a 4 均值m e a n ( d ) 与标准差s t d ( d ) 计算程序 a 5 极小化积分均方误差选取超参数q 计算程序 a 6 缺一交叉验证法确定超参数q 计算程序 参考文献 发表文章目录 致谢 3 5 6 8 0 o 1 4 4 5 5 6 7 9 1 4 5 z 2 2 2 翻3 3 3 3 3 3 3 3 4 4 垂 表格衣佾 2 1 1 万次模拟后各估计与真实函数之间的m e a n ( d ) ( s t d ( d ) ) 1 9 2 2 威布尔( 3 ,2 ) 分布的两种估计结果的m e a n ( d ) 和s t d ( d ) 2 2 2 3 f ( 1 0 ,5 ) 分布的两种估计结果的m e a n ( d ) 和s t d ( d ) 2 2 2 4 对数正态( o 5 ,0 5 ) 分布的两种估计结果的m e a n ( d ) 和s t d ( d ) 。 2 2 2 5 伽玛( 1 ,1 ) 分布的两种估计结果的m e a n ( d ) 和s t d ( d ) 2 2 4 1 试验原始观察数据3 1 4 2 整理后的区间数据3 2 插图 2 i 威布尔( 2 ,3 ) 分布及其估计1 7 2 2 威布尔( 2 ,2 ) 分布及其估计1 7 2 3 伽玛( 2 ,1 ) 分布及其估计1 8 2 4 伽玛( 1 5 ,1 ) 分布及其估计1 8 2 5 正态( 2 ,2 ) 分布及其估计1 8 2 6 正态( 1 ,2 ) 分布及其估计1 8 2 7 指数( 2 ) 分布及其估计1 8 2 8 指数( 1 5 ) 分布及其估计1 8 2 9 威布尔( 3 ,2 ) 分布的两种估计比较。2 0 2 1 0f ( 1 0 ,5 ) 分布的两种估计比较2 0 2 1 1 对数正态( 0 5 ,0 5 ) 分布的两种估计比较2 1 2 1 2 伽玛( 1 ,1 ) 分布的两种估计比较2 1 3 1 威布尔( 1 ,1 ) 分布及其估计2 7 3 2 f ( 6 ,5 ) 分布及其估计2 8 4 1 非参数b a y e s 估计与参数极大似然估计3 3 第一章绪论 1 1区间数据的研究背景 在生存分析和可靠性试验研究中,常常由于客观条件的限制无法得到失效 时间的准确观测值,只能观测到失效时间所处的区间,这类数据在统计学中称为 区间截断数据,简称区间数据 例1 1 可靠性分析中的加速寿命试验研究中,通过对所需测试的元器件施加比 正常条件下更高的应力水平,可以在较短的时间内获得元器件寿命试验数据,最 终来获得这些元器件在正常条件下的寿命分布但实际试验中,所需测试的元器 件的寿命( 即失效时刻) 往往是无法直接观测到的,只能通过实验观测到该元器 件在某个时间点前后失效 例1 2 在生物化验和药物的毒性研究中,为了知道某种药物的最高用剂量,常 通过实验来进行测试,在实验过程中,只有通过实验对象对药物的反应来判断剂 量是否已经超过用表示第 个实验对象可承受的最高剂量,其中m 的取值是无 法准确观察到的假如在试验过程中让每个实验对象经历两个实验阶段,首先 采用一个较低的剂量阢,经过一段时间后如果没有出现过量反应,再将剂量增加 到k ,如果在实验刚开始,用药剂量为阢时,实验对象已有多量反应出现,那么 其实际能承受的最高剂量k 在( 0 ,阢) 区间内,这时得到的观测数据被称为左截断 区间数据;如果采用剂量阢的那段时间没有出现过量反应出现,而当剂量增加 为k 后出现了过量反应,那么k 在( 阢,k ) 区间内;如果在用药剂量达到k 时实验 对象仍未出现不良反应,那么m 在( k ,0 0 ) 区间内,这时得到的观测数据被称为右 截断区间数据总的来说,这样一些观测数据,在统计学上被称为区间数据 区间数据在生存分析和可靠性研究中有着广泛的应用背景,实际统计分析 中的区间数据处理主要有以下两种类型 类型1 设 互) 是一列独立随机变量( 也可以是常数) 序列,它是可以被观察到的 令 瓯= 。托正,= 三:耋薹至荔: 第一章绪论2 我们虽然不能观察到五,但却能观察到( 正,盈) , = 1 ,2 ,扎在实践中, 正) 往 往是实验时刻,实验到正为止我们常常假定 正) 是同分布的 类型2 设 ( 阢,) ) 是一列独立同分布随机向量序列,且满足p ( o 阢) = 1 我们将观察到五是小于职,在( 阢,k ) 之间,还是大于令五= 厶墨s 阢 ,m = 丘魄 噩k 为相应集合的示性函数,则我们获得的观察值为( 阢,以,m ) ,i = 1 ,2 ,礼 区间数据的研究可以追溯到很久以前,六十年代的按时间分组数据研 究可视为区间数据的一种特殊情况生物医学的数据处理中常按时间顺 利t o 亡l 0 定义2 2 x 称为服从参数为a ,6 的伽玛分布,如果其分布密度为: m ,= k 一蒜 记为x r ( a ,6 ) ,其中伽玛函数r ( o ) = ft 口- 1 e d t , o 0 定义2 3 设m ,k ,是相互独立的随机变量,k r ( ,1 ) ,( o ) ,若 研= l ,歹= 1 ,2 ,m 研2 产,j 2 l ,m k 则称p = 1 ,) 称为服从参数为a = ( q 1 ,) ,( 0 ) 约d i r i c h l e t 分 布,且其概率密度函数为: 丌( p ) = 记为p d i r ( a ) | m ri j - - 1 m 兀r ( j = l p 宇1 1 西一1 , 易20 ,p l + + = 1 第二章基于区间数据的b a y e s 估计 8 令口= ,则d i r i c h l e t 分布的各阶矩形式为: j = l 1 ep i ) = q i q ,i = 1 ,m ; 2 e 慨2 ) = c q ( q i + 1 ) a ( c e + 1 ) ,i = 1 ,m ; 3 e 慨殇) = q t q + 1 ) ,i j ,i ,j = 1 ,m ; 4 v a t 慨) = a i ( a 一口i ) q 2 ( q + 1 ) , i = l ,m ; 5 c o y 慨,殇) = - a i a j l a 2 + 1 ) ,i ,j = 1 ,m 2 1 2d i r i c h l e t 过程 定义2 4 设彤为一样本空间,是。彩的子集构成的盯代数,q 0 ,p o 为( 万,) 上 的有限非零测度如果对影的任意可测分割a l ,a m ,p = ( p ( a 1 ) ,p ( ) ) 服从参数为q = ( a p o ( a 1 ) ,q 岛( ) ) 的d i r i c h l e t 分布,则我们称p 是( 万,d ) t - _ 的参数为q ,基测度为r 的d i r i c h l e t 过程【1 9 】一f 2 2 】,记为p d p ( a ,p o ) 由定义我们可以看出,d i r i c h l e t 过程既是一随机过程,又描述了随机概率测 度的分布 下面我们将分两部分引入基于d i r i c h l e t 先验分布的有限空间概率分布估 计( 这些都是已有的结果) 首先介绍单个样本数据 x = 歹) ,j = 1 ,2 ,他下的 概率分布估计问题,由此推广至多个样本数据,在第二部分中介绍多个样本数 据 x = 歹1 ,k = 九) 下的概率分布估计问题 一、当样本数据为 x = 歹】,歹= l ,2 ,n 时: 对于有限空间上的概率分布p x = j l p = p j ( j = 1 ,2 ,n ) ,若p e g 先验 分布为d i r ( a p o ) ,记= 嗡o = q p o x = j ,e = o l ,其中已知: p x = j l p = 乃, m r ( ) p p ) =毒苎一硝- 一赡;, f ir ( ) j = l m r ( a 七+ 1 ) 生三! r ( + 1 ) 兀f ( a k ) 詹j f ( a + 1 1 衍1 巧a j - 。1 。1 矽巧a + j + 。r 1 船。 := 一 r ( a p j o + 1 ) 1 - ir ( a p k o ) 詹j 硝1 一殇o r j _ 。r 1 妒掰1 。1 船 当样本数据为 x - = 歹l ,k = j n ) 时,同理有: p x 1 = j l , p x 1 = j l , ,= a i p = p i l p j 2 功n , m f ( ) ,k = j n ,p ) = j = l m i - i1 1 ( ) j = l p 墨:小,:a ) :毒盟 1 - ir ( 哟) j = l 于是p 的后验分布为 p p x a = j l ,= a ) = 硝1 砩“p j l 功2 功n , 西1 _ 1 嫦1 蠓”螺1 - 1 妇 r ( q )r ( 口1 ) f ( o g j l + 1 ) f ( a j n + 1 ) r ( a m ) r ( q + n ) 兀f ( c t p k o + 1 ) 兀 k e b xk g b x r ( q + n ) r ( a p k o ) n 结 k e b x n k c b x 毋 0 lm = 厂m船* 一已 p 哟 兀 m n 触 第二章基于区间数据的b a y e s 估计 1 0 其中取= d 1 ,a 则在均方误差准则下,p 的b a 渺估计为【17 】【2 l 】: 岛= e 锄i 墨- - j 1 9 , j 弱= a ) = 熹细+ - _ 喜瓯 这里如为 x = 歹) 的示性函数( 推广到连续型情况下国即为d i r a c 乒函数【1 7 】) 2 2 区间数据的b a y e s 估计 下面我们将讨论基于样本数据为区间数据下的非参数b a y e s 估计问题,总共 分三小节 2 2 1有限空间上基于区间数据的概率分布估计 对于概率分布p x = j l p = 功u = l ,m ) ,p 的先验分布是d p ( q ,p o ) , 记( j l j 【a ,h i = 歹t ,靠 ,对于x f a ,6 】有: p ( x k ,b l p = p j , p ( x 【口,6 】,p ) = p ( x 【a ,6 】) = p p l x 【a ,h i = 于是,当歹g 【a ,6 时 j e a ,6 】 f ( q ) m 1 - ir ( a p # o ) j - - i p q l _ 1 砩“_ 1乃, j e a ,6 】 旦 厂y p a 。l - 1 y m a m q 乃d p 兀r ( a p # o ) ,l p 2 。_ 棚 o j 蚴。0 l = 1 七 = 如o , 1 = 1 r ( q ) m七 丌r ( a p j o ) 扔1 0 j = l 1 - - - - 1 e ( p j i x 【。,h i ) :了斗 nr ( 嗡o ) p j , o j = l 1 = 1 七 西1 龆。如 1 = l m 岛 嗡。兀r ( 嗡o ) 鼢0 j = l 1 = 1 r ( o + 2 ) q p j o 。i 万 e 慨i x 【a ,6 】) r ( q ) mk nr ( a p j o ) 勘o j = l l = l m 兀r ( a p j o ) j = l ( 卅乃。c q 融。卜1 ,? 一蠢q 。叫如;。) 脚佳。+ 1 ) f 一 ( q + 1 ) 乃。0 = 器1 卜 q + l r ( q + 2 ) 七 耽。0 1 - - - - 1 所以,在已知x a ,6 】的情况下,p 的b a 沪估计为: 殇= i 备p o x = 歹) + 而1 r x = j l x 陋,6 】- 一般地,当样本数据为 咒最,i = 1 ,佗) 时,p 的b a y e s 估计通过下面 的定理给出 定理2 1 已知概率分布p x = j f i p ) = 胁= 1 ,m ) ,p 的先验分布 d p ( o e ,p o ) 当样本数据为 五b i ,i = 1 ,礼) 时,p 的j e 7 0 y e 始计为: 殇= 而o lr 仁= j ) + 而1 其中 鼠) 满足条件? 鼠岛= d ,( i 歹) 为证明上述定理,首先构造一个引理 p o ( x = j l x 鼠) 扛= 1 ( 2 1 ) 引理2 2 对于实数q 1 ,q 詹,若记磁7 ) = ( q t + 1 ) ( 啦+ r 一1 ) ,q = q 1 + + q 七,则成立 7 11 仇! r 11 ! p i l j 雎) = q ( q + 1 ) ( q + n 一1 ) , q p i r 砖t ) = 礼0 1 j ( a + 1 ) ( o + 礼一1 ) ( 2 2 ) ( 2 3 ) 葛 篡 e 美 第二章 基于区间数据的b a y e s 估计1 2 证明由于 厦r ) _ a 斛1 ) 一( a i + r - - i ) = 帮, p 宇l + r l - 1 p k 机4 咖= 堕掣 所以对于( 2 2 ) 式有: r i 2 0 冬lr 一n t 2 0 是ir = n r i 2 0 笔1r = n r l ! 住! 硝砖 r ( q 1 + r 1 ) r ( 口七+ r k ) f ( a 1 ) f ( a k )7 11 7 七! r ( q + n ) r ( q 1 ) f ( a k ) r 11 他! p 1 ,p 2 p o 冬1 p = 1 f ( q + 佗) f ( a 1 ) r ( a k ) r ( q + n ) r ( q 1 ) r ( q 七) r ( q + n ) p l , p 2 , 坠 0 l 硝1 竹l 磙+ 住_ 1 d p 硝1 押1 醒计h - 1 d p 白1 + + p 知) n p ? 1 1 p :一1d _ p 硝- r l d p p l ,p 2 ,p 知 o 整lp = 1 f ( a 1 ) f ( a k ) f ( a 1 ) f ( a k ) f ( a l + + q 七) r ( q + n ) r ( a ) a ( a + 1 ) ( o t + n 一1 ) 如。 法建 知= 厂m 第二章基于区间数据的b a y e s 估计 1 3 同理对于( 2 3 ) 式 r i 0 k l q = n r t 0 lr ;n r t o e 笔lr = n r 11 他! 吃所r l j 咖 几! 吩r ( a l + 7 1 ) r ( a k + r k ) r 11 !f ( q 1 ) f ( a k ) 佗! 巧r ( q + 几) r 11 r k ! r ( a 1 ) r ( a k ) 揣f(al r ( a k1) ) , 整1 巩= 1 p l ,p 2 , 整 o l 硝1 + n 一1 p :。+ 一1 d p 焘衍i + r i - - i 矿 1 如 = 揣几p 芋t - - 1 a j _ 一矿粥1 。1 矿1 d p l p t = l 者佗掣j=lr(akr ( q 1 ) ) ”r ( q + 1 ) = n a j ( a + 1 ) ( o t + 佗一1 ) 下面我们将运用引理2 2 对定理2 1 进行证明 口 证明假设观测区间集 最,i = 1 ,佗) ,中互不相同的区间为c l ,g , # - i g c t = j i l ,五k ,h 1 + + h k = m hsm ,又设样本当中有7 1 i 个落 入g 中1 + + n k = 扎) ,于是: p x l b 1 ,k b n i p = ( ,巧丫 c i = 1 j 0 r i l + + i h i2 n t 揣r一3ilr蛾,i l ! n k ! ,m t 知= 一一 一篡 谢七 第二章基于区间数据的b a y e s 估计 1 4 p 墨b 1 i 一,k 玩,p ) 尤1 p 静_ 1 p x i b i ,弱风) o c p o 1 i - - i ”u o r i l + + i h t 。“ 衍1 船一1 i - - - - 1 j o r i l + + 7 i h i t i f f i n i m nr ( a j ) 七 j = 1 r ( q + n ) r lr ( ) 由( 2 2 ) 式。币j = l 葡 羔味一磁,r n 11 i h i ! f j n ,挑 志力r i 。l 哦如 霜_ 面- 乏印 1 - - - - 1 r t 0 i i + + r t 2 i 磁例 g ( a p o x g ) + 1 ) ( a p o 【x q q - n i 一1 ) 上式中。+ + = q 锄n 0 + + 纵。;。) = a p o x g ) p p l x i b i ,玩) 七 r ( q + n ) p ? 1 1 p 静一1 兀 1 - - - - 1 r i j 0 i l + + 7 i h i = n i 意蠕巧t i h i m 兀f ( ) j = l 七 nq r x i - - - - 1 g ( a p o _ ( x q + 1 ) ( q p o x g ) q - 啦一1 ) 下面计算岛。= e ( 乃。i x l b 1 ,风) 当歹g 仁c 1u ug 时, p j 9 。 r ( q + 礼) nr ( ) nq 岛 x j = l i = 1 ,兀r ( 哟) 七 丽r 1 1 q r r ( a + n + ) 1 叭= i q p j 9 0 q + n g ( q r x g ) + 1 ) ( a p o x g ) + 啦一1 ) c , ( a p o x g 】+ 1 ) ( q p o x g ) + 礼i 一1 ) m = 厂漓 跫七 x ,j i 昂 q 知僦 x 当矗= 死a ( 1 z 忌) 时, r ( a + n ) p i g2 焉1 一 i ir ( ) 兀a p o x a ) ( q 娲【x g 卜+ - 1 ) ( a p o x q ) + 啦一1 ) j f f i l i = 1 m nr ( ) 知 蔫b 而 r ( q + n + 1 ) 世急 t l r i l + ”+ 。r i b 一 r l j o r l l + + i h i 掌n l r i l ! n k ! 赡3 ( n h 暑鼢u f l j ( r j t o - - 。( 地撬- ( r i 穿a + 加l h i r ( q + n ) a p o x g ) ( q r x g ) + 1 ) ( c , p o x g 卜卜啦一1 ) 孑嘲! r i 。h j + 彝三慕秘俺j l r i l - i - ”+ 。r i b 4 志,绣:谚i嚣tr r ,1 :1 n l ! i b i ! 加巧n h l 由( 2 2 ) ( 2 3 ) 有: r f a + mk 兀r ( q j ) n j = l i = 1q r x g ) ( q 昂【x g 卜卜1 ) ( q 岛 x q ) - + - n i 1 ) 揣3=1 1 - j r ( q + n + ) i j 口 e , p o ( x g ) ( q r x g 卜+ - 1 ) ( o , p o ( x g ) + 啦一1 ) + i iq 蜀1 ( x g ) ( q 岛( x t = l t l m ,( a p o x g ) 卜1 ) ( q r x a p j g o 上竺竺堕旦 o e + n 。( q + n ) q p o x q ) 詈鬯+ = p o ( x :力l x a ) q + nq 十几 c :) + 1 ) ( 口p o ( x g ) + 啦一1 ) a ,+ m 叫) ,i 掣+ 圭g p o x :如i x 鼠) q + 7 ,q + 礼 。 l :2 1 七n :豆 、l ,h m n 触 m 神蒜 1、j,=:、 0 0 神 = 臻 汹 2 2 2区间数据的总体函数估计 现考虑总体x 的分布函数f 0 ) 的非参数b a y e s 估计,我们有下述定理 定理2 3 设f ( z ) 的先验分布为d p ( q , 1 ,2 ,n 】- 满足条件:b 岛= 0 ,“ f ( z ) 的b a 可e 姑计为 口 p o ) ,f o ( x ) = p o xsz 当样本 晟,i = j ) 则在极小化均方误差准则下, p ( x r 十q - - t n - f o ( 卅熹喜眦 ( 2 4 ) 证明假设观测区间集 鼠) 中互不相同的区间为g = ( 啦,嘲,i = 1 ,七, 且k a i + 1 又设样本当中有啦个落入g 中,啦+ + n 七= n 这里不妨假 设o l :一,玩= 坼l 以及6 七= + 其它情形证明类似 设a z a + 1 ,构造概率分布: i = 1 ,h 一1 i = h i = h + 1 i = h + 2 ,k + 1 贝j j f ( x ) = p 1 + + m 由定理2 1 ,得每一伽i 的b a y e s 估计: a = i r x g ) + j p o x g i g ) = 熹( f 0 ( 。) 一f o ( 口t ) ) + 而n i ,i = ”一,h l a = i 笔昂 x ( 。 ,z 】) + i r x ( 。 ,z 】| 瓯) = 熹( 昂( z ) 一f o ( n ) ) + 熹晶( z g ) 注意到昂( z i g ) ;1 ( i = 1 ,h 一1 ) ,f 0 ( z l g ) = o = h + 1 ,七) 于 是f ) b a y e s 的估计为 肌) = 善h 武= 赤脚) + 土c z + n 喜眦瞰 口 、, ) 、j 动o ,li i 乳,及k d 州0 一 吣一一吣砧,f、l,ki、 f f f = f = = d = d 心 卜一“吼 毗 z 一 鲰9 鲰艇 x x x 0 3 参数为( 2 ,1 ) 的伽玛分布 f ( x ) = 南f t e 。出,z 0 4 参数为( 1 5 ,1 ) 的伽玛分布 f ( z ) = 司面后佩一2 出, z 0 5 参数为( 2 ,2 ) 的正态分布 f 0 ) = 赤己e 一与竽出, 6 参数为( 1 ,2 ) 的正态分布 f ( z ) = 刁1 翥己e 一掣出, 7 参数为2 的指数分布 f ( x ) = 1 一e 一詈, z 0 8 参数为1 5 的指数分布f ( x ) = 1 一e 一警,z 0 各产生5 0 个随机数据,并将其转化为观测区间( 一( d o ,1 ) ,【1 ,2 1 ,【2 ,3 1 ,【3 ,4 】及( 4 ,。) 中 的区间数据然后分别取均匀分布u ( o ,1 0 ) ,正态分布( 0 ,1 ) 以及指数分 布e ( 1 ) 作为先验分布,以及取o z = 2 ,得估计结果如下: 图2 1 :威布尔( 2 ,3 ) 分布及其估计 图2 2 :威布尔( 2 ,2 ) 分布及其估计 第二章基于区间数据的b a y e s 估计 1 8 图2 3 :伽玛( 2 ,1 ) 分布及其估计 图2 5 :正态( 2 ,2 ) 分布及其估计 图2 7 :指数( 2 ) 分布及其估计 图2 4 :伽玛( 1 5 ,1 ) 分布及其估计 图2 6 :正态( 1 ,2 ) 分布及其估计 图中曲线r 代表对应的真实分布,曲线a 代表取( 0 ,1 ) 作为先验分布所对应 的估计,曲线b 代表取u ( o ,1 0 ) 作为先验分布所对应的估计,曲线c 则代表取e ( 1 ) 作 第二章基于区间数据的b a y e s 估计 1 9 为先验分布所对应的估计从图2 1 图2 8 可以看出本文所构造的方法具有一定 的准确性为了更清楚地展示其准确性,分别将上述随机模拟过程重复i 0 0 0 0 次, 令d = s u p 霉【o ,5 】i f ( x ) 一户( z ) 1 下表给出了在区间【o ,5 】上取不同先验分布得到的 估计函数与真实函数之间的最大绝对偏差的均值m e a n ( d ) 和标准差s t d ( d ) 表2 1 :l 万次模拟后各估计与其买函数之t 日j 的m e a n ( d ) ( s t d ( d ) 1 均匀先验正态先验指数先验 威布尔分布( 2 ,3 )0 0 9 6 2 ( 0 0 3 0 7 )0 1 4 9 4 ( 0 0 4 1 5 10 1 2 0 0 ( 0 0 3 7 8 ) 威布尔分布( 2 ,2 )0 0 8 5 2 ( 0 0 3 1 2 10 1 6 1 2 ( o 0 3 7 5 1o 1 0 1 7 ( o 0 3 2 3 1 伽玛分布( 2 ,1 )0 0 8 9 2 ( 0 0 3 3 3 )0 1 8 2 1 ( o 0 3 8 9 10 1 0 1 3 ( 0 0 3 1 8 ) 伽玛分布( 1 5 ,1 ) 0 0 8 3 0 ( 0 0 3 6 6 )0 2 6 6 4 ( 0 0 4 0 7 )o 0 9 5 2 ( 0 0 2 9 5 ) 正态分布( 2 ,2 )o 1 6 0 2 ( 0 0 0 7 8 1o 1 1 2 6 ( 0 0 3 1 2 10 1 5 9 9 ( 0 0 0 7 5 ) 正态分布( 1 ,2 ) 0 3 1 1 1 ( 0 0 1 1 2 )0 1 9 8 1 ( o 0 5 9 3 10 3 0 9 6 ( 0 0 0 6 9 ) 指数分布( 2 )0 0 8 6 5 ( 0 0 3 6 0 10 2 4 4 2 ( 0 0 3 8 7 10 0 8 2 8 ( 0 0 3 5 2 ) 指数分布( 1 5 )0 0 8 4 4 ( 0 0 3 5 3 )0 2 9 7 3 ( 0 0 4 0 2 )o 0 7 6 1 ( 0 0 3 5 2 1 上面几个图给出了几个常用分布取不同先验分布所对应的估计表2 1 则进 一步展示了不同先验分布对估计效果的影响,相比正态分布n ( 0 ,1 ) ,选取均匀分 布u ( 0 ,1 0 ) 和指数分布e ( 1 ) 作为先验分布得到的估计效果要好些特别是对于选 取均匀分布作为先验分布,只要分布范围选取得当,将得到更好的估计效果,可 参见下面图2 9 图2 1 2 2 3 2与参数方法比较 下面我们对区间数据下的非参数b a y e s 估计和参数极大似然估计进行比较 分别取被估计分布是 1 参数为( 3 ,2 ) 的威布尔分布 2 参数为( 1 0 ,5 ) 的f 分布 3 参数为( 0 5 ,0 5 ) 的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 咖啡因与氨茶碱中毒的临床护理
- 公民健康教育66条
- 湖南长沙一中2025届高三月考(八)-化学答案
- 2025年小班第一学期班务总结模版
- 伏格特-小柳-原田综合征的临床护理
- 脑蛛网膜炎的临床护理
- 游戏客服工作总结模版
- 狼性管理模式之人力资源培训讲义
- 心衰超滤护理规范与实施要点
- 妊娠合并传染病护理查房
- 夏季高温施工安全防暑降温
- 2025届天津杨村一中高三-化学试卷
- TCHSA 079-2024 唇腭裂患者替牙期错牙合畸形矫治指南
- 北师大版小学数学四年级下册教案全册含有教学反思
- GB/T 45159.1-2024机械振动与冲击黏弹性材料动态力学性能的表征第1部分:原理和指南
- 有效问题解决培训
- 第八章《运动和力》达标测试卷(含答案)2024-2025学年度人教版物理八年级下册
- 跟着音乐游中国知到智慧树章节测试课后答案2024年秋广州大学
- 产品质量管控方案
- 《疣的诊断与治疗》课件
- 2025年春新北师大版数学七年级下册课件 ☆问题解决策略:转化
评论
0/150
提交评论