




已阅读5页,还剩53页未读, 继续免费阅读
(统计学专业论文)相依情形下的经验Bayes统计分析及应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西北 :业大学硕十学位论文 摘要 本文在样本相依情形下,将b a y c s 、经验b a y e s 理论应用于正指数族参数、刻度 指数族参数及单参数总体参数的统计分析研究,并对相依部件串、并联系统的可 靠性指标进行了b a y e s 分析。主要内容包括以下几个方面: 1 运用同分布p a 样本密度函数的核估计,构造了一类正指数分布族参数的经 验b a v e s 检验,讨论了它的渐近最优性,并建立其收敛速度。在适当的条件下,证 明了该收敛速度可以任意接近c j , 2 在非对称l i n e x 损失函数下,讨论了一类刻度指数族参数的经验b a y e s 估计 ( p a 样本情形) 问题,证明了e b 估计的渐近最优性,并给出了收敛速度的阶。 3 在肌相依样本情形下,用经验b a y e s 方法对单参数总体中的未知参数进行研 究,得到其相应的线性经验b a y e s 估计,并给出了渐近最优的收敛速度d | 圹牡c ) 4 对具有不同失效率的n 个相依部件组成的串、并联系统进行研究,在建立相 应失效模型的同时,给出系统分布参数、可靠度及失效率等可靠性指标的b a y e s 估 计。 关键词: 损失函数:b a y e s 估计; 经验b a y e s 估计;经验b a y e s 检验; 渐近最优性;收敛速度; 相依部件;系统可靠性指标 西j 匕1 业人学硕十学何论文 a b s t r a c t i n t h i sp 印e r ,b a y e s i a nt h e o 巧a 1 1 de m p i r i c a lb a y e s i a i lm e o r ya r eu s e dt os t u d yt l l e p a r 锄e t e re s t i m a t i o no ft h ed i s t r i b u t i o nf a m i l i e s u s i n ge m p i c a lb a y e sm e t h o d s ,t l l e p a r a m e t e r sf o rp o s i t i v ee x p e n t ;a 1f a m i i ya n ds c a l ee x p o n e n t i a if a m i l ya r ed i s c u s s e dj n 出ec a s eo fp as a m p l e s m o r e o v e lo n e p a r a m e t e rd j s 一b u f i o n 蠡m i l yp a r a m e t e ri s d i s c u s s e d 鹪t h es a m p l e sa r emd e p e n d e n t i nt h ee n d ,m er c l i a b i l i t yp e r f o m l a l l c e sf o r s e r i e sa n dp 啪l l e ls y s t e m sw i t hn d e p e n d e n tc o m p o n e m sa r es t u d i e d 1 b yu s i n gt h ek e m e l - t y p ed e n s i t ye s t i m a t i o ni nt h ec a s eo fi d e n t i c a l l yd j s t r i b u t e d a n dp o s i t i v e l ya s s o c i a t e d ( p a ) s a m p l e s ,t h ee m p 矾c a lb a y e s ( e b ) t e s tr u l e sf o rt h e p a m m e t e ro fap o s i t i v e l ye x p o n e n t i a lf h m i l y a r ec o n s t r u c t e da n dt h ea s y m p t o t i c o p t i m a | i t yi so b t a i n e d i ti ss h o w nt h a tt h ec o n v e r g e n c er a t e so ft h ep r o p o s e de bt e s t n i l e sc a r ia r b i t r a l 1 yc l o s et o ( ,u n d e rc e n a i nc o n d i t i o n 2 f o rt h es c a l e e x p o n e n t i a i f h m i l y , t h e e m p i r i c a lb a y e se s t i m a t i o no ft h e p a r a m e t e ra r ee x h i b i t e du n d e ra s y m m e t r i cl i n e x 】o s sf u n c t i o n c o m b i n i n gp as a m p l e s , t h ee be s t i m a t o r sa r ed j s c u s s e da n dt h er a t e so fc o n v e 唱e n c ea r ea l s oo b t a i n e d 3 b a s e do n埘 d e p e n d e n ts a m p l e s ,t h el i n e a re be s “m a t i o n0 ft h ep a r a m e t e ri s d i s c u s s e d a l s ot h ea s y m p t o t i c a l l yo p t i m a lr a t e so f c o n v e r g e n c ec 广。c ) i so b t a i n e d 4 f o rt h er e l i a b i l i t yp a r a m e t e r si nnn o n i n d e p e n d e ms e r i e sa n dp a r a l 】e ls y s t e m s 、v i t hd e p e n d e n tt i m ef a i l u r er a t e s ,t h ec o n i e s p o n d i n gf a 订u r em o d e i sa r ec o n s t r u c t e d m e a n w h i l e ,、v eg i v et h eb a y e s j a ne s t i m a t i o no fr e l i a b i j i t yp e r f o m l a n c e ss u c ha ss y s t e m p a m m e t e r s ,r e l i a b i k t ya n d 蠡i i u r er a t e s k e yw o r d s : l o s sf u n c t i o n : e m p i r i c a ib a y e s i a ne s t i m a t i o n a s y m p t o t i co p t i m a l i t y ; n o n i n d e p e n d e n tc o m p o n e n t s ; b a y e s i a ne s t i m a t i o n ; e m p 衙c a lb a y e s j a l lt e s t ; c o n v e r g e r l c er a t e : s y s t e mr e l i a b i l i t yp e r f o n l l a n c e s “ 西北丁业大学硕士学位论文 第一章绪论 第一章绪论 统计学中的b a y e s 学派自诞生以来发展非常迅速,如今已与经典统计学派,即 一般教科书上所讲的频率学派,成为国际数理统计界的两大学派。这两个学派一 直在争论中发展,至今仍未见分晓。 这两个学派都假设我们所研究的总体服从某种分布类型,但对于分布类型中 参数的认识却持着截然不同的观点。例如对一批产品进行抽样检查,其次品服从 二项分布,这批产品的次品率p 是未知参数:又如全国成年人的身高服从正态分布, 它包含两个参数,一个是平均身高h ,另一个是描述各人身高参差不齐程度的方差 a 2 。但是,这两个学派对于分布类型中所含的参数,如上述p ,“0 2 的认识却截 然不同,这也正是他们争论的焦点。频率学派认为这些参数是客观存在的,在未 得到全部数据( 这往往是不可能的) 前,它是未知的,是通过抽样的结果来估计 的,这种估计、推断的理论建立在频率解释的基础上。他们只利用当前随机抽样 的数掘( 不涉及其他数掘) 来估计这些参数,或者对这些参数的某些假设进行推 断,看假设是否正确。而贝叶斯学派认为这些参数本身也是随机的,它也服从某 种类型的分布,称这种分布为先验分布。 这批产品,次品率的确是一个未知常值, 例如产品抽样的例予中,对当前受检的 但从该工厂生产这种产品来看,肯定不 只生产一批,而是有很多批,每批的次品率显然不尽相同。但它们是在同一工厂、 在同样设备和工艺条件下生产的,每批产品的次品率大致相差不多,它也受某种 随机规律的制约。贝叶斯学派认为,从生产历史长河来看,同一工厂生产的同种 产品的次品率是随机变量,服从某种先验分布,当前受检的这批产品的次品率只 是这个随机变量的一个实现。在估计当前受检产品的次品率时,应当考虑这个事 实,不仅要用当前抽样的数据,还要利用先验分布所提供的信息。该学派的理论 是:利用当前抽样的数据及先验分布,由贝叶斯公式建立后验分布,以后一切统 计推断,如估计、假设检验,皆在后验分布的基础上进行,这就是贝叶斯学派的 观点。从数学论证来看,如果先验分布选择得恰当,利用贝叶斯学派方法进行的 统计推断就较为准确。这就相当于你见某人一面后对他的认识,不如你了解此人 一些历史状况后再见此人一面所得到的认识深刻。这里的关键在于如何准确地确 定先验分布。 近年来,贝叶斯理论在许多国家有广泛的应用,尤以经济领域居多。贝叶斯 学派著名学者l i n d l e y 曾预言:“统计学的未来一个贝叶斯的二十一世纪“p 不论这一论断是否偏颇,近些年束统计学的发展确实很快。翻一下国内外杂志, 尤其是美国统计学会的j a s a 和英国皇家学会的j r s s 等,几乎每期都有贝叶斯统 计方面的文章。可以说,贝叶斯统计是当今国际统计科学研究的热点。尽管这两 西北一 业人学硕十学位论文 第一章绪论 个学派的争论仍在继续,但它对统计学的发展却起到了巨大的促进作用。正如 e f r r o n 所指出:“由于这场争论而使统计学领域叶繁花茂w ” 经验贝叶斯理论就是这场争论的产物。这个理论是由美国统计学家| l r o b b i n s 于1 9 5 5 年首先提出的。它吸收了贝叶斯学派的不孤立地利用当前抽样数据来进行 统计推断的好思想,而避开或少用先验分布的假设,使用当前抽样数掘及有关历 史抽样数据来进行统计推断。这样统计推断的精度能接近在先验分布准确条件下, 用贝叶斯方法进行的统计推断。这种推断的解释仍采用频率理论。这就是说:这 种理论采用两派的一些优点,形成自己的观点。经验贝叶斯观点相对于贝叶斯学 派的观点而言,避开了贝叶斯学派的某些主观成分,全依靠客观数据,“是非常有 价值的一种思想( ,j j ”。 本章的主要任务是:简单介绍以后各章节所用到的基本知识,给出本文的 主要内容及论文的基本框架。 1 1 b a y e s 方法及经验b a y e s 方法 1 1 1b a y e s 方法 b a y e s 方法在实际中已被广泛应用,特别是在可靠性分析中有着重要的应用 它利用当前抽样的数据及先验分布,由b a y e s 公式建立后验分布,之后的一切统 计推断,如参数估计、假设检验等,皆在后验分布的基础上进行 b a y e s 学派的基本观点是:参数空间0 中的任一参数目都被看作随机变量,可 以用一个概率分布来描述p 的未知状况,这个概率分布是在抽样前就有的关于目的 先验信息的概率描述,即所谓的先验分布,记为g p ) 且d g p ) = 万p ) d 矽于是, 样本的联合分布密度函数就可看成是在随机变量口给定某个值时,x 的条件密度 函数,故应记为p i 口) ,其中x = ( 而,而,) 为观察向量,口= ( q ,岛,幺) o 从b a y e s 学派的观点柬看,样本= ( ,z ,以) 的产生要分两步进行:首 先,设想从先验分命刀( 口) 产生一个观察值口,然后再从条件分布p ( 石i 口) 产生样本 观察值x = ( 玉,恐,矗) ,这时样本x 的联合条件密度为 h p ( x i 目) = iij 口( i 护) ,z l 这个联合分布综合了样本信息,又称为似然函数 由于口是未知的,想要把先验信息与样本信息综合起来,需要结合先验分布 万( 口) 这样,样本x 与参数口的联合分布厅( x ,矽) = p ( 引口) 万( 口) ( 1 ) 就成功地把先验信息与样本信息综合到一起了 为了对未知参数口作出统计决策,需要对联合分布作出如下分解 两北1 二业人学硕士学位论文 第一章绪论 厅( 工,口) = 石( 口iz ) 加( x ) 其中彤( x ) 是x 的边缘密度函数 m ( 工) = l “p 矽= l p ( x i 口) 石( 口) 彬 ( 2 ) 它与一无关,或者说肌) 不含目的任何先验信息,因此能够用来对口作出统计决策 的仅是条件分布石( 占i 工) ,它的计算公式是 砌2 帮2 赫 这就是b a y e s 公式的密度函数形式,这个在样本给定下口的条件分布称为后 验分布,在样本给定的情形下,它集中了样本与先验分布中有关口的一切信息,要 比先验分布万( 护) 更接近于实际情况,因此使用后验分布万( 口i x ) 对口作统计决策要 比用先验分布刀( 目) 作出的决策更合理。上述的b a y e s 公式是在,o 都是连续型 随机变量场合下得到的,其他场合下的b a y e s 公式也可类似写出,例如:当z 是离 散型随机变量时,只需把其中的密度函数p ( x i 臼) 改为概率尸( 肖= x l 口) ,而当口是 离散型随机变量时,只要把其中先验分布函数牙( 口) 改为分布列石( 只) , ( f = j ,2 j ,疗) ,积分号改为求和号即可 。 在统计学上,我们把所采取的决策或行为的全体成为决策空间或行动空间, 记为d ,d = d 统计推断的任务就在于建立一个定义于样本空间x 而取值于决策 空间d 的函数6 ( 工) ,使得当有了样本x 时,就采取决策6 ( x ) ,即:当观察值为 x = ( 船,船,函) 时,采取决策d = 6 ( x ,肋,而) ,称函数6 ( x ) 为决策函数或统计 判决函数。 在具体决策问题中,可供选择的判决函数很多,如何在决策空l 日j 中选择一个好 的判决d ,我们引入风险函数来衡量其优劣。设三( o ,d ) 为损失函数,则由下式定 义的口的函数 r ( o ,6 ) = e ( 帅) 三( e ,6 ( 石) ) = j ( o ,6 ( x ) ) p ( x lo ) d o 称为判决函数6 的风险函数。从定义可知,风险函数即在真实参数为口时,采 取判决函数6 ( x ) 的b a y e s 风险 ( 6 ) = 局 r ( o ,6 ) = 晟删 ( o ,6 ) 兀( o ) d e 运用后验分布式( 3 ) 可得 尼j ( 6 ) = ( e ,6 ( x ) 扣( ox ) d e 棚( 工) 出 ( 4 ) 将任满足条件m ( 6 c ,) = f m ( 6 ) 的判决函数6 a ( x ) ,称为所研究统计决策问 题的b a y e s 解,在估计问题中,它就称为b a y e s 估计。 通常情况下,我们习惯采用平方损失函数,即 3 西北工业大学硕士学位论文第一章绪论 ( o ,6 ) = ( o 一6 ) 2 此时,目的b a y e s 估计恰好为目的后验分布均值,即 6 a = 占( e f x ) = f0 7 【( e i 善) 册 b a y e s 理论及其方法的使用,关键在于如何确定先验分布。当然,比较令人 信服和易为使用者所接受的选择,是基于历史资料或有根据的理论所得出的结果, 为此目的,寻找某些一般性的选择先验分布的办法就是一件很有意义的事,但是, “企图规定一种放之四海而皆准的选择先验分布的法则,几乎是不可能的1 4 9 】。” 对先验分布的研究,张尧庭 1 9 9 1 给出了确定先验分布的方法:贝叶斯方法、 共轭分布法、杰弗莱原则和最大熵原则;s a y c h u kv 1 a d i m i rp m 1 给出了共轭分 布法与最大熵原则相结合确定先验分布的方法;f a b r i c eg u 舒i n 2 0 0 3 从相依性 研究角度给出了建立先验分布的一种方法;韩明【2 0 0 3 给出了确定先验分布的多层 b a y e s 方法;金少华 2 0 0 3 利用分布函数的凹凸性质,合理她构造了一类先验分布: h u m b e r t og u t i 6 r r e z p u l i d o 2 0 0 5 给出了一种在可靠性中获取先验分布的综合 方法。 1 1 2 经验b a y e s 方法 经验b a y e s ( e m p i r i c a lb a y e sp r o c e d u r e ) 方法简称e b 方法,是在b a y e s 方法 的基础上发展起来的,其基本思想是用样本所估计的先验分布代替真正的先验分 布,然后做出b a y e s 统计推断与决策。 假设我们有一批历史数据( ( m ,e 囊( ,e :) ,( ,o 一) ) 与当前数据( x ,e ) ,其 中m ,彤,而,x 是可以观察的,是已知的,e ,o v “,e 。,0 是不可观察的,是样本 对应分布中的未知参数,这里我们只就估计而言,对于假设检验可以同样叙述。 参数吼,良,o 。0 虽然未知,只是随机变量矽的实现,但它们遵从同一先验分 布万f 们,寻求经验b a y e s 估计的任务就是要找一个依赖于凰,j 乙,兄,x 的函数 色( ,皿,鼠,) 来估计护,并使它接近先验分布厅( 毋) 已知时的b a y e s 估计。 e b 方法认为样本是由刖( x ) 中抽取出来的,其中肼( x ) 是由式( 2 ) 给出的边缘密度 函数。因此,可以先用葺,艺,估计研( x ) 或其特征,由于假设p ( x i o ) 是已知的, 再根据式( 2 ) 估计先验分布刀p ) 或其特征,最后结合当前样本,应用b a y e s 方法获 得口的e b 估计。 在求e b 估计时,可以参考由历史资料( ,x 矿一,兄) 获得的关于先验分布 万( p ) 的信息,选定一个判决函数6 卜) ,记为6 。o f 船,船,知) ,称任何同时依赖 于历史样本( m ,m ,z ,) 和当前样本x 的判决函数6 。( x l 乩勋,赫) 为经验判决 函数。 西北工业大学硕士学位论文第一章绪论 当( 兄,尼,凰) 已知时,6 一“l 勋,肋,而) 的b a y e s 风险为 尼( 6 一o f 蔚,柏,赫) ) = 且州 上( o ,6 一o i 肋,勋,赫) ) = p ( e ,& o i 如,勋,) ) p ( x l e ) 兀( e ) 出d e 由于上式仍是而,恐,矗的函数,故对( m ,凰,兄) 的联合分布求数学期望,得 到6 一( 工i 工,x v 一,舶) 的全面b a y e s 风险 尼( & ) = 蜀“n 川 尼( & ( x i 勋,勋,赫) ) = 弘( 6 。( 巾。m ,而) ) n p ( 五i o ) 如如如 定义1 1 1 称 6 一( x i 新,髓,) 是渐近最优的经验b a y e s 估计,简记为a o e b 估计,如果一串经验判决函数 & b f ,船,而) 满足条件 缎r ,( 6 。) = ( 6 。) 即& 的全面b a y e s 风险的极限等于b a y e s 估计的b a y e s 风险 定义1 1 2 称6 。是具有收敛速度为g 的经验b a y e s 估计,如果 r ( 6 。) 一心( 6 。) = d ( 胛1 ) 其中4 口 1 2 1 可靠性的定义 1 2可靠性的基本概念 可靠性又称生存率,用于衡量产品的性能指标。它综合反映了产品的耐久性、 无故障性、维修性、经济性和有效性等。国军标g j b 4 5 1 9 0 对可靠性做如下定义: 可靠性是指产品在规定条件下和规定时问内,完成规定功能的能力。该定义 的三要素是三个“规定”:规定条件、规定时间、规定功能。 规定条件包括使用时的环境条件、工作条件、维修条件和工作方式等,如温 度、湿度等。在不同的舰定条件下,同一产品的可靠性是不同的。 规定时问是指产品规定的任务时间。同一产品在不同的使用时间范围,其可 靠性水平是不同的。这里的时洲定义是广义的,可以是统计的r 历小时,也可以 是工作循环次数、行驶罩程等,它将根据产品的具体特性而定。要确定产品规定 的环境条件、工作条件和任务时| 日j ,必须对产品的寿命剖面和任务剖面进行分析 研究。 西北 :业大学硕士学位论文第一章绪论 规定功能是指产品规定的必须具有的功能及其技术指标。产品功能的多少和 其技术指标的高低,直接影响到可靠性指标的高低。只有规定了清晰的功能和性 能界限,才能明确产品的故障判据。产品的功能判掘不同,将得到不同的可靠性 评定结果。 1 2 3 可靠性的主要特征量 可靠性评估是己知产品的寿命分布和一组数据,如何去估计产品的可靠住的 问题。在研究产品的可靠性时,就需要各种数量指标,以便说明产品的可靠性程 度。我们把表示和衡量产品的可靠性的各种数量指标统称为可靠性指标( 可靠性特 征量) 。产品的可靠性特征量主要有可靠度、失效率、平均寿命等。 ( 1 ) 可靠度 可靠性的概率度量称为可靠度,即产品在规定条件和规定时间内完成规定功 能的概率,一般用r ( f ) 来表示。它是时间的函数,表示为: 冗( 磅= f f ) ( 5 ) 式中:r ( f ) 可靠度函数: r 产品故障| ; 的工作时问: ,规定的时间。 由可靠度的定义有: 晡) = 掣 ( 6 ) 式中:n f = o 时,在规定条件下工作的产品数; ,( ,) 在。到f 时刻的工作时间内,产品的累计故障数。 ( 2 ) 失效率 失效率( f a i l u r cr a i e ) 五( ,) 是系统、机器、设备等产品一直到某一时刻f 为止, 尚未发生故障的可靠度r ( f ) 在下一个单位时问内可能发生故障的条件概率。换句 话说,五( ,) 表示在某段时间,内圆满地工作的百分率r ( f ) ,在下一个瞬间将以何种 比率发生失效或故障。因此,失效率的表达式为 俐= 黼一篇= 器( , 。) ( 7 ) 或;一生坐塑 ( 8 ) 片( f ) 由式( 6 ) 可知,z ( ,) 是瞬时失效率,也可称为r ( ,) 条件下的厂( f ) 。 若可靠度函数霆g ) 或不可靠度函数f ( f ) = i 一震( 玲已求出,则可按式( 6 ) 求出 6 西北丁业大学硕士学位论文第一章绪论 五( r ) 。反之,若失效率函数五( ,) 已知,则由式( 7 ) 亦可求得r ( ,) ,即 r ( f ) = e x p l 一【a ( f ) 出l ( 9 ) 即可靠度函数五( ,) 是把a ( f ) 由0 到t 进行积分之后作为指数的指数型函数。由 此可见,产品的失效率越小,产品的可靠性就越高;反之,失效率越大。产品的 可靠性就越低 ( 3 ) 平均寿命 平均寿命是最为常用的寿命特征指标,是一个标志产品平均能工作多长时间 的特征量。对于不可修复产品,平均寿命是产品发生失效前的工作时间或储存时 间的平均值,或称为失效前平均时间,记为m 1 v r f ( m e a i lt i m e t of a i l u r c ) 。对于可 修复产品平均寿命指相邻两次故障间的平均工作时间,通常称为平均无故障工作 时间,记为m t b f ( m e a nt i m eb e t w e c nf a i l u r e ) 。如果我们仅考虑首次失效前的一 段工作时间,那么,对于可修复和不可修复产品,平均寿命在理论上就没有什么区 别了,所以我们将二者统称为平均寿命,记作0 。 若产品总体的失效密度函数( ,) 已知,出概率论中数学期望的定义,可知产品 的平均寿命为 曰= e ( 7 ) = f 矿( ,) 廊= f r ( ,) 西 ( 1 0 ) 1 3 本文主要内容与结构 自经验b a y e s ( e b ) 方法引入以来,e b 估计和e b 检验问题就成为b a y e s 理论的 研究热点,到现在已有几十年的历史,存在很多文献。在指数族方面,有j o h n s ,v a i l r y z i n 阢3 ”,韦来生“,陈希孺,r s s i n 曲2 5 1 和薛留根分别对离散和连 续型单参数指数族参数的单、双侧e b 检验及e b 估计进行了讨论;胡太忠和潘国华 【4 “,s i n g l l 和w e i 【”,魏莉】,及王立春”1 对刻度指数族参数的单、双侧e b 检 验和e b 估计进行了研究。而在截断型分布族方面,师义民。“,康会光口”,韦来 生【”l ,梁华| 4 9 1 等对单、双边截断型分御族参数的e b 检验和e b 估计做了一些研究。 以上这些结论都是在独立同分布样本下得到的,然而在实际中,尤其在可靠 性理论、渗透理论和某些多元分析问题中,我们遇到的随机样本常常不是i i d ,而 是具有一定的相关性,如:正相依( p a ) 样本( p a 样本定义见2 1 ) 和m 相依样 本( m 相依样本定义见4 1 ) 。对于在相依样本下进行参数的经验b a y e s 统计分析 研究有重要的意义。 本文主要运用经验b a y e s 方法研究分御族参数的统计推断及其在可靠性分析 中的应用。第一章给出了本文以后各章节所需要的基本概念。第二章在p a 样本情 形下给出了一类币指数分柿族参数的经验b a y e s 检验,讨论了它的渐近最优性,并建 西匕工业大学硕十学位论文第一章绪论 立其收敛速度在适当的条件下,证明了该收敛速度可以任意接近g ) 第三章在同 分布p a 样本下,考虑了非对称损失函数l i n e x 损失下刻度指数族参数的e b 估计问 题,获得收敛速度并给出渐近最优性的证明。第四章对肌相依样本时线性经验 b a ”s 估计进行了研究,得到一维聊相依样本单参数总体中参数e 的线性经验b a y e s 估计,并给出了渐近最优的收敛速度。第五章对一类具有相依部件的串、并联系 统的可靠性指标估计问题迸行了研究,建立了合理的失效模型,计算机模拟结果 表明所给出的方法是可行的。 在相依情形下,研究参数的经验b a y e s 估计与检验及其收敛速度和渐近最优 性,具有理论和应用价值。 西北工业大学硕士学位论文 第二章p a 样本f 正指数族参数的经验b a y e s 检验 第二章p a 样本下正指数族参数的经验b a y e s 检验 2 1 问题的提出 自j o l l i l s ,、,觚r y z i n 阱对离散型和连续型指数族关于砌样本情形的单边检验 提出以来,已有不少文献对其进行研究瑚太忠等h 讨论了刻度指数族参数在线性损 失下的单侧e b 检验问题,s i n g l l 和w 萌i 州研究了双侧的e b 检验,这些都是在硼样本 情形下进行的在可靠性理论、渗透理论、和某些多元分析等实际问题中,遇到的随 机样本常常不是独立同分布的,而是具有某种相关性,正相协( p a ) 和负相协( n a ) 样本 就是常见的两种文献 1 ,2 ,8 ,4 1 ,4 4 】均在n a 样本下,分别研究了截断型分布族参数的 单边及双边e b 检验和e b 估计问题 本章运用同分布p a 样本密度函数的核估计,构造了一类正指数分靠族参数的经 验b a y e s 检验,讨论了它的渐近最优性,并建立其收敛速度在适当的条件下,证明该收 敛速度可以任意接近g ) 最后,给出适合定理条件的一个例子 下面首先引入p a 序列的定义【”j 定义l 称随机变量”z 。0 j ) 是p :a 的( p o s i t i v e l ya s s o c i a t e d ) ,如果对于月4 上 任意两个使协方差存在且对每个变元均非降( 或非升) 的函数 和 都有 c o v o f ? 眯i ,x2 x j , 2 0 x l ,x2 ,x m 2 0 称随机变量序列 z , 是p a 的,如果对任意自然数疗,x ,x ,x 。都是 p a 的 考虑如下讵指数族:设随机变量在给定参数e 时的条件密度函数为: 厂( 0lx ) = c ( e ) “( x ) e x p ( 一e x ) j 【,o 】 ( 1 ) 其中样本空间3 c = ( o ,佃) ,参数空间o = f o o ,c ( o ) 一= f “( x ) e x “缸) 出 0 且关于工是不减的设g ( 0 ) 为0 的未知先验密度且扣( e ) = g ( o ) 棚考虑假 设检验问题 爿0 :0 o 。 鳃p a ( ,) ( 9 ) 又知0 【g ( x ) ,托( x ) 是x 的连续函数,根掘连续函数的介值性定理,存在一点使得 p 。( ) = o 。测有 f p g ( 工) 肛g 【p 。( x ) o 。x , 因此b a y e s 判决函数可表示为 淋) 2 :裟 c t 其b a y e s 风险为 民= 节r ( 6 。,g ) = f 6 。o ) 钆一p 。( x ) 尼( x ) 出+ c 6 当先验分布g ( e ) 已知且6 ( x ) = 6 。( j ) 时,吃完全可以精确达到,但由于此处先 验分布g ( e ) 未知,因此6 。( x ) 对我们来说也是未知的且不可用这就需要导入e b 检 验方法 2 2e b 检验函数的构造 设 一,o ,) , 托o , 以,o 。 和 x ,e 为同分布样本,其中葺,局,( 历史样 本) 与x ( 当前样本) 具有共同的密度函数厂o l e ) ,如式( 1 ) 所定义o ,( f = ,2 ,胛) 与 e 有共同的先验分布g ( 9 ) ,又设x ,以x 。( 一2j ) 为同分布p a 随机变量序列,由 式( 1 ) 所示的概率密度函数可得其对应的边缘密度为: 1 0 西北工业大学硕士学位论文第二章p a 样本下正指数族参数的经验b a y 。! ! 垒堕 尼( 工) = l 厂( z l o p g ( e ) 文中假定p a 序列是弱平稳的且满足条件( a ) :c d v ( x ,一) c , 为了获得e b 检验函数,首先构造弘( 曲,0 c g ( x ) 。讹( x ) 的估计量这里采用核估计 的方法设x ( y ) ( f = 口,) 是b o r e l 可测有界函数且满足下列条件( b ) ( 口,) k ( y ) = d ,当y 茌( 以,) 时 rjf = f ( 岛) rj ,k ( y ) 砂; d ,f f = d ,j 一 【丑 忙。 ( 口,) k ,( y ) 在局上除有限点集易外是可微的且,器曼。l 置气y ) l c o 。根据 鼢d 【卅,厶( ,) 的核估计如下: 驰) = 去弘【竿 其中p _ o ( 门一。) 且,砌嘭= m ( 1 1 ) 则伐。( x ) ,( ) c ) ,狰话( x ) 的核估计可表示为 “小寿蓦k 。( 罕 c a 小,= 南善片,( 竿) c ( 工) = o 。y 。( x ) 一a 。( 石) 下文,我们仅讨论g ( e ) e t n ,乃) = g f r e g ( o ) co o ,p 。) 其中 d d ,m 。( x ) d “( x ) 一m 。( x ) 出 这罩及以下均以e 表示对( x ,以,x 。) 的联合分布求均值按定义若 触e 魄湖一( z ) i = p , 炽e n ( x ) 卜7 。( x ) | _ 口, 堕塑业盔堂堡堂堡垒文多二章p a 样本下上 指数旅参数的经验b a y e s 检验 触e i m 。( x ) 卜m 。( x ) | = d 则称o c 。( 工) ,靠( 工) ,o ) 分别为a 。o ) ,( x ) ,o ) 的一致渐近无偏估计量 若! 鳃r = ,则称( 6 。 为参数e 的渐近最优e b 检验若对g 口,有 r = d ( ”一9 ) ,则称e b 检验函数 6 。 的收敛速度的阶为g 约定:文中出现的c ,c o ,c 均表示与胛无关的常数,它们在不同的表达式中可 以表示不同的值,即使在同一表达式中也是如此 2 3 主要结论及其证明 为导出e b 检验函数 6 。) 的渐近最优性及其收敛速度,先给出如下引理: 引理1 令肖和y 是两个p a 随机变量,皆有有限方差,则对任意两个可微函数岛和岛, 有 v ( g ,( x ) ,( y ) ) s 母k 5 0 0 ) 节k ;。) | c o v ( t y ) ( 1 7 ) 当蜀和分别在有限或可列集e ,和e ,上不可微时,有 一( 占小) ,( ,) ) 蔓煅| 占 ,( ,) is 即眇( 刈( w ) ( 1 7 ) j e r ,一t 。1 ,e r f 一, 证明:式( 1 7 ) 的证明见文献【9 】引理4 2 当面和毋分别在蜀和蜀上不可微时, v ( 蜀( 功,( y ) ) 在乘积空间( r 厂e ,) ( 尺,一e 。) 上积分与在尺j 上积分相等,类似可 证式( 1 7 ) 定理1 设y 。p ) ,c 。( z ) 分别为式( 1 2 ) 和( 1 3 ) 所示,其中蜀,奠,鼍是服从同一分布的 p a 序列,且满足假设( a ) 和( b ) ,甜( x ) d 且“( x ) 是x 的严格增函数,对魄x ,若 丫g ( x ) 连续且s 印7 。( x ) :c o o ,则有 ( 1 ) 伽( h ( x ) ) c ( 以吃“( x ) ) 一十c ( 疗嘭) ( 1 8 ) ( 2 ) 胁( d 。( x ) ) c ( 一霸“( x ) ) + c 0 引。 ( 1 9 ) 证明:( 1 ) 踟r ( y 。o ) ) = 寿哳l 弘( 竿 南i t 南e 卟竿) 南。( 罕 南 = 去喜惭卜阵 南 + 高磊盖铆 ( 竿 南,屹降碥 = t + l l = 去扣m 竿 高 = 匆晰 ( 竿) 南 1 2 s 而南e 竿 2 去r 峨群( 警灿沪( 蜀阿 2 面r 群( v ) 7 。( h 以v 沙 由脚g ) = 吖i ? ,t 。厶) 存在s 阶导数则 能e h ( x ) 卜a a ( 叫= d 恕e n ( x ) 一y c ( x ) i = d 舰e l ( x ) 一m 。( 刮5 d 证明:由c 卜一不等式和j e s s e n 不等式,对任意函数厂( x ) ,z ( 工) ,当d ,时,有 e i ( x ) 一,( 石) l 2 占肚( x ) 一厂( x ) 吖2 + 2 e 峨( x ) 一( x ) l s 2 踟矾( x ) r + 2 i 阢( x ) 一厂刚 利用泰勒展开定理和假设( a ) ,有 e m ( x ) = i :畅( v 耽( x + v ) 咖 = c ( e ) 唧( 一盼) j :弼( r ) 唧( 一e 。吃v ) 舢( e ) :l c ( 。) 唧( 一帆) l ,+ 生譬等r v 。( d 唧( 一。耵) 十( e ) 砘( 小等量。q e ) 唧( 也) 抄酏) 唧( 也v 。) 砷删 其中v 【d ,v 】胜意到k 。( ) 的有界性( 不妨设j 局( ) i b ) 及d e 印( 一e 。v ) j ,可 得 ! 翌e i y 。( 工) 一( 石) i = ! 鳃2 砌r 丫。( 工) 班 十恕2 l 等。c ( e ) 唧( 一哟 f v ( v ) 唧( 一e v ) 咖 棚( e ) l 鳃南( e ) 酬也) 叫。) ,f m “= d h 同样 e m 石) = 一丢f x 小) a 。( h 吃v ) 咖 1 4 堕j ! 三些盔堂堡学惶塑 第二章p 氏样本下j i = 指数族参数的经验b a y e s 检验 = 一 上c ( o ) 唧( 骶) f 巧( v ) 唧( 一眠v ) 枷( 。) 一寺l c ( 。) 酬m ) 卜。+ 警铲p 州咄印( 0 ”) 一v b 。) = 叫小譬上8 吲8 ) 唧( 嘶) 雎昭小) 唧( 一e 矿) 面卜( o ) 其中矿【d ,v 】,注意到i k ,( ) i c 口及d e 印( 一。以v ) j ,则 ! 鲤ej o c 。( 工) 卜a 。 ) | ! 鳃2 阮r 口。( 石) 以 也2 降二。侧卅骶) 眇砷) 计。州十( e ) f 硝池+ 力上o 。e ( o ) 唧( 也) 搬( e ) ( 乃) 由于p q 日是关于x 的严格减函数且陆( 肛) = e 。,故存在岫,( p 。,6 ) ,使 订 吣 一,=ll 筠 二誉l 恕 两北1 :业人学硕十学位论文 第二章p a 样本下正指数族参数的经验b a y e s 检验 q = e 异 糯( 习0 j 批( 功 o “( 刁弘( 习 肋( 刁一岛 出 9 = r 异 牖( 习 o ,化( 习o “( 功丫o ( 习 。一艮( 功 出 9 = 牖( 砷 o ,耽( z ) o “( 功 一耽( 刁:陋 定理3 设6 :( x ) 由式( 1 5 ) 定义,x ,z ”z 。为同分布弱平稳p a 样本序列,满足条件 ( b ) ,并假设下列条件成立: ( a ) l d g ( e ) ( b ) 对v x x ,( x ) 是关于工的连续不减函数,丫g ( x ) 存在,( ,1 ) 阶导数 则当疗磁斗o 。0 专o 。) 肘有 ! 鳃r 。( 6 。,g ) = r 。 证明:要证明! 鳃尺。( 6 。,g ) = 心,即证明:塑( 9 + q 2 + 9 + q 4 ) = o 由于p 。( j ) 是关于x 的减函数,则对坛( p g j ,) p 。( ) 一o o p 。( ) 一o o = o , o o p a ( p a :) o o p c ( p a ) = o ( 2 5 ) 9 e 2 甜( z ) 弘( x ) 膨( e 。+ 1 ) l c ( o ) 印( - 0 一) 粥( e ) 如( ) 出 s 2 肼( e 。+ 1 ) 上o “c ( e ) t 甲( 一肌) 施( o ) p ( 印) = d ( 腻) 9 c 22 “o ) 7 c ( x ) 肼( o 。+ 1 ) o “c ( o ) 唧( 一o n ) d g ( o ) 乃。o ) 出 2 蹦( e 。+ 1 ) 工o “c ( o ) 唧( 一e n ) 扣( e ) 乃“( n ) = o ( 掰) 另外,对v x ( n ,p o ) ,有肋( x ) = 丫g ( x ) ( e 。一p 。( 工) ) 所。( x ) 一( o 。+ 1 ) 掰上o c ( o ) 唧( 一h ) 粥( e ) 1 = 一耽 2 2 1 肋 2 ( 习 岛一f j g ( 习 一( 岛+ 1 ) 蹦上e ,c ( 。) g 印( 卅c 灯( 。) ( n ) e 0 一d 。( 肛) 一( o o + 1 ) 箔o c ( e ) 印( 聃) 粥( 9 ) 1 6 。尹。尹 。_。_。_ ,l,! 叫州叫一苄: 一2一2一2 = = ,、 ,i 弘 弘 12一2 + + 对对 = 圭m ( j ) o 由定理l 知 胁 川。( 瑚= 惭 e 吖。( x ) 一a c ( x ) 2 0 5 胁m ( x ) + 2 脚陋( x ) 蹦+ 去+ 端+ 熹 ,廊- “( x ) 刀,疗
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年公共卫生管理硕士入学考试试卷及答案
- 2025年公共关系管理专业毕业考试题及答案
- 阿加曲班病例分享
- 蚊香投资项目可行性研究报告(立项备案模板)undefinedundefined
- 培训讲师都用
- 中暑病人护理
- 粤教沪科版中考物理复习 第五章 我们周围的物质 第一课时教学课件
- 2025年风险管理与控制考试试卷及答案
- 2025年地质勘查工程师考试试卷及答案
- 2025年爱国主义教育与实践能力考核试卷及答案
- 2024年广东惠州市交通投资集团招聘笔试参考题库含答案解析
- 便利店食品管理制度
- 《核分析技术》课件
- 空压机说明书(中文)
- 【基于Python的电商系统设计与实现14000字(论文)】
- 录用体检操作手册(试行)
- 农民工工资表(模板)
- 各级无尘室尘埃粒子测量表
- 湖北省武汉市江汉区2022-2023学年三年级下学期期末数学试卷
- 南充市仪陇县县城学校考调教师考试真题2022
- 广东省广州市白云区2022-2023学年数学六年级第二学期期末质量检测试题含解析
评论
0/150
提交评论