华东师范大学茆诗松概率论与数理统计教程参数估计课件市公开课一等奖省赛课微课金奖课件_第1页
华东师范大学茆诗松概率论与数理统计教程参数估计课件市公开课一等奖省赛课微课金奖课件_第2页
华东师范大学茆诗松概率论与数理统计教程参数估计课件市公开课一等奖省赛课微课金奖课件_第3页
华东师范大学茆诗松概率论与数理统计教程参数估计课件市公开课一等奖省赛课微课金奖课件_第4页
华东师范大学茆诗松概率论与数理统计教程参数估计课件市公开课一等奖省赛课微课金奖课件_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章参数预计

§6.1

点预计几个方法§6.2

点预计评价标准§6.3

最小方差无偏预计§6.4

贝叶斯预计§6.5

区间预计华东师范大学茆诗松概率论与数理统计教程参数预计课件第1页1/105普通惯用

表示参数,参数

全部可能取值组成集合称为参数空间,惯用

表示。参数预计问题就是依据样本对上述各种未知参数作出预计。参数预计形式有两种:点预计与区间预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第2页2/105设x1,x2,…,xn是来自总体X一个样本,我们用一个统计量取值作为

预计值,称为

点预计(量),简称预计。在这里怎样结构统计量并没有明确要求,只要它满足一定合理性即可。这就包含到两个问题:

其一

是怎样给出预计,即预计方法问题;

其二

是怎样对不一样预计进行评价,即估计好坏判断标准。华东师范大学茆诗松概率论与数理统计教程参数预计课件第3页3/105§6.1

点预计几个方法

6.1.1

替换原理和矩法预计

一、矩法预计

替换原理是指用样本矩及其函数去替换对应总体矩及其函数,譬如:用样本均值预计总体均值E(X),即;用样本方差预计总体方差Var(X),即用样本p分位数预计总体p分位数,用样本中位数预计总体中位数。

华东师范大学茆诗松概率论与数理统计教程参数预计课件第4页4/105例6.1.1

对某型号20辆汽车统计其每加仑汽油行驶里程(km),观察数据以下:

29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9

经计算有

由此给出总体均值、方差和中位数预计分别为:28.695,0.9185

和28.6。矩法预计实质是用经验分布函数去替换总体分布,其理论基础是格里纹科定理。华东师范大学茆诗松概率论与数理统计教程参数预计课件第5页5/105二、概率函数P(x,θ)已知时未知参数矩法预计

设总体含有已知概率函数P(x,

1,

…,

k),

x1,x2

,

…,xn是样本,假定总体k阶原点矩

k存在,若

1,

…,

k能够表示成

1,

…,

k函数

j=

j(

1,

…,

k),则可给出诸

j矩法预计为

其中华东师范大学茆诗松概率论与数理统计教程参数预计课件第6页6/105例6.1.2

设总体服从指数分布,因为EX=1/

,即

=1/EX,故

矩法预计为另外,因为Var(X)=1/

2,其反函数为所以,从替换原理来看,

矩法预计也可取为

s为样本标准差。这说明矩预计可能是不唯一,这是矩法预计一个缺点,此时通常应该尽可能采取低阶矩给出未知参数预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第7页7/105例6.1.3

x1,x2,

…,xn是来自(a,b)上均匀分布U(a,b)样本,a与b均是未知参数,这里k=2,因为不难推出由此即可得到a,b矩预计:华东师范大学茆诗松概率论与数理统计教程参数预计课件第8页8/1056.1.2

极(最)大似然预计

定义6.1.1

设总体概率函数为P(x;

),

是参数

可能取值参数空间,x1,x2

,…,xn是样本,将样本联合概率函数看成

函数,用L(

;x1,x2,

…,xn)表示,简记为L(

),

称为样本似然函数。华东师范大学茆诗松概率论与数理统计教程参数预计课件第9页9/105

假如某统计量满足

则称是

极(最)大似然预计,简记为MLE(MaximumLikelihoodEstimate)。

人们通常更习惯于由对数似然函数lnL(

)出发寻找

极大似然预计。当L(

)是可微函数时,求导是求极大似然预计最惯用方法,对lnL(

)求导愈加简单些。华东师范大学茆诗松概率论与数理统计教程参数预计课件第10页10/105例6.1.6

设一个试验有三种可能结果,其发生概率分别为现做了n次试验,观察到三种结果发生次数分别为n1,n2,n3(n1+n2+n3=n),则似然函数为其对数似然函数为华东师范大学茆诗松概率论与数理统计教程参数预计课件第11页11/105将之关于

求导,并令其为0得到似然方程解之,得因为所以是极大值点。华东师范大学茆诗松概率论与数理统计教程参数预计课件第12页12/105例6.1.7

对正态总体N(,2),θ=(,2)是二维参数,设有样本x1,x2

,

…,xn,则似然函数及其对数分别为

华东师范大学茆诗松概率论与数理统计教程参数预计课件第13页13/105

将lnL(,2)分别关于两个分量求偏导并令其为0,即得到似然方程组

(6.1.9)

(6.1.10)华东师范大学茆诗松概率论与数理统计教程参数预计课件第14页14/105

解此方程组,由(6.1.9)可得

极大似然预计为将之代入(6.1.10),得出

2极大似然预计利用二阶导函数矩阵非正定性能够说明上述预计使得似然函数取极大值。

华东师范大学茆诗松概率论与数理统计教程参数预计课件第15页15/105

即使求导函数是求极大似然预计最惯用方法,但并不是在全部场所求导都是有效。

例6.1.8

设x1,x2

,

…,xn是来自均匀总体

U(0,

)样本,试求

极大似然预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第16页16/105

解似然函数要使L(

)抵达最大,首先一点是示性函数取值应该为1,其次是1/

n尽可能大。因为1/

n是

单调减函数,所以

取值应尽可能小,但示性函数为1决定了

不能小于x(n),由此给出

极大似然预计:。华东师范大学茆诗松概率论与数理统计教程参数预计课件第17页17/105

极大似然预计有一个简单而有用性质:假如是

极大似然预计,则对任一函数g(

),其极大似然预计为。该性质称为极大似然预计不变性,从而使一些复杂结构参数极大似然预计取得变得轻易了。华东师范大学茆诗松概率论与数理统计教程参数预计课件第18页18/105

例6.1.9

设x1,x2,

…,xn是来自正态总体N(

,

2)

样本,则

2极大似然预计为,于是由不变性可得以下参数极大似然预计,它们是:

标准差

MLE是;华东师范大学茆诗松概率论与数理统计教程参数预计课件第19页19/105概率MLE是;总体0.90分位数x0.90=+

u0.90

MLE是,其中u0.90为标准正态分布0.90分位数。华东师范大学茆诗松概率论与数理统计教程参数预计课件第20页20/105§6.2

点预计评价标准

6.2.1

相合性

我们知道,点预计是一个统计量,所以它是一个随机变量,在样本量一定条件下,我们不可能要求它完全等同于参数真实取值。但假如我们有足够观察值,依据格里纹科定理,伴随样本量不停增大,经验分布函数迫近真实分布函数,所以完全能够要求预计量伴随样本量不停增大而迫近参数真值,这就是相合性,严格定义以下。华东师范大学茆诗松概率论与数理统计教程参数预计课件第21页21/105定义6.2.1

∈Θ为未知参数,是

一个预计量,n是样本容量,若对任何一个ε>0,有

(6.2.1)

则称为

参数相合预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第22页22/105

相合性被认为是对预计一个最基本要求,假如一个预计量,在样本量不停增大时,它都不能把被估参数预计到任意指定精度,那么这个预计是很值得怀疑。通常,不满足相合性要求预计普通不予考虑。证实预计相合性普通可应用大数定律或直接由定义来证.华东师范大学茆诗松概率论与数理统计教程参数预计课件第23页23/105

若把依赖于样本量n预计量看作一个随机变量序列,相合性就是依概率收敛于

,所以证实预计相合性可应用依概率收敛性质及各种大数定律。华东师范大学茆诗松概率论与数理统计教程参数预计课件第24页24/105在判断预计相合性时下述两个定理是很有用。定理6.2.1

设是

一个预计量,若

则是

相合预计,定理6.2.2

若分别是

1,

…,

k相合估计,

=g(

1

,

…,

k)是

1,

…,

k连续函数,则是

相合预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第25页25/105例6.2.2

设x1,x2

,

…,xn是来自均匀总体U(0,

)样本,证实

极大似然预计是相合预计。证实:在例6.1.7中我们已经给出

极大似然预计是x(n)。由次序统计量分布,我们知道x(n)分布密度函数为p(y)=nyn-1/

n,y<

,

故有由定理6.2.1可知,x(n)是

相合预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第26页26/105

由大数定律及定理6.2.2,我们能够看到:矩预计普通都含有相合性。比如:

样本均值是总体均值相合预计;样本标准差是总体标准差相合预计;样本变异系数是总体变异系数相合预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第27页27/1056.2.2

无偏性

定义6.2.2

设是

一个预计,

参数空间为Θ,若对任意

∈Θ,有

则称是

无偏预计,不然称为有偏预计。

华东师范大学茆诗松概率论与数理统计教程参数预计课件第28页28/105例6.2.4

对任一总体而言,样本均值是总体均值无偏预计。当总体k阶矩存在时,样本k阶原点矩ak是总体k阶原点矩

k无偏预计。但对中心矩则不一样,譬如,因为,样本方差s*2不是总体方差

2无偏预计,对此,有以下两点说明:

(1)当样本量趋于无穷时,有E(s*2)

2,我们称s*2为

2渐近无偏预计。

(2)若对s*2作以下修正:,则s2是总体方差无偏预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第29页29/105例6.2.5

设总体为N(

,

2),x1,x2,

…,xn是样本,则s2是

2无偏预计,且可求出这说明s不是

无偏预计.

利用修正技术可得cns是

无偏预计,其中是修偏系数.

能够证实,当n

时,有cn1.

这说明s是

渐近无偏预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第30页30/1056.2.3

有效性

定义6.2.3

设是

两个无偏预计,假如对任意

∈Θ,有且最少有一个

∈Θ使得上述不等号严格成立,则称比有效。

华东师范大学茆诗松概率论与数理统计教程参数预计课件第31页31/105例6.2.6

设x1,x2

,

…,xn是取自某总体样本,记总体均值为

,总体方差为

2,则,,都是

无偏预计,但显然,只要n>1,比有效。这表明用全部数据平均预计总体均值要比只使用部分数据更有效。华东师范大学茆诗松概率论与数理统计教程参数预计课件第32页32/105例6.2.7

均匀总体U(0,

)中

极大似然预计是x(n),因为,所以x(n)不是

无偏预计,而是

渐近无偏预计。经过修偏后能够得到

一个无偏预计:。且另首先,由矩法我们能够得到

另一个无偏预计,且由此,当n>1时,比有效。华东师范大学茆诗松概率论与数理统计教程参数预计课件第33页33/1056.2.4

均方误差

无偏预计不一定比有偏预计更优。评价一个点预计好坏普通能够用:点预计值与参数真值

距离平方期望,这就是下式给出均方误差

均方误差是评价点预计最普通标准。我们希望预计均方误差越小越好。华东师范大学茆诗松概率论与数理统计教程参数预计课件第34页34/105

注意到,所以

(1)

若是

无偏预计,则,这说明用方差考查无偏预计有效性是合理。

(2)

当不是

无偏预计时,就要看其均方误差。下面例子说明:在均方误差含义下有些有偏预计优于无偏预计。

华东师范大学茆诗松概率论与数理统计教程参数预计课件第35页35/105例6.2.8对均匀总体U(0,

),由

极大似然预计得到无偏预计是,它均方误差

现我们考虑θ形如预计,其均方差为

用求导方法不难求出当时上述均方误差抵达最小,且其均方误差

所以在均方误差标准下,有偏预计优于无偏预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第36页36/105§6.3

最小方差无偏预计

6.3.1

Rao-Blackwell定理

以下定理说明:好无偏预计都是充分统计量函数。

定理6.3.2

设总体概率函数是

p(x,

),x1,x2

,

…,xn

是其样本,T=T(x1,x2

,

…,xn)是

充分统计量,则对

任一无偏预计,令,则也是

无偏预计,且

华东师范大学茆诗松概率论与数理统计教程参数预计课件第37页37/105

定理6.3.2说明:假如无偏预计不是充分统计量函数,则将之对充分统计量求条件期望能够得到一个新无偏预计,该预计方差比原来预计方差要小,从而降低了无偏预计方差。换言之,考虑

估计问题只需要在基于充分统计量函数中进行即可,该说法对全部统计推断问题都是正确,这便是所谓充分性标准。

华东师范大学茆诗松概率论与数理统计教程参数预计课件第38页38/105例6.3.1

设x1,x2

,

…,xn是来自b(1,p)样本,则是p充分统计量。为预计

=p2,可令因为,所以是

无偏预计。这个只使用了两个观察值预计并不好.下面我们用Rao-Blackwell定理对之加以改进:求关于充分统计量条件期望,得华东师范大学茆诗松概率论与数理统计教程参数预计课件第39页39/1056.3.2

最小方差无偏预计

定义6.3.1

对参数预计问题,设是

一个无偏预计,假如对另外任意一个

无偏预计,在参数空间Θ上都有

则称是

一致最小方差无偏预计,简记为

UMVUE。假如UMVUE存在,则它一定是充分统计量函数。华东师范大学茆诗松概率论与数理统计教程参数预计课件第40页40/105

定理6.3.3

设x=(x1,x2

,

…,xn)是来自某总体一个样本,是

一个无偏预计,假如对任意一个满足E(

(x))=0

(x),都有则是

UMVUE。关于UMVUE,有以下一个判断准则。华东师范大学茆诗松概率论与数理统计教程参数预计课件第41页41/105

例6.3.2

设x1,x2

,…,xn是来自指数分布Exp(1/

)样本,则T=x1+…+xn是

充分统计量,而是

无偏预计。设

=

(x1,x2,

…,xn)是0任一无偏预计,则两端对

求导得这说明,从而,由定理6.3.3,它是

UMVUE。华东师范大学茆诗松概率论与数理统计教程参数预计课件第42页42/1056.3.3Cramer-Rao不等式

定义6.3.2

设总体概率函数P(x,

),

∈Θ满足以下条件:

(1)参数空间Θ是直线上一个开区间;

(2)支撑S={x:P(x,

)>0}与

无关;

(3)导数对一切

∈Θ都存在;

(4)对P(x,

),积分与微分运算可交换次序;

(5)期望存在;则称为总体分布费希尔(Fisher)

信息量。

华东师范大学茆诗松概率论与数理统计教程参数预计课件第43页43/105

费希尔信息量是数理统计学中一个基本概念,很多统计结果都与费希尔信息量相关。如极大似然预计渐近方差,无偏预计方差下界等都与费希尔信息量I(

)相关。I(

)种种性质显示,“I(

)越大”可被解释为总体分布中包含未知参数

信息越多。华东师范大学茆诗松概率论与数理统计教程参数预计课件第44页44/105例6.3.3

设总体为泊松分布P(

)分布,则于是华东师范大学茆诗松概率论与数理统计教程参数预计课件第45页45/105例6.3.4

设总体为指数分布,其密度函数为

能够验证定义6.3.2条件满足,且于是华东师范大学茆诗松概率论与数理统计教程参数预计课件第46页46/105定理6.3.4(Cramer-Rao不等式)

设定义6.3.2条件满足,x1,x2

,

…,xn是来自该总体样本,T=T(x1,x2

,

…,xn)是g(

)任一个无偏预计,存在,且对

∈Θ

中一切

,微分可在积分号下进行,则有华东师范大学茆诗松概率论与数理统计教程参数预计课件第47页47/105

上式称为克拉美-罗(C-R)不等式;

[g’(θ)]2/(nI(

))称为g(

)无偏预计方差

C-R下界,简称g(

)C-R下界。尤其,对

无偏预计,有;

假如等号成立,则称T=T(x1,

…,xn)是

g(

)有效预计,有效预计一定是UMVUE。华东师范大学茆诗松概率论与数理统计教程参数预计课件第48页48/105例6.3.5

设总体分布列为p(x,

)=

x(1-

)1-x,x=0,1,它满足定义6.3.2全部条件,能够算得该分布费希尔信息量为,若x1,x2,

…,xn是该总体样本,则

C-R下界为(nI(

))-1=

(1-

)/n。因为是

无偏预计,且其方差等于

(1-

)/n,抵达C-R下界,所以是

有效预计,它也是

UMVUE。华东师范大学茆诗松概率论与数理统计教程参数预计课件第49页49/105例6.3.6

设总体为指数分布Exp(1/

),它满足定义6.3.2全部条件,例6.3.4中已经算出该分布费希尔信息量为I(

)=

-2,若x1,x2,

…,xn是样本,则

C-R下界为(nI(

))-1=

2/n。而是

无偏预计,且其方差等于

2/n,抵达了C-R下界,所以,是

有效预计,它也是

UMVUE。华东师范大学茆诗松概率论与数理统计教程参数预计课件第50页50/105能抵达C-R下界无偏预计不多:例6.3.7

设总体为N(0,

2),满足定义6.3.2条件,且费希尔信息量为,令,

C-R下界为,

UMVUE为其方差大于C-R下界。这表明全部

无偏预计方差都大于其C-R下界。华东师范大学茆诗松概率论与数理统计教程参数预计课件第51页51/105费希尔信息量主要作用表示在极大似然预计。

定理6.3.5

设总体X有密度函数p(x;

),

∈Θ,

Θ为非退化区间,假定

(1)对任意x,偏导数,和对全部

∈Θ都存在;

(2)∀

∈Θ,有,其中函数F1(x),F2(x),F3(x)可积.华东师范大学茆诗松概率论与数理统计教程参数预计课件第52页52/105(3)∀

∈Θ,

若x1,x2

,

…,xn是来自该总体样本,则存在未知参数

极大似然预计,且含有相合性和渐近正态性:

华东师范大学茆诗松概率论与数理统计教程参数预计课件第53页53/105§6.4

贝叶斯预计

6.4.1

统计推断基础

经典学派观点:统计推断是依据样本信息对总体分布或总体特征数进行推断,这里用到两种信息:总体信息和样本信息;贝叶斯学派观点:除了上述两种信息以外,统计推断还应该使用第三种信息:先验信息。

华东师范大学茆诗松概率论与数理统计教程参数预计课件第54页54/105(1)总体信息:总体分布提供信息。(2)样本信息:抽取样本所得观察值提供信息。(3)先验信息:人们在试验之前对要做问题在经验上和资料上总是有所了解,这些信息对统计推断是有益。先验信息即是抽样(试验)之前相关统计问题一些信息。普通说来,先验信息起源于经验和历史资料。先验信息在日常生活和工作中是很主要。华东师范大学茆诗松概率论与数理统计教程参数预计课件第55页55/105

基于上述三种信息进行统计推断统计学称为贝叶斯统计学。它与经典统计学差异就在于是否利用先验信息。贝叶斯统计在重视使用总体信息和样本信息同时,还注意先验信息搜集、挖掘和加工,使它数量化,形成先验分布,参加到统计推断中来,以提升统计推断质量。忽略先验信息利用,有时是一个浪费,有时还会导出不合理结论。华东师范大学茆诗松概率论与数理统计教程参数预计课件第56页56/105

贝叶斯学派基本观点:任一未知量

都可看作随机变量,可用一个概率分布去描述,这个分布称为先验分布;在取得样本之后,总体分布、样本与先验分布经过贝叶斯公式结合起来得到一个关于未知量

新分布—后验分布;任何关于

统计推断都应该基于

后验分布进行。华东师范大学茆诗松概率论与数理统计教程参数预计课件第57页57/1056.4.2

贝叶斯公式密度函数形式

总体依赖于参数

概率函数在贝叶斯统计中记为P(x|

),它表示在随机变量θ取某个给定值时总体条件概率函数;

依据参数

先验信息可确定先验分布

(

);

从贝叶斯观点看,样本x1,x2

,

…,xn产生分两步进行:首先从先验分布

(

)产生一个样本

0,然后从P(x|

0)中产生一组样本。这时样本联合条件概率函数为,这个分布综合了总体信息和样本信息;华东师范大学茆诗松概率论与数理统计教程参数预计课件第58页58/105

0

是未知,它是按先验分布

(

)产生。为把先验信息综合进去,不能只考虑

0,对

其它值发生可能性也要加以考虑,故要用

(

)进行综合。这么一来,样本x1

,

…,xn和参数

联合分布为:h(x1,x2

,

…,xn,

)=p(x1,x2

,

…,xn

)

(

),

这个联合分布把总体信息、样本信息和先验信息三种可用信息都综合进去了;华东师范大学茆诗松概率论与数理统计教程参数预计课件第59页59/105在没有样本信息时,人们只能依据先验分布对

作出推断。在有了样本观察值x1,x2

,

…,xn之后,则应依据h(x1,x2

,

…,xn,

)对

作出推断。因为h(x1,x2

,…,xn,

)=

(

x1,x2

,…,xn)m(x1,x2

,…,xn),其中是x1,x2

,

…,xn边际概率函数,它与

无关,不含

任何信息。所以能用来对

作出推断仅是条件分布

(

x1,x2

,

…,xn),它计算公式是华东师范大学茆诗松概率论与数理统计教程参数预计课件第60页60/105

这个条件分布称为

后验分布,它集中了总体、样本和先验中相关

一切信息。

后验分布

(

x1,x2

,

…,xn)计算公式就是用密度函数表示贝叶斯公式。它是用总体和样本对先验分布

(

)作调整结果,贝叶斯统计一切推断都基于后验分布进行。

华东师范大学茆诗松概率论与数理统计教程参数预计课件第61页61/1056.4.3

贝叶斯预计基于后验分布

(

x1,x2

,

…,xn)对

所作贝叶斯预计有各种,惯用有以下三种:使用后验分布密度函数最大值作为

点预计,称为最大后验预计;使用后验分布中位数作为

点预计,称为后验中位数预计;使用后验分布均值作为

点预计,称为后验期望预计。用得最多是后验期望预计,它普通也简称为贝叶斯预计,记为。华东师范大学茆诗松概率论与数理统计教程参数预计课件第62页62/105例6.4.2

设某事件A在一次试验中发生概率为

,为预计

,对试验进行了n次独立观察,其中事件A发生了X次,显然X

b(n,

),即假若我们在试验前对事件A没有什么了解,从而对其发生概率

也没有任何信息。在这种场所,贝叶斯本人提议采取“同等无知”标准使用区间(0,1)上均匀分布U(0,1)作为

先验分布,因为它取(0,1)上每一点机会均等。贝叶斯这个提议被后人称为贝叶斯假设。华东师范大学茆诗松概率论与数理统计教程参数预计课件第63页63/105

由此即可利用贝叶斯公式求出

后验分布。详细以下:先写出X和

联合分布然后求X边际分布最终求出

后验分布最终止果说明

XBe(x+1,n-x+1),其后验期望预计为

(6.4.4)华东师范大学茆诗松概率论与数理统计教程参数预计课件第64页64/105一些场所,贝叶斯预计要比极大似然预计更合理一点。比如:“抽检3个全是合格品”与“抽检10个全是合格品”,后者质量比前者更信得过。这种差异在不合格品率极大似然预计中反应不出来(两者都为0),而用贝叶斯预计两者分别是0.2和0.83。由此能够看到,在这些极端情况下,贝叶斯预计比极大似然预计更符合人们理念。华东师范大学茆诗松概率论与数理统计教程参数预计课件第65页65/105例6.4.3

设x1,x2

,

…,xn是来自正态分布N(,02)一个样本,其中

02已知,

未知,假设

先验分布亦为正态分布N(

,2),其中先验均值

和先验方差

2均已知,试求

贝叶斯预计。解:样本x分布和

先验分布分别为华东师范大学茆诗松概率论与数理统计教程参数预计课件第66页66/105由此能够写出x与

联合分布其中,。若记则有华东师范大学茆诗松概率论与数理统计教程参数预计课件第67页67/105

注意到A,B,C均与

无关,由此轻易算得样本边际密度函数应用贝叶斯公式即可得到后验分布这说明在样本给定后,

后验分布为

N(B/A,1/A),即

华东师范大学茆诗松概率论与数理统计教程参数预计课件第68页68/105

后验均值即为其贝叶斯预计:它是样本均值与先验均值

加权平均。华东师范大学茆诗松概率论与数理统计教程参数预计课件第69页69/1056.4.4

共轭先验分布

若后验分布

(

x)与

(

)属于同一个分布族,则称该分布族是

共轭先验分布(族)。二项分布b(n,

)中成功概率

共轭先验分布是贝塔分布Be(a,b);泊松分布P(

)中均值

共轭先验分布是伽玛分布Ga(

,

);在方差已知时,正态均值

共轭先验分布是正态分布N(,2);在均值已知时,正态方差

2共轭先验分布是倒伽玛分布IGa(

,

)。华东师范大学茆诗松概率论与数理统计教程参数预计课件第70页70/105§6.5

区间预计

6.5.1区间预计概念

定义6.5.1

是总体一个参数,其参数空间为Θ,x1,x2

,

…,xn是来自该总体样本,对给定一个

(0<

<1),若有两个统计量和,若对任意

∈Θ,有(6.5.1)华东师范大学茆诗松概率论与数理统计教程参数预计课件第71页71/105

则称随机区间[]为

置信水平为1-

置信区间,或简称[]是

1-

置信区间.

和分别称为

(双侧)置信下限和置信上限.

这里置信水平1-

含义是指在大量使用该置信区间时,最少有100(1-

)%区间含有

华东师范大学茆诗松概率论与数理统计教程参数预计课件第72页72/105例6.5.1

设x1,x2

,

…,x10是来自N(,

2)样本,则

置信水平为1-

置信区间为其中,,s分别为样本均值和样本标准差。这个置信区间由来将在6.5.3节中说明,这里用它来说明置信区间含义。若取

=0.10,则t0..95(9)=1.8331,上式化为华东师范大学茆诗松概率论与数理统计教程参数预计课件第73页73/105

现假定

=15,

2=4,则我们能够用随机模拟方法由N(15,4)产生一个容量为10样本,以下即是这么一个样本:14.8513.0113.5014.9316.9713.8017.953313.3716.2912.38

由该样本能够算得从而得到

一个区间预计为该区间包含

真值--15。现重复这么方法100次,能够得到100个样本,也就得到100个区间,我们将这100个区间画在图6.5.1上。华东师范大学茆诗松概率论与数理统计教程参数预计课件第74页74/105

由图6.5.1能够看出,这100个区间中有91个包含参数真值15,另外9个不包含参数真值。图6.5.1

置信水平为0.90置信区间华东师范大学茆诗松概率论与数理统计教程参数预计课件第75页75/105

=0.50,我们也能够给出100个这么区间,见图6.5.2。能够看出,这100个区间中有50个包含参数真值15,另外50个不包含参数真值。图6.5.2

置信水平为0.50置信区间华东师范大学茆诗松概率论与数理统计教程参数预计课件第76页76/105定义6.5.2

沿用定义6.5.1记号,如对给定

(0<

<1),对任意

∈Θ,有

(6.5.2)

称为

1-

同等置信区间。

同等置信区间是把给定置信水平1-

用足了。常在总体为连续分布场所下能够实现。华东师范大学茆诗松概率论与数理统计教程参数预计课件第77页77/105定义

若对给定

(0<

<1)和任意

∈Θ,有,则称为

置信水平为1-

(单侧)置信下限。假如等号对一切

∈Θ成立,则称为

1-

同等置信下限。若对给定

(0<

<1)和任意

∈Θ,有,则称为

置信水平为1-

(单侧)置信上限。若等号对一切

∈Θ成立,则称为1-

同等置信上限。单侧置信限是置信区间特殊情形。所以,寻求置信区间方法能够用来寻找单侧置信限。华东师范大学茆诗松概率论与数理统计教程参数预计课件第78页78/1056.5.2枢轴量法

结构未知参数

置信区间最惯用方法是枢轴量法,其步骤能够概括为以下三步:1.设法结构一个样本和

函数G=G(x1,x2

,

…,xn,

)使得G分布不依赖于未知参数。普通称含有这种性质G为枢轴量。2.适当地选择两个常数c,d,使对给定

(0<

<1)有P(c≤G≤d)=1-

3.假如能将c≤G

≤d进行不等式等价变形化为则[,]是

1-

同等置信区间。华东师范大学茆诗松概率论与数理统计教程参数预计课件第79页79/105关于置信区间结构有两点说明:

满足置信度要求c与d通常不唯一。若有可能,应选平均长度抵达最短c与d,这在G分布为对称分布场所通常轻易实现。实际中,选平均长度尽可能短c与d,这往往极难实现,所以,常这么选择c与d,使得两个尾部概率各为

/2,即P(G<c)=P(G>d)=

/2,这么置信区间称为等尾置信区间。这是在G分布为偏态分布场所常采取方法。华东师范大学茆诗松概率论与数理统计教程参数预计课件第80页80/105例6.5.2

设x1,x2

,

…,xn是来自均匀总体U(0,

)一个样本,试对给定

(0<

<1)给出

1-

同等置信区间。解:(1)取x(n)作为枢轴量,其密度函数为p(y;

)=nyn

,0<y<1;

(2)x(n)/

分布函数为F(y)=yn,0<y<1,故P(c≤x(n)/

≤d)=dn-cn,所以我们能够适当地选择c和d满足dn-cn=1-

华东师范大学茆诗松概率论与数理统计教程参数预计课件第81页81/105(3)利用不等式变形可轻易地给出

1-

同等置信区间为[x(n)/d,x(n)/c],该区间平均长度为。不难看出,在0≤c<d≤1及dn-cn=1-

条件下,当d=1,c=

时,取得最小值,这说明是

置信水平1-

为最短置信区间。华东师范大学茆诗松概率论与数理统计教程参数预计课件第82页82/1056.5.3单个正态总体参数置信区间

一、

已知时

置信区间在这种情况下,枢轴量可选为,c和d应满足P(c≤G≤d)=

(d)-

(c)=1-

,经过不等式变形可得该区间长度为。当d=-c=u1-

/2时,d-c抵达最小,由此给出了同等置信区间为

[,]。(6.5.8)这是一个以为中心,半径为对称区间,常将之表示为。华东师范大学茆诗松概率论与数理统计教程参数预计课件第83页83/105例6.5.3

用天平秤某物体重量9次,得平均值为(克),已知天平秤量结果为正态分布,其标准差为0.1克。试求该物体重量0.95置信区间。解:此处1-

=0.95,

=0.05,查表知u0.975=1.96,于是该物体重量

0.95置信区间为,从而该物体重量0.95置信区间为

[15.3347,15.4653]。华东师范大学茆诗松概率论与数理统计教程参数预计课件第84页84/105例6.5.4

设总体为正态分布N(

,1),为得到

置信水平为0.95置信区间长度不超出1.2,样本容量应为多大?解:由题设条件知

0.95置信区间为

其区间长度为,它仅依赖于样本容量n而与样本详细取值无关。现要求,马上有n(2/1.2)2u21-

/2.现1-

=0.95,故u1-

/2=1.96,从而n(5/3)21.962=

10.6711。即样本容量最少为11时才能使得

置信水平为0.95置信区间长度不超出1.2。华东师范大学茆诗松概率论与数理统计教程参数预计课件第85页85/105二、

2未知时

置信区间

这时可用t统计量,因为,所以t能够用来作为枢轴量。完全类似于上一小节,可得到

1-

置信区间为

此处是

2无偏预计。华东师范大学茆诗松概率论与数理统计教程参数预计课件第86页86/105例6.5.5

假设轮胎寿命服从正态分布。为预计某种轮胎平均寿命,现随机地抽12只轮胎试用,测得它们寿命(单位:万公里)以下:4.684.854.324.854.615.025.204.604.584.724.384.70

此处正态总体标准差未知,可使用t分布求均值置信区间。经计算有=4.7092,s2=0.0615。取

=0.05,查表知t0.975(11)=2.,于是平均寿命0.95置信区间为(单位:万公里)华东师范大学茆诗松概率论与数理统计教程参数预计课件第87页87/105

在实际问题中,因为轮胎寿命越长越好,所以能够只求平均寿命置信下限,也即结构单边置信下限。因为由不等式变形可知

1-

置信下限为

将t0.95(11)=1.7959代入计算可得平均寿命

0.95置信下限为4.5806(万公里)。华东师范大学茆诗松概率论与数理统计教程参数预计课件第88页88/105三、

2置信区间

取枢轴量,因为

2分布是偏态分布,寻找平均长度最短区间极难实现,普通都用等尾置信区间:采取

2两个分位数

2

/2(n-1)和

21-

/2(n-1),在

2分布两侧各截面积为

/2部分,使得由此给出

21-

置信区间为华东师范大学茆诗松概率论与数理统计教程参数预计课件第89页89/105例6.5.6某厂生产零件重量服从正态分布N(,

2),现从该厂生产零件中抽取9个,测得其重量为(单位:克)45.345.445.145.345.545.745.445.345.6

试求总体标准差

0.95置信区间。解:由数据可算得s2=0.0325,(n-1)s2=8

0325=0.26.

查表知

20.025(8)=2.1797,

20.975(8)=17.5345,代入可得

20.95置信区间为

从而

0.95置信区间为:[0.1218,0.3454]。华东师范大学茆诗松概率论与数理统计教程参数预计课件第90页90/105

在样本容量充分大时,能够用渐近分布来结构近似置信区间。一个经典例子是关于百分比p置信区间。6.5.4大样本置信区间

华东师范大学茆诗松概率论与数理统计教程参数预计课件第91页91/105

设x1,…,xn是来自b(1,p)样本,有对给定

,,经过变形,可得到置信区间为

其中记

=u21-

/2,实用中通常略去

/n项,于是可将置信区间近似为华东师范大学茆诗松概率论与数理统计教程参数预计课件第92页92/105例6.5.7

对某事件A作120次观察,A发生36次。试给出事件A发生概率p0.95置信区间。解:此处n=120,=36/120=0.3

而u0.975=1.96,于是p0.95(双侧)置信下限和上限分别为故所求置信区间为[0.218,0.382]华东师范大学茆诗松概率论与数理统计教程参数预计课件第93页93/105例6.5.8

某传媒企业欲调查电视台某综艺节目收视率p,为使得p1-

置信区间长度不超出d0,问应调查多少用户?解:这是关于二点分布百分比p置信区间问题,由(6.5.11)知,1-

置信区间长度为这是一个随机变量,但因为,所以对任意观察值有。这也就是说p1-

置信区间长度不会超出。现要求p置信区间长度不超出d0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论