第8讲 第七章 参数估计_第1页
第8讲 第七章 参数估计_第2页
第8讲 第七章 参数估计_第3页
第8讲 第七章 参数估计_第4页
第8讲 第七章 参数估计_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章第七章 参数估计参数估计第一节第一节参数的点估计参数的点估计第二节第二节估计量的评选标准估计量的评选标准第三节第三节区间估计区间估计第四节第四节第一节第一节 参数的点估计参数的点估计点估计概念点估计概念求估计量的方法求估计量的方法课堂练习课堂练习小结小结 引言引言 上一章,我们介绍了总体、样本、上一章,我们介绍了总体、样本、简单随机样本、统计量和抽样分布的概简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理出了几个重要的抽样分布定理 . 它们是它们是进一步学习统计推断的基础进一步学习统计推断的基础 . 总体总体

2、样样本本统计量统计量描述描述作出推断作出推断研究统计量的性质和评价一个统计推断的研究统计量的性质和评价一个统计推断的优良性,完全取决于其优良性,完全取决于其抽样分布抽样分布的性质的性质.随机抽样随机抽样 现在我们来介绍一类重要的统计推断问题现在我们来介绍一类重要的统计推断问题 参数估计问题是利用从总体抽样得到的信息来估参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些函数计总体的某些参数或者参数的某些函数. 参数估计参数估计估计废品率估计废品率估计新生儿的体重估计新生儿的体重估计湖中鱼数估计湖中鱼数 估计降雨量估计降雨量在参数估计问题在参数估计问题中,假定总体分中,假定总

3、体分布形式已知,未布形式已知,未知的仅仅是一个知的仅仅是一个或几个参数或几个参数.这类问题称为这类问题称为参数估计参数估计.参数估计问题的一般提法参数估计问题的一般提法X1,X2,Xn要依据该样本对参数要依据该样本对参数 作出估计作出估计, 或估计或估计 的某个已知函数的某个已知函数 .)( g现从该总体抽样,得样本现从该总体抽样,得样本 设有一个统计总体设有一个统计总体 , 总体的分布函数总体的分布函数为为F( x, ) ,其中,其中 为未知参数为未知参数 ( 可以是向量可以是向量) . 参数估计参数估计点估计点估计区间估计区间估计)1 . 0,(2 N(假定身高服从正态分布(假定身高服从正

4、态分布 ) 设这设这5个数是个数是:1.65 1.67 1.68 1.78 1.69 估计估计 为为1.68, 这是这是点估计点估计.这是这是区间估计区间估计.估计估计 在区间在区间 1.57, 1.84 内,内,例如我们要估计某队男生的平均身高例如我们要估计某队男生的平均身高. 现从该总体选取容量为现从该总体选取容量为5的样本,我们的任的样本,我们的任务是要根据选出的样本(务是要根据选出的样本(5个数)求出总体均值个数)求出总体均值 的估计的估计. 而全部信息就由这而全部信息就由这5个数组成个数组成 . 一、点估计概念一、点估计概念随机抽查随机抽查100个婴儿个婴儿 , ,得得100个体重数

5、据个体重数据 10,7,6,6.5,5,5.2, 呢呢 ? ? 据此据此, ,我们应如何估计我们应如何估计和和而全部信息就由这而全部信息就由这100个数组成个数组成 .例例1 已知某地区新生婴儿的体重已知某地区新生婴儿的体重 , , 2,XN ( ,) 未知未知 为估计为估计 : 我们需要构造出适当的样本的函数我们需要构造出适当的样本的函数 T(X1,X2,Xn) , 每当有了样本,就代入该函数中算出一个值,用来每当有了样本,就代入该函数中算出一个值,用来作为作为 的估计值的估计值 . 把样本值代入把样本值代入T(X1,X2,Xn) 中,中,估计值估计值 .T(X1,X2,Xn) 称为参数称为

6、参数 的的点估计量点估计量,得到得到 的一个的一个点点 我们知道我们知道, ,若若 , ,由大数定律由大数定律, , 1|1|lim1 niinXnP自然想到把样本体重的平均值作为总体平均体重的自然想到把样本体重的平均值作为总体平均体重的一个估计一个估计. .,11niiXnXniiXXnS122)(11样本体重的平均值样本体重的平均值 2,XN ()E X 则则 .用样本体重的均值用样本体重的均值 估计估计 . .X 类似地,用样本体重的方差类似地,用样本体重的方差 估计估计 . .22S使用什么样的统计量去估计使用什么样的统计量去估计 ? 可以用样本均值可以用样本均值;也可以用样本中位数也

7、可以用样本中位数;还可以用别的统计量还可以用别的统计量 .问题是问题是: 二、寻求估计量的方法二、寻求估计量的方法1. 矩估计法矩估计法2. 极大似然法极大似然法3. 最小二乘法最小二乘法4. 贝叶斯方法贝叶斯方法 这里我们主要介绍前面两种方法这里我们主要介绍前面两种方法 .1. 矩估计法矩估计法 矩估计法是英国统计学家矩估计法是英国统计学家K.皮尔逊皮尔逊最早提出来的最早提出来的 .由辛钦定理由辛钦定理 ,若总体若总体 的数学期望的数学期望 有限有限, E X X则有则有11niiXXn ()PE X 11nkkiiAXn ()(1,2,)PkkE Xk 12(,)kg A AA12(,)P

8、kg 其中其中 为连续函数为连续函数 .g 这表明这表明 , 当样本容量很大时当样本容量很大时 , 在统计上在统计上 , 可以用可以用 用样本矩去估计总体矩用样本矩去估计总体矩 . 这一事实导出矩估计法这一事实导出矩估计法.定义定义 用样本原点矩估计相应的总体原点矩用样本原点矩估计相应的总体原点矩 , 又又用样本原点矩的连续函数估计相应的总体原点矩的用样本原点矩的连续函数估计相应的总体原点矩的连续函数连续函数, 这种参数点估计法称为这种参数点估计法称为矩估计法矩估计法 . 理论依据理论依据: 大数定律大数定律矩估计法的具体做法如下矩估计法的具体做法如下 设总体的分布函数中含有设总体的分布函数中

9、含有k个未知参数个未知参数 , 那么它的前那么它的前k阶矩阶矩 , 一般一般12,k 12,k 都是这都是这 k 个参数的函数个参数的函数,记为:记为:i=1,2, ,k从这从这 k 个方程中解出个方程中解出j=1,2,kj=1,2,k12(,)iik 12(,)jjk 那么用诸那么用诸 的估计量的估计量 Ai 分别代替上式中的诸分别代替上式中的诸 , ii12(,)jjkA AA j即可得诸即可得诸 的的矩估计量矩估计量 :矩估计量的观察值称为矩估计量的观察值称为矩估计值矩估计值 . 例例2 设总体设总体 X 在在 a , b 上服从均匀分布上服从均匀分布 , a , b 未知未知 . 是来

10、自是来自 X 的样本的样本 , 试求试求 a , b 的矩估计量的矩估计量 .1,nXX解解 1E X 2ab 22E X 2()12ba 2()()D XE X2()4ab 即即 1221212()abba 解得解得于是于是 a , b 的矩估计量为的矩估计量为 21213()a21213()b213() ,niiaXXXn 213()niibXXXn 样本矩样本矩总体矩总体矩解解 1E X 22E X 2()()D XE X 例例3 设总体设总体 X 的均值的均值 和方差和方差 都存都存在在 , 未知未知 . 是来自是来自 X 的样本的样本 , 试试求求 的矩估计量的矩估计量 .1,nXX

11、2(0) 2, 2, 22解得解得1AX1 2221于是于是 的矩估计量为的矩估计量为 2, 22222111niiAAXXn 211()niiXXn 样本矩样本矩总体矩总体矩 矩法的优点矩法的优点是简单易行是简单易行,并不需要事先知道总体并不需要事先知道总体是什么分布是什么分布 . 缺点缺点是,当总体类型已知时,没有充分利用分是,当总体类型已知时,没有充分利用分布提供的信息布提供的信息 . 一般场合下一般场合下,矩估计量不具有唯一性矩估计量不具有唯一性 . 其主要原因在于建立矩法方程时,选取那些总体其主要原因在于建立矩法方程时,选取那些总体矩用相应样本矩代替带有一定的随意性矩用相应样本矩代替

12、带有一定的随意性 . 2. 最大似然法最大似然法 它是在总体类型已知条件下使用的一种参数估它是在总体类型已知条件下使用的一种参数估计方法计方法 . 它首先是由德国数学家它首先是由德国数学家高斯高斯在在1821年提出的年提出的 . GaussFisher 然而然而,这个方法通这个方法通常归功于英国统计学家常归功于英国统计学家费歇费歇 尔尔. 费歇费歇 尔尔在在1922年重新发现了年重新发现了这一方法,并首先研究了这种方这一方法,并首先研究了这种方法的一些性质法的一些性质 .最大似然法的基本思想最大似然法的基本思想 先看一个简单例子先看一个简单例子:一只野兔从前方窜过一只野兔从前方窜过 .是谁打中

13、的呢?是谁打中的呢? 某位同学与一位猎人一起外某位同学与一位猎人一起外出打猎出打猎 .如果要你推测,如果要你推测,你会如何想呢你会如何想呢?只听一声枪响,野兔应声倒下只听一声枪响,野兔应声倒下 . 你就会想,只发一枪便打中你就会想,只发一枪便打中, 猎人命中的概率猎人命中的概率一般大于这位同学命中的概率一般大于这位同学命中的概率 . 看来这一枪是猎人看来这一枪是猎人射中的射中的 . 这个例子所作的推断已经体现了极大似然法的这个例子所作的推断已经体现了极大似然法的基本思想基本思想 . 最大似然估计原理:最大似然估计原理: 当给定样本当给定样本X1,X2,Xn时,定义时,定义似然函数似然函数为:为

14、: 设设X1,X2,Xn是取自总体是取自总体X的一个样本,样本的一个样本,样本的联合密度的联合密度(连续型)或联合分布律连续型)或联合分布律 (离散型离散型)为为 f (x1,x2, ,xn ; ) . )( Lf (x1, x2 , xn; )这里这里 x1, x2 , xn 是样本的观察值是样本的观察值 . 似然函数:似然函数:)(max)( LL 最大似然估计法最大似然估计法就是用使就是用使 达到最大值的达到最大值的 去估计去估计 . )( L 称称 为为 的的最大似然估计值最大似然估计值 . 看作参数看作参数 的函数,它可作为的函数,它可作为 将以多大可将以多大可能产生样本值能产生样本

15、值 x1, x2, ,xn 的一种度量的一种度量 .)( L )( L f (x1,x2, xn; ) 而相应的而相应的统计量统计量称为称为 的的最大似然估计量最大似然估计量 .1(,)n XX两点说明:两点说明: 1、求似然函数、求似然函数L( ) 的最大值点,可以应用的最大值点,可以应用微积分中的技巧。由于微积分中的技巧。由于ln(x)是是 x 的增函数的增函数, lnL( )与与L( )在在 的同一值处达到它的最大值,假定的同一值处达到它的最大值,假定 是一实数,且是一实数,且lnL( )是是 的一个可微函数。通过的一个可微函数。通过求解方程:求解方程: 可以得到可以得到 的的MLE .

16、 0)(lndLd 若若 是向量,上述方程必须用方程组代替是向量,上述方程必须用方程组代替 . 2、用上述求导方法求参数的、用上述求导方法求参数的MLE有时行不有时行不通,这时要用最大似然原则来求通,这时要用最大似然原则来求 .L(p)= f (x1, x2, xn; p ) 下面举例说明如何求最大似然估计下面举例说明如何求最大似然估计 例例5 设设X1,X2,Xn是取自总体是取自总体 XB(1, p) 的一个的一个样本,求参数样本,求参数p的最大似然估计量的最大似然估计量.nixxiipp11)1 (解:解:似然函数似然函数为为: ppXi110)1ln()()ln()(ln11pxnpxp

17、Lniinii对数似然函数对数似然函数为:为:niiniixnxpppL11)1()(niiniixnxpp11)1 (即为即为 p 的的最大似然估计值最大似然估计值 .对对p求导并令其为求导并令其为0,)(111)(ln11niiniixnpxpdppLd=0得得xxnpnii11从而从而 p 的的最大似然估计量最大似然估计量为为 111 (,)nniip XXXXn (4) 在最大值点的表达式中在最大值点的表达式中, 用样本值代入就用样本值代入就得参数的得参数的最大似然估计值最大似然估计值 .求最大似然估计求最大似然估计(MLE)的一般步骤是:的一般步骤是: (1) 由总体分布导出样本的联

18、合分布率由总体分布导出样本的联合分布率(或联或联合密度合密度); (3) 求似然函数求似然函数L( ) 的最大值点的最大值点(常常转化为常常转化为求求ln L( )的最大值点的最大值点) ,即,即 的的MLE; (2) 把样本联合分布率把样本联合分布率 ( 或联合密度或联合密度 ) 中自变中自变 量看成已知常数量看成已知常数,而把参数而把参数 看作自变量看作自变量,得到似然得到似然 函数函数L( ); 例例6 设总体设总体 X N( ) , 未知未知 . 是来自是来自 X 的样本值的样本值 , 试求试求 的最大似然估计量的最大似然估计量 .1,nxx2, 2, 2, 似然函数为似然函数为 解解

19、X 的概率密度为的概率密度为 xexfx,21)(222)( 222()211( ,)2ixniL e 222()211( ,)2ixniL e 2222211(2 )()exp() 2nnniix 于是于是22211ln(2 )ln()222niinnLnLx 令令211()0niiLnLxn 2222211()022()niinLnLx 11niixxn 2211()niixxn 解得解得的最大似然估计量的最大似然估计量为为2, ,X 2211()niiXXn 解:似然函数为解:似然函数为例例7 设设X1,X2,Xn是取自总体是取自总体X的一个样本的一个样本为未知参数其它 , 0,1)()

20、(xexfXx其中其中 0,求求 的最大似然估计的最大似然估计. ,其它,, 01),(1)(niixxeLi i=1,2,n其它, 0min,11)(1 ixnxenii对数似然函数为对数似然函数为niixnL1)(1ln),(ln 解:似然函数为解:似然函数为其它,, 01),(1)(niixxeLi i=1,2,n对对 分别求偏导并令其为分别求偏导并令其为0,niixn11 nL),(ln=0 (2)由由(1)得得niixnL12)(1),(ln =0 (1)对数似然函数为对数似然函数为niixnL1)(1ln),(ln 用求导方法无法最终确定用求导方法无法最终确定用最大似然原则来求用最

21、大似然原则来求 .、 , inix1*min 对对, 0),(,min Lxi是是故使故使 达到最大的达到最大的 即即 的的MLE ),( L , niixn1*1 于是于是 取其它值时,取其它值时,. 0),( L 即即 为为 的的MLE .*, ,且是且是 的增函数的增函数 其它, 0min,1),(1)(1ixnxeLnii 第二次捕出的有记号的鱼数第二次捕出的有记号的鱼数X是是r.v, X具有超具有超几何分布:几何分布:,SNkSrNkrkXP 为了估计湖中的鱼数为了估计湖中的鱼数N,第一次捕上,第一次捕上 r 条鱼条鱼 ,做上记号后放回做上记号后放回. 隔一段时间后隔一段时间后, 再

22、捕出再捕出 S 条鱼条鱼 , 结果发现这结果发现这S条鱼中有条鱼中有k条标有记号条标有记号.根据这个信息,根据这个信息,如何估计湖中的鱼数呢?如何估计湖中的鱼数呢?最后,我们用最大似然法估计湖中的鱼数最后,我们用最大似然法估计湖中的鱼数),min(0rSk 应取使应取使L(N;k)达到最大的达到最大的N,作为作为N的极大似然估计的极大似然估计. 但用对但用对N求导的方法相当困难求导的方法相当困难, 我们考虑比值我们考虑比值:) 1;();(NkXPNkXP把上式右端看作把上式右端看作 N 的函数,记作的函数,记作 L( N ; k) .SNkSrNkrkXP)()(kSrNNrNSN经过简单的

23、计算知,这个比值大于或小于经过简单的计算知,这个比值大于或小于1,kSrN 或或kSrN 而定而定 .由由) 1;();(NkXPNkXP)()(kSrNNrNSN经过简单的计算知,这个比值大于或小于经过简单的计算知,这个比值大于或小于 1,kSrN 或或kSrN 而定而定 .由由 这就是说,当这就是说,当N增大时,序列增大时,序列P(X=k;N)先是上升先是上升而后下降而后下降; 当当N为小于为小于 的最大整数时的最大整数时, 达到达到最大值最大值 . 故故N的极大似然估计为的极大似然估计为.kSrN kSr 例例1 设总体设总体X的概率密度为的概率密度为其它, 010,) 1()(xxxf

24、 其中其中 是未知参数是未知参数 , X1 , X2 , , Xn 是取自是取自 X 的样本的样本,1 求参数求参数 的矩估计的矩估计.三、三、 例例1 设总体设总体X的概率密度为的概率密度为其它, 010,) 1()(xxxf 其中其中 是未知参数是未知参数 , X1 , X2 , , Xn 是取自是取自 X 的样本的样本,1 求参数求参数 的矩估计的矩估计.解解 样本矩样本矩总体矩总体矩解得解得11211 的矩估计量为的矩估计量为 故故211XX 1E X 10(1)x x dx 110(1)xdx 12 解解 由密度函数知由密度函数知例例 2 设设X1,X2,Xn是取自总体是取自总体 X

25、 的一个样本的一个样本为未知参数其它 , 0,1)()(xexfXx其中其中 0 , 求求 的矩估计的矩估计. , X具有均值为具有均值为 的指数分布的指数分布 即即E(X- ) = 2 D(X- )= E(X)= 2 D(X)= 故故解得解得 X niiXXn12)(1 niiXXn12)(1也就是也就是 E(X)= 2 D(X)=()D X ()()E XD X的矩估计量为的矩估计量为于是于是, 解解 似然函数似然函数为为niixL11)( 11)( niinx) 10(ix对数似然函数为对数似然函数为niixnL1ln) 1(ln)(ln ni 1例例3 设设X1,X2,Xn是取自总体是

26、取自总体X的一个样本的一个样本其它, 010,)(1xxxfX 求求 的的最大似然估计值最大似然估计值. 其中其中 0,niixndLd1ln)(ln求导并令其为求导并令其为0=0从中解得从中解得1lnniinx 即为即为 的的最大似然估计值最大似然估计值 . 对数似然函数为对数似然函数为niixnL1ln)1(ln)(ln 这一节,我们介绍了参数点估计这一节,我们介绍了参数点估计, 给出了寻求给出了寻求估计量最常用的矩法和极大似然法估计量最常用的矩法和极大似然法 . 参数点估计是用一个确定的值去估计未知的参数点估计是用一个确定的值去估计未知的参数参数 . 看来似乎精确看来似乎精确 ,实际上把

27、握不大,实际上把握不大 . 四、小结四、小结第二节第二节 估计量的评选标准估计量的评选标准无偏性无偏性有效性有效性相合性相合性小结小结样本均值是否是样本均值是否是 的一个好的估计量?的一个好的估计量? (2) 怎样决定一个估计量是否比另一个估计量怎样决定一个估计量是否比另一个估计量“好好”?样本方差是否是样本方差是否是 的一个好的估计量?的一个好的估计量?2 这就需要讨论以下几个问题这就需要讨论以下几个问题: :(1) 我们希望一个我们希望一个“好的好的”估计量具有什么特性?估计量具有什么特性?(3) 如何求得合理的估计量?如何求得合理的估计量?XN( )2, 估计量的评选标准估计量的评选标准

28、 在介绍估计量的评选标准之前,我们必须强在介绍估计量的评选标准之前,我们必须强调指出:调指出: 评价一个估计量的好坏,不能仅仅依据一次试评价一个估计量的好坏,不能仅仅依据一次试验的结果,而必须由多次试验结果来衡量验的结果,而必须由多次试验结果来衡量 . 这是因为估计量是样本的函数这是因为估计量是样本的函数, 是随机变量是随机变量 . 因因此,由不同的观测结果,就会求得不同的参数估计此,由不同的观测结果,就会求得不同的参数估计值值. 因此一个好的估计,应在多次试验中体现出优良因此一个好的估计,应在多次试验中体现出优良性性 . 常用的几条标准是:常用的几条标准是:1无偏性无偏性2有效性有效性3相合

29、性相合性这里我们重点介绍前面两个标准这里我们重点介绍前面两个标准 . 估计量是随机变量,对于不同的样本值会得到估计量是随机变量,对于不同的样本值会得到不同的估计值不同的估计值 . 我们希望估计值在未知参数真值附我们希望估计值在未知参数真值附近摆动,而它的期望值等于未知参数的真值近摆动,而它的期望值等于未知参数的真值. 这就这就导致无偏性这个标准导致无偏性这个标准 . 一、无偏性一、无偏性 )(E则称则称 为为 的的无偏估计无偏估计 . ),(1nXX 设设是未知参数是未知参数 的估计量,若的估计量,若 例如,用样本均值作为总体均值的估计时,例如,用样本均值作为总体均值的估计时,虽无法说明一次估

30、计所产生的偏差,但这种偏差随虽无法说明一次估计所产生的偏差,但这种偏差随机地在机地在0的周围波动,对同一统计问题大量重复使的周围波动,对同一统计问题大量重复使用不会产生系统偏差用不会产生系统偏差 .无偏性是对估计量的一个常见而重要的要求无偏性是对估计量的一个常见而重要的要求 .无偏性的实际意义是指没有系统性的偏差无偏性的实际意义是指没有系统性的偏差 . 例例1 设总体设总体 X 服从参数为服从参数为 的指数分布的指数分布 , 其其概概率密度率密度为为 1,0,0 ,x exfx 其其它它, ,0 其其中中为未知为未知,X1,X2,Xn是取自总体的一个样本是取自总体的一个样本 ,试证试证 和和

31、都是参数都是参数 的的无偏估计无偏估计量量 .1min(,)nXZXX 证证 ,E X E X 所以所以 是参数是参数 的的无偏估计量无偏估计量 .X而而1min(,)nZXX 具有概率密度具有概率密度 min,0,;0 ,nx nexfx 其其它它, ,故知故知 ,E Zn E nZ 即即 也是参数也是参数 的的无偏估计量无偏估计量 .nZ所以无偏估计以方差小者为好所以无偏估计以方差小者为好, 这就引进了这就引进了有效性有效性这一概念这一概念 .的大小来决定二者谁更优的大小来决定二者谁更优 .21)( E和和2 1 一个参数往往有不止一个无偏估计一个参数往往有不止一个无偏估计, 若若 和和都

32、是参数都是参数 的无偏估计量,的无偏估计量,我们可以比较我们可以比较22)( E211)()( ED由于由于222)()( ED二、有效性二、有效性D( ) D( )2 1 则称则称 较较 有效有效 .2 1 都是参数都是参数 的无偏估计量,若对的无偏估计量,若对任意任意 ,),(11nXX ),(122nXX 1 设设和和 且至少对于且至少对于某个某个 上式中的不等号成立,上式中的不等号成立,XnZ故故 较较 有效有效 . 例例2 (续例续例1) 试证试证 当当 n 1 时时 的无偏估计量的无偏估计量 较较 有效有效 .1min(,)nXZXX 证证 2,D X 221111()()nnii

33、iiD XDXD Xnnn故有故有 22,D Zn 而而故有故有 2.D nZ 当当 n 1 时时 , (),D nZD X 三、相合性三、相合性任意任意 ,当,当 时时 依概率收敛依概率收敛于于 , 则称则称 为为 的的相合估计量相合估计量.设设n 是参数是参数 的估计量,若对于的估计量,若对于1(,)n XX1(,)n XX为为 的的相合估计量相合估计量0 对于任意对于任意 , 有有lim|1,nP由辛钦定理由辛钦定理 若总体若总体 的数学期望的数学期望 有限有限, E X X则有则有11nkkiiAXn ()(1,2,)PkkE Xk 12(,)kg A AA12(,)Pkg 其中其中

34、为连续函数为连续函数 .g故故11nkkiiAXn ()(1,2,)kkE Xk为为 的的相合相合估计量估计量 . 若若 为连续函数为连续函数, g12(,)kg A AA12(,)kg 为为 的的相合估计量相合估计量 . 则有则有四、小结四、小结 对于一个未知参数可以提出不同的估计量对于一个未知参数可以提出不同的估计量 , 因此自然提出比较估计量的好坏的问题因此自然提出比较估计量的好坏的问题 ,这就,这就需要给出评定估计量好坏的标准需要给出评定估计量好坏的标准 . 在本节中在本节中, 介绍了评定估计量好坏的三个标介绍了评定估计量好坏的三个标准准 :无偏性、有效性、和相合性无偏性、有效性、和相

35、合性 .第三节第三节 区间估计区间估计置信区间定义置信区间定义置信区间的求法置信区间的求法单侧置信区间单侧置信区间小结小结 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计. 它是用样本算它是用样本算得的一个值去估计未知参数得的一个值去估计未知参数. 但是,点估计值仅仅但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大值的误差范围,使用起来把握不大. 区间估计正好区间估计正好弥补了点估计的这个缺陷弥补了点估计的这个缺陷 . 譬如,在估计湖中鱼数的问题中,若我们譬如,在估计湖中鱼数的问题中,若我们

36、根据一个实际样本,得到鱼数根据一个实际样本,得到鱼数 N 的极大似然估的极大似然估计为计为1000条条. 若我们能给出一个区间,在此区间内我们若我们能给出一个区间,在此区间内我们合理地相信合理地相信 N 的真值位于其中的真值位于其中. 这样对鱼数的这样对鱼数的估计就有把握多了估计就有把握多了. 实际上,实际上,N的真值可能大于的真值可能大于1000条,也可条,也可能小于能小于1000条条.也就是说,我们希望确定一个区间,使我们能也就是说,我们希望确定一个区间,使我们能以比较高的以比较高的可靠程度可靠程度相信它包含真参数值相信它包含真参数值.湖中鱼数的真值湖中鱼数的真值 这里所说的这里所说的“可

37、靠程度可靠程度”是用概率来度量的是用概率来度量的 ,称为置信度或置信水平称为置信度或置信水平. 习惯上把置信水平记作习惯上把置信水平记作 1 ,这里,这里 是一个是一个 很小的正数很小的正数.例如,通常可取置信水平例如,通常可取置信水平 =0.95或或0.9等等. 1根据一个实际样本,由给定的置信水平,我根据一个实际样本,由给定的置信水平,我小的区间小的区间 ,使,使们求出一个尽可能们求出一个尽可能( , ) 1P 置信水平的大小是根据实际需要选定的置信水平的大小是根据实际需要选定的.置信区间置信区间. 称区间称区间 为为 的的 1置信水平为置信水平为 的的( , ) 一、一、 置信区间定义置

38、信区间定义 满足满足设设 是是 一个待估参数,给定一个待估参数,给定, 0 X1,X2,Xn确定的两个统计量确定的两个统计量则称区间则称区间 是是 的置信水平(置信度的置信水平(置信度 )为为 的置信区间的置信区间. 1和和 分别称为置信下限和置信上限分别称为置信下限和置信上限. 若由样本若由样本1P 12(,)n XXX 12(,)n XXX () ( , ) 这里有两个要求这里有两个要求:可见,可见, 对参数对参数 作区间估计,就是要设法找出两个作区间估计,就是要设法找出两个只依赖于样本的界限只依赖于样本的界限(构造统计量构造统计量). 一但有了样本,就把一但有了样本,就把 估计在区间估计

39、在区间 内内 . 12(,)n XXX 12(,)n XXX () ( , ) 可靠度与精度是一对矛盾,一般是可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高在保证可靠度的条件下尽可能提高精度精度.1. 要求要求 以很大的可能被包含在区间以很大的可能被包含在区间 内,就是说,概率内,就是说,概率 要尽可能大要尽可能大 .即要求估计尽量可靠即要求估计尽量可靠. ( , ) P 2. 估计的精度要尽可能的高估计的精度要尽可能的高. 如要求区间长度如要求区间长度 尽可能短,或能体现该要求的其它准则尽可能短,或能体现该要求的其它准则. 在求置信区间时,要查表求分位点在求置信区间时,要查表求

40、分位点.二、置信区间的求法二、置信区间的求法()1P aXb()()1P XbP Xa ()1,2P Xb()2P Xa 设设 , 对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率分布的上 分位点分位点. x01()P Xx定义定义()1P Xx()1P aXb()()1P XbP Xa若若 X 为连续型随机变量为连续型随机变量 , 则有则有12,ax 2.bx ()1,3P Xb2()3P Xa所求置信区间为所求置信区间为122(,)xx 所求所求置信区间为置信区间为1 23,ax 3.bx 1 233(,)xx 标准正态分布的标准正态分布的上上 分位点分位点u()

41、P Uu2( ,)UN 分布的上分布的上 分位数分位数 )(2n 2 自由度为自由度为n的的22( )P n22( )n F分布的上分布的上 分分位数位数 ),(21nnF 自由度为自由度为n1,n2的的12(,)FF n n 12(,)P FF n n N(0, 1)选选 的点估计为的点估计为 , ,X求参数求参数 的置信度为的置信度为 的置信区间的置信区间. 例例1 设设X1,Xn是取自是取自 的样本,的样本, ,2已知 ),(2 N 1nXU 取明确问题明确问题,是求什么是求什么参数的置信区间参数的置信区间?置信水平是多少?置信水平是多少?寻找未知参寻找未知参数的一个良数的一个良好估计好

42、估计.解解 寻找一个待估参数和寻找一个待估参数和统计量的函数统计量的函数 ,要求,要求其分布为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出U取值于任意区间的概率取值于任意区间的概率.,1 对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得,2 u对于给定的置信水平对于给定的置信水平, 根据根据U的分布,确定一的分布,确定一个区间个区间, 使得使得U取值于该区间的概率为置信水平取值于该区间的概率为置信水平. 1|2unXP使使为什么为什么这样取?这样取? 122unXunXP从中解得从中解得,1 对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得,2 u 1|2

43、unXP使使,22 unXunX也可简记为也可简记为2()Xun 122unXunXP于是所求于是所求 的的 置信区间为置信区间为 从例从例1解题的过程,我们归纳出求置信区间解题的过程,我们归纳出求置信区间的一般步骤如下的一般步骤如下:1. 明确问题明确问题, 是求什么参数的置信区间是求什么参数的置信区间? 置信水平置信水平 是多少是多少? 12. 寻找参数寻找参数 的一个良好的点估计的一个良好的点估计T(X1,X2,Xn) 3. 寻找一个待估参数寻找一个待估参数 和估计量和估计量 T 的函数的函数 U(T, ),且其分布为已知且其分布为已知. 1 5. 对对“aS(T, )b”作等价变形作等

44、价变形,得到如下形式得到如下形式: 1P 即即于是于是 就是就是 的的100( )的置信区间的置信区间. ( , ) 1 4. 对于给定的置信水平对于给定的置信水平 ,根据,根据U(T, )的分布,确定常数的分布,确定常数a, b,使得,使得 1 1 P(a U(T, )b) = 可见,确定区间估计很关键的是要寻找一个可见,确定区间估计很关键的是要寻找一个待估参数待估参数 和估计量和估计量T 的函数的函数U(T, ), 且且U(T, )的分布为已知的分布为已知, 不依赖于任何未知参数不依赖于任何未知参数 . 而这与总体分布有关,所以,总体分布的形式是而这与总体分布有关,所以,总体分布的形式是否

45、已知,是怎样的类型,至关重要否已知,是怎样的类型,至关重要. 需要指出的是需要指出的是,给定样本,给定置信水平,给定样本,给定置信水平 ,置信区间也不是唯一的置信区间也不是唯一的. .对同一个参数,我们可以构造许多置信区间对同一个参数,我们可以构造许多置信区间. .,2已知 例如,设例如,设 X1 , , Xn 是取自是取自 的样本的样本 , ),(2 N求参数求参数 的置信水平为的置信水平为 的置的置 1N(0, 1)nXU 0.95 信区间信区间. 由标准正态分布表,对任意由标准正态分布表,对任意a、b,我们可以求得我们可以求得 P( aUb) .N(0, 1)nXU 例如,由例如,由P(

46、-1.96U1.96)=0.95)(ufu96. 196. 195. 096. 1,96. 1nXnX 我们得到我们得到均值均值 的置信水平为的置信水平为 1的的置信区间为置信区间为0.95 由由 P(-1.75U2.33)=0.95这个区间比前面一个要长一些这个区间比前面一个要长一些. .33. 2,75. 1nXnX )(ufu33. 275. 1置信区间为置信区间为我们得到我们得到均值均值 的置信水平为的置信水平为 1的的0.95 我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短. . 类似地,我们可得到若干个不同的置信区间类似地,我们可得到若干个不同的置信区间. . 任意两个数

47、任意两个数a和和b,只要它们的纵标包含,只要它们的纵标包含f(u)下下95%的面积,就确定一个的面积,就确定一个95%的置信区间的置信区间. .0buuu)(ufaaabb950.950.950.在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a =-b时求得的时求得的置信区间的长度为最短置信区间的长度为最短. .0buuu)(ufaaabb950.950.950.a =-b 即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如 分布,分布,F分布,习惯上仍取对称的分位点来计算未知参数分布,习惯上仍取对称的分位点来计算未知参数的置信区间的置信区间. .2 我们可以得到未

48、知参数的的任何我们可以得到未知参数的的任何置信水平小置信水平小于于 1 的的置信区间,并且置信区间,并且置信水平越高,相应的置信水平越高,相应的置置信区间信区间平均长度平均长度越长越长. .)(22n)(221n)(xfx)(2nX 也就是说,要想得到的区间估计可靠度高,也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差区间长度就长,估计的精度就差. .这是一对矛盾这是一对矛盾. . 实用中应在保证足够可靠的前提下,尽量使实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些得区间的长度短一些 .三、单侧置信区间三、单侧置信区间 上述置信区间中置信限都是双侧的,但对于上述置信

49、区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向有些实际问题,人们关心的只是参数在一个方向的界限的界限. 例如对于设备、元件的使用寿命来说,平均寿命例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了过长没什么问题,过短就有问题了. 这时这时, 可将置信上限取为可将置信上限取为+ ,而,而只着眼于置信下限只着眼于置信下限 ,这样求得的,这样求得的置信区间叫置信区间叫单侧置信区间单侧置信区间.于是引入单侧置信区间和置信限的定义:于是引入单侧置信区间和置信限的定义: 满足满足设设 是是 一个待估参数,给定一个待估参数,给定, 0 若由样本若由样本X1,X

50、2,Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的单侧置的单侧置信区间信区间. 1定义定义12(,)n XXX 1P ,) 称为称为 的置信水平为的置信水平为 的单侧置信的单侧置信下限下限. 1 对于任意对于任意 , 满足满足若由样本若由样本X1,X2,Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的单侧置的单侧置信区间信区间. 112(,)n XXX 1P (, 称为称为 的置信水平为的置信水平为 的单侧置信的单侧置信上限上限. 1 对于任意对于任意 ,设灯泡寿命服从正态分布设灯泡寿命服从正态分布. 求灯泡寿命均值求灯泡寿命均

51、值 的的置信水平为置信水平为0.95的单侧置信下限的单侧置信下限. 例例2 从一批灯泡中随机抽取从一批灯泡中随机抽取5只作寿命试只作寿命试验,测得寿命验,测得寿命X(单位:小时)如下:(单位:小时)如下:1050,1100,1120,1250,1280 ) 1(ntnSX 方差方差 未知未知2 解解 的点估计取为样本均值的点估计取为样本均值 , X 对给定的置信水平对给定的置信水平 ,确定分位点,确定分位点) 1( nt 1 1)1(ntnSXP使使即即 1) 1(nSntXP于是得到于是得到 的置信水平为的置信水平为 的单侧置信区间的单侧置信区间为为 1,) 1(nSntX 将样本值代入得将

52、样本值代入得 的置信水平为的置信水平为0.95的单侧置信下限是的单侧置信下限是1065小时小时 的置信水平为的置信水平为 的单侧置信下限为的单侧置信下限为 1即即nSntX) 1( 请自己画一张表,将各种情况下的区间请自己画一张表,将各种情况下的区间估计加以总结估计加以总结. 随机地取炮弹随机地取炮弹 10 发做试验,得炮口速度的发做试验,得炮口速度的标准差标准差 , 炮口速度服从正态分布炮口速度服从正态分布. 求这求这种炮弹的炮口速度的标准差种炮弹的炮口速度的标准差 的置信水平为的置信水平为0.95 的置信区间的置信区间.11()sm s 222(1)(1)nSn 由由2221222(1)(

53、1)(1)1nSP nn 解解 随机地取炮弹随机地取炮弹 10 发做试验,得炮口速度的发做试验,得炮口速度的标准差标准差 , 炮口速度服从正态分布炮口速度服从正态分布. 求这求这种炮弹的炮口速度的标准差种炮弹的炮口速度的标准差 的置信水平为的置信水平为0.95 的置信区间的置信区间.11()sm s 于是得到于是得到 的的置信水平为置信水平为 的置信区间为的置信区间为0.952221211(,)(1)(1)nsnsnn 这里这里20.025,120.975,19,n20.025(9)19.023, 20.975(9)2.700, 11.s 可得到可得到 的的置信水平为置信水平为 的置信区间为的

54、置信区间为1 2222212(1)(1)(,)(1)(1)nSnSnn 2 同学们可通过练习,掌握各种求未知参数的同学们可通过练习,掌握各种求未知参数的 置信区间的具体方法置信区间的具体方法.这一节,我们介绍了区间估计这一节,我们介绍了区间估计.五、小结五、小结单个总体单个总体 的情况的情况两个总体两个总体 的情况的情况课堂练习课堂练习小结小结2( ,)N 211(,),N 222(,)N 一、单个总体一、单个总体 的情况的情况2( ,)N 2( ,),XN 并设并设 为来自总体的为来自总体的 1,nXX样本样本 ,2,X S分别为样本均值和样本方差分别为样本均值和样本方差 .均值均值 的置信

55、区间的置信区间1.12为已知为已知(0,1)XNn 可得到可得到 的的置信水平为置信水平为 的置信区间为的置信区间为 1 22(,)XuXunn2()Xun 或或22为未知为未知(1)Xt nSn 可得到可得到 的的置信水平为置信水平为 的置信区间为的置信区间为 1 此分布不依赖于此分布不依赖于任何未知参数任何未知参数2|(1)1XPtnSn 由由22(1),(1)SSXtnXtnnn2(1)SXtnn或或 例例1 有一大批糖果有一大批糖果.现从中随机地取现从中随机地取 16 袋袋 , 称称得重量得重量(以克计以克计)如下如下: 506 508 499 503 504 510 497 512

56、514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正态分布设袋装糖果的重量近似地服从正态分布,试求总试求总体均值体均值 的置信水平的置信水平0.95为的置信区间为的置信区间.解解 这里这里10.95,20.025,115,n0.025(15)2.1315.t 1611503.75 ,16iixx 16211()6.2022 .15iisxx 2(1)sxtnn于是得到于是得到 的的置信水平为置信水平为 的置信区间为的置信区间为 0.95即即(500.4,507.1)方差方差 的置信区间的置信区间22.222(1)(1)nSn 2221222(1)(1)(1

57、)1nSP nn 由由可得到可得到 的的置信水平为置信水平为 的置信区间为的置信区间为1 2222212(1)(1)(,)(1)(1)nSnSnn 222122(1)(1)(1)1nSPnn 由由可得到标准差可得到标准差 的的置信水平为置信水平为 的置信区间为的置信区间为1 2221211(,)(1)(1)nSnSnn 例例2 有一大批糖果有一大批糖果.现从中随机地取现从中随机地取 16 袋袋 , 称称得重量得重量(以克计以克计)如下如下: 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正

58、态分布设袋装糖果的重量近似地服从正态分布,试求总试求总体标准差体标准差 的置信水平的置信水平0.95为的置信区间为的置信区间.解解 这里这里20.025,120.975,115,n20.025(15)27.488, 20.975(15)6.262. 16211()6.2022 .15iisxx 于是得到于是得到 的的置信水平为置信水平为 的置信区间为的置信区间为0.952221211(,)(1)(1)nSnSnn 即即(4.58,9.60).二、两个总体二、两个总体 的情况的情况211(,),N 222(,)N 设已给定置信水平为设已给定置信水平为 , 并设并设 1 112,nXXX是来自第一

59、个总体的样本是来自第一个总体的样本 , 212,nY YY是来自第二是来自第二个总体的样本个总体的样本 ,这两个样本相互独立这两个样本相互独立 .且设且设 分别分别,X Y为第一、二个总体的样本均值为第一、二个总体的样本均值 , 2212,SS为第一、二为第一、二个总体的样本方差个总体的样本方差 . 两个总体均值差两个总体均值差 的置信区间的置信区间12 1.12212,为已知为已知2111(,),XN n2222(,)YN n因为因为 相互独立相互独立 ,X Y所以所以 相互独立相互独立 . ,X Y故故22121212(,)XYN nn12221212()()(0,1)XYNnn 或或2212212()XYunn于是得到于是得到 的的置信水平为置信水平为 的置信区间为的置信区间为1 12 222212,为已知为已知2121212()()(2)11XYt nnSnn 其中其中2,SS 222112212(1)(1).2nSnSSnn 2121211(2)XYtnnSnn于是得到于是得到 的的置信水平为置信水平为 的置信区间为的置信区间为1 12 其中其中2,SS 222112212(1)(1).2nSnSSnn 例例3 为比较为比较 I , 两种型号步枪子弹的枪口两种型号步枪子弹的枪口速度速度 ,随机地取随机地取 I 型子弹

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论