参数估计讲解_第1页
参数估计讲解_第2页
参数估计讲解_第3页
参数估计讲解_第4页
参数估计讲解_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 参数估计点估计的概述两个正态总体 的均值差和方 差比区间估计统计推断是数理统计的重要组成部分 , 它包括统计估计和假设检验两类基本问题 . 统计 估计是根据样本的信息对总体分布的概率特性(如分布类型、参数等)作出估计 , 统计估计 又分为参数估计和非参数估计 , 本章只讨论参数估计问题 .在实际问题中 ,经常遇到随机变量 X (即总体 X )的分布函数的形式已知 ,但它的一个 或者多个参数未知的情形 , 此时写不出确切的概率密度函数 . 若通过简单随机抽样 , 得到总体 X的一个样本观测值 (x1,x2, ,xn), 我们自然会想到利用这一组数据来估计这一个或多个 未知参数 . 诸如此

2、类 , 利用样本去估计总体未知参数的问题, 称为参数估计问题 . 参数估计问题有两类 , 分别是点估计和区间估计 .第一节 点估计的概述用一个数值估计某个参数 , 这种估计就是点估计 . 比方说我们要考察某医院新出生婴儿 的男女比例 , 抽查了 100 个婴儿 , 按后估计出这个比例值为 0.83, 这个比值就是“比例”这个 未知数的点估计值 .定义 8.1 设总体 X 的分布函数 F(x,q)形式已知 ,其中q 是待估计的参数 ,点估计问题 就是利用样本 (X1,X2, , X n) ,构造一个统计量 q?=q?(X1,X2, ,Xn)来估计 q,我们称 q?(X1,X2, ,Xn)为q 的

3、点估计量 , 它是一个随机变量 . 将样本观测值 (x1,x2, ,xn)代入 估计量 q?=q?(X1,X2, ,Xn), 就得到它的一个具体数值 q?(x1, x2 , , xn) ,这个数值称为 q 的点估计值 .一、矩估计法矩估计法的基本思想是用样本矩估计总体矩 . 因为由大数定理知 , 当总体的 k 阶矩存 在时 , 样本的 k 阶矩依概率收敛于总体的 k 阶矩 .我们假设总体 X 的分布函数为 F(x;q1,q2, ,qk),其中q1,q2, ,qk 是待估参数 .若总 体 X为连续型随机变量 ,设密度函数为 f(x;q1,q2, ,qk ) ;若总体 X 为离散型随机变量 , 设

4、分布律为 P X = x = p(x;q1,q2, ,qk). (X1,X2, , X n )是来自总体的样本 . 假设总体 X的1阶至 k阶原点矩 mi都存在,则有i +? imi =E(Xi)=-? xif(x;q1,q2, ,qk)dx = mi (q1,q2, ,qk)(X为连续型) i =1,2, ,k 或 mi =E(Xi)=? xip(x;q1,q2, ,qk)=mi(q1,q2, ,qk) (X 为离散型) i =1,2, ,k x?R其中 R是 X所有可能取值的集合) .一般来说 ,他们是q1,q2, ,qk的函数.根据样本矩依概率收敛于总体矩 , 样本矩的连续函数依概率收敛

5、于总体矩的连续函数, 我们可以用样本矩作为总体矩的估计量 , 而样本矩的连续函数作为总体矩的连续函数的估计量.即1 n im?i = Ai = 1? X ij i =1,2, ,kn j=1得方程组mi(q1,q2, ,qk)=m?i i =1,2, ,k解得q?i = q?i ( X1, X 2 , ,Xn) i =1,2, ,k称q?i 为qi 的矩估计量 , 这种方法称为矩估计法 .相应的估计值称为矩估计值 , 矩估计量与矩估计值统称为矩估计 .例 8.1 设总体 X 服从区间 (q1,q2) 上的均匀分布 , 即密度函数为1? ,q1 x 0是未知参数 , 求l 的最大似然估计 .解

6、设(x1,x2, , xn )是样本 (X1,X2, , X n )的一组观测值 . 于是似然函数为nL(l ) = L(l ;x1,x2,.,xn) =?i=1(lxxi!e-l ) = ln x!n? xii =1l -nl e-nl ? xi i=1两边取对数得对数似然函数为lnL(l )=-nl +lnl 邋xi -i =1nln(xi !)i=1dln L(l ) =-n+1?nl i=1dlxi=0l?= x0 l?=x解方程得且d2lnL(l )且2dl 2从而得出 l最大似然估计为l?=X.22例 8.4设(X1,X2, , X n )是来自正态总体 N(m,s2)的样本,其中

7、 m,s 2是未知参数 .求 m,s 2 的最大似然估计 .解 由已知得样本的似然函数为2 2 1 1 n 2 L(m,s2) = L (m,s 2 ; x1, x2,., xn) = (2ps 2)n/2 exp- 2s2 ?i=1(xi -m)2两边取对数得2nln L(m,s 2) =- ln(2p)-2nlns21 n 22? (xi -m)2 2s i =1分别关于 m和s 2求偏导数 ,得似然方程组? ln L ? ? m ? ln L ?2 ?s2s12? (xi -m)=0s i=1n 1 n 22sn2 +2s14?i=1(xi -m)2 =0解这一方程组得n?i=11=?m

8、?1由微积分知识易验证以上所求为 m和 s 2 的最大似然估计由上例我们可以总结出求最大似然估计的一般步骤如下:(1) 写出似然函数 L(q1,q2, ,qk) ;(2) 写出对数似然函数 lnL(q1,q2, ,qk ) ,及方程组 ? lnL(q) =0,i =1,2, ,k; ? qi3)解上述方程组得最大似然估计值 q?i =q?i(x1,x2 , ,xn )(i =1,2, ,k)值得注意的是 ,通过取对数得到对数似然方程 , 进而解对数似然方程组求最大值点的方 法并不总是有效的 , 因此应该具体问题具体分析 .例 8.5 设总体 X 服从均匀分布 , 即概率密度函数为f(x;q)

9、=?q?0,0 xq其他0q ? ,q未知求参数 q 的最大似然估计解 设(X1,X2, ,Xn) 是来自总体的样本 ,似然函数为1L(q ; x1, x2 , ,xn)= n,0xi ?q,i 1,2, ,nqn显然L(q;x1,x2 , ,xn)关于q单调,要使 L(q;x1,x2,.,xn)达到最大,就要使q达到最小 ,由于0xi ? x(n) m1ianxxi ? q,i 1,2,., n 所以 q 的最大似然估计值为q?= m1iaxn xi q 的最大似然估计量为q?(X1, X2,., Xn ) = m1iaxn Xi .习题 8-1A组1. 设总体 X 的分布律为X-102P2

10、qq1- 3q1 其中 0q , 求 q 的矩估计 .32. 一批灯泡的使用寿命的抽取样本如下(单位:h ) :1458, 1395, 1565, 1614, 1351, 1490, 1478, 1382, 1536, 1496 试用矩估计法针对这批灯泡的平均寿命m及寿命方差 s 2 做出矩估计3.设(X1,X2, , X n )是来自总体 X 的样本, X 服从参数为 p的几何分布 ,即 X 的分 布律为k-1PX =k = p(1- p)k-1 (k =1,2, )其中 p未知, 0 p 1,求 p的最大似然估计4. 已知总体 X 的密度函数为f(x;q) =?q xq -1, ?0,0x

11、0.求:(1) 参数 q 的矩估计;(2) 参数q 的最大似然估计 B组1. 设总体的分布律为P X = k = (k -1)q 2(1- q )k -2 求 q 的矩估计和最大似然估计 .2. 设总体 X 的密度函数为(k =2,3, ,0 q 0.求q1,q2 的最大似然估计3. 已知总体 X 是离散型随机变量,X 的可能取值为 0,1,2, 且 P X = 2 =(1-q)2,E(X) = 2(1- q ) ( q为未知参数 ).求:(1) X 的概率分布;(2) 对 X 抽取容量为 10 的样本,其中 5 个取 1,3 个取 2,2 个取 0. 求 q 的矩估计值和最大 似然估计值 .

12、4. 已知总体 X 的密度函数为f(x) =?l e-l (x-2) ?0,x2其他l 0.(X1,X2, , X n)是来自总体 X 的样本 ,Y = X2.(1) 求Y的期望 E(Y)(记 E(Y) =b)(2) 求 l 的矩估计量和最大似然估计量(3) 利用上述结果求 b 的最大似然估计量第二节点估计量的评选标准对于总体的同一个未知参数 , 由于采用的估计方法不同 ,可能会产生多个不同的估计量 . 这就提出了一个问题 ,当总体的同一个参数存在不同的估计量时 , 究竟采用哪一个更好?这 涉及到用什么样的标准来评价估计量的好坏问题 ,对此, 我们介绍几个常用的评价标准: 无偏 性、有效性和一

13、致性 .一、无偏性在评价一个估计量的好坏时 , 我们当然希望估计量与被估参数越接近越好, 但估计量是一个随机变量 , 它的取值随样本的观测值而变 , 有时与被估参数的真值近些 , 有时远些 , 我们 只能从平均意义上看估计量是否与被估参数尽量接近 , 最好是等于被估参数 . 于是有无偏估 计量的概念 .定义 8.3 设q?=q?(X1,X2,.,Xn)是未知参数的估计量 ,若对任意 q蜵 有E(q?) =q ,则称 q?(X1, X2 ,., Xn )是q 的无偏估计量例 8.6 设 (X1,X2,.,Xn)是来自总体 X 的样本,作为总体均值的估计有1 nnnT1 =X =1? Xi , T

14、2 = X1, T3 =邋aiXi (ai 0,且 ai =1),n i=1i=1i=1试证 T1 , T2 , T3 都是无偏估计量证 因为 X1,X2,., X n相互独立且服从同一分布 ,故有E(Xi)= E(X) (i=1,2, ,n) 由数学期望的性质知1nE(T1) = ? E(Xi)= E(X)n i=1E(T2)=E(X1) =E(X)nnE(T3) =邋aiE(Xi) =E(X)( ai) =E(X) i=1 i=1因此T1 , T2 , T3都是无偏估计量 . 由此可见一个未知数可以有多个不同的无偏估计量 .例 8.7 设总体的方差 D(X) 存在,试证样本二阶中心矩 B2

15、是总体方差 D ( X )的有偏估2计, 而样本方差 S2是总体方差 D(X) 的无偏估计 .证明nn1 2 1 2 2E(B2)= E 邋(Xi - X)2 = EXi2 -(X)2n i=1 n i=11 n 2 2 2 2=E( ? Xi2)-E(X)2 = E(X2)-E(X)2n i=122=D(X)+E(X)2 -D(X)- E(X)21 n-1 =D(X)- D(X) = D(X) nn所以 B2是总体方差 D(X)的有偏估计 .而2 1 n 2 nS2 =? (Xi - X)2 =B2n -1 i=1 n-1所以E(S2) =E( n B2)= n E(B2)= n n-1D(

16、X)= D(X) n-1 n-1 n-1 n即而样本方差S2 是总体方差 D(X) 的无偏估计 .、有效性由例 8.6 可以看出一个参数的无偏估计量不是唯一的 , 假若参数 q 有两个无偏估计量 q?1和q?2 ,我们认为其观测值更密集在参数 q 真值附近的一个较为理想 .由于方差是随机变量取 值与其数学期望的偏离程度的度量 ,所以无偏估计以方差小者为好 . 这就引出了评价估计量 好坏的另一标准有效性 .定义 8.4 设q?1 =q?1(X1,X2,., Xn)和q?2 =q2(X1,X2,.,Xn) 都是q 的无偏估计量 ,若 对 q蜵 , 有 D(q?1 ) D(q?2 ) ,且至少有一个

17、 q蜵 使不等式严格成立 ,则称 q?1比q?2更有 效.例 8.8 在本节例 8.6 中,设总体 X 的方差 D(X)存在,试问T1, T2, T3哪一个更有效?1解 D(T1) = D(X)nD(T2) = D(X)n 2 1D(T3)= D(X)(? ai2) ? D(X) i=1 n注意 , 此处利用了不等式n n n n(邋ai bi ) ai ? bi 得到了 ? ai 3i=1i =1i=1 i=1 n所以 T1 是三个估计量中最有效的估计量三、一致性无偏性和有效性都是针对无偏估计而言的 , 且都是在样本容量固定的前提下提出的.我们自然希望随着样本容量的增大 , 一个估计量的值稳

18、定于待估参数的真值 . 这样, 对一个好的 估计量又有下面一致性的要求 .定义 8.4 设 q?= q?( X1, X2 ,., Xn )是q的估计量 ,若对于任意 q 蜵 ,满足对任意 eX0, 有 lim P q?- q 0f(x,q)=qq 0为常数?0,x 0( X1, X2,., Xn )是来自总体 X的样本 .证明:样本均值 X 是 q 的无偏估计量 .3设q?是q的无偏估计 ,且有 D(q?) 0.证明: q?2不是q 2的无偏估计 .2 2 2 1 n 24. (X1,X2,., Xn )是来自总体 X N(0,s 2)的样本 ,其中s 2未知,令s?2 = ? Xi2,n i

19、=1试证 s? 是 s 的一致估计量 .B组1. (X1,X2,., Xn )是来自总体 X的样本 ,设E(X)= m,D(X )=sn-1(1) 确定常数 c,使c? (Xi+1 -Xi)2是s 2的无偏估计量(2) 确定常数 c,使 X2 - cS2是m2的无偏估计2.设q?1和q?2是q的两个独立的无偏估计量 ,假定 D(q?1)=2D(q?2),求常数 C1,C2,使 q? = C1q?1 + C2q?2为q的无偏估计量 ,并使得 D(q?)达到最小 .223.设总体 X N(m1,s2),总体Y N (m2,s 2) ,设(X1, X2 ,., X n1 )是来自总体 X的 样本,

20、(Y1,Y2,.,Yn2)是来自总体 Y的样本,两样本独立 .(1) 求参数 m1 - m2 的一个无偏估计 .2 1n12 n22 2(2) 证明: Sw2 =邋(Xi - X)2 + (Yi -Y)2是s2的无偏估计 .n1 +n2 - 2 i=1i=14. 设(X1,X2,.,Xn1)是来自均匀总体 U (0,q )的样本 ,证明q的最大似然估计满足一 致性要求 .第三节 区间估计前面,我们讨论了参数的点估计 , 它是用样本算得的一个估计值去估计未知参数,这个估计值仅仅是未知参数的一个近似值 ,但其精度如何点估计本身不能回答 . 实际中,度量一个点 估计的精度的最直观的方法是给出一个未知

21、参数的一个区间 , 这就是我们常常用到的参数的 另一种估计形式:区间估计 . 如估计某人的身高在 1.70 1.72之间, 估计, 某项费用在 1000 1400 之间等等 .一、区间估计问题定义 8.5 设总体 X 的分布中含有一个未知参数 q, q (X1,X2, ,Xn) 和q(X1,X2,Xn)由样本 (X1,X2, , X n )确定的两个统计量 .对给定的 a(0 a 1),如果对参数 q 的任何值 , 都有Pq q q ?1-a则称随机区间 (q ,q )为参数 q的置信水平为 1- a的置信区间 ,q,q 分别称为 q的双侧置信 区间的置信下限和置信上限 , 1-a 称为置信水

22、平或置信度 .当 X 为连续型随机变量时 ,对于给定的 a(0 a 1), 我们总是可以按要求给出随机区 间(q,q),使得 Pq q q =1-a .而当 X 为离散型随机变量时 ,对于给定 a(0a 1),常常找不到区间 (q,q),使得 Pq q q 恰好为 1- a .此时我们去找区间 (q,q),使得Pq q q 至少为 1- a ,且尽可能的接近 1-a.置信区间的含义: 若反复抽样多次 (各次的样本容量相等 , 均为 n), 每一组样本值确定 一个区间 (q ,q ) ,每个这样的区间要么包含 q的真值 ,要么不包含 q的真值 .按伯努利大数定 理,在这么多的区间中 ,包含q真值

23、的约占 100(1- )% ,不包含 q真值的约仅占 100a%. 例 如:若 a = 0.01,反复抽样 1000次,则得到的 1000个区间中 ,不包含 q真值的约为 10个.在对参数 q 作区间估计时 , 常提出以下两个要求:(1)可信度高 ,即随机区间 (q,q )要以很大的概率包含真值 q;(2)估计精度高 , 即要求区间的长度尽可能的小 .而这两个要求往往是矛盾的 , 区间估计的理论和方法的基本问题就是在已有的样本信 息下 ,找出较好的估计方法 ,以尽量提高可信度和精度 . 奈曼提出的原则是:先保证可信度 , 在这个前提下尽量提高精度 .例 8.9 设总体 X N(m,s2), s

24、2已知, m未知, (X1,X2, , Xn)是来自总体的样本 , 求 m的置信水平为 1-a 的置信区间 .解 我们知道样本均值 X 是总体均值 m 的无偏估计量 , X 的取值大部分集中于 m 附近 , 显然以很大概率包含 m的区间也应包含 X ,因此,我们从 X 出发,构造 m的置信区间 .又因X -m N(0,1)8.1sn所以PX -msnua =1- assPX -ua m X +ua =1- a2 n 2 n其中 ua 是标准正态分布的上侧 a 分位点(如图 8.1 ),这样我们得到了 m的置信水平为 1-a22的置信区间(X -ua s ,X +ua s ). 8.22 n 2

25、 n图 8.1由此,我们给出求未知参数 q 的置信区间的具体做法如下:(1)寻找一个样本 (X1,X2, ,Xn)和q的函数 W =W(X1,X2, ,Xn;q),使得W的 分布不依赖于 q和其他未知参数 ,称具有这种性质的函数 W为枢轴量 .(2)对于给定的置信水平 1-a ,定出两个常数 a,b使得Pa W(X1,X2, ,Xn;q)b =1- a.将a W(X1,X2, ,Xn;q)b变形为q(X1,X2, ,Xn)q q (X1,X2, ,Xn),(q,q )即是q 的置信水平为 1- a的置信区间 .需要注意的是 ,置信水平为 1- a的置信区间并不是唯一的 .如例 8.9 中,如果

26、取 1-a = 0.95即a = 0.05 ,查表可得 ua = u0.025 = 1.96 . 于是, 我们得到一个置信水平为 0.95 的置信 2区间(X -1.96s ,X +1.96 s ) . nn8.3事实上,对于任意给定的 a1,a2(0 a2 a1 1),只要a2 +a1 =a = 0.05 ,记相应的上侧a1和a2分位点分别为 ua1 ,ua2 ,则所确定的区间s(X -ua2n ,X+ua1 s ) 都是 m的置信水平为 95%的置信区间 . 例如 a1 = 0.03,a2 = 0.02 , 得置信区间为(X - 2.06s ,X +1.88 s )nn8.4那么在众多的区

27、间中 , 我们应该使用哪一个呢?注意到置信水平相同的区间的长度往往是不同的 ,例如区间 8.3 的长度为 2? 1.96s3.92 s区间 8.4 的长度为(1.88 + 2.06)ss= 3.94nn根据我们对置信区间的要求, 我们应该在置信水平一定的前提下 ,选取区间长度最短的那一个区间 .二、单个正态总体的区间估计 由于我们遇到的很多总体都是服从或是近似服从正态分布的 , 且很多统计量的极限分布 也是正态分布 ,因此,我们专门介绍正态总体 N ( m,s 2 )中的参数 m和s 2的区间估计 .设已给 定置信水平 1-a, (X1,X2, , X n )是来自总体 N(m,s 2)的样本

28、. X 和S2分别是样本均值 和样本方差 .1. 均值 m的区间估计X -m(1)s 2已知时 ,由本节例 1中的枢轴量已得到 m的一个置信水平为 1-a 的置信s , 1 s n m 1- a区间为(X -ua,X +ua) . 8.52 n 2 n例 8.10 对 50 名大学生的午餐费进行调查 , 得样本均值为 4.10 元, 假如总体的标准差为1.75 元 , 求大学生的午餐费 m的置信水平为 0.95 的置信区间 .解 m的置信区间为 (X -ua s ,X +ua s ) ,a = 0.05 , ua = u0.025 =1.96 , s = 1.75 ,2 n 2 n 2n =5

29、0, x =4.1. 由 8.5 式得 m的置信水平为 0.95 的置信区间为(3.61,4.59) .222)s 2未知时,此时不能用 8.2 式给出的区间 ,因为其中含有未知参数 s .考虑到 S2是 s 2的无偏估计量 ,因此将 8.1 式中的 s 换成 S= S2 ,有抽样分布定理知8.6XS -mt(n-1).SnX -m使用 作为枢轴量可得 ( 参见图 8.2)S图 8.2X-mP-ta (n-1) S ta (n -1) =1-a2 S n 2SPX -ta(n-1) m X +ta (n-1)2 n 2=1- a于是得到 m的一个置信水平为 1-a 的置信区间为SS(X -ta

30、 (n-1),X +ta (n-1) ).2 n 2 n8.7例 8.11 为估计一物体的重量 m,用天平秤了 5 次, 得结果(克): 5.52, 5.48, 5.64, 5.51, 5.43.假定测量值是正态的 ,求 m的一个置信水平为 0.95 的置信区间 .解 由已知 X = 5.516, S = 0.07765a = 0.05 , ta(4) = t0.025 (4)2所以由 8.7 式得 m的一个置信水平为 0.95= 2.7764的置信区间为S(X -ta (n-1) S ,X +ta (n-1)2 n 2= (5.420,5.612) .22. 方差 s 2 的区间估计根据实际

31、问题的需要 , 只介绍 m未知的情况 .22S2 *是s 2的无偏估计量 ,因此有抽样分布定理知(n-s12)S2 c2(n-1) . s8.8f (x)2xO2/2 (n 1)/212 / 2( n 1)图 8.32Pc12-a (n-1)2(n-1)S22 c a (n -1) =1- a2Pc(na22-(1n)-S12)s2c12-a (n-1) =1-a.这就得到方差 s 2 的一个置信水平为1-a 的置信区间为n-1)S2n-1)(n -1) S2c12-a 2 (n-1)单位: mm)如下:s2 的置信水平为 95%的置例 8.12 从某厂生产的滚珠中随机抽取 10 个 , 测得

32、滚珠的直径14.6 15.0 14.7 15.1 14.9 14.8 15.0 15.1 15.2 14.8若滚珠直径服从正态分布 N(m,s2),若 m未知,求滚珠直径方差信区间 .m未知 , 计算样本方差 S2 = 0.0373 , 置信水平 1-a = 0.95, a = 0.05 , 自由度n-1=2 2 2 29,查表可得 ca/2 (n-1) = c 0.025 (9) = 19.0 , 1-/2 (n-1) = 0.975 (9) = 2.70.则方差 s 2 的置信水平为 95%的置信区间为琪骣(n -1)S2 , (n-1)S2 =骣9创0.0373, 9 0.0373琪桫c

33、a2/2 ( n-1) , c12-a/2 (n -1) =桫琪 19.0 , 2.70即(0.0177,0.1243).三、两个正态总体的区间估计在实际中常遇到下面的问题: 已知产品的某一质量指标服从正态分布 , 但由于原料、设 备条件、工艺过程的改变等因素 ,引起总体均值、 总体方差有所改变 .我们需要知道这些变化 有多大 , 这就需要考虑两个正态总体均值差或方差比的估计.2设(X1,X2, ,Xn1) 与(Y1,Y2, ,Yn2) 分别来自于两个相互独立的正态总体N(m1,s12)和 N (m2 ,s 22 )的样本 , X , Y , SX2 , SY2分别是两个样本的均值和方差 ,给

34、定置信水平1- a(0 a 1).1. 两个总体均值 m1 - m2的区间估计221)s12和s 22均已知因为 X , Y 分别为 m1和 m2 的无偏估计, 故 X -Y 是 m1-m2 的无偏估计. 由 于X22 s1s 2n2N(m1 , 1 ), Y N(m2, 2 ), 且 X 和Y 相互独立 , 所以22s1 s 2X -Y N(m1 -m2, 1 + 2 )1 2 n1 n2继而U = (X -Y)-(m1-m2) N(0,1)22 s12 +s 22 n1 n2取U 为枢轴量 , 即得到m1 - m2 的一个置信水平为 1- a(0 a 1) 的置信区间为X -Y +ua/2

35、2+s2n28.92) s 12 =s 22 =s 2 , s 2 未知 .由上一章抽样分布定理知T=(X -Y)(- m1 -m2)11+n1 n2 t(n1 +n2 -2)其中Sw2(n1 -1)SX2 +(n2 -1)SY2n1 +n2 -2取 T 为枢轴量 , 可得 m1 - m2 的一个置信水平为 1- a(0 a 1) 的置信区间11(n1 +n2 -2)Sw+n1 n2X -Y +ta/2(n1 +n2 -2)Sw n1 +n1n1 n28.10例 8.13 某工厂一条生产灯泡的流水线 , 在工艺改变前后分别抽检若干件产品的寿命, 得数据为2改变前: n1 = 6,X = 136

36、4, SX2 =156;改变后: n2 = 9,Y = 1407, SY2 =172.假定灯泡寿命服从正态分布 , 且工艺改变前后方差不变 , 试求工艺改变前后平均寿命之差的 置信度为 95%的置信区间 .解 Sw(n1 -1)SX +(n2 -1)SYn1 +n2 -25?156 8?17213= 12.88 ,a = 0.05 , ta/2 (13) = 2.16,11Y -X = 43 , 2.16创12.88+ =14.7 ,69骣琪桫琪Y所以由 8.10 式得 m1 -m2 的一个置信水平为 0.95 的置信区间为- X ? ta/2 (13)Sw11= (43 -14.7 , 43

37、 +14.7) = (28.3 , 57.3). n1 n22.两个总体方差比 s12 s22 的区间估计我们仅讨论 m1和 m2 都未知的情况 ,由抽样分布定理知取 F 为枢轴量得 ( 如图 8.4)图 8.4P F1-a/2 (n1 -1,n2 -1) F Fa/2 (n1 -1,n2 -1) =1- aP睚镲铪2 XY Fa/2 (n1 -1,n2 -1)s 2 S2s1 SX 2 2 =1- s 2 SY F1-a /2 (n1 -1,n2 -1)于是得到 s12 s22 的一个置信水平为 1-a(0 a 1)的置信区间琪骣SX21 , SX21 .琪桫SY Fa/2 (n1 -1,n

38、2 -1)SY F1-a /2 (n1 -1, n2 -1)22例 8.14 两 个相互 独立 的正态 总体 X N(m1,s2) , Y N(m2,s2) , 各 取 样2 2s 2本, n1 =25, SX2 = 12.7 , n2 =20, SY2 = 10.8 ,求 12 的置信度为 95% 的置信区间 .s22s2解12 的置信区间为SX212SY F1-a /2 (n1 -1,n2 -1)s22= (0.347 , 2.737).习题 8-3A组1. 设某种油漆的 9 个样品,其干燥时间(以 h 为单位)分别为:6.0 5.7 5.8 6.5 7.0 6.3 5.6 6.1 5.0

39、设干燥时间总体服从正态分布 N(m,s 2 ).(1) 若由以往经验 s = 0.6(h) ,求 m的置信水平为 0.95 的置信区间 ;(2) 若 s 未知,求 m的置信水平为 0.95 的置信区间 .2. 用两种工艺(或原料) A 和 B 生产同一种橡胶制品为比较两种工艺下产品的耐磨 性, 从两种工艺的产品中各随意抽取了若干件,测得如下数据:工艺 A : 185.82, 175.10, 217.30, 213.86, 198.40 工艺 B : 152.10, 139.89, 121.50, 129.96, 154.82, 165.60 假设两种工艺下产品的耐磨性 X 和 Y都服从正态分布

40、:X N(a,sx2),Y N(b,sy2),(1) 建立 s x s y 的置信度为 0.95 置信区间;(2) 建立 a-b 的置信度为 0.95 置信区间 .3. 设某自动包装机包装洗衣粉 ,其重量服从正态分布 , 随机抽查 12袋, 测得重量分别为: 1001 1004 1003 997 999 1000 1004 1000 996 1002 998 999 求这批洗衣粉重量方差和标准差的置信区间(a = 0.05) .4. 某大学从 A、B两市招收的新生中分别抽 5名、 6名男生 ,测得身高值如下: A市: 172 178 180.5 174 175B市: 174 171 176.5

41、 168 172.5 170设两市学生身高分别服从 N(m1,s 2),N(m2,s 2 ).求m1 - m2的置信水平为 0.95 的置信区间5. 为比较,两种型号步枪子弹的枪口速度 ,随机的取型号子弹 10发, 得到枪口速 度的平均值为 x1 = 500m / s,标准差为 s1 = 1.10m / s;随机的取型号子弹 20发,得到枪 口速度的平均值为 x2 =496m/ s ,标准差为 s2 = 1.20m / s .假设两总体都可认为近似的服 从正态分布 , 且方差相等 . 求两总体均值差 m1 -m2 的一个置信水平为 0.95 的置信区间 . B组1. 一次等级考试 ,因急于评估

42、试卷质量 ,教师先随机抽取 36份试卷批改 , 平均分为 72分, 标准差 13.2 分, 系主任要求在 90%的可信度下 , 对全体考生的平均成绩做一个区间估计 .2. 某公司要对下一年职工医疗费情况作个预算 ,通常医疗费的标准差为 120元. 现要求 在 95%的置信度下 ,保证所估计的总体平均值在加减 40元的范围内 . 问应该取多大的样 本?3. 假定吸烟者买烟的月支付近似服从正态分布 ,一机构随机抽取了容量为 26 的样本进 行调查 ,得到样本平均值为 80元,样本标准差为 20元.试以 95%的把握估计全部吸烟者月平 均烟钱支出的置信区间 .4. 随机地从 A批导线中抽 4 根,又

43、从 B批导线中抽 5根,测得电阻值为 :A 批导线 :0.143 0.142 0.143 0137B 批导线 :0.140 0.142 0.136 0.138 0.140设测定数据分别来自分布 N ( m1, s 12 ), N (m2 , s 22 ) ,且样本相互独立 . m1, m2均未知 , 222(1) s12 =s22 =s 2未知时 ,求 m1 - m2的一个置信水平为 0.95 的置信区间 .22(2) 求方差比 s 12 s 22 的置信水平为 0.95 的置信区间 .第四节 单侧置信区间前面介绍的置信区间中置信限都是双侧的,但在有些实际问题 , 人们所关心的只是参数在一个方向的界限 .例如对于设备、元件的使用寿命来说 , 平均寿命过长没什么问题 ,过短就 有问题了 . 这时,可将置信上限取为 +, 而只着眼于置信下限 ,这样求得的置信区间称为单 侧置信区间 .定义 8.6 给定a(0 a q ? 1-a称随机区间 (q,+? )是q 的置信水平为 1- a的单侧置信区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论