版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 第第5章章 参数估计参数估计 3. 1 参数估计概述参数估计概述 参数估计是统计推断的基本方法之一。 我们把刻划总体X的某些特征的常数称为 参数,最常用的参数是总体X的数学期望 和方差。假如总体XN( ),则X的 分布是由参数和2确定的,其中, =E(X),2 =D(X)。 2 , 在实际问题中,总体X的参数是未知的,例如 纱厂细纱机上的断头次数XP(),如果求每 只纱绽在某一时间间隔内断头的次数为K的概率, 就需要先确定参数,才能求出所求的概率。又 如,灯泡厂生产的灯泡,由经验知其寿命XN ( ),但是由于生产过程中各种随机因素 的影响,生产出来的灯泡的寿命是不一致的,为 了保证灯泡的质
2、量,必须进行抽样检查,根据样 本所提供的信息,对总体X的分布做出估计,也 即对参数,2做出估计。这类问题称为参数估 计问题。 2 , 参数估计问题,就是要从样本出发构造 一些统计量作为总体某些参数的估计量, 当取得一个样本值时,就以相应的统计量 的值作为总体参数的估计值。例如,常以 统计量 作为总体数学期望的估计量。当 要估计某批灯泡的平均寿命时,就从该批 灯泡中随机地抽取若干个,分别测出其寿 命,以这些测量数据的平均值作为该批灯 泡的平均寿命的估计值。 X 设总体X的分布函数的类型已知,但是 其中有一个或多个参数未知,设X1,X2, X3,Xn为总体X的容量为n的样本。 参数估计就是讨论如何
3、由样本X1,X2, X3,Xn提供的信息对未知参数作出 估计,以及讨论如何建立一些准则对所作 出的估计进行评价 。 一般是建立适当的统计量 (X1,X2, X3,Xn),当样本观察值为x1,x2, x3,xn时,如果以 (x1,x2, x3,xn)作为总体分布中未知参数 的估计值,这样的估计方法叫做点估计, 如果总体分布函数中有t个未知参数,则要 建立t个估计量作为t个未知参数的估计量。 参数估计的形式分为两类:点估计和区间估计。 由估计量的观察值作为未知参数的估计值,这种 作法称为点估计或定值估计。而有时并不要求对 参数作定值估计,只要求估计出未知参数的一个 所在范围,并指出参数被包含在该范
4、围的概率, 这种方法称为区间估计,进行参数估计并不一定 要预先知道总体的分布类型。有时,虽然未知总 体的分布类型,但仍可对总体的某些数字特征作 出估计。 3. 2 参数的点估计 点估计方法很多,本节介绍最常见 的矩估计法和极大似然法。 一、矩估计法 由大数定律可知,样本分布函数依概率 收敛于总体分布函数,样本均值依概率收 敛于总体均值,我们自然会想到,是否能 用有关的样本矩来估计总体分布的相应矩 呢?统计实践表明,这个方法是可取的, 这种用样本矩来估计总体分布参数的方法 称为矩估计法,通常,用样本 均值来估 计总体的均值,用样本方差S2来估计总体 的方差。 X 【例3.1】试用矩估计法对总体
5、XN( )的参数,2作出估计。 2 , 解: 因E(X)=,D(X)=2 设X 1,X2,Xn为X的一个样本,其 样本均值为,样本方差为S2。 令E(X)= ,D(X)=S2,即得的估 计量为 , 。 X 22 S X 【例5.2】设X1,X2,Xn是取自总 体X的样本,已知X的概率密度为: 其他 ,0 10 , ),( 1 XX Xf ) 1( 试用矩估计法估计总体参数 。 解: 由于 样本均值为 ,令E(X)= ,得: , 从而总体 参数的矩估计为 ,其 中 。 1 ),()( dxXxfXE X 1 X X 1 n i i X n X 1 1 XX 【例5.3】X1,X2,Xn为总体XB
6、 (N,P)的样本,其中N,P为未知参数, 试用矩估计法估计参数N及P。 解: E(X)=NP D(X)=NP(1-P) 样本均值与方差分别为 ,S2。 令 E(X)= D(X)=S2 X X 即 解得N、P的矩估计量为 ,其 中 , 。 2 )1(SPNP XNP X S P SX X N 2 2 2 1 n i i X n X 1 1 n i i XX n S 1 22 )( 1 1 二、极大似然估计法 先考察两个简单的例子。 【例3.4】某同学与一位男猎人一起外出打 猎,只见一只野鸡在前方窜过,只听一声 枪响,野鸡被他们两人中某一位一枪命中, 试推测这一发命中的子弹是谁打的,答案 是简单
7、的,既然只发一枪且命中,而男猎 人的命中的概率一般大于这位同学命中的 概率,因此可以认为这一枪是男猎人射中 的。 【例3.5】假定在一个箱子里放着黑、白两 种球共4只,且知道这两种球的数目之比为 13,但不知道究竟哪一种颜色的球多。 设黑球所占的比例为P,由上述假定推知P仅 可能取1/4和3/4这两个值,现在采用有放 回抽样的方法,从箱子中随机地抽取三个 球,观察到球的颜色为黑、白、黑,你会 对箱子中的黑球数作出什么推断呢?即你 认为P的值是1/4,还是3/4? 直观上觉得P=3/4(即箱子中黑球数为3) 更可信,因为当P=1/4时抽到这样一个具 体样本的概率为1/41/4 3/43/4 1/
8、4=3/641/4=3/64,当 P=3/4时,抽到这样一个具体样本的概率为 3/43/4 1/41/4 3/4=9/643/4=9/64,由于9/643/649/643/64,因 此在观察到上述样本中的三个球的颜色之 后,觉得P=3/4更可信,即你倾向于认为 箱子中放有三个黑球,这里体现了极大似 然法的基本思想。 现在我们来阐明极大似然法的基本原理。 设总体X的概率密度为 ,它只含一个 未知参数 (若X是离散型 ,表示 概率 ),X1,X2,X3,Xn 是取自X的样本,x1, x2, x3, ,xn为样 本观察值。X1,X2,X3,,Xn的联合 密度等于 ,显然,对于样本的 一组观察值x1,
9、 x2, x3, ,xn, ),(xf ),(xf xXP n i i xf 1 ),( 它是 的函数,记作 并称为似然函数 ),()( 321 n xxxxLLL n i i xf 1 ),( 当 已知时,似然函数描述了样本取得样 本观察值x1, x2, x3,xn的可能性。同 样,当一组样本观察值取定时(即抽样完 成时),要问它最大可能取自什么样的总 体(即总体的参数 应等于什么时的可能 性最大),也要从似然函数 的极大 化中求出相应的 值来,这个值就是 的 一个估计值。于是,我们可以给出极大似 然估计的定义。 )(LL 定义3. 1 设总体的概率密度为 ,其 中 是未知参数,x1,x2,
10、xn为X的 一组样本观察值。若能求得观察值的某个 函数 ,使得似然函数取极大 值,即 ,则称 为 的一个极大似然估计值,其相应的统 计量 ,称为参数 的极大似 然估计量。 ),(xf ),( 321n xxxx ),(max) ,( 2121 nn xxxLxxxL ),( 21n xxx 由定义3.1可知,求总体参数 的极大似然 估计值 的问题,就是求似然函数 L( )的极大值问题。在L( )可微时, 要使L( )取极大值 必须满足 (3.1) 从上式可解得 的极大似然估计值。 0 d dL 由于lnL( )与L( )有相同的极值点, 而且,求lnL( )的极值点更为容易,所 以常用下式 (
11、3. 2) 来代替(3.1)式。方程(3.1)或(3.2) 都称为似然方程。 0)(ln L d d 当似然函数包含多个参数时,即: ),( 21n LL n i ni xf 1 21 ),( 若L关于各参数的偏导数存在,则 j的极 大似然估计 一般可由方程组: 或 解得。上面方程组称 为似然方程组。 ),( 21njj xxx ), 2 , 1(0),( 21 njL n j 0),(ln 21 n j L 注意 上面的讨论中,我们没有提到似函 数 取极大值的充分条件,对于具体的 函数可作验证。 )(L 【例3.6】设总体X服从参数为 的泊松分 布,求参数 的极大似然估计量。 解 设X1,X
12、2,X3,Xn是来自X的样 本, 则 n i i xnnn i i x X e X eL i 1 1 ) !( ! )( n i i XxnnL 1 ) !(lnln)(ln 令 的极大似然估计量为 。 其中 为样本均值。 0 )(ln Xn n L X X 【例3.7】设总体XN ,其中 及 是未知参数,如果取得样本观测值为x1, x2, ,xn,求参数 及 的极大似然 估计值。 ),( 2 解: 似然函数为: n i xi eL 1 2 )( 2 2 2 1 n i i x n e 1 2 2 )( 2 1 2 1 n i i xn n L 1 2 2 )( 2 1 ln2ln 2 ln
13、对 及 求偏导数,并让它们等于零, 得: n i i n i i n x L x L 1 2 3 1 2 0)( 1ln 0)( 1ln 解此方程组,即得 及 的极大似然估计值 为: xx n n i i 1 1 Sxx n n i i 1 2 )( 1 【例3.8】设总体X服从均匀分布 , 求参数 与 的极大似然估计量 , 21 U 1 2 解 设X1,X2,Xn是X的样本,则 其它 , 0 , 2 , 1, )( 1 ),( 21 12 21 nix L i n )ln(),(ln 1221 nL 从而有 0 ),(ln 121 21 nL 0 ),ln( 122 21 n 显然由此方程组
14、解不出1与2,现利用定义 求1与2的极大似然估计量,因为: 其它 , 0 , )( 1 ),( 2211 12 21 n n xxx L 其它 , 0 , )( 1 2)()2()1(1 12 n n xxx 又 ,即 的极大似然估计量分别为 。 n n n xx)( 1 )( 1 ) 1 ()(12 ),(),( )() 1 (21n xxLL 21, )() 1 ( , n xx 在对总体参数做出估计时并非所有的估计量 都是优良的,从而产生了评价估计量是否 优良的标准。对于点估计量来说,一个好 的估计量有如下三个标准: 1无偏性 如果样本统计量的期望值等于该统计 量所估计的总体参数,则这个
15、估计量叫做 无偏估计量。这是一个好的估计量的一个 重要条件。用样本平均数作为总体平均数 的点估计量,就符合这一要求。无偏性也 就是没有系统的偏差,它是从平均意义讲 的,即如果这种估计方法重复进行,则从 估计量所获得的平均数等于总体参数。 显然,如果说一个估计量是无偏的,并不是 保证用于单独一次估计中没有随机性误差, 只是没有系统性的偏差而已。若以代表被 估计的总体参数,代表的无偏估计量,则 用数学式表示为: ) (E 我们知道,总体参数中最重要的一个参数 是总体平均数 ,样本平均数 是它的一 个无偏估计量,即 。另外,样本 方差也是总体方差的无偏估计量。 X )(XE 2一致性 当样本容量n增
16、大时,如果估计量越来越 接近总体参数的真值时,就称这个估计量 为一致估计量。估计量的一致性是从极限 意义上讲的,它适用于大样本的情况。如 果一个估计量是一致估计量,那么,采用 大样本就更加可靠。当然,在样本容量n增 大时,估计量的一致性会增强,但调查所 需的人力、物力也相应增加。 3有效性 有效性的概念是指估计量的离散程度。如果两个 估计量都是无偏的,其中方差较小的(对给定的 样本容量而言)就可认为相对来说是更有效的。 严格地说,如果 和 是 的两个无偏估计量, 它们的相对有效性按下述比率决定: 其中, 是较小的方差。 1 2 2 1 2 2 1 2 以上这三个标准并不是孤立的,而应该联系 起
17、来看。如果一个估计量满足这三个标准, 这个估计量就是一个好的估计量。数理统 计已证明,用样本平均数来估计总体平均 数和用样本比率来估计总体比率时,它们 是无偏的,一致的和有效的。 3. 3 参数的区间估计参数的区间估计 一、区间估计的概念 对未知参数来说,我们除了关心它的点估 计外,往往还希望估计出它的一个范围, 以及这个范围覆盖参数真值的可靠程度, 这种范围通常用区间的形式给出,这种区 间就叫参数的置信区间。 定义3. 2 设总体分布含有一个未知参数 , 若由样本确定的两个统计量(X1,X2, X 3,Xn)与 (X1,X2,X3, Xn),对于给定数值 ,满足 (3. 3) )10( 1)
18、,(),( 2121nn XXXXXXP 则称随机区间 为的一个 双侧置信区间, 称为双侧置信下(上) 限,1- 称为置信水平或置信度。 ),( )%1(100 )( (3.3)式表示置信区间 包含未知参数 真值的概率是1- ,若反复抽样多次(每 次样本容量相等),每组样本观察值确定 一个区间 ,每个这样的区间或者包 含 的真值,或者不包含 的真值,按贝 努利定理,在所有这些区间中,包含 真 值的约占 ,不包含真值的仅占 左右。 ),( ),( )%1 (100 %100 当 和 时, 称为置信区间观察值,也称为置 信区间。 ),( 321n xxxx),( 321n xxxx ),( 在有些
19、问题中,我们关心的是未知参 数至少有多大(如设备元件使用的寿命), 或不超过多大(如产品的次品率),因此 下面给出单侧置信区间的概念。 定义3.4 在定义3.3中,如果将(3.3)式 改成 1),( 1),( 21 21 n n XXXP XXXP 则称 或 为单侧置信区间, 和 分别称为单侧置 信下限与单侧置信上限。 ),( 21 n xxx ),(,( 21n xxx 评价一个置信区间的好与坏有两个标准, 一是精度,即 越小精度越高,也就 越好。另一个是置信度,即 越 大越好。我们当然希望 尽可能地小, 同时希望 尽可能地大,但是当样 本容量n固定时,精度与置信度不可能同时 提高。 P P
20、 因为当精度提高时即 变小时, ( )覆盖真值 的可能性也变小, 从而降低了置信度,相反,当置信度增大 时, 必然也增大,从而降低了精度, 在实际问题中,一般是根据实际问题的需 要,先选定置信度为1- ,然后再通过增 加样本容量n提高精度。 (1)构造一个随机变量g()(含待估计的 未知参数,分布已知); (2)给定置信水平 ,使 ; ) 10(1 1)(bgaP (3)从不等式 中解出 即 得的 置信区间 ; (4)将xi代替 中的xi, 即得观察区间。 bga)( 21 : 1),( 21 ),( 21 假设总体XN( ),构造 与 的 置信区间有重要的实用意义,而且有关结 果是完满的。
21、2 , 2 一、均值的置信区间 从总体X中取样本(X1,X2,Xn), 设样本值为(x1, x2, x3, ,xn) 由于 n i i n NX n X 1 2 ),( 1 随机变量 很明显,统计量Z的分布函数不依赖于未知 参数。 ) 1 , 0 ( / N n X Z 设已给定对的区间估计置信度为1- 令 为Z的双侧 点) 解不等式(关于 ): 得 1 2/2/ ZZZP 2/ ( Z 2/2/ ZZZ n ZX n ZX 2/2/ 从而所求的100(1- )%置信区间为 将样本平均值 取其观察值 ,则 100(1- )%的置信区间为 ),( 2/2/ n ZX n ZX X n i i x
22、 n x 1 1 )( 2/ n Zx 【例3.9】某厂质量管理部门的负责人希望 估计移交给接受部门的5500包原材料的平 均重量,一个由250包原材料组成的随机 样本所给出的平均值 =65千克。总体标 准差 =15千克。试构造总体未知的平均 值的置信区间,假定95%的置信区间已 能令人满意,并假定总体为正态分布 x 解:(1)样本平均值=65千克 (2)由1- =0.95, /2=0.025,查标 准正态分布表得 (3)写出置信区间= = = (63. 14, 66. 86) 96. 1 025. 02/ ZZ )( 2/ n Zx ) 250 15 96. 165( 于是,我们有95%的把
23、握说总体平均值介 于63.14和66.86千克之间。 注意 在很多情况下,我们遇到的总体为非 正态分布,但中心极限定理告诉我们,当 样本容量n足够大,无论总体服从什么分布, 的柚样分布将近似地服从正态分布,因此 当样本取自总体方差已知的非正态分布时, 我们仍可以用 公式来近似求出总体平均值的置信区间。 x )( 2/ n Zx n2 未知时,求的置信区间 n稍微留意上述求得的的置信区间,不难 发现只有在 已知时方法才可行。如果 未知,则可用样本方差S2代替总体方差 , 从而根据统计量: 2 2 2 2 t 1 / nT nS X T n对给定的置信水平1- ,令 n可解得的1- 置信区间为 1
24、 2/2/ tTtP ) 1( 2/ n S ntX n将 、S2分别取其观察值 n则的1- 置信区间为 X 2 1 2 1 )( 1 1 , 1 n i i n i i xx n sx n x ) 1( 2/ n s ntx n例3. 10 为了估计一分钟一次广告的平均 费用,抽出了15电视台的随机样本。样本 的 平 均 值 = 2 0 0 0 元 , 其 中 标 准 差 S=1000元。假定所有被抽样的这类电视 台服从正态分布,试构造总体平均值的 95%的置信区间。 x 解:(1)样本均值与方差分别为 =2000元, S=1000元 (2)由1- =0.95,得 /2=0.025, n-1
25、=14,查t分布表,得 x 14. 2)14() 1( 025. 02/ tnt n(3)写出置信区间: n显然我们有95%的把握说明,总体平均数 处在 1447.5元和2552.5元之间。 ) 15 1000 14. 22000()( 2/ n S tx = =(1447.5, 2552. 5) 注意 当 未知但样本容量n30,即大样本时, 可用标准正态分布近似地当作t分布。因此,在 实际工作中,只有在小样本的情况下,即样本容 量n30时,才应用t分布,而对于大样本,则通 常采用正态分布来构造总体平均数的置信区间。 另外,根据中心极限定理,从非正态总体中抽样 时,只要能够抽取大样本,那么,样
26、本平均数的 抽样分布就会服从正态分布。这时,我们也就能 够用 来构造置信区间,但由于 是未 知的,因此,只能用 来构造置信区间。 )( 2/ n Zx )( 2/ n S Zx 二、方差 2的置信区间 n设X1,X2,X3,Xn是总体XN( , 2)的 一个样本,其观察值为x1,x2,x3,xn。 因为在一般情况下,总体的均值是未知的, 所以我们只讨论均值 未知时,对 2的区间 估计。要对 2进行区间估计,须考虑样本 方差S2,由 分布理论知随机变量 ) 1( ) 1( 2 2 2 2 n Sn 2 n对于给定的置信水平1- 1- ,有 1)1() 1( 2 2/ 22 2/1 nnP n由此
27、得 2的置信水平为1- 的置信区间为 n而 标准差的置信水平为1- 的置信区间是 ) 1( 1 , ) 1( ) 1( 2 2/1 2 2 2/ 2 nx Sn nx Sn ) 1( 1 , ) 1( 1 2 2/1 2 2/ nx Sn nx Sn 例3.11 某制造厂的一名生产管理人员需要知道完成 某件工作所需的时间。为此他进行了一项研究, 得出一个适于分析的31个观察值组成的随机样本, 从样本数据算出的方差为0.3小时,试问: (1)构造方差 2的95%的置信区间 (2)构造 的95%的置信区间 (3)构造置信区间时作了何种假定? 解:(1)S2=0.3,自由度= n-1 = 31-1=
28、30 查 分布表得: 从而求得0.19162 0.5360 因此,我们有95%的把握说2落在0.1916和 0.5360之间的范围内。 979.46)30()30( 2 025. 0 2 2/ 791.16)30()30( 2 975. 0 2 2/1 2 (2)其总体标准差的置信区间为: 0. 4377 30),可 用S12,S22、分别代替12、22 ,于是可用 区间 作为1-2的近似的1- 置信区间。 )( 2 2 2 1 2 1 2/21 n S n S ZXX 3 未知时,求1-2的置信区间,则t 分布理论知 其中 22 2 2 1 )2( 11 )()( 21 21 2121 nn
29、t nn S xx T w 2 ) 1() 1( 21 2 22 2 11 2 nn SnSn S w 在给定的置信水平1- 的条件下,有 由此可得1-2的置信水平为1- 的置信区 间 当 及Sw取样本观察值时,置信区间为 1)2() 2( 212/212/ nntTnntP ) 11 )2( 21 212/21 nn SnntXX w 21,X X ) 11 )2( 21 212/21 nn Snntxx w n【例3.13】某银行负责人想知道存户存入 两家银行的钱数,他从每一家银行各抽选 了一个由25个存户组成的随机样本。样本 平均值如下:银行A: =450元;银行B: =325元。两个总
30、体均服从方差分别为 A2=750和B2=850的正态分布。试构造 A-B的95%的置信区间。 A x B x n解 由于两个总体均服从正态分布,因此 也服从正态分布,从而计算总体均 值之差的置信区间可用: 这个公式。 BA XX )( 22 2/ B B A A BA nn ZXX 已知 12=750,22=850, =450, =325, 所以所求的置信区间为: 这意味着有95%的把握认为总体均值之差在 109.32元和140.68元之间。 : A x B x 96. 1 025. 02/ ZZ 68.140,32.109 25 850 25 750 96. 1325450 n【例3.14】
31、某工厂中有两台生产金属棒的 机器。一个随机样本由机器A生产的11根 金属棒组成,另一个随机样本由机器B生 产的21根金属棒组成。两个样本分别给出 两台机器所生产金属棒的长度数据如下: n =6. 10英寸, =5.95英寸,SA2=0.018, SB2 =0. 020。假定两个总体近似服从正态分 布,且总体方差相等,试构造A-B的95% 的置信区间。 A x B x n解 019. 0 22111 020. 0) 121(018. 0) 111( 2 ) 1() 1( 22 2 BA BBAA w nn SnSn S 1- =95%, =0.05,查t分布表得 t /2= t0.025(30)
32、=2.042 所以所求置信区间为: =(0.05, 0.25) ) 21 1 11 1 019. 0042. 295. 510. 6( 4两个总体均不服从正态分布且方差未知 对于一般不服从正态分布的两个总体,我 们往往根据中心极限定理采用大样本抽样 方法。如果两个总体方差未知,就用S1和 S2分别作为1和2的估计值,当n1和n2足 够大时,1-2的置信水平为1- 的近似置 信区间为: )( 2 2 2 1 2 1 2/21 n S n S ZXX n【例3.15】东大和西大两所大学某学期期末英语 考试采用同一试题,东大认为该校学生英语考试 成绩能比西大高出10分,为了证实这一说法,主 管部门从
33、两校各抽取一个随机样本并得到如下数 据:n东=75人,n西=80人, 东=78. 6分, 西=73.8 分,S东=8.2分,S西=7. 4分。试 在95%的置信度下确定两校平均分数之差的置 信区间。 x x 解: 分 1- =0.95, =0. 025,查标准正态分布表得, 从而其置信区间为: (78. 6 73. 8 1. 96 1. 26)=(2.3, 7.3) 2 26. 1 80 4 . 7 75 2 . 8 22 22 西 西 东 东 n S n S 96. 1 025. 02/ ZZ 因此,我们有95%的把握说东大、西大两 校英语考试成绩之差在2.3分和7.3分之间。 这一结果说明
34、东大的平均成绩确实高于西 大,但并未高出10分。 二、二正态总体方差比的置信区 间 n在实际工作中还常常需要比较两个总体的 方差。例如,在选择产品时,我们通常需 要方差较小的产品,因为方差较小的产品 的质量比较均匀。比较两个总体方差的大 小,可以将两个方差相比,当两个方差相 等时其比值为1。但两个总体方差12和22 都是未知的,所以需要通过两个样本方差 来加以比较推断。 n设二正态总体XN (1,12)与YN (2,22), 其中的参数均未知,它们相互独立的两个 样本的容量分别为n1, n2,样本方差为S12与 S22,现在求其方差比12/22的置信区间 n由 分布理论知 2 )1( )1(
35、)1( )1( 2 2 2 2 2 22 1 2 2 1 2 11 n Sn n Sn n从而 n于是,对给定的置信水平为1- ,有: ) 1, 1( / / ) 1/( ) 1( ) 1/( ) 1( 21 2 2 2 1 2 2 2 1 2 2 2 2 22 1 2 1 2 11 nnF SS n Sn n Sn F 1)1, 1() 1, 1( 212/212/1 nnFFnnFP 所以 12/22的置信水平为1- 的置信区间为: (此处利用了公式: ) ) 1, 1(),1, 1( 122/ 2 2 2 1 122/1 2 2 2 1 nnF S S nnF S S ),( 1 ),(
36、 121 21 nnF nnF n【例3.16】为了比较用两种不同方法生产 的某种产品的寿命,进行一项试验。试验 中抽选了由方法1生产的16个产品组成一个 随机样本,其方差为1200小时。又抽选了 用方法2生产的21个产品组成另一个随机样 本,得出的方差为800小时。试以95%的置 信度估计12/22的置信区间 解:由于S12=1200,S22=800,S12 S22 3623. 0 76. 2 1 )15,20( 1 ) 1, 1( 57. 2)20,15() 1, 1( 025. 0 212/1 025. 0212/ F nnF FnnF 从而所求的置信区间为: 即: 0.58 12/22
37、0.05,就要采用有 限总体修正系数,从而P的区间估计公式为: 1 ) 1 ( 2/ N nN n PP ZP n【例3.17】某一大公司的人事处长希望知 道本公司内专业不对口的职员究竟占多大 比例。于是,他从2000名具有大专以上学 历的职员中随机抽取了一个由150人组成的 样本进行研究,结果表明,其中有45人说 他们从事的工作与所学专业不对口。试在 95. 5%的置信度下构造出专业不对口人员 所占真正比例的置信区间。 n解:由于样本容量很大,n=150, n =45/150=0.3, 和 都大于5, 故可用正态分布逼近。但又由于抽样比重 n , n故需用有限总体修正系数计算Sp,则 P P
38、n) 1 (Pn 05. 0075. 0 2000 150 N n =(0.228, 0.372) 计算结果表明,我们有95. 5%的把握说,该公司 具有大专以上学历的人员中,有22.8%37.2%的 人专业不对口。 1 ) 1 ( 2/ N nN n PP ZP 12000 1502000 150 )3 .01 (3 .0 23 .0( 二、两个总体比例之差的区间估计 n为了估计两个总体比例之差P1-P2,我们可从 每一个总体中各抽一个随机样本,并利用两 个样本比例之差 。这样就可以按通常 的方式构造出一个区间的估计值。我们知道, 当n1和n2都很大,即大样本,而且总体比例 不太接近0或1时
39、,两个独立样本 的抽 样分布近似服从正态分布,其平均值为P1-P2, 标准差为: 21 PP 21 PP n因为P1和P2皆未知,所以标准差应通过下 式来估计: 2 22 1 11 )1 ()1 ( 21 n PP n PP PP 2 22 1 11 ) 1 ( ) 1 ( 21 n PP n PP S PP n于是上述条件下P1-P2的100(1- )% 的置信区间由下式给出: 2 22 1 11 2/21 ) 1 ( ) 1 ( ) ( n PP n PP ZPP n【例3.18】某企业有两个车间,分别用A和B表示。 为了降低废品率,该企业对车间B的工人首先进 行业务培训。3个月后,该企业
40、负责人对两个车 间的产品质量进行了检验。从车间A抽取了200件 产品,从车间B抽取了220件产品。查得废品率A 车间为 ,B车间为 ,试在95%的把 握程度下,构造两个废品率之间的置信区间。 %15 A P %3 B P n解: B BB A AA PP n PP n PP S BA ) 1 ( ) 1 ( 220 )03. 01 (03. 0 200 )15. 01 (15. 0 0277. 0 nZ /2=Z0.025=1.96,从而其区间估计为: (0.15-0.03 1. 96 0. 0277)=(0.066, 0.174) 根据这一结果,我们有95%的把握说,车 间A和车间B的废品率之差为6. 6%17. 4%。 这说明,车间B人员的业务培训收到了效 果。 n以上所举的例子中,都假定样本容量已定。 在实际设计抽样方案中有一个重要的问题, 就是在特定的情况下,应该用多大的样本? 如果使用一个比需要大的样本,就会浪费 资料;如果样本太小,就不能达到分析的 目的。 事实上,决定样本大小的因素有以下三点: (1)受总体方差2数值大小的影响。总体 方差大,抽样误差大,则应多抽一些样本 容量,反之,则可少抽一些。当然,当总 体方差为0时,那么只需抽出其中一个就能 代表总体。问题是实际工作中我们往往不 知道总体
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师教学年度考核含答案
- 2026年二级注册建筑师之建筑结构与设备考试题库500道带答案
- 2026年吕梁师范高等专科学校单招职业适应性考试必刷测试卷及答案解析(名师系列)
- 2026年计算机知识题库500道附完整答案【历年真题】
- 2026年县乡教师选调考试《教师职业道德》题库及1套参考答案
- 2026年LTE知识题库及完整答案【网校专用】
- 2025年上半年七台河市事业单位公开招聘工作人员51人笔试历年题库附答案解析
- 法律顾问岗位面试题目与法律知识要点
- 2025年新疆师范高等专科学校辅导员考试笔试真题汇编附答案
- 2026中国科协所属单位招聘应届高校毕业生33人笔试考试参考题库及答案解析
- 变压器故障处理培训课件
- 除灰脱硫培训课件
- 知识产权保护风险排查清单模板
- 第一单元任务三《新闻写作》教学设计-2025-2026学年统编版语文八年级上册
- 2025年广西高校教师资格岗前培训考试(高等教育学)历年参考题库含答案详解(5卷)
- 2025年嫩江市招聘农垦社区工作者(88人)笔试备考试题附答案详解(基础题)
- 2025年驾考科目三安全考试题库
- IATF16949中英文对照版2025-10-13新版
- 肩关节脱位的护理
- 电子商务数据分析-数据采集
- 2025年保安员资格考试题目及答案(共100题)
评论
0/150
提交评论