第5章第三节参数估计_第1页
第5章第三节参数估计_第2页
第5章第三节参数估计_第3页
第5章第三节参数估计_第4页
第5章第三节参数估计_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、估计量:用于估计总体参数的随机变量如样本均值,样本比率、样本方差等例: 样本均值就是总体均值的一个估计量总体参数用 表示,估计量用 表示估计值:估计参数时计算出来的统计量的具体值如果样本均值 x =80,则80就是的估计值用样本对总体的未知参数进行估计的方法常见的有两种: 点估计(point estimation) 区间估计(interval estimation) 用某一样本统计量的值来估计相应总体参用某一样本统计量的值来估计相应总体参数的值叫总体参数的数的值叫总体参数的点估计点估计。以样本统计量的抽样分布(概率分布)以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本为理论

2、依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,统计量的值估计总体参数值的所在范围,称为总体参数的称为总体参数的区间估计区间估计。用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计优点: 简单、具体明确缺点:点估计没有给出估计值接近总体未知参数程度的信息点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等例如,对一批某种型号的电子元件10000只进行耐用时间检查,随机抽取100只,测试的平均耐用时间为1055小时,合格率为91%。我们推断说10000只电子元件的平均耐用时间为1055小时,全部

3、电子元件的合格率也是91%。为了考察师大男生的身高状况,随机抽测为了考察师大男生的身高状况,随机抽测50人得到人得到 cm5S,cm170 x试估计师大男生的平均身高和标准差。试估计师大男生的平均身高和标准差。 解:解: 师大男生平均身高的估计值是170cm,但其真正的平均身高是否就是170cm? 未必就是,这里面存在误差。那么这种误差误差是如何处理呢? 点估计值仅仅是未知参数的一个近似值,它没有点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不反映出这个近似值的误差范围,使用起来把握不大。区间估计正好弥补了点估计的这个缺陷大。区间估计正好弥补了点估计的这个缺

4、陷 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到。根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班平均分数在7585之间,置信水平是95% 优点:考虑了估计量的分布,能说明估计结果的可靠程度xxzx2 譬如,在估计湖中鱼数的问题中,若我们譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数根据一个实际样本,得到鱼数 N 的估计量为的估计量为1000条。条。 若我们能给出一个区间(若我们能给出一个区间(950,1050),),在此区间内我们合理地相信在此区间内我们合理地相信 N 的真值位于其的真值位于其中,

5、中, 这样对鱼数的估计就有把握多了。这样对鱼数的估计就有把握多了。 实际上,实际上,N的真值可能大于的真值可能大于1000条,也可条,也可能小于能小于1000条。条。问题就在于:这个问题就在于:这个1000的估计值可能的估计值可能在区间(在区间(950,1050)内,也可能不在内,也可能不在将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率称为置信水平 表示为 (1 - 为是总体参数未在区间内的比率常用的置信水平值有 99%, 95%, 90%相应的为0.01,0.05,0.10这个概率不是用来描述某个特这个概率不是用来描述某个特定的区间包含总体参数真值的定的区间包含总体

6、参数真值的可能性,而是指在多次抽样得可能性,而是指在多次抽样得到的区间中大概有多少个区间到的区间中大概有多少个区间包含了总体参数的真值包含了总体参数的真值由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个总体参数的真值是固定的、未知的,总体参数的真值是固定的、未知的,而用不同样本构造的区间是不固定而用不同样本构造

7、的区间是不固定的,因此,置信区间是一个随机区的,因此,置信区间是一个随机区间,它会因样本的不同而不同间,它会因样本的不同而不同也就是说,我们希望确定一个区间,使我们能也就是说,我们希望确定一个区间,使我们能以比较高的以比较高的可靠程度可靠程度相信它包含真参数值相信它包含真参数值.湖中鱼数的真值湖中鱼数的真值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的是用概率来度量的 ,称为称为置信度置信度或或置信水平置信水平,置信水平的大小是根据实,置信水平的大小是根据实际需要选定的。际需要选定的。 习惯上把置信水平记作习惯上把置信水平记作 1 ,这里,这里 是一个是一个 很小的正数很小的正数.

8、(1)区间估计简单地说就是用一个区间去估计未知参数,把未知参数估计在某两个界限之间。(2)置信区间按照预先给定的概率(1- )确定的包含未知总体参数的可能范围。它是以上下置信限(L1 , L2)为界。(3)置信概率又称置信水平或置信度,指在区间估计中,预先选定(规定)的概率。用 1-表示。常取95%或99%。(4)显著性水平在使用置信区间作估计时,被估计的参数不在该区间内的概率。用表示。一般取值要求较小。要点无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 抽样分布抽样分布中,样本中,样本均值、比均值、比率、方差率、方差分别是总分别是总体均值、体均值、比率、方比率、方差的无偏差的无偏估计

9、量估计量12无偏估计量还无偏估计量还必须与总体参必须与总体参数的离散程度数的离散程度比较小比较小一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数2xp2s1. 假定条件总体服从正态分布,且方差() 已知如果不是正态分布,可由正态分布来近似 (n 30)2.使用正态分布统计量 z)1 ,0( Nnxz)(22未知或nszxnzx此条件下小样本总体也适用此条件下小样本总体也适用112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136

10、.8102.8101.5 98.4 93.328.109,44.10192.336.105251096.136.1052nzx36.105x23353927364436424643313342534554472434283936444039493834485034394548453263.41,37.3713.25 .393677.7645.15 .392nszx5 .39x77. 7s 某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36分钟)。176.27,824.241006

11、96.126,100696.126,22nZxnZx 某厂生产的零件长度 X 服从 N( , 0.04),现从该厂生产的零件中随机抽取6个,长度测量值如下(单位:毫米): 14.6, 15.l, 14.9, 14.8, 15.2, 15.1.求: 的置信系数为0.95的区间估计。 . 11.15 ,79.14 ,22znXznX解:n = 6, = 0.05,z/2 = z0.025 = 1.96,2=0.22 . 所求置信区间为,95.14 X通过计算,得1. 假定条件 总体服从正态分布,且方差() 未知 小样本 (n 30)2.使用 t 分布统计量)1(ntnsxtnstx2注意自由度注意

12、自由度15101520148015001450148015101520148014901530151014601460147014702 .1503, 8 .14762 .1314901677.24131.214902nstx1490 x77.24s 从一个正态总体中抽取一个随机样本, n = 25 ,其均值x = 50 ,标准差 s = 8。建立总体均值的95%的置信区间。3 .53,69.462580639. 250,2580639. 250,1212nstxnstxnn 为估计一物体的重量,将其称量10次,得到重量的测量值 (单位: 千克) 如下:10.l, 10.0, 9.8, 10.

13、5, 9.7, l0.l, 9.9, 10.2, 10.3, 9.9.设它们服从正态分布 N( , 2)。求 的置信系数为0.95的置信区间。解解: n=10, =0.05, t9 (0.025)=2.2622,2415. 0 ,0583. 0 ,05.10 2SSX经经计计算算,得得的置信区间。的置信区间。的置信系数为的置信系数为为为, 0.95 10.22 9.87 2.2622100.241510.05 2.2622100.241510.05)2/( ),2/( 11nntnSXtnSX1.假定条件 总体服从二项分布,样本量足够大 可以由正态分布来近似2.使用正态分布统计量 z) 1 ,

14、 0()1 (Nnpz)()-1 ()1 (22未知时或nppzpnzp参看书本参看书本%35.74%,65.55%35. 9%65100%)651%(6596. 1%65)1 (2nppzp【例】某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造(95%的置信区间)。764.0,636.0200)7.01(7.096.17.0)1(2nppZp1.估计一个总体的方差或标准差2.假设总体服从正态分布3. 总体方差 2 的点估计量为s

15、2,且11222nsn111122122222nsnnsn参看书本参看书本112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3401.12)24() 1(2975. 0212n364.39)24() 1(2025. 022n39.18083.56401.1221.93125364.3921.9312522有一大批糖果,现从中随机地抽取16袋 , 称得重量(以克计)如下:506 508 499 503

16、 504 510 497 512 514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正态分布,试求总体标准差的置信水平0.95为的置信区间。S=6.2022解:这里解:这里20.025,120.975,115,n 20.025(15)27.488, 20.975(15)6.262. 16211()6.2022 .15iisxx 2221 211(,)( 1 )( 1 )n Sn S n n (4.58,9.60).于是得到于是得到的的置信水平为置信水平为0.95的置信区间为的置信区间为例2:为估计一物体的重量,将其称量10次,得到重量的测量值 (单位: 千

17、克) 如下:10.1, 10.0, 9.8, 10.5, 9.7, 10.1, 9.9, 10.2, 10.3, 9.9.设它们服从正态分布 N( , 2)。求2的置信系数为0.95的置信区间。S2=0.0583解:解:n=10, = 0.05, S2=0.0583, 查附表得查附表得, .023.19)025. 0()2/( ,70. 2)975. 0()2/1 ( 29212921nn 0.194 0.028 2.70.05839 ,19.0230.05839 ) 2/1 () 1( ,) 2/() 1( 212212,nnSnSn于是,的的区区间间估估计计。的的置置信信水水平平为为为为

18、1 2样本容量的确定2121222121xx 21pp 2221ss1.假定条件两个总体都服从正态分布,1、 2已知若不是正态分布, 可以用正态分布来近似(n130和n230)两个样本是独立的随机样本使用正态分布统计量 z) 1 , 0()()(2221212121Nnnxxz1.1, 2已知时,两个总体均值之差1-2在1- 置信水平下的置信区间为222121221)(nnzxx222121221)(nsnszxx中学1中学2n1=46n1=33S1=5.8 S2=7.2861x782x)97.10,03.5(97.28332.7468.596.1)7886()(22222121221nsns

19、zxx1.假定条件两个总体都服从正态分布两个总体方差未知但相等:1=2两个独立的小样本(n130和n230)总体方差的合并估计量2) 1() 1(212222112nnsnsnsp21221211nnsnsnsppp)2(11)()(21212121nntnnsxxtp21221221112nnsnntxxp方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.55 .321x996.1521s8 .282x358.1922s677.1721212

20、358.19) 112(996.15) 112(2ps56. 37 . 3121121677.170739. 2)8 .285 .32(1.假定条件两个总体都服从正态分布两个总体方差未知且不相等:12两个独立的小样本(n130和n230)使用统计量)()()(2221212121vtnsnsxxt两个总体均值之差1-2在1- 置信水平下的置信区间为222121221)(nsnsvtxx1222221121212222121nnsnnsnsnsv方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020

21、.028.830.030.25 .321x996.1521s875.272x014.2322s13188.13188014.2311212996.158014.2312996.15222v433. 4625. 48014.2312996.151604. 2)875.275 .32(假定条件两个匹配的大样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布两个总体均值之差d =1-2在1- 置信水平下的置信区间为nzdd2假定条件两个匹配的大样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布 两个总体均值之差d=1-2在1- 置信水平下的置信区间为nsntdd) 1(

22、2学生编号学生编号试卷试卷A试卷试卷B差值差值d17871726344193726111489845691741754951-2768551387660169857781055391611101101dniindd53. 61)(12dniidndds67. 4111053. 62622. 211) 1(2nsntdd1.假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的2.两个总体比率之差1- 2在1- 置信水平下的置信区间为222111221)1 ()1 (nppnppzpp%32.19,%68. 6%32. 6%13400%)321 (%32500%)451 (%4596. 1%32%451. 比较两个总体的方差比用两个样本的方差比来判断如果S12/ S22接近于1,说明两个总体方差很接近如果S12/ S22远离1,说明两个总体方差之间存在差异2.总体方差比在1-置信水平下的置信区间为212221222122221FssFss),(1),(1222121nnFnnF5201x26021s4802x28022s505.028026098.12802602221估计总体均值时样本容量n为样本容量n与总体方差 2、可接受的允许误差E、可靠性系数Z或t之间的关系为与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论