第五章 参数估计_第1页
第五章 参数估计_第2页
第五章 参数估计_第3页
第五章 参数估计_第4页
第五章 参数估计_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

5.1参数估计的一般问题5.2一个总体参数的区间估计5.3两个总体参数的区间估计5.4样本容量的确定第五章参数估计11、一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该营业窗口服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客户,发现受访者有9名认为营业厅现在的服务质量比两年前好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量比两年前好的比率进行区间估计。2、某大学生记录了自己一个月31天所花费的伙食费,经计算得出了这个月平均每天花费10.2元,标准差2.4元。若置信水平为95%,试估计该学生每天平均伙食费的置信区间。3、据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房中本地购房比率p的区间估计,在显著性水平为10%时,其边际误差E=0.08,则:(1)这80名受访者样本中为本地购房者的比率是多少?(2)若置信水平为95%,则要保持同样的精度进行区间估计,需要调查多少名购房者?问题的提出:2解决问题:【例1】这是一个求某一属性所占比率的区间问题。已知n=30,,样本比率p=30%。总体比率的区间为:即[13.6%,46.4%]。3解决问题:【例2】已知,s=2.4,则其置信区间为:该学生每天平均生活费的95%的置信区间为9.36元到11.04元。4解决问题:【例3】(1)由比率估计的公式

E=得:则:p=0.75(2)所要确定的样本容量为:5解决问题:【例3】即:当显著性水平由0.1变为0.05时,要保持同样的精度,样本容量应从80增加到113.65.1参数估计的一般问题5.1.1参数估计的三个基本术语5.1.2参数估计的方法5.1.3评价估计量的标准75.1.1参数估计的三个基本术语这三个术语是:参数估计,估计量,估计值。所谓参数估计,又称抽样估计,就是根据样本提供的信息对总体的某些特征进行估计或推断。如:用估计估计估计总体参数符号85.1.1参数估计的三个基本术语估计量。参数估计中,用来估计总体参数的统计量,称之为估计量,用符号表示。

如上页图示左边的样本指标统称估计量。估计值。根据样本资料计算出的估计量的具体数值,称之为估计值。

如:对山大在校男生的身高进行估计。随机抽取100名学生,其平均身高为174cm。则:

所要估计的山大男生的平均身高,为参数;样本的平均身高,即样本均值,为估计量;根据100名男生身高所计算出的具体平均值174cm,即为估计值。95.1.2参数估计的方法参数估计的方法有两种:点估计区间估计1、点估计又叫定值估计,就是用样本估计量的值直接作为总体参数的估计值

。点估计常用的方法有两种:矩估计法极大似然估计法

优缺点:其优点是简单、具体明确。但点估计总有一定的抽样误差,而点估计本身又无法说明抽样误差的大小,也无法说明估计结果有多大的把握程度。因此,通常进行的估计,一般都是区间估计,因为区间估计能够比较好地解决参数估计的精确度与可靠程度的问题。105.1.2参数估计的方法(1)

矩估计法矩估计法是英国统计学家K.Pearson提出的。其基本思想是:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩以概率收敛与总体矩。因此,只要总体X的k阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。在统计学中,矩是指以期望值为基础而定义的数字特征,例如数学期望、方差、协方差等。矩可以分为原点矩和中心矩两种。(2)极大似然估计法(略)极大似然估计法(MaximumLikelihoodEstimate,简记为MLE)是由Fisher提出的一种参数估计方法。其基本思想是:设总体分布的函数形式已知,但有未知参数

可以取很多值,在

的一切可能取值中选一个使样本观察值出现的概率为最大的

值作为估计值,记作,并称为

的极大似然估计值。这种求估计量的方法称为极大似然估计法。115.1.2参数估计的方法2、区间估计区间估计就是根据样本估计量、以一定的可靠程度推断总体参数所在的区间范围。这种估计不仅以样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计量的精度(准确性),也能说明估计结果的把握程度(可靠程度)。125.1.3评价估计量的标准在参数估计中,用于估计总体参数的统计量有很多(不仅仅局限于前述所指出的统计量),比如,估计总体均值也可以用样本中位数做为估计量,等等。然而,究竟用哪种估计量对总体参数进行估计,这就需要对估计效果作出评判,进而就需要有一定的评价标准。一个好的估计量通常要求满足以下三个标准:

131、无偏性所谓无偏性是指样本估计量的均值应等于被估计总体参数的真值。数理统计已证明,、,同样可证明。2、有效性所谓有效性是指作为优良的估计量,除了满足无偏性外,其方差应比较小。这样才能保证估计量的取值能集中在被估计的总体参数的附近,对总体参数的估计和推断更可靠。3、一致性一致性又称相合性,即随着样本容量n的增大,一个好的估计量将在概率意义下愈来愈接近于总体的真值。(这点通过样本均值的抽样分布标准差分析之)样本平均数作为总体平均数的估计量、样本比例作为总体比例的估计量,样本方差作为总体方差的估计量,都具有上述优良性质,所以,通常用样本平均数去估计总体平均数,用样本比率去估计总体比率,用样本方差去估计总体方差。5.1.3评价估计量的标准145.2一个总体参数的区间估计5.2.1总体均值的区间估计5.2.2总体比率的区间估计5.2.3总体方差的区间估计155.2.1总体均值的区间估计在对总体均值进行区间估计时,需要考虑总体是否是正态分布,总体方差是否已知,用于构造估计量的样本是大样本还是小样本等。1、总体方差已知,正态总体均值的区间估计当总体服从正态分布且已知时,无论所抽选的样本是大样本还是小样本,样本均值的抽样分布均为正态分布,即:重复抽样下,~N(µ,σ²/n),建立置信区间所用的统计量是Z统计量:

~N(0,1)Z=165.2.1总体均值的区间估计构造总体均值所在(1-)置信水平下的的置信区间为:

称为显著性水平,是事先确定的一个概率值,也被称为风险值,它是总体均值不包括在置信区间的概率;(1-)称为置信水平;是估计总体均值时的允许误差,即误差范围。因此,总体均值的置信区间也可以表示为:175.2.1总体均值的区间估计

该表达形式表明,总体均值的置信区间是由两部分组成,即:点估计值和允许误差。当总体方差未知,但总体均值和方差有限,只要是大样本,即使总体分布形式未知或总体为非正态分布,依据中心极限定理,样本均值的分布近似正态分布,因此,估计总体均值的方法同上。不过此时,要用样本方差替代未知的总体方差。

185.2.1总体均值的区间估计2、总体方差未知,正态总体(小样本)当总体服从正态分布,但方差未知时,小样本情况下,则需用样本方差代替总体方差,此时样本均值经标准化以后统计量(随机变量)服从自由度为(n-1)的t分布,即:

这时,需要采用t分布建立总体均值的置信区间。195.2.1总体均值的区间估计则所构造的总体均值在(1-)置信水平下的置信区间为:205.2.2总体比率的区间估计在此,只讨论大样本情况下总体比率的估计.根据样本比率的抽样分布可知,当n时,样本比率p的抽样分布近似于正态分布,即:

将样本比率标准化后的统计量z服从标准正态分布,即:

z=215.2.2总体比率的区间估计所构造的总体比率p在(1-)置信水平下的置信区间为:与总体均值的置信区间构成相同,总体比率的置信区间也是由两部分组成的,即:点估计值和允许误差。225.2.2总体比率的区间估计说明:样本比率的抽样分布对n的要求。见教材p141235.2.3总体方差的区间估计在此,只讨论正态总体方差的估计。根据样本方差的抽样分布可知,样本方差服从自由度为(n-1)的分布,即:

因此,用分布构造总体方差的置信区间。给定一个显著性水平,用分布构造的总体方差的置信区间为:

245.2.3总体方差的区间估计用图示表示:0图5.1自由度为(n-1)的分布255.2.3总体方差的区间估计用代替,最终可推导出总体方差

在(1-)置信水平下的置信区间:

265.3两个总体参数的区间估计

如第四章所讲,两个总体的参数估计,主要是对两个总体的

,等的估计。

5.3.1两个总体均值之差的区间估计独立样本匹配样本5.3.2两个总体比率之差的区间估计5.3.3两个总体方差比的区间估计

275.3.1两个总体均值之差的区间估计对两个总体均值之差的估计,需要考虑两个样本是独立样本还是匹配样本,以及样本容量是大是小等相关的情况。1、两个总体均值之差的估计:独立样本所谓独立样本,是指两个样本是从两个总体中独立抽取的,即一个样本的元素与另一个样本的元素相互独立。(例p133)281、两个总体均值之差的估计:独立样本(1)总体方差已知,正态总体;或大样本如果两个总体都服从正态分布,且方差已知,则无论样本容量是大样本还是小样本;或者,两个总体分布未知,方差也未知,但两个样本都为大样本()295.3.1两个总体均值之差的区间估计根据抽样分布可知,两个样本均值之差的抽样分布,服从的正态分布。~

将两个样本均值之差标准化后,则服从标准正态分布,即:z=305.3.1两个总体均值之差的区间估计当两个总体方差已知时,两个总体均值之差在(1-)置信水平下的置信区间为:

当两个总体的方差未知时,可用两个样本方差来代替,则所构造的置信区间为:例5.6315.3.1两个总体均值之差的区间估计(2)总体方差未知,正态总体,小样本第一种情况:当两个总体的方差未知但相等,即:则需用两个样本的方差来估计,这时需将两个样本的数据结合在一起,以给出总体方差的合并估计量,用表示,其公式为:325.3.1两个总体均值之差的区间估计将两个样本均值之差标准化后服从自由度为的t分布,即:

因此,两个总体均值之差在(1-)置信水平下的置信区间为:例5.7335.3.1两个总体均值之差的区间估计第二种情况:当两个总体的方差未知但不相等,即:,两个样本均值之差经标准化后近似服从自由度为的t分布。自由度的计算公式为:345.3.1两个总体均值之差的区间估计构造两个总体均值之差在(1-)置信水平下的置信区间。355.3.1两个总体均值之差的区间估计2、两个总体均值的估计:匹配样本所谓匹配样本,是指一个样本中的数据与另一个样本中的数据相对应。为何使用“匹配样本”?(1)大样本在大样本情况下,两个总体均值之差的置信区间为:365.3.1两个总体均值之差的区间估计式中:d—两个匹配样本对应数据差值;—所有差值的均值;—各差值的标准差。当总体的未知时,可用样本差值的标准差代替。(2)小样本小样本情况下,假定两个总体各观察值的配对差服从正态分布。则两个总体均值之差的置信区间为:375.3.1两个总体均值之差的区间估计

例题教材p148(例5.9)385.3.2两个总体比率之差的区间估计依据第四章抽样分布知识,从两个二项总体中抽取两个独立的大样本,样本比率之差的抽样分布服从正态分布,则所构造的的置信区间为:

例5.10395.3.3两个总体方差比的区间估计问题的提出:现实中,如果要对两种测量工具的精度作出评价;如果要对两个生产过程的稳定性作出评价;如果要对两种不同方法生产的产品性能的稳定性作出评价;如果要对两个教授评分的差异性作出评判,等等。以上诸多问题该如何解决?两个总体方差的比较就可以解决上述问题。405.3.3两个总体方差比的区间估计与比较两个总体均值不一样,比较两个总体的方差,要用各自的样本方差比来判别。如果接近于1,说明两个总体方差很接近;反之,说明两个总体方差之间存在差异。由第四章抽样分布可知,当两个总体正态分布时,

415.3.3两个总体方差比的区间估计因此,要用F分布来构造两个总体方差比的置信区间。这个置信区间为:此置信区间等同于:

425.3.3两个总体方差比的区间估计通过上一公式,可推导出两个总体方差比在一定置信水平下的置信区间为:查F分布表时注意:F分布表给出的是上侧面积的分位数,即,而的分位数值是通过下列关系求得的:435.3.3两个总体方差比的区间估计

例5.11445.4样本容量的确定抽样设计中的一个重要内容就是要确定必要的样本单位数。

所谓必要的样本单位数,就是为了使抽样误差不超过给定的允许范围至少应抽取的样本单位数目。确定必要样本单位数的原则是:在保证抽样推断能达到预期的可靠程度和精确性的要求下,使费用达到最小,即用尽可能少的样本容量而能达到误差在允许范围之内。455.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论