第六章 参数估计.ppt_第1页
第六章 参数估计.ppt_第2页
第六章 参数估计.ppt_第3页
第六章 参数估计.ppt_第4页
第六章 参数估计.ppt_第5页
免费预览已结束,剩余64页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章参数估计,第六章参数估计,1抽样分布2点估计3区间估计4一个总体参数的区间估计5两个总体参数的区间估计6样本量,1抽样分布,1.1抽样的基本概念1.2样本均值的抽样分布1.3中心极限定理,1.1抽样的基本概念,在抽样问题中,我们把研究对象的全体称为总体(population),总体的数量特征就是总体参数(Populationparameter)。为了解总体的情况,我们从总体中随机抽取的个个体称为样本(sample),样本的数量特征就是统计量(statistics),它与总体参数相对应。统计量是关于样本数据的函数,它不依赖任何未知参数,利用调查数据,就能直接计算得到统计量的值。,1.1抽样的基本概念,设是从总体中抽取的容量为的一个样本,根据样本构造一个函数,该函数便是一个统计量,也称为样本统计量。当调查得到样本数据的值时,代入,计算出的数值,就得到了一个具体的统计量值。在这里,大写的表示变量,小写的表示变量的具体取值,相应的,表示统计量,而则表示统计量的一个具体结果。,1.1抽样的基本概念,设是从总体中抽取得到一个样本,则:样本均值为样本方差为样本均值和方差是最常见的统计量。,1.2样本均值的抽样分布,设总体服从正态分布,为个互相独立且与总体同分布的随机变量,则样本均值服从期望为,方差为的正态分布。记作:上面的结果表明,样本均值的期望与总体均值相同,而方差则变为原来的,这说明用样本均值去估计总体均值,平均来说没有偏差(因为期望相等),当样本量增加时,样本均值的方差变小,即用样本均值估计总体均值会更加精确。,1.3中心极限定理,设总体的分布未知,但已知均值为,方差为,抽取得到一个容量为的样本,当足够大(我们通常要求)时,则样本均值近似服从期望为,方差为的正态分布。中心极限定理告诉我们:不管总体服从什么样的分布,只要样本量足够大,样本均值都近似服从正态分布。,2点估计,参数估计的方法分为:点估计区间估计点估计:直接以样本统计量的某个取值作为总体参数的估计值区间估计:给出一个区间,说起来留有余地,不像点估计那么绝对,2点估计,2.1点估计2.2点估计优劣的评价标准,2.1点估计,点估计(pointestimation)就是直接以样本统计量的某个取值作为总体参数的估计值。在统计中经常使用的点估计量有:用样本均值直接估计总体均值,用样本比例直接估计总体比例,用样本方差直接估计总体方差等。,2.1点估计,【例6.1】已知某种灯泡的寿命,其中和都是未知的。现随机抽取,10只灯泡,测得寿命(单位:小时)分别为1502,1453,1567,1510,1500,1468,1582,1534,1450,1504,试估计和。,2.1点估计,解:因为是全部灯泡的平均寿命,为样本平均寿命,根据点估计的思想,用估计,用估计。由于所以,和的估计值分别为1507小时和1970.222小时。,2.2点估计优劣的评价标准,评价估计量好坏的标准:无偏性有效性一致性,2.2点估计优劣的评价标准,1.无偏性定义如果的期望等于未知参数,即对一切可能的成立,则称为的无偏估计。,2.2点估计优劣的评价标准,【例6.2】设为从一均值为的总体中抽取的样本,请验证的如下估计量的无偏性:,2.2点估计优劣的评价标准,解:由于,容易验证,。因而,都是的无偏估计。然而,因而它们都不是的无偏估计。,2.2点估计优劣的评价标准,2.有效性定义设和均为参数的无偏估计,如果有则称比有效。当是所有无偏估计中方差最小的那个时,称为最小方差无偏估计。,2.2点估计优劣的评价标准,3一致性定义设是的一个估计量,若依概率收敛于,即对任意的,则称是的一致估计。同时满足上述三条标准的估计量称为一致最小方差无偏估计量。,3区间估计,定义设为总体的一个未知参数,是来自该总体的一个样本,对给定的,确定两个统计量和,若有成立,则称为的置信度为的置信区间。其中,称为置信下限,称为置信上限。为显著性水平,一般取较小的值,如,等。,3区间估计,区间长度则表示估计的范围,即估计的精度,区间长度越短越好。但置信度和区间长度是相互矛盾的。实际中,我们总是在保证置信度的前提下,尽可能地提高精度。,4一个总体参数的区间估计,4.1正态分布总体4.2非正态分布总体4.3比例的估计,4.1正态分布总体,1正态总体,已知当总体服从正态分布且已知时,样本均值的抽样分布均为正态分布,对进行标准化以后的随机变量将服从标准正态分布,即有:从而,总体均值在置信度下的置信区间为:,4.1正态分布总体,【例6.3】从某超市的货架上随机地抽得9包0.5千克装的白糖,实测其重量分别为(单位:千克):,从长期的实践中知道,该品牌的白糖重量服从正态分布已知,求的置信区间。,4.1正态分布总体,解:经计算,对于显著性水平,查标准正态分布表,可得,于是,的置信区间为,4.1正态分布总体,2正态总体,未知方差未知,且为小样本时,虽然同样可以用样本方差代替来构建总体均值的置信区间,但此时,样本均值经标准化以后的随机变量服从自由度为的分布,即:,4.1正态分布总体,根据分布建立的总体均值在置信度下的置信区间为:其中,为自由度为时,分布中左侧面积为时的值。,4.1正态分布总体,【例6.4】例6.3中,若未知,求的95%的置信区间。解:已知,直接计算可得对于显著性水平,查自由度为的分布表,可得。从而,的95%置信区间为:,4.2非正态分布总体,当总体是非正态分布总体时,在数学上可以证明,当样本足够大时,无论总体是否服从正态分布,样本均值的抽样分布均为正态分布,其数学期望为总体均值,方差为,其中为总体方差。对进行标准化以后的随机变量将服从标准正态分布,即有:从而,总体均值在置信度下的置信区间为:其中,是标准正态分布左侧面积为时的Z值。,4.2非正态分布总体,如果总体的方差未知,则式中的可用样本标准差代替,此时总体均值的置信区间变为:,4.2非正态分布总体,【例6.5】从某校随机地抽取100名男学生,测得平均身高为170厘米,标准差为7.5厘米,试求该校男学生平均身高95的置信区间。,4.2非正态分布总体,解:由于为大样本,且总体方差未知,又100,170,7.5,1-0.95,查表得1.96,有1701.961701.47因此,该校男学生平均身高的95的置信区间为68.5171.5厘米之间。,4.3比例的估计,大样本情形(,时),比例的抽样分布可用正态分布近似。的数学期望为,的方差为。样本比例经标准化后的随机变量服从标准正态分布,即:,4.3比例的估计,从而,总体比例在置信度下的置信区间为:,4.3比例的估计,值未知的解决办法:用样本比例来代替,总体比例的置信区间可表示为:较为保守的方法:当0.5时,达到最大值。所以用0.5作为的估计值求出的将是最宽的置信区间:当0.30.7时,由这两种方法得到的结果很接近。,4.3比例的估计,【例6.6】从某社区抽取一个由200个家庭组成的样本,发现其中有36的家庭拥有电脑。试问,在99%的置信度下,该社区拥有电脑的家庭所占比例的置信区间是多少?,4.3比例的估计,解:若采用第一种方法,得到的置信区间为:O.362.58O.36O.09=0.27,0.45,4.3比例的估计,若采用第二种方法,则得到置信区间:0362.58O.36O.09=0.27,0.45因此,该社区拥有电脑的家庭所占比例的置信区间是27%,45%。,5两个总体参数的区间估计,5.1独立样本5.2匹配样本5.3比例之差的估计,5.1独立样本,独立样本指的是两个样本从两个总体中独立抽取,一个样本中的元素与另一个样本中的元素相互独立。,5.1独立样本,假设有两个总体,它们均值分别为和,方差分别为和,现分别从这两个总体中独立地抽取大小为和的两个样本。在大样本情形下,无论两个总体是否服从正态分布,两个样本均值之差的抽样分布均服从期望为-,方差为的正态分布,即有:,5.1独立样本,对进行标准化,则有,5.1独立样本,当两个总体的方差为、已知时,由,可构造置信度下的的置信区间为当两个总体的方差、未知时,可以用两个样本方差来代替。置信区间为:,5.2匹配样本,匹配样本指的是一个样本中的数据与另一个样本中的数据相对应。大样本条件下,使用匹配样本进行估计时,两个总体均值之差的置信度下的置信区间为其中,表示两个匹配样本数据的差值,表示各差值的均值,表示各差值的标准差。,5.2匹配样本,若未知,可用样本数据来代替。而如果是小样本,若两个总体配对的观察值之差服从正态分布,则的置信区间为,5.2匹配样本,【例6.7】某机构对随机抽取的10名小学生采用A、B两套试卷测智力,结果如表6.1所示,试建立这两套试卷平均得分之差的95%置信区间。,5.2匹配样本,解:将每位学生A套试卷的得分与B套试卷得分相差,得到差值列。又查分布表可知,得到这两套试卷平均得分之差的95%置信区间为:,5.3比例之差的估计,两个样本比例之差的抽样分布服从正态分布,将进行标准化,则有,5.3比例之差的估计,通常和是未知的,可以用样本比例和来代替。两个总体比例之差在置信度下的置信区间可构建为,5.3比例之差的估计,【例6.8】H公司委托一家市场调查公司对旗下产品进行调查,以对该公司产品在两个地区的市场占有率进行比较。调查公司从这两个地区分别随机调查了1000人,其中使用过H公司产品的被调查者所占的比例分别为30%和22%,试求这两个地区H公司产品市场占有率之差的95%置信区间。,5.3比例之差的估计,解:,=30%,=22%,故=70%,=78%,查表可得,=1.96。代入算式,得:从而,两个地区产品市场占有率之差的95%置信区间为,6样本量,6.1确定样本量的一般问题6.2一般问题的具体化,6.1确定样本量的一般问题,在置信度下,总体均值的置信区间为,其区间长度为。置信区间长度的一半称为允许误差,表示在一定的置信度下,用样本均值去估计总体均值时所允许的最大绝对误差,用符号表示。允许误差、可靠性系数、总体标准差和样本量之间存在着如下关系:,6.1确定样本量的一般问题,从而有,6.1确定样本量的一般问题,影响样本量的因素主要有:1可靠性系数所需要的样本量与可靠性系数成正比关系2总体方差所需要的样本量与总体方差也成正比关系3允许误差所需要的样本量与允许误差成反比关系,6.2.1估计总体均值1单个总体情形若总体方差未知,则可采用经验值代替。,6.2一般问题的具体化,【例6.9】设某市家庭的月均收入服从正态分布,标准差为l000元,现要对该市家庭的月平均收入进行估计,若置信度为95,允许的估计误差在100元以内,样本量应定为多少?,6.2一般问题的具体化,解:由题意,1000元,100元,1-0.95=0.05,查表得1.96,代入算式,得384.16385385(人),6.2一般问题的具体化,6.2一般问题的具体化,2两个总体情形对于给定的允许误差和置信度,估计两个总体均值之差所需的样本量为:其中,和为从两个总体中抽取的样本量,和为两个总体的方差。,【例6.10】假定两个总体的标准差分别为,若要求误差范围不超过5,相应的置信度为95%。假定估计两个总体均值之差时所需的样本量为多大?,6.2一般问题的具体化,解:因而,所需的样本量为=57,=57。,6.2一般问题的具体化,6.2.2估计总体比例1单个总体情形与估计总体均值时样本量的确定方法类似,单个总体情形,估计总体比例的允许误差的表达式为,6.2一般问题的具体化,整理可得样本量的确定公式:,6.2一般问题的具体化,【例6.11】如果认为某地区私家车的拥有比例为0.5,且要求在95的置信度下保证这一比例的允许的估计误差不超过3,试问样本量应定为多少?,6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论