总体参数区间估计(6)幻灯片_第1页
总体参数区间估计(6)幻灯片_第2页
总体参数区间估计(6)幻灯片_第3页
总体参数区间估计(6)幻灯片_第4页
总体参数区间估计(6)幻灯片_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节参数估计的基本问题第二节单个总体均值和比率的区间估计第三节样本容量的确定第四节两个总体均值和比率差异的区间估计第五节分层抽样、整群抽样和等距抽样的区间估计第6章STAT一家食品生产企业以生产袋装食品为主,每天的产量约为8000袋左右。按规定每袋的重量应不低于100克,否则即为不合格。为对产量质量进行检测,企业设有质量检查科专门负责质量检验,并经常向企业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。由于产品的数量大,进行全面的检验是不可能的,可行的办法是抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一批食品中随机抽取了25袋,下表是对每袋食品重量的检验结果。(假定该种袋装食品重量服从正态分布。)案例导入STAT

根据表中数据,质检科估计出该天生产的食品每袋的平均重量在101.57~109.14克之间,其中,估计的可信程度为95%,估计误差不超过4克。产品的合格率在95.68%~64.32%之间,其中,估计的可信程度为95%,估计误差不超过15.68%。25袋食品的重量(克)112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.0108.8101.6108.498.4100.5115.6102.2105.093.3STAT案例导入STAT

质检报告提交后,企业高层领导人提出几点意见:一是抽取的样本大小是否合适?能不能用一个更大的样本进行估计?二是能否将估计的误差在缩小一点?比如,估计平均重量时估计误差不超过3克,估计合格率时误差不超过10%。三是总体平均重量的方差是多少?因为方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应对生产过程进行调整。STAT案例导入第6章总体参数估计STAT本章重点1、单个总体均值的区间估计;2、样本容量的确定;3、两个总体均值之差的区间估计。本章难点1、小样本情形下总体参数的区间估计;2、其他组织形式总体参数的区间估计及样本容量的确定。点估计从总体中抽取一个随机样本,计算与总体参数相应的样本统计量,然后把该统计量视为总体参数的估计值,称为参数的点估计。简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况的抽样分布点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差问题:第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数?估计值的优良标准第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优于另一个?估计值的优良标准:无偏性、有效性、一致性抽样估计量的优良标准设为待估计的总体参数,为样本统计量,则的优良标准为:若,则称为的无偏估计量指样本指标的均值应等于被估计的总体指标无偏性若,则称为比更有效的估计量若越大越小,则称为的一致估计量作为优良的估计量,除了满足无偏性的要求外,其方差应比较小有效性指随着样本单位数的增大,样本估计量将在概率意义下越来越接近于总体真实值一致性抽样估计量的优良标准无偏性无偏性:估计量抽样分布的数学期望等于被估计的总体参数。P(

)BA无偏有偏有效性有效性:与离散度相联系。对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。

AB的抽样分布的抽样分布P(

)一致性一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。AB较小的样本容量较大的样本容量P(

)为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量。数理统计证明:抽样估计量的优良标准第二节单个总体均值和比率的区间估计一、总体均值的区间估计:大样本(n≥30)的情形总体标准差已知总体标准差未知二、总体均值的区间估计:小样本(n<30)的情形三、总体比率的区间估计区间估计在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在75~85之间,置信水平是95%

样本统计量

(点估计)置信区间置信下限置信上限区间估计的图示x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.65x+1.65x一、总体均值的区间估计

大样本(n≥30)的情形【例】Duotu公司是一家专营体育设备和附件的公司,为了监控公司的服务质量,Duotu公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意分数的样本均值为80分,试建立总体满意分数的区间。STAT(一)抽样误差抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。(实际未知)STATSTAT由概率论可知,服从标准正态分布,即有以下关系式成立:一般称,为置信度,可靠程度等,反映估计结果的可信程度。若事先给定一个置信度,则可根据标准正态分布找到其对应的临界值。进而计算抽样误差STAT(二)抽样误差的概率表述(三)总体均值的区间估计1、大样本、已知2、使用正态分布统计量Z3、总体均值在1-置信水平下的置信区间为(三)总体均值的区间估计1、大样本、未知2、使用正态分布统计量Z3、总体均值在1-置信水平下的置信区间为【例】某市交通部门为了对城市的环境进行监测,定期公布该市居民每天小汽车的里程数,抽取了36个居民作为一个简单随机样本,得到资料如下。试构造该市居民每天小汽车里程数的总体均值的95%的置信区间。居民汽车里程数居民汽车里程数居民汽车里程数居民汽车里程数123456789325040243344454844101112131415161718473136394645393845192021222324252627274354363448233642282930313233343536343934354253284939分析:区间估计包括两个部分——点估计和误差边际,只需分别求出即可到的总体的区间估计。解:已知(1)样本的汽车里程数

(2)误差边际样本标准差误差边际(3)90%的置信区间为39.5±2.13即(37.37,41.63)里。

注意(1)置信系数一般在抽样之前确定,根据样本所建立的区间能包含总体参数的概率为(2)置信区间的长度(准确度)在置信度一定的情况下,与样本容量的大小呈反方向变动,若要提高估计准确度,可以扩大样本容量来达到。

在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分布。t分布的图形和标准正态分布的图形类似STAT二、总体均值的区间估计小样本(n<30)的情形0标准正态分布t分布(自由度为20)t分布(自由度为10)标准正态分布与t分布的比较总体均值的区间估计1、总体服从正态分布、小样本、未知2、使用t分布统计量3、总体均值

在1-置信水平下的置信区间为【例】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修职员掌握及其维修的操作,以减少培训工人所需要的时间。为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方对15名职员进行培训的培训天数资料。根据上述资料建立置信度为95%的总体均值的区间估计。(假定培训时间总体服从正态分布)。职员时间职员时间职员时间152659115424475012583558541360444962146254510461563解:依题意,总体服从正态分布,n=15(小样本),此时总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值的区间估计。样本平均数样本标准差误差边际95%的置信区间为53.87±3.78即(50.09,57.65)天。三、总体比率的区间估计1、样本比例近似服从正态分布2、使用正态分布统计量z3、总体比例在1-置信水平下的置信区间为【例】1997年菲瑞卡洛通讯公司对全国范围每内的902名女子高尔夫球手进行了调查,以了解美国女子高尔夫球手对自己如何在场上被对待的看法。调查发现,397名女子高尔夫球手对得到的球座开球次数感到满意。试在95%的置信水平下估计总体比例的区间。

(3)95%的置信区间0.44±0.0324

即(0.4076,0.4724)。结论:在置信水平为95%时,所有女子高尔夫球手中有40.76%到47.24%的人对得到的球座开球数感到满意。分析:解:(1)样本比例(2)误差边际第三节样本容量的确定一、总体均值估计时样本容量的确定二、总体比率估计时样本容量的确定STAT一、总体均值估计时样本容量的确定STAT【例】拥有工商管理硕士学位的毕业生每年年薪底薪的标准差大约为2000元,假定希望估计每年年薪底薪的95%的置信区间。如果研究者期望的极限误差为200元,样本容量应当有多大?解:依题意,可得将以上结果取下一个整数(385)即为必要的样本容量。

由于总体标准差在大多数情况下是未知的,可以有以下方法取得的值。(1)使用有同样或者类似单元的以前样本的样本标准差;(2)抽取一个预备样本进行试验性研究。用实验性样本的标准差作为的估计值。(3)运用对值的判断或者“最好的猜测”,例如,通常可用全距的1/4作为的近似值。说明STAT二、总体比率估计时样本容量的确定STAT【例】LouisHarris﹠Associates对女性行政人员所进行的一项调查表明,33%的被调查者认为他们所在的公司十分适合女性行政人员工作。假定《职业女性》每年一度对该比率进行调查,令总体比率的值为,如果希望极限误差为应选取多少名女性行政人员组成样本?假定区间估计中取置信水平为95.45%。解:依题意,可得将以上结果取下一个整数(89)即为必要的样本容量。STAT

由于总体比例在大多数情况下是未知的,可以有以下方法取得的值。(1)使用有同样或者类似单元的以前样本的样本比例;(2)抽取一个预备样本进行试验性研究。用实验性样本的比例作为的估计值。(3)运用对值的判断或者“最好的猜测”;(4)如果上面的方法都不适用,采用。STAT说明必要的样本容量受以下因素影响总体标准差极限误差的期望值置信度抽样方法抽样组织方式STAT第四节两个总体均值和比率差异的区间估计一、两个总体均值差异的估计(独立样本)(一)大样本且总体标准差已知(二)大样本且总体标准差未知(三)小样本二、两个总体比率差异的估计一、两个总体均值差异的估计假定条件两个样本容量都很大(n130和n230)两个样本是独立的随机样本使用正态分布统计量z的点估计【例】TheButlerCounty银行与信托公司在S市有两个支行,现在该公司想对位置不同的支行进行调查以了解他们的信用卡使用情况,以便为公司采取新的营销措施提供依据。公司负责人对位于市区的A支行和另一个地处某郊区的B支行进行调查,以95%的置信水平估计这两个支行的信用卡余额均值的差异。假定从两支行各抽取了一个由49张信用卡组成的随机样本,样本均值如下:银行A:4500元;银行B:3250元。设已知两个总体的方差分别为

接下来计算误差边际

得到总体均值之差的95%的置信区间为1250±21.87即(1228.13,1271.87

)元。解:依据区间估计的一般原理以及首先计算点估计的值

假若在例中,我们事先并没有关于总体方差的任何资料,但是抽样过程已经取得了两个样本的标准差料如下:

在95%的置信水平下,两个总体均值之差的置信区间为:即1250±23.31=(1226.69,1273.31)元。STAT假定:(1)两个总体都服从正态分布。(2)两个总体方差相等若总体方差已知,抽样分布是正态分布(无论样本容量大小),数学期望为,标准差为:若总体方差未知,用两个样本方差估计。

的区间估计的具体表达式为【例】某城市的规划小组想要估计两个相邻地区家庭平均收入之差。经过调查得到这两个地区家庭的独立随机样本提供如下的资料:两个相邻地区的独立样本数据地区1地区2试计算两个地区平均收入之差的95%的置信区间。(假定两个总体服从方差相等的正态分布)在95%的置信水平下,两个地区家庭平均收入之差的区间为437.59元至1962.41元之间。二、两个总体比率差异的估计假定条件:适用于来自两个总体的独立、随机样本。两个总体比例之差的点估计量:STAT[例]某税收机构想要比较两个地区办事处的工作质量。通过随机抽取每个办事处拟定的纳税申报单的样本并且确认其中哪些为正确的,该机构可以估计每个办事处的有错申报的比率。特别值得注意的是其比率之差。令:假设来自于两个办事处的独立随机样本提供了下面信息:

归纳:

两个总体比例之差的区间估计:大样本情况下90%的置信区间为(0.005,0.095)。第五节分层抽样、整群抽样和等距抽样的区间估计STAT在分层抽样中,总体首先被分成若干个层,然后再从各层中随即抽取一定的样本单位组成一个样本。设总体由个单位组成,并被划分为层,各层包含,,…,个单位,则。又设总的样本容量为,从每一层各自独立地抽取一个简单随机样本,各层的样本容量分别为,,…,,满足。STAT一、分层随机抽样的区间估计(一)总体均值的区间估计整个总体的均值便是各层均值的加权算术平均数,即第h层的样本均值的数学期望和方差分别为STAT根据数学期望的性质,有

STAT(一)总体均值的区间估计STAT所以,估计量的方差值与各层内方差有关,与层之间的差别无关。因此,是总体均值的无偏估计量。STAT(一)总体均值的区间估计STAT若各层的样本容量是等比例分配的,即则的方差就简化为:STAT(一)总体均值的区间估计根据方差加法定理,在分组情况下,有总方差()=组内平均方差()+组间方差()STAT在分层抽样情形下,总方差仅由层内平均方差构成,小于简单随机抽样时的总方差,因此分层抽样的抽样误差比简单随机抽样的抽样误差小的结论。另外,我们还可以通过扩大层间方差进一步提高分层抽样的效率。STAT(一)总体均值的区间估计STAT总体层内方差一般是未知的,可用样本层内方差代替,得到方差的无偏估计:若给定置信度为,极限误差为

STAT(一)总体均值的区间估计STAT因此总体均值的置信区间:

【例】某厂有甲、乙两个车间生产保温瓶,乙车间产量是甲车间的2倍。现按产量比例共抽查了60支,结果如下。试以95.45%的可靠程度推断该厂生产的保温瓶的平均保温时间的可能范围。STAT(一)总体均值的区间估计STAT层1225281.20.8合计——解:从题意可知,样本单位在各层是等比例分配的,于是点估计值STAT(一)总体均值的区间估计STAT抽样标准差总体均值的95.45%的置信区间为:

[27—0.24,27+0.24],即[26.76,27.24]小时。STAT(一)总体均值的区间估计STAT重复抽样方法下

不重复抽样方法下

STAT(二)样本容量的确定STAT在大样本情形下,总体成数的点估计量为:方差为STAT(三)总体成数的区间估计STAT在大样本情形下,总体成数的置信水平的置信区间:STAT(三)总体成数的区间估计STAT(一)总体均值的区间估计设总体被划分为群,每群都包含个单位,总体的单位数。又设总体均值为,总体第群的均值为。于是有:总体的个群看作是个群单位。他们分别具有标志值,二、整群抽样的区间估计STAT设从总体的个群单位中以等概率的方式随机抽取个群单位组成样本,其标志值分别为按简单随机抽样中的估计方法对总体均值作出估计。

的无偏估计为

STAT(一)总体均值的区间估计STATSTAT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论