《统计学》(第二版)学习指导与习题训练答案-总体参数区间估计(6)_第1页
《统计学》(第二版)学习指导与习题训练答案-总体参数区间估计(6)_第2页
《统计学》(第二版)学习指导与习题训练答案-总体参数区间估计(6)_第3页
《统计学》(第二版)学习指导与习题训练答案-总体参数区间估计(6)_第4页
《统计学》(第二版)学习指导与习题训练答案-总体参数区间估计(6)_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、STAT案例导入一家食品生产企业以生产袋装食品为主,每天的产量约为8000袋左右。按规定每袋的重量应不低于100克,否那么即为不合格。为对产量质量进行检测,企业设有质量检查科专门负责质量检验,并经常向企业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。 由于产品的数量大,进行全面的检验是不可能的,可行的方法是抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一批食品中随机抽取了25袋,下表是对每袋食品重量的检验结果。假定该种袋装食品重量服从正态分布。第六章 总体参数估计STAT 根据表1的数据,质检科估计出该天生产的食品每袋的平均重量在克之间,其中,估计的可信程度为95%

2、,估计误差不超过4克。产品的合格率在95.68%64.32%之间,其中,估计的可信程度为95%,估计误差不超过15.68%。表1 25袋食品的重量(克)112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.0108.8101.6108.498.4100.5115.6102.2105.093.3STAT第六章 总体参数估计STAT 质检报告提交后,企业高层领导人提出几点意见:一是抽取的样本大小是否适宜?能不能用一个更大的样本进行估计?二是能否将估计的误差在缩小一点?比方,估计平均重量时估计误差不超过

3、3克,估计合格率时误差不超过10%。三是总体平均重量的方差是多少?因为方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应对生产过程进行调整。STAT第六章 总体参数估计第六章 总体参数估计STAT本章重点1、单个总体均值的区间估计;2、样本容量确实定;3、两个总体均值之差的区间估计;本章难点1、小样本情形下总体参数的区间估计;2、其他组织形式总体参数的区间估计及样本容量确实定;一、 点估计点估计就是用样本估计量的一个具体观测值直接作为总体的未知参数的估计值的方法。如例中随机抽取的100头的平均每头毛重(95.5kg)可作为10000头平均每头毛重 的点估计值 常用的估计量有:(1)样

4、本平均数 为总体平均数 的估计量; (2)样本方差 为总体方差 的估计量; (3)样本成数 为总体成数 估计量。参数估计的根本问题STAT第六章 总体参数估计 在对总体特征做出估计时,并非所有估计量都是优良的,从而产生了评价估计量是否优良的标准。作为优良的估计量应该符合如下三个标准:二、点估计的性质 STATSTAT第六章 总体参数估计1、无偏性 如果样本某统计量的数学期望值等于其所估计的总体参数真值,那么这个估计统计量就叫做该总体参数的无偏估计量。如样本平均数的数学期望是总体平均数,那么样本均值是总体均值的无偏估计量。这里无偏估计量是指没有系统偏差(非随机偏差)的平均意义上的量,即如果说一个

5、估计量是无偏性的,并不是保证用于单独一次估计中没有随机性误差,只是没有系统性偏差而已。这是一个优良估计量的重要条件。 假设以 代表被估计的总体参数, 代表 的无偏估计量那么有:STATSTAT第六章 总体参数估计2、一致性 假设估计量随样本容量n的增大而越来越接近总体参数值时,那么称该估计量为被估计参数的一致性估计量。估计量的一致性是从极限意义上讲的,它适用于大样本的情况。如果一个估计量是一致性估计量,那么采用大样本就更加可靠。当然,样本容量n增大时,估计量的一致性会增强,但调查所需的人、财、物力也相应增加。例如,以样本平均数估计总体平均数,符合一致性的要求,即存在如下关系:式中 为任意小的正

6、数。STATSTAT第六章 总体参数估计3、有效性 有效性是指无偏估计量中方差最小的估计量。无偏估计量只考虑估计值的平均结果是否等于待估计参数的真值,而不考虑估计的每个可能值及其次数分布与待估计参数真值之间离差大小的离散程度。我们在解决实际问题时,不仅希望估计值是无偏的,更希望这些估计值的离差尽可能地小,即要求比较各无偏估计量中与被估计参数的离差较小的为有效估计量。如样本平均数与中位数都是总体均值的无偏估计量,但在同样的样本容量下,样本平均数是有效的估计量。STATSTAT第六章 总体参数估计6.2 单个总体均值和比率的区间估计 点估计的缺点:不能反映估计的误差和精确程度区间估计:利用样本统计

7、量和抽样分布估计总体参数的可能区间STATSTAT第六章 总体参数估计STAT【例1】Duotu公司是一家专营体育设备和附件的公司,为了监控公司的效劳质量, Duotu公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意分数的样本均值为80分,试建立总体满意分数的区间。一抽样误差抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。抽样误差一、 总体均值的区间估计大样本n30实际未知STAT第六章 总体参数估计STAT要进行区间估计,关键是将抽样误差 求解。假设 ,那么区间可表示为: 此时,可以

8、利用样本均值的抽样分布对抽样误差的大小进行描述。 上例中,样本容量n=100,总体标准差 ,根据中心极限定理可知,此时样本均值服从均值为 ,标准差为 的正态分布。即:STAT第六章 总体参数估计STAT二抽样误差的概率表述 由概率论可知, 服从标准正态分布,即,有以下关系式成立:一般称, 为置信度,可靠程度等,反映估计结果的可信程度。假设事先给定一个置信度,那么可根据标准正态分布找到其对应的临界值 。进而计算抽样误差STAT第六章 总体参数估计STAT假设,那么查标准正态分布表可得,抽样误差 此时抽样误差的意义可表述为:以样本均值为中心的的区间包含总体均值的概率是95%,或者说,样本均值产生的

9、抽样误差是或更小的概率是。 常用的置信度还有90%,95.45%,99.73%,他们对应的临界值分别为,2和3,可以分别反映各自的估计区间所对应的精确程度和把握程度。STAT第六章 总体参数估计STAT 在Duotu公司的例子中,样本均值产生的抽样误差是或更小的概率是。因此,可以构建总体均值的区间为,由于,从一个总体中抽取到的样本具有随机性,在一次偶然的抽样中,根据样本均值计算所的区间并不总是可以包含总体均值,它是与一定的概率相联系的。如以下图所示:三计算区间估计:STAT第六章 总体参数估计STAT图1 根据选择的在 、 、 位置的样本均值建立的区间STAT 上图中,有95%的样本均值落在阴

10、影局部,这个区域的样本均值的区间能够包含总体均值。 因此,总体均值的区间的含义为,我们有95%的把握认为,以样本均值为中心的的区间能够包含总体均值。 通常,称该区间为置信区间,其对应的置信水平为 置信区间的估计包含两个局部:点估计和描述估计精确度的正负值。也将正负值称为误差边际或极限误差,反映样本估计量与总体参数之间的最大误差范围。总结:STAT第六章 总体参数估计STAT在大多数的情况下,总体的标准差都是未知的。根据抽样分布定理,在大样本的情况下,可用样本的标准差s作为总体标准差的点估计值,仍然采用上述区间估计的方法进行总体参数的估计。STAT第六章 总体参数估计STAT【例2】某市交通部门

11、为了对城市的环境进行监测,定期公布该市居民每天小汽车的里程数,抽取了36个居民作为一个简单随机样本,得到资料如下。试构造该市居民每天小汽车里程数的总体均值的95%的置信区间。居民 汽车里程数 居民 汽车里程数 居民汽车里程数 居民汽车里程数 12345678932504024334445484410111213141516171847313639464539384519202122232425262727435436344823364228 2930313233343536343934354253284939STAT第六章 总体参数估计STAT分析:区间估计包括两个局部点估计和误差边际,只需分

12、别求出即可到的总体的区间估计。解:1样本的汽车里程数 2误差边际STAT第六章 总体参数估计STAT样本标准差误差边际390%的置信区间为39.5 2.13 即,里。 注意1置信系数一般在抽样之前确定,根据样本所建立的区间能包含总体参数的概率为2置信区间的长度准确度在置信度一定的情况下,与样本容量的大小呈反方向变动,假设要提高估计准确度,可以扩大样本容量来到达。STAT第六章 总体参数估计STAT 在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分布。我们讨论总体服从正态分布的情况。t分布的图形和标准正态分布的图形类似,如以下图示:二、总体均值的区间估计:小样本n30STAT第六章 总体参

13、数估计STAT0标准正态分布t分布自由度为20t分布自由度为10图2标准正态分布与t分布的比较STAT第六章 总体参数估计STAT在分布中,对于给定的置信度,同样可以通过查表找到其对应的临界值,利用临界值也可计算区间估计的误差边际因此,总体均值的区间估计在总体标准差未知的小样本情况下可采用下式进行:假定总体服从正态分布;STAT第六章 总体参数估计STAT【例3】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修职员掌握及其维修的操作,以减少培训工人所需要的时间。为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方对名职员进行培训的培训天数资料。根据上述资料建

14、立置信度为的总体均值的区间估计。假定培训时间总体服从正态分布。职员时间职员时间职员时间STAT第六章 总体参数估计STAT解:依题意,总体服从正态分布,小样本,此时总体方差未知。可用自由度为n-1=14的t分布进行总体均值的区间估计。样本平均数样本标准差误差边际95%的置信区间为53.87 3.78 即,天。STAT第六章 总体参数估计STAT 对总体比例 的区间估计在原理上与总体均值的区间估计相同。同样要利用样本比例 的抽样分布来进行估计。 假设, 那么样本比例近似服从正态分布。 同样,抽样误差 类似的,利用抽样分布正态分布来计算抽样误差三、 总体比率的区间估计STAT第六章 总体参数估计S

15、TAT上式中, 是正待估计的总体参数,其值一般是未知,通常简单的用 替代 。即用样本方差 替代总体方差 。那么, 误差边际的计算公式为:STAT第六章 总体参数估计STAT【例4】1997年菲瑞卡洛通讯公司对全国范围每内的902名女子高尔夫球手进行了调查,以了解美国女子高尔夫球手对自己如何在场上被对待的看法。调查发现,397名女子高尔夫球手对得到的球座开球次数感到满意。试在95%的置信水平下估计总体比例的区间。分解:解:依题意,1样本比例2误差边际STAT第六章 总体参数估计STAT 395%的置信区间0.44 0.0324 即,。 结论:在置信水平为95%时,所有女子高尔夫球手中有40.76

16、%到47.24%的人对得到的球座开球数感到满意。STAT第六章 总体参数估计STAT第六章 总体参数估计6.3 样本容量确实定误差边际其计算需要假设我们选择了置信度STAT由此,得到计算必要样本容量的计算公式:STAT第六章 总体参数估计一、总体均值估计时样本容量确实定STAT【例5】拥有工商管理硕士学位的毕业生每年年薪底薪的标准差大约为2000元,假定希望估计每年年薪底薪的95%的置信区间。如果研究者期望的极限误差为200元,样本容量应当有多大?解:依题意,可得将以上结果取下一个整数385即为必要的样本容量。第六章 总体参数估计STAT 说明: 由于总体标准差 在大多数情况下 是未知的,可以

17、有以下方法取得 的值。1使用有同样或者类似单元的以前样本的样本标准差;2抽取一个预备样本进行试验性研究。用实验性样本的标准差作为 的估计值。3运用对 值的判断或者“最好的猜测,例如,通常可用全距的1/4作为 的近似值。STAT第六章 总体参数估计STAT在建立总体比例的区间估计时,确定样本容量的原理与第三节第一点中使用的为估计总体均值时确定样本容量的原理相类似。二、 总体比率估计时样本容量确实定STAT第六章 总体参数估计STAT【例6】Louis HarrisAssociates对女性行政人员所进行的一项调查说明,33%的被调查者认为他们所在的公司十分适合女性行政人员工作。假定?职业女性?每

18、年一度对该比率进行调查,令总体比率的值为 ,如果希望极限误差为 ,应选取多少名女性行政人员组成样本?假定区间估计中取置信水平为95.45%。解:依题意,可得将以上结果取下一个整数89即为必要的样本容量。STAT第六章 总体参数估计STAT 说明: 由于总体比例 在大多数情况下是未知的,可以有以下方法取得 的值。1使用有同样或者类似单元的以前样本的样本比例;2抽取一个预备样本进行试验性研究。用实验性样本的比例作为 的估计值。3运用对 值的判断或者“最好的猜测;4如果上面的方法都不适用,采用 。STAT第六章 总体参数估计STAT练习:对某种白炽灯进行使用寿命检验,根据以往正常生产经验,灯泡使用寿

19、命标准差为0.4小时,合格率为90%,先采用重复抽样的方式,在95.45%的概率保证度下,抽样平均使用寿命的极限误差不超过0.08小时,合格率的误差不超过5%,试计算必要的样本容量。第六章 总体参数估计6.4 两个总体均值之差、比率差异的区间估计一、 两个总体均值差异的估计:独立样本 的抽样分布:两个总体均值之差的抽样分布的形式:如果两个总体的样本大小都足够大,可以以正态分布来近似。STAT 的点估计STAT第六章 总体参数估计STAT【例7】The Butler County银行与信托公司在S市有两个支行,现在该公司想对位置不同的支行进行调查以了解他们的信用卡使用情况,以便为公司采取新的营销

20、措施提供依据。公司负责人对位于市区的A支行和另一个地处某郊区的B支行进行调查,以95%的置信水平估计这两个支行的信用卡余额均值的差异。假定从两支行各抽取了一个由49张信用卡组成的随机样本,样本均值如下:银行A:4500元;银行B:3250元。设两个总体的方差分别为 解:依据区间估计的一般原理以及 首先计算点估计的值STAT第六章 总体参数估计STAT 接下来计算误差边际 得到总体均值之差的95%的置信区间为即, 元。STAT第六章 总体参数估计STAT 假假设在例7中,我们事先并没有关于总体方差的任何资料,但是抽样过程已经取得了两个样本的标准差料如下: STAT第六章 总体参数估计在95%的置

21、信水平下,两个总体均值之差的置信区间为:即125023.31=,元。STATSTAT第六章 总体参数估计假定:1两个总体都服从正态分布。2两个总体方差相等假设总体方差 , 抽样分布是正态分布(无论样本容量大小),数学期望为 ,标准差为: STATSTAT第六章 总体参数估计假设总体方差 未知,用两个样本方差 估计。 STATSTAT第六章 总体参数估计的区间估计的具体表达式为 STATSTAT第六章 总体参数估计【例8】某城市的规划小组想要估计两个相邻地区家庭平均收入之差。经过调查得到这两个地区家庭的独立随机样本提供如下的资料表6-3 两个相邻地区的独立样本数据地区1 地区2试计算两个地区平均

22、收入之差的95%的置信区间。(假定两个总体服从方差相等的正态分布)STATSTAT第六章 总体参数估计在95%的置信水平下,两个地区家庭平均收入之差的区间为元至元之间。STAT 两个总体比例之差的推断和检验分别与两个总体的均值之差的推断与检验的方法大致相同 适用于来自两个总体的独立、随机样本。 两个总体比例之差的点估计量: 期望值: 标准差二、两个总体比率差异的估计STAT 在大样本的情况下,例9某税收机设想要比较两个地区办事处的工作质量。通过随机抽取每个办事处拟定的纳税申报单的样本并且确认其中哪些为正确的,该机构可以估计每个办事处的有错申报的比率。特别值得注意的是其比率之差。STAT第六章

23、总体参数估计STAT 令:假设来自于两个办事处的独立随机样本提供了下面信息:STAT第六章 总体参数估计STAT STAT第六章 总体参数估计STAT归纳: 两个总体比例之差的区间估计:大样本情况下90%的置信区间为,。STAT第六章 总体参数估计6.5 分层抽样、整群抽样和等距抽样的区间估计STATSTAT第六章 总体参数估计一、分层随机抽样的区间估计一总体均值的区间估计 在分层抽样中,总体首先被分成假设干个层,然后再从各层中随即抽取一定的样本单位组成一个样本。 设总体由个单位组成,并被划分为 层,各层包含 , , 个单位,那么 。又设总的样本容量为 ,从每一层各自独立地抽取一个简单随机样本

24、,各层的样本容量分别为 , , ,满足 。 STATSTAT第六章 总体参数估计整个总体的均值便是各层均值的加权算术平均数,即第h层的样本均值的数学期望和方差分别为STAT根据数学期望的性质,有 STAT第六章 总体参数估计STAT所以,估计量 的方差值与各层内方差 有关,与层之间的差异无关。 因此, 是总体均值 的无偏估计量。 STAT第六章 总体参数估计STAT假设各层的样本容量 是等比例分配的,即那么 的方差就简化为:STAT第六章 总体参数估计根据方差加法定理,在分组情况下,有总方差 =组内平均方差 +组间方差 STAT在分层抽样情形下,总方差仅由层内平均方差构成,小于简单随机抽样时的

25、总方差,因此分层抽样的抽样误差比简单随机抽样的抽样误差小的结论。另外,我们还可以通过扩大层间方差进一步提高分层抽样的效率。STAT第六章 总体参数估计STAT总体层内方差 一般是未知的,可用样本层内方差 代替,得到方差的无偏估计: 假设给定置信度为 ,极限误差为 STAT第六章 总体参数估计STAT因此总体均值 的 置信区间: 【例10】 某厂有甲、乙两个车间生产保温瓶,乙车间产量是甲车间的2倍。现按产量比例共抽查了60支,结果如下。试以95.45%的可靠程度推断该厂生产的保温瓶的平均保温时间的可能范围。STAT第六章 总体参数估计STAT层1225281.20.8合计解:从题意可知,样本单位

26、在各层是等比例分配的,于是点估计值 STAT第六章 总体参数估计STAT抽样标准差总体均值的95.45%的置信区间为: ,27+0.24,即26.76,27.24小时。STAT第六章 总体参数估计STAT二样本容量确实定重复抽样方法下 不重复抽样方法下 STAT第六章 总体参数估计STAT三总体成数的区间估计在大样本情形下,总体成数 的点估计量为: 方差为STAT第六章 总体参数估计STAT在大样本情形下,总体成数 的置信水平 的 置信区间:STAT第六章 总体参数估计二、 整群抽样的区间估计STAT一总体均值的区间估计设总体被划分为 群,每群都包含 个单位,总体的单位数 。又设总体均值为 ,总体第 群的均值为 。于是有: 总体的 个群看作是 个群单位。他们分别具有标志值, 第六章 总体参数估计STAT设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论