




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
5用样本估计总体知识梳理1.在实际问题中,直接得到总体的全部数字信息往往比较困难,而常常进行抽样调查,即从总体中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,主要包括样本数据的频率分布和基本数字特征.2.要估计总体频率分布情况,我们常用频率分布直方图和频率折线图来表达.3.在频率分布直方图中,纵轴表示各组的宽度,数据落在各小组内的频率用小矩形表示.各个小矩形的面积总和为1.4.连接频率分布直方图中各小矩形上端的中点,就得到频率分布折线图.随着样本容量的不断增加,所分的区间数也不断增加,而区间的长度在不断减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线.知识导学在前面我们学习的三种不同的抽样方法,目的是为了从总体中获得一个易得、有代表性的样本,这是统计的任务之一;统计的第二任务是用样本来估计总体,这也是统计的基本思想.用样本的情况估计总体的相应情况,大体上有两类,其中之一就是本节要学的“用样本的频率分布估计总体分布”.所以在学本节前,需系统回顾抽样方法.学习时可结合图形的变化,即由样本数据的频率分布直方图折线图总体密度曲线,理解样本数据的重要性和用样本估计总体的可行性.对于总体中个体取值较少的情况,我们常用条形图表示其样本分布;而对于个体取值较多或无限的总体,我们则常用频率分布直方图、频率分布表、频率分布折线图等图表形式表示样本分布.一般样本容量越大,这种估计越精确.特别注意:列(画)频率分布表(直方图)时的求解顺序,并明确频率分布直方图中,每个小矩形的面积等于相应各组的频率,而各组频率的和等于1(即各个小矩形面积之和为1),体会当样本容量无限增大时,组数也相应无限增多,此时频率分布折线图就无限接近一条光滑的曲线总体密度曲线.本节的重点是在表示样本数据的过程中,学会列频率分布表、画频率分布直方图和频率折线图,体会它们各自的特点.本节的难点是对总体分布概念的理解和统计思想的建立.疑难突破1.在统计中,经常用数据的频率分布直方图来估计总体的分布情况.直方图中样本的分布和总体分布的关系是什么?剖析:当样本容量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率.因此,我们可以用样本的频率分布直方图来估计总体在任意区间内取值的频率,也即总体的分布情况.由刚才分析可知,在样本的频率分布中,随着样本容量的不断扩大,其分布越来越接近总体分布,当样本容量无限加大,而组距无限缩小时,频率分布直方图的上方将演变成一条光滑的曲线.在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连结各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图,有时也用它来估计总体的分布情况.下面就作上面产品尺寸那个例子的频率折线图1-5-1,注意观察它与前几个图的不同点.图1-5-1由前面我们已经知道:频率分布直方图的面积为1.同样,我们不难证明:折线与横轴所围成的面积也是1,因此,当样本容量比较大时,我们还可以用频率折线图来估计总体的分布情况.2.用样本估计总体是统计的基本思想.那么在对总体分布的估计中是怎样体现这一思想的?剖析:用样本估计总体的某一指标的时候,由于样本毕竟不是总体,所以用样本来估计总体一般来说是有误差的,只是误差的大小而已.当样本的选取合理,具有代表性的时候误差就很小.例如,在全国范围内的测验中,如果民意测验者走进大学校园里去访问1 000名大学生,对他们进行民意调查,他们所组成的样本将不会公平地代表全国的民意,这是因为大学生选民的比例很小,而且是一个有倾向性的团体,不能代表全体选民,这样的不公平就使得样本估计总体的误差比较大,这就是样本的选取不合理造成的.典题精讲例1某公司对已制造出售的洗衣机安全无故障运行时间进行抽样调查,以便制定技术更新计划,调查情况如下表所示:已购时间(h)1 5003 0003 0004 5004 5006 0006 0007 5007 5009 000台数3004501 200600450(1)列出频率分布表;(2)画出频率分布直方图;(3)估计机器无故障时间7 500 h以内的可能性.思路分析:从所给的数据表格我们知道总样本数为300+450+1 200+600+450=3 000,区间组数已经给划分好了,直接就可列出频率分布表,进而画出频率分布直方图,回答问题.解:(1)样本频率分布表如下表:无故障时间(h)频数频率累积频率1 5003 0003000.100.13 0004 5004500.150.254 5006 0001 2000.400.656 0007 5006000.200.857 5009 0004500.151合计3 0001(2)频率分布直方图如图1-5-2所示.图1-5-2(3)由题意可知机器无故障时间7 500 h以内的可能性就是机器无故障时间1 5003 000 h,3 0004 500 h,4 5006 000 h,6 0007 500 h的频率之和,即0.10+0.15+0.40+0.20=0.85.绿色通道:频率=,某数值对应的累积频率=该数值的所有区间对应的频率的和(如果有的话).该行的累积频率=该行和该行前面的所有行(如果有的话)的频率的总和=前一行累积频率+该行的频率;频率分布直方图中每个矩形的面积就等于相应组的频率,即组距=频率,各组频率的和等于1,因此,各小矩形的面积的和等于1.变式训练为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.518岁的男生的体重情况,结果如下(单位:kg).56.5 69.5 65 61.5 64.5 66.5 64 64.5 76 58.572 73.5 56 67 70 57.5 65.5 68 71 7562 68.5 62.5 66 59.5 63.5 64.5 67.5 73 6855 72 66.5 74 63 60 55.5 70 64.5 5864 70.5 57 62.5 65 69 71.5 73 62 5876 71 66 63.5 56 59.5 63.5 65 70 74.568.5 64 55.5 72.5 66.5 68 76 57.5 60 71.557 69.5 74 64.5 59 61.5 67 68 63.5 5859 65.5 62.5 69.5 72 64.5 75.5 68.5 64 6265.5 58.5 67.5 70.5 65 66 66.5 70 63 59.5试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计.解:按照下列步骤获得样本的频率分布:(1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,极差是76-55=21.(2)确定组距与组数.如果将组距定为2,那么由212=10.5,组数为11,这个组数是适合的.于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是54.5,56.5),56.5,58.5),74.5,76.5.(4)列频率分布表.分组频数频率54.5,56.5)20.0256.5,58.5)60.0658.5,60.5)100.1060.5,62.5)100.1062.5,64.5)140.1464.5,66.5)160.1666.5,68.5)130.1368.5,70.5)110.1170.5,72.5)80.0872.5,74.5)70.0774.5,76.530.03合计1001.00 (5)绘制频率分布直方图.频率分布直方图如图1-5-3所示.图1-5-3由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计体重在64.5,66.5) kg的学生最多,约占学生总数的16%;体重小于58.5 kg的学生较少,约占8%等.例2对某班50人进行智力测试,其得分为:62,46,63,56,92,74,48,64,41,86,79,71,69,82,85,68,64,62,68,81,57,93,53,74,76,56,78,47,66,55,64,52,87,69,43,73,97,68,56,67,59,78,52,79,44,55,69,57,31,54.(1)列出频率分布表及相应的频率分布直方图;(2)由频率分布直方图你能看出点什么吗?思路分析:这个样本量较大并且含有相同数据的样本少,需按照我们前面所说的五步来操作频率分布直方图,关于第(2)问由频率分布直方图的意义不难看出.解:(1)由于最大值为97,最小值为31,则组距为10,各区间为30,40),40,50),50,60),60,70),70,80),80,90),90,100共7个区间,所以频率分布表如下:区间30,40)40,50)50,60)60,70)70,80)80,90)90,100频数161214962频率0.020.120.240.280.180.120.04频率分布直方图(图1-5-4)为图1-5-4(2)由频率分布直方图可以看出,智力处在中等的频率较大,而智力成绩特别高和特别低的频率比较小.绿色通道:在作频率分布直方图时可按下列步骤完成:第一步,找出最大值与最小值,计算其差;第二步,决定组距,从而得出组数;第三步,决定第一组的起点(一般稍微小一点),从而决定各个分段点;第四步,算出各组的频数与频率,从而列出频率分布表;第五步,画出频率分布直方图.变式训练在风帆比赛中,成绩以低分为优胜,比赛共11场,并以最佳的9场成绩计算最终的名次,前7场比赛结束后,五名选手的积分情况如下表所示.运动员比赛场次总分1234567891011甲322242722乙2361105532丙784431835丁5514556444戊4135927646根据上面的比赛结果,请你比较各选手之间的成绩,并预测谁将获得最后的胜利.思路分析:可以先用样本平均数与标准差来分析.把前7场比赛成绩看成一个样本,由样本去估计总体.解:分别计算这五位选手前7场比赛积分的平均数和标准差:=3.14,=4.57,=5.00,=6.29,=6.57;s甲=1.73,s乙=2.77,s丙=2.51,s丁=3.19,s戊=3.33.由此可以看出甲的成绩最为优异,而且表现也最为稳定,把前7场比赛的成绩看作是总体的一个样本,可以估计每位运动员最后比赛的成绩,因此预测甲会获胜.问题探究问题我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合适呢?你认为,为了较合理地确定这个标准,需要做哪些工作?导思:为了制定出居民用水量的标准,需要了解广大居民的实际月用水量大部分在什么数值范围内.但由于居民户较多,全部调查不易操作,故可采取抽样调查的方式获取一个有代表性的样本,然后通过样本的情况估计所有居民的月用水量,以便制定出这个标准.探究:很显然,如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较合理的标准,必须先了解居民日常用水的分布情况,比如月平均用水量在哪个范围内的居民最多,他们占全市居民的百分比情况等.由于城市居民户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样我们获得了100位居民今年的月均用水量(单位:t):100位居民2006年的月均用水量(单位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2面对这些随意记录的数据,除了发现月用水量的最大值是4.3和最小值是0.2之外,很难再看出其他信息.为此我们需要对这些数据进行分析整理.分析数据的一种最基本的方法是用图(即频率分布直方图)将它们画出来,以便从数据中提取信息和传递信息,或者是用紧凑的表格(即频率分布表)改变数据的排列方式.下表是100位居民2006年的月均用水量的频率分布表:分组频数频率0,0.5)40.040.5,1)80.081,1.5)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鱼类育种课件教学
- 电路导纳知识培训课件
- 电解电容销售知识培训课件
- 电脑硬件基础知识培训课件
- 高考直通车课件听
- 电脑文员知识培训课件
- 基建输变电工程总承包合同
- 电脑听课件多窗口操作
- 电能表计安装及维护课件
- nasmcpt考试试题及答案
- 2025年云南省中考道德与法治试卷真题(含标准答案及解析)
- 上海海事大学工程热力学英文课件chapter1 Basicconception
- 2025至2030中国HTCC陶瓷基板市场销售模式及竞争前景分析报告
- 房屋过户买卖合同贷款事宜范本
- 幕墙施工安全课件
- 呼吸系统疾病诊疗指南共识
- 2025年陕西高考化学试卷试题真题及答案详解(山西宁夏青海适用)
- 子宫腺肌症教学护理查房
- 中国可见光通信项目创业计划书
- 五金件盐雾测试报告
- JG/T 8-2016钢桁架构件
评论
0/150
提交评论