用样本估计总体(1).ppt_第1页
用样本估计总体(1).ppt_第2页
用样本估计总体(1).ppt_第3页
用样本估计总体(1).ppt_第4页
用样本估计总体(1).ppt_第5页
免费预览已结束,剩余16页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.1用样本的频率分布估计总体分布(一),莱芜一中刘少华,1.频数:将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目。2.频率:样本中某个组的频数和样本容量的比。,简单随机抽样、系统抽样、分层抽样,2.通过抽样方法收集数据的目的是什么?,从数据中寻找所包含的信息,用样本去估计总体,1.随机抽样的三种常用方法:,复习旧知,温故知新,思考:生活中,我们在哪里可以看到大量的数据?,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,采用抽样调查的方式获得样本数据分析样本数据来估计全市居民用水量的分布情况,2000年全国主要城市中缺水情况排在前10位的城市,问题1:为了较合理地确定这个标准,你认为需要做哪些工作?,探索新知,初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.,下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布情况.,用图将它们画出来,或者用紧凑的表格改变数据的排列方式.,分析数据的一种基本方法是,作图可以达到两个目的:(1)从数据中提取信息(2)利用图形传递信息。表格通过改变数据的构成形式,为我们提供解释数据的新方式。,3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2,讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗?,通过抽样,获得了100位居民月平均用水量(单位:t),如下表:,我们要对这些数据进行整理与分析,收集数据,第一步:求极差(一组数据中的最大值与最小值的差),思考1:上述100个数据中的最小值和最大值分别是什么?样本数据的变化范围是什么?,0.24.3,思考2:分成多少组合适呢?,第二步:决定组距与组数,组距:指每组两个端点的距离。组数:k=极差组距,,(4.30.2)0.58.2组数=8.2+1=9于是组距为0.5,组数为9,如果将上述100个数据取组距为0.5进行分组,那么这些数据共分为多少组?,4.3-0.2=4.1,整理数据,若k为整数,则组数=k,若k不为整数,则组数=k+1。当样本容量不超过100时,按数据多少,常分成5-12组。,第四步:列频率分布表,第三步:将数据分组,以组距为0.5将数据分组时,可以分成以下9组:,0,0.5),0.5,1),4,4.5.,知识探究(一):频率分布表,思考3:各组数据的取值范围可以如何设定?,各组均为左闭右开区间,最后一组是闭区间,思考4:如何统计样本数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?,4,8,15,22,25,14,6,4,2,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,100,1.00,0.02,频率分布表1.分组2.频数累计(可省)3.频数4.频率最后一行是合计,知识探究(一):频率分布表,频数的合计为样本容量,频率合计为1,100位居民月平均用水量的频率分布表,5.频率/组距,请计算每个小矩形的面积,它代表什么?为什么?,所有小矩形的面积的和是多少?,1,为了直观反映样本数据在各组中的分布情况,将频率分布表中的信息用图形表示:,知识探究(二):频率分布直方图,1.频率分布直方图,显示了样本数据落在各个小组的比例的大小,图中最高的小矩形说明了什么?,2.大部分居民的月均用水量都集中在什么之间?,月均用水量在2,2.5)内的居民最多.,1,3)之间.,根据频率分布直方图,居民月均用水量有什么特点?,分析数据,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗?,若将标准a定为2.5,则,74%的居民在2.5t以下,若将标准a定为3,则,88%的居民在3t以下,标准可定为3t.,同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,下面给出以0.1和1为组距重新作出的频率分布直方图。,优点:很容易表示大量数据,非常直观的表明分布形状,使我们能够看到在分布表中看不清楚的一些数据模式。缺点:虽然可以大致估计出总体的分布情况,但是不能保留原来的数据信息,在精确度要求较高的情况下不适用。,问题:你认为频率分布直方图的优缺点是什么?,画出频率分布折线图,频率/组距,月均用水量/t,(取组距中点,并连线),连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图.,利用样本频率分布对总体分布进行相应估计:(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?(2)样本容量越大,这种估计越精确.(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线总体密度曲线.,在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.,总体密度曲线:,1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?,思考,实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。,2.图中阴影部分的面积表示什么?总体密度曲线与横轴围成的面积是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论