2.2.1用样本的频率分布估计总体的分布_第1页
2.2.1用样本的频率分布估计总体的分布_第2页
2.2.1用样本的频率分布估计总体的分布_第3页
2.2.1用样本的频率分布估计总体的分布_第4页
2.2.1用样本的频率分布估计总体的分布_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.2.1 用样本的频率分布估计总体分布,1、用样本去估计总体,是研究统计问题的一个基本思想,2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、分层抽样。要注意这几种抽样方法的联系与区别。,3、初中时我们学习过样本的频率分布,包括频数、频率的概念,频数分布表和频数分布直方图的制作。,频率分布,样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的频率。,频率分布的表示形式有:样本频率分布表 样本频率分布图 样本频率分布条形图 样本频率分布直方图 样本频率分布折线图,所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。,抛掷硬币的大量重复试验的结果,样本容量为72 088,频率

2、分布条形图,频率分布表:,注意: 各长方形长条的宽度要相同。,相邻长条的间距要适当。,长方形长条的高度表示取各值的频率。,例:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a ,用水量不超过a的部分按平价收费,超过a的部分按议价收费。,如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?,为了较合理地确定这个标准,你认为需要做 哪些工作?,3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6

3、 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2

4、,显然:这个例子与前面抛掷硬币的问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有: 频率分布表和频率分布直方图,1.极差:样本数据中的最大值和最小值的差,2.确定组距和组数:,4.3 - 0.2 = 4.1,(当数据在100个以内时,按数据多少常分5-12组),组数=,3 将数据分组:,0,0.5 ),0.5,1 ),4,4.5,4 画频率分布表,5 画频率分布直方图 为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,1、图中各小长方形的宽度和高度在数量上有何特点?,宽度:组距,5 画频率分布直方图 为了直观反映

5、样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,2、图中各小长方形的面积表示什么?各小长方形的面积之和为多少?,面积:频率,分析:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,探究:同样一组数据,如果组距不同,横轴、纵轴的单位

6、不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,谈谈你对图的印象。,变式:某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年

7、龄在3252岁的知识分子所占的比例约是多少.,70%,一、求极差,即数据中最大值与最小值的差,二、决定组距与组数 :组距=极差/组数,三、分组,通常对组内数值所在区间, 取左闭右开区间 , 最后一组取闭区间,四、登记频数,计算频率,列出频率分布表,小结:作频率分布直方图的步骤,五、画出频率分布直方图(纵轴表示频率组距),连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,样本容量增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间 (a, b) 内取值的百分比)。,当样本容量无限增大,

8、分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体密度曲线,总体密度曲线,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,茎叶图,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1)甲运动员得分:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39,(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39,注:中间的数字表示得分的十位数字。 旁边的数字分别表示两个人得分的个位数。,当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有的信息,而且 可以随时记录,给数据的记录和表示都方便。,茎叶图,练习:某中学高一某班甲,乙两名同学自高中以来每场数学考试成绩情况如下: 甲:95,81,75,91,8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论