频率分布直方图94339.ppt_第1页
频率分布直方图94339.ppt_第2页
频率分布直方图94339.ppt_第3页
频率分布直方图94339.ppt_第4页
频率分布直方图94339.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用样本的频率分布估计总体分布,一 、教学目标,1 通过实例体会分布的意义和作用。 2 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图。 3 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。,二、教学重点与难点,重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图。 难点:能通过样本的频率分布估计总体的分布。,频率直方图,我国是世界上严重缺水的国家之一,城市缺水问题较为突出。,2000年全国主要城市中缺水情况排在前10位的城市,某市政府为了节约生活用水,计划在本市试行居 民生活用水定额管理,

2、即确定一个居民月用水量 标准a , 用水量不超过a的部分按平价收费,超过a 的部分按议价收费。,如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?,为了较合理地确定这个标准,你认为需要做 哪些工作?,思考:由上表,大家可以得到什么信息?,通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:,1.求极差(即一组数据中最大值与最小值的差),2.决定组距与组数,组数=,4.3 - 0.2 = 4.1,3.将数据分组,0,0.5 ),0.5,1 ),4,4.5,组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 组距:指每个小组的两个端点的

3、距离,,4.列频率分布表,100位居民月平均用水量的频率分布表,注意:这里出来了条形图中条形的宽度。频率不仅与条形的高度有关,而且与它的宽度有关。,为了使选择不同宽度的总体分布相同,我们用另一种图形表示,即直方图用面积表示概率。,5.画频率分布直方图,小长方形的面积,组距,频率,=,注意:,这里的纵坐标不是频率,而是频率/组距;,某个区间上的频率用这个区间的面积表示;,直方图,思考:所有小长方形的面积之和等于?,一、求极差,即数据中最大值与最小值的差,二、决定组距与组数 :组距=极差/组数,三、分组,通常对组内数值所在区间, 取左闭右开区间 , 最后一组取闭区间,四、登记频数,计算频率,列出频

4、率分布表,画一组数据的频率分布直方图,可以按以下的步骤进行:,五、画出频率分布直方图(纵轴表示频率组距),如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗?,你认为3吨这个标准一定能够保证85%以上的居民用水量不超过标准吗?,分析:月用水量在3 t以上的居民所占的比例为6% +4%+2%=12%,即大约有12%的居民月用水量在3t以 上,88%的居民月用水量在3t以下. 因此,居民月 用水量标准定为3t是一个可以考虑的标准.,想一想:你认为3t这个标准一定能够保证85以 上的居民用水不超标吗?如果不一定,那么哪些 环节可能会导

5、致结论的差别?,所得到的结论的统计意义,3t这个标准一定能保证85%以上的居民用水不超标吗? 不一定! 原因1、样本只是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。 原因2、明年的用水情况与今年不可能完全一样,但应该大致一样。,高考题型:,13,练 习,1.有一个容量为50的样本数据的分组的频数如下:,12.5, 15.5) 3,15.5, 18.5) 8,18.5, 21.5) 9,21.5, 24.5) 11,24.5, 27.5) 10,27.5, 30.5) 5,30.5, 33.5) 4,(1)列出样本的频率分布表;,(2)画出频率分布直方图;,(3)根

6、据频率分布直方图估计,数据落在15.5, 24.5)的百分比是多少?,解:组距为3,分组 频数 频率 频率/ 组距,12.5, 15.5) 3,15.5, 18.5) 8,18.5, 21.5) 9,21.5, 24.5) 11,24.5, 27.5) 10,27.5, 30.5) 5,30.5, 33.5) 4,0.06 0.16 0.18 0.22 0.20 0.10 0.08,0.020 0.053 0.060 0.073 0.067 0.033 0.027,频率分布直方图如下:,频率/ 组距 0.020 0.053 0.060 0.073 0.067 0.033 0.027,所得到的结

7、论的统计意义,一般的,统计得到的结果,是对于总体较为合理的估计或预测,但其误差应该控制在合理的范围之内。 也正因为这样,统计结果的好坏,往往需要进一步的评价,或通过理论方法的检验,或通过实际应用的检验。,频率分布表和频率分布直方图在带给我们许多新的信息的同时,也丢失了一些信息,如原始数据不能在分布表和直方图中很好地体现出来。,频率分布直方图的优缺点是什么?,例1.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.,应用举例:,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。,思考:上例的样本容量为100,如果增至1000,其频率分布直方图的情

8、况会有什么变化? 假如增至10000呢?,分析:样本容量越大,这种估计越精确。但随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线.,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线,区间 在总体内取值的概率,总体密度曲线,总体密度曲线,甲,乙,0 1 2 3 4 5,2 5 5 4 1 6 1 6 7 9 4 9 0,8 4 6 3 6 8 3 8 9 1,1、某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39,(2

9、)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39,茎叶图,叶就是从茎的旁边生长出来的数,表示得分的个位数。,茎是指中间的一列数,表示得分的十位数,画茎叶图的步骤:,1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字。 2.将最小茎和最大茎之间的数按大小次序排成一列。 3.将各个数据的叶按读数次序(或按大小次序)写在其茎的左(右)侧。,茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的

10、发挥更稳定。 在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。,第 二 课 时,知识回顾,频率分布直方图,应用,1.求极差,2.决定组距与组数,3.将数据分组,4.列频率分布表,5.画频率分布直方图,频率分布折线图,连接频率直方图中各小长方形上端中点的折线,叫频率分布折线图,当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线,总体在区间 内取值的频率,S,总体密度曲线,a b,例

11、2、对某电子元件进行寿命追踪调查,情况如下:,(1)列出频率分布表;,(2)画出频率分布直方图;,(3)估计电子元件寿命在100h400h以内的频率;,(4)估计电子元件寿命在400h以上的频率;,应用举例:,(1)列出频率分布表;,高考题型:,探究: 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。,例题、从某企业全体员工某月的工资表中随机抽取 了50名员工的工资资料如下: 800、800、800、800、800、1000、1000、 1000、 1

12、000、1000、1000、1000、1000、1000、1000、 1200、1200、1200、1200、1200、1200、1200、 1200、1200、1200、1200、1200、1200、1200、 1200、1200、1200、1200、1200、1200、1500、 1500、1500、1500、1500、1500、1500、2000、 2000、2000、2000、2000、2500、2500、2500,(1)画出50名员工的工资的频率分布直方图,一、列出频率分布表,第 三 课 时,新课讲授,初中我们学过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度。,我们还有一

13、种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分布情况,这种方法就是茎叶图。,制作茎叶图的方法,将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。,茎:十位数字,叶:表示个位数字,例1:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50,茎叶图:,注:,1、重复出现的数据要重复记录,不能遗漏;特别是“叶”部分;,2、所有的信息都可以从这个茎叶图中得到;,3、茎叶图便于记录和表示;,4、不足的是其分析只是粗略

14、的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便;,例2:甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得分水平: 甲 12,15,24,25,31,31,36,36,37,39,44,49,50 乙 8,13,14,16,23,26,28,33, 38,39,51,33,29,注:中间的数字表示得分的十位数字。 旁边的数字分别表示两个人得分的个位数。,为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了14天,记录下上午8:0010:00间各自的点击量: 甲:73,24,58,72,64,38,66, 70,20,41,55,67, 8,25; 乙:12,37,21, 5,54,42,61, 45,19, 6,19,36,42,14. 你能用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论