高中数学2.2.1用样本的频率分布估计总体分布1课件新人教A必修3_第1页
高中数学2.2.1用样本的频率分布估计总体分布1课件新人教A必修3_第2页
高中数学2.2.1用样本的频率分布估计总体分布1课件新人教A必修3_第3页
免费预览已结束,剩余26页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2用样本估计总体2.2.1用样本的频率分布估计总体分布,1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.(重点)3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.(难点),我国是世界上严重缺水的国家之一,城市缺水问题较为突出.,2000年全国主要城市中缺水情况排在前10位的城市,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费.,(1)如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,(2)为了较合理地确定这个标准,你认为需要做哪些工作?,频率分布表和频率分布直方图,(1)求极差(一组数据中的最大值与最小值的差).,例如,4.3-0.2=4.1,说明样本数据的变化范围是4.1(t).,(2)决定组距与组数.设k=极差组距,若k为整数,则组数=k,否则,组数=k+1.,为方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么组数=极差组距=4.10.5=8.2,因此可以将数据分为9组,这个组数是比较合适的,于是取组距为0.5,组数为9.,(4)列频率分布表.计算各小组的频率,作出下面的频率分布表.(频数=样本数据落在各小组内的个数,频率=频数样本容量),(3)将数据分组.,以组距为0.5将数据分组时,可以分成以下9组:,0,0.5),0.5,1),4,4.5.,列频率分布表:,4,8,15,22,25,14,6,4,2,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,100,1.00,注意频数的合计应是样本容量,频率合计应是1.,0.02,频率分布表一般分“分组”,“频数累计”(可省),“频数”,“频率”,“频率/组距”五列,最后一行是合计,(5)画频率分布直方图.根据频率分布表可以得到如图所示的频率分布直方图:,月均用水量/t,0.10,0.20,0.30,0.40,0.50,O,频率/组距,0.5,1,1.5,2.5,3.5,4.5,2,3,4,提升总结:频率分布直方图的画法第一步:画平面直角坐标系.第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步:以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.,频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图来反映样本的频率分布.,月均用水量/t,频率/组距,0.50.40.30.20.1,0.511.522.533.544.5,O,各组的频率在图中哪里显示出来?各小长方形的面积=频率.各小长方体的面积之和是否为定值?各小长方形的面积之和为1.,宽度:组距,高度:,频率组距,月均用水量/t,0.50.40.30.20.1,0.511.522.533.544.5,O,你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,频率/组距,(1)居民月均用水量的分布是呈“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性.频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.,如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?88%的居民在3t以下,标准可定为3t.在实际中,取a=3t一定能保证85%以上的居民用水不超标吗?在实践中,对统计结论是需要进行评价的.,频率分布直方图如下:,月均用水量/t,0.5,1,1.5,2,2.5,3,3.5,4,4.5,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图.,o,频率/组距,利用样本频率分布对总体分布进行相应估计:(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?(2)样本容量越大,这种估计越精确.(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线总体密度曲线.,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在区间(a,b)内取值的百分比).,o,频率/组距,总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律,是研究总体分布的工具.用样本频率分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值的百分比.,茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.,茎叶图,甲,乙,012345,2554161679490,8463683891,叶就是从茎的旁边生长出来的数,表示得分的个位数字,茎是指中间的一列数,表示得分的十位数字,从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定.,茎叶图的优、缺点:在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便.但当样本数据较多时,茎叶图就显得不太方便.因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长.,1.将样本容量为100的数据按从大到小的顺序分为8组如下表:,9,12,13,15,14,14,13,10,频数,8,7,6,5,4,3,2,1,组号,则第三组的频率为()(A)0.14(B)1/14(C)0.03(D)3/14,2.将一个容量为50的样本数据分组后,组距和频数如下:12.5,15.5),;15.5,18.5),8;18.5,21.5),9;21.5,24.5),11;24.5,27.5),1;27.5,30.5),6;30.5,33.5,3则估计小于或等于30的数据大约占总体的()(A)(B)(C)(D),3.某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32岁52岁的知识分子所占的比例约是多少.,【解析】(1)极差为67-28=39,取组距为5,分为8组.,分组频数频率27,32)30.0632,37)30.0637,42)90.1842,47)160.3247,52)70.1452,57)50.1057,62)40.0862,6730.06合计501.00,样本频率分布表:,(2)样本频率分布直方图:,年龄,0.060.050.040.030.020.01,273237424752576267,O,(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32岁52岁的知识分子约占70%.,频率/组距,1.总体分布指的是总体取值的频率分布规律,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论