用样本频率分布估计总体分布课件.ppt_第1页
用样本频率分布估计总体分布课件.ppt_第2页
用样本频率分布估计总体分布课件.ppt_第3页
用样本频率分布估计总体分布课件.ppt_第4页
用样本频率分布估计总体分布课件.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.1用样本的频率分布估计总体分布,我们用简单随机抽样、系统抽样、分层抽样的方法收集样本数据后,就可以通过样本研究总体。,用样本估计总体的两种情况:用样本的频率分布估计总体分布用样本的数字特征(平均数、标准差等)估计总体的数字特征,复习回顾,频数:不分组时,数据中某个数据出现的次数分组时,一个组内的数据的个数,频率:,极差:最大数-最小数,频率分布表:,知识探究(一):频率分布表,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.,问题1:如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理?,问题2:为了较为合理的确定标准a,需要做哪些工作?,通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):,3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2,问题3:这些数字告诉了我们什么信息?,我们可以看出,样本数据中的最大值4.3和最小值,其他数据在0.24.3之间,分析数据的基本方法:用图画出来用表格重新排列,1、借助于图:频率分布直方图、频率分布折线图、茎叶图两个目的从数据中提取信息利用图形传递信息,2、借助于表格:频率分布表两个目的改变数据的排列方式提供解释数据的新方式,第二步:确定组距,组数组距=每个小组两个端点的差.组数=极差组距(取整数),探究一频率分布表,(4.10.5=8.2将8.2取整,组数=9,组距=0.5,思考1:上述100个数据的最小值和最大值分别是多少?,第一步:求极差,思考2:分成多少组合适?,如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?,极差:4.3-0.2=4.1,512组,第四步:列频率分布表,探究一频率分布表,思考3:各组数据的取值范围如何设定?,第三步:确定端点,将数据分组各组均为左开右闭区间,最后一个闭区间,思考4:如何统计各族中的频数、频率?,0,0.5),0.5,1),1,1.5),4,4.5.,分组频数频率频率/组距0,0.5)40.040.080.5,1)80.080.161,1.5)150.150.301.5,2)220.220.442,2.5)250.250.502.5,3)140.140.283,3.5)60.060.123.5,4)40.040.084,4.520.020.04合计1001.002,探究(二):画频率分布直方图,第一步:画直角坐标系:x轴为数据单位,y轴为频率/组距,第二步:在x轴上均匀标出各组分点,在y轴上标出单位长度,第三步:以组距为宽,各组的频率/组距为高,分别画出各组对应的长方形,问题1:频率分布直方图中各小长方形的宽度和高度在数量上有何特点?,宽度:组距,2频率分布直方图的意义,问题2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?,各小长方形的面积=各小组的频率,各小长方形的面积之和=1,宽度:组距,3分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,思考:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?,与分组数(或组距)及坐标系的单位长度有关.,1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.1,2、决定组距与组数(将数据分组),3、将数据分组(8.2取整,分为9组),画频率分布直方图的步骤,4、列出频率分布表.(填写频率/组距一栏),5、画出频率分布直方图。,组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。,小结,理论迁移,例1某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在3252岁的知识分子所占的比例约是多少.,(1)极差为67-28=39,取组距为5,分为8组.,分组频数频率频率/组距27,32)30.060.01232,37)30.060.01237,42)90.180.03642,47)160.320.06447,52)70.140.02852,57)50.100.02057,62)40.080.01662,67)30.060.012合计501.000.200,样本频率分布表:,(2)样本频率分布直方图:,(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在3252岁的知识分子约占70%.,例2:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第二小组的频率是多少?样本容量是多少?若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?,练习巩固,1有一个容量为50的样本数据的分组及各组的频数如下:12.5,15.5)324.5,27.5)1015.5,18.5)827.5,30.5)518.5,21.5)930.5,33.5)421.5,24.5)11列出样本的频率分布表和画出频率分布直方图;根据样本的频率分布估计,小于30.5的数据约占多少?,解:组距为3,分组频数频率频率/组距,12.5,15.5)3,15.5,18.5)8,18.5,21.5)9,21.5,24.5)11,24.5,27.5)10,27.5,30.5)5,30.5,33.5)4,0.060.160.180.220.200.100.08,0.0200.0530.0600.0730.0670.0330.027,频率分布直方图如下:,0.010,0.020,0.030,0.040,0.050,12.5,15.5,0.060,0.070,课堂练习,2(2006年全国卷II)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在2500,3000(元)月收入段应抽出_人.,0.0001,0.0002,0.0003,0.0004,0.0005,1000150020002500300035004000,月收入(元),频率/组距,2019/12/15,26,可编辑,2019/12/15,27,可编辑,课堂练习,2一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在2500,3000(元)月收入段应抽出_人.,0.0001,0.0002,0.0003,0.0004,0.0005,月收入(元),频率/组距,25,1000150020002500300035004000,课堂练习,3某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒右图是按上述分组方法得到的频率分布直方图设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为(),A0.9,35B0.9,45C0.1,35D0.1,45,课堂练习,3某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒右图是按上述分组方法得到的频率分布直方图设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为(),A0.9,35B0.9,45C0.1,35D0.1,45,A,课堂练习,4为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁18岁的男生体重(kg),得到频率分布直方图如下:,根据上图可得这100名学生中体重在56.5,64.5的学生人数是()A.20B.30C.40D.50,0.03,0.05,0.07,54.5,58.5,62.5,66.5,70.5,74.5,课堂练习,4为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁18岁的男生体重(kg),得到频率分布直方图如下:,C,0.03,0.05,0.07,54.5,58.5,62.5,66.5,70.5,74.5,根据上图可得这100名学生中体重在56.5,64.5的学生人数是()A.20B.30C.40D.50,课堂练习,输入A1,A2,An,a0i4,输出s,是,否,开始,结束,课堂练习,B,输入A1,A2,An,a0i4,输出s,是,否,开始,结束,小结:画频率分布直方图的步骤:第一步:求极差:(数据组中最大值与最小值的差距)第二步:决定组距与组数:(强调取整)第三步:将数据分组(给出组的界限)第四步:列频率分布表.(包括分组、频数、频率、频率/组距)第五步:画频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.),组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。,注意,(2)纵坐标为:,第二节,3分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,频率分布直方图如下:,在频率分布直方图中取各小长方形上端的中点用折线依次连接各中点得到频率分布折线图,用样本频分布估计总体分布,上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。,当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体密度曲线,总体密度曲线,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,茎叶图,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39,(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39,(1)甲:8,13,16,14,23,26,28,38,33,39,51。,(2)乙:12,15,24,25,31,36,31,36,37,39,44,49,50,,茎叶图,当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有的信息,而且可以随时记录,给数据的记录和表示都方便。,小结图形优点缺点频率分布1)易表示大量数据丢失一些直方图2)直观地表明分布地情况信息1)无信息损失只能处理样本茎叶图2)随时记录方便记录和表示容量较小数据,课堂小结,表示样本分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论