2.2.1用样本的频率分布估计总体分布_第1页
2.2.1用样本的频率分布估计总体分布_第2页
2.2.1用样本的频率分布估计总体分布_第3页
2.2.1用样本的频率分布估计总体分布_第4页
2.2.1用样本的频率分布估计总体分布_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2022-2-23统计的基本思想方法: 用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本从总体中抽取一个样本,根据样本的根据样本的情况去估计总体的相应情况情况去估计总体的相应情况. .统计的核心问题: 如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题:一类是如何从总体中抽取样本? 另一类是如何根据对样本的整理、计算、另一类是如何根据对样本的整理、计算、分析分析, ,对总体的情况作出推断对总体的情况作出推断.2022-2-23 用样本的有关情况去估计总体的相应情况用样本的有关情况去估计总体的相应情况, ,这种估计大体分为两类,这种估计大体分为两类,一类是用样本频

2、率分一类是用样本频率分布估计总体分布,布估计总体分布,一类是用样本的某种数字特一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应征(例如平均数、方差等)去估计总体的相应数字特征。数字特征。 整体介绍:整体介绍:2022-2-23频率分布的概念:频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。频数频数:将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数频数。频率频率:每组数据的个数除以全体数据个数的商叫做该组的频率频率。 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本

3、市试行居民生活用水一、探究一、探究定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.那么标准a定为多少比较合理呢? 为了较合理地确定这个标准,你认为了较合理地确定这个标准,你认为需要做哪些工作?为需要做哪些工作?2000年全国主要城市中缺水情况排在前10位的城市2022-2-23 思考:由上表,大家可以得到什么信息?由上表,大家可以得到什么信息? 通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均位居民某年的月平均用用 水量水量( (单位:单位:t) t) ,如下表:,如下表: 1.1.求极差求极差( (即一组数据中最大值与最小

4、值的差即一组数据中最大值与最小值的差) ) 2. 2.决定组距与组数决定组距与组数: 组数组数= = 4.3 - 0.2 = 4.14.10.5 = 8.2组距组距极差极差= =3.3.将数据分组将数据分组0,0.5 ),0.5,1 ),4,4.5 二、画频率分布直方图的步骤当数据在当数据在100个以内时,常分个以内时,常分5-12组组.第几组频率=第几组频数第几组频数样本容量4.4.列频率分布表列频率分布表100位居民月均用水量的频率分布表月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的小长方形的面积面积=?5

5、.5.画频率分布直方图画频率分布直方图其相应组上的频率等于该组上长方形的面积. = 频频率率长长方方形形的的面面积积组组距距频频率率组组距距把横轴分成若干段,每一段对应一个组把横轴分成若干段,每一段对应一个组的组距,以此线段为底作矩形,高等于的组距,以此线段为底作矩形,高等于该组的频率该组的频率/组距组距, 这样得到一系列矩形这样得到一系列矩形,每一个矩形的每一个矩形的面积面积恰好恰好是是该组上的该组上的频率频率,这些矩形构成了频率分布直方图这些矩形构成了频率分布直方图.作频率分布直方图的方法为作频率分布直方图的方法为:归纳:归纳:月均用水量月均用水量/t频率频率组距组距0.100.200.3

6、00.400.500.511.5 22.533.544.51、小长方形的面积总和=?三、频率分布直方图再认识月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.52、月均用水量最多的在那个区间?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.53、请大家阅读第68页,直方图有那些优点和缺点?优点优点:从频率分布直方图可以清楚的看出数据分布的总体趋势缺点缺点:从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了 频率分布直方图

7、的特征:频率分布直方图的特征:如果当地政府希望使 85% 以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗? 拓展思考:12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在15.5, 24.5)的百分比是多少? 例1.有一个容量为50的样本数据的分组的频数如下:解:(1)组距为3,列频率分布表 分组 频数 频率 频率/ 组

8、距 12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027(2)画频率分布直方图:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.0702022-2-231.一个容量为一个容量为32的样本,已知某组样本的频率为的样本,已知某组样本的频率为0.125,那么该组样本的频数为(,那么该组样本的频数

9、为( )A2 B4 C6 D82.在用样本频率估计总体分布的过程中,下在用样本频率估计总体分布的过程中,下列说法正确的是(列说法正确的是( )A总体容量越大,估计越精确总体容量越大,估计越精确B总体容量越小,估计越精确总体容量越小,估计越精确C样本容量越大,估计越精确样本容量越大,估计越精确D样本容量越小,估计越精确样本容量越小,估计越精确课堂训练3、已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11, 那么频率为0.2范围的是( )A.5.57.5 B. 7.59.5 C. 9.511.5 D. 11.513.5 分组 频数

10、 频率 5.57.5 2 0.1 7.59.5 6 0.3 9.511.5 8 0.411.513.5 4 0.2 合计 20 1.0D2022-2-234 4、一个容量为、一个容量为2020的样本数据的样本数据. .分组后分组后. .各组与频各组与频数如下:数如下:(0,20 2;(20,30 3, (30,40 4; (0,20 2;(20,30 3, (30,40 4; (40,50 5; (50,60 4; (60,70 2(40,50 5; (50,60 4; (60,70 2。则样。则样本在本在(0,50(0,50上的频率为:上的频率为: ,7/10(2012,江西)2022-2-

11、232400 2700 3000 3300 3600 3900X 体重体重y0.0015 5、观察新生婴儿的体重,其频率分布直方图、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重如图所示,则新生婴儿体重(2700,3000)(2700,3000)的频的频率为:率为: ;0.32022-2-236为了了解某地区高三学生的身体发育情况,抽为了了解某地区高三学生的身体发育情况,抽查了该地区查了该地区100名年龄为名年龄为17.5岁岁18岁的男生体重岁的男生体重(kg) ,得到频率分布直方图如下:得到频率分布直方图如下:C0.030.050.07体重体重(kg)频率频率/组距组距54.5

12、 58.5 62.5 66.5 70.5 74.5 根据上图可得这根据上图可得这100名学生中体重在名学生中体重在56.5,64.5的学生人数是的学生人数是( )A. 20 B. 30 C. 40 D. 502022-2-237.一个容量为一个容量为100的样本的样本,数据的分组和各组的相数据的分组和各组的相关信息如下表关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个空格.分组 频数 频率 频率累计12,15) 615,18) 0.0818,21) 0.3021,24) 2124,27) 0.6927,30) 1630,33) 0.1033,36 1.00合计合计 100 1.0

13、02022-2-232022-2-23频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量月均用水量/t2022-2-23频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量月均用水量/t2022-2-23频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间 (a, b) 内取值的百分比)。内取值的百分比)。当样本容量无限增大,组距无限缩小,那么频当样本容量无限增大,组距无限缩小,那么频率分布直方图

14、就会无限接近于一条光滑曲线率分布直方图就会无限接近于一条光滑曲线总体密度曲线总体密度曲线。2022-2-23 用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。 反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线2022-2-232022-2-232022-2-230123480 50 5 71 1 53茎茎叶叶2022-2-23【问题问题】 某赛季甲、乙两名篮球运动员每场某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下:

15、比赛的得分情况如下: 甲运动员得分:甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.2022-2-23【问题问题】 某赛季甲、乙两名篮球运动员每场某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下:比赛的得分情况如下: 甲运动员得分:甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.甲甲 乙乙 84 6 3 3 6 83

16、 8 9 10123452 55 41 6 1 6 7 94 902022-2-23 甲运动员得分:甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.甲甲 乙乙 84 6 3 3 6 83 8 9 10123452 55 41 6 1 6 7 94 90你能理解这个图是如何记录这些数据的吗?你能理解这个图是如何记录这些数据的吗?你能算出甲、乙运动员得分的众数,中位数,平均数吗?你能算出甲、乙运动员得分的众数,中位数,平均数吗?你能通过该图说明哪个运动员的发挥

17、更稳定吗?你能通过该图说明哪个运动员的发挥更稳定吗?2022-2-23你认为茎叶图有哪些优点? (1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改. 对任意一组样本数据,是否都适合用茎叶图表示?为什么? 不适合样本容量很大.思考思考:2022-2-231.用样本的频率分布估计总体分布,当总体中的个体数取值很少时,可用茎叶图估计总体分布;当总体中的个体数取值较多时,可将样本数据适当分组,用频率分布表或频率分布直方图估计总体分布.2.总体密度曲线可看成是函数的图象,对一些特殊的密度曲线,其函数解析式是可求的.3.茎叶图中数据的茎和叶的划分,可根据样本数据的特点灵活决定.课堂小结1.求极差(即一组数据中最大值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论