版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.2用样本估计总体9.2.1总体取值规律的估计第一课时总体取值规律的估计课标要求1.掌握频率分布表的作法以及频率分布直方图的画法.2.掌握用频率分布直方图估计总体.【引入】收集数据是为了寻找数据中蕴含的信息.因为实际问题中数据多而且杂乱,往往无法直接从原始数据中发现规律,所以需要根据问题的背景特点,选择合适的统计图表对数据进行整理和直观描述.在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了.一、频率分布直方图探究我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一户居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.为使大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?(1)为了确定一个较为合理的用水标准,你认为需要做哪些工作?提示为了确定一个较为合理的用水标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.(2)为了了解全市居民用户月均用水量的整体分布情况,应该采用怎样的方法?提示采用抽样调查的方式,通过分析样本观测数据来估计全市居民用户月均用水量的分布情况.(3)假设通过简单随机抽样,获得100位居民用户的月均用水量数据(单位:t)如下表:9.013.614.95.94.07.16.45.419.42.02.28.613.85.410.24.96.814.02.010.52.15.75.116.86.011.11.311.27.74.92.310.016.712.012.47.85.213.62.622.43.67.18.825.63.218.35.12.03.012.022.210.85.52.024.39.93.65.64.47.95.124.56.47.54.720.55.515.72.65.75.56.016.02.49.53.717.03.84.12.35.37.88.14.313.36.81.37.04.91.87.128.010.213.817.910.15.54.63.221.6上述100个数据中的最大值和最小值分别是多少?由此说明样本数据的变化范围是什么?提示最大值是28.0t,最小值是1.3t,样本观测数据的变化范围为26.7t.(4)样本数据中的最大值和最小值的差称为极差,如果将上述100个数据按组距为3进行分组,那么这些数据共分为多少组?提示26.7÷3=8.9.因此这些数据共分为9组.(5)以组距为3进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?提示[1.2,4.2),[4.2,7.2),…,[25.2,28.2].(6)试列出频率分布表.提示分组频数累计频数频率[1.2,4.2)正正正正230.23[4.2,7.2)正正正正正正丅320.32[7.2,10.2)正正130.13[10.2,13.2)正90.09[13.2,16.2)正90.09[16.2,19.2)正50.05[19.2,22.2)30.03[22.2,25.2)40.04[25.2,28.2]丅20.02合计1001.00(7)请画出频率分布直方图.提示【知识梳理】画频率分布直方图的步骤(1)求极差:极差是一组数据中最大值与最小值的差.(2)决定组距与组数:当样本容量不超过100时,常分成5~12组,一般取等长组距,并且组距应力求“取整”.(3)将数据分组:分组时,第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值,分组区间一般是“前闭后开”.(4)列频率分布表:一般分四列,即分组、频数、频率、eq\f(频率,组距).其中频数合计应是样本容量,频率合计是1.(5)画频率分布直方图:横轴表示样本数据,纵轴表示eq\f(频率,组距).小长方形的面积=组距×eq\f(频率,组距)=频率.各小长方形的面积和等于1.温馨提示频率分布直方图的纵轴表示eq\f(频率,组距),频数分布直方图的纵轴表示频数.例1为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):分组[147.5,155.5)[155.5,163.5)[163.5,171.5)[171.5,179.5]频数62127m频率a0.1(1)求出表中a,m的值;(2)画出频率分布直方图.解(1)依题意得6+21+27+m=60,则m=6.a=eq\f(27,60)=0.45.(2)根据频率分布表,可求第一组、第二组的频率分别为eq\f(6,60)=0.1,eq\f(21,60)=0.35.作出频率分布直方图如图所示.思维升华1.在列频率分布表时,极差、组距、组数有如下关系:(1)若eq\f(极差,组距)为整数,则eq\f(极差,组距)=组数.(2)若eq\f(极差,组距)不为整数,则eq\f(极差,组距)的整数部分+1=组数.2.绘制频率分布直方图的注意点:(1)各组频率的和等于1,因此,各小矩形的面积的和也等于1.(2)横轴表示样本数据,纵轴表示eq\f(频率,组距),这样每一组的频率可以用该组的组距为底、eq\f(频率,组距)为高的小矩形的面积表示.(3)画频率分布直方图的关键是确定矩形的高,一般地,频率分布直方图中两坐标轴上的单位长度不一致.训练1从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例.解(1)频率分布表如下:成绩分组频数频率频率/组距[40,50)20.040.004[50,60)30.060.006[60,70)100.20.02[70,80)150.30.03[80,90)120.240.024[90,100]80.160.016合计501.000.1(2)频率分布直方图如图所示.(3)学生成绩在[60,90)分的频率为0.2+0.3+0.24=0.74=74%,所以估计成绩在[60,90)分的学生比例为74%.二、频率分布直方图的相关计算与应用例2为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?(3)求样本中不达标的学生人数.解(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此第二小组的频率为eq\f(4,2+4+17+15+9+3)=0.08.因为第二小组的频率=eq\f(第二小组的频数,样本容量),所以样本容量=eq\f(第二小组的频数,第二小组的频率)=eq\f(12,0.08)=150.(2)样本数据中次数在110以上(含110次)的频率为eq\f(17+15+9+3,2+4+17+15+9+3)×100%=88%.所以估计全校高一年级学生的达标率约为88%.(3)样本的达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12,所以样本中不达标的学生人数为150×0.12=18.思维升华由频率分布直方图进行相关计算时,需掌握下列关系式:(1)eq\f(频率,组距)×组距=频率.(2)eq\f(频数,样本量)=频率,此关系式的变形为:样本量×频率=频数.训练2(链接教材P198练习T1)第19届亚运会于2023年9月23日至2023年10月8日在杭州举行,志愿者的服务工作对亚运会的举办十分重要.某高校承办了杭州志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95],绘制成如图所示的频率分布直方图.已知第三、四、五组的频率之和为0.7,第一组和第五组的频率相同.(1)求a,b的值;(2)根据组委会要求,本次志愿者选拔录取率为19%,请估算被录取至少需要多少分.解(1)因为第三、四、五组的频率之和为0.7,所以(0.045+0.020+a)×10=0.7,解得a=0.005.由题意可知,(0.005×2+b+0.045+0.020)×10=1,解得b=0.025.(2)由频率分布直方图得[45,55),[55,65),[65,75),[75,85)的频率分别为0.05,0.25,0.45,0.2,因为0.05+0.25+0.45=0.75<0.81,0.05+0.25+0.45+0.2=0.95>0.81,所以录取分数应该落在第四组,设录取分数为x,则0.75+0.02·(x-75)=0.81,解得x=78,所以被录取至少需要78分.【课堂达标】1.对于频率分布直方图,下列说法中正确的是()A.小长方形的高表示取某数的频率B.小长方形的高表示该组个体在样本中出现的频数C.小长方形的高表示该组个体在样本中出现的频率与组距的比D.小长方形的高表示该组个体在样本中出现的频数与组距的比答案C解析在频率分布直方图中,各小长方形的面积表示相应各组的频率,小长方形的高表示该组个体在样本中出现的频率与组距的比.2.一个容量为20的样本数据,分组与频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数234542则样本在[10,50)内的频率为()A.0.5 B.0.24C.0.6 D.0.7答案D解析因为样本在[10,50)内的频数为2+3+4+5=14,样本容量为20,所以在[10,50)内的频率为eq\f(14,20)=0.7.3.某班组织学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数为()A.45 B.50C.55 D.60答案B解析根据题中频率分布直方图可知成绩低于60分的有第一、二组数据,在频率分布直方图中,对应矩形的高分别为0.005,0.010,每组数据的组距为20,则成绩低于60分的频率为(0.005+0.010)×20=0.3.因为低于60分的人数是15,所以该班的学生人数是15÷0.3=50.4.从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50~350kW·h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.则该直方图中x的值为________.答案0.0044解析由(0.0024+0.0036+0.0060+x+0.0024+0.0012)×50=1,得x=0.0044.一、基础巩固1.关于频率分布表,下列叙述中正确的是()A.从频率分布表可以看出样本数据相对于平均数的波动大小B.频数是指落在各个小组内的数据C.每小组的频数与样本量之比是这个小组的频率D.组数是样本平均数除以组距答案C解析对于A选项,频率分布表使样本数据被妥善整理,从而以更简洁的数据形态呈现,无法通过频率分布表看出数据相对于平均数的波动情况;对于B选项,频数是指落在各个小组内的数据的个数;对于C选项,每小组的频数与样本量之比等于这个小组的频率,C正确;对于D选项,组数一般由样本数据的极差除以组距得到.2.采用简单随机抽样抽到一个容量为20的样本数据,分组后,各组的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数23x5y2已知样本数据在区间[20,40)内的频率为0.35,则样本数据在区间[50,60)内的频率为()A.0.70 B.0.50C.0.25 D.0.20答案D解析由题意得eq\f(3+x,20)=0.35,解得x=4,则y=20-2-3-4-5-2=4,故所求频率为eq\f(4,20)=0.20.3.如图是某中学高一学生体重(单位:kg)的频率分布直方图,已知图中从左到右的前三组的频率之比为1∶2∶3,则第三小组的频率为()A.0.125 B.0.250C.0.375 D.0.500答案C解析由频率分布直方图,知前三组的频率之和为1-(0.0125+0.0375)×5=0.750,所以第三小组的频率为0.750×eq\f(3,1+2+3)=0.375.4.某小区抽取了200个用户的月平均用电量(单位:千瓦时),绘制了频率分布直方图如图所示(每组区间包含左端点,不包含右端点),则样本中月平均用电量在[220,260)的用户数为()A.80 B.60C.50 D.30答案A解析由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1,得x=0.0075,∴月平均用电量在[220,260)的用户数为200×20×(0.0125+0.0075)=80.5.(多选)某高中高一、高二、高三年级的学生人数分别为1200,900,900.现按照分层随机抽样的方法抽取300名学生,调查学生每周平均参加体育运动的时间(单位:h).样本数据整理后得到如图所示的频率分布直方图,则下列说法正确的是()A.每个年级抽取的学生人数分别为120,90,90B.估计高一年级每周平均体育运动时间不足4h的人数约为300C.估计该校学生每周平均体育运动时间不少于8h的人数约为600D.估计该校每周平均体育运动时间不少于8h的百分比约为10%答案ABC解析由题意可知,高一、高二、高三年级的学生人数之比为4∶3∶3,所以300人中各年级抽取的人数分别为120,90,90,故A正确;由题图知,高一年级每周平均体育运动时间不足4h的人数约为1200×(0.025+0.1)×2=300,故B正确;由题图知,该校学生每周平均体育运动时间不少于8h的人数约为3000×(0.075+0.025)×2=600,故C正确;由C知,该校学生每周平均体育运动时间不少于8h的百分比约为eq\f(600,3000)=20%,故D错误.6.相关部门对某城市“五朵金花”之一的某景区在“十一”黄金周中每天的游客人数作了统计,其频率分布如表所示.时间10月1日10月2日10月3日10月4日10月5日10月6日10月7日频率0.050.080.090.130.300.150.20已知10月1日这天该景区的营业额约为8万元,假定这七天每天游客人均消费相同,则这个黄金周该景区游客人数最多的那一天的营业额约为________万元.答案48解析设这个黄金周该景区游客人数最多的那一天的营业额约为x万元.由eq\f(8,0.05)=eq\f(x,0.30),得x=48,则游客人数最多的那一天的营业额约为48万元.7.某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数,单位:分)分成六段:[40,50),[50,60),…,[90,100],画出如下部分频率分布直方图.观察图形的信息,第四小组的频率为________.答案0.3解析第四小组的频率为1-(0.025+0.015×2+0.01+0.005)×10=0.3.8.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是________.答案90解析∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本容量为是eq\f(36,0.3)=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.9.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,试估计样本在[40,50),[50,60)内的数据个数之和.解根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.∵样本中数据在[20,60)内的频率为0.6,样本容量为50,∴eq\f(4+5+x+y,50)=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.10.某校高一某班的某次数学测试成绩(满分为100分)如下56,58,62,63,63,65,66,68,69,71,72,72,73,74,75,76,77,78,79,95,98,其中[80,90)内的成绩缺失.频率分布直方图也受到了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在[50,60)内的频率及全班人数;(2)求分数在[80,90)之间的频数,并计算频率分布直方图中[80,90)间的矩形的高.解(1)由频率分布直方图,分数在[50,60)的频率为0.008×10=0.08.又分数在[50,60)之间的频数为2,所以全班人数n=eq\f(2,0.08)=25.(2)由统计数据,分数在[80,90)之间的频数为25-21=4.∴分数在[80,90)之间的频率为eq\f(4,25)=0.16.设频率分布直方图中[80,90)间的矩形高为h,则10h=0.16,∴h=0.016.因此频率分布直方图中[80,90)间的矩形的高为0.016.二、综合运用11.(多选)供电部门对某社区1000位居民12月份人均用电情况进行统计后,按人均用电量分为[0,10),[10,20),[20,30),[30,40),[40,50]五组,整理得到如下的频率分布直方图,则有关这1000位居民,下列说法正确的是()A.12月份人均用电量人数最多的一组有400人B.12月份人均用电量在[20,30)内的有300人C.12月份人均用电量不低于20度的有500人D.在这1000位居民中任选1位协助收费,选到的居民用电量在[30,40)一组的概率为eq\f(1,20)答案ABC解析根据频率分布直方图知,12月份人均用电量人数最多的一组是[10,20),有1000×0.04×10=400(人),A正确;12月份人均用电量在[20,30)内的人数为1000×0.03×10=300,B正确;12月份人均用电量不低于20度的人数是1000×(0.03+0.01+0.01)×10=500(人),C正确;用电量在[30,40)内的有0.01×10×1000=100(人),所以1000位居民中任选1位,选到的居民用电量在[30,40)一组的概率为eq\f(100,1000)=eq\f(1,10),D错误.12.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则(1)图中的x=________;(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有________名学生可以申请住宿.答案(1)0.0125(2)72解析(1)由频率分布直方图知20x=1-20×(0.025+0.0065+0.003+0.003),解得x=0.0125.(2)上学时间不少于1小时的学生的频率为0.003×2×20=0.12,因此估计有0.12×600=72(名)学生可以申请住宿.13.某高校在2024年的某招生考试成绩中随机抽到100名学生的笔试成绩(满分200分),按成绩分组,得到的频率分布表如下:组号分组频数频率第1组[160,165)50.05第2组[165,170)①0.35第3组[170,175)30②第4组[175,180
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Viewing Workshop说课稿2025学年高中英语北师大版2019必修三-北师大版2019
- 尿管留置期间的护理要点总结
- 初中感恩友谊主题班会说课稿2025
- 5.1 认识职业说课稿2025年中职心理健康全一册同济大学版
- 高中环保科技前沿主题班会说课稿
- 2026年三上数学时分秒说课稿
- 2026年英语听说课说课稿案例
- 本册综合说课稿2025年小学信息技术(信息科技)六年级下册黔科版
- Lesson 110 How do they compare说课稿2025年初中英语第一册 下半册新概念英语
- 初中2025年团结互助主题班会说课稿
- 《半导体设备零配件清洗技术规范》
- T-JWEA 0001-2025 水利水电工程施工图审查技术导则
- 《医疗机构人员廉洁从业九项准则》考试试题(附答案)
- 石油化工安装工程预算定额(2019版)
- 医院收费窗口服务规范
- 2025年供销社笔试题目及答案
- 2025年中国中车集团有限公司招聘笔试题库及答案解析
- 《火力发电企业电力监控系统商用密码应用技术要求》
- 凉山之最教学课件
- 2025年石家庄市市属国有企业招聘笔试考试试题(含答案)
- 消防设备维修实习总结范文
评论
0/150
提交评论