版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北师大版(2019)高中数学必修第一册第6章
统计现在你以母校而自豪,将来母校因你更光荣!§6.4.3用样本估计总体数字特征-百分位数学习目标1
结合实例,能用样本估计百分位数,培养数学抽象的核心素养.2
理解百分位数的统计含义,培养数据分析的核心素养.3通过学习和应用百分位数,重点培养数据分析素养、数学运算和数学建模素养1.重点:结合实例,能用样本估计百分位数2.难点:理解百分位数的统计含义.中位数
一组数的平均数与这组数中的每一个数都有关,特别地,平均数容易受到最值的影响,因此有时平均数并不能很好地表示这组数的中心位置.而中位数就是这组数的中心位置。①当数据个数为奇数时,中位数是按从小到大(或从大到小)的顺序依次排列的中间那个数.
②当数据个数为偶数时,中位数为按从小到大(或从大到小)的顺序依次排列的最中间的两个数的平均数.
注意:一组数据的中位数只有一个.中位数、百分位数定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.可以通过下面的步骤计算一组n个数据的第p百分位数:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.第p百分位数的定义问题延伸与思考月平均用水量/t0.120.10.080.060.040.0201.24.27.2
10.213.216.219.222.225.228.20.1070.0430.0300.0300.0170.0100.0130.0070.077频率/组距100户居民用户月均用水量的频率分布的特点:大部分居民用户的月均用水量集中在一个较低值区域,尤其在区间[1.2,7.2)最为集中;少数居民用户的月均用水量偏多;随着月均用水量的增加,居民用户数呈现降低趋势.该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户均用水量集中在较低值区域.思想:用样本的频率分布估计总体的频率分布推测为政府决策确定一个居民用户月用水量的标准a问题决策问题
如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?即:寻求一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.
①把100个样本数据从小到大排序第i个12345...8081...979899100数据1.31.31.82.02.0...13.613.8...24.324.525.628.0②得到第80和第81个数据分别是13.6和13.8区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.③取这两数的平均数称此数为这组数据的第80百分位数或80%分位数估计建议市政府把月均用水量标准定为14t总体数据的第80百分位数约为13.780%20%a第p百分位数的定义一组数据的第p百分位数:能使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值的数.计算一组n个数据的第p百分位数的步骤:第1步:按从小到大排列原始数据;第2步:计算i=n×p%;第3步:①若i不是整数,则第p百分位数为第j项数据(
j为大于i的比邻整数);
②若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.在实际应用中,常用的分位数还有第25百分位数,第50百分位数(中位数),第75百分位数.这3个分位数把一组由小到大排列的数据分成四等份,故称为四分位数.其中,第25百分位数称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.第1百分位数第5百分位数第95百分位数第99百分位数p%(100-p)%a25%50%75%求一组数据的第p百分位数1.由样本数据计算第p百分位数2.由样本数据的频率分布直方图计算第p百分位数第1步:按从小到大排列原始数据;第2步:计算i=n×p%;第3步:①若i不是整数,而大于i的比邻整数为
j,则第p百分位数为第j项数据;
②若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
不是.是指能够考取本科院校的同学占同学总数的百分比.有70%的同学数学测试成绩在小于或等于85分.例2(1)班级人数为50的班主任老师说“90%的同学能够考取本科院校”,
这里的“90%”是百分位数吗?(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?思考1:第p百分位数有什么特点?总体数据中的任意一个数小于或等于它的可能性是p.例3.知100个数据的第75百分位数是9.3,则下列说法正确的是(
)A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.这100个数从小到大排列后,9.3是第75个数和第76个数的平均数D.这100个数从小到大排列后,9.3是第75个数和第74个数的平均数解析:因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C.C例4.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,50,95百分位数;解(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,例5.根据下表或下图,估计月均用水量的样本数据的80%和95%分位数.统计表或统计图,与原始数据相比,它们损失了一些信息,例如由上表中可以知道在[16.2,19.2)内有5个数据,但不知道这5个数据具体是多少.此时,我们通常把它们看成均匀地分布在此区间上.月平均用水量/t0.120.10.080.060.040.0201.24.27.2
10.213.216.219.222.225.228.20.1070.0430.0300.0300.0170.0100.0130.0070.077频率/组距根据表或图估计月均用水量的样本数据的80%和95%分位数.解:∵80%分位数一定位于[13.2,16.2)内.可估计月均用水量的样本数据的80%分位数约为14.2;∵95%分位数一定位于[22.2,25.2)内.可估计月均用水量的样本数据的95%分位数约为22.95.假定样本数据在区间内是均匀分布的.在频率分布直方图中,第p百分位数左侧的长方形面积和为p%面积比=宽之比根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等这个结果与根据原始数据求得的中位数6.6相差不大.由于0.077×3=0.231,(0.077+0.107)×3=0.552.因此中位数落在区间[4.2,7.2)内.设中位数为x,由0.077×3+0.107×(x-4.2)=0.5得到x≈6.71.因此,中位数约为6.71,如图所示.第p百分位数的计算例6.某车间12名工人一天生产某产品(单位:kg)的数量分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第75百分位数分别是
.解:将12个数据按从小到大排序:13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.由12×75%=9可知,按从小到大排列原始数据所给数据的第75分位数为第9个和第10个数据的平均数计算i=n×p%若i不是整数,而大于i的比邻整数为
j,则第p百分位数为第j项数据若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.15.3例7.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)由频率分布直方图估计志愿者年龄的95%分位数为________岁.解:(1)设[25,30)年龄组对应小矩形的高度为h,由(0.01+h+0.07+0.06+0.02)×5=1,解得h=0.04.(2)由题图可知年龄小于40岁的频率为1-0.02×5=0.9,
且所有志愿者的年龄都小于45岁,∴志愿者年龄的95%分位数在[40,45)内,
∴志愿者年龄的95%分位数为0.0442.5例8.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)由频率分布直方图估计志愿者年龄的85%分位数为___岁.0.0439解析(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,所以志愿者年龄的85%分位数在[35,40)内,例9.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?解:由题意知分别落在各区间上的频数为在[80,90)上有60×0.15=9,在[90,100)上有60×0.25=15,在[100,110)上有60×0.3=18,在[110,120)上有60×0.2=12,在[120,130]上有60×0.1=6.从以上数据可知第50百分位数一定落在区间[100,110)上,综上可知,第50百分位数和第75百分位数分别估计为103.3cm,112.5cm.例10.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1:3:7:6:3,那么成绩的70%分位数约为___秒.解:设成绩的70%分位数为x,成绩小于等于16秒的频率为成绩小于等于17秒的频率为∴成绩的70%分位数在区间[16
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年证券从业资格考试题库及答案全解
- 2026年网络工程专家网络技术与故障排查能力考核题
- 2026年初级会计师实务科目预测模拟试题及答案
- 2026年食品安全法知识要点测试与解析中级
- 清洁能源基地建设方案
- AI语音合成培训合同2026
- 城中村商业模式创新方案
- 碳排放监测系统建设方案
- 材料采购协同办公系统方案
- 有机废物转化处理方案
- YST 581.1-2024《氟化铝化学分析方法和物理性能测定方法 第1部分:湿存水含量和灼减量的测定 重量法》
- 电池测试岗位工作总结
- 吕国泰《电子技术》第7章触发器和时序逻辑电路
- 路灯养护投标方案
- (完整版)医疗器械网络交易服务第三方平台质量管理文件
- 中国高血糖危象诊断与治疗指南
- 人教版三年级语文下册《选读课文8 除三害》优质教学设计教案-9
- 人民医院检验科程序文件
- 在BBO桥牌在线练习桥牌的步骤
- DB21T 3444-2021老玉分级规范
- MT/T 544-1996矿用液压斜轴式轴向柱塞马达试验方法
评论
0/150
提交评论