高一数学9.2.2 总体百分位数的估计_第1页
高一数学9.2.2 总体百分位数的估计_第2页
高一数学9.2.2 总体百分位数的估计_第3页
高一数学9.2.2 总体百分位数的估计_第4页
高一数学9.2.2 总体百分位数的估计_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9.2.2总体百分位数的估计课标要求结合实例,能用样本估计百分位数,理解百分位数的统计含义.【引入】观察下列两组数据:甲组1222233355668891010121313乙组00001123456677101414141415由甲、乙两组数据知它们的中位数都是5.5,但很明显,甲组数据中,小于5.5的数普遍比乙组的大,而大于5.5的数普遍比乙组的小,也就是说,中位数并不能全面地体现数据的分布特点,那么,如何补救呢?一、百分位数的定义探究1请阅读课本第202页到第203页,思考问题2中居民用户月均用水量标准转化为数学问题具体指什么?提示寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.探究2你能制定一下具体方案吗?提示把得到的100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数eq\f(13.6+13.8,2)=13.7.【知识梳理】1.总体百分位数的估计一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步:按从小到大排列原始数据.第2步:计算i=n×p%.第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据,若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.温馨提示中位数是第50百分位数.例1(多选)下列表述正确的是()A.50%分位数就是总体的中位数B.第p百分位数可以有单位C.一个总体的四分位数有4个D.样本容量越大,第p百分位数估计总体就越准确答案ABD解析一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误,其它均正确.思维升华分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据如何在最小值与最大值之间分布的信息.训练115%分位数的含义是()A.总体中任何一个数小于它的可能性是15%B.总体中任何一个数小于或等于它的可能性是15%C.总体中任何一个数大于它的可能性是15%D.总体中任何一个数大于或等于它的可能性是15%答案B解析根据第p百分位数的定义可知B正确.二、由样本数据求百分位数例2(链接教材P203例2、P204例3)从某公司生产的产品中,任意抽取12件,得到它们的质量(单位:kg)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,分别求出这组数据的25%,75%,95%分位数.解将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,则25%分位数是eq\f(8.0+8.3,2)=8.15,75%分位数是eq\f(8.6+8.9,2)=8.75,95%分位数是第12个数据9.9.思维升华总体百分位数估计需要注意的两个问题(1)总体百分位数估计的基础是样本百分位数的计算,因此计算准确是关键;(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.训练2下列一组数据的第25百分位数是2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6()A.3.2 B.3.0C.4.4 D.2.5答案A解析把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=10×25%=2.5,不是整数,则第3个数据3.2,是第25百分位数.三、利用频率分布直方图求百分位数例3为了解学生在课外读物方面的支出情况,抽取了100名同学进行调查,结果显示这些同学的支出都在[10,50](单位:元),其频率分布直方图如图所示,估计学生课外读物支出的样本数据的第65百分位数.(结果保留两位小数)解法一由频率分布直方图可得,(0.01+0.023)×10=0.33,(0.01+0.023+0.037)×10=0.7,所以第65百分位数应位于[30,40)内,所以样本数据的第65百分位数为30+10×eq\f(0.65-0.33,0.7-0.33)≈38.65(元),所以估计学生课外读物支出的样本数据的第65百分位数为38.65元.法二由法一知第65百分位数应位于[30,40),设为x,则0.01×10+0.023×10+(x-30)×0.037=0.65,解得x≈38.65元,所以估计学生课外读物支出的样本数据的第65百分位数为38.65元.思维升华频率分布直方图中第p百分位数的求解方法可以模仿中位数的求解思路:(1)确定第p百分位数所在的区间[a,b).(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+eq\f(p%-fa%,fb%-fa%)×(b-a).训练3为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下这60株树木的第50百分位数和第75百分位数吗?解由题意知分别落在各区间上的频数在[80,90)上为60×0.15=9,在[90,100)上为60×0.25=15,在[100,110)上为60×0.3=18,在[110,120)上为60×0.2=12,在[120,130]上为60×0.1=6,从以上数据可知第50百分位数一定落在区间[100,110)上,由100+10×eq\f(0.5-0.4,0.7-0.4)=100+eq\f(10,3)≈103.3;第75百分位数一定落在区间[110,120)上,由110+10×eq\f(0.75-0.7,0.9-0.7)=110+eq\f(5,2)=112.5.综上可知,第50百分位数和第70百分位数分别估计为103.3cm,112.5cm.【课堂达标】1.(多选)已知100个数据的75%分位数是9.3,则下列说法正确的是()A.这100个数据中至少有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数答案AC解析A中,因为第75百分位数之后的数字可能也是9.3,则A正确;C中,因为100×75%=75为整数,所以第75个数据和76个数据的平均数为75%分位数,是9.3,则C正确,其他选项均不正确,故选AC.2.一组数据6,47,49,15,42,41,7,39,43,40,36,且这组数的一个四分位数是15,则它是()A.15%分位数 B.25%分位数C.50%分位数 D.75%分位数答案B解析将数据由小到大排列为6,7,15,36,39,40,41,42,43,47,49,共11个,由11×25%=2.75,故25%分位数是15.3.一组数据:7,6,3,2,8,3,5,6,9,7的中位数是________;85%分位数是________.答案68解析将数据从小到大排列为:2,3,3,5,6,6,7,7,8,9,故中位数为6,又10×85%=8.5,故这一组数据的85%分位数为第9个数为8.4.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为________.答案eq\f(100,9)解析样本数据低于10的比例为(0.08+0.02)×4=0.40,样本数据低于14的比例为0.40+0.09×4=0.76,所以此样本数据的第50百分位数在[10,14)内,估计此样本数据的第50百分位数为10+eq\f(0.50-0.40,0.76-0.40)×4=eq\f(100,9).一、基础巩固1.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数为()A.8.4 B.8.5C.8.6 D.8.3答案A解析因为8×30%=2.4,故30%分位数是由小到大排列后的第三项数据8.4.2.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是()A.90B.90.5C.91D.91.5答案B解析把成绩按从小到大的顺序排列为56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是eq\f(90+91,2)=90.5.3.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是()A.[4.5,+∞) B.[4.5,6.6)C.(4.5,+∞) D.(4.5,6.6]答案A解析因为8×65%=5.2,所以这组数据的第65百分位数是第6项数据4.5,则x≥4.5,故选A.4.某高校12名毕业生的起始月薪如下表所示:毕业生123456起始月薪285029503050288027552710毕业生789101112起始月薪289031302940332529202880则第85百分位数是()A.3325 B.3130C.3050 D.2950答案B解析将这12个数据按从小到大的顺序排列:2710,2755,2850,2880,2880,2890,2920,2940,2950,3050,3130,3325.又因为12×85%=10.20,所以第85百分位数是第11个数据,为3130.5.为了解“双减”政策实施后学生每天的体育活动时间,研究人员随机调查了该地区1000名学生每天进行体育运动的时间,按照时长(单位:分钟)分成6组:第一组[30,40),第二组[40,50),第三组[50,60),第四组[60,70),第五组[70,80),第六组[80,90],经整理得到如图的频率分布直方图,则可以估计该地区学生每天体育活动时间的第25百分位数约为()A.42.5分钟 B.45.5分钟C.47.5分钟 D.50分钟答案C解析由于10×0.01=0.1<0.25,10×0.01+10×0.02=0.3>0.25,故第25百分位数位于[40,50)内,则第25百分位数为40+eq\f(0.25-0.1,0.3-0.1)×10=47.5,可以估计该地区学生每天体育活动时间的第25百分位数约为47.5.6.一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为________,第86百分位数为________.答案14.517解析∵75%×20=15,∴第75百分位数为eq\f(14+15,2)=14.5.∵86%×20=17.2,∴第86百分位数为第18个数据17.7.某小学制订了一份调查问卷,让学生家长对该校实行某项改革的效果进行评分,评分都在[40,100]内,将所有数据按[40,50],(50,60],(60,70],(70,80],(80,90],(90,100]进行分组,整理得到频率分布直方图如下,则这次调查数据的70%分位数为________.答案80解析因为前4组数据的频率之和为0.05+0.15+0.2+0.3=0.7,所以70%分位数为80.8.如图是某市2024年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的第10百分位数为________,日最低气温的第80百分位数为________.答案24℃16℃解析由折线图可知,把日最高气温按照从小到大排序得24,24.5,24.5,25,26,26,27,因为共有7个数据,7×10%=0.7不是整数,所以这7天日最高气温的第10百分位数是第1个数据24℃.把日最低气温按照从小到大排序得12,12,13,14,15,16,17,因为共有7个数据,7×80%=5.6,不是整数,所以这7天日最低气温的第80百分位数是第6个数据16℃.9.求下列数据的四分位数.13,15,12,27,22,24,28,30,31,18,19,20.解把这12个数据按从小到大的顺序排列可得12,13,15,18,19,20,22,24,27,28,30,31,计算12×25%=3,12×50%=6,12×75%=9,所以数据的第25百分位数为eq\f(15+18,2)=16.5,第50百分位数为eq\f(20+22,2)=21,第75百分位数为eq\f(27+28,2)=27.5.10.某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位:kg),并绘制频率分布直方图如下:一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在10天中,大约有8天可以满足顾客的需求).求每天应该进的苹果质量(精确到整数位).解80%地满足顾客的需求也可理解为计算这组数据的第80百分位数,因为日销售量[60,90)的频率为0.525<0.8,日销售量[60,100)的频率为0.875>0.8,所以第80百分位数落在[90,100)内,则每天应进90+10×eq\f(0.8-0.525,0.875-0.525)≈98(kg)苹果.二、综合运用11.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,第50百分位数为b,则有()A.a=13.7,b=15.5B.a=14,b=15C.a=12,b=15.5D.a=14.7,b=15答案D解析把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=eq\f(1,10)×(10+12+14+14+15+15+16+17+17+17)=14.7,因为10×50%=5,所以这10名工人一小时内生产零件的第50百分位数为b=eq\f(15+15,2)=15.12.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差等于乙的成绩的极差答案BCD解析由题图可得,eq\o(x,\s\up6(-))甲=eq\f(4+5+6+7+8,5)=6,eq\o(x,\s\up6(-))乙=eq\f(3×5+6+9,5)=6,A项错误,B项正确;甲的成绩的第80百分位数是eq\f(7+8,2)=7.5,乙的成绩的第80百分位数是eq\f(6+9,2)=7.5,所以二者相等,C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.13.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)估计总体400名学生中分数小于70的人数;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)根据该大学规定,把15%的学生划定为不及格,利用(2)中的数据,确定本次测试的及格分数线.解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4,所以估计总体400名学生中分数小于70的人数为400×0.4=160.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5,所以总体中分数在区间[40,50)内的人数估计为400×eq\f(5,100)=20.(3)设分数的第15百分位数为x,分数小于50的频率为1-(0.01+0.02+0.04+0.02)×10=0.1,分数小于60的频率为0.1+0.1=0.2,所以x∈[50,60),则0.1+(x-50)×0.01=0.15,解得x=55,则本次考试的及格分数线为55分.三、创新拓展14.某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层随机抽样方法(按A类、B类分两层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).(1)A类工人中和B类工人中各应抽查多少人?(2)从A类工人中的抽查结果和从B类工人中的抽查结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论