适用于新教材强基版2025届高考数学一轮复习教案第九章统计与成对数据的统计分析9.2用样本估计总体新人教A版_第1页
适用于新教材强基版2025届高考数学一轮复习教案第九章统计与成对数据的统计分析9.2用样本估计总体新人教A版_第2页
适用于新教材强基版2025届高考数学一轮复习教案第九章统计与成对数据的统计分析9.2用样本估计总体新人教A版_第3页
适用于新教材强基版2025届高考数学一轮复习教案第九章统计与成对数据的统计分析9.2用样本估计总体新人教A版_第4页
适用于新教材强基版2025届高考数学一轮复习教案第九章统计与成对数据的统计分析9.2用样本估计总体新人教A版_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§9.2用样本估计总体考试要求1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.学问梳理1.百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.平均数、中位数和众数(1)平均数:eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).(2)中位数:将一组数据按从小到大或从大到小的依次排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).3.方差和标准差(1)方差:s2=eq\f(1,n)eq\i\su(i=1,n,)(xi-eq\x\to(x))2或eq\f(1,n)eq\i\su(i=1,n,x)eq\o\al(2,i)-eq\x\to(x)2.(2)标准差:s=eq\r(\f(1,n)\i\su(i=1,n,)xi-\x\to(x)2).4.总体(样本)方差和总体(样本)标准差(1)一般式:假如总体中全部个体的变量值分别为Y1,Y2,…,YN,总体平均数为eq\x\to(Y),则总体方差S2=eq\f(1,N)eq\i\su(i=1,N,)(Yi-eq\x\to(Y))2.(2)加权式:假如总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=eq\f(1,N)eq\i\su(i=1,k,f)i(Yi-eq\x\to(Y))2.常用结论2.数据x1,x2,…,xn与数据x1′=x1+a,x2′=x2+a,…,xn′=xn+a的方差相等,即数据经过平移后方差不变.3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.思索辨析推断下列结论是否正确(请在括号中打“√”或“×”)(1)对一组数据来说,平均数和中位数总是特别接近.(×)(2)方差与标准差具有相同的单位.(×)(3)假如一组数中每个数减去同一个非零常数,则这组数的平均数变更,方差不变.(√)(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)教材改编题1.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为()A.2B.4C.6D.8答案D解析依据方差的性质可知,数据x1,x2,…,x9的方差s2=2,那么数据2x1,2x2,…,2x9的方差为22s2=8.2.某射击运动员7次的训练成果分别为86,88,90,89,88,87,85,则这7次成果的第80百分位数为()A.88.5B.89C.91D.89.5答案B解析7次的训练成果从小到大排列为85,86,87,88,88,89,90,7×80%=5.6,所以第80百分位数为从小到大排列的数据中的第6个数据,即89.3.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175,176,179,180,179,则中位数为________.答案178.5解析把10名旗手的身高从小到大排列为175,175,176,176,178,179,179,179,180,180,则eq\f(178+179,2)=178.5,所以所求中位数为178.5.题型一样本的数字特征和百分位数的估计例1(1)从某中学抽取10名同学,他们的数学成果如下:82,85,88,90,92,92,92,96,96,98(单位:分),则这10名同学数学成果的众数、第25百分位数分别为()A.92,85 B.92,88C.95,88 D.96,85答案B解析数据92出现了3次,出现的次数最多,所以众数是92;这组数据已经依据由小到大的依次排列,计算10×25%=2.5,取第三个数,所以第25百分位数是88.延长探究本例中,第70百分位数是多少?解10×70%=7,第70百分位数是第7项与第8项的平均数,为eq\f(92+96,2)=94.(2)(多选)(2024·郑州模拟)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+3(i=1,2,…,n),则下列说法正确的有()A.两组样本数据的样本标准差相同B.两组样本数据的样本中位数不同C.两组样本数据的样本平均数相同D.两组样本数据的样本众数相同答案AB解析数据x1,x2,…,xn的样本平均数是eq\x\to(x),标准差是s,样本中位数是xM,众数是xN,所以数据yi=xi+3(i=1,2,…,n)的平均数是eq\x\to(x)+3,标准差是s,中位数是xM+3,众数是xN+3,故A,B正确.思维升华计算一组n个数据第p百分位数的步骤跟踪训练1(1)某中学高一年级8名学生某次考试的数学成果(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成果的第75百分位数为()A.102B.103C.109.5D.116答案C解析这组数据已经依据由小到大的数据排列,8×75%=6,则这8名学生数学成果的第75百分位数为第6个数与第7个数的平均数,即为eq\f(103+116,2)=109.5.(2)(多选)已知某班10名男生引体向上的测试成果统计如表所示,则下列说法正确的是()成果(个)10987人数1432A.这10名男生引体向上测试成果的平均数为8.4B.这10名男生引体向上测试成果的第25百分位数为7.5C.这10名男生引体向上测试成果的中位数为8.5D.这10名男生引体向上测试成果的众数为9答案ACD解析对于A,这10名男生引体向上测试成果的平均数为eq\f(10+4×9+3×8+2×7,10)=8.4,所以A正确;对于B,将这10名男生引体向上的测试成果按从小到大的依次排序得7,7,8,8,8,9,9,9,9,10,又10×25%=2.5,则第25百分位数是第3个数,即为8,所以B错误;对于C,这10名男生引体向上测试成果的中位数为eq\f(9+8,2)=8.5,所以C正确;对于D,这10名男生引体向上测试成果的众数为9,所以D正确.题型二总体集中趋势的估计例2某市共有居民60万人,为了制定合理的节水方案,对居民用水状况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据依据[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求a的值,并估计该市居民月均用水量不少于3吨的人数;(2)估计该市居民月均用水量的众数和中位数.解(1)由频率分布直方图,可知(0.04+0.08×2+0.12+0.16+2a+0.42+0.50)×0.5=1,解得a=0.3;月均用水量不少于3吨的人数为(0.12+0.08+0.04)×0.5×60×104=72000.(2)由图可估计众数为2.25;设中位数为x,因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2<x<2.5,由0.50×(x-2)=0.5-0.48,可得x=2.04,故居民月均用水量的中位数为2.04.思维升华频率分布直方图中的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应当相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2(2024·哈尔滨模拟)治理沙漠化离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到如图所示的频率分布直方图.(1)求直方图中a的值及众数、中位数;(2)若树苗高度在185cm及以上是可以移栽的合格树苗.从样本中用比例支配的分层随机抽样方法抽取20株树苗作进一步探讨,不合格树苗、合格树苗分别应抽取多少株?解(1)∵(0.0015+0.0110+0.0225+0.0300+a+0.0080+0.0020)×10=1,∴a=0.0250,众数为eq\f(185+195,2)=190,设中位数为x,∵(0.0015+0.0110+0.0225)×10=0.35<0.5,(0.0015+0.0110+0.0225+0.0300)×10=0.65>0.5,则185<x<195,0.35+0.0300×(x-185)=0.5,∴x=190.故a=0.0250,众数为190,中位数为190.(2)由题意可知,合格树苗所占频率为(0.0300+0.0250+0.0080+0.0020)×10=0.65,不合格树苗所占频率为1-0.65=0.35,所以不合格树苗抽取20×0.35=7(株),合格树苗抽取20×0.65=13(株),故不合格树苗、合格树苗应分别抽取7株和13株.题型三总体离散程度的估计例3(2024·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下.旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为eq\x\to(x)和eq\x\to(y),样本方差分别记为seq\o\al(2,1)和seq\o\al(2,2).(1)求eq\x\to(x),eq\x\to(y),seq\o\al(2,1),seq\o\al(2,2);(2)推断新设备生产产品的该项指标的均值较旧设备是否有显著提高(假如eq\x\to(y)-eq\x\to(x)≥2eq\r(\f(s\o\al(2,1)+s\o\al(2,2),10)),则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).解(1)由表格中的数据易得eq\x\to(x)=eq\f(1,10)×(-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3)+10.0=10.0,eq\x\to(y)=eq\f(1,10)×(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5)+10.0=10.3,seq\o\al(2,1)=eq\f(1,10)×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,seq\o\al(2,2)=eq\f(1,10)×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)由(1)中数据可得eq\x\to(y)-eq\x\to(x)=10.3-10.0=0.3,而2eq\r(\f(s\o\al(2,1)+s\o\al(2,2),10))=eq\r(\f(2,5)s\o\al(2,1)+s\o\al(2,2))=eq\r(0.0304),明显有eq\x\to(y)-eq\x\to(x)>2eq\r(\f(s\o\al(2,1)+s\o\al(2,2),10))成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.思维升华总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.跟踪训练3(2024·济宁模拟)甲、乙两名学生参与数学竞赛培训,现分别从他们在培训期间参与的若干次预赛成果中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成果的平均数和方差;(2)现要从中选派一人参与数学竞赛,从统计学的角度考虑,你认为选派哪位学生参与合适?请说明理由.解(1)eq\x\to(x)甲=eq\f(1,8)×(82+81+79+78+95+88+93+84)=85,eq\x\to(x)乙=eq\f(1,8)×(92+95+80+75+83+80+90+85)=85,seq\o\al(2,甲)=eq\f(1,8)×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,seq\o\al(2,乙)=eq\f(1,8)×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41.(2)由(1)知eq\x\to(x)甲=eq\x\to(x)乙,seq\o\al(2,甲)<seq\o\al(2,乙),甲的成果较稳定,所以派甲参赛比较合适.课时精练1.(2024·潍坊模拟)数据1,2,3,4,5,6,7,8,9的第80百分位数为()A.7B.7.2C.7.5D.8答案D解析因为这组数据已经依据由小到大的依次排列,9×80%=7.2,所以第80百分位数为第8个数,即为8.2.(2024·南京模拟)已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为eq\f(1,2),则另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为()A.2,eq\f(1,2)B.2,1C.4,eq\f(3,2)D.4,eq\f(9,2)答案D解析因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为eq\f(1,2),所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,方差为32×eq\f(1,2)=eq\f(9,2).3.(多选)成立时间少于10年、估值超过10亿美元且未上市的企业称为独角兽企业.2024年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2024年中国新经济独角兽企业TOP100的行业分布图,在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业数量共同占比达到70%.下列说法正确的是()A.随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注B.在该TOP100榜单中独角兽企业数量的中位数是3C.在中国新经济独角兽企业TOP100榜单中,京、沪、粤三地的企业超过82家D.2024年中国新经济独角兽企业TOP100榜单中,企业服务、汽车交通、先进制造行业的企业数量共同占比超过30%答案AD解析A选项,由图可知,汽车交通行业在独角兽企业TOP100榜单中数量较多,故A选项正确;B选项,数据为11,10,10,10,10,9,7,6,4,4,4,4,3,2,2,2,2,则中位数为4,故B选项不正确;C选项,100×70%=70<82,故C选项不正确;D选项,企业服务、汽车交通、先进制造行业的企业数量共同占比为eq\f(11+10+10,100)×100%=31%>30%,故D选项正确.4.(多选)习近平总书记强调,要坚持健康第一的教化理念,加强学校体育工作,推动青少年文化学习和体育熬炼协调发展.某学校对高一年级学生每周在校体育熬炼时长(单位:小时)进行了统计,得到如下频率分布表:分组[2,3)[3,4)[4,5)[5,6]频率0.250.300.200.25则下列关于高一年级学生每周体育熬炼时长的说法中正确的是()A.众数约为2.5B.中位数约为3.83C.平均数为3.95D.第80百分位数约为5.2答案BCD解析对于A,依据频率分布表可得,高一年级学生每周体育熬炼时长的众数为eq\f(3+4,2)=3.5,故A错误;对于B,设高一年级学生每周体育熬炼时长的中位数为x,则0.25+eq\f(x-3,4-3)×0.30=0.5,解得x≈3.83,故B正确;对于C,高一年级学生每周体育熬炼时长的平均数为0.25×2.5+0.30×3.5+0.20×4.5+0.25×5.5=3.95,故C正确;对于D,因为0.25+0.30+0.20+0.05=0.80,所以高一年级学生每周体育熬炼时长的第80百分位数约为5+eq\f(0.05,0.25)=5.2,故D正确.5.(多选)第24届冬奥会于2024年2月4日在国家体育场鸟巢实行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成果满分100分,现随机抽取了80名候选者的面试成果并分为五组,绘制成如图所示的频率分布直方图,则下列说法正确的是(每组数据以区间的中点值为代表)()A.b的值为0.25B.候选者面试成果的中位数约为69.4C.在被抽取的候选者中,成果在区间[65,75)之间的候选者有30人D.估计候选者的面试成果的平均数约为69.5答案BD解析对于A,由(0.005+b+0.045+0.02+0.005)×10=1,解得b=0.025,故A错误;对于B,设候选者面试成果的中位数为x,则(0.005+0.025)×10+(x-65)×0.045=0.5,解得x≈69.4,故B正确;对于C,成果在区间[65,75)的频率为0.045×10=0.45,故人数为80×0.45=36,故C错误;对于D,50×0.005×10+60×0.025×10+70×0.045×10+80×0.02×10+90×0.005×10=69.5,故D正确.6.(2024·云南师大附中模拟)依据气象学上的标准,连续5天的日平均气温低于10℃即为入冬.将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①,②,③,④,依次计算得到结果如下:①平均数eq\x\to(x)<4;②标准差s<4;③平均数eq\x\to(x)<4且极差小于或等于3;④众数等于5且极差小于或等于4.则4组样本中确定符合入冬指标的共有()A.1组B.2组C.3组D.4组答案B解析①举反例:0,0,0,4,11,其平均数eq\x\to(x)=3<4,但不符合入冬指标;②举反例:11,11,11,11,11,其标准差s=0<4,但不符合入冬指标;③假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10-3=7,此时数据的平均数必定大于7,与eq\x\to(x)<4冲突,故假设错误.则此组数据全部小于10.符合入冬指标;④∵众数为5,极差小于等于4,∴最大数不超过9,符合入冬指标.7.一组数据按从小到大的依次排列为2,2,3,x,5,5,若这组数据的中位数为4,则这组数据的众数为________.答案5解析因为中位数为4,所以eq\f(3+x,2)=4,所以x=5,所以这组数据的众数是5.8.(2024·沧州模拟)已知某样本数据分别为1,2,3,a,6,若样本平均数eq\x\to(x)=3,则样本方差s2=________.答案eq\f(14,5)解析由题设,得eq\x\to(x)=eq\f(1+2+3+a+6,5)=3,可得a=3,所以s2=eq\f(1,5)eq\i\su(i=1,5,)(xi-eq\x\to(x))2=eq\f(14,5).9.(2024·沧州模拟)某公司支配聘请新员工40名,现有100名应届毕业生应聘,接受先笔试再面试的方式,笔试结束后,依据笔试成果有60%的人入围面试者名单.这100名应届毕业生笔试成果的频率分布直方图如图所示.(1)求a的值及笔试成果的平均分;(2)依据频率分布直方图,请预估面试入围分数线(结果保留整数).解(1)由频率分布直方图知(0.005+0.010+0.015+2a+0.030)×10=1,则a=0.020,所以平均分为95×0.1+105×0.2+115×0.3+125×0.2+135×0.15+145×0.05=117.5.(2)由题意得,入围面试的频率为0.6,设分数线为m,则(120-m)×0.03+0.2+0.15+0.05=0.6,解得m≈113,所以预估面试入围分数线为113分.10.对参与某次数学竞赛的1000名选手的初赛成果(满分:100分)作统计,得到如图所示的频率分布直方图.(1)依据直方图完成以下表格;成果[50,60)[60,70)[70,80)[80,90)[90,100]频数(2)求参赛选手初赛成果的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)假如从参与初赛的选手中选取380人参与复赛,那么如何确定进入复赛的选手成果?解(1)填表如下:成果[50,60)[60,70)[70,80)[80,90)[90,100]频数50150350350100(2)平均数为55×0.05+65×0.15+75×0.35+85×0.35+95×0.1=78,方差为(55-78)2×0.05+(65-78)2×0.15+(75-78)2×0.35+(85-78)2×0.35+(95-78)2×0.1=101.(3)进入复赛的选手成果为80+eq\f(350-380-100,350)×10=82(分),所以初赛成果为82分及以上的选手均可进入复赛.(说明:回答82分以上,或82分及以上均可).11.(2024·天津模拟)某校排球社的同学为训练动作组织了垫排球竞赛,以下为依据排球社50位同学的垫球个数画的频率分布直方图,全部同学垫球数都在5~40之间.估计垫球数的样本数据的第75百分位数是()A.17.5B.18.75C.27D.28答案D解析垫球数在区间[5,25)内的人数占总数的(0.01+0.01+0.04+0.06)×5×100%=60%,垫球数在区间[5,30)内的人数占总数的(0.01+0.01+0.04+0.06+0.05)×5×100%=85%;所以第75百分位数位于区间[25,30)内,且25+5×eq\f(0.75-0.6,0.85-0.6)=28,所以估计垫球数的样本数据的第75百分位数是28.12.(2024·上海模拟)若等差数列{xn}的公差为3,则x1,x2,x3,…,x9的方差为________.答案60解析由等差数列{xn}

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论