2026版正禾一本通高三一轮总复习数学(湘教版)-2 第二节 用样本估计总体_第1页
2026版正禾一本通高三一轮总复习数学(湘教版)-2 第二节 用样本估计总体_第2页
2026版正禾一本通高三一轮总复习数学(湘教版)-2 第二节 用样本估计总体_第3页
2026版正禾一本通高三一轮总复习数学(湘教版)-2 第二节 用样本估计总体_第4页
2026版正禾一本通高三一轮总复习数学(湘教版)-2 第二节 用样本估计总体_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二节用样本估计总体【课程标准】1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.1.用样本估计总体的集中趋势(1)平均数:若样本容量为n,第i个个体是xi,则样本平均数x=x1+x(2)众数:观测数据中出现次数最多的数是众数,用M0表示.(3)中位数:将一组观测数据按从小到大的顺序排列后,称处于中间位置的数是中位数,用Me表示.当数据个数为奇数时,处于中间位置的数就是中位数;当数据的个数是偶数时,则中间两个数的平均数即为中位数.[微提醒]平均数、中位数和众数的比较名称优点缺点平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数不受数据组中极端值的影响具有较好的稳定性对极端值不敏感众数反映一组数据的集中趋势众数是一个位置代表值,它不受数据中极端值的影响2.用样本估计总体的离散程度(1)极差:将一组数据中的最大值与最小值统称为极值,将最大值与最小值之差称为极差,也称全距,用R表示.(2)方差①总体方差:若设y1,y2,…,yN是总体的全部个体,μ是总体均值,则称σ2=(y1②样本方差:若从总体中随机抽样,获得n个观测数据x1,x2,…,xn,用x表示这n个数据的均值,则称s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].为这n个数据的样本方差,也简称方差③分层抽样的方差:将总体分为两层,第一、二层的样本量分别为n1,n2,样本均值分别为x1,x2,样本方差分别为s12,s22,则全部样本的样本容量、样本均值和样本方差分别为n=n1+n2,x=1n(n1x1+n2x2),s2=1n{n1[s12+(x1-(3)标准差标准差是方差的算术平方根.如果σ2是总体方差,则称σ=σ2是总体标准差;如果s2是样本方差,则称s=s2即s=1n3.用频率分布直方图估计总体分布众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是频率分布直方图中最高矩形所在区间的中点所对应的数据.4.百分位数(1)定义:百分位数是位于按从小到大的顺序排列的一组数据中某一个百分位置的数值,以Pr表示,其中r是区间[1,99]内的整数.一个百分位数Pr将总体或样本的全部观测值分为两部分,至少有r%的观测值小于或等于它,且至少有(100-r)%的观测值大于或等于它,当r%=50%时,Pr即对应中位数.学生用书⬇第262页(2)计算一组n个数据的第P百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算c=n×r%.第3步,若c不是整数,用m表示比c大的最小整数,则所求Pr是xm,如果c是整数,则所求的Pr是xc+x【常用结论】(1)若x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,…,mxn+a的平均数为mx+A.(2)数据x1,x2,…,xn与数据x'1=x1+a,x'2=x2+a,…,x'n=xn+a的方差相等,即数据经过平移后方差不变.(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.【自主检测】1.(多选)下列说法正确的是()A.对一组数据来说,平均数和中位数总是非常接近B.方差与标准差具有相同的单位C.如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变D.在频率分布直方图中,最高的小长方形底边中点的横坐标是众数答案:CD2.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关,在如图两种分布形态中,a,b,c,d分别对应平均数和中位数之一,则可能的对应关系是()A.a为中位数,b为平均数,c为平均数,d为中位数B.a为平均数,b为中位数,c为平均数,d为中位数C.a为中位数,b为平均数,c为中位数,d为平均数D.a为平均数,b为中位数,c为中位数,d为平均数答案:A解析:在频率分布直方图中,中位数两侧小矩形的面积和相等,平均数可以用每个小矩形底边中点的横坐标与小矩形的面积之积的和近似代替,结合两个频率分布直方图得:a为中位数,b为平均数,c为平均数,d为中位数.故选A.3.某车间12名工人一天生产某产品(单位:kg)的数量分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第25,50,75百分位数分别是.

答案:13.7,14.7,15.3解析:将12个数据按从小到大排序:13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.由i=12×25%=3,得所给数据的第25百分位数是第3个数据与第4个数据的平均数,即P25=13.6+13.82=13.7;由c=12×50%=6,得所给数据的第50百分位数是第6个数据与第7个数据的平均数,即P50=14.6+14.82=14.7;由c=12×75%=9,得所给数据的第75百分位数是第94.(用结论)已知x1,x2,…,x10的平均值为6,方差为3,则2x1-1,2x2-1,…,2x10-1的平均值为,方差为.

答案:1112解析:新数据的平均值为2×6-1=11,新数据的方差为22×3=12.考点一百分位数的估计自主练透1.(2024·湖北武汉五调)已知一组数据1,2,3,4,x的第三四分位数是x,则x的取值范围为()A.3 B.[2,3]C.[3,4] D.4答案:C解析:在五个数中,第三四分位数为第二大的数,故1,2,3,4,x中第二大的数是x,所以3≤x≤4.故选C.2.某工厂随机抽取部分工人,对他们某天生产的产品件数进行了统计,统计数据如表所示,则该组数据的产品件数的第60百分位数是()件数7891011人数36542A.8.5 B.9 C.9.5 D.10答案:B解析:抽取的工人总数为20,20×60%=12,那么第60百分位数是所有数据从小到大排序后的第12项与第13项数据的平均数,第12项与第13项数据分别为9,9,所以第60百分位数是P60=9.故选B.3.为了解“双减”政策实施后学生每天的体育活动时间,研究人员随机调查了某地区1000名学生每天进行体育运动的时间,按照时长(单位:min)分成6组:第一组[30,40),第二组[40,50),第三组[50,60),第四组[60,70),第五组[70,80),第六组[80,90],经整理得到如图所示的频率分布直方图,则可以估计该地区学生每天体育活动时间的第25百分位数约为min.

答案:47.5解析:由10×0.01=0.1<0.25,10×0.01+10×0.02=0.3>0.25,故第25百分位数位于[40,50)内,则第25百分位数为P25=40+0.25-0.10.3-0.1×104.如图所示是由某市3月1日至3月10日的最低气温(单位:℃)绘制的折线统计图,由图可知这10天最低气温的第80百分位数是.

答案:2解析:由折线图可知,这10天的最低气温按照从小到大的顺序排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8是整数,则这10天最低气温的第80百分位数是P80=2+22学生用书⬇第263页计算一组n个数据第p百分位数的步骤考点二总体集中趋势的估计师生共研(1)某射击运动员进行打靶练习,已知打十枪每发的环数分别为9,10,7,8,10,10,6,8,9,7,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.c>a>bC.b>c>a D.c>b>a(2)(多选)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法正确的是()A.频率分布直方图中第三组的频数为10B.根据频率分布直方图估计样本的众数为75分C.根据频率分布直方图估计样本的中位数为75分D.根据频率分布直方图估计样本的平均数为75分答案:(1)D(2)ABC解析:(1)将9,10,7,8,10,10,6,8,9,7按从小到大的顺序排列为6,7,7,8,8,9,9,10,10,10,则众数为c=10,中位数为b=12×(8+9)=8.5,平均数为a=110×(6+7+7+8+8+9+9+10+10+10)=8.4,所以c>b>A.故选(2)分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A正确;因为众数的估计值是频率分布直方图中最高矩形底边的中点的横坐标,从图中可看出众数的估计值为75分,故B正确;因为(0.005+0.020+0.010)×10=0.35<0.5,(0.005+0.020+0.010+0.030)×10=0.65>0.5,所以中位数位于[70,80)内,设中位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的估计值为45×(10×0.005)+55×(10×0.020)+65×(10×0.010)+75×(10×0.030)+85×(10×0.025)+95×(10×0.010)=73(分),故D错误.故选ABC.频率分布直方图中的数字特征1.众数:最高矩形的底边中点的横坐标.2.中位数:中位数左边和右边的矩形的面积和应该相等.3.平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.对点练1.(1)(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:亩产量[900,950)[950,1000)[1000,1050)频数61218亩产量[1050,1100)[1100,1150)[1150,1200)频数302410根据表中数据,下列结论中正确的是()A.100块稻田亩产量的中位数小于1050kgB.100块稻田中亩产量低于1100kg的稻田所占比例超过80%C.100块稻田亩产量的极差介于200kg至300kg之间D.100块稻田亩产量的平均值介于900kg至1000kg之间(2)(多选)(2024·山东菏泽三模)某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如下所示的频率分布直方图,则(同一组中的数据用该组区间的中点值作代表)()A.m=0.030B.样本质量指标值的平均数为75C.样本质量指标值的众数小于其平均数D.样本质量指标值的第75百分位数为85答案:(1)C(2)ACD解析:(1)对于A,因为前3组的频率之和0.06+0.12+0.18=0.36<0.5,前4组的频率之和0.36+0.30=0.66>0.5,所以100块稻田亩产量的中位数所在的区间为[1050,1100),故A不正确;对于B,100块稻田中亩产量低于1100kg的稻田所占比例为6+12+18+30100×100%=66%,故B不正确;对于C,因为1200-900=300,1150-950=200,所以100块稻田亩产量的极差介于200kg至300kg之间,故C正确;对于D,100块稻田亩产量的平均值约为1100×(925×6+975×12+1025×18+1075×30+1125×24+1175×10)=1067(kg)(2)对于A,由题意知(0.010+0.015+0.035+m+0.010)×10=1,解得m=0.030,故A正确;对于B,样本质量指标值的平均数为55×0.1+65×0.15+75×0.35+85×0.3+95×0.1=76.5,故B错误;对于C,样本质量指标值的众数是70+802=75<76.5,故C正确;对于D,前3组的频率之和为0.010+0.015+0.035×10=0.60,前4组的频率之和为0.60+0.030×10=0.90,故第75百分位数位于第4组,设其为t,则t-80×0.030+0.60=0.75,解得t=85考点三总体离散程度的估计多维探究角度1方差与标准差(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:学生用书⬇第264页试验序号i12345678910伸缩率xi545533551522575544541568596548伸缩率yi536527543530560533522550576536记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为z,样本方差为s2.(1)求z,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z≥2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高解:(1)由题意可知,zi=xi-yi(i=1,2,…,10)的值分别为:9,6,8,-8,15,11,19,18,20,12,所以z=110∑i=110zi=110×(9+6+8-8+15+11+19+18+s2=110×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61(2)由(1)知:z=11,2s210=26.1=24.4,故有所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.利用样本的方差、标准差解决优化决策问题的依据1.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.角度2分层随机抽样的方差与标准差(2025·黑龙江哈尔滨模拟)某校有高中生2000人,为了获得该校全体高中生的身高信息,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20,则总样本的方差为.

答案:43解析:因为男生样本的均值为170,女生样本的均值为160,所以总样本的均值为2550×170+2550×160=165,所以总样本的方差s2=2550×[16+(170-165)2]+2550×[20+(160-165)2计算分层随机抽样的方差的步骤第一步:确定x1第二步:确定x;第三步:应用公式s2=n1n1+n2[s12+x1-x2]+n2n1+对点练2.(1)(2025·湖南长沙一模)为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为()A.0.94 B.0.96 C.0.75 D.0.78(2)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085①求两位学生预赛成绩的平均数和方差;②现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.答案:(1)A解析:(1)该地区中学生每天睡眠时间的平均数为800×9+1200×81200+800=8.4(小时),则该地区中学生每天睡眠时间的方差为8001200+800×[1+(9-8.4)2]+12001200+(2)①x甲=18×(82+81+79+78+95+88+93+84)=x乙=18×(92+95+80+75+83+80+90+85)=s甲2=18×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35s乙2=18×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]②由(1)知x甲=x乙,甲的成绩较稳定,所以派甲参赛比较合适.学生用书⬇第265页[真题再现]1.(多选)(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案:CD解析:设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为x,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为x+c,m+c,σ,t,因为c≠0,所以A,B不正确,C,D正确.故选CD.2.(多选)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差答案:BD解析:对于A,如1,2,2,2,2,5的平均数不等于2,2,2,2的平均数,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数,均为x3+x42,故B正确;对于C,因为x1是最小值,x6是最大值,则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,例如:1,4,4,4,4,7,则平均数n=16×(1+4×4+7)=4,标准差s1=3,4,4,4,4,则平均数m=4,标准差s2=0,显然3>0,即s1>s2,故C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D[教材呈现]1.(人教A必修二P189T6)数据x1,x2,…,xn的平均数为x,数据y1,y2,…,yn的平均数为y,a,b为常数.如果满足y1=ax1+b,y2=ax2+b,…,yn=axn+B.证明y=ax+B.2.(湘教版必修一P264T4)在某次测量中得到的A样本数据为:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是()A.众数 B.平均数C.中位数 D.标准差点评:高考题考查平均数、中位数、标准差、极差的定义等基础知识,高考题与教材题相似度极高.课时测评76用样本估计总体对应学生(时间:60分钟满分:100分)(本栏目内容,在学生用书中以独立形式分册装订!)(1-8,每小题5分,共40分)1.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数 B.平均数 C.方差 D.极差答案:A解析:记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数.故选A.2.据某地区气象局发布的气象数据,未来十天内该地区每天最高温度(单位:℃)分别为31,29,24,27,26,25,24,26,26,23,则这组数据的第40百分位数为()A.27 B.26.5 C.25.5 D.25答案:C解析:先将这组数据按照从小到大进行排序,分别为23,24,24,25,26,26,26,27,29,31,又10×40%=4,所以该组数据的第40百分位数为排序后的第4个数和第5个数的平均数,即P40=25+262=25.5.3.(2022·全国甲卷理)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案:B解析:对于A,讲座前问卷答题的正确率的中位数是70%+75%2=72.5%,故A错误;对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,故B正确;对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,故C错误;对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,故D4.(2025·贵州贵阳模拟)某学校共有学生2000人,其中高一800人,高二、高三各600人,学校为了解学生在暑假期间每天的读书时间(单位:时),按照分层随机抽样的方法从全校学生中抽取100人,其中高一、高二、高三学生每天读书时间的平均数分别为x1=2.7,x2=3.1,x3=3.3,每天读书时间的方差分别为s12=1,s22=2,sA.从高一学生中抽取40人B.抽取的高二学生的总阅读时间是93时C.被抽取的学生每天的读书时间的平均数为2.8时D.估计全体学生每天的读书时间的方差为s2=1.966答案:C解析:对于A,根据分层随机抽样,分别从高一、高二、高三学生中抽取40人、30人、30人,故A正确;对于B,抽取的高二学生的总阅读时间是x2×30=93(时),故B正确;对于C,被抽取的学生每天的读书时间的平均数为40100×2.7+30100×3.1+30100×3.3=3(时),故C错误;对于D,被抽取的学生每天的读书时间的方差为40100×[1+2.7-32]+30100×[2+3.1-32]+30100×[3+(3.3-3)2]=1.5.(2024·八省联考)某同学掷骰子5次,分别记录每次骰子出现的点数,根据5次的统计结果,可以判断一定没有出现点数6的是()A.中位数是3,众数是2B.平均数是3,中位数是2C.方差是2.4,平均数是2D.平均数是3,众数是2答案:C解析:对于A,当掷骰子出现结果为2,2,3,5,6时,满足中位数为3,众数为2,可以出现点数6,故A不正确;对于B,当掷骰子出现结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点数6,故B不正确;对于C,若平均数为2,且出现点数6,则方差s2>15(6-2)2=3.2>2.4,所以当平均数为2,方差为2.4时,一定不会出现点数6,故C正确;对于D,当掷骰子出现结果为2,2,2,3,6时,满足平均数为3,众数为2,可以出现点数6,故D不正确.故选C6.(多选)为了坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展,某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:分组[2,3)[3,4)[4,5)[5,6]频率0.250.300.200.25则下列关于高一年级学生每周体育锻炼时长的说法中正确的是()A.众数约为2.5B.中位数约为3.83C.平均数为3.95D.第80百分位数约为P80=5.2答案:BCD解析:对于A,根据频率分布表可得,高一年级学生每周体育锻炼时长的众数为3+42=3.5,故A错误;对于B,设高一年级学生每周体育锻炼时长的中位数为x,则0.25+x-34-3×0.30=0.5,解得x≈3.83,故B正确;对于C,高一年级学生每周体育锻炼时长的平均数为0.25×2.5+0.30×3.5+0.20×4.5+0.25×5.5=3.95,故C正确;对于D,因为0.25+0.30+0.20+0.05=0.80,所以高一年级学生每周体育锻炼时长的第80百分位数约为P80=5+0.050.257.一组数据按从小到大的顺序排列为2,2,3,x,5,5,若这组数据的中位数为4,则这组数据的众数为.

答案:5解析:因为中位数为4,所以3+x2=4,所以x=5,8.已知某样本数据分别为1,2,3,a,6,若样本平均数x=3,则样本方差s2=.

答案:14解析:由题设,得x=1+2+3+a+65=3,可得a=39.(10分)某中药产品的质量以其质量指标值衡量,质量指标值越大表明质量越好.为了提高中药产品的质量,我国医疗科研专家攻坚克难,研发出A,B两种新配方,在这两种新配方生产的产品中随机抽取数量相同的样本,测量这些产品的质量指标值,规定质量指标值小于85为废品,在[85,115)内为一等品,不小于115为特等品.现把测量数据整理如下,其中B配方的样本中有6件废品.A配方的频数分布表质量指标值[75,85)[85,95)[95,105)[105,115)[115,125]频数8a36248B配方的频率分布直方图(1)求实数a,b的值;(4分)(2)试确定A配方和B配方哪一种更好.(说明:在统计方法中,同一组数据常用该组区间的中点值作代表)(6分)解:(1)依题意,A,B两种配方的样本容量相同,设为n.由B配方的样本中有6件废品,结合B配方的频率分布直方图,得6n=0.006×10,解得n=100所以a=100-(8+36+24+8)=24.由(0.006+b+0.038+0.022+0.008)×10=1,得b=0.026.所以实数a,b的值分别为24,0.026.(2)由(1)及A配方的频数分布表得,A配方质量指标值的样本平均数xA=80×8A配方质量指标值的样本方差sA2=1100×[(-20)2×8+(-10)2×24+0×36+102×24+202×8]由(1)及B配方的频率分布直方图得,B配方质量指标值的样本平均数xB=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100B配方质量指标值的样本方差sB2=-202×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.综上,xA=xB,即A,B两种配方质量指标值的样本平均数相等,但A配方质量指标值没有B配方质量指标值稳定,所以B配方更好.10.(12分)甲、乙两人在相同条件下各射击10次,每次中靶环数情况如图所示.(1)请填写下表(写出计算过程):(5分)平均数方差命中9环及9环以上的次数甲乙(2)从下列三个不同的角度对这次测试结果进行分析:(7分)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩更好些);③从折线图上两人射击命中环数的走势看(分析谁更有潜力).解:由题图知,甲射击10次中靶环数分别为9,5,7,8,7,6,8,6,7,7.将它们由小到大排列为5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为2,4,6,8,7,7,8,9,9,10.将它们由小到大排列为2,4,6,7,7,8,8,9,9,10.(1)x甲=110×(5+6×2+7×4+8×2+9)=7(环x乙=110×(2+4+6+7×2+8×2+9×2+10)=7(环s甲2=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=s乙2=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+9)=填表如下:平均数方差命中9环及9环以上的次数甲71.21乙75.43(2)①因为平均数相同,s甲2<所以甲的成绩比乙稳定.②因为平均数相同,甲命中9环及9环以上的次数比乙少,所以乙的成绩比甲好些.③因为甲的成绩在平均数附近上下波动,而乙的成绩处于上升趋势,且从第四次射击开始就没有比甲成绩低的情况发生,所以乙更有潜力.(每小题6分,共24分)11.(多选)(2025·重庆模拟)创新,是一个民族进步的灵魂,是一个国家兴旺发达的不竭源泉.为支持中小企业创新发展,国家决定对部分创新型企业的税收进行适当减免,现在全国调查了100家中小企业年收入情况,并根据所得数据画出了样本的频率分布直方图,则下列结论正确的是()A.样本中年收入在[500,600)的中小企业约有16家B.样本的中位数大于400万元C.估计全国中小企业年收入的平均数为376万元D.样本在区间[500,700]内的频数为18答案:CD解析:由题图,得(0.001+0.002+0.0026+0.0026+x+0.0004)×100=1,解得x=0.0014,所以年收入在[500,600)的中小企业约有0.0014×100×100=14(家),故A不正确;因为(0.001+0.002)×100=0.3<0.5,(0.001+0.002+0.0026)×100=0.56>0.5,所以样本的中位数小于400万元,故B不正确;由题图可知,样本中中小企业年收入的平均数为[0.001×150+0.002×250+0.0026×(350+450)+0.0014×550+0.0004×650]×100=376(万元),所以估计全国中小企业年收入的平均数为376万元,故C正确;样本在区间[500,700]内的频数为(0.0014+0.0004)×100×100=18,故D正确.故选CD.12.根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬.将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①,②,③,④,依次计算得到结果如下:①平均数x<4;②标准差s<4;③平均数x<4且极差小于或等于3;④众数等于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论