版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2讲用样本估计总体1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.会计算样本均值和样本方差,结合具体实例,掌握分层随机抽样的样本均值和样本方差.4.能用样本估计总体的取值规律.5.能用样本估计百分位数,理解百分位数的统计含义.1.频率分布表、频率分布直方图的制作步骤及意义2.频率分布折线图用线段连接频率分布直方图中各个矩形上面一边的eq\x(\s\up1(06))中点,就得到频率分布折线图.3.不同统计图的特点及适用类型(1)不同的统计图在表示数据上的特点扇形图主要用于直观描述各类数据占总数的eq\x(\s\up1(07))比例,条形图和直方图主要用于直观描述不同类别或分组数据的eq\x(\s\up1(08))频数和eq\x(\s\up1(09))频率,折线图主要用于描述数据随eq\x(\s\up1(10))时间的变化趋势.(2)不同的统计图适用的数据类型条形图适用于描述eq\x(\s\up1(11))离散型的数据,直方图适用于描述eq\x(\s\up1(12))连续型的数据.4.总体平均数与样本平均数(1)总体平均数①一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称eq\o(Y,\s\up6(-))=eq\f(Y1+Y2+…+YN,N)=eq\x(\s\up1(13))eq\f(1,N)eq\o(∑,\s\up6(N),\s\do4(i=1))Yi为总体均值,又称总体平均数;②如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式eq\o(Y,\s\up6(-))=eq\x(\s\up1(14))eq\f(1,N)eq\o(∑,\s\up6(k),\s\do4(i=1))fiYi.(2)样本平均数如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称eq\o(y,\s\up6(-))=eq\f(y1+y2+…+yn,n)=eq\x(\s\up1(15))eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))yi为样本均值,又称样本平均数.5.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据eq\x(\s\up1(16))小于或等于这个值,且至少有(100-p)%的数据eq\x(\s\up1(17))大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按eq\x(\s\up1(18))从小到大排列原始数据.第2步,计算i=eq\x(\s\up1(19))n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第eq\x(\s\up1(20))j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的eq\x(\s\up1(21))平均数.6.总体集中趋势的估计(1)平均数、中位数和众数等都是刻画“eq\x(\s\up1(22))中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.(2)一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用eq\x(\s\up1(23))平均数、eq\x(\s\up1(24))中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用eq\x(\s\up1(25))众数.7.频率分布直方图中平均数、中位数、众数的求法(1)样本平均数:可以用每个小矩形底边中点的eq\x(\s\up1(26))横坐标与小矩形的面积的乘积之和近似代替.(2)在频率分布直方图中,中位数左边和右边的直方图的面积应该eq\x(\s\up1(27))相等.(3)将最高小矩形所在的区间eq\x(\s\up1(28))中点的横坐标作为众数的估计值.8.方差、标准差(1)假设一组数据为x1,x2,…,xn,则①平均数eq\o(x,\s\up6(-))=eq\f(x1+x2+…+xn,n);②方差s2=eq\x(\s\up1(29))eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))__(xi-eq\o(x,\s\up6(-)))2;③标准差s=eq\x(\s\up1(30))__eq\r(\f(1,n)\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2).(2)如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为eq\o(Y,\s\up6(-)),则称S2=eq\f(1,N)eq\o(∑,\s\up6(N),\s\do4(i=1))(Yi-eq\o(Y,\s\up6(-)))2为总体方差,S=eq\r(S2)为总体标准差.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=eq\f(1,N)eq\o(∑,\s\up6(k),\s\do4(i=1))fi(Yi-eq\o(Y,\s\up6(-)))2.(3)如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为eq\o(y,\s\up6(-)),则称s2=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))(yi-eq\o(y,\s\up6(-)))2为样本方差,s=eq\r(s2)为样本标准差.(4)标准差刻画了数据的离散程度或波动幅度,标准差eq\x(\s\up1(31))越大,数据的离散程度越大;标准差eq\x(\s\up1(32))越小,数据的离散程度越小.(5)分层随机抽样的均值与方差分层随机抽样中,记总的样本平均数为eq\o(w,\s\up6(-)),样本方差为s2.以分两层抽样的情况为例,假设第一层有m个数,分别为x1,x2,…,xm,平均数为eq\o(x,\s\up6(-)),方差为seq\o\al(2,1);第二层有n个数,分别为y1,y2,…,yn,平均数为eq\o(y,\s\up6(-)),方差为seq\o\al(2,2).则eq\o(x,\s\up6(-))=eq\f(1,m)eq\o(∑,\s\up6(m),\s\do4(i=1))xi,seq\o\al(2,1)=eq\f(1,m)eq\o(∑,\s\up6(m),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))2,eq\o(y,\s\up6(-))=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))yi,seq\o\al(2,2)=eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))(yi-eq\o(y,\s\up6(-)))2.则①eq\o(w,\s\up6(-))=eq\x(\s\up1(33))eq\f(m,m+n)eq\o(x,\s\up6(-))+eq\f(n,m+n)eq\o(y,\s\up6(-));②s2=eq\x(\s\up1(34))eq\f(1,m+n){m[seq\o\al(2,1)+(eq\o(x,\s\up6(-))-eq\o(w,\s\up6(-)))2]+n[seq\o\al(2,2)+(eq\o(y,\s\up6(-))-eq\o(w,\s\up6(-)))2]}=eq\x(\s\up1(35))eq\f(1,m+n)eq\b\lc\[\rc\](\a\vs4\al\co1((mseq\o\al(2,1)+nseq\o\al(2,2))+\f(mn,m+n)(\o(x,\s\up6(-))-\o(y,\s\up6(-)))2)).注意:在比例分配的分层随机抽样中,可以直接用样本平均数来估计总体平均数,用样本方差来估计总体方差.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为eq\o(x,\s\up6(-)),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq\o(x,\s\up6(-))+a.(2)若数据x1,x2,…,xn的方差为s2,则:①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax1,ax2,…,axn的方差为a2s2.1.(多选)下列统计量中,能度量样本x1,x2,…,xn的离散程度的是()A.样本x1,x2,…,xn的标准差B.样本x1,x2,…,xn的中位数C.样本x1,x2,…,xn的极差D.样本x1,x2,…,xn的平均数答案:AC解析:由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.2.(多选)给出一组数据:1,3,3,5,5,5,下列说法正确的是()A.这组数据的极差为4B.这组数据的平均数为3C.这组数据的中位数为4D.这组数据的众数为3和5答案:AC解析:这组数据的极差为5-1=4,A正确;平均数为eq\f(1+3×2+5×3,6)=eq\f(11,3),B错误;中位数为eq\f(3+5,2)=4,C正确;众数为5,D错误.3.设一组数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01 B.0.1C.1 D.10答案:C解析:因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.故选C.4.(2025·广东惠州博罗县模拟)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十进制)如图所示,假设得分的中位数为a,众数为b,平均数为c,则()A.a=b=c B.a<c<bC.a<b<c D.b<a<c答案:D解析:由题图可知众数b=5.由中位数的定义知,中位数是第15个数与第16个数的平均值,由题图知将数据从小到大排,第15个数是5,第16个数是6,∴a=5.5,c=eq\f(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10,30)>5.9,∴b<a<c.故选D.5.(人教B必修第二册5.1.2练习AT2改编)90,92,92,93,93,94,95,96,99,100的75%分位数为________,80%分位数为________.答案:9697.5解析:10×75%=7.5,10×80%=8,所以75%分位数为96,80%分位数为eq\f(96+99,2)=97.5.考向一统计图表及应用角度1扇形图(2024·东北三省四校模拟)某校2024年的高考考生人数是2023年高考考生人数的1.5倍.为了更好地对比该校考生的升学情况,统计了该校2023年和2024年高考分数达线情况,得到如图所示的扇形统计图.下列结论正确的是()A.该校2024年与2023年的本科达线人数比为6∶5B.该校2024年与2023年的专科达线人数比为6∶7C.2024年该校本科达线人数比2023年该校本科达线人数增加了80%D.2024年该校不上线的人数有所减少答案:C解析:设2023年该校的高考人数为a,则2024年该校的高考人数为1.5a,2023年本科达线人数为0.5a,2024年本科达线人数为0.9a,∴该校2024年与2023年的本科达线人数比为9∶5,本科达线人数增加了80%,故A错误,C正确;2023年专科达线人数为0.35a,2024年专科达线人数为0.45a,∴该校2024年与2023年的专科达线人数比为9∶7,故B错误;2023年不上线的人数为0.15a,2024年不上线的人数也是0.15a,∴2024年该校不上线的人数无变化,故D错误.故选C.角度2折线图(2025·山东滨州期末)为了研究我市甲、乙两个5G智能手机专卖店的销售状况,厂家统计了去年4月到9月甲、乙两店每月的营业额(单位:万元),得到如图所示的折线图.根据两店的营业额折线图可知,下列说法错误的是()A.甲店月营业额的平均值在[31,32]内B.乙店月营业额总体呈上升趋势C.7,8,9月的总营业额甲店比乙店少D.乙店的月营业额极差小于甲店的月营业额极差答案:D解析:对于A,甲店月营业额的平均值为eq\f(1,6)×(14+21+26+30+52+47)≈31.7,31.7∈[31,32],A正确;对于B,根据乙店的营业额折线图可知乙店每月的营业额逐月变大,所以总体呈上升趋势,故B正确;对于C,由营业额折线图可知,甲店的7,8,9月的总营业额为30+52+47=129,乙店的7,8,9月的总营业额为33+44+53=130,129<130,故C正确;对于D,根据甲、乙两店的营业额折线图可知甲店的月营业额极差为52-14=38,乙店的月营业额极差为53-7=46,乙店的月营业额极差比甲店的月营业额极差大,故D错误.故选D.角度3频率分布直方图(多选)(2024·山东菏泽东明县模拟)某小区为了让居民了解更多垃圾分类的知识,对500名小区居民进行了培训,并进行了培训结果测试,从中随机抽取50名居民的成绩(单位:分),按照[50,60),[60,70),…,[90,100]分成5组,并制成了如图所示的频率分布直方图,则下列结论正确的是()A.所抽取的50名居民成绩的平均数约为74B.所抽取的50名居民成绩的中位数约为75C.50名居民成绩的众数约为85D.参加培训的居民中约有100人的成绩不低于85分答案:AD解析:由频率和为1,可得0.1+0.3+0.3+10m+0.1=1,所以m=0.02,所抽取的50名居民成绩的平均数约为55×0.1+65×0.3+75×0.3+85×0.2+95×0.1=74,故A正确;设中位数为x,因为0.1+0.3<0.5,0.1+0.3+0.3>0.5,所以x∈(70,80),所以0.1+0.3+0.03(x-70)=0.5,所以x=70+eq\f(10,3)≠75,故B错误;50名居民成绩的众数无法由频率分布直方图判断出来,故C错误;因为成绩不低于85分的频率为0.02×5+0.1=0.2,所以参加培训的居民中成绩不低于85分的约有0.2×500=100人,故D正确.故选AD.常见统计图的特点(1)通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆;②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.1.(2025·天津模拟)为了解某校今年准备报考飞行员的学生的体重情况,对所得的体重数据(单位:kg)进行分组,区间为[50,55),[55,60),[60,65),[65,70),[70,75],将其按从左到右的顺序分别编号为第一组、第二组、…、第五组.画出频率分布直方图(如图所示),已知第一组、第二组和第三组的频率之比为1∶2∶3,且第一组的频数为6,则报考飞行员的学生人数是()A.48 B.5C.54 D.60答案:A解析:由题图前三组的频率之和为1-(0.013+0.037)×5=0.75,又第一组、第二组和第三组的频率之比为1∶2∶3,所以第一组的频率为0.75×eq\f(1,1+2+3)=0.125,又第一组的频数为6,所以报考飞行员的学生人数为eq\f(6,0.125)=48.故选A.2.(2024·辽宁实验中学模拟)如图是2022年5月~2023年5月共13个月我国纯电动汽车月度销量及增长情况统计图(单位:万辆),则下列说法错误的是()A.2023年前5个月我国纯电动汽车的销量超过214万辆B.这13个月我国纯电动汽车月度销量的中位数为61.5万辆C.这13个月我国纯电动汽车月度销量的众数为52.2万辆D.和2022年同期相比,2023年我国纯电动汽车月度销量有增有减答案:B解析:对于A,2023年前5个月我国纯电动汽车的销量为28.7+37.6+49+47.1+52.2=214.6万辆,即2023年前5个月我国纯电动汽车的销量超过214万辆,故A正确;对于B,将这13个月我国纯电动汽车的月度销量由小到大依次排列为28.7,34.7,37.6,45.7,47.1,47.6,49,52.2,52.2,53.9,54.1,61.5,62.4,则中位数为其中第7个数据,即49万辆,故B错误;对于C,这些数据中只有52.2出现2次,其他数据均只出现1次,故众数为52.2万辆,故C正确;对于D,2023年1月的同比增长率为负数,其他月份的同比增长率为正数,故和2022年同期相比,2023年我国纯电动汽车月度销量有增有减,故D正确.故选B.3.(多选)十项全能是田径运动中全能项目的一种,是由跑、跳、投等10个田径项目组成的综合性男子比赛项目,比赛成绩是按照国际田径联合会制定的专门田径运动会全能评分表将各个单项成绩所得的评分加起来计算的,总分多者为优胜者.如图是某次十项全能比赛中甲、乙两名运动员的各个单项得分的雷达图,则下列说法正确的是()A.在400米跑项目中,甲的得分比乙的得分低B.在跳高和标枪项目中,甲、乙水平相当C.甲的各项得分比乙的各项得分更均衡D.甲的各项得分的极差比乙的各项得分的极差大答案:BD解析:对于A,由雷达图可知,400米跑项目中,甲的得分比乙的得分高,A错误;对于B,由雷达图可知,在跳高和标枪项目中,甲、乙水平相当,B正确;对于C,甲的各项得分的波动较大,乙的各项得分均在(600,800]内,波动较小,C错误;对于D,甲的各项得分的极差在(400,600)内,乙的各项得分的极差小于200,D正确.故选BD.考向二用样本估计总体角度1总体百分位数的估计(1)(2025·安徽合肥开学考试)天然气是洁净燃气,供应稳定,能够改善空气质量,因而能为地区经济发展提供新的动力,带动经济繁荣及改善环境.多年来,我国规模以上工业天然气生产稳定增长,2023年5月至2024年4月,天然气日均产量(单位:亿立方米)依次为6.1,6.1,5.9,5.8,6.0,6.1,6.6,6.7,6.9,7.0,6.6,6.5,这组数据的上四分位数是________.答案:6.65解析:将数据从小到大排列依次为5.8,5.9,6.0,6.1,6.1,6.1,6.5,6.6,6.6,6.7,6.9,7.0,又12×75%=9,所以这组数据的上四分位数是eq\f(6.6+6.7,2)=6.65.(2)(2025·山东重点中学联盟期末)某校举办歌唱比赛,将200名参赛选手的成绩整理后画出频率分布直方图如图,根据频率分布直方图,第40百分位数估计为________.答案:66解析:由频率分布直方图可知,(a+0.015+0.025+0.035+a+0.005)×10=1,解得a=0.010,∵0.10+0.15=0.25<0.4,0.10+0.15+0.25=0.5>0.4,∴第40百分位数落在区间[60,70)内,设其为m,则0.25+(m-60)×0.025=0.4,解得m=66,即第40百分位数估计为66.角度2比例分配的分层随机抽样的均值与方差(多选)大连市教育局为了解第二十四中学、第八中学、育明中学三所学校的学生文学经典名著的年阅读量,采用比例分配的分层随机抽样方法抽取了一个容量为120的样本.其中,从第二十四中学抽取容量为35的样本,平均数为4,方差为9;从第八中学抽取容量为40的样本,平均数为7,方差为15;从育明中学抽取容量为45的样本,平均数为8,方差为21.据此估计,三所学校的学生文学经典名著的年阅读量的()A.均值为6.3 B.均值为6.5C.方差为17.52 D.方差为18.25答案:BD解析:设第二十四中学、第八中学、育明中学三组数据中每个人的数据分别为xi(i=1,2,3,…,35),yi(i=1,2,3,…,40),zi(i=1,2,3,…,45),则所求均值为eq\f(\o(∑,\s\up6(35),\s\do4(i=1))xi+\o(∑,\s\up6(40),\s\do4(i=1))yi+\o(∑,\s\up6(45),\s\do4(i=1))zi,120)=eq\f(35×4+40×7+45×8,120)=6.5,方差为eq\f(1,120)[eq\o(∑,\s\up6(35),\s\do4(i=1))(xi-6.5)2+eq\o(∑,\s\up6(40),\s\do4(i=1))(yi-6.5)2+eq\o(∑,\s\up6(45),\s\do4(i=1))(zi-6.5)2]=eq\f(1,120)[eq\o(∑,\s\up6(35),\s\do4(i=1))(xi-4-2.5)2+eq\o(∑,\s\up6(40),\s\do4(i=1))(yi-7+0.5)2+eq\o(∑,\s\up6(45),\s\do4(i=1))(zi-8+1.5)2]=eq\f(1,120)[eq\o(∑,\s\up6(35),\s\do4(i=1))(xi-4)2-eq\o(∑,\s\up6(35),\s\do4(i=1))5(xi-4)+eq\o(∑,\s\up6(35),\s\do4(i=1))2.52+eq\o(∑,\s\up6(40),\s\do4(i=1))(yi-7)2+eq\o(∑,\s\up6(40),\s\do4(i=1))(yi-7)+eq\o(∑,\s\up6(40),\s\do4(i=1))0.52+eq\o(∑,\s\up6(45),\s\do4(i=1))(zi-8)2+eq\o(∑,\s\up6(45),\s\do4(i=1))3(zi-8)+eq\o(∑,\s\up6(45),\s\do4(i=1))1.52]=eq\f(1,120)×[(9+2.52)×35+(15+0.52)×40+(21+1.52)×45]=18.25.故选BD.角度3均值、方差的应用某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下:试验序号i12345678910伸缩率xi545533551522575544541568596548伸缩率yi536527543530560533522550576536记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为eq\o(z,\s\up6(-)),样本方差为s2.(1)求eq\o(z,\s\up6(-)),s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果eq\o(z,\s\up6(-))≥2eq\r(\f(s2,10)),则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).解:(1)eq\o(x,\s\up6(-))=eq\f(1,10)×(545+533+551+522+575+544+541+568+596+548)=552.3,eq\o(y,\s\up6(-))=eq\f(1,10)×(536+527+543+530+560+533+522+550+576+536)=541.3,eq\o(z,\s\up6(-))=eq\o(x,\s\up6(-))-eq\o(y,\s\up6(-))=552.3-541.3=11,zi=xi-yi的值分别为9,6,8,-8,15,11,19,18,20,12,故s2=eq\f(1,10)×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.(2)由(1)知,eq\o(z,\s\up6(-))=11,2eq\r(\f(s2,10))=2eq\r(6.1)=eq\r(24.4),故有eq\o(z,\s\up6(-))≥2eq\r(\f(s2,10)),所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.1.频率分布直方图中第p百分位数的计算(1)确定百分位数所在的区间[a,b].(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+eq\f(p%-fa%,fb%-fa%)×(b-a).2.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s2=eq\f(1,n)[(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-neq\o(x,\s\up6(-))2],或写成s2=eq\f(1,n)(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-eq\o(x,\s\up6(-))2,即方差等于原始数据平方的平均数减去平均数的平方.1.(2025·云南昭通模拟)样本数据x1,x2,…,xn的平均数eq\o(x,\s\up6(-))=4,方差s2=1,则样本数据2x1+1,2x2+1,…,2xn+1的平均数、方差分别为()A.9,4 B.9,2C.4,1 D.2,1答案:A解析:由eq\o(x,\s\up6(-))=4,得样本数据2x1+1,2x2+1,…,2xn+1的平均数为2eq\o(x,\s\up6(-))+1=2×4+1=9,由s2=1,得样本数据2x1+1,2x2+1,…,2xn+1的方差为4s2=4.故选A.2.(2024·辽宁葫芦岛二模)某地为了了解学生的睡眠时间,根据初中和高中学生的人数比例采用分层随机抽样的方法抽取了40名初中生和20名高中生,调查发现初中生每天的平均睡眠时间为8小时,方差为2,高中生每天的平均睡眠时间为7小时,方差为1.根据调查数据,估计该地区中学生睡眠时间的总体方差为()A.1.3 B.1.5C.1.7 D.1.9答案:D解析:估计该地区中学生每天睡眠时间的平均数为eq\f(40,60)×8+eq\f(20,60)×7=eq\f(23,3)(小时),估计该地区中学生每天睡眠时间的总体方差为eq\f(40,60)×eq\b\lc\[\rc\](\a\vs4\al\co1(2+\b\lc\(\rc\)(\a\vs4\al\co1(8-\f(23,3)))\s\up12(2)))+eq\f(20,60)×eq\b\lc\[\rc\](\a\vs4\al\co1(1+\b\lc\(\rc\)(\a\vs4\al\co1(7-\f(23,3)))\s\up12(2)))=eq\f(51,27)≈1.9.故选D.3.有13名同学参加学校组织的才艺表演比赛,已知他们所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是________(填“众数”“中位数”或“平均数”).答案:中位数解析:因为7位获奖者的分数肯定是13名参赛选手中较高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖了.4.某校开展了航天知识竞赛活动,竞赛分为初赛和复赛两个阶段.全校共有1000名学生参加,将他们的初赛成绩(成绩都在[50,100]内)分为[50,60),[60,70),[70,80),[80,90),[90,100]5组,得到如图所示的频率分布直方图.(1)求a的值,并估计全校学生初赛成绩的平均数(同一组中的数据以这组数据的中间值作为代表);(2)若规定初赛成绩前20%的学生进入复赛,试估计进入复赛的分数线n.解:(1)由(0.010+0.020+a+0.030+0.005)×10=1,解得a=0.035,所以全校学生初赛成绩的平均数估计为55×0.1+65×0.2+75×0.35+85×0.3+95×0.05=75.(2)由频率分布直方图可知,成绩在[80,100]内的频率为0.35>0.2,成绩在[90,100]内的频率为0.05<0.2,则分数线n位于区间[80,90)内,故n=90-eq\f(0.2-0.05,0.03)=85.课时作业一、单项选择题1.(2025·湖南永州模拟)某班50名同学的体育测试成绩统计如下表,其中两个数据被遮盖.成绩/分919293949596979899100人数■■1235681012下列关于成绩的统计量中,与被遮盖的数据无关的是()A.平均数和方差 B.中位数和方差C.中位数和众数 D.平均数和众数答案:C解析:由表格数据可知,成绩为91分、92分的人数之和为50-(12+10+8+6+5+3+2+1)=3,100分出现的次数最多,所以成绩的众数为100,成绩从小到大排列后处在第25和26位的都是98分,所以成绩的中位数为98,所以中位数和众数都与被遮盖的数据无关.故选C.2.(2025·湖南长沙模拟)已知由小到大排列的4个数据1,3,5,a,若这4个数据的极差是它们中位数的2倍,则这4个数据的第75百分位数是()A.7 B.6C.5 D.4答案:A解析:由小到大排列的4个数据1,3,5,a,则a≥5,这4个数据的极差为a-1,中位数为eq\f(3+5,2)=4,因为这4个数据的极差是它们中位数的2倍,所以a-1=2×4,解得a=9,所以这4个数据由小到大依次为1,3,5,9,因为4×0.75=3,故这4个数据的第75百分位数是eq\f(5+9,2)=7.故选A.3.已知数据x1,x2,x3,x4,x5,x6的平均数是5,方差是9,则xeq\o\al(2,1)+xeq\o\al(2,2)+xeq\o\al(2,3)+xeq\o\al(2,4)+xeq\o\al(2,5)+xeq\o\al(2,6)=()A.159 B.204C.231 D.636答案:B解析:根据题意,数据x1,x2,x3,x4,x5,x6的平均数eq\o(x,\s\up6(-))=5,方差s2=9,则s2=eq\f(1,6)(xeq\o\al(2,1)+xeq\o\al(2,2)+xeq\o\al(2,3)+xeq\o\al(2,4)+xeq\o\al(2,5)+xeq\o\al(2,6))-eq\o(x,\s\up6(-))2=9,变形可得xeq\o\al(2,1)+xeq\o\al(2,2)+xeq\o\al(2,3)+xeq\o\al(2,4)+xeq\o\al(2,5)+xeq\o\al(2,6)=204.故选B.4.(2025·四川成都模拟)下图是2023年11月中国的10个城市地铁运营里程(单位:公里)及运营线路条数的统计图,下列判断正确的是()A.这10个城市中北京的地铁运营里程最长且运营线路条数最多B.这10个城市地铁运营里程的中位数是516公里C.这10个城市地铁运营线路条数的平均数是15.4D.这10个城市地铁运营线路条数的极差是12答案:C解析:对于A,北京的地铁运营线路条数最多,而运营里程最长的是上海,A错误;对于B,地铁运营里程的中位数是eq\f(558.6+516,2)=537.3公里,B错误;对于C,地铁运营线路条数的平均数是eq\f(20+27+18+14+17+12+14+10+14+8,10)=15.4,C正确;对于D,地铁运营线路条数的极差是27-8=19,D错误.故选C.5.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下列叙述不正确的是()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案:D解析:由题中图形可得各月的平均最低气温都在0℃以上,A正确;七月的平均温差约为10℃,而一月的平均温差约为5℃,故B正确;三月和十一月的平均最高气温都在10℃左右,基本相同,C正确;平均最高气温高于20℃的月份为六月、七月、八月,只有3个,D错误.6.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案:B解析:讲座前问卷答题的正确率的中位数为eq\f(70%+75%,2)=72.5%>70%,故A错误;讲座后问卷答题的正确率只有一个是80%,4个是85%,剩下的全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,故B正确;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C错误;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,故D错误.故选B.7.(2025·陕西西安模拟)某校为了解在校学生对中国传统文化的传承认知情况,随机抽取了100名学生进行中国传统文化知识考试,并将这100名学生的成绩进行整理,得到如下频率分布直方图.根据此频率分布直方图,下列结论中不正确的是()A.图中的a=0.012B.若从成绩在[70,80),[80,90),[90,100]内的学生中采用比例分配的分层随机抽样方法抽取10名学生,则成绩在[80,90)内的有3人C.这100名学生成绩的中位数约为65D.若同一组中的数据用该组区间的中点值作代表,则这100名学生的平均成绩约为68.2答案:C解析:由(0.008×2+a+0.02×2+0.032)×10=1,得a=0.012,A正确;这100名学生中成绩在[70,80),[80,90),[90,100]内的频率分别为0.2,0.12,0.08,所以采用比例分配的分层随机抽样方法抽取的10名学生中成绩在[80,90)内的有10×eq\f(0.12,0.4)=3人,B正确;根据频率分布直方图,可知这100名学生成绩的中位数在[60,70)内,设中位数为x,则(x-60)×0.032=0.22,所以x=66.875,C错误;根据频率分布直方图的平均数的计算公式,可得这100名学生的平均成绩约为45×0.08+55×0.2+65×0.32+75×0.2+85×0.12+95×0.08=68.2,D正确.故选C.8.已知某人收集了一个样本量为50的一组数据,并求得其平均数为70,方差为75,现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误的数据进行更正后,重新求得样本的平均数为eq\o(X,\s\up6(-)),方差为s2,则()A.eq\o(X,\s\up6(-))<70,s2>75 B.eq\o(X,\s\up6(-))>70,s2<75C.eq\o(X,\s\up6(-))=70,s2>75 D.eq\o(X,\s\up6(-))=70,s2<75答案:D解析:因为80+70=60+90,因此平均数不变,即eq\o(X,\s\up6(-))=70,设其他48个数据依次为a1,a2,…,a48,因此(a1-70)2+(a2-70)2+…+(a48-70)2+(60-70)2+(90-70)2=50×75,(a1-70)2+(a2-70)2+…+(a48-70)2+(80-70)2+(70-70)2=50×s2,所以50(s2-75)=100-400-100=-400<0,所以s2<75.故选D.二、多项选择题9.(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差答案:BD解析:对于A,设x2,x3,x4,x5的平均数为m,x1,x2,…,x6的平均数为n,则n-m=eq\f(x1+x2+x3+x4+x5+x6,6)-eq\f(x2+x3+x4+x5,4)=eq\f(2(x1+x6)-(x2+x3+x4+x5),12),因为没法确定2(x1+x6),x2+x3+x4+x5的大小关系,所以无法判断m,n的大小,例如1,2,3,4,5,6,可得m=n=3.5,又如1,1,1,1,1,7,可得m=1,n=2,再如1,2,2,2,2,2,可得m=2,n=eq\f(11,6),故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数,均为eq\f(x3+x4,2),故B正确;对于C,因为x1是最小值,x6是最大值,则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,例如2,4,6,8,10,12,则平均数n=eq\f(1,6)×(2+4+6+8+10+12)=7,标准差s1=eq\r(\f(1,6)×[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2])=eq\f(\r(105),3),而4,6,8,10的平均数m=eq\f(1,4)×(4+6+8+10)=7,标准差s2=eq\r(\f(1,4)×[(4-7)2+(6-7)2+(8-7)2+(10-7)2])=eq\r(5),显然eq\f(\r(105),3)>eq\r(5),即s1>s2,故C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.故选BD.10.(2025·福建莆田模拟)已知一组正实数样本数据xi(i=1,2,3,…,10),满足x1≤x2≤x3≤…≤x10,则()A.样本数据的第80百分位数为x8B.去掉样本的第一个数据,样本数据的极差可能不变C.若样本数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则样本数据的平均数大于中位数D.将组中的每个数据变为原来的2倍,则所得的新样本数据组的方差变为原数据组方差的2倍答案:BC解析:对于A,由10×80%=8,所以样本数据的第80百分位数为eq\f(x8+x9,2),故A错误;对于B,由题意存在这样一种可能,若x1=x2≤x3≤…≤x10,则极差为x10-x1=x10-x2,此时样本数据的极差不变,故B正确;对于C,样本数据的频率分布直方图为单峰不对称,且在右边“拖尾”,大致如图.由于在右边“拖尾”时最高峰偏左,中位数靠近高峰处,平均数靠近中点处,此时平均数大于中位数,故C正确;对于D,若每个数据变为原来的2倍,则方差变为原来的4倍,故D错误.故选BC.11.(2025·湖南长沙模拟)某学校高一年级学生有900人,其中男生500人,女生400人,为了获得该校高一全体学生的身高信息,现采用样本量按比例分配的分层随机抽样方法抽取了一个容量为90的样本,经计算得男生样本的均值为170,方差为19,女生样本的均值为161,方差为28,则下列说法中正确的是()A.男生样本量为50B.抽样时某女生甲被抽到的概率为eq\f(4,9)C.抽取样本的均值为166D.抽取样本的方差为43答案:ACD解析:男生样本量为eq\f(500,900)×90=50,故A正确;每个女生被抽到的概率为eq\f(90,900)=eq\f(1,10),故B错误;由A项分析知,女生样本量为90-50=40,所以抽取样本的均值为eq\f(50,50+40)×170+eq\f(40,50+40)×161=166,故C正确;抽取样本的方差为eq\f(1,90)×{50×[19+(170-166)2]+40×[28+(161-166)2]}=43,故D正确.故选ACD.三、填空题12.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数?甲:________,乙:________,丙:________.答案:众数平均数中位数解析:甲、乙、丙三个厂家从不同角度描述了一组数据的特征,甲:该组数据8出现的次数最多;乙:该组数据的平均数eq\o(x,\s\up6(-))=eq\f(4+6×3+8+9+12+13,8)=8;丙:该组数据的中位数是eq\f(7+9,2)=8.13.某校组织学生参与航天知识竞答活动,某班8位同学的成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是________(写出一个满足条件的m值即可).答案:7或8或9或10(填上述四个数中任意一个均可)解析:7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第二个数即7,所以7,6,8,9,8,7,10,m这组数据的第25百分位数为7,而8×0.25=2,所以7为从小到大排列后第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.14.(2025·安徽合肥模拟)土壤修复是使遭受污染的土壤恢复正常功能的技术措施.中国现有耕地有近eq\f(1,5)受到不同程度的污染,但随着新发展理念的深入贯彻落实,国家对环境保护工作越来越重视.2021年我国正式启动(含已招标项目,不含未招标、流标项目)的土壤修复工程项目共510个,合同总金额为121.56亿元,覆盖全国除西藏、港、澳、台的30个省(区、市).如图为2021年30个省(区、市)土壤修复工程类项目数量的前十名,则这30个省(区、市)土壤修复工程类项目数据的第80百分位数是________,若图中未列出的其他20个省(区、市)土壤修复工程类项目数量的方差为44.7,则这30个省(区、市)土壤修复工程类项目数据的总体方差为________.答案:30188.6解析:总共有30个省(区、市),第80百分位数即为第24位和第25位的平均值,第24位为广东,项目数据为28,第25位为山东,项目数据为32,故其第80百分位数为30.30个行政区域中,前十名的平均数为eq\f(1,10)×(58+36+36+35+33+32+28+26+24+22)=33,所以前十名的方差为eq\f(1,10)×[(58-33)2+(36-33)2+(36-33)2+(35-33)2+(33-33)2+(32-33)2+(28-33)2+(26-33)2+(24-33)2+(22-33)2]=eq\f(1,10)×(625+9+9+4+1+25+49+81+121)=92.4,除前十名外的20个省的平均数为eq\f(510-330,20)=9,方差为44.7,故30个省的平均数为17,方差为eq\f(1,30)×{10×[92.4+(33-17)2]+20×[44.7+(9-17)2]}=eq\f(1,30)×(3484+2174)=188.6.四、解答题15.(2025·陕西西安鄠邑区模拟)为探究某药物对小鼠的生长抑制作用,将20只小鼠平均分为两组:对照组(不加药物)和实验组(加药物).测得20只小鼠体重(单位:g)如下:对照组:20.1,20.4,20.1,20.0,20.1,20.3,20.6,20.5,20.4,20.5;实验组:19.8,20.3,20.0,20.2,19.9,19.8,20.0,20.1,20.2,19.7.对照组和实验组的小鼠体重的样本平均数分别记为eq\o(x,\s\up6(-))和eq\o(y,\s\up6(-)),样本方差分别记为seq\o\al(2,1)和seq\o\al(2,2).(1)求eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)),seq\o\al(2,1),seq\o\al(2,2);(2)判断该药物对小鼠的生长是否有显著的抑制作用(若eq\o(x,\s\up6(-))-eq\o(y,\s\up6(-))≥2eq\r(seq\o\al(2,1)+seq\o\al(2,2)),则认为该药物对小鼠的生长有显
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026及未来5年中国花园式住宅行业市场全景调研及发展前景研判报告
- 昆明酒会活动策划方案(3篇)
- 2026年及未来5年中国氯化聚乙烯防水卷材行业市场深度研究及投资战略规划报告
- 2026及未来5年中国h13模具钢行业市场全景调研及发展前景研判报告
- 口腔种植体表面改性技术的临床应用
- 2026秋招:医学检验真题及答案
- 助学金监督制度
- 事业单位财会办公室制度
- 中小学校监督制度
- 公司安全监督制度
- 2025煤矿安全规程解读
- 烧伤进修汇报课件
- 机械行业重点岗位安全手册
- 2025年河南省机关事业单位工勤技能岗位等级考试(保安员·高级技师/一级)历年参考题库含答案详解(5卷)
- 卵巢癌PARP抑制剂临床应用指南解读
- 儿童青少年心理健康知识讲座
- 2025年天津市初中学业水平考试中考物理真题试卷(中考真题+答案)
- 2025至2030年中国儿童免疫系统市场分析及竞争策略研究报告
- 2025年电力涂料行业深度研究分析报告
- 城镇燃气管网泄漏检测技术规程
- 肉羊高效健康养殖与疫病防控技术培训
评论
0/150
提交评论