2026年高考数学一轮专题训练:统计 含答案_第1页
2026年高考数学一轮专题训练:统计 含答案_第2页
2026年高考数学一轮专题训练:统计 含答案_第3页
2026年高考数学一轮专题训练:统计 含答案_第4页
2026年高考数学一轮专题训练:统计 含答案_第5页
已阅读5页,还剩30页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

/高考数学一轮复习统计一.选择题(共8小题)1.(2025•晋城二模)已知10个样本数据的平均值为10,方差为6,则这10个数据的65%分位数的最大值为()A.11 B.12 C.13 D.142.(2025•武汉模拟)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分,得到如图所示的统计表格,则下列结论不正确的是()评委编号模型名称123456甲7.09.38.39.28.98.9乙8.19.18.58.68.78.6A.甲得分的平均数大于乙得分的平均数 B.甲得分的众数大于乙得分的众数 C.甲得分的中位数大于乙得分的中位数 D.甲得分的方差大于乙得分的方差3.(2025春•道里区校级月考)为了了解高中学生每天的课后学习时间和他们的数学成绩排名的关系,某实验小组做了调查,得到一些数据如下表,已知学习时间x(单位:小时)与成绩名次y(单位:名)满足线性回归方程y=−6815x+a,则学习时间x0.51.02.02.54.0成绩排名y2014108y5附加:i=1A.19 B.29915 C.20 D.4.(2025•红桥区一模)在2023年某省普通高中学业水平考试(合格考)中,对全省所有考生的数学成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],90分以上为优秀,则下列说法中不正确的是()A.该省考生数学成绩的中位数为75分 B.若要全省的合格考通过率达到96%,则合格分数线约为44分 C.从全体考生中随机抽取1000人,则其中得优秀考试约有100人 D.若同一组中数据用该组区间中间值作代表值,可得考试数学成绩的平均分约为705.(2025•浦东新区模拟)研究变量x,y得到一组成对数据(xi,yi),i=1,2,…,n,先进行一次线性回归分析,接着增加一个数据(xn+1,yn+1),其中xnA.变量x与变量y的相关性变强 B.相关系数r的绝对值变小 C.线性回归方程y=aD.拟合误差Q变大6.(2024秋•辽宁期中)由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程ŷA.若相关系数r越小,则两组变量的相关性越弱 B.若b̂越大,则两组变量的相关性越强C.经验回归方程ŷ=b̂x+â至少经过样本数据(x1,y1),(x2,y2D.在经验回归方程ŷ=b̂x+a7.(2024春•寿光市期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据:以下结论正确的是()男生女生篮球迷3015非篮球迷4510附:χ2P(χ2≥k)0.100.050.01k2.7063.8416.635A.没有95%的把握认为是否是篮球迷与性别有关 B.有99%的把握认为是否是篮球迷与性别有关 C.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关 D.在犯错误的概率不超过0.01的前提下,可以认为是否是篮球迷与性别有关8.(2024秋•忻城县校级期中)已知数据x1,x2,x3,…,x10,满足xi﹣xi﹣1=1(2≤i≤10),若去掉x1,x10后组成一组新数据,则新数据与原数据相比,下列说法正确的是()A.若x1=1,则数据x1,x2,x3,…,x10的第75百分位数为7.5 B.平均数变小 C.方差不变 D.中位数不变二.多选题(共4小题)(多选)9.(2025•揭阳模拟)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:cm)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是()A.基地牡丹植株高度的极差的估计值大于50 B.基地牡丹植株高度不高于70的频率估计值为30% C.基地牡丹植株高度的众数与中位数的估计值相等 D.基地牡丹植株高度的第75百分位数的估计值小于80(多选)10.(2025•江苏模拟)为了解某地家村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中正确的是()A.估计该地农户家庭年收入的平均值不超过6.5万元 B.估计该地有一半以上的农户.其家庭年收入介于4.5万元至8.5万元之间 C.若用分行抽样的方法在该地农户家庭年收入在[2.5,3.5],[6.5,7.5],[12.5,13.5]三组中共抽取48个家庭进行初步访谈,则年收入在[6.5,7.5]的家庭应抽24人 D.从抽样的12组中的每组中抽出一个数据,得到12个家庭的具体收入数据x1,x2,⋯,x12,若数据a与这12个家庭的收入数据的差的平方和最小,则数据a必为这12个家庭收入数据的平均数(多选)11.(2025•温江区模拟)下列命题正确的是()A.对于随机事件A与B,P(A)>0,P(B)>0,若P(A|B)=P(A),则事件A与B相互独立 B.若经验回归方程为ŷ=0.3xC.数据2,7,9,11,13,12,5,7,9,11,13,15的75%分位数为12 D.随机变量X~B(6,0.5),当P(X=k)最大,则k的取值为3(多选)12.(2025•泉州模拟)某地种植的新品种哈密瓜获得了丰收,随机从采摘好的哈密瓜中挑选了100个称重(单位:kg),并整理数据,得到如图频率分布直方图.根据此频率分布直方图,下面结论正确的是()A.m=0.1 B.估计该哈密瓜的质量不低于1.6kg的比例为30% C.估计有一半以上的该哈密瓜的质量介于1.4kg至1.6kg之间 D.估计该哈密瓜的质量的中位数介于1.5kg至1.6kg之间三.填空题(共4小题)13.(2025春•河南月考)在对某中学高三年级学生体重(单位:kg)的调查中,按男、女生人数比例用分层随机抽样的方法抽取部分学生进行测量,已知抽取的男生有50人,其体重的平均数和方差分别为54,20,抽取的女生有40人,其体重的平均数和方差分别为45,11,则估计该校高三年级学生体重的方差为.14.(2024春•大武口区校级期中)红铃虫(Pectinophoragossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(个)和温度x(℃)的8组观测数据,制成图1所示的散点图.现用两种模型①y=ebx+a,②y=cx2+d分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.根据收集到的数据,计算得到如下值:xzti=1i=1i=1i=1252.964616842268850.470308表中zi=lnyi;z=18i=1(1)根据残差图,比较模型①、②的拟合效果,模型比较合适?(2)根据(1)中所选择的模型,求出y关于x的回归方程.附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其回归直线v̂=α̂+15.(2024•吕梁一模)某市2018年至2022年新能源汽车年销量y(单位:百台)与年份代号x的数据如下表:年份20182019202020212022年份代号x01234年销量y1015203035若根据表中的数据用最小二乘法求得y关于x的回归直线方程为ŷ=6.5x+a16.(2023•浦东新区三模)已知一组成对数据(18,24),(13,34),(10,38),(﹣1,m)的回归方程为y=﹣2x+59.5,则该组数据的相关系数r=(精确到0.001).四.解答题(共4小题)17.(2025春•萍乡期中)某高中开设“四季农耕”的劳动教育课程,课程包括播种和田间管理.学校对选择了这两类课程的学生人数分布进行了统计,相关数据记录在如表格中,但其中有几项缺失,已知有45课程性别合计男生女生播种160田间管理120合计400(1)补全表格,并判断是否有99.9%的把握认为不同劳动教育课程的选择与性别有关;(2)学校为了调研学生课程完成率是否存在与平均完成率偏差过大的情况,需计算偏差系数w(n),现给出以下两种数据处理方式:①w(n)=1ni=1学生编号123456完成率x%507060667284附:χ2P(x2≥k0)0.10.050.010.001k02.7063.8416.63510.82818.(2025春•临川区校级期中)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值及样本成绩的第80百分位数;(2)已知落在区间[50,60)的样本平均成绩是57,方差是7,落在区间[60,70)的样本平均成绩为66,方差是4,求两组样本成绩合并后的平均数z和方差s2.参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:m,x,s12;n,y,s22,记总的样本平均数为ω,样本方差为s19.(2025春•崂山区校级期中)某公司计划对未开通共享电动车的某市进行车辆投放,为了确定车辆投放量,对过去在其他城市的投放量情况以及年使用人次进行了统计,得到了投放量x(单位:千辆)与年使用人次y(单位:千次)的数据如表所示,根据数据绘制投放量x与年使用人次y的散点图如图所示.x1234567y611213466101196(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型y=a+blgx或指数函数模型y=c•dx(c>0,d>0)对两个变量的关系进行拟合.请问哪个模型更适宜作为投放量x与年使用人次y的回归方程类型(给出判断即可,不必说明理由)?并求出y关于x的回归方程;(2)公司为了测试共享电动车的性能,从所有同型号共享电动车中随机抽取100辆进行等距离骑行测试,骑行前对其中60台进行保养,测试结束后,有20台报废,其中保养过的共享电动车占比30%.请根据统计数据完成2×2列联表,并根据小概率值α=0.01的独立性检验,能否认为共享电动车是否报废与保养有关?保养未保养合计报废20未报废合计60100参考数据:vi=lgy1,v=17yvi=17xi=17x100.5462.141.54253550.123.47参考公式:对于一组数据(x1,y1),(x2,y2),…(xₙ,yₙ),其回归直线的斜率和截距的最小二乘估计公式分别为:b̂=i=1n(xi−x)(yi−yP(x2≥k)0.250.10.050.0250.010.001k1.3232.7063.8415.0246.63510.82820.(2025春•北仑区校级期中)黔西一中为了提高学生对“黔西一中校史”的了解,举办了“知史爱校守初心”的知识竞赛活动,现从所有竞答试卷的卷面成绩中随机抽取100份作为样本数据,将样本答卷中分数x(40≤x≤100)的整数分成六段:[40,50),[50,60),…,[90,100],并作出如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)求样本数据的第59百分位数;(3)已知样本数据落在[50,60)的平均数是52,方差是6;落在[60,70)的平均数是64,方差是3.求这两组数据的总平均数x和总方差s2.

高考数学一轮复习统计答案与试题解析一.选择题(共8小题)1.(2025•晋城二模)已知10个样本数据的平均值为10,方差为6,则这10个数据的65%分位数的最大值为()A.11 B.12 C.13 D.14【考点】百分位数;平均数;方差.【专题】整体思想;转化法;概率与统计;运算求解.【正确答案】C【分析】设这10个数分别为x1,x2,…,x10,不妨设x1≤x2≤...≤x10,可得这10个数据的65%分位数为x7,设x1,x2,…,x6的平均数为m,方差为s,x7,x8,x9,x10的平均数为n,方差为t,由方差定义结合放缩法求解不等式得答案.解:设这10个数分别为x1,x2,…,x10,不妨设x1≤x2≤...≤x10,∵10×65%=6.5,∴这10个数据的65%分位数为x7,设x1,x2,…,x6的平均数为m,方差为s,x7,x8,x9,x10的平均数为n,方差为t,由题意知,6m+4n106=6[∴6≥3(50−2n进而x7≤n≤13,当且仅当s=t=0时取等号,即x1=x2=x3=x4=x5=x6=8,x7=x8=x9=x10=13时,x7取得最大值为13.故选:C.【点评】本题考查百分位数的求法,考查分析问题与解决问题的能力,属难题.2.(2025•武汉模拟)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分,得到如图所示的统计表格,则下列结论不正确的是()评委编号模型名称123456甲7.09.38.39.28.98.9乙8.19.18.58.68.78.6A.甲得分的平均数大于乙得分的平均数 B.甲得分的众数大于乙得分的众数 C.甲得分的中位数大于乙得分的中位数 D.甲得分的方差大于乙得分的方差【考点】平均数;中位数;众数;方差.【专题】整体思想;综合法;概率与统计;运算求解.【正确答案】A【分析】根据平均数、众数、中位数和方差的定义求解.解:对于A,甲得分的平均数为7.0+9.3+8.3+9.2+8.9+8.96=8.6,乙得分的平均数为所以甲得分的平均数等于乙得分的平均数,故A错误;对于B,甲得分的众数为8.9,乙得分的众数为8.6,所以甲得分的众数大于乙得分的众数,故B正确;对于C,甲得分从小到大排列为:7.0,8.3,8.9,8.9,9.2,9.3,所以甲得分的中位数为8.9,乙得分从小到大排列为:8.1,8.5,8.6,8.6,8.7,9.1,所以甲得分的中位数为8.6,所以甲得分的中位数大于乙得分的中位数,故C正确;对于D,甲得分的方差为16×[(7.0﹣8.6)2+(9.3﹣8.6)2+(8.3﹣8.6)2+(9.2﹣8.6)2+(8.9﹣8.6)2+(8.9﹣8.6)乙得分的方差为16×[(8.1﹣8.6)2+(9.1﹣8.6)2+(8.5﹣8.6)2+(8.6﹣8.6)2+(8.7﹣8.6)2+(8.6﹣8.6)所以甲得分的方差大于乙得分的方差,故D正确.故选:A.【点评】本题主要考查了平均数、众数、中位数和方差的定义,属于基础题.3.(2025春•道里区校级月考)为了了解高中学生每天的课后学习时间和他们的数学成绩排名的关系,某实验小组做了调查,得到一些数据如下表,已知学习时间x(单位:小时)与成绩名次y(单位:名)满足线性回归方程y=−6815x+a,则学习时间x0.51.02.02.54.0成绩排名y2014108y5附加:i=1A.19 B.29915 C.20 D.【考点】经验回归方程与经验回归直线.【专题】计算题;方程思想;待定系数法;概率与统计;运算求解.【正确答案】D【分析】根据i=15xiyi=解:由已知得:0.5×20+1×14+2×10+2.5×8+4×y5=76,解得y5=3,所以x=15所以样本点中心为(2,11),代入回归直线方程得11=−68解得a=301故选:D.【点评】本题考查回归直线方程系数的求法及性质,属于中档题.4.(2025•红桥区一模)在2023年某省普通高中学业水平考试(合格考)中,对全省所有考生的数学成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],90分以上为优秀,则下列说法中不正确的是()A.该省考生数学成绩的中位数为75分 B.若要全省的合格考通过率达到96%,则合格分数线约为44分 C.从全体考生中随机抽取1000人,则其中得优秀考试约有100人 D.若同一组中数据用该组区间中间值作代表值,可得考试数学成绩的平均分约为70【考点】频率分布直方图的应用.【专题】转化思想;综合法;概率与统计;运算求解.【正确答案】A【分析】根据频率分布直方图计算中位数、平均分,由不合格率为4%求得合格线,利用优秀率估算抽取的1000人中的优秀从数,从而判断各选项.解:因为前几组的频率依次为0.1,0.15,0.2,0.3,所以中位数在[70,80]内,所以中位数为70+0.5−0.1−0.15−0.20.03≈要全省的合格考通过率达到96%,设合格分数线为y,则y−4010=1−0.960.1由频率分布直方图优秀的频率为0.1,因此人数为1000×0.1=100,C正确;由频率分布直方图得平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,考试数学成绩的平均分约为70,D正确.故选:A.【点评】本题考查频率分布直方图的综合应用,属中档题.5.(2025•浦东新区模拟)研究变量x,y得到一组成对数据(xi,yi),i=1,2,…,n,先进行一次线性回归分析,接着增加一个数据(xn+1,yn+1),其中xnA.变量x与变量y的相关性变强 B.相关系数r的绝对值变小 C.线性回归方程y=aD.拟合误差Q变大【考点】一元线性回归模型;样本相关系数.【专题】转化思想;综合法;概率与统计;运算求解.【正确答案】C【分析】设变量x,y的平均数分别为x,y,分析可知x=xn+1,对于CD:根据回归方程和拟合误差的性质分析判断.解:设变量x,y的平均数分别为x,y,则x=1ni=1可知新数据的样本中心点不变,仍为(x,y),对于AB:可得i=1n+1(xi−x同理可得i=1i=1则相关系数r=可知相关系数r的值不变,变量x与变量y的相关性不变,故AB错误;对于C:因为b̂且线性回归方程过样本中心点(x,y),即b̂,â均不变,所以线性回归方程y=âx因为(xn+1,yn+1)即为样本中心点,即yn+1=y可知残差平方和i=1n+1(故选:C.【点评】本题考查了线性回归模型,属于中档题.6.(2024秋•辽宁期中)由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程ŷA.若相关系数r越小,则两组变量的相关性越弱 B.若b̂越大,则两组变量的相关性越强C.经验回归方程ŷ=b̂x+â至少经过样本数据(x1,y1),(x2,y2D.在经验回归方程ŷ=b̂x+a【考点】经验回归方程与经验回归直线;样本相关系数.【专题】转化思想;综合法;概率与统计;运算求解.【正确答案】D【分析】根据相关系数的含义可判断AB;根据回归直线的含义可判断CD.解:对于A,若相关系数|r|越小,则两组变量的相关性越弱,A错误;对于B,因为b̂是回归直线的斜率,它不反应两变量的相关性强弱,B对于C,经验回归方程ŷ=b对于D,在经验回归方程ŷ=b若b̂>0,相应的观测值y约增加b̂个单位;若b̂<0故当解释变量x每增加1个单位时,相应的观测值y约增加b̂个单位,D故选:D.【点评】本题考查线性回归分析的应用,属中档题.7.(2024春•寿光市期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据:以下结论正确的是()男生女生篮球迷3015非篮球迷4510附:χ2P(χ2≥k)0.100.050.01k2.7063.8416.635A.没有95%的把握认为是否是篮球迷与性别有关 B.有99%的把握认为是否是篮球迷与性别有关 C.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关 D.在犯错误的概率不超过0.01的前提下,可以认为是否是篮球迷与性别有关【考点】独立性检验.【专题】计算题;转化思想;综合法;概率与统计;运算求解.【正确答案】A【分析】根据列联表运用公式χ2=n解:根据题目中的列联表数据,男生女生合计篮球迷301545非篮球迷451055合计7525100得到χ2=n所以,没有95%的把握认为是否是篮球迷与性别有关.故选:A.【点评】本题是一个独立性检验,我们可以利用临界值的大小来决定是否拒绝原来的统计假设,若值较大就拒绝假设,即拒绝两个事件无关,是中档题.8.(2024秋•忻城县校级期中)已知数据x1,x2,x3,…,x10,满足xi﹣xi﹣1=1(2≤i≤10),若去掉x1,x10后组成一组新数据,则新数据与原数据相比,下列说法正确的是()A.若x1=1,则数据x1,x2,x3,…,x10的第75百分位数为7.5 B.平均数变小 C.方差不变 D.中位数不变【考点】百分位数;平均数;中位数.【专题】转化思想;综合法;概率与统计;运算求解.【正确答案】D【分析】利用中位数、百分位数、平均数和方差的定义分析计算即可.解:因为数据x1,x2,x3,…,x10,满足xi﹣xi﹣1=1(2≤i≤10),所以当x1=1时,数据为:1,2,3,4,5,6,7,8,9,10,因为10×75%=7.5,所以该组数据的第75百分位数是8,所以A错误;由于xi﹣xi﹣1=1(2≤i≤10),故x2=x1+1,x3=x1+2,…,x9=x1+8,x10=x1+9,原来的平均数为x1去掉x1,x10后的平均数为x2+x原来的方差为(x去掉x1,x10后的方差为(x2−原来的中位数与现在的中位数均为x5+x故选:D.【点评】本题考查百分位数的求解,平均数与方程的概念,属中档题.二.多选题(共4小题)(多选)9.(2025•揭阳模拟)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:cm)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是()A.基地牡丹植株高度的极差的估计值大于50 B.基地牡丹植株高度不高于70的频率估计值为30% C.基地牡丹植株高度的众数与中位数的估计值相等 D.基地牡丹植株高度的第75百分位数的估计值小于80【考点】百分位数;中位数;极差.【专题】对应思想;定义法;概率与统计;运算求解.【正确答案】BC【分析】根据频率分布直方图以及极差,频率,中位数,众数,以及百分位数定义可解.解:根据题意,最高值为100,最低值为50,则极差小于或等于50,故A错误;基地牡丹植株高度不高于70的频率估计值为0.01×10+0.02×10=0.3,故B正确;牡丹植株高度的众数为75,根据图表可得,[50,60)的频率为0.1,[60,70)的频率为0.2,[70,80)的频率为0.4,0.1+0.2+0.4=0.7>0.5,设中位数为x,则(x﹣70)×0.04=0.5﹣0.1﹣0.2=0.2,则x=75,故众数等于中位数,故C正确;设第75百分位数为m,又[50,60)的频率为0.1,[60,70)的频率为0.2,[70,80)的频率为0.4,[80,90)的频率为0.25,则0.7+(m﹣80)×0.025=0.75,则m=82>80,故D错误.故选:BC.【点评】本题考查频率分布直方图以及极差,频率,中位数,众数,以及百分位数定义,属于中档题.(多选)10.(2025•江苏模拟)为了解某地家村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中正确的是()A.估计该地农户家庭年收入的平均值不超过6.5万元 B.估计该地有一半以上的农户.其家庭年收入介于4.5万元至8.5万元之间 C.若用分行抽样的方法在该地农户家庭年收入在[2.5,3.5],[6.5,7.5],[12.5,13.5]三组中共抽取48个家庭进行初步访谈,则年收入在[6.5,7.5]的家庭应抽24人 D.从抽样的12组中的每组中抽出一个数据,得到12个家庭的具体收入数据x1,x2,⋯,x12,若数据a与这12个家庭的收入数据的差的平方和最小,则数据a必为这12个家庭收入数据的平均数【考点】频率分布直方图的应用.【专题】转化思想;综合法;概率与统计;运算求解.【正确答案】BD【分析】根据频率分布直方图的性质,结合平均数的概念,分层抽样的概念,最小二乘法原理,逐一判断即可.解:估计该地农户家庭年收入的平均值为:3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02=7.68>6.5,所以A选项错误;因为家庭年收入介于4.5万元至8.5万元之间的频率为0.1+0.14+0.2+0.2=0.64>0.5,所以估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,所以B选项正确;因为[2.5,3.5],[6.5,7.5],[12.5,13.5]三组的频率之比为0.02:0.2:0.02=4:40:4,所以若用分行抽样的方法在该地农户家庭年收入在[2.5,3.5],[6.5,7.5],[12.5,13.5]三组中共抽取48个家庭进行初步访谈,则年收入在[6.5,7.5]的家庭应抽40人,所以C选项错误;根据线性回归分析中最小二乘法原理,可得若数据a与这12个家庭的收入数据的差的平方和最小,则数据a必为这12个家庭收入数据的平均数,所以D选项正确.故选:BD.【点评】本题考查频率分布直方图的综合应用,属中档题.(多选)11.(2025•温江区模拟)下列命题正确的是()A.对于随机事件A与B,P(A)>0,P(B)>0,若P(A|B)=P(A),则事件A与B相互独立 B.若经验回归方程为ŷ=0.3xC.数据2,7,9,11,13,12,5,7,9,11,13,15的75%分位数为12 D.随机变量X~B(6,0.5),当P(X=k)最大,则k的取值为3【考点】经验回归方程与经验回归直线;n重伯努利试验与二项分布;二项分布的均值(数学期望)与方差;百分位数.【专题】对应思想;定义法;概率与统计;运算求解.【正确答案】AD【分析】对于A,利用条件概率以及相互独立事件概率相关知识可解;对于B,根据线性回归方程知识可解;对于C,根据百分位数定义可解;对于D,根据二项分布知识可解.解:对于A,对于随机事件A与B,P(A)>0,P(B)>0,若P(A|B)=P(A),又P(A|B)=P(AB)P(B)=P(A),即P(AB则事件A与B相互独立,则A正确;对于B,若经验回归方程为ŷ=0.3x+0.2,若x=3,则y=1.1,则对于C,数据排序为:2,5,7,7,9,9,11,11,12,13,13,15(共12个),75%分位数位置为0.75×12=9,对应位置为第9个与第10个的平均值,即12+132=12.5,故对于D,随机变量X~B(6,0.5),则P(X=k)=C则当k=3时,P(X=3)最大,故D正确.故选:AD.【点评】本题考查条件概率以及相互独立事件,线性回归方程,百分位数定义以及二项分布知识,属于中档题.(多选)12.(2025•泉州模拟)某地种植的新品种哈密瓜获得了丰收,随机从采摘好的哈密瓜中挑选了100个称重(单位:kg),并整理数据,得到如图频率分布直方图.根据此频率分布直方图,下面结论正确的是()A.m=0.1 B.估计该哈密瓜的质量不低于1.6kg的比例为30% C.估计有一半以上的该哈密瓜的质量介于1.4kg至1.6kg之间 D.估计该哈密瓜的质量的中位数介于1.5kg至1.6kg之间【考点】频率分布直方图的应用.【专题】转化思想;综合法;概率与统计;运算求解.【正确答案】BCD【分析】根据频率分布直方图有所有频率之和为1即可求得m,根据质量不低于1.6kg的频率之和即可判断B,求出哈密瓜的质量介于1.4kg至1.6kg之间的频率即可判断C,计算中位数即可判断D.解:对A选项:根据题意可得(0.5+2m+2+2.5+3)×0.1=1,解得m=1,所以A选项错误;对B选项:估计该哈密瓜的质量不低于1.6kg的比例为(2+1)×0.1×100%=30%,所以B选项正确;对C选项:因为(3+2.5)×0.1=0.55>0.5,所以估计有一半以上的该哈密瓜的质量介于1.4kg至1.6kg之间,所以C选项正确;对D选项:因为前几组的频率依次为0.05,0.1,0.3,0.25,所以该哈密瓜的质量的中位数在[1.5,1.6)内,且为1.5+0.5−0.05−0.1−0.3所以估计该哈密瓜的质量的中位数介于1.5kg至1.6kg之间,所以D选项正确.故选:BCD.【点评】本题考查频率分布直方图的综合应用,属中档题.三.填空题(共4小题)13.(2025春•河南月考)在对某中学高三年级学生体重(单位:kg)的调查中,按男、女生人数比例用分层随机抽样的方法抽取部分学生进行测量,已知抽取的男生有50人,其体重的平均数和方差分别为54,20,抽取的女生有40人,其体重的平均数和方差分别为45,11,则估计该校高三年级学生体重的方差为36.【考点】方差;由分层随机抽样的样本平均数估计总体平均数.【专题】计算题;方程思想;转化思想;综合法;概率与统计;运算求解.【正确答案】36.【分析】根据题意,先求出总体的平均数,进而由总体方差公式计算可得答案.解:根据题意,抽取的男生有50人,其体重的平均数和方差分别为54,20,抽取的女生有40人,其体重的平均数和方差分别为45,11,则总体的平均数x=则该校高三年级学生体重的方差S2=5050+40×[20+(54﹣50)2]+故36.【点评】本题考查总体方差的计算,注意总体方差的计算公式,属于基础题.14.(2024春•大武口区校级期中)红铃虫(Pectinophoragossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(个)和温度x(℃)的8组观测数据,制成图1所示的散点图.现用两种模型①y=ebx+a,②y=cx2+d分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.根据收集到的数据,计算得到如下值:xzti=1i=1i=1i=1252.964616842268850.470308表中zi=lnyi;z=18i=1(1)根据残差图,比较模型①、②的拟合效果,模型①比较合适?(2)根据(1)中所选择的模型,求出y关于x的回归方程ŷ=附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其回归直线v̂=α̂+【考点】残差及残差图.【专题】整体思想;综合法;概率与统计;运算求解.【正确答案】(1)选模型①比较合适;(2)ŷ【分析】(1)根据残差图判断即可;(2)令z=lny则ẑ=â+b̂x,利用参考数据求出解:(1)应该选择模型①.由于模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②的带状宽度窄,所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适;(2)令z=lny,z与温度x可以用线性回归方程来拟合,则ẑ所以b̂所以â=z−b̂即z关于x的线性回归方程为ẑ=0.29x−4.61.于是有所以产卵数y关于温度x的回归方程为ŷ故①;ŷ【点评】本题主要考查了经验回归方程的求解,考查了残差图的应用,属于中档题.15.(2024•吕梁一模)某市2018年至2022年新能源汽车年销量y(单位:百台)与年份代号x的数据如下表:年份20182019202020212022年份代号x01234年销量y1015203035若根据表中的数据用最小二乘法求得y关于x的回归直线方程为ŷ=6.5x+a【考点】经验回归方程与经验回归直线.【专题】综合题;整体思想;综合法;概率与统计;逻辑思维.【正确答案】﹣0.5.【分析】首先计算x和y,并代入回归直线方程求â,并求x解:依题意,x=0+1+2+3+45代入回归直线ŷ=6.5x所以回归直线为ŷ当x=1时,ŷ故﹣0.5.【点评】本题主要考查线性回归方程的应用,属于中档题.16.(2023•浦东新区三模)已知一组成对数据(18,24),(13,34),(10,38),(﹣1,m)的回归方程为y=﹣2x+59.5,则该组数据的相关系数r=﹣0.998(精确到0.001).【考点】经验回归方程与经验回归直线;样本相关系数.【专题】对应思想;分析法;概率与统计;运算求解.【正确答案】﹣0.998.【分析】一组成对数据的平均值(x,y)一定在回归方程上,可求得m,再利用相关系数r的计算公式算出即可.解:由条件可得,x=14×(18+13+10﹣1)=10,y=1(x,y)一定在回归方程y=﹣2x+59.5上,代入解得m=62,故y=i=14xiyi=1192,i=14x∴r=i故﹣0.998.【点评】本题考查相关系数的应用,属于中档题.四.解答题(共4小题)17.(2025春•萍乡期中)某高中开设“四季农耕”的劳动教育课程,课程包括播种和田间管理.学校对选择了这两类课程的学生人数分布进行了统计,相关数据记录在如表格中,但其中有几项缺失,已知有45课程性别合计男生女生播种160田间管理120合计400(1)补全表格,并判断是否有99.9%的把握认为不同劳动教育课程的选择与性别有关;(2)学校为了调研学生课程完成率是否存在与平均完成率偏差过大的情况,需计算偏差系数w(n),现给出以下两种数据处理方式:①w(n)=1ni=1学生编号123456完成率x%507060667284附:χ2P(x2≥k0)0.10.050.010.001k02.7063.8416.63510.828【考点】独立性检验.【专题】整体思想;综合法;概率与统计;运算求解.【正确答案】(1)完善表格如图,课程性别合计男生女生播种16080240田间管理40120160合计200200400有关;(2)3313,25【分析】(1)设男生有x人,根据题意有45⋅x(2)先计算完成率的平均数,再根据①②公式计算比较即可.解:(1)设男生有x人,则45⋅x所以选择田间管理课的男生人数为40,从而女生有200人,女生中选择播种课的人数为80人,完善表格如图,课程性别合计男生女生播种16080240田间管理40120160合计200200400零假设H0:不同劳动教育课程的选择与性别无关,则χ2依据小概率值α=0.001的独立性检验,我们推断H0不成立,故有99.9%的把握认为不同劳动教育课程的选择与性别有关;(2)由题意可知,x=根据①的计算公式计算:w(6)=根据②的计算公式计算:w(6)=因此方式②的偏差系数更大,从而方式②对大偏差数据的体现更加明显.【点评】本题主要考查了独立性检验的应用,属于中档题.18.(2025春•临川区校级期中)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值及样本成绩的第80百分位数;(2)已知落在区间[50,60)的样本平均成绩是57,方差是7,落在区间[60,70)的样本平均成绩为66,方差是4,求两组样本成绩合并后的平均数z和方差s2.参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:m,x,s12;n,y,s22,记总的样本平均数为ω,样本方差为s【考点】频率分布直方图的应用.【专题】转化思想;综合法;概率与统计;运算求解.【正确答案】(1)a=0.025;第80百分位数为86;(2)63;23.【分析】(1)根据频率分布直方图的性质,建立方程求出a,在根据百分位数的求法,即可求解;(2)根据加权平均数与方差的结论,即可求解.解:(1)由题意知0.05+0.1+0.2+0.3+10a+0.1=1,解得a=0.025;成绩在[40,80)的频率为0.65,成绩在[40,90)的频率为0.9,所以第80百分位数在(80,90)内,且为80+0.8−0.65(2)由频率分布直方图知,这100份答卷分数在[50,60)的份数为100×0.1=10,分数在[60,70)的份数为100×0.2=20,所以ω=57×s2【点评】本题考查频率分布直方图的综合应用,属中档题.19.(2025春•崂山区校级期中)某公司计划对未开通共享电动车的某市进行车辆投放,为了确定车辆投放量,对过去在其他城市的投放量情况以及年使用人次进行了统计,得到了投放量x(单位:千辆)与年使用人次y(单位:千次)的数据如表所示,根据数据绘制投放量x与年使用人次y的散点图如图所示.x1234567y611213466101196(1)观察散点图,可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论