2026届高三数学二轮复习:突破练14 统计与成对数据的统计分析_第1页
2026届高三数学二轮复习:突破练14 统计与成对数据的统计分析_第2页
2026届高三数学二轮复习:突破练14 统计与成对数据的统计分析_第3页
2026届高三数学二轮复习:突破练14 统计与成对数据的统计分析_第4页
2026届高三数学二轮复习:突破练14 统计与成对数据的统计分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题突破练14统计与成对数据的统计分析

必备知识夯实练

1.(2025北京东城模拟)如图所示的频率分布直方图显示了三种不同的分布形态,图1形

成对称形态,图2形成“右拖尾”形态,图3形成“左拖尾”形态,根据所给图作出以下判断,

不正确的是()

图1

A.图1的平均数二中位数二众数

B.图2的平均数〈众数〈中位数

C.图2的众数v中位数〈平均数

D.图3的平均数〈中位数(众数

2.(2025江西九江二模)植物的根是吸收水分和矿物养分的主要器官.己知在一定范围内,

小麦对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽小麦实验中,在确保土壤

肥力及灌溉条件相对稳定的情况下,统计了根长度x(单位:cm)与氮元素吸收量),(单

位:mg/天)的相关数据,如下表所示:

X9.912.114.818.219.921.825.127.730.432.1

y0.300.340.420.500.550.600.710.740.780.86

根据表中数据可得±二21.2,歹=().58及经验回归方程为尸().()25戈+凡则()

A.o=-0.05

B.变量了与x的样本相关系数r<()

C.在一定范围内,小麦的根长度每增加1cm,它一天的氮元素吸收量平均增加0.025mg

D.若对小麦的根长度与钾元素吸收量的相关数据进行统计,则对应回归方程不变

3.(多选题)(2025山东名校联考)某小区共有2000名20~60岁的居民进行消防知识有奖

答题,满分100分.答题完成后,工作人员从中随机抽取100人的答卷,并根据成绩绘制了

频率分布直方图(如图),则下列结论正确的是()

A.频率分布直方图中=0.015

B.小区2000名20〜60岁居民答题成绩的平均数约为70.5,极差约为60

C.估计这100名居民答题成绩的第60百分位数为70

D.被抽取的100人中答题成绩在[7(),90)的有45人

4.(2025河北衡水模拟)加密运算在信息传送中具有重大作用.对于一组数据山/2,

其密钥S-定义算法尸。S淇中2,…,几将数据小,02,…,4〃加密

ni=i(a「s,ai>s,

为",岳,…仇的过程称为/型单向加密.现将一组数据4,1,6,847进行/型单向加密,则加

密后的新数据的第60百分位数为()

A.2B.3

C.6D.9

5.(多选题)(2025北京海淀模拟)如图是根据一组观测数据得到海拔6~15km的大气压强

散点图,根据一元线性回归模型得到经验回归方程为%=-4.0x+68.5,决定系数为*=0.99.

根据非线性回归模型得到经验回归方程为y2=132.9e-og1决定系数为港=0.99,则下列说

法正确的是()

疝大气压强3a

05678910111213141516

海拔高度/km

A.由散点图可知,大气压强与海拔高度负相关

B.由方程yi=-4.0x+68.5可知,海拔每升高1km,大气压强必定降低4.0kPa

C.由方程yi=-46+68.5可知,样本点(11,22.6)的残差为-1.9

D.对比两个回归模型,结合实际情况,方程'2=132.9*63、的预报效果更好

6.(2025云南昆明模拟)某研究性学习小组针对“使用某APP的用户是否存在性别差异”,

向40〃(〃£N*)个人进行调查.用。表示所有调查对象构成的集合.以。为样本空间建立

古典概型,并定义一对分类变量X和丫如下:对于Q中的每一名学生,

10,调查对象为女性,

11,调查对象为男性,

Y=

霭黑黑7现得到下表

Y

X

10

18〃12/7

012〃8〃

若根据a=0.05的独立性检验,认为P(y=l[X=0)>P(y=1|X=1)(其中MO5=3.841),贝!n的最

_____n(ad-bc)2_____

小值为___________.(参考公式:/=,其中n=a+b+c+d)

(a+c)(b+d)(a+b)(c+d)

7.(2025北京西城模拟浦丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔设

计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年某

国知识付费用户数量(单位:亿人次,数据为年末数据),并绘制成南丁格尔玫瑰图(如图所

示),根据此图,则下列正确结论的序号是.

①2016年至2023年,知识付费用户数量逐年增加

②2017年至2023年,知识付费用户数量逐年增加量2018年最多

③2017年至2023年,知识付费用户数量的逐年增加量逐年递增

④2023年知识付费用户数量超过2016年知识付费用户数量的10倍

关键能力提升练

8.(多选题)(2025福建福州模拟)有一组成对样本数据(mji),(X2)2),…设元=

-iX,y=-玄为由这组数据得到新成对样本数据

ni=lni=l

(xi+元yi+9),(x2+%”+9),…,5+五力+9).利用一元线性回归模型,根据最小二乘法,下列结

论一定正确的是()

AA

£(Xi-x)(yt-y)A

附:经验回归直线的斜率和截距的最小二乘估计公式分别为b=在、———a=y-bx.

萤㈤t

E(Xi-x\yi-y)£(*,i)AAA

样本相关系数片I0,决定系数R2=1-W~^其中%=bxi+a).

S(Xi-x)2l(-y)2自仇

,i=ii=iyi

A.两条经验回归直线都过点(无歹)

B.两条经验回归直线的截距相同

C.两组数据的样本相关系数相同

D.两组数据的决定系数相同

9.(多选题)(2025安徽合肥二模)从某校高一和高二年级分别随机抽取100名学生进行知

识竞赛,按得分(满分100分)绘制如图所示的频率分布直方图,根据频率分布直方图,并用

频率估计概率记高一年级学生得分平均数的估计值为x,高二年级学生得分中位数与平

均数的估计值分别为),2从高一和高二年级各随机抽取一名学生,记事件"高一年级

学生得分不低于60分,高二年级学生得分不低于80分”,事件N="高一年级学生得分不

低于80分,高一年级学生得分不低于60分”,则()

A.x<zBj>z

C.事件M,N互斥D.P(M)=P(N)

10.(2025广东汕头一模)在政府发布的光伏发电补贴政策的引导下,西北某地光伏发电装

机量急剧上升,现对2016年至2023年的新增光伏装机量进行调查,根据散点图选择了两

个模型进行拟合,并得到相应的经验回归方程.为判断模型的拟合效果,甲、乙、而三位

同学进行了如下分析:

(1)甲同学通过计算残差作出了两个模型的残差图,如图所示;

(2)乙同学求出模型①的残差平方和为().4175、模型②的残差平方和为1.5625;

⑶丙同学分别求出模型①的决定系数/=。952()、模型②的决定系数为暇=0.9781.

经检验,模型①拟合效果最佳,则甲、乙、丙三位同学中,运算结果肯定出错的同学

是.(填“甲”或“乙”或“丙”)

11.(15分)(2025湖南长沙模拟)乒乓球被称为中国的“国球”,是一种球类体育项目.某学校

为了丰富学生的课后活动内容,增强学生体质,决定组织乒乓球活动社.以下是接下来7

个星期(用x=\表示第1个星期,用.2表示第二个星期,以此类推)参加活动的累计人数

y(单位:人)的统计数据.

XI234567

y/A614203774I()8203

⑴根据表中数据可以判断),与x大致满足回归模型试建立y与x的回归方程(精

确到0.01);

(2)为了更好地开展体育类型活动,学校继续调查全校同学的身高情况.采用按比例分层

抽样抽取了男生30人,其身高的平均数和方差分别为171.5和13.0;抽取了女生20人淇

身高的平均数和方差分别为161.5和27.0,试求全体学生身高的平均数和方差.

7717

参考数据9二66,女1.57,£刘》二2681,X工汉々50.95,其中z/=lg=~XZi.

i=ii=i7i=i

参考公式:对于一组数据(“i,也),(“2,V2),…初其经验回归直线u=a+0”的斜率和截

n

A

XUiVi-nuvAA

距的最小二乘估计公式分别为/?=鼻——a=v-pu.

£uj-nu

i=i

核心素养创新练

12.(17分)(2025南京师大附中模拟)在测试中,客观题底度的计算公式为P点淇中Pi为

第,■题的难度R为答对该题的人数,N为参加测试的总人数.现对某校高三年级24()名学

生进行一次测试,共5道客观题.测试前根据对学生的了解,预估了每道题的难度,如表所

示:

题号12345

考前预估难度Pi0.90.80.70.60.4

测试后,随机抽取了20名学生的答题数据进行统计,结果如下

题号12345

实测答对人数161614148

(1)根据题中数据,估计这240名学生中第5题的实测答对人数;

⑵从抽取的20名学生中再随机抽取2名学生,记这2名学生中第5题答对的人数为X,

求X的分布列和数学期望;

⑶定义统计量S=?(P二P02+(P2'-P2>+…+(尸/月)2]淇中&为第i题的实测难度,Pj为第

i题的预估难度。=12…,心规定:若SV0.05,则称该次测试的难度预估合理,否则为不合

理.试据此判断本次测试的难度预估是否合理.

答案:

1.B解析对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数

和中位数应该大体上差不多.如果直方图在右边“拖尾”,那么平均数大于中位数.如果直

方图在左边“拖尾”,那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾

巴”那边.

题图1的频率分布直方图是对称的,所以平均数一中位数一众数,故A正确;题图2众数最

小,平均数大于中位数,故B错误,C正确;题图3众数最大,平均数小于中位数,故D正确.

故选B.

2.C解析由经验回归直线过样本点的中心(五歹)知,4=0.58-0.025x21.2=0.05,故A错误;

小麦对氮元素的吸收量与它的根长度具有正相关关系,故样本相关系数。0,故B错误;

由经验回归方程y=0.025x+。可得,在一定范围内,小麦的根长度每增加1cm,它一天的氮

兀素吸收量平均增加0.025mg,故C止确;若研究小麦的根长度与钾兀素吸收量的相关

关系,回归方程可能发生改变,故D错误.故选C.

3.ABD解析由图可知(0.01x2+2〃+0.02+0.03)xl0=l,所以4=0.015,故A正确;记平均数

的估计值为五贝底।=(45x0.01+55x0.015+65x0.02+75x0.03+85x0.015+95x0.01)x10=70.5,

极差约为100-40=60,故B正确;设第60百分位数的估计值为

x,(0.01+0.015+0.020)x10=0.45<0.6,(0.01+0.015+0.020+0.030)x10=0.75>0.6,所以

(70,80),故C错误;成绩在[70,90)的频率为0.3+0.15=0.45,所以有0.45x100=45人,故D正

确.故选ABD.

4.C解析依题意,密钥S=4+I+6:8+4+7=5,则加密后的新数据依次为9,6』,3,9,2,将加密后

6

的新数据按从小到大的顺序排列为123,6,9,9,由6x60%=3.6,得加密后的新数据为第60

百分位数为6.故选C.

5.ACD解析对于A,由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度

负相关,故A正确;

对于B,经验回归方程得到的数据为估计值,而非精确值,故B错误;

对于C,当x=ll时,$1=40x11+68.5=24.5,所以样本点(11,22.6)的残差为22.6-24.5=-1.9,

故C正确;

对于D,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程丫2二132.9已

c的预报效果更好,故D正确.故选ACD.

6.3解析因为尸(y="x=o)>p(y=i|x=i),所以用该APP的用户存在性别差异,

所以上殁舞黑誓=|,-3.841,即心3.841X|=2.400625,所以〃的最小值

为3.

7①②解析对于①,由图可知,2016年至2023年,知识付费用户数量逐年增加,故①正

确;

对于②和③,知识付费用户数量的逐年增加量分别为2017年,1.88-0.96-0.92;

2018年295-1.88=1.07;

2019年,3.56-2.95=0.61;

2020年,4.15-3.56=0.59;

2021年,4.77-4.15=0.62;

2022年,5.27-4.77=0.5;

2023年,5.72527=0.45.

则知识付费用户数量逐年噌加量2()18年最多,知识付费用户数量的逐年增加量不是逐

年递增,故②正确,③错误;

对于④,由5.72<10x0.96,则2023年知识付费用户数量未超过2016年知识付费用户数量

的10倍,故④错误.故答案为①②.

8.CD解析对于A,设新数据的样本点的中心为(7,历,

因为丁二41+元+%2+,+…+%n+^_%l+X2+…+Xn+-=9-

nn一

9=为+9+乃+:+…+如+9=2为所以新成对样本数据的经验回归直线过点(2元29),故A错误;

AE(xi+x-2x)(yt+y-2y)£(年幻3广歹)A

对于B,因为"二J-------=q-------=b,所以新成对样本数据的经验叵归直线

£(Xi+=x-2x)2£(Xi-x)2

1=1i=i

AAAA

的截距为d=2歹—b-2x=2(y—应)=2a,故B错误;

Z(Xi+x-2x)(yi+y-2y)

对于c,因为新成对样本数据的样本相关系数尸=7t=

X^i+x-zx)2_x(yt+y-2y)2

X(Xi-x)(yi-y)

院0n土•,所以两组数据的样本相关系数相同,故C正确;

Z(xi-x)2x(y(-y)2

Ji=ii=i

Z[yi+y-[b(Xi+x)+2a]}g(yt-bxt-a-y-bx-a)

对于D,因为新成对样本数据的决定系数~2=[上J__=1上2_____——.

S(yi+y-2y)£(“歹)

1=14=1

A_A

其中少=bH+a,

Z(yt-yt)2

所以R,2=1.等——二R2,所以两组数据的决定系数相同,故D正确.

1Z=1(yt-y)

故选CD.

9.AB解析

x=(35xO.Ol+45x0.02+55x0.03+65x0.02+75x0.01+85x0.005+95x0.005)x10=58.5,

z=(35x0.005+45x0.01+55x0.015+65x0.02+75x0.03+85x0.015+95x0.005)x10=67.5,

・・・0.05+0.1+0.15+0.2=0.5,/.y=70,二x<z,故A选项正确;

)>z,故B选项正确;・・・MnN=“高一年级学生得分不低于80分,高二年级学生得分不低于

8()分'竽。,故C选项错误;

由频率估计概率得=(0.2+0.1+0.05+0.05)x(0.15+0.05)=0.08,

P(N)=(0.05+0.05)x(0.2+0.3+0.15+0.05)=0.07^D选项错误.

故选AB.

10.丙解析甲的残差图中,模型①的残差点更均匀地分布在以横轴为对称轴的水平带

状区域内,且水平带状区域更窄,说明模型①拟合效果更好;残差平方和越大,即决定系数

越小,说明数据点越离散,户以乙的计算结果显示模型①的拟合效果更好,而丙的计算结

果显示模型②的拟合效果更好.故答案为丙.

11.解(1)对于)两边取常用对数可得lgy=lg(c^)=lgc+xlgd,设z=lgy,a=lgc,b=lgd,

AAA

则回归方程变为z=Q+bx.

yxf=12+22+32+42+52+62+72=1+4+9+16+25+36+49=140,/?=7,%=I+2+3+4+5+6+7“

17

£XiZ^7xz7

根据参考公式力=弓——,将ZHZ户50.95,5句.57,Ex"l40*=4代入,可得b«

50.95-7x4xl.5750.95-43.96

140-7X42140-112

a=z-bx«1.57-0.25x4=1.57-1=0.57.

则1=0.25x+0.57,

因为a-\gc,b=lgd,

所以1gd57,则c«10057;

1g公0.25,贝ij冷IO。*.

所以y与x的回归方程为(=10057-10°-25<

即y=loo-25.v+o,5;

(2)全体学生身高的平均数又二30X171.5120X161.5=51451323。=^=167.5,

30+205050

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论