2025高考数学二轮复习:统计(三大考向) 专项训练【含答案】_第1页
2025高考数学二轮复习:统计(三大考向) 专项训练【含答案】_第2页
2025高考数学二轮复习:统计(三大考向) 专项训练【含答案】_第3页
2025高考数学二轮复习:统计(三大考向) 专项训练【含答案】_第4页
2025高考数学二轮复习:统计(三大考向) 专项训练【含答案】_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025高考数学考二轮专题复习-第十讲-统计(三大考向)-专项训

-:考情分析

命题解读考向考查统计

1.高考对统计的考查,重点是2022•新高考□卷,

以下考点(1)分层随机抽样

19(1)

(2)统计图表频率分布直方图、频数分布2023•新高考□卷,

19(1)

(3)会用统计图表对总体进表

行估计,会求n个数据的第p2024•新高考□卷,

百分位数.4

2022•新高考□卷,

(4)能用数字特征估计总体独立性检验

20(1)

集中趋势和总体离散程度.

(5)了解样本相关系数的统

计含义.

2023•新高考口卷,

(6)理解一元线性回归模型数据的数字特征

9

和2x2列联表,会运用这些方

法解决简单的实际问题.

二:2024高考命题分析

2024年高考新高考口卷未考查统计相关内容,口卷中考查了频数分布表中数据的

数字特征的求法。统计的考查应关注:相关性、频率分布直方图、样本的数字特征、

独立性检验、回归分析等。这些考验的是学生读取数据、分析数据、处理数据的能

力。预计2025年高考还是主要考查频率分布直方图和数据的数字特征,可以多留意方

差的计算方法!

三:试题精讲

一、单选题

1.(2024新高考口卷4)某农业研究部门在面积相等的100块稻田上种植一种新型水

稻,得到各块稻田的亩产量(均在[900,1200)之间,单位:kg)并部分整理下表

亩产[900,[950,[1000,[1100,[1150,

量950)1000)1050)1150)1200)

频数612182410

据表中数据,结论中正确的是()

A.100块稻田亩产量的中位数小于1050kg

B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%

C.100块稻田亩产量的极差介于200kg至300kg之间

D.100块稻田亩产量的平均值介于900kg至1000kg之间

高考真题练

一、多选题

1.(2023新高考口卷-9)有一组样本数据占,…,品,其中巧是最小值,工6是最大值,

贝I()

A.尤2,*3,匕,工5的平均数等于占,*2,…,工6的平均数

B.4,三,4三的中位数等于%的中位数

C.%,三,尤4,三的标准差不小于%,々,…,尤6的标准差

D.3,当,匕,毛的极差不大于占,马,…,%的极差

二、解答题

1.(2022新高考口卷20)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生

习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查

T100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照

组),得到如下数据:

(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?

n(ad-be)。

(a+b)(c+d)(a+c)(b+d)

P(K2>k)0.0500.0100.001

k3.8416.63510.828

2.(2022新高考口卷T9)在某地区进行流行病学调查,随机调查了100位某种疾病患

者的年龄,得到如下的样本数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代

表);

3.(2023新高考口卷T9)某研究小组经过研究发现某种疾病的患病者与未患病者的某

项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率

分布直方图:

^^0林也组距

0.040...........................Cu8

5o6

0.036...........................o.o4

0.034...........................o.

0.012...........

0.010-------------------------------------

CHMtt二:T——指标0.002•・・・•••・।

<^9510()105110115120125130t^7075W85W95100105

也辆名关■族者

利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,

小于或等于C的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,

记为P(C);误诊率是将未患病者判定为阳性的概率,记为式C).假设数据在组内均匀

分布,以事件发生的频率作为相应事件发生的概率.

⑴当漏诊率p(c)=o.5%时,求临界值C和误诊率4(c);

知识点总结

一、分层随机抽样

1、分层随机抽样的概念

一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个

子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合

在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.

2、分层随机抽样的平均数计算

在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为M和

N,抽取的样本量分别为加和",第1层和第2层的样本平均数分别为最,y,样本

_—A/7—N-TYI—n-

平均数位右,则0=------X+------y=——X+——y.我们可以采用样本平均

M+NM+Nm+nm+n

数万估计总体平均数评

二、样本的数字特征

1、众数、中位数、平均数

(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.

(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最

中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.

(3)平均数:〃个样本数据占其,…,%的平均数为1=芯+%+…,反应一组数据

n

的平均水平,公式变形:£.r,.=nx.

4=1

2、标准差和方差

(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示.假设样本

数据是为尤2,…,尤,,工表示这组数据的平均数,则标准差

2

s=J—[(占-X)+(无2-尤)2---1-(Xn-X)"].

Vn

(2)方差:方差就是标准差的平方,即/=—[(X]-x)2+(々-x)2H---F(x—X)2].显

n"n

然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多

采用标准差.

(3)数据特征

标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数

据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度

的大小推算标准差、方差的大小.

三、频率分布直方图

1、频率、频数、样本容量的计算方法

频率

口西施X组距=频率.

匚犀频蔑数量=频率,频箫数=样本容量,样本容量X频率=频数.

口频率分布直方图中各个小方形的面积总和等于1.

2、频率分布直方图中数字特征的计算

(1)最高的小长方形底边中点的横坐标即是众数.

(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为x,利用尤左

(右)侧矩形面积之和等于0.5,即可求出x.

(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积

乘以小长方形底边中点的横坐标之和,即有X=X[P1+X]P1++Xnpn,其中X"为每个小

长方形底边的中点,P“为每个小长方形的面积.

四、百分位数

1、定义

一组数据的第P百分位数是这样一个值,它使得这组数据中至少有P%的数据小于或

等于这个值,且至少有(100-P)%的数据大于或等于这个值.

2、计算一组"个数据的的第。百分位数的步骤

(1)按从小到大排列原始数据.

(2)计算j=p%.

(3)若i不是整数而大于,•的比邻整数人则第p百分位数为第,项数据;若i是整

数,则第2百分位数为第i项与第"1项数据的平均数.

3、四分位数

我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常

用的分位数还有第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后

的数据分成四等份,因此称为四分位数.

五、变量间的相关关系

1、变量之间的相关关系

当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫

相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥

着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础

上,发现其中的规律,对它们的关系作出判断.

注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一

种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可

能是伴随关系.

2、散点图

将样本中的n个数据点(4y)(7=1,2,描在平面直角坐标系中,所得图形叫做散点

图.根据散点图中点的分布可以直观地判断两个变量之间的关系.

(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关

关系,我们将它称为正相关,如图(1)所示;

(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关

关系,我们将它称为负相关,如图(2)所示.

(1)(2)

3、相关系数

若相应于变量%的取值%,变量y的观测值为y(14V”),则变量x与y的相关系数

Z(七一尤Xy-y)2%%一"盯

i=l_i=I通常用r来衡量X与y之间的线

£@<这(》-方瓦厂1瓦「后

1=11=1VZ=1V4=1

性关系的强弱,r的范围为-IWrWl.

(1)当厂>0时,表示两个变量正相关;当「<0时,表示两个变量负相关.

(2)卜|越接近1,表示两个变量的线性相关性越强;M越接近。,表示两个变量间几

乎不存在线性相关关系.当|厂|=1时,所有数据点都在一条直线上.

(3)通常当M>0.75时,认为两个变量具有很强的线性相关关系.

六、线性回归

1、线性回归

线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.

对于一组具有线性相关关系的数据(XI,m),(X2,了2),…,(羽,女),其回归方程

y=bx+a的求法为

n__“__

£(占一x)(y;-y)-nxy

b=-^—^-------------------二号-----------

-尤)2-nx

i=lz=l

a=y-bx

其中,xYx.,y=—,(],y)称为样本点的中心.

2、残差分析

对于预报变量y,通过观测得到的数据称为观测值y,通过回归方程得到的y称为预

测值,观测值减去预测值等于残差,自称为相应于点(尤,,y)的残差,即有自=

残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果

以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.

(1)残差图

通过残差分析,残差点(占,2,)比较均匀地落在水平的带状区域中,说明选用的模型比

较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合

适.

(2)通过残差平方和Q=f(y-B)2分析,如果残差平方和越小,则说明选用的模型

i=l

的拟合效果越好;反之,不合适.

(3)相关指数

反(M-犷

用相关指数来刻画回归的效果,其计算公式是:--------

Z(x-y)2

1=1

心越接近于1,说明残差的平方和越小,也表示回归的效果越好.

七、非线性回归

解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换

元将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程.

求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归

方程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计

算要细心,避免计算错误.

1、建立非线性回归模型的基本步骤:

(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;

(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非

线性关系);

(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用

反比例函数、二次函数、指数函数、对数函数、幕函数模型等);

(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;

(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;

(6)消去新元,得到非线性回归方程;

(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型

是否合适等.

八、独立性检验

1、分类变量和列联表

(1)分类变量:

变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

(2)列联表:

口定义:列出的两个分类变量的频数表称为列联表.

□2x2列联表.

一般地,假设有两个分类变量X和匕它们的取值分别为{占,和{%,为},其样

本频数列联表(称为2x2列联表)为

%总计

不aba+b

cdc+d

总计a+cb+dn=a-\-b+c+d

从2x2列表中,依据」与上的值可直观得出结论:两个变量是否有关系.

a+bc+d

2、等高条形图

(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用

等高条形图表示列联表数据的频率特征.

(2)观察等高条形图发现,与上相差很大,就判断两个分类变量之间有关系.

a+bc+d

3、独立性检验

计算随机变量炉=-----MadTcf—利用/的取值推断分类变量x和y是否独

(Q+b){c+d)(Q+c)(b+d)

立的方法称为X2独立性检验.

0.010.00

a0.100.050.001

05

2.703.846.637.8710.82

%

61598

【统计常用结论】

均数、方差的性质:如果数据%,马,……,居的平均数为"方差为那么

口一组新数据%+4%+反……%+人的平均数为,方差是r.

□一组新数据时,以2,,31的平均数为QX,方差是。2d.

□一组新数据叼+b,ax2+Z?,...,axn+Z?的平均数为+b,方差是〃2s2.

常见的非线性回归模型

(1)指数函数型y=(。>0且awl,c>0)

两边取自然对数,lny=ln(c〃x),即Iny=lnc+xlna,

令卜In’,原方程变为y=inc+/ina,然后按线性回归模型求出Ina,Inc.

[x=x

(2)对数函数型y=blnx+a

令F:二:,原方程变为y'=Z^+a,然后按线性回归模型求出6,a.

x=lnx

(3)募函数型y=ax'

两边取常用对数,Igy=lg®"),BPlgy=n\gx+lga,

令,原方程变为,,=加,+]g〃,然后按线性回归模型求出〃,Iga.

p=lgx

(4)二次函数型丁=法2+〃

令,原方程变为y'=bx'+a,然后按线性回归模型求出6,a.

\x=x

(5)反比例函数型y=a+2型

X

yr=y

令,1,原方程变为V=+然后按线性回归模型求出b,a.

x=­

、x

名校模拟练

一、单选题

1.(2024•河南•三模)已知某学校高三年级甲、乙、丙三个班级人数分别为40,30,

50,学校计划采用按比例分配的分层随机抽样的方法在三个班级中评选优秀学生,已

知乙班分配到的优秀学生名单为6人,则高三年级三个班优秀学生总人数为()

A.16B.30C.24D.18

2.(2024•山东•二模)某校高三共有200人参加体育测试,根据规则,82分以上的考生

成绩等级为A,则估计获得A的考生人数约为()

A.100B.75C.50D.25

3.(2024•浙江绍兴•三模)有一组样本数据:2,3,3,3,4,4,5,5,6,6.则关于

该组数据的下列数字特征中,数值最大的为()

A.第75百分位数B.平均数C.极差D.众数

4.(2024•山西•三模)某次趣味运动会,设置了教师足球射门比赛:教师射门,学生守

门.已知参与射门比赛的教师有60名,进球数的平均值和方差分别是3和13,其中男

教师进球数的平均值和方差分别是4和8,女教师进球数的平均值为2,则女教师进球

数的方差为()

A.15B.16C.17D.18

5.(2024•四川凉山三模)样本数据和马,,毛的平均数了=4,方差s2=i,则样本数

据2占+1,2%+1,L,2%+1的平均数,方差分别为()

A.9,4B.9,2C.4,1D.2,1

6.(2024・四川成都•三模)“数九”从每年“冬至”当天开始计算,每九天为一个单位,

冬至后的第81天,“数九”结束,天气就变得温暖起来.如图,以温江国家基准气

候站为代表记录了2023—2024年从“一九”到“九九”成都市的“平均气温”和“多年平

均气温”(单位:C),下列说法正确的是()

数九寒天气温对比

■■平均气温匚口多年平均气温单位:℃

一九二九三九四九五九六九七九八九九九

A.“四九”以后成都市“平均气温”一直上升

B.“四九”成都市“平均气温”较“多年平均气温”低0.1"C

C.“一九”到“五九”成都市“平均气温”的方差小于“多年平均气温”的方差

D.“一九”到“九九”成都市“平均气温”的极差小于“多年平均气温”的极差

7.(2024•陕西・三模)2024年1月九省联考的数学试卷出现新结构,其中多选题计分标

准如下:口本题共3小题,每小题6分,满分18分;□每道小题的四个选项中有两个

或三个正确选项,全部选对得6分,有选错的得0分;口部分选对得部分分(若某小

题正确选项为两个,漏选一个正确选项得3分;若某小题正确选项为三个,漏选一个

正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的考试中,

小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小

题随机地选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)

的中位数为()

A.9B.10C.11D.12

8.(2024•浙江•三模)在对某校高三学生体质健康状况某个项目的调查中,采用样本量

比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生80人,女生120

人,其方差分别为15,10,由此估计样本的方差不可能为()

A.11B.13C.15D.17

9.(2024•安徽安庆•三模)已知一组数据国,马,•,%的平均数为]o另一组数据

的平均数为了(元片了).若数据网,々,,xm,y{,y2,,%的平均数为

z=ax+(l-a)y,其中;则〃5的大小关系为()

A.m<nB.m>nC.m=nD.加,”的大小关系

不确定

10.(2024・陕西榆林•三模)在一次数学模考中,从甲乙两个班各自抽出10个人的成

绩,甲班的十个人成绩分别为公、々、、税,乙班的十个人成绩分别为.假设

这两组数据中位数相同方差也相同,则把这20个数据合并后()

A.中位数一定不变,方差可能变大

B.中位数可能改变,方差可能变大

C.中位数一定不变,方差可能变小

D.中位数可能改变,方差可能变小

二、多选题

11.(2024・全国•三模)在某次数学测试中,甲、乙两个班的成绩情况如下表:

班级人数平均分方差

甲45881

乙45902

记这两个班的数学成绩的总平均分为"总方差为$2,则()

A.x=88B.x=89C.?=8.6D.52=2.5

12.(2024・广东广州•三模)在某次学科期末检测后,从全部考生中选取100名考生的

成绩(百分制,均为整数)分成[50,60),[60,70),[70,80),[80,90),[90,100)五组

后,得到如下图的频率分布直方图,则()

A.图中。的值为0.005B.低于70分的考生人数约为40人

C.考生成绩的平均分约为73分D.估计考生成绩第80百分位数为83分

13.(2024•河北•三模)根据中国报告大厅对2023年3月〜10月全国太阳能发电量进行

监测统计,太阳能发电量(单位:亿千瓦时)月度数据统计如下表:

月份3456

发电量/亿千瓦时242.94230.87240.59259.33

月份78910

发电量/亿千瓦时258.9269.19246.06244.31

关于2023年3月〜10月全国太阳能发电量,下列四种说法正确的是()

A.中位数是259.115B.极差是38.32

C.第85百分位数是259.33D.第25百分位数是240.59

14.(2024•广东汕头•三模)下图是样本甲与样本乙的频率分布直方图,下列说法判断

正确的是()

A.样本乙的极差一定大于样本甲的极差

B.样本乙的众数一定大于样本甲的众数

C.样本乙的方差一定小于样本甲的方差

D.样本甲的中位数一定小于样本乙的中位数

15.(2024•黑龙江•三模)在某市初三年级举行的一次体育考试中(满分100分),所有考

生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,

甲、乙两班考生的成绩占比如图所示,则下列说法错误的是()

[50,60)[60,70)[70,80)[80,90)[90,100]

一甲班成绩占比■—乙班成绩占比

A.成绩在[70,80)的考生中,甲班人数多于乙班人数

B.甲班成绩在[80,90)内人数最多

C.乙班成绩在[70,80)内人数最多

D.甲班成绩的极差比乙班成绩的极差小

三、解答题

16.(2024•青海海南•二模)某青少年跳水队共有100人,在强化训练前、后,教练组

对他们进行了成绩测试,分别得到如图1所示的强化训练前的频率分布直方图,如图2

所示的强化训练后的频率分布直方图.

图2

⑴根据表中数据,估计强化训练后的平均成绩(同一组中的数据用该组区间的中点值

作代表).

(2)我们规定得分80分以上(含80分)的为“优秀”,低于80分的为“非优秀”.

优秀人数非优秀人数合计

强化训练前

强化训练后

合计

将上面的表格补充完整,并回答能否有99.5%的把握认为跳水运动员是否优秀与强化训

练有关.

附:K2=---------------"(ad-bcf-------^n=a+b+c+d_

(a+Z?)(c+d)(a+c)(b+d)

2

P(K>k0)0.050.0100.0050.001

卜03.8416.6357.87910.828

17.(2024•陕西・模拟预测)某公司新研发了一款智能灯,此灯有拍照搜题功能,学生

遇到疑难问题,通过拍照搜题后,会在显示屏上显示该题的解答过程以及该题考查的

知识点与相应的解题方法该产品投入市场三个月后,公司对部分用户做了调研:抽取

了200位使用者,每人填写一份评分表(满分为100分),现从200份评分表中,随机

抽取40份(其中男女使用者的评分表各20份)

作为样本,经统计得到如下的数据:

女生使用者评分:67,71,72,75,80,83,83,83,84,84,85,86,88,90,

90,91,92,92,92,92

男生使用者评分:67,68,69,69,70,72,72,73,74,75,76,76,77,78,

79,82,84,84,89,92

记该样本的中位数为“,按评分情况将使用.都对该智能灯的态度分为两种类型:评分

不小于M的称为“满意型”,其余的都称为“不满意型”.

⑴求M的值,填写如下2x2列联表

女生评分男生评分合计

“满意型”人数

“不满意型”人数

合计

(2)能否有99%的把握认为满意与性别有关?

n(ad-bc')2

参考公式与数据:K2=

(a+b)(c+d)(o+c)(6+d)

2

P(K>k0)0.10.050.0250.01

左02.7063.8415.0246.635

18.(2024•河南郑州•三模)按照《中华人民共和国环境保护法》的规定,每年生态环

境部都会会同国家发展改革委等部门共同编制《中国生态环境状况公报》,并向社会公

开发布.下表是2017-2021年五年《中国生态环境状况公报》中酸雨区面积约占国土

面积的百分比(%%):

年份2017年2018年2019年2020年2021年

年份代码X,12345

6.45.55.04.83.8

(1)求2017—2021年年份代码士与%的样本相关系数(精确到0.01);

(2)请用样本相关系数说明该组数据中了与x之间的关系可用一元线性回归模型进行描

述,并求出y关于x的经验回归方程;

(3)预测2024年的酸雨区面积占国土面积的百分比.

(回归直线的斜率和截距的最小二乘法估计公式分别为:

,f(无,-丁)(y-歹)/55

J=]

i>=—n-----------------,a=y-bx\xiyj=70.6,£y;=133.69

JT

i=\

附:样本相关系数,「=I/",屈。6.

屈―%%-刃2

V1=1i=l

19.(2024・陕西渭南•三模)某市为提高市民对文明城市创建的认识,举办了“创建文明

城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将100个样本数据按

[30,40),[40,50),[50,60),[60,70),[70,80),[80,90]分成6组,并整理得到如下频

率分布直方图.

(1)请通过频率分布直方图估计这100份样本数据的平均值(同一组中的数据用该组区

间的中点值作代表)和中位数;

(2)该市决定表彰知识竞赛成绩排名前30%的市民,某市民知识竞赛的成绩是78,请估

计该市民能否得到表彰.

20.(2024•江西九江•三模)车胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮

胎胎面磨损.某实验室通过实验测得轿车行驶里程与某品牌轮胎凹槽深度的数据,如下

表所示:

行驶里程力/万km0.00.41.01.62.42.83.44.4

轮胎凹槽深度/i/mm8.07.87.26.25.64.84.44.0

fx也=79.68,大龙:一可2=16.24,、归(七一元八回4一肛"16.56.

1=11=1Vt=iVi=i

(1)求该品牌轮胎凹槽深度〃与行驶里程X的相关系数厂,并判断二者之间是否具有很强

的线性相关性;(结果保留两位有效数字)

(2)根据我国国家标准规定:轿车轮胎凹槽安全深度为1.6mm(当凹槽深度低于L6mm

时刹车距离增大,驾驶风险增加,必须更换新轮胎).某人在保养汽车时将小轿车的轮

胎全部更换成了该品牌的新轮胎,请问在正常行驶情况下,更换新轮胎后继续行驶约

多少公里需对轮胎再次更换?

£(占-可(%-9)

附:变量无与y的样本相关系数7卧F=除f;对于一组数据

(%,X),(%,%),.......,(X",%),其线性回归方程9=液+&的斜率和截距的最小二乘估

。2(西一丁)(y-力_

计分别为:B=--------,a=y-bx.

可2

i=\

21.(2024•内蒙古•三模)现统计了甲12次投篮训练的投篮次数和乙8次投篮训练的投

篮次数,得到如下数据:

甲777377818581778593737781

乙7181737371738573

已知甲12次投篮次数的平均数另=80,乙8次投篮次数的平均数兀=75.

(1)求这20次投篮次数的中位数加,估计甲每次训练投篮次数超过小的概率;

(2)求这20次投篮次数的平均数最与方差52.

22.(2024・甘肃张掖•模拟预测)近年来,马拉松比赛受到广大体育爱好者的喜爱.某地

体育局在五一长假期间举办比赛,志愿者的服务工作是成功举办的重要保障.现抽取了

200名候选者的面试成绩,并分成六组:第一组[40,50),第二组[50,60),第三组

[60,70),第四组[70,80),第五组[80,90),第六组[90,100),绘制成如图所示的频率分

布直方图.

⑴求加;

(2)估计候选者面试成绩的平均数(同一组中的数据用该组区间的中点值为代表);

(3)在抽出的200名候选者的面试成绩中,若规定分数不低于80分的候选者为被录取的

志愿者,已知这200名候选者中男生与女生人数相同,男生中有20人被录取,请补充

2x2列联表,并判断是否有99%的把握认为“候选者是否被录取与性别有关”.

“2n(ad-bc)2_.

附:看=证记师7证团'其中〃

0.050.0100.0050.001

k03.8416.6357.87910.828

23.(2024・湖南邵阳•三模)某市开展“安全随我行”活动,交警部门在某个交通路口增

设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数》与天

数x的情况,对统计得到的样本数据…,10)作了初步处理,得到下面的散

点图及一些统计量的值.

机人)

25-

20-

15-

10-

5-

,,,,♦

0

12345678910x(Q)

101010

XyY

i=l1=1Z=1

5.58.71.930138579.75

_110

表中匕=iny,r.

1Uj=i

(1)依据散点图推断,>与y=e"*哪一个更适合作为未佩戴头盔人数》与天数x

的回归方程类型?(给出判断即可,不必说明理由)

(2)依据(1)的结果和上表中的数据求出y关于龙的回归方程.

(3)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,

得到如下列联表:

性别佩戴头盔合计

不佩戴佩戴

女性81220

男性14620

合计221840

依据夕=0.10的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?

八z%,一屈

n^ad-bc^

参考公式:b=^-------------,a=y-bx,Z2其中

(〃+b)(c+d)(Q+c)(b+d)'

Xx;-rix2

i=\

n=a+b+c+d.

a0.150.100.050.0250.0100.0050.001

Xa2.0722.7063.8415.0246.6357.87910.828

参考答案与详细解析

考情分析

命题解读考向考查统计

1.高考对统计的考查,重点是2022•新高考口卷,

以下考点(1)分层随机抽样19(1)

(2)统计图表频率分布直方图、频数分布2023•新高考口卷,

表19(1)

(3)会用统计图表对总体进

2024•新高考口卷,

行估计,会求n个数据的第p

4

百分位数.

2022•新高考口卷,

(4)能用数字特征估计总体独立性检验

20(1)

集中趋势和总体离散程度.

2023•新高考口卷,

(5)了解样本相关系数的统数据的数字特征

9

计含义.

(6)理解一元线性回归模型

和2x2列联表,会运用这些方

法解决简单的实际问题.

二:2024高考命题分析

2024年高考新高考口卷未考查统计相关内容,口卷中考查了频数分布表中数据的

数字特征的求法。统计的考查应关注:相关性、频率分布直方图、样本的数字特征、

独立性检验、回归分析等。这些考验的是学生读取数据、分析数据、处理数据的能

力。预计2025年高考还是主要考查频率分布直方图和数据的数字特征,可以多留意方

差的计算方法!

三:试题精讲

一、单选题

1.(2024新高考口卷4)某农业研究部门在面积相等的100块稻田上种植一种新型水

稻,得到各块稻田的亩产量(均在[900,1200)之间,单位:kg)并部分整理下表

亩产[900,[950,[1000,[1100,[1150,

量950)1000)1050)1150)1200)

频数612182410

据表中数据,结论中正确的是()

A.100块稻田亩产量的中位数小于1050kg

B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%

C.100块稻田亩产量的极差介于200kg至300kg之间

D.100块稻田亩产量的平均值介于900kg至1000kg之间

【答案】C

【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可

判断B;根据极差计算方法即可判断C;根据平均值计算公式即可判断D.

【详解】对于A,根据频数分布表可知,6+12+18=36<50,

所以亩产量的中位数不小于1050kg,故A错误;

对于B,亩产量不低于1100kg的频数为24+10=34,

所以低于1100kg的稻田占比为10与0-卢34=66%,故B错误;

对于C,稻田亩产量的极差最大为1200-900=300,最小为1150-950=200,故C正

确;

对于D,由频数分布表可得,亩产量在口050,1100)的频数为

100-(6+12+18+24+10)=30,

所以平均值为工x(6x925+12x975+18xl025+30xl075+24xll25+10xll75)=1067,故

100

D错误.

故选;C.

高考真题练

一、多选题

1.(2023新高考口卷9)有一组样本数据尤…,%,其中a是最小值,%是最大值,

贝U()

A.无2,%,了4,%的平均数等于玉,尤2,,",%的平均数

B.9,W,%,尤5的中位数等于工,马,…,天的中位数

C.无2,%,匕,%的标准差不小于%,%,…,毛的标准差

D.工2,尤3,4尤5的极差不大于不,%,…,%的极差

【答案】BD

【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.

【详解】对于选项A:设%2,%3,%4,%5的平均数为加,%1,兀2,…,%6的平均数为,,

Q|.|%]+W+冗3++%5+*6%+*3+*4+毛2(±+4)—(毛+,2+”3+,4)

U~m~64―-12

因为没有确定2(玉+/),毛+%2+毛+尤4的大小关系,所以无法判断人〃的大小,

例如:1,2,3,4,5,6,可得丁=九=3.5;

例如1,1,1,1,1,7,可得机=1,〃=2;

例如L2,2,2,2,2,可得“7=2,”=?;故A错误;

O

对于选项B:不妨设玉V尤2VX3Vx4Vx5Vx6,

可知马,W,尤4,三的中位数等于小程…,%的中位数均为与&,故B正确;

对于选项C:因为玉是最小值,%是最大值,

则超,W,%,%的波动性不大于W,尤2,…,工6的波动性,即4,W,尤4,%的标准差不大于

%,尤2,…'天的差,

例如:2,4,6,8,10,12,则平均数“=9(2+4+6+8+10+12)=7,

6

标准差1=^[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2]=,

4,6,8,10,贝!|平均数〃z=;(4+6+8+10)=7,

标准差S?=^[(4-7)2+(6-7)2+(8-7)2+(10-7)2]=也,

显然巫1>E,即为>$2;故C错误;

3

对于选项D:不妨设为<x2<x3<x4<x5<x6,

则工6-芯之“5-工2,当且仅当%=工2,入5=工6时,等号成故D正确;

故选:BD.

二、解答题

1.(2022新高考口卷20)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生

习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查

了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照

组),得到如下数据:

不够良好良好

病例组4060

对照组1090

(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?

n(ad-bc)2

(4+b)(c+d)(a+c)(b+d)

P(K2>k)0.0500.0100.001

k3.8416.63510.828

【答案】⑴答案见解析

【分析】(1)由所给数据结合公式求出K2的值,将其与临界值比较大小,由此确定是否

有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i)根据定

义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求R.

n(ad-be)2200(40x90-60x10)

【详解】(1)由已知片=

(a+b)(c+d)(a+c)(b+d)50x150x100x100

又尸(K?26.635)=0.01,24>6,635,

所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.

2.(2022新高考口卷T9)在某地区进行流行病学调查,随机调查了100位某种疾病患

者的年龄,得到如下的样本数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代

表);

【答案】⑴47.9岁;

【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;

【详解】(1)平均年龄元=(5x0.001+15x0.002+25x0.012+35x0.017+45x0.023

+55x0.020+65x0.017+75x0.006+85x0.002)x10=47.9(岁).

3.(2023新高考口卷T9)某研究小组经过研究发现某种疾病的患病者与未患病者的某

项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率

分布直方图:

t就率阻距c&0m

0.040...........................^U8

O6

0.036...........................oa.O4■、

0.034..........................

0.012...................

0.010--------------------------------------

—指标0.002j-------------,岫

(^9510()10511015120125130<^707580859095100105

东电磕%

利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,

小于或等于C的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,

记为0(C);误诊率是将未患病者判定为阳性的概率,记为4(c).假设数据在组内均匀

分布,以事件发生的频率作为相应事件发生的概率.

(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率"(c);

【答案】⑴c=97.5,4(c)=3.5%;

【分析】(1)根据题意由第一个图可先求出。,再根据第二个图求出C297.5的矩形面

积即可解出;

【详解】(1)依题可知,左边图形第一个小矩形的面积为5x0.002>0.5%,所以

95<c<100,

所以(c-95)x0.002=0.5%,解得:c=97.5,

q(c)=0.01x(100-97.5)+5x0.002=0.035=3.5%.

知识点总结

一、分层随机抽样

1、分层随机抽样的概念

一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个

子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合

在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.

2、分层随机抽样的平均数计算

在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为〃和

N,抽取的样本量分别为加和九,第1层和第2层的样本平均数分别为I,亍,样本

_———Z77—77—

平均数位①,则0=------X+------y=——x+——y.我们可以采用样本平均

M+NM+Nm+nm+n

数了估计总体平均数”

二、样本的数字特征

1、众数、中位数、平均数

(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.

(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最

中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.

(3)平均数:〃个样本数据占,程…,的平均数为[=*+如+…%,反应一组数据

n

的平均水平,公式变形:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论