2022年全国高考数学真题分类汇编:统计与统计案例(附答案解析)_第1页
2022年全国高考数学真题分类汇编:统计与统计案例(附答案解析)_第2页
2022年全国高考数学真题分类汇编:统计与统计案例(附答案解析)_第3页
2022年全国高考数学真题分类汇编:统计与统计案例(附答案解析)_第4页
2022年全国高考数学真题分类汇编:统计与统计案例(附答案解析)_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2022年全国高考数学真题分类汇编:统计与统计案例

选择题(共2小题)

1.分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:人),得如图茎叶图:

则下列结论中错误的是()

甲乙

615.

85306.3

75327.46

64218.12256666

429.0238

10.1

A.甲同学周课外体育运动时长的样本中位数为7.4

B.乙同学周课外体育运动时长的样本平均数大于8

C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4

D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6

2.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10

位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民

在讲座前和讲座后问卷答题的正确率如图:

则()

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

第1页(共18页)

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

二.解答题(共4小题)

3.在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本

数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表):

(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;

(3)已知该地区这种疾病的患者的患病率为0.1%,该地区年龄位于区间[40,50)的人

口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求

此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位

于该区间的概率,精确到0.0001).

4.甲、乙两城之间的长途客车均由4和8两家公司运营.为了解这两家公司长途客车的运

行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:

准点班次数未准点班次

A24020

B21030

(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;

(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?

2

附:蜉=________n(ad-bc)__________

(a+b)(c+d)(a+c)(b+d)

P0.1000.0500.010

k2.7063.8416.635

5.一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和

第2页(共18页)

不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时

在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:

不够良好良好

病例组4060

对照组1090

(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?

(2)从该地的人群中任选一人,工表示事件“选到的人卫生习惯不够良好”,8表示事件

“选到的人患有该疾病”,P回A)与的比值是卫生习惯不够良好对患该疾病

P(B|A)P(B|A)

风险程度的一项度量指标,记该指标为R.

(i)证明:^P(A|B),P(A|B);

P(A|B)P(A|B)

(ii)利用该调查数据,给出P(川8),P(“甬)的估计值,并利用(i)的结果给出及

的估计值.

附.蜉=________n(ad-bc)2________

(a+b)(c+d)(a+c)(b+d)

P(烂》“)0.0500.0100.001

k3.8416.63510.828

6.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材

积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:机2)和材积量(单

位:,/),得到如下数据:

样本号i12345678910总和

根部横截面积为0.040.060.040.080.080.050.050.070.070.060.6

材积量E0.250.400.220.540.510.340.360.460.420.403.9

101010

并计算得二为2=0.038,£〃2=]6158,£加州=0.2474.

i=li=li=l

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量:

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面

积总和为186层.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出

第3页(共18页)

该林区这种树木的总材积量的估计值.

n__

Y.(x「x)(了「丫)

附:相关系数I-]

22,V1.896^1377.

旧(Xi-x)E(Yi-?)

Vi=li=l

第4页(共18页)

2022年全国高考数学真题分类汇编:统计与统计案例

参考答案与试题解析

一.选择题(共2小题)

1.分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:〃),得如图茎叶图:

则下列结论中错误的是()

甲乙

615.

85306.3

75327.46

64218.12256666

429.0238

10.1

A.甲同学周课外体育运动时长的样本中位数为7.4

B.乙同学周课外体育运动时长的样本平均数大于8

C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4

D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6

【解答】解:由茎叶图可知,甲同学周课外体育运动时长的样本中位数为工■售至=7.4,

选项/说法正确;

由茎叶图可知,乙同学周课外体育运动时长的样本平均数大于8,选项8说法正确;

甲同学周课外体育运动时长大于8的概率的估计值为&且<0中选项C说法错误;

乙同学周课外体育运动时长大于8的概率的估计值为」3=o8125>06,选项。说法

16''

正确.

故选:C.

2.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10

位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民

在讲座前和讲座后问卷答题的正确率如图:

第5页(共18页)

则()

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

【解答】解:对于4讲座前问卷答题的正确率从小到大为:

60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,

讲座前问卷答题的正确率的中位数为:(70%+75%)/2=72.5%,故/错误;

对于8,讲座后问卷答题的正确率的平均数为:

-L(80%+85%+85%+85%+85%+90%+90%+95%+100%+100%)=89.5%>85%,故8正

10

确:

对于C,由图形知讲座前问卷答题的正确率相对分散,讲座后问卷答题的正确率相对集

中,

••・讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C错误;

对于。,讲座后问卷答题的正确率的极差为:100%-80%=20%,

讲座前正确率的极差为:95%-60%=35%,

讲座后问卷答题的正确率的极差小于讲座前正确率的极差,故。错误.

故选:B.

二.解答题(共4小题)

第6页(共18页)

3.在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本

数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);

(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;

(3)已知该地区这种疾病的患者的患病率为0.1%,该地区年龄位于区间[40,50)的人

口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求

此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位

于该区间的概率,精确到0.0001).

【解答】解:(1)由频率分布直方图得该地区这种疾病患者的平均年龄为:

5X0.001X10+15X0.002X10+25X0.012X10+35X0.017X10+45X0.023X10+55X

0.020X10+65X0.017X10+75X0.006X10+85X0.002X10=47.9岁.

(2)该地区一位这种疾病患者的年龄位于区间[20,70)的频率为:

(0.012+0.017+0.023+0.020+0.017)X10=0.89,

.•.估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率为0.89.

(3)设从该地区中任选一人,此人的年龄位于区间[40,50)为事件8,此人患这种疾病

为事件C,

则尸(C|5)=P(BC)=61%xS023X1°=0,0014.

P(B)16%

4.甲、乙两城之间的长途客车均由4和8两家公司运营.为了解这两家公司长途客车的运

行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:

准点班次数未准点班次

A24020

B21030

第7页(共18页)

(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;

(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?

附:<2=________n(ad-bc)2_______

(a+b)(c+d)(a+c)(b+d)

P(烂》在)0.1000.0500.010

k2.7063.8416.635

【解答】解:(1)《公司一共调查了260辆车,其中有240辆准点,故/公司准点的概

率为"I』;

26013

8公司一共调查了240辆车,其中有210辆准点,故8公司准点的概率为纯上;

2408

(2)由题设数据可知,准点班次数共450辆,未准点班次数共50辆,N公司共260辆,

8公司共240辆,

2

.2=5OOX(240X30-210X20)〉

260X240X450X50

.♦.有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.

5.一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和

不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时

在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:

不够良好良好

病例组4060

对照组1090

(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?

(2)从该地的人群中任选一人,力表示事件“选到的人卫生习惯不够良好”,8表示事件

“选到的人患有该疾病”,「(工以)与「@/)的比值是卫生习惯不够良好对患该疾病

P(B|A)P(B|A)

风险程度的一项度量指标,记该指标为凡

(i)证明:^P(A|B).P(A|B);

P(A|B)P(A|B)

(ii)利用该调查数据,给出P(/但),P(工后)的估计值,并利用(i)的结果给出农

的估计值.

2

附:蜉=________n(ad-bc)__________

(a+b)(c+d)(a+c)(b+d)

第8页(共18页)

P(蜉/左)0.0500.0100.001

k3.8416.63510.828

【解答】解:(1)补充列联表为:

不够良好良好合计

病例组4060100

对照组1090100

合计50150200

计算片=%22£处1丝飒1=24>6.635,

100X100X50X150

所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.

_____P(AB)P(亚)

(2)(/)证明:ff=P(B|A);P(2ia)=P(ElA).P(E|g)=_LS2F®

P(B|A)P(B|A)P(B|A)P(B|A)P(AE)P(AB)

_P(A)P(A)

—P(AB)P垣)____

=P(竺)中垣)_%)一P(豆=P(£B)rP(A|B).

P(AB)-P(AB)P([B)P(@)p(:B)*(A而'

P(B)P(B)

(ii)利用调查数据,P(/伊)=/2_=2,p(A后)=」^-=工,P(为8)=1-P

100510010

(A\B)=3,P(^B)=1-P(Z|E)=—>

510

2__9_

所以H=1。-=6.

~5元

6.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计--林区某种树木的总材

积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:加2)和材积量(单

位:,/),得到如下数据:

样本号i12345678910总和

根部横截面积H0.040.060.040.080.080.050.050.070.070.060.6

材积量M0.250.400.220.540.510.340.360.460.420.403.9

101010

并计算得工X,-2=0.038,三%2=].6158,£=0.2474.

i=li=li=l

第9页(共18页)

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面

积总和为186〃?2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出

该林区这种树木的总材积量的估计值.

n__

X(x「x)(y「y)

附:相关系数,=I尸1,V1.896^1.377.

22

旧(Xi-X)E(yr?)

Vi=li=l

【解答】解:(1)设这种树木平均一棵的根部横截面积为7,平均一棵的材积量为7,

则根据题中数据得:7=&_殳=0.06机2,行=&a=0.39〃?3;

1010

10__

Z(x「x)(Vj-y)

(2)由题可知,r—।jg|Q'——

JE(X「X)2£(y「y)2

Vi=li=l

10_

£xiyi-nxy

■-二0.0134=0.0*=

[JP2-2、Y2-2、Vo.002X0.0948O.OlxVl.896

J(XXj-nx)(LVi-ny)

Vi=li=l

◎PL3Gsos;

0.01377_

⑶设总根部面积和X,总材积量为匕则区2,故丫=2^x186=1209(小3).

Yy0.06

第10页(共18页)

考点卡片

1.频率分布直方图

【知识点的认识】

1.频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,

将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频

率分布直方图.

频率/川距

(1.5»

0.40

0.30

0.20

<).10

0.511$22S333JJ6

月平均用水量/1

2.频率分布直方图的特征

①图中各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1.

②从频率分布直方图可以清楚地看出数据分布的总体趋势.

③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信

息被抹掉.

3.频率分布直方图求数据

①众数:频率分布直方图中最高矩形的底边中点的横坐标.

②平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和.

③中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.

【解题方法点拨】

绘制频率分布直方图的步骤:

第11页(共18页)

2.茎叶图

【知识点的认识】

1.茎叶图:将样本数据有条理地列出来,从中观察样本分布情况的图称为茎叶图.

例:某篮球运动员在某赛季各场比赛的得分情况:12,15,24,25,31,31,36,36,

37,39,44,49,50

得分表示成茎叶图如下:

茎叶

125

245

3116679

44

50

2.茎叶图的优缺点:

优点:

(1)所有信息都可以从茎叶图上得到

(2)茎叶图便于记录和表示

缺点:

分析粗略,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.

第12页(共18页)

【解题方法点拨】

茎叶图的制作步骤:

(1)将每个数据分为“茎”(高位)和“叶”(低位)两部分

(2)将最小的茎和最大的茎之间的数按小大次序排成一列

(3)将各个数据的叶按大小次序写在茎右(左)侧

第1步中,

①如果是两位数字,则茎为十位上的数字,叶为个位上的数字,如89,茎:8,叶:9.

②如果是三位数字,则茎为百位上的数字,叶为十位和个位上的数字,如123,茎:1,叶:

23.

对于重复出现的数据要重复记录,不能遗漏,同一数据出现几次,就要在图中体现几次.

3.众数、中位数、平均数

【知识点的认识】

1.众数、中位数、平均数

众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,

其中以平均数的应用最为广泛.

(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;

(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个

数据的平均数)叫做这组数据的中位数;

(3)平均数:一组数据的算术平均数,即;』(xi+x0+…+x)-

n'12n

2.众数、中位数、平均数的优缺点

特征数优点缺点

众数体现了样本数据的最大只能表达样本数据中的很少一部分

集中点信息无法客观反映总体特征

中位数不受少数极端值的影响不受少数极端值的影响

平均数与每一个数据有关,更受少数极端值的影响较大,使其在

能反映全体的信息.估计总体时的可靠性降低.

【解题方法点拨】

众数、中位数、平均数的选取:

(1)平均数能较好地反映一组数据的总体情况;

(2)中位数不受极端值影响,有时用它代表全体数据的中等水平(或一般水平);

(3)众数能反映一组数据的集中情况(即多数水平).

第13页(共18页)

根据频率分布直方图估算众数、中位数、平均数:

(1)众数:在频率分布直方图中,最高矩形的中点的横坐标就是众数.

月平均用水量/I

(2)中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中

位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以

估计中位数的值.

(3)平均数:是频率分布直方图的“重心”,是直方图的平衡点.平均数等于频率分布直方

图中每个小矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之

和.

4.极差、方差与标准差

【概念】

用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极

差.一组数据中各数据与平均数差的平方和的平均数叫做方差.方差的算术平方根就为标准

差.方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.

【例题解析】

例:求数据98,100,101,102,99的极差,方差,标准差.

解:极差是:102-98=4;

平均数7=工(98+100+101+102+99)=100,

5

则方差是:$2=±[(98-100)2+(100-100)2+(101-100)2+(102-100)2+(99-100)

5

2]=2;

标准差$=&.

可以看出这类题考查的基本上是对概念的理解,根据概念去解题就可以了.

【考点分析】

这个考点很重要,也很容易,所以大家都应该好好的看看概念,理解方差的含义和怎

第14页(共18页)

么求就可以了.

5.线性回归方程

【概念】

线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关

系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可

分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,

且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析

中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归

分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关

关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类

型为线性函数.

【实例解析】

例:对于线性回归方程y=i.5x+45,Xie(1.7,5,13,19]-则丫=

解:[=1+7+5+13+19当因为回归直线必过样本中心(彳,y),

5

所以亍=1.5X9+45=13.5+45=58」.

故答案为:58.5.

方法就是根据线性回归直线必过样本中心(7,y),求出7,代入即可求这里面可以

看出线性规划这类题解题方法比较套路化,需要熟记公式.

【考点点评】

这类题记住公式就可以了,也是高考中一个比较重要的点.

6.独立性检验

【知识点的知识】

1、分类变量:

如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

2、原理:假设性检验(类似反证法原理).

一般情况下:假设分类变量x和丫之间没有关系,通过计算依值,然后查表对照相应的概

率尸,发现这种假设正确的概率尸很小,从而推翻假设,最后得出x和y之间有关系的可

能性为(i-尸),也就是“x和丫有关系表中的%就是好的观测值,即―蜉).

第15页(共18页)

叱2n3-bc)2

A=-------------------------------

(a+b)(c+d)(a+c)(b+d)其中n=a+h+c+d(考试给出)

5、解题步骤:

(1)认真读题,取出相关数据,作出2X2列联表;

(2)根据2X2列联表中的数据,计算K2的观测值k;

(3)通过观测值人与临界值如比较,得出事件有关的可能性大小.

7.条件概率与独立事件

【知识点的知识】

1、条件概率的定义:对于任何两个事件”和8,在已知事件4发生的条件下,事件5发生

的概率叫做条件概率,用符号尸(80)来表示.

(2)条件概率公式:称为事件4与8的交(或积).

(3)条件概率的求法:

①利用条件概率公式,分别求出尸CA)和P(AQB),得尸(用4)=F泮[?其中尸

(A)>0;

②借助古典概型概率公式,先求出事件/包含的基本事件数〃(4),再在事件“发生的条

件下求出事件8包含的基本事件数,即N(JAS),得P(8|/)=n(A「B)

n(A)

【解题方法点拨】

典例1:利用计算机产生1到6之间取整数值的随机数。和人在a+b为偶数的条件下,

-b|>2发生的概率是

9

解:由题意得,利用计算机产生1到6之间取整数值的随机数a和b,基本事件的总个数是

第16页(共18页)

6X6=36,即(a,h)的情况有36种,

事件ua+b为偶数”包含基本事件:

(1,1),(1,3),(1,5),(2,2),(2,4),(2,6),

(3,1),(3,3),(3,5),(4,2),(4,4),(4,6)

(5,1),(5,3),(5,5),(6,2),(6,4),(6,6)共18个,

“在为偶数的条件下,\a-b\>2"包含基本事件:

(1,5),(2,6),(5,1),(6,2)共4个,

4

故在a+b为偶数的条件下,-切>2发生的概率是2=坐-=2

189

36

故答案为:2

典例2:甲乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人

一道必答题,答对则为本队得1分,答错不答都得0分,已知甲队3人每人答对的概率分别

为1,X,乙队每人答对的概率都是2.设每人回答正确与否相互之间没有影响,用s

432

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论