第九章 统计与成对数据的统计分析(测试)解析版-2025年高考数学一轮复习_第1页
第九章 统计与成对数据的统计分析(测试)解析版-2025年高考数学一轮复习_第2页
第九章 统计与成对数据的统计分析(测试)解析版-2025年高考数学一轮复习_第3页
第九章 统计与成对数据的统计分析(测试)解析版-2025年高考数学一轮复习_第4页
第九章 统计与成对数据的统计分析(测试)解析版-2025年高考数学一轮复习_第5页
已阅读5页,还剩10页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章统计与成对数据的统计分析(测试)

(考试时间:120分钟试卷满分:150分)

注意事项:

1.答卷前,考生务必将自己的姓名、准考证号填写在答题卡上。

2.回答选择题时,选出每小题答案后,用铅笔把答题卡对应题目的答案标号涂黑。如需改动,用橡皮

擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无效。

3.考试结束后,将本试卷和答题卡一并交回。

第一部分(选择题共58分)

一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要

求的。

1.已知一组数据:3,5,7,x,9的平均数为6,则该组数据的40%分位数为()

A.4.5B.5C.5.5D.6

【答案】C

【解析】依题意,3+5+;+X+9=6,解得X=6,

将数据从小到大排列可得:3,5,6,7,9,

又5x04=2,则40%分位数为甘=5.5.

故选:C.

2.法国当地时间2024年7月26日晚,第三十三届夏季奥林匹克运动会在巴黎举行开幕式.“奥林匹克之父”

顾拜旦曾经说过,奥运会最重要的不是胜利,而是参与;对人生而言,重要的不是凯旋,而是拼搏.为弘扬

奥运精神,某学校组织高一年级学生进行奥运专题的答题活动.为了调查男生和女生对奥运会的关注程度,

在高一年级随机抽取10名男生和10名女生的竞赛成绩(满分100分),按从低到高的顺序排列,得到下

表中的样本数据:

男生82858687889090929496

女生82848587878788889092

则下列说法错误的是()

A.男生样本数据的25%分位数是86

B.男生样本数据的中位数小于男生样本数据的众数

C.女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变

D.女生样本数据中去掉一个最高分和一个最低分后所得数据的方差不变

【答案】D

【解析】对于A:10x25%=2.5,所以男生样本数据的25%分位数是86,故A正确;

对于B:男生样本数据的中位数为上寸=89,男生样本数据的众数为90,故B正确;

对于C:女生样本数据的平均数为&(82+84+85+87x3+88x2+90+92)=87,

女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数为:(84+85+87x3+88x2+90)=87,故

O

C正确;

对于D:女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变,

但是极差变小,所以方差变小,故D错误.

故选:D

3.已知一组数据丢失了其中一个,另外六个数据分别是8,8,8,10,11,16,若这组数据的平均数、中

位数、众数依次成等差数列,则丢失数据的所有可能值的和为()

A.12B.20C.25D.27

【答案】D

【解析】这7个数据的众数是8,设丢失的数据是x,

ri十①.、r犬+8+8+8+10+11+16x+61

则平均数为-------------------

7

若x<8,则中位数是8,则苫@+8=8x2,解得x=-5.

AlAQ

若x=8,则中位数是8,平均数号r”==,

77

69

此时亍,8,8不成等差数列,不符合题意.

若8<x<10,则中位数是x,则三@+8=2x,解得x=9.

若元=10,则中位数是10,则与旦=?,

77

71

7,10,8不成等差数列,不符合题意.

若x>10,则中位数是10,则三生+8=10x2,解得x=23.

所以丢失数据的所有可能值的和为-5+9+23=27.

故选:D

4.“绿水青山就是金山银山”的理念深入人心,人民群众的生态环境获得感、幸福感、安全感不断提升.某校

高一年级举行环保知识竞赛,共500人参加,若参赛学生成绩的第60百分位数是80分,则关于竞赛成绩

不小于80分的人数的说法正确的是()

A.至少为300人B.至少为200人

C.至多为300人D.至多为200人

【答案】D

【解析】由题意,500x60%=300,因此竞赛成绩不小于80分的人数至多有500-300=200人,

故选:D.

5.为了解某校今年准备报考飞行员的学生的体重情况,对所得的体重数据(单位:kg)进行分组,区间为

[50,55),[55,60),[60,65),[65,70),[70,75],将其按从左到右的顺序分别编号为第一组,第二组,……,第五

组.画出频率分布直方图(如图所示),已知第一组,第二组和第三组的频率之比为1:2:3,且第一组的频

【答案】A

【解析】由题前三组频率之和为1-(0Q13+0.037)x5=0.75,

又第一组、第二组和第三组的频率之比为1:2:3,

所以第一组的频率为0.75XTF=0.125,又第一组的频数为6,

1+2+3

所以报考飞行员的学生人数为a=48人.

故选:A.

6.已知数据王,々,…,&(玉£Z,,5)的平均数、中位数、方差均为4,则这组数据的极差为

()

A.3B.4C.5D.6

【答案】D

【解析】根据题意,不妨设玉<%2<%3<%4<毛,且看£Z,可得%3=4,

由平均数为4,得/+々+内+%+%)=4

即%+/+毛+%4+%5=20;

由方差为4,得《[(玉―4)+(々—4)+(x3—4)+(/_4)+(/—4)]=4,即x;+工;=100;

%+%+$+%4+%5=20

联立由七6Z可解得玉=1,%2=3,%4=5,/=7;

%;+%2+后+X:+片=100

根据极差定义可得这组数据的极差为-石=6.

故选:D

20242024

7.已知实数天,占,...,9024,则使£卜-%|和最小的实数上分别为不,无1,…,尤2024的()

i=0z=0

A.平均数;平均数B.平均数;中位数

C.中位数;平均数D.标准差;平均数

【答案】C

2024

【解析】£|斗・一无|=|%0-々|+。一人|+|%2024-H+…+|%2024-4,表示2025个绝对值之和,

/=0

根据绝对值的几何意义知,绝对值的和的最小值表示距离和的最小值,

2024

因为2025为奇数,所以上取吃,石,…,々024的中位数时,ZR—4有最小值;

z=0

20242024

=£(片—2kxi+左2)=(X;+x;+%;+,1+,^2024)—(2%+2%]+2/++2%2024)%+2025k?为关k的

z=0z=0

一元二次函数,

故当左=X0+X]+土磔时,言仁-左)2有最小值,

2023z=o

2024

即左为不,为,…,尤2024的平均数时,E(x「k)2有最小值.

z=0

故选:c

8.某校积极开展“戏曲进校园”活动,为了解该校各班参加戏曲兴趣小组的人数,从全校随机抽取5个班级,

把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本标准差为2,且样本数据互不相等,

则该样本数据的极差为()

A.3B.4C.5D.6

【答案】D

【解析】不妨设该五个班级的样本数据分别为a,b,c,d,e(a<b<c<d<e),且a,6,c,d,e©N*,

a+b+c+d+e

-------------------=7

5

(7-a)2+(7-Z?)2+(7-c)2+(7-rf)2+(7-e)2一;

5—

化简得a+b+c+d+e=35,(a-7)2+(6-7)2+(c-7)2+(d-7)2+(e-7)2=20,

易知e2d+12c+2NZ?+3Na+4nQ+b+c+d+e45e-10=>e29,

又易知五个数据减7的平方数为整数,7/-7,。-7,d-7,e-7五个数的绝对值不超过4,

2222

当e=ll时,(a-7)+(/,-7)+(c-7)+(^-7)=4,由数据为整数且均不相同得不成立,

当e=10时,(a-7『+("7)2+(c-7『+("-7)2=11,由数据为整数且均不相同得该四个平方数只能为

0,1,1,9,则a=4,6=6,c=7,d=8,符合题意,此时极差为6;

当e=9时,(a-7)2+(&-7)2+(c-7)2+(J-7)2=16,由数据为整数且均不相同得不成立;

综上,五组数据的极差为6.

故选:D

二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部

选对的得6分,部分选对的得部分分,有选错的得0分.

9.某公司计划组织秋游活动,定制了一套文化衫,女职工需要不同尺码文化衫的频数如图.

A.文化衫尺码的众数为187B.文化衫尺码的平均数为165

C.文化衫尺码的方差为28D.文化衫尺码的中位数为165

【答案】BD

【解析】由题图知,众数为165,故A错误;

总数为34+59+187+85+21=386,

平均数为^-x(155x34+160x59+165xl87+170x85+175x21)=165,故B正确;

386

方差为七x(l()2x34+5?X59+()2X187+52X85+102X21)«23.58,故C错误;

中位数为165,故D正确.

故选:BD

10.已知一组数据再,%,的平均数为元,另一组数据力为…,%的平均数为9.若数据

与声,…,xm,%,%的平均数为彳,则()

A.当机=几时,z=B.当z=—上时,m=n

———九+v_

C.当元=y时,z=wD.当三〉元时,y>x

【答案】ACD

【解析]当山=〃时,z^-^—x+^—y^x+\y^^-^,A正确;

当彳=苫上时,取士=无2==x,”=0,»=%==%=。,则m与W不一定相等,B错误;

___m_n_m_n_m+n__x+y_十小

当无=y时,z=------x+--------y=--------x+-----x=--------x=x=-------,C正确;

m+nm+nm+nm+nm+n2

当z>%时,2=----x+-----y>x,有------1%+-----y>0,故-----y------%>0

m+nm+n\m+nJm+nm+nm+n

即一-X=—^-(y-x)>o,所以y>三,D正确.

m+nm+nm+n

故选:ACD.

11.北京时间2024年8月12日凌晨,第33届法国巴黎奥运会闭幕式正式举行,中国体育代表团以出色的

表现再次证明了自己的实力,最终取得了40枚金牌、27枚银牌和24枚铜牌的最佳境外参赛成绩,也向世

界展示了中国体育的蓬勃发展和运动员们顽强拼搏的精神.某校社团为发扬奥运体育精神举办了竞技比赛,

此比赛共有5名同学参加,赛后经数据统计得到该5名同学在此次比赛中所得成绩的平均数为8,方差为4,

比赛成绩xe[0,15],且xeN*,则该5名同学中比赛成绩的最高分可能为()

A.13B.12C.11D.10

【答案】BC

【解析】设该5名同学在此次比赛中所得成绩分别为耳,x2,x3,乙,与,

由题得钎/+々+七+匕+内)=8,

贝lj%+/+玉+x4+/=40,

且[(%—8)+(々—8)+(£—8)+(X4-8)+(毛—8)]="

则(玉—8)+(9—8)+(%3-8)+(%4-8)+(%—8)=20,

不妨设毛最大,

对于A选项,若毛=13,则(石―8)+(x2—8)+(x3—8)+(x4—8)=—5不成立,故A错误;

对于B选项,若%5=12,则(——8)+(x2—8)+(巧-8)+(x4—8)=4,

则满足题意,例如5位同学的成绩可为7,7,7,7,12,故B正确;

对于C选项,若冗5=11,则(%一8)+(%-8)+(毛—8)+(x4—8)=11,

则满足题意,例如5位同学的成绩可为5,7,8,9,11,故C正确;

对于D选项,若毛=10,则石+/+*3+Z=30且(%,—8)+(々—8)+(£—8)+(%—8)=16,

则,+%;+君+%4—16(氏+々+W+%)+4x82=16,

—k+—16(%+%2+退+/)—4x8^+16—16x30—4x8~+16—240,

(x,+/+及+%=30

则可得2222八,该方程组无正整数解,故D错误.

[芯+%2+毛+%4—240

故选:BC.

第二部分(非选择题共92分)

三、填空题:本题共3小题,每小题5分,共15分。

12.现利用随机数表发从编号为00。,02,,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表

第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为

952260004984012866175168396820274377236627096623

925808564389099006482834597418582977814964608925

【答案】18

【解析】依次选出的编号为:01,17,09,08,06,18

则选出来的第6支水笔的编号为18,

故答案为:18.

13.某公司对来应聘的人进行笔试,统计出200名应聘者的笔试成绩,整理得到下表:

组号123456

成绩分组[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]

累积频率0.050.15aa+0.302a+0.102a+0.30

注:第〃组的累积频率指的是前〃组的频率之和.

若公司计划150人进入面试,则估计参加面试的最低分数线为.

【答案】65

【解析】由各组累积频率为1得,2a+Q3=l,则a=0.35.

又由||^=0.75知,面试的最低分数线为笔试成绩从低到高排列的第25百分位数机,

由题表知,笔试成绩分别在[40,60)与[40,70)的累积频率分别为Q15,0.35,

,,m-600.25-0.15

T/T______________________________

70-60-0.35-0.15'

解得m=65f

从而可估计参加面试的最低分数线为65.

故答案为:65

14.已知一组统计数据%,%,,%的平均数为"方差为S2,则函数了(尤)=£(尤-X)的最小值为.

Z=1

【答案】ns2

【解析】由元=怜王,得$2=转—:停—唔%+清恪片

则汽%2="1+无2),

Z=1

n〃〃n

X2nxl222

故fM=Z(x一i)=-2x^jXi+Z%;=~2加,X+=n(x-x)+ns>ns,当且仅当天=7时等

<=1Z=1Z=14=1

号成立.所以函数"x)=t(X-X,)2的最小值为我2.

1=1

故答案为:ns2

四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步聚。

15.(13分)

为了了解某中学学生的身高情况,随机对该校男生、女生的身高进行抽样调查,已知抽取的样本中,

男生、女生的人数相同,根据所得数据绘制成如图所示的统计图表.

身高

别(cm)

Ax<150

B150<x<

C155<x<

L160<x<

Ex>165

女生身高情况扇形统计图

(1)在样本中,男生身高的中位数落在_______组(填组别序号),女生身高在2组的有_________人;

(2)在样本中,身高在150Vx<155之间的共有________人,身高人数最多的在________组(填组别序号);

(3)已知该校共有男生500人,女生480人,请估计身高在155Vx<165之间的学生约有多少人?

【解析】(1)•••在样本中,共有男生2+4+8+12+14=40(人),

中位数是第20和第21人的平均数,.•.男生身高的中位数落在。组,

女生身高在8组的有40x(1-30%-20%-15%-5%)=12(人).(4分)

(2)在样本中,身高在150Wx<155之间的共有4+12=16(人),身高人数最多的在C组.

(3)由于500x---------------------+480x(30%+15%)=541(人),(9分)

2+4+8+12+14

故估计身高在155vx<165之间的学生约有541人.(13分)

16.(15分)

某公司为了了解顾客对其旗下产品的满意程度,随机抽取〃名顾客进行满意度问卷调查,按所得评分

(满分10。分)从低到高将满意度分为四个等级:

调查评[70,%0,90)

[40,50)[50,60)[60,70)[90,100]

满意度良满

不满意一般

等级好

并绘制如图所示的频率分布直方图.已知调查评分在[70,80)的顾客为80人.

(1)求n的值及频率分布直方图中f的值;

(2)若某段时间有10000名顾客购买该公司的产品,请估计这10000名顾客中对该公司产品满意度达到

“满意”的人数;

(3)该公司设定的预案是:以抽取的样本作为参考,若顾客满意度评分的均值低于80分,则需要对该公

司旗下产品进行调整,否则不需要调整、根据你所学的统计知识,判断该公司是否需要对旗下产品进行调

整,并说明理由.(每组数据以区间的中点值代替)

【解析】(1)0.02xl0〃=80,10z+0.06+0.1+0.2+60r+90r=l,

所以〃=400,z=0.004:(5分)

(2)6r=6x0.004=0.024,

估计的人数为10000*0.024x10=10000*0.24=2400人;(10分)

(3)由频率分布直方图得,顾客满意度评分的均值为:

45x0.04+55x0.06+65x0.1+75x0.2+85x9x0.04+95x0.24=80,

由题意知不需要对该公司旗下产品进行调整.(15分)

17.(15分)

为进一步推动防范电信网络诈骗工作,预防和减少电信网络诈骗案件的发生,某市开展防骗知识大宣

传活动.举办了“网络防骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,

成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]得到如图所示的频率分布直方图.

频率

(1)求图中a的值,根据频率分布直方图计算样本成绩的平均数和下四分位数;

(2)已知若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:机,

x,s;;",y,s;,记总的样本平均数为了,样本方差为d.

证明:S2=---

m+n

(3)已知落在[50,60)的平均成绩是59,方差是7,落在[60,70)的平均成绩为65,方差是4,求两组样本

成绩的总平均数三和总方差52.

【解析】(1)由题意可知,(0.005+0.。1。+0.。2。+。+0.。25+。.。1。)?1。1,

解得:a—0.030;

(45x0.005+55x0.01+65x0.02+75x0.03+85x0.025+95x0.01)x10=74,

前2组的频率和为(0.005+0.010)x10=0.15,

前3组的频率和为0.15+0.02x10=0.35,

所以下四分位数在第3组,设为x,

贝1J0.15+(x-60)x0.02=0.25,得元=65

所以下四分位数为65;(4分)

/一、—rrix+nym_n_

(2)co=---------=-------x+-------y,

m+nm+nm+n

s;=机£(%-可~,s;=〃£(%一9;

mi=lrii=\

1

总体方差/9=——一向+才(%-而)-

m+n_i=li=l

又七tn(&-寸=m元)+(元-初.,

1=1Z=1

=,[(七—*)2+2(元一句(七一元)+(元_5)[,

mmm

=z(x,-可2+2伍一向£(占一可+£(元一⑹2,

i=lz=li=l

mmm

因为Z(七一元)==mx-nix=0,

Z=1Z=14=1

tnmmm

-昉2a-元y+2(元-句f(%-可+£(元-砌2,

f=l,=14=1Z=1

=ms;+m(x-6?)2=m\s;+(无一行『

同理|x》,「必)2=”[s;+(y_^)],

故/=----%一而)?+£(%「勿y,

m+ni=\

1

[s;+(元一句]+〃[s;+(y一句2]};(12分)

m+n

(3)[50,60)的频率是0.010x10=0.1,频数是Qlxl00=10,[60,70)的频率是0.020x10=0.2,频数是

0.2x100=20

所以总体平均数三二m£义59+m£><65=63,

总体方差1=——同7+(59-63月+20[4+(65-63)[}=13.(15分)

10I2(31J

18.(17分)

机器模型预测常常用于只有正确与错误两种结果的问题.表1为根据模型预测结果与真实情况的差距的

情形表格,定义真正例率R=V^,假正例率。2.概率阈值为自行设定的用于判别正(反)例的值,

若分类器(分类模型)对该样例的预测正例概率大于等于设定的概率阈值,则记分类器预测为正例,反之预测

为反例.

预测结果

总例

正例反例

真正假反

31

例例为例«2

£假正真反

例例名例%

表1分类结果样例划分

利用这些指标绘制出的ROC曲线可衡量模型的评价效果:将各样例的预测正例概率与1,0从大到小排

序并依次作为概率阈值,分别计算相应概率阈值下的B与P2.以外为横坐标,B为纵坐标,得到标记点.依

次连接各标记点得到的折线就是ROC曲线.图1为甲分类器对于8个样例的ROC曲线,表2为甲,乙分类

器对于相同8个样例的预测数据.

甲乙

样例数分分

据类类

器器

未木预预

例例测正测正

有尼例例

性概率概率

10.0.

1

例2334

10.0.

2

例5853

0.0.

3

例1513

£0.0.

4

例6239

Z0.0.

5

例4787

0.0.

6

例4753

0.0.

7

例3311

10.0.

8

例7763

表2甲,乙分类器对于相同8个样例的预测数据

甲分类器的ROC曲也乙分类器的ROC曲线

o0.5IJ

般正例率

图1甲分类制的ROC曲线图2乙分类器的ROC曲线

(1)当概率阈值为0.47时,求甲分类器的ROC曲线中的对应点;

(2)在图2中绘制乙分类器对应的ROC曲线(无需说明绘图过程),并直接写出甲,乙两分类器的ROC

曲线与x轴,直线x=l所围封闭图形的面积;

(3)按照上述思路,比较甲,乙两分类器的预测效果,并直接写出理想分类器的ROC曲线与x轴,直线

x=l所围封闭图形的面积为1的充要条件.

【解析】(1)概率阈值为047时,

真正例为2,5,8,假反例为1,假正例为4,6,真反例为3,7,

贝I]%=3,%=1,%=2,%=2.

2_1433

所以横坐标―右纵坐标Pi=

2+2-23+74

故当概率阈值为0.47时,求甲分类器的ROC曲线中的对应点对应点为(0.5,0.75).(5分)

(2)乙分类器对应的ROC曲线如下图所示.

F乙分大器的ROC曲找

9

a

*■£

6

啦o,3

0.

O0.5IX

传正假也

由已知题意可得,甲、乙分类器的ROC曲线都经过(0,0),(LD,

作如下图所示的辅助线,每个小直角三角形的面积都等于=±,

24432

大直角三角形的面积都等于;,故所求面积为;+白义5=亮.

所以,甲分类器的ROC曲线与x轴,直线x=l所围封闭图形的面积为二21.

C曲我

的RO

类器

甲分

9

o

O

.61

的线

OC

-•-R

例率

假正

C曲线

的RO

类器

甲分

图I

77

1

=有.

-rx5

积为1

所求面

理可得

,同

助线

的辅

所示

下图

作如

C曲找

的RO

类器

八乙分

9

O.

Q

6

/

n

OC曲

-R

f/

IX

0.5

O

侬上

假正

97

12分

为(

面积

形的

闭图

围封

l所

x=

直线

x轴,

线与

C曲

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论