2025年新高考数学一轮复习:统计与成对数据的统计分析(测试)(学生版+解析)_第1页
2025年新高考数学一轮复习:统计与成对数据的统计分析(测试)(学生版+解析)_第2页
2025年新高考数学一轮复习:统计与成对数据的统计分析(测试)(学生版+解析)_第3页
2025年新高考数学一轮复习:统计与成对数据的统计分析(测试)(学生版+解析)_第4页
2025年新高考数学一轮复习:统计与成对数据的统计分析(测试)(学生版+解析)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章统计与成对数据的统计分析(测试)

(考试时间:120分钟试卷满分:150分)

注意事项:

1.答卷前,考生务必将自己的姓名、准考证号填写在答题卡上。

2.回答选择题时,选出每小题答案后,用铅笔把答题卡对应题目的答案标号涂黑。如需改动,用橡皮

擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无效。

3.考试结束后,将本试卷和答题卡一并交回。

第一部分(选择题共58分)

一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要

求的。

1.已知一组数据:3,5,7,尤,9的平均数为6,则该组数据的40%分位数为()

A.4.5B.5C.5.5D.6

2.法国当地时间2024年7月26日晚,第三十三届夏季奥林匹克运动会在巴黎举行开幕式.“奥林匹克之父”

顾拜旦曾经说过,奥运会最重要的不是胜利,而是参与;对人生而言,重要的不是凯旋,而是拼搏.为弘扬

奥运精神,某学校组织高一年级学生进行奥运专题的答题活动.为了调查男生和女生对奥运会的关注程度,

在高一年级随机抽取10名男生和10名女生的竞赛成绩(满分100分),按从低到高的顺序排列,得到下

表中的样本数据:

男生82858687889090929496

女生82848587878788889092

则下列说法错误的是()

A.男生样本数据的25%分位数是86

B.男生样本数据的中位数小于男生样本数据的众数

C.女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变

D.女生样本数据中去掉一个最高分和一个最低分后所得数据的方差不变

3.已知一组数据丢失了其中一个,另外六个数据分别是8,8,8,10,11,16,若这组数据的平均数、中

位数、众数依次成等差数列,则丢失数据的所有可能值的和为()

A.12B.20C.25D.27

4.“绿水青山就是金山银山”的理念深入人心,人民群众的生态环境获得感、幸福感、安全感不断提升.某校

高一年级举行环保知识竞赛,共500人参加,若参赛学生成绩的第60百分位数是80分,则关于竞赛成绩

不小于80分的人数的说法正确的是()

A.至少为300人B.至少为200人

C.至多为300人D.至多为200人

5.为了解某校今年准备报考飞行员的学生的体重情况,对所得的体重数据(单位:kg)进行分组,区间为

[50,55),[55,60),[60,65),[65,70),[70,75],将其按从左到右的顺序分别编号为第一组,第二组,……,第五

组.画出频率分布直方图(如图所示),已知第一组,第二组和第三组的频率之比为1:2:3,且第一组的频

6.已知数据知尤?,…,%(%eZ,i=l,2,,5)的平均数、中位数、方差均为4,则这组数据的极差为

()

A.3B.4C.5D.6

20242024?

7.已知实数%%,…,9024,则使21苍一4和2(%一女)最小的实数上分别为不,和…,Z024的()

1=04=0

A.平均数;平均数B.平均数;中位数

C.中位数;平均数D.标准差;平均数

8.某校积极开展“戏曲进校园”活动,为了解该校各班参加戏曲兴趣小组的人数,从全校随机抽取5个班级,

把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本标准差为2,且样本数据互不相等,

则该样本数据的极差为()

A.3B.4C.5D.6

二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部

选对的得6分,部分选对的得部分分,有选错的得0分.

9.某公司计划组织秋游活动,定制了一套文化衫,女职工需要不同尺码文化衫的频数如图.

A.文化衫尺码的众数为187B.文化衫尺码的平均数为165

C.文化衫尺码的方差为28D.文化衫尺码的中位数为165

io.已知一组数据孙%,…,%的平均数为元,另一组数据必,%,…,y”的平均数为9.若数据

士,孙…,X/%,%,…,%的平均数为N,贝I」()

当根=〃时,

A.z=±BB.当z=■时,m=n

22

C.当元=歹时,1=土土工D.当N>无时,歹>无

2

11.北京时间2024年8月12日凌晨,第33届法国巴黎奥运会闭幕式正式举行,中国体育代表团以出色的

表现再次证明了自己的实力,最终取得了40枚金牌、27枚银牌和24枚铜牌的最佳境外参赛成绩,也向世

界展示了中国体育的蓬勃发展和运动员们顽强拼搏的精神.某校社团为发扬奥运体育精神举办了竞技比赛,

此比赛共有5名同学参加,赛后经数据统计得到该5名同学在此次比赛中所得成绩的平均数为8,方差为4,

比赛成绩xe[0』5],且xeN*,则该5名同学中比赛成绩的最高分可能为()

A.13B.12C.11D.10

第二部分(非选择题共92分)

三、填空题:本题共3小题,每小题5分,共15分。

12.现利用随机数表发从编号为00,。1,。2,,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表

第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为.

952260004984012866175168396820274377236627096623

925808564389099006482834597418582977814964608925

13.某公司对来应聘的人进行笔试,统计出200名应聘者的笔试成绩,整理得到下表:

组号123456

成绩分组[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]

累积频率0.050.15a々+0.302〃+0.102a+0.30

注:第〃组的累积频率指的是前〃组的频率之和.

若公司计划150人进入面试,则估计参加面试的最低分数线为

14.已知一组统计数据%,%,,居的平均数为"方差为S2,则函数/(x)=f(x-xj2的最小值为.

1=1

四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步聚。

15.(13分)

为了了解某中学学生的身高情况,随机对该校男生、女生的身高进行抽样调查,已知抽取的样本中,

男生、女生的人数相同,根据所得数据绘制成如图所示的统计图表.

女生身高情况扇形统计图

根据图表中信息,回答下列问题:

(1)在样本中,男生身高的中位数落在_______组(填组别序号),女生身高在2组的有人;

(2)在样本中,身高在150Wx<155之间的共有_______人,身高人数最多的在________组(填组别序号);

(3)已知该校共有男生500人,女生480人,请估计身高在155Wx<165之间的学生约有多少人?

16.(15分)

某公司为了了解顾客对其旗下产品的满意程度,随机抽取〃名顾客进行满意度问卷调查,按所得评分

(满分100分)从低到高将满意度分为四个等级:

调查评[70,电0,90)

[40,50)[50,60)[60,70)[90,100]

满意度良满

不满意一般

等级好思

并绘制如图所示的频率分布直方图.已知调查评分在[70,80)的顾客为80人.

(1)求n的值及频率分布直方图中t的值;

(2)若某段时间有10000名顾客购买该公司的产品,请估计这10000名顾客中对该公司产品满意度达到

“满意”的人数;

(3)该公司设定的预案是:以抽取的样本作为参考,若顾客满意度评分的均值低于80分,则需要对该公

司旗下产品进行调整,否则不需要调整、根据你所学的统计知识,判断该公司是否需要对旗下产品进行调

整,并说明理由.(每组数据以区间的中点值代替)

17.(15分)

为进一步推动防范电信网络诈骗工作,预防和减少电信网络诈骗案件的发生,某市开展防骗知识大宣

传活动.举办了“网络防骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,

成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]得到如图所示的频率分布直方图.

频率

(1)求图中。的值,根据频率分布直方图计算样本成绩的平均数和下四分位数;

(2)己知若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:m,

x,s;;”,y,s;,记总的样本平均数为了,样本方差为S2.

证明:

⑶已知落在[50,60)的平均成绩是59,方差是7,落在[60,70)的平均成绩为65,方差是4,求两组样本

成绩的总平均数2和总方差

1((

例.58.53

((

例.15.13

5((

例.62.39

I((

例.47.87

((

例.47.53

((

例.33.11

I((

例.77.63

表2甲,乙分类器对于相同8个样例的预测数据

甲分类器的ROC曲找乙分类器的ROC曲找

0.9

>6

「0.3,

O0.5Ix

假正例率

图】甲分类器的ROC曲线图2乙分类器的ROC曲线

(1)当概率阈值为0.47时,求甲分类器的ROC曲线中的对应点;

(2)在图2中绘制乙分类器对应的ROC曲线(无需说明绘图过程),并直接写出甲,乙两分类器的ROC

曲线与x轴,直线x=l所围封闭图形的面积;

(3)按照上述思路,比较甲,乙两分类器的预测效果,并直接写出理想分类器的ROC曲线与x轴,直线

x=l所围封闭图形的面积为1的充要条件.

19.(17分)

将2024表示成5个正整数A,%,尤3,x4,与之和,得到方程Xl+X2+X3+X4+尤5=2024①,称五元

有序数组(为,马,W,0马)为方程①的解,对于上述的五元有序数组(4%,£,龙4,尤5),当时,若

max(x,.-x.)=Z(reN),则称尤4,尤5)是—密集的一组解.

⑴方程①是否存在一组解任,孙玉,4,毛),使得%+「王[=1,2,3,4)等于同一常数?若存在,请求出该常

数;若不存在,请说明理由;

(2)方程①的解中共有多少组是1-密集的?

5

(3)记5=工尤"问S是否存在最小值?若存在,请求出S的最小值;若不存在,请说明理由.

Z=1

第九章统计与成对数据的统计分析(测试)

(考试时间:120分钟试卷满分:150分)

注意事项:

1.答卷前,考生务必将自己的姓名、准考证号填写在答题卡上。

2.回答选择题时,选出每小题答案后,用铅笔把答题卡对应题目的答案标号涂黑。如需改动,用橡皮

擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无效。

3.考试结束后,将本试卷和答题卡一并交回。

第一部分(选择题共58分)

一、选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要

求的。

1.已知一组数据:3,5,7,尤,9的平均数为6,则该组数据的40%分位数为()

A.4.5B.5C.5.5D.6

【答案】C

【解析】依题意,;=6,解得x=6,

将数据从小到大排列可得:3,5,6,7,9,

又5x04=2,则40%分位数为等=5.5.

故选:C.

2.法国当地时间2024年7月26日晚,第三十三届夏季奥林匹克运动会在巴黎举行开幕式.“奥林匹克之父”

顾拜旦曾经说过,奥运会最重要的不是胜利,而是参与;对人生而言,重要的不是凯旋,而是拼搏.为弘扬

奥运精神,某学校组织高一年级学生进行奥运专题的答题活动.为了调查男生和女生对奥运会的关注程度,

在高一年级随机抽取10名男生和10名女生的竞赛成绩(满分100分),按从低到高的顺序排列,得到下

表中的样本数据:

男生82858687889090929496

女生82848587878788889092

则下列说法错误的是()

A.男生样本数据的25%分位数是86

B.男生样本数据的中位数小于男生样本数据的众数

C.女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变

D.女生样本数据中去掉一个最高分和一个最低分后所得数据的方差不变

【答案】D

【解析】对于A:10x25%=2.5,所以男生样本数据的25%分位数是86,故A正确;

QQInn

对于B:男生样本数据的中位数为=出=89,男生样本数据的众数为90,故B正确;

对于C:女生样本数据的平均数为工(82+84+85+87x3+88x2+90+92)=87,

女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数为0(84+85+87x3+88x2+90)=87,故

O

C正确;

对于D:女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变,

但是极差变小,所以方差变小,故D错误.

故选:D

3.已知一组数据丢失了其中一个,另外六个数据分别是8,8,8,10,11,16,若这组数据的平均数、中

位数、众数依次成等差数列,则丢失数据的所有可能值的和为()

A.12B.20C.25D.27

【答案】D

【解析】这7个数据的众数是8,设丢失的数据是x,

.x+8+8+8+10+11+16%+61

则n平均数为-------------------

7

若x<8,则中位数是8,则苫旦+8=8x2,解得x=-5

若x=8,则中位数是8,平均数三x+巴6]■二?69,

77

69

此时亍,8,8不成等差数列,不符合题意.

若8<x<10,则中位数是x,贝U土答+8=2无,解得x=9.

若x=10,则中位数是10,则土乌=2,

77

71

了,10,8不成等差数列,不符合题意.

若x>10,则中位数是10,则三星+8=10x2,解得x=23.

所以丢失数据的所有可能值的和为-5+9+23=27.

故选:D

4.“绿水青山就是金山银山”的理念深入人心,人民群众的生态环境获得感、幸福感、安全感不断提升.某校

高一年级举行环保知识竞赛,共500人参加,若参赛学生成绩的第60百分位数是80分,则关于竞赛成绩

不小于80分的人数的说法正确的是()

A.至少为300人B.至少为200人

C.至多为300人D.至多为200人

【答案】D

【解析】由题意,500x60%=300,因此竞赛成绩不小于80分的人数至多有500-300=200人,

故选:D.

5.为了解某校今年准备报考飞行员的学生的体重情况,对所得的体重数据(单位:kg)进行分组,区间为

[50,55),[55,60),[60,65),[65,70),[70,75],将其按从左到右的顺序分别编号为第一组,第二组,……,第五

组.画出频率分布直方图(如图所示),已知第一组,第二组和第三组的频率之比为1:2:3,且第一组的频

【答案】A

【解析】由题前三组频率之和为1-(。013+0.037)x5=0.75,

又第一组、第二组和第三组的频率之比为1:2:3,

所以第一组的频率为Q75X-F=0.125,又第一组的频数为6,

1+2+3

所以报考飞行员的学生人数为2=48人.

0.125

故选:A.

6.已知数据王,尤2,…,%(x;eZ,i=l,2,,5)的平均数、中位数、方差均为4,则这组数据的极差为

()

A.3B.4C.5D.6

【答案】D

【解析】根据题意,不妨设无1<三,且x,eZ,可得%=4,

由平均数为4,得、(玉+尤2+尤3+-%+%)=4,即再+%+工3+%+%=20;

由方差为4,得g[(玉—4)+(9—4)+(』—4)+(%—4)+(毛—4)]=4,即x:+x;+x;+x:+*=100;

(x+龙,+灰+羽+%=20

联立?2'2[…,由x”Z可解得改=1,々=3,匕=5,%=7;

[菁+%2+毛+%4+*5=100

根据极差定义可得这组数据的极差为%-玉=6.

故选:D

20242024】

7.已知实数天,…,々024,则使2|%-无|和2(七-左)最小的实数%分别为飞心…所的的()

i=0z=0

A.平均数;平均数B.平均数;中位数

C.中位数;平均数D.标准差;平均数

【答案】C

2024

【解析】-左|=|/-%|+|玉-%|+|%2024-%|+,+|入2024-%|,表示2025个绝对值之和,

i=0

根据绝对值的几何意义知,绝对值的和的最小值表示距离和的最小值,

2024

因为2025为奇数,所以左取无。,占,…,々。24的中位数时,有最小值;

i=0

20242024

£(%-4=£仁—2日j+%?)=(片++%2+,…+工;024)—(2N0+2工1+2%2+-+2K2024)"+2025%之于k的

i=01=0

一元二次函数,

故当年=%+%:+马侬时,£(七一厅有最小值,

2025z=o

2024

即k为七,X],々024的平均数时,za-有最小值.

i=0

故选:C

8.某校积极开展“戏曲进校园”活动,为了解该校各班参加戏曲兴趣小组的人数,从全校随机抽取5个班级,

把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本标准差为2,且样本数据互不相等,

则该样本数据的极差为()

A.3B.4C.5D.6

【答案】D

【解析】不妨设该五个班级的样本数据分别为a,b,c,d,e(a<b<c<d<e),且a,b,c,d,e©N*,

a+b+c+d+e

---------------------=7

5

则依题意有<n-------^―--------^―-----------------------------------3,

『-a)+(7-6)+(7­)+(7—d)+(7-e)

化简得a+b+c+d+e=35,(a-7)2+(,-7y+(c-7)2+(d-7)2+(e-7)2=20,

易知e2d+lNc+22〃+32a+4=a+b+c+d+eW5e-10neN9,

又易知五个数据减7的平方数为整数,7/-7,c-7,d-7,e-7五个数的绝对值不超过4,

当e=ll时,(a-7)2+(^-7)2+(c-7)2+(6/-7)2=4,由数据为整数且均不相同得不成立,

2222

当e=10时,(a-7)+(Z>-7)+(c-7)+(^-7)=11,由数据为整数且均不相同得该四个平方数只能为

0,1,1,9,则〃=4,Z?=6,c=7,d=8,符合题意,此时极差为6;

2222

当e=9时,(a-7)+(/?-7)+(c-7)+(J-7)-16,由数据为整数且均不相同得不成立;

综上,五组数据的极差为6.

故选:D

二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部

选对的得6分,部分选对的得部分分,有选错的得0分.

9.某公司计划组织秋游活动,定制了一套文化衫,女职工需要不同尺码文化衫的频数如图.

A.文化衫尺码的众数为187B.文化衫尺码的平均数为165

C.文化衫尺码的方差为28D.文化衫尺码的中位数为165

【答案】BD

【解析】由题图知,众数为165,故A错误;

总数为34+59+187+85+21=386,

平均数为二一x(155x34+160x59+165xl87+170x85+175x21)=165,故B正确;

386

^>g—x(102x34+52x59+02xl87+52x85+102x21)«23.58,故C错误;

386'7

中位数为165,故D正确.

故选:BD

io.已知一组数据与马,…,(的平均数为元,另一组数据%,%,…,%的平均数为了.若数据

X],%,…,X”必,必,…,%的平均数为彳,贝(J()

A.当根="时,z=工土工B.当2=土土工■时,m=n

22

__x+v

C.当元=9时,z=—<D.当三〉》时,y>x

2

【答案】ACD

【解析】当〃?=〃时,2=/^工9=:元+1y=『,A正确;

m+nm+n222

当彳=苫2时,取%=%==x〃?=&弘=%==%=0,贝I」形与〃不一定相等,B错误;

___m_n_m_n_m+n__x+y_十*

当无=>时,z=------x+-------y=--------x+-------x=--------x=x=-------,C正确;

m+nm+nm+nm+nm+n2

rnvim〔_

当无时,N=------------x+-------------y>x,有------1x+----y>0,故-----y------x>0

m+nm+nm+nJm+nm+nm+n

即,^歹一__x=^^(y-^)>o,所以了>无,D正确.

m+nm+nm+n

故选:ACD.

11.北京时间2024年8月12日凌晨,第33届法国巴黎奥运会闭幕式正式举行,中国体育代表团以出色的

表现再次证明了自己的实力,最终取得了40枚金牌、27枚银牌和24枚铜牌的最佳境外参赛成绩,也向世

界展示了中国体育的蓬勃发展和运动员们顽强拼搏的精神.某校社团为发扬奥运体育精神举办了竞技比赛,

此比赛共有5名同学参加,赛后经数据统计得到该5名同学在此次比赛中所得成绩的平均数为8,方差为4,

比赛成绩xe[0,15],且xeN*,则该5名同学中比赛成绩的最高分可能为()

A.13B.12C.11D.10

【答案】BC

【解析】设该5名同学在此次比赛中所得成绩分别为不,%,X3,x4,X5,

由题得元=g(X]+%+X3+尤4+毛)=8,

贝I]xt+x2+x3+x4+x5=40,

一目.s?=y[(玉—8)+(x2—8)+(x3—8)+(x4—8)+(x5—8)J=4,

2

则&-8)2+(x2-8)2+(%-8)2+(x4-8)2+(x5-8)=20,

不妨设退最大,

对于A选项,若无§=13,贝!J(再—8)+(9—8)+(%j—8)+(x4—8)=—5不成立,故A错误;

对于B选项,若%=12,贝(|(玉—8)+(x?—8)+(x3—8)+(x4—8)=4,

则满足题意,例如5位同学的成绩可为7,7,7,7,12,故B正确;

对于C选项,若%=11,则(%-8)2+(々-8)2+(毛-8)2+(%-8)2=11,

则满足题意,例如5位同学的成绩可为5,7,8,9,11,故C正确;

对于D选项,若无5=10,则占+%+尤3+乙=3。且(王一8)2+(9一8)2+(毛—8)2+(又一8)2=16,

则片++后+—16(%+%2+/+/)+4义82—16,

=^>+%2+-^3+¥=16(玉+九2+毛+)—4x8?+16-16x30—4x8?+16=240,

fx++Xn+=30

则可得2222xc,该方程组无正整数解,故D错误.

[入:+芯+芯+汇=240

故选:BC.

第二部分(非选择题共92分)

三、填空题:本题共3小题,每小题5分,共15分。

12.现利用随机数表发从编号为00,。1,。2,,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表

第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为

952260004984012866175168396820274377236627096623

925808564389099006482834597418582977814964608925

【答案】18

【解析】依次选出的编号为:01,17,09,08,06,18

则选出来的第6支水笔的编号为18,

故答案为:18.

13.某公司对来应聘的人进行笔试,统计出200名应聘者的笔试成绩,整理得到下表:

组号123456

成绩分组[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]

累积频率0.050.15aa+0.302a+0.102a+0.30

注:第”组的累积频率指的是前〃组的频率之和.

若公司计划150人进入面试,则估计参加面试的最低分数线为

【答案】65

【解析】由各组累积频率为1得,2a+0.3=l,则“=0.35.

又由e=0.75知,面试的最低分数线为笔试成绩从低到高排列的第25百分位数小,

由题表知,笔试成绩分别在[40,60)与[40,70)的累积频率分别为0.15,0.35,

X,AT,_7_7_1_-6_0___0_.2_5__-_0_._1_5

70-60-0.35-0.15'

解得m=65,

从而可估计参加面试的最低分数线为65.

故答案为:65

14.已知一组统计数据占,3,•,%的平均数为"方差为s2,则函数/(x)=t(x-%)2的最小值为

Z=1

【答案】ns2

1〃

【解析】由下二学得/2这X:

〃i=l〃Ii=li=l

则="1+于2),

1=1

212222

故f(x)='^(x-x,.)=nx-为+Ex=nx-Inx-x+^xr=n(x-x)+ns>ns,当且仅当x=x时等

1=11=11=11=1

号成立.所以函数=的最小值为加.

Z=1

故答案为:

四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步聚。

15.(13分)

为了了解某中学学生的身高情况,随机对该校男生、女生的身高进行抽样调查,己知抽取的样本中,

男生、女生的人数相同,根据所得数据绘制成如图所示的统计图表.

a身高

别(cm)

Ax<150

150<x<

B

155<x<

C

L160<x<

Ex>165

女生身高情况扇形统计图

根据图表中信息,回答下列问题:

(1)在样本中,男生身高的中位数落在________组(填组别序号),女生身高在2组的有人;

(2)在样本中,身高在150〈尤<155之间的共有人,身高人数最多的在________组(填组别序号);

(3)已知该校共有男生500人,女生480人,请估计身高在155Vx<165之间的学生约有多少人?

【解析】(1):在样本中,共有男生2+4+8+12+14=40(人),

中位数是第20和第21人的平均数,.•.男生身高的中位数落在。组,

女生身高在B组的有40x(1-30%-20%-15%-5%)=12(人).(4分)

(2)在样本中,身高在1504x<155之间的共有4+12=16(人),身高人数最多的在C组.

12+14

(3)由于500x+480x(30%+15%)=541(人),(9分)

2+4+8+12+14

故估计身高在155Vx<165之间的学生约有541人.(13分)

16.(15分)

某公司为了了解顾客对其旗下产品的满意程度,随机抽取〃名顾客进行满意度问卷调查,按所得评分

(满分100分)从低到高将满意度分为四个等级:

调查评[70,电0,90)

[40,50)[50,60)[60,70)[90,100]

满意度良满

不满意一般

等级好-思zfe.

并绘制如图所示的频率分布直方图.已知调查评分在[70,80)的顾客为80人

[频率/组距

9t-----........................--I-

6t------------------…--------

0.020----------------------

0.010......................

0.006…--—

t—I—

0^405060708090100

(1)求n的值及频率分布直方图中f的值;

(2)若某段时间有10000名顾客购买该公司的产品,请估计这10000名顾客中对该公司产品满意度达到

“满意”的人数;

(3)该公司设定的预案是:以抽取的样本作为参考,若顾客满意度评分的均值低于80分,则需要对该公

司旗下产品进行调整,否则不需要调整、根据你所学的统计知识,判断该公司是否需要对旗下产品进行调

整,并说明理由.(每组数据以区间的中点值代替)

【解析】(1)0.02x10/7=80,10Z+0.06+0.1+0.2+60r+90f=1,

所以"=400,z=0.004;(5分)

(2)6?=6x0.004=0.024,

估计的人数为10000x0.024x10=10000x0.24=2400人;(10分)

(3)由频率分布直方图得,顾客满意度评分的均值为:

45x0.04+55x0.06+65x0.1+75x0.2+85x9x0.C4+95x0.24=80,

由题意知不需要对该公司旗下产品进行调整.(15分)

17.(15分)

为进一步推动防范电信网络诈骗工作,预防和减少电信网络诈骗案件的发生,某市开展防骗知识大宣

传活动.举办了“网络防骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,

成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]得到如图所示的频率分布直方图.

(1)求图中。的值,根据频率分布直方图计算样本成绩的平均数和下四分位数;

(2)己知若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,

无,s;;”,y,s"记总的样本平均数为了,样本方差为

证明:S1=-下一5+;

(3)已知落在[50,60)的平均成绩是59,方差是7,落在[60,70)的平均成绩为65,方差是4,求两组样本

成绩的总平均数2和总方差52.

【解析】(1)由题意可知,(0.005+0.010+0.020+a+0.025+0.010)?101,

解得:a=0.030;

平均数为(45x0.005+55x0.01+65x0.02+75x0.03+85x0.025+95x0.01)x10=74,

前2组的频率和为(0.005+0.010)x10=0.15,

前3组的频率和为0.15+0.02x10=0.35,

所以下四分位数在第3组,设为无,

则0.15+(%-60)x0.02=0.25,得x=65

所以下四分位数为65;(4分)

/_、_rrix+riym_n_

(2)co=---------=-------X+-------y,

m+nm+nm+n

1m01n,

imn

总体方差心—学广必)气昌”才

mm-

又£(々-5)2=£[&-元)+(元-万)],

i=li=l

7—可之+2(元一同(苍一元)+(无一句]

mmm

=-可2+2(元一向£(x,_可+£(元一切)2,

Z=1Z=14=1

mmm

因为Z(七一元)==nix-rwc=0,

Z=1Z=1Z=1

mtnmm

5(龙厂寸=5(%-寸+2(元一•5&一元)+5(元一寸,

i=lZ=1Z=1Z=1

=mSy+m(x-6?)2=加[s;+(无一百J],

同理£(y,一匠J=〃[s;+(y_^)[,

i=l-

imn

故之(%一万y+t(%—匠)2,

“〃l_i=li=l_

(3)[50,60)的频率是Q010xl0=0.1,频数是0.1x100=10,[60,70)的频率是0.020x10=0.2,频数是

0.2x100=20

所以总体平均数彳=上一x59+S—x65=63,

10+2010+20

总体方差/=寻而,017+(59-63)[+20[4+伍5-63)1}=13.(15分)

18.(17分)

机器模型预测常常用于只有正确与错误两种结果的问题.表1为根据模型预测结果与真实情况的差距的

情形表格,定义真正例率Pi='^,假正例率必.概率阈值为自行设定的用于判别正(反)例的值,

几1+%几3+%

若分类器(分类模型)对该样例的预测正例概率大于等于设定的概率阈值,则记分类器预测为正例,反之预测

利用这些指标绘制出的ROC曲线可衡量模型的评价效果:将各样例的预测正例概率与L0从大到小排

序并依次作为概率阈值,分别计算相应概率阈值下的B与必.以上为横坐标,B为纵坐标,得到标记点.依

次连接各标记点得到的折线就是ROC曲线.图1为甲分类器对于8个样例的ROC曲线,表2为甲,乙分类

器对于相同8个样例的预测数据.

甲乙

样例数分分

据类类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论