专题42随机抽样用样本估计总体_第1页
专题42随机抽样用样本估计总体_第2页
专题42随机抽样用样本估计总体_第3页
专题42随机抽样用样本估计总体_第4页
专题42随机抽样用样本估计总体_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

备战2024高考数学一轮复习

(新高考)

专题42畸机抽样、用样本估计总体

N。考向解读

❶考点精折

❷真题精讲

❸模拟精练

❹专题训练

专题42随机抽样、用样本估计总体

命题解读命题预测复习建议

随机抽样、用样本估预计2024年的高考随机抽样集合复习策略:

还会出题,出题形式可以是选

计总体在高考中是出题频率择、填空,也可以是解答,在1.掌握各种抽样方法,理解频

比较高,其中抽样方法容易解答题中常与概率等联合出率分布直方图;

题,考杏分析问题能力和计算

出选择题,频率分布直方图能力。2.理解样本的数字特征,并会

考的比较多,常结合样本的计算数字特征。

数字特征出题,这部分出题

比较灵活,多结合目前的实

际问题出题,考查分析问题

的能力,以及处理数据的能

力。

一❶考虑精折一

一随机抽样的方法

1.简单随机抽样

(I)抽取方式:逐个不放回抽取;

(2)每个个体被抽到的概率相等;

(3)常用方法:抽签法和随机数法.

2.分层抽样

(1)定义:在抽样时,将总体分成互不交叉的层,然后按照•定的比例,从各层独立地抽取•定数

量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.

⑵分层抽样的应用范围:

当总体是由差异明显的几个部分组成时,往往选用分层抽样.

二样本的数字特征

1.作频率分布直方图的步骤

(1)求极差(即一组数据中最大值与最小值的差);

(2)决定组距与组数;

(3)将数据分组;

(4)列频率分布表;

(5)画频率分布直方图.

2.频率分布折线图和总体密度曲线

(I)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.

(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线

图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体'密度曲线.

3.样本的数字特征

(1)众数、中位数、平均数

数字特征定义与求法优点与缺点

众数通常用于描述变量的值出现次数最多的数,但

一组数据中重任出现次数

众数它对其他数据信息的忽视比较明显,使它无法客观

最多的数

地反映总体特征

把一组数据按从小到大的

中位数等分样本数据所占频率,它不受少数几个极

顺序排列,处在中间位置的

中位数端值的影响,这在某些情况下是优点,但它对极端值

一个数据(或两个数据的平

的不敏感有时也会成为缺点

均数)

平均数与每一个样本数据有关,可以反映山更多的

如果有〃个数据XIK2,……,

关于样本数据全体的信息,但平均数受数据中的极

平均数那么这〃个数的平均数

端值的影响较大,使平均数在估计总体时可靠性降

__x14-x2-h...4-xn

n

(2)标准差、方差

①标准差:样本数据到平均数的一种平均距离,一般用s表示严

巾[(修为2+(不-又)2+…+Qn-又)2],其中X*=123,…⑼是样本数据/是样本容量区是样本平

均数.

②方差:标准差的平方式

S2=^[(-V|-%)2+(X2-%)2+...+(A;,-X)2].

一❷真题精耕

1.(全国高考真题)下列统计量中,能度量样本玉,々,…,毛的离散程度的是()

A.样本演,々,…,X"的标准差B.样本玉,工2,…,土的中位数

C.样本玉,工2,…,X”的极差D.样本为,工2,…,X”的平均数

【答案】AC

【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定

正确选项.

【详解】由标准差的定义可知,标准差考查的是数据的离散程度;

由中位数的定义可知,中位数考查的是数据的集中趋势;

由极差的定义可知,极差考杳的是数据的离散程度;

由平均数的定义可知,平均数考查的是数据的集中趋势;

故选:AC.

2.(天津高考真题)从某网络平台推荐的影视作品中抽取400部,统计其评分分数据,

将所得400个评分数据分为8组:[66,70)、[70,74)、…、[94,98],并整理得到如

()

D.80

【答案】D

【分析】利用频率分布直方图可计算出评分在区间[82,86)内的影视作品数量.

【详解】由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为

400x0.05x4=80.

故选:D.

3.(全国高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的

某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指

标数据如下:

旧设备

新设备

旧设备和新设备生产产品的该项指标的样本平均数分别记为7和I,样本方差分别记为S;

(1)求3亍,S:,S;;

(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果

歹—亍22、庄玉,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则

V10

不认为有显著提高).

【答案】(1)1=10,/=10.3,s:=0.036,s;=0.04:(2)新设备生产产品的该项指标的均

值较旧设备有显著提高.

【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.

(2)根据题目所给判断依据,结合(1)的结论进行判断.

--9.8+10.3+10+10.2+9.9+9.8+10-F10.1+10.2+9.7

[详解](1)x=--------------------------------------------=1I0n,

10

-10.1+10.4+10.1+10+10.1+10.3+10.6+10.5+10.4+10.5

y---------------------------------------------------10A.O3,

0.22+0.32+04-0.22+0.12+0,22+0+0.12+0.22+0.32

10

0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.P+0.22

0.04.

"To-

(2)依题意,y-x=0.3=2x0.15=2A/0.152=2XA).0225«

2陪产=2由,

,所以新设备生产产品的该项指标的均值较旧设备有显著提高.

V10

4.(2021•河南高三其他模拟(文))2021年7月1日是中国共产党百年华诞,某社区将组

织主题为“红歌献给党”的百人大合唱,将这100人的年龄分成[0,20),[20,30),[30,40),

[40,50),[50,60),[60,70),[70,80)7段后得到如图所示的频率分布直方图.

谭率

0.030组距---------

0.020---------------

0.015---1----------------------

0.010■—1~-,—----------

0.005--------------------------------------------

O1020304050607080年龄

(1)求这100人年龄的平均数(同一组中的数据用该组的区间中点值代表),并求中位数的

估计值;

(2)若从样本中年龄在[40,60)的人员中按分层抽样法选取5人,然后从这5人中选出2

人做领队,求这2名领队分别来自[40,50)与[50,60)两组的概率.

【答案】(1)平均数为37,中位数的估计值为35;(2)

5

【分析】(1)将每组数据的组中值乘以频率,再将结果相加即可得到平均数;根据频率分布

直方图计算频率之和为0.5时对应的年龄即为中位数;

(2)先根据分层抽样计算出[40,60),[50,60)中抽取的人数,然后列出所有基本事件,

再找出满足条件的基本事件,根据基本事件的数量之比求解出对应概率.

【详解】解:(1)这100人年龄的平均数为

15x0.15+25x0.2+35x0.3+45x0.154-55x0.1+(65+75)x0.05=37,

前两组数据所占频率之和为(0.015+0.02)X10=0.35,

前三组数据所占频率之和为(0.015+0.02+0.03)xl0=0.65.

设中位数的估计值为x,则0.35+0.03x(x-30)=0.5,解得x=35.

(2)由题意可知,年龄在[40,50)内的人数为15,[50,60)内的人数为10,

按分层抽样法选取5人,则在[40,50)内抽取5乂言m=3人,记为4,4,4,

10

在[50,60)内抽取5x=2人,记为8],B.

15+102

从这5人中选出2人做领队的所有情况是(4,4),(4,4),(4,4),(4闯,

(4闯,(4闯,(4出),(4闯,(4也),(4&),共io种.

这2名领队分别来自[40,50)与[50,60)两组的情况有(4,用),(4,层),(4,4),

(4也),(4闯,(4,层),共6种.

所以这2名领队分别来0[40,50)与[50,60)两组的概率P=-^=|

一❸模按精练一

1.(2023•江苏南通•二模)已知甲种杂交水稻近五年的产量(单位:t/hm2)数据为:9.8,

10.0,10.0,10.0,10.2,乙种杂交水稻近五年的产量(单位:t/hm?)数据为:9.6,9.7,10.0,

10.2,10.5,则()

A.甲种的样本极差小于乙种的样本极差

B.甲种的样本平均数等于乙种的样本平均数

C.甲种的样本方差大于乙种的样本方差

D.甲种的样本60百分位数小于乙种的样本60百分位数

【答案】ABD

【分析】根据极差判断A,计算平均数判断B,计算方差判断C,分别计算甲乙的样本60百

分位数判断D.

【详解】对A,10.2-9.8=0.4,10.5-9.6=0.9>0.4,故A对;

对B,币=-(9.8+10.0+10.0+10.0+10.2)=10.0,

5

=-(9.6+9.7+10.0+102+10.5)=10.0=^,故B对;

对C,因为甲、乙平均值都为10,所以$;=(96-1。):(1。.2-10),

c2(9.6-10)2+(9.7-叫+(10.2-10)2+(10.5-10)2

乙=二

显然甲种的样本方差小于乙种的样本方差,故C错误;

对D,60%x5=3为整数,故甲的60百分位数”号”二10.0,

乙的60百分位数为3号丝=10.1>10.0,故D对.

故选:ABD

2.(2023•江苏•统考二模)某校1000名学生参加数学文化知识竞赛,每名学生的成绩

,Y-JV(70,102),成绩不低于90分为优秀,依此估计优秀的学生人数为(结

果填整数).

附:若4~N(〃,cr'),则P(〃一bv〃+。)=0.6827,P(〃-2。<J<〃+2。)=0.9545.

【答案】23(22也可以)

【分析】根据X~N(70,6),得出P(X>90)=尸(X>〃+2cr),再乘以总人数得出结果.

【详解】由每名学生的成绩X~N(7O,IO'),得〃=70,。=10,

则P(X>90)=P(X>70+20)=P(X>4+2。)=;[l-P(〃-2b<4<〃+2(T)]

=1(1-0.9545)=0.02275,

则优秀的学生人数为1000x0.02275=22.75«23.

故答案为:23.

3.(2021•河南高三其他模拟(文))某生物研究小组准备探究某种蜻蜒的翼K分布规律,随

机捕捉20只该种蜻蜓,测量它们的翼长(翼长为整数,单位:mm)并绘制成如下的茎叶

图和一部分频率分布直方图,其中基叶图中有一处数字看不清(用。表示),但已知茎叶图

中每一行的数据都按照从小到大的顺序排列且无相同数据频率分布直方图每个分组含左端

点不含右端点.

至叶

3679

4123a689

501234568

612

(1)求。的值;

(2)根据茎叶图将频率分布直方图补充完整;

(3)分别根据茎叶图和频率分布直方图计算蜻蜓翼长的中位数,并分析哪个中位数可以更

准确地反映蜻蜓翼长的总体情况.

【答案】(1)4=5;(2)作图见解析;(3)茎叶图,中位数为49.5;频率分布直方图中,

中位数为50;答案见解析.

【分析】(1)先计算出[40,45)区间中的个体数,然后根据茎叶图分析。的取值:

(2)根据茎叶图分别计算[35,40),[45,50),[50,55),[55,60),[60,65)对应的频率

除以组距的值,由此可补充频率分布直方图;

(3)茎叶图:取第10个和第11数据相加然后除以2即可得到结果;频率分布宜方图:计算

频率和为0.5时对应的横坐标的值即为中位数;然后根据茎叶图、频率分布直方图对数据的

保存特点分析哪一个统计图的中位数更准确地反映照蜓翼长的总体情况.

【详解】解:(1)[40,45)区间对应的个体个数为0.03x5x20=3,乂寸应的三个数据分别

为41,42,43,

因此。必须要大于4且小于6,从而。=5.

⑵区间[35,40),[45,50),[50,55),[55,60),[60,65)对应的纵坐标分别为

32

=0.03,-----=0.04-----=0.05^—=0.03=0.02.

20x520x520x520x520x5

所以频率分布直方图如下:

出距

频率分布直方图中,区间[35,50)的频率为(0.03+0.03+0.04)、5=0.5,因此中位数为50.

利用茎叶图计算的中位数更加准确,因为频率分布直方图损失了样本的部分信息,数据的分

组对数字特征的估计结果也有影响;

茎叶图是原始数据,记录了样本的全部信息,所以能更准确地反映蜻蜓翼长的总体情况.

4.(2021•贵州黔东南苗族侗族自治州•凯里一中高三三模(文))2020年7月29日,贵州省

林业局发布全省2019年度森林覆盖率,黔东南州森林覆盖率为67.98%,这是自2012年全

省开展小康森林覆盖率指标监测工作以来,黔东南州连续8年位居全省市州第一,“绿水青

山就是金山银山”已成为新时代中国特色社会主义生态文明建设的重要内容.某社团在一次

研学旅活动中,为了解某苗圃基地的红豆杉幼苗生长情况,从基地的树苗中随机抽取了60株

测量高度(单位:cm),经统计,树苗的高度均在区间[29,41]内,将其按[29,31),[31,33),

[33,35),[35,37),[37,39),[39,41]分成6组,制成如图所示的频率分布直方图:

(2)该社团决定从树苗的高度在[36,41]中采用分层抽样的方法抽取5株树苗带回学校栽种,

然后再从这5株树苗中随机抽取3株跟踪研究,求恰有1株树苗高度在[37,39)的概率.

【答案】(1)。=0.05,平均数为35.8(cm);(2)

5

【分析】(1)根据频率分布直方图的所有矩形面积之和为1,可得

(0.025+2。+().()75+().1+().2)x2=i进一步计算出°,则根据频率分布直方图可算出树

苗的平均高度的估计值.

(2)根据题意可先分别计算出树苗高度在[36,37)、[37,39)、[39,41]内的数量,再根据古典

概型的概率公式计算出所求概率.

【详解】解:(1)由于频率分布直方图的所有矩形面积之和为1,

则(0.025+2a+0.075+0.1+0.2)x2=1,解得〃=().05,

第一、二、三、四、五、六组的频率分别为0.05、0.1、0.15.0.4、0.2、0.1,

则平均数为().()5x30+().lx32+().15x34+0.4x36+0.2x38+0.1x4()=35.8(cm).

(2)由题意可知,树苗亩度在[36,37)内的有60x0.2x1=12株,在[37,39)内的有

60x0.2x1=12株,在[39,41]内的有60x0.05x2=6株,

1219

则树苗高度在[36,37)内抽取5x.二2株,在[37,39)内抽取5x笠=2株,在[39,41]内

抽取5x9=1株,

30

记树苗高度在[36,37)内的2株为%,在[37,39)内的2株为旧,与,在[39,41]内的

1株为c,

则从5株树苗中随机抽取3两株的基本事件有也),,

(%,4也),(%,4,C),(4也,。),(如4也),3,4,。),(出也,C),伍也,C)共10

种,其中恰有1株树苗高度在[37,39)的有6种,

故所求概率为白=]

5.(2021•黑龙江大庆市•大庆实验中学高三其他模拟(文))某企业销售部门为了解员工的销

售能力,设计了关于销售的问卷调查表,从该部门现有员工中性别(男生占45%)分层抽取〃

名进行问卷调查,得分分为1,2,3,4,5五个档次,各档次中参与问卷调查的员工的人数

如条形图所示,已知第5档员工的人数占总人数的1.

5

(1)(i)求〃与a的值;

(ii)若将某员工得分所在的档次作为该员工的销售能力基数(记销售能力基数玉,二5为能力

基数高,其他均为能力基数不高入在销售能力基数为5的员工中,女生与男生的比例为7:3,

以抽的〃名员工为研究对象,完成下面的2x2列联表,并判断是否有90%的把握认为销售

能力某数高不高与性别有关.

男生女生合计

销售能力基数高

销售能力基数不高

合计

(2)为提高员工的销售能力,部门组织员工参加各种形式的培训讲座,经过培训,每位员

工的营销能力指数V与销售能力基数%以及参加培训的次数t满足函数关系式

),=%+(1+%)1.如果员工甲的销售能力基数为4,员工乙的销售能力基数为2,

则在甲不参加培训的情况下,乙至少需要参加多少次培训,其营销能力指数才能超过甲?

参考数据及参考公式:In3*1.099,

附:”=(5)(;株其中"=〃+"c+d.

P(K2之引

k。

【答案】(1)(i)«=100,^=34;(jj)列联表答案见解析,没有90%的把握认为销售能力

基数高不高与性别有关;12)乙至少需要参加17次培训,其营销能力指数才能超过甲.

【分析】(1)(i)根据题意,列方程求出"、。的值;

(ii)根据题意,填写2x2列联表,计算出Kz,对照临界值表即可得出结论;

(2)计算员工甲的学习能力以及员工乙在参加了t次学习方法课程后的学习能力,建立不

等式即可求解.

201

【详解】解:(1)⑴由题意,可得一=一,所以〃二100,。=100-(22+20+16+8)=34;

n5

(ii)2x2列联表如表所示:

男生女生合计

销售能力基数高61420

销售能力基数不高394180

合计4555100

.K?_100x(6x41-39x14)

«2.273<2.706»

45x55x80x20

所以没有90%的把握认为销售能力基数高不高与性别有关:

(2)员工甲不参加培训的营销能力指数乂=4+(1+4)l+e*=14,

员工乙参加t次培训后的营销能力指数歹2=2+(1+2)1+e区=2+31+e区,

7

由已知得2+31+e15>14,则d5>3,上〉ln3N>151n3/>16.485,

k/15

所以乙至少需要参加17次培训,具营销能力指数才能超过甲.

6.(2023・江苏无锡•辅仁高中校联考模拟预测)互花米草是禾本科草本植物,其根系发达,

具有极高的繁殖系数,对近海生态具有较大的危害.为尽快消除互花米草危宙,2022年10

月24日,市政府印发了《莆田市互花米草除治攻坚实施方案》,对全市除治攻坚行动做了具

体部署.某研究小组为了解甲、乙两镇的互花米草根系分布深度情况,采用按比例分层抽样

的方法抽取样本.已知甲,真的样本容量〃?=12,样本平均数胃=18,样本方差$:=19;乙镇

的样本容量〃=18,样本平均数y:36,样本方差s;=7。.

⑴求由两镇样本组成的总样本的平均数彳及其方差§2;

(2)为营造“广泛发动、全民参与”的浓厚氛围,甲、乙两镇决定进行一次“互花米草除治大练

兵”比赛,两镇各派一支代表队参加,经抽签确定第一场在甲镇举行.比赛规则:

每场比赛直至分出胜负为止,胜方得1分,负方得。分,下一场在负方举行,先得2分的代

表队获胜,比赛结束.

当比赛在甲镇举行时,甲镇代表队获胜的概率为|,当比赛在乙镇举行时,甲镇代表队获胜

的概率为/北求E(X).

参考数据:

12xl82=3888,18x362=23328,28.82=829.44,12xlO.82=1399.68,18x7.22=933.12.

【答案】⑴5=28.8,§2=]2736

【分析】(1)利用平均数的计算公式求得5,再利用方差的计算公式进行转化求解即可得解;

(2)先根据题意得到*的所有可能取值,再利用独立事件的概率公式分别求得X各个取值

的概率,从而利用数学期望的计算公式即可得解.

【详解】(1)根据题意,得心=%+18=---------------=28.8,

因为

拉T+亍-4年。—"三2tx^^12匕一)

J=Ir=lr=l

12/12A12

=^(x.-x)-+2(x-z)X±-12文+\2(x-z)~=^(xr.-x)'+12(x-z)",

/=!\f=l//=!

1818

同理+日12优,

r=1/=1

所以s2=(a

会(若一f+亍_可2+Z(v,一歹+7一彳)2

0;=i-

4格-12(=—热-丹+12(歹-方

=5[12S:+12(x-z)2+l8S;+18(>-z)2]

1

x(12xl9+12xl0.82+18x70+18x7.22)=127.36

30

所以总样本的平均数为5=28.8,方差$2=127.36.

(2)依题意可知,¥的所有可能取值为0J2,

设“第i场比赛在甲镇举行,甲镇代表队获胜〃为事件4,“第i场比赛在乙镇举行,甲镇代表

队获胜"为事件4,,=1,2,3,

则P(4)=|,P(8J=;,

4

所以尸(X=0)=

V525

316

P(X=I)=P(力瓦不+筋2以卜尸卜尸像?始上*贵—一

5225

P(X=2)=1—P(X=0)一P(X=1)=葛

所以E(X)=0XW+1X£+2X”=^

25252525

一❹专题训练一

1.(2023•广东梅州・统考一模)为了了解小学生的体能情况,抽取了某小学四年级100名学

生进行一分钟跳绳次数测试,将所得数据整理后,绘制如下频率分布直方图.根据此图,下

B.估计该小学四年级学生的一分钟跳绳的平均次数超过125

C.估计该小学四年级学生的一分钟跳绳次数的中位数约为119

D.四年级学生一分钟跳绳超过125次以上优秀,则估计该小学四年级优秀率为35%

【答案】B

[解析】根据题意可得(0.005*3+0.01+2x+0.02+0.025)x10-1,可得x=().015,故A正确;

根据频率分布直方图可得其平均数为

90x0.05+100x0.15+110x0.2+120x0.25+130x0.15+140x0.1+150x0.05+160x0.05=120.5

,所以B错误;

由频率分布直方图可知,(0.005+0.015+0.02)x10=0.4,而0.4+0.25>0.5,

所以中位数落在区间"5,125)内,设中位数为。,则(4-115)x0.025=0.5-0.4,可得〃=119,

所以C正确;

由图可知,超过125次以上的频率为(0.15+0.1+0.05+0必)xl0=0.35,所以优秀率为35%,

即D正确.

故选:B

2.(2023•广东广州・统考一模)某校随机抽取了100名学生测量体重,经统计,这些学生的

体重数据(单位:kg)全部介干45至70之间,将数据整理得到加图所示的频率分布官方图,

B.这100名学生中体重低于60kg的人数为60

C.据此可以估计该校学生体重的第78百分位数约为62

【答案】AC

【解析】对于A项,因为5x(0.01+a+0.06+0.04+0.02)=l,解得:a=0.07,故A项正确;

对于B项,(0.01+0.07+0.06)x5x100=70人,故B项错误;

对于C项,因为0.01x5+0.07x5+0.06x5=0.7,0.01x5+0.07x5+0.06x5+0.04x5=0.9,

0.7<0.78<0.9,所以第78百分位数位于[60,65)之间,

设第78百分位数为x,则0.01x5+0.07x5+0.06x5+8-60)x0.04=0.7+,解得:x=62,

故c项正确:

对于D项,因为

0.01x5x47.5+0.07x5x52.5+0.06x5x57.5+0.04x5x62.5+0.02x5x67.5=57.25,即:估计

该校学生体重的平均数约为57.25,故D项错误.

故选:AC.

3.(2023•广东惠州•统考模拟预测)在某市高二举行的一次期中考试中,某学科共有2000

人参加考试.为了了解本次考试学生成绩情况,从中抽取了部分学生的成绩(成绩均为正整

数,满分为100分)作为样本进行统计,样本容量为〃.按照

[50,60),[60,70),[70,80)[80,90)[90,10q的分组作出频率分布直方图,如图所示.其中,成绩

落在区间[50,60)内的人数为16.则下列结论正确的有()

)频率/组距

0.040

0.016

0.010

0.004

506070809010°成绩办

A.样本容量〃=1000

B.图中x=0.030

C.估计该市全体学生成绩的平均分为70.6分

D.该市要对•成绩由高到低前20%的学生授予“优秀学生”称号,则成绩为78分的学生肯定

能得到此称号

【答案】BC

[解析】对•于A:因为成绩落在区间[50,60)内的人数为16,所以样本容量〃=--^—=100,

0.016x10

故A不正确;

对于B:因为(0.016+x+0.040+0.010+0.004)xl0=l,解得x=0.030,故B正确;

对于C:学生成绩平均分为:

0.016x10x55+0.030x10x65+0.040x10x75+0.010x10x85+0.004x10x95=70.6,

对于D:010x(0.004+0.010)+(8()-78)x0.040=0.22>0.20,

即按照成绩由高到低前20%的学生中不含78分的学生,所以成绩为78分的学生不能得到此

称号,故D不正确.

故选:BC.

4.(2021•全国高考真题)下列统计量中,能度量样本*,与,…,£的离散程度的是()

A.样本占,々,…,匕的标准差B.样本〃的中位数

C.样本内,工2,…,Z的极差D.样本七广2,…,Z的平均数

【答案】AC

【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定

正确选项.

【详解】由标准差的定义可知,标准差考查的是数据的离散程度;

由中位数的定义可知,中位数考查的是数据的集中趋势;

由极差的定义可知,极差考查的是数据的离散程度:

由平均数的定义可知,平均数考查的是数据的集中趋势;

故选:AC.

5.(2021•全国高考真题)有一组样本数据网,々,…,血,由这组数据得到新样本数据必,

%,・・・,/,其中K=%+c(i=l,2,…,〃),c为非零常数,则()

A.两组样本数据的样本平均数相同

B.两组样本数据的样本中位数相同

C.两组样本数据的样本标准差相同

D.两组样数据的样本极差相同

【答案】CD

【分析】A、C利用两组数据的线性关系有E(y)=风幻+c、D(y)=D(x),即可判断正误;

根据中位数、极差的定义,结合已知线性关系可判断B、D的正误.

【详解】A:E(y)=E(x+c)=E(x)+c且CW0,故平均数不相同,错误;

B:若第一组中位数为七,则第二组的中位数为乂=为+。,显然不相同,错误;

C:。(力=O(x)+O(c)=O(x),故方差相同,正确;

D:由极差的定义知:若第一组的极差为43一Xmin,明第二组的极差为

卜阿一为访=(/咏+')-(/访+')=玉网一/而,故极差相同,正确;

故选:CD

6.为了评估某家快递公司的服务质量,某评估小组进行了客户满意度调查,从该公司参与调

查的客户中随机抽取500名客户的评分,评分均在区间[50,100]上,分组为[50,60),

[60,70),[70,80),[80,90),[90,100],其频率分布直方图如图所示.规定评分在60分

以卜.表示对该公司的服务质量不满意,则这500名客户中对该公司的服务质量不满意的客户

的人数为()

A.15B.16C.17D.18

【答案】A

【解析】由频率分布宜方图可知,评分在区间[50,60)上的频率为

1-(0.007+0.02+0.03+0.04)x10=0.03,

所以评分在区间[50,60)上的客户有0.03x500=15(人),

即对该公司的服务质量不满意的客户有15人.

故选:A

7.已知一组数据的频率分布直方图如图所示,则众数、中位数、平均数分别为()

A.63,64,66B.65,65,67c.55,64,66D.64,65,64

【答案】B

【解析】由频率分布直方组可知,

...60+70

众f数为-------=65;

2

由10x0.03+5x0.04=0.5,所以面枳相等的分界线为65,即中位数为65;

平均数为55x0.3+65x0.4+75x0.15+85x0.1+95x0.05=67.

故选:B.

8.演讲比赛共有10位评委分别给出某选手的原始评分,评定该选手的成绩时,从10个原始

评分中去掉1个最高分、1个最低分,得到8个有效评分.8个有效评分与10个原始评分相

比,不变的数字特征是().

A.中位数B.平均数C.方差D.极差

【答案】A

【解析】设位评委评分按从小到大排列为演

10<X2<A3<X4.--<XS<X9<X10,

则①原始中位数为土产,去掉最低分最高分后剩余工5…

中位数仍为主也,,A正确.

2

-1

②原始平均数X=m(玉-+x2++x4••-+x8+x9+^!0),后来平均数

,=+&+%…+玉+/),平均数受极端值影响较大,

8

「•1与P不一定相同,B不正确;

22

S'2=1[(X2-X)+--+(X9-X)]由②易知,C不正确.

④原极差=玉0-玉,后来极差可能相等可能变小,D不正确.

故选:A.

9.某人从一鱼池中捕得120条鱼,做了记号后再放回池中,经过一段时间后,再从该鱼池中

捕得100,经过发现有记号的也有10条(假定该鱼池中鱼的数量既不减少也不增加)则池

中大约有鱼()

A.120B.1000条C.130条D.1200条

【答案】D

10120

【解析】设池中有大鱼约x条,则由题意可知一=—,解得x=1200,故池中大鱼约

100X

有1200条.

故诜:D.

10.某地区有高中生2400人,初中生有9600人,小学生12000人,此地区教育部门为了了

解本地区中小学生的近视情况及形成原因,要从本地区的中小学生中抽取部分学生进行调查,

已知抽取的高中生人数为12人,则该地区教育部门共抽取了人进行调查()

A.108B.48

C.60D.120

【答案】D

【解析】由地区高中生2400人,初中生有9600人,小学生12000人,设共抽取了x人,

若抽取的高中生人数为12人,

240012

根据分层抽样知:解之得x=120,

2400+9600+12000-T?

故选:D

11.(2021•安徽池州市•池州中高三其他模拟(理)〉某科技企业投资2亿元生产种供5G

智能手机使用的芯片,该芯片因生产原因其性能存在着一定的差异,该企业为掌握芯片的性

能情况,从所生产的芯片中随机抽取了200片进行了性能测试,得到其性能指标值的频数分

布表如下所示(同一组数据用该组数据的区间中点值作代表).

性能指标值/分[40,50)[50,60)[60,701[70,80)[80,90)

频数203040603020

利用样本估计总体的思想,解决下列问题:

(1)估计该科技企业所生产的芯片性能指标值的平均数;

(2)每块芯片的性能等级和纯利润X(单位:元/片,1<"?<4)如下表所示:

性能指标值[40,50)[50,70)[70,90)[90,100]

等级次品。级B级A级

纯利润X-40130/7750m70"?

(i)从该科技企业所生产的芯片中随机抽取3片芯片,试求至少有2片芯片为A级或8级

芯片的概率;

(ii)若该科技企业该芯片的年产量为200万片,其中次品直接报废处理,其他芯片全部能

被手机厂商收购,问:该企业两年之内是否有可能收回总投资?试说明理由.参考数据:

lnl0«2.30.

【答案】(1)平均数为70.5分;(2)(i)0.57475;(ii)两年之内能收回总投资,理由见解

析.

【分析】(1)根据平均数公式计算可得;

(2)首先求出芯片为A级或6级芯■的概率,再根据相互独立事件的概率公式计算可得;

(3)列出芯片的性能指标值与对应概率的表格,求出每块芯片的纯利润的期望值,再利用

导数求出最值:

【详解】解:(1)由题意如,样本平均数为

x=45x0.1+55x0.15+65x0.2+75x0.3+85x0.15+95x0.1=70.5.

所以可以估计该科技企业所生产的芯片性能指标值的平均数为70.5分.

(2)(i)由题意知芯片为A级或8级芯片的概率尸=30+20+60=055,

200

则从该科技企业所生产的芯片中随机抽取3片芯片,至少有2片芯片为A级或B级芯片的

概率为P=1-C^0.453-C;0.452x0.55=0.57475.

(ii)由题意可知,该芯片的性能指标值与对应概率如卜表所示:(1<〃?<4)

性能指标值[40,50)[50,70)[70,90)[90,100]

纯利润-40呼30/7?50w70/«

概率

故每块芯片的纯利润

E(X)=-40emxO.l+30mxO.35+50wx0.45+70/wx0.1=-4e'n+40m,

记丁二石(X),贝1」_/=-4«阳+40=—41"'一10),

令y'=0,得〃7=In10,

故当用£。In10)时,y*>0,y=E(X)单调递增,

当mt=(hi10,4)时,/*<0,y=E(X)单调递减,

所以当m=lnl0^2.30时,V取得最大值,

J/max=—4。短°+40XIn10之一4x10+40x2.30=52(元).

12.(2023•江苏南通・江苏省如皋中学校考模拟预测)某市统计高中生身体素质的状况,规定

身体素质指标值不小于60就认为身体素质合格.现从全市随机抽取100名高中生的身体素

100100

质指标值X,(i=1,23…,100),经计算»=7200,J;X/=100X(7224-36).若该市高中生

/=11=1

的身体素质指标值服从正态分布"(〃,,),则估计该市高中生身体素质的合格率为

.(用百分数作答,精确到0.1%)

参考数据:若随机变量X眼从正态分布Nj,/),则尸(,〃—bWXK〃+bh0.6827,

P{/.t-2<J<X<p+2cr)«0.9545,P(/.i-3a<X<//+3a)»0.9973.

【答案】97.7%

【分析】计算样本的平均数和方差,由此估计〃,。,再结合参考数据求P(X»60).

1100

【详解】因为100个数据毛,X-为,…,的平均值亍=诉»,=72,

1vU/=]

方差s?得即f*唇7004派如"+36)一37436.

所以〃的估计值为〃=72,o■的估计值为。=6.

设该市高中生的身体素质指标值为X,

由P(〃—2b<XK〃+2b)a0.9545,得P(72-124X«72+12)=P(604X«84)10.9545,

l-P(〃-2b<X<〃+2叽1-0.9545

产(X>84)二尸(X〉〃+2o)=?(X<〃-2b)二

22

所以P(X>60)=P(60<^<84)+P(X>84卜0.9545+->:(1-0.9545)=0.97725«97.7%.

故答案为:97.7%.

13.(2023•广东湛江•统考一模)某工厂一台设备生产一种特定零件,工厂为了解该设备的生

产情况,随机抽检了该设备在一个生产周期中的100件产品的关键指标(单位:cm),经统

计得到下面的频率分布直方图:

⑴由频率分布直方图估计抽检样本关键指标的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论