概率与统计重点题型全归纳(思维导图+知识串讲+8大考点+复习提升)-2025年新高二数学暑假专项提升 (人教A版)_第1页
概率与统计重点题型全归纳(思维导图+知识串讲+8大考点+复习提升)-2025年新高二数学暑假专项提升 (人教A版)_第2页
概率与统计重点题型全归纳(思维导图+知识串讲+8大考点+复习提升)-2025年新高二数学暑假专项提升 (人教A版)_第3页
概率与统计重点题型全归纳(思维导图+知识串讲+8大考点+复习提升)-2025年新高二数学暑假专项提升 (人教A版)_第4页
概率与统计重点题型全归纳(思维导图+知识串讲+8大考点+复习提升)-2025年新高二数学暑假专项提升 (人教A版)_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第12讲概率与统计重点题型全归纳

内容导航

向串讲知识:思维导图串讲知识点,有的放矢

重点速记:知识点和关键点梳理,查漏补缺

举一反三:核心考点能举一反三,能力提升

一;复习提升:真题感知+提升专练,全面突破

知识点01分层随机抽样

1、分层随机抽样的必要性

简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能出现比较“极端”

的样本,从而使得估计出现较大的偏差,这时候我们可以考虑采用一种新的抽样方法一分层随机抽样。

2、分层随机抽样的概念

一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总

体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为

分层随机抽样,每一个子总体称为层.

3、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为

比例分配,即:

样本中第n层的个体数样本容量

(1)---------------------------------------=-----------------

总体中第n层的个体数总体容量

,八总体中第m层的个体数样本中第m层的个体数

总体中第n层的个体数样本中第n层的个体数

4、分层随机抽样使用的原则

(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原

则;

(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层

个体数量的比等于抽样比.

5、分层随机抽样的步骤

(1)分层:按某种特征将总体分成若干部分(层);

(2)求比:抽样比k=急;

(3)定数:按抽样比确定每层抽取的个体数;

(4)抽样:每层分贝按简单随机抽样的方法抽取样本

(5)成样:综合各层抽样,组成样本。

知识点02分层随机抽样的平均数计算

1、总体平均数和样本平均数的计算

在分层随机抽样中,如果层数为2层,第1层和第2层包含的个体数分别为M和N,抽样的样本容量分别

为加和〃,第1层、第2层的总体平均数分别为文和歹,第1层、第2层的样本平均数分别为最和亍,总

体平均数为琳,样本平均数为石,则

(i)-=MX+W=^-+^-

M+NM+NM+N

—mx+nym-n—

(2)3=---------=------x+-------y

m+nm+nm+n'

2、用样本平均数估计总体平均数

由于第1层的样本平均数捻可以估计第1层的总体平均数文,用第2层的样本平均数亍可以估计第2层的

总体平均数Y,因此可以用Mx”'=上—星+—2^7估计总体平均数W.

M+NM+NM+N

rnrjTY1n

在比例分配的分层随机抽样中,w已口_,

MNM+N

Lc、rM-N—m-n——

所以------x+---------y=-------x+-------y=co

M+NM+Nm+nm+n

因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数石估计总体平均数为

知识点03频率分布直方图

1、频率分布直方图

(1)列出样本数据的频率分布表和频率分布直方图的步骤:

①计算极差:找出数据的最大值与最小值,计算它们的差;

极差

②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且组距=W;

③将数据分组:通常对组内数值所在左闭右开区间,最后一组取闭区间;

也可以将样本数据多取一位小数分组.

④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.

频率

⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。

(2)频率分布直方图的特点:

频率

①小长方形的面积=组距x=频率,

②个小长方形的面积等于1,

③小长方形的高=雾,所有小长方形的高的和=工.

组距组距

(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,

一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.

(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,

频率分布直方图可以用一条光滑曲线y=/(x)来描绘,这条光滑曲线就叫做总体密度曲线.

总体密度曲线精确地反映了一个总体在各个区域内取值的规律.

2、根据频率分布直方图求平均数、中位数和众数

(1)频率分布直方图中的“平均数”:因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布

直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.

(2)频率分布直方图中的“中位数”:根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也

就有50%的个体大于或等于中位数。因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该

相等,由此可估计中位数的值。

(3)频率分布直方图中的“众数”:根据众数的意义,在频率分布直方图中最高矩形中的某个(些)点的横

坐标为这组数据的众数。一般用中点近似值代替。

知识点04总体百分位数的估计

1、第p百分位数的定义:一般地,一组数据的第°百分位数是这样一个值,它使得这组数据中至少有0%

的数据小于或等于这个值,且至少有(100—P)%的数据大于或等于这个值.

2、计算一组〃个数据的第p百分位数的步骤

第1步,按从小到大排列原始数据.

第2步,计算i=〃xp%.

第3步,若,不是整数,而大于i的比邻整数为j,则第p百分位数为第,项数据;

若i是整数,则第P百分位数为第i项与第0+1)项数据的平均数.

知识点05总体集中、离散趋势的估计

1、相关概念

(1)众数:在样本数据中,出现次数最多的那个数据;

(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,

若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。

(3)平均数:设样本的数据为不,々,,匕,则样本的算术平均数为无=芯+%++%,;

2、众数、中位数和平均数的比较

名称优点缺点

与中位数相比,平均数反映出样本数据中更多的任何一个数据的改变都会引起平均数的改变.数据越

平均数

信息,对样本中的极端值更加敏感“离群”,对平均数的影响越大

不受少数几个极端数据(即排序靠前或靠后的数

中位数对极端值不敏感

据)的影响

众数只能传递数据中的信息的很少一部分,对极端值

众数体现了样本数据的最大集中点

不敏感

3、平均数相关结论:

①如果两组数和乂,的平均数分别是元和歹,则一组数玉+%,%+%,,%+%的平均数

是元+了;

②如果一组数%,马,•,%的平均数为了,则一组数。,如,…,心的平均数为反。

③如果一组数%,飞,,%的平均数为了,则一组数占+。,尤2+“,…,%+。的平均数为元+。

4、用样本的标准差估计总体的标准差

(1)数据的离散程度可以用极差、方差或标准差来描述;

(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;

(3)样本方差描述了一组数据围绕平均数波动的大小;

一般地,设样本的数据为百,马,…,尤”,样本的平均数为元,

定义样本方差为?=区3+(々7厂++(i-可

n

简化公式:S?=—[(X;+芍++x;)—7优"]=一(X;+%+.+X~)—X~

nn

(方差等于原数据平方的平均数减去平均数的平方)

(4)样本的标准差是方差的算术平方根.

样本标准差s=忤F+5F++(斗一互,s20.

Vn

标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围.

(5)方差相关结论:

①如果一组数百,马,,匕的方差为则一组数百+。,尤2+。,,尤的方差为

②如果一组数%,马,,%的方差为r,则一组数防,区2,,应,的方差为人气2。

知识点06事件的关系和运算

1、互斥(互不相容):一般地,如果事件A与事件8不能同时发生,

也就是说ACB是一个不可能事件,即AnB=0,

则称事件A与事件B互斥(或互不相容)

2、互为对立:一般地,如果事件A与事件8在任何一次试验中有且仅有一个发生,

即AU8=Q,且An8=0,那么称事件A与事件8互为对立.

事件A的对立事件记为彳

3、包含关系:一般地,若事件A发生,则事件B一定发生,

我们就称事件B包含事件A(或事件A包含于事件B),

即(或AU8),

特殊情形:如果事件B包含事件A,事件A也包含事件8,即8NA且

则称事件A与事件8相等,记作A=B

4、并事件(和事件):一般地,事件A与事件8至少有一个发生,

这样的事件中的样本点或者在事件A中,或者在事件B中,

则称这个事件为事件A与事件B的并事件(或和事件)AU8(或A+B)

5、交事件(积事件):一般地,事件A与事件B同时发生,

这样的一个事件中的样本点既在事件A中,也在事件8中,

则称这样的事件为事件A与事件B的交事件(或积事件)AC8(或AB)

知识点07古典概型

1、古典概型的定义

我们将具有以下两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.

①有限性:样本空间的样本点只有有限个;

②等可能性:每个样本点发生的可能性相等.

2、古典概型的判断标准

一个试验是否为古典概型,在于这个试验是否具有古典概型的两个特点:有限性和等可能性.并不是所

有的试验都是古典概型.

3、古典概型的概率计算公式

一般地,设试验E是古典概型,样本空间A包含〃个样本点,事件A包含其中的左个样本点,则定义

事件A的概率尸(4)=&=号架,其中,“(A)和"(Q)分别表示事件A和样本空间C包含的样本点个数.

nn(LJ)

知识点08概率的基本性质

1、概率的基本性质

性质1对任意的事件A,都有尸(A)>0.

性质2必然事件的概率为1,不可能事件的概率为0,即尸(。)=1,

尸(0)=0.

性质3如果事件A与事件B互斥,那么P(4UB)=P(A)+P(B).

推广:如果事件4,A2,Am.两两互斥,那么事件

4U4U…U4n发生的概率等于这m个事件分别发生的概率

之和,即P(4U4U…U4)=P(Ai)+P(A2)+...+P(Affl).

性质4如果事件A与事件5互为对立事件,那么尸(B)=1-P(A),

P(A)=1-P(B).

性质5如果4U3,那么P(A)<P(B).

性质6设A,8是一个随机试验中的两个事件,我们有尸(4UB)=P

(A)+P(B)-P(4AB).

2、复杂事件概率的求解策略

(1)对于一个较复杂的事件,一般将其分解成几个简单的事件,当这些事件彼此互斥时,原事件的概率就是

这些简单事件的概率的和.

(2)当求解的问题中有“至多”“至少”“最少”等关键词语时,常常考虑其对立事件,通过求其对立事件的概率,

然后转化为所求问题.

注:概率的一般加法公式P(AU8)=P(A)+P(B)-P(AnB)中,易忽视只有当AC8=0,即A,B互斥时,

P(AUB)=P(A)+P(B),此时P(AHB)=O.

知识点09事件的相互独立性

1、定义:对任意两个事件A与3,如果尸(AB)=尸(A)尸(5)成立,则称事件A与事件2相互独立,简称为

独立.

概念理解:(1)事件A与B相互独立式事件A的发生不影响事件B发生的概率,事件B的发生不影响事

件A发生的概率;

(2)由连个事件相互独立的定义,容易验证必然事件Q、不可能事件0都与任意事件相互独立,这是因为

必然事件Q总会发生,不会受任何事件是否发生的影响;同样不可能事件0总不会发生,也不会受任何事

件是否发生的影响,当然他们也不影响其他事件是否发生。

2、性质:如果事件A与事件B相互独立,则A与百,可与8,可与后也都相互独立。

3、两个相互独立事件同时发生的概率乘法:事件A与事件8相互独立,则尸(AB)=P(A)尸(8)

4、推广:两个事件的相互独立可以推广到〃(〃〉2,”eN*)个事件的相互独立性,即若事件,从相

互独立,则这〃个事件同时发生的概率尸(444)=P(A)尸(4)p(4)

知识点10判断事件是否相互独立的方法

1、直接法:若事件A的发生对事件8的发生概率没有影响,反之亦然,则这两个事件是相互独立的,这是

从定性的角度进行判断。

2、公式法:若对两事件A,B有P(AB)=P(A)P(B),则事件A,2相互独立.

用相互独立事件的乘法公式解题的步骤:

(1)用恰当的字母表示题中有关事件;

(2)根据题设条件,分析事件间的关系;

(3)将需要计算概率的事件表示为所设事件的乘积或若干个事件的乘积之和(相互乘积的事件之间必须满足

相互独立);

(4)利用乘法公式计算概率.

知识点11相互独立事件的概率计算公式

已知两个事件A,8相互独立,它们的概率分别为P(A),P(B),则有

事件表示概率

A,B同时发生ABP(A)P(8)

A,2都不发生~ABP(A)P(B)

A,8恰有一个发生网网P(A)P(B)+P(A)P(B)

A,B中至少有一个发生(AB)IJ(AB)i|(AB)P(A)P(B)+P(A)P(B)+P(A)P(B)

A,8中至多有一个发生(AB).(AB)l(AB)P(A)P(B)+P(A)P(B)+P(A)P(B)

►►►核心考点举一反三<<<

【考点一:分层随机抽样】

一、单选题

1.(24-25高一下・甘肃兰州•期中)一个公司共有名210员工,要采用分层抽样方法从全体员工中抽取一个

容量为30的样本.己知某部门有70名员工,那么从这一部门抽取的员工人数为()

A.9B.6C.10D.8

【答案】C

【分析】由题意列出比例式即可求解.

【详解】设所求为无,则《=券,解得》=1。・

故选:C.

2.(24-25高一下・甘肃张掖•期中)某学校有教师200人,男学生1200人,女学生1000人.现用分层抽样的

方法从全体师生中抽取一个容量为〃的样本,已知从女学生中抽取的人数为50,则〃的值为()

A.100B.120C.150D.180

【答案】B

【分析】根据女学生的抽样比与总体的抽样比相等列方程即可求解.

【详解】由题得,2。。+/+1。。。=/'解得"“O’

故选:B.

3.(24-25高一下•河南周口・月考)某校高一年级共有2000人,其中男生1200人,女生800人,某次考试

结束后,学校采用按性别分层随机抽样的方法抽取容量为〃的样本,已知样本中男生比女生人数多8人,则

〃=()

A.20B.30C.40D.48

【答案】C

【分析】利用分层抽样的性质直接求解.

【详解】根据分层抽样的性质可知,样本中男生人数为:”就=呆,

样本中女生人数为:"黑=三,

由题意,所以三-滑=8,

所以〃=40.

故选:C

4.(23-24高一上•浙江杭州•期中)某中学高一学生500人,其中男生300人,女生200人,现获得全体学

生的身高信息,采用样本量比例分配的分层抽样方法,抽取了容量为50的样本,经计算得到男生身高样本

均值为171cm,方差为29cm2;女生身高样本均值为161cm,方差为19cm"下列说法中不正确的是()

A.男生样本容量为30B.每个男生被抽入到样本的概率均为《

C.所有样本的均值为167cmD.所有样本的方差为45cm②

【答案】D

【分析】根据分层抽样的抽样比公式,以及均值和方差公式,即可求解.

【详解】A.由题意可知,男生应抽取300x或=30人,故A正确;

B.每个男生被抽入到样本的概率均为黑=吃,故B正确;

C.所有样本的均值为生理|寿上史=167cm,故C正确;

D.所有样本的方差为八3。[29+(171-167)[+2。[19+(161-167)上仅故口错误.

50

故选:D

5.(23-24高一下.福建福州.期末)某学校高一年级男生共有490人,女生共有510人,为调查该年级学生

的身高情况,通过按比例分配的分层抽样,得到男生和女生样本数据的平均数和方差分别为,,元和

若W=兀,S;=20,5;=30,则该校高一年级全体学生身高的方差为.

【答案】25,1

【分析】结合分层随机抽样的方差公式可得答案

49049

【详解】学校高一年级男生共有49。人,所占比例为取而‘女生51。个,所占比例为

510_51

490+510-WO)

故该校高一年级全体学生的年龄方差为:S?=高5;+(")[+^卜;+伍-可2

_--———°49S1

当玉=20,S;=30时,x=^=x2,=j^x20+:j^x30=25.1,

故答案为:25.1.

【考点二:频率分布直方图】

一、多选题

1.(24-25高一下•浙江金华•期中)饮料瓶的主要成分是聚对苯二甲酸乙二醇酯,简称“PET”.随着垃圾分

类和可持续理念的普及,饮料瓶作为可回收材料的“主力军”之一,得以高效回收,获得循环再生,对于可持

续发展具有重要意义,上海某高中随机调查了该校某两个班G4班,8班)5月份每天产生饮料瓶的数目(单

位:个),并按[10,20),[20,30),[30,40),[40,50),[50,60),[60,70]分组,分别得到频率分布直方图如下:下列

瓶数(个)瓶数(个)

Z班8班

A.A班该月平均每天产生的饮料瓶个数估计为41

B.8班5月产生饮料瓶数的第75百分位数一

C.已知该校共有学生1000人,则约有150人5月份产生饮料瓶数在[40,50)之间

D.m=0.025

【答案】ABD

【分析】由频率分布直方图的性质可求得加,通过计算频率、频数、平均值、百分位数即可得到正确选项.

【详解】A班该月平均每天产生的饮料瓶个数估计为

10x(15x0.005+25x0.015+35x0.030+45x0.020+55x0.025+65x0.005)=41,故A正确;

由10x(Q005+0.020+〃z+0.020+0.015+0.015)=l,解得m=0.025,故D正确;

(0.005+0.020+0.025+0.020)x10=0.7<0.75,

(0.005+0.020+0.025+0.020+0.015)x10=0,85>0.75,

故B班5月产生饮料瓶数的第75百分位数超位于[50,60)中,

所以10X(0.005+0.020+0.025+0.020)+(x2-50)x0.015=0.75,

解得无2=浮,故B正确;

A班和8班5月份产生饮料瓶数在[40,50)的频率均为0.020x10=0.2,

故该校学生5月份产生饮料瓶数在[40,50)的频率也为Q2,

因为1000x0.2=200,

所以该校约有200人5月份产生饮料瓶数在[40,50)之间,故C错误.

故选:ABD.

2.(2025・四川自贡•三模)为了解本地区居民用水情况,甲、乙两个兴趣小组同学利用假期分别对A、B两

个社区随机选择100户居民进行了“家庭月用水量”的调查统计,利用调查数据分别绘制成频率分布直方图

(如图所示).甲组同学所得数据的中位数、平均数、众数、标准差分别记为卬、王、耳、与,乙组同学所

得数据的中位数、平均数、众数、标准差分别记为出、%、&、S?.则下列判断正确的有().

A.4<小且玉<%.B.4<仇且名>52.

C.4>%且电=%.D.白<弓<尤1.

【答案】ABD

【分析】根据频率分布直方图的中位数,平均数公式,众数公式,可判断结果,标准差是衡量数据的离散

程度,数据越集中,标准差越小,从而可判断标准差.

【详解】中位数的计算与比较:

由图甲可判断甲组数据的中位数%在[7,10.5)内,

第一组[0,3.5)的数据的频率为0.01x3.5=0.035,第二组[3.5,7濒率为0.10x3.5=0.35,

贝!]0,035+0.35+(4-7)x0.05=0.5,解得%=9.3,

由图乙可判断乙组数据的中位数出在[10.5,14)内,

贝110.01x3.5+0.07x3.5+(%—10.5)x0.105=0.5,解得的它12.595,所以《<出.

平均数的计算与比较:

甲组平均数芯:

%=(1.75x0.01+5.25x0.1+8.75x0.05+12.25x0.04

+15.75x0.03+19.25x0.03+22.75x0.025)x3.5«10.811,

乙组平均数%:

x2=(1.75x0.01+5.25x0.02+8.75x0.05+12.25x0.105

+15.75x0.06+19.25x0.025+22.75x0.015)x3.5《12.648,

所以演<次2.

众数的计算与比较:

由图甲可得甲组众数伪=后匚=5.25;

由图乙可得乙组众数12.25,所以仇.

标准差的比较:

因甲组数据分布相对分散,乙组数据相对集中在中间区间,所以Sj>S2.

对于A,由前面计算可知可<出且占<%,故A正确;

对于B,因仿<仇且当>$2,故B正确;

对于C,由前分析得玉-10.811,%=9.3,不,

x2«12.648,%x12.595,a2>x29故C错误;

对于D,因4=5.25,%=9.3,«10.811,贝(],故D正确.

故答案选ABD.

二、解答题

3.(24-25高一下•吉林长春・月考)为增强市民节能环保意识,某市面向全市征召义务宣传志愿者,现从符

合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:

分组(单位:岁)频数频率

[20,25)50.05

[25,30)①0.20

[30,35)35②

[35,40)300.30

[40,45)100.10

总计1001.00

O8A频率/组距

O7

O6

O5

O4

O3

O2

O1

O202530354045年龄/岁

(1)频率分布表中的①②位置应填什么数据?

(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数;

(3)现用比例分配的分层随机抽样从[30,35)、[35,40)、[40,45)的样本中共抽取几名志愿者,已知从[40,45)中

抽取了2人,求〃的值.

【答案】⑴①应填20,②应填0.35;

⑵直方图见解析,人数为175;

⑶15

【分析】(1)结合抽取的总人数,结合表格中数据,计算出结果;

(2)计算出[25,30)区间的频率/组距,绘制直方图,并利用年龄在[30,35)岁的频率得到答案;

(3)计算出三个区间的比例,从而计算出从[30,35)、[35,40)中分别抽取的人数,得到答案.

„„35

【详解】(1)①应填0.20x100=20,②应填为=0.35;

(2)[25,30)区间的频率为0.20,故频率/组距为0.20+5=0.04,

故补全频率分布直方图,如下:

O8

O7

O6

O5

O4

O3

O2

O1

O202530354045年龄/岁

这500名志愿者中年龄在[30,35)岁的人数为0.35x500=175;

(3)[30,35)、[35,40)、[40,45)的人数比例为0.07:0.06:0.02=7:6:2,

从[40,45)中抽取了2人,故从[30,35)、[35,40)中分别抽取了7人和6人,

故“=7+6+2=15.

4.(24-25高一下•广西贵港•月考)为了了解某工厂生产的产品情况,从该工厂生产的产品中随机抽取了一

个容量为100的样本,测量它们的尺寸(单位:mm),并将数据分为

[92,94),[94,96),[96,98),[98,100),[100,102),[102,104),[104,106]七组,其频率分布直方图如图所

示.

(1)求图中的X值;

(2)根据频率分布直方图,用分层随机抽样的方法从[94,96),[100,102)两个区间共抽取出7个产品,则每个

区间分别应抽取多少个产品;

(3)记产品尺寸在[98,102)内为A等品,每件可获利6元;产品尺寸在[92,94)内为不合格品,每件亏损2元;

其余为合格品,每件可获利3元.若该工厂一个月共生产2000件产品,以样本的频率代替总体在各组的频

率,若单月利润未能达到10000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实

施升级改造.

【答案】(1)0.12

⑵在[94,96)内抽取2个产品,在[100,102)内抽取5个产品

(3)需要对该工厂设备实施升级改造

【分析】(1)根据频率分布直方图中所有小矩形的面积之和为1进行求解即可;

(2)根据频率分布直方图中的求出两个区间的频数,然后结合分层抽样定义即可得解;

(3)根据题意,结合频率分布直方图中的数据求出月利润,最后比较大小即可.

【详解】(1)S(0.02+0.04+0.06+0.07+0.09+0.10+x)x2=1,解得-0.12

(2)100件样本中,尺寸在[94,96)内的样本数为100*0.04x2=8;尺寸在[100,102)内的样本数为

100x0,1x2=20.

Q

由分层随机抽样可知,在[94,96)内抽取产品数为:7xJ至=2个产品,在[100,102)内抽取产品数为:

o+20

7x2^0-=5个产品.

8+20

即在[94,96)内抽取2个产品,在[100,102)内抽取5个产品.

(3)由题意可得,这批产品中4等品有2000x(0.09x2+0.10x2)=760(件),

这批产品中不合格品有2000*0.02x2=80(件),

这批产品中合格品有2000-760-80=1160(件),

760x6+1160x3-80x2=7880(元).

所以该工厂生产的产品一个月所获得的利润为7880元,

因为7880<10000,所以需要对该工厂设备实施升级改造.

5.(24-25高一下•云南昆明•期中)云南师大附中在组织选拔数学英才班的过程中,对高一年级的300名学

生进行了一次测试.已知参加此次测试的学生的分数尤g=1,2,,300)全部介于45分到95分之间,学校将

所有分数分成5组:[45,55),[55,65),…,[85,95],整理得到如图所示的频率分布直方图(同组数据以这

组数据的中间值作为代表).

(1)求机的值,并估计此次校内测试分数的平均值三;

(2)学校要求按照分数从高到低选拔首100名的学生进行培训,试估计这100名学生的最低分数(计算结果

保留一位小数);

⑶试估计这300名学生的分数不。=1,2,,300)的方差S2,并判断此次得分为63分和86分的两名同学的成

绩是否进人到了[元-s,元+s]范围内?

(参考公式:S2=,££(%-丁)-其中方为各组频数,参考数据:7129«11.4),

n1=1

【答案】(1)机=。-024,元=75

⑵81.3

⑶s?=129;答案见详解

【分析】(1)先由各组的频率和为1,求出机,然后利用平均数的定义可求出最,

(2)先求出这100名学生的最低分数就是该次校内测试分数的67%分位数,然后利用百分位的定义求解即

可,

(3)先利用方差公式求出方差后再判断即可

【详解】(1)(0.006+0.014+m+0.036+0.020)x10=1,所以〃z=0.024,

所以该次校内考试测试分数的平均数的估计值为:

50x0.06+60x0.14+70x0.24+80x0.36+90x0.2=75^-.

300—10099

(2)因为--------=-,0.06+0.14+0.24=0.44<-<0.8=0.06+0.14+0.24+0.36

30033

设这100名学生的最低分数为a,

2

贝!]0.06+0.14+0.24+0.036(a-75)=-,解得aa81.3

所以这100名学生的最低分数的估计值为81.3分.

1nC

(3).?=-

ni=i

=0.06x(50-75)2+0.14x(60-75)2+0.24x(70-75)2+0.36x(80-75)2+0.2x(90-75)2

二129,

/.s=J129e11.4,/.x-s=63.6,x+s=86.4,

故得分为63分的同学的成绩没有进入到[63.6,86.4]内,

得分为86分的同学的成绩进入到了[63.6,86.4]内.

即:得分为63分的同学的成绩没有进入到门-5,元+s]范围,

得分为86分的同学的成绩进入到叵-s,元+s]范围了.

6.(24-25高一下•江西抚州•期中)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为

样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],

得到如图所示的频率分布直方图.

(1)求频率分布直方图中。的值及样本成绩的第80百分位数;

(2)已知落在区间[50,60)的样本平均成绩是57,方差是7,落在区间[60,70)的样本平均成绩为66,方差是4,

求两组样本成绩合并后的平均数三和方差

参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:加,

x,打;",九s;记总的样本平均数为了,样本方差为$2,则s2=S=,[s;+(元一同]+“、;+(歹一切)1).

【答案】(1)0=0.025,第80百分位数为86

(2)2=63,总方差23.

【分析】(D根据百分位数定义利用频率分布直方图计算可得结果;

(2)代入由样本方差计算总体方差的公式计算可得结果.

【详解】(1)由题意知0.05+0.1+0.2+0.3+10。+0.1=1,解得。=0.025;

成绩在[40,80)的频率为0.65,成绩在[40,90)的频率为0.9,

故第80百分位数在(80,90)之间,则0.65+(m-80)x0.025=0.8,

解得m=86,

故第80百分位数为86;

(2)由频率分布直方图知,这100份答卷分数在[50,60)的份数为100x0.1=10,

分数在[60,70)的份数为100x0.2=20,

57x10+66x20

所以建二63

30

1卜(『]+)

总方差/0x17+57—6320]4+(66—632]j=23.

10+20

【考点三:总体百分位数的估计】

一、单选题

1.(23-24高一下•山东淄博・期末)己知一组数据2,3,4,1,5,则其上四分位数为()

A.1B.2C.3D.4

【答案】D

【分析】从小到大排序后直接求解即可.

【详解】数据从小到大排序得到1,2,3,4,5,上四分位数即为75%分位数.由于75%x5=3.75,则第4

个数即4为上四分位数.

故选:D.

2.(23-24高一下•西藏拉萨•期末)如图所示,某市5月1日到10日PM?5日均值(单位:ug/n?)变化的

折线图,则该组数据的第54百分位数为()

}日均值/Qig/n?)

.................................................»

U12345678910日期

A.45B.48C.60D.80

【答案】A

【分析】先将各数据从小到大排列,再根据求百分位数的步骤可得.

【详解】5月1日到10日PMZ5日均值从小到大依次30,32,34,40,41,45,48,60,78,80,

由于10x54%=5.4,故第6个数据45即为第54百分位数,

故选:A.

3.(24-25高一上.河南南阳・期末)将10个数据按照从小到大的顺序排列如下:7,8,13,15,17,18,

18,a,25,27,若该组数据的70%分位数是19,则"=()

A.20B.21C.23D.24

【答案】A

【分析】根据百分位的定义计算即可求解.

【详解】因为10x70%=7,所以该组数据的70%分位数是第7个数据和第8个数据的平均数,

所以号1=19,解得。=20.

故选:A.

4.(23-24高一下•天津南开•月考)某校举办了数学知识竞赛,并将1000名学生的竞赛成绩(满分100分,

成绩取整数)整理成如图所示的频率分布直方图,则以下四个说法正确的个数为()

②估计这组数据的众数为75

③估计这组数据的下四分位数为60

④估计成绩高于80分的有300人

A.1B.2C.3D.4

【答案】D

【分析】利用频率分布直方图的性质判断①,利用众数、百分位数的求法判断②③,根据频率分布直方图

计算可估计总体判断④.

【详解】由频率分布直方图可知10x(2a+3a+3a+6a+5a+a)=1,解得。=0.005,①正确;

根据频率分布直方图可知众数落在区间[70,80),用区间中点表示众数,即众数为75,②正确;

前两组频率之和为(0.01+0.015)x10=0.25,所以这组数据的下四分位数为60,③正确;

成绩高于80分的频率为(0。25+0.005)x10=0.3,所以估计总体成绩高于80分的有1000x0.3=300人,④

正确;

综上①②③④正确,

故选:D

5.(23-24高一下.新疆伊犁•期末)某校高一年级一共有1500名同学参加数学测验,已知所有学生成绩的

第70百分位数是92分,则数学成绩不小于92分的人数至少为()

A.420B.350C.450D.400

【答案】C

【分析】设X表示学生数学成绩,根据百分位数定义知P(X<92)<70%,进而求数学成绩不小于92分的

人数最小值.

【详解】若X表示学生数学成绩,则X<92的人数占比PW70%,

故X292的人数占比P1-70%=30%,

所以数学成绩不小于92分的人数至少为1500x30%=450人.

故选:c

二、填空题

6.(2024高一下•全国・专题练习)某地区为了解最近11天该地区的空气质量,调查了该地区过去11天小

颗粒物的浓度(单位:ktg/m3),数据依次为53,56,69,70,72,79,65,80,45,41,以加>50).已知这组数据的极

差为40,则这组数据的第加百分位数为.

【答案】79

【分析】根据极差求得加的值,计算81%xll=8.91,根据百分位数的含义即可确定答案即可.

【详解】由题意得,数据的极差为40,因为数据中最小值为41,

故机应为最大值,为81,则81%xll=8.91,

将数据53,56,69,70,72,79,65,80,45,41,81从小到大排列为:

41,45,53,56,65,69,70,72,79,80,81,,

故这组数据的第机百分位数为第九个数据79.

故答案为:79

【考点四:平均数、方差等数据特征的计算】

一、单选题

1.(24-25高一下•广西贵港•月考)某社区通过公益讲座以普及社区居民的垃圾分类知识,为了解讲座效果,

随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲

座前和讲座后问卷答题的正确率如图,则()

八正确率

100%----------

95%--------------------------------*------------冰

90%-―-------------•--------------*--------------

85%------―--------------■♦--------*—♦

80%--------.---------------------*——*讲座前

75%-..................................•讲座后

70%--------*------------------------

65%-*------------2-----------------

60%■

I

Oi之31%。Si'o京民编号

A.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

B.讲座前问卷答题的正确率的中位数小于70%

C.讲座后问卷答题的正确率的70百分位数是90%

D.讲座后问卷答题的正确率的平均数大于85%

【答案】D

【分析】根据极差、中位数、百分位数、平均数定义逐项计算判断即可求解.

【详解】根据数据分析得到如下结果:

12345678910

讲座前65%60%70%60%65%75%90%85%80%95%

讲座后90%85%80%90%85%85%95%100%85%100%

对于A选项,讲座前问卷答题正确率的极差为95%-60%=0.35,

讲座后问卷答题的正确率的极差为100%-80%=0.2,

0.2<0.35,所以A错误;

对于B选项,讲座前问卷答题正确率从小到大排列为:

60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,

正确率的中位数为70%:75%=726%>70%,B错误;

对于C选项,讲座后问卷答题的正确率从小到大排列为:

80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,

因为10x0.7=7,所以讲座后问卷答题的正确率的70百分位数是:

90%+95%

=92.5%所以C错误,

2

对于D,讲座后问卷答题的正确率的平均数为:

80%+4X85%+2X::%+95%+2X100%=89.5%>85%,D正确.

故选:D

2.(24-25高一下•广西桂林•开学考试)设一组样本数据王…,x,的平均数为3,方差为4,则数据

3玉+1,3%+1,",3x,+1的标准差为()

A.12B.3月C.6D.36

【答案】C

【分析】根据方差的性质得到3%+1,3%+1,,3匕+1的方差,进而得到标准差.

【详解】玉,%,,%的方差为4,故3再+1,3%+1,,3%+1的方差为4x3z=36,

故标准差为A/36=6.

故选:C

3.(24-25高一上•河南南阳・月考)已知一个样本容量为10的样本平均数为5,方差为16现将样本中的3

个数据4,5,6去掉,则去掉后剩余样本容量为7的样本平均数元和52是()

A.5,1B.5,2C.5,3D.4,3

【答案】B

【分析】根据平均数与方差的计算公式,分别表示出去掉前后两组数据的平均数与方差,将条件等式整体

代入计算即可.

【详解】由均值"+咒0…•+&=5得为+3+……+不。=50.

2

方差([(药-5)2+(巧-5『+……+(X10-5)]=1.6

222

得(%—5)+(x2—5)+.......+(%o—5)=16.

不妨设设%8=4,芯=5,芯0=6,贝J)

_%[+%,+..........+X-,50-15_

x=--------------------=---------=5,

77

12222

S="[(七一5)2+(%-5)2+……+(^10-5)-(4-5)-(5-5)-(6-5)]=|X(16-2)=2,

故选:B.

4.(24-25高一下•安徽宿州•期中)已知互不相等的一组数占,马,尤3,4%,的平均数为Z,方差为T,

右X],X],三,,尤$,%,多的方差为sg,贝!]()

A.s;>s;B.s;=s;

C.s:<s;D.s;与只的大小关系不确定

【答案】C

【分析】根据平均值的性质求得平均数,然后利用方差的概念求解即可判断各项.

[详解]由题意可知,++―=玉,

所以玉+々+尤3+匕+尤5+%+/=7/,则%+%+-+;+尤5+%+%=了,

所以数据%,马,吃,匕,%,%,%的平均数是国,

(%一国》+(当一%)2+(三一/下+(又一玉丫+(毛一毛丫+(%一毛?+(毛一七)2

8

s;与只的分子相同,比较分母,可知s;<s分

故选:C

5.(2025高一•全国•专题练习)己知5名篮球运动员在某场比赛中的得分均为个位数,且平均数、中位数

和极差均为6,则当方差取最大值时,这组得分的第60百分位数是()

A.6B.6.5C.7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论