统计与概率-2023届高考数学一轮复习学案

上传人：追*** IP属地：河北上传时间：2025-03-04 格式：PDF 页数：62 大小：7.83MB 积分：12 举报 版权申诉

已阅读5页，还剩57页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

统计与概率

【知拥直讲解】

一、随机抽样

1.样本、样本量

我们把从总体中抽取的那部分个体称为样本，样本中包含的个体数称为样本

容量，简称样本量。调查样本获得的变量值称为样本的观测数据，简称样本数据。

例1.下列调查中，调查方式选择合理的是（）

A.了解某市高一年级学生的身高情况，选择普查

B.了解长征运载火箭的设备零件质量情况，选择抽样调查

C.了解一批待售袋装牛奶的细菌数是否达标，选择普查

D.了解病人血液中血脂的含量，选择抽样调查

【答案】D

【详解】AC的总量太大，不适合普查，AC不正确；

火箭的设备零件质量情况应该选择普查，B不正确；

病人血液中血脂的含量应选择抽样调查，D正确.

2.简单随机抽样

（1）定义

一般地，设一个总体含有〃（及为正整数）个个体，从中逐个抽取“ci

个个体作为样本，如果抽取是放回的，且每次抽取时总体内的各个个体被抽到的

概率都相等，我们把这样的抽样方法叫做放回简单随机抽样；如果抽取是不放回

的，且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等，我们把这

样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽

样统称为简单随机抽样

（2）常用方法：抽签法、随机数法。

例2.对50件样品进行编号01,02,......,50,在如下随机数表中，指定从2行

第3组第一个数开始，从左往右抽取两个数字，抽取5个编号，则抽到的第3

个编号是（）

486285008938155698822776173903

536660891248395326163490563640

006207961329901923643865964526

A.48B.24C.26D.49

【答案】C

【详解】按随机数表法，从随机数表从2行第3组第一个数开始，从左往右抽取

两个数字，则编号依次为48,39,26,16,34,

则抽到的第3个编号是26,故选：C

3.分层随机抽样

(1)定义

一般地，按一个或多个变量把总体划分成若干个子总体，每个个体属于且仅

属于一个子总体，在每个子总体中独立地进行简单随机抽样，再把所有子总体中

抽取的样本合在一起作为总样本，这样的抽样方法称为分层随机抽样，每一个子

总体称为层。在分层随机抽样中，如果每层样本量都与层的大小成比例，那么称

这种样本量的分配方式为比例分配。

(2)总体平均数

比例分配的分层随机抽样中，

总体平均数/=悬％+急y=f%+扁y=w

例3.某区域大型城市、中型城市、小型城市的数量之比为2:机:1,为了解该区

域城市的空气质量情况，现用比例分配的分层抽样方法抽取一个容量为〃的样本.

在样本中，中型城市比大型城市多4个，比小型城市多8个，则〃=()

A.24B.28C.32D.36

【答案】A

【详解】根据分成抽样等比例关系可设抽取的大中小型城市的数量分别为

2x,nvc,x,

,f//ix-2x=4人=4~

则，0,解得〈c,所以〃=2%+"比+x=24.

\mx-x=Q\m=3

二、常用统计图表

1.频率分布直方图

(1)画法

第一步：求极差，决定组数和组距，组距=空;

组数

第二步：分组，通常对组内数值所在区间取左闭右开区间，最后一组取闭区间;

第三步：登记频数，计算频率，列出频率分布表。

(2)特点

①纵轴表示标，即小长方形的高=标;

频率

②小长方形的面积=组距X=二=频率;

组距

③各小长方形的面积的总和等于1.

例4.某品牌家电公司从其全部200名销售员工中随机抽出50名调查销售情况,

销售额都在区间[5,25](单位：百万元)内，将其分成5组：[5,9),[9,13),[13,17),

[17,21),[21,25],并整理得到如下的频率分布直方图，下列说法正确的是()

频率

组距

0.03

0.02

销售额/百万元

A.频率分布直方图中a的值为0.07

B.估计全部销售员工销售额的众数与中位数均为15

C.估计全部销售员工中销售额在17百万元以上的有12人

D.估计全部销售员工销售额的第20百分位数约为10.5

【答案】D

【详解】

由频率分布直方图可知4x(0.02+a+0.09+0.03+0.03)=l,

解得a=0.08,所以A错误，

由频率分布直方图可知众数为15,

因为前2组的频率和为4x0.02+4x0.08=0.4<0.5,前3组的频率和为

4x0.02+4x0.08+4x0.09=0.76>0.5,所以中位数在第3组，设中位数为工，则

0.4+0.09（x-13）=0.5,解得x*14.1，所以B错误，

由频率分布直方图可知销售额在17百万元以上的频率为4x（0.03+0.03）=0.24,所

以全部销售员工中销售额在17百万元以上的约有0.24x200=48人，所以C错误，

因为第1组的频率为0.08,前2组的频率和为0.4,所以第20百分位数在第2组，

设第20百分位数为）1则4x0.02+0.08（、-9）=0.2,解得y=10.5,所以全部销售员

工销售额的第20百分位数约为10.5,所以D正确，

2.条形图

建立直角坐标系，用横轴（横轴上的数字）表示样本数据类型，用纵轴上的单

位长度表示一定的数量，根据每个样本（或某个范围内的样本）的数量多少画出长

短不同的等宽矩形，然后把这些矩形按照一定的顺序排列起来，这样一种表达和

分析数据的统计图称为条形图；

3.折线图

建立直角坐标系，用横轴上的数字表示样本值，用纵轴上的单位长度表示一

定的数量，根据样本值和数量的多少描出相应各点，然后把各点用线段顺次连接，

得到一条折线，用这种折线表示出样本数据的情况，这样的一种表示和分析数据

的统计图称为折线图；

例5.如图是民航部门统计的2021年春运期间12个城市售出的往返机票的平均

价格以及相比去年同期变化幅度的数据统计图表，根据图表，下面叙述不正确的

是（）

A.深圳的变化幅度最小，北京的平均价格最高

B.天津和重庆的春运期间往返机票价格同去年相比有所上升

C,平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门

D.平均价格从高到低居于前三位的城市为北京、深圳、广州

【答案】C

【详解】从折线图看，深圳的涨幅最接近0%,从条形图看，北京的平均价格最

高，故A正确；

从折线图看，天津和重庆的的涨幅均为正值，故B正确；

从折线图看，平均价格的涨幅从高到低居于前三位的城市为天津、西安、南京，

故C错误；从条形图看，平均价格从高到低居于前三位的城市为北京、深圳、广

州，故D正确.

4.扇形图

用一个圆表示总体，圆中各扇形分别代表总体中的不同部分，每个扇形的大

小反映所表示的那部分占总体的百分比的大小，这样的一种表示和分析数据的统

计图称为扇形图.

例6.南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔｛Florence

Nightingale1820-1910）设计的，图中每个扇形圆心角都是相等的，半径长短表

示数量大小.某机构统计了近几年中国知识付费用户数量（单位：亿人次），并

绘制成南丁格尔玫瑰图如下，根据此图，下列说法错误的是（）

A.2015年至2022年，知识付费用户数量逐年增加

B.2016年至2022年，知识付费用户数量逐年增加量2018年最多

C.2022年知识付费用户数量超过2015年知识付费用户数量的10倍

D.2016年至2022年，知识付费用户数量的逐年增加量逐年递增

【答案】D

【详解】

对于A,由图可知，2015年至2022年，知识付费用户数量逐年增加，故A正确；

对于BD,知识付费用户数量的逐年增加量分别为：2016年，0.96-0.48=0.48;

20174,1.88-0.96=0.92；20184,2.95-1.88=1.07；20194,3.56-2.95=0.61；

20204,4.15-3.56=0.59；20214,4.77-4.15=0.62：2022年，5.27-4.77=0.5,

可知知识付费用户数量逐年增加量2018年最多，故B正确，D错误；

对于C,由5.27>0.48x10,即2022年知识付费用户数量超过2015年知识付费用

户数量的10倍，故C正确；

三、用样本的数字特征估计总体

1.百分位数

（1）一般地，一组数据的第p百分位数是这样一个值，它使得这组数据中至少

有p%的数据小于或等于这个值，且至少有（100-P）%的数据大于或等于这个

值。

例7.某校从参加高一年级期中考试的学生中随机抽取10名学生，统计他们的

数学成绩如下：（满分：100分）

学生ABCDEFGHIJ

成绩（分）82816578687596908872

由此可知，这10名学生期中考试数学成绩的75%分位数是（）分.

A.81B.82C.85D.88

【答案】D

【详解】10名学生期中考试数学成绩由小到大排列为65,68,72,75,78,81,82,88,90,96,

因为10x75%=7.5,故这10名学生期中考试数学成绩的75%分位数为88,

（2）四分位数

常用的分位数有第25百分位数，第50百分位数（即中位数），第75百分

位数。这三个分位数把一组由小到大排列后的数据分成四等份，因此称为四分位

数。其中第25百分位数也称为第一四分位数或下四分位数，第75百分位数也称

为第三四分位数或上四分位数。

例8.按从小到大顺序排列的9个数据:10,16,25,33,39,43,m,65,70,

若这组数据的第一四分位数与第三四分位数的和是73,则相等于()

A.40B.48C.50D.57

【答案】B

【详解】对于已知9个数据：10,16,25,33,39,43,〃?,65,70,

•••9x25%=2.25,，第一四分位数为25,

•.9x75%=6.75,二第三四分位数为切，,25+帆=73,解得m=48.

2.总体集中趋势的估计

(1)中位数：将一组数据按大小依次排列，处于最中间位置的一个数据(或最中

间两个数据的平均数)叫做这组数据的中位数.

(2)众数：一组数据中出现次数最多的数据叫做这组数据的众数.

(3)平均数：一组数据的算术平均数即为这组数据的平均数，

—1

〃个数据x,X?,…，X”的平均数x=-(x+x2d------Fx„).

4.总体离散程度的估计

(1)假设一组数据是修，x2，…，，用工表示这组数据的平均数，则我

们称2£仁1(七一工)为这组数据的方差。有时为了计算方差的方便，我们

还把方差写成以1"--的形式。我们对方差开平方，取它的算术平方

根卜忆1卜L%)，称为这组数据的标准差。

(2)方差和标准差反映了数据波动程度的大小。

/\2/V2/_\2

方差：$2=：[(%]_%)+卜2一％)+…+($—%)]o

222

标准差：S=—[卜i-X)+92—%)+…+卜豆—]o

补充：①若数据不，Xz,…，X”的平均数为X,

则以x+a,mx?+a,mx3+a,…，侬„+a的平均数是勿x+a;

②若数据X,x2,•,,,x〃的方差为s?,

则数据a*i+b,ax2+b,•••,ax〃+b的方差为a2sl

四、变量的相关关系及回归模型

1.变量的相关关系

(1)定义：两个变量有关系，但又没有确切到可由其中的一个去精确地决定另

一个的程度，这种关系称为相关关系。

(2)散点图

每个编号下的成对样本数据都可用直角坐标系中的点表示出来，由这些点组

成了统计图。我们把这样的统计图叫做散点图。

(3)正相关、负相关、线性相关

如果从整体上看，当一个变量的值增加时，另一个变量的相应值也呈现增加

的趋势，我们就称这两个变量正相关；如果当一个变量的值增加时，另一个变量

的相应值呈现减少的趋势，则称这两个变量负相关。

一般地，如果两个变量的取值呈现正相关或负相关，而且散点落在一条直线

附近，我们就称这两个变量线性相关。一般地，如果两个变量具有相关性，但不

是线性相关，那么我们就称这两个变量非线性相关或曲线相关。

2.样本相关系数

(1)定义：r='一「/一,

£之1,-工)ZILi(yi-y)

我们称r为变量x和变量y的样本相关系数。

当r>0时，称成对样本数据正相关。这时，当其中一个数据的值变小时,

另一个数据的值通常也变小；当其中一个数据的值变大时，另一个数据的值通常

也变大。

当r<0时，称成对样本数据负相关。这时，当其中一个数据的值变小时，

另一个数据的值通常会变大；当其中一个数据的值变大时，另一个数据的值通常

会变小。

(2)线性相关的程度

样本相关系数r的取值范围为［—1,1］。样本相关系数r的绝对值大小可以反

映成对样本数据之间线性相关的程度：

当|r|越接近1时，成对样本数据的线性相关程度越强；

当|r|越接近0时，成对样本数据的线性相关程度越弱。

例9.相关变量尤，y的散点图如图所示，现对这两个变量进行线性相关分析.方

案一：根据图中所有数据，得到回归直线方程y=4x+%,相关系数为4；方案二：

剔除点(10,32),根据剩下的数据得到回归直线方程)，="》+生，相关系数为4.则

()

A.0<4<4<1B.

C.D,-1<弓<4<0

【答案】D

【详解】

由散点图可知这两个变量为负相关，所以4<0,&<0.

因为剔除点(10,32)后，剩下点的数据更具有线性相关性，间更接近1,

所以一1<4<小<0.

例10.对三组数据进行统计，获得以下散点图，关于其相关系数依次是4,

4,则它们的大小关系是()

35-35-35

30-30-30

25-25-25

20-20-20

15-15-15

10-1010

555

O5101520253035xO5101520253035xO5101520253035x

A.rt>r3>r2B.r}>r2>r3C.D.r3>r}>r2

【答案】A

【详解】解：由散点图可知，图一两个变量成正相关，且线性相关性较强，故

4>0.75,图二两个变量成负相关，且线性相关性较强，故弓<-0.75,

图三两个变量线性相关性较弱，故闻<0.75,

所以4>4>4；

(3)残差分析

①对于响应变量丫，通过观测得到的数据称为观测值，通过经验回归方程得到

的，称为预测值，观测值减去预测值称为残差。残差是随机误差的估计结果，

通过对残差的分析可以判断模型刻画数据的效果，以及判断原始数据中是否存

在可疑数据等，这方面工作称为残差分析。

②残差的散点图

若残差比较均匀地分布在以取值为o的横轴为对称轴的水平带状区域内，则

满足一元线性回归模型对随机误差的假设。

③决定系数/?2=]_举J"-'')?o

在R2表达式中，£k—与经验回归方程无关，残差平方和

2k1(%—工丫与经验回归方程有关。因此腔越大，表示残差平方和越小，即

模型的拟合效果越好；R2越小，表示残差平方和越大，即模型的拟合效果越差。

例11.在对10个同类工场的研究后，某工场获得投入与纯利润的简单随机样本

数据&,%)(i=l,2,...»10),x,y,分别表示第i个工场的投入(单位：万

元）和纯利润（单位：万元）.

第i个工场12345678910

投入*/万元32313336373839434546

纯利润E/万元25303437394142444850

1010101（）

参考数据：Z>,=380,£y=390,Z（X,-》=254,£（X-y）-=546,

/=1f=l<=1z=l

10_________

^（xi-x）（y;-y）=355,V34671«186.20.

/=1

⑴请用相关系数说明该组数据中y与x之间的线性相关程度；

（2）求y关于x的经验回归方程（精确到0.01）;

⑶现有甲、乙两种大型机器供工场选择，甲型机器价位是60万元，乙型机器价

位是50万元，下表是甲、乙两种大型机器各30台的使用年限（整年）统计表：

1年2年3年4年合计

甲型/台3129630

乙型/台6129330

据以往经验可知，每年使用任一型号都可获利润30万元，若仅考虑购置成本和

每台机器的使用年限（使用年限均为整年），以频率估计概率，该工场选择买哪

一款型号机器更划算？

£（西一丁）（乂一刃

参考公式：相关系数，=-7^旦-----------=,对于一组具有线性相关关系的数

次（y-方2

V1=1r=l

据（％，X）（i=l,2,n）,其回归直线y=+a的斜率和截距的最小二乘估计

,£（4-丁）回一刃

公式分另“为b=上―----------,a=y-bx.

f=l

【答案】（l）y与x之间具有较强的线性相关关系；

（2）y=[40x74.11；

⑶该工场应选择购买乙型号机器更划算.

【解析】

⑴依题意知，；=38,5=39,且相关系数

可（丹-刃

Sa-355_355

i=l»0.9533>0.95

7254x546—2V34671

、区（%-元/回一刃一

V1=1/=1

因为y与x的相关系数接近于1,所以y与x之间具有较强的线性相关关系.

（2）

.Z（%-可（%-下）355.355

依题意知，b=I］（）-----------=p1.40,a=y-bxw39-^-x38«-14.11,

Wf254

i=l

所以y关于x的经验回归方程为y=1.40x-14.11.

⑶

以频率估计概率，购买一台甲型号机器的利润X（单位：万元）的概率分布列为:

X-3003060

P0.10.40.30.2

1231

£（X）=（-30）x—+0x-+30x—+60x-=18（万元）

105105

购买一台乙型号机器的利润y（单位：万元）的概率分布列为:

Y-20104070

P0.20.40.30.1

1231

£（r）=（-20）x-+10x-+40x—+70x—=19（万元）

因为E（X）<E（K）,所以该工场应选择购买乙型号机器更划算.

五、列联表与独立性检验

1.分类变量与列联表

(1)分类变量

在讨论问题时，为了表述方便，我们经常会使用一种特殊的随机变量，以区

别不同的现象或性质，这类随机变量称为分类变量。分类变量的取值可以用实数

表示。

(2)2x2列联表

列出的两个分类变量的频数表，称为列联表。

2.独立性检验

(1)零假设

以。为样本空间的古典概型。设x和丫为定义在。上，取值于｛0,1｝的成

对分类变量。

“°：分类变量x和丫独立。通常称为为零假设或原假设。

(2)公公式

假定我们通过简单随机抽样得到了x和y的抽样数据列联表

2_n(ad-bc')2

”(a+b)(c+d)(a+c)(b+d)°

对于任何小概率值a,可以找到相应的正实数％,使得后面关系成立：

PG>xa)=ao

我们称％为a的临界值，这个临界值就可作为判断,2大小的标准。概率值

a越小，临界值%a越大。

(3)独立性检验

基于小概率值a的检验规则是：

当;工时，我们就推断为不成立，即认为x和丫不独立，该推断犯错

误的概率不超过a;

当时，我们没有充分证据推断“0不成立，可以认为X和丫独立。

这种利用,2的取值推断分类变量X和丫是否独立的方法称为％2独立性检

验，读作“卡方独立性检验”，简称独立性检验。

例12.2021年4月22日，一则“清华大学要求从2019级学生开始，游泳达到一

定标准才能毕业”的消息在体育界和教育界引起了巨大反响.游泳作为一项重要

的求生技能和运动项目受到很多人的喜爱.其实，已有不少高校将游泳列为必修

内容.某中学为了解2020届高三学生的性别和喜爱游泳是否有关，对100名高三

学生进行了问卷调查，得到如下列联表：

喜欢游泳不喜欢游泳总计

男生10

女生20

总计

已知在这100人中随机抽取1人，抽到喜欢游泳的学生的概率为不

⑴请将上述列联表补充完整；

(2)判断是否有99.9%的把握认为喜欢游泳与性别有关.

n(ad-hc)2

(q+b)(c+d)(a+c)3+d)

P(K2>k)0.050.0250.010.0050.001

k3.8415.0246.6357.87910.828

【答案】(1)答案见解析

⑵有99.9%的把握认为喜欢游泳与性别有关

【解析】

(1)因为在100人中随机抽取1人抽到喜欢游泳的学生的概率为1,

所以喜欢游泳的学生人数为100x，=60.

其中女生有20人，男生有40人，列联表补充如下：

喜欢游泳不喜欢游泳合计

男生401050

女生203050

合计6040100

n(ad-bc)2100x(40x30-20x10)2

⑵因为片=»16.667>10.828,

(a+b)(c+d)(a+c)(b+d)60x40x50x50

所以有99.9%的把握认为喜欢游泳与性别有关.

六、随机事件的概率与古典概型

1.随机事件

(1)一般地，随机试验中的每个随机事件都可以用这个试验的样本空间的子集

来表示，将样本空间。的子集称为随机事件，简称事件。

(2)只包含一个样本点的事件称为基本事件。

(3)随机事件一般用大写字母A,B,C,表示，在每次试验中，当且仅

当A中某个样本点出现时，称为事件/发生。

(4)在样本空间A中，每次试验总有一个样本点发生，所以。总会发生，称0

为必然事件，空集0不包含任何样本点，在每次试验中都不会发生，称。为不

可能事件。

2.频率与概率

(1)事件的概率

对随机事件发生可能性大小的度量(数值)称为事件的概率，事件/的概率

用PQ4）表示。

（2）频率的稳定性

一般地，随着试验次数71的增大，频率偏离概率的幅度会缩小，即事件/发

生的频率盒（力）会逐渐稳定于事件/发生的概率PQ4）o我们称频率的这个性质

为频率的稳定性。因此，我们可以用频率加（A）估计概率P（A）o

3.事件的关系和运算

名称条件结论符号表示

事件8包含事件

包含若4发生，则B-阻力（或

4（或事件4包含于

关系定发生AQB）

事件例

相等事件A与事件8相

若阻彳且4?8A=B

关系

4发生或8发生（事

并（和）事件力与事件8的

件4与事件8至少4U8(或A+B)

事件并事件（或和事件）

有一^个发生）

/发生且8发生（事

交（积）事件4与事件8的

件4与事件8同时/ns(或AB)

事件交事件（或积事件）

发生）

互斥事件彳与事件8互

71rl8为不可能事件/n8=0

事件斥（或互不相容）

/ns为不可能事

对立事件4与事件8互4n8=0,4U8=

件，4U8为必然事

事件为对立a

件

在一个随机试验中

独立事件4与事件8相

两个事件48是否P(AB)=P(A)P(B)

事件互独立

发生互不影响

4.概率的基本性质

(1)对任意的事件A,都有0WPG4)W1o

(2)必然事件的概率为1,不可能事件的概率为0,即P(。)=1,P(0)=0o

(3)如果事件4与事件B互斥，那么P(AUB)=PQ1)+P(B)。

(4)如果事件/与事件B互为对立事件，

刃卜么P(B)=1-PQ4),PQ4)=l-P(B)o

(5)如果4UB,那么P(A)WP(B)o

(6)设4,B是一个随机试验中的两个事件，

我们有PQ4UB)=PQ4)+P⑻-PQ4AB)。

5.基本事件的特点

(1)任何两个基本事件是互斥的。

(2)任何事件(除不可能事件)都可以表示成基本事件的和。

6.古典概型

具有以下两个特征的概率模型称为古典概率模型，简称古典概型。

(1)有限性：样本空间的样本点只有有限个。

(2)等可能性：每个样本点发生的可能性相等。

(3)古典概型的概率公式

一般地，设试验K是古典概型，样本空间。包含几个样本点，事件/包含

其中的k个样本点，则定义事件4的概率PQ4)=-=嘤，其中以力)和九Q)

分别表示事件A和样本空间。包含的样本点个数。

七、事件的相互独立性与条件概率

1.两个事件相互独立的定义

对任意两个事件A与B,如果PQ4B)=PQ4)P(B)成立，则称事件/与事

件B相互独立，简称为独立。

例13.如图是一个古典概型的样本空间。及事件A和事件8,其中〃(Q)=24,

〃(A)=12,〃(8)=8,n(AuB)=16,则()

A.P（AUB）=-B.P（4J）=§

C.事件A与8互斥D.事件A与B相互独立

【答案】ABD

【详解】

“（C）=24,/.n（AB）=〃（Q）-〃（AuB）=24-16=8,

一（）一”（。）一24一％'P（）一〃（Q）-24~3,

P（而）="（照）,故A正确，B正确；

〃（C）243

•.•“（45）=4,..A8W0;.A与8不互斥，故C错误：

•：P（A）=:<=—=-,P（B）=>[=—=P（AYP（B）=-x-=-=P（AB]

v7”（C）242—〃（C）243v7v72361八

，事件A与B相互独立，故D正确.

2.独立事件的性质

(1)必然事件。，不可能事件。都与任意事件相互独立。

(2)如果事件4与B相互独立，那么A与B,A与B,A与B也都相互独立。

(3)如果4,A2,...,An相互独立，那么204遇2=

PQ4i)P(&)…P(40。

3.条件概率的概念

(1)条件概率的概念

一般地，设A,B为两个随机事件，且PQ4)>0,我们称P(B|A)=生曾为

在事件/发生的条件下，事件8发生的条件概率，简称条件概率。

(2)条件概率公式

①P(B⑷=n(AB)

九⑷°

②P(B|A)=华4，PQ4B)表示事件/与B积事件的概率。

(3)条件概率的性质

①。<P(B|A)<1,PQ⑷=1o

②如果B和C是两个互斥事件，则P(BUC|A)=P(BIA)+P(CM)。

③设B和B互为对立事件，则PB|A=l-P(BIA)o

④概率的乘法公式：对任意两个事件4与B,

若P(A)>0,则PQ4B)=PQ4)P⑻A)

例14.一个箱子中有大小形状完全相同的3个黑球和5个白球，从中取出2个

球，下列几个命题中正确的是()

A.若是不放回地抽取，则取出2个黑球和取出2个白球是对立事件

B.若是不放回地抽取，则第2次取出黑球的概率小于第1次取出黑球的概率

c.若是有放回地抽取，则取出1个黑球1个白球的概率为II

D.若是有放回地抽取，则在至少取出1个白球的条件下，第2次取出白球的概

率4

【答案】CD

【详解】

对于A,不放回地抽取两个球，包括两个都是黑球、两个都是白球和一个黑球一

个白球，共3种情况，所以取出两个黑球和取出两个白球不是对立事件，所以A

错误：

对于B,不放回地抽取，第2次取到黑球的概率为9392+5993=丁3第1次取得黑

0/0/0

球的概率为：，所以第2次取到黑球的概率等于第1次取到黑球的概率，所以B

错误；

对于C,有放回地抽取，取出1个黑球1个白球包括第1次为黑球第2次为白球、

533s15

第1次为白球第2次为黑球，所以所求概率为+所以C正确，

oooo32

对于D,有放回地抽取，至少取出一个白球的条件下，第2次取出白球包括第1

3555

—x—+—x——

次黑球第2次白球、第1次白球第2次白球，所以所求概率为5；gg；5=H，

—X—+—X—+—X—

888888

4.全概率公式

一般地，设4,&，…，4九是一组两两互斥的事件，aU&u...UAn=。，

且P(4)>o,i=l,2,,九，则对任意的事件Bua,有P(B)=

落1P(4)P(BA)o我们称其为全概率公式。

八、离散型随机变量及其分布列

1.随机变量

(1)定义式：一般地，对于随机试验样本空间。中的每个样本点3,都有唯一

的实数X(3)与之对应，我们称X为随机变量。

(2)性质：①取值依赖于样本点；②所有可能取值是明确的。

(3)离散型随机变量

变量可能取值为有限个或可以一一列举的随机变量，我们称为离散型随机变

量。通常用大写英文字母表示随机变量，例如X,Y,Z■,用小写英文字母表

示随机变量的取值，例如％,y,zo

2.离散型随机变量的分布列

(1)一般地，设离散型随机变量X的可能取值为小，不，…，马，我们称X

取每一个值项的概率P(X=珀=pt,i=1,2,,ri为X的

概率分布列，简称分布列。

(2)表示方法：①公式法；②列表法；③图形法。

3.离散型随机变量的均值

(1)随机变量的数字特征

类似于研究一组数据的均值和方差，我们也可以研究离散型随机变量的均值

和方差，它们统称为随机变量的数字特征。

(2)随机变量的均值(期望)

①称E(X)=”1+x2P2+-+xnPn=£匕%由

为随机变量X的均值或数学期望，数学期望简称期望。

②一般地，如果随机变量X服从两点分布(0-1分布)，那么E(X)=p0

(3)均值的性质

设X的分布列为P(X=刈)=pt,i=1,2,,n。

①E(X+b)=E(X)+bo②E(aX)=aE(X)。

③E(aX+Z?)=ciE(X)+b。

4.离散型随机变量的方差

(1)方差、标准差

D(X)=(%i-E(X))pi+(x2-E(X))p2+…+(xn-E(X))pn

=£仁1(七一E(X))2pt为随机变量X的方差，有时也记为Var(X),并称"(X)

为随机变量X的标准差，记为(T(X)O

②公式：D(X)=£%*PL(E(X))o

(2)方差的性质：D(aX+b)=a2D(X)。

例15.已知两组数据，第一组4,…，七和第二组口,%,”,其

中％==1,2,…,7),以=%£占，第一组数据不全相同，则这两组数据相比，下

'i=l

列说法正确的是()

A.平均数一定相等B.中位数一定相等

C.极差一定相等D.第一组数据的方差大于第二组数据的方差

【答案】ACD

7717|7

【详解】对于A,因为菁=y(i=l,2,…,7),所以2苦=2％,所以弓2占=亍2%，

r=li=l//=1'»=1

7717

_|7

所以x=-=上——一上一乙」=容,

•/=iy—

88Ii=l

所以x=y,所以A正确,

对于B,因为第一组数的中位数为匕，第二组数的中位数为％1且，匕=为，但匕

不一定等于丹,所以两组数的中位数不一定相等，所以B错误，

对于C,由选项A的计算可知，%=7，所以第一组数据的最大值和最小值与第

二组数据的最大值和最小值分别相等，所以两组数据有极差相等，所以C正确，

2222

对于D,第一组数据的方差为S,=y[(%,-%)+(x2-%)+-••+(%7-X)],

第二组数据的方差为s；=：[(y-yr+(%-丫)2+…+(必一y))+(然一

1___

=-[(%)-X)2+(X-X)2+…+(七,

所以TAS2Z,即第一组数据的方差大于第二组数据的方差，所以D正确

九、二项分布、超几何分布与正态分布

1.二项分布

(1)n重伯努利试验

①我们把只包含两个可能结果的试验叫做伯努利试验。

②我们将一个伯努利试验独立地重复进行71次所组成的随机试验称为71重伯努

利试验。显然，n重伯努利试验具有如下共同特征：同一个伯努利试验重复做

n次；各次试验的结果相互独立。

(2)二项分布

①一般地，在九重伯努利试验中，设每次试验中事件A发生的概率为

p(0<p<1),用X表示事件人发生的次数，则X的分布列为P(X=k)=

%pk(l—p)nf，/C=0,1,2,,九。如果随机变量X的分布列具有上

式的形式，则称随机变量X服从二项分布，记作X~B(几p)o

②22=0P(X=k)=》=0Cn(1-P')n~k=[p+(1-p)]n=1o

(3)二项分布的均值与方差

如果X〜B(几p),那么E(X)=np,D(X)=np(l-p)°

2.超几何分布

(1)超几何分布

一般地，假设一批产品共有N件，其中有M件次品。从N件产品中随机抽

取n件(不放回)，用X表示抽取的71件产品中的次品数，则X的分布列为

P(X=k)=c"#,k=m,m+l,m+2,,r。其中n,N,MeN：

M<N,n<N,m=max{0,n—N+M],r=min{n,M]。如果随机变量X

的分布列具有上式的形式，那么称随机变量X服从超几何分布。

(2)超几何分布的均值

设随机变量X服从超几何分布，则X可以解释为从包含M件次品的N件产

品中，不放回地随机抽取71件产品中的次品数。令p=*,则p是N件产品的

次品率，而£是抽取的九件产品的次品率，则£1(；)=p,即E(X)=等=npo

3.正态分布

(1)定义：若随机变量X的概率分布密度函数为f(x)=—7=e2小,xeR,

42n

其中〃eR,CT>0为参数，则称随机变量X服从正态分布，记为X〜N(〃R2)o

特别地，当〃=0,(7=1时，称随机变量X服从标准正态分布。

(2)正态曲线的特点

①曲线是单峰的，它关于直线》=“对称。②曲线在％=〃处达到峰值一9O

42n

③当|%|无限增大时，曲线无限接近％轴。

(3)3a原则

①PQ-o<X<fi+a)0.6827;②-2<r<X<p+2(r)*0,9545;

③P(〃-3(r<X</z+3(J)«0.9973。

(4)正态分布的均值与方差

若X〜NR,/),则E(X)=从，O(X)=a2。

例16.随机变量自服从正态分布J~N(10,4),则标准差为()

A.2B.4C.10D.14

【答案】A

【详解】因为4服从正态分布J~N(10,4)可知:方差为4,故标准差为2,

【对点制球】

一、单选题

1.中国古典乐器一般按"八音"分类，这是我国最早按乐器的制造材料来对乐器

进行分类的方法，最早见于《周礼•春官•大师》.八音分为"金、石、七、革、丝、

木、匏、竹"，其中"金、石、木、革”为打击乐器，”土、匏、竹”为吹奏乐器，"丝"

为弹拨乐器.现从“金、石、土、革、丝"中任取"两音"，则"两音"中含"丝"的概率

为（）

“2

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

统计与概率-2023届高考数学一轮复习学案

文档简介

温馨提示

最新文档

评论

统计与概率-2023届高考数学一轮复习学案

文档简介

温馨提示

最新文档

评论

相关文档