概率与统计高考常见题型解题思路及知识点总结_第1页
概率与统计高考常见题型解题思路及知识点总结_第2页
概率与统计高考常见题型解题思路及知识点总结_第3页
概率与统计高考常见题型解题思路及知识点总结_第4页
概率与统计高考常见题型解题思路及知识点总结_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率与统计高考常见题型

解题思路及知识点总结

一、解题思路

(一)解题思路思维导图

频率估计概率力互斥事件和事件的概率P(A+B尸P(A)+P(B)

求概率古典概型概率相互独立事件积事件的概率P(AB尸P(A)P(B)

在事件A发生的条件下事件B发生的概率

概几何概型概率P\AB)Q<AB)

率P\A\Q(JI

超几何分布X~H(N,M,n)—N、M必需是明确的,否则不能用

离散型随

机变量的二项分布)(~88刀)一独立重复试验(频率估计概率)

分布列

其他分布——变量取每一个值的意义及概率(与其他知识结合)

连续型随

机变量的*正态分布)(~用必b)—根据关于,〃对称求概率,3。法则

分布列

—>众数一最高组中间值

样本频率分布直方图估计中位数一过中位数画横轴垂线,垂线分直方图

两侧小矩形面积的和都为0.5,列方程求解

统非线性相关还

计一

1原平均数一各小矩形中间值(无特别说明时)乘

摸以其面积的和(加权平均)

,元

线性相关最小二乘法求线性回归方程(公式的等价转换)

*求出卡方(先处理括号,再约分),在给定条件

独立性检验

下对照经验值,判断两个分类变量是否有关

(二)常见题型及解题思路

1.正确读取统计图表的信息

解题思路及步骤注意事项

理解背景读懂题目所给的背景,理解统计图表各个量的意义

对选项逐一判断对选项逐•判断,统计图表是否能得出该选项的结论,错误选项•般是概念错误、计

算错误、以偏概全的错误等

典例1;(2017全国3卷理科3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了

2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图,根据该折线

图,下列结论错误的是().

1

A.月接待游客量逐月增加

B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7,8月份

D.各年I月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳

【解析】由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误,选A.

2.古典概型概率问题

解题思路及步骤注意事项

求基本事件总数m每个基本事件要求等可能,若是条件概率问题,在有条件则基本事件总数相对减少

求事件A包含基本确定A包含基本事件个数时要不重不漏

事件个数n

代入公式求概率P(A)=:,事件A已经发生的条件下在事件B发生概率P(5|A)==节器

典例2:(2018全国2卷理科8)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德

巴赫猜想是“每个大于2的偶数可以表示为两个素数的和“,如33=7+23.在不超过30的素数中,随机选

取两个不同的数,其和等于30的概率是

解:不超过30的素数有2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有

C;)=45种方法,因为7+23=11+19=13+17=30,所以随机选取两个不同的数,其和等于30的有3种方

法,故概率为3=2_,选C.

4515

典例3:(2014全国2卷理科5)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续

两天为优良的概率是06已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是()

A.0.8B.0.75C.0.6D.0.45

解:设某天空气质量优良,则随后一天空气质量也优良的概率为P,则据条件概率公式得p=^=08故选

V./3

A.

3.几何概型问题

解题思路及步骤注意事项

求试验全部结果所构成区域长度(或面积或明确表示实验结果的是一个变量、两个变量还是三个变量,

体枳)它们分别用长度(或角度)、面积和体积来表示

求构成事件A的区域长度(或面枳或体积)确定构成事件A的区域长度(或面枳或体积)

代入公式求概率

典例4:(2016全国1卷理科4)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘

坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是()

BC

A。!!1吟

2

7:?07:407:?08:少叼08:208»0

解:如图所示,画出时间轴:?'S%

小羽到达的时间会随机地落在图中线段AB中,而当他到达时间落在线段AC或DB时,才能保证他等车的时

间不超过10分钟,根据几何概型,所求概率P=U」=L选B.

402

4.类似超几何分布的离散型随机变量分布列问题(古典概型求概率)

解题思路及步骤注意事项

写出随机变量可能取值明确随机变量取每•个值的意义

求出随机变量取每个值的概率“从M个不同元素中不放回抽取(或同时抽取)n个元素”类型概率问题,

用古典概型求概率

写出分布列检验所有概率之和是否等于1

求数学期望若服从超级和分布X〜H(N,M,n),则可带入公式七(x)=〃"快速求出

N

5.类似二项分布的离散型随机变量分布列问题(频率估计概率,相互独立事件概率计算)

解题思路及步骤注意事项

写出随机变量可能取俏明确随机变量取每一个俏的意义

求出随机变量取每个值的概率当有“把频率当成概率或用频率估计概率”条件时,“从M个不同元素中抽

IIIn个元素”类型概率问题就变成相互独立事件的问题

写出分布列检验所有概率之和是否等于1

求数学期望若服从二项分布乂~M〃,P),则可带入公式E(x)=如快速求出

典例5(超几何分布与二项分布辨析):某工厂为检验其所生产的产品的质量,从所生产的产品中随机抽取

10件进行抽样检验,检测出有两件次品.

(1)从这10件产品中随机抽取3件,其中次品件数为X,求X分布列和期望;

(2)用频率估计概率,若所生产的产品按每箱100件装箱,从一箱产品中随机抽取3件,其中次品件数

为Y,求Y分布列和期望;

(3)用频率估计概率,从所生产的产品中随机抽取3件,其中次品件数为Z,求Z分布列和期望.

分析:第(1)问中,抽取产品的总体N=10,所含次品件数M=2,都是明确的,所以该随机变量的分布为

超几何分布。第(2)问是从一箱产品中抽取,产品的总体N=100是明确的,但其中有多少件次品M是不

明确的,有的同学根据样本可认为M=20,但违背了题目中的“用频率估计概率”这一条件,或者说没有

理解这句话的含义,本质上就是概率的定义没有理解。根据概率定义,“用频率估计概率”这一条件应理

解为:从这100件产品中任意抽取1件产品,该件产品是次品的概率是0.2,同时抽取3件等同于不放回

抽1件3次,由于每次的概率都是0.2,因此,可以看成独立重复实验,该随机变量的分布为一项分布。

第(3)问是从所生产的全部产品中抽取,而全部产品有多少件题目条件没给出,这时总体N不明确(若

总体N明确,就属于第(2)问情况),其中所含次品件数M自然也是不明确的。因此,类似的,在“用

频率估计概率”这一条件,该随机变量的分布为二项分布。

解:(1)x的可能取值为0,1,2,根据题意X〜H(10、2、3),所以x分布列为:

P[x=k)=,伏=0,1,2)E(x)3x—=0.6

Go7=10

(2)Y的可能取值为0,1,2,3,根据题意Y〜B(3,0.2),所以Y分布列为:

PiY=k)=C;♦0.2«•(1_0.2广,(%=0,1,2,3)E(y)=3x0.2=0.6

3

(3)Z的可能取值为0,1,2,3,根据题意Z〜B(3O2),所以Z分布列为:

RZ=0=C;.0.2人.(1-0.2广,伏=0,1,2,3)E(Z)=3x0.2=0.6

以上分析用一个表归纳如下:

抽取总体个数N总体中所含次品M个数随机变量分布类型

明确明确超几何分布

明确不明确二项分布

不明确不明确二项分布

从该例以看到,当一保持不变,若N越大,每次不放回抽取,抽到次品的概率与一相差越小,因此,当

NN

N很大时,超几何分布可以近似看成二项分布。

典例6:据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革〃引起广泛

关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择

了3000人进行调查,就“是否取消英语听力''问题进行了问卷调查统计,结果如下表:

态度调查人群应该取消应该保留无所谓

在校学生2100人120人y人

社会人士500人工人Z人

已却在全体样本中随机抽取1人,抽到持"应该保留"态度的人的概率为0.06.

(1)现用分层抽样的方法在所有参与调查的人中抽取300人进行问卷访谈,问应在持"无所谓“态度的人中

抽我多少人?

(2)在持“应该保留〃态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组

中在校学生人数X的分布列和数学期望.

解:(1)反抽到持“应该保留''态度的人的概率为0.06,团上—=006,解得%=60,

3000

(3持"无所谓”态度的人数为3000-2100-500-120-60=220,

因应在"无所谓"态度抽取220x整;=22人.

30C0

(2)由(1)知持"应该保留”态度的一共有180人,

团在所抽取的6人中,在校学生人数为拼x6=4,社会人士人数为黑x6=2,于是第一组在校学生人数

18。180

X的可能取值为1,2,3.P(x=1)=萼=;,P(X=2)=萼=[P(X=3)=萼=;

4

即X的分布列为;

X123

131

P

555

0EX=lxi+2x1+3xi=2.

典例7(与函数结合):(2018全国1卷理科20)某工厂的某种产品成箱包装,每箱200件,每一箱产品在

交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20

件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为

p(d<p<l),且各件产品是否为不合格品相互独立.

(1)记20件产品中恰有2件不合格品的概率为f(p)求f(p)的最大值点P().

(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的Po作为p的值.已知每件产品

的检验费用为2元,若有不合格超进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.

(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;

(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?

解:(I)20件产品中恰有2件不合格品的概率为f(p)=C/p2(i邛)】8因此

f(P)=C^[2p(l-p)18-18p2(l-p)17]=2C^p(l-p)17(l-lOp).^f(p)=得P=0」.当PJOOD时,f'(p)>0;当

p6(0.1,1)时,f'(p)v0.所以f(p)的最大值点为Po=。1.

(2)由(1)知,p=0.1.

(i)令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20x2+25Y,即

X=40+25Y.所以EX=E(40+25Y)=40+25EY=490.

(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元曲于EX>400,故应该对余下的

产品作检验.

6.其他离散型随机变量分布列问题(频率估计概率,方案选择,随机变量取值意义,与其他知识结合)

解题思路及步骤注意事项

写出随机变量可能取值这类题重点考查是否理解随机变量取每一个值的意义

求出随机变量取每个值的概率注意对随机变量所取的值表示多种的情况,多数情况由频率估计估计概率

写出分布列检验所有概率之和是否等于1

求数学期望通过数学期望进行决策

典例8(与函数结合):(2107全国3卷理科18)某超市计划按月订购一种酸奶,每天进货量相同,进货成

本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售

经验,每天需求量与当天最高气温(单位;有关.如果最高气温不低于25,需求量为500瓶;如果最

高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的

订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:

最高气温[iai5)[15,20)[M25)[2530)[3035)[3540)

天数216362574

以最高气温位于各区间的频率代替最高气温位于该区间的概率.

(I)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;

(2)设六月份一天销售这种酸奶的利润为y(单位:元),当六月份这种酸奶一天的进货量〃(单位:瓶)

为多少时,丫的数学期望达到最大值?

5

解:(1)易知需求量X可取200,300,500,

2+161(?,.25+7+4)

P(X=200)=PX=3(X))=-^-=-;PX=50())==-

30x35''730x35'’30x35

则分布列为:

X200300500

122

P--—

555

(2)①当〃W200时:丫=〃(6-4)=2〃,此时%*=400,当〃=200时取至(

②当200v〃W300时:r=--2n4-l[2(X)x2-h(n-2(X))-(-2)]=-»+8°°~2n=6n+80()

此时小=520,当〃=300时取到.

③当300v〃W500时,

32GG2n

y=g[200x2+(〃-200).(-2)]+|[300x2+(〃-300).(-2)]+|.〃.2=~

此时y<520.

④当")500时,易知y一定小r-③的情况.

综上所述当”=300时,y取到最大值为520.

典例9(与数列结合):(2019全国1卷理科21)为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪

种新药更有效,为此进行动物试的.试验方案如下:每一轮选取两只口鼠对药效进行对比试验.对于两只

白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一•轮试验.当其中一种

药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描

述问题,约定:对丁•每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得一1

分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得I分,甲药得T分;若都治愈或都未治愈

则两种药均得()分.甲、乙两种药的治愈率分别记为a和从一轮试验中甲药的得分记为X.

(I)求X的分布列;

(2)若甲药、乙药在试验开始时都赋予4分,p,(i=(M,…,8)表示“甲药的累计得分为i时,最终认为甲

药比乙药更有效”的概率,则%=0,p8=1,Pi=a]*+Z?Pj+cpj+i。=1,2,・・・,7),其中。=尸(乂=-l),

b=P(X=0),c=P(X=l).假设。=0.5,夕=0.8.

(i)证明:{A+I-P,}0=0,1,2,,7)为等比数列;

(ii)求P4,并根据〃4的值解释这种试验方案的合理性.

解:(1)由题意可知X所有可能的取值为:一1,0,1

.•.P(X=—1)=(1—a)/?:P(X=0)=M+(l—a)(l—£);P(X=l)=a(l-y0)

则X的分布列如下:

6

X-101

P。(1-4)

(2)・/。=0.5,£=0.8

.x=0.5x0.8=04,/?=0.5x0.84-0.5x0.2=0.5.c=0.5x0.2=0.1

(i)・・・pi=op、]+bR+cpM(i=l,2,--,7)

即Pi=0.4%+0.5pf.+0.1PM(i=1,2,…,7)

整理可得:5Pi=4pi+%(i=1,2,…,7)pM-Pi=4(/2,.-p”J(i=1,2,…,7)

/.{Pm一2}(i=0,1,2,…,7)是以p「Po为首项,4为公比的等比数列

(ii)山(i)矢口:化+|-必=(Pi_〃o>4'=必-4'

70

•••〃8一。7二爪4,P7_P6=PI《6,……,A-p0=A-4

..1-4s48-1

作和可得:外一P。=Pi-(4°+4+…+4,)=-j—j-p,=二一p,=1

3

7,0浦箱1-4444-1311

,PLP「p°」.(4+4+4.+4・)二百历二二,二二用=而

凡表示最终认为甲药更有效的.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为

甲药更有效的概率为0=言"0.0039,此时得出错误结论的概率非常小,说明这种实验方案合理.

7.连续型随机变量分布问题一正态分布

解题思路及步骤注意事项

明确总体的均值和方差一般用样本的均值和方差估计总体的均值和方差

求随机变量在某范围概率利用正态密度曲线关于对称性求概率

典例10:(2107全国1卷理科19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上

随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下

生生的零件的尺寸服从正态分布N.,吟.

7

(I)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(〃-3b,〃+3cr)之外的零件数,

求P(X..l)及X的数学期望:

(2)一天内抽检零件中,如果现了尺寸在(〃-3b,"+3。)之外的零件,就认为这条生产线在这一天

的生产过程可能出现了异常情况,需对当天的生产过程进行检查.

(i)试说明上述监控生产过程方法的合理性;

(ii)下面是检验员在一天内抽取的16个零件的尺寸:

9.9510.129.969.9610.019.929.9810.04

10.269.9110.1310.029.2210.0410.059.95

1161i161116

经计算得工==9.97,5=/—22(x,.-J)2==—(2x;-16工2)=0.212,其中七为抽取的第

16i=ly16、16,=|

i个零件的尺寸,/=

用样本平均数工作为〃的估计值A,用样本标准差S作为。的估计值3,利用估计值判断是否需对当天

的生产过程进行检查?剔除(。-3上。+33)之外的数据,用剩下的数据估计〃和。(精确到0.01).

附:若随机变量Z服从正态分布N(〃,4),则P(〃—3bvZ<,+3b)=0.9974,0.997416«0.9592,

V0.008»0.09.

【解析】(1)由题可知尺寸落在(4-36〃+3。)之内的概率为0.9974,落在(〃-3b,〃+3b)之外的概率

)6

为0.0026.P(X=0)=C;6(l-0.9974)°0.9974'工0.9592,

P(X..1)=1-P(X=0)«1-0.9592=0.0408,

由题可知X〜8(16,0.0026),所以E(X)=16x().0026=0.0416.

(2)(i)尺寸落在(〃-3cr,〃+3cr)之外的概率为。0026,由E态分布知尺寸落在(4-3b,M+3CT)之外

为小概率事件,因此上述监控生产过程的方法合理.

(ii)〃-3cr=9.97—3x0.212=9.334,//+3<T=9.97+3x0.212=10.606,

(〃-3b,〃+3b)=(9.334,10.606),因为9.2249.334,10.606),所以需对当天的生产过程检查.因此剔

997x16-922

除9.22,剔除数据之后:'一=10.02.

,=[(9.95—10.02)2+(10.12-10.02『+(9.96—10.02)2+(9.96-10.02『+(10.01-10.02『+

(9.92-10.02)2+(9.98-10.O2)2+(10.04-10.O2)2+(10.26-10.O2)2+(9.91-10.O2)2+

(10.13-10.02)2+(10.02-10.02)2+(10.04-I0.02)2+(10.05-10.02)2+(9.95—10.02)1x七=0.008所以

<7=JO.008«0.09.

8

8.最小二乘法求两个线性变量的回归方程问题

解题思路及步骤注意事项

画散点图若样本点大致分布在一条直线附近,则可判断两个变量具有线性相关,若题设

已知两个变量线性相关,可省略该步骤

求上和y准确计算工和G

列表计算3根据样本数据特点合理选用公式计算,若各数据与平均数差的有效数学字比原

数据少,则选用作差再相乘的公式

求力,写出回归方程运算结果保留两位小数位数应与题H要求

典例11:(2016全国3卷理科18)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线

图.

Ja

Kw

注:年份代码1-7分别对应年份2008-2014.

(1)由折线图看甯,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.

(2)建立y关于I的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.

附注:

参考数据:Zyi=9.32,Xtiyi=40.17,归加-y)2=0.55,77=2.646.

一i-1vi=l

)(y-y)

参考公式:相关系数厂已回归方程y=a+bt中斜率和截距的最小二乘估计公式

向(「针*y「y)2

£(t「D(y「y)一

分别为:。=上---------------,a=y-bz

i=l

解:(I)由折线图中的数据和附注中参考数据得

三=4s(tjt)2=28,Jx(yiy)=655.

Vi=

777

Ly

Z(t.-t)(y-y)=Xii-EZYi=40.17-4X9.32=2.89,

i-li-1~

因为y与l的相关系数近似为0.99,说明y与1的线性相关程度相当高,从而可以用线性回归模型拟合y与I

的关系.

9

2&-日d-于)

2.89

(2)由y—=1.331及(1)得力=i=l々0.103,

a寸-立力.331-0.103、4巾.92.所以丫关于t的回归方程为7=0.92+0.101.

将2016年对应的1=9代入回归方程得:7=0.92+0.10x9=1.82.

所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.

9.两个变量通过换元可转化为线性相关问题

解题思路及步骤注意事项

画散点图根据样本点分布情况确定两个变最适用的函数模型,若题设已知两个变最的函数模型,

可省略该步骤

换元通过换元,使得换元后的两个变量线性相关(一次函数关系)

求线性回归程用最小二乘法求线性回归方程

还原还原为原来两个变量的回归方程

典例12:(2015全国1卷理科19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:

干兀)对年销售量y(单位:t)和年利润z(单位:干兀)的影响,对近8年的年宣传费Xi和年销售量yi(i=l,2,…,8)数

据作了初步处理,得到下面的散点图及一些统计量的值.

62o

560o

58o

物56o

出54o

52o

50O

343638404244464850525456

年宣传费/千元

XW88

yt(xi-x)22

E(Wi-w)t(xi-x)(yi-y)Z(Wi-w)(yi-y)

i=li=ii=li=i

46.65636.8289.81.61469108.8

_,8

表PWi=Vxi,w=-£Wi.

8i=l

(1)根据散点图判断,产a+bx与y=c+d正哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出

判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.

(3)已知这种产品的年利润z与x,y的关系为z=0.2y・x.根据(2)的结果回答下列问题:

①年宣传费x=49时,年销售量及年利润的预报值是多少?

②年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据(uhV|)XU2,v2),...,(Un,vn),其回归线v=a+pu的斜率和截距的最小二乘估计分别为:8

2(Ui-u)(Vi-v)

-------------,«=V-^U.

册i)2

10

解:⑴由散点图的变化趋势可以判断.y=c+d4适宜作为年销售量y关于年宣传费x的回归方程类型.

8

.Z(叱-初(M-刃1()XX

⑵令w=4冼建立y关于w的线性回归方程.由于d=『-------------=一-=68

IS

1=1

34-2讨二563-68乂6.8=100.6,所以y关于w的线性回归方程为5HOO.6+68w,因此y关于x的回归方程为9

=100.6+68Vx.

(3)0由(2)知,当x=49时,年销售量y的预报值夕=100.6+68屈=576.6,年利润z的预报值£=576.6X0.2-49=66.32.

②根据⑵的结果知,年利润z的预报值,2=0.2(100.6+684)大=虫+13.6代+20.12.所以当代=*=6,8,即x=46.24

时,2取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.

10.两个分类变量是否有关的独立性检验问题

解题思路及步骤注意事项

2x2列联表注意是用样本数据而不是总体数据

计算F方注意运算策略,处理分子的交叉相乘时应先提公因式,平方数写成乘积形式再约分,最

后除法运算保留三位小数

比较经验值要根据题设中的百分比我对应的经验值做比较

下结论根据比较结果,把结论完整的表述出来,不能只是说有关或无关

典例13:(2018全国3卷理科18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务

的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,

第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:

min)绘制了如下茎叶图:

流冲生产方式第二料生产方式

S6S56«9

976270122345668

98776s433281443

2110090

(I)根据茎叶图判断哪种生产方式的效率更高?并说明理由;

(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工

人数填入下面的列联表:

超过m不超过m

第一种生产方式

第二种生产方式

(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?

n(ad-bc)2

附:

(a+b)(c+d)(a+c)(b+d)

0.0500.0100.001

k3.8416.63510.828

11

解:(1)第二种生产方式的效率更高.理由如下:

(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用

第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率

更高.

(ii)由茎叶图可知:用第一-种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生

产方式的工人完成生产任务所需付间的中位数为73.5分钟.因此第二种生产方式的效率更高.

(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟:用第二种生产方

式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.

(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大

致呈对称分布.用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对

称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式

完成生产任务所需的时间比用第•种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率

更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.

12

二、知识点总结

(-)知识点思维导图

13

(二)常用定理、公式及其变形

1.用样本的数字特征估计总体的数字特征

—X4-

(I)样本本均值:x=

(2)样本标准差:§二席"(2I)?+5+(工—-)2

(3)频率分布直方图估算样本众数、中位数、平均数

①众数:最高小矩形中点值;

年中位数:先确定中位数所在小组,设中位数为m,由直线x=m两侧小矩形面积之和等于0.5列方程求m.

③平均数:各小矩形中点值与其面积的积的和.

2.随机事件的概率及概率的意义

(1)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件:

(2)概率定义:在相同的条件S下重及n次试验,观察某一事件A是否出现,称n次试验中事件A出现

的次数nA为事件A出现的频数:称密件A出现的比例fn(A)=?为事件A出现的频率:对于绐定的随机事

件A,如果随着试验次数的增加,事件A发生的频率0(A)稳?在某个常数上,把这个常数记作P(A),

称为事件A的概率.

3.概率的基本性质

(I)事件的包含、并事件、交事件、相等事件

(2)若ADB为不可能事件,即AQB=4),那么称事件A与事件B互斥;

(3)若APIB为不可能事件,AUB为必然事件,那么称事件A与事件B互为对立事件;

(4)当事件A与B互斥时,满足加法公式:P(AUB尸P(A)+P(B);若事件A与B为对立事件,则AUB

为必然事件,所以P(AUB)=P(A)+P(B尸1,于是有P(A)=1—以B)

4.古典概型及随机数的产生

(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性.

A包含的基本事件数

(2)公式P(A)=

总的基本事件个数

5.几何概型及均匀随机数的产生

(1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称

这样的概率模型为几何概率模型;

八个构成事件4的区域长度(面积或体积)

么支:P(A)一试验的全部结果所构成的区域长度(面积或体积).

6.随机变量:如果随机试验可能出现的结果可以用一个变量X来表示,并且X是随着试验的结果的不同

而变化,那么这样的变量叫做随机变量.随机变量常用大写字母x、Y等或希腊字母&、n等表示.

7.离散型随机变量的分布列:一般的,设离散型随机变量X可能取的值为X"X2,.....,Xi......

Xn-

X取每一个值Xi(i=l,2......)的概率P(片Xi)=Pi,则称表为离散型随机变量X的概率分布,简称分

布列

pp«IP2...P*...P-

分布列性质:

①科涉,i=1>2,...;

②Pl+p2+...+pn=1.

14

8超几何分布概念与分布列

其基本模型为“在含有M件次品的N件产品中,任取n件,其中恰有X件次品数,则

事件{X=k}发生的概率为P(X=k)=频学工,k=0,1,2,…,叫其中m=min{M,n},且

nWN,MWN,n,M,N£N”,称分布列04

X01•••m

P•••

nncn

c5c5

为超几何分布列,如果随机变量X的分布列为超几何分布列,则称随机变量X服从

超几何分布.

9.条件概率:对任意事件A和事件B,在已知事件A发生的条件下事件B发生的概率,叫做条件概率.记

作P(B|A),读作A发生的条件下B的概率公式:P(5|A)=g黑,P(4)>0.

10.相互独立事件:事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫做相互

独立事件,P(A・8)=P(A)・P(b)

11.二项分布:一般地,在n次独立重复试验中,设事件A发生的次数为X,在每次试

验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概

率为P(X二k)=—k=0,1,2,…,n.此时称随机变量X服从二项分布,

记作X〜B(n,p),并称p为成功概率,其均值E(X)=np,方差D

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论