新结构:概率统计_第1页
新结构:概率统计_第2页
新结构:概率统计_第3页
新结构:概率统计_第4页
新结构:概率统计_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

24届2月优质模拟试题汇编(新结构):概率统计(大题)

★一.解答题常见结论背景

一.二项分布

1.〃重伯努利试验的概念

只包含两个可能结果的试验叫做伯努利试验,将一个伯努利试验独立地重复进行〃次所组成的随机试验称为〃重伯

努利试验.

2.〃重伯努利试验具有如下共同特征

(1)同一个伯努利试验重复做〃次;

(2)各次试验的结果相互独立.

3.二项分布

一般地,在〃重伯努利试验中,设每次试验中事件A发生的概率为用X表示事件A发生的次数,

则X的分布列为:P(X=Z)=C:p“l-p)T,Z=0J2…〃,如果随机变量X的分布列具有上式的形式,则称

随机变量X服从二项分布,记作

X~B(n,p)

4.一般地,可以证明:如果X~伏〃,p),那么EX=/中,DX=npQ-p).

二.超几何分布

超几何分布模型是一种不放回抽样,一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取

〃件(不放回),用X表示抽取的〃件产品中的次品数,则X的分布列为尸(*=幻=竺口~»=叫加+1,血+2一..,

其中〃,N,MEN*,峪N,次=max{0,〃-N+M},r=min{w,M}.如果随机变量X的分布列具有上式

的形式,那么称随机变量X服从超几何分布.

2.超几何分布的期望

E(X)=^=np(p为N件产品的次品率).

三.二项分布与超几何分布的区别

1.看总体数是否给出,未给出或给出总体数较大一般考查二项分布,此时往往会出现重要的题眼“将频率视为概率”.

2.看一次抽取抽中“次品”概率是否给出,若给出或可求出一般考查二项分布.

3.看一次抽取的结果是否只有两个结果,若只有两个对立的结果A或一般考查二项分布.

4.看抽样方法,如果是有放回抽样,一定是二项分布;若是无放回抽样,需要考虑总体数再确定.

5.看每一次抽样试验中,事件是否独立,事件发生概率是否不变,若事件独立且概率不变,一定考查二项分布,这

也是判断二项分布的最根本依据.

6.把握住超几何分布与二项分布在定义叙述中的区别,超几何分布多与分层抽样结合,出现“先拍,再抽”的题干

信息.

3.二项分布

一般地,在〃重伯努利试验中,设每次试验中事件4发生的概率为〃用X表示事件4发生的次数,

k

则X的分布列为:P(X=k)=//(1-Py-,k=0,1,2,..nf如果随机变量X的分布列具有上式的形式,则称

随机变量X服从二项分布,记作

X~B(n,p)

4.一般地,可以证明:如果X~p),那么EX=,",DX=〃p(l—p).

四.二项分布的两类最值

(1)当〃给定时,可得到函数/(6=。)"1一〃)1次=01,2厂〃,这个是数列的最值问题.

Pk_C;pkQ-p),i(〃-A+1)〃k(1-〃)+5+1)〃-A_]।(〃+1)〃一左

—=k(\-p)=k(\-p)=

分析:当%时,〃&>〃£_],随〃值的增加而增加:当%>5+1)〃时,

Pk<Pk7,PA随攵值的增加而减少.如果(〃+1)〃为正整数,当%=(〃+1)〃时,Pk=Pi,此时这两项概率均

为最大值.如果5+1)〃为非整数,而攵取(〃+1)〃的整数部分,则P*是唯一的最大值.

注:在二项分布中,若数学期望为整数,则当随机变量A等于期望时,概率最大.

(2)当人给定时,可得到函数f(p)=C:—…,〃£(0,1),这个是函数的最值问题,

这可以用导数求函数最值与最值点.

分析:f\p)=C:?PJ(\-p)n-k-pkp)"i]

=《(1一〃广1卜(1一p)-5-4)p]=〃)〃-i(k-np).

当Z=l,2,…,〃一1时,由于当时,/'(p)>0,/(p)单调递增,当〃〉人时,/'(p)<0,,f(p)单调递减,

nn

故当〃」时,/(〃)取得最大值,/(P)max=/(3•又当〃一°,/(P)f1,当〃-0时,/(〃)一°,从而一(〃)

nn

无最小值.

五.复杂概率计算

(1)善于引入变量表示事件:可用“字母+变量角标”的形式表示事件“第几局胜利”,例如:4表示“第i局比

赛胜利”,则无表示“第,.局比赛失败”.

(2)理解事件中常见词语的含义:

A/中至少有一个发生的事件为AU5;都发生的事件为A8;4班都不发生的事件为A8;恰有一个发生

的事件为4五U彳6;A,B至多一个发生的事件为4万U15U彳万.

(3)善于“正难则反”求概率:若所求事件含情况较多,可以考虑求对立事件的概率,再用夕(A)=l-P(入)解

出所求事件概率.

六.条件概率

1.条件概率定义

一般地,设A3为两个随机事件,且尸(A)>0,我们称。(3|4)二里”为在事件A发生的条件下,事件8发

P(A)

生的条件概率,简称条件概率.

可以看到,P(8|A)的计算,亦可理解为在样本空间A中,计算A3的概率.于是就得到计算条件概率的第二种途,

n(AB)

n(AB)=n(Q)=P(AB)

即P(B\A)=〃⑷一厂一户⑷

〃(。)

特别地,当尸(B|A)=P(B)时,即4B相互独立,则尸(AB)=P(A)P(5).

2.条件概率的性质

设P(A)>0,全样本空间定义为Q,则

(1)P(C|A)=1;

(2)如果3与。是两个互斥事件,则P((3uC)|A)=P(5|A)+P(C|A);

(3)设事件A和8互为对立事件,则P(耳IA)=1-P(B|A).

七.全概率公式与贝叶斯公式

在全概率的实际问题中我们经常会碰到一些较为复杂的概率计算,这时,我们可以用“化整为零”的思想将它们分

解为一些较为容易的情况分别进行考虑

一般地,设小,从2,…,A”是一组两两互斥的事件,人=45..74=^,且P(A)>0,i=L2,…,nf则对

任意的事件BqC,有P(B)=£P(A)P(B|A).

r-l

我们称上面的公式为全概率公式,全概率公式是概率论中最基本的公式之一.

2.贝叶斯公式

设4,从2,…,A〃是一组两两互斥的事件,AD…uA“=。,且尸(A)>0,i=l,2,…,〃,则对任意事件Bg。,

有p(ai8)="a)*®"1)=,"(,')"®,/=i,2,…,几在贝叶斯公式中,尸(耳)和P(AW)分别称为先验

P⑻”(A)P伊A)

k=\

概率和后验概率.

八.一维随机游走与马尔科夫链

1.转移概率:对于有限状态集合5,定义:4)=。(X用="乂")为从状态,到状态,/的转移概率.

2.马尔可夫链:若P(X“«j|X〃,‘,x”』,xo..)=I=Pl),即未来状态Xe只受当前状态X.的

影响,与之前的X1,X、2,…,X。无关.

3.一维短机游走模型.

设数轴上一个点,它的位置只能位于整点处,在时刻,=0时,位于点x=i(ieN+),下一个时刻,它将以概率。或

者夕(a£(0,1)。+/=1)向左或者向右平移一个单位.若记状态Xg表示:在时刻/该点位于位置x=i(iwN»

那么由全概率公式可得:

尸(X-)=P(Xw)•P(X…IXu)+尸―P(X,+I=/1Xu)

另一方面,由于P(X.1|X』T)=£,P(X,+』|X』.|)二a,代入上式可得:

■=。%+厂用・

进一步,我们假设在工=0与工=m(〃2>0,〃?£%+)处各有一个吸收壁,当点到达吸收壁时被吸收,不再游走.于

是,己=0,^=1.随机游走模型是一个典型的马尔科夫过程.

进一步,若点在某个位置后有三种情况:向左平移一个单位,其概率为。,原地不动,其概率为力,向右平移一个

单位,其概率为C,那么根据全概率公式可得:

有了这样的理论分析,下面我们看全概率公式及以为随机游走模型在2019年全国1卷中的应用.

九.统计

1.线性回归方程与最小二乘法

(1)回归直线方程过样本点的中心(月田,是回归直线方程最常用的一个特征

(2)我们将»=去+6称为y关于X的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直

线.这种求经验回归方程的方法叫做最小二乘法,求得的〃,。叫做方,。的最小二乘估计(/easfsq”areses〃mme),其

b=--------=-------

£(七-可2力;一沅

f=Ir=l

A

a=y-bx.

(3)残差的概念

对于响应变量y,通过观测得到的数据称为观测值,通过经验回归方程得到的亍称为预测值,观测值减去预测值称

为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存

在可疑数据等,这方面工作称为残差分析.

(4)刻画回归效果的方式

(i)残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图

形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.

(ii)残差平方和法:残差平方和力(n-二)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合

/=|

效果越差.

(iii)利用心刻画回归效果:决定系数斤是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客立

-5j

预报变量的能力.内=1得",乃越大,即拟合效果越好,序越小,模型拟合效果越差.

E(z-y)2

/=|

★二.优质模拟试题汇编

1.(浙江省温州市2024届高三上学期期末考试)现有标号依次为1,2,…,〃的〃个盒子,标号为1号的盒子里

有2个红球和2个白球,其余盒子里都是1个红球和1个白球.现从1号盒子里取出2个球放入2号盒子,再从2

号盒子里取出2个球放入3号盒子,…,依次进行到从〃-1号盒子里取出2个球放入〃号盒子为止.

(1)当〃=2时,求2号盒子里有2个红球的概率;

(2)当〃=3时,求3号盒子里的红球的个数J的分布列;

(3)记〃号盒子中红球的个数为X“,求X”的期望E(X“).

【详解】(1)由题可知2号盒子里有2个红球的概率为2=等=

⑵由题可知4可取1,2,3,^=l)=||x||+^x||=^,

*=3)=1喀+管P(k2)=n)—P(­)=?

所以3号盒子里的红球的个数q的分布列为

123

7117

P

361836

(3)记%T为第,?(〃N2)号盒子有三个红球和一个白球的概率,则4=:,“I为第〃(〃22)号盒子有两个红球和两

6

711

个白球的概率,则伪=:b2=g则第〃(〃22)号盒子有一个红球和三个白球的概率为-如,且

31o

211

bn-\=T^-2+Tan-2+弓(1-%-2-2-2)(〃23),

J44

化解得加=?1*+1:,得心「3沁1心,―3―、卜*3=13而4,3="才々、3、,则数列九/31I为等比数列,首项

6256^5731553/51

11

以+

=--・

622♦

E(X”)=1xan_1++3x(1—a,-_2_J=3—2%—%=2.

2.(浙江省宁波市镇海中学2024届高三上学期期末)某款游戏预推出一项皮肤抽卡活动,玩家每次抽卡需要花费

10元,现有以下两种方案.方案一:没有保底机制,每次抽卡抽中新皮肤的概率为Pi;方案二:每次抽卡抽中新

皮肤的概率为〃2,若连续99次未抽中,则第100次必中新皮肤.已知。<〃2<目<1,玩家按照一、二两种方案进

行抽卡,首次抽中新皮肤时的累计花费为x,y(元).

(1)求x,y的分布列;

(2)求E(x);

(3)若PI=2〃2=0.02,根据花费的均值从游戏策划角度选择收益较高的方案.(参考数据:0.9/!0.37.)

【详解】(1)X可取值10,20,30,…,,y可取值10.20,…,1000,当>=A时,摸球次数为苏,没有抽中新皮肤的概

率为"Pi,故P(X=&)=(1-pj历t,-j^eN,

(1_〃2尸〃2,34

尸(y=2)=.

(l-p,)",A:=1000

(2)令A=£/(l—pji,则(1一〃|)八二之/(1一〃|)',故PjA=l+(l-pj+(l-整理得

/=|

至1」〃e=匕止血一

P\

所以A=若玩家按方案一抽卡,花费k元时抽到皮肤,则抽取次数为3而

月I。

k_k_

尸(X=s)=p«-pJ力,其中浑3s”.则£(x)=fs(l—月沛龙亲(Jpj广

5-1S-11U

1-(1一四)布±

=10--------------------〃(1-/I》。,

Pl

因为玩家按方案一抽卡次数无限制,且当〃时,&(]-p消->0,(if声_>0,

所以E(X)=W.

Pi

(3)A=2〃2=O.O2,即月=0.02,%=()♦()1,由(2)可得故石")=旦=50();

0.02

若玩家按方案二抽卡,则y可取值10,20,…,1000,且2(丫=/)=0.0以0.99分,其中i=1(),20,…,990,

99

p(r=iooo)=0.99",故E(丫)=1ooox0.99"+1og卜x0.01x0.99^'j,

A=1

=01xf>0#0./3一巴工+I000M

普1710.0120.01J

=1000(1-0.99")-990x0.99"+1000x0.99"=I000-990x0.99w«1(X)()-990—«630

,70.99

因为E(x)〈矶y),故选择方案二.

3.(新疆维吾尔自治区乌鲁木齐市2024届高三第一次质量监测)我们平时常用的视力表叫做对数视力表,视力呈

现为4.8,4.9,5.0,5.1.视力25.0为正常视力.否则就是近视.某地区对学生视力与学习成绩进行调查,随机抽

查了100名近视学生的成绩,得到频率分布直方图:

(1)能否据此判断学生的学习成绩与视力状况相关;(不需说明理由)

(2)估计该地区近视学生学习成绩的第85百分位数;(精确到0.1)

(3)已知该地区学生的近视率为54%,学生成绩的优秀率为36%(成绩285分为优秀),从该地区学生中任选一

人,若此人的成绩为优秀,求此人近视的概率.(以样本中的频率作为相应的概率)

【详解】(1)因从频率分布直方图可以看到,不同成绩层次的同学近视率大致相当,故不能据此判断学生的学习成

绩与视力状况相关;

(2)由频率分布直方图可知,成绩90分以下所占比例为7%+13%+20%+24%=64%,因此第85百分位数一定位

于[90,100]内,

85-6435

由go+iOxMTrngo+magsw,可以估计该地区近视学生的学习成绩的第85百分位数约为95.8;

(3)设A=”该地区近视学生”,6=“该地区优秀学生”,由频率分布直方图可得=(竿

。日。.54~)=。.36,所以2陋=锵=缥产=端衿=。.72.

,\UI,\UfIJ

即若此人的成绩为优秀,则此人近视的概率为0.72.

4.(合肥一中2024届高三上学期期末)我国一科技公司生产的手机前几年的零部件严重依赖进口,2019年某大国

对其实施限制性策略,该公司启动零部件国产替代计划,与国内产业链上下游企业开展深度合作,共同推动产业发

展.2023年9月该公司最新发布的智能手机零部件本土制造比例达到」90%,以公司与一零部件制造公司合作生

产某手机零部件,为提高零部件质量,该公司通过资金扶持与技术扶持,帮助制造公司提高产品质量和竞争力,同

时派本公司技术人员进厂指导,并每天随机从生产线上抽取一批零件进行质量检测.下面是某天从生产线上抽取的

10个零部件的质量分数(总分1000分,分数越高质量越好):928、933、945、950、959、967、967、975、982、

994.假设该生产线生产的零部件的质量分数X近似服从正态分布N(〃,2(>),并把这10个样本质量分数的平均

数[作为〃的值.

参考数据:若X〜则P(〃一bKXK〃+b)=0.68.

(1)求〃的值;

(2)估计该生产线上生产的1000个零部件中,有多少个零部件的质量分数低于940?

(3)若从该生产线上随机抽取〃个零件中恰有4个零部件的质量分数在[940,980]内,则〃为何值时,P(^=1O)

的值最大?

【解析】

28+33+45+50+59+67+67+75+82+94

(1)=二900+=960,所以〃=960.

10

(2)由(1)知,X~N(960,202),

/、z、1一P(〃一。WXW1-0.68

P(X<940)=P(X<//-rr)=——---------------------——人-----------=0.16.

22

该生产线上生产的1000个零部件中,质量分数低于940的个数约为0.16x1000=160.

(3)每个零部件的质量分数在[940,980]内的概率为P(//-cr<X<//+cr)«0.68,

,oM,o

由题意可知g〜8(〃,0.68),则P(J=10)=xO.68xO.32->

(,oM9

、+C'I1xO.68xO.32-().32〃+0.32

设/(〃)=C:°xO.68")x0.32…则二.人0.68隈0.3210—一口一令

0.32〃+0.32,-9.32…、0.32n+0.32,皿

------------------>1,得〃<-----»13.7,所以当〃<13时,+令A------------<1,得

72-90.68〃一9

o32

n>—«13.7,所以当〃214时,+所以〃=14时,/(〃)最大,故使尸(4=10)最大的n的

0.68

值为14.

5.(江西省南昌市第二中学2024届高三“九省联考”考后适应性测试)有两个盒子,其中1号盒子中有3个红球,2

个白球;2号盒子中有6个红球,4个白球.现按照如下规则摸球.从两个盒子中任意选择一个盒子,再从盒中随

机摸出2个球,摸球的结果是一红一白.

(1)你认为较大可能选择的是哪个盒子?请做出你的判断,并说明理由;

(2)如果你根据(1)中的判断,面对相同的情境,作出了5次同样的判断,记判断正确的次数为X,求X的数

学期望(实际选择的盒子与你认为较大可能选择的盒子相同时,即为判断正确).

【详解】(1)设选择1号盒子后摸出一红一白的概率为片,设选择2号盒子后摸出一红一白的概率为4,则

片=罢4〃=萼=4,因为八人,所以较大可能选择1号盒子;

J3jo

99)

(2)由贝叶斯公式,选择1号盒子后猜中的概率>=2=由题意得:X~B5,-,

945

所以qX)=5x行=正―

6.(江西省抚州市临川第一中学2024届高三“九省联考”考后适应性测试)某校举行围棋友谊赛,甲、乙两名同学

71

进行冠亚军决赛,每局比赛甲获胜的概率是;,乙获胜的概率是可,规定:每一局比赛中胜方记1分,负方记0分,

先得3分者获胜,比赛结束.

(1)求进行3局比赛决出冠亚军的概率;

(2)若甲以2:1领先乙时,记X表示比赛结束时还需要进行的局数,求X的分布列及数学期望.

【详解】(1)甲3局全胜的概率为=■,乙3局全胜的概率为鸟

JJJ4/JJJ4,

・•・进行3局比赛决出冠亚军的概率为P=:+:=:

719111

(2)X的可能取值为1,2,P(X=1)=-,P(X=2)=^x-+lxi=l故X的分布列为:

7.(吉林省长春市五校2023.2024学年高三上学期联合模拟考试)为了更好地推广冰雪体育运动项目,某中学要求

每位同学必须在高中三年的每个冬季学期选修滑冰、滑雪、冰壶三类体育课程之一,且不可连续选修同一类课程,若

I

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论