




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高考概率问题的衍生与马尔可夫链马尔可夫链是俄国数学家AndreyAndreyevichMarkov(18561922)研究并提出的一种数学方法,是用来解释自然变化的一般规律模型,该数学方法可以说是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测、语音识别方面都有着极其广泛的应用.在高中,马尔可夫链实际上就是一类特殊的数列递推问题,最大的难点在于理解题意以及寻找递推式.赌徒问题(随机游走)例1:(2023·杭州市二模/湖南师大附中三模T21)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.
其数学定义为:假设我们的序列状态是…Xt2,Xt1,Xt,Xt+1…,那么Xt+1时刻的状态的条体概率仅依赖前一状态Xt,即P(Xt+1|…Xt2,Xt1,Xt)=P(Xt+1|Xt).现实生活中也存在着许多马尔科大链,例如著名的赌徒模型.
假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为50%,每局赌赢可以赢得1元,每一局赌徒赌输的概率为
50%,赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为A(A∈N*,A<B),赌博过程如图的数轴所示.
当赌徒手中有n元(0≤n≤B,n∈N)时,最终输光的概率为P(n),请回答下列问题:
(1)请直接写出
P(0)与P(B)的数值;(2)证明{P(n)}是
个等差数列,并写出公差d;
(3)当A=100时,分别计算B=200,B=1000时,P(A)的数值,并结合实际,解释当B→+∞时,P(A)的统计含义.(1)请直接写出
P(0)与P(B)的数值;我们来理解一下问题在说什么:一个赌徒拿着A元去赌博,50%输掉一元,手上的本金就只有A1元,赢得话就A+1元,不妨优先考虑一些极端情况:①如果一开始就是0元的本金,那他就是一开始就是输光的状态,所以他输的概率
P(0)=1②如果一开始就是B元的本金,那他一开始就已经赢到目标钱数,所以输的概率
P(0)=0(2)证明{P(n)}是
个等差数列,并写出公差d;考虑一些常规情况,手上有未知的本金n元,我们令n=10,手上有10元,他输光的概率就是
P(10)
,同时这也是一种所处的状态,这个
P(10)
的状态,可以是由P(9)
的状态赢了一局后得到的,也可以是由
P(11)
的状态输了一局得到的,公式表为P这样子我们可以得到一个更普遍的递推式也许会有同学会问为什么不可以由
的状态或者别的状态到达P(n)吗?其实也是可以的,最后化出来的式子是隔项的递推式,经过变形推导也能得到上述式子,但是为了方便我们一般都是取最近的状态研究,我们来推导一下它的通项:2P易知
{P(n)}为等差数列,令公差为d,则有P0+Bd=(3)当A=100时,分别计算B=200,B=1000时,P(A)的数值,并结合实际,解释当B→+∞时,P(A)的统计含义.在这里我们可以看到,如果你的目标钱数B如果趋于
+∞
时,你输光的概率将趋近于1即百分百,事实上,如果拓展到更广的范围,你输光为0仍然不收手继续赌博,仍然要达到目标B,最后你很有可能会先负债B;也就是说,在公平游戏的情况下,也会趋于“久赌必输”,更何况现实中的赌博往往是不公平的(庄家赢的概率较大);所以我们要控制自己的欲望,不要参与赌博.例2:(2020·岳阳市一模T21)某产品自生产并投入市场以来,生产企业为确保产品质量,决定邀请第三方检测机构对产品进行质量检测,并依据质量指标Z时,产品为优等品;当时,产品为一等品;当时,产品为二等品.第三方检测机构在该产品中随机抽取500件,绘制了这500件产品的质量指标Z的条形图.用随机抽取的500件产品作为样本,估计该企业生产该产品的质量情况,并用频率估计概率.(1)①从该企业生产的所有产品中随机抽取1件,求该产品为优等品的概率;②X元,求X的分布列与数学期望;(2)商场为推广此款产品,现面向意向客户推出“玩游戏,送大奖”活动.客户可根据抛硬币的结果,操控机器人在方格上行进,已知硬币出现正、反面的概率都是12,方格图上标有第0格、第1格、第2格、……、第50格.机器人开始在第0格,客户每掷一次硬币,机器人向前移动一次,若掷出正面,机器人向前移动一格(从k到k+1),若掷出反面,机器人向前移动两格(从k到k+2),直到机器人移到第49格(胜利大本营)或第50格(参与n格的概率为.①投掷三次硬币后,设机器人所在格数为X,求X的分布列以及数学期望;②求Pn的表达式并解释此方案能否吸引顾客购买该款产品.解析:(1)①.根据条形图可知,优等品的频率为121+87+42500=12,用频率估计概率,可得任取一件产品为优等品的概率.
②.由①任取一件产品为优等品的概率为12,由题意求出检测出3件或4件为优等品时以及检测出的优等品低于3件时的X的值进而得出P(X=47000)或P(X=39000).可得X的分布列,即可得出数学期望E(X)=41500.
(2)机器人在第0格为必然事件,P0=1,第一次掷硬币出现正面,机器人移到第1格,其概率P1=12.机器人移到第n(2≤n≤49)格的情况只有两种:①先到第n2格,又出现反面,其概率12Pn2,②先到第n1格,又出现正面,其概率12Pn1.可得Pn=12PPnPn1=12(Pn1Pn2),1≤n≤49时,数列{PnPn1}为首项P1P0=12,公比为12的等比数列马尔可夫链(MarkovChains)我们可以看到,上述问题的解决,是在一个当前的状态下,去判断前一个状态和后一个状态与该状态的联系,从而找到递推式,过程中的每个状态的转移只依赖于在此之前的n个状态,这个过程被称为n阶马尔可夫模型(其中n是影响转移状态的数目),最简单的马尔科夫过程就是一阶过程,每一个状态的转移只依赖于其之前的那一个状态,这也是后面很多模型的讨论基础.很多时候,题目中的马尔科夫链、隐马尔可夫模型都是只讨论一阶模型,甚至很多文章就将一阶模型称之为马尔可夫模型,实际上我们知道一阶模型只是一种特例而已.传球问题中的马尔可夫模型例3:三人互相传球,由甲开始发球,并作为第一次传球,每人得球后传球给其他人的可能性均相等.经过5次传球后,球仍回到甲手中,则不同的传球方式共有(
)A.6种 B.8种 C.10种 D.16种【答案】C【解析】根据题意,作出树状图,第四次球不能传给甲,由分步加法计数原理可知:经过5次传球后,球仍回到甲手中,则不同的传球方式共有10种,这个问题解决起来不算麻烦,可以看做是一个排列组合问题下的分支,但是一旦参与的人数变多或者传球次数增加,那么列举法就会显得捉襟见肘,所以我们不妨把这类问题做一个引申和推广.(例3升级Plus版本):甲乙丙丁4人传接球训练,球从甲脚下开始,等可能地随机传向其余3人中的1人,接球者接到球后,再等可能地随机传向另外3人中的1人,依此类推.假设所有传出的球都能接住.记第n次传球之前,球在甲脚下的概率为Pn
(n∈N∗)
,易知
P1=1
,P2=0.
(1)推导Pn
的表达式;
(2)设第n次传球之前,球在乙脚下的概率为Qn
,比较Qn
与Pn
(
n≥3
)的大小;并结合实际,解释当n→+∞时,Pn
与Qn
的统计含义;(3)假设经历了6次传球后,球依旧在甲的脚下,请问共有多少种不同的传球路径?分析第一个问题球在甲脚下,概率为
Pn
,这个概率是受上一个持球者影响的:如果上一个持球者还是甲,那球传出去后,只能是其它三人接球,下一个持球者就不可能是甲,所以从上一个甲持球的状态,到现在还是甲持球的状态,转移概率为0;如果上一个持球者不是甲,而是乙丙丁三人中的随便一个人,那么球传出去后,有
13可能给到甲,即转移概率为
综上公式可以描述为Pn=0·Pn1+13·(1-P经过变形也能构造出等比数列,进而求出通项分析第二个问题易得乙的递推也类似甲,唯一不同的是初始概率.得到,接下来就是做差比较,最后分奇数和偶数讨论大小.这里我们观察一下通项
,随着n越来越大,意思是传球的次数越来越多,球在甲、乙手上的概率会趋于一个定值14,又因为四个人是等可能地随机传球,所以每个人接到球的可能性会逐渐相等.分析第三个问题球在甲脚下的概率可以计算得到,所有传球路径总的可能数为36,四个人是等可能地随机传球,所有路径均为等可能性,使其相乘即为不同的传球路径的数量,易知答案为183种.例4:(2023·惠州一模T22改编)为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐(吐槽一下惠州学生命真苦啊……).已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为
23
,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为
14
,前一天选择面食套餐后一天继续选择面食套餐的概率为
12
,如此往复.
(1)求该同学第二天中午选择米饭套餐的概率;
(2)记该同学第n天选择米饭套餐的概率为
Pn;
(i)求Pn表达式;
(ii)证明:当n≥2时,Pn
≤512
;并结合实际,说明当n→+∞时,P高考中的马尔可夫链问题(2019·全国1·理T21)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.(1)求X的分布列;(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.(ⅰ)证明:{pi+1pi}(i=0,1,2,…,7)为等比数列;(ⅱ)求p4,并根据p4的值来解释这种试验方案的合理性.【解析】(1)X的所有可能取值为1,0,1.P(X=1)=(1α)β,P(X=0)=αβ+(1α)(1β),P(X=1)=α(1β).所以X的分布列为X101P(1α)βαβ+(1α)(1β)α(1β)(2)(ⅰ)由(1)得a=0.4,b=0.5,c=0.1.因此pii1pii+1,故0.1(pi+1pi)=0.4(pipi1),即pi+1pi=4(pipi1).又因为p1p0=p1≠0,所以{pi+1pi}(i=0,1,2,…,7)为公比为4,首项为p1的等比数列.(ⅱ)由(ⅰ)可得p8=p8p7+p7p6+…+p1p0+p0=(p8p7)+(p7p6)+…+(p1p0)=48-1由于p8=1,故p1=34所以p4=(p4p3)+(p3p2)+(p2p1)+(p1p0)=44-13pp4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p4=1257此时得出错误结论的概率非常小,说明这种试验方案十分合理.思考:pi=api1+bpi+cpi+1(i=1,2,…,7)这个公式怎么来的?一维随机游走模型:设数轴上一个点,它的位置只能位于整点处,在时刻t=0时,位于点x=i(i∈N+),下一个时刻,它将以概率α或者β(α,β∈(0,1),且α+β=1)向左或者向右平移一个单位.若记状态Xt=i表示:在时刻t该点位于位置x=i(i∈N+),那么由全概率公式可得:
P(Xt+1=i)=P(Xt=i1)•P(Xt+1=i|Xt=i1)+P(Xt=i+1)•P(Xt+1=i|Xt=i+1)
另一方面,由于P(Xt+1=i|Xt=i+1)=α,P(Xt+1=i|Xt=i1)=β;
代入上式可得:Pi=α•Pi+1+β•Pi1
进一步,我们假设在x=0与x=m(m>0,m∈N+)处各有一个吸收壁,当点到达吸收壁时被吸收,不再游走.于是,P0=0,Pm=1.随机游走模型是一个典型的马尔科夫过程,进一步,若点在某个位置后有三种情况:向左平移一个单位,其概率为a,原地不动,其概率为b,向右平移一个单位,其概率为c,那么根据全概率公式可得:
pi=api+1+bpi+cpi1(2020·全国Ⅰ卷T19)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先12(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【解析】(1)甲连胜四场的概率为116(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为116;乙连胜四场的概率为1丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为1(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18思考:这里主要研究第三问,事实上,本题是一个典型的马尔可夫链模型,其具有马尔可夫性质:即一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态.对于这种满足马尔科夫性质的随机事件,其概率或者期望,采用马尔科夫链公式,能够极大地简化计算.具体如下:(基本就是降维打击)设第一轮比赛的负者最终获胜概率为P1=,第一轮比赛的胜者与丙最终获胜概率均为P2,故有P1+P2+P2=1,解得P2=.再来看两个例子,①:甲、乙两人轮流抛硬币(质地均匀),约定甲先抛,谁先抛出正面获胜,问甲获胜的概率是多少?法一:数列通项求极限法二:概率递推设甲最终获胜概率为P,分两种情况:第一种情况,第一轮甲抛出正面,概率为12第二种情况,第一轮甲抛出反面,概率为12,则相当于比赛重新进行,只是由乙先抛,根据对称性可知此时乙获胜概率为P,甲获胜概率为1P.因此,我们有P=12+12(1P),②:(2017清华大学自主招生T12)投掷一枚质量均匀的硬币,当出现两次正面向上即停止,求总投掷次数的数学期望.法一:数学期望定义+函数与数列方法(需要无穷级数知识)记随机变量X表示总投掷次数,下面计算P(X=k);总共投掷k次结束,说明第k次投掷的结果为正面,前k−1次中恰有一次为正面.不难利用古典概型推出,P(X=k)=(k−1)·.接下来使用无穷级数求和去解决极限收敛问题(需要一些极限知识)法二:采用数学期望性质+马尔科夫链思路求解:设投掷硬币直到出现两次正面这件事为X.将这个事情分成两件事:1.投掷硬币,直到第一次出现正面,记此时投掷X1次;2.到第一次出现正面后,重新计算.投掷硬币,直到再一次出现正面,记此时投掷X2次.投掷硬币是一个独立问题,这一次的正反不会影响后面投掷时的正反.因此不难得出E(X1)=E(X2)=2.(同样的概率模型可以用在彩票上,如果说某个彩票的大奖的中奖率为1%,从理论上来说,买上100张彩票,就可以中一次大奖了,即E(ξ)=1p,p为一次试验成功的概率由数学期望性质,得E(X)=E(X1)+E(X2)=4.思考:如果此题改为“投掷一枚质量均匀的硬币,当出现连续两次正面向上即停止,求总投掷次数的数学期望.”该如何解决?(2020·江苏T23)甲口袋中装有2个黑球和1个白球,乙口袋中装有3个白球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复n次这样的操作,记甲口袋中黑球个数为Xn,恰有2个黑球的概率为pn,恰有1个黑球的概率为qn.(1)求p1·q1和p2·q2;(2)求2pn+qn与2pn1+qn1的递推关系式和Xn的数学期望E(Xn)(用n表示).(2023·新高考Ⅰ卷T21)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投籃,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.(1)求第2次投篮的人是乙的概率;(2)求第i次投篮的人是甲的概率;(3)已知:若随机变量Xi服从两点分布,且,则.记前n次(即从第1次到第n次投篮)中甲投篮的次数为Y,求E(Y).(1)分类,第一次投篮是甲的话,到第二次投篮还是甲的转移概率为0.6;第一次是乙的话,到第二次投篮还是乙的转移概率为0.8,即
P(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 牛气营销方案
- 协议书存款 通道
- 2025-2030介入导管材料创新与性能优化关键技术发展白皮书
- 三方协议书 换新
- 2025-2030亲子互动模式对婴幼儿智力发展的影响研究
- 2025-2030二手实木家具回收再利用商业模式创新可行性报告
- 2025-2030乳品添加剂行业生产自动化改造与效率提升方案
- 原木家具安装施工方案
- 2025-2030临海建筑抗腐蚀节能窗材料研发与市场应用前景
- 桩基础施工方案谁签字
- (2025)时事政治试题库附答案详解
- 支行日常巡检方案
- 网络安全威胁建模规范
- 2025年双鸭山宝清县公安局公开招聘留置看护队员100人工作考试考试参考试题及答案解析
- 2025年度济南市工会社会工作专业人才联合招聘(47人)笔试参考题库附答案解析
- 统编版2025-2026学年语文六年级上册第一、二单元综合测试卷(有答案)
- 2025年成考语文试卷及答案
- 2025年国企面试题型及答案
- 5年(2021-2025)高考1年模拟物理真题分类汇编专题04 机械能守恒、动量守恒及功能关系(广东专用)(解析版)
- 石刻牌坊施工方案
- T-CWAN 0166-2025 不锈钢波纹管非熔化极气体保护焊工艺规范
评论
0/150
提交评论