




已阅读5页,还剩238页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,博弈论,第一章导论,1.1什么是博弈论(GameTheory),1.1.1从游戏到博弈,游戏都有一些共同的特点:,1.都具有一定的规则;,2.都有一个结果;,3.策略至关重要;,4.策略和利益有相互依存性,.,2,一、博弈论概述,1.1.1博弈论的定义博弈论研究的是人与人之间利益相互制约下策略选择时的理性行为及相应结局。豪尔绍尼(JohnC.Harsanyi)1994年诺贝尔经济学奖获奖致词:博弈论是关于策略相互作用的理论。博弈论研究人与人之间“斗智”的形式和后果,当人们利益存在冲突时,每个人所获得的利益不仅取决于自己所获取的行动,还依赖于其他人采取的行动,每个人都需要针对对方的行为选择作出对自己最有利的反应。,.,3,3、博弈论的分类(1)合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。(2)非合作博弈研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。(3)完全信息不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息;反之,则称为不完全信息。(4)静态博弈和动态博弈静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。,.,4,博弈的分类及对应的均衡,.,5,1.1.2一个非技本性的定义规定或定义一个博弈需要以下几个方面:1参与人(Player)(局中人)指博弈中的决策主体,他的目的是通过选择行动(或策略)以最大化自己的支付(效用)水平,参与人可以是自然人、团体、自然(“上帝”作为虚拟的参与人)。2各个参与人各自可选择行动集(actionset),Ai=ai,是其可以采用的全部行动的集合。一个行动组合(actionproile)是一个由博弈中的n个参与人每个选取一个行动所组成的有序集a=(a1,a2,an)。3.参与人i的策略(strategy)是如下的一项规则:给定其信息集,该策略决定在博弈的每一时点他选择何种行动。,.,6,参与人i的策略集(strategyset)Si=si是其可行策略的集合。策略组合(strategyprofile)s=(s1,s2,sn)是由博弈的n个参与人每人选择一个策略所组成的一个有序集。4.参与人i的得益(支)(payoff)ui(s1,s2,sn)表示这样的含义:在所有的参与人和自然都选择了各自的策略且博弈已经完成后,参与人i获得的效用。参与人i获得的期望效用,该期望效用是参与人i及其他参与人所选择的策略的函数。5.一个博弈的结果是指在博弈结束以后,建模者从行动、得益和其他变量的取值中所挑选出来的他所感兴趣的要素的集合。,.,7,1.2几类经典的博弈模型1.2.1囚徒的困境(prisonersdilemma),这个例子本身就部分奠定了非合作博弈论的基础。,.,8,1.2.2智猪博弈猪圈里有两头猪:大猪和小猪,猪圈的一头有一个猪食槽,另头装有个按纽,控制着猪食的供应,按一下就会有10单位的猪食进槽,但谁按谁就要付出相当于2单位猪食的成本;当猪食进槽时,若大猪先到,大猪可吃到9单位;小猪先到,则小猪可吃到4单位,大猪吃6单位;若两者同时到,叫大猪可吃7单位,小猪吃3单位。,小猪,大猪,按,等,按,等,5,1,4,4,9,1,0,0,.,9,1.2.3性别战1.2.4斗鸡博弈,女,足球,芭蕾,男,足球,芭蕾,2,1,0,0,0,0,1,3,A,B,进,退,进,退,3,3,2,0,0,2,0,0,.,10,1.2.5市场进入阻挠1.2.6猜硬币博弈1.2.7石头剪子布,默许,在位者,进入者,进入,不进入,斗争,40,50,10,0,0,300,0,300,猜硬币方,正,反,正,反,盖硬币方,1,1,1,1,1,1,1,1,石头,剪子,布,石头,剪子,布,0,0,1,1,1,1,1,1,0,0,1,1,1,1,1,1,0,0,A,B,.,11,1.3博弈的结构和博弈的分类1.3.1博弈中的博弈方一、单人博弈实际上是最优化问题,或者是一个参与人与“自然”的博弈。二、双人博弈最常见、研究得最多的博弈双人博弈中的两个博弈方之间并不总是相互对抗的。(互补性问题)掌握信息较多的一方并不能保证获益大。个人追自身的最大利益并不能保证所得最优。三、多人博弈可能存在“破坏者”与“联盟”。,.,12,1.3.2博弈中的策略博弈中独立决策、独立承担博弈结果的个人或组织称为博弈方。博弈中各博弈方的决策内容称为“策略“,但应注意到并不是每个博弈方都有相同的可选略。如果在一个博弈中每个博弈方的策略数都是有限的,则称该博弈为有限博弈;否则就称为无限博弈。1.3.3博弈中的得益(支付,payoff)得益指在一个特定的策略组合下参与人得到效用水平,即各个博弈方从博弈中所获得的利益.,.,13,一、零和博弈二、常和博弈三、变和博弈国内常见的博弈论参考书:1.经济博弈论(第二版)谢识予编著复旦大学出版社,20022.博弈论与信息经济学张维迎著,上海三联书店、上海人民出版社3.博弈论施锡铨著,上海财经大学出版社,20024.GameTheory,1991,D.Fudenbergu1,u2,un表示策略式博弈。例,L,M,R,U,M,D,4,3,5,1,6,2,2,1,8,4,3,6,3,0,9,6,2,8,S1=U,M,D,S2=L,M,R,支付用矩阵表示,称为双矩阵博弈。,参与人A,参与人B,.,17,2.1.1上策均衡(严格占优战略均衡)如果在某个博弈中,无论其他博弈方选择什么策略,一个博弈方的某个策略给他带来的支付始终不低于其他策略,则称该策略为这个博弈方的一个上策(优势策略Dominantstrategy)。如果一个博弈的某个策略组合中所有策略都是各个博弈方自己的上策,则称这样的策略组合为该博弈的一个“上策均衡”。例(囚徒的困境),.,18,2.1.2严格下策反复消去法(逐步剔除严格劣战略)例,L,M,R,U,M,D,8,3,5,1,6,2,2,1,8,4,3,0,9,6,2,8,3,6,可以预测该博弈的合理结局为(U,L),即参与人A,选择策略U,而参与人B选择策略L。,.,19,2.2Nash均衡2.2.1Nash均衡的定义Nash均衡是指这样的策略组合(或剖面):为了极大化自己的收益(或效用),每一个参与人所采取的策略一定应该是关于其他参与人所采取的策略的最佳反应.因此没有一个参与人会轻率地偏离这个策略组合而使自己蒙受损失。,.,20,定义在有n个参与人的博弈G=S1,S2Sn;u1,u2,un)中,策略组合s*=(s1*,s2*,sn*)是一个Nash均衡,如果对于每一个i,si*是给定其他参与人的选择:S-i*=(s1*,si-1*,si+1*,sn*)的情况下,第i个人的最优策略,即ui(si*,s-i*)ui(si,s-i*),对所有的i或者用另一种表示方式,si*是下述最大化问题的解:si*argui(s1*,si-1*,si,si+1*,sn*),i=1,2,n因此,当且仅当没有一个参与人能从单方面背离某个策略组合的预见中增加自己的得益时,这个策略组合就是Nash均衡。,Si*Si,.,21,Nash均衡的哲学含义:设想n个参与人在博弈前规定每一个参与人选择一个特定的策略。s*=(si*,s-i*)代表这个协议,要问在没有外力强制的情况下,是否有参与人有积极性不遵守该协议?如没有,则说明该协议是可以自动实施的。能够自动实施的协议就可以看作一个Nash均衡。例求下列博弈的Nash均衡:,C,R,得Nash均衡为:,(D,R).,用划线法可求,.,22,Nash均衡有强弱之分.上述定义中给出的是弱Nash均衡,一个Nash均衡是强的,如果给定其他参与人的策略,每一个参与人的选择是唯一的。即,s*是一个强Nash均衡,当且仅当对每一个i,sisi*总有:ui(si*,s-i*)ui(si,s-i*)。如果一个Nash均衡是强的,则没有任何参与人在均衡策略和其他策略之间是无差异的。(弱Nash均衡不是)如在以下博弈中:,C1,C2,C3,R1,R2,R3,2,12,1,10,1,12,0,12,0,10,0,11,0,12,0,12,0,13,(R1,C1)和(R1,C3),都是Nash均衡,但没有,一个强Nash均衡。,.,23,本质上说,Nash均衡的概念对社会计划者和理论家施加了一个约束,使他们不能建议或者预测一种非均衡行为。博弈论可预测到,在均衡集较小的局势中,文化规范的重要性也小。2.2.2Nash均衡的一致性预测性质Nash均衡是参与人将如何博弈的“一致性”(consistent)预测:如果所有参与人预测到一个特定的Nash均衡将出现,那么,没有人有兴趣作不同的选择。也只有Nash均衡具有这样的特征:参与人预测到均衡,参与人预测到其他参与人预到均衡等等。,.,24,对比之下,预测一个非Nash均衡的策略组合意味着至少有一个参与人会犯错误,尽管这样的错误确有可能出现。说Nash是一致性预测并不意味着Nash均衡一定是一个好的预测,但只有Nash均衡才有:“一致性”预测的性质。重要结论:一种制度安排要发生效力必须是一种Nash均衡(Nash执行的,NashImplementation),否则,这种制度便不能“稳定”。,.,25,2.2.3Nash均衡与严格下策消去法命题2.1在博弈G=S1,S2,Sn;u1,u2,un中,如果严格下策反复消去法排除了除(s1*,s2*sn*)之外的所有策略组合,那么(s1*,s2*,sn*)一定是该博弈唯一的Nash均衡。命题2.2在博弈G=S1,S2,Sn;u1,u2,un中,如果(s1*,s2*,sn*)是G的一个Nash均衡,那么严格下策消去法一定不会将它消去。检验纳什均衡(囚徒困境,智猪游戏),.,26,性别战博弈,.,27,思考题:为何几乎所有的卡特尔都会遭到失败?,.,28,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作次,那么在第九次博弈参与人就会采取不合作态度。,.,29,2.3无限策略博弈分析和反应函数2.3.1Gournot(库诺特)双寡头竞争模型(Nash均衡最早的版本,1838年),.,30,设有两个参与人,分别称为企业1和企业2,每个企业的策略是选择产量,得益是利润,它是两个企业产量的函数。我们用qi0,)表示第i个企业的产量,总供给量为Q=q1+q2,Ci(qi)cqi表示成本函数,P=P(q1+q2)=a-(q1+q2)表示逆需求函数(售价)。第i个企业的利润函数为:ui(q1+q2)=qiP(q1+q2)Ci(qi),i=1,2即u1(q1+q2)=q1P(q1+q2)Cq1u2(q1+q2)=q2P(q1+q2)Cq2,.,31,(q1*,q2*)是Nash均衡产量意味着:q1*argmaxu1(q1,q2*)=q1P(q1+q2*)C1(q1)q2*argmaxu2(q1*,q2)=q2P(q1*+q2)C2(q2)找出Nash均衡的一个办法是对每个企业的利润函数求一阶导数并令其为零:,.,32,u1/q1=P(q1+q2)+q1P(q1+q2)C1(q1)=0u2/q2=P(q1+q2)+q2P(q1+q2)C2(q2)=0上述两个一阶条件分别定义了两个反应函数:q1*=R1(q2)q2*=R2(q1)反应函数意味着每个企业的最优策略(产量)是另一个企业产量的函数,两个函数的交点就是Nash均衡q*=(q1*,q2*)(如下图),.,33,Cournot模型,q1,q2,R1(q2),R2(q1),NE,O,q1*,q2*,.,34,2.4混合策略和混合策略Nash均衡2.4.1严格竞争博弈和混合策略的引进一、严格竞争博弈,正面,反面,正面,反面,盖币方,猜币方,-1,1,1,-1,1,-1,-1,1,这个博弈实际上是一个零和博弈,一方所得即,另一方所失,该博弈没有纯策略的Nash均衡。,例1,.,35,例2社会福利博弈,寻找工作游荡,救济,不救济,3,2,-1,3,-1,10,0,政府,流浪汉,这个博弈也不存在纯策略的Nash均衡,给定政府救济,流浪汉的最佳策略是游荡,给定流浪汉游荡,政府的最佳策略是不救济,上述博弈的显著特征是:每一个参与人都想猜透对方的策略,而每个参与人又都不想让对方猜透自己的策略,所以此类博弈中都不存在(纯策略)Nash均衡。,.,36,对猜硬币博弈来说,设出正面的概率友p,则出反面的概率为1p,如果p1/2,且猜币方全猜正面,他的期望得益为:p1+(1p)(1)=2p10即从平均来讲,这时猜币方一定是赢多输少;而如果p1/2,猜币方也可通过全猜反面而占优。只有p=1/2,对方无法占便宜,从而双方各选1/2作为正反面的概率也就成了一种“均衡”。二、混合策略和混合策略Nash均衡定义在博弈GS1,S2,Sn;u1,u2,un中参与人的策略空间为Si=si1,si2,sik,则参与人i以概率分布i=(i1,ik)随机地在其k个可选策略中选择的“策略”称为个混合策略。,.,37,其中0ij1,且ij=1纯策略可以理解为混合策略的特例,如纯策略si1可以看作是混合策略i=(1,0,0)。我们用i表示参与人i的混合策略空间:ii用=(1,2,n)表示n个博弈方的混合策略组合。用i表示混合策略组合空间:在纯策略情形下,ui=ui(s)=ui(u1,ui,un)对任何一个给定的纯策略组合:s=(s1,s2,sn),ui取确定值。与混合策略相伴的是得益(支付)的不确定性。这时:,.,38,ui()=ui(1,i,n)ui(i,i)表示参与人i的期望效用,它可定义为ui(i,-i)=(j(sj)ui(s),sS,j=1,n,其中j(sj)是混合策略j赋予纯策略sj的概率。,以两人博弈为例:S1=s11,s12,s1p,S2=s21,s22,s2q,如果参与人1相信参与人2的混合策略为:,2=(21,22,2q),那么参与人选择纯策略s1p的期望效用为:,2ju1(s1p,s2j),q,j=1,.,39,参与人选择混合策略1=(11,12,1p)的期望效用(得益)为:u1(1,2)=1k2ju1(s1k,s2j),p,k=1,q,J=1,=1k2ju1(s1k,s2j),K=1,J=1,p,q,类似地有u2(1,2)=1k2ju2(s1k,s2j),k=1j=1,pq,例如对博弈,LMR,U4,35,16,2,M2,18,43,6,D3,09,62,8,参与人2(B),参与人1(A),(双矩阵博弈),.,40,下面重新定义Nash均衡定义在博弈G=S1,S2,Sn;u1,u2,un中,混合策略组合*=(1*,i*,n*)是一个Nash均衡,如果对任一i,有:ui(i*,-i*)ui(i,-i*),对任ii这个定义也可以写为:定义对在博弈G=S1,Sn;u1,un中的混合策略组合*=(1*,i*,n*),如果对所有的参与人i,有ui(i*,-i*)ui(sik,-i*),对每一sikSi成立,则称*为博弈G的Nash均衡。,.,41,22双矩阵博弈的Nash均衡的求法例1求双矩阵博弈的混合策略Nash均衡,其中A=B=解:设1*=(x.1x),2*=(y,1y)为Nash均衡点,u1(1*,2*)=xAy=3xy+2x(1-y)+4(1-x)(1-y)=x(5y-2)+4-4y,如果y2/5,则在x=1时达到最大值。类似地u2(1*,2*)=xBy=y(2x-1)+4-3x,32,04,21,34,.,42,要使上式取最大值,应取y=故两者的交点为(2/5,1/2)故混合策略的Nash均衡为:(2/5,3/5),(1/2,1/2),相应的得益为:U1=2.4,u2=2.5,0,0x1/2,0,1,x=1/2,1,1/2D/2,若银行同意到期后再收回,连本带利将得到2R(RD)。,1,2,2,1,2,2,YN,YNYN,YN,YNYN,(r,r)(D,2rD)(2rD,D),(R,R)(2RD,D)(D,2RD)(R,R),Y:提取;N:不提日期1为投资到期之前;日期2为之后,.,100,3.4.2讨价还价博弈(Rubinstein,1982)假定两个人分一块蛋糕,参与人1先出价,参与人2可以选择接受或拒绝;如果1接受博弈结束,蛋糕按1的方案分配;如果1拒绝,1再出价;如此直下去直到一个参与人的出价被另一个人接收为止。这是一个无限期完美信息博弈,参与人1在时期1,3,5,出价,参与人2在时期2,4,6,出价。用x表示1的份额,1x表示2的份额,x1和(1x1)分别是1出价时1和2的份额,x2和(1x2)分别表示2出价时参与人1和参与人2的份额。假定参与人1和参与人2的贴现因子分别为1和2,则如果在时期t博弈结束,参与人1和参与人,2的支付贴现值分别是u1=1xi和u2=2(1xi),t-1t-1,.,101,如果博弈是有限期的,可以使用逆向归纳法求解子博弈完美Nash均衡(T为期限)设T=2,参与人2出价,如果他提出x2=0,1只有接受,因为他巳无出价机会,由于2在T=2时得到1单位相当于在t=1时得到2单位,所以1在t=1时出价1x12时2会接受,这时子博弈完美Nash均衡的结果是(12,2),设T=3,设1出价x=1,因为在T=2时的1单位等于t=2时的1单位,如果2在t=2时出价x2=1,1,2,1,2,x1,AR,出x2,AR,出x3,(x1,1x1),(1x2,2(1x2),.,102,参与人1会接受,参与人2在t=2时的11单位相当于t=1时的2(11)单位,如果参与人1在t=1时出价1x1=2(11),参与人2会接受,因此,子博弈完美的唯一结果为:x=12(11)类似地:T=4时的子博弈完美Nash均衡的结果是:x=12(11(12)T=5时的子博弈完美的结果是:x=12(11(12(11)当1=2=0时,x=1,当2=0时仍为x=1,.,103,但当1=0,20时结果为x=12,如果1=2=1(即双方都有无限的耐心)那么当T=1,3,5,时结果为x=1;当T=2,4,6,时结果为x=0(后动优势),定理(Rubinstein,1982),在无限期讨价还价博弈中,唯一的子博弈完美Nash均衡的结果是:x*=(12)/(112)(如果1=2=,x*=1/(1+)无限期讨价还价的子博弈完美Nash均衡的结果决定于参与人的贴现因子(耐心程度),.,104,证明:T=+,博弈无最后阶段,但参与人1出价的任何一个阶段开始的子博弈等价于从t=1开始的整个博弈,我们可以应用有限阶段逆向归纳法寻找子博弈完美均衡.假定t3,1出价,1能得到的最大份额是M1,对1而言t期的M1等价于t1期的1M,故2知道在t-1期的任何x21M的出价将被1所接受,因此2出价x2=1M,自得11M;又对2而言t1期的11M等价于t2期的2(11M),故1可在t2期出价x1=12(11M),因为从t2期能得到的最大份额一定与从t期开始的博弈完全相同,故我们有:x1=M=12(11M)解得M=(12)/112),且结果是唯的.,.,105,承诺行动与子博弈完美均衡例法律是的要胁诉讼(设原告为P,被告为D),P,D,P,(0,0),不指控,指控(提出要求),拒绝接受,起诉放弃,(sc,s),(x-c-p,-x-d)(-c,0),其中指控成本为c如果决定指控,P要求D支付s0以“私了”,P的起诉成本为d,如果P以概率赢得x,则x0,F(1)0,F(1/6)u(,(1-)+)即ESS要求在群体混合策略(1-)+中能够得到比突变体更高的效用水平。由效用函数的线性性质,我们有:,.,140,(1-)u(,)+u(,)(1-)u(,)+u(,)这一不等式只要求在接近于0时成立,它等同于要求对于所有的以下两式必有一式成立:u(,)u(,)或u(,)=u(,)且u(,)u(,)上述不等号如换为号则称为弱ESS。定义如果策略满足:u(,)u(,),对任意,若u(,)=u(,)则u(,)u(,)则称为ESS策略。,.,141,在两个或多个有差别的博弈方群体成员相互间随机配对,这时就成了非对称博弈,可用双矩阵来表示:(A,B),设X=(x1,x2,xn)和Y=(y1,y2,yn)分别为双方的混合策略,则有动态方程:dxi/dt=xi(AY)iXAY,i=1,2,ndyj/dt=yj(BX)jYBX,j=1,2,n例市场进入博弈的模仿者动态和ESS,进入不进,打击不打,(1,5),(0,0)(2,2),打击不打,进入0,02,2,不进1,51,5,.,142,这时由稳定性理论分析结果知进化稳定策略只有(x*,y*)=(1,0)这一点,其他所有的点都不是模仿者动态中收敛和具有抗扰动的稳定状态。这意味着有限理性的博弈方通过长期博弈学习,潜在的进入者会进入,在位者会容忍。,.,143,非对称鹰鸽博弈的进化稳定分析现在我们设v1=10,v2=2,c=12,得下列博弈:进化稳定策略为(x*,y*)=(1,0),(0,1),鹰鸽,鹰(v1-c)/2,(v2-c)/2v1,0,鸽0,v1v1/2,v2/2,1,2,在非对称的情形中,一个目标对双方有不同的价值,如v1v20,再设其他方面与对称博弈一样。,鹰鸽,鹰-1,-510,0鸽0,25,1,2,1,.,144,Y15/6,O1/61x,A,D,C,B,.,145,第六章完全但不完美信息博弈6.1不完美信息动态博弈6.2完美Bayes均衡在完全但不完美信息博弈中,因为存在多节点信息集,一些重要的选择及其后续阶段不构成子博弈,所以仅满足子博弈完美性无法排除不可置信的威胁或承诺,无法保证均衡策略中所有选择的可信性,为此必须发展新的均衡概念。6.2.1完美Bayes均衡的概念借助于子博弈完美的思想,新的均衡概念必须满足一些基本要求。为了说明这些基本要求,首先分析下面的例子:,.,146,.,147,例,1,2,2,LM,R(1,3),(2,1)(0,0)(0,2)(0,1),ABAB,AB,L2,10,0,M0,20,1,R1,31,3,2,1,该博弈的策略型如右图:它有两个Nash均衡:(L,A)和(R,B),由于该博弈没有真子博弈,子博弈完美的要求将自动满足,Nash均衡就是子博弈完美均衡;但直觉上,2选B是不合理的(劣策略),故2取B是一个“空头威胁”。,p1-p,.,148,上面的例子反映了一个重要的事实:在完全但不完美信息博弈中,尽管(R,B)是子博弈完美的,但仍然依赖于一个不可置信的空头威胁。之所以会发生上述现象,是因为2在他将要采取的信息集上不知道哪一个结会将会达到,因此他关于这个问题需要一个“信念”,由此提出下列条件:R1:在每一个信息集,在该集具有行动的参与人关于博弈到达信息集中的哪一个结必须有一个信念。对于非单点信息集,信念是集中各个结上的概率分布;对于单点集,信念则置概率1于单决策集上。,.,149,R2:在给定的信念下,参与人的策略必须是序贯理性的(sequentiallyrational),即在每一个信息集,具行动的参与人所采取的行动(以及参与人以后的行动)在给定该参与人在该信息集上的信念与其他参与人以后的策略下必须是最优的。如上例,我们在参与人2的信息集上赋与一个概率分布p,1-p作为信念,可以给出2的期望得益:若2取A为1p+2(1p)=2p若2取B则为0p+1(1p)=1p由于0p1,所以2p1p,根据R2的要求,参与人2不应取B。R3:参与人在均衡路径上信息集的信念,是通过Bayes法则与参与人的均衡策略来确定的。,.,150,对完美Bayes均衡来说R1R3抓住了它的主要精神,信念被提高到如同均衡定义中策略那样重要的地位,但是,在较广泛的经济应用中,将需要更多的要求以删除难以置信的均衡,不同的作者使用不同的完美Bayes均衡的定义,但有一个共同点是都包含了R1R3,大多数定义还包括了对非均衡路径上信念的要求。我们添加如下的:R4:在非均衡路径上信息集的信念通过Bayes法则和参与人的可能的均衡策略来确定。定义一个完美的Bayes均衡由满足R1R4的策略和信念组成。,.,151,Bayes法则:在日常生活中,当面临不确定时,在任何一个时点上,我们对某件事情发生的可能性有一个判断(先验概率),然后,会根据新的信息来修正这个判断(后验概率),Bayes法则就是这样的方法。设参与人的类型是独立分布的,参与人i有K个可能的类型;有H个可能的行动,k和ak分别表示特定的类型和行动,则P(k)0,P(k)=1,i选择ak的概率为:PaK=P(a11)P(1)+P(aKK)P(K)=,.,152,Bayes公式:Bayes法则要求P(aK)0,否则后验概率无意义。如果P(aK)=0,我们允许P(KaK)在区间0,1区间取任何值,只要所取的值与均衡策略相容。在动态博弈中,P(aK)=0对应的则为非均衡路径上的信息集。,.,153,Bayes法则举例:如果我们把所有的人划分为好人(GP)和坏人(BP)两类;所有的事分为好事(GT)和坏事(BT)两类,如果我观测到某人干了件好事,则有PGT=PGTGPPGP+PGTBPPBPPGPGT=PGTGPPGP/PGT为具体起见,我们认为某人为好人的概率为1/2,那么在观察到告干了件好事后如何修正他是好人的概率?设:设PGTGP=1,PGTGP=0,则PGPGT=1设PGPGT=1,PGTBP=1,则PGPGT=1/2,即无改变。设PGTGP=1,PGTBP=1/2,则PGPGT=2/3,即他是好人的可能性增大了。,.,154,如果我们观察到这个人干了一件坏事,我们会怎样改变看法?设PBTGP=0,PBTBP=p0,则PGPBT=0,PBPBT=1,即他一定是一个坏人;如果我们原来认为他肯定是一个坏人,突然发现他干了一件好事,设PGTBP=p0,PGTGP=q0则PBPGT=1,.,155,例(可能的均衡策略)该博弈的真子博弈有唯一Nash均衡(L,R),因此整个博弈有唯一的子博弈完美Nash均衡(D,L,R),这个策略组合是否是完美Bayes均衡?在参与人3看来,若1采用D,R是2的劣策略,因而p=1,在给定如此信念下,3的最优选择为R,1,2,3,3,A,LR,LRLR,(2,0,0),(1,2,1(3,3,3)(0,1,2)(0,1,1),p1-p,LR,L2,13,3,R1,21,1,3,2,.,156,可见(D,L,R)与信念p=1满足要求R1-R3,由于该博弈树不存在任何一个信息集不在该均衡路径上,即R4“平凡地”得到满足。于是它也是完美Bayes均衡。现在考虑另一个策略组合(A,L,L)以及信念p=0,这是一个Nash均衡,也满足R1-R3,但它肯定不是子博弈完美的(仅有的真子博弈有唯一的Nash均衡(L,R),这表明仅有R1-R3并不能保证参与人的策略是子博弈完美Nash均衡,问题在于参与人3的信念p=0与2的策略L并不相合(p=0意味着2取R而不是L),如果按(A,L,L)进行的话,3的信息集不能达到,即3的信息
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 礼仪考试题及答案单选
- 广东耕作学自考试题及答案
- 广东房地产发自考试题及答案
- 馈电开关考试题及答案
- 押题宝典教师招聘之《幼儿教师招聘》模考模拟试题及答案详解(有一套)
- 课件春晓教学课件
- 客户服务考试题及答案
- 课件时间控制
- 镁氯化工数字化技能考核试卷及答案
- 聚氯乙烯塑料配制工安全规范考核试卷及答案
- 2025年吉林省教育系统后备干部考试题及答案
- 2025-2026学年人教版(2024)初中体育与健康七年级全一册教学计划及进度表(第一学期)
- 2025-2026学年济南版(2024)初中生物八年级上册教学计划及进度表
- “一带一路”倡议下的企业出海战略研究
- 体系管理知识培训课件
- 辽宁沈阳地铁有限公司所属公司招聘笔试题库完整参考答案详解
- 2025年秋季小学二年级上册语文教学计划及教学进度表
- 2025年海事两员从业资格考试(包装危险货物申报人员)历年参考题库含答案详解(5套)
- 新学期初二开学家长会课件
- 2025-2026学年外研版(2024)初中英语七年级上册(全册)教学设计(附目录)
- 消化内科临床科室发展规划与实施方案
评论
0/150
提交评论