版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、LOGO 博弈论博弈论 The Game Theory 宾 宁 bn_第二章第二章 完全信息静态博弈完全信息静态博弈2.1博弈论的基本概念及战略式表述2.2纳什均衡2.3纳什均衡的应用举例2.4混合战略纳什均衡2.5纳什均衡的存在性定理2.6纳什均衡的多重性2.1 博弈论的基本概念及战略式表述博弈论的基本概念及战略式表述案例- 房地产开发项目-假设有A、B两家开发商, 市场需求:可能大,也可能小投入:1亿 v假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,每栋售价7千万;v如果市场上只有一栋楼出售:需求大时,可卖1.8亿,需求小时,可卖1.1亿。40004000,40004000
2、80008000,0 00 0,800080000 0,0 0不开发开发商A开发不开发开发-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况博弈的战略式表述v 博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体;参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动:参与人的决策变量行动:参与人的决策变量 战略:参与人选择行动的规则战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知
3、识 支付函数:参与人从博弈中获得的效用水平支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡:所有参与人的最优战略的组合均衡:所有参与人的最优战略的组合v 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。代表自然代表参与人博弈的参与人集合:Nini), 2 , 1 (,参与人:博弈论中选择行动以最大化自己效用的决策主体。参与人:博弈论中选择行动以最大化自己效用的决策主体。可以是自然人,也可以是团体,如企业、国家甚至由若干国家组成的集团可以是自然人,也可以是团体,如企业、国家甚至由若干国家组成的集团(OPECOPEC、欧盟等)。、欧盟等)。虚
4、拟参与人:虚拟参与人:“自然自然”作为虚拟参与人作为虚拟参与人自然:指决定外生的随机变量的机制自然:指决定外生的随机变量的机制为分析方便引入,自然作为虚拟参与人没有自己的支付和目标函数(即所为分析方便引入,自然作为虚拟参与人没有自己的支付和目标函数(即所有结果对它是无差异的)有结果对它是无差异的)参与人决策的后果依赖于自然的选择。在不完全信息博弈中,自然选择参参与人决策的后果依赖于自然的选择。在不完全信息博弈中,自然选择参与人的类型与人的类型v 行动:参与人在某个时点的决策变量行动:参与人在某个时点的决策变量v Ai表示第表示第i个参与人的一个特定行动个参与人的一个特定行动v 行动的顺序:行动
5、的顺序对于博弈的结果是非常重要的,行动的顺序:行动的顺序对于博弈的结果是非常重要的,事实上,不同的行动顺序意味着不同的博弈。事实上,不同的行动顺序意味着不同的博弈。v 在博弈论中,一般假设参与人的行动空间和行动顺序是所在博弈论中,一般假设参与人的行动空间和行动顺序是所有参与人的共同知识。有参与人的共同知识。选择的所有行动的集合表示可供iaAii 信息:参与人在博弈中的知识,特别是有关其他参与人的特信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识。征和行动的知识。 如房地产开发博弈中,如果如房地产开发博弈中,如果A不知道市场需求,而不知道市场需求,而B知道,则知道,则A的信息集
6、为的信息集为大,小大,小,B的信息集为的信息集为大大或或小小 完美信息:完美信息:指一个参与人对其他参与人(包括指一个参与人对其他参与人(包括“自然自然”)的)的行动选择有准确了解的情况,即每一个信息集只包含一个值行动选择有准确了解的情况,即每一个信息集只包含一个值。 完全信息:完全信息:指自然不首先行动或自然的初始行动能被所有参指自然不首先行动或自然的初始行动能被所有参与人准确观察到的情况,即博弈模型没有事先规定的不确定与人准确观察到的情况,即博弈模型没有事先规定的不确定性。性。 共同知识:共同知识:指指“所有参与人知道所有参与人知道所有参与人所有参与人知道所有参与人知道所有参与人知道知道.
7、”的知识的知识。 战略:参与人在给定信息集的情况下选择行动的规则战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与,它规定参与人在什么情况下选择什么行动,是参与人的人的“相机行动方案相机行动方案”。在静态博弈中,战略和行动是相同的。作为一种行动规则,战略必须是完备的。si表示第i个参与人的特定战略;Si=si代表第i个参与人所有可选择的战略集合;如果n个参与人每人选择一个战略,n维向量s=(s1,s2, ,si, ,sn)称为一个战略组合,其中si表示第i个人选择的战略。v支付函数:参与人从博弈中获得的效用水平,或支付函数:参与人从博弈中获得的效用水平
8、,或者指参与人得到的期望效用水平。者指参与人得到的期望效用水平。v博弈的基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择ui表示第i个参与人的支付(效用水平);u=(u1,u2, ,ui, ,un)称为n个参与人的支付组合,其中ui是所有参与人战略选择的函数: ui=ui(s1,s2, ,si, ,sn) 结果:博弈分析感兴趣的所有东西,如均衡战略组合、均衡结果:博弈分析感兴趣的所有东西,如均衡战略组合、均衡行动组合、均衡支付组合等。行动组合、均衡支付组合等。 均衡:所有参与人的最优战略的组合均衡:所有参与人的最优战略的组合 一般记为:*1(,)insss
9、s其中,*is是第i个参与人在均衡情况下的最优战略,它是i的所有可能战略中使ui或Eui最大化的战略。111,)iiinsssss( , ,表示除由i之外的所有参与人的战略组合。*is是给定s-i情况下第i个参与人的最优战略意味着*,*()( ,),iiiiiiiiu s su s sss均衡意味着对所有的i = 1,2,n,上式都成立。v博弈的战略式表述(strategic form representation),又称为标准式表述(normal form representation):代表战略式表述博弈。,用数:、每个参与人的支付函,间:、每个参与人的战略空、博弈的参与人集合:战略式表述
10、给出:nnniiiuuSSGnisssuniSni,;), 2 , 1),(3;, 2 , 12);, 2 , 1 (,1111v寡头产量博弈中,企业是参与人,产量是战略空间,利润是支付;战略式表述博弈为:个企业的产量和利润分别表示第和ilqqqlqqlqqGii),(),(; 0, 0212211212.2 纳什均衡纳什均衡2.2.1 占优战略均衡2.2.2 重复剔除的占优均衡2.2.3 划线法2.2.4 箭头法2.2.5 纳什均衡2.2.1 占优战略均衡占优战略均衡v占优战略:不论其他人选择什么战略,参与人的最优战略是唯一的,这样的最优战略称为“占优战略”(dominant strateg
11、y)。被称为劣战略对应的,所有向量。所有参与人的战略组成之外的表示由除,(优战略,个参与人的(严格)占是第*,111*),()(),iiiiiiiiiiniiiissssssussuisssssisv占优战略均衡v定义:在博弈的战略表达式中,如果对于所有的i,si*是i的占优战略,下列战略组合称为占优战略均衡:),(*1*nsssv注意:v如果所有人都有(严格)占优战略存在,那么占优战略均衡就是可以预测的唯一均衡。囚徒1招认,招认 (-1,-1) (-8,0) (0,-8) (-5,-5)沉默招认招认沉默囚徒2囚徒1的占优战略囚徒2的占优战略囚徒困境:2.2.2 重复剔除的占优均衡重复剔除的占
12、优均衡v重复剔除严格劣战略:v思路:首先找到某个参与人的劣战略(假定存在),把这个劣战略剔除掉,重新构造一个不包含已剔除战略的新的博弈,然后再剔除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 这个唯一剩下的战略组合就是这个博弈的均衡解,称为“重复剔除的占优均衡”。v 智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮。将有10个单位的猪食进入猪食槽,供两头猪食用。两头猪面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。如果某一头猪作出自己去按按钮的选择,它必须付出如下代价:第
13、一,它需要收益相当于2个单位的成本;第二,由于猪食槽远离猪食,它将比另一头猪后到猪食槽,从而减少吃食的数量。v 大猪先到:大猪吃到9个单位,小猪吃到1个单位;v 小猪先到:小猪吃到4个单位,大猪吃到6个单位;v 同时到达:大猪吃到7个单位,小猪吃到3个单位。 21大猪不按按不按按小猪(4, 4)(5, 1)(9, -1) (0, 0)小猪大猪按等待按5,14,4等待9,10,0小猪的占优战略2324v 重复剔除的占优均衡重复剔除的占优均衡 战略组合 称为重复剔除的占优均衡,如果它是重复剔除劣战略后剩下的唯一战略组合。如果这种唯一战略组合是存在的,我们就说该博弈是重复剔除占优可解。 注意:如果重
14、复剔除后的战略组合不唯一,该博弈就不是重复剔除占优可解的。),(*1*nsssv练习:在下列战略式表达中,找出重复剔除的占优均衡4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R32.2.3 划线法划线法v思路:先找出自己针对其他博弈方每种策略或策略组合(对多人博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略(这种相对最佳对策总是存在的,不过不一定惟一),然后再此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。1, 01, 30, 10, 40, 22
15、, 0-5, -50, -8-8, 0-1, -1囚徒囚徒困境困境2, 10, 00, 01, 3夫妻夫妻之争之争v注意:注意:不是每个博弈都可以用划线法求出确定性的博弈结果。许多博弈根本不存在确定性的结果,当然也就无法用划线法找出这种结果。-1, 11, -11, -1-1, 1猜猜硬硬币币2.2.4 箭头法箭头法v思路:对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能够通过单独改变单独改变自己的策略而增加得益。1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚徒囚徒困境困境-1, 11, -11, -1-1, 1猜猜硬硬币币2,
16、10, 00, 01, 3夫妻夫妻之争之争2.2.5 纳什均衡纳什均衡v通俗地说,纳什均衡的含义就是: 给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。v在一个博弈中,均衡用于预测博弈参与人的战略选择。某一战略组合是均衡意味着从个人理性的意义上,他会自动遵守这种选择,而不再需要另外的因素来维护这种选择;任何参与人单方面偏离均衡不会带来收益的增加是理性人自觉遵守选择的必须条件,这是纳什均衡的重要特征。 纳什均衡的纳什均衡的“一致性一致性”预测预测一致性预测一致性预测:如果所有参与人预测一个特定的纳什均衡将会出现,那么,没有人
17、有兴趣作不同的选择。v如果一种预测不具有一致性,即可以利用预测结果来改变策略从而达到谋利的目的,则就会导致“测不准”现象出现。v只有纳什均衡才具有一致预测的性质v一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能2.3 纳什均衡的应用举例纳什均衡的应用举例2.3.1 古诺特(Cournot)寡头 竞争模型2.3.2 公共资源问题2.3.1古诺特(古诺特(Cournot)竞争模型()竞争模型(1838)企业1企业2v参与人:企业参与人:企业1 1、企业、企业2 2v战略:战略: 选择产量选择产量v得益:得益: 利润,利润是两个企业产量的函数利润,利润是两个企业产量的函数v qi
18、:第i个企业的产量v Ci(qi)代表成本函数v P=P(q1+q2):价格是两个企业产量的函数v 第i个企业的利润函数为:企业1企业22 , 1),()(),(2121iqCqqPqqqiiiiv(q1*,q2*)是纳什均衡意味着:)(),(),(maxarg)()(),(maxarg222*122*12*211*211*211*1qCqqPqqqqqCqqPqqqq 找出纳什均衡的方法是对每个企业的利润函数求一阶导数,使其为0。0)()()(0)()()(222122122112112111qCqqPqqqPqqCqqPqqqPq)()(12*221*1qRqqRq)()(12*221*1
19、qRqqRqq2q1*1q*2q)(21qR)(12qR每个企业的最优产量是另一个企业的产量的函数。交叉点即纳什均衡点v假定每个企业有不变的单位成本:cqqCcqqC222111)()(假定需求函数为:)(21qqaP0)(0)(2212212111cqqqaqcqqqaq最优化的一阶条件是:)(21)()(21)(112*2221*1cqaqRqcqaqRq)(31*2*1caqq解反应函数得纳什均衡为:垄断利润为:2*2*12*2*11)(91),(),(caqqqqv为什么说古诺特(Cournot)寡头竞争模型是典型的囚徒困境问题?v垄断企业的问题:)(cQaQMaxQ垄断企业的最优产量
20、:)(32)(21*2*1*caqqcaQ垄断利润为:22)(92)(41cacam寡头竞争的总产量大于垄断产量的原因是:每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视了对另外一个企业的外部负效应。伯特兰德寡头模型(伯特兰德寡头模型(1883)v伯特兰德模型中各厂商选择的是价格而不是产量。v产品有一定差别是指两个厂商生产的是同类产品,但在品牌、质量和包装等方面有所不同。因此伯特兰德模型中厂商的产品之间有很强的替代性,但又不是完全可替代,即价格不同时,价格较高的不会完全销不出去。当厂商1和厂商2价格分别为P1和P2时,它们各自的需求函数为122222122211112111),
21、(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP)(21)(21*122222*2*211111*1PdcbabPPdcbabP其中d1,d20即两厂商产品的替代系数。设两厂商无固定成本,边际成本分别为c1和c2。则双方得益函数为:v豪泰林(Hotelling,1929)价格竞争模型引入产品的差异性,如空间上的差异;旅行成本越高,产品的差异就越大,均衡价格从而均衡利润也就越高;当旅行成本为零时,不同商店的产品之间具有完全的替代性
22、,没有任何一个商店可以把价格定得高于成本,则得到伯川德均衡结果。豪泰林豪泰林(Hotelling)价格竞争模型价格竞争模型 古诺模型(cournot model):假定产品同质并采用产量竞争,若不采用产量竞争,而是采用价格竞争,将引出伯川德(Betrand,1883)悖论(Betrand paradox):即使只有两个企业,在均衡情况下,价格等于边际成本,企业的利润为零,这与完全竞争市场均衡一样。因为当pMC,企业每增加一单位产出增加的利润为p-MC0;因此每一同质厂商当p高于MC时均有动机通过降价来增加市场份额,这种竞争的结果最终是pMC, =0。 悖论之解:产品非同质,即有差异性(产品本身
23、的差异或提供服务的差异)。 Hotelling模型(1929):考察产品物质性能相同但市场空间位置上有差异。 消费者均衡分布在0,1上,需求函数为Di(p1,p2) 单位产品成本为c,价格为pi(i=1,2) 旅行成本,即单位距离t 产品物质性能相同(若不考虑旅行成本时,消费者在两商店买就无差异,即存在旅行成本是其差异所在) 消费者具有单位需求(消费1个或0个) 0 x1商店商店1商店商店2假定假定 依据上述假定,可进一步假设x左边消费者购买商店1,x右边消费者购买商店2。即 D1= x,D2=1x (1)方程(1)中的x应满足:在两商店购买成本相同,即2112(1)2pptptxptxxt2
24、111212212(,)2(,)12pptD p pxtpptDp pxt 从而得:1121112121212221221212121(,)()(,)()()21(,)()(,)()()200p ppc D p ppcppttp ppc Dp ppcppttpp利润函数分别为:利润最大化的一阶条件:,21122020pctppctp 得方程(2)*1212,(0)2tppct得:价格不等于边际成本,利润大于 这里我们将消费者的位置差异解释为产品差异,这个差异进一步可解释为消费者购买产品的旅行成本。旅行成本越高,产品的差异就越大,均衡价格从而均衡利润也就越高。原因在于,随着旅行成本的上升,不同商
25、店出售的产品之间的替代性下降,每个商店对附近消费者的垄断力加强,商店之间的竞争越来越弱,消费者对价格的敏感度下降,从而每个商店的最优价格更接近于垄断价格。另一方面,当旅行成本为0时,不同商店的产品之间具有完全的替代性,没有一个商店可以把价格定得高于成本。2.3.2 公共资源问题公共资源问题 公海捕鱼 小煤窑的过度发展 v 公共资源的悲剧证明:如果一种资源没有排他性的所有权,就会导致资源的过度使用。 特征:1、没有哪个个人、企业或组织拥有所有权(非排他性) 2、大家都可以自由利用(竞争性) “公地悲剧公地悲剧”最早可追溯到古希腊哲人亚里士多德(前384-前322)的断言:“凡是属于最多数人的公共
26、事物常常是最少受人照顾的事物,人们关怀着自己的所有,而忽视公共的事物;对于公共的一切,他至多只留心到其中对他个人多少有些相关的事物。”使这一断言模式化并成为公共选择分析模型的是英国学者加雷特哈丁,他为了要说明带有普遍性的人口过渡膨胀问题,于1968年提出了著名的“公地悲剧”理论。v 有n个农民的村庄共同拥有一片草地,每个农民都有在草地上放牧的自由。每年春天,农民要决定自己养多少只羊。vgi:第i个农民饲养的数量,i=1,2,n. niigQ1n个农民饲养的总量V: 代表每只羊的平均价值,v是G的函数,V=V(Q), 因为每只羊至少要一定数量的草才不至于饿死,有一个最大的可存活量Qmax,: 当
27、Q0; 当Q=Q(x)时,V(Q)=0。v当草地上羊很少时,增加一只羊也许不会对其他羊的价值有太大影响,但随着羊的不断增加,每只羊的价值将急剧下降。QQmaxv参与人:农民战略: 养羊的数量得益: 利润0, 022GvGvui=100- (g1+g2+g3) 4gi反应函数:R1(g2,g3)=(96- g2-g3)/2 R2(g1,g3)=(96- g1-g3)/2 R3(g1,g2)=(96- g1-g2)/2g1*=g2*=g3*=24, 此时u1*=u2*=u3*=576令n=3,c=4,V(G)=100-(g1+g2+g3)。那么有: 公共资源效率评价,讨论总体利益最大的最佳羊只数量
28、。设在该草地上羊只的总数为Q,则总得益为2964)100(QQQQu使总得益u最大的养羊数Q*必使总得益函数的导数为0,求得1728576323047224348uQ 说明:非合作博弈的结果有可能是低效率的。每个可以利用公共资源的人都相当于面临着一种囚徒的困境:在总体上有加大利用资源可能时,自己加大利用而他人不加大利用则自己得利,自己加大利用但其他人也加大利用则自己不至于吃亏,最终是所有人都加大利用资源直至再加大只会减少利益的纳什均衡水平。2.4 混合战略纳什均衡混合战略纳什均衡2.4.1 严格竞争博弈和混合战略的引进2.4.2 混合战略和混合战略纳什均衡2.4.3 混合战略纳什均衡的求解思路
29、猜硬币博弈猜硬币博弈 1-1, -11, -11, 1-1,反面正面反面正面猜谜游戏v两个儿童各拿一枚硬币,v若同时正面朝上或朝下,A给B 1分钱,v若只有一面朝上,B给A 1分钱。零和博弈博弈参与者有输有赢,但结果永远是0。没有一个战略组合构成纳什均衡v社会福利博弈 23, 3-1, 1-1, 00,流浪流浪汉政府救济不救济寻找工作没有一个战略组合构成纳什均衡v上述博弈的特征是:在这类博弈中,都不存在纯纳什均衡。参与人的支付取决于其他参与人的策略;以某种概率分布随机地选择不同的行动每个参与人都想猜透对方的策略,而每个参与人又不愿意让对方猜透自己的策略。这种博弈的类型是什么?如何找到均衡? 1
30、-1, -11, -11, 1-1,反面正面反面正面猜谜游戏v两个小孩的最优策略是采取每个策略的可能性均为1/2;v每个小孩各取策略的1/2是纳什均衡。零和博弈这种战略是使对方抓不住采取什么战略的规律,盖正这种战略是使对方抓不住采取什么战略的规律,盖正或反并不重要,可以采用随机思路;直观上这种方法或反并不重要,可以采用随机思路;直观上这种方法是两个理性人的最优战略,这实际拓广了战略的含义,是两个理性人的最优战略,这实际拓广了战略的含义,也就是按预定的可能性机制选择具体战略。也就是按预定的可能性机制选择具体战略。v纯战略:如果一个战略规定参与人在每一个给定的信纯战略:如果一个战略规定参与人在每一
31、个给定的信 息情况下息情况下只选择一种特定只选择一种特定的行动,该战略为的行动,该战略为 纯战略纯战略。v混合战略:如果一个战略规定参与人在给定信息情况混合战略:如果一个战略规定参与人在给定信息情况 下下以某种概率分布随机地选择不同的行以某种概率分布随机地选择不同的行 动动,则该战略为混合战略。,则该战略为混合战略。kikikikikikikiiikiinnKksisissSKiuuuSSSGn11121211101,。,的概率,对于所有的选择是)(的一个混合战略,这里称为,那么,概率分布个纯战略:有假定参与人中,;,表述:个参与人博弈的战略式在,:(,)(,),1,2,iiiiiiiiiEE
32、in i即为满足如下条件的战略组合v纯战略可以理解为混合战略的特例,即在诸多战略中,选该纯战略si的概率为1,选其他纯战略的概率为0。5,14,49,-10,0等待小猪大猪按等待按 1-1, -11, -11, 1-1,反面正面反面正面如何寻找混合战略纳什均衡? 支付最大化法 支付等值法 由于混合战略伴随的是支付的不确定性,因此参与人关心的是其期望效用。 最优混合战略:是指使期望效用函数最大的混合战略(给定对方的混合战略) 在两人博弈里,混合战略纳什均衡是两个参与人的最优混合战略的组合。混合战略纳什均衡求解思路混合战略纳什均衡求解思路 23, 3-1, 1-1, 00,流浪流浪汉政府救济不救济
33、寻找工作2 . 00151510111311*故化的一阶条件:求微分,得到政府最优)()()()(),(:政府的期望效用函数为)。,(流浪汉的混合战略是);,(假定政府的混合战略是GLGLGvv即:流浪汉以0.2的概率选择寻找工作,0.8的概率选择游荡同样,可以根据流浪汉的期望效用函数找到政府的最优混合战。?支付最大化法支付最大化法支付等值法支付等值法v 假定最优混合战略存在,给定流浪汉选择混合战略(r,1- r),政府选择纯战略救济的期望效用为: 3r+(-1)(1-r)=4r-1v 选择纯战略不救济的效用为:-1r+0(1-r)=-rv 如果一个混合战略(而不是纯战略)是政府的最优选择,一
34、定意味着政府在救济与不救济之间是无差异的。 4r-1=-r 即 r=0.2 23, 3-1, 1-1, 00,流浪流浪汉政府救济不救济寻找工作 23, 3-1, 1-1, 00,流浪流浪汉政府救济不救济寻找工作n同理,假定最优混合战略存在,给定政府的选择混合战略(s,1- s),流浪汉选择纯战略寻找工作的期望效用为: 2s+(1)(1-s)=s+1n选择纯战略流浪的效用为:3s+0(1-s)=3sn如果一个混合战略(而不是纯战略)是政府的最优选择,一定意味着政府在救济与不救济之间是无差异的。 s+1=3s 即s=0.5n社会福利博弈 23, 3-1, 1-1, 00,流浪流浪汉政府救济不救济寻
35、找工作政府救济的概率:1/2 ;不救济的概率:1/2。流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8每个参与人的战略都是给定对方混合战略时的最优战略v对 的解释:v如果流浪汉找工作的概率小于0.2, 则政府选择不救济,如果大于0.2,政府选择救济 ,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略。v对 s*= 0.5的解释:v如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是寻找工作。2 . 0* v混合战略纳什均衡的含义:v 纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中, , *=0
36、.5是唯一的混合战略纳什均衡。v 从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2,那么政府的唯一最优选择是纯战略:不救济;v 如果政府以1的概率选择不救济,流浪汉的最优选择是寻找工作,这又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。2 . 0* s流浪汉寻找工作的概率小于0.2政府概率为1:不救济流浪汉寻找工作政府救济一个数值例子一个数值例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析2, 35, 23, 11, 5CDAB博弈方博弈方2博博弈弈方方1齐威王田忌赛马齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-
37、1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-1 1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田田 忌忌齐齐威威王王2.5 纳什均衡的存在性定理纳什均衡的存在性定理不同均衡概念的关系占优均衡DSE重复剔除占优均衡IEDE纯战略纳什均衡PNE混合战略纳什均衡MNEv纳什均衡存在性定理:每一个有限博弈至少存在一个纳什均衡(纯战略的或混合战略的)。问题:是否所有的博弈都存在NE(纯的或混合的)?Nash在1950年证明
38、:Wilson(1971)证明,几乎所有有限博弈,都存在有限奇数个NE,包括纯策略NE和混合策略NE。Oddness Theorem2.6 纳什均衡的多重性纳什均衡的多重性1.帕累托上策均衡2.风险上策均衡3.聚点均衡4.相关均衡5.防共谋均衡 多重Nash均衡(注意两个例子的区别) 斗鸡博弈 性别战课堂讨论:请举出类似的例子!课堂讨论:请举出类似的例子!类似的例子(竞争关系)类似的例子(竞争关系)1、停车占位(协调机制)、停车占位(协调机制)2、升官(选拔机制)、升官(选拔机制)3、找工作(招聘管理)、找工作(招聘管理)4、抢市场(竞争机制)、抢市场(竞争机制)5、填志愿(录取机制)、填志愿
39、(录取机制)类似的例子(合作关系)类似的例子(合作关系)1、约会、约会2、恋爱与结婚、恋爱与结婚3、聚餐、聚餐4、通讯、通讯5、语言、语言纳什均衡的多重性 例:两人分一块蛋糕,各自独立地提出自己要求的份额 ,如果 ,每人得到自己要求的份额;否则,谁也得不到什么。 此博弈有无穷多个纳什均衡 (只要满足: 如图 )面临多重纳什均衡,依据参与人预测,有可能结果不是纳什均衡。如性别战12,x x121xx121xx1x2x11这条曲线上的任何点都是纳什均衡-1,-1 女 足球 芭蕾足球 芭蕾男2,10,01,2(一)帕累托优势均衡(帕累托上策均衡) 有一种情况,一个博弈有多个纳什均衡,其中有一个纳什均
40、衡给所有局中人带来的得益,都大于其他纳什均衡给他们带来的得益。这种按照支付大小筛选出来的纳什均衡,比其他纳什均衡具有帕累托优势。这种按支付大小筛选的标准,称为帕累托优势标准帕累托优势标准。例1:古代两个猎人狩猎,假设两个猎人一起去狩猎,才能猎获一只鹿,一只鹿可管一家20天的生活;如果一个猎人单兵作战,他只能打到4只兔子,4只兔子可管一家人4天生活;两人行为决策的博弈矩阵如图1。4,00,44,410,10 乙猎鹿 打兔 猎鹿甲 打兔 图1:猎人博弈关于效率问题历史上不同的看法,如“不患寡,患不均”。现代经济学界普遍倾向于接受帕累托效率标准。帕累托效率标准。 (二(二 )风险优势标准(风险上策均衡)风险优势标准(风险上策均衡) 如果按照帕累托优势标准,难于确定局中人将采取多个纳什均衡中的哪一个纳什均衡规定的策略时,可以考虑不同纳什均衡之间的风险状况,风险小的优先。1、按期望赢利来讨论、按期望赢利来讨论 甲:上策期望利润:(9+0)/2=4.5 下策期望利润:(8+7)/2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 买房先交首付还是先签合同
- 红木家具买卖合同
- 酒具采购合同
- 宁乡租房合同
- 朋友合作合同
- 工商局房屋租赁合同
- 英文劳务合同
- 深圳设计合同
- 天津甄瑜合同
- 旧货买卖合同
- 11《百年孤独(节选)》任务式公开课一等奖创新教学设计统编版高中语文选择性必修上册
- 2025年汽车后市场汽车维修配件电商平台研究报告
- 中小企业数字化转型实施报告
- 2025年三力测试题库及答案
- 中国铁建股份有限公司招聘笔试题目
- 电机与电气控制 课程思政 三相异步电动机正反转运行的控制线路
- 2025 小学技术课创意机器人之快递小帮手课件
- 2025年10月全国自考《00226知识产权法》真题及答案
- 服饰色彩搭配培训
- 基于知识、能力、素养培养的2026届高考历史复习备考策略讲座
- 冬季通信工程安全培训课件
评论
0/150
提交评论