博弈论课件5-完全信息静态博弈-纳什均衡_第1页
博弈论课件5-完全信息静态博弈-纳什均衡_第2页
博弈论课件5-完全信息静态博弈-纳什均衡_第3页
博弈论课件5-完全信息静态博弈-纳什均衡_第4页
博弈论课件5-完全信息静态博弈-纳什均衡_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

完全信息静态博弈——纳什均衡

设有两人博弈,每个博弈方都有不同的策略,谁都希望自己出“高招”使自己获胜(即寻求效用的最大化),但获胜并不完全依赖于自己的行为能力,还依赖于对手怎么做。2022/12/191中南财经政法大学信息学院完全信息静态博弈——纳什均衡设有两人博弈,每个

试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退,但是此时面临着两败俱伤的结果。经典案例三——斗鸡博弈2022/12/192中南财经政法大学信息学院试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来经典案例三——斗鸡博弈-3,-32,00,20,0退BA进退进独木桥对于相当多的博弈,我们无法运用重复剔除劣战略的方法找出均衡解。显然为了找出这些博弈的均衡解,需要引入纳什均衡。2022/12/193中南财经政法大学信息学院经典案例三——斗鸡博弈-3,-32,00,20,0退BA进退例1、选课博弈钟信陈明德语法语德语3,21,1法语0,02,3斗鸡博弈:对诸多现象的解释2022/12/194中南财经政法大学信息学院例1、选课博弈钟信德语法语德语3,21,1法语例2、性别博弈

Battleofsexes

足球2,10,0-1,-11,2芭蕾足球

芭蕾girlboy2022/12/195中南财经政法大学信息学院例2、性别博弈

Battleofsexes

足球2,10纳什均衡____哲学思考

如果一个博弈问题的所有博弈方事前能达成一个“协议”,并在没有外部强制的情况下,每个博弈方都有积极性遵守这个“协议”。那么,这个协议就是纳什均衡。2022/12/196中南财经政法大学信息学院纳什均衡____哲学思考如果一个博弈问题的所有博弈假设n个人参与博弈,给定其他博弈方策略的条件下,每个博弈方选择自己的最优策略。纳什均衡指的是“由所有博弈方的最优策略组成的一个组合”n个人制订了一个协议,这n个人是否能自愿遵守?他们会自觉遵守,这个协议就构成一个纳什均衡。如果一个协议不构成纳什均衡,它就不可能自动实施,而需要外力胁迫,这就是无所谓的“协议”2022/12/197中南财经政法大学信息学院假设n个人参与博弈,给定其他博弈方策略的条件下,每个博弈方选理解纳什均衡的重要性:任何“合理”结果都要满足的条件——当某一博弈方发现他人单方面改变策略可以获取更多时,他会毫不犹豫地改变自己的策略,博弈自然就有达到均衡了。思考:一种制度安排要发生效力,为什么必须是纳什均衡。否则,这种制度安排会有效力吗?2022/12/198中南财经政法大学信息学院理解纳什均衡的重要性:任何“合理”结果都要满足的条件——当某五、纳什均衡定义:在博弈G={s1,…,sn;u1,…,un}中,如果各博弈方i的某策略si*与其他博弈方的策略s-i*组成策略组合(si*,s-i*),且任一博弈方i的策略si*都是对其余博弈方策略s-i*的最佳反应。 则称(si*,s-i*)为该博弈的一个Nash均衡 特别,当且仅当(si*,s-i*)是Nash均衡,且对所有纯策略si(si≠si*)有ui(si*,s-i*)>ui(si,s-i*),又称(si*,s-i*)是严格(强)Nash均衡。2022/12/199中南财经政法大学信息学院五、纳什均衡定义:在博弈G={s1,…,sn;u1,…,un纳什均衡与一致预期纳什均衡:所有博弈方的最优策略的组合:给定该策略中别人的选择,没有人有积极性改变自己的选择。一致预期:基于信念的选择是合理的;支持选择的信念是正确的;预期的自我实现:如果所有人认为这个结果会出现,这个结果就一定会出现。预期是自我实现的,预期不会错误。如果你认为我预期你将选择X,你就真的会选择X。2022/12/1910中南财经政法大学信息学院纳什均衡与一致预期纳什均衡:所有博弈方的最优策略的组合:给定纳什均衡举例例如——广告博弈纳什均衡:(做广告,做广告)企业1企业22022/12/1911中南财经政法大学信息学院纳什均衡举例例如——广告博弈企业1企业22022/12/10经典案例三——斗鸡博弈-3,-32,00,20,0退BA进退进独木桥纳什均衡:A进,B退;A退,B进纳什均衡可以帮我们找出这些博弈的均衡解,2022/12/1912中南财经政法大学信息学院经典案例三——斗鸡博弈-3,-32,00,20,0退BA进退例如——性别博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。请同学分析:2022/12/1913中南财经政法大学信息学院例如——性别博弈小莉足球芭蕾足球(2,1)(一)Nash均衡的基本求解法1、划线法基本思想——博弈方先找出自己针对其他博弈方每种策略或策略组合的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略,然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。2022/12/1914中南财经政法大学信息学院(一)Nash均衡的基本求解法1、划线法2022/12/10具体方法——对其他博弈方的任一策略组合,找出博弈方i的最佳策略,并在其得益值下划一小横线;若存在一个这样的策略组合,所有博弈方的得益值下都划了线,则该组策略组合就是该博弈的一个纳什均衡。2022/12/1915中南财经政法大学信息学院具体方法——对其他博弈方的任一策略组合,找出博弈方i的最佳策例1、性别博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)分析:如果大海选足球,小莉的“相对优势策略”也是足球,这比她选芭蕾好,这是在小莉的盈利值1下划线。2022/12/1916中南财经政法大学信息学院例1、性别博弈小莉足球芭蕾足球(2,

如果大海选芭蕾,小莉的“相对优势策略”也一定是芭蕾,这时将右下方格中盈利值2下划线。如果小莉选足球,大海的“相对优势策略”是足球,这时,在大海的盈利矩阵左上格中盈利值2下划线。 如果小莉选芭蕾,大海的“相对优势策略”也是芭蕾,因而在右下格其盈利值2下划线。当双方的相对优势策略确定后,哪个格子里面两个数字都被被划线,那么这个格中所对应的相对优势策略组合就是一个纳什均衡。2022/12/1917中南财经政法大学信息学院 如果大海选芭蕾,小莉的“相对优势策略”也一定是芭蕾,这时将例2、囚徒困境博弈

招不招招甲不招(问题1:甲、乙如何选择?)

-8,-80,-15-15,0-1,-12022/12/1918中南财经政法大学信息学院例2、囚徒困境博弈-8,-80,-15-15,0-1,-12例3—“智猪博弈”(boxedpigs)有些博弈没有占优均衡,但通过剔除“劣”策略,我们可以预测博弈的结果;还可以通过“纳什均衡”预测博弈的结果。如“智猪博弈”按等待按等待5,14,49,-10,0这个博弈中,大猪的最优选择依赖于小猪的选择,但小猪的最优选择与大猪的选择无关。如果大猪知道小猪的理性的,大猪将选择“按”。均衡是“大猪按,小猪等待”。“劣”策略:无论对方选择什么,如果自己选择A得到的总是收益小于选择B得到的收益,A就是相对于B的劣策略。2022/12/1919中南财经政法大学信息学院例3—“智猪博弈”(boxedpigs)有些博弈没有占优均例4:博弈G如右图:1,01,30,10,40,20,0博弈方Ⅱ左中右解:该博弈的纳什均衡为(中,上)。

2022/12/1920中南财经政法大学信息学院例4:博弈G如右图:1,01,30,10,4例5:博弈G如下图:2,81,61,80,80,60,80,81,50,9博弈方ⅡLMR解:该博弈有两个纳什均衡(U,L)和(U,R)。2022/12/1921中南财经政法大学信息学院例5:博弈G如下图:2,81,61,80,8例6、军备竞赛苏美扩军裁军扩军(-3000,-3000)(10000,-∞)裁军(-∞,10000)(0,0)结论,这个博弈存在一个Nash均衡(扩军,扩军)2022/12/1922中南财经政法大学信息学院例6、军备竞赛苏扩军裁军扩军(-3000,-军备考虑为扩军、有限军备、不设防,那么G为:

BA扩军有限裁军扩军(-2000,-2000)(-1600,-1500)(8000,-∞)有限(-1500,-1600)(-500,-500)(9500,-∞)裁军(-∞,8000)(-∞,9500)(0,0)据划线法求得Nash均衡为双方采用有限军备策略。注意①对每一方,有限军备都是全局优势策略,扩军和不设防都是全局劣势策略。 ②此问题也可用重复剔除的占优均衡求得博弈问题的解为(有限军备,有限军备)。2022/12/1923中南财经政法大学信息学院军备考虑为扩军、有限军备、不设防,那么G为:例7:寻找纳什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,2002022/12/1924中南财经政法大学信息学院例7:寻找纳什均衡C1C2C3R1R2R3100,1000,纳什均衡(NashEquilibrium)的理解•纳什均衡-是一种“僵局”,给定别人不改变策略的情况下,没有人有兴趣改变。•囚徒困境是西方经济学中个人理性与集体理性冲突的一个例证。2022/12/1925中南财经政法大学信息学院纳什均衡(NashEquilibrium)的理解2022/基本思路——对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加盈利,如能,则从所分析的策略组合对应的盈利数组引一箭头,到改变策略后策略组合对应的盈利数组,最后综合对每个策略组合的分析情况,只有指向、无指离的策略组合形成对博弈的结果。2、箭头法2022/12/1926中南财经政法大学信息学院基本思路——对博弈中的每个策略组合进行分析,考察在每个策略组具体方法——考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后策略组合对应的得益数组。若存在一策略组合,其得益数组只有进来的箭头而没有出去的箭头,则该策略组合就是纳什均衡。2022/12/1927中南财经政法大学信息学院具体方法——考察在每个策略组合处各个博弈方能否通过单独改变自例1:博弈G如右博弈方Ⅱ左中右0,41,00,00,20,11,3纳什均衡为(上,中)2022/12/1928中南财经政法大学信息学院例1:博弈G如右博弈方Ⅱ左例2、囚徒困境乙甲坦白抵赖坦白(-8,-8)(0,-15)抵赖(-15,0)(-1,-1)因此,策略组合(坦白,坦白)就是唯一具有稳定性的结果。2022/12/1929中南财经政法大学信息学院例2、囚徒困境乙坦白抵赖坦白(-8,-8斗鸡B进攻退却-3,-32,00,20,0经典案例3——斗鸡博弈

(进,退)和(退,进)是两个纳什均衡。2022/12/1930中南财经政法大学信息学院斗鸡B-3,-32,00,20,0经典案例3例4、性别博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)2022/12/1931中南财经政法大学信息学院例4、性别博弈小莉足球芭蕾足球(2,1)((二)纳什均衡与重复剔除的占优均衡

占优均衡肯定是纳什均衡,但反过来纳什均衡不一定是占优均衡,因此占优均衡是比纳什均衡更强、稳定性更高的均衡概念。只是,占优均衡在博弈问题中的普遍性比纳什均衡要差得多。

重复剔除的占有均衡和纳什均衡之间的关系要复杂一些,关键是这两者之间是否存在相容性,即严格劣策略反复消去法是否会消去纳什均衡,对于纳什均衡和重复剔出的占优均衡的关系,下面的两个命题基本上给出了我们所希望的答案。2022/12/1932中南财经政法大学信息学院(二)纳什均衡与重复剔除的占优均衡占优均衡肯定是纳什Nash均衡的特质1)一致预测性 “一致”——各博弈方的实际行为选择与他们的预测一致。2)与重复剔出的占优均衡的关系若G={s1,…,sn;u1,…,un},通过严格劣策反复消去法排除了除(s1*,…,sn*)之外的所有策略组合,那么(s1*,…,sn*)一定是该博弈唯一的Nash均衡。若G={s1,…,sn;u1,…,un},如果(s1*,…,s2*)是G的一个Nash均衡,那么严格劣策反复消去法一定不会将它剔除。2022/12/1933中南财经政法大学信息学院Nash均衡的特质1)一致预测性2022/12/1033中南纳什均衡构成纳什均衡的策略一定是重复剔除严格劣策略过程中不会被剔除的策略。许多不存在占优策略均衡或重复剔除的占优均衡的博弈却存在纳什均衡。小结与思考:三种均衡的概念:占优均衡——重复剔除的占优均衡——纳什均衡三种均衡是什么关系2022/12/1934中南财经政法大学信息学院纳什均衡2022/12/1034中南财经政法大学信息学院纳什均衡纳什均衡与其他概念的关系每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或者重复剔除的占优均衡。纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉的策略组合;但没有被剔除的策略组合不一定是纳什均衡,除非它是唯一的。注意:弱劣策略剔除可能剔除掉纳什均衡2022/12/1935中南财经政法大学信息学院纳什均衡2022/12/1035中南财经政法大学信息学院不同均衡概念的关系:占优均衡DSE重复剔除占优均衡IEDE纯策略纳什均衡PNE2022/12/1936中南财经政法大学信息学院不同均衡概念的关系:占优均衡重复剔除占优均衡纯策略纳什均衡2占优均衡重复剔除的占优均衡纳什均衡完全信息静态博弈均衡解的思考进程2022/12/1937中南财经政法大学信息学院占优均衡重复剔除的占优均衡纳什均衡完全信息静态博弈均衡解的思

那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。纳什均衡是一最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。

纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。2022/12/1938中南财经政法大学信息学院那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈纳什均衡的缺点(1)纳什均衡不唯一。在不唯一的情况下,哪一个才是最可能出现的呢?(允许了不可置信的威胁的存在)

(2)没有纳什均衡存在又如何分析?2022/12/1939中南财经政法大学信息学院纳什均衡的缺点2022/12/1039中南财经政法大学例1——监督博弈(不存在纳什均衡)监督不监督偷懒不偷懒1,-1-1,2-2,32,2给定工人偷懒,老板的最优选择是监督;给定老板监督,工人的最优选择是不偷懒;给定工人不偷懒,老板的最优选择是不监督;给定老板不监督,工人的最优选择是偷懒;形成如此循环。2022/12/1940中南财经政法大学信息学院例1——监督博弈(不存在纳什均衡)监督不监督偷懒不偷懒1,-例2——斗鸡博弈(存在两个以上纳什均衡)-3,-32,00,20,0退BA进退进独木桥纳什均衡:A进,B退;A退,B进2022/12/1941中南财经政法大学信息学院例2——斗鸡博弈(存在两个以上纳什均衡)-3,-32,00,美苏古巴导弹危机冷战期间美苏争霸最严重的一次危机。苏联:面临将导弹撤回国还是坚持部署在古巴的选择;美国:挑起战争还是容忍苏联的挑衅行为。结果:苏联:将导弹从古巴撤回,做了丢面子的“撤退的鸡”,美国:坚持自己的的策略,做了“不退的鸡”,但是象征性地从土耳其撤回了一些导弹,给苏联一点面子。独木桥2022/12/1942中南财经政法大学信息学院美苏古巴导弹危机独木桥2022/12/1042中南财经政法大这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的结果。2022/12/1943中南财经政法大学信息学院这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来

在博弈中纳什均衡点如果有两个或两个以上,结果就难以预料。这对每个博弈方都是麻烦事,因为后果难料,行动也往往进退两难。左边还是右边例如两个骑自行车的人对面碰头,很容易互相“向住”:因为不知道对方会不会躲、往哪边躲,自己也不知该如何反应,于是撞到一起。自行车相撞一般不会造成什么大麻烦,可是如果换成马车、汽车,就可能出现伤亡。所以,应该有一个强制性的规定,来告诉人们该怎么做。2022/12/1944中南财经政法大学信息学院在博弈中纳什均衡点如果有两个或两个以上,结果就难交通博弈与交通规则靠左行靠右行靠左行靠右行1,11,1-1,-1-1,-12022/12/1945中南财经政法大学信息学院交通博弈与交通规则靠左行靠右行靠左行靠右行1,11,1-1,

海上航行也要面临同样的问题,尽管大海辽阔,但是航线却是比较固定的,因此船只交会的机会很多,这些船只属于不同的国家,如何调节谁进谁退的问题呢?先来看一个小笑话:一艘军舰在夜航中,舰长发现前方航线上出现了灯光。舰长马上呼叫:“对面船只,右转30度。”对方回答:“请对面船只左转30度。”“我是美国海军上校,右转30度。”“我是加拿大海军二等兵,请左转30度。”舰长生气了:“听着,我是‘列克星顿’号战列舰舰长,这是美国海军最强大的武装力量,右转30度!”“我是灯塔管理员,请左转30度。”2022/12/1946中南财经政法大学信息学院海上航行也要面临同样的问题,尽管大海辽谁打电话上面的例子是通过规定解决了问题,不过,若是遇到电话打到一半突然断了的事,你该怎么办?假如你正在和朋友通话,电话断了,而话还没说完。这时有两个选择,马上打给对方,或等待对方打来。注意:如果你打过去,他就应该等在电话旁,好把自家电话的线路空出来,如果他也在打给你,你们只能听到忙音;另一方面,假如你等待对方打电话,而他也在等待,那么你们的聊天就没有机会继续下去。2022/12/1947中南财经政法大学信息学院谁打电话2022/12/1047中南财经政法大学信息学院

案例——欧共体在空中客车与波音公司的竞争中对空中客车公司的战略性补贴。欧共体为了打破美国波音公司对全球民航业的垄断,曾放弃欧洲传统的自由竞争精神而对与波音公司进行竞争的空中客车公司进行补贴。2022/12/1948中南财经政法大学信息学院2022/12/1048中南财经政法大学信息学院

当双方都未获得政府的补贴时,两个公司都开发新型飞机会因市场饱和而亏损,但若一家公司开发而另一家公司不开发时,则开发的那家公司会获巨额利润,见表2。2022/12/1949中南财经政法大学信息学院当双方都未获得政府的补贴时,两个公司表2未补贴时的博弈

空中客车开发不开发开发波音不开发

-10,-10100,00,1000,02022/12/1950中南财经政法大学信息学院表2未补贴时的博弈-10,-10100,00,1000

此时有两个纳什均衡,即一家开发而另一家不开发。下面,考虑欧共体对空中客车进行补贴20个单位的情况。此时,当两家都开发时,空中客车仍然盈利10单位而不是亏损,博弈矩阵见表3。2022/12/1951中南财经政法大学信息学院此时有两个纳什均衡,即一家开发而另一家不开发。表3有补贴时的博弈

空中客车开发不开发开发波音不开发

-10,10100,00,1200,02022/12/1952中南财经政法大学信息学院表3有补贴时的博弈-10,10100,00,1200,

这时只有一个纳什均衡,即波音公司不开发和空中客车公司开发的均衡(不开发,开发),这有利于空中客车。在这里,欧共体对空中客车的补贴就是使空中客车一定要开发(无论波音是否开发)的威胁变得可置信的一种“承诺行动”。2022/12/1953中南财经政法大学信息学院这时只有一个纳什均衡,即波音公司不课后练习:1、P1024,52022/12/1954中南财经政法大学信息学院课后练习:2022/12/1054中南财经政法大学信息学院

完全信息静态博弈——纳什均衡

设有两人博弈,每个博弈方都有不同的策略,谁都希望自己出“高招”使自己获胜(即寻求效用的最大化),但获胜并不完全依赖于自己的行为能力,还依赖于对手怎么做。2022/12/1955中南财经政法大学信息学院完全信息静态博弈——纳什均衡设有两人博弈,每个

试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退,但是此时面临着两败俱伤的结果。经典案例三——斗鸡博弈2022/12/1956中南财经政法大学信息学院试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来经典案例三——斗鸡博弈-3,-32,00,20,0退BA进退进独木桥对于相当多的博弈,我们无法运用重复剔除劣战略的方法找出均衡解。显然为了找出这些博弈的均衡解,需要引入纳什均衡。2022/12/1957中南财经政法大学信息学院经典案例三——斗鸡博弈-3,-32,00,20,0退BA进退例1、选课博弈钟信陈明德语法语德语3,21,1法语0,02,3斗鸡博弈:对诸多现象的解释2022/12/1958中南财经政法大学信息学院例1、选课博弈钟信德语法语德语3,21,1法语例2、性别博弈

Battleofsexes

足球2,10,0-1,-11,2芭蕾足球

芭蕾girlboy2022/12/1959中南财经政法大学信息学院例2、性别博弈

Battleofsexes

足球2,10纳什均衡____哲学思考

如果一个博弈问题的所有博弈方事前能达成一个“协议”,并在没有外部强制的情况下,每个博弈方都有积极性遵守这个“协议”。那么,这个协议就是纳什均衡。2022/12/1960中南财经政法大学信息学院纳什均衡____哲学思考如果一个博弈问题的所有博弈假设n个人参与博弈,给定其他博弈方策略的条件下,每个博弈方选择自己的最优策略。纳什均衡指的是“由所有博弈方的最优策略组成的一个组合”n个人制订了一个协议,这n个人是否能自愿遵守?他们会自觉遵守,这个协议就构成一个纳什均衡。如果一个协议不构成纳什均衡,它就不可能自动实施,而需要外力胁迫,这就是无所谓的“协议”2022/12/1961中南财经政法大学信息学院假设n个人参与博弈,给定其他博弈方策略的条件下,每个博弈方选理解纳什均衡的重要性:任何“合理”结果都要满足的条件——当某一博弈方发现他人单方面改变策略可以获取更多时,他会毫不犹豫地改变自己的策略,博弈自然就有达到均衡了。思考:一种制度安排要发生效力,为什么必须是纳什均衡。否则,这种制度安排会有效力吗?2022/12/1962中南财经政法大学信息学院理解纳什均衡的重要性:任何“合理”结果都要满足的条件——当某五、纳什均衡定义:在博弈G={s1,…,sn;u1,…,un}中,如果各博弈方i的某策略si*与其他博弈方的策略s-i*组成策略组合(si*,s-i*),且任一博弈方i的策略si*都是对其余博弈方策略s-i*的最佳反应。 则称(si*,s-i*)为该博弈的一个Nash均衡 特别,当且仅当(si*,s-i*)是Nash均衡,且对所有纯策略si(si≠si*)有ui(si*,s-i*)>ui(si,s-i*),又称(si*,s-i*)是严格(强)Nash均衡。2022/12/1963中南财经政法大学信息学院五、纳什均衡定义:在博弈G={s1,…,sn;u1,…,un纳什均衡与一致预期纳什均衡:所有博弈方的最优策略的组合:给定该策略中别人的选择,没有人有积极性改变自己的选择。一致预期:基于信念的选择是合理的;支持选择的信念是正确的;预期的自我实现:如果所有人认为这个结果会出现,这个结果就一定会出现。预期是自我实现的,预期不会错误。如果你认为我预期你将选择X,你就真的会选择X。2022/12/1964中南财经政法大学信息学院纳什均衡与一致预期纳什均衡:所有博弈方的最优策略的组合:给定纳什均衡举例例如——广告博弈纳什均衡:(做广告,做广告)企业1企业22022/12/1965中南财经政法大学信息学院纳什均衡举例例如——广告博弈企业1企业22022/12/10经典案例三——斗鸡博弈-3,-32,00,20,0退BA进退进独木桥纳什均衡:A进,B退;A退,B进纳什均衡可以帮我们找出这些博弈的均衡解,2022/12/1966中南财经政法大学信息学院经典案例三——斗鸡博弈-3,-32,00,20,0退BA进退例如——性别博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。请同学分析:2022/12/1967中南财经政法大学信息学院例如——性别博弈小莉足球芭蕾足球(2,1)(一)Nash均衡的基本求解法1、划线法基本思想——博弈方先找出自己针对其他博弈方每种策略或策略组合的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略,然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。2022/12/1968中南财经政法大学信息学院(一)Nash均衡的基本求解法1、划线法2022/12/10具体方法——对其他博弈方的任一策略组合,找出博弈方i的最佳策略,并在其得益值下划一小横线;若存在一个这样的策略组合,所有博弈方的得益值下都划了线,则该组策略组合就是该博弈的一个纳什均衡。2022/12/1969中南财经政法大学信息学院具体方法——对其他博弈方的任一策略组合,找出博弈方i的最佳策例1、性别博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)分析:如果大海选足球,小莉的“相对优势策略”也是足球,这比她选芭蕾好,这是在小莉的盈利值1下划线。2022/12/1970中南财经政法大学信息学院例1、性别博弈小莉足球芭蕾足球(2,

如果大海选芭蕾,小莉的“相对优势策略”也一定是芭蕾,这时将右下方格中盈利值2下划线。如果小莉选足球,大海的“相对优势策略”是足球,这时,在大海的盈利矩阵左上格中盈利值2下划线。 如果小莉选芭蕾,大海的“相对优势策略”也是芭蕾,因而在右下格其盈利值2下划线。当双方的相对优势策略确定后,哪个格子里面两个数字都被被划线,那么这个格中所对应的相对优势策略组合就是一个纳什均衡。2022/12/1971中南财经政法大学信息学院 如果大海选芭蕾,小莉的“相对优势策略”也一定是芭蕾,这时将例2、囚徒困境博弈

招不招招甲不招(问题1:甲、乙如何选择?)

-8,-80,-15-15,0-1,-12022/12/1972中南财经政法大学信息学院例2、囚徒困境博弈-8,-80,-15-15,0-1,-12例3—“智猪博弈”(boxedpigs)有些博弈没有占优均衡,但通过剔除“劣”策略,我们可以预测博弈的结果;还可以通过“纳什均衡”预测博弈的结果。如“智猪博弈”按等待按等待5,14,49,-10,0这个博弈中,大猪的最优选择依赖于小猪的选择,但小猪的最优选择与大猪的选择无关。如果大猪知道小猪的理性的,大猪将选择“按”。均衡是“大猪按,小猪等待”。“劣”策略:无论对方选择什么,如果自己选择A得到的总是收益小于选择B得到的收益,A就是相对于B的劣策略。2022/12/1973中南财经政法大学信息学院例3—“智猪博弈”(boxedpigs)有些博弈没有占优均例4:博弈G如右图:1,01,30,10,40,20,0博弈方Ⅱ左中右解:该博弈的纳什均衡为(中,上)。

2022/12/1974中南财经政法大学信息学院例4:博弈G如右图:1,01,30,10,4例5:博弈G如下图:2,81,61,80,80,60,80,81,50,9博弈方ⅡLMR解:该博弈有两个纳什均衡(U,L)和(U,R)。2022/12/1975中南财经政法大学信息学院例5:博弈G如下图:2,81,61,80,8例6、军备竞赛苏美扩军裁军扩军(-3000,-3000)(10000,-∞)裁军(-∞,10000)(0,0)结论,这个博弈存在一个Nash均衡(扩军,扩军)2022/12/1976中南财经政法大学信息学院例6、军备竞赛苏扩军裁军扩军(-3000,-军备考虑为扩军、有限军备、不设防,那么G为:

BA扩军有限裁军扩军(-2000,-2000)(-1600,-1500)(8000,-∞)有限(-1500,-1600)(-500,-500)(9500,-∞)裁军(-∞,8000)(-∞,9500)(0,0)据划线法求得Nash均衡为双方采用有限军备策略。注意①对每一方,有限军备都是全局优势策略,扩军和不设防都是全局劣势策略。 ②此问题也可用重复剔除的占优均衡求得博弈问题的解为(有限军备,有限军备)。2022/12/1977中南财经政法大学信息学院军备考虑为扩军、有限军备、不设防,那么G为:例7:寻找纳什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,2002022/12/1978中南财经政法大学信息学院例7:寻找纳什均衡C1C2C3R1R2R3100,1000,纳什均衡(NashEquilibrium)的理解•纳什均衡-是一种“僵局”,给定别人不改变策略的情况下,没有人有兴趣改变。•囚徒困境是西方经济学中个人理性与集体理性冲突的一个例证。2022/12/1979中南财经政法大学信息学院纳什均衡(NashEquilibrium)的理解2022/基本思路——对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加盈利,如能,则从所分析的策略组合对应的盈利数组引一箭头,到改变策略后策略组合对应的盈利数组,最后综合对每个策略组合的分析情况,只有指向、无指离的策略组合形成对博弈的结果。2、箭头法2022/12/1980中南财经政法大学信息学院基本思路——对博弈中的每个策略组合进行分析,考察在每个策略组具体方法——考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后策略组合对应的得益数组。若存在一策略组合,其得益数组只有进来的箭头而没有出去的箭头,则该策略组合就是纳什均衡。2022/12/1981中南财经政法大学信息学院具体方法——考察在每个策略组合处各个博弈方能否通过单独改变自例1:博弈G如右博弈方Ⅱ左中右0,41,00,00,20,11,3纳什均衡为(上,中)2022/12/1982中南财经政法大学信息学院例1:博弈G如右博弈方Ⅱ左例2、囚徒困境乙甲坦白抵赖坦白(-8,-8)(0,-15)抵赖(-15,0)(-1,-1)因此,策略组合(坦白,坦白)就是唯一具有稳定性的结果。2022/12/1983中南财经政法大学信息学院例2、囚徒困境乙坦白抵赖坦白(-8,-8斗鸡B进攻退却-3,-32,00,20,0经典案例3——斗鸡博弈

(进,退)和(退,进)是两个纳什均衡。2022/12/1984中南财经政法大学信息学院斗鸡B-3,-32,00,20,0经典案例3例4、性别博弈小莉大海足球芭蕾足球(2,1)(0,0)芭蕾(-1,-1)(1,2)2022/12/1985中南财经政法大学信息学院例4、性别博弈小莉足球芭蕾足球(2,1)((二)纳什均衡与重复剔除的占优均衡

占优均衡肯定是纳什均衡,但反过来纳什均衡不一定是占优均衡,因此占优均衡是比纳什均衡更强、稳定性更高的均衡概念。只是,占优均衡在博弈问题中的普遍性比纳什均衡要差得多。

重复剔除的占有均衡和纳什均衡之间的关系要复杂一些,关键是这两者之间是否存在相容性,即严格劣策略反复消去法是否会消去纳什均衡,对于纳什均衡和重复剔出的占优均衡的关系,下面的两个命题基本上给出了我们所希望的答案。2022/12/1986中南财经政法大学信息学院(二)纳什均衡与重复剔除的占优均衡占优均衡肯定是纳什Nash均衡的特质1)一致预测性 “一致”——各博弈方的实际行为选择与他们的预测一致。2)与重复剔出的占优均衡的关系若G={s1,…,sn;u1,…,un},通过严格劣策反复消去法排除了除(s1*,…,sn*)之外的所有策略组合,那么(s1*,…,sn*)一定是该博弈唯一的Nash均衡。若G={s1,…,sn;u1,…,un},如果(s1*,…,s2*)是G的一个Nash均衡,那么严格劣策反复消去法一定不会将它剔除。2022/12/1987中南财经政法大学信息学院Nash均衡的特质1)一致预测性2022/12/1033中南纳什均衡构成纳什均衡的策略一定是重复剔除严格劣策略过程中不会被剔除的策略。许多不存在占优策略均衡或重复剔除的占优均衡的博弈却存在纳什均衡。小结与思考:三种均衡的概念:占优均衡——重复剔除的占优均衡——纳什均衡三种均衡是什么关系2022/12/1988中南财经政法大学信息学院纳什均衡2022/12/1034中南财经政法大学信息学院纳什均衡纳什均衡与其他概念的关系每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或者重复剔除的占优均衡。纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉的策略组合;但没有被剔除的策略组合不一定是纳什均衡,除非它是唯一的。注意:弱劣策略剔除可能剔除掉纳什均衡2022/12/1989中南财经政法大学信息学院纳什均衡2022/12/1035中南财经政法大学信息学院不同均衡概念的关系:占优均衡DSE重复剔除占优均衡IEDE纯策略纳什均衡PNE2022/12/1990中南财经政法大学信息学院不同均衡概念的关系:占优均衡重复剔除占优均衡纯策略纳什均衡2占优均衡重复剔除的占优均衡纳什均衡完全信息静态博弈均衡解的思考进程2022/12/1991中南财经政法大学信息学院占优均衡重复剔除的占优均衡纳什均衡完全信息静态博弈均衡解的思

那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。纳什均衡是一最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。

纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。2022/12/1992中南财经政法大学信息学院那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈纳什均衡的缺点(1)纳什均衡不唯一。在不唯一的情况下,哪一个才是最可能出现的呢?(允许了不可置信的威胁的存在)

(2)没有纳什均衡存在又如何分析?2022/12/1993中南财经政法大学信息学院纳什均衡的缺点2022/12/1039中南财经政法大学例1——监督博弈(不存在纳什均衡)监督不监督偷懒不偷懒1,-1-1,2-2,32,2给定工人偷懒,老板的最优选择是监督;给定老板监督,工人的最优选择是不偷懒;给定工人不偷懒,老板的最优选择是不监督;给定老板不监督,工人的最优选择是偷懒;形成如此循环。2022/12/1994中南财经政法大学信息学院例1——监督博弈(不存在纳什均衡)监督不监督偷懒不偷懒1,-例2——斗鸡博弈(存在两个以上纳什均衡)-3,-32,00,20,0退BA进退进独木桥纳什均衡:A进,B退;A退,B进2022/12/1995中南财经政法大学信息学院例2——斗鸡博弈(存在两个以上纳什均衡)-3,-32,00,美苏古巴导弹危机冷战期间美苏争霸最严重的一次危机。苏联:面临将导弹撤回国还是坚持部署在古巴的选择;美国:挑起战争还是容忍苏联的挑衅行为。结果:苏联:将导弹从古巴撤回,做了丢面子的“撤退的鸡”,美国:坚持自己的的策略,做了“不退的鸡”,但是象征性地从土耳其撤回了一些导弹,给苏联一点面子。独木桥2022/12/1996中南财经政法大学信息学院美苏古巴导弹危机独木桥2022/12/1042中南财经政法大这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的结果。2022/12/1997中南财经政法大学信息学院这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来

在博弈中纳什均衡点如果有两个或两个以上,结果就难以预料。这对每个博弈方都是麻烦事,因为后果难料,行动也往往进退两难。左边还是右边例如两个骑自行车的人对面碰头,很容易互相“向住”:因为不知道对方会不会躲、往哪边躲,自己也不知该如何反应,于是撞到一起。自行车相撞一般不会造成什么大麻烦,可是如果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论