纳什均衡与致性PPT课件

上传人：建*** IP属地：上海上传时间：2021-11-19 格式：PPTX 页数：34 大小：295.49KB 积分：20 举报 版权申诉

已阅读5页，还剩29页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、二、基本定义二、基本定义参与人（players)：博弈中决策主体的集合：什么人参与博弈？每个人是什么角色？行动（actions): 每个人有些什么样行动可以选择？在什么时候行动？信息(information)：在博弈中的知识；每个人知道些什么（包括特征、行动等）？井底之蛙、所罗门断案、华盛顿捉贼、和尚买梳子。战略（strategies)：行动计划；每个人有什么战略可供选择？战略的完备性；支付（payoffs)：每个人在不同战略组合下得到些什么？依赖于所有参与人的选择；均衡（equilibrium)：所有参与人最优战略的组合；结果（outcomes)：我们所感兴趣的东西。第1页/共

2、34页三、静态博弈三、静态博弈最简单的博弈静态博弈：所有博弈的参与人同时或可看作同时选择策略行动的博弈。 “同时”是一个信息概念，而不一定与日历上的时间一致；第2页/共34页四、囚徒困境（四、囚徒困境（prisonersprisoners dilemma)dilemma) 囚徒困境：精明策略与糟糕结局坦白不坦白坦白不坦白8，8 0，1010，01，1无论对方如何选择，每个人的最优选择：坦白。所以，我们可以预测，结果将是（坦白，坦白）划线法求解均衡划线法求解均衡第3页/共34页囚徒困境作为博弈论中的一个基本模型，可以解释很多与此类似的社会现象。增产困境：农业增产不增收; 旅客困境：聪明反被

3、聪明误; 人质困境：赫鲁晓夫在哪里.第4页/共34页2 2、占优均衡、占优均衡(dominant-strategy equilibrium)(dominant-strategy equilibrium) 一个博弈中，不管其他博弈方选择什么策略，一博弈方的某个策略给他带来的得益始终高于其他策略，我们就称这样的最优战略，被称为“占优或上策战略”(dominant strategy)。一个博弈中的某个策略组合都是各个博弈方的各自的上策，那么这种战略组合被称为“占优或上策均衡”。占优战略均衡的出现只要求所有人都是理性的，但不要求每个参与人知道其他参与人是否理性。囚徒困境博弈有占优均衡，所以其结果很

4、容易预测。占优均衡并不是普遍存在正是博弈论理论的价值所在，否则就和最优化问题相差无异了。第5页/共34页3 3、个人理性与集体理性的冲突、个人理性与集体理性的冲突 “囚徒困境”表明个人理性与集体理性的冲突囚徒的困境对社会来说是非常理想的结局，两罪犯都受到应有的惩罚；但从两个决策者的角度来看是很不理想的结果，两个罪犯从各自最大利益出发选择行为，结果是没有实现两人总体的最大利益，也没有实现个人的最大利益。因此，不合作损人有损己。这样的例子很多：寡头竞争，军备竞赛，团队生产中的劳动供给，公共产品的供给，等等；许多的法律、制度就是为解决“囚徒困境”而存在的；第6页/共34页“囚徒困境囚徒困境”的

5、一般表示的一般表示合作不合作合作不合作T，TS，RR，SP，P满足：RTPS; (S+R)R-T第8页/共34页4、选择不合作、选择不合作无奈的生存决无奈的生存决策策活路就是比对手跑得快；放弃合作是利益使然齐桓公饿死之谜；皇后失位；前线士兵为什么选择不逃跑。第9页/共34页五五、“智猪博弈智猪博弈”(boxed (boxed pigs)pigs) 有些博弈并没有占优均衡，应发展实用性更有效的博弈分析概念和方法，如通过剔除“坏”战略或严格下策（不管其他博弈方的策略如何变化，一个博弈方的某种策略所带来的得益总比另一种策略带来的得益要小，我们就成为前一种策略相对对于后一种策略的严格下策），因此我

6、们也可以用该方法来预测博弈的结果。如“智猪博弈”。按等待按等待3，12，47，10，0这个博弈中，大猪的最优选择依赖于小猪的选择，但小猪的最优选择与大猪的选择无关。如果大猪知道小猪的理性的，大猪将选择“按”。均衡是“大猪按，小猪等待”。“劣”战略：无论对方选择什么，如果自己选择A得到的总是收益小于选择B得到的收益，A就是相对于B的劣战略。第10页/共34页1、重复剔除占优均衡、重复剔除占优均衡 “重复剔除严格劣战略”(iterated elimination of strictly dominated strategy)的思路：首先找出博弈参与人的劣战略(dominated strategy)

7、（假定存在的话），把这个劣战略剔除后，剩下的是一个不包含已剔除劣战略的新的博弈；然后在剔除这个新的博弈中的劣战略；继续这个过程，直到没有劣战略存在。如果剩下的战略组合是唯一的，这个唯一的战略组合就是“重复剔除占优均衡”(iterated dominance equilibrium)。如果这样的解存在，我们说该博弈是“重复剔除占优可解的”(iterated dominance solvable).第11页/共34页例子：上例的囚徒困境分析；例：对于没有绝对优劣关系的策略而言，该方法失效。左中右上1，01，30，1下0，40，22，0第12页/共34页2 2、理性共识、理性共识（commo

8、n knowledge of common knowledge of rationality)rationality) (1)Zero-order CKR: 每个人都是理性的，但不知道其他人是否是理性的； (2)first-order CKR: 每个人是理性的，并且知道其他每个人也都是理性的，但并不知道其他人是否知道自己是理性的； (3)second-order CKR: (1)+(2)+每个人知道其他人知道自己是理性的。第13页/共34页3 3、重复剔除与理性共识、重复剔除与理性共识重复剔除不仅要求每个人是理性的，而且要求每个人知道其他人是理性的，每个人知道每个人知道每个人是理性的，如此等

9、等，即理性是“共同知识”（共识）C1C2C3R1R2R310,41, 598,4 9, 90, 399,81,980,100100,98这个博弈只要求一阶理性共识就可以预测均衡结果。第14页/共34页最优选择最优选择这个博弈只要求一阶理性共识就可以预测均衡结果：如果R相信C是理性的，R就知道C不会选择C3，所以R的最优选择是R1；如果C相信R是理性的，C就知道R不会选择R2，所以C的最优选择是C2。但要C预期R不会选择R3，需要二阶理性共识；要R不预期C会选择C1，需要三阶理性共识。第15页/共34页4 4、不能用重复剔除解的博弈、不能用重复剔除解的博弈许多博弈没有占优均衡，也没有重

10、复剔除的占优均衡。考虑如下博弈：C1C2C3R1R2R30，44，05，34，00，45，33，53，56，6第16页/共34页等待比进攻更有效淝水之战办公室出风头的菜鸟大猪和小猪的角色刘备的老二哲学煮酒论英雄。第17页/共34页六、纳什均衡与一致预期六、纳什均衡与一致预期纳什均衡：所有参与人的最优战略的组合给定该战略中别人的选择，没有人有积极性改变自己的选择。一致预期：所有博弈方都预期一个特定的博弈结果会出现，那么所有的博弈方都不会利用该预期或这种预期能力，选择与预期结果不一致的策略，也就是说没有哪个博弈方有偏离这个预期结果的愿望，因此该预期结果最终会成为博弈结果。预期的自我实现

11、：如何所有人认为这个结果会出现，这个结果就会出现。预期是自我实现的，预期不会错误。如果你认为我预期你将选择X，你就真的会选择X。一致预期中一致的含义：各博弈方的实际行为选择与他们的预期一致，而不是不同博弈方的预测相同、无差异。第18页/共34页1、哲学思考、哲学思考如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。第19页/共34页2、寻找纳什均衡、寻找纳什均衡C1C2C3R1R2R3100，1000，050，10150，01，160，00，3000，0200，200例第20页/共34页广告博弈纳什均衡：（做广告，做广告）战略做广告

12、不做广告做广告4，415，1不做广告1，1510，10企业1企业2第21页/共34页考虑团队生产：让其中的一个人变成所有者工作偷懒工作偷懒6，62，20，88，0第22页/共34页双寡头竞争：双寡头竞争：CournotCournot博弈博弈两个企业1和2同时选择产量q1 和q2，价格由市场决定；假定需求函数为其中q1为企业1的产量，q2为企业2的产量假定成本函数为： ,并假定c1=c2=2 那么，利润函数为：)(8)(21qqQPiiiqcqC)(22212212222212112111116)28()(6)28()(qqqqqqqcqQPqqqqqqqqcqQPq第23页/共34页双

13、寡头竞争（续）双寡头竞争（续）企业最大化利润的一阶条件为：反应函数纳什均衡产量市场价格：8-4=4 纳什均衡利润为26)(26)(12222211qqRqqqRq221NENEqq421NENE第24页/共34页垄断产量和垄断利润垄断企业的目标函数：垄断产量：垄断利润：262)8 ()(QQQQQQcQQPM3MQ9M第25页/共34页在缺乏独立决策、缺乏协调机制的两个企业之间，上述的合作结果并不容易实现，即使实现了也是不稳定的。产量的古诺模型是一种囚徒困境，无法实现博弈方总体和各个博弈方各自最大利益的结论。如上世纪八九十年代国际经济中石油输出国组织的限额和突破问题。第26页

14、/共34页七、混合战略纳什均衡七、混合战略纳什均衡猜硬币博弈猜硬币博弈猜硬币方盖硬币方结论：各博弈方必须保证自身策略选择的随机性，以结论：各博弈方必须保证自身策略选择的随机性，以及重视选择两个策略的概率分布。以防止其他博弈方及重视选择两个策略的概率分布。以防止其他博弈方猜到自己的策略，或利用自己策略选择的偏好获利。猜到自己的策略，或利用自己策略选择的偏好获利。第27页/共34页划拳博弈老虎鸡虫杠子老虎鸡虫杠子0，01，-10，0-1，1-1，10，01，-10，00，0-1，10，01，-11，-10，0-1，10，0第28页/共34页1 1、混合战略纳什均衡、混合战略纳什均衡有些博弈没有有

15、些博弈没有“纯战略纯战略”纳什均衡，但有混合纳什均衡，但有混合战略纳什均衡，如监督博弈。战略纳什均衡，如监督博弈。混合策略是以一定概率分布的意义上达到了一混合策略是以一定概率分布的意义上达到了一种稳定或均衡。种稳定或均衡。监督不监督偷懒不偷懒1，11，22，32，2给定工人偷懒，老板的最优选择是监督；给定老板监督，工人的最优选择是不偷懒；给定工人不偷懒，老板的最优选择是不监督；给定老板不监督，工人的最优选择是偷懒；如此循环。第29页/共34页博弈2博弈12 2、混合战略纳什均衡求解例子、混合战略纳什均衡求解例子又如上例中的划拳博弈。第30页/共34页一千次的打击比不上一次的成功林肯的失败经历；乱拳打死老师傅随机策略。第31页/共34页风险

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

纳什均衡与致性PPT课件

文档简介

温馨提示

最新文档

评论

纳什均衡与致性PPT课件

文档简介

温馨提示

最新文档

评论

相关文档