完全信息静态博弈_第1页
完全信息静态博弈_第2页
完全信息静态博弈_第3页
完全信息静态博弈_第4页
完全信息静态博弈_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026/4/21魏光兴——重庆交通大学11、囚徒困境与占优均衡I囚徒困境(Prisoners’Dilemma)来源:普林斯顿大学的塔克(tunker)教授杜撰的故事梗概:两个小偷行窃未果被抓,隔离审讯。“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。坦白否?六个基本要素分别是什么?基于收益矩阵(payoffmatrix)的模型描述:-8,-80,-10-10,0-1,-1囚徒A坦白抵赖坦白抵赖囚徒B2026/4/21魏光兴——重庆交通大学21、囚徒困境与占优均衡II占优战略/优势策略/上策(dominantstrategy)无论其他局中人如何行动,总是(严格地)优于其他战略的战略,称为(严格)占优战略。而被(严格地)占优的战略称为(严格)劣战略。博弈局中人一定会选择占优战略,一定不会选择劣战略。纳什均衡各博弈方都不再改变自己的行为时的战略组合,因为即使改变也不能提高自己的收益。占优均衡其中各战略都是各局中人的占优战略的战略组合占优均衡并不常见,因为很多时候不存在占优战略2026/4/21魏光兴——重庆交通大学31、囚徒困境与占优均衡III思考攻守同盟是否可行?背后哲理个体理性与集体理性之间的矛盾:实现集体利益时才能实现个人利益,单纯追逐个人利益往往不能实现。看不见的手亚当斯密《国富论》中无形之手就是自利的个体理性:我们的晚餐不是来自屠夫、酿酒的商人或面包师傅的仁慈之心,而是因为他们对自己的利益特别关注……每个人都会尽其所能,运用自己的资本争取最大的利益,一般而言,他不会有意图为公众服务,也不自知对社会有什么贡献,他关心的仅仅是自己的安全、自己的利益,但如此一来,他就好象被一只无形的手引领,在不知不觉中对社会改进尽力而为……2026/4/21魏光兴——重庆交通大学41、囚徒困境与占优均衡IV现实中的囚徒困境屡见不鲜的价格战铺天盖地的广告战曾经威胁世界甚至整个人类的军备竞赛公共资源过度开采/公共品供给短缺大学扩招、研究生扩招、大学贷款基建备受批评却日益严重的应试教育微妙的三角关系年年都有的评优评先活动各种资格考试广泛盛行2026/4/21魏光兴——重庆交通大学51、囚徒困境与占优均衡V如何走出囚徒困境?可信的(由第三方实施的、据说黑社会中存在的)报复历史上的“人质”或“通婚”方案军队中的(有些企业试图培养的)“忠诚”文化长期重复关系2026/4/21魏光兴——重庆交通大学61、囚徒困境与占优均衡VI委托-代理(principal-agent)关系中被设计的囚徒困境委托-代理关系通常的含义是委托人请代理人代理某件事情。其中的关键问题是二者利益不一致,并且委托人不知道代理人是否努力工作(称为信息不对称),甚至委托人没有办法监督代理人的工作。为此,需要设计一种制度(system),使代理人在追求自己利益的同时也最大化委托人的利益,如何设计这样的制度就是信息经济学(informationeconomics)研究的问题。由于在经济学中,制度与合同/合约/契约(contract)、机制(mechanism)等词具有相同含义,信息经济学又称为机制设计理论、合同/合约/契约理论。又由于是研究委托代理关系,也称为委托代理理论。其实质是激励代理人按照委托人的利益行事,还称为激励理论(IncentiveTheory),注意与管理学中激励理论差异。2026/4/21魏光兴——重庆交通大学71、囚徒困境与占优均衡VII委托-代理(principal-agent)关系中被设计的囚徒困境预防审计合谋—双头审计经理与注册会计师之间可能合谋,隐瞒不良信息。股东解决这一问题的一种做法是双头审计,请两位会计师进行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告问题的注册会计师以更多的报酬。5,5-1,66,-10,0注册会计师A隐瞒实报隐瞒实报注册会计师B2026/4/21魏光兴——重庆交通大学81、囚徒困境与占优均衡VIII委托-代理(principal-agent)关系中被设计的囚徒困境压低供应商价格假设:两供应商成本都为6元/件,报价都为10元/件。策略:如果二者报价都为10元/件或8.5元/件,则从每家订购50件;若一家报价10元/件而另一家报价8.5元/件,则从价低者订购100件。125,125250,00,250200,200供应商A8.5108.510供应商B2026/4/21魏光兴——重庆交通大学91、囚徒困境与占优均衡IX回顾:博弈论、互动局势与名人名言博弈论研究互动局势下的最优行为决策,必须考虑自己的行为对他人利益的影响,以及他人对自己行为的反应。互动局势自己的行为会影响他人利益,他人行为也会影响自己利益;在重复博弈/长期关系中,合作和报复都有可能。名人名言莫列尔:应当随时考虑别人的利益,条件是不这样做自己的利益就是受到损害。2026/4/21魏光兴——重庆交通大学102、智猪博弈I预言故事:智猪博弈(BoxedPigs)一头大猪和一只小猪生活在同一猪圈里,共用一食槽。食槽的一端有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假定按一下会掉下10个包子,而跑去按开关的猪会耗费3个包子的能量。如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪会吃掉8个包子,小猪只能吃到2个;如果大猪先按开关,按完后跑过来,小猪会吃掉4个包子,大猪可以吃到6个;如果都不去按开关,就会被一起饿死。模型描述4,03,48,-10,0大猪按等按等小猪2026/4/21魏光兴——重庆交通大学112、智猪博弈II重复剔除严格劣战略IteratedEliminationofStrictlyDominatedStrategies在求解纳什均衡过程中,可以剔除局中人的严格劣战略以简化博弈,因为严格劣战略肯定不会被实施。注意:一定是剔除“严格”劣战略,因为如果剔除的劣战略不是严格的,那么有可能剔除纳什均衡。如果重复剔除严格劣战略之后的战略组合是唯一的,那就是纳什均衡。但是,并不是所有纳什均衡都可以通过重复剔除严格劣战略得到。4,04,48,-10,0大猪按等按等小猪2026/4/21魏光兴——重庆交通大学122、智猪博弈III智猪博弈背后的哲理小猪角度:自己不能努力,即使努力劳动成果也会被大猪侵占,所以最优选择是等待,坐享大猪的劳动成果,这称为搭便车(free-riding)。但是,因为如此,小猪没有权利,很多时候处于任人宰割的地位。大猪角度:自己必须努力工作,不得不让小猪分享部分劳动成果。但也正因为如此,大猪拥有主导权,而这种权利可以使大猪在利益分配中获得更多的利益。练习:用重复剔除严格劣战略求以下博弈的纳什均衡1,01,30,10,40,22,0左中右上下2026/4/21魏光兴——重庆交通大学132、智猪博弈IV生活中的智猪博弈制度改革小股东与大股东广告搭便车技术创新搭便车能者多劳聚餐AA制老师优先选用自己编写的教材领导配高档轿车、装修豪华办公室2026/4/21魏光兴——重庆交通大学142、智猪博弈V如何解决这些问题?基本思路是界定产权,明确各方的责任、权力和利益。通过界定产权,可以防止搭便车。通过明确责权利,可以削弱一方在利益分配中的独导地位。这都要通过法律或制度来实施。在某些领域,这一问题是没有办法解决的。所以莫勒尔说:尽管大家同乘一条船,可一些是划船,另一些人只是坐船。2026/4/21魏光兴——重庆交通大学153、最优反应与画线法I网络名句我尊重你是因为你尊重我,你尊重我是因为我尊重你;我喜欢你是因为你喜欢我,你喜欢我是因为我喜欢你;我爱你是因为你爱我,你爱我是因为我爱你。麦琪的礼物小说故事:妻子麦琪有一头长发,却没有梳子。丈夫有一只怀表,却没有表链。麦琪生日那天,麦琪卖掉了长发为丈夫买了一条表链,吉姆卖掉怀表为妻子买了一把梳子。模型描述0,02,11,20,0吉姆卖表不卖剪发不剪麦琪2026/4/21魏光兴——重庆交通大学163、最优反应与画线法II最优反应给定对方的战略选择,我方的最优战略画线法在最优反应战略对应的数字上画线如果某战略组合都画上了线,那就是纳什均衡。此时,各方的行为选择都是给定对方战略下的最优选择,每一方都不能通过单方面的改变行为选择来提高自己的收益。0,02,11,20,0吉姆卖表不卖剪发不剪麦琪2026/4/21魏光兴——重庆交通大学173、最优反应与画线法III练习:用画线法求解下列博弈的纳什均衡性别战博弈斗鸡博弈2,10,00,01,2妻子韩剧足球韩剧足球丈夫1,1-2,22,-2-4,-4公鸡2后退进攻后退进攻公鸡12026/4/21魏光兴——重庆交通大学183、最优反应与画线法IV练习:用画线法求解下列博弈的纳什均衡复杂例子协调博弈4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R320,200,00,05,5左右左右2026/4/21魏光兴——重庆交通大学194、多重均衡与协调I多重均衡的协调很多博弈具有多个纳什均衡,比如以上讲到的麦琪的礼物、性别战、斗鸡博弈与协调博弈等,称为多重均衡。在某些具有多重均衡的博弈中,各个博弈方偏好于不同的均衡结果,如麦琪的礼物、性别战和斗鸡博弈;而在另一些具有多重均衡的博弈中,各个博弈方偏好于同一个均衡结果,如协调博弈。那么,博弈方如何使自己偏好的均衡称为实际的均衡结果呢?这就是多重均衡的协调问题。2026/4/21魏光兴——重庆交通大学204、多重均衡与协调II多重均衡的协调权威方,比如性别战博弈中,许多家庭习惯于听从某一方的安排,形成了事实上的权威方。树立非理性形象,比如在斗鸡博弈或性别战博弈中,以非理性闻名的一方往往会获得胜利。协商,比如吉姆可以事先给麦琪发条短信,告诉她卖了表给她买了梳子。相关均衡,比如性别战博弈中双方可以通过抛硬币来决定,现实中交通管制还广泛实施的单双号通行。聚点均衡,人们会选择习惯的行为,习惯就是聚点。帕累托占优均衡,如协调博弈。风险占优均衡,如鹿-兔博弈。2026/4/21魏光兴——重庆交通大学215、博弈与纳什均衡的数理描述博弈(game)博弈方局中人的第项战略表示为,构成其战略空间局中人的收益表示为,为各局中人所选择战略的函数博弈表示为纳什均衡(NE,NashEquilibrium)如果对任意,均有,那么称战略组合为博弈G的一个纳什均衡。也就是说,给定其他人的战略选择,任意局中人都实现了最大收益,或者不能通过改变自己的战略提高收益。即,在纳什均衡中,每一个局中人都不能单方面改变自己的战略来提高收益,从而每一个人都不会再改变战略,是一个相对静止的状态——因此称为均衡。2026/4/21魏光兴——重庆交通大学226、混合战略均衡I猜硬币博弈两人玩游戏,一人A盖住硬币,另一人B猜哪一面朝上,输赢一块钱。类似的例子还有划拳、敲棒棒、剪刀·石头·布、田忌赛马、乒乓球团体赛、战争。1,-1-1,1-1,11,-1局中人B国徽数字国徽数字局中人A2026/4/21魏光兴——重庆交通大学236、混合战略均衡II纯战略与纯战略纳什均衡纯战略:肯定会(以100%的概率)被选择的战略。纯战略纳什均衡:各个局中人都选择纯战略的纳什均衡。混合战略与混合战略纳什均衡混合战略:以一定的概率分布选择某几个行动的战略数理描述:局中人的纯战略空间为,其一个混合战略表示为分别以概率选择实施对应的纯战略。混合战略纳什均衡:由局中人的混合战略构成的纳什均衡。显然,纯战略纳什均衡是混合战略纳什均衡的特殊情况。下文的战略指混合战略,纳什均衡指混合战略纳什均衡。2026/4/21魏光兴——重庆交通大学246、混合战略均衡III混合战略纳什均衡的求解方法混合战略的三个原则严格劣战略肯定不会被选择实施选择实施非严格劣战略具有随机性均衡时,博弈各方选择任意一个纯战略会得到相同的收益混合战略纳什均衡满足的条件任意局中人随机选择实施自己纯战略的概率分布使对方选择其每一个纯战略都会得到相同的收益概率分布满足归一化条件具体求解方法剔除严格劣战略设各个局中人的概率分布根据以上两条件列方程解未知数2026/4/21魏光兴——重庆交通大学256、混合战略均衡IV混合战略纳什均衡的求解方法例子2,35,23,11,5CDAB博弈方2博弈方1策略得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6博弈方1的混合策略博弈方2的混合策略2026/4/21魏光兴——重庆交通大学266、混合战略均衡V混合战略纳什均衡的求解方法练习求以上麦琪的礼物、性别战、斗鸡博弈、协调博弈的混合战略纳什均衡。求田忌赛马的纳什均衡以及各博弈方的期望收益。3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1

1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田忌齐威王2026/4/21魏光兴——重庆交通大学276、混合战略均衡VI混合战略纳什均衡的两种解释重复博弈中各种均衡结果出现的概率分布偏好不同类型局中人所占比例的概率分布生活中的随机性与多元化虽然我们很多时候讨厌随机性,但是正因为随机性的广泛存在我们的生活才丰富多彩。多元化是社会稳定发展的一个重要前提条件,古今中外的无数事实证明了这一点。2026/4/21魏光兴——重庆交通大学286、混合战略均衡VII《孙子兵法》中的混合战略与随机性攻而必取者,攻其所不守也;守而必固者,守其所必攻也。故善攻者,敌不知其所守;善守者,敌不知其所攻。微乎微乎,至于无形;神乎神乎,至于无声。故能为敌之司命。物理学中的混合战略与随机性吕艾勒如果你与他人合作,通常还是让行为有规律可循会比较好一些。但在有竞争的情况下,最佳策略通常都涉及随机的不可预测的行为。波尔从“聪明的驴”到量子理论和测不准理论爱因斯坦从“我在哪里”到相对论2026/4/21魏光兴——重庆交通大学297、纳什均衡的存在性I存在性定理纳什(Nash,1950):任何博弈都至少存在一个纳什均衡,只不过可能是混合战略纳什均衡。奇数定理威尔逊(Wilson,1951):几乎所有博弈都有奇数个纳什均衡。求解步骤总结重复剔除严格劣战略化简博弈求纯战略纳什均衡求混合战略纳什均衡2026/4/21魏光兴——重庆交通大学307、纳什均衡的存在性II练习2,10,21,23,0上下左右2,01,14,23,41,22,31,30,23,0CTMLRB2026/4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论