经济博弈论2ppt课件_第1页
经济博弈论2ppt课件_第2页
经济博弈论2ppt课件_第3页
经济博弈论2ppt课件_第4页
经济博弈论2ppt课件_第5页
已阅读5页,还剩112页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 完全信息静态博弈,本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。,本章分六节,2.1基本分析思路和方法 2.2纳什均衡 2.3无限策略博弈分析和反应函数 2.4混合策略和混合策略纳什均衡 2.5纳什均衡的存在性 2.6纳什均衡的选择和分析方法扩展,2.1 基本分析思路和方法,2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法,2.1.1 上策均衡,上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低价”。 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 上策均衡不是普遍存在的,2.1.2 严格下策反复消去法,严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略 严格下策反复消去法:反复寻找博弈中各个博弈方的,在策略之间两两比较意义上的“严格下策”,并把它们消去的方法。,2.1.3 划线法,划线法的补充说明,此法以策略之间的相对优劣关系为基础,因此在分析用得益矩阵表示的博弈问题时具有普遍适用性。 并不意味着每个用得益矩阵表示的博弈都可以用划线法求出确定性的博弈结果。如猜硬币、夫妻之争 但可以帮助我们清楚地认识博弈方之间的策略偏好是否一致,共同利益和矛盾冲突。,箭头法基本思路,对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后策略组合对应的得益数组,最后综合对每个策略组合的分析情况,形成对博弈结果的判断。,2.1.4 箭头法,剪头法说明,剪头法与划线法不同,但两者都是基于策略之间相对优劣关系进行分析的,得到的结论也是一致的。 这种通过反映各博弈方选择的箭头,寻找博弈中具有稳定性的策略组合的方法,就是“剪头法”。 只有指向的箭头没有指离的箭头的得益数组,即为稳定性的策略组合。,注,在博弈方多于三个,或可选策略很多或无限策略时,因无法用得益矩阵表示博弈,前面介绍的方法也无法应用。所以,必须探讨其他的方法。,2.2 纳什均衡,2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法,2.2.1 纳什均衡的定义,策略空间: 博弈方 的第 个策略: 博弈方 的得益: 博弈: 纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡,2.2.2 纳什均衡的一致预测性质,一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果 只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性,那什均衡一致预测性的证明,如果一个博弈的所有博弈方都预测博弈结果是某个那什均衡,那么由于那什均衡策略组合中各博弈方的策略都是对其他博弈方策略组合的最佳对策,因此任一博弈方都不会单独改变策略,因此,预测的结果会成为博弈的最终结果。这说明,一个那什均衡作为各个博弈方的共同预测时,一定是一致预测。,那什均衡一致预测性的证明,反之,如果每个博弈方都预测到某个策略组合将是博弈结果时,都会主动坚持该策略组合中的策略,而不想采取与预测不一致的策略,则说明该策略组合中的每个博弈方的策略都是对其他博弈方策略的最佳对策。根据那什均衡的定义,这个策略组合一定是一个那什均衡。,说明:,一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能。也可能博弈中根本无纳什均衡,加之博弈方的理性、能力等与假设不符等。都会影响纳什均衡在博弈分析中的预测作用 所以,相同的预测,只是一致预测性质的前提而不是结果。 那什均衡的一致预测性质是其预测能力的基本保证。但那什均衡分析并不一定能对所有博弈的结果都作出准确的预测。,那什均衡与前面介绍方法的联系,上策均衡、严格下策反复消去法、划线法、箭头法、那什均衡都是根据不同思路,从不同侧面对完全信息静态博弈进行分析。它们的相互关系是我们所关心的。如它们是相容的还是不容的?等等 上策均衡是那什均衡,但比那什均衡要严格,要求更强、稳定性更高,其普遍性比那什均衡要差得多。 划线法、箭头法都是在得益矩阵表示的博弈中寻找那什均衡的方法。,2.2.3 纳什均衡与严格下策反复消去法,纳什均衡与严格下策反复消去法的关系要复杂得多 命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡 命题2.2:在n个博弈方的博弈 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的,2.3 无限策略分析和反应函数,2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性,2.3.1 古诺的寡头模型,寡头产量竞争以两厂商产量竞争为例,单位成本,分析,如果假设策略组合,是本博弈的那什均衡,其必是最大值问题的解。求最大值的两个式子都是各自变量的二次式,且二次项系数都小于0,,因此,,只要能使两式各自对 的导数等于0,就能实现两式的最大值。,令,解得,策略组合(2,2)是本博弈唯一的那什均衡,也是本博弈的结果。,市场总产量Q=2+2=4 市场价格P=8-4=4 双方各自得益(利润)u* =2*(8- 4)-2*2=4 两厂商的利润总和为4+4=8,下面对上述博弈结果作效率评价。我们可以从两厂商总体利益最大化角度作一次产量选择。,设总产量为Q总得益U=QP(Q)-cQ=Q(8-Q)-2Q=6Q-Q2 易得Q*=3 最大得益u*=9 所以,联合决策比各自的决策效率要高。即节约成本,又提高利润。 思考:现时中的两个寡头企业能否通过某种协调机制进行合作? 为什么? 自由竞争是否也存在低效率的情况?如果是,如何处理?,4.5,4.5,5,3.75,3.75,5,4,4,不突破,突破,厂商2,不突破,突破,厂 商 1,以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5,两寡头间的囚徒困境博弈,注:是对1.5的突破,2.3.2 反应函数,古诺模型的反应函数,理性局限和古诺调整,两寡头古诺模型中,对厂商2的任意产量 ,厂商1的最佳对策产量 ,就是使自己在厂商2生产 的情况下利润最大化的产量,即 是下面最大化问题的解。,厂商1对厂商2的反应函数,厂商2对厂商1的反应函数,(2,2),反应函数法,容易看出反应函数对应的两条直线的交点(2,2)才是由相互对对方的最佳反应产量构成的产量组合。 进一步推广:对一个一般的博弈,只要得益是策略的一个多元连续函数,都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数,也就是反应函数,而解出的各个博弈反应函数的交点就是那什均衡。 这种利用反应函数求博弈的那什均衡的方法称为“反应函数法”。,2.3.3 伯特兰德寡头模型(1883年),价格竞争寡头的博弈模型(各厂商选择的是价格,而不是产量) 模型说明:两厂商生产同类产品,但在品牌、质量、和包装等方面有所不同。产品有很强的代替性,但又不能完全替代,即价格不同时,价格高的不是完全销不出去。当厂商1和厂商2价格分别为 和 时,它们的各自的需求函数为:,可以反应上述差别产品的特征,其中 即两厂商的替代系数。假设两厂商无固定成本,边际生产成本分别为 和 。两厂商同时决策。,利用上述得益函数在偏导数为0时有最大值,求出两厂商对对方策略(价格)的反应函数分别为:,那什均衡 必是两反应函数的交点,即必须满足:,波特兰得模型讨论,一般的情况是有n个寡头的价格决策,并且产品也可以是无差别的。 对产品无差别的情况,还必须考虑消费者对价格的敏感性问题,因为如果所有消费者对价格都非常敏感,则生产完全同质商品的厂商之间的价格差别根本不可能存在,因为此时价格高的一方将完全卖不出去。,对于多于两寡头的波特兰得模型分析,则是两寡头模型的简单推广,只需求出每个厂商对其他各个厂商价格的反应函数,然后,解出它们的交点即可。 与古诺产量决策模型一样,其那什均衡也不如各博弈方通过协商、合作得到的最佳结果,因此也是囚徒困境的一种。 我国现实经济中,彩电企业之间的价格战和失败的高峰会议等。,2.3.4 公共资源问题,在经济学中,所谓公共资源是指: (1)没有哪个个人、企业或组织拥有所有权; (2)大家都可以自由利用 具有这样两个特征的自然资源或人类生产的供大众免费使用的设施和财货。 如:可自由开采的地下水、可自由放牧的草地,可自由排放废水的公共河道、公共道路、公共楼道等。,从休谟(David Hume)1739年开始,政治经济学者们就开始关注,人们完全从自利动机出发自由利用公共资源时,公共资源倾向被过度利用、低效率使用和浪费,并且过度利用会达到任何利用它们的人都无法得到实际好处的程度。 下面用公共草地放牧问题为例来论证上面结论。,设某村庄有n个农户,该村有一大片大家都可以自由放牧羊群的公共草地。由于这片草地的面积有限,因此只能让不超过某一数量的羊吃饱,如果在这片草地上放牧羊只的实际数量超过这个限度,则每只羊都无法吃饱,从而每只羊的产出(毛、皮、肉的总价值)就会减少,甚至只能勉强存活或要饿死。,假设这些农户在夏天才到公共草地放羊,而每年的春天就要决定养羊的数量,则可看作各农户在决定自己养羊数是不知道其他农户养羊数的,即各农户的养羊的决策是同时作出的。 再假设所有农户都清楚这篇公共草地最多能养多少羊和羊只总数的不同水平下每只羊的产出。,这就构成了n个农户之间关于养羊数的一个博弈问题,并且是一个静态博弈。 在此博弈中,博弈方就是n个农户;他们各自的策略空间就是他们可能选择的养羊数目 的取值范围;当各户养羊数为 时,在公共草地上放牧羊只的总数为 ,每只羊的产出应是羊只总数 的减函数,假设购买和照料每只羊的成本对每个农户都是相同的不变常数 ,则农户 养 只羊的得益函数为:,公共草地养羊问题,以三农户为例 n=3,c=4 每只羊的产出函数为,三农户的得益函数分别为:,由于羊的数量不是连续可分的,上述函数不是连续函数。在技术上也可以把羊的数量看作连续可分的,因此上述得益函数仍然可当作连续函数。,竞争:个体利益最大化,求三农户各自对其他两农户策略(养羊数)的反应函数,(分别对 ) 得,合作:总体利益最大化,结论:三农户独立决策时,实际上使草地处于过度放牧的情况,浪费了资源,农户也没有获得最好的收益。如果各农户能将养羊数量自觉控制在48/3=16只,则他们都能得到更多的利益。,此问题的进一步分析,此例再一次证明了那什均衡。即非合作博弈的结果有可能是低效率的。 如果允许外来者任意加入利用该公共资源的行列,则所有利用该资源的人的利益很快都会消失,即羊只总数会随着放牧农户的增加而增加到刚好不至于亏损的水平,各农户将完全不能从在公共草地上养羊得到任何好处,公共资源等于完全被浪费掉。,此问题的进一步分析,在公共资源利用方面出现这样的悲剧,原因是每个可以利用公共资源的人都相当于面临着一种囚徒困境。即在总体上有加大利用资源可能(至少加大利用者自身还能增加得益)时,自己加大利用而他人不加大利用则自己的利,自己加大利用而其他人也加大利用则自己不至于吃亏,最终是所有人都加大利用资源直至再加大只会减少利益的那什均衡水平。,公共资源的悲剧在我国的例子,在我国受风沙、沙漠化威胁的地区,当地居民关于保护还是毁坏防风防沙林带的选择,就可以看作一种公共资源博弈问题。 每个人都想,如果只有自己砍几棵树,只要别人不砍就无关要紧,自己却可得利,而如果其他人都砍而自己不砍,则防护林也保护不了,还不如也砍。最后的结论是砍总是合算的。结果是防护林带完全被破坏,整个地区都被沙漠吞没,人人都被迫离乡背井,最终倒霉的还是自己。,公共设施问题也是类似的问题。在许多人类生产生活、提供的公共设施问题上,做搭便车(Free Rider)总是比做提供者合算,因此,许多必要的公共设施,如楼道里的电灯等总是没人提供。 这些公共资源博弈问题的结果说明了在公共资源的利用,公共设施的提供方面,政府的组织、协调和制约是非常必要的,这也说明政府存在必要的主要理由之一。,思考下面问题,写出博弈矩阵并分析,乡下地方有一个只有的两户人家的小居民点,由于道路情况不好,与外界的交通比较困难。如果修一条路出去,每家都能得到3那么多好处,但是修路的成本相当4;要是没有人协调,那么两家博弈的形势如下:如果两家联合修路,每家分摊成本2,各得好处3,两家的纯“赢利”都是1;如果一家修另一家坐享其成,修的一家付出4而得到3,“赢利”-1,坐享其成的一家可以白白赢利3(修路的总不能因为修了路就不让邻居走);如果两家都不修路,结果两家的赢利都是0。,智猪博弈,在博弈论经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是91;同时到槽边,收益比是73;小猪先到槽边,收益比是64。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。,在考虑成本的情况下,写出博弈矩阵并分析结果,结果分析,在两头猪都有智慧的前提下,最终结果是小猪选择等待 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单: 在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。,管理启示,在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。,2.3.5 反应函数的问题和局限性,在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。 即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。,图2.15 反应函数的问题,2.4 混合策略和混合策略纳什均衡,2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数,2.4.1 严格竞争博弈和混合策略的引进,一、猜硬币博弈,(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 引出混合策略(Mixed strategies)纳什均衡概念。 原来意义上的策略为“纯策略(Pure Strategies).,严格竞争博弈:各博弈方的利益和偏好不一致,通常策略下没有那什均衡,二、混合策略、混合策略博弈 和混合策略纳什均衡,混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈”。 混合策略纳什均衡:包含混合策略的策略组合,并且该策略组合满足各博奕方对其他博奕方的策略是最佳对策时,就构成混合策略纳什均衡。,三、一个例子,该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析 (1)决策时双方都要保持决策的随机性 (2)选择每种策略的概率 使对方无机可乘 可设博弈方1选A的概率为 选B的概率为 ,博弈方2选C 的概率为 ,选D的概率为 则博弈方1选A和B的概率 和 ,一定要使博弈方2选C的期望 得益和选D的期望得益相等。,也就是:,当博弈方1以(0.8,0.2)的概率随机选择A和B,博弈方2以(0.8,0.2)的概率随机选择C和D时,由于谁都无法通过单独改变自己随机选择的概率分布改善自己的期望得益,因此这个混合策略组合是稳定的。 (0.8,0.2)本博弈唯一的混合策略那什均衡。,双方多次重复该博弈的期望得益,当双方采用该策略组合时,虽不能确定单独一次博弈的结果究竟会是四组得益中的哪一组,但双方进行该博弈的期望得益,就是多次独立重复该博弈的平均结果,分别为:,策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6,四、齐威王田忌赛马,本博弈中两博奕方的利益也是完全冲突对立的,也是一个严格竞争的零和博弈,不会有纯策略那什均衡,也是一个混合策略博弈问题。 可设齐威王的策略从上到下分别称为 和 ,田忌的策略从左到右分别称为策略 和 。 设齐王分别以概率 随机选择相应策略,则田忌采用g、h、i、j、k、和l的期望得益分别为,齐王为使田忌无机可乘,所选概率分布必须使这6个期望得益相等。,同样,田忌以概率 随机选择相应策略,则该6个概率也必须使齐王选择各纯策略的期望得益相等,因而 得 。齐王和田忌都以1/6的相同概率随机选择各自的6个纯策略,构成本博弈唯一的混合策略那什均衡。,多次进行这样的赛马,齐王平均每次能赢得田忌一千金铜,这时因为齐王三匹马的实力略胜田忌三匹马总体实力一筹的缘故。,五、小偷和守卫的博弈,背景介绍:一小偷欲偷窃,有一守卫看守仓库,如果小偷偷窃时看守在睡觉,则小偷就能能得手,偷得价值为V的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓。设小偷被抓住后要坐牢,负效用为-P,守卫睡觉而未遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用为-D。而如果小偷不偷,则它们既无得也无失,守卫不睡意味着出一份力挣一分钱,他也没有得失。 根据上述假设双方博弈矩阵如下:,五、小偷和守卫的博弈,在一次性的博弈中没有自动实现的均衡性策略组合,也无法预测博弈的结果。 这个博弈除了双方得益没有猜硬币那么对成称外,本质特征与猜硬币博弈是相同的。 决策原则:不能让对方猜到自己的策略,应该以随机的方式选择策略,并且随机选择两种策略的概率不能让对方有机可乘。 可以用原来代数的方法分析,也可以用下面图解的方法来解决这个问题。,横轴表示小偷偷的策略概率 它分布在0-1之间。不偷的概率,纵轴反映对应与小偷“偷”策略的不同概率,守卫选择“睡”策略的期望得益。 图中从S到-D连线的纵坐标就是在横坐标对应的小偷“偷”窃概率下,守卫选择“睡”的期望得益,易知:该线与横轴的交点 就是小偷选择“偷”窃概率的最佳水平,选择“不偷”的概率则为 1-,加重对守卫的处罚效果将会怎样?,首先,S到-D连线上每一点的纵坐标,就是在小偷选择该点横坐标表示的”偷“窃概率 时,守卫选择”睡“觉策略的期望得益,假设小偷的”偷“窃概率大于 时,此时守卫”睡“觉的期望得益小于0,因此他会百分之百选择不睡,小偷偷一次被抓一次,所以对小偷来说大于 的”偷“的概率是不可取的。 反之,守卫的期望得益会大于0,守卫天天睡大觉是合算的。此时,小偷选择作案的频率会增加,在不被抓的前提下,作案频率增加,小偷的收益也会增加,一旦达到均衡点,小偷的策略会选择改变。因此,均衡点是小偷以概率 和 分别选择“偷”和“不偷”。此时,守卫“睡”与“不睡”的期望得益都等于0,选择纯策略或混合策略的得益都是相同的。,思考题 :,短期的效果是使守卫真正尽职。 在长期并不能使守卫更尽职,但会降低盗窃发生的概率,事实上,为了使小偷也没可乘之机,守卫也必须选择自己的特定的概率分布的混合策略。 守卫采取“睡”与“不睡”的混合策略概率分布,也可以用同样的方法来确定。下页图中的 和 是守卫的最佳概率选择。,加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会使得守卫更多的偷懒,进一步分析,在小偷与守卫的博弈中,小偷分别以概率 和 随机选择“偷”与“不偷”,守卫分别以概率 和 随机选择策略“睡”与“不睡”时,双方都不能通过改变策略或概率改善自己的期望得益,因此构成混合策略那什均衡,这也是该博弈的唯一的那什均衡。 小偷与守卫之间存在的混合策略博弈,还可以揭示一种“激励的悖论”。,2.4.2 多重均衡博弈和混合策略,一、夫妻之争的混合策略纳什均衡,夫妻之争博弈的混合策略纳什均衡 策略 得益 博弈方1 (0.75,0.25) 0.67 博弈方2 (1/3,2/3) 0.75,夫妻之争的混合策略纳什均衡分析,这个结果明显不如双方交流协商时,任何一方迁就另一方时双方的得益好,因为那时任何一方的得益至少为1。 出现这中情形是夫妻双方缺乏沟通造成的。 是在双方不能交流串通的博弈规则下所采取的解决方式。 处理此类问题,建议不采用上述博弈方式解决。,制式问题的引入,电器和电子设备之间采用的原理或相关技术标准称为制式。如果生产相关电器或电子设备的厂商采用相同的制式,产品之间就会相互匹配,零配件也可以通用。对于推广各自的产品和生产经营中的合作是有益的。设有两生产彩电的厂商,可选用A、B两种不同制式,于是产生两厂商之间选择制式的博弈问题。,二、制式问题,制式问题混合策略纳什均衡 A B 得益 厂商1: 0.4 0.6 0.664 厂商2: 0.67 0.33 1.296,与夫妻之争类似,存在两个纯策略那什均衡(A,A)和(B,B)。厂商1喜欢后一个均衡,厂商2喜欢前一个均衡,究竟哪一个均衡会出现也没有必然的结论,也是一个混合策略问题。,制式博弈问题结果分析,各自独立选择制式的结果也不是理想的结果。通过协商采用纯策略的任何一个都比混合策略得益更高。证明像引进技术、投资、开发新产品等问题中,不同厂商各自为政的方式常常会导致低效率。,市场机会博弈的引入,两厂商同时发现一个市场机会,但这个市场容量并不大,如果只有一个厂商进入该市场,能赚到100个单位的利润,但如果两厂商同时进入该市场,则他们不仅赚不到钱,而且要各亏损50个单位。若果两厂商没有沟通和协商解决的有效办法,就会形成下面得益矩阵表示的局面。,三、市场机会博弈,进 不进 得益 厂商1: 2/3 1/3 0 厂商2: 2/3 1/3 0,两纯策略的那什均衡(进,不进)和(不进,进)。前一个均衡对厂商1有利,后一个对厂商2有利。两厂商既不希望让对方独占市场,但也不希望两败俱伤。可以考虑混合策略的那什均衡。,市场机会博弈分析,此结果对一次博弈的指导意义不大。对多次遇到类似问题时,2/3厂商选择进如市场,1/3选择不进,会更加有意义。,混合策略和严格下策反复消去法,在包括混合策略的情况下,关于严格下策反复消去法的结论仍然成立。 任何博弈方都不会采用严格下策,不管他们是纯策略还是混合策略。 严格下策反复消去法不会消去任何那什均衡,包括纯策略那什均衡和混合策略那什均衡。 如果经反复消去法消去后留下的策略组合是唯一的,那么一定是那什均衡。,2.4.3 混合策略和严格下策反复消去法,纯策略下两博弈方都没有严格下策,不能使用严格下策反复消去法,要考虑混合策略。,对博弈方2不管采取什么策略(q,1-q),博弈方1采取混合策略(1/2,1/2,0)时,其得益都是3/2。都大于采用D策略时能得到的确定性得益1。 若果我们是风险中性的,D策略相对于混合策略(1/2,1/2,0)是严格下策.,博弈方1,博弈方2,U,M,L,R,消去D策略的得益矩阵,此时,L策是博弈方2的相对于R策的严格下策,也可将它从博弈方2的策略空间中消去.最后,在剩下的两个策略组合中,博弈方1当然选择(M,R),这就是该博弈的那什均衡,双方的得益为(3,3),混合策略反应函数,反应函数的概念:一博弈方对另一博弈方每种可能的决策内容的最佳反应决策构成的函数. 求那什均衡的反应函数分析方法也可以扩展到求混合策略那什均衡。 在纯策略的范畴内,反应函数是各博弈方选择纯策略对其他博弈方纯策略的反应 在混合策略范围内,博弈方的决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应,同样也是一定的概率分布。,2.4.4 混合策略反应函数,猜硬币博弈,盖硬币方对猜硬币方的反应函数,猜硬币方对盖硬币方的反应函数,(1/2,1/2),二反应函数的交点(1/2,1/2)正是相互对对方最佳反应的混合策略概率分布,即本博弈的唯一的混合策略那什均衡。,夫妻之争博弈,当q2/3.。即r=0. 当q1/3,妻子选时装的得益2q2/3,大于选足球的得益1-q2/3,即选时装,r=1 当q=1/3时,r取0与1之间的任何值对妻子的得益都一样。 因此,妻子对丈夫的反应函数: 同理:丈夫对妻子的反应函数:,注意图中的反应函数的三个交点:其中(0,0),即r=q=0,和(1,1),即r=q=1,为两个纯策略的那什均衡。而交点坐标(3/4,1/3),对应妻子以概率分布(3/4,1/4)随机选择时装表演、足球,丈夫以概率分布(1/3,2/3)随机选择时装、足球,是本博弈的一个混合策略那什均衡。,2.5 纳什均衡的存在性,纳什定理:在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。 谢识予的经济学博弈论106页证明。主要根据是布鲁威尔和角谷的不动点定理。 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。,2.6 纳什均衡的选择和分析方法扩展,那什均衡在相当广泛的博弈类型中普遍存在。 但并不能彻底解决一个博弈问题,因为那什均衡的存在性不等于惟一性。 即使多个那什均衡之间优劣关系明显,博弈方也未必选择优者,也要考虑风险因素。 多人博弈中,还会有“破坏者”或博弈方“串通”的可能性,博弈方的选择和结果往往也无法用那什均衡加以解释。 那什均衡分析存在局限性。因此,在此基础上需作进一步深入分析。,多重那什均衡博弈引进混合策略的进一步解释,混合策略本身不一定比纯策略更好,而且对于确定哪个纯策略更好也没作用。 有必要对多重那什均衡导致的选择问题,对博弈方在这种情况下的决策行为等做一些讨论。,2.6.1 多重纳什均衡博弈的分析,帕累托上策均衡 风险上策均衡 聚点均衡 相关均衡,帕累托最优的概念,帕累托最优(Pareto Optimality),也称为帕累托效率、帕累托改善,是博弈论中的重要概念,并且在经济学, 工程学和社会科学中有着广泛的应用。 帕累托最优是以提出这个概念的意大利经济学家维弗雷多帕雷托的名字命名的, 维弗雷多帕雷托在他关于经济效率和收入分配的研究中使用了这个概念。 帕雷托最优的定义:帕累托最优是指资源分配的一种状态,在不使任何人境况变坏的情况下,而不可能再使某些人的处境变好。,另一个相关概念是帕累托改进(Pareto Improvement),帕累托改进是指一种变化,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。一方面,帕累托最优是指没有进行帕累托改进的余地的状态;另一方面,帕累托改进是达到帕累托最优的路径和方法。,帕累托上策均衡,并不是所有多重那什均衡都会导致分析的困难。 如果存在多个那什均衡,各均衡之间存在明显的优劣。博弈方会偏向同一个那什均衡。 即被选均衡给各博弈方带来的利益,都大于其他所有那什均衡带来的利益。 各个博弈方不仅自己选择该策略,还可以预料其他博弈方会选择该策略。 上述均衡选择的依据是,帕累托效率意义上的优劣关系,也称“帕累托上策均衡”。典型例子“战争与和平”博弈。,一、帕累托上策均衡,(鹰鸽博弈) 这个博弈中有两个纯策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托上策均衡。,如果博弈双方都是理性的,都会选择帕累托上策均衡。否则,如果对方选择“战争”,自己最佳策略选择也是“战争”。,如何理解世界历史上的战争不断? 可以从以下几方面理解:包括决策者考虑短期利益、个人或小集团利益更多,决策者确实缺乏理性和理智,或者局部地区或特定时期战争的利益比上述博弈中所假设的要大等。 此外,其他国家选择战争时还击比不还击损失小,先发制人则更能使自己相对有利,也是导致战争机会增大的重要原因。,二、风险上策均衡,考虑、顾忌博弈方、其他博弈方可能发生错误等,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。,帕累托那什均衡:(U,L) 都采用帕累托那什均衡两博弈方会各多获得2个单位的得益。 若一方选择(U,L)而另一方选择(D,R)则前者的得益将是0。这与选取(D,R)而不管对方选去什么,得益为7要低得多。这意味着采取(U,L)对两博弈方都有较大的风险。 如果考虑风险因素,(D,R)比(U,L)具有相对优势。 (D,R)是这个博弈的一个“风险上策均衡(Risk-dominant Equilibrium).,猎鹿(Stag-hunting)博弈,两个人同时发现1头鹿和2只兔子,如果两人合力抓鹿,则可以把这个价值10个单位的鹿抓住,兔子当然就抓不到;如果两人都去抓兔子,则各可以抓到1只价值3个单位的兔子,鹿就会跑掉;但如果一个人选择抓鹿另一个人选择抓兔子,那么选择抓兔子的一个会抓到一只兔子,而另一个抓鹿的则什么都抓不到。由于两人的决策必须在瞬间作出,根本来不及商量,因此也就成了一个双方必须同时作出决策的静态博弈问题。如果合作猎获1头鹿后双方会平分收获,那么这个博弈的利益关系如下图:,风险上策均衡的进一步分析,博弈方对风险上策均衡的选择倾向,有一种自我强化的机制。 当部分或所有博弈方选择风险上策均衡的可能性增强的时候,任一博弈方选择帕累托上策均衡的期望得益都会进一步变小,这就使各博弈方更倾向于选择风险上策均衡,而这又进一步使选择帕累托上策均衡策略的得益更小,从而形成一种选择风险上策均衡策略的反馈机制,往往会

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论