纯策略纳什均衡_第1页
纯策略纳什均衡_第2页
纯策略纳什均衡_第3页
纯策略纳什均衡_第4页
纯策略纳什均衡_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、纯策略纳什均衡纯策略纳什均衡(Pure Strategy Nash Equilibrium )编辑什么是纯策略纳什均衡纯策略纳什均衡是指在一个纯策略组合中,如果 给定其他的策略不变,该节点不会单方面改变自己的 策略,否则不会使节点访问代价变小。编辑存在纯策略纳什均衡的有限次重复博弈1如果重复博弈中有惟一纯策略纳什均衡,那么我 们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒 的困境的博弈的例子:图砧2用白 不如白囚徒】坦白 f T0T不坦向! TO;七】/用I囚健的困境的博客我们现在考虑该博弈重复两次的重复博弈,这可 以理解成给囚徒两次坦白机会,最后的得益是两个阶段博弈中各自得益之和在两次博弈过

2、程中,双方知道第一次博弈的结果再进行二次博弈用逆推归纳法来分析,先分析第二阶段,也就是第二次重复时两博弈方 的选择很明显,这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈,此时前一阶段的结果已成为既成事实,此后又不再有任何的后续阶段,因此实现自身当前的最大利益是两博弈方在该阶段决策中的惟一原则因此我们不难得出结论,不管前一次的博弈得到的结果如何,第二阶段的惟一结果就是原博弈惟一的纳什均衡 (坦白,坦白),双方得益(-5 , -5) 现在再回到第一阶段,即第一次博弈理性的博弈方在第一阶段就对后一阶段的结局非常清楚,知道第二阶段的结果必然是(坦白,坦白) ,因此不管第一阶段的博弈结果是什么,双方在

3、整个重复博弈中的最终得益,都将是第一阶段的基础上各加-5 因此从第一阶段的选择来看,这个重复博弈 与图 l 中 得益矩阵表示的一次性博弈实际上是完全等价的囚徒2国防1坦白 不坦白坦白 不加白-1*101-5T一口5 j -&4图2惟一钝策略均衡的有的次重复博弈于是我们可以得出惟一纯策略均衡的有限次重复 博弈的结果就是重复原博弈惟一的纯策略纳什均衡, 这就是这种重复博弈惟一的子博弈完美纳什均衡路 径.如果重复博弈中有多个纯策略纳什均衡,设某一 市场有两个生产同样 质量产品的厂商,他们对产品的 定价同有高(H)、中(M)、低(L)三种可能.设高价时市 场总利润为10个单位,中价时市场总利润

4、为6个单 位,低价时市场总利润为2个单位.再假设两厂商同 时决定价格,价格不等时低价格者独享利润,价格相 等时双方平分利润.这时候两厂商对价格的选择就构 成了一个静态博弈问题.我们看一个三价博弈的重复 博弈的例子:厂商【图3三价博弈的复博非显然,这个得益矩阵 有两个纯策略纳什均衡(M ,M)和(L, L),我们也可以看出实际上两博弈方最大的得益是 策略组合 (H , H) ,但是它并不是纳什均衡现在考虑重复两次该博弈,我们采用一种 触发策略(Trigger Strategy ) :博弈双方首先试图合作,一旦发觉对方不合作也用不合作相报复的策略使得在第一阶段采用(H, H)成为子博弈完美纳什均衡

5、,其双方的策略是这样的:博弈方 1 :第一次选H ;如果第一次结果为(H ,H) ,则第二次选M ,如果第一次结果为任何其他策略组合,则第二次选择 L 博弈方2 :同博弈方1 在上述双方策略组合下,两次重复博弈的路径一定为第一阶段(H , H) ,第二阶段(M, M),这是一个子博弈完美纳什均衡路径.因为第二阶段是一个原博弈的纳什均衡,因此不可能有哪一方愿意单独偏离;其次,第一阶段的(H, H)虽然不是原来的博弈纳什均衡,但是如果一方单独偏离,采用 M 能增加 1 单位得益, 这样的后果却是第二阶段至少要损失 2 单位的得益, 因为双方采用的是触发策略 ,即有报复机制的策略,因此合理的选择是坚

6、持H 这就说明了上述策略组合是这个两次重复博弈的子博弈完美纳什均衡.从上述的例子我们可以看出,有多个纯策略纳什 均衡的博弈重复两次的子博弈完美纳什均衡路径是, 第一阶段采用(H, H),第二阶段采用原博弈的纳什均 衡(M, M).如果这个重复博弈重复三次,或者更多次,结论 也是相似的,仍然用触发策略,它的子博弈完美纳什 均衡路径为除了最后一次以外,每次都采用(H, H), 最后一次采用原博弈的纳什均衡(M, M).编辑存在纯策略纳什均衡的无限次重复博弈1与有限次重复博弈一样,无限次重复博弈也是基 本博弈的简单重复,但是无限次重复博弈没有最后一 次重复,因此无限次重复博弈与有限次有一些不同.任何

7、博弈中博弈方策略选择的依据都是得益的大 小,这在重复博弈中仍然是成立的.但是重复博弈又 与一次性博弈有所不同,因为在重复博弈中,每一阶 段都是一个博弈,并且各博弈方都有得益,因此对于重复博弈,我们要计算的就是博弈结束时的一个总的 得益.由于前一次博弈和后一次博弈之间会有损失, 因此我们采用一种方法,就是将后一阶段的得益折算 成当前阶段得益的(现在值)的贴现系数有了贴现系 数那么在无限次重复博弈中,某博弈方各阶段得 益为叽2,,则该博弈方总得益的现在值为:C-7T = % + 62 + 3汗3 + =t=l对于存在惟一纯策略纳什均衡博弈的无限次重复 博弈,我们从下面的例子来看:用4存在惟一地施略

8、的什均衡情雾的无限次及亚博界其中博弈方1和博弈方2分别表示两个厂商,H 和L分别表示高价和低价.显然,该博弈的一次性博 弈有惟一的纯策略纳什均衡(L, L),但是这个纳什均 衡并不是最佳策略组合,因为策略组合(H, H)的得益 (4, 4)比(1, 1)要高的多.但是由于(H, H)不是该博 弈的纳什均衡,所以在一次性博弈中不会被采用.根 据上面的分析,此博弈在有限次重复博弈并不能实现潜在的合作利益,两博弈方在每次重复中都不会采用 效率较高的(H, H).为了实现效率较高的合作利益(H, H),假设两博弈方都采用 触发策略,也即报复性策略: 第一阶段采用H,在第t阶段,如果前t-l阶段的结果

9、都是(H, H),则继续采用L .假设博弈方1已经采用 了这种策略,现在我们来确定博弈方 2在第一阶段的 最优选择.如果博弈方2采用L,那么在第一阶段能 得到5,但这样会引起博弈方1 一直采用L的报复, 自己也只能一直采用L,得益将永远为1,总得益的 现在值为斤= 5+1 x(5 + 1 x + . = 5 + J1 - G如果博弈方2采用H,则在第一阶段他将得4, 下一阶段又面临同样的选择.若记V为博弈方2在该 重复博弈中每阶段都采用最佳选择的总得益现在值, 那么从第二阶段开始的无限次重复博弈因为与从第一 阶段开始的只差一阶段,因而在无限次重复时可看作 相同的,其总得益的现在值折算成第一阶段的得益为 方乂匕 因此当第一阶段的最佳选择是 H时,整个无限 次重复博弈总得益的现在值为V = 4y = 4 或者J46 亡1因此,当 口 >5+口解得5>«时,博弈方2会采用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论