第六章(完全但不完美信息动态博弈).ppt_第1页
第六章(完全但不完美信息动态博弈).ppt_第2页
第六章(完全但不完美信息动态博弈).ppt_第3页
第六章(完全但不完美信息动态博弈).ppt_第4页
第六章(完全但不完美信息动态博弈).ppt_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章是完整但不完整的信息动态游戏,第一节不完整的信息动态游戏1,概念,示例动态游戏中落后的游戏方首先不能确定游戏方的行为时,被称为“不完整信息的动态游戏”。(阿尔伯特爱因斯坦,Northern Exposure(美国电视电视剧),不完全信息的动态游戏)在这种游戏中,各方在游戏结束时的利益完全明确。这种游戏被称为“完美但不完整的信息动态游戏”或“不完整的信息动态游戏”。(阿尔伯特爱因斯坦,Northern Exposure,美国电视电视剧,被称为不完整的信息动态游戏)。不完全信息动态游戏的基本特征之一是游戏各方之间的信息不对称。以二手车买卖游戏问题为例,在二手车市场上,买家经常收支相抵,收支不

2、均衡,为什么买新车的时候没有这种感觉呢?主要原因是买方在二手车交易中的信息较少,卖方对汽车的实际情况和价值比买方知道得更多。二手车交易可以抽象为游戏问题,这取决于原车主(卖方)如何使用汽车,二手车的内在质量好,两种茄子情况决定。(威廉莎士比亚、二手车、二手车、二手车、二手车、二手车、二手车、二手车),第二步是由原所有者决定是否出售(售价为一、高、低两个以上,更多的价钱问题可能更复杂);最后,买方决定是否购买。这里规定买方不能与卖方的价钱或购买渡边杏箱,讨价还价。买方对第一阶段卖方的行为(汽车状态是好是坏)不太了解,因此买方有不完整的信息,这是不完整信息的动态游戏。(阿尔伯特爱因斯坦,North

3、ern Exposure(美国电视电视剧),牙齿例子中显示,在不完全信息的情况下,游戏一方的最佳策略不仅取决于另一方的策略,还取决于对另一方行为的判断。判断不同游戏当事人不同行动选择概率的大小,并据此计算对自己不同战略的期待利益,了解其中最大期待利益对应的战略是自己方面的最佳战略。(威廉莎士比亚,温斯顿,游戏名言) (这实际上是完全但不完全的信息动态游戏的标准分析方法)。第二,不完全信息动态游戏的表现,以二手车交易为例,利用好的时候,对买方来说,牙齿车需要3千韩元,使用车需要1千韩元,卖方需要2千韩元(可以解释为买方想买的等级)。另外,假设在利用不足的时候,卖方要花1000韩元才能很好地使用汽

4、车。买卖双方的游戏如图6-1所示。1,开始节点表示第一阶段卖方(即游戏1)对如何使用汽车的选择有两个可茄子的选择:“好”和“差”。第二阶段如果卖方选择“不卖”,则不发生交易。如果他选择了“销售”,则进入买方选择的第三阶段,此时买方不知道卖方的选择是“销售”还是“销售”,用多节点信息集表示这种不完全性。(阿尔伯特爱因斯坦,美国电视电视剧(Northern Exposure),销售名言)第三阶段的买家不能直接做出有针对性的选择,必须确定牙齿多节点信息集中每个节点出现的可能性。买方在这里只有“买”和“不买”两种茄子选择,但可能的结果有四种:“买好车”、“买车”;不“买”好车和坏车。前两个结果对买卖双

5、方都有影响。后两种茄子结果只影响卖方。也就是说,当买方在第三阶段选择不买的时候,不管车的状态是好是坏,都不会影响买方的利益。以卖方为例,在汽车状态不好的时候,他必须先花掉伪装1,000元,如果卖不掉,牙齿伪装费用就会白白损失,因此他的选择(销售或销售渡边杏)的前提是判断买方是否会买。汽车情况好的时候,不管卖不卖都没有损失,只有有利可图的可能性,所以总比不卖好。Exit P25,在卖方选择出售的前提下,买方选择利润的可能性(车辆状态好)和损失的可能性(车辆状态不好)不买,当然不会损失,但也失去了获得利润的机会。因此,买方是否决定购买,必须对汽车状态好坏的概率进行判断。第二节完美的贝叶斯均衡,在完

6、整的信息动态游戏中,子游戏完美性保证了平衡策略没有不可思议的威胁或承诺。而且因为这里有多节点信息集,包含这些多节点信息集的游戏阶段不构成真正的子游戏,所以不能满足子游戏的完整性要求。此外,不可靠的威胁或承诺不能保证平衡战略中所有选择的可靠性。子博弈需要开发新的均衡概念,因为优化纳什均衡的概念失去了意义。1,完美贝叶斯均衡的定义,一个战略组合及其相应的判断满足以下四个茄子条件,则称之为“完美贝叶斯均衡”。条件1:游戏玩家要从每个信息集中选择,必须对游戏到达该信息集中每个节点的可能性有“判断”。对于多节点信息集,“判断”应当理解为,对于游戏到达该信息集中每个节点的概率分布单节点信息集,“判断”到达

7、该节点的概率为L。条件2:轮到给定的游戏方选择“判断”,他的后续战略必须是“序列李晟”。也就是说,如果给出牙齿判断和“其他游戏者后续战略”牙齿,牙齿游戏的后续行动选择是为了最大限度地提高自己的期待。条件3:在平衡路径的信息集中,判断必须符合贝叶斯法则和各游戏方的平衡策略。条件4:在不平衡路径的信息集中,判断也要符合贝叶斯法则和各游戏方可能在这里的平衡策略。一个战略组合及其相应的判断满足牙齿四个茄子条件时,被称为“完美的贝叶斯平衡”。根据上面的定义,子博弈完美的纳什均衡是完整的信息动态博弈中完美的贝叶斯均衡的特例。也就是说,在完整的信息动态博弈中,子博弈的完美纳什均衡是完美的贝叶斯均衡。事实上,

8、顺序李晟条件要求各游戏方遵守最大利益原则,进行战略选择,排除游戏方战略中不可思议的威胁或承诺。因此,顺序李晟要求对确保完美威尼斯平衡的真正稳定性至关重要。其次,对平衡要求的初步解释以图6.2中完整但不完整的信息动态博弈为例,说明了上述条件的重要性。先看“条件1”。当游戏当事人1的第一阶段选择不是R牙齿时,游戏当事人2不知道是否选择了游戏当事人1牙齿L或M。因此,当轮到游戏2选择时(不选择游戏1阶段R),他必须判断游戏1的选择。否则不能在自己的U和D中做出合理的选择。图6-2看不完整但不完整的信息动态游戏,“条件2”的必要性。牙齿游戏本来除了游戏外,没有其他钟摆游戏(子游戏完整性要求自然满足)牙

9、齿。子博弈完美的纳什均衡定义实际上是纳什均衡。(阿尔伯特爱因斯坦,美国电视电视剧,游戏名言)如果把上图换成矩阵(下图),牙齿游戏就有两个纯战略纳什均衡(L,U)和(R,D)牙齿。(R,D)依赖难以置信的威胁。也就是说,游戏方2的威胁是,轮到自己选择的时候(游戏方1不选择R),唯一的选择是D。P 21,但是当选择游戏当事人1牙齿L的概率很高的时候(如果不选择游戏当事人1牙齿严格的战略M,只有选择L才能获得自己的最大收益),游戏当事人2选择D的期待收益比选择U的期待收益小。事实上,如果在游戏交易方1的第一阶段没有选择R,则游戏交易方2选择“判断”游戏交易方1牙齿L的概率为P,M选择的概率为l-p,

10、则游戏交易方2选择U的期望为:选择d时的期望是p1-p,即p1/2,游戏时游戏者1的第一阶段选择必须是L牙齿,不是M也不是R。因此,游戏当事人1的第一阶段选择L,游戏当事人2在游戏当事人1的第一阶段未选择R的情况下选择U,游戏当事人2为游戏当事人1选择L,M的概率判断P和1-p(p1-p),构成满足序列理性要求的战略组合。满足条件1和条件2实际上排除了依赖于上述不可靠威胁的不合理纳什均衡战略(R,D)。顺序理性的含义要求各游戏方遵守最大利益原则,做出行动选择,由此可见,游戏方战略中排除了不可思议的威胁或承诺。对于“条件3”和“条件4”,“平衡路径之上”的信息集意味着,如果按照平衡策略进行博弈,

11、牙齿信息集将以正概率实现,而“非平衡路径之上”的信息集意味着在按照平衡策略进行博弈时实现的概率为零。图6-2对于游戏第二方的信息集,如果游戏第一方的第一阶段平衡战略选择为R,则牙齿信息集不在平衡路径上。当游戏者1的第一阶段选择不是R牙齿时,牙齿信息集就在均衡路径上。以牙齿游戏为例,分析完美贝叶斯均衡定义中的“条件3”和“条件4”。对于条件3,假设均衡战略组合在上面提到的“游戏1在步骤1中选择L,游戏2在步骤2中选择U”。首先讨论条件3的贝叶斯条件。在牙齿游戏中,两种游戏的选择都是为了获得最大利益的主动选择,没有非自愿选择和内生不确定性,因此不需要有助于“判断”的额外信息。也就是说,在游戏当事人

12、2的情况下,“判断”是在游戏当事人1的前期直接选择的,没有条件概率问题,贝叶斯法则自动满足,只要调查游戏当事人2的判断是否符合每个游戏当事人的平衡策略。也就是说,考察是否符合牙齿“判断”牙齿游戏1的第一阶段选择和游戏2的第二阶段选择。游戏第一方的平衡策略是在第一阶段选择L,因此游戏第二方仅判断“游戏第一方选择牙齿L的概率p=1”与游戏第一方的策略一致,牙齿判断与牙齿阶段最大利益下自己的选择U一致,因此牙齿判断确实是游戏第二方决策和双方战略平衡的稳定基础。上述分析充分显示了不完全信息游戏中“判断”和平衡战略之间的相互依存关系,二者必须一致协调,才能成为真正的平衡。这是条件3的真正意义。然后看“条

13、件4”。对于上述均衡战略组合:“游戏方1在步骤1中选择L,游戏方2在步骤2中选择U。”由于游戏方2的多节点信息集位于平衡路径上,因此平衡路径上没有“判断”牙齿所需的信息集,因此条件4自动满足。为此,对另一个纳什均衡战略组合(R,D)“游戏第一阶段选择R,游戏第二阶段选择D”讨论条件4的含义。在牙齿平衡策略组合中,游戏侧2的2节点信息集是不在平衡路径上的信息集。条件4是游戏方2目前牙齿信息集的“判断”也要满足贝叶斯法则和双方的平衡策略。同样的条件3,贝叶斯法则自动满足,只需讨论游戏方2的“判断”和双方可能在这里的均衡策略的一致性。显然,到达牙齿信息集表明,在游戏当事人1牙齿1阶段,已经偏离了上述

14、均衡战略R,根据前面的分析,游戏当事人2将“判断”必须选择游戏当事人1牙齿L策略。牙齿判断与游戏当事人2的平衡战略D不一致,违背了条件4,符合自己平衡战略D的“判断”是选择游戏当事人1牙齿M的概率1-p=l,即游戏当事人1牙齿M的确实选择,但牙齿结论与游戏当事人1的序列理性相矛盾。对于游戏方1,M是相对于R的下策,相对于L的下策(P14),即使不希望R,也只选择L,不选择M。因此,游戏当事人2的“判断”1-p=1可以与自己的战略D匹配,但与游戏当事人1牙齿可能在这里的平衡战略L不匹配。也就是说,不符合“判断”牙齿条件4。因此,(R,D)战略组合不能成为牙齿游戏具有真正稳定性的完美贝叶斯均衡。为

15、了进一步理解完美的贝叶斯均衡和四个茄子条件,特别是判断的条件3和条件4,我们进一步讨论了两个茄子实例。例如,图1,图6.1所示的二手车交易。轮到买主选择的时候,他必须先判断车状态好坏的概率。也就是说,必须判断p(g|s)和p(b|s)。为此,首先要在销售方的第一阶段确定汽车的使用,即车辆状态良好的概率p(g)和差异概率p(b)。对判断形成的三个茄子进一步说明,牙齿两个茄子的概率构成了本游戏的外生不确定性,一般是通过经验数据获得的。只有P(g)和p(b)的概率不能判断p(g|s)和p(b|s)。如果卖方茶状态好,两种茄子情况不同,则选择不同,因此如果卖方好,并且知道在两种茄子情况下销售的概率p(

16、s|g)和p(s|b)分别有多大,就可以根据贝叶斯法则计算买方需要的判断。上述条件概率,因为卖方是理性的主动选择。根据图6.1和前面的分析,在汽车状态好的时候,卖方选择一定出售,因此p(s|g)=1牙齿成立。相反,如果车状态不好的时候不能卖,就会受到损失,卖方必须考虑买方购买的概率的大小。假设买方选择购买的概率为0.5。卖方在车辆状态不好时选择出售的期望为0.510.5(1)=0,相当于不出售的利益,作为风险中立的游戏方,卖方可以采用(0.5,0.5)的概率分布选择销售或不出售的混合策略。此时买方判断p(s|b)=0.5符合卖方的平衡战略和自己的平衡战略。这是两个茄子概率判断,其中P(s|g)

17、=1和p(s|b)=0.5,假设整体车辆状态良好,存在差异的概率p(g)=p(b)=0.5(上述经验数据)。牙齿信息集是平衡路径上的信息集,因为在卖方的上述策略中,买方选择的信息集可以达到相当大的概率(在上述条件下满足最大概率和正概率条件)。上述分析证明,牙齿判断符合条件3。在牙齿示例中,由于均衡路径中没有多节点信息集,因此自动满足条件4。例2,图6.3是具有3个游戏方的3阶段不完全信息动态游戏。在牙齿游戏中,游戏第3方的信息集是2节点信息集。如果在游戏第一方的第一阶段选择F,则游戏过程将经历多节点信息集。也就是说,假设选择游戏方3牙齿L和R的概率分别为P和1-p,最终可以得到4茄子的结果,各

18、方可以受益,如图所示。(David aser,Northern Exposure(美国电视电视剧),游戏名言)首先看一下游戏第三方的选择,他选择的U的期望是:d的期待是因为。也就是说,您可以在pl/3时选取U,在pl/3时选取D,在P=1/3时选取U、D或混合策略。首先,假设游戏当事人3“判断”p1/3。这时他的合理选择是D。再看一下游戏2的选择。因为L是他对R的严格上策,他没有考虑在游戏3牙齿3阶段如何选择,只选择了L。可以看出,游戏3“判断”p1/3符合游戏2的平衡策略。此外,游戏方2只能选择L,因此完全符合游戏方2均衡策略的游戏方3的“判断”必须为p=1。对于博弈1,他知道从博弈2选择开始的子博弈的均衡必须是(L,D)。也就是说,如果自己选择了F,就能得到3个单位的收益,比较B得到2是好的,所以F是他的均衡策略。均衡战略组合(F,L,D)和相应的博弈第3方的“判断”p=1完全满足完美贝叶斯均衡的条件13,可以肯定的是,由于上述政策组合下没有要在均衡路径上判断的信息集,所以条件4会自动满足,是完美的贝叶斯均衡。(威廉莎士比亚,Northe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论