版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第6章完整但不完整的信息动态游戏,第1节不完整的信息动态游戏1,概念和示例在动态游戏中,事后行为的游戏方不理解最初行为游戏方的部分或全部行为的情况下,被称为“不完整信息的动态游戏”。在这种游戏中,每个游戏方在游戏结束时都能充分把握每个游戏方的利益,我们称之为“完整但不完整信息的动态游戏”,或者简称为“不完整信息的动态游戏”。不完全信息动力学游戏的基本特征之一是游戏各方之间的信息不对称。以二手车的游戏问题为例。在二手车市场上生活的人往往觉得收支相抵,为什么买新车的时候不觉得这种感觉呢?因为在二手车交易中,买方的信心较少,卖方比买方更了解汽车的真实和价值。二手车交易本来可以抽象为车主(卖方)如何使
2、用汽车、二手车的本质质量好或坏的游戏问题。第二步是由原始所有者决定是否销售(一个、两个或更多销售价格,价格越多,问题就越复杂)。最后由买方决定是否购买,在这里买方不能接受或不购买卖方的价格,不能讨价还价。买方对第一阶段卖方的行为(车辆状态是好是坏)不太了解,即买方有不完整的信息,这是不完整信息的动态游戏。从这个例子中可以看出,在不完全的信息情况下,游戏当事人的最佳策略不仅仅依赖于其他游戏当事人的策略,而是依赖于他对其他游戏当事人行为的判断。判断不同游戏当事人各种行为选择概率的大小,相应地计算自己各种策略的预期收益,其中最大的预期收益对应的策略是自己的最佳对策。这实际上是完全但不完全的信息动态游
3、戏的标准分析方法。第二,不完全信息动态游戏的表现是,以二手车交易为例,使用时给买方3000韩元的价格,使用时有1000韩元的价格,卖方要求2000韩元(意思是买方想买的工资)。还假定,如果使用不良,卖方要花1000韩元伪装成使用好的车。游戏当事人的利益如图6-1所示。开始节点表示第一阶段的卖方(游戏方1)有“良好”和“不良”两个选择,可以选择如何使用汽车。如果卖方选择“不销售”,则没有发生交易。如果他选择“销售”,买方将使用多节点信息集作为第三个阶段,不知道卖方的选择是“优秀-销售”还是“不良-销售”,以表示这种不完整。第三阶段买方不能直接做出目标选择,必须对该多节点信息集中每个节点出现的可能
4、性进行判断。买家在这里只有两个选择:购买和不购买,但可能的结果是:买好车,坏车;好车,烂车。前两个结果对买卖双方都有影响。然后,两个结果只影响卖方。卖方在第二阶段选择出售,买方在第三阶段选择不买时,车辆状态好坏对买方的利益没有影响。对每个批发商来说,汽车状态不好的时候,如果先伪装1000韩元,不出售,就可能白白损失这笔伪装费,因此他的选择(不出售或出售)的前提条件是对买方是否会购买的判断。茶状态好的时候不能卖,不能卖,只能获利,所以总比不卖的时候卖得好。Exit P25,在卖方选择销售的前提下,买方获得利润的能力(车辆状态好)和损失的可能性(车辆状态差),如果选择不买,当然不会损失,但也将失去
5、获得利润的机会。因此,根据买方决定购买的情况,还会判断汽车状态是好是坏的概率。第二节完整的贝叶斯均衡,完整的信息动态博弈中,我们通过子博弈完整,确保均衡策略没有不可靠的威胁或承诺。但是在这里,由于存在多节点信息集,并且包含这些多节点信息集的游戏阶段不构成实际的子游戏,因此不能完全排除子游戏完整性要求或不可靠的威胁或承诺,不能保证平衡策略中所有选择的可信度,并且子游戏精炼纳什均衡的概念失去了意义,因此需要开发新的平衡概念。第一,策略组合及其判断满足以下四个要求时,称为“完美贝叶斯平衡”的完整贝叶斯平衡定义。要求1:游戏各方应“判断”游戏在每个infoset中选择的可能性。对于多节点信息集,“判断
6、”是游戏到达该信息集每个节点的概率分布。对于单节点信息集,可以理解为“以l判断到达该节点的概率”。要求2:给出每个游戏当事人的“判断”,他们的战略应该是“顺序理性”。在每个信息集中,可以选择游戏对手的判定和其他游戏相关人员的“后续战略”,意味着自己的期望值最大。要求3:在平衡路径上的信息集中,“判断”必须反映贝叶斯法则和每个游戏方的平衡策略。要求4:在不平衡路径上的信息集中,判断必须同时满足贝叶斯法则和每个游戏方在这里可能拥有的平衡策略。如果战略体系及其判断同时满足这四个要求,则称为“完美的贝叶斯平衡”。根据上面的定义,子博弈精炼纳什均衡是完整的信息动态博弈中完美的贝叶斯均衡的特例。也就是说,
7、在完整的信息动态博弈中,子博弈精炼纳什均衡是完美的贝叶斯均衡。其次,对平衡要求的初步解释以6.2的完整但不完整的信息动态博弈为例,说明了上述要求的重要性。如果游戏当事人1的第一阶段选择不是r,则游戏当事人2不知道游戏当事人1还选择了l作为m。因此,当轮到游戏当事人2选择时(如果在游戏当事人1的第一阶段没有选择r),他必须对游戏当事人1的选择做出判断,否则不能在自己的u和d中做出合理的选择。Exit P17,1,这个游戏除了原始游戏外没有其他真正的子游戏(子游戏完整性的要求自然满足),子游戏精炼纳什均衡的定义实际上是纳什均衡。请将上图改为矩阵(如下)。这个博弈有两个纯策略纳什均衡(l,u)和(r
8、,d)。(r,d)取决于不可靠的威胁。也就是说,当游戏第二方移动到自己的选择(游戏第一方不选择r)时,唯一选择的是d。Exit P22但是,当游戏方1选择l的概率很高时(基于游戏方1没有选择严格的策略m,只有选择l才能获得自己的最大收益),游戏方2选择d的期望低于选择u的期间。Exit实际上是在游戏当事人1的第一阶段没有选择r的情况下,游戏当事人2选择1的l的概率是p,选择m的概率l-p的情况下,游戏当事人2选择u的期望是:并且,选择d时的期望是p 1-p时,即p 1/2时,游戏方2的u选择比选择d时的期望获得更大的收益。根据请求2,游戏方2没有选择d,只能选择u。此时,游戏当事人1的第一阶段
9、选择必须是l,而不是m或r。因此,在游戏当事人1的第一阶段,l,游戏当事人2在游戏当事人1的第一阶段未选择r的情况下选择u,游戏当事人2为博当事人1选择l,m的概率判断p和1-p(p1-p),构成满足序列合理要求的策略组合。满足要求1和要求2实际上,前面提到的依靠不可靠的威胁排除了不合理的纳什均衡政策(r,d)。序列合理性的含义是,各游戏方必须遵守最大利益原则,做出行动选择,排除游戏方战略中可信度低下的威胁或承诺。对于要求3和4,所谓的“按均衡路径”的增长率集意味着,如果游戏按照均衡策略进行,则该信息集以正概率满足,而“不在均衡路径上”的信息集意味着,当游戏按照均衡策略进行时达到的概率为零。图
10、6-2对于游戏第二方的信息集,如果游戏第一方的第一阶段平衡策略选择为r,则该信息集不在均衡路径上。如果博弈第一阶段的选择不是r,那么这组信息在均衡路径上。To P13,以此博弈为例,分析完整贝叶斯均衡定义的要求3和要求4。在要求3的情况下,平衡策略组合假定上述“游戏方1在步骤1中选择l,游戏方2在步骤2中选择u”。首先讨论需求3的贝叶斯条件。在这个游戏中,两个游戏当事人的选择都是为了最佳利益,针所采取的积极选择,没有非自愿选择或外生不确定性,因此不需要有助于“判断”的额外信息。在游戏第二方的情况下,“判断”直接选择在游戏第一方的前期,因此不存在条件概率问题,贝叶斯方法自动满足。看看游戏当事人2
11、是否符合各方的平衡策略,即判断是否符合游戏当事人1的第一阶段选择和游戏当事人2自己的这一阶段选择。游戏第一方的均衡策略是在第一阶段选择l,所以这个游戏第二方只有判断游戏第一方选择l的概率p=1与游戏第一方的策略一致,在这个阶段,游戏第二方选择u的策略是一致的,所以这个判断是游戏第二方决策和双方策略均衡的稳定基础。上述分析充分显示了在不完整的信息游戏中“判断”和“平衡策略”之间的相互依存关系,这两者是一体的,和谐的,这才是真正的平衡。这就是要求3的真正意义。请再看一下要求4。对于这里所说的平衡策略组合:“游戏方1在第一阶段选择l,游戏方2在第二阶段选择u。”游戏第二方的多节点信息集位于平衡路径上
12、,平衡路径上没有需要“判断”的信息集,因此需要4自动满足。为此,为了另一个纳什均衡策略组合(r,d,“游戏方1的第一阶段为r,游戏方2的第二阶段为d选择”,讨论了要求4的含义。在此平衡策略组合中,游戏方2的两个节点信息集是不在平衡路径中的信息集。要求4游戏当事人2此时该信息集的“判断”也要满足贝叶斯和双方的平衡策略。3,贝叶斯法则仍然自动满足,所以我们只需要讨论博弈第二方的判断和可能在这里的双方均衡策略的一部分。显然,达到这个信息集的原因是游戏当事人1在第一阶段偏离了上述平衡策略r,根据前面的分析,游戏当事人2将“判断”游戏当事人1必须选择l策略(从利润分配中可以看出)。这个判断与游戏者2的均
13、衡策略d不符,与要求4不符。符合自己平衡策略d的“判断”只是游戏当事人1选择m的概率1-p=l。这意味着游戏当事人1确实选择了m,但这个结论与游戏当事人1的序列合理性又有矛盾。对于游戏对手1,m是对r的相对策略或对l的相对策略(P14),因为即使不选择r,也只选择l而不选择m。因此,游戏当事人2的“判断”1-p=1与自己的策略d匹配,但游戏当事人1与可能在这里的平衡策略l不匹配。换言之,“判断”不符合要求4。因此,(r,d)策略组合不能成为具有这个博弈真正稳定性的完美贝叶斯均衡。为了进一步理解完美的贝叶斯平衡及其四个要求,特别是判断的要求3和要求4,我们将进一步讨论两个例子。以实例1,6.1中
14、显示的二手车事务处理为例。如果买方决定由卖方出售,要确定车辆状态好坏的概率,可以用两种条件概率p(g|s)和p(b|s)表示。3.为了进一步解释判断的形成,买方首先要知道卖方第一阶段汽车的使用情况。也就是说,车状态良好的概率p(g)和阶概率p(b),它们构成了这个游戏的外生不确定性。当然,这两种巨率一般是通过经验知识和数据或平均情况获得的。只有P(g)和p(b)的概率还不能确定p(g|s)和p(b|s)。卖方如果知道车辆状态好、坏或不卖,销售概率p(s|g)和p(s|b)分别有多大,就可以根据贝叶斯法则计算买方需要的判断。也就是说,对于车条件、车条件等,确定卖方销售的概率分布p(s|g)和p(
15、s|b)是很重要的。由于卖方自愿选择和理性行动,上述巨率分布取决于卖方自身的平衡策略。通过图6.1和之前的分析,卖方在车辆状态良好时选择(P7),因此设定p(s|g)=1。相反,如果车状态不好,就不能卖,会受到损失,因此如何选择需要更多的斟酌。卖方必须考虑买方选择购买的概率大小。假设买方选择购买的概率为0.5,卖方在汽车状态不好时选择出售的预期收益为0 . 51 0 . 5(-1)=0,这相当于未出售的收益,作为风险中立的游戏对手,卖方可以选择以(0.5,0.5)的概率分配出售或不出售的混合策略。买方认为p(s|b)=0.5同时符合卖方的平衡政策和自己的平衡策略。假定有两种概率判断:P(s|g
16、)=1和p(s|b)=0.5,整体车辆状态良好,不良概率p(g)=p(b)=0.5,买方可以根据Bayes规则轻松计算也就是说,买方“判断”卖方在他选择的两个节点信息集中销售的车的比例。汽车所占比例的“判断”如下:在卖方的战术上,买方选择的信息集至少是相当大的比例(在上述假设下,最大概率,当然,满足正一般比率条件),因此是平衡路径上的信息集。上述分析表明,“判断”符合要求3。本示例中没有均衡路径中没有的多节点信息集,因此必须自动满足4。例2,图6.3是具有3个游戏方的3阶段不完全信息动态游戏。在此游戏中,游戏第3方的infoset是2节点infoset。一般来说,我们假设游戏方3选择游戏方2选
17、择l和r的概率分别是p和1-p。如果游戏方1在第一阶段选择f,则游戏将通过四种可能的结果继续。各方对其优势数组的相同顺序值分别获得收益。用逆向归纳法先回顾游戏第3方的选择,选择u的期望值是d的期望值,所以最好选择p l/3中的d,P=1/3中的u,d或混合策略。首先,假设游戏党3“判断”p 1/3,他的合理选择是d;再看一下游戏第二方的选择,因为l是他对r的严格上策,所以不考虑游戏第三方在第三阶段如何选择,只选择l。游戏当事人3的“判断”p 1/3符合游戏当事人2的战略,但是考虑到游戏当事人2只有l的一个选择,完全符合游戏当事人2的均衡战略的游戏当事人3的“判断”必须为P=1。最后,看看游戏第一方的选择。他知道从游戏对手2的选择开始的子游戏的均衡是(l,d)在所难免的。也就是说,通过自己选择f,可以获得3个单位的收益,比较b,获得2的收益是好的,所以f是他的均衡策略。所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 架线维护工安全宣贯模拟考核试卷含答案
- 兽医化验员岗前实操效果考核试卷含答案
- 钢水罐准备工安全生产能力强化考核试卷含答案
- 木屋架工操作管理考核试卷含答案
- 26年VEGFR表达检测与用药适配
- 26年ECOG评分关联核心要点
- 2025年医保知识考试题库及答案:医保患者权益保障政策解读试题答案
- 八年级地理下册期末测试卷
- 2023年军队文职人员公开招聘笔试《戏剧与影视》押题卷(含答案)
- 2026年测绘无人机操作员高级工模拟试卷及参考答案
- GA/T 1390.8-2025信息安全技术网络安全等级保护基本要求第8部分:IPv6网络安全扩展要求
- 经销商管理系统
- AI赋能园艺景观设计:从技术到实践
- 2026年初中安全急救培训
- 二十届四中全会模拟100题(带答案)
- 融通地产集团社会招聘考试题
- 2026年叉车机械理论考试题库及一套答案
- 2026秋招:江苏苏豪控股集团笔试题及答案
- 弹性力学-第六章-平面问题的基本理论
- 2026年中国化工经济技术发展中心招聘备考题库附答案详解
- 【历 史】八年级历史上册必背140个知识点2025-2026学年统编版八年级历史上册
评论
0/150
提交评论