第九章多阶段博弈

上传人：a*** IP属地：湖北上传时间：2023-01-31 格式：PPTX 页数：29 大小：248.98KB 积分：28 举报 版权申诉

已阅读5页，还剩24页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第九章多阶段博弈本章重点：

多阶段博弈的定义及其特征

多阶段博弈总支付的计算

理解多阶段博弈的纯策略，理解及其运用策略性关联

理解及运用在t-1期前选择非纳什均衡策略的条件多阶段子博弈纳什均衡及其与策略性关联的关系

几个定理及一阶段偏离原则的理解本章主要内容一、预备知识二、支付三、策略和条件性博弈行为四、子博弈完美纳什均衡五、一阶段偏离原则

一、预备知识多阶段博弈的定义：为一个标准阶段博弈的有限序列，在其中每一个阶段博弈都是独立的、完全但不完美信息的博弈（同时行动博弈）。这些阶段博弈由相同的参与人依次进行，而由这一博弈序列得到的总支付用博弈结果序列来评价。每个阶段结束之后，所有参与人都可以观察到该阶段的结果，而且这一信息结构是共同知识二、支付因为多阶段博弈是一个跨期博弈，当涉及跨期问题时我们就需要对未来的收益进行折现。而折现因子的大小则由参与人的耐心决定，折现因子

越高意味着参与人越有耐心，也就更为关心未来的支付。没有耐心的极端情况发生在

的时候，此时说明参与人只关心当前这一阶段博弈的支付。我们来看这样一个多阶段博弈，其中共有T个阶段博弈，每个时期标号为1,2，……，T。令

表示参与人i预期从在时期t的阶段博弈结果中得到的参与人i的支付。我们用

表示参与人i在这个多阶段博弈中进行该博弈序列所得到的总支付，将它定义为：它是参与人预期在这博弈序列中所得支付的折现总和。三、策略和条件性博弈行为1.策略在多阶段博弈中，参与人可以通过在不同阶段的博弈间创造策略性关联的策略（一般是将后面阶段博弈中的行为建立在早前阶段博弈中采取的行动这一条件之上的），以此从中获利。参与人可以使用这种形式的策略：“如果在博弈1,2，……，t-1中如此等等皆发生了，那我们博弈t中就选择行动

。”在多阶段博弈中判定每个参与人的信息集是很重要的，而在任一阶段t上信息集的数目必然与前面的阶段博弈1,2，……，t-1中得来的可能结果的数目相等。例如，第一阶段博弈有四个结果，则在第二个阶段博弈上，每个参与人应当有四个信息集。需要注意的是，在每一个阶段博弈中，参与人并不知道其对手在该阶段的选择是什么，这意味着我们在该阶段的某些信息集上有不止一个结点。2.条件性纯策略在一个有T个阶段博弈构成的多阶段博弈中，参与人i的一个纯策略可以是下面这种形式的条件性纯策略列表：

其中

是出现在时期t之前的特定结果，但是不包括时期t，而

是参与人从第t个阶段博弈中得出的行动。我们来看一个n企业博弈，这些企业在一系列市场上进行价格选择对于这个例子来说，参与人i的一个纯策略就是一个连续函数的列表，每一个都是从连续多个历史的集合到一个单一价格之上。总而言之，多阶段博弈策略的定义可以使用扩展式来表达该博弈的结构。进而言之，和在扩展式博弈中一样，策略被定为每一参与人在每一信息集上（混合或纯）策略的完备列表。在多阶段博弈中，每个参与人的信息集都和之前阶段博弈中的博弈历史相联结。四、子博弈完美均衡1、命题9.1

考虑具有T个阶段的一个多阶段博弈，令

为第t个阶段博弈的一个纳什均衡策略剖面。在这个多阶段博弈中，存在一个子博弈完美均衡，其均衡路径与产生自

的路径是一致的。在多阶段博弈中引入子博弈完美纳什均衡就相当于将阶段之间的任何策略性关联予以排除，这样我们就可以把每一个阶段当做一个独立博弈一样进行求解。2、命题9.2

如果

是由阶段博弈

构成的多阶段博弈的纳什均衡，那么将

限制在时期T上的阶段博弈，必是该阶段博弈的一个纳什均衡。这个命题告诉我们，对于时长为T的任一有限阶段博弈而言，在最后一个阶段博弈

上参与人必然会采取该阶段博弈上的一个纳什均衡。3、命题9.3

如果一个有限的多阶段博弈，其每个阶段博弈都有唯一的一个纳什均衡，那么这一多阶段博弈就有唯一的子博弈完美纳什均衡。4、对于两阶段博弈而言，要使第一阶段上选择非纳什均衡的行为成为可能，需要以下两个条件：在第二个阶段必有至少两个不同的均衡：“大棒”和“胡萝卜”。对于“大棒”和“胡萝卜”之间在支付上的差异来说，折现因子一定会大到对博弈的第一个阶段有着足够充分的影响。为了检查一个策略剖面是否在一个多阶段（或任一有限扩展式）博弈中是子博弈完美纳什均衡，我们所需证明的全部就是在给定

的条件下，每一参与人i不具有一个他打算偏离的单一信息集。举例：囚徒-复仇博弈假设在第一个时期t=1，来自两个相邻社区的参与人进行我们熟悉的囚徒困境博弈，各自采取两个纯行动:沉默(mum)和告密（fink）（大写的表示参与人1的行动，小写的表示参与人2的行动），其支付矩阵为：在这个博弈结束之后，同样是这两个参与人在时期t=2继续玩复仇博弈。每个参与人都可以选择是否加入他的社区帮（gang，即G或g）或者继续保持“孤家寡人（loner，即L或l）”的状态。相应的支付矩阵如下：A、如果我们对这个两阶段博弈进行单独的分析，则可得：在第一阶段博弈——囚徒困境博弈中，存在唯一的一个纳什均衡（F，f）。在第二个阶段博弈——复仇博弈中，存在两个纳什均衡（L，l）和（G，g），还有一个是每个参与人以0.5的概率在这两个纳什均衡之间进行混合的混合策略均衡B、使用折现支付（折现率为）的概念，我们可以写下这个多阶段囚徒-复仇博弈的扩展式，以说明所有可能的结果和折现支付的总和。C、根据命题9.1，将该博弈看成彼此独立的每个博弈的纳什均衡构成一个行为序列，通过考虑这样一些无条件策略，我们可以将阶段之间的任何策略性关联予以排除。由此我们可以得到两个子博弈完美均衡：和D、该博弈在第二阶段具有两个纳什均衡，（L，l）或（G，g），由上文中第4点可知，在折现因子足够大的情况下，该博弈在第一阶段就有可能选择非纳什均衡策略，实现策略性相连。其中（L，l）为“胡萝卜”，而（G，g）为“大棒”。现在让我们考虑参与人在第一个阶段选择（M，m）这样的非纳什均衡选择。为了将合作行为（M，m）变成子博弈完美均衡所采取的均衡路径的一部分，参与人必须得找到一种让自己有动力坚持选择（M，m）的方法，抵制住选择告密的诱惑。参与人可以达成这样的协议：如果在第一个阶段博弈上（M，m）得到执行则在复仇博弈中均采取友好均衡的策略，而如果在第一个阶段博弈上实现的不是（M，m），那么他们可以通过在复仇博弈中采取结伙均衡策略来惩罚彼此。也就是说，每一个参与人都在这个多阶段博弈中采取以下策略：参与人1：在阶段1采取M。如果（M，m）在阶段1得到执行，那么在阶段2采取L，如果在阶段1不是（M，m）得到了执行，那么在阶段2采取G。参与人2：在阶段1采取m。如果（M，m）在阶段1得到执行，那么在阶段2采取l，如果在阶段1不是（M，m）得到了执行，那么在阶段2采取g。

接着我们来检查一下这对策略是否是一个子博弈完美纳什均衡，我们只需要确认参与人不愿意在博弈的第一个阶段偏离沉默（mum）策略即可。换言之，就是看在给定每个参与人都相信其对手做什么，并且这种信念会一直延续到第二个时期的阶段博弈中，选择沉默是不是一个最优反应？我们先来看参与人1的情况：

和

这说明当前仅当或时，M是一个最优反应。五、一阶段偏离原则一阶段偏离原则：在分析某个策略剖面是不是一个子博弈完美均衡上，我们只需要确认是否没有参与人愿意在第一个阶段偏离该策略即可。一阶段不可改善：策略

是一阶段不可改善的（one-stageunimprovable），如果没有信息集、行动

和相应的策略

满足

。显然，最优策略是一阶段不可改善的一个一阶段不可改善的策略必然是最优的总结多阶段博弈由一系列标准式阶段博弈所定义，这些阶段博弈依序列而进行，在其间参与人可以

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第九章多阶段博弈

文档简介

温馨提示

最新文档

评论

第九章多阶段博弈

文档简介

温馨提示

最新文档

评论

相关文档