第四章 序贯决策博.ppt_第1页
第四章 序贯决策博.ppt_第2页
第四章 序贯决策博.ppt_第3页
第四章 序贯决策博.ppt_第4页
第四章 序贯决策博.ppt_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章序贯决策博弈 序贯决策博弈 局中人做出策略选择时知道对手的策略选择 本章讨论动态博弈 所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈 这类博弈也是现实中常见的基本博弈类型 由于动态博弈中博弈方的选择 行为有先后次序 因此在表示方法 利益关系 分析方法和均衡概念等方面 都与静态博弈有很大区别 本章对动态博弈分析的概念和方法 特别是子博弈完美均衡和逆推归纳法作系统介绍 并介绍各种经典的动态博弈模型 主要内容 1 序贯博弈的定义和表示方法2 寻找序贯博弈纳什均衡的 虚线排除确定法 3 寻找序贯博弈纳什均衡的 倒推法 4 先动优势和后动优势5 倒退法 的缺陷 一 序贯博弈的定义和表示方法 在动态博弈中 参与人的行动有先后顺序 而且后行动者在自己行动之前能观察到先行动者的行动 博弈的三要素 策略是在整个博弈中所有选择 行为的 完整计划 什么是计划 如果对手选A 我将采取行动X 如果 我将采取行动 在同时决策博弈中 行动就是策略 但在序贯决策博弈中 行动是指每一个决策点上局中人的决策变量或行动的具体抉择 结果是上述 计划型 策略的策略组合 构成一条路径 支付对应每条路径 而不是对应每步选择 行为 支付向量中 数字的排列按局中人的出场顺序出现 构造博弈战略式表述 在进入障碍博弈中潜在进入者只有一个信息集 两个可选择的行动 其行动空间为 SA 进入 不进入 垄断者有两个信息集 每个信息集上有两个可选择的行动 其行动空间为 进入 容忍 进入 对抗 不进入 容忍 不进入 对抗 扩展式表述博弈 博弈的扩展式表述 参与人集合 参与人的行动顺序 行动空间 信息集 支付函数 外生事件 即自然的选择 的概率分布 在扩展式表述博弈 参与人是相机行事 即 等待 博弈到达自己的信息集 包括一个或多个决策 后再决定如何行动 在战略式表述博弈 参与人似乎是在博弈开始之前 就制定出了一个完全的相机行动计划 即 如果 发生 那么我将现在 博弈的扩展式表述 博弈树 它描述了博弈参与人的一个序贯决策过程 从博弈数的根开始 到末端点结束 拥有初始决策节点的局中人先做出决策 他的决策引出博弈树的棱 而棱的末端将是下一个局中人做出决策 依此类推 举例 假如某个垄断企业一年可以赚10亿元的利润 假定别的企业为了进入该行业需要投资4亿元 当新的企业准备进入时 原有垄断企业有两种决策 1 容忍 但利润要变为5亿元 这时新的企业可以得5亿 减去4亿投资 仍有1亿 2 抵抗 例如降低价格 企业的利润变为2亿元 且新的企业也只得2亿 但减去投资 亏损2亿 谁先动 潜在进入者如何表示该博弈 进入障碍博弈 进入者 进入 不进 垄断者 容忍 抵抗 容忍 抵抗 1 5 2 2 0 10 0 4 垄断者 二 序贯博弈的纳什均衡 例如 性别战 男 足球 芭蕾 女 足球 芭蕾 足球 芭蕾 2 1 0 0 1 1 1 2 策略组合 该博弈有八种可能的策略组合 足球 上 足球 下 足球 足球 上 足球 下 芭蕾 足球 上 芭蕾 下 足球 足球 上 芭蕾 下 芭蕾 芭蕾 上 足球 下 足球 芭蕾 上 足球 下 芭蕾 芭蕾 上 芭蕾 下 足球 芭蕾 上 芭蕾 下 芭蕾 用虚线排除确定法寻找纳什均衡 将以上策略在博弈书中用粗线表示 将存在单独改变激励的策略用虚线表示 方法如下 1 找到第二阶段两根粗线所对应的支付 2 比较这两个支付前面的数字 如果大的数字所对应的那条 树枝 是细的 则男方存在单独偏离的动机 则男方的策略选择 树枝 用虚线表示 3 比较这两个后面付前面的数字 其中对应第一阶段 树枝 是细的那个数字可以不再考虑 因为男方没选这个方向 它是 虚 的 4 因此只在男方选的那个 树丫 上进行比较女方的支付 如果大的数字对应的 树枝 是细的 则女方的策略选择 树枝 用虚线表示 P159 虚线排除确定法的缺陷 该方法可以找到纳什均衡 但找不到博弈的最终结果 均衡是策略的组合 而结果则是行动的组合 因此 我们一般用倒推法 BackwardsInduction 来寻找序贯博弈的结果 三 寻找序贯博弈的结果 倒推法 从动态博弈的最后一个阶段博弈方的行为开始分析 逐步倒推回前一个阶段相应博弈方的行为选择 一直到第一个阶段的分析方法 称为 逆推归纳法 逆推归纳法是动态博弈分析最重要 基本的方法 步骤 从博弈的最后一个阶段开始分析 通过比较最后一个参与决策的局中人的支付 推断他或她的选择 从而将他不会选的策略 枝桠 砍掉 从而回到上一个阶段 比较该阶段参与决策的局中人的支付 将他或她不会选的策略砍掉 依此类推 男 足球 芭蕾 女 足球 芭蕾 足球 芭蕾 2 1 0 0 1 1 1 2 倒推法 1 在上面一个枝桠上 由于最后一阶段是女方做决策 因此比较女方的支付1和0 将0所对应的芭蕾策略砍掉 没砍掉的打上箭头 2 在下面一个枝桠上 由于最后一阶段是女方做决策 因此比较女方的支付 1和2 将 1所对应的足球策略砍掉 没砍掉的打上箭头 3 回到第一个阶段 比较带箭头的两个策略男方的支付 因为此时男方做决策 将支付将较小的策略砍掉 女 练习 开金矿博弈 倒推法的评价 逆推归纳法只能分析明确设定的博弈问题 要求博弈的结构 包括次序 规则和得益情况等都非常清楚 并且各个博弈方了解博弈结构 相互知道对方了解博弈结构 这些可能有脱实际的可能逆推归纳法也不能分析比较复杂的动态博弈在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难对博弈方的理性要求太高 不仅要求所有博弈方都有高度的理性 不允许犯任何错误 而且要求所有博弈方相互了解和信任对方的理性 对理性有相同的理解 或进一步有 理性的共同知识 四 先动优势与后动优势 在序贯情侣博弈中 任何一方率先采取行动可能得到的好处 都比他或她后行动可能得到的好处大 这种局中人先动得益大于后行得益的情况 叫做先动优势 请比较 男 足球 芭蕾 女 足球 芭蕾 足球 芭蕾 2 1 0 0 1 1 1 2 女 先动优势 当男方先动时 男方得2 女方得1 但当女方先动时 男方得1 女方得2 先下手为强 女 足球 芭蕾 男 足球 芭蕾 足球 芭蕾 1 2 1 1 0 0 2 1 男 序贯博弈中的性别战 举例 情侣博弈中往往是先动一方 比如女方已经买好了电影票 再比如男方曾经多次告诉女方 世界杯

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论