




已阅读5页,还剩70页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
完全信息动态博弈 作者 朱怀念管理学院huainian258 管理学院SchoolofManagement 完全信息动态博弈 子博弈精炼纳什均衡 一博弈扩展式表述二子博弈精练纳什均衡三应用举例 在静态博弈中 所有参与人同时行动 或行动虽有先后 但没有人在自己行动之前观测到别人的行动 在动态博弈中 参与人的行动有先后顺序 且后行动者在自己行动之前能观测到先行动者的行动 正如博弈论专家习惯于用战略式表述描述和分析静态博弈一样 他们习惯于用扩展式表述来描述和分析动态博弈 回顾一下博弈的战略式表述包括三个要素 参与人集合每个参与人的战略集合由战略组合决定的每个参与人的支付博弈的扩展式表述所 扩展 的主要是参 与人的战略空间 战略式表述简单地给出了参与人有些什么战略可以选择 而扩展式表述要给出每个战略的动态描述 谁在什么时候行动 每次行动时有些什么具体行动可供选择 以及知道些什么 简单的说 在扩展式表述中 战略对应于参与人的相机行动规则 即在什么情况下选择什么行动 具体来讲 博弈的扩展式表述包括以下要素 1 参与人集合 i 1 n 此外 我们用N代表虚拟参与人 自然 2 参与人的行动顺序 谁在什么时候行动 3 参与人的行动空间 在每次行动时 参与人有些什么选择 4 参与人的信息集 每次行动时 参与人知道些什么 5 参与人的支付函数 在行动结束之后 每个参与人得到些什么 支付是所有行动的函数 6 外生事件 即自然的选择 的概率分布 房地产开发博弈 案例 房地产开发项目 假设有A B两家开发商市场需求 可能大 也可能小投入 1亿 假定市场上有两栋楼出售 需求大时 每栋售价1 4亿 需求小时 售价7千万 如果市场上只有一栋楼需求大时 可卖1 8亿需求小时 可卖1 1亿 博弈战略式表述 不开发 开发商A 开发 不开发 开发 不开发 开发商B 开发商A 开发 不开发 开发 开发商B 需求小的情况 需求大的情况 博弈的战略式表述 一博弈扩展式表述 例 市场进入阻挠博弈设进入成本为10 战略式表示扩展式表示 进入者 进入 不进入 0 300 在位者 市场进入阻挠博弈树 不可置信威胁 合作 40 50 斗争 10 0 A 开发 不开发 N N 大 小 1 2 1 2 大 小 1 2 1 2 B B B B 开发 不开发 开发 不开发 开发 不开发 开发 不开发 4 4 8 0 3 3 1 0 0 8 0 0 0 1 0 0 参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布 房地产开发博弈 一博弈扩展式表述的基本要素 博弈的基本构造结 包括决策结和终点结两类 决策结是参与人行动的始点 终点结是决策人行动的终点 结满足传递性和反对称性x之前的所有结的集合 称为x的前列集P x x之后的所有结的集合称为x的后续集T x 枝 枝是从一个决策结到它的直接后续结的连线 每一个枝代表参与人的一个行动选择 信息集 每个信息集是决策结集合的一个子集 该子集包括所有满足下列条件的决策结 1每个决策结都是同一个参与人的决策结 2该参与人知道博弈进入该集合的某个决策结 但不知道自己究竟处于哪一个决策结 A 开发 不开发 N N 大 小 1 2 1 2 大 小 1 2 1 2 B B B B 开发 不开发 开发 不开发 开发 不开发 开发 不开发 4 4 8 0 3 3 1 0 0 8 0 0 0 1 0 0 B在决策时不确切地知道自然的选择 B的信息集由4个变为2个 房地产开发博弈 A 开发 不开发 N N 大 小 1 2 1 2 大 小 1 2 1 2 B B B B 开发 不开发 开发 不开发 开发 不开发 开发 不开发 4 4 8 0 3 3 1 0 0 8 0 0 0 1 0 0 B知道自然的选择 但不知道A的选择 或A B同时决策 房地产开发博弈 一博弈扩展式表述 只包含一个决策结的信息集称为单结信息集 如果博弈树的所有信息都是单结的 该博弈称为完美信息博弈 自然总是假定是单结的 因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动 不同的博弈树可以代表相同的博弈 但是有一个基本规则 一个参与人在决策之前知道的事情 必须出现在该参与人决策结之前 囚徒困境博弈的扩展式表述 A B 坦白 抵赖 B B A A 坦白 抵赖 坦白 抵赖 8 8 0 10 10 0 1 1 坦白 抵赖 坦白 抵赖 坦白 抵赖 8 8 0 10 10 0 1 1 囚徒困境博弈的扩展式表述 等待 小猪 大猪 按 等待 按 案例2 智猪博弈 智猪博弈的扩展式表述 完全信息动态博弈扩展式表示的练习 练习 参与人1 丈夫 和参与人2 妻子 必须独立决定出门时是否带伞 他们知道下雨和不下雨的可能性为50 支付函数为 如果两人都带伞 则下雨时两人的效用均为 2 不下雨时两人的效用均为 1 如果只有一人带伞 下雨时带伞者的效用为 2 5 不带伞者的效用为 3 不下雨时带伞的效用为 1 不带的效用为0 如两人都不带伞 下雨时每人的效用为 5 不下雨时每人的效用为1 给出下列四种情况下的扩展式及战略式表述 1 两人出门前都不知道是否会下雨 并且两人同时决定是否带伞 即每一方在决策时都不知道对方的决策 2 两人在出门前都不知道是否会下雨 但丈夫先决策 妻子观察到丈夫是否带伞后才决定自己是否带伞 3 丈夫出门前知道是否会下雨 但妻子不知道 但丈夫先决策 妻子后决策 4 同 3 但妻子先决策 丈夫后决策 一博弈扩展式表述二子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题三应用举例 目录导航 泽尔腾 1965 关于完全信息动态博弈模型直接引用纳什均衡的困惑问题 考虑下列问题 一个博弈可能有多个 甚至无穷多个 纳什均衡 究竟哪个更合理 纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的 但是如果参与人的行动有先有后 后行动者的选择空间依赖于前行动者的选择 前行动者在选择时不可能不考虑自己的行动对后行动者的影响 子博弈精练纳什均衡的一个重要改进是将 合理纳什均衡 与 不合理纳什均衡 分开 动态博弈中战略的表述 战略 参与人在给定信息集的情况下选择行动的规则 它规定参与人在什么情况下选择什么行动 是参与人的 相机行动方案 在静态博弈中 战略和行动是相同的 作为一种行动规则 战略必须是完备的 是第i个参与人的特定战略 代表第i个参与人所有可选择的战略集合 如果n个参与人每人选择一个战略 n维向量 称为一个战略组合 表示第i个人选择的战略 动态博弈战略的表述 足球 男的战略 足球 芭蕾 女方 选择足球 还是选择芭蕾 女方战略 足球 芭蕾 芭蕾 足球 芭蕾 芭蕾 足球 足球 1 追随策略 他选择什么 我就选择什么2 对抗策略 他选择什么 我就偏不选什么3 芭蕾策略 不管他选什么 我都选芭蕾 4 足球策略 不管他选什么 我都选足球 战略即 如果他选择什么 我就怎样行动的相机行动方案 在扩展式博弈里 参与人是相机行事 即 等待 博弈到达一个自己的信息集 包含一个或多个决策结后 再采取行动方案 什么是动态博弈的战略 房地产博弈扩展式表述中的战略 若A先行动 B在知道A的行动后行动 则A有一个信息集 两个可选择的行动 战略空间为 开发 不开发 B有两个信息集 四个可选择的行动 B有四个纯战略 开发策略 不论A开发不开发 我开发 追随策略 A开发我开发 A不开发我不开发 对抗策略 A开发我不开发 A不开发我开发 不开发策略不论A开发不开发我不开发 简写为 开发 开 开发 不开发 不开发 开发 不开发 不开发 大括号内的第一个元素对应A选择 开发 时B的选择 第二个元素对应A选择 不开发 时B的选择 什么是参与人的战略 扩展式 开发 开发 开发 不开发 不开发 开发 不开发 不开发 开发 不开发 开发商B 开发商A 战略式 纳什均衡与均衡结果 存在三个纯战略纳什均衡 不开发 开发 开发 开发 不开发 开发 开发 不开发 不开发 两个均衡结果 A开发 B不开发 A不开发 B开发 注意 均衡不同于均衡结果 扩展式 路径在扩展式博弈中 所有n个参与人的一个纯战略组合决定了博弈树上的一个路径 开发 不开发 开发 决定了博弈的路径为A 开发 B 不开发 1 0 不开发 开发 开发 决定了路径 房地产开发博弈的战略组合 路径 完全信息动态博弈 子博弈精练纳什均衡泽尔腾 1965 战略是参与人行动规则的完备描述 它要告诉参与人在每一种可预见的情况下 即每一个决策结 上选择什么行动 即使这种情况实际上没有发生 甚至参与人并不预期它会发生 因此 只有当一个战略规定的行动规则在所有可能的情况下都是最优的 它才是一个合理的可置信的战略 子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则 扩展式 开发 开发 开发 不开发 不开发 开发 不开发 不开发 开发 不开发 开发商B 开发商A 战略式 存在三个纯战略纳什均衡 不开发 开发 开发 开发 不开发 开发 开发 不开发 不开发 哪个纳什均衡更合理 开发 开发 不开发 哪个纳什均衡更合理 不可置信的威胁战略 A 开发 不开发 B B 开发 不开发 开发 3 3 1 0 0 1 0 0 不开发 不开发 开发 开发 开发 不开发 开发 开发 不开发 不开发 x x 对于 不开发 开发 开发 这个组合之所以构成纳什均衡 是因为B威胁不论A开发还是不开发 他都将选择开发 A相信了B的威胁 不开发是最优选择 但是A为什么要相信B的威胁呢 毕竟 如果A真开发 B选择开发得 3 不开发得0 所以B的最优选择是不开发 如果A知道B是理性的 A将选择开发 逼迫B选择不开发 自己得1 B得0 即纳什均衡 不开发 开发 开发 是不可置信的 因为它依赖于B的一个不可置信的威胁 扩展式 开发 开发 开发 不开发 不开发 开发 不开发 不开发 开发 不开发 开发商B 开发商A 战略式 考虑 开发 不开发 不开发 之所以构成Nash均衡 是因为若A选择开发 则B选择不开发是最优选择 若给定B选择不开发 则A选择开发是最优的 尽管结果看起来是合理的 但战略组合包含有不合理的战略 当A选择不开发时 B为什么还要选择不开发 开发 不开发 不开发 战略组合包含有不可置信的战略 不可置信 不合理 的战略 扩展式 开发 开发 开发 不开发 不开发 开发 不开发 不开发 开发 不开发 开发商B 开发商A 战略式 考虑 开发 不开发 开发 首先 它是Nash均衡 其次 它在每条路径都是合理的 开发 不开发 开发 是唯一合理的战略组合 改进的Nash均衡 唯一合理的战略组合 完全信息动态博弈 子博弈精练纳什均衡 举例 泽尔腾 1965 进入者 进入 不进入 0 300 在位者 合作 40 50 斗争 10 0 市场进入阻挠博弈树 特点 剔除博弈中包含的不可置信威胁 承诺行动 破釜沉舟 背水一战给定进入者进入 剔除 进入 斗争 进入 默许 是唯一的子博弈精练纳什均衡 不可置信威胁 支付函数 行动 子博弈精炼纳什均衡 不可置信威胁例子 美国普林斯顿大学古尔教授在1997年的 经济学透视 里发表文章 提出一个例子说明威胁的可信性问题 两兄弟老是为玩具吵架 哥哥老是要抢弟弟的玩具 不耐烦的父亲宣布政策 好好去玩 不要吵我 不管你们谁向我告状 我都把你们两个关起来 关起来比没有玩具更可怕 现在 哥哥又把弟弟的玩具抢去玩了 弟弟没有办法 只好说 快把玩具还我 不然我就要去告诉爸爸 哥哥想 你真要告诉爸爸 我是要倒霉的 可是你不告状不过没有玩具玩 而告了状却要被关禁闭 告状会使你的境遇变得更坏 所以你不会告状 因此哥哥对弟弟的警告置之不理 的确 如果弟弟是会算计自己利益的理性人 在这样的环境下 还是不告状的好 可见 弟弟是理性人 他的告状威胁是不可置信的 子博弈精炼纳什均衡 可置信威胁例子 曹操与袁绍的仓亭之战 曹操召集将领来献破袁之策 程昱献了十面埋伏之计 他让曹操退军河上 诱袁前来追击 到那时 我军无退路 必将死战 可退袁矣 曹操采纳此计 令许褚诱袁军军至河上 曹军无退路 操大呼曰 前无去路 诸军何不死战 众军奋力回头反击 袁军大败 二子博弈精练纳什均衡 一个纳什均衡称为精练纳什均衡 当只当参与人的战略在每个子博弈中都构成纳什均衡 也就是说 组成精练纳什均衡的战略必须在每一个子博弈中都是最优的 一个精练纳什均衡首先必须是一个纳什均衡 但纳什均衡不一定是精练纳什均衡 承诺行动 当事人使自己的威胁战略变得可置信的行动 泽尔腾通过引入子博弈概念来剔除不可置信战略 泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除 从而给出动态博弈的一个合理的预测结果 简单说 子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的 关于子博弈 什么是子博弈 什么是子博弈精练纳什均衡 有没有更好的方法找到子博弈精练纳什均衡 关于子博弈以及子博弈精练纳什均衡 子博弈 是原博弈的一部分 它本身也可以作为一个独立的博弈进行分析 1 子博弈必须从一个单结信息点开始 只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时 该决策结才能作为一个子博弈的初始结 如果信息集包含两个以上的决策结 则这两个都不可以作为子博弈的初始结 2 子博弈的信息集和支付向量都直接继承自原博弈 即当x 和x 在原博弈中属于同一信息集时 他们在子博弈中才属于同一信息集 习惯上 任何博弈的本身称为自身的一个子博弈 A 开发 不开发 X X 大 小 1 2 1 2 大 小 1 2 1 2 B B B B 开发 不开发 开发 不开发 开发 不开发 开发 不开发 4 4 8 0 3 3 1 0 0 8 0 0 0 1 0 0 参与人X的信息集不能开始一个子博弈 否则的话 参与人B的信息将被切割 子博弈例子1 子博弈的例子2 不开发 不开发 房地产开发博弈 找出房地产开发博弈的子博弈 不开发 开发 开发 开发 不开发 开发 开发 不开发 不开发 子博弈精练纳什均衡的定义 子博弈精练纳什均衡 扩展式博弈的战略组合是一个子博弈精练纳什均衡 如果 1 它是原博弈的纳什均衡 2 它在每一个子博弈上给出纳什均衡 A 开发 不开发 B B 开发 不开发 开发 1 0 0 1 0 0 3 3 x x 房地产开发博弈 不开发 开发 开发 开发 不开发 开发 开发 不开发 不开发 在c上构成均衡 在b上不构成 在b和c上都构成在b上构成均衡 在c上不构成 不开发 判断下列均衡结果哪个构成子博弈精练纳什均衡 不开发 b c 按定义判断子博弈精练纳什均衡的例子 关于子博弈精练纳什均衡的有关注意事项 如果一个博弈有几个子博弈 一个特定的纳什均衡决定了原博弈树上唯一的一条路径 这条路径称为 均衡路径 博弈树上的其他路径称为 非均衡路径 纳什均衡只要求均衡战略在均衡路径的决策结上是最优的 而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的 而且在非均衡路径上的决策结上也是最优的 这是纳什均衡与子博弈精练纳什均衡的实质区别 子博弈精练Nash均衡的特点 可见 一个战略组合是子博弈精练Nash均衡 当且仅当它在每一个子博弈上都构成一个Nash均衡 本身是一个Nash均衡 即整个博弈是唯一子博弈时 但反之不成立 要求战略组合不仅在均衡路径上是最优的 而且在非均衡路径的决策结上也是最优的 即此战略组合要告诉博弈人在每一种可预见的情况下 即使此种情况并没有发生或不预期它发生 的最优选择 而Nash均衡仅要求在均衡路径上是最优的 满足 序贯性原理 不论过去发生了什么 博弈人应该在博弈的每一个时点上最优化自己的决策 能排除一般Nash均衡战略中不可信威胁或承诺 因而是稳定的 一博弈扩展式表述二子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡逆向归纳法与子博弈精练纳什均衡的存在问题三应用举例 目录导航 用逆向归纳法求 子博弈精练纳什均衡 1 U D L 3 1 0 0 2 2 2 R 给定博弈达到最后一个决策结 该决策结上行动的参与人有一个最优选择 这个最优选择即该决策结开始的子博弈的纳什均衡倒数第二个决策结 找倒数第二个的最优选择 这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡 如此重复直到初始结 每一步都得到对应于子博弈的一个纳什均衡 并且根据定义 该纳什均衡一定是该子博弈的子博弈的纳什均衡 这个过程的最后一步得到整个博弈的纳什均衡 完全信息动态博弈 子博弈精练纳什均衡泽尔腾 1965 用逆向归纳法求子博弈精练纳什均衡对于有限完美信息博弈 逆向归纳法求解子博弈精练纳什均衡是一个最简便的方法 房地产开发博弈 逆向归纳法求解例子 例用逆向归纳法求解如下三阶段完美信息动态博弈 子博弈精练Nash均衡为 完全信息动态博弈 子博弈精练纳什均衡泽尔腾 1965 1 U D L 1 1 2 2 0 R U 3 0 0 2 1 D 子博弈精练纳什均衡 U U L U 和L分别是参与人1和参与人2在非均衡路径上的选择 逆向归纳法求解子博弈精练纳什均衡的过程 实质上是重复剔除劣战略的过程 从最后一个决策结依次剔除每个子博弈的劣战略 最后生存下来的战略构成精练纳什均衡 在不完美信息中的应用 逆向归纳法的推理思想对不完美信息动态博弈也适用 参与人1选D 相当于 关于逆向归纳法的说明 用逆向归纳法求解的子博弈精练纳什均衡也要求 所有的参与人是理性的 是共同知识 如果博弈由多个阶段组成 则从逆向归纳法得到的均衡可能并不非常令人信服 逆向归纳法的问题与子博弈精练纳什均衡的存在问题 逆向归纳法的局限性 1 只能分析明确设定的扩展式博弈问题 要求博弈的顺序 规则和支付情况都非常清楚 并且各参与人了解博弈结构 相互知道对方了解博弈结构 2 不能分析比较复杂的有限问题 如下象棋博弈 和复杂的无限博弈问题 3 对参与人的理性要求太高 子博弈精练Nash均衡存在的问题 1 多人多阶段博弈可能并不非常令人信服 一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡子博弈精练纳什均衡用逆向归纳法求子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡逆向归纳法与子博弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈四重复博弈和无名氏定理五应用举例 逆向归纳法与子博弈精练纳什均衡的存在问题 逆向归纳法与子博弈精练纳什均衡的存在问题 多个参与人理性要求高 逆向归纳法要求 所有参与人是理性的 是所有参与人的共同知识 因此 在有多个参与人或每个参与人有多次行动机会的情况下 逆向归纳法的结果可能并非如此 如果n很小 逆向归纳法的结果 理性将受到怀疑的多人多阶段动态博弈问题设有n个博弈人 参与人i n或者选择D结束博弈 各得支付1 i 或者选择A进入下一个参与人i 1的决策 如果前n 1个参与人都选A而进入参与人n的决策结 参与人n选择A 则各得支付2 选D则各得支付1 n 此时不管选A或D 博弈都将结束 逆向归纳法与子博弈精练纳什均衡的存在问题 如果n很大 结果又如何呢 1 D 1 1 A 2 D 1 2 1 2 A i D 1 i 1 i A n D 1 n 1 n A 多个参与人的情况 2 2 对于参与人1 获得2单位支付前提是所有n 1个参与人都选A 否则就要考虑是否应该选择D以保证1的支付 如果给定一个参与人选择A的概率是p 1 所有n 1个参与人选择A的概率是pn 1 如果n很大 这个值就很小 另外 即使参与人1确信所有n 1个参与人都选A 他也可能怀疑是否第2个参与人相信所有n 2个参与人都选A 这个链越长 共同知识的要求就越难满足 谢识予的例8参与人 犯错误 选择出现的博弈问题 博弈人理性局限的例子 一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡子博弈精练纳什均衡用逆向归纳法求子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡逆向归纳法与子博弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈四重复博弈和无名氏定理五应用举例 逆向归纳法与子博弈精练纳什均衡的存在问题 蜈蚣博弈 蜈蚣博弈 1 D 1 1 A 2 D 0 3 A 1 D 98 98 A 2 D 98 101 A 蜈蚣博弈 100 100 2 D 97 100 A 1 D 99 99 A 有两个参与人1 2 每个参与人有100个决策结 1 D 2 2 A 2 D 1 4 A 但是 当你没有预料的事情发生时 比如参与人选择了A 你该如何选择 逆向归纳法意味着你应该选择D 因为如果参与人1得到下一个机会的话他将选择D 但是 逆向归纳法也意味着参与人一开始就会选 择D 你的选择应该依赖于你如何预测参与人未来的行为 特别是 你如何修正你对参与人1理性程度的评价 参与人1一开始就选择A可能是因为他自己是非理性的 也可能是因为他认为你是非理性的 如果参与人1不是理性的 或者他不认为你是理性的 那么 你或许应该选择A 然后看看你们究竟可以走多远 现在再设想你处于参与人1的位置 你如何考虑你选择A对参与人2的影响呢 你会不会故意选择A以诱使参与人2认为你是非理性的因而也选择A 期待这个 将错就错 过程一直下去以得到100个单位的支付呢 如果是这样 参与人2为什么要从你选择了A这个事实就推断你是非理性的或你不认为他是理性的呢 逆向归纳法与子博弈精练纳什均衡的存在问题 逆向归纳法理论没有为当某些未预料到的事情出现时参与人如何形成他们的预期提供解释 这使得逆向归纳法的解释受到怀疑 弗德伯格等人将偏离行为解释为是由于有关 支付函数 信息的不确定性造成的 即实际的支付函数不同于原来认为的支付函数 从而参与人在观测到未曾预料到的行为时应该修正有关支付函数的信息 他们认为 任何一个有关博弈行为的理论应该是 完备的 即理论应该对任何可能的行为赋予正的概率 从而当某件事情出现时 参与人对随后的博弈行为的条件预测总是很好定义的 泽尔腾将偏离行为解释为参与人在博弈过程中犯的错误 或者说均衡的 颤抖 即在扩展式博弈隐含了参与人犯错误的可能 如果参与人在每个信息集上犯错误的概率是独立的 因而参与人不会犯系统性的错误 那么 不论过去的行为与逆向归纳法的预测如何不同 参与人应该继续使用逆向归纳法预测从现在开始子博弈的行为 逆向归纳法的形式化表述 假设博弈仅有两个阶段 第一阶段参与人1行动 第二阶段参与人2行动 逆向归纳法从第二阶段开始 其优化问题为 其最优选择依赖于 记为 因为参与人1应能预见到这些 故参与人1在第一阶段的优化问题为 若其最优解 则即为一个子博弈精练Nash均衡 其中A2是参与人2的行动空间 一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四应用举例五重复博弈 有限次重复博弈 无限次重复博弈 应用举例 qi 第i个企业的产量C 代表单位不变成本假定逆需求函数为 第i个企业的利润函数为 斯坦伯格的寡头竞争模型 斯坦伯格的寡头竞争模型 用逆向归纳法求解 首先考虑给定q1的情况下 企业2的最优选择 企业2的问题是 最优化一阶条件意味着 因为企业1预测到企业2将根据S2 q1 来选择q2 企业1在第1阶段的问题是 解一阶条件得 斯坦伯格的寡头竞争模型 均衡结果比较 斯坦伯格的寡头竞争模型 从上述计算可以看出 斯坦伯格的均衡总产量大于库诺特均衡总产量 企业1的斯坦伯格的均衡产量大于库诺特均衡产量 企业2的斯坦伯格的均衡产量小于库诺特均衡产量 同样 企业1在斯坦伯格博弈中的利润大于在库诺特博弈中的利润 企业2的利润却有所下降 这就是所谓的 先动优势 拥有信息优势可能使参与人处于劣势 企业1先行动的承诺价值 企业1之所以获得斯坦伯格利润而不是库诺特利润 是因为它的产品一旦生产出来就变成了一种积淀成本 无法改变 从而使企业2不得不承认它的威胁是可置信的 而假如企业1只是宣布了它将生产 a c 而没有实际生产 企业2是不会相信她的威胁的 重复博弈 一次动态博弈也称为 序贯博弈 重复博弈 指同样结构的博弈重复多次 其中的每次博弈称为 阶段博弈 如囚徒困境 重复博弈的特征 1 阶段博弈之间没有 物质上 的联系 即前一阶段的博弈不改变后一阶段的结构 2 所有参与人都观测到博弈过去的历史 3 参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值 贴现因子 下一期的一单位支付在这一期的价值 注意 在每个阶段 参与人可同时行动 也可不同时行动 重复博弈 因为其他参与人过去的历史总是可以观测到的 因此 一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史 因此 参与人在重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间 这意味着 重复博弈可能带来一些 额外 的均衡结果 影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性 博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡 信息的完备性 当一个参与人的支付函数不为其他参与人知道时 该参与人可能有积极性建立一个 好 的声誉以换取长远利益 有限次重复博弈与无名氏定理 有限次重复博弈 连锁店悖论 进入者 进入 不进入 在位者 默许 斗争 默许 10 0 0 300 0 300 40 50 x x 在位者 斗争 市场进入博弈 有一个垄断者已在市场上 称为 在位者 另一个企业虎视眈眈想进入 称为 进入者 进入者有两个战略可以选择 进入 不进入 在位者也有两个战略 默许 斗争 假定进入之前的垄断利润为300 进入之后寡头利润为100 进入成本为10 连锁店悖论 Selten 进入者 在位者 不进入进入 默许
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉字真有趣课件照片
- 《Photoshop CC平面广告设计》高职全套教学课件
- Unit6 Plan for Yourself单元测试(无答案)人教版(2024)八年级英语上册
- 汉字多的课件
- 新能源汽车充电基础设施建设规
- 高端家电市场品牌竞争策略研究
- 汉子家园言课件
- 水边玩耍的安全教育
- 消防设施功能测试方案
- 建筑工程施工阶段安全监控方案
- 2025年体育教练员执业能力考试试题及答案解析
- 2025年住培结业考试题库及答案
- 2025年重庆辅警管理知识模拟100题及答案
- 创伤急救基本知识培训课件
- DB42∕T 2151-2023 应急物资储备库建设规范
- 2025年二级建造师继续教育题库及参考答案(完整版)
- 胶水储存管理办法
- 精神患者家属健康教育讲座
- 分包招采培训课件
- 公司全员销售管理办法
- 《病理检验技术》课程标准
评论
0/150
提交评论