信息静态博弈_第1页
信息静态博弈_第2页
信息静态博弈_第3页
信息静态博弈_第4页
信息静态博弈_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第四部分第四部分 博弈论博弈论 第六章第六章 完全信息静态博弈完全信息静态博弈 博弈论英文为 Game Theory 其中 Game 的基本意义是游戏 直译应该是 游戏理论 研究理性的决策主体之间发生冲突时的决策问题及均衡问题 也就是研究理性的决策者之 间冲突及合作的理论 博弈论试图把这些错综复杂的关系理性化 抽象化 以便更精确地 刻画事物变化发展的规律 为实际应用提供决策指导 博弈论中的个人决策与传统微观经济学中论及的个人决策相比 都是在给定约束的条 件下追求效用或收益最大化 但其约束条件却不尽相同 通常 传统微观经济学中论及的 个人决策 是在给定价格参数和个人收入的条件下 使效用最大化 个人效用函数只依赖 于自己的选择而不依赖于他人的选择 个人的最优选择只是价格和收入的函数而不是其他 人选择的函数 因此 既不考虑自己的决策对他人决策的影响也不考虑他人决策对自己决 策的作用 与此相对照 在博弈论里 个人效用函数不仅依赖于自己的选择 而且依赖于 他人的选择 个人的最优选择是他人选择的函数 因而该理论注意到了事物之间的普遍联 系 考虑了人们决策的相互影响 并把他人的决策置于内生变量之中进行分析 拓宽了传 统经济学的分析思路 更接近现实世界 最早的博弈论思想产生于中国早在 2500 多年前的春秋时期 孙子兵法 中论述的十 三篇军事思想和治国战略 便闪烁着博弈论的光辉 100 年后孙武的后代孙膑 演绎孙子 兵法 用于田忌赛马 可以说是最早的博弈论案例 然而直到本世纪初 博弈论才被系统 地引入经济学研究中来 1944 年美国科学家冯 诺依曼 Von Neumann 和经济学家摩根斯 特 Morgentern 合作出版了 博弈论与经济行为 The Theory of Games and Economic Behaviour 一书 成为现代经济博弈论研究的开端 此后 在国际学术界博弈论受到了更多 的关注 从 1950 年至 1954 年 美国数学家 经济学家纳什 John Nash 发表了一系列论文 提出了著名的 纳什均衡 的概念 奠定了现代博弈论的基石 严格意义上说 博弈论并不是经济学的一个分支 它是一种方法 应用领域很广 不 仅经济学 政治学 军事 外交 国际关系 公共选择 体育等都和博弈论有关 实际上 博弈论应该看成是数学的一个分支 几十年来 许多经济学者花费了巨大的精力 研究博弈的理论 并探讨了其实际应用 的价值 博弈论在经济学中的应用模型迅速发展 博弈论的许多成果也正是借助于经济学 现象发展起来的 由于这一理论重视不同利益主体之间行为特征和规律的分析 特别是关 于人们行为的相互作用 人们之间的利益冲突与一致 以及竞争与合作等方面的研究 这 种重视理性选择的相互依赖性的深刻思想 不仅构成了现代微观经济学的重要理论 而且 为宏观经济分析提供了重要的微观基础 20 世纪 90 年代以来 博弈论已经成为主流经济 学中一个重要的组成部分 6 1博弈论的基本概念博弈论的基本概念 6 1 1 博弈的基本要素博弈的基本要素 博弈论的基本概念包括参与人 行动 信息 战略 得益 效用 结果和均衡 其中 参与人 战略和得益是描述一个博弈需要的最少的三要素 而行动和信息是其 积木 参 2 与人 行动和结果统称为 博弈规则 the rules of the game 博弈分析的目的是使用博 弈规则预测均衡 我们现在给出这些概念的准确定义 1 1 参与人 参与人 players players 参与人指的是一个博弈中的决策主体 他的目的是通过选择行 动 或战略 以最大化自己的得益 效用 水平 参与人可能是自然人 也可能是团体 如企 业 国家 甚至若干个国家组成的集团 如 OPEC 欧盟 北约等 重要的是每个参与人必 须有可供选择的行动和一个很好定义的偏好函数 那些不作决策的被动主体只当作环境参 数来处理 除 般意义上的参与人之外 为了分析的方便 在博弈论中 自然 nature 作为 虚拟参与人 pseudo player 来处理 这里 自然 是指决定外生的随机变量的 概率分布的机制 与一般参与人不同的是 自然作为虚拟的参与人没有自己的得益和目标 函数 即所有结果对它都是无差异的 一般用代表参与人 ni 1 2 2 行动 行动 actions or moves 行动是参与人在博弈奕的某个时点的决策变量 一般地 我们用表示第个参与人的一个特定行动 表示可供 i 选择的所有行动的集合 i ai ii aA action set 参与人的行动可能是离散的 也可能是连续的 在 n 人博弈中 n 个参与人 的行动的有序集称为 行动组合 action Profile 其中的第 i 个元素是 1n aaa i a 第 i 个参与人的行动 与行动相关的 个重要问题是行动的顺序 the order of play 行动顺 序对于博弈的结果是非常重要的 有关静态博弈与动态博弈的区分就是基于行动的顺序作 出的 我们将看到 同样的参与人 同样的行动集合 行动的顺序不同 每个参与人的最 优选择就不同 博弈的结果就不同 事实上 不同的行动顺序意味着不同的博弈 特别是 在不完全信息博弈中 后行动者可以通过观察先行动者的行动来获得信息 从而使得博弈 分析成为预测人的行为的一个强有力的工具 在博弈论中 一般假定参与人的行动空间和 行动顺序是所有参与人的共同知识 common knowledge 共同知识指的是 所有参与人 知道 所有参与人知道所有参与人知道 等等 是与信息有关的一个重要概念 3 3 信息 信息 information 信息是参与人有关博弈的知识 特别是有关 自然 的选择 其他参与人的特征和行动的知识 信息集 information set 是博弈论中描述参与人信息特征 的一个基本概念 4 4 战略 战略 strategies 战略是参与人在给定信息集的情况下的行动规则 它规定参与 人在什么时候选择什么行动 因为信息集包含了一个参与人有关其他参与人之前行动的知 识 战略告诉该参与人如何对其他参与人的行动作出反应 因而战略是参与人的 相机行 动方案 contingent action plan 一般我们用表示第 i 个参与人的一个特定战略 i s 代表第 i 个参与人的所有可选择的战略的集合 strategy set 如果 n 个参与人每人 ii sS 选择一个战略 n 维向量称为一个战略组合 strategy profile 其中 1ni ssss 是第 i 个参与人选择的战略 i s 5 5 得益 得益 payoff payoff 在博弈论中 得益是指在一个持定的战略组合下参与人得到的确定 效用水平 或者是指参与人得到的期望效用水平 令为第 i 个参与人的得益 效用水平 i u 以为 n 个参与人的得益组合 博弈的一个基本特征是一个参与人的 1ni uuuu 得益不仅取决于自己的战略选择 而且取决于所有其他参与人的战略选择 是所有参与 i u 人的战略选择的函数 1nii sssu 6 6 结果 结果 out come 和均衡和均衡 equilibrium 结果是博弈分析有所感兴趣的所有内容 如 均衡战略组合 均衡行动组合 均衡支付组合等 均衡是所有参与人的最优战略的组合 记为 1 ni ssss 3 其中 是第 i 个参与人在均衡情况下的最优战略 它是 i 的所有可能的战略中使或 i s i u 最大化的战略 用表示由除 i 之外的所有参与人的战略组 i Eu 111niii sssss 成的向量 是第 i 个参与人在均衡情况下的最优战略意味着 佰草集美白面膜 网提供 i s iiiiiiii ssssussu 均衡意味着 对所有的 上式同时成立 ni 2 1 6 1 2 博弈的表述形式博弈的表述形式 在博弈论中 博弈有不同的表述形式 这里介绍扩展形式和战略形式 从理论上讲 这两种表述形式几乎是完全等价的 但从分析的方便性角度看 战略形式表述更适合于静 态博弈 而扩展式表述更适合于讨论动态博弈 扩展形式扩展形式 扩展形式是对博弈的最明确描述 它记录了博弈中所有参与人在不同阶段的行动次序 所有可能的信息状态和选择 在扩展形式博弈中以某一个参与人的行动开始 第一个参与 人行动后 轮到其他参与人行动 允许参与人观察对手的行动 直到博弈结束 结果 参与人各自得到其得益 通常用博弈树来描述扩展形式的博弈 下面举例说明扩展形式博弈及其博弈树表示 设有两人玩掷硬币游戏 每人在桌面上 扔一枚硬币 但彼此隐蔽 结果不被对方发现 参与人 1 先掷 然后参与人 2 掷 最后同 时在桌面上显示朝上的一面 如果两枚硬币朝上的一面相同 则参与人者 l 向参与人 2 支 付 5 元 如果朝上的一面不相同 则参与人 2 向参与人 1 支付 5 元 记 H 正面 T 反面 则用博弈树表示如图 7 1 所示 图中参与人做决策的点 称为 决策结点 简称结点 表示参与人 1 行动 2 表示参与人 2 行动 实心圆点 称为 终结点 表明博弈结束 终结点下 面一行括号中的一对数字分别为参与人 l 和 2 的得益 图图 7 17 1 4 图中用虚线连接的结点 称为 信息集 意味着参与人 2 在行动之前并不确切 地知道自己处在 和 中哪个结点 一个信息集可能包含多个 决策 结点 也可能只包含 一个 决策 结点 博弈树代表了行动的次序 因此常用来描述动态博弈 扩展形式博弈 也可以用来表述同时行动的 静态 博弈 尽管博弈树描述了在时间顺序上一个人在另一个 人之前行动 但结点 和 处于同一信息集的事实意味着 不存在某人先行的信息传给另 一个人 从博弈时间上看 后行与先行是同时进行的 上图中左右两个博弈树是对称的 背 靠背地 每个先行者都没有显示信息给对方 肾阴虚吃什么药 网提供 2 2 战略形式战略形式 战略形式表述又称为标准式表述 所有参与人同时选择各自的战略 所有参与人选择 的战略一起决定每个参与人的支付 这里 参与人 同时选择 的是战略 而不是行动 因 为战略是参与人行动的全面计划 战略式表述也可以用以描述动态博弈 更为准确地讲 战略式表述给出 1 博弈的参与人集合 2 1 ni 2 每个参与人的战略空间 niSi 2 1 3 每个参与人的得益函数 nisssu nii 2 1 1 我们用表示战略式表述博弈 nn uuSSG 11 一个博弈被认为有限博弈 如果第一 参与人的个数是有限的 第二 每个参与人可 选择的战略是有限的 两人有限博弈的战略式表述可以用矩阵表来直观地给出 6 1 3 博弈的分类博弈的分类 博弈涉及的范围十分广泛 从不同的角度有不同的分类 按参与人之间能否达成一个有约束力的协议 博弈可分为合作型博弈与非合作型博弈 如果在一个博弈过程中 参与人之间的协议 承诺或威胁具有完全的约束力 并且能够强 制执行 则称之为合作博弈 否则 如果协议 承诺或威胁不可强制执行 即使参与人之 间在博弈之前可以互相交往 也称之为非合作博弈 按照参与人决策时是否存在时间的先后次序 博弈可分为静态博弈与动态博弈 如果 参与人同时进行决策选择 或者虽非同时但后行动者并不知道先行动者采取了什么具体行 动 则称之为静态博弈 当考虑时间因素 博弈需要多阶段或重复地进行下去时 就成为 动态博弈问题 在动态博弈中 参与人的决策有先后次序 后行动者能够观察到先行动者 所选择的战略 静态分析方法是博弈研究的重要基础 而动态研究则有助于人们从根本上 认识和把握利益主体的行为特征 诱变因素和变化规律 按照参与人事先是否拥有其他参与人决策方面的信息 博弈可分为完全信息博弈与不 完全信息博弈 在完全信息博弈中 每一位参与人都拥有所有其他参与人的特征 战略集 合及得益函数方面准确的信息 在不完全信息博弈中 参与人只能了解上述信息中的一部 分 此外 按照参与人之间冲突的性质 博弈还可以分为对抗性博弈与非对抗性博弈 在对抗 性博弈中 参与人的收益或效用完全对立 一方所得必是另一方所失 一方利益的增加必 然导致另一方利益的减少 在对抗性博弈中 如果参与人各方不管采取何种战略 各自收 益之和恒为零 则称之为零和博弈 如果各自的收益之和为常数 则称之为常和博弈 大 多数的体育比赛从结果看属于对抗性零和博弈 在非对抗性博弈过程中 参与人有各自不 同的收益值 其和不再等于零或常数 参与人之间的收益或效用既冲突又一致 具备了达 5 成某种均衡的可能 经济活动中的很多博弈问题都属于非对抗性博弈 而非对抗性博弈也 就构成了经济博弈论研究的重点 中药丰胸 网提供 6 2纳什均衡纳什均衡 在这里集中讨论完全信息静态博弈 完全信息 指的是每个参与人对所有其他参与人 的特征 包括战略空间 得益函数等 有完全的了解 静态 指的是所有参与人同时选择行 动且只选择一次 应该指出的是 同时行动 在这里是一个信息概念而非日历上的时间概 念 只要每个参与人在选择自己的行动时不知道其他参与人的选择 我们就说他们在同时 行动 日历概念上的同时行动是信息概念上的同时行动的一种特殊情况 尽管从数量上讲 它可能是多数情况 完全信息静态博弈是一种最简单的博弈 在这种博弈中 由于每个人是在不知其他人 行动的情况下选择自己的行动 战略和行动实际上是一回事 博弈分析的目的是预测博弈 的均衡结果 即给定每个参与人都是理性的 每个参与人都知道每个参与人都是理性的 为了回答什么是每个参与人的最优战略 什么是所有参与人的最优战略组合的问题 我们 介绍完全信息静态博弈解的一般概念 纳什均衡 纳什均衡也是所有其他类型博弈解的基 本要求 我们采用从特殊到一般的方法 先讨论纳什均衡的特殊情况 然后讨论纳什均衡 的 般概念 6 2 1 占优战略均衡占优战略均衡 由于每个参与人的效用 得益 是博弈中所有参与人的战略的函数 因此每个参与人的 最优战略选择依赖于所有其他参与人的战略选择 但在一些特殊的博弈中 一个参与人的 最优战略可能并不依赖于其他参与人的战略选择 就是说 不论其他参与人选择什么战略 他的最优战略是唯一的 这样的最优战略被称为 占优战略 也称为 上战均衡 例例 1 1 囚徒困境囚徒困境 囚徒困境 的故事讲的是 两个嫌疑犯作案后被警察擦抓住 被分别关在不同的房间里审讯 警察知道两人有罪 但缺乏足够的证据定罪 除非两人当 个至少有一个人坦白 他们也完全清楚可能的结局 1 如果两人均坦白供认 则双方各判刑 年 2 如果两人均抵赖 则双方各判别 1 年 或许因证据不足 3 如果其中一人坦白 另一人抵赖 则坦白者释放 抵赖者加重判刑 年 用战略型表述的这个博弈模型 是由博弈的三个基本要素组成 洁面乳 排行榜网提供 图图 7 27 2 图 7 2 用得益矩阵表示囚徒困境的问题 在这个博弈中 每个囚徒都有两种可选择的 战略 坦白或抵赖 因为这两个囚徒被隔离开 因此其中任何一人在选择战略时都不可能 6 知道另一人的选择 我们就可以把他们的决策看作是同时的 矩阵中的每个元素都是由两 个数字组成的数组 表示所处行列代表的两参与人所选战略的组合下双方各自的得益 其 中第一个数字为囚徒 A 的得益 第二个数字为囚徒 B 的得益 这是一个两个参与人同有两 种相同的可选战略 战略和得益都对称的博弈 对该博弈中的两个囚徒来讲 各自都有两种可选择的战略 但各自的得益不仅取决于 自己的战略选择 也取决于另一方的对应选择 该博弈共有四种可能的结果 在这些结果 中 每个囚徒可能取得的最好得益是 最坏得益是 10 两人的唯一目标就是要实现自身 的最大得益 那么他们该怎样选择战略 其结果又如何呢 每个参与人选择自己的战略时 虽然无法知道另一方的实际选择 但他却不能忽视另 一方的选择对他自己的利益的影响 因此他应该考虑到另一方有两种可能的选择 并分别考 虑自己相应的最佳战略 对囚徒 1 来说 囚徒 2 有坦白和抵赖两种可能的选择 假设囚徒 2 选择的是抵赖 则对囚徒 1 来说 抵赖得益为 1 坦白得益为 0 他应该选择坦白 注意 囚徒 l 是根据自身利益最大的原则行事 不会去关心一旦自己坦白 另一方抵赖 另一方 会被宣判 10 年徒刑的事实 假设囚徒 2 选择的是坦白 则囚徒抵赖得益为 10 坦白得益 为 8 他还是该选择坦白 因此 在本博弈中 无论囚徒 2 采取何种战略 囚徒 l 的选择 只有一种 即坦白 因为在另一方的两种可能选择的情况下 坦白给自己带来的得益都是 较大的 同样的道理 囚徒 2 的唯一的选择也是坦白 该博弈的最终结果是两囚犯同选择 坦白战略 同获得益 8 即都被判 8 年徒刑 每个囚徒的最优战略是 坦白 一般地 称为参与人 i 的 严格 占优战略 如果对应所有的 是 i 的严格最优选择 i s i s i s 即 溶脂吸脂减肥 网提供 iiiiiiiii sssssussu 相应地 所有的被称为 劣战略 ii ss 定义定义 7 17 1 在博弈的战略式表述中 如果对于所有的 i 是 i 占优战略 那么 战略 i s 组合称为占优战略均衡 1 n sss 在一个博弈里 如果所有参与人都有占优战略存在 则占优战略均衡是可以预测到的 唯一的均衡 因为没有一个理性的参与人会选择劣战略 在囚徒困境博弈里 坦白 坦白 是 占优战略均衡 在这个博弈中 无论是对这两个囚徒总体来讲 还是对他们个人来讲 最 佳的结果都不是同时 坦白 各得到 8 因为都 抵赖 的结果比都 坦白 要好得多 该博弈揭示了个体理性与团体理性的之间的矛盾 以自己的最大利益为目标 结果是无 法实现团体最大利益 同时也揭示了个体理性本身的内在矛盾 从个体利益出发的行为 最终也不一定真正实现个体的最大利益 这个博弈在经济学上有着广泛的应用 在市场竞 争的各个领域和方面 军备竞争 在资源利用和环境保护等 普遍存在类似于囚徒困境的 问题 6 2 2 重复剔除的占优均衡重复剔除的占优均衡 在每个参与人都有占优战略的情况下 占优战略均衡是一个非常合理的预测 但在绝 大多数博弈中 占优战略均衡是不存在的 由于占优战略均衡在博弈分析中的局限性 需 要发展更有效的博弈分析方法 重复剔除的占优均衡就是一种更有效的方法 有些学者也 称之为 严格下战反复消去法 例例 2 智猪博弈智猪博弈 我们以 智猪博弈 为例来阐述这种方法的思想 这个例子讲的 7 是 猪圈里有两头猪 头大猪 一头小猪 猪圈的一头有 个猪食槽 另一头安装着一 个按钮 控制着猪食的供应 按 下按钮 8 个单位的猪食进槽 但需要付出 2 个单位的 成本 若大猪先到 大猪吃到 个单位 小猪只能吃到 1 个单位 若小猪先到 大猪和小 猪各吃到 4 个单位 若两猪同时到 大猪吃到 5 个单位 小猪吃到 3 个单位 这里每头猪 都有两种战略 按或等待 图 7 3 列出对应不同战略组合下的支付矩阵 如第一格表示两 头猪同时按按钮 因而同时走到猪食槽 大猪吃到 5 个单位 小猪吃到 3 个单位 扣除 2 个单位的成本 支付水平分别为 个单位和 个单位 图图 7 3 这个博弈没有占优战略均衡 因为尽管 等待 是小猪的占优战略 大猪没有占优战 略 大猪的最优战略依赖于小猪的战略 如果小猪选择 等待 大猪的最优战略是 按 反之 如果小猪选择 按 大猪的最优战略是 等待 因此 我们不能应用占优战略找 出均衡 怎样寻找这个博弈的均衡解呢 假定小猪是理性的 小猪肯定不会选择 按 的战略 因为不论大猪选择什么战略 对小猪来说 等待 严格优于 按 因而理性的小猪会选 择 等待 再假定大猪知道小猪是理性的 那么 大猪会正确地预测到小猪会选择 等待 给定这个预测 大猪的最优选择只能是 按 这样 按 等侍 是这个博弈唯一的均衡 即大指选择 按 小猪选择 等待 支付水平分别为 2 和 4 个单位 这是一个 多劳不 多得 少劳不少得 的均衡 在找出上述智猪博弈的均衡解时 我们实际上是应用了 重复剔除严格劣战略 的思 路 这个思路是这样的 首先找出某个参与人的劣战略 假定存在 把这个劣战略剔除掉 重新构造一个不包含已剔除战略纳新的博弈 然后再剔除这个新的博弈中的某个参与人的 劣战略 继续这个过程 一直到只剩下一个唯一的战略组合为止 这个唯一剩下的战略组 合就是这个博弈的均衡解 称为 重复剔除的占优均衡 在上例中 我们首先剔除掉小猪 的劣战略 按 在剔除掉这个战略后的新的博弈中 小猪只有一个战略 等待 大猪有 两个战略 但此时 等待 已成为大猪的劣战略 剔除这个战略 剩下的唯一战略组合是 按 等待 重复剔除的占优均衡 概念中的 占优战略 和 劣战略 与前面的定义有 所不同 前面的占优战略是指一个参与人所有可选择的战略中严格优于所有其他战略的那 个战略 在应用重复剔除方法寻找均衡时 一个战略是占优战略或劣战略可能只是相对于 另一个特定的战略而言的 自发热护膝护腕 网提供 定义定义 7 2 令和是参与人 i 可选择的两个战略 即 如果对于任意的 i s i s iii Sss 其他参与人的战略组合 参与人 i 从选择得到的得益严格小于从选择得到的得益 i s i s i s 即 iiiiiii sssussu 称战略严格劣于战略 也称为相对的劣战略 相应地 也称为相对于占优 i s i s i s i s i s i s 战略 弱占优 弱劣 的概念在博弈分析中也经常使用 定义定义 7 3 如果对于所有的 且对于某些 i s iiiiiii sssussu i s 8 严格不等式成立 称弱劣于战略 称为相对于的弱占优战略 i s i s i s i s 定义定义 7 4 重复剔除的占优均衡重复剔除的占优均衡 战略组合称为重复剔除的占优战略均 1 n sss 衡 如果它是重复剔除劣战略后剩下的唯一的战略组合 如果这种唯一的战略组合存在 我们说该博弈是重复剔除占优可解的 6 2 3 纳什均衡纳什均衡 现实生活中相当多的博弈 我们无法使用重复剔除劣战略的办法找出均衡解 那么怎 样找出博弈的均衡解呢 我们需要引入纳什均衡 Nash equilibrium 的概念 纳什均衡是完 全信息静态博弈解的一般概念 构成纳什均衡的战略一定是重复剔除严格劣战略过程中不 能被剔除的战略 设想 n 个参与人在博弈之前达成 个协议 规定每一个参与人选择一个特定的战略 令 代表这个协议 其中 是协议规定的第 i 个参与人的战略 什么情况下 1 n sss i s 会发生参与人有积极性不遵守这个协议 显然 只有当遵守协议带来的效用大于不遵守协 议时的效用时 个人才会遵守这个协议 如果任何参与人都遵守这个协议 我们说这个 协议是可以自动实施的 这个协议就构成了一个纳什均衡 安神补脑食品 网提供 定义定义 7 5 有 n 个参与人的战略表述博弈 战略组合 nn uuSSG 11 是一个纳什均衡 如果对于每一个 i 是给定其他参与人选择 1 n sss i s 时的第 i 个参与人的最优战略 即 1 1 1 niii sssss iSsssussu iiiiiiii 用另 种表述方式 是下述最大化问题的解 i s nisssssus niiiii i S i s 2 1 maxarg 1 1 1 战略组合不是 G 的一个纳什均衡等价于说至少对于某些 i 而言 1ni ssss 不是 i 的最优战略 给定 至少存在一个 使得 i s i s ii Ss iiiiii ssussu 就是说 如果我们预测 是博弈的一个结果 但这个结果不是 个纳 1ni ssss 什均衡 那么 至少存在某些参与人有积极性偏离这个结果 一致 consistent 预测性是纳什均衡的本质属性 是指这样的一种性质 如果所有的参 与人都预测到一个特定的纳什均衡将会出现 那么 没有人有兴趣作不同的选择 偏离这 个预测结果 因此这个预测结果最终会成为博弈的结果 只有纳什均衡具有这样的特征 参与人预测到均衡 参与人预测到其他参与人预测到均衡 等等 对比之下 预测一个非 纳什均衡的战略组合将意味着至少有一个参与人会犯错误 有关对手的选择的预测是错误的 或自己的选择是错误的 尽管这样的错误确实可能出现 纳什均衡与占优战略均衡及重复剔除的占优均衡都是博弈分析的方法 它们之间的相 互关系如何呢 首先 每 个占优战略均衡 重复剔除的占优均衡一定是纳什均衡 但并 非每一个纳什均衡都是占优战略均衡或重复剔除的占优均衡 这是因为 一个参与人的占 优战略是对于所有其他参与人的任何战略组合的最优选择 它也 定是对于所有其他人的 某个特定战略的最优选择 然而 一个战略构成纳什均衡战略的唯一条件是它是参与人对 于其他参与人均衡战略的最优选择 在重复剔除过程中 如果最后剩下来的战略组合是唯 一的 它 定是 个纳什均衡 其次 纳什均衡一定是在重复剔除严格劣战略的过程中没 9 有被剔除的战略组合 并且是唯一的 6 3纳什均衡应用纳什均衡应用 纳什均衡在经济学上的应用非常广泛 这里介绍几个典型的应用例子 6 3 1 古诺古诺 Cournot 寡头竞争模型寡头竞争模型 古诺 1838 早在一个多世纪之前就已提出了纳什所定义的均衡 但只是在特定的双寡头 垄断模型中 古诺的研究现在已理所当然地成为博弈论的经典文献之一 同时也是产业组 织理论的重要里程碑 古诺模型可以说是纳什均衡最早的版本 比纳什的定义早 100 年 这里 我们只讨论古诺模型的一种非常简单的情况 我们将通过模型说明 a 如何把 对一个问题的非正式描述转化为一个博弈的标准式表述 b 如何通过计算解出博弈的纳什 均衡 令分别表述企业 1 企业 2 生产的同质产品的产量 市场中该产品的总供给 21 q q 令表示市场出清时的价格 更为精确一些的表述为 21 qqQ QaQP 设企业 i 生产的总成本0 QPaQQaQPaQ时 时 i q 即企业不存在固定成本 巳生产每单位产品的边际成本为常数 c 这里我们假 iii cqqC 定 根据古诺的假定 两个企业同时进行产量决策 ac 为求出古诺博弈中的纳什均衡 我们首先要将其化为标准式的博弈 前节已讲过 博 弈的标准式表述包含下列要素 1 博弈的参与人 2 每一参与人可以选择的战略 3 针对每 一个可能出现的参与人的战略组合 每一参与人的收益 双头垄断模型中当然只有两个参 与人 即模型中的两个垄断企业 在古诺的模型里 每一企业可以选择的战略是其产品产 量 我们假定产品是连续可分割的 由于产出不可能为负 每一企业的战略空间就可表示 为 即包含所有非负实数 其中一个代表性战略就是企业选择的产量 0 i S i s 也许有的读者提出特别大的产量也是不可能的 因而不应包括在战略空间之中 0 i q 不过 由于 任一企业都不会有的产出 0 QPaQ时 aqi 要全面表述这一博弈并求其均衡解 还需把企业 i 的收益表示为它自己和另一企业所选 择战略的函数 我们假定企业的收益就是其利润额 这样在 般的两个参与人标准式博弈 中 参与人 i 的收益就可写为 jii ssu cqqaqcqqpqqq jiijiijii 在一个标准的两人博弈中 一对战略 如是纳什均衡 则对每个参与者 i 应 2 1 ss i s 该满足 jiijii ssussu 上式对中每一个可选战略都成立 这一条件等价于 对每个参与者 i 必须是 i S i s i s 下面最优化问题的解 10 max jii Ss ssu ii 在古诺的双头垄断模型中 上面的条件可具体表述为 一对产出组合 若为纳 2 1 qq 什均衡 对每一个企业 i 应为下面最大化问题的解 i q max max 0 0 cqqaqqq jii q jii q ii 设 下面将证明该假设成立 企业 i 最优化问题的一阶条件既是必要条件 caqj 又是充分条件 其解为 2 1 cqaq ji 那么 如果产量组合要成为纳什均衡 企业的产量选择必须满足 2 1 qq 解这一对方程组得 3 2 1 ca qq 均衡解的确小于 a c 满足上面的假设 对这一均衡的直观理解非常简单 每一家企业当然都希望成为市场的垄断者 这时它 会选择使自己的利润最大化 结果其产量将为垄断产量并可赚 i q 0 i q 2 caqm 取垄断利润 在市场上有两家企业的情况下 要使两企业总的利润4 0 2 caqi 最大化 两企业的产量之和应等于垄断产量 比如时就可满足这一 21 qq m q2 mi qq 条件 但这种安排存在一个问题 就是每一家企业都有动机偏离它 因为垄断产量较低 相应的市场价格就比较高 在这一价格下每家企业都会倾向于提高产量 而不顾这 m qp 种产量的增加会降低市场出清价格 在古诺的均衡解中 这种情况就不会发生 两企业的 总产量要更高一些 相应地使价格有所降低 我们还可以通过图形求解 方法如下 对每个企业的利润函数求一阶导数并令其等于 零 02 02 12 2 2 21 1 1 cqqa q cqqa q 上述两个一阶条件分别定义了两个反应函数反应函数 reaction function 2 2 1 12 2 2 21 1 cqa qRq cqa qRq 反应函数意味着每个企业的最优战略 产量 是另一个企业产量的函数 两个反应函 2 1 2 1 1 2 2 1 cqaq cqaq 11 数的交点就是纳什均衡 2 1 qq 图图 7 4 6 3 2 贝特兰德贝特兰德 Bertrand 价格竞争模型价格竞争模型 下面我们讨论双头垄断中两个企业相互竞争的另一模型 贝特兰德 1883 提出企业在 竞争时选择的是产品价格 而不像古诺模型中选择产量 首先应该明确贝特兰德模型和古诺模型是两个不同的博弈 这一点十分重要 参与者 的战略空间不同 收益函数不同 并且 随后就可清楚地看到 在两个模型的纳什均衡中 企业行为也不同 一些学者分别用古诺均衡和贝特兰德均衡来概括所有这些不同点 但这 种提法有时可能会导致误解 它只表示古诺和贝特兰德博弈的差别 以及两个博弈中均衡 行为的差别 而不是博弈中使用的均衡概念不同 在两个博弈中 所用的都是上节我们定 义的纳什均衡 我们考虑两种有差异的产品 如果企业 l 和企业 2 分别选择价格和 1 p 2 p 消费者对企业 i 的产品的需求为 其中 b 0 即只限于企业 i 的产品为企业 j 产品的替代品的情况 这个需求函数在现实中并 不存在 因为只要企业 j 的产品价格足够高 无论企业 i 要多高的价格 对其产品的需求 都是正的 后面将会讲到 只有在 b 2 时问题才有意义 和前面讨论过的古诺模型相似 我们假定企业生产没有固定成本 并且边际成本为常数 c c a 两个企业是同时行动 选 择各自的价格 的 要寻找纳什均衡首先需要把对问题的叙述化为博弈的标准式 参与者仍为两个 不过 这里每个企业可以选择的战略是不同的价格 而不再是其产品产量 我们假定小于 0 的价 格是没有意义的 但企业可选择任意非负价格 这样 每个企业的战略空间又可以表示为 所有非负实数 其中企业 i 的一个典型战略是所选择的价格 0 i S i s0 i p 我们仍假定每个企业的收益函数等于其利润额 当企业 i 选择价格 其竞争对手选 i p 择价格时 企业 i 的利润为 j p 那么 价格组合若是纳什均衡 对每个企业 i 应是以下最优化问题的解 2 1 pp i p 12 对企业 i 求此最优化问题的解为 由上可知 如果价格组合为纳什均衡 企业选择的价格应满足 2 1 pp 解这一对方程式得 6 3 3 公共资源问题公共资源问题 社会经济活动的不断发展 我们越来越无法回避公共资源利用 公共设施提供和公共 环境保护等方面的问题 在这些问题中 包含了众多的博弈关系 经济学中的公共资源是 指具有 1 没有哪个个人 企业或组织拥有所有权 2 大家都可以自由利用 这样两 个特征的自然资源和人类生产的供大众免费使用的设施和财物 最晚是从休漠 David Hume 1739 开始 政治经济学家已经认识到如果公民只关注个人福利 公共物品就会出 现短缺 并且公共资源也会过度使用 在此 我们用下面公共草地的放牧问题为例来进行 分析 考虑一个有 n 个村民的村庄 每年夏天 所有村民都在村庄公共的草地上放牧 用 表示村民 i 放养羊的头数 则村庄里羊的总头数 购买和照看一 i g n gggG 21 只羊的成本为 c c 不随一户村民拥有羊的数目多少而变化 当草地上羊的总头数为 G 时 一个村民养一只羊的价值为 v G 由于一只羊要生存 至少需要一定数量的青草 草地可 以放牧羊的总数有一个上限 当时 v G 0 但时 v G 0 max G max GG max GG 还有 由于最初的一些羊有充足的空间放牧 再加一只不会对已经放养的羊产生太大影响 但当草地上放养羊的总数已多到恰好只能维生的时候 即时 再增加一只就会对 max GG 其他已经放养的羊带来极大损害 每只羊的价值会急剧下降 用公式表述为 max GG 如图所示 0 G v0 G v 13 图图 7 5 每只羊的价值随羊的总数的增加而下降每只羊的价值随羊的总数的增加而下降 春天时 村民同时选择计划放养的羊的数量 假定羊是连续可分割的 村民 i 的一个战 略就是他选择的在村庄草地上放养羊的数量 假设战略空间为 它包含了可以给 i g 0 村民带来收益的所有可能选择 其实也足够了 当其他村民养羊数量为 0 max G 时 村民 i 放养只羊获得的收益为 111nii gggg i g 7 1 这样 若为纳什均衡 则对每个村民 i 当其他村民选择 时 必须使 7 1 最大化 这一最优化问题的一阶条件为 1 1 1nii gggg i g 7 2 这里代表 将代入 7 2 并把所有村民的一阶条件 i g 1 1 1nii gggg i g 加总 然后再除以 n 得 7 3 其中 表示 但是 全社会的最优选择 用表示 应满 G 1n gg G 它的一阶条件为 7 4 0 cGvGGv 将社会最优的一阶条件与个人最优的一阶条件相比较可知 公共资源被过度使 GG 用了 因为每个村民只考虑他们自己的利益 并不管其行为对其他村民带来的后果 这就 是公共资源的悲剧 6 4混合战略和混合战略纳什均衡混合战略和混合战略纳什均衡 前面介绍的纳什均衡分析方法可以解决许多博弈问题 但是如果博弈中不存在纳什均 衡或者纳什均衡不唯一 那么纳什均衡分析方法就不能给参与人的选择和博弈结果作明确 的预测 实践的发展 需要理论发展 不断完善 对于不存在纳什均衡和存在多个纳什均 衡的博弈怎样进行分析呢 这里引进两个重要概念 混合战略和混合战略纳什均衡 6 4 1 混合战略混合战略 我们考虑下面的博弈 猜硬币 这个故事讲的是 两个儿童手里各拿着一枚硬币 决 定要显示正面向上还是反面向上 如果两枚硬币同时正面向上或同时反面向上 儿童 B 赢 走儿童 A 的硬币 如果两枚硬币只有一枚正面向上 儿童 A 赢走儿童 B 的硬币 表 1 13 给出这个博弈的支付矩阵 14 图图 7 6 在此博弈中 每一参与者的战略空间都是 正面 背面 为理解矩阵表中所列参与者 各自的收益 设想每一参与人拿有一枚硬币 并必须选择是出正面向上还是背面向上 若 两枚硬币是一致的 即全部正面向上或全部背面向上 则参与人 2 赢走参与人 1 的硬币 如果两枚硬币不一致 一正一反 参与人 1 赢得参与人 2 的硬币 在此博弈中 没有一组 战略能够满足纳什均衡的条件 因为如果参与者的战略是一致的 正面 正面 或 背面 背面 那么参与人 1 就希望能改变战略 如果参与者的战略不一致 正面 背面 或 背面 正面 则参与人 2 将希望能改变战略 猜硬币博弈一个显著的特点是每个参与人都想先猜中对方的战略 这一类博弈在扑克 棒球 战争等其他环境中也经常会出现 在用扑克牌赌博的博弈中 类似的问题是如何决 定使诈的次数 如果大家都知道参与者 i 是从来不使诈的 那么任何时候当 i 下很高的赌 注时他的对手就会认输 但这又使得 i 偶然使诈会有利可图 另一方面 使诈次数过多亦 非上战 在棒球比赛中 假设投球手既可以掷出快球 又可掷出曲线球 那么击球手能够 击中任何一类投球的前提是 他能正确估计到投球手将掷出哪一类球 与之相似 在战争 中 假设进攻方可能在两个攻击点 或两条进攻路线 比如 陆路或水路 中选择其一 防御方可以抵御来自任一方向的攻击 但也只在它正确预测到进攻路线的前提下 在博弈中 一旦每个参与者都竭力猜测其他参与者的战略选择 就不存在纳什均衡 因为这时参与者的最优行为是不确定的 而博弈的结果必然要包含这种不确定性 现在引 入混合战略的概念 我们可以将其解释为一个参与者对其他参与者行为的不确定性 我们 将把纳什均衡的定义扩展到包含混合战略 从而可以分析诸如猜硬币 扑克 棒球及战争 等博弈的解出现的不确定性 规范地表述 参与者 i 的一个混合战略是在其战略空间中 一些或全部 战略的概率 i S 分布 此后我们称中的战略为 i 的纯战略 pure strategies 若分析完全信息同时行动博弈 i S 一个参与者的纯战略就是他可以选择的不同行动 例如在猜硬币博弈中 内含有两个纯 i S 战略 分别为正面和背面 这时参与者 i 的一个混合战略为概率分布 其中 q 为 1 qq 出正面向上的概率 为出背面向上的概率 且 混合战略 0 1 表示参与者q 110 q 的一个纯战略 即只出背面向上 类似地 混合战略 1 0 表示只出正面向上的纯战略 作为混合战略的第二个例子 请看图 7 7 所示博弈 15 图图 7 7 参与者 2 有三个纯战略 左 中 右 这时他的一个混合战略为概率分布 其中 q 表示出左的概率 r 表示出中的概率 表示出右的概率 1 rqrq rq 1 和前面相同 且 这里还应满足及 在此博弈中 混合战10 q10 r10 rq 略 1 3 1 3 l 3 表示参与者出左 中 右的概率相同 而 1 2 l 2 0 表示出左 中的概 率相同 但绝不可能选择出右 和在所有情况下一样 参与者的一个纯战略只是混合战略 的一种特例 例如参与者 2 只出左的纯战略可表示为混合战略 1 0 0 更为一般地 假设参与者 i 有 K 个纯战略 则参与者 i 的一个混 1iKii ssS 合战略是一个概率分布 其中表示对所有 k 1 K 参与者 i 选择战 1iKi pp ik p 略的概率 由于是一个概率 对所有 k 1 K 有且 ik s ik p10 ik p 我们用表示基于的任意一个混合战略 其中包含了选择每一个1 1 iKi pp i p i S 纯战略的概率 正如我们用表示内任意一个纯战略 i s i S 定义定义 7 6 对标准式博弈 假设 那么 nn uuSSG 11 1iKii ssS 参与者 i 的一个混合战略为概率分布 其中对所有 k 1 K 有 1iKii ppp 且 10 ik p1 1 iKi pp 相对于这种以一定概率分布在一些战略中随机选择的混合战略 确定性的具体的战略 我们称为 纯战略 而我们原来意义上的纳什均衡 即任何参与人都不愿单独改变战略的 纯战略组成的战略组合现在可称为 纯战略纳什均衡 当然 纯战略也可以看作混合战略 的特例 纯战略可以看作 选择相应纯战略的概率为 1 选择其余纯战略的概率为 0 的混 合战略 混合战略可以看作纯战略的扩展 引进了混合战略的概念以后 我们可将纳什均衡的概念扩大到包括混合战略的情况 对各参与人的一个战略组合 不管它是纯战略组成的还是混合战略组成的 只要满足各参 与人都不会想要单独偏离它 我们就称之为一个纳什均衡纳什均衡 如果确实是一个严格意义上的 混合战略组合构成的纳什均衡 称为 混合战略纳什均衡混合战略纳什均衡 我们以猜硬币博弈为例 假定 参与者 1 推断参与者 2 会以的概率出正面 以的概率出背面 亦即参与者 1 推断参qq 1 与者 2 将使用混合战略 据此推断 参与者 l 出正面可得的期望收益为 1 qq 出背面的期望收益为 由于当且qqq211 1 1 12 1 1 1 qqq 仅当时 则时 参与者 1 的最优纯战略为出正面 2 1 q1221 qq2 1 q 时为出背面 当时 参与者 1 出哪一面都是无差异的 同样 参与者 2 1 q2 1 q 也必须以 的概率出正面和背面 才能使对方无机可乘 猜硬币博弈中两个参与人都以 1 2 1 2 的概率分布随机选择正面和反面的混合战略组合 就是一个混合战略纳什均 衡 期望得益 这是零和博弈零和博弈 6 4 2 性别战博弈性别战博弈 混合战略和混合战略均衡的概念不仅可用在不存在纯战略纳什均衡的博弈问题中 这种 问题各参与人之间的利益总是有一定的对立性 在没有确定性结果的博弈 即存在多个纯 0 1 2 1 2 1 1 2 1 2 1 1 2 1 2 1 1 2 1 2 1 16 战略纳什均衡的博弈 这种博弈中博弈方之间的利益有相当的一致性 中也可运用 作为混 合战略纳什均衡的例子 我们用经典例子 性别战博弈为例 这个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论