第2章博弈论与决策行为.ppt_第1页
第2章博弈论与决策行为.ppt_第2页
第2章博弈论与决策行为.ppt_第3页
第2章博弈论与决策行为.ppt_第4页
第2章博弈论与决策行为.ppt_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章博弈论与决策行为 你可以使鹦鹉成为训练有素的经济学家 所以它必须要学的两个词 供给 和 需求 现在它们或许可换成 博弈 和 均衡 萨缪尔森引 短谚 学习目标 博弈论概述完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈 2 1博弈论概述 什么是博弈论博弈论的基本概念博弈的分类博弈论的发展简述博弈论与信息经济学的关系 1什么是博弈论 博弈论 gametheory 是研究决策主体的行动发生直接相互作用时候的决策以及这种决策的均衡问题 是专门研究博弈如何出现均衡的规律的学科 换句话说 博弈论研究当某一经济主体的决策既受其他经济主体的影响 而且该经济主体的相应决策又反过来影响到其他经济主体的决策问题和均衡问题 博弈论又称 对策论 在传统经济学中 谈到个人决策 就是在给定一个价格参数和收入的条件下 最大化自己的效用 个人效用函数只依赖于自己的选择 而不依赖于其他人的选择 虽然经济作为一个整体 人与人之间的选择是相互作用的 但对于个体或厂商来说 所有其他人的行为都被包括在一个参数里 即价格 所以 经济主体决策时 面临的似乎是一个非人格化的东西 其选择既不考虑自己的选择对他人的影响 也不考虑他人选择对自己的影响 而在博弈论中 个人的效用函数不仅依赖于自己的选择 而且依赖于他人的选择 个人的最优选择是其他人选择的函数 从这个意义上 博弈论研究的是 在存在相互作用外部经济条件下的个人选择问题 人们之间决策行为相互影响 广泛存在于社会经济活动中 如 国家与国家之间的关系 中央与地方政府之间 还有家庭中的夫妻 他们之间的行为也是一种博弈 博弈论的应用是非常广泛的 2博弈论的基本概念 博弈论的基本概念包括 参与人行动战略得益 支付函数 信息结果均衡 1 参与人 参与人 player 指的是博弈中选择行动以最大化自己效用的决策主体 参与人可以是个人 也可以是团体 如国家 企业等 除一般意义上的参与人外 博弈论中还有 虚拟参与人 pseudoplayer 自然 nature 自然 是指不以博弈参与人意志为转移的外生事件 自然 选择的是外生事件的各种可能现象 并用概率分布来描述 自然 的选择机理 也可以说 自然就是决定外生的随机变量的概率分布的机制 根据参与人的数量将博弈分为 单人博弈 双人博弈 和 多人博弈 单人博弈 实质上是个体决策的最优化问题 参与人拥有的信息越多 即决策的环境了解得越多 决策的准确性就越高 得益也就越好 两人博弈就是两个各自独立决策 但策略和得益具有相互依存关系的博弈方的决策问题 两人博弈是博弈问题中最常见 也是研究的最多的博弈类型 三人以上的 即多人博弈 多人博弈中策略和利益的相互依存关系更为复杂 2 行动 行动 actionormove 是参与人在博弈的某个时点上的决策变量 比如 在房地产开发博弈中 每个参与人只有两种行动可供选择 即开发 不开放 如果在这个博弈中 有A B两人 如果A选择不开发 B选择开发 那么 不开发 开发 就是一个行动组合 事实上 这个例子中共有四个行动组合 其他三个为 开发 开发 开发 不开发 不开发 不开发 3 战略 战略 strategy 是参与人在给定信息集的情况下的行动规则 它规定参与人在什么时候选择什么行动 如 人不犯我 我不犯人 人若犯我 我必犯人 是一种战略 这里 犯 与 不犯 是两种不同的行动 战略规定了什么时候选择 犯 什么时候选择 不犯 各参与人可以选择的全部战略或战略选择的范围称为 战略空间 如果一个博弈中每个参与人的战略数都是有限的 则称为 有限博弈 finitegame 如果一个博弈中至少有某些参与人的战略有无限多个 则称为 无限博弈 infinitegame 4 得益 支付 支付函数 得益 payoff 是指在一个特定的战略组合下 参与人从博弈中所获得的利益 效用水平 是参与人追求的根本目标 也是他们行为和判断的主要依据 博弈的一个基本特征是参与人的得益不仅取决于自己的战略选择 而且取决于所有参与人的战略选择 因此参与人的得益是所有参与人战略组合的函数 5 信息 信息 指的是参与人在博弈过程中能够了解和观察到的知识 特别是有关其他参与人 对手 的特征和行动的知识 得益的信息行为过程的信息 6 结果 结果 outcome 是指博弈分析者所感兴趣的要素的集合 如均衡战略组合 均衡行动组合 均衡得益组合等 在房地产开发博弈中 一个可能的结果是 高需求 开发 开发 即自然 市场 选择了高需求 A和B同时行动都选择了开发 都得到利润 另一个可能的结果 低需求 开发 不开发 即自然选择了低需求 A选择了开发 得到利润 B选择不开发 没得利 7 均衡 均衡是所有参与人的最优战略或行动组合 上述概念中 参与人 行动 结果统称为博弈规则 博弈分析的目的是使博弈规则决定均衡 3博弈的分类 博弈论可以划分为 合作博弈 cooperativegames 与非合作博弈 non cooperativegames 二者的区别主要在于 人们的行为相互作用时 当事人之间能否达成一个具有约束力的协议 如果有 就是合作博弈 反之 就是非合作博弈 合作博弈假设了参与人之间的合作协议是可强制执行的 战略选择问题就不再重要 核心问题是利益分配 强调的是团体理性 效率 公正 公平 非合作博弈中 决策主体根据自己的利益来决定自己的选择 核心问题是战略选择 强调的是 个人理性和个人最优决策 当前 非合作博弈是博弈论研究的主流领域 1 非合作博弈的划分 非合作博弈的分类可以从两个角度 按参与人行动的先后顺序划分按参与人对有关其他参与人的特征 战略空间及支付函数的知识划分可得到四种不同类型的博弈 1 静态博弈和动态博弈 按参与人行动的先后顺序划分 博弈可以划分为 静态博弈和动态博弈 静态博弈 指的是博弈中的参与人同时选择行动 或虽非同时但后行动者不知道先行动者采取了什么具体行动 动态博弈 指的是参与人的行动有先后顺序 且后行动者能够观察到先行动者所选择的行动 行动顺序对于博弈的结果非常重要 2 完全信息博弈和不完全信息博弈 按参与人对有关其他参与人的特征 战略空间及支付函数的知识划分 博弈可以划分为 完全信息博弈和不完全信息博弈完全信息博弈 指的是每一个参与人对所有其他参与人 对手 的特征 战略空间及支付函数有准确的知识 否则 就是不完全信息博弈 2 非合作博弈的四种类型 将上述两个角度的划分结合起来 就得到四种不同类型的博弈 完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈 3 四种类型对应的四个均衡概念 上述四种博弈相对应的四个均衡概念 即 纳什均衡 纳什 1950 1951 子博弈精炼纳什均衡 泽尔腾 1965 贝叶斯纳什均衡 海萨尼 1967 1968 精炼贝叶斯纳什均衡 泽尔腾 1975 博弈的分类及其对应的均衡概念 信息 4博弈论的发展简述 上溯到18世纪初19世纪 古诺 产量决策的古诺模型 1838 伯特兰德 价格决策的伯特兰德模型 1883 经典的博弈模型20世纪博弈论的发展1944年 冯 诺依曼和摩根斯坦 博弈论和经济行为 50年代合作博弈发展到鼎盛时期 纳什 1950 夏普里 1953 提出的 讨价还价模型 同时非合作博弈论创立 塔克 1950 定义 囚徒困境 纳什和塔克的著作基本奠定了现代非合作博弈论的基石 60年代后又出现了一些重要人物 泽尔腾将纳什均衡的概念引入动态分析 提出 精炼纳什均衡 的概念 1965 海萨尼把不完全信息引入博弈论 1967 1968 80年代出现了几个比较有影响的人物 如克瑞普斯 威尔逊等 5博弈论与信息经济学的关系 1 经济学是研究说明什么的 传统认识 稀缺资源的有效配置现代观点 人的行为 假定人是理性的 在给定的约束条件下最大化自己的偏好 需要相互合作 合作中有冲突 发明制度规范人们的行为 如价格制度 市场制度 在现实市场中 市场参加者之间的信息不对称 解决的制度 办法 激励机制 2 博弈论研究的问题是 人们之间的行为 即一个人在决策时 必须考虑对方的反应 博弈论作为研究对策双方行为的一种方法 逐渐应用到经济学领域 3 1994年诺贝尔经济学奖授给纳什 泽尔腾 海萨尼三位博弈论专家的原因 1 博弈论在经济学中的应用最广泛 最成功 博弈论的许多成果也是借助于经济学的例子来发展的 特别是在应用领域 2 经济学家对博弈论的贡献也越来越大 特别是在动态分析和不完全信息引入博弈论之后 3 最带根本性意义的原因是经济学和博弈论的研究模式是一样的 即强调个人理性 也就是在给定的约束条件下追求效用最大化 在这一点上 博弈论和经济学是完全一样的 博弈论真正成为主流经济学的一部分 是20世纪70 80年代的事 70年代中期以后 经济学家开始转向强调个人理性 特别是强调对个人的最基础的效用函数的研究之后 发现信息是一个非常重要的问题 同时 在研究个人行为时 个人决策有一个时间顺序 时序问题在经济学中就变得非常重要 博弈论发展到这一阶段正好为这两方面 信息 时序 提供了有力的研究工具 博弈论的模型70年代中期在经济学中应用 80年代开始 博弈论逐渐主流经济学的一部分 甚至可以说成为微观经济学的基础 博弈论的发展和经济学的发展 可以说是你中有我 我中有你 博弈论成为主流经济学的一部分 正是伴随经济学对信息问题的重视而来的 从某种意义上 信息经济学是博弈论应用的一部分 或者说信息经济学是非对称信息博弈论 二者的关系可概括为 1 二者的研究模式是一样的 都强调个人理性 个人效用最大化 2 博弈论为经济学的信息问题和时序问题 提供了研究工具 3 二者相互促进 共同发展 3 2完全信息静态博弈 完全信息 指的是每个参与人对其他参与人特征 包括战略空间 支付函数等 有完全的了解 静态 指的是所有参与人同时选择行动 且只选择一次 完全信息静态博弈是一种最简单的博弈 完全信息静态博弈理论是非合作博弈理论的基础 博弈分析的两个最基本的问题 一是如何表述一个博弈局势 二是如何求这个博弈局势的解 1博弈的标准式表述和求解 在博弈论里 一个博弈可以用两种不同的方式来表述 一种是战略式表述 又称标准式表述 另一种是扩展式表述 或展开式表述 从理论上讲 二者几乎是完全等价的 但从方便的角度 前者更适合静态博弈 后者更适合动态博弈 博弈标准式表述含有以下三个要素 1 参与人集合 2 每一个参与人可供选择的战略集合 即战略空间 3 针对所有参与人可能选择的战略组合 每一个参与人获得的收益 如果一个博弈被称为有限博弈 第一 参与人的个数是有限的 第二 每个参与人可选择的战略是有限的 两人有限博弈的标准式表述可以用矩阵直接给出 例如 房地产开发博弈 1 高需求 开发商B 开发商A 开发不开发 开发不开发 2 低需求 开发不开发 开发商B 开发不开发 开发商A 2求解 纳什均衡 纳什均衡是完全信息静态博弈的一般概念 也是所有其他类型博弈解的基本要求 纳什均衡 是博弈论学者纳什创建的 纳什对博弈论的贡献有两个方面 合作博弈理论中的讨价还价模型 称纳什讨价还价解 非合作博弈论的纳什均衡 1 什么是纳什均衡 设想在博弈论预测的博弈结果中 给定每个参与人选定各自的战略 为使该预测是正确的 必须使参与人自愿选择理论给他推导出的战略 这样 每个参与人要选择的战略必须是针对其他参与人选择战略的最优反应 所有参与人选择的战略一起构成一个战略组合 这种理论推测结果可以叫做 战略稳定 或 自动实施 的 因为没有参与人愿意独自离弃他所选定的战略 我们把这一状态就称为纳什均衡 纳什均衡是完全信息静态博弈的一般概念 构成纳什均衡的战略一定是重复剔除严格劣战略过程中不能被剔除的战略 而重复剔除劣战略后所留战略却不一定满足纳什均衡战略的条件 因此纳什均衡是一个比重复剔除严格劣战略要强的均衡解的概念 是所有参与人的最优战略组合 2 求解方法 划线法 在两人有限博弈中 求解纳什均衡有一种简单的方法 划线法 以抽象博弈为例 首先考察参与人1的最优战略 对于参与人2的一个给定战略 也就是在双变量矩阵的每一列中 找出参与人1的最优战略 并在相应的收益值下面划一条横线 然后 用类似的方法找出参与人2的最有战略 最后 如果双变量中某个单元的两个收益值下面都被划了横线 那么这个单元对应的战略组合就是一个纳什均衡 见下面的 性别博弈 例子 3 举例说明 博弈论中著名的例子 占优战略均衡 囚徒困境重复剔除的占优战略均衡 智猪博弈纯战略纳什均衡 性别博弈混合战略纳什均衡 斗鸡博弈 1 占优战略均衡 一般来说 每个参与人的最优战略选择依赖于其他参与人的战略选择 但在一些特殊的博弈中 一个参与人的最优战略可能并不依赖于其他参与人的战略选择 就是说 不论其他参与人选择什么战略 他的最优战略是唯一的 这样的最优战略被称为 占优战略 在博弈中 如果所有的参与人都有占优战略存在 因而博弈将在所有参与人的占优战略的基础上达到均衡 这种均衡称为占优战略均衡 例一 囚徒困境 两个嫌疑犯作案后被警察抓住 分别关在不同的房间审讯 警察告诉每一个人 如果都坦白 各判8年 如果其中一人坦白 另一人抵赖 坦白的放出去 抵赖的判10年 如果两人都抵赖 不供认警方不知道的犯罪事实 各判1年 给出囚徒困境的战略式表述 囚徒困境 Prisoner silemma 囚徒B 坦白抵赖 囚徒A 坦白 抵赖 这里 每个囚徒都有两种可供选择的战略 坦白或抵赖 表中每一格的两个数字代表对应战略组合下两个囚徒的支付 效用 其中 第一个数字是A的支付 第二个数字为B的支付 在这个例子里 不论同伙选择什么战略 每个人的最优战略是坦白 在一个博弈里 如果所有参与人都有占优战略存在 占有战略是可以预测到的唯一的均衡 在这个例子里 坦白 坦白 就是占有战略均衡 占优战略均衡只要求每个参与人是理性的 而并不要求每个参与人知道其他参与人是理性的 这是因为 不论其他参与人是否理性 占优战略总是一个理性参与人的最优选择 现实社会经济活动中的许多问题都可以用囚徒困境的分析方法去解释 如 公共产品的供给问题军备竞赛交通拥挤中小学生 减负 与各学校的加班补习市场竞争中的价格战团队工作中的偷懒等 囚徒困境 个人理性与团体理性的冲突 2 重复剔除的占优战略均衡 在绝大多数博弈中 占优战略均衡是不存在的 我们可以通过逐步剔除劣势战略找出博弈的均衡 劣战略 dominatedstrategies 是指在其他博弈参与人战略为既定的条件下 某一参与人可能采取的战略中 对自己相对不利的战略 严格劣战略 strictlydominatedstrategies 则是指 无论其他博弈参与人采取什么战略 某一参与人可能采取的战略中 对自己相对不利的战略 首先找出某一博弈参与人的严格劣战略 将它剔除掉 重新构造一个不包括已剔除战略的新的博弈 然后继续剔除这个新的博弈中某一参与人的严格劣战略 重复进行这一过程 直到剩下唯一的参与人战略组合为止 这个唯一剩下的参与人战略组合 就是这个博弈的均衡解 称为 重复剔除的占优战略均衡 iterateddominanceequilibrium 例二 智猪博弈 猪圈里有两头猪 一头大猪 一头小猪 猪圈的一头有一猪食槽 另一头安装一个按钮 控制着猪食的供应 按一下按钮 将有10个单位的猪食进槽 但按按钮需要支付2个单位的成本 包括时间 若大猪先到 大猪吃到9各单位 小猪只能吃到1个单位 若小猪先到 大猪吃到6个单位 小猪吃到4个单位 若同时到 大猪吃到7个单位 小猪吃到3个单位 下表列出的数字是对应不同战略组合下每头猪所吃到猪食量减去按按钮的成本之后的净收益 智猪博弈 小猪 按等待 按等待 大猪 这个博弈没有占优战略均衡 无论大猪选择什么战略 小猪的占优战略是 等待 而大猪的最有战略依赖于小猪的选择 假定小猪是理性的 再假定大猪知道小猪是理性的 那么大猪会正确地预测到小猪会选择 等待 给定这个预测 大猪的最优选择只能是 按 这样 按 等待 是这个博弈的唯一战略均衡 在智猪博弈的均衡求解中 首先剔除小猪的劣战略 按 在剔除掉小猪的劣战略后的新的博弈中 小猪只有一个战略 等待 大猪仍有两个战略 但此时 等待 已成为大猪的劣战略 再剔除这个劣战略 剩下的唯一战略组合是 按 等待 与占优战略均衡相比 重复剔除劣势战略均衡 不仅要求博弈的所有参与人都是理性的 而且要求每个参与人都了解所有的其他参与人都是理性的 理性是参与人的共同知识 没有一个理性的参与人会选择劣战略 在上例中 如果大猪不能排除小猪按按钮的可能性 按按钮就不一定是大猪的最优选择 智猪博弈 多劳不多得 少劳不少得 现实社会经济活动中也有许多智猪博弈的例子 股票市场上炒股 小户 跟 大户 大企业与小企业的博弈 大企业研发 小企业模仿 公共产品的搭便车现象 例子 市场进入阻挠博弈 产业经济学中的例子 有一个垄断企业已在市场上 称在位者 另一个企业想进入 称进入者 在位者想保持自己的垄断地位 所以就要阻挠进入者进入 这个博弈中 进入者有两种战略可以选择 进入或不进入 在位者也有两种战略选择 默许或斗争 假定进入之前垄断利润为300 进入之后寡头利润合为100 各得50 进入成本10 两种战略组合下的支付矩阵如下 市场进入阻挠博弈 进入者 进入不进入 在位者 默许斗争 这个博弈有两个纳什均衡 进入 默许 和 不进入 斗争 其中 前者是强纳什均衡 后者是弱纳什均衡 给定进入者进入 在位者选择默许时得50单位利润 选择斗争得不到利润 所以 最优战略是默许 同样 给定在位者选择默许 进入者的最优战略就是进入 尽管在进入者选择不进入时 默许和斗争对在位者无差别 但只有当在位者选择斗争时 不进入才是进入者的最优选择 所以 不进入 斗争 是一个纳什均衡 如果想用重复剔除弱劣战略的方法找到博弈的解 斗争是在位者的弱劣战略 因而被剔除 进入 默许 是唯一剩下的没有被剔除的战略组合 是重复剔除的占优均衡 纳什均衡 不进入 斗争 将被剔除掉了 这个例子也说明 纳什均衡允许弱劣战略的存在 注意 如果重复剔除后剩下的战略组合不是唯一 该博弈不是重复剔除占优可解的 相当多的博弈是无法使用重复剔除劣战略的方法找到均衡解的 3 纯战略纳什均衡 性别博弈 这个例子讲的是谈恋爱的男女 有些业余活动要安排 或者看足球 或者看歌剧 男的偏好足球 女的则偏好歌剧 但他们不愿意分开活动 下表给出双方的收益 例三 性别博弈 男 歌剧足球 女 歌剧足球 在这个博弈中 先站在女方的立场上选择最优战略 如果男方选择看歌剧 女方选择看歌剧的得益是2 选择足球的得益是0 因此 女方的最优选择是看歌剧 如果男方选择看足球 女方选择看歌剧的收益是0 选择看足球的收益是1 因此女方的最优选择是看足球 同样 站在男方的立场上 女方选择看歌剧 男方的最优选择是看歌剧 女方选择看足球 男方最优选择看足球 这个博弈存在两个纳什均衡 歌剧 歌剧 足球 足球 就是说 双方或者一起看歌剧 或者一起看足球 事实上 这个博弈还有一个混合战略纳什均衡 就是女方以2 3的概率选择歌剧 1 3的概率选择足球 男方以2 3的概率选择足球 1 3的概率选择歌剧 一般来说 如果一个博弈有两个纯战略纳什均衡 那么 一定存在第三个混合战略纳什均衡 4 混合战略纳什均衡 混合战略指的是 参与人以一定的概率选择某种战略 当博弈重复多次时 应当研究各个战略选择应赋予多大的概率 能获取最大的期望效益 与此相对 把博弈中原来意义上的战略称为 纯战略 其实 也可以看做混合战略 即选择相应纯战略的概率为1 选择其余占率的概率为0 混合战略纳什均衡 如果一个战略组合满足各参与人的战略 相互是其他参与人战略的最佳对策时 就是一个纳什均衡 这时任何博弈方单独改变自己的策略 都不能给自己增加任何利益 例四 斗鸡博弈 设想两个人举着火把从独木桥的两端向中间进行火拼 每一个人都有两种战略 继续前进 或退下阵来 若两人都继续前进 则两败俱伤 若一方前进另一方退下来 前进者取得胜利 退下来的丢了面子 若两人都退下来 两人都丢面子 支付矩阵如下表所示 表 斗鸡博弈 B 进退 进退 A 这个博弈里也有两个纳什均衡 进 退 退 进 如果一方进 另一方的最优战略就是退 两人都进 或两人都退都不是纳什均衡 这个例子也有许多应用 在有些情况下 公共物品的供给也可能变成一个斗鸡博弈 一般来说 可能是一个囚徒困境问题 也可能是智猪博弈问题 警察与游行队伍的问题 夫妻间矛盾问题 记住 毛泽东的军事战略 敌进我退 敌驻我扰 敌疲我打 敌退我追 总之 纳什均衡是参与人将如何博弈的 一致性 预测 如果所有参与人预测到一个特定的纳什均衡将会出现 那么没有人有兴趣作不同的选择 纳什均衡且只有纳什均衡具有这样的特征 参与人预测到均衡 参与人预测到其他参与人预测到均衡等 对比之下 预测一个非纳什均衡战略组合 将意味着至少有一个人会犯错误 有关对手的选择的预测是错误的 或自己的选择是错误的 这样的错误确实可能出现 5 纳什均衡的存在性 纳什均衡的存在性定理 纳什 1950 每一有限博弈至少存在一个纳什均衡 纯战略的或混合战略的 这就是纳什均衡的存在性 纳什均衡的存在性不等于唯一性 许多博弈的纳什均衡都不唯一 从而博弈的选择会遇到困难 纳什均衡是局中人的一致性预测 但当纳什均衡多于一个时 多重纳什均衡就出现了 不同均衡概念之间的关系 占优均衡 重复剔除占优均衡 纯战略纳什均衡 混合战略纳什均衡 囚徒困境 智猪博弈市场进入阻挠博弈 性别博弈 斗鸡博弈 3无限策略博弈分析 在无限策略 连续策略空间的博弈中 我们仍然可以以纳什均衡概念为基础进行博弈分析 古诺模型 关于产量的寡头竞争模型被认为最早提出了纳什所定义的均衡 1838 寡头产量竞争 以两厂商产量竞争为例 古诺模型的主要内容 假设市场上有1 2两家厂商生产同质产品 两厂商同时决定各自的产品 他们在决策之前不知道另一方的产量 两参与人的战略空间是他们可选择的产量 因为产量是连续可分的 因此两参与有无限多种可选策略 得益是两厂商各自的利润 即各自的销售收入减去各自的成本 两参与人的得益取决于他们的产量水平 分析 这是个无限策略博弈 首先将一个博弈转化为基本式 利用纳什均衡的概念求出博弈的均衡解 在双寡头垄断市场上 每一个厂商都从自身利润最大化出发选择最优产量 这一对产量组合就是古诺双寡头模型的纳什均衡 这一结果效率并不高 当市场上两家企业 即双寡头垄断时 要使两家厂商总的利润最大化 两厂商的产量之和应当等于垄断产量 满足这一条件 这时每个厂商的利润 大于上述纳什均衡利润 因此从两厂商的总体看 根据总体利润最大化确定产量效率更高 如果两厂商考虑合作 联合起来决定产量 先定出使总收益最大化的产量 然后各自生产一半 则各自可分享到比只考虑自身利益的独立决策行为更高的利润水平 但是 在独立决策 缺乏协调机制的两个企业之间 上述合作的结果并不容易出现 即使出现了也往往是不稳定的 因为各生产一半实现最大化总利润的产量组合不是纳什均衡 每一家厂商都有动机单独偏离它 因为垄断产量较低 相应的市场价格就比较高 在这一价格下 每个厂商都会倾向于提高产量 而不顾这种产量的增加会降低市场出清价格 因此 关于产量博弈的古诺模型也是一种囚徒困境 完全信息静态博弈下的古诺模型是最简单的 后人在此基础上 又在完全信息动态博弈 不完全信息静态博弈条件下的研究 对这个模型进行不同的变型 4理论应用 豪泰林 Hotelling 价格竞争模型在古诺模型中 产品是同质的 在这个假设下 如果企业的竞争战略是价格而不是产量 伯川德 Bertrand 证明 即使只有两个企业 在均衡情况下 价格等于平均成本 企业的利润为零 与完全竞争市场均衡一样 这便是所谓的 伯川德悖论 BertrandParadox 与古诺模型相比 伯川德模型中的纳什均衡是完全竞争的结果 双方的定价都等于成本 这与古诺模型中双方均获得正利润的结果截然不同 为什么 每个厂商都有削价的动机 如果一方削价 哪怕是些微的 它就可以占领整个市场并提高其利润水平 因此 直至价格被压低至成本水平 假如双方相同 双方都将价格定为在略低于对手的水准 纳什均衡的含义 一旦双方的索价等于成本 任何一方就不存在调整其价格的动机了 解开这一悖论的办法之一是引入产品的差异性 如果不同企业生产的产品是有差异的 替代弹性就不会是无限的 此时消费者对不同企业的产品有着不同的偏好 价格不是他们唯一感兴趣的变量 在存在产品差异的情况下 均衡价格不会等于成本 产品差异有多种形式 经典的豪泰林模型考虑了一种特殊的差异 即空间上的差异 在模型中 产品在物质性能上是相同的 但在空间位置上有差异 因为不同位置上的消费者要支付不同的运输成本 他们关心的是价格与运输成本之和 而不仅仅是价格 如果将位置差异解释为产品差异 则差异越大 均衡价格及利润就越高 原因在于 随着交通成本的上升 不同商店出售产品的替代性下降 每一个商店对附近的消费者的垄断能力加强 商店之间的竞争越来越弱 消费者对价格的敏感度下降 从而每一个商店的最优价格更接近垄断价格 当交通成本为零时 不同商店的产品之间具有完全的替代性 没有任何一个商店可以把价格定得高于成本 我们就得到伯川德均衡结果 价格等于边际成本 利润为零 即p1 p2 cu1 u2 0这个模型对寡头企业存在大于零的长期利润的解释就是 寡头长期利润来自于其产品或服务的差异性 2 3完全信息动态博弈 动态博弈的根本特征是 参与博弈的各方行动不是同时 而是有先后顺序 当一个人行动在前 一个人行动在后时 后者自然会根据前者的选择进行策略的调整 前者也理性地预期到这一点 并考虑这一影响 1动态博弈的扩展式表述 扩展式表述 可用 博弈树 来表示 扩展式所 扩展 的主要是参与人的战略空间 扩展形表述要给出每个参与人战略的动态描述 即参与人在什么时点 什么情况下选择什么样的行动 包括以下要素 1 参与人集合 2 行动顺序 即谁在何时采取行动 3 行动空间 每次轮到某一参与人行动时 可供选择的行动 4 信息集 参与人进行选择时所知道的信息 5 收益函数 每个参与人可能选择的每一种行动所构成的行动组合相对应的各个参与人的收益 6 外生事件的概率分布 即虚拟参与人 自然 的可能选择 它在博弈中的作用只是在相应的地方在若干外生事件中根据一定的概率分布随即选取 而没有自己的利益目标和收益函数 例子 房地产开发 假定该博弈的行动顺序如下 1 开发商A先行动 选择开发或不开发 2 在A决策后 自然选择市场需求的大小 3 开发商B在观测到A的决策和市场需求后 决定开发或不开发 房地产开发博弈树 图 A 开发 不开发 大 小 大 小 开发 不开发 开发 不开发 开发 不开发 开发 不开发 N B N B 4 4 8 0 3 3 1 0 0 8 0 0 0 1 0 0 图1房地产开发博弈 博弈树的构造 博弈树给出了有限博弈的几乎所有信息 构成博弈树的基本元素包括 结 枝和信息集 1 结 博弈中某一参与人 包括自然 采取行动的时点 或博弈结束的时点 其中 参与人采取行动的时点称为决策结 博弈行动路径的终点称为终点结 在这个例子中 决策结包括有A N B的七个圆圈 终点结包括对应8个支付向量的点 2 枝 在博弈树上 枝是从一个决策结到它的直接后续结的连线 每一个枝代表参与人的一个行动选择 3 信息集 博弈树上的所有决策结分隔成不同的信息集 每一个信息集是决策结集合的一个子集 并不是所有的动态博弈都可以用扩展形表示 因为有些动态博弈的阶段很多 或者博弈方在一个阶段有许多可以选择的行为 这时用扩展形表示动态博弈就很困难 或者根本不可能 例如下象棋是动态博弈 但它不仅博弈阶段很多 而且每各阶段的可能选择也很多 因此很难用扩展形表示 无法用扩展形表示的动态博弈 通常可以直接用文字描述和数学函数式表示 动态博弈的策略和结果 动态博弈的结果首先是指各博弈方的策略组合 其次 动态博弈的结果是各博弈方的策略组合形成的一条连接各个阶段的 路径 PATH 最后 实施上述策略组合的最终结果 即路径终端处得益数组中的数字 2子博弈精炼纳什均衡 纳什均衡的缺陷 1 一个博弈可能有多个纳什均衡 究竟哪一个均衡实际会发生 博弈论没有一般结论 2 参与人不考虑自己的选择对他人的影响 这个假设在研究静态博弈时是成立的 但对动态博弈而言 这个假设就有问题了 纳什均衡很难说是动态博弈的一个合理解 3 纳什均衡允许不可置信威胁的存在 纳什均衡的这些缺陷促使博弈论专家 从20世纪60年代开始就不断寻求改进和精炼纳什均衡概念 以得到更为合理的博弈解 1 泽尔腾的贡献 泽尔腾 1965 通过对动态博弈的分析完善了纳什均衡的概念 定义了 子博弈精炼纳什均衡 这是对纳什均衡概念的第一个最重要的改进 其目的是把动态博弈中的 合理纳什均衡 与 不合理纳什均衡 分开 将那些包含不可置信威胁战略的纳什均衡从均衡中剔除 从而给动态博弈结果一个合理预测 简单地说 子博弈精炼纳什均衡要求均衡战略的行为规则在任何时点上都是最优的 2 子博弈 定义 在动态博弈中 从每一个行动选择 即一个决策结 开始至博弈结束 构成一个博弈 称为 子博弈 简单地说 子博弈是原博弈的一部分 它本身可以作为一个独立的博弈进行分析 在博弈论中 任何博弈本身为自身的一个子博弈 3 子博弈精炼纳什均衡 定义 如果一个完全信息动态博弈中 各博弈方的策略构成的一个策略组合 在整个动态博弈及它的所有子博弈中都构成纳什均衡 那么这个策略组合称为该动态博弈的一个 子博弈精炼纳什均衡 子博弈精炼纳什均衡能够排除均衡策略中不可置信的威胁和承诺 因此是真正稳定的 逆推归纳法是求完美信息动态博弈子博弈精炼纳什均衡的基本方法 4 子博弈精炼纳什均衡的求解方法 逆推归纳法 逆推归纳法 从博弈的最后一个阶段开始分析 每一次确定出所分析阶段博弈方的选择和路径 该阶段参与人的最优选择 这个最优选择就是该阶段的子博弈的纳什均衡 然后 倒回到第二个阶段 找出倒数第二个决策者的最优选择 这个选择与第一步的决策者的最优选择构成该阶段的子博弈纳什均衡 如此不断到初始结 每一步得到对应子博弈的一个纳什均衡 并且根据定义 这个纳什均衡一定是该子博弈的所有子博弈的纳什均衡 在这个过程中的最后一步得到的整个博弈的纳什均衡也就是这个博弈的子博弈精炼纳什均衡 用逆推归纳法求解子博弈精炼纳什均衡的过程 实质是重复剔除劣战略过程在扩展式博弈上的扩展 从最后一个决策结开始依次剔除掉每一个子博弈的劣战略 最后剩下来的战略构成精炼纳什均衡 由于逆推归纳法确定的各个博弈方在各阶段的选择 都是建立在后续阶段各个博弈方理性选择的基础上 因此自然排除了包含有不可置信的威胁或承诺的可能性 因此其结论是比较可靠的 确定的各个博弈方的策略组合是有稳定性的 应该强调的是 一个精炼均衡首先必须是一个纳什均衡 但纳什均衡不一定是精炼均衡 只有那些不包含不可置信威胁的纳什均衡才是精炼纳什均衡 所谓 精炼纳什均衡 就是将纳什均衡中包含的不可置信的威胁战略剔除出去要求参与人的决策在任何时点上都是最优的由于剔除了不可置信的威胁战略 在许多情况下 精炼纳什均衡也缩小了纳什均衡的个数 这一点对预测是非常有意义的 不可置信威胁引出信息经济学中一个很重要的概念 承诺行动 commitment 承诺行动是当事人使自己的威胁战略变得可置信的行动 一种威胁在什么时候才是可置信的 只有当事人在不实施这种威胁时 就会遭受更大的损失时 威胁才是可置信的 所以 承诺行为就意味着当事人要为自己的诺言付出成本 尽管这种成本不一定真的发生 承诺行动会给当事人带来很大的好处 因为它会改变均衡结果 2 4不完全信息静态博弈 贝叶斯纳什均衡 完全信息博弈的基本假设是所有的参与人对其他参与人的情况 特征 战略空间 支付函数 有完全的了解 满足这个假设的博弈称为完全信息博弈 完全信息博弈假设是存在的 但是现实中的许多博弈并不满足完全信息的需求 也就是说 这个假设在许多情况下是不成立的 不满足完全信息假设的博弈称为不完全信息博弈 1海萨尼转换 在1967年之前 博弈论专家认为不完全信息博弈是无法分析的 因为当一个参与人不知道他在与谁博弈时 无法选择自己的战略 海萨尼在1967 1968年提出了一个处理不完全信息博弈的方法 引入一个虚拟参与人 自然 自然首先行动选择参与人的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论