




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 高级微观经济学高级微观经济学 高级微观经济学的学习目的高级微观经济学的学习目的 第一 了解并掌握经济学的研究方法 提高复杂第一 了解并掌握经济学的研究方法 提高复杂 经济社会现象研究的能力 经济社会现象研究的能力 从现象中提出问题的能力 运用经济学分析逻辑 建立问题研究的框架和 模型 提出决定因素和决定机制的能力 借助理论决定模型 开展经验研究 提出政策 空间的能力 第二 借助经济学学习 进行思维训练 提高自第二 借助经济学学习 进行思维训练 提高自 学能力和创新意识 学能力和创新意识 2 高级微观经济学内容高级微观经济学内容 一 体系框架一 体系框架 二 理性市场分析二 理性市场分析 三 不完全理性市场分析三 不完全理性市场分析 四 一般市场均衡机制四 一般市场均衡机制 五 市场有效性评价五 市场有效性评价 六 行为主体的非独立选择 纳什均衡 六 行为主体的非独立选择 纳什均衡 3 课件地址 课件地址 邮箱 邮箱 dang ai jun dang ai jun 4 第十章第十章战略型博弈与纳什均衡战略型博弈与纳什均衡 在本书前六章中 我们建立了消费者和生产者最消费者和生产者最 优选择的理论分析框架优选择的理论分析框架 并用严密的逻辑体系和数理 化形式表示 第七至第九章的市场分析 均衡分析以 及社会福利分析是对该框架的重要扩展 但这个框架的存在 暗含着一个重要的假设 那暗含着一个重要的假设 那 就是消费者和生产者的最优选择相互之间是独立的 就是消费者和生产者的最优选择相互之间是独立的 不受他人行为决策的直接影响 不受他人行为决策的直接影响 事实上 现实经济活动是行为人在相互合作与冲 突中实现的 保证合作和解决冲突的办法 是需要依 靠规范经济参与者行为的制度 经典经济学中的市场经典经济学中的市场 制度制度就是最重要的制度之一 在市场制度中通过完全竞争条件完全竞争条件的安排 保证了 消费者和生产者的独立决策地位 一方面 完全竞争规定存在足够多的消费者或生 产者 每个人的选择不能对价格产生影响 只能是市市 场价格的接受者场价格的接受者 另一方面则又规定完全竞争市场的信息是对称完全竞争市场的信息是对称 的 的 基于上述两方面 市场价格信号才具备了可以将 所有的选择约束信息集于一身的功能 5 因此 当价格信号通过市场传递给每个消费者或 生产者时 能保证其选择是独立的 最优的 这样就 妥善地处理了独立性决策问题 如果说 完全竞争在工业革命初期还可以作为现 实市场的一种合理化描述 但于今天 其与生产力高 度发达的市场经济现实就差距太大了 现实中商品的多样性商品的多样性和技术的密集发展技术的密集发展以及企业企业 规模扩大规模扩大等方方面面的原因使市场交易双方的人数 常常是有限的 另外 市场交易者之间的信息是难市场交易者之间的信息是难以以 对称的对称的 比如 产品质量的信息生产者就比消费者掌 握的多 信息不对称的交易 因为没有统一的识别标准 使价格信号不能提供相互合作与冲突解决的最有效 制度安排信息 而其它的制度安排也要面对经济参与 人之间行为相互作用的问题 因此 经济现实需要提出并解决人们在相互作因此 经济现实需要提出并解决人们在相互作用用 条件下的选择问题 而博弈论则是一个很好的工具条件下的选择问题 而博弈论则是一个很好的工具 博弈论的思想源远流长 而能作为现代博弈论研 究对象和内容的博弈论思想和实践活动 从世界范围 言 则可追溯到我国春秋战国时代 孙子兵法 一书 中的军事博弈思想军事博弈思想 以及 田忌赛马 这一经典的事 例 6 在经济学文献中 博弈的研究最早是与近代经济 学中 寡头垄断寡头垄断 特别是 双头垄断双头垄断 条件下的产量 和价格决定问题相联系的 其中最为突出的代表有古诺古诺 伯德朗伯德朗和艾奇沃斯艾奇沃斯 等人的研究 他们通过对 寡头垄断 条件下厂商行 为相互影响的分析 揭示了经济活动过程中蕴含的博 弈行为特征 为经济博弈论的建立提供了思想雏形 1944年冯冯 诺依曼诺依曼和奥奥 摩根斯坦摩根斯坦发表 博弈论 和经济行为 首次提出了 大多数经济行为应当按大多数经济行为应当按博博 弈来分析弈来分析 的一般博弈论思想 标志着博弈论由此诞 生了 作为一种方法论 博弈论基于与经济学在强调个 人理性方面的一致性 在经济领域得到广泛而成功的 应用 经济学家在博弈论发展的贡献也越来越大 特 别是随着20世纪70年代中期经济学研究更加关注个人个人 效用效用之后 关注人与人之间的关系和信息不对称对个 人选择与制度安排的影响 应用博弈论工具的经济模 型发展起来 8080年代中期博弈论进入主流经济学 此年代中期博弈论进入主流经济学 此 后逐步成为微观经济学教科书的重要组成部分 后逐步成为微观经济学教科书的重要组成部分 博弈论用于研究决策主体发生相互作用时的决博弈论用于研究决策主体发生相互作用时的决 策 及其均衡问题 策 及其均衡问题 7 从理论上划分 主要是两类 合作博弈合作博弈 当事人达成某种协议 强调团体理性团体理性 非合作博弈非合作博弈 当事人无须达成协议 强调个体理性个体理性 其中非合作博弈为研究的重点非合作博弈为研究的重点 博弈论的发展趋势大致有如下几个方面 博弈论的研究越来越重视微观研究重视微观研究 博弈论的研究越来越重视人的理性行为研究重视人的理性行为研究 特别是个体理性与团体理性的冲突 而解决这一冲突 的办法 就是制度安排 即应该是什么 属于规范 博弈论越来越重视对信息的研究重视对信息的研究 8 10 110 1 非合作博弈的基本概念非合作博弈的基本概念 一 什么是博弈一 什么是博弈 博弈的意思是在下棋的对局中想尽一切办法求得想尽一切办法求得 胜利胜利 博弈是英文 game 的意译 game 直译为游戏 显然博弈一词将游戏中求胜之意充分贴切的反映出 来 如果取胜的办法是在游戏规则允许的范围内充分 利用规则 我们可称这些办法为策略策略 于是参与下棋 对局的人 通过由各自采用的策略相互联系 形成依 存关系 就是说 每个对局者所采取的行动不仅直接 依赖于对方已采取的行动 而且还依赖对方可能采取 的行动 推而广之 在许多人参与的一个活动中 由各自 策略形成的求其最大利益的相互依存关系 即可称为 博弈博弈 二 博弈中的基本要素二 博弈中的基本要素 博 弈 中 的 基 本 要 素 包 括 参 与 人参 与 人 或 游 戏 者 Players 行动行动 actions 信息信息 information 战略战略 strategies 收益或支付收益或支付 payoff 支付函 数 结果结果 outcome 均衡均衡 equilibrium 等 7 个 9 下面分别给予说明 1 1 参与人参与人 参与人是博弈决策主体 他的目的是通过选择行目的是通过选择行 动或战略 使自己支付 效用 水平最大化动或战略 使自己支付 效用 水平最大化 参与人 可以是自然人自然人 也可以是单一组织 团体 或企业单一组织 团体 或企业 在参与人序列中 还有一类称为自然自然 nature 作为虚拟参与人虚拟参与人 pseudo player 来处理 自然是指决定外生的随机变量概率分布的机制 自然是指决定外生的随机变量概率分布的机制 所有结果对自然无意义 但自然可以决定博弈过程所有结果对自然无意义 但自然可以决定博弈过程的的 框架 决定在某种情形下 行为发生的可能性及相框架 决定在某种情形下 行为发生的可能性及相关关 结果 所以 参与人决策后果依赖于自然选择 结果 所以 参与人决策后果依赖于自然选择 在不完全信息博弈中 自然选择参与人的类型 2 行动行动 行动由以下四个方面来界定 1 行动是参与人在博弈的某个时点的决策变量行动是参与人在博弈的某个时点的决策变量 用表示 指第 个参与人 i aii 2 行动集行动集是参与人 所有行动的集合 ii aA i 又称行动空间行动空间 行动可以是连续的 也可以是离散的 如古诺模 型中 行动是选择产量 也可q 0 iiii qqAq 以 是 离 散 的 如 房 地 产 厂 商 的 行 动 开发 不开发开发 不开发 i i i i A A A A 10 3 行动组合行动组合 在个人的博弈中 个参与人的所有行动的有nn 序集 即个人每人的行动形成的 2 2 2 21 1 1 1n n n n a a a aa a a aa a a aa a a a n 一组行动 是博弈中的一个解 4 行动的顺序行动的顺序 它指参与人采取行动的时间安排规则 可以是同 时 或是序列 同时同时是指所有参与人同时决策行动 序列序列指谁先 谁后的安排规则 这是静态博弈与动态博弈的重要区静态博弈与动态博弈的重要区 别别 3 信息信息 信息指参与人关于博弈的知识 特别是关于自然 的选择 其他参与人的特征和行动的知识 信息集是参与人在特定时点上有关不同变量取值 的知识 与此相关有如下三个概念 1 完美信息完美信息 perfect information 指参与人对其他参与人和自然的行动选择有准确准确 的了解 即每个信息集只包括一个值 2 完全信息完全信息 complete information 指自然不首先行动 或自然的初始行动被参与人 准确地观察到 没有事前的不确定性 比如 在房地产开发博弈中 11 如果至少有一个参与人不知道市场需求的大小 信息是不完全的也是不完美的 如果两个参与人都知道市场需求是大还是小 信 息是完全的 但如果 A 不知道 B 选择了什么行动 那 么 A 的信息是不完美的 注意 注意 在博弈论中 完美信息与完全信息之间既有联系 又与区别 不完全信息不完美信息 完全信息 对所有局中人的策略或支付函数完全了 解 完美信息 对所有局中人已有行动的完全把握 3 共同知识共同知识 common knowledge 指 所有参与人知道 所有参与人知道所有参与 人知道 所有参与人知道所有参与人知道所有参与人 知道 的知识 4 战略战略 战略是指在给定信息集的条件下 参与人的行动 规则 即如果出现什么情况 对手采取什么行动 那 么我该采取什么行动 12 战略集战略集或战略空间战略空间代表参与人 的所有 ii sS i 可选择的战略的集合 战略组合战略组合指个参与人的某 21n ssss n 一战略的组合 需要说明战略与行动的区别战略与行动的区别 严格意义上 战略是行动的规则 而不是行动本 身 但在静态博弈中 战略和行动相同 因为战略选 择依据于参与人所获得的信息 但静态博弈中 所有 参与人同时行动 没有任何人获取他人的行动信息 从而战略选择蜕变成简单的行动选择 5 收益或支付收益或支付 收益或支付指一个特定的战略组合下参与人行动 的效用 可以是确定效用或期望效用 设为 第个 人 的 收 益 水 平 i ui 为个参与人的收益组合 一个 21n uuuu n 参与人的收益不仅取决于自己的战略 而且取决于所 有其它参与人的战略选择 所以是所有参与人战略 i u 选择的函数 即 21nii sssuu 6 结果结果 结果指博弈分析中所感兴趣的所有东西 如 战略组合 21n ssss 13 的行动组合 21n aaaa 的收益组合等 21n uuuu 7 均衡均衡 均 衡 是 指 所 有 参 与 人 的 最 优 战 略 组 合 为第 个参与人的最优战略 2 1 n ssss i si 是使或最大化的战略 由均衡产生的结果称为 i u i Eu 均衡结果 为了把特定的参与人与其他参与人分开 可以用 表示除了参与人 之 niii sssss 111 i 外的其他所有参与人的战略的组合向量 那么 说 是给定情况下第 个参与人的最优战略 意味着 i s i s i 对于 有 均衡均衡意 ii ss iiiiii ssussu 味着对于所有的这个式子同时成立 ni 2 1 博弈均衡与经济学中均衡的不同博弈均衡与经济学中均衡的不同 经济学中的均衡是指最优行为的结果 而博弈均 衡是参与人最优战略的组合 下面介绍两个经典例子 以说明上述概念 并练下面介绍两个经典例子 以说明上述概念 并练 习使用博弈要素对博弈问题进行分析 习使用博弈要素对博弈问题进行分析 14 例子 1 囚徒困境囚徒困境 这是教科书中都要列举的经典例子 主要是说有两个共同犯罪的人在被关押后所面临 的如何决策的问题 假定两个人都坦白承认所犯罪行 则各判 5 年的 徒刑 若其中一个人选择坦白罪行 而另一个人选择抵 赖 则坦白者可得赦免 而抵赖者则被重判 8 年徒刑 若两个人同时抵赖 则可由于缺乏足够的证据而 都被判 1 年徒刑的轻罚 显然两个罪犯的决策是非独立的博弈 利用博弈 要素可将这个例子化简为如下分析框架 1 参与人参与人 囚徒 A 和囚徒 B 即 A 和 B 2 行动行动 坦白 抵赖 即 坦白 i ABAi A A 囚 徒 A 囚徒B 坦白抵赖 坦 白 5 5 0 8 抵 赖 8 0 1 1 15 抵赖 坦白 抵赖 B A 行动组合行动组合 坦白 坦白 坦白 抵赖 1 a 2 a 3 a 抵赖 坦白 抵赖 抵赖 4 a 3 战略战略 因为是静态博弈 所以战略等同于行动 坦白 抵赖 战略组合等用于行动组合 4 收益收益 用矩阵表示 每格内第一个数字表示 A的收益 第二个数字表示 B 的收益 A 坦白 同时 B 也坦白 每人关押各 5年 A 坦白 同时 B 抵赖 则 A 释放 而 B 被关押 8 年 反之亦然 A 抵赖 同时 B 也抵赖 每人各关押 1 年 显然在这个例子中 囚徒的选择是非常困难的 因为个人的最优选择是坦白 而对两个人的共同选择 而言 最优选择则是抵赖 就是说囚徒面临着个人理个人理 性性 5 5 与集体理性集体理性相矛盾的深刻问题 例 2 房地产开发博弈房地产开发博弈 如果市场上有两栋楼出售 需求大需求大时 每栋楼价 可达 1 4 亿 需求小需求小时每栋楼售价可达 0 7 亿 如果 市场上只有一栋楼出售 需求大时可售 1 8 亿 需求 16 小时可售 1 1 亿 这时有两家开发商 A 和 B 无论谁 开发都需投入资金 1 亿 其可以选择是开发或是不开 发 本例可用博弈要素表示如下 第一种情况 自然选择需求大 第二种情况 自然选择需求小 这个博弈问题有两层意思 其一是市场的需求问市场的需求问 题题 其二是 A A 和和 B B 的竞争的竞争 开 发 商 A 开发商 B 开发不开发 开 发 0 4 0 4 0 8 0 不 开 发 0 0 8 0 0 开 发 商 A 开发商 B 开发不开发 开 发 0 3 0 3 0 1 0 不 开 发 0 0 1 0 0 17 1 参与人 开发商 A 和开发商 B 以及虚拟参与人自然 自然决定市场的需求 需求大的概率为 需求 1 p 小的概率为 2 p 2 行动 开发 不开发 开发 不开发 A A B A 3 行动组合 开发 开发 开发 不开发 1 a 2 a 不开发 开发 不开发 不开发 3 a 4 a 4 行动顺序 可能出现以下三种情况可能出现以下三种情况 自然选择需求大小 然后 A B 同时决策 决策 时 A B 双方不知道对方的决定 自然选择需求大小 然后 A 选择 接着 B 再进 行选择 自然选择需求大小 然后 B 选择 接着 A 再进 行选择 5 信息 A B 有关自然选择的信息 即需求大小的概率 A 或 B 关于双方决策的信息 如果 A 不知自然选择 则 A 的信息集 大 N A h 18 小 如果 B 知道自然选择 则 B 的信息集为 大 N B h 或 小 N B h 若 B 先行动 A 后行动 则 A 关于 B 的信息集为 开发 或者 不开发 B A h B A h 若 A 和 B同时决策 A 关于 B 的信息集为 开 B A h 发 不开发 6 战略 参与人 A 和 B 在给定信息集条件下参与行动的规 则 若 B 在不知道市场需求下先行动 A 在 B 之后选 择自己的行动 那么 B B 的战略空间的战略空间为 开发 不开发 B S 而 A 的战略空间为 开发 开发 开发 不开发 A S 1 A s 2 A s 不开发 开发 不开发 不开发 3 A s 4 A s 中 是给定 B 为开放时 A 的行动 yxsA x 是 B 选择不开发时 A 相应的行动 y 战略组合 19 不开发 开发 开发 是一个战略组合 S 在这个战略组合中 A 的战略是如果 B 选择开发 我 不开发 如果 B 不开发 我就开发 B 的战略是开发 以此类推可得到其它的战略组合 注意 战略与行动是两个不同的概念 注意 战略与行动是两个不同的概念 战略是行动的规则而不是行动本身 比如战略是行动的规则而不是行动本身 比如 开发开发 和和 不开发不开发 是两个行动 而战略要说明的是什么是两个行动 而战略要说明的是什么时时 候采取什么行动 候采取什么行动 比如 毛主席曾说过 人不犯我 我不犯人 人 若犯我 我必犯人 就是一种战略 其中的 犯 和 不犯 是两个行动 战略规定了什么时候选择 犯 什么时候选择 不犯 7 收益 指一个特定组合下参与人行动的效用 8 结果 前面所有的 2 7 的各项内容都是结果 20 1010 2 2 博弈的标准式和纳什均衡博弈的标准式和纳什均衡 一 博弈的标准式表述一 博弈的标准式表述 1 博弈的参与人 nI 2 1 2 每个参与人的可选择的战略集或战略空间 ii sS ni 2 1 3 每个参与人的收益函数 21ni sssu 即所有参与人可能选择的战略组合决ni 2 1 定每一个参与人的收益 定义 在一个在一个人博弈的标准式中 参与人的战略空间人博弈的标准式中 参与人的战略空间n 为为 收益函 数为 收益函 数为 则 则 n SSS 21 n uuu 21 表示此博弈 表示此博弈 2121nn uuuSSSG 例如在两个寡头产量的博弈中 参与人是企业 战略空间是产量 收益是利润 博弈的标准表达q 式为 0 0 21221121 qqqqqqG 二 完全信息静态博弈二 完全信息静态博弈 完全信息静态博弈是最简单的博弈 即战略与行 动相统一的博弈 21 其具备以下三个条件 1 假定参与人是理性的 2 具有完全信息 即参与人对所有参与人的特征 战略空间 收益函数 有完全的了解 3 所谓静态是指参与人同时选择行动 而且只有 一次 同时 是信息概念 不是时间的概念 指在不 知其他人参与人选择的情况下采取行动 三 占优战略均衡三 占优战略均衡 1 概念 占优战略均衡是指参与人的最优战略不依赖于其占优战略均衡是指参与人的最优战略不依赖于其 他参与人的战略选择 不论其他参与人选择什么战他参与人的战略选择 不论其他参与人选择什么战 略 他的最优战略是唯一的 这个最优战略被称为略 他的最优战略是唯一的 这个最优战略被称为占占 优战略 优战略 如囚徒困境中 坦白对于 A 和 B 来说都是最优的 一般称为第 个人的严格占优战略 如果对应 i si 所有的 是 的严格最优选择 即对于任意的 i s i si 有 对应地所有 ii ss iiiiii ssussu 的被称为劣战略劣战略 其中 ii ss 22 111niii sssss 占优战略均衡占优战略均衡 在博弈标准形式中 如果对于所有的 是i i si 的占优战略 那么战略组合 1 ni ssss 称为占优战略均衡 所以在囚徒困境博弈中 坦白 坦白 是占优战 略均衡 在开发商博弈中 在需求大时 开发 开发 是占优战略均衡 在需求小时 不存在占优战略均衡 占优战略均衡只要求每个参与人是理性的 而并 不要求每个参与人知道其他参与人是理性的 因为不 论其他参与人是否理性 占优战略总是一个理性参与 人的最优选择 提出理性理性问题 是针对前面谈到个人理性和团体 理性的冲突而言的 在囚徒困境博弈中 就囚徒个人 而言 坦白是理性的 而就团体而言 抵赖才是理性 的 囚徒困境是个典型 其它诸如军备竞赛 团体中 的劳动供给 以及公共产品的供给等本质上都是囚徒 困境类型的博弈问题 2 重复剔除的占优均衡 应当指出 在一个博弈标准形式中 每个参与人 23 都有占优战略的情况常常是不存在的 但占优战略均 衡的分析逻辑仍然存在 退一步 可以将占优战略看 作不是严格的优于所有其他可选择的战略 而只是相 对于某个特定的战略而言 定义 令和是参与人 可选择的两个战略 i s i s i ii Ss 若对于任意其他参与人的战略组合 参 ii Ss i s 与人 选择的收益严格小于选择的收益 即对所i i s i s 有的而言 都有 i s iiiiii ssussu 我们称严格劣于 称为相对于的劣战 i s i s i s i s 略 相对于的占优战略 而占优战略均衡中的占 i s i s 优均衡是相对所有的的占优战略 i s ii ss 重复剔除劣战略的占优均衡重复剔除劣战略的占优均衡 战略组合称为重复剔除 1 ni ssss 占优均衡 若其是剔除劣战略后剩下的唯一战略组合 若唯一战略组合存在 则称其博弈是重复剔除占 优可解的 若不唯一存在 则认为其不存在均衡解 3 例子 智猪博弈智猪博弈 下面借助 智猪博弈 的例子来说明重复剔除劣 24 战略的占优均衡 故事背景 猪圈内有一头大猪和一头小猪 圈内一头是一个 食槽 另一头有一个控制猪食的按钮 按一下按钮 就有 8 单位的猪食进槽 但是这一行动将付出 2 单位 成本 若大猪先到 则大猪吃 7 个单位猪食 小猪只吃1 个单位 若小猪先到 则大猪和小猪各吃 4个单位 大 小猪同时到 大猪吃 5 个单位猪食 小猪吃 3 个单位 猪食 大猪和小猪都只有两个战略 按或等待 不同战 略组合下相应的支付矩阵为 支付矩阵左上角一格内的数字 3 1 表示 两 头猪同时去按按钮 同时到达食槽 大猪吃 5 个单位 小猪吃 3 个单位 但是由于都要扣除 2 单位成本 所 以结果支付组合为 3 1 其余三格的情况可以次类 大 猪 小猪 按等待 按 3 1 2 4 等 待 7 1 0 0 25 推 对于该例 可作出如下分析 1 该博弈没有占优战略均衡没有占优战略均衡 因为虽然 等待 是小猪的占优战略 但是大猪 没有占优战略 大猪的最优战略依赖于小猪的战略 即如果小猪选择 等待 大猪的最优战略为 按 而如果小猪选择 按 大猪的最优战略则为 等待 显然 这个博弈不能运用占优战略找出均衡 2 小猪的理性选择是小猪的理性选择是 等待等待 无论大猪选择什么战略 对于理性的小猪来说 等待 都是严格优于 按 的 这样一来 小猪剔 除严格劣战略 按 后 等待 成为了唯一的选择 3 假定大猪知道小猪是理性的 那么大猪会正 确的预测到小猪会选择 等待 给定这个预测 等 待 相对于 按 是大猪的劣战略 应该将其剔除 因此大猪的最优选择只能是 按 这样战略组合 按 等待 是该博弈的唯一的均衡 通过上述例子可以了解重复剔除劣战略的均衡解 的求解思路 其要求要求 理性理性 是参与人的共同知识是参与人的共同知识 如果经过剔除劣战略后不存在唯一的战略组合 则可 认为该博弈不是重复剔除占优可解的 比如在前面讨论的房地产开发一例中 假定市场 26 是低需求 无论 A 还是 B 都没有一种战略优于另一种 每个开发商的最优战略都依赖于对方的战略 所以难 以用重复剔除劣战略的方法找到均衡解 为了对这些博弈求解 我们需要引入纳什均衡为了对这些博弈求解 我们需要引入纳什均衡 NashNash equilibriumequilibrium 的概念 的概念 四 纳什均衡四 纳什均衡 纳什均衡是博弈解的概念 可以对非常广泛类型 的博弈做出较为严格的预测 参与人的纳什均衡战略决不会在重复剔除严格劣 战略的过程中被剔除掉 而重复剔除劣战略后所留下 的战略却不一定满足纳什均衡的条件 所以纳什均衡纳什均衡 博弈解是比重复剔除战略的博弈解更为严格博弈解是比重复剔除战略的博弈解更为严格 1 纳什均衡的定义 所谓纳什均衡是一种博弈状态 在该状态下 每 一个参与人选择的战略必须是针对其他参与人选择战 略的最优最优反应 这种参与人的战略选择组合可以称为 战略稳定或自动实施 因为没有参与人愿意独立放弃 他所选择的战略 用公理化的形式将纳什均衡描述为 在个参与人标准式博弈n 中 如果战略组 2121nn uuuSSSG 27 合满足对每一个参与人 是至少不劣 1n ss i i s 于 他 针 对 其 他个 参 与 人 的 所 选 战 略1 n 的最优反应战略 则该战略组 1 1 1nii ssss 合是该博弈的一个纳什均衡 1n ss 即 对于所有中的 iiiiii ssussu i S i s 都成立 亦即是以下最优化问题的解 i s max 1 1 1niiii Ss sssssu ii 即 max iii ssu 解读一下这个定义 有个参与人进行博弈 对第 个参与人而言 他ni 的战略空间是 收益函数是 若 ii sS ii su i s 是最优战略选择 则为全部参与人的最优 1n ss 战略选择组合 这就是一个纳什均衡解 那么怎样来识别呢 其存在如下关系 对第 个参与人来说 选择纳什均衡解中的战略选i 择所获得的收益要大于他没有选择纳什均衡解的收 益 即使其他参与人的战略选择都是最优的 28 公理化形式为 成立 所以纳什纳什均均 iiiiii ssussu i 衡解是参与人都感到最优的解衡解是参与人都感到最优的解 2 纳什均衡解的应用 古诺古诺 1838 年提出的模型是纳什均衡的经典案例纳什均衡的经典案例 我们通过对此例的分析建立起基于公理化形式的具体建立起基于公理化形式的具体 应用形式应用形式 1 古诺模型的基本命题 设两个市场寡头生产同质同质产品 市场总需求为 21 qqQ 反需求函数为 显然当时 QaQp aQ 当时 的总QaQp aQ 0 Qp i q 成本为 即不存在固定成本 iii cqqc 0 FC 即单位成本 边际成本 为常数 且假定cMC ac 2 古诺模型的博弈标准化形式 参与人 厂商 1 和厂商 2 选择的战略空间 选择变量为产量 非负 可以无穷 0 i S 29 大 其中 战略选择就是产量 1 ni ssS i s 注意任何选择受到的约束 0 i qaqi 收益函数 即企业 的收益与企业1和企业2战略选择的关系i 函数 在本例中 jii ssu cqqaq cqqpq qqu jii jii jiii 纳什均衡解 在标准式博弈中 一个战略组合如果是 ji ss 纳什均衡解 则对参与人来讲 应该满足i i s 这一条件等价于对每个参与 jiijii ssussu 人 必 须 是 下 面 最 优 化 问 题 的 解 即i i s i s max jii Ss ssu ii 在古诺模型中 可表示成产出组合 若 ji qq 为纳什均衡解 则对于企业 应为下列最大化问i i q 题的解 即 30 max max max 2 0 ijiii jii jii q i cqqqqaq cqqaq qqq i j p j s1 2 P 的最优反应 反之 如果参与人 1 有个纯战略都是的最优n 2 P 39 反应 则这些纯战略全部或部分的任意线性组合 同 时其它纯战略概率为 0 时形成的混合战略同样是参与 人 1 对的最优反应 2 P 三 混合战略条件下的纳什均衡三 混合战略条件下的纳什均衡 是参与人 1 和参与人 2 211 PPV 212 PPV 的混合战略期望收益函数 一对混合战略组合要成为纳什均衡 2 1 pp 必须满足 1 P 211 2 11 PPVPPV 对中战略所有可能的概率分布都成立 且必 1 S 1 P 2 P 须满足 对中战略所 2 12 2 12 PPVPPV 2 S 有可能的概率分布都成立 2 P 定义 在两个参与人标准式博弈 2121 uussG 中混合战略组合是纳什均衡的充要条件充要条件为 2 1 pp 每一个参与人的混合战略是另一个参与人的混合战略 的最优反应 即 211 2 11 PPVPPV 40 且 2 12 2 12 PPVPPV 四 一个社会福利博弈的例子四 一个社会福利博弈的例子 1 博弈背景 政府想救济流浪汉 但前提是流浪汉必须努力寻 找工作 否则不救济 而流浪汉却只有在得不到政府救济时才会寻找工 作 这个博弈的支付矩阵为 2 博弈标准表达式 1 参与人 政府 A 和流浪汉 B 2 战略行动空间 A A A AA A A A救济 不救济救济 不救济 A A A AB B B B寻找工作 流浪寻找工作 流浪 政 府 流 浪 汉 寻 找工作 流浪 救济 3 2 1 3 不救济 1 1 0 0 41 3 行动组合 救济 寻找工作 救济 寻找工作 1 a 救济 流浪 救济 流浪 2 a 不救济 寻找工作 不救济 寻找工作 3 a 不救济 流浪 不救济 流浪 4 a 4 纯战略收益 3 1111 BAAA ssuu 2 1111 BABB ssuu 1 2111 BAAA ssuu 1 1211 BABB ssuu 1 1222 BAAA ssuu 3 2122 BABB ssuu 0 2222 BAAA ssuu 0 2222 BABB ssuu 3 混合战略求解方法 1 参与人的混合战略 设政府的混合战略为 1 21 AA pp 42 流浪汉的混合战略 1 21 BB rrpp 2 政府的均衡混合战略 设政府的期望效用函数为 BAA ppV 211211111 BAABBAABA ssupssupp 222212212 BAABBAABA ssupssupp 0 1 1 1 1 1 3 rrrr 1 1 13 rr rr 15 一阶条件为 015 r VA 解得 就是说流浪汉以 0 22 0 r 8 0 2 0 B V 的概率选择找工作 0 8 的概率选择流浪 问题是我们解的是政府的最优化问题 但是却得 到流浪汉的混合战略 其原因是 我们首先假定最优混合战略是存在的 假定给定流浪汉选择混合战略 政府 1 rr 选择纯战略救济 即 时的期望效用为 1 14 1 1 3 1 1 rrrrVA 43 政府选择纯战略不救济 即 时的期望效用为 0 rrrrVA 0 1 1 0 2 如果一个混合战略 即 是政府的最1 0 优选择 那么一定意味着政府在救济与不救济之间是 无差异的 即 0 14 1 21 rVrrrV AA 解得 2 0 r 也 就 是 说时 政 府 选 择 不 救 济 2 0r 只有当时政府才会选择混合战略或者任2 0 r 何纯战略 而这时 救济与不救济的选择没5 0 有差异 同时通过求解流浪汉的最优化问题得到政府 的均衡混合战略 3 流浪汉的均衡混合战略 设流浪汉的期望效用函数为 ABB ppV 121211111 BABABABAB ssupssupp 222221212 BABABABAB ssupssupp 0 1 3 1 1 1 2 rr 3 1 12 rr 44 3 12 r 一阶条件为 0 12 r r VB 解得 就是说政府以 0 55 0 5 0 5 0 AV 的概率救济 0 5 的概率选择不救济 可以对作类似于的分析 5 0 2 0 r 如果 流浪汉的最优选择是找工作 5 0 只有当时 流浪汉才会选择混合战略5 0 V 或者任何纯战略 即对他而言任何选择都1 0 r 是无差异的 五 混合战略纳什均衡五 混合战略纳什均衡 1 纳什均衡要求每个参与人的战略是给定对方混 合战略下的最优选择 在上例中 是唯一的纳什均5 0 2 0 r 衡 这意味着 纳什均衡的解释纳什均衡的解释 1 假定政府认为流浪汉选择找工作的概率严格 小于 0 2 那么政府的唯一最优选择就是选择纯战略 45 不救济 但是如果政府以概率 1 选择不救济 流浪汉的最 优选择却
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025北京市通州区马驹桥镇招考20人考前自测高频考点模拟试题及1套参考答案详解
- 2025广西贵港市公安局港南分局面向社会招聘警务辅助人员16人模拟试卷及一套答案详解
- 2025昌吉州事业单位引进急需紧缺专业人才暨“千硕进昌”上半年引才考前自测高频考点模拟试题附答案详解(黄金题型)
- 2025年上海城投集团社会招聘考前自测高频考点模拟试题及一套答案详解
- 2025空军军医大学幼儿园招聘(4人)考前自测高频考点模拟试题有完整答案详解
- 2025河南郑州市教育局直属32所学校招聘323人模拟试卷及答案详解(夺冠)
- 2025湖南衡阳珠晖法院招聘聘用制司法辅警3人模拟试卷及参考答案详解
- 2025年延吉市党史地方志办公室招聘公益性岗位的考前自测高频考点模拟试题附答案详解(突破训练)
- 2025贵阳学院人才引进15人模拟试卷含答案详解
- 2025黑龙江哈尔滨市松北区卫生健康局招聘乡村医生10人考前自测高频考点模拟试题及答案详解(夺冠)
- 广东省2025年度初级注册安全工程师职业资格考试金属非金属矿山安全复习题及答案
- 十二经络课件
- Starter Unit 3 Welcome 单元测试(含答案)人教版(2024)七年级英语上册
- 玻璃委托代加工合同范本
- 年产9000吨塑料粒子项目报告表
- 秦朝服饰设计分享
- 子宫脱垂的中医护理查房
- 2024年12月英语四级真题及答案-第1套
- 大学生禁毒知识竞赛题库题及答案
- 2024年高校教师资格证考试题库(各地真题)
- 病房抢救室工作制度
评论
0/150
提交评论