博弈论(第四章).pdf_第1页
博弈论(第四章).pdf_第2页
博弈论(第四章).pdf_第3页
博弈论(第四章).pdf_第4页
博弈论(第四章).pdf_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章第四章 重复博弈重复博弈 有限次重复博弈 无限次重复博弈 民间 Folk Theorem 定理 第一节第一节 重复博弈引论重复博弈引论 为什么研究重复博弈 普遍性 长期利益的问题 第一节第一节 重复博弈引论重复博弈引论 重复博弈与一般动态博弈的区别 重复博弈的一个阶段就是一个独立 的静态博弈或动态博弈 各个博弈方都 有相应的得益 这是重复博弈与一般动 态博弈的主要区别之一 第一节第一节 重复博弈引论重复博弈引论 重复博弈的特征 前一阶段的博弈不改变后一阶段博弈的结构 所有局中人都观测到以往博弈过程的支付和策略 局中人的支付是所有阶段博弈支付的贴现值之和或 加权平均值 第一节第一节 重复博弈引论重复博弈引论 基本概念 分类 有限重复博弈 G T 无限重复博弈 G 随机结束的重复博弈 策略 子博弈和均衡路径 第一节第一节 重复博弈引论重复博弈引论 基本概念 重复博弈的得益 有限重复博弈得益 无限重复博弈得益 211 123 1 n ni ni i uuuuuu 21 123 1 i i i uuuuu 第一节第一节 重复博弈引论重复博弈引论 基本概念 重复博弈的得益 随机结束重复博弈的得益 设停止重复的概率为p 继续重复的概率为1 p 利率是r 22 123 1 11 1 111 1 1 1 1 1 1 1 1 t tt tttt ttt uuuprupr pp uuu rr 第二节第二节 有限次重复博弈有限次重复博弈 零和博弈的有限次重复博弈 零和博弈的有限次重复博弈 博弈方的正确策 略就是重复基本博弈的纳什均衡策略 第二节第二节 有限次重复博弈有限次重复博弈 惟一纯策略纳什均衡博弈的有限次重复博弈 如果基本博弈惟一纯策略纳什均衡本身就是帕 累托效率意义上的最佳策略组合 那么因为符合所 有博弈方的利益 因此有限次重复显然不会改变博 弈方的行为方式 第二节第二节 有限次重复博弈有限次重复博弈 惟一纯策略纳什均衡博弈的有限次重复博弈 囚徒2 囚 徒 1 坦白不坦白 坦白 5 50 8 不坦白 8 0 1 1 第二节第二节 有限次重复博弈有限次重复博弈 惟一纯策略纳什均衡博弈的有限次重复博弈 囚徒2 囚 徒 1 坦白不坦白 坦白 10 10 5 13 不坦白 13 5 6 6 每次重复采用原博弈惟一的纯策略纳什均衡 就 是这种重复博弈惟一的子博弈完美纳什均衡路径 第二节第二节 有限次重复博弈有限次重复博弈 惟一纯策略纳什均衡博弈的有限次重复博弈 原博弈有惟一的纯策略纳什均衡的博弈 则有 限次重复博弈的惟一均衡即各博弈方在每阶段 即每 次重复 中都采用原博弈的纳什均衡策略 由于这样 的均衡中各博弈方的策略都不存在不可信的威胁或承 诺 因此是子博弈精炼纳什均衡 第二节第二节 有限次重复博弈有限次重复博弈 多个纯策略纳什均衡博弈的有限次重复博弈 厂商1 HML H 5 50 60 2 M 6 03 30 2 L 2 02 01 1 厂商2 触发策略 Trigger Strategy 首先试探合作 一旦发觉不合 作则也采用不合作相报复的策略 厂商1 第一次选H 如第一次结果为 H H 则第二次 选M 如果第一次结果为任何其他策略组合 则第二次选L 厂商2 同厂商1 第二节第二节 有限次重复博弈有限次重复博弈 多个纯策略纳什均衡博弈的有限次重复博弈 厂商1 HML H 8 81 71 3 M 7 14 41 3 L 3 13 12 2 厂商2 以上博弈重复n次 结论还是相似的 当重复次数较 多时 平均得益接近于一次性博弈中 H H 的得益 5 5 重复博弈的试验重复博弈的试验重复博弈的试验重复博弈的试验重复博弈的试验重复博弈的试验重复博弈的试验重复博弈的试验 美国Michigen大学教授R 爱克塞罗曾进行计算机程序 竞赛 来决定什么策略最优 14位程序设计者中有经济学家 计算机专家 政治 家 数学家等 总共进行5次循环赛 12万次对局 获胜的策略是最简单的策略 以牙还牙 tit for tat 第二节有限次重复博弈第二节有限次重复博弈 多个纯策略纳什均衡博弈的有限次重复博弈 两个纯策略纳什均衡 A B B A 和一个 混合策略纳什均衡 即厂商1和厂商2以相同的概率随机 在选择A或B 混合策略双方得益 2 厂商2 厂 商 1 AB A 3 31 4 B 4 10 0 第二节有限次重复博弈第二节有限次重复博弈 多个纯策略纳什均衡博弈的有限次重复博弈 两次重复博弈 连续两次采用同一纯策略纳什均衡的路径 则双方得 益分别是 1 4 和 4 1 两次采用混合策略纳什均衡 则双方平均得益 2 2 采用轮换策略 则双方平均得益为 2 5 2 5 一次纯策略 一次混合策略 则双方得益为 1 5 3 和 3 1 5 第二节有限次重复博弈第二节有限次重复博弈 多个纯策略纳什均衡博弈的有限次重复博弈 3 3 2 2 2 5 2 5 3 1 5 1 5 3 1 4 4 1 U厂商1 U厂商2 第二节有限次重复博弈第二节有限次重复博弈 多个纯策略纳什均衡博弈的有限次重复博弈 三次重复博弈 厂商1 第一阶段选A 如果第一阶段结果是 A A 则第二阶段 选A 如果第一阶段结果是 A B 第二阶段选B 第三阶段无条 件选B 厂商2 第一阶段选A 第二阶段无条件选B 如果第一阶段结果是 A A 则第三阶段选A 如果第一阶段结果是 B A 则第 三阶段选B 根据这个触发策略 3次重复的均衡路径是 A A A B 和 B A 双方平均得益为 3 1 4 3 2 67 第二节有限次重复博弈第二节有限次重复博弈 有限次重复博弈的民间 Folk Theorem 定理 设原博弈的一次性博弈有均衡得益数组优于w 那么在 该博弈的多次博弈中 所有不小于个体理性得益的可实现得 益 都至少有一个子博弈精炼纳什的极限的平均得益来实现 它们 第二节有限次重复博弈第二节有限次重复博弈 有限次重复博弈的民间 Folk Theorem 定理 个体理性得益 Individual Rationality Payoff 或保 证得益 Reservation Payoff 无论其他局中人行为 如何 一局中人在博弈中采取某种特定的策略 能 够最低限度保证得到的得益 可实现得益 Feasible Payoff 博弈中所有纯策 略组合得益的凸组合 Convex Combination 即纯策 略得益的加权平均数组 第二节有限次重复博弈第二节有限次重复博弈 有限次重复博弈的民间 Folk Theorem 定理 3 3 1 4 4 1 U厂商1 U厂商2 第三节无限次重复博弈第三节无限次重复博弈 无限次重复博弈和有限次重复博弈的区别 无法应用逆推归纳法 无限次重复博弈不能忽视不同时间得益的价值 差异和贴现问题 第三节无限次重复博弈第三节无限次重复博弈 零和博弈的无限次重复博弈 由于无限次重复博弈没有最后一个阶段 我 们可以讨论无限次重复博弈的第t阶段 博弈方 的利益关系不会因为第t 1阶段的结果而有任何改 变 仍然是严格对立的 因此第t 1阶段 t 2阶 段 t 3阶段也不会合作 博弈方会一直重复原博 弈的混合策略纳什均衡策略 第三节无限次重复博弈第三节无限次重复博弈 惟一纯策略纳什均衡博弈的无限次重复博弈 有两种情况 一是原博弈惟一的纯策略纳什均衡 本身是帕累托意义最佳策略组合 符合各博弈方最大 利益的情况 二是惟一的纯策略纳什均衡不是效率最 高的策略组合 对于第一种情况 无论是无限次还是 有限次重复博弈 都与一次性博弈相同 对于第二种 情况 我们进行具体分析 第三节无限次重复博弈第三节无限次重复博弈 囚徒困境式博弈的无限次重复 厂商2 厂 商 1 LH L 1 15 0 H 0 54 4 第三节无限次重复博弈第三节无限次重复博弈 囚徒困境式博弈的无限次重复 触发策略 第一阶段采取H策略 在t阶段 如果前t 1阶段的结果 都是 H H 则继续采取H策略 否则采用L 当贴现值 较大时 双方采取以上触发策略构成无限次重复博弈的 一个子博弈精炼纳什均衡 如果局中人2采用一次L策略 则得益u u 5 1 1 2 5 1 如果局中人2一直采用H策略 则得益u u 4 4 4 2 4 1 所以 当u u 时 即5 1 4 1 1 4时 局中人2 会采用L策略 当u1 4时 采用H策略有利 第三节无限次重复博弈第三节无限次重复博弈 一个男孩被视为傻瓜 因为每当别人拿一枚一个男孩被视为傻瓜 因为每当别人拿一枚1 1元硬币和元硬币和5 5角角 硬币让他选的时候 他总是选硬币让他选的时候 他总是选5 5角的 有一个人觉得奇怪 就角的 有一个人觉得奇怪 就 问他 问他 为什么你不拿为什么你不拿1 1元钱的 元钱的 男孩小声回答 男孩小声回答 假若我假若我 拿了拿了1 1元钱的硬币 下次他们就不会拿钱让我选了 元钱的硬币 下次他们就不会拿钱让我选了 第三节无限次重复博弈第三节无限次重复博弈 无限次重复博弈的民间定理 设G是一个完全信息静态博弈 用 e1 en 记G的 纳什均衡的得益 用 x1 xn 表示G的任意可实现得益 如果xi ei对于任意局中人i都成立 而 足够接近1 那么无 限次重复博弈G 中一定存在一个子博弈精炼纳 什均衡 各局中人的平均得益就是 x1 xn 第三节无限次重复博弈第三节无限次重复博弈 无限次重复博弈的民间定理 4 4 0 5 1 1 U厂商1 U厂商2 5 0 第三节无限次重复博弈第三节无限次重复博弈 无限次重复的古诺模型 垄断产量 3 两厂商合作则q1 q2 1 5 u1 u2 4 5 如厂商2不合作 则u2 8 1 5 q2 q2 2q2 4 5q2 q22 一阶导数 0 得q2 2 25 则u2 5 0625 合作u2 4 5 4 5 4 5 2 4 5 1 不合作u2 5 0625 4 4 2 5 0625 4 1 当u2 u2 时 即 0 5249时选择合作 第三节无限次重复博弈第三节无限次重复博弈 恶性竞争的无限次重复博弈 如果是n家厂商呢 2个厂商按垄断产量进行生产并分享利润U 1家厂商单独 改变产量则独得全部利润U 2家厂商同时改变产量则双方均 无利润 则双方无限次重复博弈的策略是什么 效率工资模型效率工资模型 效率工资模型效率工资模型 模型设定模型设定模型设定模型设定 首先厂商选择工资率为 w 然后工人选择接受或拒绝 如果拒绝 则他作个体户得到收入 w0小于w 如果接受 则工人选择努力工作 负效用为e 或偷懒 无负效用 厂商只能看到产量高低 高产量为 y 低产量是0 工人努力工作时一定是高产量 y 不努力时却并不一定是0 而是 高产量 y 的概率为 p 低产量0的概率为1 p 工人努力工作时 厂商得益为 y w 工人得益为w e 工人偷懒时 厂商期望得益为py w 工人得益为 w 考虑如下的触发策略考虑如下的触发策略考虑如下的触发策略考虑如下的触发策略考虑如下的触发策略考虑如下的触发策略考虑如下的触发策略考虑如下的触发策略 厂商在第一阶段给工资率 在第t阶段 如果前面t 1阶段结果 都是 则继续给 否则从此永远是 工人的策略是如果 则接受 否则宁愿作个体户得到 并在以前各期结果都是 和当前工资率为 时努力工作 否 则偷懒 设厂商已采用上述触发策略 由于 工人接受工作是最佳 反应 用 记工人努力工作时无限次重复博弈得益的现值 则 即 w yw w 0 w 0 ww 0 w yw w 0 ww e V ee VewV 1 ewVe 记工人选偷懒时无限重复博弈得益的现值 则 即 因此当 时 即 努力是工人的最佳选择 反过来 设工人已采用上述触发策略 若厂商给的工资率满足上式 条件 并且威胁一旦产量降低就解雇工人 则各阶段的得益为 无限次重复博弈得益现值为 若不愿给 则解雇工人 以后得益为0 因此只要 厂商选择前述触发策略就是最佳 反应 1 1 0 w ppVwV ss 0 1 1 1 1 s Vwp wp se VV e p ewe p p ww 1 1 1 1 00 wy 1 wy w 0 wy 综上所述 在满足 的条件下 双方的触发策略构成一个纳什均衡 而上述两式实际上意味着 即工人努力的产出扣除努力负效用后的剩余 必须不小于工人作个体户的收入即 机会成本 再加上一定比例的取决于努力负效用 贴现系数和偷懒

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论