重复博弈教学课件PPT.ppt

上传人：扣*** IP属地：宁夏上传时间：2019-12-21 格式：PPT 页数：53 大小：502.02KB 积分：18 举报 版权申诉

已阅读5页，还剩48页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第四章重复博弈 repeatedgame 本章介绍基本博弈重复进行构成的重复博弈虽然形式上是基本博弈的重复进行但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复因为博弈方对于博弈会重复进行的意识会使他们对利益的判断发生变化从而使他们在重复博弈过程中的行为选择受到影响这意味着不能把重复博弈当作基本博弈的简单叠加必须把整个重复博弈过程作为整体进行研究重复博弈引论有限次重复博弈无限次重复博弈本章分三节 4 1重复博弈引论 4 1 1为何研究重复博弈经济中的长期关系人们的预见性未来利益对当前行为的制约长期合同回头客长客和一次性买卖的区别有无确定的结束时间 4 1 2基本概念有限次重复博弈给定一个基本博弈g 可以是静态博弈也可以是动态博弈重复进行t次g 并且在每次重复g之前各博弈方都能观察到以前博弈的结果这样的博弈过程称为 g的t次重复博弈记为g t 而g则称为g t 的原博弈 g t 中的每次重复称为g t 的一个阶段无限次重复博弈一个基本博弈g一直重复博弈下去的博弈记为g 策略博弈方在每个阶段针对每种情况如何行为的计划子博弈从某个阶段不包括第一阶段开始包括此后所有的重复博弈部分均衡路径由每个阶段博弈方的行为组合串联而成重复博弈的得益 1 贴现系数2 一个t期重复博弈每期收益随机停止和贴现率 4 2有限次重复博弈定义给定一个基本博弈g 可以是静态博弈也可以是动态博弈重复进行t次g 并且在每次重复g之前各博弈方都能观察到以前博弈的结果这样的博弈过程称为 g的t次重复博弈记为g t 而g则称为g t 的原博弈 g t 中的每次重复称为g t 的一个阶段 4 2 1两人零和博弈的有限次重复博弈4 2 2唯一纯策略纳什均衡博弈的有限次重复博弈4 2 3多个纯策略纳什均衡博弈的有限次重复博弈 4 2 1两人零和博弈的有限次重复博弈引入实例猜硬币博弈的有限次重复博弈正确策略是什么思路运用子博弈逆向归纳法结论一般零和博弈为原博弈的有限次重复博弈的策略就是重复一次性博弈中的纳什均衡策略囚徒的困境博弈的有限次重复1 两次重复2 有限次重复逆推归纳法等价博弈 4 2 2唯一纯策略纳什均衡博弈的有限次重复博弈一般结论定理设原博弈g有唯一的纯策略纳什均衡则对任意整数t 重复博弈g t 有唯一的子博弈完美纳什均衡即各博弈方每个阶段都采用g的纳什均衡策略各博弈方在g t 中的总得益为在g中得益的t倍平均得益的与原博弈g中的得益应用有限次重复削价竞争博弈有唯一纯策略纳什均衡 70 70 有限次重复的结果仍然是每次都采用低价低价古诺模型重复开金矿博弈的有限次重复均衡策略是什么重复囚徒困境博弈悖论与连锁店悖论 1 囚徒困境悖论2 连锁店悖论3 叠代重复博弈生态破坏资源过度开发环境污染问题破解悖论 1 成功例子石油输出过组织 opec 2 破解悖论的关键站的高望的远考虑的是长期利益 3 假设一个重复10次囚徒困境的博弈贴现系数为问满足什么条件参与者会选择不坦白 4 2 3多个纯策略纳什均衡博弈的有限次重复博弈三价博弈的重复博弈原博弈有两个纳什均衡 m m l l 两次重复的子博弈完美纳什均衡有多个 1 每次重复一个纳什均衡 2 加混合策略纳什均衡重要的是在2次重复博弈中可以找到包含 h h 的子博弈完美均衡触发策略两博弈方先试探合作一旦发现对方不合作则也用不合作报复触发策略是重复博弈实现合作的关键措施博弈方1 第一次选h 如第一次结果为 h h 则第二次选m 否则选l博弈方2 同博弈方1 触发策略的进一步讨论报复的可信性 hmlpq 触发策略可信的重复博弈 hmlpq 博弈有4个纳什均衡 m m l l p p q q 均衡策略博弈方1 第一阶段选h 如果第一阶段结果是 h h 第二阶段采用m 否则采用p 博弈方2 第一阶段选h 如果第一阶段结果是 h h 第二阶段采用m 否则采用q 两市场博弈的重复博弈重复两次 a b a b or b a b a 1 4 4 1 连续两次采用混合策略 2 2 a b b a or b a a b 2 5 2 5 轮换策略一次纯策略一次混合策略 1 5 3 3 1 5 两次重复两市场博弈子博弈完美纳什均衡平均得益三次重复两市场博弈子博弈完美纳什均衡触发策略厂商1 第一阶段a 如果第一阶段结果 a a 则第二阶段a 如果第一阶段结果 a b 则第二阶段b 第三阶段b 厂商2 第一阶段a 第二阶段无条件b 如果第一阶段结果 a a 则第三阶段a 如果第一阶段结果 a b 则第三阶段b 均衡路径 a a a b b a 平均收益 3 1 4 3 2 67 重复次数进一步扩展到101次的策略博弈方1 2的策略前99次选a 但从其中的第二次开始一旦发现结果不是 a a 则选b坚持到底最后2次重复与三次重复博弈中的后2次策略相同平均收益 99x3 1 4 101 2 99 4 2 4有限次重复博弈的民间定理个体理性收益 w 不管其它博弈方的行为如何一博弈方在某个博弈中只要自己采取某种特定的策略最低限度保证能获得的得益也称为保留收益可实现收益博弈中所有纯策略组合得益的加权平均数组有限次重复博弈的民间定理设原博弈的一次性博弈有均衡得益数组优于w 那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们 4 3无限次重复博弈 4 3 1两人零和博弈的无限次重复博弈4 3 2唯一纯策略纳什均衡博弈的无限次重复博弈4 3 3无限次重复古诺模型4 3 4有效工资率 4 3 1两人零和博弈的无限次重复博弈案例无限次重复拳头剪刀布游戏你的策略是什么分析重复次数不会改变原博弈中博弈方之间在利益上的对立关系也不会创造出潜在的合作利益因此两人零和博弈无限次重复的所有阶段都不可能发生合作博弈方会一直重复原博弈的混合策略纳什均衡 4 3 2 唯一纯策略纳什均衡博弈的无限次重复博弈冷酷策略第一阶段采用h 如果前t 1阶段的结果都是 h h 则继续采用h 否则采用l 如果博弈方2采用l 总得益现值为如果博弈方2采用h 总得益现值为结论当时双方采用此触发策略是子博弈完美纳什均衡囚徒困境悖论得以破解提问思考 1 有限次重复博弈能否通过冷酷战略破解囚徒困境问题 2 具有唯一占优策略纳什均衡的无限次重复博弈的子博弈完美纳什均衡是纳什均衡的重复吗无限次重复博弈的无名氏定理无限次重复博弈的无名氏定理的实质是一个存在性定理 4 3 3 无限次重复古诺模型假设假设市场存在2个寡头市场需求函数为p 8 q q 8 q q1 q2 两个企业的边际成本都为2 不存在固定成本两企业可以进行古诺竞争与可以合作作为一个垄断企业博弈重复无限次考虑以下三个问题 1 保持垄断产量冷酷策略的条件 2 冷酷策略条件不满足就一定要进行你死我活的竞争吗 3 一定要冷酷到底吗支持垄断产量冷酷策略的条件只有当企业采取偏离策略后的总收益小于不偏离的总收益那么企业才不会偏离即冷酷策略条件不满足就一定要进行你死我活的竞争吗低水平的合作如果企业2偏离企业1第二阶段对其进行惩罚只生产产量x 企业2只能与之合作否则第三阶段会继续被惩罚因此企业2在第二阶段的利润只能是非要冷酷到底吗加大惩罚力度和提高合作水平因此企业2只有在第一阶段偏离获利大于第二阶段的所受惩罚的损失的时候企业2才会选择偏离 4 3 4 有效工资成立的条件是什么问题在同一行业为什么一些企业的工资高于其他企业触发策略总结我们分析的无限次重复博弈的原博弈都是完全信息博弈如果原博弈是一个不完全信息博弈无限次重复博弈的结果将会复杂很多重复博弈和声誉模型的联系与区别习题 1 举出生活中的一个重复博弈和一次性博弈效率不同的例子火车站及旅游景点的商店和生活区商店的价格 2 重复两次下面的博弈如果你是博弈方1 你该如何采取策略用画线法容易找出该博弈的两个纯策略纳什均衡 t l 和 m r 这两个纳什均衡的得益都帕累托劣于 b s 一次性博弈中效率较高的 b s 不可能实现但该博弈的结构表明存在双方合作的利益在两次重复博弈中也有构造惩罚机制的条件因此我会考虑运用试探合作的触发策略争取部分实现 b s 提高博弈的效率我作为博弈方1会采用这样的触发策略第一次重复采用b 第二次重复时如果前一次的结果是 b s 则采用m 如果前一次的结果是其他则采用t 如果另一个博弈方有同样的分析能力或者比较有经验那么他或她也会采用相似的触发策略在第一次重复时采用s 第二次重复时如果前一次的结果是 b s 则采用r 否则采用l 双方采用上述触发策略构成一个子博弈完美纳什均衡因此是稳定的这时候前一次重复实现了 b s 提高了博弈的效率 3 2次重复下面博弈问能否有一个子博弈完美纳什均衡策略组合实现第一阶段收益为 4 4 如能给出策略组合如果不能请说明为什么如果下左的收益改为 1 5 会发生什么变化至少能在部分阶段实现收益 4 4 的条件是什么两个ne 上左中中博弈方1 第一阶段下第二阶段上博弈方2 第一阶段右第二阶段如果第一阶段结果是下右则选左否则选中如果把 4 4 改为 1 5 不存在spne实现 4 4 4 求出下列静态博弈的纳什均衡并说明有限次重复和无限次重复时博弈方1 2的策略首先很容易看出博弈方1的d策相对于t策和m策都是严格下策因此可以消去消去博弈方1的d策后四个策略组合中不存在纯策略纳什均衡根据混合策略纳什均衡的计算方法不难算出混合策略纳什均衡为博弈方1概率分布 1 2 1 2 在t和m中随机选择博弈方2则以概率分布 1 3 2 3 在l和r中随机选择由于上述静态博弈是没有纯策略纳什均衡的严

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

重复博弈教学课件PPT.ppt

文档简介

温馨提示

最新文档

评论

重复博弈教学课件PPT.ppt

文档简介

温馨提示

最新文档

评论

相关文档