已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章 重复博弈(repeated game),本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。,重复博弈引论 有限次重复博弈 无限次重复博弈,本章分三节,4.1 重复博弈引论,4.1.1 为何研究重复博弈 经济中的长期关系 人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间,4.1.2 基本概念,有限次重复博弈:给定一个基本博弈g(可以是静态博弈,也可以是动态博弈),重复进行t次g,并且在每次重复g之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“g的t次重复博弈”,记为g(t)。而g则称为g(t)的“原博弈”。g(t)中的每次重复称为g(t)的一个“阶段”。 无限次重复博弈:一个基本博弈g一直重复博弈下去的博弈,记为g( ),策略:博弈方在每个阶段针对每种情况如何行为的计划 子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分 均衡路径:由每个阶段博弈方的行为组合串联而成,重复博弈的得益,1,贴现系数 2,一个t期重复博弈,每期收益,随机停止和贴现率,4.2 有限次重复博弈,定义:给定一个基本博弈g(可以是静态博弈,也可以是动态博弈),重复进行t次g,并且在每次重复g之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“g的t次重复博弈”,记为g(t)。而g则称为g(t)的“原博弈”。g(t)中的每次重复称为g(t)的一个“阶段”。 4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈的有限次重复博弈,4.2.1 两人零和博弈的有限次重复博弈,引入实例:猜硬币博弈的有限次重复博弈, 正确策略是什么? 思路:运用子博弈逆向归纳法 结论:一般零和博弈为原博弈的有限次重复博弈的策略就是: 重复一次性博弈中的纳什均衡策略,囚徒的困境博弈的有限次重复 1、两次重复 2、有限次重复 逆推归纳法 等价博弈,4.2.2唯一纯策略纳什均衡博弈的有限次重复博弈,一般结论,定 理: 设原博弈g有唯一的纯策略纳什均衡,则对任意整数t,重复博弈 g(t)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用g的纳什均衡策略。 各博弈方在g(t)中的总得益为在g中得益的t倍,平均得益的与原博弈g中的得益。,应用:有限次重复削价竞争博弈,有唯一纯策略纳什均衡 (70,70) 有限次重复的结果仍然是 每次都采用(低价,低价) 古诺模型重复,开金矿博弈的有限次重复,均衡策略是什么?,重复囚徒困境博弈悖论与连锁店悖论,1,囚徒困境悖论 2,连锁店悖论 3,叠代重复博弈:生态破坏,资源过度开发,环境污染问题,破解悖论,1,成功例子:石油输出过组织(opec)。 2,破解悖论的关键:站的高,望的远,考虑的是长期利益。 3,假设一个重复10次囚徒困境的博弈,贴现系数为 ,问 满足什么条件,参与者会选择不坦白。,4.2.3多个纯策略纳什均衡博弈的有限次重复博弈,三价博弈的重复博弈,原博弈有两个纳什均衡(m,m)、(l,l) 两次重复的子博弈完美纳什均衡有多个:1、每次重复一个纳什均衡; 2、加混合策略纳什均衡。重要的是在2次重复博弈中可以找到包含 (h,h)的子博弈完美均衡。,触发策略: 两博弈方先试探合作,一旦发现对方不合作则也用不合作报复。 触发策略是重复博弈实现合作的关键措施。 博弈方1:第一次选h;如第一次结果为(h,h),则第二次选m,否则选l 博弈方2:同博弈方1。,触发策略的进一步讨论:报复的可信性,h m l p q,触发策略可信的重复博弈,h m l p q,博弈有4个纳什均衡(m,m)、(l,l),(p,p),(q,q)。 均衡策略: 博弈方1:第一阶段选h,如果第一阶段结果是(h,h),第二阶段采用 m,否则采用p。 博弈方2:第一阶段选h,如果第一阶段结果是(h,h),第二阶段采用 m,否则采用q。,两市场博弈的重复博弈(重复两次),(a,b)+(a,b) or (b,a)+(b,a)(1,4)(4,1) 连续两次采用混合策略(2,2) (a,b)+(b,a) or (b,a)+(a,b)(2.5,2.5)轮换策略 一次纯策略+一次混合策略(1.5,3)(3,1.5),两次重复两市场博弈子博弈完美纳什均衡平均得益,三次重复两市场博弈子博弈完美纳什均衡,触发策略: 厂商1:第一阶段a;如果第一阶段结果(a,a)则第二阶段a,如果第一阶段结果(a,b),则第二阶段b;第三阶段b。 厂商2:第一阶段a;第二阶段无条件b;如果第一阶段结果(a,a)则第三阶段a,如果第一阶段结果(a,b),则第三阶段b。 均衡路径:(a,a)+(a,b)+(b,a)。 平均收益:(3+1+4)/3=2.67,重复次数进一步扩展到101次的策略。 博弈方1,2的策略:前99次选a,但从其中的第二次开始,一旦发现结果不是(a,a),则选b坚持到底,最后2次重复与三次重复博弈中的后2次策略相同。 平均收益(99x3+1+4)/101=2.99,4.2.4 有限次重复博弈的民间定理,个体理性收益(w):不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益,也称为保留收益。 可实现收益:博弈中所有纯策略组合得益的加权平均数组。,有限次重复博弈的民间定理,设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。,4.3 无限次重复博弈,4.3.1 两人零和博弈的无限次重复博弈 4.3.2唯一纯策略纳什均衡博弈的无限次重复博弈 4.3.3 无限次重复古诺模型 4.3.4 有效工资率,4.3.1 两人零和博弈的无限次重复博弈,案例:无限次重复拳头,剪刀,布游戏,你的策略是什么? 分析:重复次数不会改变原博弈中博弈方之间在利益上的对立关系,也不会创造出潜在的合作利益。因此,两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡。,4.3.2:唯一纯策略纳什均衡博弈的无限次重复博弈,冷酷策略:第一阶段采用h,如果前t-1阶段的结果都是(h,h),则继续采用h,否则采用l。 如果博弈方2采用l,总得益现值为 如果博弈方2采用h,总得益现值为,结论:当 时,双方采用此触发策略是子博弈完美纳什均衡,“囚徒困境悖论”得以破解。 提问思考:1, 有限次重复博弈能否通过冷酷战略破解囚徒困境问题? 2,具有唯一占优策略纳什均衡的无限次重复博弈的子博弈完美纳什均衡是纳什均衡的重复吗?,无限次重复博弈的无名氏定理,无限次重复博弈的无名氏定理的实质是一个存在性定理,4.3.3: 无限次重复古诺模型,假设:假设市场存在2个寡头,市场需求函数为p=8-q(q8),q=q1+q2。两个企业的边际成本都为2,不存在固定成本。两企业可以进行古诺竞争,与可以合作作为一个垄断企业。博弈重复无限次。 考虑以下三个问题: (1)保持垄断产量(冷酷策略)的条件; (2)冷酷策略条件不满足就一定要进行你死我活的竞争吗? (3)一定要冷酷到底吗?,支持垄断产量(冷酷策略)的条件,只有当企业采取偏离策略后的总收益小于不偏离的总收益,那么企业才不会偏离,即:,冷酷策略条件不满足就一定要进行你死我活的竞争吗?:低水平的合作,如果企业2偏离,企业1第二阶段对其进行惩罚,只生产产量x,企业2只能与之合作,否则第三阶段会继续被惩罚,因此企业2在第二阶段的利润只能是,非要冷酷到底吗?加大惩罚力度和提高合作水平,因此企业2只有在第一阶段偏离获利大于第二阶段的所受惩罚的损失的时候,企业2才会选择偏离。,4.3.4: 有效工资成立的条件是什么?,问题:在同一行业,为什么一些企业的工资高于其他企业?,触发策略,总结,我们分析的无限次重复博弈的原博弈都是完全信息博弈,如果原博弈是一个不完全信息博弈,无限次重复博弈的结果将会复杂很多; 重复博弈和声誉模型的联系与区别。,习题,1,举出生活中的一个重复博弈和一次性博弈效率不同的例子。 火车站及旅游景点的商店和生活区商店的价格。,2,重复两次下面的博弈,如果你是博弈方1,你该如何采取策略?,用画线法容易找出该博弈的两个纯策略纳什均衡(t,l)和(m,r)。这两个纳什均衡的得益都帕累托劣于(b,s)。一次性博弈中效率较高的(b,s)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(b,s),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用b;第二次重复时,如果前一次的结果是(b,s),则采用m,如果前一次的结果是其他,则采用t。 如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用s;第二次重复时,如果前一次的结果是(b,s),则采用r,否则采用l。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(b,s),提高了博弈的效率。,3,2次重复下面博弈。问能否有一个子博弈完美纳什均衡策略组合,实现第一阶段收益为(4,4)?如能,给出策略组合,如果不能,请说明为什么。如果(下,左)的收益改为(1,5)会发生什么变化,至少能在部分阶段实现收益(4,4)的条件是什么?,两个ne:(上,左),(中,中) 博弈方1:第一阶段下;第二阶段上 博弈方2:第一阶段右;第二阶段,如果第一阶段结果是(下,右),则选左,否则选中。 如果把(4,4)改为(1,5),不存在spne实现(4,4)。,4,求出下列静态博弈的纳什均衡,并说明有限次重复和无限次重复时博弈方1,2的策略。,首先很容易看出,博弈方1的d策相对于t策和m策都是严格下策,因此可以消去,消去博弈方1的d策后四个策略组合中不存在纯策略纳什均衡。根据混合策略纳什均衡的计算方法,不难算出混合策略纳什均衡为:博弈方1概率分布(1/2,1/2)在t和m中随机选择,博弈方2则以概率分布(1/3,2/3)在l和r中随机选择。 由于上述静态博弈是没有纯策略
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024时事政治试题库附有答案
- 2025年城市绿地规划与生态修复项目可行性研究报告及总结分析
- 2025年数字医疗解决方案项目可行性研究报告及总结分析
- 水热溶剂热技术研究
- 2025年员工健康管理解决方案项目可行性研究报告及总结分析
- 2025年一级注册建筑师之设计前期与场地设计考前冲刺模拟试卷B卷含答案
- 2025年企业级防火墙租赁协议
- 2025年农业生产智能管理平台项目可行性研究报告及总结分析
- 2025年配送服务协议(家具清洗)
- 2025年数字化内容创作与分发可行性研究报告及总结分析
- 违章记录表格式
- 供热管网系统管网水力平衡调节方法及步骤
- JJG 144-2007标准测力仪
- GB/T 29477-2012移动实验室实验舱通用技术规范
- GA/T 800-2008人身损害护理依赖程度评定
- 国家药监局医疗器械技术审评检查大湾区分中心第二批员额制人员公开招聘(广东)【共500题附答案解析】模拟检测试卷
- JJF1101-2019环境试验设备温度、湿度校准规范-(高清现行)
- 通达信函数大全整理
- 小升初英语衔接存在的问题及其对策优秀获奖科研论文
- 煤矿矿井废水处理设计方案
- 《数字电路逻辑设计》--逻辑函数及其化简练习习题
评论
0/150
提交评论