版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二部分: 完全信息动态博弈第八章第八章 重复博弈重复博弈 主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng第八章第八章 重复博弈重复博弈 主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng一、有限重复博弈 重复博弈所关心的议题: 将来可信的威胁或承诺如何影响到当前的行动Con
2、trol Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng考察下列博弈1,15,00,54,4UDLR12Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 上述博弈存在唯一的Nash均衡。 将上述博弈重复两次,其中第二次博弈开始时,第一次博弈的结果已知。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng两
3、次重复博弈的博弈树121Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 上述重复博弈只存在唯一的Nash均衡:在每次博弈中,参与人1都选择U,参与人2都选择L,即( (U, U, U, U, U), (L, L, L, L, L) ) 可以证明:该均衡为精炼Nash均衡。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1,15,00,54,4UDLR121,15,00,54,4UDLR1
4、21+1,1+1 5+1,0+10+1,5+1 4+1,4+1UDLR12Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 前面的分析说明:在两次重复博弈中,合作仍无法到达。 同样可证明:在n阶段重复博弈(即博弈重复n次且每次博弈开始时,前面博弈的结果都已知)中,合作同样无法到达。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng重复博弈定义 对于给定的阶段博弈G,令G(T)表示G重复进行T
5、次的有限重复博弈,并且在下一此博弈开始前,所有以前博弈的进程都可被观测到, G(T)的收益为T次阶段博弈收益的简单相加。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在重复博弈中,当全部博弈进行到任何一个阶段,到此为止的进行过程就成为参与各方的共同知 识,而其后尚未开始进行的部分就是一个子博弈。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng定理: 如果阶段博弈G有唯一的Nash均衡,
6、则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡结果在每一个阶段重复进行。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng考察下列博弈1,15,00,00,54,40,00,00,03,3121L2L1M1R2M2RControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 上述博弈存在两个Nash均衡: (L1 , L2)和(R1 , R2) 将上述博弈重复两次。Cont
7、rol Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 1) 战略: 每个局中人都有个战略;(1+9)3= 59049Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 2) 战略组合: 一共存在 个战略组合; 59049 59049=3,486,784,401Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunf
8、eng 3) 均衡: 可以根据以下原则构造均衡: 由第一阶段的结果,预测第二阶段的均衡。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng例如: 若第一阶段出现(M1,M2)(即出现合作),则第二阶段为(R1,R2)(即“好的均衡”); 若第一阶段没有出现(M1, M2 ), 则第二阶段为(L1,L2)(即“差的均衡”)。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng根据上述原则,可构
9、造如下策略:S1:第一阶段选择M1;如第一阶段结果为(M1,M2),则下一阶段选R1;否则选择L1。S2:第一阶段选择M2;如第一阶段结果为(M1,M2) ,则下一阶段选R2;否则选择L2。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在上述策略下,博弈可表示为:这意味着:合作可以在第一阶段达到1+1,1+1 5+1,0+1 0+1,0+10+1,5+1 4+3,4+3 0+1,0+10+1,0+1 0+1,0+1 3+1,3+1121L2L1M1R2M2RControl Science
10、 and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 定理: 如果G= 是一个有多个Nash均衡的完全信息静态博弈,则G(T)可以存在子博弈精炼解,其中对每一 t(1)2 sssssssss当时,参与人1接受参与人2的建议。而当 时,参与人2可得1-。由于1-,所以参与人 会在第二阶段提出自己的最优建议 。此时参与人1接受建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 考察参与人1在第一阶段的最优选择。 参与人1在
11、第一阶段即可预测到参与人2在第二阶段的最优选择2ss Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng211 1-1-(1)1(1)1ssssssss 由于参与人2的选择为 时,参与人1接受其建议,且自己可得。而相当于第一阶段的,所以参与人1在第一阶段提出的 满足如下条件, 则参与人2将会接受参与人 的建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng11(1)1ss 所以 时,则参与
12、人2将会接受参与人 的建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng11221(1) 1(1) 1 ssssss 当 时, Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng111(1) 1(1)ssss 这意味着:当 -时,参与人1的所获大于博弈进入第二阶段的所获,且此时参与人2接受自己的建议。因此,参与人1在第一阶段的最优选择为:-Control Science and Engi
13、neering, HUST All Rights Reserved, 2007, Luo Yunfeng11(1)ss 因此博弈的均衡结果为:参与人1在第一阶段建议 ,参与人2接受该建议。 博弈结束。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng假设参与人的贴现率分别为: 首先考察参与人2的最优选择。 12, 。212 ss 参与人 在第二阶段提出自己的最优建议此时参与人1接受建议。Control Science and Engineering, HUST All Rights Reser
14、ved, 2007, Luo Yunfeng 考察参与人1在第一阶段的最优选择。 1121(1)1sss参与人1在第一阶段提出的 满足如下条件 1-则参与人2将会接受参与人的建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1211(1)1ss 所以 时,则参与人2将会接受参与人 的建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng121121212121(1) 1(1) 1 ss
15、ssss 当 时,+Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng121 1(1)ss参与人1在第一阶段的最优选择为:Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1211(1)ss因此博弈的均衡结果为:参与人1在第一阶段建议 ,参与人2接受该建议。 博弈结束。Control Science and Engineering, HUST All Rights Reserved, 2007
16、, Luo Yunfeng 考虑以上述讨价还价博弈为阶段博弈的无限重复博弈。 假设贴现率为 。12,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 由于在无限重复博弈 中,由 t+1 阶段开始的每个子博弈都等同于初始博弈 ,因此,从第 t 阶段开始的子博弈等同于 t+2 阶段开始的子博弈。(,)G(,)GControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng212122( ,1- )( ,1-
17、 ) 1(1)1 1tsstsssss 假设从阶段开始的子博弈的均衡解为,所以,从 阶段开始的子博弈的均衡解为。由三阶段讨价还价博弈的均衡可得:所以Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng221212121()11 因此,以上述三阶段讨价还价博弈为阶段博弈的无限重复博弈的均衡为: ,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 从均衡结果可以看到:每个参与人在博弈中的所得都随自
18、己的贴现率(即自己的耐心)增大而增加,随对方的贴现率(即对方的耐心)的减少而增加。 这说明在讨价还价博弈中,耐心越大越有利,越不耐心越不利!Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 进一步讨论均衡结果与参与人贴现率的关系。2112 1. 111 2. 102ss给定 ,当时,参与人 得到整个蛋糕(即一美元);给定 ,当时,参与人 得到整个蛋糕(即一美元);Control Science and Engineering, HUST All Rights Reserved, 2007,
19、Luo Yunfeng 从上述分析可以看到:有绝对耐心的参与人总可以通过拖延时间使自己独吞整个蛋糕。这种“耐心优势”在一般情况也成立:给定其他条件(如参与人的出价次序),越有耐心的参与人得到的份额越大。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng120.50.9210.18210.812ss 比如说,令, ,即假定参与人 比 更有耐心,则均衡结果为: , Control Science and Engineering, HUST All Rights Reserved, 2007, Lu
20、o Yunfeng123.1112“”s 令,所以 因此,在讨价还价博弈中,存在所谓的 先动优势 。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1220 01211“” 特别地,当,时,参与人 得不到整个蛋糕,除非。就是说没有任何耐心的参与人 总可以得到一点份额。 这也是 先动优势 的一种体现。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 4. 贴现率还可以理解为讨价还价的一种成本,类似蛋糕随时间的推延而不断缩小,每一论讨价还价的总成本与剩余的蛋糕成比例。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 讨价还价的成本可以分为两类:固定成本和变动成本。贴现率可以认为是变动成本,参与人每出一次价,蛋糕都要按一定比例(贴现率)缩小。Control Science and Engi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三角形一边一角模型研究课件-2026届高三数学二轮专题复习
- 第四医院考试题目及答案
- 2026五年级数学下册 2的倍数特征
- 2026年地理中考试卷真题及答案
- 2026八年级下语文当代文学常识学习
- 2026二年级数学 北师大版儿童乐园除法入门
- 供应业务审计制度
- 人工智能生成内容标识制度
- 2025 高中信息技术数据与计算在化学分析课件
- 小学小组奖惩制度范本
- 建筑工程项目部 2026 年春节节后复产复工实施方案
- T∕CNCA 128-2025 露天煤矿土石方剥离综合单价确定方法
- 《婚姻家庭继承法(第八版)》课件全套 房绍坤
- 轮状病毒性肠炎护理查房
- 自由落体运动实验报告
- 转基因的科学-基因工程知到章节答案智慧树2023年湖南师范大学
- YC/T 380-2010烟草及烟草制品铬、镍、砷、硒、镉、铅的测定电感耦合等离子体质谱法
- GB/T 8554-1998电子和通信设备用变压器和电感器测量方法及试验程序
- 2023年初中信息技术等级考试模拟试题练习题
- 二年级数学下册课件-6 有余数的除法-解决问题30-人教版11张PPT
- 班主任专业能力大赛书面测试小学组
评论
0/150
提交评论