第8章 重复博弈_第1页
第8章 重复博弈_第2页
第8章 重复博弈_第3页
第8章 重复博弈_第4页
第8章 重复博弈_第5页
已阅读5页,还剩120页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二部分: 完全信息动态博弈第八章第八章 重复博弈重复博弈 主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng第八章第八章 重复博弈重复博弈 主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng一、有限重复博弈 重复博弈所关心的议题: 将来可信的威胁或承诺如何影响到当前的行动Con

2、trol Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng考察下列博弈1,15,00,54,4UDLR12Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 上述博弈存在唯一的Nash均衡。 将上述博弈重复两次,其中第二次博弈开始时,第一次博弈的结果已知。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng两

3、次重复博弈的博弈树121Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 上述重复博弈只存在唯一的Nash均衡:在每次博弈中,参与人1都选择U,参与人2都选择L,即( (U, U, U, U, U), (L, L, L, L, L) ) 可以证明:该均衡为精炼Nash均衡。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1,15,00,54,4UDLR121,15,00,54,4UDLR1

4、21+1,1+1 5+1,0+10+1,5+1 4+1,4+1UDLR12Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 前面的分析说明:在两次重复博弈中,合作仍无法到达。 同样可证明:在n阶段重复博弈(即博弈重复n次且每次博弈开始时,前面博弈的结果都已知)中,合作同样无法到达。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng重复博弈定义 对于给定的阶段博弈G,令G(T)表示G重复进行T

5、次的有限重复博弈,并且在下一此博弈开始前,所有以前博弈的进程都可被观测到, G(T)的收益为T次阶段博弈收益的简单相加。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在重复博弈中,当全部博弈进行到任何一个阶段,到此为止的进行过程就成为参与各方的共同知 识,而其后尚未开始进行的部分就是一个子博弈。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng定理: 如果阶段博弈G有唯一的Nash均衡,

6、则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡结果在每一个阶段重复进行。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng考察下列博弈1,15,00,00,54,40,00,00,03,3121L2L1M1R2M2RControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 上述博弈存在两个Nash均衡: (L1 , L2)和(R1 , R2) 将上述博弈重复两次。Cont

7、rol Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 1) 战略: 每个局中人都有个战略;(1+9)3= 59049Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 2) 战略组合: 一共存在 个战略组合; 59049 59049=3,486,784,401Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunf

8、eng 3) 均衡: 可以根据以下原则构造均衡: 由第一阶段的结果,预测第二阶段的均衡。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng例如: 若第一阶段出现(M1,M2)(即出现合作),则第二阶段为(R1,R2)(即“好的均衡”); 若第一阶段没有出现(M1, M2 ), 则第二阶段为(L1,L2)(即“差的均衡”)。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng根据上述原则,可构

9、造如下策略:S1:第一阶段选择M1;如第一阶段结果为(M1,M2),则下一阶段选R1;否则选择L1。S2:第一阶段选择M2;如第一阶段结果为(M1,M2) ,则下一阶段选R2;否则选择L2。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在上述策略下,博弈可表示为:这意味着:合作可以在第一阶段达到1+1,1+1 5+1,0+1 0+1,0+10+1,5+1 4+3,4+3 0+1,0+10+1,0+1 0+1,0+1 3+1,3+1121L2L1M1R2M2RControl Science

10、 and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 定理: 如果G= 是一个有多个Nash均衡的完全信息静态博弈,则G(T)可以存在子博弈精炼解,其中对每一 t(1)2 sssssssss当时,参与人1接受参与人2的建议。而当 时,参与人2可得1-。由于1-,所以参与人 会在第二阶段提出自己的最优建议 。此时参与人1接受建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 考察参与人1在第一阶段的最优选择。 参与人1在

11、第一阶段即可预测到参与人2在第二阶段的最优选择2ss Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng211 1-1-(1)1(1)1ssssssss 由于参与人2的选择为 时,参与人1接受其建议,且自己可得。而相当于第一阶段的,所以参与人1在第一阶段提出的 满足如下条件, 则参与人2将会接受参与人 的建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng11(1)1ss 所以 时,则参与

12、人2将会接受参与人 的建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng11221(1) 1(1) 1 ssssss 当 时, Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng111(1) 1(1)ssss 这意味着:当 -时,参与人1的所获大于博弈进入第二阶段的所获,且此时参与人2接受自己的建议。因此,参与人1在第一阶段的最优选择为:-Control Science and Engi

13、neering, HUST All Rights Reserved, 2007, Luo Yunfeng11(1)ss 因此博弈的均衡结果为:参与人1在第一阶段建议 ,参与人2接受该建议。 博弈结束。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng假设参与人的贴现率分别为: 首先考察参与人2的最优选择。 12, 。212 ss 参与人 在第二阶段提出自己的最优建议此时参与人1接受建议。Control Science and Engineering, HUST All Rights Reser

14、ved, 2007, Luo Yunfeng 考察参与人1在第一阶段的最优选择。 1121(1)1sss参与人1在第一阶段提出的 满足如下条件 1-则参与人2将会接受参与人的建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1211(1)1ss 所以 时,则参与人2将会接受参与人 的建议。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng121121212121(1) 1(1) 1 ss

15、ssss 当 时,+Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng121 1(1)ss参与人1在第一阶段的最优选择为:Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1211(1)ss因此博弈的均衡结果为:参与人1在第一阶段建议 ,参与人2接受该建议。 博弈结束。Control Science and Engineering, HUST All Rights Reserved, 2007

16、, Luo Yunfeng 考虑以上述讨价还价博弈为阶段博弈的无限重复博弈。 假设贴现率为 。12,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 由于在无限重复博弈 中,由 t+1 阶段开始的每个子博弈都等同于初始博弈 ,因此,从第 t 阶段开始的子博弈等同于 t+2 阶段开始的子博弈。(,)G(,)GControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng212122( ,1- )( ,1-

17、 ) 1(1)1 1tsstsssss 假设从阶段开始的子博弈的均衡解为,所以,从 阶段开始的子博弈的均衡解为。由三阶段讨价还价博弈的均衡可得:所以Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng221212121()11 因此,以上述三阶段讨价还价博弈为阶段博弈的无限重复博弈的均衡为: ,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 从均衡结果可以看到:每个参与人在博弈中的所得都随自

18、己的贴现率(即自己的耐心)增大而增加,随对方的贴现率(即对方的耐心)的减少而增加。 这说明在讨价还价博弈中,耐心越大越有利,越不耐心越不利!Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 进一步讨论均衡结果与参与人贴现率的关系。2112 1. 111 2. 102ss给定 ,当时,参与人 得到整个蛋糕(即一美元);给定 ,当时,参与人 得到整个蛋糕(即一美元);Control Science and Engineering, HUST All Rights Reserved, 2007,

19、Luo Yunfeng 从上述分析可以看到:有绝对耐心的参与人总可以通过拖延时间使自己独吞整个蛋糕。这种“耐心优势”在一般情况也成立:给定其他条件(如参与人的出价次序),越有耐心的参与人得到的份额越大。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng120.50.9210.18210.812ss 比如说,令, ,即假定参与人 比 更有耐心,则均衡结果为: , Control Science and Engineering, HUST All Rights Reserved, 2007, Lu

20、o Yunfeng123.1112“”s 令,所以 因此,在讨价还价博弈中,存在所谓的 先动优势 。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1220 01211“” 特别地,当,时,参与人 得不到整个蛋糕,除非。就是说没有任何耐心的参与人 总可以得到一点份额。 这也是 先动优势 的一种体现。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 4. 贴现率还可以理解为讨价还价的一种成本,类似蛋糕随时间的推延而不断缩小,每一论讨价还价的总成本与剩余的蛋糕成比例。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 讨价还价的成本可以分为两类:固定成本和变动成本。贴现率可以认为是变动成本,参与人每出一次价,蛋糕都要按一定比例(贴现率)缩小。Control Science and Engi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论