博弈论与信息经济学6-重复博弈_第1页
博弈论与信息经济学6-重复博弈_第2页
博弈论与信息经济学6-重复博弈_第3页
博弈论与信息经济学6-重复博弈_第4页
博弈论与信息经济学6-重复博弈_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。—重复博弈华东理工大学商学院E-mail:scqian@QianShichao钱世超不存款存款到期客户1客户2(1,1)存款不存款提前不存款客户1到期提前到期提前客户2(1,1)(1,1)(1.2,1.2)(0.6,1)(1,0.6)(0.8,0.8)存款GameTheory&InformationEconomics博弈论与信息经济学博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。重复博弈:指同样结构的博弈重复多次重复博弈的特征:前一阶段的博弈不改变后一阶段的结构;所有参与人都观测到博弈过去的历史;参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。重复博弈有限次重复博弈无限次重复博弈博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。有限次重复博弈定义对给定一个基本博弈G(静态博弈,或动态博弈),重复进行T次G,且每次重复G之前,各参与人都能观察到以前参与人的行动与博弈结果,这样的博弈过程称为G的T次重复博弈,记为G(T)策略:每位参与人在各阶段行为选择形成的链策略路径:各参与人策略交互形成的路径均衡路径:双方策略路径构成均衡子博弈精炼纳什均衡形成的路径是均衡路径博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。惟一纳什均衡博弈的有限次重复博弈惟一纳什均衡博弈纯策略均衡博弈混合策略均衡博弈博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。参与人2LM参与人1L1,15,0M0,54,4参与人2LM参与人1L1,15,0M0,54,4参与人2LM参与人1L1,15,0M0,54,4参与人2LR参与人1L1,-1-1,1R-1,11,-1参与人2LR参与人1L1,-1-1,1R-1,11,-1参与人2LR参与人1L1,-1-1,1R-1,11,-1…………逆向递归(L,L)(L,L)(L,L)逆向递归(0.5,0.5)(0.5,0.5)(0.5,0.5)定理如果基本博弈G有惟一的纳什均衡,T为有限,则每一阶段各参与人的均衡策略构成重复博弈G(T)的惟一子博弈精炼纳什均衡策略。博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。困惑与思考:理论与实践直觉的不一致参与人2LM参与人1L1,15,0M0,54,4参与人2LM参与人1L1,15,0M0,54,4参与人2LM参与人1L1,15,0M0,54,4……是否有合作机会?“连锁店悖论”(Selton,1978)(3,-2)(5,5)不进入(10,1)进入和平价格战企业B企业A(3,-2)(5,5)不进入(10,1)进入和平价格战企业B企业A(3,-2)(5,5)不进入(10,1)进入和平价格战企业B企业A……实践中,参与人决策的依据逻辑是什么?博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。多重纳什均衡博弈的有限次重复博弈LMRL1,15,00,0M0,54,40,0R0,00,03,3LMRL1,15,00,0M0,54,40,0R0,00,03,3LMRL1,15,00,0M0,54,40,0R0,00,03,3……二重纯策略纳什均衡N次重复博弈策略:每位参与人有3N个纯策略+混合策略策略路径:共有3N×3N个纯策略路径+其它策略路径定理:双方的策略路径使得每一阶段的博弈均为纳什均衡,该策略路径必为均衡策略路径。LMRL1,15,00,0M0,54,40,0R0,00,03,3二重纯策略纳什均衡2次重复博弈LMRL4,48,33,3M3,87,73,3R3,33,36,6LMRL2,26,11,1M1,65,51,1R1,11,14,4LMRL1,15,00,0M0,54,40,0R0,00,03,3博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。有限次重复博弈中的触发策略(报复机制)LMRL1,15,00,0M0,54,40,0R0,00,03,3LMRL1,15,00,0M0,54,40,0R0,00,03,3二重纯策略纳什均衡2次重复博弈参与人1:第一次选M,如第一次结果为(M,M),

则第二次选R;否则第二次选L参与人2:同参与人1考虑双方策略:LMRL2,26,11,1M1,67,71,1R1,11,14,4其余子博弈精炼均衡:((L,L),(L,L))((R,R),(L,L))((M,M),(R,R))一般结论:对于基础博弈G有多个纳什均衡的G(T),可以存在子博弈精炼解,其中对每一t<T,t阶段的结果都不是G的纳什均衡。博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。厂商市场选择问题:两次重复厂商2AB厂商1A3,31,4B4,10,0纳什均衡:纯策略:(B,A)→(4,1)(A,B)→(1,4)混合策略:(0.5,0.5)→(2,2)两次重复:每阶段选择任一纳什均衡均可构成6种均衡路径结果。(4,1)(3,1.5)(2,2)(2.5,2.5)(1.5,3)(1,4)(3,3)阶段平均收益厂商1厂商2不可实现的最佳结果ABA4,72,8B5,51,4ABA7,45,5B8,24,1ABA5,53,6B6,32,2第二阶段:(A,B)第二阶段:(B,A)第二阶段:(0.5,0.5)第一阶段:触发策略不可实现:如果第一阶段不是(A,A),第二阶段选B,但(B,B)不是均衡博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。厂商市场选择问题:三次重复考虑双方触发策略:第一阶段选A第二阶段如第一阶段结果是(A,A),选A;如第一阶段结果是(A,B),选B第三阶段选B第一阶段选A第二阶段选B第三阶段如第一阶段结果是(A,A),选A;如第一阶段结果是(B,A),选B厂商1厂商2ABA3,31,4B4,10,0ABA3,31,4B4,10,0ABA3,31,4B4,10,0双方平均收益:厂商1=(3+1+4)/3=8/3;厂商2=8/3如果一方维持策略不变,另一方在不同阶段选择其它行动,结果如何?是否存在其它策略组合,可以获得帕累托效率?博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。厂商市场选择问题:n+2次重复考虑双方触发策略:第1阶段选A第2~n+1阶段如前一阶段结果是(A,A),选A;如前一阶段结果是(A,B),选B第n+2阶段选B第1阶段选A第2~n阶段如前一阶段结果是(A,A),选A;如前一阶段结果是(B,A),选B第n+1阶段选B第n+2阶段如n阶段结果是(A,A),选A;如前一阶段结果是(B,A),选B厂商1厂商2ABA3,31,4B4,10,0ABA3,31,4B4,10,0ABA3,31,4B4,10,0双方平均收益=(3n+1+4)/(n+2)=3-1/(n+2)3ABA3,31,4B4,10,0……博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。有限次重复博弈的无名氏(民间)定理(4,1)(1,1)(1,4)(3,3)阶段平均收益厂商1厂商2不可实现的最佳结果(0,0)可实现收益:所有纯策略的凸组合的收益。图中(0,0)、(1,4)、(3,3)、(4,1)所围区域个体理性收益:博弈方选择特定策略可获得的最

低收益之组合w=(w1,w2)=(1,1)定理:若基本博弈有均衡收益组合优于w,则所有不小于个体理性收益的可实现收益,都可以在重复博弈中,通过某个子博弈精炼纳什均衡的极限的平均收益来实现或逼近。博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。无限次重复博弈定义对给定一个基本博弈G,重复进行∞次,参与者以现值为收益(贴现因子均为δ),且每次重复G之前,各参与人都能观察到以前参与人的行动与博弈结果,这样的博弈过程称为G的无限次重复博弈,记为G(∞,δ)博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。参与人2LM参与人1L1,15,0M0,54,4参与人2LM参与人1L1,15,0M0,54,4参与人2LM参与人1L1,15,0M0,54,4无限重复囚徒困境博弈考虑双方均采用触发策略:第一阶段选择M。如果t阶段结果为(M,M),

则t+1阶段继续选择M,否则永远选L(M,M)(M,M)(M,L)或(L,M)(L,L)(L,L)(M,M)…….(M,M)(M,M)…….(M,M)(M,M)…….…….t阶段无限重复博弈t阶段两种选择相应收益:选择L:选择M:保持M策略的条件:即结论:只要δ足够大,合作可以成为子博弈精炼纳什均衡,实现帕累托效率博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。无限次重复博弈的无名氏(民间)定理定理:若G是一个完全相信静态博弈,用记G的纳什均衡收益,用表示G的任意可实现收益。如果对任意博弈方i都成立,而δ足够接近1,那么无限次重复博弈G(∞,δ)中一定存在一个子博弈精炼纳什均衡,各方博弈的平均收益是。(5,0)(1,1)(0,5)(4,4)阶段平均收益厂商1厂商2不可实现的最佳结果(0,0)博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。两个企业生产同质产品,产量分别为q1和q2;市场出清价格p=8-(q1+q2);产品边际成本为2,固定成本为0;两个企业同时进行产量决策,以实现各自利润最大化。Cournot(1838)模型的无限次重复博弈

---维持垄断产量合作一次性博弈结果:(2,2)q1q2(0,0)独家垄断结果:33垄断价格线合作t阶段两种选择相应收益:选择2.25:选择1.5:保持1.5策略的条件:即考虑双方均采用触发策略:t阶段前双方均选择。如果t阶段结果为(1.5,1.5),

则t+1阶段继续选择1.5;如果一方偏离1.5而选2.25,则另一

方采取惩罚,永远选2。博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。Cournot(1838)模型的无限次重复博弈

---一般情况分析(2,2)q1q2(0,0)33垄断价格线考虑q1=q2=q状态的合作机会时有合作机会qπ03211.544.5t阶段前双方均选择。如果t阶段结果为(q,q),

则t+1阶段继续选择q;如果一方偏离q而选

,则另一方采取惩罚,永远选2。考虑双方均采用触发策略:博弈论与信息经济学.Copyright©2015ECUST.Allrightsreserved.华东理工大学版权所有,翻印必究。t阶段两种选择相应收益:选择:选择q:合作条件:qδ03211.50.51结论:9/17当时,双方在q=1.5合作并运用触发策略,可以获得收益最高的子博弈精炼均衡当时,双方在

合作并运用触发策略,可以获得收益最高的子博弈精炼均衡想想OPEC产量限额问题博弈论与信息经济学.Copyrig

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论