第四章 重复博弈_第1页
第四章 重复博弈_第2页
第四章 重复博弈_第3页
第四章 重复博弈_第4页
第四章 重复博弈_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 重复博弈重复博弈- -广告博弈广告博弈 l两个企业 (Kelloggs & General Mills) 的经理想最大化利润 l策略是广告活动 l同步博弈 l一次博弈 l无限重复博弈 l有限重复博弈 一次广告博弈一次广告博弈 通用面粉通用面粉 凯洛格凯洛格 策略策略无广告无广告中等强度中等强度高强度高强度 无广告无广告1212,12121 1,2020-1-1,1515 中等强度中等强度2020,1 16 6,6 60 0,9 9 高强度高强度1515,-1-19 9,0 02 2,2 2 一次广告博弈的均衡一次广告博弈的均衡 纳什均衡纳什均衡 通用面粉通用面粉 凯洛格凯洛格 策略策略无广告

2、无广告中等强度中等强度高强度高强度 无广告无广告1212,12121 1,2020-1-1,1515 中等强度中等强度2020,1 16 6,6 60 0,9 9 高强度高强度1515,-1-19 9,0 02 2,2 2 n劣策略:不管其他参与人采取什么策略,都能导致最低收益的策略 n理性参与人永远不会选择劣策略 n许多博弈中参与者都没有占优策略,但仍可能通过劣策略的重复剔 除进行分析,这种方法称劣策略重复剔除法 如果企业每年都进行这种一次博弈,并且永远进行下去,这时参与人可以对对如果企业每年都进行这种一次博弈,并且永远进行下去,这时参与人可以对对 手的手的“欺骗欺骗”行为进行惩罚或报复。在

3、这种情况下,共谋起作用吗?行为进行惩罚或报复。在这种情况下,共谋起作用吗? l密歇根大学爱克斯罗德教授的计算机模拟 他首先邀请全世界的学者递交自认为最优的策略程序,然后将这些策略相互之间交替进 行不特定次数的“重复囚徒博弈”,根据最终排名来判定优劣。第一轮14个程序之间的竞 赛结果显示,“一报还一报” 的简单策略获得第一。之后,又有63位科学家递交了改进 的程序,进行第二轮竞赛,其中包括多个以“一报还一报”策略为基础的改良品种。令人 惊异的是,第二轮比赛的优胜者仍然是“一报还一报”。 l触发策略 “如果对手在过去没有做过广告,我就不做;一旦对手作广告,自此以后,我就用高 强度的广告活动来惩罚他

4、” l事实上,只要对手在过去没有过“欺骗”行为,各个企业都会同意“合作”。因为欺骗行为会 引发以后所有时期的惩罚 无限重复博弈 假设假设General MillsGeneral Mills采用了这种触发策略,采用了这种触发策略, KelloggsKelloggs的利润是多少呢的利润是多少呢? ? 合作 = 12 +12/(1+i) + 12/(1+i)2 + 12/(1+i)3 + = 12 + 12/i相当于每年年底得到¥12的永久年金 欺骗 = 20 +2/(1+i) + 2/(1+i)2 + 2/(1+i)3 + = 20 + 2/i 通用面粉通用面粉 凯洛格凯洛格 策略策略无广告无广告

5、中等强度中等强度高强度高强度 无广告无广告1212,12121 1,2020-1-1,1515 中等强度中等强度2020,1 16 6,6 60 0,9 9 高强度高强度1515,-1-19 9,0 02 2,2 2 KelloggKellogg从欺骗行为中获得的好处从欺骗行为中获得的好处: : l欺骗 - 合作 = 20 + 2/i - (12 + 12/i) = 8 - 10/i 假设i = .05 l欺骗 - 合作 = 8 - 10/.05 = 8 - 200 = -192 l欺骗没有好处. 在无限次重复博弈中共谋是纳什均衡! 通用面粉通用面粉 凯洛格凯洛格 策略策略无广告无广告中等强度

6、中等强度高强度高强度 无广告无广告1212,12121 1,2020-1-1,1515 中等强度中等强度2020,1 16 6,6 60 0,9 9 高强度高强度1515,-1-19 9,0 02 2,2 2 欺骗行为的收益和成本欺骗行为的收益和成本 l如果 当前收益 未来成本的现值 欺骗行为是有利的 l如果 当前收益 未来成本的现值 欺骗行为没有好处 通用面粉通用面粉 凯洛格凯洛格 策略策略无广告无广告中等强度中等强度高强度高强度 无广告无广告1212,12121 1,2020-1-1,1515 中等强度中等强度2020,1 16 6,6 60 0,9 9 高强度高强度1515,-1-19

7、9,0 02 2,2 2 关键点关键点 l当博弈无限重复没有确定的“终结之日”时,共 谋作为纳什均衡就能够维持下去 l这需要: 有能力监督对手的行动 有惩罚叛徒的能力和名声 低利率 在未来进行博弈的机会多 共谋在现实世界中的例子共谋在现实世界中的例子 l垃圾搜集行业 l水表制造业 l石油输出国组织 l黑手党组织 说明说明 l根据谢尔曼反托拉斯法案第二节,共谋是违法的. l后果可能是罚款和坐牢 lOPEC是国际间组织,美国法律不适用于它 如果博弈有限重复进行,共谋起作用吗如果博弈有限重复进行,共谋起作用吗? ? 有限重复博弈有限重复博弈 假设广告博弈被重复两次 通用面粉通用面粉 凯洛格凯洛格 策

8、略策略无广告无广告中等强度中等强度高强度高强度 无广告无广告1212,12121 1,2020-1-1,1515 中等强度中等强度2020,1 16 6,6 60 0,9 9 高强度高强度1515,-1-19 9,0 02 2,2 2 纳什均衡 用逆向归纳法,结论是:不用逆向归纳法,结论是:不. . l在第二阶段,博弈是一次博弈,因此在这最后阶 段,均衡是高强度的广告活动. l由于每个人都知道第二阶段的结果,因此,第一 阶段就变成了最后阶段. l两个企业在两个时期的均衡策略都是高强度的广 告活动. l如果博弈重复已知的有限次数,同样的结果依然 成立 期末问题的应用期末问题的应用 l当参与方确切

9、地知道一个重复博弈什么时候结束时,期末 问题就出现了。由于无法在最后一次对对手违背协议行为 进行惩罚,因此参与方就会采取如同一次博弈的策略 l59岁现象 l辞职问题 l虚假广告 l火车站和旅游点的商贩 那一次的结果不是(A,A),则改为B并坚持 到底,最后两次重复与三次重复博弈后两次重 复的策略相同; 博弈方2:前99次选A,但从其中的第二次开始, 一旦发现那一次的结果不是(A,A),则改 为B并坚持到底,最后两次重复与三次重复博 弈后两次重复的策略相同; 双方的每阶段的平均得益是(993+1+4) /101=2.99,非常接近效率最高的得益(3,3) 123 , 21 123 1 t t t 2 5 115/(1) 2 4444/(1) 1/4 1/4 1 ( ,) n xx 2 /(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论