[小学教育]重复博弈.ppt_第1页
[小学教育]重复博弈.ppt_第2页
[小学教育]重复博弈.ppt_第3页
[小学教育]重复博弈.ppt_第4页
[小学教育]重复博弈.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 1、重复博弈的定义及特征 (1) 定义: 重复博弈指同样结构的博弈重复多次, 其中每次博弈称为阶段博弈。 (2) 特征: A、阶段博弈之间没有“物质”上的联系,即 前一阶段的博弈不改变后一阶段博弈的结构; B、所有参与人都观测到博弈过去的历史; C、参与人的总支付是所有阶段博弈支付的 贴现值之和或加权平均值。 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 2、有限次重复博弈 (1)定义 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 (2)相关概念 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 重复博弈的得益 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 (3)定理1 在G中得益的T倍,平均每阶段得益等于原博弈G中的得益。 例:有限次重复囚徒困境博弈 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 如果我们以该博弈作为原博弈G进行重复博弈, 结果是否会与一次性博弈有所不同,还是仍然是一次 性博弈的简单重复呢? 如果重复的次数是两次,则该重复博弃的现实意 义可以理解为官方给这两个囚徒两次机会,他们最后 的得益(被关年数的负值表示的负效用)是两个阶段博 弈中各自得益之和(当然在第二阶段开始之前是让每 个囚徒知道上一阶段另一囚徒选择的)。 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 分析: 因为重复博弈的全过程是一种动态博弈过程,因此我 们用逆推归纳法来分析双方在各阶段的选择。先看第 二阶段,即后一次博弈。第二阶段博弈本身仍然是两 囚徒之间的一个囚徒的困境博弈,此时,前一阶段的 结果已成为既成事实而在此阶段之后又不再有任何 的后续阶段,因此实现自身在本阶段中的最大利益是 两博弈方在该阶段决策的唯一原则,所以,不管前一 阶段博弈的结果如何,第二阶段博弈的唯一结果就是 原博弈的一次性博弈的唯一的纳什均衡(坦白,坦白) ,双方的得益为(一5,一5)。 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 现在我们再回到前一阶段,即第一个阶段。在第一 阶段,两博弈方对后一阶段将会出现的结果是一清 二楚的,都知道双方在第二阶段将得到一5的得益, 因此此时双方都知道整个两次重复博弈的结果,双 方的最终得益肯定就是在本阶段的双方得益上各加 一个(一5)。因此,该重复博弈实际上与一次性博 弈是等价的。 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 (4) 多个纯策略纳什均衡博弈的有限次重复博弈 5,5 3,3 2,0 0,2 2,0 6,0 0,20,6 1,1 H M H 厂商2 ML 厂 商 1 L 三种可选战略博弈 2,23,13,1 1,34,47,1 1,31,78,8厂 商 1 厂商2 L M H HML 两次重复三种可选战略博弈的等价模型 触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复 博弈方1:第一次选h;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博伊方1 例1 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 两市场博弈的重复博弈(重复两次) (A,B)+(A,B) OR (B,A)+(B,A)(1,4)(4,1) 连续两次采用混合策略(2,2) (A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)轮换策略 一次纯策略+一次混合策略(1.5,3)(3,1.5) 0,04,1 1,33,3 厂 商 1 厂商2 B A AB 两市场博弈 厂商2 得益 厂商1得益 (1,4) (3,3) (2.5,2.5) (2,2) (3,1.5) (4,1) (1.5,3) 例2 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 进一步,我们可把二次重复两市场博弈推广到任意有限 次重复,就说l 01次。这时,厂商1的策略是在前99次中都选A ,但一旦发现哪次出现结果(A,B),则改选并坚持B到底,最 后二次与二次重复的后两次一样;厂商2的策略也是前99次都 选A,但一旦发现哪次出现结果(B,A),则以后每次都选B, 最后二次与二次重复的后两次一样。同样的道理,这也是子 博弈完美纳什均衡路径。双方平均得益都等于 (993十l十4)101299,非常接近于最优结果(3,3)。 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 (5) 有限次重复博弈的民间定理 个体理性得益:不管其它博弈方的行为如何,一博弈方在 某个博弈中只要自己采取某种特定的策略,最低限度保证 能获得的得益。 可实现得益:博弈中所有纯策略组合得益的加权平均数组 定理:设原博弈的一次性博弈有均衡得益数组优于w,那 么在该博弈的多次重复中所有不小于个体理性得益的可实 现得益,都至少有一个子博弈完美纳什均衡的极限的平均 得益来实现它们。 注:w表示最差均衡得益数组. Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 例 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 3、无限次重复博弈 (1)特征 无限次重复博弈的特征是不存在可作为最后一 阶段的最后一次重复。 (2)分析无限次重复博弈的难点 一是普通的逆推归纳法无法直接运用; 二是在无限次重复中,各博弈方的各阶段得益的 总和常常是趋向无穷大的,在分析无限次重复博弈 时该用什么作判断依据。 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 (3)无限次重复博弈及得益的定义 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 可实现得益: 可实现得益实际上就是阶段博弈各种纯战略组 合得益的加权平均所构成的得益组合,其中权 数非负且总和为1。我们用(x1, x2, xn)来记 一个可实现得益。不同的权数结构就可构成不 同的可实现得益,一博弈的全体可实现得益组 合对应的坐标平面(两个以上博弈方时就是空间 的区域)上的点构成一定的面积。 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 例: Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 可实现得益 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 平均得益: Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 (4)无名氏定理 设G是一个完全信息的静态博弃。用(e1,, en) 记G的一个纳什均衡取得的得益,用(x1, xn)表示 的任意可实现得益如果xiei,对任意博弈方i都成 立,而足够接近1,那么无限重复博弈G(, )中 一定存在一个子博弈完美的纳什均衡路径能实现各博 弈方的平均得益为(x1, xn) 。 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 上例的无名氏定理 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 () 两人零和博弈的无限次重复博弈 两人零和博弈无限次重复的所有阶段都不 可能发生合作,博弈方会一直重复原博弈 的混合策略纳什均衡 Date经济管理学院 曹正勇 Game Theory and Information Economics Game Theory and Information Economics Game Theory and Information Economics 博弈论与信息经济学 ()触发策略冷酷战略(grim strategy) 博弈

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论