完全且完美信息动态博弈课件_第1页
完全且完美信息动态博弈课件_第2页
完全且完美信息动态博弈课件_第3页
完全且完美信息动态博弈课件_第4页
完全且完美信息动态博弈课件_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 完全且完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。本章分六节3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论3.1 动态博弈的表示法和特点3.1

2、.1 阶段和扩展性表示3.1.2 动态博弈的基本特点3.1.1 阶段和扩展性表示阶段:动态博弈中一个博弈方的一次选择行为例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2 动态博弈的基本特点策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合,构成一条路径得益对应每条路径,而不是对应每步选择、行为动态博弈的非对称性先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利,有“先行优势”。3.2 可信性和纳什均衡的问题3.2.1 相机选择和策略中的可信性问题3.2.2 纳什均衡的问

3、题3.2.3 逆推归纳法3.2.1 相机选择和策略中的可信性问题不同版本的开金矿博弈分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈分钱打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈分钱打官司都不可信3.2.2 纳什均衡的问题 第三种开金矿博弈中, (不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中

4、可能是不稳定的,不能作为预测的基础。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题3.2.3 逆推归纳法定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。乙不借借(1,0)甲不分分(0,4)(2,2)3.3 子博弈和子博弈完美纳什均衡3.3.1 子博弈3.3.2 子博弈完美纳什均衡3.3.1 子博弈定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,

5、能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2 子博弈完美纳什均衡定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。3.4 几个经典动态博弈模型3.4.1 寡占的斯塔克博格模型3.4.2 劳资博弈3.4.3 讨价还价博弈3.4.4 委托人代理人

6、理论3.4.1 寡占的斯塔克博格模型先后选择产量的产量竞争博弈把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。222126qqqq-= 产量 得益厂商1 3单位 4.5厂商2 1.5单位 2.25先行优势3.4.2 劳资博弈先由工会决定工资率,再由厂商决定雇用多少劳动力RL0W L厂商的反应函数R(L)斜率为WLW0工会的误差异曲线3.4.3 讨价还价博弈三回合讨价还价112不接受,出S接受不接受,出S2接受出S1三回合讨价还价博弈结果的讨论无限回合讨价还价3.4.4 委托人代理人理论一、委托人代理人关系经济活动和社会活动中有很多委托人代理人关系,有明显的,也有隐蔽的。工厂和工人、

7、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。委托人代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性委托人代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等二、无不确定性的委托人代理人模型R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0R(0),0122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束: w(E)-E w(S)-S w(E) w(S)+E-S参与约束:22R(E)-w(E), w(E)-E拒绝接受拒绝接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w

8、(S)-S0参与约束委托人的选择11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10-S)接受:0.9*w(20)-E+0.1*w(10)-E0委托:0.9*20-w(20)+0.1*10-w(10)0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条

9、件参与约束对于委托人来说,就是要根据上述两个条件,以及 E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20) -w(10)五、选择报酬和连续努力水平的 委托人代理人博弈R, CC(e) +R(e)委托人希望的代理人努力水平(满足参与约束)店主和店员的问题商店的利润 , 是均值为0的随机变量店员的负效用 , 是店员的努力机会成本为1店主采用的报酬计算公式店员的得益店员期望得益为店主的得益为参与约束:当店员风险中性时 符合其最大利益店主选择下限 代入得益公式得: ,期望得益为 ,易求得令 得 ,再代入参与约束得 ,求数学期望得 解得 ,则店主的最优激励工资计算公式是3.5

10、 有同时选择的动态博弈模型3.5.1 标准模型3.5.2 间接融资和挤兑风险3.5.3 国际竞争和最优关税3.5.4 工资奖金制度3.5.1 标准模型博弈中有四个博弈方,分别称为博弈方1、博弈方2、博弈方3和博弈方4第一阶段是博弈方1和博弈方2的选择阶段,他们同时在各自的可选策略(行为)集合 和 中分别选择 和 第二阶段是博弈方3和博弈方4的选择阶段,他们在看到博弈方1和博弈方2的选择 和 以后,同时在各自的可选策略(行为)集合 和 中分别选择 和各博弈方的得益都取决于所有博弈方的策略 即博弈方i的得益是各个博弈方所选择策略的多元函数3.5.2 间接融资和挤兑风险下一阶段1, 11, 11,

11、1不 存存 款客户2不存存款客户1第一阶段0.8,0.80.6,11,0.61.2,1.2提 前到 期客户2提前到期客户1第二阶段(到期,到期) (存款,存款)(提前,提前) (不存,不存)1.2,1.2第二阶段建立信贷保证、保险制度,对存款进行保护、保险的原因非法集资问题 现代更容易引发金融、社会风险的主要是不正规的非法金融活动,如地下钱庄和非法集资等。因为非法金融活动常常通过恶意欺骗的手段吸引人们参加,用借新债还旧债的方法,而不是经营利润偿还到期资金,信用差、管理差而且缺乏保险措施,引起金融风险并引发社会问题的可能性要大得多。3.5.3 国际竞争和最优关税厂商的得益函数为:第二阶段厂商选择

12、:第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化:政府的得益函数;3.5.4 工资奖金制度 模型假设:1.雇员i(i=1,2)的产出函数为 , 为雇员努力水平, 为随机扰动。 服从分布密度 ,均值为0的随机变量。 雇员努力的负效用函数为 ,且 。2.产量高的雇员得到高工资 ,产量低的得到低工资 。3.两雇员在已知雇主宣布的工资奖金制度下,同时独立选择各自的努力程度。雇员选择雇主决定了工资以后,雇员同时决定努力程度:一阶条件这是雇员所选择努力程度必须满足的基本条件。利用条件概率的贝叶斯法则: 代入得: 两雇员情况一样,对努力程度的选择也相同,即: ,这样就得到: 这就

13、是两雇员之间的静态博弈纳什均衡。 若进一步假设 ,那么雇主选择 由于雇员之间博弈的均衡是对称均衡,因此双方赢得竞赛的机会都是0.5,假设雇能得到其他工作机会提供的得益是 ,则保证雇员接受工作的基本条件是:此即“参与约束”。 由于在雇员接受工作的前提下,雇主必然尽可能压低工资,因此约束条件可取等号: 于是得到: 设上述参与约束条件满足,雇主的利润函数为 雇主的期望利润为 ,因此雇主有如下的最优化问题:上述雇主决策可转化为促使雇员的努力程度满足: 一阶条件为: 代入两雇员的最优努力水平决定公式得到:3.6 动态博弈分析的问题和扩展讨论3.6.1 逆推归纳法的问题3.6.2 颤抖手均衡和顺推归纳法3

14、.6.3 蜈蚣博弈问题3.6.1 逆推归纳法的问题逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。这些可能有脱实际的可能逆推归纳法也不能分析比较复杂的动态博弈在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性有相同的理解,或进一步有“理性的共同知识”3.6.2 颤抖手均衡和顺推归纳法颤抖手均衡10, 010, 12, 06, 2LRUD博弈方2博弈方12, 010,

15、16, 29, 0(3, 3)(2, 3)1212L(0, 0)NTVRM(1, 2)(1, 1)SU(2, 1)顺推归纳法0,01,30,03,1swwsRD(2, 2)21Van Damme 博弈3,10,02,22,20,01,3DsRwsDw博弈方1博弈方2Van Damme 博弈策略形3.6.3 蜈蚣博弈问题该博弈是说明逆推归纳法和博弈分析困难的经典博弈1211212R(98,98)(97,100)dr(99,99)DRrd(98,101)(100,100)DRrd(0,3)D(2,2)R(1,1)D第四章 重复博弈 本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复

16、进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。本章分三节4.1 重复博弈引论4.2 有限次重复博弈4.3 无限次重复博弈4.1 重复博弈引论4.1.1 为何研究重复博弈4.1.2 基本概念4.1.1 为何研究重复博弈经济中的长期关系人们的预见性未来利益对当前行为的制约长期合同、回头客、长客和一次性买卖的区别有无确定的结束时间4.1.2 基本概念有限次重复博弈:给定一个基本博弈

17、G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G( )策略:博弈方在每个阶段针对每种情况如何行为的计划子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分均衡路径:由每个阶段博弈方的行为组合串联而成重复博弈的得益4.2 有限次重复博弈4.2.1 两人零和博弈的有限次重复博弈4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈4.

18、2.3多个纯策略纳什均衡博弈 的有限次重复博弈4.2.4 有限次重复博弈的民间定理4.2.1 两人零和博弈的有限次重复博弈零和博弈是严格竞争的,重复博弈并不改变这一点。以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样,博弈方的正确策略是重复一次性博弈中的纳什均衡策略。4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈定理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益的与原博弈G中的得益。-5,-50,-8-8,0-1,-1坦

19、白不坦白囚徒2坦白不坦白囚徒1(-5,-5)-10,-10-13,-5-5,-13-6,-6坦 白不坦白囚徒2坦白不坦白囚徒1(-10,-10)有限次重复削价竞争博弈100,10020,150150,2070,70高 价低 价高价低价寡头2寡头1削价竞争博弈有唯一纯策略纳什均衡(70,70)有限次重复的结果仍然是(低价,低价)4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈5,53,32,00,22,06,00,20,61,1HMH厂商2ML厂商1L三价博弈2,23,13,11,34,47,11,31,78,8厂商1厂商2LMHHML两次重复三价博弈的等价模型触发策略:两博弈方先试探合作,一

20、旦发现对方不合作则也用不合作报复博弈方1:第一次选h;如第一次结果为(H,H),则第二次选M,否则选L博弈方2:同博弈方1两市场博弈的重复博弈(重复两次)(A,B)+(A,B) OR (B,A)+(B,A)(1,4)(4,1)连续两次采用混合策略(2,2)(A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)轮换策略一次纯策略+一次混合策略(1.5,3)(3,1.5)0,04,11,33,3厂商1厂商2BAAB两市场博弈重复博弈不同策略、均衡及一次性博弈得益比较不同策略组合、均衡得益图示厂商2得益厂商1得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)

21、(1.5,3)4.2.4 有限次重复博弈的民间定理个体理性得益:不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益可实现得益:博弈中所有纯策略组合得益的加权平均数组定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们厂商2得益厂商1得益(1,4)(3,3)(1,1)(4,1)w=(1.1)4.3 无限次重复博弈4.3.1 两人零和博弈的无限次重复博弈4.3.2 唯一纯策略纳什均衡博弈 的无限次重复博弈4.3.3 无限次重复古诺模型4.3

22、.4 有效工资率4.3.1 两人零和博弈的无限次重复博弈两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡4.3.2唯一纯策略纳什均衡博弈 的无限次重复博弈两寡头削价竞争博弈 该博弈一次性博弈均衡是都采用低价,是囚徒困境型博弈4,40,55,01,1HLHL无限次重复两寡头削价博弈 触发策略:第一阶段采用H,如果前t-1阶段的结果都是(H,H),则继续采用H,否则采用L。 如果博弈方2采用L,总得益现值为 如果博弈方2采用H,总得益现值为 因此当 时,此触发策略纳什均衡策略两寡头削价竞争无限次重复博弈的民间定理厂商2得益厂商1得益(1,4)(3,3)(1

23、,1)(4,1)(5,0)(5,0)4.3.3 无限次重复古诺模型 假定: ,边际成本都为2。 在无限次重复古诺模型中,当贴现率 满足一定条件时,两厂商采用下列触发策略构成一个子博弈完美纳什均衡: 在第一阶段生产垄断产量的一半1.5;在第 t 阶段,如果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5,否则生产古诺产量2。 设厂商1已采用该触发策略,若厂商2也采用该触发策略,则每期得益4.5,无限次重复博弈总得益的现值为: 如果厂商2偏离上述触发策略,则他在第一阶段所选产量应为给定厂商1产量为1.5时,自己的最大利润产量,即满足: 解得 ,此时利润为5.0625,高于触发策略第一阶段得益4.5。 但从第二阶段开始,厂商1将报复性地永远采用古诺产量2,这样厂商2也被迫永远采

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论