第三章完全信息动态博弈图文_第1页
第三章完全信息动态博弈图文_第2页
第三章完全信息动态博弈图文_第3页
第三章完全信息动态博弈图文_第4页
第三章完全信息动态博弈图文_第5页
已阅读5页,还剩113页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 完全、完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过程和收益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。本章分六节3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论复习1:什么是动态博弈 动态博弈(d

2、ynamic game)是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。 那么,根据定义,生活中有些什么动态博弈呢?复习2:完美信息与不完美信息 完美信息的博弈是指在博弈的任何阶段,每个参与者都清楚博弈之前发生的所有行动,也即每个信息集都是一个单元素集合。 没有完美信息的博弈具有不完美信息。复习3:完全信息与不完全信息 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。 完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。 如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或

3、者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。进入者进入不进入(0,300)在位者不可置信威胁合作(40,50)斗争(-10,0)一个动态博弈的例子:产业进入壁垒进入者进入不进入(0,300)在位者可信威胁合作(40,50)斗争(10,0)3.1 动态博弈的表示法和特点3.1.1 阶段和扩展性表示3.1.2 动态博弈的基本特点3.1.1 阶段和扩展性表示 阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2 动

4、态博弈的基本特点 策略是在整个博弈中所有选择、行为的计划 结果是上述“计划型”策略的策略组合,构成一条路径 收益对应每条路径,而不是对应选择、行为 动态博弈的非对称性先后次序决定动态博弈必然是非对称的。 先选择、行为的博弈方有时更有利,有“先行优势”。一 博弈扩展式表述博弈的基本构造结: 包括决策结和终点结两类;决策结是参与人行动的始点,终点结是决策人行动的终点.结满足传递性和非对称性x之前的所有结的集合,称为x的前列集P(x),x之后的所有结的集合称为x的后续集T(x)。博弈扩展式表述l 枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择.l 信息集: 每个信息集

5、是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:1 每个决策结都是同一个参与人的决策结;2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)参与人(A,B,N)战略收益参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结,决策结终点结枝结,初始结 信息集A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开

6、发不开发开发不开发(4,4)(8,0)(-3,-3) (1,0)(0,8)(0,0)(0,1)(0,0) B在决策时有不确定性房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的选择;但不知道A的选择(或A、B同时决策) 房地产开发博弈博弈扩展式表述 只包含一个决策结的信息集称为单结信息集,如果博弈树的所有信息都是单结的,该博弈称为完美信息博弈。 自然总是假定是单结的,因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到

7、自然的行动。 不同的博弈树可以代表相同的博弈,但是有一个基本规则:一个参与人在决策之前知道的事情,必须出现在该参与人决策结之前。AB坦白抵赖BBAA坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵赖坦白抵赖坦白抵赖(-8,-8)(0,-10) (-10,0) (-1,-1)囚徒困境博弈的扩展式表述囚徒困境博弈的扩展式表述3.2 可信性和纳什均衡的问题3.2.1 相机选择和策略中的可信性问题3.2.2 纳什均衡的问题3.2.3 逆推归纳法3.2.1 相机选择和策略中的可信性问题不同版本的开金矿博弈分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金

8、矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈分钱打官司都可信3.2.1 相机选择和策略中的可信性问题乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈分钱打官司都不可信3.2.1 相机选择和策略中的可信性问题3.2.2 纳什均衡的问题第三种开金矿博弈中, (不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。 结论结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能可能是不稳定的,不能作为预测的基础。 根源根源:纳什均衡本身不能排

9、除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题3.2.3 逆推归纳法定义定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法逆推归纳法”。 逆推归纳法是动态博弈分析最重要、基本的方法。乙不借借(1,0)甲不分分(0,4)(2,2)3.3 子博弈和子博弈完美纳什均衡3.3.1 子博弈3.3.2 子博弈完美纳什均衡完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n考虑下列问题:一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理?纳什均衡假定每一个参与人在选择自己的最

10、优战略时假定所有其他参与人的战略是给定的,但是如果参与人的行动有先有后,后行动者的选择空间依赖于前行动者的选择,前行动者在选择时不可能不考虑自己的行动对后行动者的影响。子博弈精练纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。3.3.1 子博弈 定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965) 曹操与袁绍的仓亭之战,曹操召集将领来献破袁之策

11、,程昱献了十面埋伏之计,他让曹操退军河上,诱袁前来追击,到那时“我军无退路,必将死战,可退袁矣”。 曹操采纳此计,令许褚诱袁军军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”,众军奋力回头反击,袁军大败。3.3.2 子博弈完美纳什均衡定义定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。完全信息动态博弈-子博弈精练纳

12、什均衡(举例)泽尔腾(1965)进入者进入不进入(0,300)在位者合作(40,50)斗争(-10,0)市场进入阻挠博弈树特点:剔除博弈中包含的不可置信威胁。 承诺行动-破釜沉舟-背水一战v给定进入者进入,剔除(进入,斗争),(进入,默许)是唯一的子博弈精练纳什均衡-举例(结婚-反对)不可置信威胁收益函数行动子博弈精练纳什均衡n一个纳什均衡称为精练纳什均衡,当只当参与人的战略在每个子博弈中都构成纳什均衡,也就是说,组成精练纳什均衡的战略必须在每一个子博弈中都是最优的。n一个精练纳什均衡首先必须是一个纳什均衡,但纳什均衡不一定是精练纳什均衡。n承诺行动-当事人使自己的威胁战略变得可置信的行动。完

13、全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。子博弈精练纳什均衡n泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果n子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n子博弈:是原博弈的一部分,它本身也可以作为一个独立的博弈进行分析:(1)子博弈必

14、须从一个单结信息点开始:只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结,则这两个都不可以作为子博弈的初始结(见下页)。(2)子博弈的信息集和支付向量都直接继承自原博弈,即当x和x在原博弈中属于同一信息集时,他们在子博弈中才属于同一信息集。n习惯上,任何博弈的本身称为自身的一个子博弈。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n子博弈精练纳什均衡: 扩展式博弈的战略组合是一个子博弈精练纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。A开发不开发BB开发不开发开发(1,0)(

15、0,1)(0,0)(-3,-3)xx房地产开发博弈开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发)在c上构成均衡,在b上不构成; 在b和c上都构成 在c上构成均衡,在b上不构成完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)不开发 判断下列均衡结果哪个构成子博弈精练纳什均衡?不开发bc完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”,博弈树上的其他路径称为“非均衡路径”。n

16、纳什均衡只要求均衡战略在均衡路径的决策结上是最优的;n而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的,而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈精练纳什均衡的实质区别。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n战略是参与人行动规则的完备描述,它要告诉参与人在每一种可预见的情况下(即每一个决策结)上选择什么行动,即使这种情况实际上没有发生(甚至参与人并不预期它会发生)。n因此,只有当一个战略规定的行动规则在所有可能的情况下都是最优的,它才是一个合理的可置信的战略,子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。用逆向

17、归纳法求-子博弈精练纳什均衡1UDL(3,1)(0,0)22,2R 给定博弈达到最后一个决策结,该决策结上行动的参与人有一个最优选择,这个最优选择即该决策结开始的子博弈的纳什均衡 倒数第二个决策结,找倒数第二个的最优选择,这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡。 用逆向归纳法求-子博弈精练纳什均衡1UDL(3,1)(0,0)22,2R如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的子博弈的纳什均衡,这个过程的最后一步得到整个博弈的纳什均衡完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n用逆向归纳法求子博弈精练纳什均衡

18、 对于有限完美信息博弈,逆向归纳法求解子博弈精练纳什均衡是一个最简便的方法。A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)1UDL(1,1)22,0RU(3,0)(0,2)2D 子博弈精练纳什均衡(U,U),L). U和L分别是参与人1和参与人2在非均衡路径上的选择。 逆向归纳法求解子博弈精练纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最后生存下来的战略构成精练纳什均衡。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n用逆向归纳法求解的子博弈

19、精练纳什均衡也要求“所有的参与人是理性的”是共同知识。n如果博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非常令人信服。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)进入者进入不进入(0,300)在位者市场进入阻挠博弈树不可置信威胁收益函数行动合作(40,50)斗争(-10,0)承诺行动与子博弈精练纳什均衡n承诺行动与子博弈精练纳什均衡n有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参与人能在博弈之前采取某种行动改变自己的行动空间或支付函数,原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变.承诺行动与子博弈精练纳什均衡n这些改变博弈结果而采取的

20、措施称为承诺行动.n完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟).n不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.承诺行动与子博弈精练纳什均衡A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈 如果在A决策之前,B与某客户签定了一个合同,规定B若不在特定时期内开发若干面积的写字楼,则将支付违约金3.5,这个合同就是承诺行动.(1,-3.5)承诺行动与子博弈精练纳什均衡n经常有这样的情况,非理性-通常是自动的而不是策略性的-是一个优势。n在电影怪爱博士中的末日机器就是一个例子。前苏联认为不可能在一场理性的军备竞赛中超过更富有

21、的美国,所以,他制造了一颗炸弹,如果任何人引爆了这颗炸弹,它将自动炸毁整个世界。着部电影描述了这样一个细节,你必须告诉对方你有这么一个末日机器。n据说前美国总统尼克松曾告诉他的副手哈德蔓,他对这个策略更复杂的看法:我称为疯子理论,我要让北越相信我已经到了无论付出多少都要结束战争的地步,我们只要他听到这样的传闻:“看在上帝的份上,尼克松已经被共产党搞疯了,当他生气的时候,我们没法制止他,他的手已经按在核按纽上了。”胡志明两天之后会到巴黎求和的。重复博弈 其他参与人过去的历史总是可以观测到的一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史参与人在重复博弈中的战略空间远远大于和

22、复杂于每一阶段的战略空间重复博弈可能带来一些“额外”的均衡结果。 重复博弈 影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。 博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡。 信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。重复博弈和无名氏定理 有限次重复博弈连锁店悖论进入者进入不进入在位者默许斗争默许(-10,0)(0,300)(0,300)(40,50)xx在位者斗争 假定同样的市场上有20个(可以理解为在位者有20个连锁店),进入者每次进入一个市场,博弈就编程了20次重复博弈。 假定进入者进

23、入第1个市场,在位者应该如何反应呢?重复博弈和无名氏定理这个博弈的纳什均衡是什么?假定博弈共进行10次,结果会如何?为什么会出现这个结果?倒推论证法 假定现在是第十次,结果和一次博弈一样。第九次,即倒数第二次,局中人已经很清楚,最后一次博弈对方肯定要实行低价,因此,现在如何对他施行好心都不会在下一次得到好报,所以,理性人的“我”没有理由实施高价使对方获益。依次类推。高价企业乙企业甲低价高价低价价格大战中的囚徒困境价格大战中的囚徒困境重复博弈 无限次重复博弈囚徒困境博弈重复无穷次,结果如何?证明得出,如果参与人有足够的耐心,(抵赖,抵赖)是一个子博弈精练纳什均衡结果)。冷酷战略(1)开始选择抵赖

24、;(2)选择抵赖一直到有一方选择了坦白,然后永远选择坦白。囚徒A囚徒 B坦白抵赖坦白抵赖 无限次重复博弈使其走出了囚徒困境,背后的原因是: 如果博弈重复无穷次而且每个人有足够的耐心,任何短期机会主义行为的所得都是微不足道的。简单逻辑 一个男孩被视为傻瓜,因为每当别人拿一枚1角硬币和5分硬币让他选的时候,他总是选5分的 有一个人觉得奇怪,就问他:“为什么你不拿1角钱的?” 男孩小声回答:“假若我拿了1角钱的硬币,下次他们就不会拿钱让我选了。”重复博弈和无名氏定理n参与人不固定时的重复博弈厂商消费者购买不购买高质量低质量质量博弈 假定只有一个厂商提供产品,每个消费者只买一次,且每个阶段只有一个消费

25、者。 为什么消费者偏好于购买大商店的产品而不相信走街串巷的小商贩?一次博弈的均衡结果重复博弈和无名氏定理n参与人不固定时的重复博弈厂商消费者购买不购买高质量低质量质量博弈 如果厂商的贴现因子 =1/2,则无限次重复博弈的纳什均衡为: 厂商从生产高质量的产品厂商从生产高质量的产品开始,继续生产高质量的产品,开始,继续生产高质量的产品,除非曾经生产过低质量产品,除非曾经生产过低质量产品,如果上一次生产了低质量的产如果上一次生产了低质量的产品,之后永远生产低质量的产品,之后永远生产低质量的产品。品。 第一个消费者选择购买,第一个消费者选择购买,只要厂商不曾生产过低质量的只要厂商不曾生产过低质量的产品

26、,随后消费者继续购买,产品,随后消费者继续购买,如果厂商曾件生产过低质量的如果厂商曾件生产过低质量的产品,之后消费者不再购买。产品,之后消费者不再购买。重复博弈的均衡结果贴现因子:下一期的一单位支付在这一期的价值。重复博弈和无名氏定理 参与人不固定时的重复博弈厂商厂商消费者消费者购买购买不购买不购买高质量高质量低质量低质量质量博弈质量博弈 厂商:如果生产低质量的产品,得到的短期利润是2,但之后每阶段利润为0,如果总是生产高质量的产品,每阶段得到1单位利润,贴现值为1/(1- ) =2,厂商将不会生产低质量产品。害怕失掉消费者。 消费者: =1/2,其只关心1阶段的支付,只有当预期高质量时,才会

27、购买。消费者预期不曾生产过低质量产品的厂商将继续生产高质量产品,故选择购买,反之亦然厂商生产过高质量的产品.重复博弈的均衡结果 克莱因等认为这个例子可以解释为什么消费者偏好去大商店购买东西而不信赖走街串巷的小商贩。 西蒙等用类似博弈解释雇佣关系,认为,企业存在的原因之一正式创造一个“长期的参与人”,这样一个参与人由于对未来利益的考虑而更讲信用。3.4 几个经典动态博弈模型3.4.1 寡占的斯塔克博格模型3.4.2 劳资博弈3.4.3 讨价还价博弈3.4.4 委托人代理人理论3.4.1 寡占的斯塔克博格模型 先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。

28、QQPPqqQ8)(,21221 cc121111112)(8 )(qqqqqcQPqu212116qqqq221222222)(8 )(qqqqqcQPqu222126qqqq第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n斯坦克尔伯的寡头竞争模型企业1企业2v参与人:企业参与人:企业1 1、企业、企业2 2;v行动顺序:企业行动顺序:企业1 1先选择产量先选择产量q q1 1,企业,企业2 2观测到观测到q q1 1,然后选,然后选 择自己的产量择自己的产量q q2 2。v支付:支付: 利润,利润是两个企业产量的函数利润,利润是两个企业产量的函数n斯坦克尔伯的寡头竞争模型nqi :第i个企

29、业的产量nC:代表单位不变成本n假定逆需求函数为:n第i个企业的利润函数为:企业1企业22 , 1),)(),(21icQPqqqii)()(21qqaQP斯坦克尔伯的寡头竞争模型n用你向归纳法求解,首先考虑给定q1的情况下,企业2的最优选择。企业2的问题是:)(),(212212cqqaqqqMax最优化一阶条件意味着:)(21)(1122cqaqSq因为企业1预测到企业2将根据S2(q1)来选择q2,企业1在第1阶段的问题是:)()(,(111211cqSqaqqSqMax)(21*1caq)(41*2caq斯坦克尔伯的寡头竞争模型n均衡结果比较)(21ca)(31ca)(31ca2)(9

30、1ca2)(91ca)(21ca)(41ca2)(81ca2)(161ca2)(41ca)(21ca2)(41ca)(32ca)(43ca2)(92ca2)(163ca斯坦克尔伯的寡头竞争模型n从上述计算可以看出:n斯坦克尔伯的均衡总产量大于库诺特均衡总产量,企业1的斯坦克尔伯的均衡产量大于库诺特均衡产量,企业2的斯坦克尔伯的均衡产量小于库诺特均衡产量。同样,企业1在斯坦克尔伯博弈中的利润大于在库诺特博弈中的利润,企业2的利润却有所下降,这就是所谓的“先动优势”。斯坦克尔伯的寡头竞争模型n从上述计算可以看出: 拥有信息优势可能使参与人处于劣势。企业1先行动的承诺价值 :企业1之所以获得斯坦克尔

31、伯利润而不是库诺特利润,是因为它的产品一旦生产出来就变成了一种积淀成本,无法改变,从而使企业2不得不承认它的威胁是可置信的。而假如企业1只是宣布了它将生产 ,企业2是不会相信她的威胁的。)(21ca 3.4.2 劳资博弈先由工会决定工资率,再由厂商决定雇用多少劳动力)(*WLRL0W L厂商的反应函数R(L)斜率为W)(max),(max00WLLRLWLLLW0工会的无差异曲线)(*WL)(*WL0u1u2u3u*W)(,max*0WLWuW 采用逆推归纳法 利用厂商的效用函数计算出最佳反应 带入工会效用函数计算出均衡用工数量 联想:吉利公司如何与沃尔沃公司达成一致?3.4.2 劳资博弈 分

32、冰激凌的故事 游戏规则:第一轮由第一个参与人(小鹃)提出条件,第二个参与人小明可以接受,从而游戏结束,也可以不接受,则游戏进入第二轮; 小明提出条件,小鹃可以接受,从而结束游戏,也可以不接受,从而进入第三轮; 冰激凌融化呈线性,游戏结束,冰激凌融化3.4.3 讨价还价博弈 第二种情况:桌上放了一个冰淇淋冰激凌,但两轮谈判过后,冰激凌将完全融化。博弈结果如何? 第三种情况:桌上的冰淇淋冰激凌在三轮谈判后将完全融化,结果又如何?3.4.3 讨价还价博弈 第四种情况:桌上的冰淇淋冰激凌在四轮谈判后将完全融化,或者在五轮谈判、六轮,100轮谈判后将完全融化,结果又如何? 博弈的结果是:假如“轮数”是偶

33、数,双方各得一半,假若论述是奇数,则小鹃得到(n+1)/2n;小明得到(n-1)/(2n) 最后:如果分的不是冰激凌,而是大白兔奶糖呢?3.4.3 讨价还价博弈 两个玩家 二人收益供给10000元 现在二人将针对每个人将获得多少而展开讨价还价博弈3.4.3 讨价还价博弈有限期轮流出价无贴现 回合T为奇数,小王先出价 由于回合数为奇数 接受或拒绝没有差异,因此所有的均衡都是弱的 均衡结果只决定于小张最后决定接受的时间 第一回合:小王的方案是自己得X1,小张得10000-S1 小张若接受,二人收益分别为S1和10000-S1,谈判结束。如果小张拒绝,则开始第二回合谈判。 第二回合:小张的方案是小王

34、得S2,自己得10000-S2 如果拒绝,则开始第三回合谈判:小王自己得S3,小张得10000-S3,此时小张必须接受有限期轮流出价无贴现 这三回合中双方所提出的S1、S2和S3都是0到 10000之间的任意金额 可以认为由于S1、S2和S3都有无限多种 所以这个讨价还价博弈是一个无限策略的动态博弈有限期轮流出价无贴现 改变基本假设,改变博弈均衡 假设小王仍然先出价 回合数为偶数时,博弈的结果就是小张将得到全部收益。 这就是所谓的后发优势有限期轮流出价无贴现相同贴现讨价还价 有贴现的情况就是讨价还价每多进行一个回合,由于谈判费用和利息损失等,双方的利益都要打一个折扣 假设条件双方折扣率均为 回

35、合数T=3。3.4.3 讨价还价博弈三回合讨价还价112不接受,出S3接受不接受,出S2接受出S1)10000(,22SS)10000,(11SS)10000(,3232SSSS2SSS211000010000三回合讨价还价博弈结果的讨论益越大甲的得益越小,乙的收越大,时,当益越小甲的得益越大,乙的收越大,时,当5 . 0015 . 0相同贴现讨价还价 第一回合:小王的方案是自己得S1,小张得10000-S1。小张若接受,二人收益分别为S1和10000-S1,谈判结束。如果小张拒绝,则开始第二回合谈判 第二回合:小张的方案是小王得S2,自己得10000-S2。小王若接受,二人收益分别为S2和(

36、10000-S2),谈判结束 如果拒绝,则开始第三回合谈判:小王自己得S3,小张得10000-S3,此时小张必须接受,最后二人的实际收益分别为 和 )10000(22S22S 这三回合中双方所提出的S1、S2和S3都是0到 10000之间的任意金额 由于S1、S2和S3都有无限多种,所以这个讨价还价博弈是一个无限策略的动态博弈。相同贴现讨价还价有不同贴现的讨价还价 假设小王的折扣率为1,小张的折扣率为2, 两人知道对方的折扣率 回合数T=3 用逆推归纳法来分析这个博弈有不同贴现的讨价还价 第三回合:知道双方的收益 第二回合:小张在第二回合会出能让小王接受的,也是可能使自己收益最大的S2,应满足

37、使小王收益 第一回合:小王只要令10000-S1=2,即 S1=10000-2即可。这样第一回合与第二回合小张的收益相同,而小王的收益S1=10000-2,比第二、三回合收益更大。 小王会在第一回合出价S1=10000-2,小张会接受 最终二人收益分别为S1=10000-2和2 这就是这种有限奇数次讨价还价有贴现情况的均衡解。有不同贴现的讨价还价无限期讨价还价 贴现肯定存在 与有限期讨价还价逻辑推理相同 小张获得的收益与自己的折扣率呈增函数关系,而与对方的折扣率呈减函数关系无限回合讨价还价SS211000010000SSS211000010000110000*S11000010000*S3.4

38、.4 委托人代理人理论一、委托人代理人关系 经济活动和社会活动中有很多委托人代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。 委托人代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性 委托人代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等二、无不确定性的委托人代理人模型R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0R(0),0122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束: w(E)-E w(S)-S w(E) w(S)+E-S代理人博弈 委托人的激励

39、制度设计必须满足两个约束,即参与约束与激励相容约束。 参与约束是指代理人执行此契约的效用大于不执行的效用 激励相容约束是指代理人执行此契约的收益不但大于其采取其他行动的收益,而且委托人的收益也可得到有效保证,会符合其收益最大化的预期目标 只有满足这两个条件的激励制度才会被有效的实施参与约束:22R(E)-w(E), w(E)-E拒绝接受拒绝接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w(S)-S0参与约束 委托人的选择11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-

40、w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10-S)接受:0.9*w(20)-E+0.1*w(10)-E0委托:0.9*20-w(20)+0.1*10-w(10)0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件参与约束对于委托人来说,就是要根据上述两个条件,以及 E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20) -w(10)五、选择报酬和连续

41、努力水平的 委托人代理人博弈R, CC(e) +R(e)委托人希望的代理人努力水平(满足参与约束)UU*ee)()()()()()(*eCeRweCeRwUeCeRw激励相容约束:参与约束:店主和店员的问题商店的利润 , 是均值为0的随机变量店员的负效用 , 是店员的努力机会成本为1店主采用的报酬计算公式店员的收益店员期望收益为店主的收益为 eR42eC )4(eBABRASABeBeBAe)1 ()1 ( 4)4(424eBeAe2)4(eeBA参与约束参与约束:当店员风险中性时 符合其最大利益店主选择下限 代入收益公式得: ,期望收益为 ,易求得令 得 ,再代入参与约束得 ,求数学期望得

42、解得 ,则店主的最优激励工资计算公式是*ee 1B5)8(BA58 BA1B3ARw 31)4(2eeBABe2*1)4(2eeBA142ee142ee2*e有趣的例子1:囚徒的救赎 好莱圬大片肖申克的救赎是一部很好看的电影,主要内容是一个被冤屈的囚犯如何凭着坚定的信念和聪明才智逃出牢房。我们的“囚犯”也可以通过好的策略合作,摆脱“困境”的诅咒。囚徒的救赎-一报还一报 一报还一报能够赢得竞赛不是靠打击对方,而是靠从对方引出使双方都有好处的行为。 如果重复博弈多次,就有报复的机会,这种惩罚的规则是:人家对你怎么做,你就对他怎么做,如果他上次背叛了你,你这次背叛他,如果上次他与你合作,你这次就选择

43、与他合作。囚徒的救赎-一报还一报 艾克谢罗德认为,一报还一报体现了这个策略符合四个优点:清晰、善意、报复性和宽恕性。这一法则不会引发作弊,所以是善意的;它不会让作弊者逍遥法外,所以是报复的;它不会长时间怀恨在心,只要作弊者改正,就愿意恢复合作,所以是宽恕的。 一报还一报从自己的不可欺负性得到好处,还放弃了占他人便宜的可能性囚徒的救赎 重复囚徒困境的几个建议: 1、不要嫉妒 2、不要首先背叛 3、对合作和背叛都要给予回报 4、不要耍小聪明旅行者困境-做人不要太精明 两个旅行者从一个以生产细瓷花瓶闻名的地方旅行回来,在提取行李的时候,发现花瓶被摔坏了,就向航空公司索赔。 航空公司知道花瓶的价格大概

44、杂八、九十元,但不知道他们购买的确切价格。 因此航空公司请两位旅客在100元以内写出花瓶的价格,如果两个人写得一样,就按照写的数额赔偿,如果不一样,原则上按照低的价格赔偿,并认为该旅客讲了真话,奖励2元,而讲假话的罚款2元。 这个博弈的最终结果将是什么?旅行者困境 一位富翁的狗在散步时跑丢了,于是他急匆匆到电视台发了一则启示:有狗丢失,归还者得酬金1万元,并附有狗的彩照。 一个乞丐看到广告后,第二天一大早就报着狗准备去领酬金,当他经过一家大商店的墙体屏幕时,发现酬金涨到了3万元 乞丐又折回住处,把狗重新栓在那里,在接下来的几天里,乞丐从来没有离开过这只大屏幕 当酬金涨到使全市居民感到惊讶时,乞

45、丐返回他的住处,可是那只狗已经死了-在这个世界上,金钱一旦被作为筹码,就不会再买到任何东西。3.5 有同时选择的动态博弈模型3.5.1 标准模型3.5.2 间接融资和挤兑风险3.5.3 国际竞争和最优关税3.5.4 工资奖金制度3.5.1 标准模型 博弈中有四个博弈方,分别称为博弈方1、博弈方2、博弈方3和博弈方4 第一阶段是博弈方1和博弈方2的选择阶段,他们同时在各自的可选策略(行为)集合 和 中分别选择 和 第二阶段是博弈方3和博弈方4的选择阶段,他们在看到博弈方1和博弈方2的选择 和 以后,同时在各自的可选策略(行为)集合 和 中分别选择 和 各博弈方的收益都取决于所有博弈方的策略 即博

46、弈方i的收益是各个博弈方所选择策略的多元函数),(4321aaaauuii1a2a1a2a3a4a4321,aaaa1A2A3A4A3.5.2 间接融资和挤兑风险下一阶段1, 11, 11, 1不 存存 款客户客户2不存存款客客户户1第一阶段0.8,0.80.6,11,0.61.2,1.2提 前到 期客户客户2提前到期客客户户1第二阶段(到期,到期) (存款,存款)(提前,提前) (不存,不存)1.2,1.2第二阶段建立信贷保证、保险制度,对存款进行保护、保险的原因非法集资问题现代更容易引发金融、社会风险的主要是不正规的非法金融活动,如地下钱庄和非法集资等。非法金融活动常常通过恶意欺骗的手段吸

47、引人们参加,用借新债还旧债的方法,而不是经营利润偿还到期资金信用差、管理差而且缺乏保险措施,引起金融风险并引发社会问题的可能性要大得多。3.5.3 国际竞争和最优关税ijiiijiijietehceheaheha)()()(厂商的收益函数为:第二阶段厂商选择:32,3),(max*jiiijijijiitcaetcaheehhtt),(jijijiiieehhtt第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府收益,再求最优化:2 , 1,9,9)(4,33)(9)2(9)(18)(2),(),(max*2*22*icaecahcattcattcatcatcattwttwiiiiijiijiijii政府的收益函数;),(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论