博弈论与信息经济学第六讲_第1页
博弈论与信息经济学第六讲_第2页
博弈论与信息经济学第六讲_第3页
博弈论与信息经济学第六讲_第4页
博弈论与信息经济学第六讲_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 第六讲第六讲 完全信息动态博弈的应用完全信息动态博弈的应用 讨价还价与重复博弈讨价还价与重复博弈 上一讲小结上一讲小结 子博弈完美纳什均衡的两个应用子博弈完美纳什均衡的两个应用 轮流出价的讨价还价模型轮流出价的讨价还价模型 重复囚徒困境的解重复囚徒困境的解 2子博弈完美纳什均衡子博弈完美纳什均衡Statements need to be backed up by sufficient threats to make them credible.3 第六讲第六讲 完全信息动态博弈的应用完全信息动态博弈的应用 讨价还价与重复博弈讨价还价与重复博弈 上一讲小结上一讲小结 子博弈完美纳什均衡的两个

2、应用子博弈完美纳什均衡的两个应用 轮流出价的讨价还价模型轮流出价的讨价还价模型 重复囚徒困境的解重复囚徒困境的解4子博弈完美纳什均衡的两个应用子博弈完美纳什均衡的两个应用(一)(一)Stackelberg 动态寡头市场博弈模型动态寡头市场博弈模型: :假设在寡头市场上有两个厂商,一方较强,一方假设在寡头市场上有两个厂商,一方较强,一方较弱,较强的一方先行动,较弱的一方跟进。较弱,较强的一方先行动,较弱的一方跟进。这里,厂商选择的是产量:这里,厂商选择的是产量: Leader Follower q2这个模型说明,在信息不对称的这个模型说明,在信息不对称的gamegame中,信息较中,信息较多的博

3、弈方并不一定获得更多的收益。多的博弈方并不一定获得更多的收益。这种现象的根源在于这种现象的根源在于,先行动者吃准后行动者是一先行动者吃准后行动者是一个理性的,不可能为了赌气或其他原因而采取不个理性的,不可能为了赌气或其他原因而采取不理性的行为。理性的行为。q15杜邦公司的震慑博弈70年代,杜邦公司预测到全球未来对二氧化钛的需求达到50万吨以上;于是,为了垄断该市场,决定增加50万吨的生产能力,给予对手一个震慑;通过扩建现有工厂,新建13万吨的新厂,使得杜邦公司保持了二氧化钛的垄断地位达25年。6(二)工会与厂商的博弈(二)工会与厂商的博弈LeontiefLeontief于于19461946年提

4、出。此博弈的过程是:工会年提出。此博弈的过程是:工会决定工资,厂商根据工资的高低决定雇佣人数。决定工资,厂商根据工资的高低决定雇佣人数。工会的效用是工资(工会的效用是工资(W W)和雇佣人数()和雇佣人数(L L)的函数)的函数; ;厂商只有一个目标,即利润(厂商只有一个目标,即利润(R R)。)。厂商只有劳动成本厂商只有劳动成本W WL,L,厂商利润厂商利润: : = (W,L)=R(L)- WL第一步,厂商对工会决定的任意工资第一步,厂商对工会决定的任意工资W W,决定一个,决定一个最优的雇佣数最优的雇佣数L L。 MaxL0(W,L)= MaxL0 R(L)-WL 必须使必须使对对L L

5、的导数的导数(W,L)= R(L)-W=07求解的结果求解的结果R R(L)-W=0(L)-W=0LR R斜率为斜率为w wR(L)R(L)WLWL L L* * (w) (w)8第二步,回到第一阶段工会的选择。工会第二步,回到第一阶段工会的选择。工会了解厂商的决策规则。所以工会的问题是:了解厂商的决策规则。所以工会的问题是: MaxMaxw0w0 W, W, L L* * ( (W W) ) LW WW W* *L L* * ( (W W* *) ) I I0 0I I1 1I I2 2L L* * (W) (W) 9 第六讲第六讲 完全信息动态博弈的应用完全信息动态博弈的应用 讨价还价与重

6、复博弈讨价还价与重复博弈 上一讲小结上一讲小结 子博弈完美纳什均衡的两个应用子博弈完美纳什均衡的两个应用 轮流出价的讨价还价模型轮流出价的讨价还价模型 重复囚徒困境的解重复囚徒困境的解10(一)轮流出价的讨价还价模型(一)轮流出价的讨价还价模型讨价还价是经济生活中的极重要部分,从日常的货物买卖到国际贸易以及政治谈判,都存在讨价还价问题。讨价还价模型是一个可观察行动的多阶段博弈。Rubinstein 于1982年建立了一个轮流出价模型(Alternating offers):11在此模型中,两人分一块蛋糕, 1先出价,如2接受,则博弈结束, 按1的方案分配;如2拒绝,则由2出价,如1接受,则博弈

7、也结束,否则再由1出价、直到一个参与人的出价被接受。 这个博弈从理论上讲有无限多个纳什均衡,但是Rubinstein证明它的SPNE是唯一的。12用用x x表示参与人表示参与人1 1的份额,用的份额,用(1-x)(1-x)表示参与表示参与人人2 2的份额,用的份额,用x x1 1和(和(1- x1- x1 1)表示)表示1 1出价时参出价时参与人与人1 1和和2 2的份额,用的份额,用x x2 2和(和(1- x1- x2 2)表示)表示2 2出出价时参与人价时参与人1 1和和2 2的份额。的份额。假定参与人假定参与人1 1和和2 2的的贴现因子贴现因子( (discount factordi

8、scount factor) )分别为分别为1 1和和2 2。如果博弈在如果博弈在t t期结束,则期结束,则: : 参与人参与人1 1得到得到 1 1=1 1t-1t-1X X1 1 参与人参与人2 2得到得到 2 2=2 2t-1 t-1 (1- x1- x1 1); ; 13在分析无限期博弈之前先讨论一下有限在分析无限期博弈之前先讨论一下有限期的情况,如果有限,可以使用逆向归期的情况,如果有限,可以使用逆向归纳法分析。纳法分析。先假设两个阶段,先假设两个阶段,T=2T=2,2 2来出价,他提来出价,他提出出X X2 2=0=0,参与人,参与人1 1会接受,因为他没有出会接受,因为他没有出价

9、的机会。价的机会。t=1t=2 (X 2,1-X 2)(1-2,2) (0,1)(X 1,1-X 1)141.1.现在假定现在假定T=3T=3,最后阶段由参与人,最后阶段由参与人1 1出价,出价,它可以得到它可以得到x x1 1=1=1。参与人参与人1 1在在T=3T=3时时1 1单位的收益等于单位的收益等于T=2T=2时时的的1 1,所以在,所以在T=2T=2时参与人时参与人2 2出价出价X X2 2=1 1而参与人而参与人2 2在在T=2T=2时的(时的(1-1-1 1)收益等)收益等于于T=1T=1时时2 2(1-1-1 1)。)。这时,这时,SPNESPNE的结果是的结果是x=1-x=

10、1-2 2(1-1-1 1) 问题:问题: T=4T=4时时SPNESPNE的结果是什么?的结果是什么? 最终均衡值最终均衡值X X* *为(为(1-1-2 2)/ /(1-1-1 12 2)15几种特殊的情况,贴现因子与几种特殊的情况,贴现因子与T T的关系的关系1=2=0时,不论T为多少,SPNE的结果是x=1.两个人都是绝对无耐心的,则第一个出价的人得到全部蛋糕。如果1=0,20,则结果是x=1-2。如果1=2=1,双方都有无限的耐心,结果依赖于博弈的次数。一般而言,如果0i1,均衡的结果依赖于的相对比例,还有博弈的时间长度T和谁在最后出价。当T趋向于无限时,则会有唯一的均衡结果X=1/

11、(1+)。16 聪明的猴子朝三暮四与朝四暮三 哪 一个更优?17 第六讲第六讲 完全信息动态博弈的应用完全信息动态博弈的应用 讨价还价与重复博弈讨价还价与重复博弈 上一讲小结上一讲小结 子博弈完美纳什均衡的两个应用子博弈完美纳什均衡的两个应用 轮流出价的讨价还价模型轮流出价的讨价还价模型 重复囚徒困境的解重复囚徒困境的解18无限次重复囚徒困境无限次重复囚徒困境1,15,00,54,4LR1 12 2L LR*19在该博弈的一次性博弈中,得益为较差的在该博弈的一次性博弈中,得益为较差的(1,1)1,1)的(的(L L,L L)是它的唯一的纳什均衡。)是它的唯一的纳什均衡。在无限次重复博弈中我们假

12、设两博弈方都采用在无限次重复博弈中我们假设两博弈方都采用触发战略触发战略(trigger strategy): :在第一阶段采用在第一阶段采用R R战略;战略;在第在第t t阶段,如果前阶段,如果前t-1t-1次的结果都是(次的结果都是(R R,R R),),则继续采用则继续采用R R战略,否则采用战略,否则采用L L战略(包括自己战略(包括自己一旦采用一旦采用L L战略,以后也只能采用战略,以后也只能采用L L战略)。战略)。双方的这种战略在贴现率双方的这种战略在贴现率较大时构成无限次较大时构成无限次重复博弈的一个重复博弈的一个SPNESPNE。20我们假设我们假设1 1采用了这个战略,可以

13、证明在采用了这个战略,可以证明在达到一定数值以后,这一战略也是达到一定数值以后,这一战略也是2 2的的最佳反应函数。最佳反应函数。如果选择一次如果选择一次L L战略,会得到战略,会得到5 5单位收益,单位收益,但会引起对方的报复,所以自己也只得但会引起对方的报复,所以自己也只得选选L L,总收益:,总收益: =5+1.+1 .2+ . . .=5+1-21相反,如果在第一阶段采用相反,如果在第一阶段采用R R战略,双方战略,双方都采取触发战略,则其收益:都采取触发战略,则其收益: =4/(1-) 当当 4/(1-)5+ 即:即: 1/4 时,博弈方对于对方的时,博弈方对于对方的触发战略也采取触

14、发战略,这是一个触发战略也采取触发战略,这是一个SPNESPNE。1-22参与人不固定时的重复博弈参与人不固定时的重复博弈以往的讨论都是假定博弈的参与人是相同的,以往的讨论都是假定博弈的参与人是相同的,但是有时往往一方的参与人是不固定的。如消但是有时往往一方的参与人是不固定的。如消费品市场。费品市场。假定只有一个厂商提供商品,每个消费者只购假定只有一个厂商提供商品,每个消费者只购买一次,每个阶段只有一个消费者。买一次,每个阶段只有一个消费者。在一个阶段中,消费者决定是否购买,而厂商在一个阶段中,消费者决定是否购买,而厂商决定质量高决定质量高/ /低。低。消费者在购买时不知道商品的质量,但是知道

15、消费者在购买时不知道商品的质量,但是知道T-1T-1期的质量。期的质量。231,1-1,20,00,0厂商厂商高高低低消费者消费者买买不买不买24对于厂商而言,提供高质量的商品是一个弱劣对于厂商而言,提供高质量的商品是一个弱劣策略,如果只博弈策略,如果只博弈1 1次,则(不买,低)。次,则(不买,低)。假如厂商的贴现因子假如厂商的贴现因子1/21/2,则下列是,则下列是SPNESPNE:厂商从生产高质量的商品开始;继续生产高质厂商从生产高质量的商品开始;继续生产高质量的商品;如果一次生产了低质量的商品,则量的商品;如果一次生产了低质量的商品,则以后永远生产低质量的商品。以后永远生产低质量的商品

16、。消费者选择购买,只要厂商没有过生产低质量消费者选择购买,只要厂商没有过生产低质量的商品,则继续购买;如果厂商生产过低质量的商品,则继续购买;如果厂商生产过低质量的商品,则不再购买。的商品,则不再购买。均衡的结果是(购买,高)。均衡的结果是(购买,高)。25重复博弈:中东地区的集市重复博弈:中东地区的集市 早期的制度学派一直未理解的事情:落后早期的制度学派一直未理解的事情:落后国家和地区为何一直在贫困中挣扎?既然有国家和地区为何一直在贫困中挣扎?既然有先进国家的榜样,而且资金与技术也非遥不可及,而这些国先进国家的榜样,而且资金与技术也非遥不可及,而这些国家地区似乎静止不动,与发达国家的距离越来

17、越远。家地区似乎静止不动,与发达国家的距离越来越远。 在中东的某些市场,有各种摊贩。品种繁多,但是其有在中东的某些市场,有各种摊贩。品种繁多,但是其有几个特点:卖东西的规模小,买卖双方萍水相逢,多半是几个特点:卖东西的规模小,买卖双方萍水相逢,多半是陌生人,成交前讨价还价占很长的时间。陌生人,成交前讨价还价占很长的时间。 由于交易的产品品质参差不齐,每个东西的特色就可以由于交易的产品品质参差不齐,每个东西的特色就可以夸大其词。在讨价还价中,欺瞒诈骗的伎俩得到淋漓发挥。夸大其词。在讨价还价中,欺瞒诈骗的伎俩得到淋漓发挥。双方都要在言词上胜过对方,品质倒在其次。双方都要在言词上胜过对方,品质倒在其

18、次。 所以在这些市场中,产品几十年、几百年都没有大的变所以在这些市场中,产品几十年、几百年都没有大的变化。化。 新制度经济学把这种均衡称为新制度经济学把这种均衡称为“低度均衡低度均衡”。 26重复博弈与信任机制重复博弈与信任机制委托人委托人0,0代理人代理人-5,105,5不信任不信任信任信任欺骗欺骗诚实诚实图图-1 -1 信任博弈信任博弈27如果此博弈只进行一次,则根据逆向归纳法,容易求如果此博弈只进行一次,则根据逆向归纳法,容易求得此博弈的纳什均衡解是:委托人选择不信任,代理得此博弈的纳什均衡解是:委托人选择不信任,代理人选择欺骗。人选择欺骗。如果双方有机会长期博弈,合作可能通过信誉机制而

19、如果双方有机会长期博弈,合作可能通过信誉机制而实现。我们假定,在每一次博弈结束前,双方都预期实现。我们假定,在每一次博弈结束前,双方都预期有有的可能性下期交易的机会,并且结果相同。我们的可能性下期交易的机会,并且结果相同。我们考虑委托人的考虑委托人的“触发战略触发战略”。代理人该如何行动?如果欺骗,只有本期的代理人该如何行动?如果欺骗,只有本期的1010单位收单位收入;如果不欺骗,得到本期的入;如果不欺骗,得到本期的5 5单位收入,有单位收入,有的概率的概率在下期得到在下期得到5 5单位收入、总的期望收入:单位收入、总的期望收入: 5+5+55+5+52 2+ + 、=5/(1-)=5/(1-

20、) 只要只要5/(1-)105/(1-)10, ,即即0.50.5, ,不欺骗就是代理人不欺骗就是代理人的最佳选择的最佳选择. .28 通过重复博弈通过重复博弈, ,建立了信誉机制建立了信誉机制. .信誉机制的信誉机制的核心在于核心在于: :当事人为了合作带来的长远利益当事人为了合作带来的长远利益, ,愿愿意抵挡欺骗带来的一次性诱惑意抵挡欺骗带来的一次性诱惑. .AB时间收益欺骗诚实图图2 2 当前收益与未来收益当前收益与未来收益1010单位单位5/(1-)29票据贴现是收款人或持票人将未到期的银行票据贴现是收款人或持票人将未到期的银行承兑汇票或商业承兑汇票向银行申请贴现,承兑汇票或商业承兑汇

21、票向银行申请贴现,银行按票面金额扣除贴现利息后将余款支付银行按票面金额扣除贴现利息后将余款支付给收款人的一项银行授信业务。票据一经贴给收款人的一项银行授信业务。票据一经贴现便归贴现银行所有,贴现银行到期可凭票现便归贴现银行所有,贴现银行到期可凭票直接向承兑人收取票款。直接向承兑人收取票款。 假设今年的假设今年的1 1元钱存入银行,利息为元钱存入银行,利息为r r,则,则到明年就变成(到明年就变成(1+r1+r)元,从今年的观点看,)元,从今年的观点看,明年的盈利明年的盈利1 1元相当于今年的元相当于今年的=1/(1+r)=1/(1+r)。显然,显然,01, 01, 是明年的贴现因子。当是明年的贴现因子。当然每年的贴现因子都可以不同,但我们都假然每年的贴现因子都可以不同,但我们都假设它是一个相同的值。设它是一个相同的值。30资本的概念?资本的概念?收入(一系列事件)决定资本的价值。收入(一系列事件)决定资本的价值。CapitalCapital是一个流,重要的是把所有的未是一个流,重要的是把所有的未来收入贴现到今天,今天怎么看这些收来收入贴现到今天,今天怎么看这些收入

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论