博弈论(对策论)扩展-完全且完美信息动态博弈_第1页
博弈论(对策论)扩展-完全且完美信息动态博弈_第2页
博弈论(对策论)扩展-完全且完美信息动态博弈_第3页
博弈论(对策论)扩展-完全且完美信息动态博弈_第4页
博弈论(对策论)扩展-完全且完美信息动态博弈_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、完全且完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。动态博弈的表示法: 阶段和扩展性表示n阶段:动态博弈中一个博弈方的一次选择行为n例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒动态博弈的基本特点n策略是

2、在整个博弈中所有选择、行为的计划n结果是上述“计划型”策略的策略组合,构成一条路径n得益对应每条路径,而不是对应每步选择、行为n动态博弈的非对称性先后次序决定动态博弈必然是非对称的。n先选择行为的博弈方常常更有利,有“先行优势”。逆推归纳法定义定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法逆推归纳法”。n逆推归纳法是动态博弈分析最重要、基本的方法。开金矿博弈甲乙(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借甲乙甲借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈 子博

3、弈和子博弈完美纳什均衡子博弈n定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。甲乙不借借不分分(1,0)(0,4)(2,2)甲(1,0)打不打子博弈完美纳什均衡定义定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。n子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。n逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基

4、本方法。几个经典动态博弈模型l寡占的斯坦博格模型l讨价还价博弈l委托人代理人理论寡占的斯坦博格模型n先后选择产量的产量竞争博弈n把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。QQPPqqQ8)(,21221 cc121111112)(8 )(qqqqqcQPqu212116qqqq221222222)(8 )(qqqqqcQPqu222126qqqq 产量 得益厂商1 3单位 4.5厂商2 1.5单位 2.25先行优势讨价还价博弈三回合讨价还价112不接受,出S接受不接受,出S2接受出S1)10000(,22SS)10000,(11SS)10000(,22SSSS2SS21100

5、0010000每谈判一次,总收益为原来的倍;SS22令110000S210000(S委托人代理人理论委托人代理人关系n经济活动和社会活动中有很多委托人代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。n委托人代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性n委托人代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0R(0),0122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束: w(E)-E w(S)-S w(E)

6、 w(S)+E-S接受:w(E)-E0接受:w(S)-S0参与约束n委托人的选择11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) R(0)店主和店员的问题商店的利润 , 是均值为0的随机变量店员的负效用 , 是店员的努力机会成本为1店主采用的报酬计算公式店员的得益店员期望得益为店主的得益为 eR42eC )4(eBABRASABeBeBAe)1 ()1 ( 4)4(424eBeAe2)4(eeBA参与约束参与约束:当店员风险中

7、性时 符合其最大利益店主选择下限 代入得益公式得: ,期望得益为 ,易求得令 得 ,再代入参与约束得 ,求数学期望得 解得 ,则店主的最优激励工资计算公式是*ee 1B5)8(BA58 BA1B3ARw 31)4(2eeBABe2*1)4(2eeBA142ee142ee2*e动态博弈分析的问题和扩展讨论逆推归纳法的问题颤抖手均衡蜈蚣博弈问题逆推归纳法的问题n逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。这些可能有脱实际的可能n逆推归纳法也不能分析比较复杂的动态博弈n在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难n对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性有相同的理解,或进一步有“理性的共同知识”颤抖手均衡和顺推归纳法n颤抖手均衡(2, 3)1212L(0, 0)NTVRM(1, 2)(1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论