




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章 不完全信息动态博弈第一节 完美贝叶斯均衡引入“完美贝叶斯均衡”的目的是进一步“精炼”贝叶斯纳什均衡。就像子博弈完美的条件是为了“精炼”动态博弈中的纳什均衡一样,其是为了剔除不可置信的威胁(或者承诺)。子博弈完美不仅要求参与者的策略组合是一个纳什均衡,而且要求其在每一个子博弈中都是纳什均衡。和子博弈完美纳什均衡类似,当不完全信息博弈由静态发展到动态之后,我们也面临对原有“均衡”概念进一步精炼的要求。当然,本章中,我们不是考虑“子博弈”,而是考虑更加广义的“后续博弈(continuation game)”,和子博弈相比,它可以不是始于单节的信息集。(请联系后面“完美贝叶斯均衡”“序贯均衡”的定义,思考:不同的“均衡”定义是如何以何种方式考虑到前面提到的“后续博弈”的) 和上一章一样,本章中的博弈存在“不完全信息”,这涉及到参与者行动时所依据的“信念”。因此,对均衡解的“精炼”,就必须设计对“信念”的考察。而我们对不完全信息的处理,仍然沿用上章的“海塞尼转换”,假设有个0博弈方“自然”,决定各参与人的类型但是只将类型告诉本人。于是,“不完全信息”可以转变为“不完美信息”。当然,处理“不完全信息动态”博弈中“均衡”的“精炼”问题时,子博弈完美并不能“胜任”。但是,既然“不完全信息”可以通过“海塞尼转换”转变为“不完美信息”,则对“不完全信息”的精炼方法,同样适用于“不完美信息动态博弈”。(回忆前面的“完全但不完美信息动态博弈”,为什么没用考虑到进一步的“精炼”,或者说本章将要进行的对“信念”的精炼?因为前面的信息“不完美”是由于“同时选择”造成的,而且我们假定其“同时选择的子博弈”中有唯一的纳什均衡,因此,不需要对信念进行进一步的精炼)首先,我们通过以下例子来说明进一步“精炼”的必要性:(0, 0) R L R L 2 M L R 1 (1, 3) (2, 1) (0, 2) (0, 1) LRL2, 10, 0M0, 20, 1R1, 31, 3 此博弈有两个NE:(L,L)和(R,R),而且本博弈没有子博弈,因此,子博弈完美的要求自然满足。然而,(R,R)却依赖一个明显不可信的威胁。为了“精炼”掉这样的NE,我们提出以下要求:要求1:在每一个信息集中,应该行动的参与者必须对博弈进行到该信息集中的哪一个节点有一个推断(信念belief)。要求2:给定参与者的推断,参与者的策略必须满足序贯理性(sequentially rational)的要求。比如上例中:p 1-p (0, 0) R L R L 2 M L R 1 (1, 3) (2, 1) (0, 2) (0, 1) 给定推断(p,1-p),L的期望得益=p1+(1-p)2=2-pR的期望得益=1-p。因此,就排除了(R,R)。这是一种特殊情况,那么,参与者的信念是否有都是“理性”的呢?定义:对于一个给定的扩展式博弈中给定的均衡,如果博弈根据均衡策略进行时,将以正的概率到达的信息集,我们称是处于均衡路径上的;反之,则称为是非均衡路径上的信息集。要求3:在处于均衡路径上得信息集中,推断由贝叶斯法则及参与者的均衡策略给出。(信念要与策略相容)以上三个要求包含了完美贝叶斯均衡的主要内容,Wilson and Kreps(1982)将推断(信念)提到了和策略同等重要的位置。在这里,一个均衡不再只是一个策略组合,还包括每一个行动集的推断。In dynamic Bayesian games, an assessment consists of a strategy profile and a system of belief . The belief i of player i is strategically consistent with the strategy profile, if it is derived from the Bayesian rule when its along the equilibrium path.The strategy i of player i is sequentially rational if given i and all other players strategy, i maximizes is (expected) payoff starting from each of his information set.An assessment , is said to be a weak perfect Bayesian equilibrium, if (1) every players belief is strategically consistent with , and (2) every players strategy is sequentially rational.但是,这并不足够。如下例所示:1 A 2, 0, 0 B 2 U D p 1-p l r l r 3 1, 2, 1 3, 3, 3 0, 1, 2 0, 1, 1 12AB33lrLrU2,0,02,0,01,2,13,3,3D2,0,02,0,00,1,20,1,1 NE: (A, U, l) (A, D, l) (A, D, r) (B, U, r) 除(A, D, r)中2的策略不满足“序贯理性要求”外,其他都是WPBNE然而,只有(B, U, r)是子博弈完美的。这是因为,WPBNE并没有考虑到“均衡路径”外的情况。对于“均衡路径”外地信念的精炼,有两种思路:(1)序贯均衡sequential equilibriumLet be an assessment. Let (v) be any sequence of completely mixed behavior strategy profile which converges to as v tends to infinitely. For each v, let v be the beliefs computed by the Bayesian rule according tov. Let be the limit of v . Then is said to be consistent with .对于上例:(2)要求4:处于均衡路径之外的信息集,推断有贝叶斯法则和可能情况下的参与者均衡策略决定。定义 满足要求1到4的策略及其推断(信念)构成博弈的完美贝叶斯均衡。对于上例:但仍有缺陷:完美贝叶斯均衡要求参与者不可威胁使用始于任何信息集的严格劣策略,即使是处于均衡路径之外的。(思考子博弈完美为什么不足够?一是有可能没有子博弈,二是完美贝叶斯均衡要求给定信念,策略要最优,同时给定策略,信念要理性如此循环,逆推归纳是很难满足的。) 上述例子事实上还隐含了要求5:在均衡路径之外的推断中,如果一个节点只有在另一参与者选择始于某些信息集的严格劣策略时才能到达,则到达该节点的概率为0.第二节 信号博弈信号发送者S;信号接受者R1、自然从可行的类型集T中依据概率p(ti)赋予发送者i某种类型ti,p(ti)=12、S观察到ti后从可行的信号集M中选择信号mj发送3、接受者观测到mj(但是看不到ti),从可行的行动集A中选择行动ak4、双方收益为, 简单情况T=t1,t2,M=m1,m2,A=a1,a2,prot1=pa2 a2 a2 a2 a1 a1 a1 a1 t1 t2 0 P 1-p m1 m1 m2 m2 接受者和发送者都有四个纯策略:混同(pooling)策略,如果类型多于两种还可能存在部分混同(partially pooling)或者称为准分离(semi-separating)策略。分离策略“杂合策略”(hybrid strategies),比如t1选择m1,t2却随机地选择m1或m2.如果最后的均衡中,若发送者的策略是混同的,则称为混同均衡,如果是分离的,则称分离均衡。我们把前面完美贝叶斯均衡的要求替换为以下信号要求:信号要求1:在观测到M中任何信号mj后,接受者对哪些类型会发送mj有个推断:,且。信号要求2R:对M中每一mj,在给定哪些类型可能发送mj的推断条件下,接受者的行动必须使接受者的期望收益最大化。信号要求2S:对于T中的每一ti,在给定接受者策略的条件下,发送者选择信号必须使发送者的收益最大化。信号要求3:对于每一M中的mj,如果T中存在ti使得,则接受者在对应于mj的信息集中所持有的信念取决于贝叶斯法则和发送者策略:其中,Tj是根据S的策略,所有可能选择mj的ti的集合。定义 信号博弈中一个纯策略完美贝叶斯均衡为一对策略和以及信念,满足上述信号要求1,2S,2R,3.(以上定义中Tj不是空集,说明其信息要求没有考虑“均衡路径”之外的信念,但是后面的例子中,我们在分析中仍然考虑了均衡路径之外的信息集,注意是怎么分析的)例子:1-q 1-p p d d d d u u u u t1 t2 0 0.5 0.5 L L R R 1,3 4,0 2,4 0,1 2,1 0,0 1,0 1,2 q 只考虑纯策略1、混同于L2、混同于R3、分离t1选L4、分离t1选R1-q 1-p p d d d d u u u u t1 t2 0 0.5 0.5 L L R R 3,2 2,0 1,0 1,1 1,0 0,1 2,1 0,0 q 考虑混同均衡L,L要求5通常思路:给出S的策略根据贝叶斯法则和先验概率计算看到某信号后的“推断(信念)” R根据该推断选择最大化自己期望得益的行动给定R的推断和行动,考察S的策略是否是最优的,即有没有偏离的动机(某些情况下要考虑非均衡路径上的选择)。这背后的纳什均衡的思路包括了对信念的考察,简单说,给定策略,该信念是理性的,给定该信念,该策略是最优的,那么,给定该策略和信念组合,没有人会有偏离的动机。第三节 信号博弈应用1、劳动力市场上的教育信号(1)没有信号的情形否 否 聘 聘 好0.1 差0.9 0 10,20 5,0 10,-3 5,0 (2)信号成本c=2,C=6差0.9 好0.1 N N N Y Y N Y Y 0 D D N N 10-c,20 5-c,0 10,20 5,0 10-C,-3 5-C,0 10,-3 5,0 差0.9 好0.1 N N N Y Y N Y Y 0 D D N N 8,20 3,0 10,20 5,0 4,-3 -1,0 10,-3 5,0 (3)Spence1973、1974模型A、自然决定工人的生产能力=H or L,prob=H=qB、工人知道自己的能力,并选择一个教育水平e0C、两个企业看到教育水平e,并开出工资水平wD、工人接受着两个工资中较高的一个,若相等则随机选择工人的收益,其中为能力的工人获得e教育的成本。企业收益为,其中为能力且获得e教育的工人的产出,产出不仅取决于能力,教育水平也能提高工人的生产能力。不考虑教育的时间持续性以及由此带来的动态选择问题。关键假设1:对于,有关键假设2:竞争使得企业的期望利润为0.即信息要求2R变为,给定观测到e之后的推断,开出的工资要等于工人的期望产出: (1)完全信息条件下:工人可以获得工资,他选择e,最大化以下问题:工人能力为私人信息的时候:A、 低能力冒充高能力的成本过高,及时获得高工资也不足以补偿:B、 低能力的人有动机冒充高能力的人,即我们几种均衡的例子:(i)两种类型的工人都选择单一的教育水平ep 给定工人的信息策略,经验概率等于先验概率,即,于是,工资等于 (2)为完成均衡条件,我们还必须给出其他教育水平的w,并考察两种工人混同于ep是否是最优选择。比如我们可以考虑以下推断:虽然这个推断显得不那么合理,并且在后面我们附加条件会将其“精炼”掉,但是信号博弈的三个条件对非均衡路径上的信念并没有任何规定。根据该推断,企业的工资为:由下图可知,在给定上述推断和策略下,两种类型的工人混同于ep是最优选择。 从该图还可构造出更多的完美贝叶斯均衡。(ii)分离均衡最自然而然的分离均衡给定该策略,于是工资为,为完成均衡的考察,还必须给出其他教育水平的推断和工资,并证明在这些条件下,工人采取该分离策略是最优的。比如:则若“假冒”成本太高,即,则该策略和信念组合下,该分离均衡对低能力的工人也是最优的。但是,如果不满足,则低能力的工人会假冒高能力的工人使得该均衡不成立,那么高能力的工人必须选择更高的教育水平(牺牲福利水平)来证明自己的能力:当然,还有更多的分离均衡。(iii)杂合均衡:一种类型选择某一教育水平,另一类型随机地选择是否混同。 假设高能力的工人选择eh,低能力的以概率选择eh或者以概率(1-)选择eL。给定该策略,有以下推断:,。由可得,那么根据该推断和策略,低能力工人选择“分离”信号时,最大化自己得益,因此。下面确定eh:低能力工人对两种策略无差异:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业废水处理与环保技术进展
- 工业机器人技术在生产线中的运用
- 工业污染源监测与控制技术
- 工业机器人技术详解
- 工业生产中的智能环境监控解决方案
- 工业机器人的人机交互设计
- 工业机械设计的未来发展方向
- 工业自动化中的机器视觉技术应用
- 工业管道设计与安全保障措施
- 工业领域用高效厢式车的探索与研究
- 商业街区广告牌更换施工方案
- DB21T 3806-2023 电梯检验检测全程录像工作规范
- 图论及其应用知到智慧树章节测试课后答案2024年秋山东大学
- 【MOOC】电子技术实验基础一:电路分析-电子科技大学 中国大学慕课MOOC答案
- 【MOOC】经济数学-微积分(二)-武汉理工大学 中国大学慕课MOOC答案
- DB22T 3053-2019 地理标志产品 乾安羊肉
- 《药物代谢学》课程教学大纲
- 起重机械吊具、索具检查记录表(钢丝绳)
- 信息科技大单元教学设计之七年级第二单元直播网络我来建
- 2024年山东省青岛市中考地理试题卷(含答案及解析)
- 瑞得全站仪RTS-822R3说明书
评论
0/150
提交评论