经济博弈论(博士)第四章.05-11-18使用稿_第1页
经济博弈论(博士)第四章.05-11-18使用稿_第2页
经济博弈论(博士)第四章.05-11-18使用稿_第3页
经济博弈论(博士)第四章.05-11-18使用稿_第4页
经济博弈论(博士)第四章.05-11-18使用稿_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主讲人:王慧敏,河海大学商学院,经济博弈论,4.3子博弈精炼纳什均衡,第四章完全信息动态博弈,4.2扩展型博弈的策略及均衡,4.1扩展型博弈表述,4.4子博弈精炼纳什均衡应用举例,4.1扩展型博弈表述,在静态博弈中,所有参与人同时行动(或行动虽有先后,但没有人在自己行动之前观测到别人的行动)。在动态博弈中,参与人的行动有先后顺序,且后行动者在自己行动之前能观测到先行动者的行动。,扩展型表述的引入,博弈专家习惯于用战略式表述描述和分析静态博弈,而用扩展式表述(extensiveformrepresentation)来描述和分析动态博弈。,4.1扩展型博弈表述,扩展型表述所“扩展”的主要是参与人的战略空间。战略式表述简单地给出参与人有些什么战略可以选择,而扩展式表述要给出每个战略地动态描述:谁在什么时候行动,每次行动时有些什么具体行动可供选择,以及知道些什么。简单地说,在扩展式表述中,战略对应于参与人的相机行动规则(contingentactionplan),即什么情况下选择什么行动,而不是简单的、与环境无关的行动选择。,扩展型表述的引入,4.1扩展型博弈表述,参与人集合:,此外,我们将用N代表虚拟参与人“自然”;参与人的行动顺序(theorderofmoves):谁在什么时候行动;参与人的行动空间(actionset):在每次行动时,参与人有些什么选择。参与人的信息集(informationset):每次行动时,参与人知道些什么;参与人的支付函数:在行动结束之后,每个参与人得到些什么(支付是所有行动的函数);外生事件(即自然的选择)的概率分布,扩展型表述的要素,4.1扩展型博弈表述,n个人有限战略博弈的扩展式表述可以用博弈树来表示。为了说明这一点,我们考虑房地产开发博弈的例子,我们假定该博弈的行动顺序如下:开发商A首先行动,选择开发或不开发;在A决策后,自然选择市场需求的大小;开发商B在观测到A的决策和市场需求后,决定开发或不开发。,扩展型表述的表示方式,4.1扩展型博弈表述,房地产开发博弈树:,4.1扩展型博弈表述,博弈树基本构造:,结(nodes):包括决策结(decisionnodes)和终点结(terminalnodes)两类。决策结是参与人采取行动的时点,终点结时博弈行动路径的终点。在上例中,决策结包括空心圆和所有六个实心圆,终点结包括对应八个支付向量的点。枝(branches):枝是从一个决策结到它的直接后续结的连线(有时用箭头表述),每一个枝代表参与人的一个行动选择。比如,在上图中,开发商A有两个选择,分别用标有“开发”和“不开发”的两个枝表示。,4.1扩展型博弈表述,博弈树基本构造:,3.信息集(informationset):博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:每一个决策结都是同一参与人的决策结;该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。我们引入信息集的目的是描述下列情况:当一个参与人要作出决策时他可能并不知道“之前”发生的所有事情。一个信息集可能包含多个决策结,也可能只包含一个决策结(称为单结信息集(singletons)。可以用虚线将属于同一信息集的两个决策结连起来,4.1扩展型博弈表述,囚徒困境博弈的扩展式表述:,一般假定博弈满足“完美回忆”(perfectrecall)的要求。完美回忆指没有参与人会忘记自己以前知道的事情,所有参与人都只到自己以前的选择。,4.2扩展型博弈的策略与均衡,纯战略:,同样的纯战略,既可以解释为扩展式的,也可以解释为战略式的。不同之处在于:在扩展式表述博弈,参与人式相机行事,即“等待”博弈到达自己的信息集(包含一个或多个决策结)后再决定如何行动;在战略式表述博弈,参与人似乎是在博弈开始之前就制定出了一个完全的相机行动计划,即“如果发生,我们将选择”。,4.2扩展型博弈的策略与均衡,如何从扩展式表述构造战略式表述,为了说明这个问题,我们考虑房地产开发博弈的例子,4.2扩展型博弈的策略与均衡,如何从扩展式表述构造战略式表述,4.2扩展型博弈的策略与均衡,逆向归纳法:,逆向归纳法实际上是重复剔除劣战略方法在扩展式博弈中地应用。我们从最后一个决策结开始往回倒推,每一步剔除在该决策结上参与人的劣选择,因此,在均衡路径,每一个参与人在每一个信息集上的选择都是占优选择。上述逆向归纳法的过程不适用于无限博弈和不完美信息博弈。逆向归纳法也不适用于无限博弈并不意味着无限博弈没有纳什均衡存在。,4.3子博弈精炼纳什均衡,4.3.1引言,在纳什均衡中,存在一个很严重的缺陷:纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略选择是给定的,就是说,参与人并不考虑自己的选择对其他人选择的影响。本节将要讨论的泽尔腾(Selten)的“子博弈精炼纳什均衡”是纳什均衡概念的第一个最重要的改进,它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。正如纳什均衡是完全信息静态博弈解的基本概念一样,子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。,4.3子博弈精炼纳什均衡,4.3.1不可置信的存在,为了说明上述论点,我们考虑上一节讨论过的房地产开发博弈的例子。,4.3子博弈精炼纳什均衡,分析结果:这个博弈有三个纳什均衡,分别为:(不开发,开发,开发),(开发,不开发,开发)和(开发,不开发,不开发)用博弈论的语言来说,纳什均衡(不开发,开发,开发)是不可置信的(notcredible),因为它依赖于B的一个不可置信的威胁战略;B的战略是不可置信的,因为给定A选择开发,B不会实施这个威胁。(开发,不开发,开发)是这个博弈的唯一子博弈精炼纳什均衡。,4.3子博弈精炼纳什均衡,4.3.2子博弈精炼纳什均衡,泽尔腾(Selten,1965)引入“子博弈精炼纳什均衡”(subgameperfectNashequilibrium)概念的目的是将那些包含不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈结果的一个合理预测。简单地说,子博弈精炼纳什均衡要求均衡战略地行为规则在每一个信息集上都是最优地。我们首先给出子博弈的概念,粗略的说,子博弈是愿博弈的一部分,它本身可以作为一个独立的博弈进行分析。正式地,我们有下述定义:,4.3子博弈精炼纳什均衡,4.3.2子博弈精炼纳什均衡,定义:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结(包括终点结)组成,它满足下列条件:(1)x是一个单结信息集,即;(2)对于所有的,如果,那么解释:条件(1)说的是一个子博弈必须从一个单结信息集开始。条件(2)说的是,子博弈的信息集和支付向量都直接继承自原博弈。要求子博弈满足上述两个条件的目的是保证子博弈对应于原博弈中可能出现的情况。,4.3子博弈精炼纳什均衡,例如:,4.3子博弈精炼纳什均衡,4.3.2子博弈精炼纳什均衡,定义:扩展式博弈的战略组合是一个子博弈精炼纳什均衡,如果(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。另外:简单地说,一个战略组合是子博弈精炼纳什均衡,当只当它在每一个子博弈(包括原博弈)上都构成一个纳什均衡。如果整个博弈是唯一的子博弈,纳什均衡与子博弈精炼纳什均衡是相同的;如果有其他子博弈存在,有些纳什均衡可能不构成子博弈精炼纳什均衡。,4.3子博弈精炼纳什均衡,4.3子博弈精炼纳什均衡,4.3.2子博弈精炼纳什均衡,这里还需强调一下上述定义中的“在每一个子博弈上给出纳什均衡”这句话。如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”(equilibriumpath),博弈树上的其他路径称为非均衡路径(out-ofequilibriumpath)。纳什均衡只要求均衡战略在均衡路径的决策结上是最优的。“在每一个子博弈上给出纳什均衡”意味着,构成子博弈精炼纳什均衡的战略不仅在均衡路径的决策结上是最优的,而且在非均衡路径的决策结上也是最优的。子博弈精炼纳什均衡就是要剔除掉那些只在特定情况下是合理的而在其他情况下并不合理的行动规则。,4.3子博弈精炼纳什均衡,4.3.3用逆向归纳发求解子博弈精炼纳什均衡,对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。因为有限完美信息博弈的每一个决策结都是一个单独的信息集,每一个决策结都开始一个子博弈。给定博弈到达最后一个决策结,该决策结上行动的参与人有一个最优选择,这个最优选择就是该决策结开始的子博弈的纳什均衡(如果该决策结上的最优行动多于一个,那么我们允许参与人选择其中的任何一个;如果最后一个决策者有多个决策结,那么每一个决策结开始的子博弈都有一个纳什均衡)。然后倒回到倒数第二个决策结(最后决策结的直接前列结),找出倒数第二个决策者的最优选择(假定最后一个决策者的选择是最优的),这个最优选择与我们在第一步找出的最后决策者的最优选择构成从倒数第二个决策结开始的子博弈的一个纳什均衡。,4.3子博弈精炼纳什均衡,4.3.3用逆向归纳发求解子博弈精炼纳什均衡,3、如此不断直到初始结,每一步都得到对应子博弈的一个纳什均衡,在这个过程的最后一步得到的整个博弈的纳什均衡也就是这个博弈的子博弈精炼纳什均衡例如:房地产开发博弈就是这样一个两阶段完美信息博弈。用逆向归纳法求解这个博弈的精炼均衡的步骤如下:,4.3子博弈精炼纳什均衡,4.3.3用逆向归纳发求解子博弈精炼纳什均衡,在第二阶段,B的最优行动规则是:不开发,开发,即,如果A在第一阶段选择了开发,B在第二阶段选择不开发;如果A在第一阶段选择了不开发,B在第二阶段选择开发。因为A在第一阶段预测到B在第二阶段会按这个规则行动,A在第一阶段的最优选择是开发。用逆向归纳法得到的精炼均衡是(开发,不开发,开发)。,4.3子博弈精炼纳什均衡,4.3.3用逆向归纳发求解子博弈精炼纳什均衡,上述分析表明,用逆向回归法求解子博弈精炼纳什均衡的过程,实质是重复剔除劣战略过程在扩展式博弈上的扩展:从最后一个决策结开始依次剔除掉每个子博弈的劣战略,最后生存下来的战略构成精炼纳什均衡。根据定义,逆向归纳法只适用于完美信息博弈。但是,有些非完美信息博弈也可以运用逆向归纳法的逻辑求解。,4.3子博弈精炼纳什均衡,4.3.4承诺行动与子博弈精炼纳什均衡,我们已经看到,有些纳什均衡之所以不是精炼均衡,是因为它们包含了不可置信的威胁战略。这一点意味着,如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数,原来不可置信的威胁就可能变得可置信,博弈的精炼均衡就会相应改变。我们将这些为改变博弈结果而采取的措施称为“承诺行动”(commitment)。在许多情况下,承诺行动对当事人是很有价值的。特别地,有些情况下,一个参与人可以通过减少自己地选择机会使自己受益,原因在于保证自己不选择某些行动可以改变对手的选择,4.3子博弈精炼纳什均衡,4.3.4承诺行动与子博弈精炼纳什均衡,承诺行动的一个古典例子使战争中将军过河将桥炸掉以表示绝不撤退的决心。完全承诺(totalcommitment):桥一旦被炸,撤退就没有可能(或者说撤退成本为无穷大)。不完全承诺:如果一个承诺只是增加某个行动的成本而不是使该行动完全没有可能。将承诺行动纳入模型的一个方法是明确地将承诺行动作为初始阶段的“行动”包括在博弈中(从而得到一个新的博弈)。,4.3子博弈精炼纳什均衡,4.3.4承诺行动与子博弈精炼纳什均衡,考虑我们前面讨论过的房地产开发博弈的例子:如果在A决策之前,B与某个客户签订一个合同,规定B在一个特定的时刻交付客户若干面积的写字楼办公室,如果B不能履约,将赔偿客户3500万。这个合同就是一个承诺行动。有了这个承诺行动,B的开发,开发就不再是一个不可置信的威胁,而是可置信的威胁,因为此时,不论A是否开发,开发是B的最优选择(如果A开发,B不开发时选择损失3500万,开发时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论