《工学动态博弈》PPT课件.ppt_第1页
《工学动态博弈》PPT课件.ppt_第2页
《工学动态博弈》PPT课件.ppt_第3页
《工学动态博弈》PPT课件.ppt_第4页
《工学动态博弈》PPT课件.ppt_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

完全且完美信息动态博弈,动态博弈的扩展形表示,动态博弈一般用“扩展形” (或称“博弈树”)表示。扩展形表述要给出每个参与人的动态描述,即参与人在什么时点、什么情况下选择什么样的行动。 (1)参与人集合; (2)行动顺序(order of move),即谁在何时采取行动; (3)行动空间(action set),每次轮到某一参与人行动时,可供选择的行动; (4)信息集(information set),参与人进行选择时所知道的信息; (5)收益函数,每个参与人可能选择的每一种行动所构成的行动组合相对应的各个参与人的收益; (6)外生事件的概率分布,即虚拟参与人(自然)的可能选择,它在博弈中的作用只是在相应的地方在若干外生事件中根据一定的概率分布随即选取,而没有自己的利益目标和收益函数。,并不是所有的动态博弈都可以用扩展形表示,因为有些动态博弈的阶段很多,或者博弈方在一个阶段有许多可以选择的行为,这时用扩展形表示动态博弈就很困难,或者根本不可能。 例如下象棋是动态博弈,但它不仅博弈阶段很多,而且每各阶段的可能选择也很多,因此很难用扩展形表示。 无法用扩展形表示的动态博弈,通常可以直接用文字描述和数学函数式表示。,动态博弈的策略和结果,动态博弈的结果首先是指各博弈方上述类型的策略构成的策略组合; 其次,动态博弈的结果是各博弈方的策略组合形成的一条连接各个阶段的“路径”(PATH); 最后,实施上述策略组合的最终结果,即路径终端处得益数组中的数字。,可信性和纳什均衡问题,相机选择和策略中的可信性问题 动态博弈中博弈方的策略并没有强制力,而且实施起来有一个过程,只要符合博弈方自己的利益,他们完全可以在博弈过程中改变计划。我们称这种问题为动态博弈中的“相机选择”(Contingent Play)。,不可置信威胁引出信息经济学中一个很重要的概念“承诺行动”(commitment)。 承诺行动是当事人使自己的威胁战略变得可置信的行动。 一种威胁在什么时候才是可置信的?只有当事人在不实施这种威胁时,就会遭受更大的损失时,威胁才是可置信的。 所以,承诺行为就意味着当事人要为自己的诺言付出成本,尽管这种成本不一定真的发生。 承诺行动会给当事人带来很大的好处,因为它会改变均衡结果。,乙的完整策略是,第一阶段选择“借”,若第二阶段甲选择“不分”,第三阶段选择“打”。甲的完整策略是:第二阶段选择“分”。最后得益是双方各得2。,完善的法律制度不但能保障社会的公平,而且还能提高社会经济活动的效率,是实现最有效率社会分工的重要保障。 当然,要充分保障社会公平和经济活动的效率,法律制度必须对人们正当权益的保护力度足够大,对侵害他人利益者有足够的震慑作用。,子博弈,定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。,子博弈完美纳什均衡,定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。,逆推归纳法(backwards induction) 逻辑基础:动态博弈中先行动的理性的博弈方,在前面阶段选择行为时必然会考虑后行为博弈方在后面阶段中将会怎样选择行动,只有在博弈的最后一个阶段不再有后续阶段牵制的博弈方,才能做出明确的选择。而当后面阶段博弈方的选择确定以后,前一阶段博弈方的行为也就容易确定了。 一般方法:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段的博弈方的选择和路径。,由于逆推归纳法确定的各个博弈方在各阶段的选择,都是建立在后续阶段各个博弈方理性选择的基础上,因此自然排除了包含有不可置信的威胁或承诺的可能性,因此其结论是比较可靠的,确定的各个博弈方的策略组合是有稳定性的。,动态博弈完善了纳什均衡的观点 所谓“精炼纳什均衡”就是将纳什均衡中包含的不可置信的威胁战略剔除出去,就是说,使均衡战略不再包含不可置信的威胁,它要求参与人的决策在任何时点上都是最优的,决策者要随机应变,而不是固守旧略。,练习1:设一四阶段两博弈方之间的动态博弈如下图所示,求子博弈精炼纳什均衡策略组合和博弈的结果。,练习2: 试写出下列动态博弈,并分析。 设想一个姑娘爱上一个小伙子,她父亲坚决不同意,威胁说,如果女儿不与小伙子断绝关系,他就与女儿断绝父女关系。女儿应当如何决策?,“战术勾结” 寡头之间的“不回避竞争法则”,是指至少有几个寡头厂商保证(通常以做广告的方式)自己的索价不高于其他任何竞争者。这样的许诺对于消费者来说似乎是件很好的事,但事实上这样的做法会提高价格。,寡占的斯塔克博格(stackberg)模型 动态的寡头市场产量博弈模型,u1=q1P(Q)-c1q1 =q18-(q1+q2)-2q1 =6q1- q1q2-q12 u2=q2P(Q)-c2q2 =q28-(q1+q2)-2q2 =6q2- q1q2-q22,根据逆推归纳法的思路,先分析第二个厂商的决策。在第二个阶段厂商2决策时,厂商1选择的q1实际上已经决定了,并且厂商2 知道q1,因此对于厂商2来说,相当于在给定q1的情况下求使u2实现最大值的q2。 q2应满足: 6q12 q2 = 0 q2 =3q1/2,厂商1 知道厂商2的这种决策思路,因此在选择产量水平q1时就知道厂商2的产量q2*会根据上式确定,所以他可以直接将上式代入自己的得益函数,这样厂商1的得益函数实际上转化成了他自己产量的一元函数: u1(q1,q2*) = 6q1q1q2*q12 = 6q1q1(3q1/2)q12 = 3q10.5q12 3q1* = 0 q1* = 3 q2* = 31.5 = 1.5 P=3.5 u1=4.5 u2 = 2.25,练习: 三寡头市场有倒转的需求函数P = 100-Q,其中Q是三厂商的产量之和,并且一至三各厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2先同时决定产量,厂商3 根据厂商1 和2 的产量决策。它们各自的产量和利润是多少?,三个厂商的利润函数为: U1=(100-q1-q2-q3)q1-2q1 U2=(100-q1-q2-q3)q2-2q2 U3=(100-q1-q2-q3)q3-2q3 根据逆推归纳法,先分析第二阶段厂商3的选择 厂商3 的反应函数为: 100-q1-q2-2q3-2=0 q3=(98-q1-q2)/2 再分析第一阶段厂商1和厂商2的选择,将厂商3的反应函数带入1和2利润函数中,求出反应函数,解方程组 q1=q2=98/3 q3=98/6,讨价还价博弈 讨价还价(bargaining)是市场经济中最常见、普通的事情。讨价还价在博弈论中是典型的动态博弈问题。,本博弈的关键有两点:1、第三回合甲的方案有强制力,即进行到该回合甲提出的分割比例S/10000S,乙必须接受,并且这一点两博弈方都是清楚的。2、该博弈每多进行一个回合总得益就会下降一个比例,因此让谈判拖得越长对双方可能越不利,如果必须让对方得的数额不如早点让其得到,这对自己是有利的。,第三回合:甲的出价S乙必须接受,因此甲的出价会选择S=10000。为了容纳更多的可能性,仍然保留S作为甲在该回合的出价。因此,如果博弈进行到第三回合,双方的得益分别为2S和2(10000S)。,第二回合乙的选择:乙知道一旦博弈进行到第三回合,甲将出S,自己得到2(10000S),甲得到2S。如果乙已经拒绝了第一回合甲的方案,此时他该如何出价才能使自己的得益最大化呢?如果他出的S2使甲选择接受的得益小于第三回合的得益,那么方案肯定会被拒绝,进行到第三回合,自己得2(10000S)。如果自己出的S2既能让甲接受(意味着甲的得益不小于第三回合的得益),又能使自己的得益比第三回合的得益大,那么这样的S2符合乙的利益。,假设任一博弈方只要得益不小于下一回合自己出价时的得益,就愿意接受对方的出价,那么乙在第二回合能让甲接受的,也可能使自己的最大利益的S2应满足: S2 = s 此时乙的收益得益为: (10000S)=100002S 2(10000S),第一回合甲的考虑,甲一开始就知道第三回合自己的得益是2S,也知道进行到第二回合自己的得益也是2S,因此,如果甲在第一回合就给乙100002S,而自己又能得到比2S更多的利益,那当然是最理想的。实现这一理想需令S1满足: 10000S1 = 100002S,此时乙的得益于进行到第二回合的利益相同,甲的得益10000100002S则比进行到第二、第三回合的得益2S大。因此甲在一第回合出价S1 = 10000100002S,乙方接受,甲、乙双方得益各为10000100002S和100002S,是这个博弈的子博弈精炼纳什均衡。,双方获得利益的比例取决于-2的大小。-2越大,甲的比例越小,乙的比例越大。当=0.5时,-2有最大值0.25,当0.51时,越大,-2越小,甲的得益越大,乙的得益越小;当00.5时,越大,-2越大,甲的得益越小,乙的得益越大。,乙讨价还价的筹码就是可以跟甲托时间(当然拖延对乙的收益也有影响),拖延时间对甲造成的损失越大,甲愿意分给乙以求早日结束讨价还价的利益越大,只有当甲完全不怕旷日持久的谈判(=1),或乙的争夺是毁灭性的(=0)时,居于有利地位的甲方才不需要花钱买太平,可以保证自己的全部利益。,练习:,考虑以下双寡头策略投资模型:企业1 和企业2当前的平均成本都是2。企业1可以装备一种新的技术,从而使其平均成本降低到1。装备这一技术需要花费f。企业2可以观察到企业1是否投资于这一新技术。一旦企业1对新技术的投资行为被观察后,两个企业如同在古诺竞争模型中一样,同时选择自己的产量水平q1和q2。因此,这是一个两阶段的博弈。假设市场需求函数为P(Q)=14-Q,其中P是市场价格,Q是市场总产量,Q=q1+q2。问上述投资额f处于什么水平时,企业1会选择引进新技术?,技术投资可以从两个方面增加企业1第二阶段的利润。首先,企业1在任何给定的产出下都能获得比原来要高的利润,因为生产成本降低了;其次,企业1还可以从企业2减少的产出中获利。企业2减少产出有的是由于企业1通过降低其生产成本可以改变其自身在第二阶段的竞争力。,逆推归纳法的问题,首先逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,互相知道对方了解博弈结构。 现实经济中得博弈问题常常没有明确的设定,要求各博弈方都完全清楚问题的背景,且相互有完全的信任更不容易,因此运用逆推归纳法会有脱离实际的可能。,其次是逆推归纳法也不能分析比较复杂的动态博弈。因为逆推归纳法的推理方法是从博弈的最后阶段开始对每种可能的路径进行比较,因此使用范围是人们有能力比较判断的选择路径数量,包括数量不很大的离散策略,或者有连续得益函数的连续分布策略 在遇到两条路径利益相同的情况时,逆推归纳法会发生选择困难。,第三,逆推归纳法更大的问题是对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许博弈方犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性(个人理性、集体理性、风险偏好)有相同的理解,或进一步有“理性的共同知识”。,蜈蚣博弈是一个有限次序博弈。在有限阶段里,两个人交替在两份大小不一的资产中做选择。在任何阶段中,先选者可以选择“接受”或“放弃”,如果接受,他取得较大的一份(假设每个人都使自己收益最大化),而另一个人则取得较小的一份,博弈结束。如果放弃,博弈进入下一阶段。在新的阶段里,原来的两份钱加倍,上一阶段的后选者有优先选择权,其他规则不变。,这一博弈的纳什均衡是第一个选择者选择接受,取走较多的收入,马上结束博弈。,倒推式理性具有其理论的完美性,也部分地解释博弈显著地早于最后阶段结束的事实,但它却无法完全预测被实验者的行为。被实验者似乎在参加多次(与不同的人进行博弈)实验后,更显现出倒推式理性。,一种可能的解释是:行为者的理性可能不是公共信息。每一个行为者可能是理性的,但却可能不确定其他人是否理性,也许只有通过经验才能认识其他人的理性。,“泡沫”资产市场 当一个市场上存在许多资产,其交易价格远远超过基本价值时,我们称之为泡沫资产市场。因为它不可能长期存在下去,随时会出现价格大幅度重挫,回到甚至低于基本价值。这种现象在股票市场上时有发生,具体表现为“股灾”。为什么理性行为者组成的市场会出现“泡沫”资产市场现象?当成交价非常高时,这种高价格绝不可能源于对基本价值的乐观态度。一种推测是,“大笨蛋” 的信念可能解释资产市场的“泡沫”现象。,求解蜈蚣博弈:,假设B能够向第三方签订一张2美元的债券,约定只要他没有选择“放弃”,进入下一阶段,就会失去债券,如果选择了放弃,债券最终还归还与他。 这一做法将带来有效率的合作结果。,当引入债券后,对该博弈的完整表述如下:,B签债券的收益为5,不签的收益为1,B会选择签。,反击,冷战期间,美国与西德等几个欧洲国家结盟共同抵抗苏联。苏联在欧洲部署着更多数量的陆军,如果攻击,就会很快占领西德。为了阻止苏联攻击,美国在西德境内驻军。然而,美国愿意提供给西德的陆军远不能抵抗苏联的全力攻击。 事实上,吓退苏联进攻的并不是部署在西德的驻军,而是来自美国的大规模反击甚至使用核武器的威胁,然而,威胁是可信的吗? 假设西德境内没有驻扎美军,美国和苏联之间的博弈局势如下:,然而,美国能够通过在西德少量驻军改变博弈局势。当时在西德的美国驻军被称为绊网,暗含的意义就是苏联若进攻席的毁灭在西德美国驻军,必将遭到美国的反击。当苏联进攻西德时,美国若不反击,眼睁睁地看着驻军毁灭,收益如下:,维持驻军的费用使美国即使在不攻击的情况下收益也减少了。虽然在任何情况下(苏联进攻、不进攻)美国的收益都减少了,但美国详细的派遣军队并非是非理性的。,博弈方的理性,博弈方的理性局限和犯错误的可能性,还给我们提出了新的问题,对于理性的博弈方来说,如果其他博弈方偏离了子博弈精炼纳什均衡的路径时,应当怎样进行后面的博弈就是一个很困难的问题。,颤抖手均衡 泽尔滕提出理解有限理性的博弈方在动态博弈中的偏离子博弈精炼纳什均衡行为的思想。 一个策略组合是一个颤抖手均衡的条件:首先必须是一个纳什均衡,其次是不能包含任何“弱势策略”,也就是偏离对偏离者没有损失的策略。包含弱势策略的纳什均衡不是颤抖手均衡,因为他们经不起任何非完全理性的“扰动”,缺乏在有限理性条件下的稳定性。,两条子博弈纳什均衡的路径,一条是博弈方1在第一阶段选择L结束博弈,另一条是R-N-T-V,但第二条不是颤抖手均衡路径。因为只要博弈方1考虑到博弈方2在第二阶段有任何一点偏离N的可能性,博弈方1在第一阶段就不会坚持R的策略,因此后一条路经对应的纳什均衡是不稳定的。,上图中的博弈只有一条纳什均衡路径,同时也是颤抖手均衡,因为只要每个博弈方犯错误、偏离该路径的概率比较小,那么博弈方主观上都有坚持它的愿望。,颤抖手均衡思想把博弈方在各个阶段的错误看作是互不相关的小概率事件。 博弈方1在第一阶段选择L结束博弈是该博弈的唯一纳什均衡路径。但如果在实际进行这个博弈时,博弈方1在第一阶段选择了R而不是L,那么这时博弈方2如果根据颤抖手均衡思想考虑,仍然会选择N而不是M,因为从第二阶段博弈方的选择开始的子博弈中,N-T既是子博弈纳什均衡路径,也是颤抖手均衡路径。,顺推归纳法,如果博弈方1 在第一阶段确实选择了D,,那么比博弈方1的选择出了差错更有说服力的解释,就是博弈方1是有意识这样选择的,在第一阶段选择D而不是R,就是准备在第二阶段选择S。,根据博弈方前面阶段的行为,包括偏离特定均衡路径的行为,推断他们的思路,并为后面阶段博弈提供依据的分析方法,就是顺推归纳法。 顺推归纳法考虑的是博弈方有意识偏离子博弈纳

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论