ch3 完全且完美信息动态博弈

上传人：为*** IP属地：贵州上传时间：2020-05-24 格式：PPT 页数：58 大小：574.50KB 积分：25 举报 版权申诉

已阅读5页，还剩53页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2020/5/24,1,第三章完全且完美信息动态博弈,完全得益完美过程动态先后请考虑以下问题：（1）是不是信息越多越有利？（2）过程是否重要？（3）动态博弈与静态博弈有哪些异同之处？（4）人们对已经过去的博弈是更注重结果还是更注重过程？其意义何在？,2020/5/24,2,本章分六节,3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论,2020/5/24,3,3.1动态博弈的表示法和特点,3.1.1阶段和扩展性表示3.1.2动态博弈的基本特点,2020/5/24,4,3.1.1阶段和扩展性表示,阶段：动态博弈中一个博弈方的一次选择行为例子：仿冒和反仿冒博弈,注：并不是所有的动态博弈都可以用扩展形来表示，如下棋。,2020/5/24,5,3.1.2动态博弈的基本特点,1.动态博弈的策略和结果策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合，构成一条路径得益对应每条路径，而不是对应每步选择、行为2、与静态博弈不同的基本特点1）策略不同。每个博弈方的策略是指在整个博弈过程中在每个阶段作出相应选择和行为的完整计划。2）结果不同。博弈的结果是指每个博弈方的策略组成的策略组合、实现博弈的路径及各个博弈方的得益。3）地位不对称,6,完全信息静态博弈模型的表述（回顾）,图3.2市场进入的动态博弈,扩展式（博弈树）,标准（战略）式,A先行动,B先行动,图3.1市场进入的静态博弈,完全信息静态博弈模型的表述(等价)动态博弈的标准式表示,图3.2市场进入的动态博弈,扩展式（博弈树）,标准（战略）式,A先行动,该博弈有三个纳什均衡：1.（进入，（不进入，不进入）；2.（不进入，（进入，进入）；3.（进入，（不进入，进入）。博弈的最终结局应出现哪个均衡，需要分析在三个均衡的合理性。,1.含有不可信的承诺2.含有不可信的威胁3.合理的纳什均衡,完全信息静态博弈模型的表述(等价)静态博弈的博弈树表示,图3.1市场进入的静态博弈,扩展式（博弈树）,标准（战略）式,A先行动,B决策时不知道A的选择,2020/5/24,9,3.2可信性和纳什均衡的问题,3.2.1相机选择和策略中的可信性问题3.2.2纳什均衡的问题3.2.3逆推归纳法,2020/5/24,10,3.2可信性和纳什均衡的问题,在动态博弈中，由于博弈方策略的实施是一个过程,所以过程十分重要，类似于对未来过程的了解，它本身依赖于其它博弈方的行为。那么就存在一个对其博弈方所可能采取策略的可信性问题。博弈方在博弈过程中存在着改变计划的情况,这种问题称为相机选择问题.可信性：动态博弈中先行为的博弈方是否应该相信后行为博弈方会采取某种策略或行为。后行为博弈方将来采取对先行为博弈方有利的行为为“许诺”，采取对先行方不利的行为为“威胁”。,2020/5/24,11,3.2.1相机选择和策略中的可信性问题1.开金矿博弈,条件：甲去开采一价值4万元的金矿，缺1万元，乙恰好有1万元可以投资。甲向乙借1万元可以可开金矿，并“许诺”成功后与对半分成。问题：乙是否该给甲投资？,2020/5/24,12,3.2.1相机选择和策略中的可信性问题1.开金矿博弈,可能性即甲可能成功之后不与乙分钱（分当然好），则乙损失1万元。由此，乙决策的关键在于他是否相信甲的“许诺”，而结局取决于甲是否遵守他的“许诺”。接下来乙可采取一些方法以使甲尽可能兑现他的许诺打官司。,2020/5/24,13,3.2.1相机选择和策略中的可信性问题1.开金矿博弈,根据自身利益最大化原则，甲在轮到行为时的唯一选择是不分，而乙清楚甲的行为准则，则选择不借。对乙来讲，本博弈中甲有一个不可信的肯定不会信守的许诺。怎样使甲的许诺变为可信的呢？关键在于必须增加一些对甲行为的约束。,2020/5/24,14,3.2.1相机选择和策略中的可信性问题2.法律保障的开金矿博弈,若乙采取法律手段，即打官司保护自己的利益，则博弈进程如下图所示。,2020/5/24,15,3.2.1相机选择和策略中的可信性问题2.法律保障的开金矿博弈,在本博弈中，乙的唯一选择是打官司，对甲来讲，乙打官司的威胁是可信的，是肯定会信守的，他最理智的选择就是分。即，乙的策略是在第一阶段借，如甲在第二阶段选择不分，则第三阶段选择打；甲的策略是如乙在第一阶段选择借，则他在第二阶段选择分。在双方这样的策略组合下，本博弈的路径是（借，分），双方得益为（2，2），实现有效率的理想的结果。,2020/5/24,16,3.2.1相机选择和策略中的可信性问题3.法律保障不足的开金矿博弈,根据纳什均衡的定义可以判断，乙的策略是第一阶段选择“借”，若第二阶段甲选择“不分”，第三阶段选择“打”，甲的策略是第二阶段选择“分”。实际结果是：乙在第一阶段不会选择“借”，甲在第二阶段也不会选择“分”，乙在第三阶段也不会选择“打”。结果相反的原因是第三阶段的“打”是不可信的威胁。,如果乙的选择打官司的得益是-1，即所谓赢了官司输了钱。即法律保障不足的开金矿博弈,2020/5/24,17,3.2.1相机选择和策略中的可信性问题3.法律保障不足的开金矿博弈,法律制度必须满足两方面的要求：一是对人们的正当权益保护力度足够大；二是对侵害他人利益者有足够的震慑作用，否则作用有限甚至完全无效。乙打官司的威胁不可信，于是甲“分”钱的许诺就不可信。最后结果乙选择“不借”,2020/5/24,18,3.2.1相机选择和策略中的可信性问题,结论：在动态博弈中，各个博弈方的选择和博弈结果，与各个博弈方在各个阶段选择各种行为的可信程度有很大关系。,2020/5/24,19,3.2.1相机选择和策略中的可信性问题先来后到博弈,在此博弈中，后进入者博弈方1要决定是否进入市场竞争，而先进入市场的博弈方2有打击和不打击两种选择。,2020/5/24,20,3.2.1相机选择和策略中的可信性问题先来后到博弈,根据利润最大化原则，博弈方2的唯一选择是无情打击对手，这时博弈方2的打击的威胁是可信的。了解博弈方2决策原则的博弈方1在第一阶段只会选择不进。该博弈的结果为（0，10），即先占领市场者独享利润。,2020/5/24,21,3.2.1相机选择和策略中的可信性问题先来后到博弈,当得益变成右图情况以后，博弈方2的打击的威胁就不再是可信的了。这样，博弈方1在第一阶段的合理选择当然只有进。博弈的结果选择路径为（进，不打击），双方得益为（5，8）。后进者信息多，但利润不如先进入者。后来者不一定总是从前者利益中分出一部分，而可能创造更大的总利益，而先进入者的损失也不一定很大。,2020/5/24,22,第三种开金矿博弈中，（不借-不打，不分）和（借-打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题。,3.2.2纳什均衡的问题,2020/5/24,23,3.2.3逆推归纳法,在动态博弈中如何求解？动态博弈的特点是：在采取某一种决策时必须对其后可能进行的子博弈有充分的了解，这样才能很好的进行博弈并得到合理的结果（基于理性和可信性，相当于对后博弈行为的合理假设）。由此，对于完全且完美信息的动态博弈其基本求解方法可由最后阶段的子博弈逆推来决定采取合适的策略逆推归纳法。,2020/5/24,24,3.2.3逆推归纳法,定义：逆推归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始，逐步向前倒推以求解动态博弈的方法。例,2020/5/24,25,3.2.3逆推归纳法,逆推归纳法是动态博弈分析最重要、基本的方法。,2020/5/24,26,3.3子博弈和子博弈完美纳什均衡,3.3.1子博弈3.3.2子博弈完美纳什均衡,2020/5/24,27,3.3.1动态博弈中的子博弈,定义：子博弈即能够自成一个博弈的某个动态博弈的从其某个阶段开始的后续阶段，它必须有一个初始信息集，且具备进行博弈所需的各种信息。,2020/5/24,28,3.3.1动态博弈中的子博弈,注意：原博弈的初始节点开始的博弈为原博弈本身，不称它为原博弈的子博弈；第五章将说明在不完美信息博弈中有其它的不作为子博弈的起始信息集的节点。,2020/5/24,29,3.3.2子博弈完美纳什均衡,在动态博弈中由于博弈过程是逐步深入的，这一过程由每个阶段所采取的策略构成，由此引出“路径”的概念。路径：从第一阶段开始通过每阶段一个行为，最后达到博弈结束的一个终端各博弈方的行为组合。找到了路径也就找到了一个分阶段的策略组合，这一策略组合恰似一个完整的计划，计划的最终实现取决于过程中各阶段的实现。,2020/5/24,30,3.3.2子博弈完美纳什均衡,在开金矿案例中，策略组合（借，分）是一个稳定的策略组合，因为如果不分，则有乙打官司的威胁，这是双方都不愿得到的结果。“稳定”意味着博弈方都不会单独改变策略，这恰似纳什均衡的概念。,2020/5/24,31,3.3.2子博弈完美纳什均衡,由于动态博弈与静态博弈有较大的差异，那么如何才能使静态博弈中的纳什均衡在动态博弈中亦有相应的概念发展？以开金矿为例（注意此例与以前开金矿例子的差异）,2020/5/24,32,3.3.2子博弈完美纳什均衡,此时打官司对乙亦无好处（此情况在现实中可能出现）。在此情况中，逆推可以得出乙不借，原因在于乙在第三阶段打官司的威胁是不可信的。由此导致甲在第二阶段分的许诺也变为不可信。结局是，甲开不成金矿，乙保本，甲失去挣钱的机会。,2020/5/24,33,3.3.2子博弈完美纳什均衡,如果按照静态博弈的分析方法，则（借，分，打）的策略组合为一个纳什均衡，因为任何一方都不会单独改变策略而降低自己的得益。这与逆推归纳法得到的结论相矛盾，原因在于路径（借，分）的纳什均衡策略组合包含了一个不可信的威胁，即乙在第三阶段会选择打官司的行为是不可信的。,2020/5/24,34,3.3.2子博弈完美纳什均衡,由此需要对静态博弈中的纳什均衡的概念有所调整，即应满足：是纳什均衡，从而具有策略稳定性不能包含任何的不会信守的许诺或威胁这样的动态博弈策略组合称为子博弈纳什均衡。,2020/5/24,35,3.3.2子博弈完美纳什均衡,定义（Selten塞尔顿）：如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡，则称该策略组合为一个“子博弈完美纳什均衡”。,2020/5/24,36,3.3.2子博弈完美纳什均衡,注意，用逆推归纳法所得到的解应为子博弈完美纳什均衡。动态博弈所应注意的两点：要求各博弈方的策略对每阶段每种可能的情况都设定一个行为方案。其意义在于避免出现不会信守的许诺或威胁，从而使子博弈完美纳什均衡可以用。假定所有博弈方都是理性的且不会犯错误的。,2020/5/24,37,3.3.2子博弈完美纳什均衡,与实际情况的差异：后续可能性太多而无法分析，于是考虑仅知道有限后续阶段的情况？许诺有限非理性，如何考虑？比如假设非理性的次数小于等于k？下棋K叉树算法博弈构成的“长短”与稳定性，不可预测性等,2020/5/24,38,3.4几个经典动态博弈模型,3.4.1寡占的斯塔克博格模型3.4.2劳资博弈3.4.3讨价还价博弈3.4.4委托人代理人理论,2020/5/24,39,3.4.1寡占的斯塔克博格模型（古诺模型在动态博弈中的体现）,模型：设一市场有1、2两个厂商生产同样的产品。如果厂商1的产量为q1,厂商2的产量为q2，则市场总产量为Q=q1+q2。设市场出清价格是P=P(Q)=8-Q，生产无固定成本，单位变动成本为2，讨论其纳什均衡。分析：个体收益最大化博弈方1利润：博弈方2利润：,回忆“古诺的寡头模型”,2020/5/24,40,回忆“古诺的寡头模型”,在本博弈中，的纳什均衡的充分必要条件是和的最大值问题：第一个对q1求导，并将q1*代入，6-q2*-2q1*=0第二个对q2求导，并将q2*代入，6-q1*-2q2*=0解得唯一解社会收益最大化：假设总产量为Q，总收益为UQP（Q）CQQ（8-Q）2Q6QQ2其最大值为Q*=3,U=9该结果与纳什均衡有较大的差异，这就是纳什均衡是源于各厂商追求自身利益最大化的结果。,3.4.1寡占的斯塔克博格模型（古诺模型在动态博弈中的体现）,2020/5/24,41,3.4.1寡占的斯塔克博格模型,然而，许多实际问题为各厂商进入市场有先后，尤其是厂家有强弱之分，且后一厂商（跟随者）在决策时是看着前一厂商的选择的，由此引出斯塔克博格模型。斯塔克博格模型与古诺模型相比，唯一的不同是前者有一个选择的次序问题，其他如博弈方、策略空间和得益函数等完全都是相同的。,2020/5/24,42,3.4.1寡占的斯塔克博格模型,先后选择产量的产量竞争博弈把古诺模型改为厂商1先选择，厂商2后选择，而非同时选择即可。,产量得益厂商13单位4.5厂商21.5单位2.25,先行优势,2020/5/24,43,逆推归纳法第二阶段：厂商2决策在决策时，厂商1选择的产量q1已经确定了，厂商2知道这一点，因此对厂商2来讲，相当于在给定q1的情况下，求使u2最大值的q2。,第一阶段：厂商1决策厂商1知道厂商2的这种决策思路，于是厂商1的得益函数转化为,求得：,3.4.1寡占的斯塔克博格模型,2020/5/24,44,产量得益厂商13单位4.5厂商21.5单位2.25比较：古诺模型厂商12单位4厂商22单位4,比较说明：两厂商地位不对称。厂商1具有先行优势，得到较多的利益。同时也说明信息较多并不一定能得到较多的利益,3.4.1寡占的斯塔克博格模型,2020/5/24,45,3.4.1寡占的斯塔克博格模型,以上模型说明：在信息不对称的博弈中，信息较多的博弈方（如厂商2决策之前已知厂商1的实际选择，因此他有较多的信息）不一定能得到较多的得益。原因：先行为或信息较少者认为后行为方或知识较多者作为理性的博弈方，不可能为了公平或赌气而采取任何对双方不利的行为，从而先发制人选择比同静态决策时更大的产量而获得利益和好处。,2020/5/24,46,3.5有同时选择的动态博弈模型,3.5.1标准模型3.5.2间接融资和挤兑风险3.5.3国际竞争和最优关税3.5.4工资奖金制度,2020/5/24,47,3.5.1标准模型,博弈中有四个博弈方，分别称为博弈方1、2、3和4第一阶段是博弈方、2的选择阶段，他们同时在各自的可选策略（行为）集合和中分别选择和第二阶段是博弈方3、4的选择阶段，他们在看到博弈方1、2的选择和以后，同时在各自的可选策略（行为）集合和中分别选择和各博弈方的得益都取决于所有博弈方的策略即博弈方i的得益是各个博弈方所选择策略的多元函数,2020/5/24,48,3.5.1标准模型及其存在的问题,与前面讨论的动态博弈一样，也是多阶段并且在后一阶段前，博弈方能看到此前的博弈过程，但在同一个阶段有两个或两个以上博弈方同时选择。严格而言，这种博弈并不是完美信息的，它们介于完美信息和被完美信息之间。可用逆推法来求解，不同的是最后阶段（每一阶段）不是单一方求利益最大化，而是由一个博弈结果来决定的。因而与以往的不有一个的差异，要详细分析才可以。,2020/5/24,49,3.5.2间接融资和挤兑风险,下一阶段,设一家银行为了给一个企业贷放一笔20000元的贷款，以20的年利率吸引客户的存款。若两个客户各有10000元资金，如果他们把资金作为1年期定期存款存入该银行，那么银行就可以向企业贷款；如果两客户都不愿行款或只有一个客户存款，那么银行就无法结上述企业贷款，这时候客户都能保住自己的本全。,2020/5/24,50,如果第二阶段理想的结果（到期，到期）纳什均衡，结果如图。,（到期，到期）（存款，存款）,下一阶段,1.2，1.2,此时有两个纳什均衡，后一个帕累托优于前一个，也是上策均衡和风险上策均衡。,3.5.2间接融资和挤兑风险,2020/5/24,51,如果第二阶段不理想的结果（提前，提前）纳什均衡，结果如图，,下一阶段,0.8，0.8,（提前，提前）（不存，不存）,此时，（不存，不存）是纳什均衡，也是上策均衡。,3.5.2间接融资和挤兑风险,2020/5/24,52,

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

ch3 完全且完美信息动态博弈

文档简介

温馨提示

最新文档

评论

ch3 完全且完美信息动态博弈

文档简介

温馨提示

最新文档

评论

相关文档