第三章完全且完美信息动态博弈.ppt

上传人：低*** IP属地：江西上传时间：2020-06-03 格式：PPT 页数：73 大小：1.39MB 积分：12 举报 版权申诉

免费预览已结束，剩余68页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三章完全且完美信息动态博弈,本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。,本章分六节,3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论,逆向归纳法的应用例子私奔博弈在我国汉代，有个青年作家叫司马相如，有个年轻的寡妇叫卓文君。但这门亲事遭到文君父亲的反对。父亲对文君说，你若跟司马相如结婚，那么就将脱离父女关系。现在，卓文君应该怎样选择？是屈从父亲，还是跟心上人结婚？,海盗分赃话说有5个海盗抢来了100枚金币，大家决定分赃的方式是：由海盗一提出一种分配方案。如果同意这种方案的人达到半数，那么该提议就通过并付诸实施；若同意这种方案的人未达半数，则提议不能通过且提议人将被扔进大海喂鲨鱼，然后由接下来的海盗继续重复提议过程，假设每个海盗都绝顶聪明，也不相互合作，并且每个海盗都想尽可能多得到金币，那么，第一个提议的海盗将怎样提议即可以使得提议被通过又可以最大限度得到金币呢？,如果他们就是第一个海盗会怎么分。答案五花八门，但是大多数是表示平均分这可能是现实中的情况，公平观念在博弈中发挥着作用。但是标准博弈论是研究人们完全理性的情况下极端复杂的策略互动后果，这里的平均分配并不符合标准博弈论的逻辑。那么答案究竟是什么呢？使用逆向归纳法可以求解如下：首先，考虑只剩下最后的海盗五，显然他会分给自己100枚，并赞成自己。再回溯到只剩下海盗四和海盗五的决策，海盗四分给自己100枚并赞成五自己；海盗五被分得0枚，即使反对也无用。回到海盗三，海盗三可以分给海盗五的决策1枚得到海盗五的同意；分给自己99枚，自己也同意；分给海盗0枚，海盗四反对但无用。,回到海盗二，海盗二分给海盗四1枚得的海盗四同意；分给自己99枚，自己也同意；海盗三、五分得0枚，他们会反对但反对没有用。回到海盗一，他可以分给海盗三、五各1枚，获得海盗三、五的同意；分给自己98，自己也同意；分给海盗二、四各0枚，他们会反对但反对不起作用。因此这个海盗分赃问题的答案是(98,0,1,0,1)。还可以演化不同的版本。（1）如果要求包括提议海盗在内的所有海盗过半数（超过1/2）同意才能使提议通过，那么海盗一应该怎么提方案？（2）如果要求提议海盗之外的海盗过半数同意才能通过，那么海盗一又该怎么提方案？（3）或者海盗的数目增加到10个、100个，海盗一又怎么提方案？问题1（97,0,1,2,0）或(97,0,1,0,2)问题2（97,0,1,1,1）问题3逐渐增加海盗的数量，将会发现答案是有规律可循的。,3.1动态博弈的表示法和特点,3.1.1阶段和扩展性表示3.1.2动态博弈的基本特点,3.1.1阶段和扩展性表示,阶段：动态博弈中一个博弈方的一次选择行为例子：仿冒和反仿冒博弈,3.1.2动态博弈的基本特点,策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合，构成一条路径得益对应每条路径，而不是对应每步选择、行为动态博弈的非对称性先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利，有“先行优势”。,3.2可信性和纳什均衡的问题,3.2.1相机选择和策略中的可信性问题3.2.2纳什均衡的问题3.2.3逆推归纳法,3.2.1相机选择和策略中的可信性问题,不同版本的开金矿博弈分钱和打官司的可信性,3.2.2纳什均衡的问题,第三种开金矿博弈中，（不借-不打，不分）和（借-打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。博弈的策略形：分不分借打2，2-1，0借不打2，20，4不借1，01，0,结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题,3.2.3逆推归纳法,定义：从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。,乙,不借,借,（1，0）,3.3子博弈和子博弈完美纳什均衡,3.3.1子博弈3.3.2子博弈完美纳什均衡,3.3.1子博弈,定义：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。,3.3.2子博弈完美纳什均衡,定义：如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略组合满足，在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺，因此是真正稳定的。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。,3.4几个经典动态博弈模型,3.4.1寡占的斯塔克博格模型3.4.2劳资博弈3.4.3讨价还价博弈3.4.4委托人代理人理论,3.4.1寡占的斯塔克博格模型,先后选择产量的产量竞争博弈把古诺模型改为厂商1先选择，厂商2后选择，而非同时选择即可。,产量得益厂商13单位4.5厂商21.5单位2.25,先行优势,寡占的斯塔克博格模型,由于本博弈是一个动态博弈，因此我们考虑用递推归纳法来分析。根据逆推归纳法的思路，首先分析第二阶段厂商2的决策，为此，我们先假设厂商1的选择为q1，是已经确定的，这实际上就是在q1确定下来求使u2实现最大值的q2这样的必须满足：6-2q2-q1=0即q2=(1/2)(6-q1)=3-q1/2（1）实际上它就是厂商2对厂商1的策略的一个反应函数。厂商1知道厂商2的这种决策思路，因此他在选择q1的知道q2*将是根据（1）代入他自己得益函数，然后再求最大值。即求使,寡占的斯塔克博格模型,寡占的斯塔克博格模型,与两寡头同时选择的古诺模型的结果u1=u2=4相比，斯塔伯克模型的结果有很大不同。它的产量大于古诺模型，价格低于古诺模型，总利润（两厂商得益之和）小于古诺模型。但是，厂商1的得益却大于古诺模型中厂商1的得益，更大于厂商2的得益。这当然是因为该模型中两厂商所处地位不同，厂商1具有先动的主动，且他又把握住理性的厂商2总归会根据自己的选择q1而合理抉择的心理，选择较大的产量得到了好处。本博弈也揭示了这一一个事实，即在信息不对称的博弈中，信息较多的博弈方（如厂商2，他在决策之前可先知道厂商1的实际选择，因此知道较多的信息）不一定能得到较多的得益。,3.4.2劳资博弈,先由工会决定工资率，再由厂商决定雇用多少劳动力,序贯讨价还价和耐心在价格谈判中最常见的谈判方式是序贯讨价还价。它的规则是由甲先提议分配方案；然后，乙若同意则实施该方案，否则由乙提议方案；然后再由甲表示是否同意，若不同意则由甲提方案；然后再由乙来表决同意否，若不同意则由乙提方案如此往复，直到谈判结束（达成协议或谈判破裂）。序贯讨价还价分有限回合和无限回合两种情况。对于有限回合情况，不管多少次，都可以用逆向归纳方法来推导其均衡结果。由于序贯谈判中会耗费时间，面临机会成本，因此我们不妨假设分配的物品不是蛋糕，而是冰激凌-它会随着时间而融化，假设冰激凌重量为100克，每一个回合冰激凌都会融化掉10克（那么10个回合冰激凌就会融化完毕）。假设甲先提议，然后是乙，在两个回合的谈判中，均衡的结果是什么？,用逆向归纳法可以这样推导均衡结果：在第二个回合，因为乙提议之后博弈结束，因此相当于他在此时面临独裁博弈，他将把全部的冰激凌分给自己，而由于冰激凌此时已经融化掉1/10，因此尽管乙得到了全部的冰激凌，但他实际得到的冰激凌为100-10=90克，而甲在第二回合什么也没得到；再回溯到第一回合，甲享有提议权，此时为让乙不至于反对其提议，他必须使得乙所获得的冰激凌实额不低于乙在第二回合可获得数量，即90克而此时冰激凌并未融化，因此甲应当分给乙0.9的比例（实额为90克），而剩下的0.1比例（10克）则分给自己。在这里，我们发现，甲自己所分得的部分，实际上正好是冰激凌将融化掉的部分，因为只有这样，才可能保证乙不反对。,谈判三个回合，情况将会怎样？此时提议顺序应当为“甲-乙-甲”，显然最后的主动权在甲手里面。相应的均衡结果仍可用逆向归纳法来获得：在第三回合，冰激凌融化到只剩下80克，此时甲提议，他将80克全部分给自己；在第二回合，乙为了获得甲的同意，只好按照不低于80克的标准分给甲，此时溶化后的冰激凌是90克，所以他分给甲的比例是8/9，择机得到1/9；然后回到第一回合，甲分配时只需要给乙10克就可以得到乙的同意，而自己得到了90克，,同样的方法和道理，可以推导出9和10谈判回合下的均衡分配结果。,至少可以得到以下几个结论谁掌握谈判的最后主动权，谁就可以得到更多的冰激凌。谈判的回合越多，则两个人的利益分享额就越接近平均分配。如果谈判回合足够长，一直可以到分配的合作利益消耗殆尽，那么最终的讨价还价均衡结果就是平均合作利益。上述的结论也间接的反映出谈判中耐心的重要。只有足够的耐心的前提下，讨价还价才可能重复进行很多回合当然，这里不是说真的要使讨价还价进行那么多回合，而是双方都表现出耐心的话，那么双方就知道应当提早做出让步，不要一直耗下去。这当中或许有几个回合的试探，不过对于双方来说的确没有必要真的耗到那么多回合，但若一方显示急于结束讨价还价，那么另一方就不大会做出让步。,关于耐心之重要，也可以从无限回合的讨价还价博弈之均衡结果看到。分配货币，由于每个人的耐心不一样，所以他们对将来的货币的主观贴现率也不一样。为此可以假设他们分配1元钱，甲的主观贴现率为r1，乙的主观贴现率是r2，那么对于甲来说，将来的1元钱与现在的1元钱之兑换比率可用贴现因子s1=1/(1+r1)表示；乙的贴现因子为s2=1/(1+r2)。这里s1、s2越大，说明谈判越有耐心，因为对他们来说将来的钱也很值钱，反之越小，s1、s2说明他们越没有耐心。给定上面这些信息，在无限回合的讨价还价博弈中，均衡结果是：第一个提议者将建议分给自己x*的比例，分给乙(1-x*)的比例。这里：,上述结果是博弈论学者鲁宾斯坦（1982）证明的一个定理。通过求导容易发现x*关于s1的偏导数大于0，而关于s2的偏导数小于0，其表达的含义是：甲的耐心越高或乙的耐心越低，都会导致甲得到更高的分享比例。当然，甲得到更高的分享比例也就意味着乙在这样的情形下将得到更低的分享比例。可以得出如下一般的结论：耐心优势。直观地讲，有绝对耐心的人总可以通过拖延时间使自己独吞所分物品；即使放弃绝对耐心，“耐心优势”在一般情况下也是成立的。先动优势.当两个耐心相同，但并非都是绝对耐心的时候(s1=s2=s1/2,即甲总是会得到比乙更多的份额。先动优势的丧失。当两人绝对耐心(s1=s2=s=1),则x*=1/2，结果是两人平均所要分割的物品。,当然，主观贴现因子s1、s2可以表示耐心，不过也可以做出其他的解释，比如用它表示固定资产的成本-一般来说，如果企业不能早日达成协议，那么它承担的成本包括三种：一是固定资产的维护费用在日益增加，二是推迟出售固定资产的利息损失的日益增加，三是不能按期交付产品的违约罚款（一般随时间增加）。显然，这些成本越高则谈判越处于不利地位，因为它不能长期耗下去，而希望可以迅速结束谈判，结果只好向对手出较大幅度的让步。,3.4.3讨价还价博弈,三回合讨价还价,3.4.3讨价还价博弈,三回合讨价还价博弈结果的讨论,无限回合讨价还价,宏观经济政策的动态一致性,3.4.4委托人代理人理论,一、委托人代理人关系经济活动和社会活动中有很多委托人代理人关系，有明显的，也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。委托人代理人关系的关键特征：不能直接控制，监督不完全，信息不完全，利益的相关性委托人代理人涉及问题：激励机制设计、机制设计理论，委托合同设计问题等,二、无不确定性的委托人代理人模型,R(S)-w(S),w(S)-S,R(E)-w(E),w(E)-E,R(0),0,R(0),0,代理人的选择激励相容约束：w(E)-Ew(S)-Sw(E)w(S)+E-S,参与约束：,参与约束,委托人的选择,数值例子,12,2,0,0,0,0,7，1,E=2,S=1,w(E)=4,w(S)=2w(E)-E=2w(S)-S=1满足使代理人努力努力的激励相容w(E)-E=20满足代理人接受的参与约束，R(E)-w(E)=120也满足委托人提出的委托条件。,三、有不确定性但可监督的委托人代理人博弈,偷懒：委托：0.1*20-w(S)+0.9*10-w(S)0不委托：0.1*20-w(S)+0.9*10-w(S)0不委托：0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10)-S,接受：0.9*w(20)-E+0.1*w(10)-E0,委托：0.9*20-w(20)+0.1*10-w(10)0,激励相容约束,促使代理人努力的激励相容约束、参与约束，以及委托人选择委托的条件,参与约束,对于委托人来说，就是要根据上述两个条件，以及E、S的值，选择最佳的工资水平w(20)和w(10)，或者它们的差额w(20)-w(10),五、选择报酬和连续努力水平的委托人代理人博弈,店主和店员的问题,商店的利润，是均值为0的随机变量店员的负效用，是店员的努力机会成本为1店主采用的报酬计算公式店员的得益店员期望得益为店主的得益为,参与约束：当店员风险中性时符合其最大利益店主选择下限代入得益公式得：，期望得益为，易求得令得，再代入参与约束得，求数学期望得解得，则店主的最优激励工资计算公式是,3.5有同时选择的动态博弈模型,3.5.1标准模型3.5.2间接融资和挤兑风险3.5.3国际竞争和最优关税3.5.4工资奖金制度,3.5.1标准模型,博弈中有四个博弈方，分别称为博弈方1、博弈方2、博弈方3和博弈方4第一阶段是博弈方1和博弈方2的选择阶段，他们同时在各自的可选策略（行为）集合和中分别选择和第二阶段是博弈方3和博弈方4的选择阶段，他们在看到博弈方1和博弈方2的选择和以后，同时在各自的可选策略（行为）集合和中分别选择和各博弈方的得益都取决于所有博弈方的策略即博弈方i的得益是各个博弈方所选择策略的多元函数,3.5.2间接融资和挤兑风险,下一阶段,（到期，到期）（存款，存款）,（提前，提前）（不存，不存）,1.2，1.2,第二阶段,建立信贷保证、保险制度，对存款进行保护、保险的原因,非法集资问题,现代更容易引发金融、社会风险的主要是不正规的非法金融活动，如地下钱庄和非法集资等。因为非法金融活动常常通过恶意欺骗的手段吸引人们参加，用借新债还旧债的方法，而不是经营利润偿还到期资金，信用差、管理差而且缺乏保险措施，引起金融风险并引发社会问题的可能性要大得多。,3.5.3国际竞争和最优关税,厂商的得益函数为：,第二阶段厂商选择：,第一阶段政府选择：先把第二阶段根据厂商选择得到结果代入政府得益，再求最优化：,政府的得益函数；,3.5.4工资奖金制度,模型假设：1.雇员i(i=1,2)的产出函数为，为雇员努力水平，为随机扰动。服从分布密度，均值为0的随机变量。雇员努力的负效用函数为，且。2.产量高的雇员得到高工资，产量低的得到低工资。3.两雇员在已知雇主宣布的工资奖金制度下，同时独立选择各自的努力程度。,雇员选择,雇主决定了工资以后，雇员同时决定努力程度：一阶条件这是雇员所选择努力程度必须满足的基本条件。,利用条件概率的贝叶斯法则：,代入得：两雇员情况一样，对努力程度的选择也相同，即：，这样就得到：这

人人文库> 全部分类> 应用文书 > 项目管理

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第三章完全且完美信息动态博弈.ppt

文档简介

温馨提示

最新文档

评论

第三章 完全且完美信息动态博弈.ppt

文档简介

温馨提示

最新文档

评论

相关文档

第三章完全且完美信息动态博弈.ppt