经济博弈论讲解.ppt

上传人：s*** IP属地：河南上传时间：2020-06-18 格式：PPT 页数：100 大小：2.14MB 积分：20 举报 版权申诉

已阅读5页，还剩95页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第三章,完全且完美信息动态博弈,什么是动态博弈：具有依次选择行为的博弈。如商业活动中的讨价还价，拍卖活动中的轮流竟价等。完全信息动态博弈和不完全信息动态博弈：如果博弈方相互了解双方的得益情况，称完全信息动态博弈。如果博弈方相互不了解双方的得益情况，称不完全信息博弈。什么是完美信息动态博弈和不完美信息动态博弈：如果所有博弈方都对自己选择前的博弈过程完全了解，称为完美信息博弈，否则称为不完美信息博弈。完全且完美信息动态博弈,游戏,两人参与游戏。首先参与人1可以向盒子里放1元钱或3元钱或不放钱，然后盒子传到参与人2那里。参与人2看到盒子里的钱后，他可以选择做相同的投资，即参与人1放1元钱他放1元钱，

2、参与人1放3元钱他放3元钱，他也可以把参与人1放的钱拿走。参与人1不放钱，参与人2不放钱，双方受益为0。参与人放1元，参与人2放1元，参与人1的额外收益（净收益）为1元，参与人2的额外收益（净收益）为1.5元；参与人2拿走参与人1放的钱，则参与人1的净收益为-1，参与人2的净收益为1。参与人放3元，参与人2放3元，参与人1的额外收益（净收益）为3元，参与人2的额外收益（净收益）为2元；参与人2拿走参与人1放的钱，则参与人1的净收益为-3，参与人2的净收益为3。,3,1,1,-3,3,0,-1,（0,0）,（-1,1）,（1,1.5）,（-3,3）,（3,2）,3.1动态博弈的表示法和特点3.2

3、可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论,3.1动态博弈的表示法和特点,3.1.1阶段和扩展形表示阶段：动态博弈中一个博弈方的一次选择行为。动态博弈中也可以存在几个博弈方同时选择的情况，这些博弈方的同时选择构成一个阶段。（一个动态博弈至少有两个阶段,动态博弈有时也称为“多阶段博弈”、“序列博弈”）,“扩展形”：用一种通过选择节点、从节点出发的表示博弈方各种可能选择的线段，以及博弈终端处的得益数组表示动态博弈的方法。也称为“博弈树”,由于扩展形可以反应动态博弈中博弈方的选择次序和博弈的阶段，因

4、此是表示动态博弈的最佳方法。,“仿冒和反仿冒”博弈,初始决策节点，博弈树的根,设有一家企业的产品被另一家企业仿冒，如果被仿冒企业采取措施制止，仿冒企业就会停止伤冒，如果被仿冒企业不采取措施制止，那么仿冒企业就会继续仿冒。对被仿冒企业来说，被仿冒当然会造成经济损失，因此采取措施制止仿冒是符合自身利益的。但问题是制止仿冒是有代价的，因此在遭仿冒时是否应该制止是需要研究的问题。对于仿冒企业来说，仿冒不被制止能获得很大利益，但如果被制止就会偷鸡不着蚀把米，因此是否仿冒也要仔细推敲。,终点结：博弈行动路径的终点,四个节均称为决策节：表示参与人在此选择行动,节与节的连线称为枝,A的得益,B的得益,信息集(

5、每次行动时参与人知道些什么）,信息集由同一局中人在相同的时点上具有相同信息的决策节点组成。用Iik(i=1,1,2,n,k=0,1,2,ri)表示局中人i的第k个信息集。它满足：（1）Iik（表示空集）（2）从博弈起始点到任一终点的路径至多与Iik交于一点（同一信息集中的节点处于同一时点上）。（3）从Iik中的任一节点出发，局中人i可以选择的行动集合都相同（因为局中人在同一信息集的不同节点上具有相同的信息）。在博弈树上，将属于同一信息集的节点用虚线框在一起，或连在一起。参与人i的信息集（用Ii表示）是参与人i决策节的一个集合，它满足两个条件：（1）Ii中的每个决策节都是参与人i的决策节。（2）

6、当博弈达到信息集Ii时，参与人i知道自己是在信息集中的决策节上，但不知道自己究竟在Ii中哪个决策节上。,开发,开发,开发,不开发,不开发,不开发,（300，300）,（800，0）,（0，800）,（0，0）,企业1,企业2,企业2,在博弈中，如何将“企业2行动时是否观察到企业1的选择”这一信息表达出来？,如果企业2的信息集为I2x2,x3，意味着当企业2行动时，博弈要么达到x2,，要么达到x3，但具体在哪一点上，企业2不清楚。在图中用虚线连结。如果企业2行动时就知道博弈到达了点x2，还是点x3。此时企业2的决策节集x2和x3都是企业2的信息集。在完全且完美信息动态博弈中，信息集都是单决策结信

7、息集。,第6章,1,2,2,L,R,L,R,L,R,L,R,L,L,L,R,R,R,由于参与人3选择时，参与人1和参与人2都已经做出了选择，因此当参与人3选择时可能面临的决策情形就有四种：（1）既知道参与人1的选择，也知道参与人2的选择；（2）知道参与人1的选择，但不知道参与人2的选择；（3）知道参与人2的选择，但不知道参与人1的选择；（4）既不知道参与人1的选择，也不知道参与人2的选择。,第6章,1,2,2,L,R,L,R,L,R,L,R,L,L,L,R,R,R,（1）既知道参与人1的选择，也知道参与人2的选择；,第6章,1,2,2,L,R,L,R,L,R,L,R,L,L,L,R,R,R,（

8、2）知道参与人1的选择，但不知道参与人2的选择；,3,3,第6章,1,2,2,L,R,L,R,L,R,L,R,L,L,L,R,R,R,（3）知道参与人2的选择，但不知道参与人1的选择；,3,3,第6章,1,2,2,L,R,L,R,L,R,L,R,L,L,L,R,R,R,（4）既不知道参与人1的选择，也不知道参与人2的选择。,3,3,3,第6章,3.1.2动态博弈的基本特点动态博弈的策略行动：是局中人在博弈的某个时点上的决策变量，如果一个博弈仅仅只是局中人一次性的同时行动对局，那么每个局中人的策略就是他能够采取的行动。所以在静态博弈中，没有区分策略和行动：行动就是策略，策略就是行动。动态博弈的策

9、略：是博弈人在博弈中的行动规则，它规定了博弈人在博弈中每次轮到自己行动时应该采取的行动。局中人i=1,2,n的策略集合用Si表示，Si中的元素si称为局中人i的策略。它定义为局中人i的信息集Ii到行动集合Ai的映射：Si:IiAi,Si(Iik)=ai,aiAi,i=1,2,n,k=1,2,ri博弈人的策略组合：每条策略组合都存在一条与之对应的路径，但在许多情况下每条路径所对应的策略组合并不唯一。,开发,开发,开发,不开发,不开发,不开发,（300，300）,（800，0）,（0，800）,（0，0）,企业1,企业2,企业2,企业1与企业2的策略,企业1的策略集合为：S1=x|x=开发或不开发

10、企业2的策略集合为：S2=（x，y）|x,y=开发或不开发,（开发，开发）,（开发，不开发）,（不开发，不开发）,（不开发，开发）,开发,不开发,企业1,企业2,根据纳什均衡的定义得（开发，（开发，开发）和（开发，（开发，不开发）为纳什均衡。,开发,开发,开发,不开发,不开发,不开发,（0，800）,（0，0）,企业1,企业2,企业2,(300,300),(800,0),支付矩阵为,开发,开发,开发,不开发,不开发,不开发,（300，300）,（800，0）,（0，800）,（0，0）,企业1,企业2,企业2,在该博弈中企业1只有一个信息集I1（x1）在该信息集上的行动为“开发”和“不开发”所

11、以企业1的策略为“开发”和“不开发”两个。（开发，不开发）企业2有两个信息集I2（x2）和I2（x3）每个信息集有两个行动“开发”和“不开发”所以企业2有4个策略（开发，开发），（开发，不开发）（不开发，开发），（不开发，不开发）(可以把它们表示成矩阵形式）,企业1和企业2的策略组合有8个分别是（开发，（开发，开发）（开发，（开发，不开发）（开发，（不开发，开发）（开发，（不开发，不开发）（不开发，（开发，开发）（不开发，（开发，不开发）（不开发，（不开发，开发）（不开发，（不开发，不开发）,-5，-5,0，-8,-8，0,-1，-1,坦白,不坦白,坦白,不坦白,两个罪犯的支付矩阵(Payof

12、fMatrix),囚徒2,囚徒1,坦白,坦白,坦白,不坦白,不坦白,不坦白,（-5，-5）,（0，-8）,（-8，0）,（-1，-1）,囚徒1,囚徒2,囚徒2,坦白,坦白,坦白,不坦白,不坦白,不坦白,（0，-8）,（-8，0）,（-1，-1）,囚徒2,囚徒1,囚徒1,策略组合的粗线表示法,以上是策略组合的粗线表示法下面介绍纳什均衡的虚线排除确定法：用虚粗线表示那些单独改变激励的选择，在一个博弈中只要有一个局中人的策略包含单独改变策略的激励，这个对局就不是纳什均衡。,三个纳什均衡：（借，打），分）；（不借，不打），不分）（不借，打），不分）唯一的子博弈精炼纳什均衡：（不借，不打），不分）,动态

13、博弈的结果：动态博弈的得益：首先是指各博弈方策略构成的策略组合，其次，动态博弈的结果是各博弈方策略组合形成的一条联接各个阶段的“路径”；最后，实施各种策略组合的最终结果，落实到给博弈方带来的得益。因此在动态博弈中，博弈的结果包括各博弈方采用的策略组合，实现的博弈路径和各博弈方的得益。,动态博弈的非对称性,因为动态博弈中各个博弈方的选择行为有先后次序，且后行动者能观察到此前选择行为博弈方的选择行为，因此动态博弈中各博弈方的地位是不对称的，这一点与所有博弈方一次性同时选择的静态博弈也明显不同。,3.2可信性和纳什均衡的问题,3.2.1相机选择和策略中的可信性问题P110,3.2.2纳什均衡的问题,

14、注意第三种开金矿博弈中有两个纳什均衡：（借，打），分）；（不借，不打），不分）;（不借，打），不分）三个都合理吗？纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中有稳定性的纳什均衡在动态博弈中可能是不稳定的。不能作为预测的基础。根源在于它不能排除博弈方策略中所包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题.,3.2.3逆推归纳法,定义：从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为“逆推归纳法”。逆推归纳法是把博弈分解为一次一次的单人博弈，通过对一系列单人博弈的分析，确定每个局中人在各

15、自决策节点上的选择，最终对动态博弈的结果，包括博弈的路径和各个局中人的博弈得益作出判断。如图在第二阶段甲选择“不分”，乙在第一阶段选择不分。,乙,不借,借,（1，0）,乙,不借,借,（1，0）,（0，4）,由于逆推归纳法的各个局中人在各阶段的选择，都建立在后续阶段各个局中人理性选择的基础上，因而很自然就排除掉了不可置信威胁或承诺的可能，因此它得到的结论比较可靠,3.3子博弈和子博弈完美纳什均衡,3.3.1子博弈定义：是原博弈的一部分，它始于原博弈中一个位于单结信息集中的决策结x，并由决策结x及其后续结共同组成。子博弈的另一种定义：,3.3.2子博弈完美纳什均衡,定义：如果在一个完美信息的动态博

16、弈中，各博弈方的策略构成的一个策略组合满足，在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。（“子博弈精炼纳什均衡”）子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺，因此是真正稳定的。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡最基本的方法。举例,3.4几个经典动态博弈模型,3.4.1寡占的斯塔克博格模型厂商先后选择产量的产量竞争寡头博弈。可以与古诺模型相比较。,用逆推归纳法分析这个博弈先分析第二阶段厂商2的决策。在第二阶段厂商2决策时，厂商1选择q1实际上已经决定了，并且厂商2知道q1相当于是在给定q1的情况下求使u2实

17、现最大值的q2,厂商1知道厂商2的这种决策思路，因此在选择q1时就知道厂商2的产量q2*，这样厂商1的得益函数实际上就转化为了他自己产量的一元函数：,产量得益厂商13单位4.5厂商21.5单位2.25,先行优势,我国自古就有“先下手为强”的说法有“后动优势”：你跟你的朋友用一把小刀瓜分一块巧克力蛋糕，而且你们都是想多吃一点的理性人。你们会同意一个人负责切蛋糕，另外一个负责分蛋糕。,3.4.2劳资博弈P124,先由工会决定工资率，厂商再决定雇用多少劳动力。工会代表的劳方效用函数是工资率和雇佣数两者的函数即u=u(W,L)厂商的利润函数为：=（W，L）=R（L）-WL,此博弈是里昂惕夫1946年提

18、出的一个博弈模型,用逆推归纳法先分析第二阶段厂商的选择，也就是工会提出的工资率为W，那么厂商实现自己最大得益的雇佣数L，就是最大值问题,第二步回到第一阶段工会的选择。现在工会需要解决的问题变成了选择W*，使他满足工会效用u=u(W,L)的最大值问题。如果将工会的效用函数u=u(W,L)的W和L之间的无差异曲线画在坐标图中，无差异曲线与厂商反应函数L*（W）曲线相切的那一点，就是工会能实现的最大效用。因此这个博弈的均衡解就是W*，L*（W），是一个子博弈完美纳什均衡。,3.4.3讨价还价博弈P126,三回合讨价还价,本博弈的关键：（1）第三回合甲的方案有强制力，即甲提出的分割比例S：10000-

19、S，乙必须接受;(2)该博弈每多进行一个回合总得益就会下降一个比例。,子博弈完美纳什均衡,每次出价的原则：在别人接受的条件下，使自身利益最大化,用逆推归纳法：,在第三回合甲的出价S乙必须接受，因此甲会选择S=10000，也就是自己独得这笔钱。现仍保留S作甲在该回合的出价。双方得益分别为现推回到第二回合乙的选择。如果自己出的S2既能让甲接受（意味着甲的得益不能小于第三回合得益），而又能使自己的得益比第三回合的得益大，那么这样的S2就是最符合乙的利益的。即此时乙的得益为,最后再回到第一回合甲的考虑。甲一开始就知道第三回合自己的得益，也知道乙在第二回合的出价。因此甲在第一回合就给乙同时又能得到比更大

20、的利益，那当然是更好。实现这一想法只要令,对结果的讨论,无限回合讨价还价：按常规思路，逆推归纳法肯定无法应用。夏科德（Shaked)和萨顿（Sutton)1984年提出了一个解决这个博弈问题的思路。要点是：对一个无限回合博弈来讲，从第三回合开始，还是从第一回合开始，结果应该是一样的。根据对三回合讨价还价博弈的逆推归纳法的结果定理（Rubinstein,1982),3.4.4委托人代理人理论,经济活动和社会活动中的委托人代理人关系。很多，有明显的，也有隐蔽的。（工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等）委托人代理人关系的关键特征：不能直接控制，监督不完全，信息的完

21、全，利益的相关性激励机制设计、机制设计理论，委托合同设计问题,无不确定性的委托人代理人模型P131假定代理人的工作成果没有不确定性，代理人的产出是努力程度的确定函数，因此委托人可根据成果掌握代理人的工作情况，不存在监督问题。委托关系基于一种标准合同。,首先讨论代理人第三阶段的选择。根据理性博弈方的决策原则：w(E)-Ew(S)-S即：w(E)w(S)+E-S此不等式为代理人努力的“激励相容约束”。代理人偷懒的“激励相容约束”为：w(S)-Sw(E)-E,R(E)-w(E),w(E)-E,R(S)-w(S),w(S)-S,R(0),0,R(0),0,参与约束：代理人愿意接受委托人委托的基本条件。

22、,参与约束,再讨论第二阶段代理人是否接受委托的选择。由于代理人在第三阶段有努力和偷懒两种选择，所以分两种情况讨论第二阶段,委托人的选择,最后再回到第一阶段委托人的选择。如果代理人在第二阶段选择拒绝，那么委托人的选择其实是无关紧要的，因为委托不委托结果都一样。如果第二阶段选择接受，那么仍然有两种不同的情况。,第一种情况：如果R(E)-w(E)R(0)，委托人选择委托；如果R(E)-w(E)R(0)，委托人选择委托；如果R(S)-w(S)0不委托：0.1*20-w(S)+0.9*10-w(S)0,努力委托：0.9*20-w(E)+0.1*10-w(E)0不委托：0.9*20-w(E)+0.1*10

23、-w(E)w(S)-S时选择努力当w(S)-Sw(E)-E时选择偷懒在两种情况下分别满足w(E)-E0w(S)-S0,激励相容约束,参与约束,会接受委托，否则不接受委托。,再分析委托人第一阶段的选择，也是本模型与前一个模型的不同之处。假设代理人会选择委托并努力工作，那么委托人有0.9的概率获得高产出的得益，有0.1的概率获得低产出的得益。,对于风险中性的委托人来说，如果选择委托的期望得益大于不委托，即选择委托如果选择委托的期望得益小于不委托，即选择不委托,在代理人接受委托并偷懒的情况下，则委托人有0.1的概率获得高产出的得益，0.9的概率获得低产出的概率,如果选择委托的期望得益大于不委托，即他

24、应该选择委托。如果他选择委托的期望得益小于不委托即他应该选择不委托。,上述双方的选择就是对应两种不同情况的子博弈完美纳什均衡,有不确定性且不可监督的委托人代理人博弈,只能根据成果付酬，w是成果函数，而非努力程度函数。不确定性对代理人利益、选择有影响。,现在我们讨论委托人一代理人关系中比较重要的情况，也就是代理人的工作成果有不确定性，而且委托人无法监督代理人工作的委托人一代理人模型。我们首先能够肯定的是，现在委托人不可能根据代理人的工作情况支付报酬，只能根据代理人的工作成累支付报酬，除非支付固定的报酬。,如果除了委托人对代理人的监督从可以监督改为无法监督，以及委托人现在是根据代理人的工作成果而不

25、是工作情况支付报酬以外，其他方面与前一个模型都相同，那么我们用下图的扩展形表示该博弈。,与上一个模型两方面的差异：第一是“自然”最后一阶段不是分别针对代理人的两种选择进行选择。这种差异主要影晌的是委托人对高产或低产究竟是代理人努力或偷懒的结果，还是随机因素影响的结果的判断。第二是双方得益函数中的报酬项现在是工作成果的函数而不再是努力程度的函数。现在主要分析的是促使代理人选择努力的激励相容约束、参与约束以及委托人相应选择委托的条件。第三阶段：假设代理人是风险中性的情况下，只要他选择努力的期望得益大于选择偷懒的期望得益，即：0.9w(20)-E+0.1w(10)-E0.1w(20)-S+0.9w(

26、10)-S他会选择努力工作，此不等式就是该模型的激励相容约束。第二阶段：代理人选择接受的期望得益大于0，即0.9w(20)-E+0.1w(10)-E0代理人选择接受委托，参与约束第一阶段：委托人判断代理人会选择努力，因此对风险中性的委托人来说当：0.920-w(20)+0.110-w(10)0此为委托人选择委托的基本条件。,努力：0.9*w(20)-E+0.1*w(10)-E0.1*w(20)-S+0.9*w(10-S),接受：0.9*w(20)-E+0.1*w(10)-E0,委托：0.9*20-w(20)+0.1*10-w(10)0,激励相容约束,促使代理人努力的激励相容约束、参与约束，以及

27、委托人选择委托的条件关于风险,参与约束,对于委托人来说，就是要根据上述两个条件，以及E、S的值，选择最佳的工资水平w(20)和w(10)，或者它们的差额w(20)-w(10),选择报酬和连续努力水平的委托人代理人博弈,不仅努力成果不确定且不可监督而且委托人可以选择报酬函数（也就是薪酬制度），代理人在连续区间中选择努力水平e的委托代理人模型。假定代理人有正值的机会成本努力的负效用是努力水平的单调递增的凸函数C=C（e)代理人可以选择的努力水平e分布在某个连续区间，其产出R是e的随机函数R=R（e),委托人根据R支付报酬，即w=w(R)w=w(R(e),委托人的得益函数：R-w=R(e)-wR(e

28、)代理人的得益函数：w-C=wR(e)-C(e)凸函数,参与约束：代理人只有在接受委托的得益大于机会成本时才愿意接受委托，即：,wR(e)-C(e)在代理人接受委托的前提下，委托人当然希望付出的报酬越少越好，因此实际的参与约束是：wR(e)=C(e)+根据上述的得益函数，可以求出最符合自身利益的代理人努力水平e*要代理人自觉选择e*，e*也必须符合他自己的利益最大化，即对其他任何努力水平e，都有,此为该模型的激励相容约束,委托人按照参与约束与激励相容约束设计报酬，就能使代理人的行为符合自己的利益。,店主与店员的委托-代理问题,R是商店的收益，e是店员的努力,当B=0，e=0店员没有努力的愿望当

29、B=0.5，即提成比例为50%时，店员愿意付出的努力是e=20.5=1当B较大时，店员的努力愿望也随之增大。,店主的选择（对A和B的选择）,3.5有同时选择的动态博弈模型,3.5.1标准模型1、博弈中有四个博弈方，分别称为博弈方1、博弈方2、博弈方3和博弈方42、第一阶段是博弈方1和博弈方2的选择阶段，他们同时在各自的可选策略（行为）集合A1和A2中分别选择a1和a2。3、第二阶段是博弈方3和博弈方4的选择阶段，他们在看到博弈方1和博弈方2的选择a1和a2以后，同时在各自的可选策略（行为）集合A3和A4中分别选择a3和a4。4、各博弈方的得益都取决于所有博弈方的策略a1a2a3和a4即博弈方i

30、的得益是各个博弈方所选择策略的多元函数,银行挤兑？,挤兑的后果？,在实际生活中，银行因遭受挤兑而倒闭的不乏其例。恒生银行（曾经是香港最大、最有影响力的华资银行）在1965年遭受两次挤兑，第二次被挤兑是由于谣言引起公众信任度的猛跌而引起，在四处求救无望的情况下，只好以控股权转让为条件换得当时作为发钞银行的汇丰银行的“无限量支持”才免于破产，但已论为人家的子公司了。,1988年杭州市许多储蓄点被挤兑，原因是抢购风潮。,2000年6月河北省滦县发生银行挤兑，原因是滦县县政府行政干预金融业务，引发储户心理发慌。当月28日，滦县县政府召开有县土地局、质量技术监督局等5个单位参加的协调会，要求与会单位将存

31、在建设银行滦县支行的公款转存到其他银行。此举引起一些群众对建行的信誉产生怀疑，造成部分储户恐慌，最终导致建设银行滦县支行的7个储蓄网点中先后有6个网点被挤提存款。这事件随在有关部门的努力下及时得到平息，但已严重干扰了金融秩序。,3.5.2间接融资和挤兑风险,设一家银行为了给一个企业贷放一笔20000元的贷款；以20的年利率吸引客户的存款。若两个客户各有10000元资金，如果他们把资金作为1年期定期存款存入该银行，那么银行就可以向企业贷款。如果两客户都不愿存款或只有一个客户存款那么银行就无法给上述企业贷款，这时候客户都能保住自己的本金。,在两客户都存款，从而银行给上述企业提供贷款的情况下，如果银

32、行满1年收回贷款，企业就能完成一笔生意银行可收回贷款本息支付存款客户的存款本息。但如果在不满1年的时候，一个客户单独或两个客户同时要求提前取出存款，银行就不得不提前收回贷款企业的生意无法完成。假设这时侯企业只能收回80的本钱，井全部偿还给银行。若是一个客户要求提前取款，则银行会偿还其全部本金，余款则属于另一客户，若两客户同时要求提前取款，则平分收回的资金。为了简单起见，我们假设银行不收任何佣全、手续费。,（到期，到期）（存款，存款）,（提前，提前）（不存，不存）,下一阶段,建立信贷保证、保险制度，对存款进行保护、保险的原因,我们用逆推归纳法来分析这个博弈，首先分析第二阶段两个博弈方的选择。容易

33、看出，该博弈有两个纯策略纳什均衡（提前，提前）（到期，到期），分别对应得益08，08）和（12，1.2），后一个明显帕累托优于前一个。通常情况下我们应该判断该博弈的结果是（到期,到期），双方得益（1.2，1.2)也就是两客户都等存款到期去取款，收回本金并获得利息。但根据上一章的分析，这种博弈并不能保证实现这种理想的结果。因为只要有一个客户认为另一客户有提前取款的可能性，那么前者的合埋选择就不再是到期取款，而是提前取款，而且上述考虑有多层次交互作用，因此常常会导致前一个低效率的纳什均衡,现在回到第一阶段两客户对是否存款的选择。如果第二阶段的博弈结果是比较理想的（到期，到期）纳什均衡，那么这时候第

34、一阶段的博弈相当于下图的得益矩阵所示。,在这种情况下第一阶段也有两个纯策略纳什均衡，一个是（不存，不存），另一个是（存款，存款）。这两个纳什均衡中也是后一个帕累托优于前一个，而且后一个也是上策均衡和风险上策均衡，因此显然两客户都会选择后一个均衡，也就是都会选择存款给银行。这是银行间接融资制度很好起作用的情况。,如果第二阶段的博弈结果是较不理想的（提前，提前）纳什均衡，那么第一阶段的博弈相当于图321的得益矩阵所示。,此时，（不存，不存）是两客户的纳什均衡，也是上策均衡，因此两容户都会选择不存。这相当于客户不再信任银行。银行系统崩溃的情况。但这种情况本身却不会引起银行挤兑的风潮和金融危机，因为在

35、这种倩况下客户根本就没有把资全存入银行。,事实上，导致银行挤兑风潮和金融危机的内在机制是这样的；对干客户来说，由于上述两阶段博弈的第二阶段的结果其实是有不确定性的，团此他们在作第一阶段选择的时候，并不能完全肯定究竟第二阶段会出现哪种结果，这就意味着他们在第一阶段选择的时候可能是以第二阶段将是（到期，到期）纳什均衡为基拙的因此选择了（存款，存款）而没有选择（不存，不存），但第二阶段实际上却由于某种谣传引起的恐慌等原因，最终出现的却是（提前，提前）的纳什均衡，也就是客户挤提存款的情况。这正是现实中引起银行倒闭的许多银行挤兑风潮的制度性根源。,3.5.3国际竞争和最优关税,在两个完全相同的国家，每个

36、国家i(i=1,2)都有一个政府、一个企业和一群消费者。其中政府负责确定关税，企业制造产品供给本国消费及出口，消费者在国内市场购买本国企业或外国企业生产的产品。,假设国家i中的企业为国内市场生产qi的产品，并出口ei的产品则企业i的总产量为qi+ei；企业i的边际成本为常数c，并且没有固定成本，因此企业i的生产总成本为c(qi+ei)假设在国家i的市场上，需求曲线为Pi（Qi）为国家i的市场出清价格，假设国家i中政府制定的关税税率为ti,因此企业j向国家i出口ej的产品，支付关税tiej给政府i。,假设博弈顺序如下：,（1）两个国家的政府同时选择关税税率t1和t2；（2）两个国家的企业观察到关

37、税税率，并同时选择其提供国内的产量和出口的产量（q1,e1)和（q2,e2);(3)企业i得到的利润i,其中政府i的收益gi为本国总的福利，包括本国消费者享受的消费者剩余、企业i赚取的利润及从企业j收取的关税收入，即,企业i的生产成本为c(qi+ei),=,=,。,求子博弈完美纳什均衡。采用逆向归纳法，首先考察企业的决策,假定两国政府已选定的税率分别是t1和t2，求两企业获得最大利润的国内市场的产出量和出口量：,联立求解可得：,（i,j=1,2,ij),（i,j=1,2,ij),再求解政府对关税的选择,对于政府由于预测到企业会根据上式进行选择，政府此时的利润为为,其中i,j=1,2,ij,实行

38、关税对一国的福利存在什么样的影响呢？不妨假设关税为零，那么各国市场上的商品总量为2(ac)/3，消费者剩余为2(ac)2/9=18(ac)2/81=36(ac)2/162，而在税率为(ac)/3的情况下，各国的商品总量为5(ac)/9，消费者剩余为25(ac)2/162，即0关税带来更大的消费者剩余。其次，我们求各国福利之和的最大值，即利用我们前面分析的结果，解一阶条件，得由于税率不可能为负数，所以t1=t2=0。即实行0关税，不仅能增加各国的福利，而且能够增加两国的总体福利。由此我们看到，实行关税是一个完美均衡，但对各国和国际社会而言却是无效率的。因而，各国政府就有充分的理由来签定一个相互承

39、诺0关税的协定，这就是为什么WTO能够不断发展的根本原因。,最后通牒博弈”：A、B两人同时获得了100块钱，先由A一次性提出分钱的方案，如果B接受，则按此方案执行分配；如果B拒绝，两个就谁也拿不到钱。,3.6动态博弈分析的问题和扩展讨论,3.6.1逆推归纳法的问题逆推归纳法只能分析明确设定的博弈问题，要求博弈的结构，包括次序、规则和得益情况等都非常清楚，并且各个博弈方了解博弈结构，相互知道对方了解博弈结构。这些可能有脱实际的可能逆推归纳法也不能分析比较复杂的动态博弈象棋博弈问题在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难对博弈方的理性要求太高，不仅要求所有博弈方都有高度的理性，不允

40、许犯任何错误，而且要求所有博弈方相互了解和信任对方的理性，对理性有相同的理解，或进一步有“理性的共同知识”,1,2,1,L,R,N,T,（2，0）,（0，2）,（0，1）,（1，3）,M,S,三阶段的动态博弈，子博弈完美纳什均衡为粗实线所表示。,如果博弈方1理性有限，错误地选择了R；如果博弈方2是理性的，他该怎么选择？,如果博弈方2仍选N，博弈方1完全理性在第三阶段选T，则收益为（1，3）。现在由于博弈方1在第一阶段的选择犯了错误，博弈方2不能判断博弈方1在第三阶段一定选T，而不是S。所以这时博弈方2必须判断博弈方1犯错误的性质。对犯错误性质的判断不同，有效地对策就不同。,3.6.2颤抖手均衡

41、和顺推归纳法,颤抖手均衡:是塞尔顿在1975年提出的，是精练子博弈完美纳什均衡的一种均衡。用得益矩阵更易说明颤抖手均衡的思想。局中人所选择的一个策略组合，只有当它在允许每个局中人都可能犯小小的错误时仍是所有局中人的最优策略组合时，才是一个足够稳定的均衡。,颤抖的手均衡要求均衡策略不仅是对手策略的最佳反应，而且是对手策略发生微小颤抖时的最佳反应。,（D，L）和（U，R）都是纳什均衡，其中（D，L）对博弈方1较为有利，（U，R）对博弈方2较为有利。在不考虑博弈方行为偏差时，两个纳什均衡都是稳定的。,（D，L）考虑到博弈方2有可能采用R，不管这种可能性多么小，博弈方1的最佳选择是U而不是D，因为：,

42、分析（D，L）不是颤抖的手均衡，（U，R）是颤抖手均衡）,（U，R）的情况就不同：首先不论博弈方2是否偏离R，博弈方1都没有必要偏离U；对博弈方2来说，博弈方1从U偏离到D对自己有不利影响，但只要博弈方1的偏离的可能性小于2/3，改变策略是不合理的。因为,在黄图中：颤抖手均衡有两个。,一个是（U，R)一个是（D，L）即使博弈方1仍会考虑到博弈方2选择R的可能性，但只要这种可能性不超过1/5，博弈方1就会坚持D。,颤抖的手均衡，首先是一个纳什均衡，其次是不能包含任何“弱劣策略，”也就是偏离对偏离者没有损失的策略。,颤抖手均衡的严格的定义：举例,在n人策略式博弈中，纳什均衡是一个颤抖手均衡，如果对

43、于每一个参与人i，存在一个严格混合策略序列，使得下列条件满足：,顺推归纳法（考虑的是有意识偏离子博弈完美纳什均衡和颤抖手均衡路径的可能性，而不是偶然性的错误）。这个博弈第一阶段是博弈方1选择阶段，博弈方1首先必须在D和R之间选择，如果他选择D，那么结束博弈，双方各得2；如果他选择R，则双方进行第二阶段的静态博弈。这个静态博弈有三个纳什均衡（s,w),(w,s)以及双方都以3/4和1/4的概率分布随机选择s和w的混合策略纳什均衡。这个博弈的均衡路径之一是第一阶段博弈方1选D，而如果到达第二阶段的静态博弈，双方采取第二阶段的纳什均衡（w,s)。（Dw,s)是该博弈的子博弈完美纳什均衡，并且是颤抖手

44、均衡。,1,(2,2),D,R,1,2,S,S,W,W,既是子博弈完美纳什均衡，又是颤抖手均衡的（Dw,s)是不稳定的。,对于（Dw,s)是否具有稳定性的均衡是有疑问的。博弈方1没有选择D而选择了R，可能是有意识的。因为：根据该策略形可知Rw是博弈方1的相对于策路D的严格下策，他在第一阶段选择R，就是准备在第二阶段选择s。在这样的判断下，博弈方2在第二阶段的选择就只有w。如果博弈方1相信博弈方2有分析能力，则在第一阶段选R比选D更有利。,1,D,R,1,2,S,S,W,W,3.6.3蜈蚣博弈问题（罗森多教授（RobertRosenthal在1981年提出的）蜈蚣博弈：有人主持A、B两人做博弈游

45、戏，决策点上写谁就是轮到谁决策。一开始，A做决策。如果他决策结束游戏，他得1，B得1；如果他不结束游戏，就轮到B决策，这时如果B决策结束游戏B得3，A得0；他不结束游戏，则又轮到A决策。两人轮流决策，奖赏越来越大。共198个阶段。（这样的博弈树像百足虫蜈蚣一样的半拉子树）,上述博弈是两个博弈方之间的完全且完美信息的动态博弈,子博弈完美纳什均衡的解：,由逆推归纳法可得：博弈方A在第一阶段就会选择D，直接结束博弈。在这个博弈中个体理性的最优选择最终会导致最差的结果。实验结果也正是证实不会出现逆推归纳法预测的结果。为什么博弈方A在第一次选择时就把主动权交给了B?把主动权交给对方，让博弈延续下去，对双

46、方都有很大的潜在利益。对博弈方A来说，只要感觉博弈方B有很小的合作精神，那么在第一阶段就应该选D。对博弈方B来说，如果博弈方A选了R，就说明博弈方A释放了合作的信号，博弈方B也会采取合作的态度，让博弈进行下去。在该博弈中，一旦出现合作的良好开端，合作必定会持续下去，从而进一步否定逆推归纳法。随着结束阶段的临近，双方进一步合作的潜在利益越来越小，停止合作的可能性会越来越大，只要博弈方是理性的人，合作持续到最后一刻的可能性是不存在的，逆推归纳法的逻辑肯定会起作用的。如果不增加进一步的信息，逆推归纳法在什么时候起作用，很难加以预测。推论：蜈蚣博弈的阶段越少，如3或5个，逆推归纳法的逻辑随时会起作用；

47、蜈蚣博弈的阶段越多。合作的可能性就越大。,讨价还价博弈(Rubinstein,1982)假定两个人分一块蛋糕,参与人1先出价,参与人2可以选择接受或拒绝;如果1接受博弈结束,蛋糕按1的方案分配;如果1拒绝,1再出价;如此直下去直到一个参与人的出价被另一个人接收为止。这是一个无限期完美信息博弈，参与人1在时期1，3，5，出价,参与人2在时期2,4,6,出价。用x表示1的份额,1x表示2的份额,x1和(1x1)分别是1出价时1和2的份额,x2和(1x2)分别表示2出价时参与人1和参与人2的份额。假定参与人1和参与人2的贴现因子分别为1和2,则如果在时期t博弈结束,参与人1和参与人,2的支付贴现值分别是u1=1xi和u2=2(1xi),t-1t-1,如果博弈是有限期的,可以使用逆向归纳法

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

经济博弈论讲解.ppt

文档简介

温馨提示

最新文档

评论

经济博弈论讲解.ppt

文档简介

温馨提示

最新文档

评论

相关文档