经济博弈论期末复习资料

上传人：伊*** IP属地：上海上传时间：2022-03-03 格式：DOCX 页数：22 大小：152.72KB 积分：20 举报 版权申诉

已阅读5页，还剩17页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、经济博弈论复习资料1、名词解释1、零和博弈：是指参与博弈的各方，在严格竞争下，一方的收益必然意味着另一方的损失，博弈各方的收益和损失相加总和永远为“零”，双方不存在合作可能的博弈。2、常和博弈：是指各博弈方的得益之和是一个非零常数的博弈。常和博弈中各博弈方之间利益关系也是对立的，博弈方之间的基本关系也是竞争关系。3、纳什均衡：在博弈G=中，如果由各个博弈方的各一个策略组成的某个策略组合中，任一博弈方的策略，都是对其余博弈方策略的组合的最佳对策，也即对任意都成立，则称为G的一个纳什均衡。4、混合策略纳什均衡：包含混合策略的策略组合，构成纳什均衡。5、纳什定理：在一个有n个博弈方的

2、博弈G=中，如果n是有限的，且都是有限集（对i=1,n）,则该博弈至少存在一个纳什均衡，但可能包含混合策略。（这个定理就是说，每一个有限博弈都至少有一个混合策略纳什均衡）6、帕累托上策均衡：是指帕累托效率意义上的优劣关系，因此用这种方法选择出来的纳什均衡，也称为“帕累托上策均衡”。7、风险上策均衡：如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时，都偏爱其中某一个纳什均衡，则该纳什均衡就是一个风险上策均衡。8、子博弈：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息和进行博弈所需要的全部信息。9、子博弈完美纳什均衡：如果在一个完美信息的动态博弈中，

3、各博弈方的策略构成一个策略组合满足，在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。10、重复博弈：是原博弈的简单重复，重复博弈的子博弈完美纳什均衡是每次重复采用原博弈的纳什均衡。11、有限次重复博弈：给定一个基本博弈G（可以是静态博弈，也可以是动态博弈），重复进行T次G，并且在每次重复G之前各博弈方都能观察到以前博弈的结果，这样的博弈过程称为“G的T次重复博弈”，记为G(T)。12、无限次重复博弈：如果一个基本博弈G一直重复博弈下去，这样的重复博弈就叫“无限次重复博弈”，记为G()。13、有限理性：意味着一般至少有部分博弈方

4、不会采用完全理性博弈的均衡策略，他们会在博弈过程中学习、博弈通过试错寻找较好的策略；有限理性意味着均衡是不断调整和改进而不是一次性选择的结果，而且即使到达了均衡也可能再次偏离。14、有限理性博弈：存在有限理性博弈方的博弈。15、最优反应动态：有快速学习能力的小群体成员的反复博弈，相应的动态机制称为“最优反应动态”。16、复制动态：学习速度很慢的成员组成的大群体随机配对的反复博弈，策略调整用生物进化的“复制动态”机制模拟。17、完全但不完美信息动态博弈：在不完美信息动态博弈中，各博弈方对博弈结束时每个博弈方的得益是完全清楚的，因此博弈方是有“完全信息”的，这类博弈我们称之为“完全但不完美

5、信息动态博弈”。18、不完全信息静态博弈（静态贝叶斯博弈）：可表示为G=。其中为行为空间，是类型空间（）；得益是策略组合和类型的多元函数；是条件概率函数，即博弈方i在自己的类型为时，对其他博弈方类型的组合的判断。19、不完全信息动态博弈（动态贝叶斯博弈）：在动态博弈中，行动有先后次序；在不完全信息条件下，博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率，即知道“自然”参与人的不同类型与相应选择之间的关系，但是，参与人并不知道其他的参与人具体属于哪一种类型。由于行动有先后顺序，后行动者可以通过观察先行动者的行为，获得有关先行动者的信息，从而证实或修正自己对先行动者的行动。2

6、0、进化博弈论:有限理性博弈的有效分析框架是借鉴生物进化博弈理论发展起来的进化博弈论，也称为“经济学中的进化博弈论”。2、简答题1、设定一个博弈模型必须确定哪几个方面? 答：设定一个博弈必须确定的方面包括:(1)博弈方，即博弈中进行决策并承担结果的参与者;(2)策略(空间)，即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等;(3)得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量;(4)博弈次序，即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构，即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度，即博弈方

7、是依据个体理性还是集体理性行为，以及理性的程度等。如果设定博弈模型时不专门设定后两个方面，就是隐含假定是完全、完美信息和完全理性的非合作博弈。2、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。答：“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单地说，“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。现实中“囚徒的困境”类型的问题是很多的。例如厂商之问的价格战、恶性的广告竞争，初等、中等教育中的应试教育等，其实都是“囚徒的困境”博弈的表现形式。3

8、、纳什均衡的一致预测性质答：如果所有博弈方都预测特定的博弈结果会出现，那么所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略，即没有哪个博弈方有偏离预测结果的愿望，因此预测结果最终真会成为博弈的结果。正是由于纳什均衡是一致预测，因此各博弈方可以预测它，可以预测他们的对手会预测它，还可以预测他们的对手会预测自己会预测它预测博弈结果是非纳什均衡，意味着要么各博弈方的预测不同，要么预期至少一个博弈方会“犯错误”，会选择错误的策略或者在实施策略时会出现差错。因为只有纳什均衡才具有一致预测的性质，因此一致预测性是纳什均衡的本质属性。一致预测性是保证纳什均衡价值的两个重要性质之一。4、相

9、机选择和策略中的可信性问题答：由于动态博弈中博弈方的策略是多阶段的行动计划，实施起来有一个过程，而且又没有强制力，因此博弈方完全可以在博奔过程中改变计划。我们称这种问题为“相机选择”问题。相机选择的存在使得动态博弈中各博弈方策略设定的行为选择的“可信性”有了疑问。各个博弈方是否会真正、始终按照自己的策略所设定的方案行为，还是可能临时改变自己的行动方案？纳什均衡不能解决这种可信性问题，无法排除博弈方策略中不可信的行为设定，因此在动态博弈中不是真正稳定的。动态博弈分析中具有真正稳定性的均衡概念是子博弈完美纳什均衡。5、动态博弈分析中为什么要引进子博弈完美纳什均衡，它与纳什均衡是什么关系?答：子博弈

10、完美纳什均衡即动态博弈中具有这样特征的策略组合:它们不仅在整个博弈中构成纳什均衡，而且在所有的子博弈中也都构成纳什均衡。在动态博弈分析中引进子博弈完美纳什均衡概念的原因在于，动态博弈中各个博弈方的行为有先后次序，因此往往会存在相机抉择问题，也就是博弈方可能在博弈过程中改变均衡策略设定的行为，从而使得均衡策略存在可信性问题，而且纳什均衡无法消除这种问题，只有子博弈完美纳什均衡能够解决它。子博弈完美纳什均衡一定是纳什均衡，但纳什均衡不一定是子博弈完美纳什均衡。因此一个动态博弈的所有子博弈完美纳什均衡是该博弈所有纳什均衡的一个子集。6、民间定理答：（1）有限次重复博弈民间定理：设原博弈的一次性博弈有

11、均衡得益数组优于各博弈方在一次性博弈中最差均衡得益构成的得益数组，那么在多次重复博弈中，所有不小于个体理性得益(1ndividual rationality Payoff，即博弈方保证能获得的得益)的可实现得益(feasible payoff，博弈中所有纯策略组合得益的加权平均数组)都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。这个定理在有人正式证明并发表之前就是博弈理论界众所周知和认为当然成立的，因此称“民间定理”。（2）无限次重复博弈民间定理：设G是一个完全信息的静态博弈。用(e1，en)记G的纳什均衡的得益。用(xl，xn)表示G的任意可实现得益。如果xiei对任意博弈方i都

12、成立，而足够接近1，那么无限次重复博弈中一定存在一个子博弈完美纳什均衡。各博弈方平均得益是(xl，xn)。这个无限次重复博弈的民间定理是弗里德曼(Fried-man)于1971年提出的，也称为民间定理是因为它与有限次重复博弈民间定理的相似性。7、根据最优反应动态和复制动态进行的进化博弈分析的结论，有什么理论和现实意义，对预测当前的经济均衡有没有作用？答：以最优反应动态和复制动态为核心的进化博弈分析，对于加深我们对社会经济问题本质特征的认识，对博弈论和一般决策、经济理论作用和局限性的认识，对于指导我们的社会经济实践，都有重要的理论和实践意义。因为进化博弈分析是以有限理性而不是完美理性为基

13、础的，因此比较符合实际，对解释现实中事物的内在规律，指导人们的实践活动价值更大，而且对揭示建立在理想化行为主体基础上的经济、决策理论的内在缺陷有重要作用；进化博弈分析也有筛选、检验完全理性博弈分析均衡、结论的作用。此外，由于最优反应动态和复制动态与经济主体的理性层次密切相关，因此进化博弈分析对加深我们对自身理性特征和局限性的认识也有重要的作用。一般来说进化博弈分析研究的主要是社会经济现象和问题的长期动态趋向和稳定性，不一定能准确预测当前经济问题的均衡结果。只有对已有较长期发展过程的问题，才能对当前的经济均衡做较有效地预测。8、完美贝叶斯均衡需满足的要求：答：（1）在各个信息集，轮到选择的博

14、弈方必须具有一个关于博弈达到该信息集中各节点的概率的“判断”。（非单节点上，相当于一个概率分布，单节点概率为1）；（2）给定各博弈方的“判断”，他们的策略必须是“序列理性”的。（即以得益或期望得益最大为目标）；（3）在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定；（4）在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。9、用柠檬原理和逆向选择的思想解释老年人投保困难的原因?答：“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中，劣质品赶走优质品，最后搞垮整个市场的机制。“逆向选择”是在同样不完美信息和消费者缺乏识别能力的市

15、场中，当价格可变时，价格和商品质量循环下降，市场不断向低端发展的机制。高龄人群的保险市场是一个典型的柠檬原理和逆向选择会起作用，从而会导致发展困难的市场。老年人的健康情况差别很大，比年轻人之间的差别要大得多，而保险公司了解老年人投保人的实际健康状况又很困难或成本很高，这就造成了保险公司对老年投保人健康状况的信息不完美。缺乏准确的信息，保险公司就无法根据每个老年投保人的实际健康情况确定不同的保费率，只能根据平均健康情况确定保费率。这种平均保费率对健康情况很差的老年人是合算的，但对健康状况较好的老年人则不合算。因此前者倾向于投保，后者则不愿意投保，投保老年人的平均健康情况会很差。这使得保险公司的赔

16、付风险大大提高，不仅不能赢利而且要亏损，从而失去经营老年保险的积极性，最终导致老年人的投保难问题。这就是柠檬原理作用的结果。如果允许调整保费率，那么保险公司为了避免亏损会上调保费率。而这又会使得原来投保或者准备投保者中相对较健康的老人退出，从而投保老人的平均健康状况会变得更差。如此循环，最终保费会升得很高而投保老人的平均健康情况则会越来越差，对市场的发展当然是很不利。这就是逆向选择机制在老年保险市场作用的结果。10、用完全但不完美信息动态博弈的思想，讨论我国治理假冒伪劣现象很困难的原因？答：商品交易中的质量问题可以用完全但不完美信息动态博弈描述，商品交易中的假冒伪劣现象正是这种市场博弈低效率

17、均衡的表现形式。根据对不完美信息市场博弈完美贝叶斯均衡的讨论，不难知道我国市场经济中假冒伪劣现象难以治理的原因主要包括：（1）信息不完美程度比较严重。我国发展市场经济的时间不长，因此在企业和个人商誉、信誉的建立，资讯的获得和传递等方面，与发达市场经济国家相比有很大差距。这使得我国市场经济活动中的信息不完全和不对称情况更加严重，这是我国市场交易博弈容易出现低效率均衡，假冒伪劣现象严重的主要根源之一。（2）消费者识别能力低下而且麻木。长期的经济落后和物质贫困使得我国消费者的消费知识缺乏，判断商品质量的能力较差。根据不完美信息市场博弈分析可知，消费者识别能力低等于不法厂商制假成本低，而这正是导致

18、不利市场均衡，假冒伪劣盛行的关键条件。事实上，我国消费者不仅识别能力低，还经常对假冒伪劣容忍麻木，甚至知假买假，我国的假冒伪劣很难治理就更不奇怪了。（3）暴利空间的存在。我国许多市场的结构和价格水平不是很合理，许多商品定价过高，存在明显的垄断暴利。这给制假者提供了很大的获利空间。根据不完美信息市场博弈分析的结论，暴利的存在也是假冒伪劣问题严重的重要原因。（4）对假冒伪劣的打击不力。由于地方、部门利益，以及管理体制等方面的原因，政府管理、执法部门对假冒伪劣管理和打击的力度往往是不够的，甚至还有反过来保护制假的情况。这当然会使造假者和打假者之间的博弈向不利的均衡方向发展，使假冒伪劣现象越来越严

19、重。（5）我国社会经济环境的变动太大，稳定性比较差也是重要原因。在不稳定的市场中，管理者和经营者都不可能对长远利益有足够的重视，不可能对培育和维护商誉有很大的积极性。这对市场博弈的均衡也有很大的影响，会对假冒伪劣现象起推波助澜的作用。当前我国市场经济中严重的假冒伪劣现象正是这些因素综合作用的结果，根治假冒伪劣必须先解决好上述问题。3、计算题（课后习题2、3、4、5章）18道题(自己整理)4、理论推导题（13道题）1、古诺的寡头模型（P59）解：寡头产量竞争以两厂商产量竞争为例设一市场有两家厂商生产同样的产品。如果厂商1的产量为，厂商2的产量为，则市场总产量为。设市场出清价格 P（

20、可以将产品全部卖出去的价格）是市场总产量的函数：。再设两厂商的生产都无固定成本，且每增加一单位产量的边际成本相等，。最后强调两厂商同时决定各自的产量，即他们在决策之前都不知道另一方的产量。两博弈方的策略空间：产量（假设产量是连续可分的，两厂商都有无限多种可选策略，生产能力限制产量上限）得益：各自利润，销售收益减去各自成本。博弈得益即：不难看出，两博弈方的得益（利润）都取决于双方的策略（产量）。怎样才能找出这个博弈的纳什均衡策略组合呢？假设策略组合（，）是本博弈的纳什均衡，那么（, ）必须是最大化问题，即：分别对 ,，求导，就一定能实现两式的最大值，得出：对方程组求解，得出= =

21、2。因此，策略组合（2,2）是本博弈唯一的纳什均衡，也是本博弈的结果。根据上述分析，模型中独立同时作产量决策，以自身最大化利益为目标的两厂商，都会选择生产2单位产量，最终市场总产量为2+2=4，市场价格为8-4=4，双方各自得益（利润）2×（8-4）-2 ×2=4，两厂商利润总和为4+4=8。从两厂商的总体来看，根据总体利益最大化确定产量效率更高，换句话说，如果两厂商更多考虑合作，联合起来决定产量，先定出总利益最大化的产量后各自生产一般（1.5单位），则各自可分享到的利益为4.5，比只考虑自身利益的独立决策行为得到的利益更高。但是，在缺乏强制作用的协议等保障手段的情况下，

22、这种情况是不可能出现的，因为两厂商早晚都会增产，只有达到纳什均衡的产量水平（2,2）时才会稳定下来，因为只有这时候任一厂商单独改变产量不利于自己。2、伯特兰德寡头模型(P63)解：1883年，伯特兰德提出把反映函数应用到伯特兰德模型分析这种模型与产量的古诺模型的差别在于，各厂商选择的是价格而不是产量。因此，它是价格竞争寡头的博弈模型。产品：两厂商生产同类产品，在品牌、质量、包装等方面有一定差别产品之间有很强替代性，但又不是完全可替代的，价格较高的不会完全销不出去。假设：厂商1产品价格为：P1 厂商2产品价格为：P2各自需求函数为：其中d1,d20,即两厂商产品的替代系数。再假设两厂商无固

23、定成本，边际生产成本分别为c1,c2。两厂商同时决策。博弈方：厂商1,厂商2；博弈策略：价格p；博弈策略空间：厂商1为s1=0,厂商2为s2=0,。和表示厂商1与厂商2能卖出产品的最高价格；博弈得益：各自利润u，即销售收益减去成本。则双方价格的函数，即得益函数：运用反应函数法分析这个博弈，利用上述函数在偏导数为0时有最大值，很容易求出两厂商对对方策略（价格）的反应函数。即：如果要得到一个纳什均衡，则必须有（，）是两反应函数的交点。即必须满足：解方程组：将，代入两得益函数就可得出两厂商的均衡得益。上述是伯特兰德模型简单的情况。若对于n个寡头的价格决策，并且产品也可以是无差别

24、的。3、公共资源问题(P65)解：随着社会经济的不断发展，我们越来越无法回避公共资源利用、公共设施提供和公共环境保护等方面的问题。而在这些问题中，也包含了众多博弈关系。公共资源的特征：(1)没有哪个人、哪个企业或组织拥有所有权； (2)大家都可以自由利用； (3)即具有非排他性和非竞争性。由于公共资源有上述两个特征，因而利用这些资源时不支付任何代价，除非政府将这些资源收归国有，并对使用者征收资源税或收取类似的费用。但一旦政府采取了上述措施，这些资源也就不再是公共资源，而更是国有资源了。公共草地放牧问题：博弈方：n个农户博弈策略：羊的数量博弈策略空间：博弈得益：假设：各户养羊数为q1,q2,

25、q3,qn。得出：在公共草地上放牧羊只得总数，以及每只羊的产出（应是羊只总数Q的减函数）为：再假设：购买和照料每只羊的成本为：c最后得出：农户i养qi只羊的得益函数为：为了更直观的观察，我们假设：有三家农户，即n=3，每只羊的产出函数V=100-Q=100-（q1+q2+q3）；养每只羊的成本为：c=4。得出：三家农户的得益函数分别为：由于羊的数量不是连续可分的，因此上述函数不是一个连续函数。但在技术上可以进行处理，把它当作连续函数。求出三个农户各自对其他两个农户的反应函数。即求q1,q2,q3最大化问题。得出：三个反映函数的交点（，）就是博弈的纳什均衡。将这个纳什均衡代入三个反应函数。就

26、得到：4、夫妻之争的混合策略纳什均衡(P81)解：一对夫妻得到了两张时装表演票和同一时间的两张足球比赛票。妻子更想去看时装表演而丈夫更想去看足球，但又不愿或不能分头行动，争执不下就决定投票决定。若同时选择时装则去看时装表演，同选足球则去看足球比赛，如选择不一致则哪儿都不去。假设：丈夫与妻子同时去看时装表演，妻子得益2,丈夫得益1；丈夫与妻子都去看足球比赛，则丈夫得益3，妻子得益1；双方选择不同而没有出门，则双方得益都为0. 2， 1 0， 0 0， 0 1， 3时装足球时装足球丈夫妻子这个博弈与没有纯策略纳什均衡的严格竞争博弈时明显不同的，如果一方知道另一方已选择了某种策略，则前者

27、唯一明智的选择就是与对方保持一致，以免得最差得益0。妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡策略得益博弈方1 （0.75，0.25） 0.67博弈方2 （1/3，2/3） 0.75 我们不难发现，这个结果明显不如夫妻双方能交流协商时，任何一方迁就另一方时双方的得益好，因为那时任何一方都至少得1.这是因为双方缺乏沟通时很可能出现最差结果而造成的。5、寡占的斯塔博格模型（P121）解：两个厂商（一方较强，一方较弱），先后选择产量的产量竞争博弈较强一方先行选择，较弱一方根据较强一方的产量选择自己的产量。由于此博弈决策的是产量，因此这是一个两博弈方都有无限多种可选策略的无限策

28、略动态博弈，无法用扩展形表示，只能用描述得益函数的方法表示。博弈方：厂商1，厂商2策略：产量q策略空间：0, ，可看作不至于使价格降到亏本的最大限度产量价格函数，其中两厂商的边际成本为，没有固定成本。两厂商的得益函数为：运用逆推归纳法分析这个博弈。先分析第二阶段厂商2的决策。在第二阶段厂商2决策时，厂商1选择实际上已经决定了，并且厂商2知道，因此对厂商2来说，相当于在给定的情况下求使实现最大值的。即对求导的问题。即求得再分析第一阶段厂商1的决策。厂商1知道厂商2的这种决策思路，因此在选择时就知道厂商2的产量，会根据公式进行确定，所以厂商1可以直接将该公式代入自己的得益函

29、数，这样厂商1的得益函数实际上转化成了他自己的产量的一元函数。即：因此，厂商1可以直接利用该公式求出使自己的得益最大的令代入该公式，并对求导，可得：求得最后得出，厂商1的最佳产量是生产3单位，厂商2的最佳产量是1.5单位，此时市场价格为3.5，双方得益（利润）分别为4.5和2.25单位。6、无不确定性的委托人-代理人模型（P131）解：假设：代理人的工作成果没有不确定性；代理人的产出是努力程度的确定性函数；因此，委托人完全可以根据成果掌握代理人的工作情况，不存在监督问题。再假设：委托关系是基于一种标准合同，第一阶段委托人有委托和不委托第二阶段代理人有接受和拒绝第三阶段代理人有努

30、力（高努力水平）和偷懒（低努力水平) 第一阶段：委托人有委托和不委托不委托得益：R(0),0。代理人的服务对委托人至关紧要时， R(0)可能是0,甚至为负值；代理人的服务对委托人不关键时， R(0)也可以是正值；例子：职业经理人第二阶段：代理人选择拒绝，则回到第一阶段；选择接受，则进行第三阶段第三阶段：高努力水平： R(E)代表委托人得到较高产出， w(E),代表委托人支付给代理人较高报酬， -E代表代理人有较高的负效应（重病成本，大机会成本）低努力水平： R(S)代表委托人得到较低产出， w(S)代表委托人支付给代理人较低报酬， -S代表代理人有较低的负效应（小病成本，小机会成本）下图

31、：无不确定性的委托人-代理人模型(P132）逆推归纳法：第三阶段：代理人努力和偷懒的选择代理人得益情况，如果 w(E)-E> w(S)-S，也就是： w(E)> w(S)+E-S此时，代理人会选择努力。上述不等式也称为代理人努力的“激励相容约束”，这是促使代理人努力工作必须满足的条件。P133如果，w(S)-Sw(E)-E时，代理人肯定会选择偷懒。该不等式成为代理人偷懒的“激励相容约束”。据此推论出：由于偷懒的负效应肯定小于努力工作的负效应，如果偷懒和努力得到的报酬相同，即w(S)=w(E)，那么偷懒的激励相容约束自动满足，代理人必然选择偷懒。第二阶段：代理人是否接受委托的选择对应

32、第三阶段的努力和偷懒的可能性选择，第二阶段有两种情况。22拒绝接受拒绝接受接受：w(E)-E>0接受：w(S)-S>0参与约束：参与约束参与约束：代表代理人愿意接受委托人委托的基本条件。另一种情况：要代理人在第二阶段选择接受，而不是拒绝，则必须使代理人在第二阶段的得益大于放弃其他机会的机会成本。第一阶段：委托人有委托和不委托两种选择如果代理人在第二阶段选择的是拒绝，那么委托人的选择其实是无关紧要的，因为委托人委托与不委托的结果一样。现在考虑代理人在第二阶段选择接受的情况，那么仍然有两种情况也就是代理人第三阶段选择努力和偷懒的情况。11不委托委托委托不委托委托： R(E)-w(E)

33、 > R(0)不委托： R(E)-w(E) < R(0)委托： R(S)-w(S) > R(0)不委托： R(S)-w(S) < R(0)最后得到：一个子博弈完美纳什均衡。即委托人的委托，代理人的接受努力数值例子:假设：努力的投入产出函数为：代理人努力水平2单位，偷懒水平1单位，而且努力的负效应等于努力水平的数值，即E=2, S=1,得到：R(0)=0,R(E)=R(2)=16,R(S)=R(1)=9.再假设：W(E)=4, w(S)=2最后得出：w(E)-E=4-2=2w(S)-S=2-1=1，此时满足促使代理人努力的激励相容约束；w(E)-E=4-2=20，此时满足

34、代理人接受委托的参与约束；R(E)-w(E)=16-4=12R(0)=0，此时满足委托人选择委托的条件。下图：无不确定性的委托人-代理人模型（数值例子）(P135)7、有不确定性但可监督的委托人-代理人博弈（P135）解：代理人的努力成果有不确定性，但委托人对代理人有完全监督的情况。存在完全监督的情况下：委托人支付给代理人的报酬是根据工作情况，而不是工作成果。意味着，产出不确定性的风险完全由委托人承担，原因：风险主要来源于环境或随即因素，与代理人无关。也意味着，代理人工作成果的不确定性直接影响的只有委托然的选择，不会影响代理人的选择，但是通过委托人的选择会对代理人的利益产生间接影响。假设：有两

35、种产出可能20和10 代理人努力时产出20的概率为0.9，产出10的概率为0.1；代理人偷懒时产出20的概率为0.1，产出10的概率为0.9.再假设：R(0)=0引进一个“自然”博弈方0反映不确定性。下图：努力成果不确定但可监督的委托人-代理人模型（P136）逆推归纳法分析第三阶段：考虑的是代理人选择努力和偷懒的情况，（激励相容约束）两种情况，即w(E)-E> w(S)-S时，选择努力， w(S)-Sw(E)-E时，选择偷懒第二阶段：考虑代理人选择接受和拒绝的情况，（参与约束）两种情况，即w(E)-E>0和w(S)-S>0时，代理人会选择接受，否则选择拒绝。第一阶段：考虑委

36、托人选择委托和不委托的情况，由于委托人对代理人的工作完全监督，也完全清楚代理人的选择，此时仍有两种情况。偷懒（委托人选择委托的期望得益）委托： 0.1*20-w(S) +0.9*10-w(S)>0不委托： 0.1*20-w(S) +0.9*10-w(S)<0努力（委托人选择委托的期望得益）委托：0.9*20-w(E)+0.1*10-w(E)>0不委托：0.9*20-w(E)+0.1*10-w(E)<08、囚徒困境式博弈的无限次重复（P190）解：囚徒困境式博弈的无限次重复寡头销价竞争博弈一次性博弈中：（L,L）纯策略纳什均衡，而（H,H）虽不是一次性博弈中的纳什均衡

37、，但却是效率较好的一个结果（潜在合作利益）。假设两个博弈方都采用触发策略：第一阶段采用H，进行t个阶段，如果前t-1阶段的结果都是（H,H），则继续采用H，否则采用L。4，40，55，01，1HLHL假设：博弈方1首先采用这种触发策略，然后讨论博弈方2针对博弈方1的这种策略的最佳反应策略。博弈方2针对博弈方1触发策略的最佳反应策略的后半部分与触发策略的后半部分是一样的。关键看博弈方2在第一阶段的最优选择是什么？第一种情况：第一阶段博弈方2 采用L，得益是5，那么引起博弈方1在此后的阶段一致采用L报复，博弈方2也只能一直采用L，得益永远是1。此时，博弈方2的总得益的现在值为：第二种情况：第

38、一阶段博弈方2采用H，得益是4，下一阶段又面临同样的选择。假设V为博弈方2在该重复博弈中每阶段都采用最佳选择的总得益现在值，那么从第二阶段开始的无限次重复博弈因为与从第一阶段开始的只差一阶段，因而在无限次重复时可看作相同的，其总得益的现在值折算成第一阶段的得益为，因此当第一阶段的最佳选择是H时，整个无限次重复博弈总得益的现在值为：或因此时，博弈方2会采用H策略，否则会采用L策略。那么，满足这个条件，只要博弈方1采用上述触发策略，博弈方2的最佳反应策略始终是选择H策略。如果博弈方1偏离H策略，博弈方2也必须用L策略来报复。9、古诺模型的无限次重复博弈和支持垄断产量的条件（P194）解：

39、古诺的寡头模型寡头产量竞争以两厂商产量竞争为例设一市场有两家厂商生产同样的产品。如果厂商1的产量为，厂商2的产量为，则市场总产量为。设市场出清价格（可以将产品全部卖出去的价格）是市场总产量的函数：再设两厂商的生产都无固定成本，且每增加一单位产量的边际成本相等。最后强调两厂商同时决定各自的产量，即他们在决策之前都不知道另一方的产量。两博弈方的策略空间：产量（假设产量是连续可分的，两厂商都有无限多种可选策略，生产能力限制产量上限）得益：各自利润，销售收益减去各自成本。博弈得益即：不难看出，两博弈方的得益（利润）都取决于双方的策略（产量）。怎样才能找出这个博弈的纳什均衡策略组合呢？

40、假设策略组合（，）是本博弈的纳什均衡，那么（，）必须是最大化问题，即：分别对，求导，就一定能实现两式的最大值，得出：对方程组求解，得出 = =2。因此，策略组合（2,2）是本博弈唯一的纳什均衡，也是本博弈的结果。根据上述分析，模型中独立同时作产量决策，以自身最大化利益为目标的两厂商，都会选择生产2单位产量，最终市场总产量为2+2=4，市场价格为8-4=4，双方各自得益（利润）2×（8-4）-2 ×2=4，两厂商利润总和为4+4=8。从两厂商的总体来看，根据总体利益最大化确定产量效率更高，换句话说，如果两厂商更多考虑合作，联合起来决定产量，先定出总利益最大化的产量后各自生产一般（1.5单位），则各自可分享到的利益为4.5，比只考虑自身利益的独立决策行为得到的利益更高。但是，在缺乏强制作用的协议等保障手段的情况下，这种情况是不可能出现的，因为两厂商早晚都会增产，只有达到纳什均衡的产量水平（2,2）时才会稳定下来，因为只有这时候任一厂商单独改变产量不利于自己。当贴现率满足一定条件时，两厂商都采用如下触发策略构成的一个子博弈完美那身均衡：第一阶段生产垄断产量的一般1

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

经济博弈论期末复习资料

文档简介

温馨提示

最新文档

评论

经济博弈论期末复习资料

文档简介

温馨提示

最新文档

评论

相关文档