博弈论复习题及答案

上传人：世*** IP属地：贵州上传时间：2020-06-03 格式：DOC 页数：24 大小：468KB 积分：20 举报 版权申诉

已阅读5页，还剩19页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论2、可口可乐与百事可乐（参与者）的价格决策：双方都可以保持价格不变或者提高价格（策略）；博弈的目标和得失情况体现为利润的多少（收益）；利润的大小取决于双方的策略组合（收益函数）；博弈有四种策略组合，其结局是：（1）如果双方都不涨价，各得利润10单位；（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；（4）如果双方都涨价，可口可乐利润140，百事可乐利润35；求纳什均衡。博弈的稳定状态有两个：都不涨价或者都涨价（均衡），均衡称为博弈的解。3、猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽，但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到；都去按则同时到。若大猪先到，大猪吃到9个单位，小猪吃到一个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃六个单位，小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示（每格第一个数字是大猪的得益，第二个数字是小猪的得益）：小猪按等待大猪按 5，14，4等待 9，-1 0，0 求纳什均衡。在这个例子中，我们可以发现，大猪选择按，小猪最好选择等待，大猪选择不按，小猪还是最好选择等待。即不管大猪选择按还是不按，小猪的最佳策略都是等待。也就是说，无论如何，小猪都只会选择等待。这样的情况下，大猪最好选择是按，因为不按的话都饿肚子，按的话还可以有4个单位的收益。所以纳什均衡是（大猪按，小猪等待）。4、根据两人博弈的支付矩阵回答问题： abA2,30,0B0,04,2(1) 写出两人各自的全部策略，并用等价的博弈树来重新表示这个博弈（6分）(2) 找出该博弈的全部纯策略纳什均衡，并判断均衡的结果是否是Pareto有效。(3) 求出该博弈的混合策略纳什均衡。（7分）(1)策略甲：乙：博弈树（草图如下：(2)Pure NE (A, a); (B, b)都是Pareto有效，仅(B, b)是有效。(3)Mixed NE (2/5, 3/5); (2/3, 1/3)5、用反应函数法求出下列博弈的所有纯战略纳什均衡。参与人2abcdA2,33,23,40,3参与人1B4,45,20,11,2C3,14,11,410,2D3,14,1-1,210,1解答：纯策略纳什均衡为（B，a）与（A，c）分析过程：设两个参与人的行动分别为，player1的反应函数player2的反应函数交点为（B，a）与（A，c），因此纯策略纳什均衡为（B，a）与（A，c）。6、（entry deterrence市场威慑）考虑下面一个动态博弈：首先，在一个市场上潜在的进入者选择是否进入，然后市场上的已有企业（在位者）选择是否与新企业展开竞争。在位者可能有两种类型，温柔型（左图）和残酷型（右图），回答下面问题。.进入者在位者进入不进入默许斗争（20，30）（-10，0）（0，100）进入者在位者进入不进入默许斗争（-10，25）（0，100）（10，20）左图：温柔型右图：残酷型(1) 找出给定在位者的两种类型所分别对应的纳什均衡，以及子博弈精炼纳什均衡（12分）(2) 已有企业为温柔型的概率至少多少时，新企业才愿意进入（8分）(1) 温柔NE (in, accommodate) 和(out, fight)。 SPNE为(in, accommodate)残酷NE (out, fight). SPNE同理(2) 8、博弈方1 和博弈方 2就如何分 10，000 元钱进行讨价还价。假设确定了以下规则：双方同时提出自己要求的数额 A 和 B，0A，B10，000。如果 A+B10，000，则两博弈方的要求得到满足，即分别得 A 和 B，但如果 A+B10，000，则该笔钱就没收。问该博弈的纳什均衡是什么？如果你是其中一个博弈方，你会选择什么数额？为什么？答十、纳什均衡有无数个。最可能的结果是（5000，5000）这个聚点均衡。9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作，各获得元的垄断利润，但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利元。（1）将这一市场用囚徒困境的博弈加以表示。（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。答：（1）用囚徒困境的博弈表示如下表：北方航空公司合作竞争新华航空公司合作，0，竞争，060000，60000（2）如果新华航空公司选择竞争，则北方航空公司也会选择竞争（600000）；若新华航空公司选择合作，北方航空公司仍会选择竞争（）。若北方航空公司选择竞争，新华航空公司也将选择竞争（600000）；若北方航空公司选择合作，新华航空公司仍会选择竞争（0）。由于双方总偏好竞争，故均衡结果为两家公司都选择竞争性策略，每一家公司所获利润均为元。12、设啤酒市场上有两家厂商，各自选择是生产高价啤酒还是低价啤酒，相应的利润（单位：万元）由下图的得益矩阵给出：（1）有哪些结果是纳什均衡？（2）两厂商合作的结果是什么？答（1）（低价，高价），（高价，低价）（2）（低价，高价）13、A、B两企业利用广告进行竞争。若A、B两企业都做广告，在未来销售中，A企业可以获得20万元利润，B企业可获得8万元利润；若A企业做广告，B企业不做广告，A企业可获得25万元利润，B企业可获得2万元利润；若A企业不做广告，B企业做广告，A企业可获得10万元利润，B企业可获得12万元利润；若A、B两企业都不做广告，A企业可获得30万元利润，B企业可获得6万元利润。（1）画出A、B两企业的支付矩阵。（2）求纳什均衡。3. 答：（1）由题目中所提供的信息，可画出A、B两企业的支付矩阵（如下表）。B企业做广告不做广告A企业做广告20，825，2不做广告10，1230，6（2）因为这是一个简单的完全信息静态博弈，对于纯策纳什均衡解可运用划横线法求解。如果A厂商做广告，则B厂商的最优选择是做广告，因为做广告所获得的利润8大于不做广告获得的利润2，故在8下面划一横线。如果A厂商不做广告，则B厂商的最优选择也是做广告，因为做广告获得的利润为12，而不做广告的利润为6，故在12下面划一横线。如果B厂商做广告，则A厂商的最优选择是做广告，因为做广告获得的利润20大于不做广告所获得的利润10，故在20下面划一横线。如果B厂商不做广告，A厂商的最优选择是不做广告，因为不做广告获得的利润30大于做广告所获得的利润25，故在30下面划一横线。在本题中不存在混合策略的纳什均衡解，因此，最终的纯策略纳什均衡就是A、B两厂商都做广告。15、求出下面博弈的纳什均衡(含纯策略和混合策略)。乙LR甲U5,00,8D2,64,5由划线法易知，该矩阵博弈没有纯策略Nash均衡。可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1可得混合策略Nash均衡(),()16、某产品市场上有两个厂商，各自都可以选择高质量，还是低质量。相应的利润由如下得益矩阵给出：(1) 该博弈是否存在纳什均衡？如果存在的话，哪些结果是纳什均衡?参考答案：由划线法可知，该矩阵博弈有两个纯策略Nash均衡，即(低质量, 高质量)， (高质量,低质量)。乙企业高质量低质量甲企业高质量50,50100,800低质量900,600-20,-30该矩阵博弈还有一个混合的纳什均衡Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630，可得因此该问题的混合纳什均衡为。17、甲、乙两企业分属两个国家，在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。如果乙企业所在国政府想保护本国企业利益，可以采取什么措施？乙企业开发不开发甲企业开发-10,-10100,0不开发0,1000,0解：用划线法找出问题的纯策略纳什均衡点。所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。该博弈还有一个混合的纳什均衡(),()。如果乙企业所在国政府对企业开发新产品补贴a个单位,则收益矩阵变为：,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需a10。此时乙企业的收益为100+a。18、博弈的收益矩阵如下表：乙左右甲上a，bc，d下e，fg，h （1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、h之间必然满足哪些关系？（尽量把所有必要的关系式都写出来）（2）如果（上，左）是纳什均衡，则（1）中的关系式哪些必须满足？（3）如果（上，左）是占优策略均衡，那么它是否必定是纳什均衡？为什么？（4）在什么情况下，纯战略纳什均衡不存在？答：（1），。本题另外一个思考角度是从占优策略均衡的定义出发。对乙而言，占优策略为；而对甲而言，占优策略为。综合起来可得到所需结论。（2）纳什均衡只需满足：甲选上的策略时，同时乙选左的策略时，。故本题中纳什均衡的条件为：，。（3）占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什均衡的条件。（4）当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳什均衡就不存在。19、Smith和John玩数字匹配游戏，每个人选择1、2、3，如果数字相同， John给Smith 3美元，如果不同，Smith给John 1美元。（1）列出收益矩阵。（2）如果参与者以1/3的概率选择每一个数字，证明该混合策略存在一个纳什均衡，它为多少？答：（1）此博弈的收益矩阵如下表。该博弈是零和博弈，无纳什均衡。John123Smith13，-3-1，1-1，12-1，13，-3-1，13-1，1-1，13，-3 （2）Smith选（1/3，1/3，1/3）的混合概率时，John选1的效用为：John选2的效用为：John选3的效用为：类似地，John选（1/3，1/3，1/3）的混合概率时，Smith选1的效用为：Smith选2的效用为：Smith选3的效用为：因为，所以：是纳什均衡，策略值分别为John：；Smith：。20、假设双头垄断企业的成本函数分别为：，市场需求曲线为，其中，。（1）求出古诺（Cournot）均衡情况下的产量、价格和利润，求出各自的反应和等利润曲线，并图示均衡点。（2）求出斯塔克博格（Stackelberg）均衡情况下的产量、价格和利润，并以图形表示。（3）说明导致上述两种均衡结果差异的原因。答：（1）对于垄断企业1来说：这是垄断企业1的反应函数。其等利润曲线为：对垄断企业2来说：这是垄断企业2的反应函数。其等利润曲线为：在达到均衡时，有：均衡时的价格为：两垄断企业的利润分别为：均衡点可图示为：0企业195200190企业2企业1的反应线均衡点（2）当垄断企业1为领导者时，企业2视企业1的产量为既定，其反应函数为：则企业1的问题可简化为：均衡时价格为：利润为：，该均衡可用下图表示：Stackelberg均衡点企业2的反应线500企业195200190企业2企业1的反应线企业2领先时可依此类推。（3）当企业1为领先者时，其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为，企业1先行动时，其能考虑企业2的反应，并以此来制定自己的生产计划，而企业2只能被动地接受企业1的既定产量，计划自己的产出，这是一种“先动优势”21、在一个由三寡头操纵的垄断市场中，逆需求函数为p=a-q1-q2-q3，这里qi是企业i的产量。每一企业生产的单位成本为常数c。三企业决定各自产量的顺序如下：(1)企业1首先选择q10；(2)企业2和企业3观察到q1，然后同时分别选择q2和q3。试解出该博弈的子博弈完美纳什均衡。答：该博弈分为两个阶段，第一阶段企业1选择产量q1，第二阶段企业2和3观测到q1后，他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。（1）假设企业1已选定产量q1，先进行第二阶段的计算。设企业2，3的利润函数分别为：由于两企业均要追求利润最大，故对以上两式分别求一阶条件：（1）（2）求解（1）、（2）组成的方程组有：（3）（2）现进行第一阶段的博弈分析：对与企业1，其利润函数为；将（3）代入可得：（4）式（4）对q1求导：解得：（5）此时，（3）将式（5）代回（3）和（4）有该博弈的子博弈完美纳什均衡：,25、某寡头垄断市场上有两个厂商，总成本均为自身产量的20倍，市场需求函数为Q=200-P。求（1）若两个厂商同时决定产量，产量分别是多少？（2）若两个厂商达成协议垄断市场，共同安排产量，则各自的利润情况如何？答：（1）分别求反应函数，180-2Q1-Q2=0，180-Q1-2Q2=0，Q1=Q2=60（2）200-2Q=20，Q=90，Q1=Q2=4526、一个工人给一个老板干活，工资标准是100元。工人可以选择是否偷懒，老板则选择是否克扣工资。假设工人不偷懒有相当于 50 元的负效用，老板想克扣工资则总有借口扣掉60 元工资，工人不偷懒老板有 150 元产出，而工人偷懒时老板只有 80元产出，但老板在支付工资之前无法知道实际产出，这些情况双方都知道。请问：（1）如果老板完全能够看出工人是否偷懒，博弈属于哪种类型？用得益矩阵或扩展形表示该博弈并作简单分析。（2）如果老板无法看出工人是否偷懒，博弈属于哪种类型？用得益矩阵或扩展形表示该博弈并作简单分析。（1）完全信息动态博弈。博弈结果应该是工人偷懒，老板克扣。（2）完全信息静态博弈，结果仍然是工人偷懒，老板克扣。27、举一个你在现实生活中遇到的囚犯两难困境的例子。答：在校园的人行道交叉路口，无需红绿灯。现在两人分别骑车从东西方向和南北方向通过路口。若同时往前冲，必定相撞，各自支付为（-2，-2）；若同时停下，都不能按时前进，支付为（0，0）；若一人前进一人停下，支付为（2，0）或（0，2）。相应的策略和支付矩阵如下表。乙前进停下甲前进-2，-22，0停下0，20，028、给定两家酿酒企业A、B的收益矩阵如下表：A企业白酒啤酒B企业白酒700，600900，1000啤酒800，900600，800表中每组数字前面一个表示B企业的收益，后一个数字表示B企业的收益。（1）求出该博弈问题的均衡解，是占优策略均衡还是纳什均衡？（2）存在帕累托改进吗？如果存在，在什么条件下可以实现？福利增量是多少？（3）如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡？如何改变上述A、B企业的收益才能使该博弈不存在均衡？答：（1）有两个纳什均衡，即（啤酒，白酒）、（白酒，啤酒），都是纳什均衡而不是占优策略均衡。（2）显然，（白酒，啤酒）是最佳均衡，此时双方均获得其最大收益。若均衡解为（啤酒，白酒），则存在帕累托改善的可能。方法是双方沟通，共同做出理性选择，也可由一方向另一方支付报酬。福利由800+900变为900+1000，增量为200。（3）如将（啤酒，白酒）支付改为（1000，1100），则（啤酒，白酒）就成为占优策略均衡。比如将（啤酒，白酒）支付改为（800，500），将（白酒，啤酒）支付改为（900，500），则该博弈就不存在任何占优策略均衡或纳什均衡。30、在纳税检查的博弈中，假设A为应纳税款，C为检查成本，F是偷税罚款，且C1/4时，才存在子博弈完美纳什均衡。37、在Bertrand价格博弈中，假定有n个生产企业，需求函数为P=a-Q，其中P是市场价格，Q是n个生产企业的总供给量。假定博弈重复无穷多次，每次的价格都立即被观测到，企业使用“触发策略”(一旦某个企业选择垄断价格，则执行“冷酷策略”)。求使垄断价格可以作为完美均衡结果出现的最低贴现因子是多少。并请解释与n的关系。分析：此题可分解为3个步骤（1）n个企业合作，产量总和为垄断产量，价格为垄断价格，然后平分利润。（2）其中一个企业采取欺骗手段降价，那个这家企业就占有的全部市场，获得垄断利润（3）其他企业触发战略，将价格降到等于边际成本，所有的企业利润为零。参考答案：（1）设每个企业的边际成本为c，固定成本为0 P=a-Q TR=P*Q=(a-Q)*Q MR=a-2Q 因为：MR=MC a-2Q=c 则:Q=(a-c)/2 P=(a+c)/2 =(P-c)*Q=(a-c)2/4 每家企业的利润为(a-c)2/4n （2）假设A企业自主降价，虽然只是微小的价格调整，但足以占领整个市场，获得所有的垄断利润(a-c)2/4 （3）其他企业在下一期采取冷酷策略，使得所有企业的利润为0 考虑： A企业不降价： (a-c)2/4n， (a-c)2/4n， A企业降价： (a-c)2/4， 0，使垄断价格可以作为完美均衡结果，就要使得不降价的贴现值大于等于降价的贴现值。设贴现因子为 A不降价的贴现值： (a-c)2/4n1/(1- ) A降价的现值： (a-c)2/4 于是：(a-c)2/4n1/(1- ) (a-c)2/4 解得： 1-1/n 38、假设某劳动市场为完全竞争市场,其供求函数如下: SL:W=120+2L DL:W=360-L 已知某厂商(在完全竞争市场下)的生产函数为 f(L,K)=10L0.5K0.5 (K=100) 且其产品的需求与供给函数分别为论述题（每小题20分，共20分）解释“囚犯困境”，并举商业案例说明。囚徒困境是博弈论里最著名的例子之一，几乎所有的博弈论著作中都要讨论这个例子。这个例子是这样的：两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白，各将被判入狱5年；如果两人都不坦白，则很难对他们提起刑事诉讼，因而两囚徒可以期望被从轻发落入狱2年；另一方面，如果一个囚徒坦白而另一个囚徒不坦白，坦白的这个囚徒就只需入狱1年，而不坦白的囚徒将被判入狱10年。表6-2给出了囚徒困境的策略式表述。这里，每个囚徒都有两种策略：坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。(注意，这里的得益是负值。)表6-2 囚徒困境囚徒乙坦白不坦白囚徒甲坦白 -5， -5-1， -10不坦白-10， -1-2， -2在囚徒困境这个模型中，纳什均衡就是双方都坦白，给定甲坦白的情况下，乙的最优策略是坦白；给定乙坦白的情况下，甲的最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡，而且是一个上策(dominant strategy)均衡，即不论对方如何选择，个人的最优选择是坦白。因为如果乙不坦白，甲坦白的话就被轻判1年，不坦白的话就判2年，坦白比不坦白要好；如果乙坦白，甲坦白的话判5年，不坦白的话判10年，所以，坦白仍然比不坦白要好。这样，坦白就是甲的上策，当然也是乙的上策。其结果是双方都坦白。这个组合是纳什均衡。寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时，如果寡头厂商们联合起来形成卡特尔，选择垄断利润最大化产量，每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡，因为给定双方遵守协议的情况下，每个厂商都想增加生产，结果是每个厂商都只得到纳什均衡产量的利润，它远小于卡特尔产量下的利润。解释“智猪博弈(boxed pigs)”，并举商业案例说明。智猪博弈的例子讲的是：猪圈里有一头大猪和一头小猪，猪圈的一头有一个猪食槽，另一头安装一个按扭，控制着猪食的供应。每按一下按扭会有10个单位的猪食进槽，但谁按按扭谁就要付2个单位的成本并且晚到猪食槽。若大猪先到猪食槽，大猪吃到9个单位，小猪只能吃到1个单位；若小猪先到猪食槽，大猪吃到6个单位，小猪吃4个单位；若同时到，大猪吃到7个单位，小猪只能吃3个单位。表6-3列出了对应于不同策略组合的得益水平。例如，表中第一格表示大猪小猪同时按按扭，从而同时走到猪食槽，大猪吃7个，小猪吃3个，除去2个单位成本，得益分别为5和1。表6-3 智猪博弈小猪按不按大猪按5， 14， 4不按9， -10， 0从表6-3可以看到，对于小猪来说，如果大猪按，它则不按更好；如果大猪不按，它不按也更好，所以，不论大猪按还是不按，它的最优策略都是不按。给定小猪不按，大猪的最优选择只能是按。所以，纳什均衡就是大猪按，小猪不按，各得4个单位猪食。市场中的大企业与小企业之间的关系类似智猪博弈。大企业进行研究与开发，为新产品做广告，而对小企业来说这些工作可能得不偿失。所以，小企业可能把精力花在模仿上，或等待大企业用广告打开市场后再出售廉价产品。解释“夫妻博弈”(battle of the sexes)”，并举商业案例说明。 “夫妻博弈”(battle of the sexes)的例子讲的是一对谈恋爱的男女安排业余活动，他们有二种选择，或去看足球比赛，或去看芭蕾舞演出。男方偏好足球，女方偏好芭蕾，但他们宁愿在一起，不愿分开。表6-6给出了这个博弈的得益矩阵。在这个博弈中，如果双方同时决定，则有两个纳什均衡，即都去看足球比赛和都去看芭蕾演出。但是到底最后他们去看足球比赛还是去看芭蕾演出，并不能从中获得结论。如果假设这是个序列博弈，例如，当女方先作出选择看芭蕾演出时，男方只能选择芭蕾；当女方先选择了看足球比赛时，男方也只能选择足球。反之，当男方先选择了看足球比赛时，女方只能选择看足球比赛；当男方先选择了看芭蕾演出时，女方只能选择芭蕾。表6-6 夫妻博弈女足球芭蕾男足球2，10，0芭蕾0，01，2在这个博弈例子中，先行动者具有明显的优势，女方通过选择芭蕾造成一种既成事实，使得男方除了一起去看芭蕾之外别无选择。这就是我们在斯塔克尔伯格模型中提到的先动优势(first mover advantage)。在那个模型中，先行动的厂商选择一个很高的产量水平，从而使它的竞争对手除了选择小的产量水平之外没有多大的选择余地。解释古诺模型。解释斯塔克尔伯格模型。l 斯塔克尔贝里(1934)提出一个双头垄断的动态模型，其中一个支配企业(领导者)首先行动，然后从属企业(追随者)行。比如在美国汽车产业发展史中的某些阶段，通用汽车就扮演过这种领导者的角色(这一例子把模型直接扩展到允许不止一个追随企业，如福特、克莱斯勒等等)。根据斯塔克尔贝里的假定，模型中的企业选择其产量，这一点和古诺模型是一致的(只不过古诺模型中企业是同时行动的，不同于这里的序贯行动)。博弈的时间顺序如下:(1)企业1选择产量q1 0; (2)企业2观测到然后选择产量q2 0(3)企业1的收益由下面的利润函数给出：l 这里P(Q)=a-Q，是市场上的总产品Q=q1+q2时的市场出清价格，c是生产的边际成本，为一常数(固定成本为0)。l 为解出这一博弈的逆向归纳解，我们首先计算企业2对企业1任意产量的最优反应，R2(q1)应满足:l 对上面的通过求极值可得：l 已知q12-3p即p0.4的时候,警察最好选择巡逻;反之2p2-3p即p0即q0.33时，他的理性选择是作案，反之不作案。在这个博弈中，警察以0.33的概率巡逻0.67的概率休息，犯罪者以0.4 的概率作案0.6的概率不作案构成一个混合纳什均衡。上述混合纳什均衡可以这样理解，如果警察以高于0.33的概率巡逻，犯罪者最好是躲避起来。犯罪者一旦躲避，警察就没有收获，于是降低巡逻的概率，于是犯罪者重新活跃，于是警察又提高巡逻概率从一个长期来看，两者的均衡将维持在警察以0.33的概率巡逻犯罪者以0.4的概率作案上面。现实中，我们看到，当严打的时候（警察出击的概率较高），犯罪分子便收敛一阵（降低作案概率）；严打的时期一过，犯罪分子又开始兴风作浪，在不能容忍罪犯过分猖狂的时候，警界不得不再次开始严打。在上述例子中，可能大家觉得警察和犯罪者都根据一定概率采取自己的行动不太好理解，那么可以尝试这样理解他们：作案的犯罪者越多，那么出动的警察将会越多，作案的犯罪者越少，出动的警察将越少；反过来，出动的警察越多，作案的犯罪者就越少，出动的警察越少，作案的犯罪者就越多。极端地假设一个例子（它有助于我们的理解），警局有100名警察，犯罪集团有100名犯罪者，那么上例博弈中，警察以0.33的概率巡逻而犯罪者以0.4 的概率作案这一纳什均衡可以理解为：在巡逻的警察少于33人时，犯罪集团最好派40名以上的犯罪者作案；在巡逻警察多于33人时，犯罪集团最好派40名以下的犯罪者作案；反过来，犯罪集团派40名以下犯罪者作案，警局最优选择出动33名以下的警察；犯罪集团派40名以上犯罪者作案，警局最优选择出动33名以上的警察。当然，如果犯罪集团倾巢出动，那么警察的选择也是全部出动，但警察一旦全部出动，犯罪者最好选择全部不作案，犯罪者一旦选择全部不作案，警察最好全部选择休息最后长期的均衡状态是，警局派33名警察巡逻，犯罪集团派40个人作案。这可以解释现实中，为什么警界总安排有巡逻力量，而犯罪者也总保持一定的作案数量。总之，这种警察和犯罪者的博弈所揭示出：加重对罪犯的处罚在长期中并不能抑制犯罪（而只能使警察偷懒）；加重处罚失职警察恰恰是会降低犯罪发生的概率。这种警察和犯罪者的博弈所揭示的，政策目标和政策结果之间的这种意外关系，常被称为“激励的悖论”。判断题（每小题1分，共15分）囚徒困境说明个人的理性选择不一定是集体的理性选择。（）子博弈精炼纳什均衡不是一个纳什均衡。（）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（）纳什均衡一定是上策均衡。（）上策均衡一定是纳什均衡。（）在一个博弈中只可能存在一个纳什均衡。（）在一个博弈中博弈方可以有很多个。（）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（）在博弈中纳什均衡是

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论复习题及答案

文档简介

温馨提示

最新文档

评论

博弈论复习题及答案

文档简介

温馨提示

最新文档

评论

相关文档