




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章,完全信息静态博弈,2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展,2.1基本分析思路和方法,2.1.1上策均衡上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略囚徒的困境中的“坦白”;双寡头削价中“低价”。上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果上策均衡不是普遍存在的(上策均衡在博弈分析中作用的局限性,说明必须发展更强的,更有效的博弈分析概念和分析方法),-5,-5,0,-8,-8,0,-1,-1,坦白,不坦白,坦白,不坦白,两个罪犯的支付矩阵(PayoffMatrix),囚徒2,囚徒1,2.1.2严格下策反复消去法严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。应用:,博弈的解为(上,中),不是原博弈的上策均衡。,严格下策反复消去法的适用范围比上策均衡分析更大一些。但有许多博弈如猜硬币、齐威王田忌赛马等赌胜博弈没有任何方的任何策略是相对其他策略的严格下策。,2.1.3划线法通过在每个博弈方对其他博弈方每个策略或策略组合的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”。,左,中,右,上,下,一对夫妻得到了两张时装表演票和同一时间的两张足球比赛票,妻子更想去看时装表演而丈夫更想去看足球,但又不愿或不能分头行动,争执不下就决定双方投票一次决定。,时装,时装,足球,足球,两个策略组合中哪个出现都是合理的,博弈方1,博弈方2,没有可以预言的博弈结果,2.3.2箭头法对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后策略组合对应的得益数组,最后只有指向箭头而没有指离箭头的得益数组为博弈解。,箭头法与划线法是不同的,但两者都是基于策略之间相对优劣关系进行分析的,得到的结论也都是一致的,因此这是两种可以相互替代的方法。,2.2纳什均衡,2.2.1纳什均衡的定义策略空间:Si,Sn博弈方i的第j个策略:sijSi博弈方i的得益:ui博弈:G=S1,Sn;u1,un定义:在博弈G=S1,Sn;u1,un中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,si-1*,si+1*,sn*)的最佳对策,也即ui(s1*,si-1*,si*,si+1*,sn*)ui(s1*,si-1*,sij,si+1*,sn*)对任意sijSi都成立,则称(s1*,sn*)为的一个”纳什均衡”(NashEquilibrium)。,投票博弈,三个参与人1,2,3,有三种方案A、B和C。参与人通过投票的方式决定采用哪个方案;不允许弃权。如果没有方案能获得多数,则采用方案A。收益函数为u1(A)=u2(B)=u3(C)=2u1(B)=u2(C)=u3(A)=1u1(C)=u2(A)=u3(B)=0请分析这个博弈的纳什均衡。,投票博弈,分析方法,A,B,B,2,0,1,2,0,1,1,2,0,2,0,1,参与人1,参与人2,A,C,C,2,0,1,2,0,1,2,0,1,2,0,1,0,1,2,参与人3-A,投票博弈,A,B,B,1,2,0,1,2,0,1,2,0,2,0,1,参与人1,参与人2,A,C,C,2,0,1,1,2,0,2,0,1,1,2,0,0,1,2,参与人3-B,投票博弈,A,B,B,2,0,1,2,0,1,1,2,0,2,0,1,参与人1,参与人2,A,C,C,0,1,2,0,1,2,0,1,2,0,1,2,0,1,2,参与人3-C,投票博弈,分析方法,A,B,B,2,0,1,2,0,1,1,2,0,2,0,1,参与人1,参与人2,A,C,C,2,0,1,2,0,1,2,0,1,2,0,1,0,1,2,参与人3-A,(A,A,A)(A,B,A),投票博弈,A,B,B,1,2,0,1,2,0,1,2,0,2,0,1,参与人1,参与人2,A,C,C,2,0,1,1,2,0,2,0,1,1,2,0,0,1,2,参与人3-B,(B,B,B),投票博弈,A,B,B,2,0,1,2,0,1,1,2,0,2,0,1,参与人1,参与人2,A,C,C,0,1,2,0,1,2,0,1,2,0,1,2,0,1,2,参与人3-C,(A,C,C)(C,C,C),智猪博弈,猪圈里圈养两头猪,一头大、一头小。猪圈的一端有一个猪食槽,另一头安装一个按钮,控制着猪食的供应,按一下按钮会有10个单位的猪食进槽,但谁按按钮就需要付出2个单位的成本且比对方晚到食槽。若大猪先到食槽,大猪吃9的单位,小猪只能吃一个单位;若同时到,大猪吃7个单位小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。(1)试给出上述博弈的矩阵式描述。(2)求解该博弈的纯策略纳什均衡。(3)举例说明该博弈的纳什均衡结果。,解例1,解(1)支付矩阵如下:,(2)根据划线法得纯策略纳什均衡为(按,等待)。(3)略,2.2.2纳什均衡的一致预测性质,如果一个博弈的所有博弈方都预测博弈结果是某个纳什均衡,那么由于纳什策略均衡组合中各博弈方的策略都是对其它博弈方策略、策略组合的最佳对策,因此任一博弈方都不会单独改变策略,因此博弈的结果会成为博弈的最终结果。这说明一个纳什均衡作为各个博弈方的共同预测时,一定是一致预测。反过来每个博弈方都预测某个策略组合将是博弈的结果时,都会主动坚持该策略组合中的策略,而不想采取与预测不一致的策略,则说明该策略组合中每个博弈方的策略都是对其他博弈方策略的最佳反应。(每个博弈方自己的策略选择与自己的预测一致,不是指各个博弈方有一致的预测。),”一致预测性“:如果所有博弈方都预测一个特定的结果会出现,那么所有博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终会成为博弈的结果。,性质:各博弈方可以预测它,可以预测他们的对手会预测它,还可以预测他们的对手会预测自己会预测它。,“斗鸡博弈”,两个所谓的勇士举着长枪,准备从独木桥的两端上桥中央进行决斗。每位勇士都有两种选择:冲上去(用U表示)或退下来(用D)表示。若两人都冲上去,则两败俱伤;若一方上去而另一方退下来,冲上去者获得胜利,退下来的丢了面子;若两人都退下来,两人都丢面子。,U,U,D,D,参与人1,参与人2,两个Nash(U,D)和(D,U),当一个理性的人预测到对方将会冲上去时,明智的选择就是退下来,可以将Nash均衡作为“斗鸡博弈”的一致性预测,如果参与人预测(U,U)会出现,那么在行动时他不会选择U,因为相对于选择U实现预测的结果,参与人选择D可以使自己的得益变好,从而导致预测的行动和实际的行动不符。,2.2.3纳什均衡与严格下策反复消去法上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡命题2.1:在n个博弈方的博弈G=S1,Sn,u1,un中,如果严格下策反复消去法排除了除(s1*,sn*)之外的所有策略组合,那么(s1*,sn*)一定是该博弈的唯一的纳什均衡.命题2.2:在n个博弈方的博弈中G=S1,Sn;u1,un)中,如果(s1*,sn*)是G的一个纳什均衡,那么严格下策反复消去法一定不会将它消去.,举例,有两个候选人,在10个立场中进行选择,选民立场均匀分布,每个立场都得到10%的选票,选民会投给离自己最近的候选人,出现平局票数平分。,2.3无限策略博弈和反应函数,划线法和箭头法法是找纳什均衡的方法,但它们的适用范围只是通过策略之间的两两比较进行分析的有限策略博弈,而对无限策略博弈是不适用的。OPEC产量博弈我国钢铁企业限产计划彩电行业价格联盟黄金珠宝行业协会价格联盟,2.3.1古诺的寡头模型P59,纳什均衡是指两博弈方的一个策略组合(q1,q2)满足其中的q1和q2相互是对对方的最佳对策。怎样才能找出这个博弈的纳什均衡策略组合?,2.3.2反应函数,对于厂商2的每个可能的产量,厂商1的最佳产量,我们称这个连续函数为厂商1对厂商2的一个“反应函数”。,解方程得:策略组合(2,2)是本博弈唯一的纳什均衡。最终市场总产量为:2+2=4市场价格为:8-4=4双方各自得利润为:2(8-4)-22=4两厂商的利润总和为4+4=8,反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反应决策构成的函数。,3,3,6,6,1.5,1.5,q1,q2,NE,2,2,R2(q1),R1(q2),与联合定产比较:以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5,以自身最大利益为目标:各生产2单位产量,各自得益为4,从两厂商总体利益最大化的角度作一次产量选择。首先根据市场条件求总体利益最大化的产量。设总产量为Q,则总得益为U=P(Q)-cQ=Q(8-Q)-2Q=6Q-Q2使总得益最大的总产量Q=3总得益u=9,2.3.3伯特兰德(Bertrand)寡头模型(1883年)P64,在寡头市场,企业更多关心的是自己产品市场的价格,价格竞争寡头的博弈模型。Bertrand模型产品有一定差别,产品之间有很强的替代性,直接用反应函数法分析这个博弈,求两厂商对对方策略的反应函数,反应函数为:,纳什均衡(P1*,P2*),2.3.4公共资源问题P65,随着社会经济的不断发展,我们越来越无法回避公共资源利用、公共设施提供和公共环境保护等方面的间题。而在这些问题中,也包含了众多的博弈关系。我们以人们对公共资源利用方面的博弈关系为例来作一些讨论。,在经济学中,所谓公共资源是指具有(1)没有哪个个人、企业或组织拥有所有权;(2)大家都可以自由利用,这样两个特征的自然资源或人类生产的供大众免费使用的设施和财货。,例如大家都可以开采使用的地下水,可自由放牧的草地,可自由排放废水的公共河道(假设政府未予限制),以及公共道路、楼道的照明灯等。,由于公共资源有上述两个特征,因而利用这些资源时不支付任何代价,除非政府将这些资源收归国有,并对使用者征收资源税或收取类似的费用。,从休漠1739年开始,政治经济学者们就己经开始认识到,在人们完全从自利动机出发自由利用公共资源时,公共资源倾向于被过度利用、低效率使用和浪费,并且过度利用会达到任何利用它们的人都无法得到实际好处的程度。,设某村庄有n个农户,该村有一片大家都可以自由放牧羊群的公共草地。由于这片草地的面积有限,因此只能让不超过某一数量的羊群吃饱,如果在这片草地上放牧羊只的实际数量超过这个限度,则每只羊都无法吃饱,从而每只羊的产出(毛、皮、肉的总价值)就会减少,甚至只能勉强存活或要饿死。,假设这些农户在夏天才到公共草地放羊,而每年春天就要决定养羊的数量,因此可看作各农户在决定自己的养羊数量时是不知道其他农户养羊数的,即各农户决定养羊数的决策是同时作出的。,再假设所有农户都清楚这片公共草地最多能养多少只羊和在羊只总数的不同水平下每只羊的产出。这就构成了n个农户之间关于养羊数的一个博弈问题,并且是一个静态博弈。,在此博弈中,博弈方就是n个农户;他们各自的策略空间就是他们可能选择的养羊数目qi(i=1,2,n)的取值范围。,当各农户养羊数为q1、q2、qn时,在公共草地上放牧羊只的总数为Qq1q2qn,根据前面的介绍,每只羊的产出应是羊群总数Q的减函数VV(Q)V(q1、q2、qn)。假设购买和照料每只羊的成本对每个农户都是相同的不变常数c,则农户i养qi只羊的得益函数为:,2.3.4公共资源问题P65,n=3,c=4,农户各自利益最大化,农户总体利益最大化,人们完全从自利动机出发自由利用资源时,公共资源被倾向于过度利用、低效率使用和浪费。,三个反应函数,纳什均衡解为:,总体利益最大化的养羊数为Q=48总得益U=2304比三农户得益的总和1728=3576大许多。,2.4混合策略和混合策略纳什均衡P70,2.4.1严格竞争博弈和混合策略的引进该博弈没有纳什策略组合,并不意味着可以选择任何策略组合都是一样的。,取胜关键:不能让另一方猜到自己的策略尽可能猜出对方策略,当两个博弈方都以1/2的相同概率选择正面、反面时,双方都无法根据对方的选择方式,选择或调整自己的策略或选择方式获得利益,从而双方对两种可选策略随机选择概率分布的意义上达到了一种稳定(均衡)。,2.3.5反应函数的问题和局限性,1、在博弈方的策略有限而不是很多,更不是连续时,无法用先求导找出各博弈方的反应函数,再求纳什均衡。,2、各博弈方的得益函数比较复杂,并不能总是保证各博弈方的反应函数有交点,混合策略:,在博弈中,博弈方的策略空间为,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且,混合战略纳什均衡在n个参与人博弈的战略式表述G=S1,,Sn;u1,un中,混合策略组合p*=(p*1,p*n)是一个纳什均衡,如果对于所有的i=1,n,下式成立:vi(p*i,p*-i)vi(pi,p*-i),pii在此,vi(pi,p-i)=(pj(sj)ui(s),参与人只能把注意力集中于期望效用:ui=Vi(s1j,s2k)。,令p1=(p11,p1J)为参与人1的概率分布,p2=(p21,p2K)为参与人2的概率分布。,参与人1推测到参与人2将以p2在s21,s2K上选择,那么自己选择纯策略s1j的期望支付是,V1(s1j)=p2kui(s1j,s2k),策略得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6,是否有混合策略纳什均衡?决策的原则:(1)在决策时利用随机性;(2)他们选择每种策略的概率一定要恰好使对方无机可乘。,博弈方1、2的混合策略,根据上述原则,博弈方1选A和B的概率为pA,pB,一定要使博弈方2选C的期望得益和选D的期望得益相等,即pA3+pB1=pA2+pB5pA=0.8pB=0.2,田忌赛马P75,abcdef,ghIjkl,齐威王的混合策略为:,齐威王的期望得益为:1/6(3+1+1+1+1-1)=1,齐威王和田忌都以1/6的相同的概率随机选择各自的六个纯策略,田忌的期望得益为:1/6(-3-1-1+1-1-1)=-1,小偷和守卫的博弈P77,加重对守卫的处罚:短期效果是使守卫更尽职,但长期中并不是使守卫更尽职,而是会降低盗窃发生的概率。,小偷与守卫的博弈揭示的,政策目标和政策结果之间的这种意外关系,常被称作“激励的悖论”,小偷和守卫的博弈,加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,最终会使守卫睡觉的概率提高到,2.4.2多重均衡博弈和混合策略,夫妻之争的混合策略纳什均衡,策略期望得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.75,结论:混合策略明显不如夫妻双方能交流协商时,任何一方迁就另一方时双方的得益好,因为那时任何一方都至少得1。,制式问题P83,AB得益厂商1:0.40.60.664厂商2:0.670.331.296,市场机会博弈P83,进不进得益厂商1:2/31/30厂商2:2/31/30,2.4.3混合策略和严格下策反复消去法,与混合策略相比,D一定是博弈方1的严格下策,因此D可从博弈方1的策略空间中消去。,2.3.1混合策略反应函数,在混合策略范畴内,反应函数是一方对另一方的概率分布的反应。,设(r,1-r)是盖硬币方随机选择正反面的混合策略的概率分布,(q,1-q)是猜硬币方随机选择正反面的混合策略的概率分布,,盖硬币方的期望得益U盖(r,q)=-1rq+1r(1-q)+1(1-r)q+(-1)(1-r)(1-q)=2r(-2q+1)+2q-1,在猜硬币方的混合策略已设定为(q,1-q)盖硬币方的最佳反应为:当(-2q+1)0时,即q1/2,盖方把r选得越小越好,那就选r=0当(-2q+1)=0时,即q=1/2,盖方r在0,1随便选,r,0,0,1,1,=,q1/2,q=1/2,q1/3Q=1/3,q,=,1,0,1,0,r3/4,r=3/4,3/4,1/3,1,1,r=R(q),q=R(r),q,r,两博弈方有三个交点(0,0),(1,1)为两个纯策略纳什均衡,交点(1/3,3/4),对应妻子以(3/4,1/4)选择时装和足球,丈夫以(1/3,2/3)概率选择时装和足球。,(r,1-r):妻子的混合策略概率分布期望得益为:U(r,q)=r(3q-1)+1-q,如果在局中人的策略多于两个情形,我们很难把局中人的反应函数作为曲线在图中画出来。,解决高维问题的另一种思路是“代数”方法。按照一阶条件导出每个局中人的最优反应函数,然后解方程组,寻求纳什均衡的“必要解”,然后根据二阶条件、边界条件或者问题的经济约束筛选出博弈的纳什均衡。,2.5纳什均衡的存在性,纳什定理:在一个由n个博弈方的博弈中,如果n是有限的,且都是有限集(对),则该博弈至少存在一个纳什均衡,但可能包含混合策略教材106页证明:布鲁威尔和角谷的不动点定点定理。意义:一般分析概念的依据。奇数定理:几乎所有有限同时博弈的纳什均衡的数目有限,并且是奇数。,2.6纳什均衡的选择和分析方法扩展,2.6.1多重纳什均衡博弈的分析帕累托上策均衡风险上策均衡聚点均衡相关均衡,帕累托上策均衡(鹰鸽博弈)有些博弈存在多个纳什均衡,但这些纳什均衡之间存在明显的优劣差异,造成所有局中人都偏好同一个纳什均衡的可能。一种情况是,博弈的某一个纳什均衡给所有局中人带来的得益,都大于其他纳什均衡给他们带来的得益。在这种情况下,每个局中人不仅自己会选择由该纳什均衡所规定的策略,而且会预料所有其他局中人也会选择由该纳什均衡所规定的策略,因而该纳什均衡就最有可能成为博弈的最终结果。,风险上策均衡筛选多个纳什均衡的另一种方法,是风险优势比较法,它的基本思路是如果按照帕累托优势标准不能确定哪一个纳什均衡时,可以考虑不同纳什均衡之间的风险状况,风险小的优先。,偏离损失比较法求风险上策均衡,如上图:有两个纳什均衡A=(上,左)和B=(下,右)如果甲从A偏离出去,则损失1,记为“甲离A损失为1”乙从A偏离出去,则损失1,记为“乙离A损失为1”如果甲从B偏离出去,则损失7,记为“甲离B损失为7”乙从B偏离出去,则损失7,记为“乙
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年热切割技术实操考试题库及答案参考
- 2025年村级养老驿站营养知识考试模拟题及答案
- 2025年入门指南与模拟试题软件开发者面试准备全攻略
- 2025年地理信息系统GIS初级工程师模拟题及解析
- 制作课件一的教学反思
- 7的分成减法教学课件
- 2025年初级律师助理面试必-备题库及解析
- 2025年安徽省安庆市大观区中考化学临考模拟试卷-
- 2025年物资储备管理局招聘考试必-备知识点梳理
- 2025年初级国际贸易实务模拟题解析
- 2025至2030中国萤石市场供给前景预测及发展战略规划研究报告
- 完工清账协议书格式模板
- 小学生地质科普课件
- 私募股权融资流程与风险管理
- 云上贵州大数据集团笔试题目
- 施工合同赶工协议
- 2024-2025学年下学期高中化学人教版高二同步经典题精炼之有机物的合成(解答题)
- 《活在课堂里》读书分享
- DB1331T 063-2023雄安新区地埋管地源热泵系统工程技术规程
- 《突破式沟通技巧》培训课件:高效沟通赋能成长
- 中学学生会检查细则说明表格
评论
0/150
提交评论