西方经济学(微观部分)第八章博弈论初步.ppt_第1页
西方经济学(微观部分)第八章博弈论初步.ppt_第2页
西方经济学(微观部分)第八章博弈论初步.ppt_第3页
西方经济学(微观部分)第八章博弈论初步.ppt_第4页
西方经济学(微观部分)第八章博弈论初步.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高等院校经济学专业“十二五”规划教材,西方经济学 (微观部分,主编 张玉明 聂艳华,对外经济贸易大学出版社,第八章 博弈论初步,8.1本章框架结构图 博弈论在20世纪50年代由数学家约翰冯诺依曼(Von Neumann)和经济学家奥斯卡摩根斯坦(Morgenstern)引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的发展作出了重要贡献,学习目的,1掌握博弈的基本含义及其分类。 2. 掌握囚徒的困境博弈的意义。 3.掌握严格下策反复消去法的分析思路;掌握纳什均衡的定义及其无限策略博弈和混合策略博弈中纳什均衡的解。 4.了解重复博弈中有限次重复博弈与无限次重复博弈

2、概念及意义,主要内容,第一节 博弈论概述 第二节 囚徒的困境 第三节 纳什均衡 第四节 重复博弈,博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。 1博弈参与人 参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与人既可以是个人,也可以是团体(企业或国家)。每个参与人的目标是通过选择行动使自己的效用最大化。 2策略 策略是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保

3、证自身利益最大化,一、博弈论的几个基本概念,第一节 博弈论概述,3支付函数 支付函数也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。 4支付矩阵 参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。 其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。表10-1即为一个支付矩阵。 表8-1支付矩阵,第一节 博弈论概述,二、同时博弈:纯策略均衡,同时博弈”是参与人同时进行决策或行动的博弈。在同时博弈中,在给定其他参与人的策略时,某个参与

4、人的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。 1占优策略 在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。也就是说,无论其他参与人采取什么策略,该参与人的最优策略是惟一的,这样的策略称之为占优策略。如表10-2所示,通过对支付矩阵的分析可以看出,如果A、B两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。这种策略均衡称之为占优策略均衡(equilibrium in dominant strat

5、egies)。 表8-2广告博弈的支付矩阵,第二节纳什均衡,并不是每个博弈的各个参与人都有一个占优策略。如表10-3所示,通过对支付矩阵的分析可以看出,现在厂商A没有占优策略,它的最优决策取决于厂商B的选择。如果厂商B做广告,则厂商A最好也做广告;但如果厂商B不做广告,厂商A不做广告又是最好的选择。这种均衡就是纳什均衡(Nash equilibrium)。所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。 表8-3广告博弈的支付矩阵,3纳什

6、均衡与占优策略均衡的区别,每一个占优策略均衡一定是纳什均衡,但并非每一个纳什均衡都是占优策略均衡。纳什均衡是有条件的占优策略均衡。 一个博弈可能存在一个以上的纳什均衡,但是一个博弈也可能不存在纯策略纳什均衡,如表8-4所示,表8-4没有纳什均衡的同时博弈,例题1,例8.1】下列说法错误的是()。 A占优策略均衡一定是纳什均衡 B纳什均衡不一定是占优策略均衡 C占优策略均衡中,每个参与者都是在针对其他参与者的某个特定策略而做出最优反应 D纳什均衡中,每个参与者都是在针对其他参与者的最优反应策略而做出最优反应 【答案】C 【解析】占优策略均衡中,不论其他参与者采取何种策略,每个参与者都会选择其自身

7、的最优策略,4寻找纳什均衡的方法条件策略下划线法,对于一个简单的“二人同时博弈”,可以用一个以二元数组为元素的支付矩阵来表示,并用“条件策略下划线法”来确定它的纳什均衡。具体步骤如下: (1)把整个博弈的支付矩阵分解为两个参与人的支付矩阵。 (2)在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线。 (3)在第二个(即位于整个博弈矩阵上方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线。 (4)将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵。 (5)在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合

8、。由该支付组合代表的策略组合就是博弈的纳什均衡,例题2,例8.2】考虑两寡头厂商A和B的如下支付矩阵,二者的(纳什)均衡策略组合为()。 A(U,L)B(D,R) C(U,R)D(D,L) 【答案】B 【解析】在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略如果其他参与者均不改变各自的最优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,当B选择U时,A会选择R,因为 ;当B选择D时,A会选择R,因为 。当A选择L时,B会选择U,因为 ;当A选择R时,B会选择D,因为 。因此,依据纳什均衡定义,可知 是纳什均衡,第三节囚徒困境,囚徒困境

9、的博弈模型的假设条件是:甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获,但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。警方向这两个嫌疑犯交待的量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两人都坦白,则每人都各判刑5年。如果两个都不坦白,则警方由于证据不足,只能对每个人各判刑2年。表8-6的支付矩阵描述了这一博弈。表中的报酬均为负数,以表示判刑的年数,表8-6囚徒困境,通过分析可以看出,囚徒困境的博弈有一个占优策略均衡(坦白、坦白)。但是,如果两人都是选择不坦白(即合作),则都可以获得最好的结局

10、。很清楚,囚徒困境的占优策略均衡反映了一个矛盾:即个人理性和团体理性的冲突,第三节囚徒困境,同时博弈:混合策略均衡,并不是所有的博弈都存在纳什均衡。比如,如表8-7所示。这博弈就不存在纯策略纳什均衡,但却存在混合策略纳什均衡。混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率,表8-7社会福利博弈,同时博弈:混合策略均衡,所有参与人的混合策略的组合构成“混合策略组合”。混合策略组合与参与人的支付的乘积之和为参与人的期望支付。当其他参与人的混合策略确定之后,某个参与人选择的可以使自己的期望支付达到最大的混合策略是该参与人的

11、条件混合策略(其几何表示为“条件混合策略曲线”)。不同参与人的条件混合策略曲线的“交点”就是混合策略条件下的纳什均衡。可以证明,混合策略均衡总是存在的,例8.3】在一条狭窄巷子里,两个年青人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去”或者选择“避让”。如果选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一个人采取“冲过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36。这个博弈有两个纯策略纳什均衡和()。 A一个混合策略纳什均衡,即两人都以80%概率选择“避让”,以20%的概率选择“冲过去” B两个混合策略纳什均衡,即

12、每个青年人轮流采取避让或者冲过去 C一个混合策略纳什均衡,即一人以80的概率选择“避让”,另一人以20的概率选择“冲过去” D一个混合策略纳什均衡,即两人都以40的概率选择“避让”,以60的概率选择“冲过去,例子3,例题3,答案】A 【解析】根据题中条件可写出两人的收益矩阵,如表8-8所示。 表8-8两人的收益矩阵 从收益矩阵可看出,这个博弈有两个纯策略纳什均衡(冲过去,避让),(避让,冲过去)。设甲选择冲过去的概率为r,乙选择冲过去的概率为c。对于甲来说,应该使冲过去的期望收益等于避让的期望收益,即 ,解得r=0.2;对于乙来说,也应该使其冲过去的期望收益等于避让的期望收益,即 ,解得c=0

13、.2 。所以,存在一个混合策略纳什均衡,第四节序贯博弈,序贯博弈”是参与人的决策和行动有先有后的博弈。描述序贯博弈的更加方便也更加自然的工具是“博弈树”。博弈树由“点”(包括“起点”、“中间点”、“终点”)、连接点的“线段”以及标在这些点和线段旁边的文字和数字组成。在博弈树中,一个纳什均衡代表一条均衡的路径。在该均衡路径上,没有哪个参与人愿意单独改变自己的策略,图8-1博弈树,在序贯博弈中,可能存在多个纳什均衡的情况。在多个纳什均衡中,有些可能并不合理。所谓对纳什均衡的“精炼”,就是要从众多的纳什均衡中进一步确定“更好”的纳什均衡。纳什均衡的精炼方法通常是使用所谓的“逆向归纳法”,具体包括以下

14、两个步骤: 第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈。 第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解;而在存在多重纳什均衡时,它就是对纳什均衡的精炼,第四节序贯博弈,例题4,例8.4】在下面的博弈树中,确定纳什均衡和逆向归纳策略,例题4,答:纳什均衡是(决策1,决策3)、逆向归纳策略也是(决策1,决策3)。分析如下: (1)(决策1,决策3)是一个纳什均衡。在该策略组合上,没有哪个参与人愿意单独改变自己的策略。首先,参与人B不会单独改变自己

15、的策略。如果它单独改变策略,即将原来的决策3变为决策4,参与人B的支付将从原来的3下降到0。其次,参与人A也不会单独改变自己的策略。如果它单独改变策略,即将原来的决策1变为决策2,则策略组合就成为(决策2,决策3),参与人A的支付将从原来的1下降到0。 (2)采用逆向归纳法,可以判断出逆向归纳策略也是(决策1,决策3)。首先,如果参与人A选择决策1,参与人B肯定不会选择决策4。另一方面,如果参与人A选择决策2,参与人B肯定不会选择决策4。在此情况下,考察参与人A的选择。由博弈树可以看出,参与人A的最优选择是决策1。最终结果是,参与人A选择决策1,参与人B选择决策3,即最优策略组合为(决策1,决

16、策3,一、名词解释 1纳什均衡(Nash equilibrium)浙江大学2005研;厦门大学2006、2008研;中南财经政法大学2007、2009研;财政部财政科学研究所2008研;西安交通大学2009研 答:纳什均衡(Nash Equilibrium)又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰纳什的名字命名。 纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。

17、与其相联系的一个概念是占优策略均衡。占优策略均衡指这样一种均衡,不管其对手采取什么策略,该竞争者采取的策略都是最优策略。纳什均衡指每一个竞赛者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。占优均衡是一种纳什均衡。占优均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解,名校考研真题详解,2混合策略北京交通大学2004研;东北大学2007研;华中科技大学2008研 答:混合策略是指在博弈中,博弈方的决策内容不是确定性的具体的策略,而是在一些策略中随机选择的概率分别的策略。混合策略情况下的决策原则有以下两个: (1)博弈参与者互相不让对方知道或猜到自己的选择,因而必须在决策时利用随机

18、性来选择策略,避免任何有规律性的选择。 (2)博弈参与者选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性倾向的某一种策略而在博弈中占上风,名校考研真题详解,二、简答题 1说明纳什均衡与纳什定理的基本概念。南开大学2005研 答:(1)纳什均衡是指这样一种策略集,在这一策略集中,任何一个博弈者在其他参与者的策略给定的条件下,其选择的策略是最优的。所以,给定其他人的策略,任何个人都没有积极性去选择其他策略,从而这个均衡没有人有积极性去打破。 (2)纳什定理的含义是:对于任何一个 个人参与的非合作博弈(零和或非零和博弈),如果每个参与者都只有有限策略,那么一定存在至少一个纳什均衡

19、解,名校考研真题详解,2表8-9为两竞争对手的博弈结果矩阵: 表8-9两竞争对手的博弈结果矩阵 请问:什么是纳什均衡?求出该博弈的所有可能的纳什均衡,利用图形说明求出的纳什均衡的意义。中山大学2010研,名校考研真题详解,名校考研真题详解,答:纳什均衡又称为非合作博弈均衡,指如果其他参与人不改变自己的策略,任何一个参与人都不会改变自己策略的均衡状态。即如果给定参与人B的选择,参与人A的选择是最优的,并且给定参与人A的选择,参与人B的选择也是最优的。那么,这样一组策略就是一个纳什均衡,即给定其他人的选择,每个参与人都作出了最优的选择。 从表8-10该博弈结果矩阵可知存在两个可能的纳什均衡:两竞争

20、对手均奋争,两竞争对手均妥协。 不论A、B均奋争还是均妥协,总的博弈效果是产生了3个效用,与一方奋争另一方妥协效用大。 表8-10博弈状态及其效用值 从表8-10可以看出,两竞争对手均奋争和两竞争对手均妥协都是纳什均衡解,并且带来的总效用一样,三、计算题 1甲、乙两个学生决定是否打扫宿舍。无论对方是否参与,每个参与人的打扫成本都是8;而每个人从打扫中的获益则是5乘以参与人数。 (1)请用一个博弈简单描述上述情景。 (2)找出该博弈的所有纳什均衡。中山大学2010研 解:(1)共有以下四种情况: 当甲乙都参与时,每个人的收益均为5 2-8=2。 当甲参与乙不参与时,甲收益为5 1-8=-3 ,乙

21、收益为5 1-0=5 。 当甲不参与乙参与时,甲收益为5 1-0=5 ,乙收益为5 1-8=-3 。 当甲乙都不参与时,每个人的收益均为0,名校考研真题详解,名校考研真题详解,具体博弈矩阵如表8-11所示: 表8-11博弈的收益矩阵 (2)从表8-11中可以看出,该博弈的纳什均衡是甲不参与乙也不参与,这一均衡解也是占优策略均衡。从参与人甲的角度看,不论参与人乙参与不参与打扫宿舍,不参与打扫宿舍都是参与人甲的较好的选择。同样的情形,从参与人乙的角度看,不参与打扫宿舍也是参与人乙的较好的选择。所以,这是一个占优策略均衡,即双方都没有动力去改变这一局面,最后谁都不去打扫宿舍。 可以看出,如果甲乙两人

22、都参与打扫宿舍,则他们的境况就要比在其他选择下更好一些。(参与,参与)是帕累托有效率的策略组合,而(不参与,不参与)则是帕累托低效率的策略组合。双方从自己的理性出发的最优策略,从社会看来是最糟糕的策略,名校考研真题详解,2假定一寡头市场有A、B两个厂商计划推出新产品,有两种产品可供选择:一为高品质产品H,另一为低品质产品L,如果这两个厂商采取的策略与其利润的关系为: 式中每格前一数字为A利润,第二数字为B利润。 (1)若这两个厂商同时决定新产品,它们利润会是多少? (2)若A先推出新产品,然后B推出新产品,它们的利润各为多少?若B先推出呢?上海交通大学2007研 解:(1)若这两个厂商同时推出

23、新产品,则A推出L时,B必选H,但B选H时,A不会选L而要选H。因此,(L,H)不是均衡。如果A选H时,B必须H,因为如选L,利润只有10,因此,(H,H)会是一个纳什均衡。当A、B两个厂商都选择高品质产品H时,这两个厂商都将获得的利润为20,名校考研真题详解,2)若A先推出新产品,然后B再推出新产品,则会形成一个动态博弈。此博弈序列将呈现如图8-2的博弈树形状。 图8-2动态博弈 从图8-2可见,A先推出新产品的话,肯定选择高品质产品H,于是B只能选择高品质产品H。可见,这时A的利润是20,B的利润也是20。 若B先推出新产品,然后A再推出新产品,则此博弈序列将呈现如图8-3的博弈树形状。

24、图8-3动态博弈 从图8-3可见,B先推出新产品的话,肯定选择高品质产品H,于是A只能选择高品质产品H。可见,这时A的利润是20,B的利润也是20,本 章 小 结,1)博弈论是描述和研究经济行为者之间策略相互依存和相互作用的一种决策理论。一个博弈包含四个关键方面:博弈的参加者即博弈方、各博弈方的策略或行为、博弈的次序、博弈方的得益。 (2)博弈大致可进行如下分类:一是根据博弈方是否合作分为合作博弈和非合作博弈;二是在非合作博弈基础上,根据博弈方的理性和行为逻辑差别分为完全理性博弈和有限理性博弈;三是根据博弈过程可分为静态博弈、动态博弈和重复博弈,并在此基础上根据信息的完全完美与否分为: 完全信

25、息静态博弈和不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈。 (3)“囚徒的困境”从博弈中两个决策者的立场上来看该结局属于个人最优策略,但从整体来说却是最差的结果,即个体理性和团体理性发生冲突,使得该结果既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益。该博弈的重要意义在于类似的情况会发生在社会经济活动中,因而该博弈具有很大的普遍性。 (4)严格下策反复消去法是建立在理性的博弈方不会选择严格下策这一原则上。它有两点不足:第一,每一步消去都需要更进一步假定博弈方之间是相互了解的,扩展到任意多步,需要假定“博弈方是理性的”是共同知识。第二,当不存在严格下策的博弈,则无法用该法进行分析,或者在策略数较多的博弈中,当该法只能消去其中的部分策略时,这时严格下策反复消去法往往无法对博弈

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论