经济学方法与博弈论讲义一.ppt_第1页
经济学方法与博弈论讲义一.ppt_第2页
经济学方法与博弈论讲义一.ppt_第3页
经济学方法与博弈论讲义一.ppt_第4页
经济学方法与博弈论讲义一.ppt_第5页
免费预览已结束,剩余95页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

经济理论与博弈论,邓大才dendacai.con(请不要将讲义放在网上),课程的安排,第一讲博弈论导论第二讲完全信息静态博弈第三讲完全信息动态博弈第四讲不完全信息静态博弈第五讲不完全信息动态博弈,博弈论教学参考书及建议阅读书目,教学参考书1、经济博弈论(第二版)谢识予编著,复旦大学出版社2、博弈论与信息经济学张维迎著,上海三联书店、上海人民出版社如果想进一步深入学习的学生建议阅读5、弗登博格,博弈论中国人民大学出版社6、冯诺依曼等,博弈论与经济行为,三联书店建议课外阅读(通俗读物):1、冲突的战略,谢林。2、博弈论:战略分析入门,机械工业出版社3、策略思维迪克西特著中国人民大学出版社4、新编博弈论平话王则柯著中信出版社5、博弈生存潘天群中央编译出版社,学习博弈论的两个网站,人大经济论坛(/bbs/index.asp?boardid=5)。中国经济学教育科研网(,第一讲博弈论导论,第一节博弈论与主流经济学的发展第二节什么是博弈及博弈论第三节博弈论的基本概念第四节博弈论的分类及典型的博弈案例,第一节博弈论与主流经济学的发展,经济学研究什么东西?从传统观点看:经济学是研究稀缺资源的有效配置的科学。从现代观点看:经济学是研究人的行为的科学,即研究“选择”。经济学研究行为与其他学科研究行为的区别?主要有两个方面:一是研究的顺序不同:经济学:从个人到社会(frommicrotomacro)社会学:从社会到个人(frommacrotomicro)心理学:用观察、实验的方法看人们实际上是怎么行为的。(行为科学)二是研究的假设不同:经济学假定人是理性的,在面临给定的约束条件下最大化自己的偏好。,什么是理性人?理性人是指有一个很好偏好的人,在面临给定的约束条件下最大化自己的偏好的人。区别理性人与自私人。(利已不害人、利已不自私)引申:君子爱财取之有道。什么是偏好呢?偏好是行为人的喜好。偏好有两个假设:完备性(completeness):任何两个可选择的方案之间都是可比较的;传递性(transitivity):(偏好具有一致性),如果如果AB,BC,则AC;,什么是约束条件呢?包括四个方面:技术性约束:如一天工作不能超过24小时;大飞机、航母的制造;制度性约束:如晚上12点必须熄灯;课程论文开学前三周交;经济性约束:一个月只有3000元的工资、一个月400元的生活费用信息性约束:如你并知道这门课有什么价值;对他人行为的预期。,传统经济学的假设及其局限性二个基本假设:完全竞争,完美信息。二个基本局限性:交易主体的数量有限;信息不对称。一般均衡理论是整个经济学的理论基石和道义基础。它假定:市场机制是完美的,帕累托最优成立,平等与效率可以兼顾。然而在以下一般均衡理论不成立:非完全竞争:垄断越来越普遍外部性:市场不可能把所有的成本收益都计算在内公共产品:市场无法解决“搭便车”问题逆向选择问题:柠檬市场道德风险问题:为什么市场的交易费用比较高?百年来,经济学的主要发展围绕以上五方面,如垄断竞争理论、产业组织理论、企业理论、信息经济学、新制度经济学、不确定下的决策(投资理论),宏观经济学,传统微观经济学与博弈论的比较传统微观经济学的个人决策是在给定一个价格参数和收入的条件下最大化自己的效用,个人的效用与其他人无涉,所有其他人的行为都被总结在“价格”参数之中。博弈论中,个人效用不仅依赖于自己的选择,还依赖于他人的选择,研究在存在外部经济条件下的个人选择问题。简言之:传统经济学是研究别人不变情况下的个人最优化行为。博弈论是研究别人变化情况下的个人最优化行为。经济学对博弈论寄予厚望,认为用博弈论可以重写经济学原理。博弈论改写经济学,从放宽新古典的完全竞争和完全信息两个条件展开。,博弈论进入主流经济学,反映在三个方面:经济学的研究对象越来越转向个体,放弃了一些没有微观基础的假设。经济学的研究对象越来越转向人与人之间行为的研究。经济学越来越重视对信息的研究。,博弈论已经改造了传统经济学。80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说是微观经济学的基础。博弈论与经济学形成了“你中有我,我中有你”的态势。不少赫赫有名的经济学就发迹于博弈论的研究。,博弈论和经济学诺贝尔奖,1994:非合作博弈:纳什(Nash)、海萨尼(Harsanyi)、塞尔顿(Selten)1996:不对称信息激励理论:莫里斯(Mirrlees)和维克瑞(Vickrey)2001:不完全信息市场博弈:阿克罗夫(Akerlof)(商品市场)、斯潘塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场)2002:实验经济学:史密斯(Smith),心理经济学:卡尼曼(Kahneman)2005:,第一节什么博弈及其博弈论,什么是博弈?军事方面:围魏救赵、远交近攻、借刀杀人、声东击西贸易方面:世贸谈判、广告大战、能源大战官僚政治方面:中央政府与地方政府、村庄与乡镇、农民与地主人生方面:人与人的关系、“三角恋”、“婚外情”、“河蚌相争,渔翁得利”其他的方面:如长沙市与武汉市、制度之间的竞争,博弈定义:决策主体互相对抗的一系列策略和行动的过程集合。参与人的利益有冲突。博弈是一个过程集合。(参与人、策略、行动、信息等。把博弈视为集合是思维从具体到抽象的重要一步)博弈的本质特征是策略的相互依存性。,什么是博弈论(gametheory),博弈论又称为对策论、游戏论。定义:研究决策主体相互作用时,人们如何进行决策、以及这种决策如何达到均衡。它是专门研究博弈如何出现均衡的规律的学问。博弈论是有关“互动行为”(interactivebehavior)的科学。,注意两点:1、它是两个或两个以上参与者之间的对策论2、两个假设:理性人假设、共同知识假设共同知识:是一个关于信息的概念。所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道的知识。,博弈论的理解,博弈论说起来有些绕嘴,但理解起来很好理解,决策及行动时:既要考虑自己的利益,也要考虑决策对其他的影响。通过选择最佳行动计划,寻求收益或效用的最大化,第二节博弈论的一些基本概念,2.1博弈论的基本概念参与人(players):博弈中决策主体的集合:什么人参与博弈?每个人是什么角色?行动(actions):每个人有些什么样行动可以选择?在什么时候行动?信息(information):在博弈中的知识;每个人知道些什么(包括特征、行动等)?战略(strategies):行动计划;每个人有什么战略可供选择?战略的完备性;,支付(payoffs):每个人在不同战略组合下得到些什么?依赖于所有参与人的选择;均衡(equilibrium):所有参与人最优战略的组合;结果(outcomes):我们所感兴趣的东西,即各种要素的集合,如均衡战略组合、均衡行动组合、均衡支付组合。,2.2博弈论的四大要素,参加者(Player)博弈方或者局在人策略(Strategies)或行为(Actions)博弈次序(Order)博弈得益(Payoffs),2.3博弈论的规则,规则必须说明四件事:“谁”(Who):谁在参与“什么”(What):以什么策略来参与。“何时”(When):什么时候行动“多少”(Howmuch):得到了多少,2.4博弈模型,模型表达式:GP,A,S,I,U一个博弈模型需要五方面内容组成:参与人、行动、结果、信息、得益P:为局中人,能够独立决策,独立承担责任的个人或组织,以最终实现自身利益最大化为目标。A:各局中人的所有可能的策略或行动的集合。分为有限博弈和无限博弈。S:博弈的进程或次序。分为静态博弈和动态博弈。,I:博弈信息,能够影响最后博弈结局的所有局中人的情报,可以分为完全信息和不完全信息。U:为局中人获得利益,也是博弈各方追求的最终目标。分为零和博弈、常和博弈和变和博弈。,2.5博弈论的表达形式,两种表达形式:战略式和展开式,也有人称为正则式或者展开式。下面是战略式表达式,又称标准式:囚徒A坦白抵赖,囚徒B,坦白,抵赖,抵赖,支付函数,行动,囚徒困境,展开式表达式:又称为博弈树,是由一个根和若干枝依次排列组成。,2.6博弈中的博弈方或者博弈者,博弈方:独立决策、独立承担博弈结果的个人或组织博弈者地位平等。不因各方之间权利、地位的差异而改变博弈者数量重要,对博弈结果和分析有影响。根据博弈者数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈,一、单人博弈只有一个博弈方的博弈,例一:单人迷宫,例二:运输路线,单人博弈实质个体最优化问题,二、两人博弈,两人博弈即有两个博弈者的博弈。两人博弈最常见,研究最多,是最基本和有用的博弈类型。囚徒困境、猜硬币、齐威王田忌赛马、猜拳等都是两人博弈。两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致。,三、多人博弈,三个博弈者之间的博弈。可能存在“破坏者”:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。申办奥运会是典型例子。多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法。如“小三问题”、“三角恋”,2.7博弈中的策略,策略:博弈者的选择内容。策略有定性和定量、简单和复杂之分。不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同。有限博弈:每个博弈方的策略数都是有限的。无限博弈:至少有某些博弈方的策略有无限多个。,2.8博弈中的得益,得益:博弈者从博弈中获得的利益,又称为支付函数。得益对应于博弈结果,也就是各博弈方策略的组合。得益是各博弈方追求的根本目标,是行为和判断的主要依据。根据得益的博弈分类:零和博弈、常和博弈、变和博弈。,零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同猜硬币,田忌赛马,石头-剪刀-布,猜拳常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系分配固定数额的奖金、利润,遗产官司变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。囚徒困境、产量博弈、制式问题等,2.9博弈者的能力和理性,完全理性和有限理性完全理性:有完美的分析判断能力、不会犯选择的错误。有限理性:博弈者的判断、选择能力有缺陷。个体理性和集体理性个体理性:以个体利益最大为目标。集体理性:追求集体利益最大化。合作博弈:允许存在有约束力协议的博弈,强调团体理性,强调效率、公正、公平。(深度解释什么要合作)非合作博弈:不允许存在有约束力协议的博弈,强调个人理性、个人最优决策,其结果可能有效率,也可能无效率。,第三节博弈论的分类,3.1根据博弈过程分类从参与人行动的先后顺序:静态博弈和动态博弈静态博弈:参与人同时选择行动,或非同时行动但后行动者并不知道前行动者采取了什么具体行动;田忌赛马、猜硬币、古诺模型动态博弈:参与人行动有先后顺序,且后行动者能够观察先行动者选择的行动。下棋、市场进入、领导追随型市场结构,重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能长期客户、长期合同、信誉问题有限次重复博弈无限次重复博弈,3.2.1根据信息结构的分类,从参与人对信息的了解看:完全信息博弈和不完全信息博弈,以对信息的了解为分类标准。完全信息博弈:博弈者完全了解所有博弈者在各种情况下的得益。不完全信息博弈:至少部分博弈者不完全了解其他博弈者得益的情况的博弈,也称为“不对称信息博弈”。,3.3.2根据博弈进程的分类,从参与人对博弈进程的了解来分类:完美信息博弈:选择行为的博弈方对博弈的进程完全了解的博弈。不完美信息博弈:至少某些博弈方在选择行动时不完全了解此前博弈进程的博弈。,博弈的划分:,第四节经典博弈案例,囚徒困境智猪博弈性别大战斗鸡博弈市场进入阻挠,案例1-囚徒困境-纳什均衡,囚徒的困境是图克(Tucker)1950年提出的。该博弈是博弈论最经典、最著名、最基础的博弈。该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷。它是实际生活中许多现象的一个抽象概括。,设定:(1)参与者都知道博弈规则、博弈结果;(2)参与者都是理性的(个人理性和个人最优决策);(3)不能“串通”。,囚徒A,囚徒B,坦白,抵赖,坦白,抵赖,-8大于-100大于-1,(坦白,坦白)是纳什均衡,尽管囚徒A不知囚徒B是否招供,但他认为自己选“坦白”最好,因而囚徒A会选择“坦白”,囚徒B也同样会选择“坦白”,结果各判8年;但若两人都不招,结果是两人只被判1年,但这种结果是不会出现的。,对囚徒A来说,尽管他不知道囚徒了B是选择了“坦白”还是“抵赖”,他发现他自己选择“坦白”都是比选择“抵赖”为好的。因此,“抵赖”是相对于“坦白”的劣战略,他不会选择劣战略。所以,甲会选择“坦白”。同样,根据对称性,乙也会选择“坦白”,结果是甲乙两人都“坦白”。参与者所选择的战略构成的组合(坦白,坦白)被称为博弈均衡。,纳什均衡的定义,定义:纳什均衡就是给定别人战略情况下,没有任何单个参与人有积极性选择其他战略,从而没有人有积极性打破这种均衡。简言之:“由所有参与人的最优战略组成的一个组合”。通俗地讲:如果别人不动,我也不能动。,囚徒困境二:河蚌相争,一只河蚌正张开壳晒太阳,不料,飞来了一只鸟,张嘴去啄他的肉,河蚌连忙合起两张壳,紧紧钳住鸟的嘴巴。鸟说:“今天不下雨,明天不下雨,就会有死蚌肉。”河蚌说:“今天不放你,名天不放你,就会有死鸟。”谁也不肯松口,有一个渔夫看见了,便过来把他们一起捉走了。蕴含的哲理:两强相斗必定双输,其他人得益。陈水扁挑衅两岸关系,囚徒困境三:OPEC限产,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。不可能有卡特尔合作成功吗?理论上,如果是无限期的合作,双方考虑长远利益,合作是会成功的。但只要是有限次的合作,就不会成功。比如合作次,那么在第九次博弈参与人就会采取不合作态度。蕴含的哲理:攻守同盟、价格同盟肯定不会成攻。为什么会有如此多的独角大侠,囚徒困境四:双寡头削价竞争,政府组织协调的必要性和重要性,寡头1:低价(70)寡头2:低价(70),厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。引伸出两个问题:一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局;二是价格大战必定是两败俱伤。,囚徒困境四:修路博弈,设想有两户相居为邻的农家,十分需要有一条好路从居住地通往公路。修一条路的成本:4。每个农家从修好的好路上获得的好处:3。如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处(支付)为3-4/2=1;如果只有一户人家单独出资修路时,修路的居民获得的支付为3-4=-1(亏损);“搭便车”、不出资,但可以使用修好的路的居民获得好处:3-0=3。,乙修不修修甲不修,我们看到,对甲和乙两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,私人一般没有积极性承担这方面服务的积极性和能力。政策启示:公共产品只能够政府提供。,囚徒困境五:禁鸣喇叭,禁鸣喇叭主要有两个方面的原因:一方面是为了控制城市噪声污染,另一方面是基于以下的博弈论原因。A、当汽车司机可以鸣喇叭时,可能为汽车超速抢行提供条件。1、但当大家都抢行时,城市交通拥挤加重,反而都难以顺利通行,获得低收益(2,2)。2、当对方缓行时,自己抢行会占便宜,获得好处为9,对方获得好处为1。3、当双方都缓行时,双方获得的好处为(8,8)。这个博弈中,“缓行”是劣战略,剔除后得到“剔除劣战略后的占优战略均衡”(抢行,抢行),这不是一个好的均衡。B、当禁止鸣喇叭时,司机为了避免造成交通事故,只得缓行,从而得到好的结果(缓行,缓行)。,交通博弈司机2缓行抢行缓行司机1抢行政策启示:政策也有好的,并非所有政策都坏事。人生启示:欲速则不达、心急吃不了热豆腐。,囚徒困境其他事例:军备竞赛。做广告。围观时踮脚尖。应试教育(比如小孩请家教)。污染。1968年,格雷特哈丁成功地将“囚徒的困境”与资源耗竭结合起来,揭示了生态环境问题与囚徒困境的相似之处。贸易自由与壁垒,地方保护主义(如武汉市禁售湖南烟)。,囚徒困境的性质:个人理性和集体理性的矛盾;个人的“最优策略”使整个“系统”处于不利的状态(如农业结构调整)。思考:为什么会造成囚徒困境是否由于“通讯”问题造成了囚徒困境?“要害”是否在于“利己主义”呢,即“个人理性”?囚徒困境的结果就一定不利吗?归根结底的原因:人类自私的天性,使他们陷入“囚徒困境”,难以自拔。,补充资料:个人最优与社会最优,理性人的最优决策:个人边际成本等于个人边际收益;社会最优决策(帕累托最优):社会边际成本等于社会边际收益;因此,除非没有外部性,个人最优决策不等于社会最优决策。政策启示:正因为如此,需要第三方,如政府、社会组织、社会舆论校正,使个人决策最优接近社会决策最优。,囚徒困境对传统经济学的挑战,对“看不见的手”原理的挑战:国富论:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。从“纳什均衡”引出了“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。,解决囚徒困境问题的“出路”,“解决个人理性和集体理性之间冲突的办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性”;许多的制度就是为解决“囚徒困境”而存在的;“一种制度安排,要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立”。囚徒困境的效果在不同情况下对社会而言可能是“负面”的,也可能是“正面”的。即囚徒困境不见得就是最坏的。,纳什均衡的三个启示,理论启示:一、个人理性与集体理性的冲突,个人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。二、“纳什均衡”引出“看不见的手”的一个悖论:从利己目的出发,结果损人不利己。“纳什均衡”提出的悖论动摇了经济学的基石。三从“纳什均衡”还可以悟出:合作是有利的“利己策略”,但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是“己所不欲勿施于人”。政策启示:合作能够带来好处,社会需要合作。人生启示:”尊重别人与尊重自己“。,4.2完全信息静态均衡的分析方法,占优战略:不论其他参与人选择什么战略,它的最优战略是唯一的,这样的最优战略被称为占优战略。占优战略均衡:如果一个博弈的某个策略组合中的所有策略都是各方的上策,那么这个策略组合将是所有人都愿意选择的,必然是比较稳定的结果,这是“占优战略均衡”。反映了所有人的绝对偏好,十分稳定。但这种情况较少见。划线法:横向,如果“列”选中一个策略,在我的最佳策略下划线;纵向,如果“行”选中一个策略,在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线,此即较为可能的解。如果这种解只有一组,此即上策均衡。,案例一智猪博弈,猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。行为与收益如下:A、如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;C、如果两猪同时到达食槽,则大猪吃7单位,小猪吃3单位食物;D、如果小猪先到,大猪吃6单位而小猪吃4单位食物。下表给出这个博弈的支付矩阵。,小猪,等待,大猪,按,等待,按,4大于10大于-1,纳什均衡:大猪按,小猪等待各得四个单位(4,4)多劳者不多得,弱者以静制动,智猪博弈二:散户跟大户,炒股时为什么小户跟着大户走?在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓“散户跟大户”的现象。对小户而言,“跟大户”是最优选择。类似的问题:非洲国家跟着中国投票。,智猪博弈三:大股东参政,为何股份公司中的大股东才有投票权?在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定经理任免的投票权,而小股东是小猪,不会直接花精力去监督经理,因而没有投票权。,智猪博弈四:中小企业模仿,为什么中小企业不会花钱去开发新产品?在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品去销售。对小企业而言,模仿和学习大企业的产品是最佳选择。类似的问题还有很多:后起的国家盗版水平比较差的学者剽窃引申的哲理:无知者无畏穿鞋的怕光脚的痞子怕光棍我是流氓,我怕谁,智猪博弈五:大企业打广告,为什么只有大企业才会花巨额金钱打广告?大企业是大猪,中小企业是小猪。大企业投入大量资金为产品打广告,中小企业等大企业的广告为产品打开销路形成市场后才生产类似产品进行销售。对中小企业来说,享受已经成熟、已经开发的市场是最优选择。,智猪博弈五:盗版和模仿问题,为什么中国企业要模仿美国和欧盟企业的产品?因为中国是技术相对落后的国家,是小猪,而美国和欧盟是发达国家,是大猪。小猪开发新产品,没有引进和模仿来得快。因此,欧盟和美国等发达国家开发新产品,中国等发展中国家引进模仿。是不是发展中国家总是模仿呢?,智猪博弈同类例子,大猪小猪博弈股份公司中大股东小股东监督纳什均衡:大股东担当监督经理的责任,小股东搭便车村中的富人穷人修路纳什均衡:大户修路改革中得到好处多的少的改革纳什均衡:得到好处多的推动改革(深度解释当今中国改革的推动者)股市的大户小户炒股纳什均衡:大户搜集信息,小户跟大户,政策启示:启示一:中国改革如何培养更多的“大猪”,是中国发展是否有动力的关键因素。启示二:稳定的社会依赖于更多的中产阶级,”纺锤型社会是较为理想的社会。启示三:社会动乱的源泉在于“小猪”,治理国家在于治理“小猪”。如何解决流氓无产者,如何引导贫穷阶层是执政的重要任务。,案例三:性别大战,芭蕾,女,男,足球,芭蕾,足球,纳什均衡:足球,足球;芭蕾,芭蕾先动优势:谁先买票,谁就会胜,案例四:斗鸡博弈,退,B,A,进,退,进,纳什均衡:A进,B退;A退,B进,斗鸡博弈的其他案例,1、村子里有两户富户,有两种可能:一家修,另一家就不修;一家不修,另一家就得修。(公共产品供给也许是囚徒困境,也许是智猪博弈,也许是斗鸡模型)2、冷战期间美苏抢占地盘:一方抢占一块地盘,另一方就占另一块。3、夫妻吵架,一方厉害,另一方就出去躲躲。谈谈阴阳协调和搭配的问题。4、警察与游行队伍的博弈,一方进,一方必须退。注意:在混合战略纳什均衡条件下,也可能两败俱伤。,案例六:市场进入阻挠,设想一个垄断企业已经在市场上(称为“在位者”),另一个企业虎视眈眈想进入(称为“进入者”)。在位者想保持自己的垄断地位,所以要阻挠进入者的进入。在这个博弈中,在位者有“默许”和“斗争”;进入者有“进入”和“不进入”两种选择。,案例六:赌胜博弈,赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示赌胜博弈的特点:一方获得的收益等于另一方失去的收益,不可能双赢,属于“零和博弈”,赌例一、田忌赛马,取胜关键:不让对方猜到自己策略,尽可能猜出对方策略思考:中国为什么不愿意透露自己的军力?,赌例二:猜硬币博弈,赌例三:石头、剪子、布,0,0,1,-1,-1,1,-1,1,1,-1,0,0,1,-1,-1,1,0,0,石头,剪子,布,博弈方2,石头,剪子,布,博弈方1,4.3完全信息动态博弈-子博弈精练纳什均衡,纳什均衡存在的问题:第一,一个博弈可能有多个纳什均衡,究竟哪一个会发生呢?无法确定。第二,在纳什均衡中,参与人在选择自己的战略时,把其他参与人的战略当作给定的。这个条件太严格了,必须放宽条件。第三,纳什均衡允许不可置信的威胁存在。,如何解决纳什均衡的多重性呢?,泽尔腾通过“子博弈精炼纳什均衡”解决了这一难题。主要方法是:将纳什均衡中包含的不可置信的威胁战略剔除出去,使均衡战略中不再包含不可置信的威胁。(如中国政府制定”反分裂法“)由于剔除了不可置信的威胁,缩小了纳什均衡的个数,精炼了纳什均衡。,完全信息动态博弈-子博弈精练纳什均衡,进入者,进入,不进入(0,300),在位者,默许(40,50),斗争(-10,0),市场进入阻挠博弈树,特点:剔除博弈中包含的不可置信威胁;给定进入者进入,剔除(进入,斗争),(进入,默许)是唯一的子博弈精练纳什均衡。,不可置信威胁,支付函数,行动,案例:抗婚博弈,故事:一个姑娘爱上一个小伙子,她父亲坚决不同意,威胁说,如果女儿不与小伙子断绝恋爱关系,他就与女儿断绝父子关系女儿怎样选择?父亲怎样选择?父亲的威胁可信吗?,其他例子,破釜沉舟反分裂法与城共亡不成功便成仁(抬棺决战)抗美援朝(北纬度)、抗美援越(北纬度)此类博弈的启示:不要欺人太甚、不要将别人逼上死胡同。“国之利器示于人”与“国之利不示与人”。,子博弈精炼纳什均衡的概念,定义:当且仅当参与人的战略在每一个子博弈中都构成纳什均衡。也就是说,组成精炼纳什均衡的战略必须在每一个子博弈中都是最优的。所谓子博弈,就是从每一个行动选择开始到博弈结束又构成一个博弈,即“子博弈”。精炼纳什均衡:当只当参与人的战略在每一个子博弈中都构成纳什均衡。承诺行动:当事人使自己的威胁变得可信的行动。,不可置信威胁的解释,不同置信的威胁引出信息经济学中一个很重要的概念,即“承诺行动”。承诺行动是当事人使自己的威胁战略变得可置信的行动。一种威胁什么时候才是可置信的呢?只有在当事人不实施这种威胁就会遭受更大的损失的时候。承诺行动的成本越高,威胁就越值相信。承诺行动的实际成本为零,但是承诺行动的成本不为零。台海危机中的中、美、台的博弈,4.4不完全信息静态博弈:贝叶斯纳什均衡,前面博弈都有一个基本假设:所有参与人都知道博弈的结构、规则、支付函数。这种博弈就是完全信息静态博弈。但是很多情况下,信息都不完全的。这种博弈称为不完全信息静态博弈。,不完全信息静态博弈-市场进入阻挠,斗争,在位者:高成本(x),进入者,进入,不进入,默许,斗争,在位者,进入者,进入,不进入,默许,在位者:低成本(1-x),在位者,40 x+(-10)(1-x)=0当x0.2时,进入,对手特征、战略空间,行动,不完全信息静态博弈-贝叶斯纳什均衡,不接受,求爱博弈:品德优良者求爱(x),求爱者,求爱,不求爱,接受,不接收,你,求爱者,求爱,不求爱,接收,求爱博弈:品德恶劣者求爱(1-x),你,100 x+(-100)(1-x)=0当x1/2时,接受求爱,对手特征、战略空间,行动,很多时候,参与人并不清楚对手的偏好、战略空间、各种组合下的利润水平,即只拥有不完全信息。每个人知己于必然,知人于或然.引入一个虚拟的参与人:自然。它选择了参与人的特征类型。海萨尼转换。完全但不完美信息博弈。因为使博弈分析成为可能,故称“完全”,但所知不确定,故“不完美”,即知道结果但是不知道博弈进程的博弈。给

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论