经济博弈论1.ppt_第1页
经济博弈论1.ppt_第2页
经济博弈论1.ppt_第3页
经济博弈论1.ppt_第4页
经济博弈论1.ppt_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

经济博弈论,清华大学博士后南京大学管理学博士中山大学经济学博士陈长彬副教授E-mail:ccbin手机2,第一节引言,3,博弈理论简介,博弈论(GameTheory):研究具有斗争或竞争性质现象的理论和方法。三要素:参与者(players)集合,策略(strategies)集合和收益(payoffs)集分类:合作博弈、非合作博弈;静态博弈、动态博弈;完全信息博弈、不完全信息博弈;研究博弈论的意义:理解人类的经济行为;理解社会和生态物种系统中的合作行为以及自自组织斑图。,4,约翰冯诺依曼(J.vonNeumann),Theoryofgamesandeconomicbehavior(1944),经典博弈论,合作博弈强调群体理性(grouprationality),就是从群体的角度考虑策略的选择,使得整体收益最大。所以合作博弈研究的是参与者在达成合作时如何分配合作得到的收益,即收益分配问题。,5,纳什(J.Nash)的博士论文非合作博弈(1950),非合作博弈强调个体理性(individualrationality),就是从个体的角度考虑策略选择,使得个体收益最大。所以非合作博弈研究的是参与者在利益相互影响的情况下如何选策略使自己的收益最大,即策略选择问题。,约翰纳什(J.Nash),纳什均衡(NashEquilibrium):所有参与人最优策略的组合。此时,每一个理性的参与者都不会有单独改变策略,因为当其他人不改变策略时如果他改变策略他的收益将会降低。例如:在两人合作博弈中,当参与者A采取其最优策略a*,参与者B也采取其最优策略b*,如果B仍采取b*,而A却采取另一种策略a,那么A的收益不会超过他采取原来的策略a*的收益。这一结果对B亦是如此。,6,应用举例:,田忌赛马:贵族:上等马、中等马、下等马田忌:下等马、上等马、中等马,司马迁史记,7,酒吧博弈在酒吧中消费,人太多则拥挤,人少则能够享受很好的服务。第一次到酒吧的人多,那么大多人人认为酒吧人太多,太挤。第二次决定的时候,参考前次而不去酒吧。少数去的人发现酒吧的人第二天很少,感觉很爽,第三次将继续回来,并重新带回许多人循环就此开始。如何决定下一次是否去酒吧消费?争当少数者博弈,8,智猪博弈小猪和大猪住在猪圈的一边(食槽在这里),开启食物的开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关,等小猪回来的时候大猪已经把大部分食物吃完。如果大猪去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。对于小猪来说,最佳策略是等待大猪去踩开关,然后“搭便车”获得小部分食物。然而,当大猪不去踩开关的时候,小猪也要冒风险去踩开关。例如腾讯毫无顾忌地跟风,做QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时候踢开挡路的,就可以了。,9,关税战:任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。X国和Y国进行贸易就是博弈。这里存在一Nash均衡,就是双方都实行贸易保护主义,提高关税。在这个均衡中贸易双方采取不合作的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税。结果贸易双方的利益都受到损害,也就是损人不利己。反之,如果贸易双方都采取合作的策略,都减少关税限制,那么双方都可以从贸易自由中获得了最大利益。,10,博弈论,美藉匈牙利数学家冯诺依曼(JohnVonNeuman)和美藉奥地利经济学家摩根斯顿(Morgenstern)相识于普林斯顿大学,他们于1944年出版了经典著作博弈论与经济行为,为现代博弈论的发展奠定了基础。,美国的数学家、经济学家纳什(JohnNash),美籍匈牙利经济学家海萨尼(JohnC.Harsanyi)和德国经济学家泽尔滕(R.Selten)因对博弈论的卓越贡献而获得1994年度的诺贝尔经济学家。,海萨尼,纳什,11,值得一提的是纳什,他发表奠定其在博弈论中重要地位的学术论文时,年仅22岁,被人称为“一个天才”。1959年,纳什被精神病医生诊断为“妄想性精神分裂”,饱受精神病折磨40余年。,泽尔滕,12,数学界的梵高“疯子天才”纳什,13,SeltenandHarsanyi,泽尔腾(1965)将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”。而海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(19671968)。总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型。,14,1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼。1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞;2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。2005年诺奖授予有以色列和美国双重国籍的罗伯特奥曼和美国人托马斯谢林,以表彰他们在博弈论领域作出的贡献。,15,从游戏到博弈,游戏的特点:下棋,打牌,赌博,田径,球类等等,共同的特点是策略策略的好坏决定游戏的结果游戏的特征:规则,结果,策略,策略和利益的依存性,16,假如你正跟恋人用手机通电话,突然信号断了。这时,你会立即拨电话过去,还是等你的恋人拨电话过来?,很显然,你是否应拨电话过去,取决于你的恋人是否会拨过来。如果你们其中一方要拨,那么另一方最好是等待;如果一方等待,那么另一方就最好是拨过去。因为如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中流逝。,想一想,17,这,就是博弈!,这,就是博弈!,*在一场博弈中,你必须考虑对方的选择以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的最优选择。*你从博弈中得到的,不仅取决于你自己的行动,也取决于对方的行动。如果你知道恋人不会打过来(如以前断线就是她在等电话,如果你的手机包月额度很难用完而她的接听免费),那么你的最优行动就是拨过去。*博弈最本质的特征是:双方的行动相互影响又相互依赖,18,博弈的关键,局中人理性地采取或选择自己的策略行为,在相互制约相互影响的依存关系中,尽可能的提高自己的利益所得,这样,博弈论就是关于包含相互依存情况中理性行为的研究。相互依存理性行为,19,博弈的四种分类情况,完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈,20,博弈的分类及对应的均衡,21,第二节博弈论的基本概念,一、市场竞争中的博弈二、现代经济学与博弈论三、博弈论的基本概念,22,一、市场竞争中的博弈,在现实经济生活中,许多产业市场是寡头断市场。寡头垄断市场是指少数几家大厂商生产一个产业中的全部或大部分产品,从而形成对一个产业的控制的产业市场。在分析寡头垄断市场中的企业决策行为时,就必须把各种决策者之间的策略相互作用纳入到经济模型中,这就是一种博弈分析。,23,二、现代经济学与博弈论,从现代的观点来看,经济学是研究人的决策行为的学问。理性人是指有一个很好定义的偏好,在面临给定的约束条件下能最大化自己偏好的人,不考虑竞争对手的决策。价格理论有两个基本假定:1、市场参与人的数量足够多,从而市场是竞争性的;2、参与人之间不存在信息不对称问题(完全竞争、完全信息)。然而在现实生活中,这两个假设在许多情况下是不能被满足。,24,三、博弈论的基本概念,(一)博弈论的定义博弈论,英文为Gametheory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。,25,(二)博弈的组成要素,一个博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、结果、均衡等。1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体);2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策;3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排;,26,4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识;5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西;6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则来决定均衡。,27,(三)博弈的分类,根据参与人的多少,可将博弈分为两人博弈或多人博弈;根据参与人是否合作,可将博弈分为合作博弈或非合作博弈;根据博弈结果的不同,又可分为零和博弈、常和博弈与变和博弈。,28,1、从行动的先后次序来分,博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中,参与人同时选择行动,或虽非同时但后行动者并不知道前行动者采取了什么具体行动;动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动的博弈。,29,2、从参与人对其他参与人的各种特征信息的获得差异来分,博弈可分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与人的特征,如策略集合及得益函数都有准确完备的知识;否则就是不完全信息。将上述两个角度的划分结合起来,我们就得到四种不同类型的博弈,这就是:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。,30,博弈的分类和均衡,31,第二节博弈的种类,一、完全信息静态博弈(一)完全信息静态博弈定义所谓完全信息静态博弈指的是各博弈方同时决策,或者决策行动虽有先后,但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。,32,(二)博弈的策略式表达,在博弈论中,一个博弈可以用两种不同的方式来表达:一种是策略式表达:另一种是扩展式表达.策略式表达更适合于静态博弈,而扩展式表达更适合于讨论动态博弈。,33,策略式表达又称为标准式表达,在这种表达中,所有参人同时选择自己的策略,所有参与人选择的策略一起决定每个参与人的得益。值得强调的是,这里参与人同时选择的是“策略”,而不是“行动”。在静态博弈中,于参与人只选择一次,所以策略就等同于行动了。而在动态博弈中,策略是参与人在各个阶段的行动的全面计划。,34,更为准确地讲,策略式表述给出:1、博弈的参与人集合:i,=(1,2,,n);2、每个参与人的战略空间:Sii1,2,3,n;3、每个参与人的得益函数:ui(s1,,si,sn),i1,2,3,,n。用GS1,Sn;u1,,un代表战略式表述博弈。,35,(三)博弈的得益矩阵表示,一个博弈被称为有限博弈,如果:第一,参与人的个数是有限的;第二,每个参人可选择的策略个数是有限的。有限博弈的策略式表达及其求解可以方便地用得益矩阵直观地给出。,36,著名的“囚徒困境”的例子,警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。问:两个罪犯会如何选择(即是坦白还是抵赖)?,37,38,(四)纳什均衡,1、占优策略均衡。一般来说,由于每个参与人的得益是博弈中所有参与人的策略的函数,因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中,一个参与人的最优策略可能可以不依赖于其他参与人的策略选择,就是说,不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为“占优策略”。如果一个博弈中,某个参与人有占优策略,那么该参与人的其他可选择策略就被称为“劣策略”。,39,在一个博弈里,如果所有参与人都有占优策略存在,那么占优策略均衡是可以预测到的唯一的均衡,因为没有一个理性的参与人会选择劣策略。所以在囚徒困境博弈里,坦白,坦白是占优策略均衡。囚徒困境反映了一个深刻的问题,即个人理性与团体理性的冲突。这给我们一个启示,我们学习博弈论,也许更应该研究的是怎样设计一种制度,在满足个人理性的同时,去争取达到“集体理性”。,40,2、严格劣策略的重复剔除,重复剔除严格劣策略”的思路如下:首先找出某个参与人的严格劣策略(假定其存在),把这个劣策略剔除掉,重新构造一个不包含已剔除策略的新的博弈;重复这个过程,一直到只剩下一个唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解,称为”重复剔除的占优均衡”。注意,上述表述中强调了“唯一”这个词。也就是说,如果重复剔除后剩下的策略组合不唯一,那么该博弈就不是可通过重复剔除劣策略求解的。,41,3纳什均衡,纳什均衡是完全信息静态博弈解的一般概念,构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略,即没有任何一个策略严格优于纳什均衡策略。当然,逆定理是不存在的。更为重要的是,许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈,也存在纳什均衡。下面,我们给出纳什均衡的正式定义。,42,纳什均衡的正式定义,纳什均衡:有n个参与人的战略式表述博弈GS1,Sn;u1,,un,战略组合S*(S1*,Sn*)是一个纳什均衡,如果对于每一个i,Si*是给定其他参与人Si*(S1*,,S-1*,Si+1*,Sn*)的情况下第i个参与人的最优战略,即:ui(si*,s-i*)ui(si,s-i*)对任意SiSi,和任意的I都成立。,43,指一组给定对手行为前提下对各博弈方存在的最佳选择;在纳什均衡状态下,只要其它参与者不变换策略选择,任何单个参与者不可能单方面通过变换策略来提高他的所获支付。,各博弈方都不愿或不会单独改变自己策略的策略组合,只要这种策略组合存在且是唯一的,博弈就有绝对确定的解。这种各博弈方都不愿单独改变策略的策略组合就是博弈论中最重要的一个概念“纳什均衡”。,44,纳什均衡的一致预测性,如果所有博弈方预测到一个特定的纳什均衡将会出现,那么,没有人有兴趣作不同的选择。纳什均衡的特征:博弈方预测到均衡,博弈方预测到其他博弈方预测到均衡,等等。一致性预测,并不意味着纳什均衡一定是一个好的预测。,45,(五)纳什均衡的多重性,在两人的有限策略博弈中,我们还可以简单地用划线法来找出纳什均衡,从这个例子中我们知道一个博弈可能有多个纳什均衡,而具体哪个均衡会实现,纳什均衡本身不能给出回答,任何有限博弈都存在至少一个纳什均衡,若是无限博弈则不一定。,46,几个博弈案例,1.智猪博弈(占优战略均衡)2.性别之争(多重纳什均衡)3.斗鸡博弈;4.市场阻挠博弈,47,博弈方法及其应用,48,典型的囚徒问题,两个嫌犯受到指控,但除非至少一个招认,否则警方不能将二人判有罪。警察把二人分别带到不同的房间,告之后果:如果二人均不坦白,将被判入狱一个月。如果双方均坦白,将被判入狱6个月。如果一方招认,另一方不招,招认一方马上释放,另一方判入狱9个月(6+3)。,49,50,博弈现象的三要素,局中人参与博弈但利益不完全一致者。有二人博弈与多人博弈之分。策略集每个局中人都会有一系列的策略可选,称为对应于每个局中人的策略集。有限和无限个对策。收益在每策略组合下每一局中人的收益情况。是选择策略的标准。收益函数或支付函数。,51,囚徒困境说明了什么,在(坦白、坦白)这个组合中,和都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果和都选择不坦白,各判刑年,显然比都选择坦白各判刑年好得多。当然,和可以在被警察抓到之前订立一个“攻守同盟”,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定,显然最好的策略是双方都不坦白。,52,例1:,甲乙二人在桌上各放一枚硬币,如果同向。甲赢一场;两面不同,乙赢一场。比赛两场告终。二战全胜者可占有对方的硬币。局中人:甲、乙二人策略集合:二人均为:正正、正反、反正、反反四个策略。(有限)甲

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论