博弈论与经济模型.doc_第1页
博弈论与经济模型.doc_第2页
博弈论与经济模型.doc_第3页
博弈论与经济模型.doc_第4页
博弈论与经济模型.doc_第5页
免费预览已结束,剩余96页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重庆大学经济与工商管理学院博士研究生学位课讲义博弈论与 经济模型(2006年春季版)蒲勇健 赵耀华*美国宾夕法尼亚大学博士、香港大学经济金融学院副教授,重庆大学兼职教授*原创作品 不可复制第一章 绪 言当代最著名的经济学家,诺贝尔经济学奖得主保罗萨缪尔森(Paul Samuelson)曾经这样说明博弈论对于现代社会的重要性,他说:“如果想成为现代社会中博闻广识的人,你必须对博弈论有某种程度的了解”。尽管博弈论还是一个非常年轻的学科,从她的创立到现在还只有半个多世纪的时间,但其发展的速度却是非常快的,其影响也是相当深远的和十分广泛的。从学术体系的创新角度看来,标志着博弈论这一学科正式创立的重大事件是由von Neumann与Oskar Morgenstern所撰写的博弈论与经济行为(Pinceton, N.J.:Princeton University press, 1943)的出版。尽管这本书出版才六十多年,然而博弈论已经发展成为了一门相当重要的学科。博弈论的基础理论研究在上个世纪的50年代和60年代获得了迅速的发展,由John Nash和Thomas Schelling以及其他一些学者做出了大量的重要贡献。随后,新的思想和理论创新的发展进一步加快了,其原因是博弈论开始被人们发现还可以应用于研究如此众多的不同领域中的不同问题。这些领域的应用情况包括上个世纪60年代的国际关系,70至80年代的经济学、商业、以及进化生物学领域,还有80和90年代的政治科学领域。现在,人们对博弈论中的一些术语已经耳熟能详,例如:“零和博弈”和“囚徒困境”,它们已经成为现代语言的一部分。虽然人们早在18世纪初以前便开始有了对具有战略依存特点的决策问题的零零星星的研究,但博弈论获得了真正的发展还是在20世纪。20世纪的初期是博弈论发展的萌芽阶段,研究的对象主要是从竞赛与游戏中引申出来的严格竞争博弈,也就是说二人零和博弈。在这类博弈中不存在合作或联合行动,对弈双方的利益是严格对立的,其中一方的所得必然等于另一方的损失。这对应于玩扑克和下棋等二人游戏的情形,但当应用于经济和政治上时,则大多数情况并不合适。在这个时候,关于二人零和博弈的理论有着丰硕的研究成果出现,尤其是提出了博弈扩展型策略、混合策略等重要的概念,为博弈论后来研究对象范围的拓展与研究的深化奠定了基础。这一阶段所以取得的最重要的成就是泽梅罗(Zermelo,E.)定理(1913)与冯诺伊曼的最小最大定理(1928),后者为二人零和博弈提供了解的概念,同时对博弈论的发展也产生了重大的影响,譬如非合作n人博弈中的基本概念纳什均衡,从某种意义上来说就是最小最大定理的延伸与推广。1944年,20世纪的天才数学家冯诺伊曼和摩根斯坦合著的博弈论与经济行为一书的出版,标志着比较系统的博弈理论的初步形成。这本巨著汇集了当时博弈论的几乎所有的研究成果,将博弈论的框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。同时,作为经济学家的摩根斯坦首先清楚而全面地确认,经济行为的主体在决策时应考虑到经济学上的利益冲突。这本书十分详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,还开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上。由于博弈论在数学上的严密性与在经济学应用上的广泛性,经济学家们将该巨著的出版视为现代数理经济学确立的里程碑。在接下来的一段时期里对合作博弈的研究有了长足的进步。按照海萨尼(Harsanyi, J. 1966)的观点,如果博弈中意愿表示协议、承诺、威胁具有完全的约束力并可强制地执行,则该博弈是合作的。如果意愿表示不可强制地执行,则为非合作博弈。非合作博弈随后发展壮大起来,纳什(Nash,J.)、泽尔滕(Selten,R.)和海萨尼因此于1994年获得诺贝尔经济学奖。但在当时,研究的注意力还主要集中在合作博弈上。一般认为,合作博弈可被视为是非合作博弈的特殊情况,它略去非合作个体之间建立合作关系的过程而着重于研究合作的可能性与形式。由于省去从非合作到合作过程中繁复的难以尽述的细节,合作博弈能对合作问题有更清晰的把握。这一期间为解决合作博弈中所遇到的问题而提出了联盟博弈、稳定集、解概念、可转移效用、核等重要概念与思想。1950年代是博弈论理论体系的成长期,纳什为非合作博弈的一般理论奠定了关键性的基础,他提出了博弈论中最重要的概念纳什均衡,为博弈论开辟了一个全新的研究领域。非合作理论开始发展起来,出现了如塔克(Tucker, A)教授的囚徒困境、重复博弈等概念。合作博弈理论在这个阶段也得到进一步发展,如夏普利值(Shapley value)概念和核概念等。博弈论的研究群体开始扩大,兰德公司在圣基尼卡开业,在随后的许多年里,这里成为了博弈论的研究中心。从此以后,经济学逐渐成为博弈论最重要的应用领域。1960年代是博弈论理论体系的成熟期。不完全信息与非转移效用联盟博弈这样一些概念的扩充使理论变得更具广泛应用性。一些常识性的基本概念得到了系统阐述与澄清。博弈论从此成为了一个完整而系统的体系。更重要的是,博弈论与数理经济及经济理论建立了牢固而持久的关系。例如,等价性原理说明博弈论与经济理论间存在竞争市场经济的价格均衡与相应博弈的重要解概念之间的对应关系。海萨尼与泽尔滕也正是在这一时期开始他们著名的工作。海萨尼提出了不完全信息博弈理论,而泽尔滕也开始其均衡选择问题的研究。从1970年代到现在是博弈论丰富和壮大的时期。博弈论在几乎所有的研究领域都得到重大的突破。博弈论开始对其它学科的研究产生了强烈的影响,计算机技术的飞速发展使得研究复杂与涉及大规模计算的博弈模型发展起来。在理论上,博弈论从基本概念到理论推演均形成了一个完整与内容丰富的体系。在应用上,政治与经济模型中的博弈论有了十分深入的研究,非合作博弈理论被应用于大批具体的经济模型。同时,博弈论应用到生物学、计算机科学、道德哲学及政治科学等领域,如随机战略这样的概念也得到了重新解释。逐渐地,博弈论开始变得大众化起来,不再是仅为少数研究者所知了。要对每年所发表的有关博弈论数以千计的文献进行了解已不是件容易的事。目前,博弈论仍处于不断发展与深化之中,预测其可能出现的创新与成就是相当困难的。在博弈论的发展过程中,纳什奠定了非合作博弈的理论框架与概念基础,他的名字与博弈论的中心概念纳什均衡联在一起;海萨尼与泽尔滕的贡献是致力于博弈论的进一步发展与应用。在非合作博弈论和经济分析里所应用的博弈论思想中,纳什均衡都处于核心地位。克雷普斯(D.Kreps)认为,如今在每一个经济学领域及与其相关的金融、会计、市场学甚至政治学等领域里,在消化其近期研究成果过程中,对纳什均衡概念的理解均起着重要作用。虽然作为先驱者的古诺(Cournot)已在其研究中开创这一思想的先河,但其目前的形式则是纳什独立完成得出的卓越成就。美国普林斯顿大学的数学家纳什,从1950年至1954年,曾发表了多篇论述博弈论的文章,为非合作的一般理论和合作博弈的谈判理论奠定了基础。他规定了非合作博弈的形式,并定义了著名的“纳什均衡点”。纳什最早对合作博弈与非合作博弈进行了区别。纳什指出以前的理论包含着某种被称为合作类型的n人博弈思想,它以一种对能由局中人形成的不同合作之间相互关系的分析为基础;与此相反,纳什认为他自己的理论则“以缺乏合作为基础,在其中假定每个参与者都各行其是,与其他人之间没有合作与沟通”。这种思想在当时实际上拓展了博弈论研究的范围,并增强了其应用性。在阐明了合作与非合作之间区别的基础上,纳什定义了著名的“纳什均衡点”,并对它的一般存在给出了证明。纳什均衡的定义一般是通过简单确定一个正常形式的有限局中人和行动的博弈来给出的。在纯战略中,它是指这样一种战略组合:假定其他局中人不改变其战略,则任何一个局中人都不能以单方面变换自己的战略来增加其效用。纳什还证明,在一个有限局中人和行动的博弈中,至少总存在一个纳什均衡。只有当我们考察混合战略时才能完全保证其存在,因为有例子表明,存在着没有纯战略均衡的博弈。这一定义实际上隐含着一个前提假定,即局中人对游戏结构有完全的了解,也就是说拥有完全信息,以便能够导出他们自己的预测。纳什均衡的意义直到现在仍是探讨与争论的题目。一般认为,它是随不同情况而变化的一种过程。例如,假设在某种博弈中,局中人通过某些非强制手段就局中人的战略选择达成协议,这项协议具体确定了每个局中人选择的战略。由于协议无强制力量,局中人如果能通过违背协议而获得利益,则该协议无效。所以,为了保证协议有效,必须有一种局中人不可能因单方面违背协议而获益的机制,即形成一种纳什均衡。就是说,纳什均衡使得协议能够自我约束,无外力作用下也能保证协议的生效。在这里,纳什均衡的意义在于保证协议的自我强制执行。但这并不是说每个纳什均衡都具有自我强制性,就多个局中人背信问题而言可能得出不同的结论。此外,这里并未讨论协议如何实施及无协议时的情况。纳什均衡在上述情况中的含义是有差别的。纳什均衡刻画了人们理性选择的结果:利益冲突达到一种稳定状态以至于没有人会单方面加以改变。纳什均衡并未对这一结果做出福利上即总体上优与劣的判断。这就允许存在一种情形:由于人们的不合作使得每个人都达不到可能的最大收益。这在囚徒困境中表现得十分明显,其中唯一的纳什均衡是双方均坦白,因为在其它战略组合下均有一方能因改变战略而获益。但是这一博弈中的帕累托最优是双方均不坦白。这表明,帕累托最优并不一定能在纳什均衡点上实现。即在存在利益冲突的情况下,利己主义个人理性选择的结果在总体上可能并不是最有效的。进而,在经济学中经济人的假设下,市场经济会达到或者趋向帕累托最优这一结论在引入利益冲突后有可能是无法成立。在囚徒困境中,双方虽可在均不坦白的情况下达到帕累托最优,却难以实现这一结果。这是由于缺乏对对方的信任。因对方可把战略改为交坦白而使自己获释,故每个人都无法信任对方会信守承诺。每个人追求自身利益最大化这个理性人假定更使这种信任失去了基础。这说明,个人利己的理性选择并不能保证人们的处境都得到改善,结果可能对大家都是不利的。从这种意义上说,纳什均衡揭示出了利己理性的弱点。在人人求得自利的同时,如何防止对所有人都不利的结果出现,这已成为今目前博弈论和经济学中研究的热点问题。实际上,纳什的研究是基于“单个时期的模式”而做出的,是静态的,即在稳定的环境条件下,双方在不改变战略的情况下进行。但现实却在不断变化,并经常是重复的。后来人们在利用战略均衡分析特定的经济模型时,发现扩展形式的每一步在给定一局中人信息的情况下,纳什定义忽视了“离开均衡路线”的偶然性。为弥补这一不现实假设的缺陷,泽尔滕发展了动态的适应于每个不同时期的博弈,从而以此为开端,促进了对均衡的各种精细改进定义的出现。在纳什均衡中还有一个完全信息的重要假设,即局中人都知道其对手要采取的战略。这种假设在以下一些情况中看来是特别不可信的:某些局中人起初拥有其他人所缺乏的关于他们自己的爱好、能力甚至博弈规则方面的知识。在经济学的应用中,这种不确定性可能反映为一个厂商起初对其竞争者的财务或人力资本资源等信息的不确定性知识。因此,要把纳什均衡分析运用于那种情景就不太合适了。为此,海萨尼建立了不完全信息博弈,从而扩展了纳什分析的应用范围。泽尔滕的研究成果使纳什均衡概念得到进一步精致化,并推动了博弈论在各个学科中的应用。针对纳什均衡概念的不完善性,纳什以后的不少研究者试图精炼原来的概念,附加上一些条件以便将无说服力的纳什均衡点剔除掉。由此,泽尔滕提出了两个著名的新概念:子博弈完美(均衡)点和颤抖手完美(均衡)点。子博弈完美点是泽尔滕于1965年提出的。他指出并非所有纳什均衡点都是同样合理的,因为某些均衡要求局中人具有实施“空洞威胁”(empty threat)的能力,即采用事实上无法实施的应变计划,从而这类均衡就失去了实际意义。泽尔滕提出子博弈完美点的概念,是要把依赖于这类威胁的均衡点排除,即在原则上排除直观上不合理的纳什均衡。在扩展型模式中,其思想表明了先行者利用其先行地位及后行者必然理性地反应的事实,来达到对其最有利的纳什均衡点。求解子博弈完美点的方法是逆向归纳法。泽尔滕的子博弈完美点概念简单、直观,且与经济学中许多实际情况如寡头市场等相符合。在许多情形,由于局中人的战略选择会引起一系列层次的连锁反应,在战略选择时就应对此加以考虑。但子博弈完美均衡点集合取决于扩展型博弈的细节,同时不能完全排除所有不直观不合理的纳什均衡点。为弥补这个不足,泽尔滕(1975)又提出了“颤抖手完美点”概念。“颤抖手完美点”概念是指:在博弈中每个局中人按纳什均衡点进行战略选择时难免会犯错误,即偶尔会偏离均衡战略(可能手会颤抖)。这样局中人应该选择那样的纳什均衡点,使得自己犯错误时,其它人按照他们的最佳反应战略,仍如同自己未发生错误一样做出同样的战略选择。这意味着局中人在战略选择时应考虑到自己有可能做出错误选择,从而会力图避免因自己的偶然错误而蒙受其它局中人改变相应战略给自己带来的损失。当然这一概念假定对任一方的颤抖概率都是一样的。其实,在博弈中人们会更小心地避免在损失大的方向上犯错误,这样向不同方向的颤抖概率就会不同。由此Myerson提出了“适当均衡点”的概念,进一步完善了颤抖手均衡。在颤抖手均衡概念中,泽尔滕利用人类行为包含非理性因素(局中人会犯错)这一特点,形成对理性概念的一种新理解。这种方法无疑是博弈理论的一个重大突破。此外,泽尔滕在把博弈论应用于具体经济分析方面做出了卓越成就,如对非合作博弈中的联盟形成和讨价还价模型等的深入研究。他在把博弈论应用于实验研究和生物学等方面也有突出贡献。总之,泽尔滕在纳什均衡概念的扩展与深化及博弈论在各学科的应用上都做出突出贡献,从而与海萨尼一起推动了博弈论理论体系的丰富与完善。在纳什的博弈理论中,博弈双方的信息是完全的,即假定博弈双方都能认清对方每次对局的情况。然而在现实生活中,博弈各方要想获得完全的信息可能性极小,即使可能获得完全信息也要付出高昂的成本。因此,海萨尼就以纳什均衡的出发点和以现实的不完全信息为条件,研究了如何分析不完全信息下的博弈,从而为研究信息经济学奠定了理论基础。他是在纳什均衡的基础上,吸取了贝叶斯的研究成果,以贝叶斯理性原则为出发点,对纳什均衡做了全面广泛的展开。首先是不完全信息理论。海萨尼对博弈论最大的贡献在于他在不完全信息问题上的突破。古典经济模型几乎无一例外地假设,个人(或厂商)的资源与偏好情况不仅为自己,也为他们的竞争对手所知,即完全信息假设。这显然不符合实际。不过,这并非模型建立者本身所希望的,而只是因为缺乏解决不完全信息问题的工具而不得不做出的简化。博弈论的发展也遇到同样问题。由于对不完全信息问题一度苦无良策,博弈论曾受到严厉批评。因为局中人事实上不可能清楚关于对手决策的所有信息。由此导致博弈理论建模的应用范围也受到了限制。海萨尼对这一问题的解决方法是将不完全信息建模为自然完成的一种抽彩。这种抽彩决定局中人的特征。而这些特征是局中人偏好与经验的总和,其中,每个局中人清楚自己的特征,但不知道别人的真实特征。即他对整个博弈局势只有不完全信息。据其特征,局中人可分为一些类型。每个局中人知道自己的类型,不知道别人的类型,但知道类型上的联合分布,从而能对其它局中人的类型作出先验分布判断。不完全信息的这种博弈局势把实际中千变万化的不完全信息都归结为局中人对他人的主观判断。这种方法成功地将不易建模的不完全信息转化为数学上可处理的不完善信息:即局中人根据经验与知识对对手的类型得出关于可能性大小的主观判断,即数学上的一种先验分布。不完全信息博弈的解是由纳什均衡概念推广而来的。其均衡点(贝叶斯均衡点)是一个n重战略,每个局中人每种类型的个人战略均是对其它局中人的(n1)重战略的那种类型的最佳应对。以类型为基础的不完全信息博弈是海萨尼(19671968年)提出的。他运用这种方法来克服将局中人的信息与偏好以及他对其它局中人信息与偏好的了解进行建模时所遇到的复杂性。这一思路极富创造性,使不完全信息博弈成为解决经济问题的一个有力工具。其次是关于混合战略的解释。混合战略概念的传统解释是,局中人应用一种随机方法来决定所选择的纯战略。这种解释在理论与实际上均不能令人满意。海萨尼对此提出了一种杰出的解释方法。他说明在每一真实的博弈形势中,总受一些微小的随机波动因素影响。在一标准型博弈模型中,这些影响表现为微小的独立连续随机变量,每个局中人的每一战略均对应其中的一个。这些随机变量的具体取值仅为相关局中人所知,这种知识即成为私人信息;而联合分布则是博弈者的共有信息。这称为变动收益博弈。变动收益博弈适用海萨尼的不完全信息博弈理论,各随机变量的一种取值类型影响着一个博弈者的收益。在适当的技术条件下,变动收益博弈所形成的纯战略组合与对应无随机影响的标准型博弈的混合战略组合恰好一致。海萨尼证明,当随机变量趋于零时,变动收益博弈的纯战略均衡点转化为对应无随机影响的标准型博弈的混合战略均衡点。海萨尼的变动收益博弈理论提供了对混合战略均衡点具有说服力的解释。局中人只是表面上以混合战略博弈,实际上,他们是在各种略为不同的博弈情形中以纯战略博弈。这种重新解释是一个具有重大意义的概念创新,是海萨尼对博弈论所采用的贝叶斯研究方法的一块基石。再次就是关于合作博弈的通解。海萨尼关于博弈论的第一篇论文(1956)把纳什的合作理论与Zeuthen的讨价还价模型结合,这是他建立人合作博弈的通用讨价还价模型(1959,1965)的第一步。绝大多数合作解概念基于具有或不具有旁支付(side payment)的特征方程型博弈。而他的通用讨价还价模型是第一个适用于标准型博弈问题的几人合作理论。通过对均衡时效用权重与联盟对局中人分红具有独创性的构造,他成功地定义了一种讨价还价解法,与非合作博弈的一种均衡点非常相似。直至现在,他的多人讨价还价模型仍是合作博弈理论中最为重要的理论之一。最后是关于对合作的非合作形式建模。现在一种观点已被广泛接受,即有关一种博弈形势的充分详细的模型必为一个非合作博弈理论。而在1960年代以前,一般观点认为,合作理论比非合作理论更为重要。海萨尼是促使产生这种观念变迁的博弈论研究者之一。他首先认识到合作机会以非合作博弈形式建模的必要性。由此观点,合作理论可视为一个简化形式,需要建立具有更多细节的非合作模型。以这种思路,海萨尼(1974)为特征方程型博弈中一个重要的合作理论冯诺伊曼摩根斯坦稳定集进行了创造性的非合作形式重建。海萨尼的讨价还价模型中为一个具有可转移效用的零和特征方程型博弈设计了一个收益向量序列,以其序列递推过程描述联盟的选择过程。其理论利用非直接优势概念形成了修正的稳定集概念。海萨尼对稳定集概念的非合作重建为考察联盟形成的非合作模型构造提供了方法上的突破。对不可置信威胁的研究引出了博弈论中一个很重要的概念,即承诺行动。承诺行动是博弈中的主体使自己的威胁战略变得可置信的行动。一种威胁是否可以置信,取决于当事人在不施行这种威胁时是否会遭受更大的损失。承诺行动意味着当事人要为自己的失信付出成本,尽管这种成本并不一定真的发生,但承诺行动给当事人带来很大的好处,因为它会改变均衡结果。随着现代经济的迅猛发展,博弈论的方法日益为人们所认识和接受,并应用于经济现象的分析研究中。博弈论已成为博大精深的体系,广泛应用于经济学、政治学、军事决策、计算机科学、生物演化等领域的研究。同时它还与数学、心理学、统计学以及认识论、伦理学等学科有着重要的联系。它与各学科之间相互影响、相互促进,一方面借鉴其它学科的思想成果,另一方面它也促进了其它学科的发展。博弈论与经济学的关系尤为密切,其最直接的应用领域是在契约、合作及各种公共产品等领域,博弈论的影响广及产业组织的市场理论、契约与合同的设计、政府行为与规制的机制设计等诸多方面,为研究各种经济现象开辟了全新视野。博弈论思想也对经济学家的思维方式产生了深刻影响。人们越来越认识到,大多数经济问题都可以作为博弈过程来分析。克雷普斯指出,仅就在经济学上的应用而言,博弈论的主旨是帮助经济学家理解和预测在经济环境中已经发生与将要发生的事情。博弈论工具的应用的确加深了对经济现象的理解。近年来,许多学者尝试运用博弈论研究微观和宏观经济理论问题,甚至想通过这条途径重新建构理论框架。这一趋势已逐渐深入到每一个经济学及相关的领域。博弈论的传统应用领域是产业组织或市场结构的研究以及对投票和公共物品供给的分析等。诸如重复博弈的囚徒困境、交错出价的讨价还价模型、时间选择博弈和先买权博弈,都在产业组织理论分析中得到深度应用。而海萨尼的贝叶斯纳什均衡解,作为许多博弈推理分析的基石,则应用于机制设计问题。其中包括非线性价格歧视、最佳拍卖、对公共物品偏好的显示以及信息不完备情况下的契约失效等。在对掠夺行为和就业市场信号的分析中所应用的一系列解的概念完全贝叶斯均衡解、克雷普斯和威尔森序列均衡解、泽尔滕颤抖手完美点均衡解,体现着经扩展的不完全信息博弈中子博弈完美点的思想。近年来,博弈论被应用到对不同拍卖行为的分析、委托人代理人的关系及激励机制问题,以及公共财政学领域等。我国学者近年来对博弈论在经济研究中的应用进行了有益尝试。如对经济调整中的社会博弈问题的研究、对中央政府与地方政府的博弈关系和规则的探讨等。博弈论作为一种有力的分析手段,在经济学中有着广泛的应用前景。博弈、合作与经济制度紧密相联,诺斯则认为对经济制度的研究实质上就是对合作的机制的研究。可以认为,近年来经济学的一系列突出成就和最新进展越来越集中地表现出人们对经济行为主体认识的深化。作为洞察主体行为规律和分析经济现象背后机制形成的认识工具,博弈论在研究变革社会的秩序演进与制度创新方面有着巨大的应用潜力。博弈论在西方经济学及经济实践中已得到广泛应用,显然我国经济理论研究引入博弈论理论和研究方法,对于利用新的科学方法和科学成果推动我国经济学的发展,为我国经济建设和经济改革提供必要的理论指导,具有重要意义。经济学在为现实经济提供理论指导的同时其自身也要不断发展,凯恩斯以后的西方经济学,在战后已发展起了一个新的体系,即以研究市场经济运行为对象的宏观经济学和微观经济学。在改革之前,我国的经济研究原是以生产关系为研究对象的政治经济学,主要探讨社会主义经济制度不断完善的途径,并不研究经济运行的过程,在当时计划经济体制下人们对经济活动的关心也主要局限在对政府行为的理解和落实上,而忽视对企业和个人行为的分析、更不考虑各经济主体之间的相互影响和相互对立,忽视经济主体在资源配置问题上的矛盾和博弈。我国在确立社会主义市场经济目标以后,重塑经济主体、转变经济主体的职能、增强各经济主体的活力,是重要的任务。博弈论分析我国转型时期宏微观经济运行的重要工具,因为在我国社会主义市场经济中,经济主体存在着信息的不完全、信息不对称等现实情况,人(政府、企业中的决策者及社会个人)都有自己的效用函数,对信息的加工能力也是有限的,各经济主体之间的选择存在着许多相互依赖关系。博弈论在西方经济学及经济实践中已得到广泛应用,显然我国经济理论研究引入博弈论理论和研究方法,对于利用新的科学方法和科学成果推动我国经济学的发展,为我国经济建设和经济改革提供必要的理论指导,具有重要意义。我国市场经济经济运行中,政府制定什么政策会收到什么效果,可以通过构建博弈模型进行研究,考虑博弈中各主体的效用函数等,研究不同博弈规则下的均衡。在转型时期政府的许多政策并不能采取指令性规定强制实施,只能依靠宏观调控的手段进行,因此,政府在制定政策时必须考虑政策实施的效果,要研究博弈主体决策行为的相互依赖和相互影响,考虑经济主体的预期以及所获信息对博弈均衡的制约和影响。个人的各项经济决策,要考虑到社会经济活动中其他相关主体的影响。企业作为生产者,目标是利润极大化。从这个目标出发,它对投入、产出的种类和数量进行选择,对自己的收入转化为积累与个人的收入分配比例进行选择,这个过程是一个博弈决策的过程。经济体制改革改变了政府全面控制整个经济活动的局面,企业和个人在经济活动中的独立性与能动性日益增强,研究各经济主体在经济活动中的博弈和均衡是研究经济运行机制和规律的重要内容,而专门研究相互依赖、相互影响的理性决策行为的博弈论方法,为政府利用经济理论分析政策问题提供了一种有效的手段。信息经济学是不对称信息博弈论在经济学上的应用,即研究在给定信息结构的条件下,进行最优的契约安排。我国经济转型时期的许多工作需要信息经济学的理论。信息经济学中信息的不对称包括不对称发生的时间和不对称信息的内容。从不对称发生的时间看,债转股的不对称可能发生在相关利益者签约之前,也可能发生在签约之后,分别称事前不对称和事后不对称。研究事前不对称信息博弈的模型称为逆向选择模型,研究事后不对称的模型称为道德风险模型。在信息经济学中,将博弈中拥有私人信息的参与人称为代理人,不拥有私人信息的参与人称为委托人。信息经济学的所有模型都可以在委托人代理人的框架下分析。债转股政府、资产管理公司和债转股国有企业之间的关系就存在特殊的值得深入探讨的委托代理关系。博弈论理论的成熟,极大地促进了委托代理理论的发展,委托代理理论可以模型化如下一类的问题:委托人(如政府)想使代理人(如债转股国有企业的经营者)按照前者的利益选择行动(如使股权回购和国有资产保值增值),但委托人不能直接观测到代理人选择了什么行动,能观测到的只是另一些变量(如企业效益、产品的市场占有率等),这些变量由代理人的行动和其他的外生的随机因素共同决定,因而充其量只是代理人行动的不完全信息。委托人的问题是如何根据这些观测到的信息来奖惩代理人,以激励其选择对委托人最有利的行动。委托人在签约时要使自己期望效用极大化,而此时会面临来自代理人的两个约束:一个是参与约束,即代理人从接受合同中得到的期望效用不能小于不接受合同时能得到的最大期望效用;另一个是代理人的激励相容约束,即代理人总是选择使自己的期望效用最大化的行动,如果委托人希望的行动正好能使代理人的期望效用最大,那么代理人就会选择它。博弈论的应用在最近一些年的发展开始从原来单纯集中于经济学领域向着整个社会科学多个领域渗透,同时,即使是经济学本身也有一些新的发现,如著名的Bertrand价格竞争模型也发现有新的混合战略纳什均衡,这种新的混合战略纳什均衡可以对我们实际所观察到的价格多样性现象作出解释。最近一些年,心理学与博弈论的结合也逐渐取得了引人注目的成就,建立在心理学证据上的博弈论发展是当前这个领域中出现的十分有趣的现象,而作为博弈论比较陈旧的领域之一的合作博弈也有新的发现。一方面是为了体现这些新的发展趋势,另一方面也是为了突出本讲义2006年春季版的特色,我们在本讲义2006年春季版中决定对2005年秋季版作一个大的甚至是根本性的改动,特别是增加了许多能够反映上述发展趋势的新内容。同时,2006年春季版在写作体系上也作了新的尝试,试图在合作和非合作博弈的内容整合上作出新的努力。一些新鲜的例子不仅仅是博弈论应用面的一个扩充,而且还体现了博弈论目前发展的活力,以及通过博弈论这种工具使得经济学逐步从一种抽象的纯粹理论形态向着可操作的应用形态的转变开始变得可能。这一点从匹配问题的解决过程中可以比较明确地看出来,以至于有人提出通过博弈论方法的应用将许多经济领域的机制设计统一形成一个所谓“经济工程学”的新兴学科的构想。不管这一富于想象力的创意最终是否能够实现,博弈论在把抽象经济理论变得更加可操作这一点上起着至关重要的作用是无可质疑的。参考文献1 张维迎. 博弈论与信息经济学. 上海人民出版社. 19962 谢枳予. 经济博弈论. 复旦大学出版社. 19973 Harsanyi, John. “Approaches to the bargaining problem before and after the theory of games”, Econometrica 1956.24,144-1574 Harsanyi, John. A bargaining model for the cooperative n-person game” in Contributions to the Theory of Games 4,edited by A.W. Tucker and R.D Luce, Princeton University Press, 1959, 325-3555 Harsanyi, John. “Bargaining and Conflict Situations In The Light of A New Approach to Game theory”, American Economic Review LV, 1965, 447-4576 Harsanyi, John. “Games with Incomplete Information Played by Bayesian Players, I: The Basic Model” Management Science. November 1967.14:159-82.2,1457 Harsanyi, John(1968a). “Games with Incomplete Information Played by Bayesian Players, II: Bayesian Equilibrium Points” Management Science. January 196814:320-34.49,63n8 Harsanyi, John(1968b). “Games with Incomplete Information Played by Bayesian Players, III: The Basic Probability Distribution of the Game” Management Science. March 1968.14:486-502.49,63n.9 Harsanyi, John (1974). “An Equilibrium-Point Intrpretation of Stable Sets and a Proposed Alternative Definition,” Management Sci.20,1472-149510Selten, Reinhard (1975). “Rexamination of the Perfectness Concept for Equilibrium Points in Extnsiv Games” International Journal of Game Theory.1975.4:25-55.2,115n,14511Von Neumann, John (1928). “Zur Theorie der Gesellschaftspiele” Mathmatische Annalen. 1928. 100:295-32012Von Neumann, John & Oskar Morgenstern (1944). The Theory of Games in Economic Behavior. New York: Wiley, 1944.1,6n,46,88n13Von Zermelo, E.(1913). “Uber eine Anwendung der Mengenlehre auf die Theorie des14Schachspiels” Proceedings, Fifth International Congress of Mathematicians.1913.2:501-410第二章 战略式博弈2.1 博弈模型的战略式表述2.1.1 一个启发性的例子考虑下述的一个启发性的例子。有两个销售同样产品的销售商1和2打算进入某一区域性市场。由于这个区域市场对产品的需求是有限的,当他们都同时进入该区域市场时,他们各自占有的市场规模都偏小,从而造成1个单位的亏损;但是,当只有一个销售商进入该区域性市场时,则获得1个单位的利润;当然,不进入市场时的利润为零。假如1和2同时进行决策或者他们在进行各自的决策时并不知道另一方的选择,它们的支付情况可由“支付矩阵”表示出来,见表2.1。表2.1 市场进入的静态博弈2进入不进入1进入1, 11, 0不进入0, 10, 01和2的行动选择范围都是“进入”或“不进入”。当2选择“进入”时,1的最优行动选择是“不进入”,而给定1选择“不进入”时,2的最优选择是“进入”。因此,结果(不进入,进入)有两个非常有趣的特点:(i)给定信念下行动选择是最优的,(ii)信念是正确的。类似地,结果(进入,不进入)也有这种有趣的特点。我们称这个博弈为“市场进入博弈”。2.1.2 博弈模型的战略式表述尽管这个启发性例子十分简单,但它却显示出一个战略式博弈的主要性质。抽象地表达就是:定义2.1:一个战略式表述博弈有下列组成部分:一群博弈参与者:;每个参与者有一行动集,行动集包括其可选择的所有行动,;每个参与者有一个收入函数(或效用函数),其中。博弈参与者(players):每个博弈都有参与者,或局中人,记为一个参与博弈的成员(),则为所有局中人构成的集合。象棋比赛由两人参与,因此;麻将要有四个人参与,因此。参与博弈者(局中人),可以是作为自然人的个人,也可以是企业、团体、组织机构、国家等。博弈论假定局中人是追求效用最大化的理性人,即他们会根据自己的信念,选择他们觉得最好的行动。行动空间(action space):每个参与者有一行动集,该行动集包括可供其选择的所有行动,称为行动空间。记中的一个元素为;又记为一个行动组合。行动组合告诉我们每个局中人的行动。又记,称为行动组合空间。有时也称行动为“战略”,称行动空间为“战略空间”,称行动组合 为“战略组合”,称行动组合空间为“战略组合空间”。收入函数(payoff function):指局中人从博弈中获得的效用水平或利润水平或其他形式的目标函数。根据我们在前面给出的说明,无论是什么样形式的收入函数,它们一般都是以效用函数作为其基础的。如果所有局中人选择,则i的收入为。局中人的收入不仅是该局中人自己所选战略的函数,而且还是所有其他局中人选择的战略的函数。在具体的分析中,可以用利润最大化或其他目标函数来代替效用最大化,但这些不同的目标函数之间并不存在矛盾,它们都应被理解以效用最大化为一致性基础的相互可替代的表达方式。运用这些概念,我们就能将本章开始所给出的“市场进入博弈”描述如下。,=不进入,进入,(进入,进入)=(进入,进入)=-1,(不进入, 进入)=(进入,不进入)=0,(进入,不进入)=(不进入,进入)=1,(不进入,不进入)=(不进入,不进入)=0。上述表达就完成了战略式博弈的形式上的描述。我们还做出这样的一个额外假定,即对于局中人们正在进行的博弈之描述是他们作为共同知识所知道的。也就是说,每一个局中人知道他们正在进行的博弈,每一个局中人知道其他的每一个局中人知道正在进行的博弈,每一个局中人知道每一个局中人知道其他的每一个局中人知道正在进行的博弈,等等。为了把市场进入博弈作为一个例子,这样的共同知识保证每一个企业知道他们正在进行一个市场进入博弈,而不是猜谜游戏,每一个企业知道其对手知道这是一个市场进入博弈,而不是猜谜游戏,等等(在许多场合,该假定并不是必需的,我们随后将在本书的几个地方重新回到这个问题上来)。定义2.2:当局中人的个数为有限数且每个局中人的行动空间或战略空间中的元素只有限个时,称博弈为有限博弈(finite game)。显然“市场进入”博弈是有限博弈。2.1.3 例子让我们来看看一些简单的战略式表述博弈。例2.1:囚徒困境(Prisoners Dilemma)假设有两个小偷1和2联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两人都认罪,则各被判刑8年。如果一人认罪,另一人不认罪,则认罪者立即释放(因成为污点证人),不认罪者加重判刑至10年。如果两人都不认罪,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。表2.2 囚徒困境博弈2认罪不认罪1认罪8,80,10不认罪10,01,1我们假定两个局中人都只在乎各自的刑期,且支付等于刑期的负数。则这个博弈可如下描述之。,=认罪,不认罪,(认罪,认罪)=(认罪,认罪)=8,(认罪,不认罪)=(不认罪,认罪)=0,(不认罪,认罪)=(认罪,不认罪)=10,且(不认罪,不认罪)=(不认罪,不认罪)=1。显然,这是一个有限博弈。例2.2:性别战(Battle of the Sexes,简写为BOS)表2.3给出一个被称为“性别战”的博弈,这个博弈说的是一对处于热恋中的青年男女准备来一次约会,男孩喜欢欣赏足球比赛而女孩喜欢看芭蕾舞表演。当然,他们俩都更喜欢在一起看表演而不愿分离,分离(哪怕是短暂的)带给他俩的痛苦会完全抵消掉独自看自己喜欢的表演所带来的快乐,当心爱的人儿不在身边时,哪有心思去欣赏表演或比赛呢?表2.3 性别战博弈女孩足球芭蕾男孩足球2,10,0芭蕾0,01,2,=足球,芭蕾,其中;(足球,足球)=2,(芭蕾,芭蕾)=1,(足球,足球)=1,(芭蕾,芭蕾)=2,(足球,芭蕾)=(芭蕾,足球)=0,。这也是一个有限博弈。例2.3:猜谜游戏(Matching the Pennies)两个小孩子手里各拿着一枚硬币,决定要出示正面或反面。如果两枚硬币同时以相同的面被两个小孩子出示,则小孩子1付给小孩子2一分钱;否则,小孩子2输给小孩1一分钱。表2.4给出了这个博弈的支付矩阵。表2.4 猜谜游戏小孩2正面反面小孩1正面1,11,1反面1,11,1,=正面,反面,其中;,如果,且在其它情形;。这仍是一个有限博弈。例2.4:石头,剪子,布(Scissor,Rock,Paper)请读者回忆你的孩提时代,想想你们那时曾玩过哪些游戏,我们想少不了有一种游戏大家都曾玩过,那就是“石头、剪子、布”。这种游戏相信有着古老的起源,甚至世界各地都有类似玩法。“石头、剪子、布”游戏有两个玩手,游戏规则是这样的:石头胜剪子,剪子胜布,布胜石头。譬如,当一方出石头而另一方出布时,则后者就赢了前者。如果双方都选择相同的行动,则为平局。我们在表2.5中给出“石头、剪子、布”的一种战略式表述。表2.5 “石头、剪子、布”博弈2石头剪子布1石头0,01,11,1剪子1,10,01,1布1,11,10,0,=石头,剪子,布,其中;(石头,剪子)=(剪子,布)=(布,石头)=1,(石头,石头)=(剪子,剪子)=(布,布)=0,(剪子,石头)=(布,剪子)=(石头,布)=1,对于所有的成立。这还是一个有限博弈。例2.5:古诺(Cournot,1838)寡头竞争模型假定有2个完全相同的企业生产相同的一种商品。第i个企业生产单位产出的成本为。进一步,设所有企业生产的总产出为Q,假定逆需求函数为线性函数; ,如果 ,若,其中,且皆为常数,我们还假定(否则企业在任何情况下都不会有利润)。于是,企业1的利润为:注意,由于任何都会带来零价格并使企业i亏损,故任何这样大的都是不合理的。因此我们假定不能超过。所以,,,()=(),可类似定义。这个博弈不是有限博弈。因为每一个局中人都有无限多种行动可选择。2.2 纳什均衡2.2.1 纳什均衡的定义我们现在来引入博弈论中的一个核心概念纳什均衡。一个纳什均衡恰好是对于每一个局中人来说是这样的一个战略组合,即给定其他人的战略,每一个局中人的这个战略最大化其期望效用。定义2.3:对于战略式博弈 ,行动组合若满足如下条件:,则称为纳什均衡(符号“”表示“任意的”)。即是说如果对于每一个,是给定其他局中人选择的情况下第个局中人的最优战略。或者用另一种表达方式:是一个纳什均衡,若,纳什均衡的含义是说:当局中人们在某一选定的战略组合下都没有动机(单方面)偏离各自已选定的战略时,该战略组合就构成一个纳什均衡。当定义2.3中的不等式为严格不等式时,我们得到“强(严格)纳什均衡概念”,于是我们有如下定义:定义2.4 一个纳什均衡是强的(Strict或Strong),如果给定其他局中人的战略,每一个局中人的最优选择是唯一的。即是说是一个强纳什均衡,当且仅当对于所有的,有如果一个纳什均衡是强的,则没有任何局中人在均衡战略与某些其他战略之间是无差异的,在弱纳什均衡情况下,有些局中人可能在均衡战略与非均衡战略之间是无差异的,既然是无差异的,为什么选择均衡战略而不选择其他战略呢?由于这个原因,强纳什均衡比弱纳什均衡是一个更为可取的概念。此外,强纳什均衡对博弈支付的微小变化并不敏感,这保证了博弈模型预测功能的稳健性。2.2.2 求解纳什均衡一般而论,不同情况下的纳什均衡有不同的求解方法。在两人有限博弈的战略式表述场合,我们可直接使用一种十分简便的方法找出模型中所有的纯战略纳什均衡,这就是“划线法”。在表2.6中,我们在给定A的每一个战略选择下找到B的最大支付所对应的B的战略,然后在该最大支付的下端划上一条短横线;同样地,我们接着又在给定B的每一战略选择下找到A的最大支付所对应的A的战略,然后在该最大支付的下端划上一条短

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论