浅议博弈论与纳什均衡_第1页
浅议博弈论与纳什均衡_第2页
浅议博弈论与纳什均衡_第3页
浅议博弈论与纳什均衡_第4页
浅议博弈论与纳什均衡_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息经济学PAGEPAGE2浅议博弈论与纳什均衡【摘要】纳什均衡是博弈论的经典理论,自上个世纪50年代提出以来日益受到人们的关注与重视,在经济学中的应用越来越广泛。同时,纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域也奠定了坚实的理论基础。本文将从博弈论及纳什均衡的定义、主要思想、代表人物、应用等方面简单论述博弈论与纳什均衡。【摘要】博弈论;纳什均衡;冯·诺依曼;囚徒困境引言博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论。两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽。作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期。然而,它过于抽象,实用性不强,其局限性日益暴露出来。50年代以来,纳什(Nash)、泽尔腾(Selten)、海萨尼(Harsanyi)等人使博弈论成熟并最终进入实用。最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情。博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具。博弈论的概念诠释博弈论研究的是策略性博弈,参与博弈的各方都拥有若干可供选择的行动方案,称为策略,博弈就是各方之间的策略性较量。所有博弈方各取一个策略参与对弈,形成一个对弈局势,各有一定得分;各方得分之和恒为零的是零和博弈,否则为非零和博弈。在一个博弈系统的所有可能局势中,如果存在一个具有稳定性的局势,尽管得分都不理想,各方却宁愿维持这一局势而不会主动改变策略,就称此局势为一个纳什均衡1。一个非零和博弈系统可能有0个、一个或多个纳什均衡。简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡。博弈论由3个基本要素组成:一是决策主体(Player),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(Utility),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数。参与人、策略集和效用构成了一个基本的博弈。三、博弈论的主要思想一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G={P,A,S,I,U)P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。A:为各局中人的所有可能的策略或行动的集合。根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等。S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,称为静态博弈;局中人行动有先后次序,称为动态博弈。I:博弈信息,能够影响最后博弈结局的所有局中人的情报。信息在博弈中占重要的地位,博弈的赢得很大程度上依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈。反之称为“不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈与变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。前者主要强调的是团体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,即策略选择问题,强调的是个人理性。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能,则称非合作博弈,非合作博弈是现代博弈论的研究重点。博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识(信息)是否了解两个角度进行。把两个角度结合就得到了4种博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。严格地讲,博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故。博论已经在政治、经济、外交和社会学领域有了广泛的应用,它为解决不同实体的冲突和合作提供了一个宝贵的方法。目前谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡。在这一点上,博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和中突、竞争与合作,而这正是博弈论的研究对象。四、博弈论的代表人物博弈论主要是由冯·诺依曼(1903~1957)所创立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼(VonNeumann)已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯坦思(OskarMorgenstern)并与其合作才使博弈论进入经济学的广阔领域。1944年他与奥斯卡·摩根斯坦恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的初步形成。书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼博弈论的局限性也日益暴露出来,它过于抽象,应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,影响力很有限。正是在这个时候,非合作博弈——“纳什均衡”应运而生了,它标志着博弈论的新时代的开始。纳什是一位天才式的人物,上大学时就开始从事纯数学的博弈论研究,特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。纳什博士1950年11月刊登在美国全国科学院每月公报上的两篇论文将冯·诺依曼的“最小最大原理”推广到非合作博弈领域,找到了普遍化的方法和均衡点,比冯·诺伊曼的合作博弈理论更能反映现实的情况。20世纪50年代以后,泽尔腾、海萨尼等人对博弈论作了进一步的完善,使之更为实用。近20年来,博弈论作为分析和解决冲突和合作的工具,在管理科学、国际政治、生态学等领域得到广泛的应用。五、纳什均衡与博弈论的应用“囚徒困境”(Prisoner’sDilemma)至今仍然是博弈研究的重要课题。两个嫌疑犯作案后被警察制度安排便不能成立。两家企业A、B合作建设一条VCD的生产线,协议由A方提供生产VCD的技术,B方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时B方如果能够获得A方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理,A方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的“集体利益”,则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。合作博弈强调的是集体主义,团体理性(CollectivcRatlionality),是效率、公平、公正;而非合作博弈则强调个人理性,个人最优决策,其结果是有时有效率,有时则不然。现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战——这些大战的受益者首先是消费者。厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈其结果会如何呢?每一个企业,都会考虑是采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。除了“囚徒困境”以外,博弈论学者还总结出许多博弈的模型。如智猪博弈(BoxedPigs)来解释多劳者不多得;性别战(BattleofSexes)来解释互动博弈;斗鸡博弈(ChickenGame)来解释一方的妥协等等。然而,博弈论还是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,"由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。"斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择--坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当•斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为"纳什均衡",也叫非合作均衡。因为,每一方在选择策略时都没有"共谋"(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。"囚徒的两难选择"有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个"纳什均衡",也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论