




已阅读5页,还剩116页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
从扑克游戏到诺贝尔奖,IntroductiontoGameTheory,1,博弈论(gametheory)是由美国数学家冯诺依曼(Von.Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、军事、政治科学、人工智能、生物学、火箭工程技术等。在1994年,三位博弈论专家即数学家纳什(Nash,他的故事被好莱坞拍成了电影美丽心灵,该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖。,2,约翰纳什(John.F.J.Nash)1928年生于美国西弗吉尼亚,1950年于普林斯顿获数学博士学位,曾任教于MIT,现为普林斯顿大学教授。主要著作为:n人博弈中的均衡(),不合作博弈论().,3,4,1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。专家预计,近几年还会有更多的博弈论专家可能获得诺贝尔经济学奖。,5,为什么博弈论在经济学领域会产生如此大的影响呢?这是因为博弈论改变了传统微观经济学的某些基本假设,从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。,6,博弈论是一门十分有趣但理论上又是十分艰深的学问,本节介绍一些大家能够凭直观或简单分析就能把握的例子,为大家介绍博弈论的基本概念及应用,以引起大家对这门目前已成为热门科学的兴趣和获得初步的了解。这些例子也是我们在日常生活中经常所遇到的问题或观察到的现象,通过博弈论,我们能够更加深刻地理解它们。,7,一、什么是博弈论:从“囚徒困境”谈起,1.囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。,8,表1囚徒困境博弈乙招不招招甲不招(问题1:甲、乙如何选择?),9,甲和乙是参与博弈的人,称为“局中人”。表1中每一个小方格内的数字被称为局中人的支付,其中左边的数字代表甲的支付,右边的是乙的支付。表1中的双变量矩阵称为博弈支付矩阵。甲或乙可以作出的选择被称为“战略”,如“招”或“不招”都是战略。,10,对甲来说,尽管他不知道乙是选择了“招”还是“不招”,他发现他自己选择“招”都是比选择“不招”为好的。因此,“不招”是相对于“招”的劣战略,他不会选择劣战略。所以,甲会选择“招”。同样,根据对称性,乙也会选择“招”,结果是甲乙两人都“招”。甲和乙都不会选择劣战略“不招”,称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。,11,囚徒困境博弈虽然简单,但是却体现了非合作博弈的基础,称(招,招)为“纳什均衡”。纳什均衡是局中人战略选择上构成的一种“僵局”,给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其战略选择。所以,可以预期(招,招)是甲乙最终完成的稳定的选择。囚徒困境反映了个人理性和集体理性的矛盾。,12,对经典经济学的冲击“纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。国富论:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”,13,从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,纳什均衡”提出的悖论实际上动摇了西方经济学的基石。,14,研究囚徒困境问题的目的利用这种困境达到有利于社会的目的政府在经济活动中的组织协调工作的必要性避免囚徒困境,15,2.生活中的“囚徒困境”例子,例子1商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都不能获得超额利润。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。,16,譬如,生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。2008年,方便面厂家合谋涨价。,17,但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的。,18,类似的例子还有:政府要负责修建公共设施,因为私人没有积极性出资修建公共设施苏格兰的草地为什么消失了?公共资源经常被过度利用。渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。问题:为什么在城市中心道路上禁止汽车鸣喇叭?,19,3.机制设计:如何走出囚徒困境,如果恰当进行机制设计,前述囚徒困境还是可以避免的,下面是一个商战中的真实例子。,20,冻结价格战的博弈机制,美国有两家销售音像商品的商店“疯狂艾迪”(CrazyEddie)和纽马克与露易斯(Newmark&Lewis),它们之间在市场上存在竞争。当它们进行合谋时,如何保证对方不会背叛而降价的一个前提就是如何能迅速查出对方的背叛行为并给予惩罚。,21,“疯狂艾迪”已作出了承诺“不可能有人卖得比我们更低,我们的价格最低廉,我们保证价格最低,而且是超级疯狂的低”。而对手企业Newmark&Lewis也打出“只要买我们的东西,将得到终生低价保证”。它承诺:假如你能在别处买到更低的价格,我们将加倍退钱。,22,广告承诺:假如你在本店买了商品之后,在你一生中于任何本地的销售商(本行销区内)那里发现相同的广告款式而价格却较本店低的话(以单据为凭),本店愿支付百分之百的差价,并额外付给差价的百分之二十五(以支票支付);或是给你差价百分之二百的本店换货单(除了原差价的百分之一百外,再额外加给百分之百,都是以换货单方式支付)。Newmark&Lewis公司终身低价保证,23,乍一看,这两家企业在玩命竞争,根本不可能形成价格联盟,即使形成也难以维持,因而它们之间似乎是在打价格战。但是,一种潜在的侦察降低价格行为的机制阻止了价格战的发生。例如:每台录相机的批发价为150美元,此时两家企业正以每台300美元的价格出售。“疯狂艾迪”打算降为每台275美元,从而将对手的顾客拉过来,例如那些家住在对手售货点附近或过去曾买过对手商品的顾客。,24,但是,对手的战略锁定了“疯狂艾迪”的行为,因为“疯狂艾迪”的这一计划会有相反的效果。因为顾客会到对手那里先以300美元买下录相机,然后再获退款50美元。这样,对手自然将价格降到更低的价格250美元一台,顾客反而是从“疯狂艾迪”那里流向对手而不是相反。,25,如果对手不想以250美元一台出售录相机,他也可以将价格降到275美元一台,只要它发现有顾客来要求退款,就会发现对手的背叛行为,从而将价格降到了250美元一台。既不以太低价出售,又快速发现对手的背叛从而以降价予以报复,使对手降价也不能增大顾客量,从而蒙受损失。,26,这样,“疯狂艾迪”就没有进行价格战的意愿了,自然形成价格联盟。在美国,明目张胆的价格合盟是违法的,但这两家企业却以不违法的方式形成了价格合盟,顾客成了背叛行为的侦察者,这一战略是十分巧妙的。国美、工贸家用电器销售策略,27,二、智猪博弈:对诸多经济现象的解释,1.智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。表2给出这个博弈的支付矩阵。,28,表2智猪博弈小猪按等待按大猪等待,29,这个博弈大猪没有劣战略。但是,小猪有一个劣战略“按”,因为无论大猪作何选择,小猪选择“等待”是比选择“按”更好一些的战略。所以,小猪会剔除“按”,而选择“等待”;大猪知道小猪会选择“等待”,从而自己选择“按”,所以,可以预料博弈的结果是(按,等待)。这称为“重复剔除劣战略的占优战略均衡”,其中小猪的战略“等待”占优于战略“按”,而给定小猪剔除了劣战略“按”后,大猪的战略“按”又占优于战略“等待”,30,2.例子在经济生活中,有许多“智猪博弈”的例子。例子:股市博弈在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。他们不会花成本去进行分析,而是跟着大户的投资战略进行股票买卖,即所谓“散户跟大户”的现象。问题:为什么中小企业不会花钱去开发新产品?,31,三、动态博弈与承诺行动,如果局中人在进行行动选择时有先后顺序之分,这种博弈就被称为“动态博弈”。例子3欧共体在空中客车与波音公司的竞争中对空中客车公司的战略性补贴。欧共体为了打破美国波音公司对全球民航业的垄断,曾放弃欧洲传统的自由竞争精神而对与波音公司进行竞争的空中客车公司进行补贴。,32,表3未补贴时的博弈空中客车开发不开发开发波音不开发,33,此时有两个纳什均衡,即一家开发而另一家不开发。下面,考虑欧共体对空中客车进行补贴20个单位的情况。此时,当两家都开发时,空中客车仍然盈利10单位而不是亏损,博弈矩阵见表4,34,表4有补贴时的博弈空中客车开发不开发开发波音不开发,35,这时只有一个纳什均衡,即波音公司不开发和空中客车公司开发的均衡(不开发,开发),这有利于空中客车。在这里,欧共体对空中客车的补贴就是使空中客车一定要开发(无论波音是否开发)的威胁变得可置信的一种“承诺行动”。,36,例子:为什么大人物、大公司要聘请常年律师大人物、大公司对声誉十分看重,因而有一些不良人物或公司通过诽谤大人物、大公司企图迫使大人物、大公司花钱“私了”而获利。这是因为,尽管对于一些无端的指控,大人物、大公司可望通过法律手段(打官司)而出清了结,但打官司请律师会增加他们额外的成本。如果能花稍少一些钱“私了”,则既使自己清白又省钱,同时诽谤者也获得收入。,37,大人物、大公司为了避免这种无端的损失,干脆花钱请常年律师,律师费用已经一次性支付,打官司不会带来额外的花费。这是一个承诺行动,它告诉潜在的诽谤者,大人物、大公司一旦受到无端诽谤必定会让他们吃官司。这样,大人物、大公司因此承诺行动而使自己得到保护,避免了许多无端指控的发生。,38,我们可以运用“承诺行动”的原理来分析许多经济及军事现象。例子项羽的“破釜沉舟”。例子韩信赵国之战,“置之死地而后生”,39,四、不对称信息下的博弈,博弈论作为经济学研究的有力工具,真正大行其道是在70年代不对称信息下经济行为分析的兴起。不对称信息指一些局中人拥有别的局中人不拥有的“私人信息”,也就是说一些局中人知道别的局中人不知道的某些情况。下面用一些例子说明这种情形下的博弈行为。,40,问题:二手车市场为什么难以建立?,在发达国家,二手车(旧车)的价格往往比新车差一大截,即使旧车本身没有什么质量问题,一旦旧车进入二手车市场,其价格就会与新车相比差得老远。在我国许多城市,二手车市场甚至难以建立起来,原因是进入市场的买车人太少。这是为什么呢?二手车市场的博弈理论为我们解答了这个谜。,41,在二手车市场上,卖车人比买车人更多地知道车的质量情况,但卖车人不会将旧车的质量问题老老实实地告诉买车人。买车人也知道这种情形,因此,买车人在开出价格时会考虑到车的质量问题。假定没有问题的好车价值20万元,有问题的坏车只值10万元,并且设买车人认为市场上出现好车和坏车的可能性各占一半。这时,买车人开出的价格不会高于1/220+1/210=15万元。这样,如果卖车人的车果真是好车,他就不会出售,好车退出市场,但当卖车人的车是坏车时,他会十分积极地将只值10万元的车按15万元卖给他。,42,但买车人知道愿意按15万元卖的车一定是坏车,从而认定市场上全是坏车。所以,除非他愿意买一辆坏车,否则他会退出市场。当他愿买坏车时,他只开出10万元的价。于是,旧车市场或者建立不起来,没有买主,或者充斥着坏车,真正的好车退出市场,而坏车在不断成交,但价格很低。类似现象广泛存在如人才市场、信贷市场等。如一个公司往往流走的是能力强的人,因为公司不能正确评价一个能力强的员工的能力,给予的薪水低于其市场价值。,43,维克里拍卖法,英式拍卖法:轮流出价,直到开除最高价的买主获得,并支付所开出的最高价格。公开竞价,容易出现围标问题。一级密封价格拍卖法:密封出价后交给卖主。统一拆开信封后,卖给出价最高的买主,并支付相应价格。不会报出心中的价值。二级密封价格拍卖法(维克里拍卖法):密封价格交给卖出,统一拆开后,卖给出价最高的人,按照第二高的价格成交。会按照心中的价值出价。70年代美国联邦政府采用维克里拍卖法进行公共工程招标。,44,例子:垄断厂商的低价销售:信号传递博弈有许多垄断厂商并未如人们所料想的那样给商品定出一个很高的价格,而是以较低的价格长期销售某种产品。譬如,发达国家的私营铁路、航空、海运码头等的价格都远低于按照其垄断定价方法定出的价格。这是什么原因呢?,45,一个电视剧,有一个情节是一位武林豪杰在交通要道边开了一个酒馆。生意十分兴隆,引起另一位武林高手的垂涎。两强相遇,武林豪杰和武林高手相互之间不知对方底细,于是来一番比试。本来,他们俩可以通过打斗来解决问题,但打斗一场双方都会有所损伤,不如通过其他方式比较武功高低。豪杰拿来5块砖,一掌将其击碎,高手也不示弱,照样击碎5块砖。于是,豪杰又拿来10块砖,同样是一掌击个粉碎,高手见之,心中没底,于是明白自己武功较豪杰还差一截。于是,这位武林高手甘拜下风,放弃了原来的计划。,46,这个电视剧情节在博弈论中被称为“信号传递博弈”。豪杰身怀绝技、天下无敌。但其他人不一定会相信他是武林第一高手,除非亲自与之交手并败于他。交战虽然可以决出高下,但对双方都会有损失,打个头破血流对谁都不是好事。当然,豪杰可以对外宣布他的武功非凡,其他人不是他的对手,但即使豪杰没有什么本事,也可以如此对外宣布。所以,仅凭口头宣布是难以令人信服的。,47,俗话说,是骡子是马,拉出去蹓蹓。豪杰用过人武功劈掉别人难以完成的十块砖,就向别人发出一个信号。这个信号向外传递的信息是:我的武功高强,你们不可匹敌。这样,不用打斗就决出高下,避免了打斗带来的更大损失。现在,我们用这个“信号传递博弈”的原理,来解释为何一些垄断厂商长期在低价格水平上经营。如果这个垄断厂商是一个低生产成本的厂商,当其它较高生产成本厂商也进入这个厂商所经营的行业与之进行竞争时,原先的那个垄断厂商可以通过降价将进入者赶出这个行业,从而继续维持垄断经营。,48,由于垄断厂商有更低的生产成本,所以,它能够将产品价格降到比进入厂商的生产成本还要低的水平上,这就造成进入者或者高价格经营导致顾客流失,或者同样也降价但价格低于成本,两种情形进入者都会亏损,最后不得不退出行业。但是,这种“打斗”行为尽管可以击退进入者,但由于一段时间的降价经营可能对垄断者带来较大损失。垄断者为了避免这种损失,可以向外宣布它是低成本的,别的厂商休想进来与它竞争。但仅凭口头宣布人家是不会相信的,因为即使垄断者不是低成本的厂商,它也会如此宣布。,49,一种方法就是,正如电视剧中的故事那样,垄断者向外发送一个信号,向外界传递它真是低成本的信息。它可以长期在一个较低价格水平上经营。如果它的价格足够低,高成本厂商不敢模仿,行内厂商会据此判定它确是低成本的。同时,它的价格也不能太低,以致于较之与进入者进行降价竞争,其损失为小一些。这样,垄断者才会采取如此策略。潜在的高成本进入者不敢进入,垄断者得以保持长期的垄断地位。问题:为什么商品广告既无商品的价格信息又无售货地点信息,只有大明星的表演?,50,五、混合战略博弈,小孩玩的游戏“石头,剪子,布”,也是一种博弈。但是,这个博弈有一种有趣的特征,即给定一方的任何选择,另一方都有制胜对方的战略,所以,给定一方任何一个战略,对方都有制胜这个战略的战略,因而这个战略不是最优的。任何“纯战略”都不是最优的,纯战略是“石头,剪子,布”中的任何一个,51,但是,我们知道,玩这个游戏是总是以对方不易猜出的随机方式出招。事实上,可以通过数学证明,当双方都以每个战略按1/3的概率出招时,达成一种双方都不愿改变这种概率分布的局面。这被称为“混合战略纳什均衡”,而这种以随机方式选择纯战略的博弈被称为“混合战略博弈”。以混合战略博弈的概念,我们来看下面这个例子。,52,例子:如果曹操与诸葛亮一样聪明三国演义中的华容道博弈在三国演义中,曹操在赤壁大战中一败涂地,率残兵败将向许都方向逃窜。诸葛亮命关羽率兵在途中阻截曹军。当时,第一批拦截大军是赵云率领的,第二批拦截大军是张飞带队的,第三批才是关羽率部伏击。由于曹军兵多将广,前二批伏击军不能逮住曹操,只是抢夺一些军械马匹之类。,53,待曹军冲过赵云、张飞两道关后,进入关羽的伏击地带。但是,当时关羽与曹操相遇的地方有两条道,一条是华容道,除此外还有另一条大道。诸葛亮令关羽伏兵于华容道,并且要求关羽在华容道上点燃树枝冒出烟雾引曹操到来。当时关羽不解,问诸葛亮,“如果在伏兵之处点火,岂不令曹兵看见而改走另一条道逃脱?”诸葛亮叫关羽不要再问,只如此照办即可。,54,当曹操冲破赵云、张飞的阻截后,来到华容道前,看见华容道上静悄悄的,但有烟火萦绕。曹操大笑道:“孔明以为我会上他的当,故意叫人在华容道上点火让我走另一条道,而他却伏兵于这条道上好逮住我呢!我偏不上他的当!”于是,曹操令大军径直上华容道上而去,结果与关羽大军撞个正着。,55,曹操为何进了孔明的圈套呢?这里的道理是这样的:孔明知道曹操是聪明人,而聪明人见华容道上有烟火会认为华容道上有伏兵,于是会避开华容道而走另一条路。如果孔明令关羽在另一条路等着,曹操就被逮住了。但是,曹操不仅聪明,而且还聪明过人,他也知道孔明的如此盘算来诱他上钩,他偏不上当,知道点火的华容道上无人,孔明的队伍在另一条道上呢!于是他选择走华容道。,56,但是,依三国演义中的逻辑,孔明总是比曹操计高一筹,按博弈论的术语来说,就是孔明的理性程度要比曹操高上一阶。孔明也知道曹操知道孔明的打算,于是令关羽正好在点火的华容道上等着曹操。三国演义中的这个故事很可能是作者编造的,因为在三国志中并无这一情节。这里,假设了曹操在智力上比孔明差一些,才有华容道上被关羽抓住,要不是关羽旧情难忘,曹操就死无葬身之地了,57,但是,如果我们不假定曹操比孔明要笨一些,而是相反假定曹操与孔明一样聪明,则曹操又知道孔明知道曹操知道孔明的打算,曹操就会知道关羽在华容道上等着他呢?此时曹操就避开华容道走另一条路。但是,这还没有完,因为若孔明知道曹操知道孔明知道。显然,最终的结果是曹操与孔明进行混合战略博弈,曹操随机地以1/2的概率选择走华容道和另一条路,孔明也以1/2的概率令关羽守华容道或另一条路。,58,于是,三国演义中的这一情节就应作如下改写:“诸葛亮抛出一枚硬币,决定关羽是守华容道呢还是另一条道,而曹操也掷出一枚硬币,决定是走华容道呢还是走另一条路。”平均看来,曹操有1/2的概率逃脱,而关羽也只有1/2的概率抓住曹操。如果说关羽在华容道上抓住了曹操,则纯属偶然、并非孔明比曹操计高一筹所致!,59,七、机制设计:如何走出囚徒困境,如果恰当进行机制设计,前述囚徒困境还是可以避免的,下面是一些社会生活中的真实例子。,60,有这样一个故事,称为“旅行者困境”,说的是有两个旅行者甲和乙从一个以出产花瓶的著名旅游胜地回来时,他们都买了同样的花瓶。提取行查时,发现花瓶被碰破了。他们向航空公司索赔。航空公司估计花瓶的价格在80或90元的价位左右,但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内自己写下花瓶价格。若两人写的相同,说明他们说了真话,就照他们写的数额赔偿;如果两人写的不一样,那就认定写得低的旅客讲的是真话,按这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。,61,如果两人都写100元,他们都会获得100元。但是,给定乙写100元,甲改写99元,则他会获得101元。乙又想,若甲写99元,他自己写98元,比写100元好,因为这样他获100元,而写100元当甲写99元时自己却只获97元。而给定乙写98元,甲又会写97元,这样,如果不说真话,最后落得每人都只写1、2元的境地。,62,例子飞机、轮船等设立头等舱、经济舱的道理是什么?无论是买票乘飞机、火车还是轮船,不同的人所愿意支付的价格实际上是不一样的。有的人收入高一些,或对花钱看得比较松一些,就可以支付较高的价格,相反,收入低的人或对花钱看得比较紧一些的人,就只愿支付较低的价格。但是,如果你问他们愿意支付什么样的价格,他们都必定说愿支付较低的价格,因为有钱人也愿意以低价购买同样的服务。,63,飞机或轮船公司为了将这些在经济学中被称为具有不同支付意愿的人区分开来,让能支付较高价格的人支付较高价格,就设计了一种“信息甄别”的机制,这种机制就是设立头等舱、二等舱、三等舱,等等。这种机制发挥作用的道理是这样的,我们可以用著名的“所罗门王断案”的故事来说明。所罗门王是古代以色列国的一位以智慧著称的君主。,64,一次,两个女人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。听罢这位妇人的求诉,所罗门王立即作出最终裁决婴儿是这位请求不杀婴儿的妇人的,应归于她。,65,这个故事讲的道理是,尽管所罗门王不知道两位妇人中谁是婴儿的母亲,但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈成两半的。所罗门王正是利用这一点,一下就识别出谁是婴儿的真正的母亲了。所罗门王的这种方法在博弈论中被称为“机制设计”,即设计一套博弈的规则,令不同类型的人作出不同的选择,尽管每个人的类型可能是隐藏的,别人观察不到,但他们所作出的不同选择却是可以观察到的。观察者可以通过观察不同人的选择而反过来推演出他们的真实类型。,66,当飞机的舱位条件和价格完全一样时,不同支付意愿的人都会以最低价格买票,不会有人愿支付比别人更多的钱去买相同的舱位的票。于是,航空公司将舱位分成头等舱、二等舱,等等,价格不同,当然服务也不同,就将不同支付意愿的顾客区分开了。,67,类似的还有,酒店的星级分类,五星级、四星级、三星级,酒店,冰棍的不同品种与价格,影剧院的不同座位价格表等等,都是实现信息甄别的机制设计。,68,七、总结,博弈论中涉及到的生活中的各种经济学道理是十分多而有趣的。有机会可以通过其它的著作了解到博弈论深遂的道理及其在经济分析中的应用。,69,推荐书目,初级:谢识予,经济博弈论,复旦大学出版社(美)罗伯特.吉本斯博弈论基础,中国社会科学出版社中级:张维迎,博弈论与信息经济学,上海三联书店,上海人民出版社高级:(美)朱.弗登博格(法)让.梯若尔,博弈论,中国人民大学出版社,70,博弈论与信息经济学(导论),71,导论,0.1博弈论与主流经济学的新发展一、经济学研究的问题1)传统教科书:稀缺资源的有效配置2)现代观点:研究人的行为经济学假定人是理性的理性人假设:在面临给定的约束条件下最大化自己的偏好可用数学工具研究人的行为,研究经济学。,72,理性是利己的,但在多个理性人共同作用时存在冲突,只有合作才能得到潜在的利益,因此,经济学假设人在解决冲突中的合作,在合作中实现自己的偏好最大化。3)新制度经济学价格理论(以价格制度为研究对象)基本假设:市场参与者的数量足够使市场是完全竞争的(任何人不能操纵影响价格)参与人之间不存在信息不对称,73,参与人数不是无限的,人们之间行为相互影响,一个人在最大化自己的偏好时必须考虑其他参与人的反应,因为其他参与人的反应影响着自己的偏好,这就是博弈论研究的问题。当参与人之间存在不完全信息时,任何一件制度安排(不同参与人之间的契约关系),就必须满足“激励相容性”和“个人理性”,这就是信息经济学研究的问题。不完全信息产生的问题:价格机制不是实现合作和解决冲突最有效的手段。,74,二、博弈论1)1994年三位诺贝尔奖得主Nash(纳什)Selten(泽尔腾)Harsanyi(海萨尼)2)博弈论研究问题研究决策主体直接相互作用时的决策及这种决策的均衡。研究多个互相作用的独立决策主体时对决策的合理性预期。一个决策问题对一个决策主体(参与人)的结局不仅依赖于自己的决策,还依赖于其他决策主体(参与人)的决策。每个参与人在分析互相作用对结局的影响中作出合理预期,75,3)与传统微观经济学的比较个人决策:给定价格和收入使效用最大化的决策给定价格和成本函数使利润最大化的决策问题:只依赖于自己的选择,不依赖其他人的选择。这本应是多个人在市场中的作用,但个人选择没能看出这种作用,这种相互作用浓缩在一个参数价格中。每个人的决策成为非人格化的决策:不考虑自己对别人的影响,也不考虑别人对自己的影响。博弈论:个人效用依赖于自己的选择和别人的选择。在相互外部经济条件下(一个人的行为影响其他人利益的现象)的个人选择问题。传统经济学中的双头垄断是博弈论的典型例子。,76,4)博弈论研究对象的例子决策行为相互影响决策人的利益(为本质)寡头垄断国家之间相互关系夫妻博弈中央和地方政府之间的关系5)博弈论的分类:合作与非合作博弈主要区别特征:人们的行为相互作用时,所有当事人(参与人)之间是否可达成一个具有约束力的协议。合作的根本问题:如何分享合作带来的剩余。,77,合作博弈:当事人间达成有约束力的协议团队理性(追求合作团队目标),相当于这些达成协议的当事人按这种协议关系构成。一个决策主体,即按一个合作决策主体的目标去行为,再分配合作带来的剩余与合作者之间双方合作成为完全垄断。非合作博弈:没有任何方能预测另一方接受并遵守协议,还是按自己的最优选择去行为。双头垄断中如果一方不能接受协议,则各自选择行为,最优化自己的目标(价格,产量),但他们的选择相互影响其利润这就是非合作博弈。,78,6)博弈论的发展1928年,诺伊曼在Mathmaticche上发表了博弈论数学基础。1944年,诺伊曼与摩根斯坦恩的TheTheoryofGamesandEconomicBehaviour。1950-1953,Nash四篇博弈论论文。合作博弈:Shapley模型,Gillies“核”概念50年代达到顶峰。著名的实例:Tucker(1950)发现囚徒困境问题。Tucker与Nash的文章奠定了非合作博弈的基石。Harsanyi将不完全信息列入博弈论(19671968)在ManagementScience上发表了三篇重要论文。Selten(1965)将Nash均衡引入动态相互作分析,推出精练Nash均衡概念,克服Nash均衡过多且不合理现象。Kreps和Wilson:动态不完全信息博弈。Rubinstein研究讨价还价模型。,79,7)博弈论作为一种一般方法论有人将其作为经济学分支,有人将其作为数学的一个分支。博弈论被授予经济学奖的原因:博弈论的成果广泛应用于经济学,博弈论的发展也借助经济学的原型。经济学家对博弈论作出了重要贡献。博弈论与经济学有相同的研究模式:个人理性、追求效用最大化、相互关系:博弈论直接,经济学间接价格。,80,8)个人理性与信息作用70年代以后重视个人理性:效用函数最大化。信息成为相互作用中的重要问题。决策顺序与信息:决策人不同决策顺序有不同信息,他可以根据拥有的信息作出选择。这是经济学中的重要问题,博弈论正好为解决这两个问题提供了工具。1965年Selten的工作:动态博弈考虑了博弈时序。19671968Harsanyi的工作:考虑不完全信息博弈。1982:克瑞普斯、威尔逊、米尔格罗姆、罗伯茨,关于信誉的模型相互作用中的信息传递。,81,9)博弈与信息ByEricRasmusen40年代末,计量经济学与博弈论同时发展,1969年计量经济学家挪威的费里昂和荷兰的丁伯根获得了首届诺贝尔经济学奖。计量经济学代替了经验经济学。随后计量经济学成为经济学重要部分,而博弈论被经济界遗忘。70年代后博弈论开始用于复杂经济问题(现有经济学理论无法解决的问题),特别是非对称信息,动态行为的经济问题。80年代博弈论成为主流经济学的重要部分,几乎代替了微观经济学。,82,10)博弈论在西方经济学中的地位萨缪尔森时代,几乎未用过博弈论。90年代以前的经济学著作很少博弈论。90年代以后的微观经济学最畅销书中,博弈论成为重要部分,用博弈论观点和方法改写微观经济学,特别是双头垄断问题。Trilor的TheoryofIndustryOrganization(产业组织理论)是完全在非合作博弈的基础上写的,是MIT教材,目前最受欢迎的产业组织理论教科书。牛津大学的微观经济学:90年代以前:消费者、生产者理论/市场与均衡/福利经济学/企业理论90年代以后:增加了博弈论/信息与合同理论(信息经济学),83,三经济学的发展趋势1)向强调个体发展(个体理性),放弃了一些没有微观基础的假设:如投资函数,消费函数,销售最大化。2)向研究人与人之间行为的相互作用发展。利益的一致与冲突/合作与竞争。以前人们之间的行为相互作用由价格参数间接影响。个体理性可以导致团体不理性。个体与集体间的冲突:不是通过政府干涉解决这种市场失灵导致的无效率现象,而是通过设计激励机制方法解决这种冲突,使在个人理性下满足集体理性即制度安排的重要性。3)重视对信息的研究:信息不对称时个人选择和制度安排的影响。,84,0.2非合作博弈论(简称博弈论)概述一、基本概念1)参与人(Player)也称决策人,局中人:独立选择(不受别人的控制)行为,最大化自己效用(偏好)的决策主体。2)行动:参与人决策变量。行动集:决策变量可行集。3)战略:参与人选择行动的规则。在什么条件(时刻或情况)下选择什么行为。4)信息:参与人在博弈论中作决策(选择)时拥有的知识,特别是关于对手特征(是什么)和行为(做了什么)知识。,85,5)结局:在给定的环境下,所有参与人各自采取的行动或战略构成的局势(结果)。6)效用函数(支付函数):参与人在博弈中在不同结局的效用水平。博弈结局是由所有参与人战略或行动决定的,即为所有参与人战略或行动的函数。7)均衡:参与人相互最优战略行动;参与人合理理性预期战略与行动。8)博弈规则:对个体行为方式的规范和结局的规范(结局对个人理性的描述,个体选择规则)博弈论研究目的:使用博弈规则决定均衡。,86,二、博弈(非合作)的划分1)按参与人行动先后顺序分:静态博弈:参与人同时选择行动(是指信息同时,不是物理时间同时),即每个参与人在选择行动时,不知道对手做了什么。动态博弈:参与人的行动有先后顺序(信息意义下和行动意义下,总可归结为信息意义),后行动者知道先行动者做了什么,甚至自然发生了什么(在此之前)。2)按了解对手的知识分(知识包括:对手特征,战略空间和支付函数)完全信息博弈:每个参与人知道对手的这些信息,对手也是如此。不完全信息博弈:至少有一个参与人对某个对手的知识缺乏完全了解。,87,3)两种划分的结合构成四种博弈:完全信息静态:Nash均衡完全信息动态:精炼Nash均衡不完全信息静态:BayesNash均衡不完全信息动态:精炼BayesNash均衡,88,0.2.1完全信息静态博弈一、构成与特征1)构成:参与人集N1,n行动集Aiai1,aim支付函数Ui(a1,an),aiAi2)特征:同时作出选择,89,二、Nash的主要贡献1)合作博弈:协商理论(1950,1953)2)非合作博弈(最重要的贡献):19501951两篇论文提出Nash均衡概念并证明Nash均衡的存在性。奠定博弈论的基础。与数理经济中的瓦尔拉斯均衡一致,从而解决了自斯密与瓦尔拉斯以来未解决的问题。3)Nash均衡对每个参与人来说,都要选择在其他参与人行动给定选择使自己效用最大化的行为。,90,战略组合:所有参与人选择的行为(战略)按一定顺序构成的一组行动或战略。本质上讲,每个参与人的效用依赖于战略组合。Nash均衡:是一种战略组合,对这组战略组合,没有任何意义在其他所有人不改变其战略的情况下改变自己的战略即没有任何人有积极性打破这种Nash均衡。Nash均衡可理解为:在互相作用,参与人之间自然达成的一种协议,由此作出人的行为规则但这种协议没有强制性约束力,是通过个人理性自动实现的。因为假定别人遵守这个协议,就没人有积极性改变这个协议或偏离这个协议。如果一个战略(协议)不是Nash均衡,就不会自动实施,因为有人可以违背这个协议来改善自己的利益(效用)。,91,4)博弈论实例囚徒困境:Tucker1950年发现了囚徒困境问题。1950年Tucker在斯坦福由于办公室的原因被安排在心理学系,一天有个心理学家找他问他在做什么,Tucker说在研究GameTheory,Tucker应邀在心理学系开了一个讨论班,下这个班上他发现了这个问题。囚徒B囚徒A,92,条件:囚徒A,B不能通信,即静态(同时)博弈(信息同时)。囚徒行为:Nash均衡,(坦,坦)。(坦,坦)是Nash均衡,且为最优战略均衡。分析:如A“坦”(或“抵”),那么B的最优行为为“坦”;如B“坦”(或“抵”),那么A的最优行为为“坦”。即无论对手采取什么行动,这个行动对他都是最好的。问题:个体理性与集体理性的矛盾。个体理性导致集体不理性;如果只有一次博弈,事前的协议也没有用,有时序和函数也没有用。,93,寡头垄断进行产量选择博弈两个企业联合起来形成一个卡特尔,可以垄断利润,每个企业可分享垄断利润。但这个协议无法遵守,因为如果一方遵守,另一方会增加产量使利润最大。因此每个企业只得到在Nash均衡下的利润,严格小于垄断下的利润。公共产品供给大家出钱兴办公用事业,所有人的福利都会增加。每个人的行为是不出钱,不出钱是由于公用品的搭便车现象,使每个人考虑的是:我出钱,你不出,我吃亏,你仍能享受福利;我不出钱,你出钱兴办,我可以享受福利。所以每个人的最优选择是不出钱,不仅是Nash均衡,而且是最优均衡。,94,军备竞赛两个进行军备竞赛国家的行为:资源用于军用,资源用于民用结局:受威胁,不受威胁条件:受威胁损失大于资源用于民用增加的社会福利。当别人用于军事,而我用于民用,受威胁。均衡:两国进行军备竞赛。结论:一种制度或协议的安排与实现,是Nash均衡。智猪博弈问题描述与规则:两头猪:大,小,相当于参与人集。猪圈一端为食槽,一端为按钮,按钮开时有十个单位食物,但按钮者要以两个单位的成本付出。两头猪的行动:按,不按,95,规则:若大猪先到:大猪吃9单位,小猪吃1单位。若同时到:大猪吃7单位,小猪吃3单位。若小猪先到:大猪吃6单位,小猪吃4单位。小猪大猪,96,均衡分析:小猪的行动:最优行动:“不按”(最优战略)。大猪的行动:假设小猪“不按”,大猪的最优策略是“按”。这时的均衡:(大猪“按”,小猪“不按”)。结论:多劳者不多得。相同条件下,小利益者可以搭便车。大股东,小股东对经理监督问题类似于智猪博弈(大股东监督,小股东不监督)为均衡。股市:大户,小户:搜集信息要相同成本,大户利益大,小户利益小。因此在大、小户以前的博弈中,小户跟大户是最优选择。,97,同一新产品广告:大企业与小企业之间一定是(大企业做,小企业不做)为均衡(成本相同,大企业利润大)。村里:富户与贫户同修一条路,一定是(富户修,贫户不出钱)。,98,性别战(battleofthesexes)一对相恋中的男女安排生产活动中的冲突:男,女。行动:看戏,看足球。规则:由如下博弈表女男,99,均衡:看足球,看足球,看戏,看戏。均衡分析:给定男(或女)看足球,对方的最优选择也是看足球。给定男(或女)看戏,对方的最优选择也是看戏。问题:多个Nash均衡在实际生活中,博弈是反复的,会形成一种默契先动优势:如果男的先选择,一定是选足球,没办法,女的也只有选足球。若女的先选,两人只好一起看戏了。,100,斗鸡博弈问题描述:两个人走向独木桥中央进行决斗。每个人有两种行动:继续前进,退下。规则:两人共同前进,两败俱伤。若一方前进,另一方退下,前进者胜利,后退者失败。博弈矩阵:AB,101,均衡(A进,B退),(A退,B进)两人都进或退不是均衡。分析:假设A进,B退是最优行动。假设B进,A退是最优行动。结论:斗鸡博弈一方失去面子,另一方获胜。市场进入阻止问题:在位企业想巩固其垄断地位阻止潜在进入者进入。博弈描述:参与人集:在位者,进入者;行动集:在位者行动集容纳,阻止,进入者行动集进入,不进;条件:进入成本为10;进入后双方垄断,各得到50;不进,垄断保持,得到300;未考虑阻止成本。,102,规则:不同行动组合下,双方支付情况如下表所示在位者进入者Nash均衡:(进入,容纳),(不进,阻止)均衡分析:给定在位者容纳,进入者进入为最优;同样,给定进入者进入,在位者容纳为最优行动。给定在位者阻止,进入者不进为最优;给定进入者不进,在位者容纳和阻止都为最优。因此,(进入,容纳)为Nash均衡。,103,0.2.2完全信息动态博弈:子博弈精炼Nash均衡1)完全静态博弈Nash均衡存在的问题:有多个Nash均衡。每个参与人在选择行动或战略时,把其他参与人的战略当作给定的,不考虑自己的选择如何影响对手的战略(静态博弈,同时行动)。Nash均衡允许有不可置信威胁战略。如前例中,(不进入,阻止)是一个不可置信的威胁(但它是Nash均衡),我不进入,你真会斗争(阻止)吗?但你不阻止我就进入了。这表明这个威胁均衡不可置信。,104,2)动态博弈子博弈精炼Nash均衡概念的目的剔除不可置信威胁的Nash均衡。保证任何参与人在任何时点战略是最优的动态博弈的表示形式:扩展型基本组成要素参与人集;参与人选择行动时点(时序);参与人在选择时点可供选择行动的集合;每个参与人在每次行动时有关对手过去行动选择的信息;每个结局对应于所有参与人的支付,105,博弈树对应于决策论中的决策树用树状图表示博弈过程,用以表示不同参与人的选择行为先后顺序,选择行为,不同行动组合行动下的支付水平。例子:以市场阻止进入为例,106,历史:参与人在作行动选择时的知识,这些知识可能是“共同知识”,也可能不是“共同知识”,这里仅分析其为共同知识的情况。在历史为“共同知识”时,作选择的参与人知道自己在博弈过程中正确的位置。子博弈:对任何给定历史,都会有一个正确作出选择的参与人(当历史为共同知识时),以这个历史为始点参与人按时序作出行为选择直接博弈结构,这个博弈称为关于这个博弈的子博弈(历史是子博弈的开始)整个博弈也是一个子博弈,只是相应的历史是“无任何知识”。,107,子博弈精炼Nash均衡:一个扩展博弈的子博弈精炼Nash战略:对任何子博弈构成Nash均衡战略。即对任何子博弈中任何参与人在任何时点作出的选择都是最优的。Nash均衡与子博弈精炼Nash均衡:子博弈精炼Nash均衡是Nash均衡,Nash均衡不一定是子博弈精炼Nash均衡。那么不具有不可置信威胁的Nash均衡才是子博弈精炼Nash均衡。,108,承诺行动承诺行动是当事人使自己的威胁战略变成可置信的行动承诺行动的特征:当当事人不实施这种威胁时,当事人就就会受到损失,即当事人要为自己的失约付出成本。著名例子:“破釜沉舟”。子博弈精炼Nash均衡与政策动态一致性及理性预期均衡类似政策动态一致性:一种政策不仅在制定时是最优的,而且在制定后的各阶段也应该是最优的。,109,0.2.3不完全信息静态博弈:BayesNash均衡1)完全信息静态博弈的基本假设:参与人知道自己和所有对手的偏好,行动空间(战略空间)及条件战略组合(行动组合)下的利润实际中这种情况是很少的更多情况是不知对手怎么样。2)不完全信息博弈:博弈中各参与人对其他参与人的偏好或战略空间或支付函数及其参数信息不完全了解。3)例:市场进入问题进入博弈中结局对参与人的支付决定于在位者的成本,而进入者不确切地知道在位者的成本。例如,假设在位者可能有两种成本:高、低。,110,在位者各成本的博弈矩阵为:高成本下:低成本下:在位者在低成本下在相同对策局势,在位者的支付要高于高成本时的支付。,111,分析:高成本在位者,选合作。当进入者选择进入时低成本在位者,选斗争(因为成本低,所以使他斗争获得的利润还高于合作时的利润)。均衡与在位者的成本类型有关。4)虚拟参与人Harsanyi的重要贡献,这个参与人相当于“自然”。有多种类型的参与人确切知道自己的真实类型。其他参与人不知道具有多种类型参与人的具体类型,就由这个虚拟参与人选择这个多类型参与人的类型,它是随机选择的,即按一种概率分布选择参与人类型这个分布函数可以是所有参与人的“共同知识”。这种虚拟参与人按某种概率分布函数选择参与人的类型的方法称为Harsanyi变换。,112,5)Harsanyi变换的作用将不完全信息问题转换为完全但
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中级会计考试必考知识点与试题及答案
- 消防信息资源共享试题及答案
- 消防事故案例试题及答案研究
- 浙江省稽阳联谊学校2023-2024学年高三上学期联考化学 无答案
- 新疆石河子市一中2023-2024学年高二9月月考英语 无答案
- 无人机驾驶员能力提升方案试题及答案
- 一级建造师备考经验与应试策略分享试题及答案
- 2025年建造师备考进阶试题及答案
- 对于初级审计师考试的问题回答技巧及答案
- 企业变革中的审计角色试题及答案
- 天津市和平区二十中学2025届学业水平考试化学试题模拟卷(九)含解析
- 扬州大学《水工程施工》2023-2024学年第二学期期末试卷
- 《隋唐时期的中外文化交流》教案-2024-2025学年统编版(2024)初中历史七年级下册
- 2025年初级社会工作者综合能力理论考试题(附答案)
- 第三届南华大学医学生临床技能竞赛评分标准高处
- 民用航空器驾驶员学校合格审定规则(完整版)
- 安全纪律教育主题班会
- 2025年浙江湖州市城市投资发展集团有限公司招聘笔试参考题库附带答案详解
- 2025年高空车作业考试题及答案
- 蜱虫预防卡通
- 股骨干骨折知识
评论
0/150
提交评论