《博弈论》最完整版课件（加专题研究）

上传人：r*** IP属地：湖北上传时间：2022-11-08 格式：PPT 页数：295 大小：4.09MB 积分：22 举报 版权申诉

已阅读5页，还剩290页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论GameTheory数学与管理工程系

1在市场的大背景中，个人只有通过关注他人所关注的东西并找到双方利益的共同点，才能更好地促进自己的目标。————德威特商业上的信用关系不是用“歃血为盟〞的方法来维系的，它需要的必须是一个利益安排机制：不管是谁，其违背信用之所得肯定小于坚守诚信之所得。———娃哈哈集团老总宗庆后谈判中只有采取适当的让步策略才能得到人家的让步，最终取得谈判的成功———龙永图2参考书目1.张维迎．博弈论与信息经济学．上海三联书店．上海人民出版社2.谢识予．经济博弈论．复旦大学出版社3.［美］刘易斯．卡布罗．产业组织导论．人民邮电出版社6.王那么柯．新编博弈论平话．中信出版社4.［法］简．泰勒尔．产业组织理论．中国人民大学出版社5.［美］艾里克．拉斯谬森．博弈与信息(第二版)．博弈论概论北京大学出版、三联书店7.［美］阿维纳什．K．迪克西特，巴里．奈尔伯夫．策略思维—商界、政界及日常生活中的策略竞争．中国人民大学出版3课程结构第一章博弈论的历史和分类第二章完全信息静态博弈第三章完全信息动态博弈第四章不完全信息静态博弈第五章不完全信息动态博弈4第一章博弈论的历史和分类1.什么是博弈论2.博弈论历史和开展3.几个经典博弈模型4.博弈结构和博弈的分类5.思考与练习51.什么是博弈论扑克、象棋、乒乓球团体赛等体育运动赌博彩票游戏〔Game〕博弈论——GameTheory——游戏理论?计策〔策略〕OPEC(石油输出国组织)的成员国选择其年产量;GM(通用汽车公司)向USX(美国钢铁)购置钢材;两家制造商分别制造螺钉和螺母,决定采用何种标准;某家公司董事会为其总经理(CEO)设立一项期股安排.6这些游戏的特征：1.都有一定的规那么：规定游戏的参加者〔个人或团体〕可以做什么，不可以做什么，游戏的顺序，游戏结束的时间，游戏者犯规的处分等；2.都有一个结果：如甲赢或输、平局或参加者各有所得等，并且各方所得的结果可以用数值表示或按照一定的规那么折算成数值；3.每个参与者都有可供选择的策略，并且不同的策略通常会带来不同的游戏结果或所得；4.策略与利益相互依存，每个参加者的利益不仅取决于自身策略的选择，也取决于其他参加者的策略选择1.什么是博弈论由以上特征，可以引出一个非技术性的定义71.什么是博弈论一个非技术性定义博弈即假设干个人、队组或其他组织，面对一定的环境，在一定的规那么下，同时或先后，一次或屡次，从各自允许的行动或策略中进行选择并加以实施，各自取得相应结果的过程.博弈论是研究决策主体的行动发生直接相互作用时候的决策以及这种决策的均衡问题的，也就是说，当一个主体，好比一个人或一个企业的选择受到其它人或其它企业选择的影响，而且反过来影响其它人、其它企业选择时的决策问题和均衡问题。82.博弈论历史和开展萌芽时期:18世纪甚至更早瓦德格拉夫(Waldegrave)在1713年提出两人博弈的极小化极大混合策略解;库诺特(Cournot)在1838年、伯特兰德(Bertrand)在1883年分别提出了博弈论中经典的经济学模型;公元前,我国的齐威王田忌赛马的博弈思想;早期研究:1500年前巴比伦犹太教法典中的“婚姻合同问题〞源于上世纪初,1913年齐默罗(Zermelo)提出了关于象棋博弈的定理是博弈论的第一个定理,提出的“逆推归纳法〞(BackwardInductionProcedure)那么是博弈论的第一种有着一般意义的分析方法;(19世纪及以前)(20世纪前半叶)92.博弈论历史和开展波雷尔(Borel)在1921-1927年间给出了混合策略的第一个现代描述,并给出了有数种策略的两人博弈的极小化极大解;冯.诺伊曼(VonNeumann)和摩根斯坦(Morgenstern)在1928年给出了扩展形博弈定义,证明了有限策略的两人零和博弈有确定的结果等;以上研究没有完成博弈论的理论体系博弈论的形成:冯.诺伊曼(VonNeumann)和摩根斯坦(Morgenstern)1944年出版了?博弈论和经济行为?(TheoryofGamesandEconomicBehavior),在该著作中,引进了博弈论的扩展形(ExtensiveForm)和正规形(NormalForm)或称策略形(Strategy)、矩阵形(MatrixForm),定义了极小化极大解(MinmaxSolution),并说明了解在所有两人零和博弈中的存在性,且提出了创立博弈论的一般理论的想法,给出了博弈论的一般框架、概念术语和表示方法.(20世纪40年代)10VonNeumannOskarMorgenstern1944年?博弈论与经济行为?11?博弈论和经济行为?出版的最大奉献在于极大地促进了博弈论与经济学之间的联系,使得博弈理论找到了用武之地.?博弈论和经济行为?的出版被公认为博弈论初步形成的标志博弈论的成长:美国数学家约翰.纳什(JohnNash)在1950年提出了将博弈论扩展到非零和博弈,最终成为非合作博弈理论基石的成果－－“纳什均衡〞(NashEquilibrium)及纳什定理.纳什均衡被誉为现代博弈论中最重要的概念,随着博弈论和经济学的开展,纳什均衡现在已经成为大多数现代经济分析的出发点和关键分析概念.同时代还有许多为博弈论的成长作出伟大奉献的科学家.(20世纪50年代)2.博弈论历史和开展12博弈论的开展:(20世纪60~70年代)2.博弈论历史和开展最重要的成果是塞尔腾(R.Selten)在1965年提出了“空头威胁〞(EmptyThreats)的问题,并提出“子博弈精炼纳什均衡〞(SubgamePerfectNashEquilibrium)对纳什均衡作完美化精炼的思想.更在1975年提出了“颤抖手均衡〞(TremblingHandPerfectEquilibrium)概念海萨尼(J.Harsanyi)在1967--1968年发表构造了不完全信息(IncompleteInformation)博弈理论的系列论文,提出了分析不完全信息博弈问题的标准方法,以及“贝叶斯纳什均衡〞(BayesianNashEquilibrium)的概念,在1973年提出了关于“混合策略〞的不完全信息解释以及“严格纳什均衡〞(StrictNashEquilibrium)的概念.13JOHNC.HARSANYIJOHNF.NASHREINHARDSELTEN1994年诺贝尔经济学奖得主1950年，Nash均衡1965年，空头威胁子博弈精炼Nash均衡1967年,BayesNash均衡1973年,Harsanyi转换14在该时期,博弈论开始真正受到经济学家的广泛关注,并被看作重要的经济理论和经济学的核心分析方法,开始贯穿几乎整个微观经济学和产业组织理论,在环境、劳动、福利、国际经济学等学科中的地位也越来越重要,大有“吞噬〞整个现代西方经济理论的气势.1996年,博弈论和信息经济学家莫里斯(JamesA.Mirrless)和维克瑞(WilliamVickrey)因为在不对称信息条件下鼓励机制问题方面的根底性研究而再次共同获得诺贝尔经济学奖.2.博弈论历史和开展博弈论的成熟以及与主流经济学的融合:(20世纪80~90年代)在该时期,又出现了一批对博弈论有重要奉献的科学家和理论.15JAMESA.MIRRLEESWILLIAMVICKREY1996年诺贝尔经济学奖得主不对称信息条件下鼓励机制的研究163.几个经典的博弈模型3.1囚徒的困境(Prisoners’Dilemma)博弈论中最著名的模型,1950年图克(Tuker)提出囚徒A坦白抵赖囚徒B坦白抵赖囚徒A的战略:坦白或抵赖囚徒B的战略:坦白或抵赖囚徒的困境模型揭示了一个很深刻的问题:个人理性与集体理性的矛盾.在经济学上有着广泛的应用,如双寡头竞争博弈、公共产品的供给、军备竞争、经济改革等现象.173.2双寡头削价竞争模型寡头之间的价格战也是囚徒困境的现象之一.假设寡头1和寡头2是双寡头市场上的两个寡头,它们原来以同一较高的价格销售同一种产品,都能得到较高的利润.但是,也许都不满足现有的市场份额和利润,都想通过降价争夺更大的市场份额和更高的利润.寡头1高价低价寡头2高价低价1883年由贝特兰德(Bertrand)提出了更为完善的削价模型几个经典的博弈模型183.3智猪博弈(BoxedPigs)猪圈里有两头猪,一头大猪一头小猪,猪圈的一头有一个食槽,另一头安装了一个控制食物供给的按纽,每按一下有10个单位的食物进入食槽,但按纽的猪要付2个单位的本钱.假设大猪先到,大猪吃到9个单位的食物,小猪只能吃到1个单位;假设小猪先到,大猪吃到6个单位的食物,小猪只能吃到4个单位;假设同时到,大猪吃到7个单位的食物,小猪只能吃到3个单位;支付分析:大猪按不按小猪按不按稳定的结果:大猪按,小猪不按多劳者不多得股票市场,大小企业,贫富之间公共产品的供给几个经典的博弈模型193.4斗鸡博弈(ChickenGame)支付分析:甲前进后退乙前进后退稳定的结果:一方前进,另一方后退公共产品的供给,美苏冷战市场进入,夫妻闹矛盾,等等两个人举着火棍从独木桥的两端走向桥的中央进行火拼,每人都有两种可能:继续前进或退下阵来.假设都继续前进,那么两败俱伤;假设一人前进一人退下阵来,那么前进者获利,后退者丢面子;假设双方都退下,那么双方都丢面子.几个经典的博弈模型203.5库诺特的寡头竞争模型(CournotModel)在某种价格水平上,市场容量是有限的,假设向市场投放的产品超出该数量,那么必须降价.能使产品全部售出的价格称为市场出清价格,为产品数量的函数.假设在同一个市场上只有两个厂商(寡头),生产销售同一种产品,产量分别为和,并且只能取整数值.市场出清价格为总产量的函数,假定为为突出其中的博弈关系,不妨假设各厂商的生产都无本钱,而且各厂商自己决定自己的产量.各厂商如何决定自己的产量???几个经典的博弈模型21显然,各厂商的产量都不会超过20,各厂商的利润为1082201688432328932427875403577642426774249668484856945545510505045114455哪种产量的组合是稳定的?(7,7)是最稳定的7764242在这个组合上，两个寡头都没有改变产量的动机如果厂商的数量增加到n个，情况如何？如果产量可以连续变化,情况又将如何??几个经典的博弈模型223.6市场进入阻挠(Entrydeterrance)进入者的战略:进入、不进入稳定的结果:进入者进入在位者默许或:进入者不进入在位者斗争有一个垄断企业已在市场(称为在位者),另一个企业虎视眈眈想进入(称为进入者),在位者为保住自己的垄断地位,要想法阻止进入者进入.在位者的战略:默许、斗争进入者进入不进入在位者默许斗争几个经典的博弈模型23进入者进入不进入在位者默许斗争如果将上述博弈的支付情况改成以下结果:稳定的结果:进入者不进入在位者斗争两种情况可以理解为,在进入者决定进入的请况下,在位者选择斗争的本钱是不一样的,前者可以认为是高本钱的,而后者是低本钱的.但是,一种不确定的问题是,进入者是不知道在位者是高本钱还是低本钱的,最多知道在位者上下本钱的可能性;当然,在位者自己知道自己是哪种本钱类型.这就造成了信息的不确定性.海萨尼研究了这个问题并引进了一个虚拟参与人“自然〞,由自然选择参与人的类型.几个经典的博弈模型24进入不进入默许(40,50)斗争(-10,0)默许(0,300)斗争(0,300)进入不进入默许(30,100)斗争(-10,140)默许(0,300)斗争(0,300)高本钱低本钱自然进入者在位者几个经典的博弈模型上下本钱的可能性是如何区分的??254.博弈结构和博弈的分类1.参与人(Players):指的是一个博弈中的决策的主体,也称博弈方,即博弈的参加者,参与人的目的是通过选择行动或策略以最大化自己的支付水平;4.1博弈论中常用的术语：参与人可以是个人、集体甚至是一个国家或者由国家组成的集团.一般,我们用表示参与人在有的博弈中,某些条件不是由参与人决定的,如气候、政策等,为了方便分析,可以引进“虚拟参与人〞,称之为“自然〞,“自然〞在博弈论中用N表示.262.行动(Actionsormoves):是参与人在博弈的某个时点的决策变量,一般用表示第个参与人的一个特定行动,而用表示可供选择的所有行动的集合(Actionset).在囚徒困境中,在库诺特模型中,在n个人的博弈中,n个参与人的行动的有序集称为一个行动组合(Actionprofile),为第个参与人的行动在囚徒困境中,在库诺特模型中,博弈结构和博弈分类27完全信息:是指参与人对其他参与人的行动或支付构成均完全了解的知识.共同知识:是“所有参与人都知道,所有参与人都知道所有参与人知道,…〞的知识.这是一个非常强的假定.信息集:是参与人在特定时刻有关变量值的知识,一个参与人无法准确知道的变量的全体属于一个信息集.包含了一个参与人有关其他参与人之前行动的知识.完美信息:指一个参与人对其他参与人(包括“自然〞)的行动选择均准确了解的信息.(主要针对动态博弈)3.次序(Orders).在现实的各种决策活动中,有时是要求各博弈方同时作出选择,但有时各博弈方的抉择有先后之分,并且一个博弈方还要作屡次决策,必须规定其中的决策次序.4.信息(Information).是参与人有关博弈的知识,特别是有关“自然〞的选择、其他参与人的特征和行动的知识.信息集(Informationset)完美信息(PerfectInformation)完全信息(CompleteInformation)不完美信息(ImperfectInformation)不完全信息(IncompleteInformation)共同知识(Commonknowledge)博弈结构和博弈分类285.战略(Strategies).也称策略,是参与人在给定信息集的情况下的行动规那么,它规定参与人在何时采用哪种行动.战略也是一种“相机行动方案〞(ContingentActionPlan),它指导参与人如何对其他参与人的行动作出反响.进入者的所有可选择的战略集合为战略与行动相同吗?在静态博弈中确实是相同的总共有四个战略组合博弈结构和博弈分类在市场阻挠模型中29在市场阻挠模型中，如果由进入者首先选择是否进入，再由在位者选择是否斗争，此时，进入者有两个战略而在位者的战略那么有四个但在位者的行动仍然是两个战略组合总共有8个动态博弈博弈结构和博弈分类306.支付(Payoffs).也称得益,对应各博弈方每一组可能的战策组合,都必须有一个结果表示该战略组合下各博弈方得到确实定收益或得到的期望收益(效用水平).在博弈中,很显然,一个参与人的支付,不仅依赖于自己所选择的战略或行动,也依赖于其他参与人所选择的战略,即某个参与人的支付是所有参与人战略组合的函数:如在市场阻挠模型中在不能确定支付水平时,往往计算期望支付博弈结构和博弈分类317.结果(Outcome).是博弈分析者所感兴趣的所有东西,如均衡战略组合、均衡行动组合和均衡支付组合等.8.均衡(Equilibrium).是指所有参与人的最优的战略组合.在均衡战略组合下,任何参与人没有改变自己战略的动机,即如果改变战略,自己的支付不会得到增加.(进入,默许)是一个均衡战略组合(40,50)那么是一个均衡支付组合如在囚徒困境中,(坦白,坦白)是一个均衡在双寡头削价竞争模型中,(低价,低价)也是一个均衡在斗鸡博弈中那么有两个均衡(前进,后退)和(后退,前进)博弈结构和博弈分类如在市场阻挠模型中32博弈结构和博弈分类4.2博弈分类参与人的数量：单人博弈、双人博弈和多人博弈单人博弈是指只有一个参与人的博弈.事实上,单人博弈就是一般的优化问题.双人博弈是指两个各自独立决策,但策略和利益具有相互依存关系的博弈方的决策问题.如迷宫问题;有自然参与的单人博弈等如囚徒困惑、智猪博弈等,双人博弈是博弈论中最根本的也是研究最多的博弈类型.多人博弈是指有三个或三个以上参与人的博弈问题.多人博弈也是双人博弈的推广,但实际情形要复杂得多,另外可能出现破坏者等等33博弈结构和博弈分类博弈中的战略：有限博弈和无限博弈有限博弈是指一个博弈中的每个参与人的可选战略都是有限的博弈.如前面介绍的几个经典博弈都属于有限博弈无限博弈是指一个博弈中至少有一个参与人的可选战略是无限的博弈.库诺特的寡头竞争模型中的产量如果是连续的情形时就属于无限博弈.34博弈中的支付：零和博弈、常和博弈和变和博弈支付是参加博弈的各方从博弈中获得的收益,是所有参与人追求的根本目标,即各参与人行动和判断的依据.在一个博弈中,每个参与人在每种战略组合下都有相应的支付,称所有参与人在同一个战略组合中支付的总和为“(社会)总支付〞.零和博弈是指在任意战略组合下“总支付〞均为零的博弈,如通常的打赌博弈,这种博弈最突出的特点是各参与人之间的利益是对立的.常和博弈是指在任意战略组合下“总支付〞均为一个常数的博弈,如假设干个人分一笔固定奖金的博弈,这种博弈各参与人之间的利益也是对立的.变和博弈是指零和博弈和常和博弈以外的博弈的总称.博弈结构和博弈分类35博弈的次序：静态博弈、动态博弈和重复博弈博弈的次序也是博弈很重要的因素,有些博弈中的所有参与人是同时选择战略的,但更多博弈中的参与人是先后选择战略的,也有的博弈是反复或重复进行的.静态博弈是指在博弈中所有的参与人同时选择战略,或者虽然不是同时选择战略,但是后选择的参与人不知道先选择的参与人的战略的博弈.如前面介绍的几个经典博弈都属于静态博弈动态博弈是指在博弈中各参与人是按某种规那么分先后行动,并且后行动者知道先行动者的战略的博弈.比方下棋博弈,市场开发博弈等博弈结构和博弈分类重复博弈是指在将博弈重复进行的博弈.36“完全信息”指的是每一个参与人都对其他所有参与人的特征、战略空间及支付组合(主要是支付组合)有准确的知识;否则,称为“不完全信息”.博弈中的信息：完全信息博弈和不完全信息博弈完美信息动态博弈和不完美信息动态博弈博弈方的能力和理性：“完美信息”指动态博弈中轮到行动的参与人对之前的博弈进程完全了解的知识.博弈结构和博弈分类博弈中参与人的“行为逻辑〞包含两个方面:参与人决策行为的根本目标和参与人追求目标的能力.“理性经济人假设〞:认为参与人都是以个体利益最大化为目标,且有准确的判断选择能力,同时还不会“犯错误〞.合作博弈和非合作博弈37博弈结构和博弈分类以个体利益最大化为目标被称为“个体理性〞;有完美的分析判断能力和不会犯错误被称为“完全理性〞,完全理性要求现实的参与人都能通过博弈分析找到最优战略,而且不会因为遗忘、失误、任性等原因偏离最优的选择.相对与“个体理性〞而言是“集体理性〞,即在全部或局部问题上以集体(集团或团体)利益为目标,追求集体利益最大化.但在博弈论中,集体利益最大化并不是参与人的目标,不过,博弈论也允许在博弈中存在“有约束力的协议〞,在集体的成员间进行利益的有效补偿.以“集体理性〞为根底的博弈称为“合作博弈〞,以“个体理性〞为根底的博弈称为“非合作博弈〞.38完全信息静态博弈完全信息动态博弈完全且完美信息动态博弈完全但不完美信息动态博弈不完全信息静态博弈不完全信息动态博弈但是,博弈问题通常包含复杂的相互依存关系,博弈分析也变得很复杂,因此,只在“完全理性〞的假设下进行博弈分析是不够的.与“完全理性〞相对应的是“有限理性〞,即参与人的判断选择能力在有缺陷的情况下分析博弈问题.4.3总结博弈非合作博弈合作博弈博弈结构和博弈分类395.思考与练习1.什么是博弈?博弈论研究的内容是什么?2.从经济学角度分析为什么博弈论中研究的多数为非合作博弈?3.一个博弈中应该包含多少要素?其中几项称为博弈的规那么?4.您知道寡头和帕累托(Pareto,法国)优势的含义吗?请到微观经济学的某些教材中找到并记录下来.5.Smith和Tom是类似于囚徒博弈的两个人,不同的是Smith有前科,因此不管两人是坦白还是抵赖,Smith都要至少比Tom多判5年.请构造一个支付矩阵表示这个博弈,并分析博弈的合理性及稳定的战略组合.40第二章完全信息静态博弈1.博弈论的战略式表述2.纳什均衡3.纳什均衡应用举例4.混合战略纳什均衡5.纳什均衡的存在性和多重性41“完全信息〞是指每个参与人对所有其他参与人的特征(战略空间、支付函数等)有完全的了解,即参与人的收益函数是“共同知识〞;“静态〞是指所有参与人同时选择行动且只选择一次;“完全信息静态博弈〞就是指每个参与人对所有其他参与人的特征(战略空间、支付函数等)有完全了解的前提下,同时选择一次行动的博弈.421.博弈论的战略式表述我们首先回到囚徒的困境模型:囚徒A坦白抵赖囚徒B坦白抵赖支付矩阵:多变量矩阵,有三个特点1.列出了所有博弈的参与人;2.列出了每一个参与人可供选择的战略集,并且所有参与人同时选择战略;3.针对所有参与人可能选择的战略组合,列出了每一个参与人获得的收益.满足这三个特点的描述就称为博弈的战略式表述,也称为博弈的标准式表述43将博弈的战略式表述一般化,在有n个参与人的博弈中,战略式表述必须给出以下三点:1.博弈中所有参与人的集合:2.每个参与人的战略空间:3.每一个参与人的支付函数:以后我们用代表战略式表述的博弈囚徒困境博弈的战略式表述为1.博弈论的战略式表述44在库诺特两寡头产量竞争模型中,战略式表述为与战略式表述对应的是扩展式表述,一般,战略式表述常用于静态博弈,而扩展式表述常用于动态博弈,扩展式表述将在动态博弈中介绍.1.博弈论的战略式表述452.纳什均衡2.1占优战略均衡(Dominant-strategyEquilibrium)囚徒A坦白抵赖囚徒B坦白抵赖囚徒困境博弈每个囚徒的最优战略都是“坦白〞,即不管其他参与人选择什么战略,“坦白〞都是囚徒A(也是B)的最好的战略,即占优战略.一个战略称为某个参与人的“占优战略〞是指:不管其他参与人选择什么战略,这个战略都是该参与人的最好的战略.在一个博弈中,如果每个参与人都有“占优战略〞存在,那么,每个参与人的占优战略的组合就称为“占优战略均衡〞,并且是唯一的“占优战略均衡〞.(Dominant-strategyEquilibrium)46占优战略的一般表述如下:2.纳什均衡47在囚徒困境博弈中,(坦白,坦白)是一个占优战略均衡在双寡头削价竞争模型中,(低价,低价)也是一个占优战略均衡在智猪博弈、斗鸡博弈、市场阻挠博弈中都没有占优战略均衡,这些博弈是否存在其他的均衡呢?又如何判断或寻找?占优战略均衡只要求每个参与人是理性的,而不必要求知道其他参与人是否是理性的,理性的人只要选择自己的占优战略,即不要求“理性〞是共同知识.2.纳什均衡482.2重复剔除的占优均衡(iteratedDominanceEquilibrium)大猪按不按小猪按不按智猪博弈中的小猪有占优策略,而大猪没有占优策略小猪的占优策略:“不按〞假设小猪是理性的,总是“不按〞再假定大猪知道小猪是理性的,会预测到小猪的策略是“不按〞,因此大猪只能选择“按〞.注意:对小猪而言,不管大猪选择什么策略,“按〞相对于“不按〞对小猪都是较差的策略,称其为“劣策略〞.(严格劣战略)2.纳什均衡49大猪按小猪不按对于一个理性的参与人,是不可能选择“劣策略〞的,因此可以在战略式表述(支付矩阵)中将其剔除,再重新构造一个不含这个“劣策略〞的新的博弈,然后在新的博弈中寻找某个参与人的劣策略,再将其从博弈中剔除,重复进行下去,直到剩下唯一一个战略组合,该组合称为“重复剔除的占优均衡〞大猪按不按小猪按不按大猪按不按小猪不按(按,不按)是智猪博弈的重复剔除的占优均衡2.纳什均衡50再看如下博弈:参与人AUD参与人BLMR相对于M为劣战略相对于U为劣战略相对于M为劣战略(U,M)是唯一剩下的战略组合(重复剔除的占优均衡)以上每次剔除的都是严格的劣战略,如果剔除的是弱劣战略呢?2.纳什均衡51参与人AUCD参与人BLMR参与人AUCD参与人BLMR再看如下博弈:(U,L)是唯一剩下的组合.在分析过程中剔除了弱的劣战略.(U,R)是唯一剩下的组合.在分析过程中也剔除了弱的劣战略.2.纳什均衡一般只使用重复剔除严格劣战略,而不使用剔除弱劣战略的方法,否那么会将更好的均衡剔除.52劣战略和重复剔除的占优战略的一般表述如下:2.纳什均衡一个博弈经过假设干次重复剔除劣战略后剩下的唯一的战略组合称为“重复剔除的占优均衡〞,且该博弈为“重复剔除占优可解〞的.占优战略均衡一定是重复剔除的占优均衡.即重复剔除严格劣战略不会将占优战略均衡剔除.53参与人AUD参与人BLR分析博弈:在这个博弈中,两个参与人都没有占优战略,也没有严格的劣战略即这个博弈既没有占优战略均衡,也没有重复剔除的占优均衡从分析中发现,在战略组合(U,L)或(D,R)上,两个参与人都不会改变战略,因为改变战略不会带来更多的支付,即没有动机.甲前进后退乙前进后退斗鸡博弈同样在斗鸡博弈中也有类似的结局纳什均衡2.纳什均衡542.3纳什均衡(NashEquilibrium)纳什均衡(NE)是博弈论中最重要的概念之一纳什均衡是指这样的一个战略组合:在这个战略组合之下,所有参与人都没有改变战略的动机,即改变战略不会给该参与人带来支付的增加或效用的改善.2.纳什均衡纳什均衡的一般描述552.纳什均衡囚徒A坦白抵赖囚徒B坦白抵赖囚徒困境寡头1高价低价寡头2高价低价双寡头削价大猪按不按小猪按不按智猪博弈甲前进后退乙前进后退斗鸡博弈(坦白,坦白)是占优战略均衡也是重复剔除的占优均衡,还是纳什均衡(低价,低价)是占优战略均衡也是重复剔除的占优均衡,还是纳什均衡(按,不按)是重复剔除的占优均衡,也是纳什均衡(前进,后退)和(后退,前进)都是纳什均衡56进入者进入不进入在位者默许斗争市场进入阻挠1进入者进入不进入在位者默许斗争市场进入阻挠22.纳什均衡没有占优战略均衡也没有重复剔除的占优均衡两个纳什均衡〔进入，默许〕和〔不进入，斗争〕在位者“斗争〞是弱劣战略没有占优战略均衡也没有重复剔除的占优均衡一个纳什均衡〔不进入，斗争〕在位者“默许〞是弱劣战略572.纳什均衡参与人AUCD参与人BLMR参与人AUCD参与人BLMR战略组合(U，L)和(U，R)都是纳什均衡战略组合(D，R)是唯一都是纳什均衡画线法:针对对手的每一战略,找到自己的最优战略,并在其支付值下面画线,最后,双方同时画线的战略组合就是纳什均衡582.纳什均衡下面给出纳什均衡与重复剔除严格劣战略的关系：592.纳什均衡命题B的证明：602.纳什均衡命题A的证明：612.纳什均衡占优战略均衡重复剔除的占优均衡纳什均衡在剔除过程中不能剔除弱劣战略623.纳什均衡应用举例3.1古诺(Cournot)寡头竞争模型(产量模型),1838年在某种价格水平上,市场容量是有限的,假设向市场投放的产品超出该数量,那么必须降价.能使产品全部售出的价格称为市场出清价格,为产品数量的函数.假设在同一个市场上只有两个厂商(寡头),生产销售同一种产品,产量分别为和.63反响函数(reactionfunction)根据纳什均衡的定义令3.纳什均衡应用举例64反响函数:指参与人的战略对其他参与人战略的依赖关系,或者对其他参与人所选战略根据反响函数可以求出自己的最优战略.反响函数法3.纳什均衡应用举例Cournot模型也可以使用重复剔除严格劣战略得到纳什均衡，你能求解吗？6566令反响函数为3.纳什均衡应用举例67反响函数曲线为交叉点即纳什均衡为3.纳什均衡应用举例683.2伯特兰德(Bertrand)寡头竞争模型(价格模型),1883年假设寡头1和寡头2是双寡头市场上的两个寡头,生产销售同类但不完全一致的产品,产品具有一定的替代性,但两个寡头都想通过调整价格争夺更大的市场份额和更高的利润.依然采用反响函数法求其纳什均衡〔NE〕3.纳什均衡应用举例69推出反响函数其交点即为纳什均衡〔NE〕3.纳什均衡应用举例703.3豪泰林(Hotelling)价格竞争模型(价格模型),1929年3.纳什均衡应用举例产品的差异多种多样，如品质、性能、包装等，Cournot模型中的产品是同质的；Bertrand模型中的产品不同质，但具有互相替代性。产品还有一些特殊的差异，如时空。消费者购置商品时,不只是要考虑商品本身的价格,还会考虑购置商品时付出的本钱如交通本钱和时间本钱等等.线性城市商店A商店B城市长度为“1”居民均匀分布居民到哪个商店购买商品分析一个线性城市中两个商店的定价竞争问题713.纳什均衡应用举例线性城市商店A商店B城市长度为“1”居民均匀分布居民到哪个商店购买商品01x两个商店同时选择价格;两个商店的单位商品的本钱都是c;每个消费者购置商品的旅行本钱与离商店的距离成正比,单位距离的本钱为t;每个消费者每次都购置单位数量的商品假设:723.纳什均衡应用举例两个商店的利润分别为求导数733.纳什均衡应用举例反响函数为交点(纳什均衡)为两个商店的利润为因此这个博弈的均衡价格和均衡利润分别为74线性村庄村庄长度为“1”居民均匀分布3.4杂货铺定位博弈有两家杂货铺要在一个线性的村庄开张,他们卖一样的商品且价格也相同,两家杂货铺会开在什么位置?杂货铺A杂货铺B线性村庄村庄长度为“1”居民均匀分布杂货铺A杂货铺B中心点为均衡位置菜场的小贩,学校门口的出租车等等3.纳什均衡应用举例753.5三个和尚没水吃(公共物品的私人供给)张三修不修李四修不修一个楼道中住着张三和李四,但楼道中的路灯坏了.该博弈存在重复剔除的占优均衡和纳什均衡为(不修,不修)但战略组合(修，修)的支付组合更好！！！？？？这也是囚徒博弈问题降价竞争,没有物业管理的小区,没制定值日制度的寝室等3.纳什均衡应用举例763.6唐僧肉谁都想吃(公共地的悲剧)一个有n个农民的村庄中有一块草地,每个农民都有在草地上放牧的自由,每年春天每个农民自己决定放养多少只羊.但问题是草地上的草是有限的,随着羊的增加,平均每只羊能吃到的青草就减少,从而影响到羊的质量即价格,当羊的数量过于大时,所有的羊都会饿死.农民们在春天如何确定他们的羊的数量?羊的数量羊的价值最大数量羊的价值随数量下降羊的价值由羊的总数决定,但是农民在确定自己羊的数量时只会考虑自己增加一只羊后自己本钱和利润的变化,而不会考虑其他农民的结果.这种决策的结果使每个农民的边际本钱都会小于社会边际本钱,最后都是增加羊的数量,从而草地被过量使用.3.纳什均衡应用举例773.纳什均衡应用举例特别注意草地上的草是有限的，而每只羊至少要吃一定量的草才不至于饿死假定羊的价值随羊数量的增加降低得越来越快！783.纳什均衡应用举例农民的目的：羊的数量羊的价值最大数量羊的价值随数量下降一阶条件为得到n个农民的反响函数将n个一阶条件相加Nash均衡总饲养量满足的条件793.纳什均衡应用举例根据二阶导数803.纳什均衡应用举例Nash均衡总饲养量满足的条件但对社会而言，最优目标是最大化社会总剩余价值：最大化的一阶条件为个人自由的前提下，公共草地被过度使用了，公共地的悲剧！海洋渔业、草地沙化、环境污染、中国小煤窑等制度经济学中经典例子(Hardin,1968)814.混合战略纳什均衡4.1福利博弈福利博弈的对象是政府和贫民.政府乐于救济那种努力找工作的贫民,但不愿帮助那种坐等救济的人,可是贫民只有在等不到政府的救济时才会去寻找工作.这种现象被称为“乐善好施〞的悖论.政府救济不救济贫民工作游手好闲在这个博弈中不存在纯战略的纳什均衡.不过政府可以采用一种不确定的政策以鼓励贫民努力寻找工作;同时,贫民也可以采用不定期地找工作,以引诱政府救济!82政府救济不救济贫民工作游手好闲政府的期望支付是:4.混合战略纳什均衡83贫民的期望支付为:为获得最大值,求导数得到一阶条件,从而求出反响函数:4.混合战略纳什均衡841.假设贫民找工作的概率大于0.2,那么政府总是选择救济;小于0.2,那么政府总是选择不救济;2.假设政府选择救济的概率大于0.5,那么贫民总是选择不工作;小于0.5,那么贫民总是选择找工作;3.均衡为政府以0.5的概率选择救济,而贫民那么以0.2的概率选择找工作,这种均衡称为混合战略纳什均衡4.福利博弈的纳什均衡可以理解为政府每次只救济50%的贫民，这样至少可以鼓励20%的贫民努力找工作.4.混合战略纳什均衡854.2混合战略的一般描述4.混合战略纳什均衡86零和博弈，审计博弈，市民责任博弈等等4.混合战略纳什均衡875.纳什均衡的存在性和多重性在一个博弈中,参与人或分析者有时并不能轻而易举地找到一个特定的均衡,但是他能够说明假设均衡存在的话,那么它应具有哪些特点,而且他也试图证明均衡也是的确实确存在的.纳什均衡的优势之一就是这种均衡在实际上可能碰见的每一个博弈中几乎都存在,即使不存在纯战略均衡也存在混合战略均衡.博弈中有一个特点有助于纳什均衡的存在,这就是支付对于参与人战略的连续性.如果参与人战略的微小变化只会引起支付的微小或者零的变化,那么称支付对于战略而言是连续的.依靠这种连续性,参与人的战略可以精密地调整,从而趋于在彼此之间达成最正确反响.5.1纳什均衡的存在性88纳什均衡的存在性定理I：每一个有限博弈至少存在一个纯战略纳什均衡或混合战略纳什均衡.在福利博弈中,没有纯战略的均衡,但是在引入了混合战略,支付对于混合战略就是连续的,因此就存在混合战略纳什均衡.博弈中另一个特点有助于纳什均衡的存在,这就是参与人的战略空间是有限的闭集,假设在一个股票市场博弈中,Smith可以借钱买股票,想借多少钱都可以,从而他想买多少股票都可以,因此他能够买的股票数量构成的战略空间为[0，∞),这个集合是无界的.如果Smith知道明天的股价会高于今天的股价,那么这个博弈将没有均衡;如果Smith购置股票的数量被限定为小于1000股,并且可以购置小数单位的股票,他能够买的股票数量构成的战略空间为[0，1000),这个博弈仍然没有均衡,因为他想购置的股票数量为999.999…..,但如果可以购置1000股,此时的均衡为1000.5.纳什均衡的存在性与多重性895.纳什均衡的存在性与多重性905.2纳什均衡的多重性在一个博弈中,令博弈论专家棘手的不是这个博弈中是否存在均衡,而是可能存在多少均衡.许多博弈中都存在多个纳什均衡,有些博弈中甚至存在无穷多个纳什均衡.考虑两个人分一块蛋糕,每个人独立地提出自己要求的份额,如果两个人提出的份额没有超过总的份额,那么各自得到自己要求的份额,如果超过了那么什么也得不到.这个博弈的均衡是什么?5.纳什均衡的存在性与多重性91双方的反响曲线是重合的因此这个博弈中有无穷个纳什均衡但是哪个均衡会出现呢？(0.5,0.5)应该是最长出现的均衡这种均衡称为“聚点〞,也称为“聚点均衡〞聚点并不唯一,聚点的出现往往依赖于博弈的环境,不同的环境,出现的聚点可能是不一样的.如果去年以四六开分过一次蛋糕,那么四六开可能就是今年的一个聚点.5.纳什均衡的存在性与多重性92思考题一、张维迎:P761.3.4.6.11.93949596三、近年以来，中国汽车价格不断下降，累积降幅平均到达20%以上，请用博弈理论分析这种现象。你能预测中国汽车市场的均衡价格吗？二、上世纪90年代，中国彩电的价格大战此起彼伏，给消费者带来了实惠，而彩电企业的单机利润大幅度下降，有报道称某彩电企业每台彩电的利润只有10元，你认为可信吗？请作出你的分析。974.俾斯麦海之战“俾斯麦海之战〞发生在1943年的南太平洋上,日本海军上将木村受命将日本陆军运抵新几内亚,期间要穿越俾斯麦海,而美国海军上将肯尼欲对日军运输船进行轰炸.穿越俾斯麦海通往新几内亚由两条航线:较短的北线和较长的南线,木村必须选择其中的一条.而肯尼只能将飞机派往其中一处去搜索日军.如果肯尼将他的飞机派到了错误的航线上,他虽然可以招回它们,但可供轰炸的时间就会减少.博弈参与人:木村和肯尼,支付假设为下表所示.肯尼北南木村北南这个博弈的纯纳什均衡是什么?(2)如果肯尼和木村分别先行动,

均衡的结果又分别是什么?(3)你能分析该博弈的混合战略纳什均衡吗?985.市民责任博弈(吉蒂谋杀案)“吉蒂谋杀案〞是社会心理学中一个声名狼籍的案例.吉蒂是在纽约被谋杀的,她的38位邻居都目睹了案件的发生却无人报案.如何解释所发生的一切?将问题简化为只有两个目击者:John和Smith,其支付假定如下表所示:Smith袖手旁观报案John袖手旁观报案博弈的纯纳什均衡是什么?分析该博弈的混合战略纳什均衡.(3)*将目击中扩大为N个人,如果有人报案,报案者支付为7,其余目击者支付为10,假设无人报案,所有目击者支付均为0,分析该博弈的均衡.99第三章完全信息动态博弈1.博弈的扩展式表述2.扩展式表述博弈的纳什均衡3.子博弈精炼纳什均衡4.子博弈精炼纳什均衡应用举例5.重复博弈与民间定理(无名氏定理)100“完全信息〞是指每个参与人对所有其他参与人的特征(战略空间、支付函数等)有完全的了解;“动态〞是指所有参与人分先后选择行动且可能选择多次行动;“完全信息动态博弈〞就是指每个参与人对所有其他参与人的特征(战略空间、支付函数等)有完全了解的前提下,分先后选择行动的博弈.手雷博弈:第一步:Tom要求Smith负1000$给自己,否那么就引爆手中的手雷;第二步:Smith决定是否要负Tom1000$(要判断Tom所说话的可信度);第三步:Tom观察Smith的决定,然后决定是否要引爆手雷.在动态博弈中都有一个问题:可信任性问题1011.博弈的扩展式表述在上一章,我们利用战略式表述研究了完全信息静态博弈,并且作为静态博弈的解的概念,重点讨论了纳什均衡(NE).手雷博弈:第一步:Tom选择是否威胁要求Smith付1000$给自己,否那么就引爆手中的手雷;第二步:Smith决定是否要付Tom1000$(要判断Tom所说话的可信度);第三步:Tom观察Smith的决定,然后决定是否要引爆手雷.该博弈的语言描述可以转化为一种很直观的表述结构:102这种结构称为博弈树,也称为博弈的扩展式表述.这是动态博弈分析中最常用的表述方法.博弈的扩展式表述包含以下要素:注意:在这里没有提到战略,战略是选择行动时的策略TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)博弈的扩展式表述103TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)博弈的扩展式表述的一般结构：结(nodes):分决策结和终点结,决策结是参与人采取行动的时点,而终点结那么是对应支付向量的点.决策结终点结每一个决策结都只有一个直接前列结(初始结除外),但可能有假设干个直接后续结.博弈的扩展式表述104TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)(2)枝(branches):是博弈树上一个决策结到它的直接后续结的连线或箭头,枝实际上是参与人的一个行动选择.枝注意终点结不存在行动集合，只有支付组合初始结没有进入的枝；终点结没有出去的枝；每个中间的决策结只有一个进入的枝，但有多个出去的枝.博弈的扩展式表述105(3)信息集(informationsets)开发商A开发(4,4)支付:(开发商A,开发商B)不开发自然N自然N大大小小开发商BBBB开发不开发开发不开发开发不开发开发不开发(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)开发商博弈的行动次序:开发商A选择行动:

开发、不开发;自然选择市场的大小:

大、小;开发商B选择行动:

开发、不开发;如果开发商B在决策之前清楚地知道开发商A和自然的选择,即参与人在轮到他决策时知道在他之前所发生的一切,这种情形下的每一个决策结属于一个信息集,即开发商B有四个信息集.只含有一个决策结的信息集成为单结信息集.如果博弈树中的信息集都是但单结的，那么称为完美信息博弈,在完美信息博弈中，参与人在决策前都知道自己处于哪个决策结.信息集开发商博弈(1)博弈的扩展式表述106开发商A开发(4,4)支付:(开发商A,开发商B)不开发自然N自然N大大小小开发商BBBB开发不开发开发不开发开发不开发开发不开发(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)但是如果开发商B在决策之前只知道A的选择,并不清楚自然的选择,此时对于B只有两个信息集,即B在决策前只知道自己处于哪个信息集,每个信息集有两个决策结,而开发商并不知道自己处于哪个决策结.开发商博弈(2)含有两个或以上的决策结的信息集称为多结信息集，含有多结信息集的博弈称为不完美信息博弈。不完美信息博弈中要求至少有一方具有不完美信息。博弈的扩展式表述107开发商A开发(4,4)支付:(开发商A,开发商B)不开发自然N自然N大大小小开发商BBBB开发不开发开发不开发开发不开发开发不开发(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)还有一种情形时,开发商B在决策之前知道市场需求的大小,但并不知道开发商A的选择(如A,B同时选择),此时对于B仍然只有两个信息集,即B在决策前只知道自己处于哪个信息集,并且每个信息集也有两个决策结,而B不知道自己处于哪个决策结.开发商博弈(3)博弈的扩展式表述108自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发开发不开发开发不开发开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)开发商博弈(4)将开发商博弈的行动顺序改变：由自然首先选择市场的大小，然后由开发商A选择是否开发.并且开发商A行动前不知道自然的选择(市场的大小)，开发商B在行动前知道市场的大小，但不知道开发商A的选择.博弈的扩展式表述109博弈的扩展式表述1101UD22LLRR111完美记忆和不完美记忆NUD11LLRR2211参与人2的不完美信息集参与人1将第一步自己的选择忘记了参与人2的不完美信息集参与人1将第二步自己的选择忘记了忘记自己选择的博弈称为不完美记忆博弈的扩展式表述1112.扩展式表述博弈的纳什均衡2.1扩展式表述博弈的战略式表述战略式表述在博弈开始之前就制定了相机行动方案,即“如果….,我将选择…...扩展式表述是相机行动，要等待博弈到达自己的信息集，然后再决定选择什么行动.TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)考虑手雷博弈是否存在纳什均衡扩展式表述的博弈如何求纳什均衡？先考虑该博弈的战略式表述方法：112扩展式表述博弈的纳什均衡威胁，引爆Tom威胁，不引爆不威胁Smith付不付(-10000,-10000)(0，0)(1000,-1000)(-100,0)(0，0)(-10000,-10000)手雷博弈的战略式表述TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)第一步Tom有两个纯战略：{威胁，不威胁}第二步在Tom选择“威胁时〞Smith有两个战略为：{付,不付}{引爆,不引爆}第三步在Smith选择“付〞时Tom有两个战略为：唯一的纳什均衡(不威胁,不付)113(4,4)支付:(开发商A,开发商B)开发商A开发不开发开发商BB开发不开发开发不开发(8,0)(0,8)(0,0)开发商博弈开发商A的战略有两个：{开发，不开发}而开发商B的战略有四个：A开发我也开发；A开发我不开发；A不开发我开发；A不开发我不开发；开发商B的四个战略表示为{开发,开发};{开发,不开发};{不开发,开发};{不开发,不开发};注意行动和战略的区别战略是行动的准那么扩展式表述博弈的纳什均衡114(4,4)支付:(开发商A,开发商B)开发商A开发不开发开发商BB开发不开发开发不开发(8,0)(0,8)(0,0)开发商博弈开发商B{开发,开发}{开发,不开发}{不开发,开发}{不开发,不开发}开发开发商A不开发(4,4)(4,4)(8,0)(8,0)(0,8)(0,8)(0,0)(0,0)这个战略式表述的博弈中有两个纯战略的纳什均衡：(开发,{开发,开发}),(开发,{开发,不开发})对应的行动组合只有一个:(A开发,B也开发)但均衡(开发,{开发,不开发})中B的均衡战略{开发,不开发}是不可信的.扩展式表述博弈的纳什均衡115TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)手雷博弈123再考虑第二步：Smith知道第三步Tom会选择“不引爆〞,因此比较了“付〞和“不付〞的支付后，Smith应该选择“不付〞最后考虑第一步：Tom知道Smith第二步会选择“不付〞，因此Tom一开始就会选择“不威胁〞因此可以得到该博弈的均衡〔不威胁、不付、不引爆〕这种从后面往前面推导的方法称为逆向归纳法我们先考虑第三步：Tom的行动“不引爆〞比“引爆〞更占优，Tom应该选择“不引爆〞2.2扩展式表述博弈的纳什均衡和逆向归纳法扩展式表述博弈的纳什均衡116定理(Zermelo,1913;Kuhn,1953):一个有限完美信息博弈至少有一个纯战略纳什均衡.如果一个扩展式博弈有有限个信息集,每个信息集上参与人有有限个行动选择,并且这个博弈是完美信息的,那么一定有一个纯战略纳什均衡,即这个定理可是使用逆向归纳法解释.开发商博弈:假设这是一个有限完美信息博弈.自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发开发不开发开发不开发开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)有均衡的结果:(市场需求大,A开发,B开发)(市场需求小,A开发,B不开发)扩展式表述博弈的纳什均衡117将这两个纳什均衡写成战略组合形式有四个:(大,开发,{开发,开发})(市场需求大,A开发,B开发)(市场需求小,A开发,B不开发)(小,开发,{不开发,开发})(大,开发,{开发,不开发})(小,开发,{不开发,不开发})战略组合(大,开发,{开发,不开发}),(小,开发,{不开发,不开发})显然不合理,B的合理战略在市场需求大时为{开发,开发},而在市场需求小时应为{不开发,开发}那么如何将不合理的纳什均衡剔除呢?扩展式表述博弈的纳什均衡118自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发开发不开发开发不开发开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)开发商博弈TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)手雷博弈3.子博弈精炼纳什均衡3.1子博弈子博弈非子博弈图例:119自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发开发不开发开发不开发开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)开发商博弈如果开发商B在行动时不知道开发商A的选择,那么开发商B有两个信息集,且每个信息集有两个决策结.子博弈非子博弈图例:定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的一局部,称为原动态博弈的一个“子博弈〞.子博弈精炼纳什均衡120条件(1)说明,“子博弈〞的初始结x必定在原博弈的一个单结信息集中,即只有当参与人在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结.如果一个信息集包含两个以上的决策结,那么这些决策结都不能作为子博弈的初始结.完美信息博弈由于所有信息集都是单结的,所以每个决策结都可以开始一个子博弈.条件(2)说明,“子博弈〞中的信息集必须只含有子博弈中的决策结,并且结构与原博弈一致.子博弈精炼纳什均衡1213.2子博弈精炼(完美)纳什均衡(4,4)支付:(开发商A,开发商B)开发商A开发不开发开发商BB开发不开发开发不开发(8,0)(0,8)(0,0)开发商博弈开发商博弈有两个纯战略的纳什均衡：(开发,{开发,开发}),(开发,{开发,不开发})子博弈1子博弈2子博弈1的纳什均衡是开发商B“开发〞子博弈2的纳什均衡也是开发商B“开发〞在扩展式表述的动态博弈中,有的纳什均衡中可能会含有不可信的战略被选择,在前面的例子中我们已经发现,虽然这些战略构成的战略组合是纳什均衡,但就这些战略本身而言不符合参与人的自身利益.子博弈精炼纳什均衡122原博弈的另一个纳什均衡(开发,{开发,不开发})中B的战略为{开发,不开发},即A开发那么B开发,A不开发那么B也不开发,与子博弈2的纳什均衡“开发〞矛盾.(开发,{开发,开发})是既是原博弈也是子博弈的纳什均衡原博弈的第一个纳什均衡(开发,{开发,开发})中,B的战略是{开发,开发},即不管A是否开发,都选择开发,即B的战略也是子博弈1和2的纳什均衡.(开发,{开发,不开发})虽然什原博弈的纳什均衡,但并不是子博弈的纳什均衡,即这是一个不合理的均衡如何将扩展式博弈中博不合理的纳什均衡去除?子博弈精炼纳什均衡123子博弈精炼纳什均衡和纳什均衡的区别就在于子博弈精炼纳什均衡可以将含有不可信战略的纳什均衡排除.在开发商博弈中,纳什均衡(开发,{开发,开发})是子博弈精炼纳什均衡,但(开发,{开发,不开发})不是一个子博弈精炼纳什均衡.(开发,{开发,开发})也是原博弈中唯一可信的纯战略的纳什均衡子博弈精炼纳什均衡124自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发开发不开发开发不开发开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)开发商博弈(4,4)支付:(开发商A,开发商B)开发商A开发不开发开发商BB开发不开发开发不开发(8,0)(0,8)(0,0)开发商博弈3.3用逆向归纳法求完美信息博弈的子博弈精炼纳什均衡子博弈1子博弈2使用逆向归纳法可以求出完全且完美信息动态博弈的纯战略的子博弈精炼纳什均衡.(开发,开发)(大,开发,开发)和(小,开发,不开发)子博弈精炼纳什均衡1254.1讨价还价博弈(一)Smith和Jones分100美圆.在谈判的第一回合中由Smith提出方案,由自己留下S1美圆,出价费用为零,Jones或者接受(此时博弈结束)或者拒绝并转入第二回合;第二回合由Jones提出方案,出价费用为10美圆,Jones提出给Smith的数量为S2美圆,Smith选择接受(此时博弈也结束)或拒绝并转入第三回合;第三回合再次由Smith提出方案,出价费用为c美圆,Smith提出自己留下S3美圆.讨价还价谈判最多只进行三轮,如果三轮都不能达成协议,那么100$将全部给Jim.如何就不同的出价费用c找到均衡的结果?(1)c=0;(2)c=80;(3)c=10;4.子博弈精炼纳什均衡应用举例126讨价还价博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)SmithJonesJonesSmith提出给Smith为S2提出要求S3支付:(Smith,Jones)(1)(2)(3)应用逆向归纳法求解：首先考虑第三回合Smith提出自己留下100美圆Jones会接受再考虑第二回合Jones只能提出自己留下0美圆而给Smith100美圆,否那么Smith一定是不接受(100，-10)(0，-10)(100，-10)子博弈精炼纳什均衡应用举例127最后考虑第一回合Smith提出自己留下100美圆,而Jones只能选择接受,不然第二回合还要出10美圆的出价费用讨价还价博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)SmithJonesJonesSmith提出给Smith为S2提出要求S3支付:(Smith,Jones)(1)(2)(3)(100，-10)(0，-10)(100，-10)(100，0)子博弈精炼纳什均衡应用举例128讨价还价博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)SmithJonesJonesSmith提出给Smith为S2提出要求S3支付:(Smith,Jones)(1)(2)(3)首先考虑第三回合Smith提出自己留下100美圆Jones会接受再考虑第二回合Jones只能提出自己留下80美圆而给Smith20美圆,否那么Smith一定是不接受(20，-10)(-80，-10)(20，70)子博弈精炼纳什均衡应用举例129最后考虑第一回合Smith提出自己留下30美圆,而Jones只能选择接受,不然第二回合还要出10美圆的出价费用讨价还价博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(100,

-10)(0,-10)SmithJonesJonesSmith提出给Smith为S2提出要求S3支付:(Smith,Jones)(20，70)(30，70)(1)(2)(3)(20，-10)(-80，-10)子博弈精炼纳什均衡应用举例130讨价还价博弈Smith提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)Sm

人人文库> 全部分类> 专业文献 > 工程机械

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《博弈论》最完整版课件（加专题研究）

文档简介

温馨提示

最新文档

评论

《博弈论》最完整版课件（加专题研究）

文档简介

温馨提示

最新文档

评论

相关文档