




已阅读5页,还剩221页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,博弈论与经济学思维,兰州大学管理学院贾明琪,2,一、介绍博弈论,(一)概念,什么是博弈论1概念:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。简单地说,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡。,3,张维迎的定义,“博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的”也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。所以在这个意义上说,博弃论又称为“对策论”.,4,博弈论(gametheory)是由美国数学家冯诺依曼(Von.Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。1994年,三位博弈论专家即数学家纳什(Nash,他的故事被好莱坞拍成电影美丽心灵,该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖。,5,1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。专家预计,近几年还会有更多的博弈论专家可能获得诺贝尔经济学奖。,6,为什么博弈论在经济学领域会产生如此大的影响呢?这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。,7,博弈论是一门十分有趣但理论上又是十分艰深的学问,我今天打算用一些大家能够凭直观或简单分析就能把握的例子为大家介绍博弈论的基本概念及应用,以引起大家对这门目前已成为热门科学的兴趣和获得初步的了解。这些例子也是我们在日常生活中经常所遇到的问题或观察到的现象,通过博弈论,我们能够更加深刻地理解它们。,8,囚犯困境(Prisonersdilemma)囚犯困境是指这样一种情形,此时两个人(或厂商)合作要比不合作好,但是每个人都觉得不合作符合他的利益,因此每个人的状况都要坏于如果他们合作时的境况。,(一)什么是博弈论:从“囚徒困境”谈起,9,囚犯困境(PrisonDilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。囚犯困境的主旨为,囚犯们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚犯招供,因为囚犯们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。,10,经典的囚徒困境1950年,由就职於兰德公司的梅里尔弗勒德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,後来由顾问艾伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为囚徒困境。经典的囚徒困境如下:,11,1.囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。,(一)什么是博弈论:从“囚徒困境”谈起,12,表1囚徒困境博弈乙招不招招甲不招(问题1:甲、乙如何选择?),13,关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我招,就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。,14,基于经济学中Rationalagent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。,15,尽管甲不知乙是否招供,但他认为自己选“招”最好,因而甲会选择“招”,乙也同样会选择“招”,结果各判8年;但若两人都不招,结果是两人只被判1年,但这种结果是不会出现的。我们可以运用“剔除劣战略”的方法来获得这样的结果。,16,甲或乙可以作出的选择被称为“战略”,如“招”或“不招”都是战略。,17,对甲来说,尽管他不知道乙是选择了“招”还是“不招”,他发现他自己选择“招”都是比选择“不招”为好的。因此,“不招”是相对于“招”的劣战略,他不会选择劣战略。所以,甲会选择“招”。同样,根据对称性,乙也会选择“招”,结果是甲乙两人都“招”。,18,甲和乙是参与博弈的人,称为“局中人”。表1中每一个小方格内的数字被称为局中人的支付,其中左边的数字代表甲的支付,右边的是乙的支付。表1中的双变量矩阵称为博弈支付矩阵。局中人所选择的战略构成的组合(招,招)被称为博弈均衡。这个组合中前后两个战略分别表示甲和乙所选择的战略。,19,表1囚徒困境博弈乙招不招招甲不招,20,甲和乙都不会选择劣战略“不招”,称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。,21,囚徒困境说明了什么,在(坦白、坦白)这个组合中,和都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果和都选择抵赖,各判刑年,显然比都选择坦白各判刑年好得多。当然,和可以在被警察抓到之前订立一个攻守同盟,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定,显然最好的策略是双方都抵赖.,22,囚徒困境的意义,“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。,23,对经典经济学的冲击,“纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。国富论:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。,24,怎么看待这个问题,二者是对立统一的,范围不同,在非竞争环境中效率会受到损失;在完全竞争条件下,边际利润等于边际成本,达到效率,25,NASH均衡条件下的行为规则,合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。所谓“己所不欲勿施于人”。但前提是人所不欲勿施于我。,26,Nashequilibrium,纳什均衡,Nashequilibrium,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰纳什命名。约翰纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为非合作博弈(1950)的博士论文。该博士论文导致了n人博弈中的均衡点(1950)和题为非合作博弈(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。,27,纳什均衡定义,假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(StrategyProfile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。,28,哲学思考,如果参与人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。,29,Bargaining问题的普遍性,几乎所有的交易都涉及讨价还价:买卖双方之间;雇员与顾主之间;合伙人之间;竞争企业之间夫妻之间;政治领域之间;中央政府与地方政府;国家之间;,30,所有讨价还价的共同之处,达成某种协议是当事人的共同利益,但他们之间在究竟达成哪一个协议的问题上存在利益冲突;协议的多重行可能阻止任何协议的出现;典型的“合作与竞争”问题;合作意味着存在着帕累托改进,但不同的当事人偏好不同的帕累托状态。不同与集体选择(唯一均衡)和其他多重均衡;不是零和博弈。,31,寻找纳什均衡,C1,C2,C3,R1,R2,R3,100,100,0,0,50,101,50,0,1,1,60,0,0,300,0,0,200,200,32,纳什均衡:举例,广告博弈纳什均衡:(做广告,做广告),企业1,企业2,33,利用纳什均衡寻租,考虑股票市场融资的例子:设想企业价值是100,现在发行的流通股为100股,每股价值1元。现在假定经理想筹集100元,投资价值只有50元。有人买新股吗?假定每一股配4股,价格为0.25元。如果股东不接受配股:原来一股1元的价值就变成0.3元(=150/500);如果接受配股,他持有的股票的价值是1.5元;因为配股的成本是1元,所以他的最优选择是接受配股。,34,所有权配置与等级结构,考虑团队生产:让其中的一个人变成所有者,工作,偷懒,工作,偷懒,6,6,2,2,0,8,8,0,35,纳什均衡与学习过程,R2,R1,NE,q1,q2,36,双寡头竞争:Cournot博弈,两个企业同时选择产量,价格由市场决定;假定需求函数为其中为企业1的产量,为企业2的产量假定成本函数为:那么,利润函数为:,37,双寡头竞争(续),企业最大化利润的一阶条件为:纳什均衡产量:纳什均衡利润为,38,垄断产量和垄断利润,垄断企业的目标函数:垄断产量:垄断利润:,39,划拳博弈,老虎,鸡,虫,杠子,老虎,鸡,虫,杠子,0,0,1,-1,0,0,-1,1,-1,1,0,0,1,-1,0,0,0,0,-1,1,0,0,1,-1,1,-1,0,0,-1,1,0,0,40,混合战略纳什均衡,有些博弈没有“纯战略”纳什均衡,但有混合战略纳什均衡,如监督博弈。,监督,不监督,偷懒,不偷懒,1,1,1,2,2,3,2,2,给定工人偷懒,老板的最优选择是监督;给定老板监督,工人的最优选择是不偷懒;给定工人不偷懒,老板的最优选择是不监督;给定老板不监督,工人的最优选择是偷懒;如此循环。,41,纳什均衡的存在性问题,每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略);如果一个博弈存在两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡。,42,风险与均衡,由于纳什均衡要求理性共识和一致预期,当人们可能犯小小的错误时,纳什均衡不一定被选择。如下面这个博弈中,多数人将选择“下”而不是“上”。,上,下,左,右,8,10,-1000,9,7,6,6,5,只要B有千分之一的概念错误地选择右,A将选择下;如果B怀疑A怀疑自己可能犯错误,B将选择右。所以,出现的不是纳什均衡,43,有问题的纳什均衡?,C1,C2,C3,R1,R2,R3,2,2,3,1,0,2,1,3,2,2,3,2,2,0,2,3,2,2,44,纳什均衡的重要影响,纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在博弈论和经济建模一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够消费近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面(1)改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。(2)扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。(3)加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。,45,(4)形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。(5)扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。(6)改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗萨缪尔森(PaulSamuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是供给和需求”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是纳什均衡”。,46,3博弈论的要素,博弈论的提法可能太过于学术化,容易让人们退避三舍。其实它有一个非常通俗的名字-游戏理论(博弈论的英文名字叫做,如果直译,就是游戏理论)。博弈论在我国还有一个名字,叫对策论。这些名字都很好理解,博弈字面意思就是赌博、下棋,赌博和下棋当然是游戏了,赌博和下棋的时候常常要千方百计地应付对手,自然是要讲究对策了。,47,参与人players,一个博弈中的决策主体,他的目的是通过选择行动(或战略)以最大化自己的支付(效用水平)。参与人可能是自然人,也可能是团体,如企业,国家等。重要的是:每个参与人必须有可供选择的行动和一个很好定义的偏好函数。不做决策的被动主体只能被当作环境参数。,48,虚拟参与人pseudo-player,为了分析方便,自然nature被当作虚拟参与人。自然代表决定外生随机变量的概率分布的机制。比如房地产开发中市场需求的大小。,49,行动ACTIONSORMOVES,参与人在博弈的某个时点的决策变量。(坦白)N个参与人的行动的有序集称为行动组合(坦白,抵赖)。,50,行动的顺序,对于博弈的结果非常重要。有关静态和动态博弈的区分就是基于行动的顺序做出的。同样的行动集合,行动的顺序不同,每个参与人的最有决策就不同,博弈的结果也不同。尤其在不完全信息博弈中,后行动者依赖观察先行动者的行动来获取信息。,51,信息information,参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识。完美信息perfectinformation:指一个参与人对其他参与人的行动选择有准确的理解,即每个信息集只包含一个值。,52,共同知识commonknowledge,所有参与人知道每一步的信息集。,53,战略strategies,参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。战略与行动:战略是行动的规则而不是行动本身。在静态博弈中,战略和行动是相同的。战略必须是完备的,要给出参与人在每一种可想象得到的情况下的行动选择。,54,支付payoff(效用utility),在一个特定的战略组合下参与人得到的确定效用水平,或是指参与人得到的期望效用水平。,55,均衡equilibrium,指所有参与人的最优战略的组合。,56,(二)历史沿革,犹太法典(Talmud)中一个男人如何将死后的财产发给三个妻子的难题.博弈理论开始于1944年由冯诺依曼(VonNeumann)和摩根斯坦恩(Morgenstern)合作的博弈论和经济行为(TheTheoryofGamesandEconomicBehaviour)一书的出版。世纪年代以来,纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。,57,三位大师主要的贡献,1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。因为在现实世界中,非合作博弈要比合作博弈普遍得多。,58,传统经济学对非合作博弈是以亚当斯密的看不见的手来解释的。他的这项理论工作使得博弈论从此成为经济学家用来分析商业竞争到贸易谈判种种现象的有力工具。Tucker于1950年定义了“囚徒困境”(prisonersdilemma)。他们两个人的著作基本上奠定了现代非合作博弈论的基石。到50年代,合作博弈发展到鼎盛期,包括纳什(1950)和夏普里(Shanley,1953)的“讨价还价”模型,Gillles和Shanley(1953)关于合作博弈中的“核”(core)的概念,以及其他一些人的贡献。,59,SeltenandHarsanyi,泽尔腾(1965)将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”,而海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(19671968)。总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型,60,(三)分类和主要思想,博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能,则称非合作博弈。合作博弈强调的是集体主义,团体理性,是效率、公平、公正;,61,非合作博弈,而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡。,62,例子,比如两家企业、合作建设一条的生产线,协议由方提供生产的技术,方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时方如果能够获得方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理,方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的集体利益,则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。,63,顺序和信息,博弈论非常强调时间和信息的重要性,认为时间和信息是影响博弈均衡的主要因素。在博弈过程中,参与者之间的信息传递决定了其行动空间和最优战略的选择;同时,博弈过程中始终存在一个先后问题,参与人的行动次序对博弈最后的均衡有直接的影响。,64,分类,博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了种博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈,65,博弈的分类及对应的均衡,66,主要思想,博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故。博弈论已经在政治、经济、外交和社会学领域有了广泛的应用,它为解决不同实体的冲突和合作提供了一个宝贵的方法。在对参与者行为研究这一点上,博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和冲突、竞争与合作,而这正是博弈论的研究对象。,67,我们从博弈中学习什么,博弈论告诉人们,要学会理解他人都有自己的思想,每个个体都是理性的,所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法,并不是处方,它并不告诉你该付多少钱买东西,这是计算机或者字典的任务。博弈论只是提供一些关系的例证,一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家,也许需要学习它的理论模型,它的实验方式,68,对博弈论的两种极端评价,从20世纪70年代末期,学者们逐渐形成一个共识,当一个人或群体与他或他们的博弈论对手都能以理性的方式做出决策行为的时候,那就是博弈论大显身手的场合。有人将博弈论比作Mendel的遗传理论和Darwin的自然选择对生物学的影响,或者Newton的天体力学对物理学的奠基作用。真正的社会并不严格是博弈论的理想对象,无论是股票市场上的投机现象,还是受制于传统文化的惯性影响下的体制选择。如同混沌动力系统理论带给人们的初始兴奋之后,博弈论并不具有有历史上像物理学中理论的预测能力。,69,四.博弈论与运筹学,运筹学是近代应用数学的一个分支,主要是将生产、管理等事件中出现的一些带有普遍性的运筹问题加以提炼,然后利用数学方法进行解决。前者提供模型,后者提供理论和方法。运筹学本身也在不断发展,现在已经是一个包括好几个分支的数学部门了。比如:数学规划(又包含线性规划;非线性规划;整数规划;组合规划等)、图论、网络流、决策分析、排队论、可靠性数学理论、库存论、对策论、搜索论、模拟等等。,70,数学规划,数学规划的研究对象是计划管理工作中有关安排和估值的问题,解决的主要问题是在给定条件下,按某一衡量指标来寻找安排的最优方案。它可以表示成求函数在满足约束条件下的极大极小值问题。,71,排队论,排队论是运筹学的又一个分支,它有叫做随机服务系统理论。它的研究目的是要回答如何改进服务机构或组织被服务的对象,使得某种指标达到最优的问题。比如一个港口应该有多少个码头,一个工厂应该有多少维修人员等,72,搜索论,搜索论是由于第二次世界大战中战争的需要而出现的运筹学分支。主要研究在资源和探测手段受到限制的情况下,如何设计寻找某种目标的最优方案,并加以实施的理论和方法。在第二次世界大战中,同盟国的空军和海军在研究如何针对轴心国的潜艇活动、舰队运输和兵力部署等进行甄别的过程中产生的。搜索论在实际应用中也取得了不少成效,例如二十世纪六十年代,美国寻找在大西洋失踪的核潜艇“打谷者号”和“蝎子号”,以及在地中海寻找丢失的氢弹,都是依据搜索论获得成功的。,73,五、完全信息动态博弈,纳什均衡的问题:多均衡、单选择性(静态性),不可置信威胁的存在性(市场进入博弈)泽尔腾剔除了不可置信威胁战略,减少了纳什均衡的个数扩展型表述的要素:参与人、参与人行动的时点、行动集合、信息,支付函数,74,子博弈精炼纳什均衡,当参与人的战略在每一个子博弈中都构成纳什均衡。每一个子博弈都是最优的。城市姑娘爱上农村小伙子导致姑娘父亲的反应。承诺行动(commitment),当事人使自己威胁战略变得可信的行为。,75,例子(要挟诉讼,曾诺行动与精炼均衡的关系),成功可能性非常小,目的是希望和解得到补偿。,不指控,指控,要求S,拒绝,接受,起诉,放弃,(0,0),P,P,D,P,(S-C,-S),(TX-P-C,-TX-D),(-C,0),76,原告指控的目的本身意味着TX-C-P,只要胜诉的可能大于0,原告将起诉。如果SC+P,原告提起诉讼;即使TXC+P仍有可能。(TX+D/2-C-P,-TX-D/2)案件私了。,78,不完全信息静态博弈,不了解对方的偏好、战略空间及各种战略组合下的利润水平。市场进入博弈,在位者默许斗争,进入者进入不进入,高成本,低成本,79,海萨尼转换,引入虚拟参与人“自然”在所有后果间是无差异的。自然的选择提供了被选择的参与人真实类型的概率分布。分布函数是共同知识。“不完全信息”转换为“完全但不完美信息”,80,贝叶斯纳什均衡Bayesianequilibrium,给定自己的类型和对方类型的概率分布的情况下,每个参与者的期望效用达到了最大化,没有人有积极性选择其他战略的类型战略依存组合。期望利润=40 x+(-10)(1-x),81,不完全信息动态博弈-精炼贝叶斯纳什均衡,垄断限价模型(低成本价格与高成本价格透露的信息)信号传递模型成本的信息含量,82,求爱博弈,如果男人是柳下惠,女人穿少的时候他会看的概率是20%;如果男人是登徒子,女人穿少的时候他会看的概率是100%。女人根据现有的信息判断男人是柳下惠的概率为70%,因此女人估计自己穿少的时候,男人看的概率为:0.7*0.2+0.3*1=0.44这是女人给定男人所属类型的先验概率下,男人可能采取看的概率。,83,续,当男人的确看了的时候,使用贝叶斯法则,根据男人看的这一行动,女人认为男人是柳下惠的概率变为:0.7*0.2/0.44=0.32根据这一新的概念,女人估计自己穿少的时候男人会刊的概率为:0.32*0.2+0.68*1=0.744如果女人将这种行为再重复一次,男人又看了,则女人认为男人是柳下惠的概率变为:,84,0.32*0.2/0.744=0.086这样女人通过男人一次次的看的行为,越来越认为男人是登徒子而不是柳下惠。这就是参与人行为传递信息的作用。,85,(二)应用与分析,我们可以利用这个道理来分析日常生活中的许多不合作现象。,86,2.生活中的“囚徒困境”例子,例子1商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。,87,譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,这在发达国家是不可思议的。,88,但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的。,89,几个例子,1.囚徒困境在经济学和生活中的例子中东石油输出国OPEC限产几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作次,那么在第九次博弈参与人就会采取不合作态度-参与者效用多重性,漂亮女生,90,价格战,厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(rivalrygame)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。,91,有趣的联系,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。,92,占优战略,不论其他参与人选择什么战略,它的最优战略是唯一的,这样的最优战略被称为占优战略。重复剔除严格劣战略,93,性别战与先动优势,双均衡的性别战,女足球芭蕾,男足球芭蕾,94,纯战略与混合战略,如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,称为纯战略。如果一个战略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合战略。,95,监督博弈的纳税检查,A为应纳税款,C为检查成本,F是偷税罚款。假定C400元。通过机制设计增大了公司利润。,191,类似的还有,酒店的星级分类,五星级、四星级、三星级,酒店,冰棍的不同品种与价格,影剧院的不同座位价格表等等,都是实现信息甄别的机制设计。,192,例子21大智若愚中的智慧:聪明过头没好处美国19世纪有一个颇有成就的政治家,其幼年时是流浪街头的孤儿。他经常在大街上向行人讨钱,但当有人让他在一块钱和两块钱之间选择时,他选择了一块钱。于是,许多人都为了亲眼验证关于他的“犯傻”行为的传闻,专门来找他并让他在一块钱和两块钱之间选择。他仍然依然故我地只选择一块钱,于是来找他的人愈来愈多。,193,终于有一天,有一位女士问他:难道你不知道两块钱比一块钱更多一些钱吗?他如此回答道:如果我有一次选择了两块钱,就不会有人来找我让我在一块钱与两块钱之间选择了,我也讨不到钱了。这个故事告诉我们有时候“扮傻”也许是有好处的。下面再来看一个例子,这是一个动态博弈,局中人A有两次决策机会,一次在局中人B决策之前,另一次在B决策之后。,194,图4一个动态博弈运用“逆向归纳法”,A在第二次决策时会选择,B选择L;给定这些结果,A在开始会选择U,纳什均衡是(U,),L)。,195,但是,如果局中人A开始“装傻”,选择D而不是U,当B认为A是傻子时,B会以为当他选R后A会选,而这正是B所乐意看到的结果。于是,当A开始装傻后,造成B对A的类型的误解,B以为A是傻子,从而预期当他自己选R后A还会“犯傻”选。于是B就选R而不是均衡中的L。但是,当B选了R后,A不再“装傻”而一举选达到最大支付3。这就是A通过“装傻”骗过B使A获利。,196,第二种情形是,局中人B“装傻”,并使A相信他是傻子。这样,A会认为当他选D时B会选R。于是,A开始就选D,但一旦A选了D,B就不再“装傻”,一举选L。这是B骗过A的情形。下面的一个例子是当所有局中人都“装傻”时,所有人都受益的情形。,197,图5所有人都“装傻”使所有人都受益的博弈由逆向归纳法,博弈均衡是所有人都选择D,即(D,D)。结果是博弈在一开始就结束了,每个局中人都获得支付1。,198,如果A开始就装傻,选U而不是D,B也装傻,选U不选D,则博弈到最后结束时每个局中人得到支付100。相反,下面用一个例子说明当所有人都“聪明过头”时,所有人都受损失的道理。有这样一个故事,称为“旅行者困境”,说的是有两个旅行者甲和乙从一个以出产花瓶的著名旅游胜地回来时,他们都买了花瓶。,199,提取行查时,发现花瓶被碰破了。他们向航空公司索赔。航空公司估计花瓶的价格在80或90元的价位左右,但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内自己写下花瓶价格。若两人写的相同,说明他们说了真话,就照他们写的数额赔偿;如果两人写的不一样,那就认定写得低的旅客讲的是真话,按这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。,200,如果两人都写100元,他们都会获得100元。但是,给定乙写100元,甲改写99元,则他会获得101元。乙又想,若甲写99元,他自己写98元,比写100元好,因为这样他获100元,而写100元当甲写99元时自己却只获97元。而给定乙写98元,甲又会写97元,这样,最后落得每人都只写1、2元的境地。所以,还是古人说得好,有时“大智若愚”可能还是上策呢?,201,小孩玩的游戏“石头,剪子,布”,也是一种博弈。但是,这个博弈有一种有趣的特征,即给定一方的任何选择,另一方都有制胜对方的战略,所以,给定一方任何一个战略,对方都有制胜这个战略的战略,因而这个战略不是最优的。任何“纯战略”都不是最优的,纯战略是“石头,剪子,布”中的任何一个。,六、混合战略博弈,202,但是,我们知道,玩这个游戏是总是以对方不易猜出的随机方式出招。事实上,可以通过数学证明,当双方都以每个战略按1/3的概率出招时,达成一种双方都不愿改变这种概率分布的局面。这被称为“混合战略纳什均衡”,而这种以随机方式选择纯战略的博弈被称为“混合战略博弈”。以混合战略博弈的概念,我们来看下面几个例子。,203,例子22为什么一般人总是小错不断,大错不犯;偷税漏税的一般是中小企业,大企业会老老实实地交税?税务部门不会对所有企业的交税情况每一次都去检查,因为这样做的成本太高,得不偿失。所以,税务部门总是随机地对企业的交税情况进行检查。,204,企业也是随机地在交税与偷漏税之间进行选择。税收部门与企业间进行的是混合战略博弈。因为如果企业总是交税,税务部门就最好不检查;但给定不检查,企业就会偷漏税。所以,两者只有在随机地检查与不检查,企业随机地在偷漏税与交税之间选择,才会达成均衡。,205,对于大企业,因一旦偷税就数目巨大,所以,税务部门在随机检查时放在大企业上的可能性就大一些;而给定税务部门检查大企业的可能性较大,大企业偷漏税的行为就较少,否则就容易被逮个正着。所以,偷漏税较多的就是一些中小企业,大企业纳税的积极性较高。同样,大人物或有钱人纳税的积极性应较高,至于我国在过去一段时期有钱人反而不交税的现象主要源于制度不健全或已有的制度得不到贯彻所致。同样的道理,在犯罪或对错误的监督惩罚博弈中,也是混合博弈,人们可能总是大错不犯小错不断。,206,例子23田忌赛马新编春秋战国时期,齐威王常与旗下大将田忌赛马。规则是:每次赛三局,每一局齐威王与田忌各出一匹马比赛奔跑速度。每一局中的胜者赢败方一千斤铜。田忌有上、中、下三匹马,而齐威王也有上、中、下三匹马。每次比赛,第一局田忌出上马,齐威王也出上马;第二局田忌出中马,齐威王也出中马;第三局,田忌出下马,齐威王也出下马。齐威王的上马比田忌的上马好,齐威王的中马也比田忌的中马好,齐威王的下马还是比田忌的下马好。于是,每次比赛的结果都是田忌连输三局。,207,田忌的谋士孙膑了解了田忌的困境后,就打听到这样一个消息:尽管齐威王的上、中、下三匹马都要比田忌的对应上、中、下三匹马好,但碰巧的是田忌的上马可胜齐威王的中马,田忌的中马可胜齐威王的下马。于是,孙膑为田忌献计:下一次比赛中第一局时田忌出下马对齐威王的上马输一局,第二局田忌出上马对齐威王的中马,第三局田忌出中马对齐威王的下马,这样可连赢两局,最后净胜一千斤铜。田忌依计而行,果真赢回一千斤铜。,208,这个故事曾经被很多人当作博弈论的例子来演绎,但实际上这个故事与博弈论无关。博弈论会假定所有局中人都是理性的,不能假定一些局中人聪明而另一些局中人却是傻子。当田忌出下马时,齐威王最好的选择是出下马而不是上马。孙膑的计谋中假定齐威王是傻子,当田忌出下、上、中马时,他仍然按上、中、下马出,当然要输了。事实上,当田忌出下马时,齐威王应出下马,但齐威王出下马时,田忌不应出下马而是出中马,但此时齐威王又应出中马而不是下马了,。这样,博弈不会有纯战略的均衡。,209,两人只能玩混合战略博弈,齐威王分别以1/6随机的概率选择出上、中、下马的任一排列,田忌也如此。由于齐威王存在绝对优势,他平均看来仍然会赢田忌一千斤铜。,210,例子24如果曹操与诸葛亮一样聪明:三国演义中的华容道博弈在三国演义中,曹操在赤壁大战中一败涂地,率残兵败将向许都方向逃窜。诸葛亮命关羽率兵在途中阻截曹军。当时,第一批拦截大军是赵云率领的,第二批拦截大军是张飞带队的,第三批才是关羽率部伏击。由于曹军兵多将广,前二批伏击军不能逮住曹操,只是抢劫一些军械马匹之类。,211,待曹军冲过赵云、张飞两道关后,进入关羽的伏击地带。但是,当时关羽与曹操相遇的地方有两条道,一条是华容道,除此外还有另一条道。诸葛亮令关羽伏兵于华容道,并且要求关羽在华容道上点燃树枝冒出烟雾引曹操到来。当时关羽不解,问诸葛亮,“如果在伏兵之处点火,岂不令曹兵看见而改走另一条道逃脱?”诸荀亮叫关羽不要再问,只如此照办即可。,212,当曹操冲破赵云、张飞的阻截后,来到华容道前,看见华容道上静悄悄的,但有烟火萦绕。曹操大笑道:“孔明以为我会上他的当,故意叫人在华容道上点火让我走另一条道,而他却伏兵于这条道上好逮住我呢!我偏不上他的当!”于是,曹操令大军径直上华容道上而去,结果与关羽大军撞个正着。,213,曹操为何进了孔明的圈套呢?这里的道理是这样的:孔明知道曹操是聪明人,而聪明人见华容道上有烟火会认为华容道上有伏兵,于是会避
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业生产安全事故分析报告
- 工业自动化与绿色制造
- 工作中的数据分析与应用
- 工业自动化的发展现状与未来趋势分析
- 工作中的个人性格与冲突处理
- 工业领域新能源技术应用
- 工作环境改善的实践与思考
- 工厂企业消防安全管理与应急预案
- 工厂生产线的环境温控系统设计
- 工程档案资料管理的标准化与规范化研究
- 肺结核防治知识讲座课件
- 2024低压电力线高速载波通信互联互通技术规范第1部分:总则
- 抖音直播带货协议书模板
- 变电站-配电房挂轨巡检机器人技术方案
- 高职汽修专业《汽车电气设备维修》说课课件
- 香港(2024年-2025年小学二年级语文)统编版能力评测试卷(含答案)
- 【高校环艺】室内外手绘效果图表现教案
- 《积极心理学(第3版)》 课件 第2章 心理流畅体验
- FURUNO 电子海图 完整题库
- DB50-T 548.4-2024城市道路交通管理设施设置规范第4部分:道路交通安全设施
- 上海市2023年高中学业水平考试生物试卷真题(含答案详解)
评论
0/150
提交评论