版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE2..PAGE2.v.§6博弈决策概要博弈决策指以博弈理论为指导进展决策,其主要特点是决策时要考虑竞争对手的竞争策略。阐述博弈理论的学科称博弈论〔gametheory〕,博弈论的思路在古诺〔Cournot,AntoineAugustin,1801-1977〕的双头垄断模型中最早提出,冯•诺伊曼〔JohnvonNeumann,1903-1957〕和摩根斯坦恩〔OskarMargenstern,1902-1977〕在1944年出版了?博弈论与经济行为?〔TheoryofGamesandEconomicBehavior〕一书,最早提出了博弈论的概念。现代博弈论那么是由纳什〔Nash,JohnF.〕、海萨尼〔Harsany,JohnC.〕、泽尔腾〔Selten,Reinhard〕、夏普利〔Sharpley,LloydS.〕等人开展起来的,1994年的诺贝尔经济学奖就授予了前三位经济学家。现在,博弈论已经成为现代经济学的根本分析工具之一,并且应用到了政治、经济、军事、社会、自然科学等各个领域。6.1博弈论根本概念博弈是一种对抗性竞争行为,如下棋、打牌、比赛,等等,是我们政治、军事、经济和生活中常见的一种行为。1博弈现象例1:“齐王赛马〞春秋战国时期,齐王和田忌各有“上、中、下〞三等级赛马,齐王的马比田忌的同等级马要略胜一筹,但齐王的“中、下〞级马跑不过田忌的“上、中〞级马。问比赛双方采取何种策略为宜?例2:“价格联盟〞2000年6月,国内九大彩电企业结盟XX,约定共同提高彩电零售价格。之后,又有空调价格联盟、民航机票价格联盟、电脑价格联盟,证券佣金价格联盟等等。但这些“联盟〞均先后解体。价格联盟能提升相关企业利润,为什么联盟策略不能持续?例3:“搭便车〞中国股市“非流通股股改〞过程中,大小股东对“对价〞往往不能达成一致意见,影响股改良程,使自身利益受损。问大小股东的正确策略是什么?注:“搭便车现象〞是奥尔森教授〔1965〕在?集体行动的逻辑:公共利益和团体理论?一书中提出的,是指在集体行动中,个人支付本钱获得的收益被集体中的其他成员免费分享的现象。由于个人支付全部本钱而只享受较少的收益分额因而集体中的理性个人没有动力去提供公共物品。2博弈概念1〕定义博弈即一些个人或组织,在一定环境条件下,按一定规那么,同时或先后,一次或屡次,从各自允许选择的行为或策略中进展选择并加以实施,各自取得相应结果的过程。例“囚徒困境〞A、B二犯罪嫌疑人因在超市盗窃被抓现行,法院调查确信A、B二人系合伙累犯,但无原来犯罪的定案证据不能定罪。二嫌犯是惯犯,知道这个法律规定,故只成认被抓现行的这次盗窃行为,这个盗窃罪依法只能判2年。为使二犯受到应有的惩罚,检方当二人面说:坦白从宽,抗拒从严!如坦白交待所有罪行,从宽判1年;如抗拒不交待,被另一人坦白检举,将重判10年;如二人都坦白将各判6年。然后将二人分开关押审讯。问二嫌疑人的合理选择是什么?“囚徒困境〞中二囚犯相互间构成一种博弈,即坦白还是抵赖的选择问题。2〕博弈的要素构建一个博弈,需要以下根本要素:〔1〕局中人〔参与者〕〔players〕:每局博弈至少有两个参与者,如二囚犯;〔2〕行动集〔actionset〕:规定每个参与者可以采取的行动的集合,如坦白,抵赖;〔3〕时序〔playingsequence〕:游戏规那么中规定的每个参与者决策的先后次序。局中人共享信息同时行动称静态博弈;局中人一方在了解对方行动后再行动称动态博弈。例中二囚徒分开,不知对方选择,可认为是同时行动;〔4〕策略〔strategies〕:策略是局中人在一局博弈中的一套完整的行动方案。策略与行动不同,策略包括信息。比方囚徒困境,每个局中人的行动只有两种:坦白,抵赖。但策略就包括:〔坦白,抵赖〕、〔抵赖,抵赖〕、〔抵赖,坦白〕、〔坦白,坦白〕四种。尽管最后的均衡是〔坦白,坦白〕,但策略有四种。策略告诉局中人,在每一种可预见的情况下选择什么行动。如:在预见“一方宽判1年,对方判10年〞的情况下,局中人选择的行动是:坦白〔一方〕,抵赖〔对方〕。〔5〕得益〔payoffs〕:局中人在不同情况下所得到的效用。如局中人二囚犯A、B在选择“坦白、抵赖〞行动情况下,A、B的得益是〔-1,-10〕。〔6〕信息〔information〕:局中人决策所依据的信息。如坦白和抵赖所导致的各种刑期。信息分为完全信息和不完全信息。在完全信息中,局中人在决策时知道在此之前的全部信息,并且局中人A知道局中人B知道全部信息,并且局中人A知道局中人B知道局中人A知道全部信息,如此以至无穷。比方下棋。在不完全信息中,局中人不知道与博弈有关的全部信息。比方猜“石头——剪刀——布〞的游戏。〔7〕均衡〔equilibria〕:均衡是所有局中人选取的最正确策略所组成的策略组合。如〔坦白、坦白〕。在上述要素中,局中人、行动集、时序、策略、得益和信息规定了一局博弈的游戏规那么。3〕博弈论研究内容参见图6-1博弈论内容体系图图6-1博弈论内容体系图3博弈决策思想与经济学决策思想的区别博弈决策与传统经济学决策不同,其主要区别如表6-1表6-1博弈决策思想与经济学决策思想的主要区别表6-1博弈决策经济学决策决策约束条件行动、策略、得益与博弈对手的可能策略。如收益率、价格、本钱、等等决策目标基于个体“理性〞的行为主体利益最大化,寻求行为主体的最正确策略基于个体“理性〞的行为主体利益最大化,寻求行为主体的满意方案决策思路针对竞争对手策略的最正确策略比拟各方案的综合经济效益主要特征主要考察竞争对手策略及相互策略组合,考察对象具主观随机性。主要考察环境变量,考察对象具相对客观稳定性。适用特点适用于面向主观选择的竞争性、对抗性问题的分析与解释。适用于面对客观环境问题的分析与解释。成败关键自己决策能力PK对手决策能力自己决策能力表6-2囚徒B坦白抵赖囚徒A坦白-6,-6-1,-10抵赖-10,-1-2,-26.2博弈矩阵1博弈矩阵概念用以描述博弈相关的局中人,策略和得益等决策属性的表格称博弈得益矩阵,简称博弈矩阵。例如:“囚徒困境〞中的博弈矩阵可表示如表〔6-2〕。借助博弈矩阵可以方便地进展博弈决策分析。6.3有鞍点博弈决策有鞍点博弈决策是二人有限零和博弈决策中,不管双方当初采取什么策略,当博弈双方经过充分研究,不断改良博弈策略之后,双方找到了一个都不能再改善的策略集合点,该点称鞍点,鞍点所反映的双方策略都是最优策略。二人有限零和博弈是指这样的一类博弈问题:参加博弈的“局中人〞只有二个,每个局中人都备有有限个可供选择的策略,而且在任一次博弈对局中,一方所得为另一方所失,局中人总的得失和为“零〞。二人有限零和博弈,可一般地表达为表〔6-3〕。表6-3甲方得失值乙方策略β1β2┄βj┄βn甲方策略α1g11g12┄g1j┄g1nα2g21g22┄g2j┄g2n┆┆┆┆αigi1gi2┄gij┄gin┆┆┆┆┆αmgm1gm2┄gmj┄gmn甲方的支付表可用矩阵表示。g11g12┄g1j┄g1ng21g22┄g2j┄g2n┆┆┆gi1gi2┄gij┄gin┆┆┆┆gm1gm2┄gmj┄gmn简记为G=〔gij〕其最优策略的一般解法是“线性规划法〞,当存在鞍点时可用“小中求大法〞求解最优策略。1二人有限零和博弈〔有鞍点时〕“小中求大法〞确定鞍点步骤:对甲方的支付矩阵而言,先求甲方矩阵各行最小值;再找出其中的最大值;方法原理是假设甲方在各策略最不利的情况下,选一个相对有利的策略,该策略对应的收益是最起码的收益;对乙方而言,甲乙利益是相互冲突的,所以,甲方最小得益就是乙方最大得益,可用“大中求小法〞找出乙方在不利情况下的相对有利策略,如果行max〔min〕=列min〔max〕=K那么K就是“鞍点〞,K是甲方的收益,也是乙的损失。双方对应的策略称为最优纯策略的解。表6-4甲方支付表乙方策略β1β2β3β4minmax甲方策略α113124-9-9α216381033α3-3-1290-3α415-6106-6maxXX1632910min3具体方法原理与求甲方最优策略一样:先求出各列最大值〔因为用的甲方支付表,甲方最大就是乙方最小〕,再选其中的最小值〔甲方最小就是乙最大〕,该值对应的乙方策略就是乙方的最优策略。例如:设甲方支付矩阵如表(6-4)甲方最优策略是α2,乙方最优策略是β2,双方博弈的值是3,博弈值对应的点就是鞍点。在这个博弈中,甲只要坚持α2策略,收益最少是3个单位。乙只有坚持β2策略,损失才不会超过3。2二人有限零和博弈〔无鞍点时〕当博弈无鞍点时,说明双方都无确定的策略,是一种你变我变的状态,如齐王赛马,当齐王知道田忌的策略后,就会采取将出场马次序打乱的策略。这种没有确定状态的博弈问题称为“二人零和混合策略博弈〞。这个问题可通过求最优策略的概率值解决。如齐王赛马,计算可知双方的策略是将马的6个出场顺序全部列出,然后任选一个出场顺序进展比赛。这样的策略,齐王获胜。无鞍点决策与有鞍点决策的最大不同是:有鞍点可以事先告诉对方自己的策略选择,结果不变。无鞍点决策对策略选择要相互XX,否那么不XX的一方必输。如田忌假设先行探测到齐王马的出场顺序,采取针对性策略就能确保获胜。6.4二人有限零和博弈决策实务解析表6-5甲方支付表乙厂策略B1B2B3B4minmax甲厂策略A11.40.51.01.60.5A20.60.81.11.20.6A31.51.451.21.31.21.2maxXX1.51.41.21.6min1.2例:假设有二家生产彩电的企业,在某地进展市场销售竞争。甲厂产品设计了三种不同质量等级的A1,A2,A3,乙厂产品设计了四种质量等级B1,B2,B3,B4,市场预测这种产品销售总量可达20000台。分析预测甲方在与乙厂竞争中,各等级产品销量如表(6-5)。试求甲乙二厂各自的最优市场销售策略,即各厂应向市场提供哪种质量等级的产品?解:运用“最小最大法〞,可求得鞍点是12000台,即甲厂的策略是生产A3质量等级产品,销量可达12000台。乙厂应生产B3质量等级产品,销售量可达20000-12000=8000台。6.5“纳什均衡〞根本原理实务解析纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰•纳什命名,分类属于完全信息静态博弈决策。纳什均衡以“理性人〞为分析依据,且假设局中人是“利己主义者〞,追求“自身利益最大化〞。1“纳什均衡〞定义在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,那么该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。一个策略组合被称为纳什均衡,其内涵是每个博弈者的均衡策略都是为了到达自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。其通俗涵义是:先给定你的最优选择,我再选择能够使我最优的选择。2均衡确实定在二人博弈中,可以采用画横线法来确定均衡。在给定一方的策略后,把自己的最优策略画上一条横线,如果在某一个框中,两个收益值都被画上横线的话,此框所表示的决策就是一个均衡。3“纳什均衡〞根本原理模型与决策实务分析纳什均衡根本原理模型有多种,其中经典的有“囚徒困境〞和“智猪博弈〞等。表6-6囚徒B坦白抵赖囚徒A坦白-6,-6-1,-10抵赖-10,-1-2,-2例1“囚徒困境〞〔prisoners'dilemma〕博弈决策模型1〕“囚徒困境〞模型构造与均衡求解“囚徒困境〞是阐述博弈理论的根本模型,模型博弈信息如前述,其得益矩阵如表6-6表。“囚徒困境〞纳什均衡确实定:给定B坦白,A坦白得益为-6,抵赖得-10,A的最优选择是坦白得-6,在-6下打横线;给定B抵赖,A坦白得益为-1,抵赖为-2,A的最优选择是坦白得-1,在-1下打横线;给定A坦白,B坦白得益为-6,抵赖得-10,B的最优选择是坦白得-6,在-6下打横线;给定A抵赖,B坦白得益为-1,抵赖得-2,B的最优选择是坦白得-1,在-1下打横线;即不管A、B作何选择,A、B的最优选择都是坦白。虽然A、B都知道所有信息,相互也清楚对方的情况,明知都抵赖是最好的结果,但从“理性〞出发,行为人都是自私的,只会考虑自己的利益,所以还是应该选择坦白,这就是“纳什均衡〞的理论指导意义。2〕“囚徒困境〞引发的思考个体理性与集体理性的矛盾——从个体利益出发的行为往往不能实现集体的最大利益;个体理性自身的矛盾——从个体利益出发的行为最终也不一定能真正实现个体的最大利益,甚至是相当差的结果!3〕观察与思考:彩电“价格联盟〞为什么讯速瓦解?2000年6月9日和6月22日,国内9家彩电企业在XX和XX举行峰会,制定了彩电销售的最低限价,但市场反响平淡,一些彩电屡屡跌破所谓的最低价。9家彩电企业的这种试图干预市场的行为没有到达预期效果。随后,国美电器商城各种品牌彩电再次大幅降价。熊猫主导产品21寸超平彩电首次以1898元出售比价格联盟最低限价低690元,而一台熊猫21英寸普通彩电只卖950元。在XX商务中心电器城各品牌29寸直平、超平彩电的实际售价都在2500元以下,均低于2590元的限价。在XX,一些机型的降幅甚至超过3500元。受降价影响,在XX,出现了大规模抢购彩电的情况。业内人员称“价格联盟〞只国家计委负责人表示,这种价格联盟违反了国家1999年公布的?制止价格垄断行为暂行规定?,规定明文制止“经营者之间通过协议、决议或者协调等串通方式操纵市场价格,以及凭借市场优势地位牟取暴利、实行价格倾销和价格歧视〞。将组成巡查组,对市场进展监视检查。思考:彩电价格联盟解体的内在原因是什么?有必要对类似的“价格联盟〞实施行政干预吗?“价格联盟〞解体分析“价格联盟〞是一种典型的“囚徒困境〞博弈,其最简单的形式如“双寡头削价竞争〞。设双寡头得益矩阵如表〔6-7〕:表〔6-7〕寡头2高价低价寡头1高价100,10020,150低价150,2070,70寡头1高价策略可能得益是〔100,20〕;低价策略可能得益是〔150,70〕,低价策略优于高价策略,寡头2亦同。由于双方都无法信任对方,都必须防范对方利用自己的信任谋取利益,博弈结果只能是都采用低价策略,各得70,各得100的结果最好无法实现。需特别强调的是:即使双方都完全知道上述利害关系也无法改变这种结局,这就是“纳什均衡〞的内涵。按“纳什均衡〞理论,彩电价格联盟解体的原因在于联盟各方都是独立的经济实体,有追求自身个体利益的内在“理性〞需求,其最优策略是选择低价占领市场获取最大利益,各方都有这个要求,谁高价谁吃亏,故高价的“价格联盟〞不能成立。国家计委的行政干预并不是“价格联盟〞解体的真正原因,要使行政干预对“价格联盟〞发挥作用,国家主管部门只要确保联盟各方是独立的经济主体就行,制定合理的博弈规那么,如“囚徒困境〞中,检方关于坦白、抵赖各种情况下的刑期。例2“智猪博弈〞〔boxedpigs〕博弈决策模型“智猪博弈〞是解释“搭便车〞行为具有合理性的一个经典模型。1〕“智猪博弈〞模型构造与均衡求解设有两头猪,大猪和小猪。猪圈的一头是食槽,另一头是按键。按键的本钱〔劳动〕为2。如大猪先到,吃9个单位,小猪吃1个单位;如小猪先到,吃4个单位,大猪吃6个单位;如同时到,大猪吃7个单位,小猪吃3个单位。表6-8小猪按键等待大猪按键5,14,4等待9,-10,0设得益矩阵如表〔6-8〕均衡的结果是:〔按,等待〕。即大猪按键,小猪等待,小猪“搭便车〞是最好的策略。2〕“智猪博弈〞模型引发的思考弱势个体自身理性的矛盾——为改变弱势地位而积极进取的理性选择,获益反不如消极等待的“搭便车〞选择!即弱势方愈是积极努力,强弱差距就越大,即相对意义上的强者更强,弱者更弱!〔其原因是弱势方创造的财富大部份被强者占有!〕社会经济生活中,弱势者“搭便车〞是合理的选择。如:股改中的“对价〞应由大股东与公司还价,小股东等待为宜;股市投机炒作中,控盘操作应由庄家做,散户应跟风等待;企业的大规模促销广告应由大企业做,小企业借势营销是上策;村里的路应由富人投资修建,穷人的合理选择是不管。周四3〕观察与思考:TCL王牌液晶电视的“智猪博弈〞营销战略2005年12月17日,在南方都市报、新京报、CCTV、新浪网等权威媒体主办的“2005年度中国营销大奖〞评选中,“TCL‘智猪博弈’力推王牌液晶电视〞案例最终入选“年度中国十大营销事件〞。从2004年开场,中国彩电市场进入“转型期〞,TCL作为全球彩电巨头,也面临液晶电视带来的新考验。面对转型期的市场,TCL做出全面出击液晶的决定,立足于液晶电视研发、制造、营销等领域的综合优势的建立,全面参加全球液晶电视市场的角逐。与此同时,在国内液晶电视市场上,TCL巧妙运用博弈论中“智猪博弈〞的竞争策略,驱使中小品牌率先炒作市场,释放风险,选择合理时机迅速切入,以最小的代价建立了在液晶电视领域里的新霸主地位。在新技术产品的推广中,谁先杀进市场,谁就是“踩踏板〞的角色。而“智猪博弈〞的典型环境有一个特点,就是踩踏板的一方在争食中处于劣势。这早已不是新鲜的商业智慧,因此面对即将兴起的液晶电视市场,等待几乎成为所有新来者的优先选择。1智赶小猪“踩踏板〞2004年5月18日,TCL在XX举行“开启中国大屏幕液晶电视新时代〞的发布会,宣布将全面介入国内大屏幕液晶电视市场。两个月后,TCL在技术领域挥出重拳,与国际著名芯片厂商Genesis成立联合实验室,同时发布一款高端彩电专用的DDHD控制芯片。在销售终端,TCL也发布了许多关于液晶电视的宣传资料。既然大猪已经踩动了踏板,小猪们也纷纷迅速做出反响,二三线品牌厂商投入巨资进展市场推广,开发大量新机型,并开场囤积面板等关键器件,等着抢食。2蓄积力量待“落食〞TCL的一些被认为是“踩踏板〞的举措只是佯动,实际在进展技术、产业链和市场三大布局。在整个2004年剩余的时间里,TCL的举动显得非常低调,没有与二三线品牌一起积极投身于撬动和启蒙市场,注意力都集中在这次全球布局中,投入的资金也大多集中在提高液晶研发和产能实力上,专注于液晶电视技术和产能实力的储藏。TCLXX液晶电视生产基地目前是全国最大的液晶电视生产基地,年产量超过130万台;XX工业园的建成更令TCL在实现全球液晶产业布局上底气十足。在TCL的产业幅员上,中国、泰国、波兰和墨西哥四大生产基地将成为TCL液晶产业链的中轴。TCL的方案是到2006年拥有600万台的液晶电视年产能,这一目标在今天事实上已接近实现。在国内市场,TCL的真实策略是:让更多的二三线品牌去炒作市场,充分释放市场风险,让小猪们去踩踏板。3大猪吃食小猪惨在二三线品牌的热炒之下,2004年的中国液晶电视市场一片热火朝天。但小猪踩踏板本钱高昂,权威的中怡康时代调查公司提供的数据说明,整个中国液晶电视市场2004年的销量只有不到20万台。如此狭窄的市场里集中了20多个国内外品牌的数百款产品,也就完全无法为任何一个二三线品牌提供稳定的利润来源。个别品牌仅样机损失就高达上亿元。更惨的是,为了抢占市场份额,二三线品牌普遍广泛囤积液晶面板等关键元器件。而随着液晶技术的演进,液晶面板的采购价格却在飞速下降,局部二线厂商陷入“投入越多,亏损越大〞的困境。随消费者逐渐认可液晶电视,市场风险迅速释放,2005年3月开场,国内液晶电视市场开场出现迅猛增长势头,TCL利用其研发产能实力夺取了13.1%的市场份额,抢了个盆满钵满。二三线品牌厂商由于付出了沉重的踩踏板本钱,后劲明显缺乏,逐渐出现了明显的分化。一局部品牌退出了液晶市场,另一局部也重新回到了边缘化的市场位置,靠大猪余下的一点残食勉强维持。思考:TCL成功启示是什么?二三线厂商失败教训有哪些?分析小结:1TCL自2004年5月起的“发布会〞、“建立芯片实验室〞,以至于“终端促销〞等一系列举动,造足“踩踏板〞的假象。当“小猪们〞踌躇满志的开场在液晶市场掘金时,TCL却“舍末逐本〞,抓住研发能力和产能实力两大基点,悄悄完成了全球化的产业布局,蓄势待发。当“小猪们〞踩动踏板后,TCL利用其强大的研发产能实力,饱餐落食,奠定胜局!实现了大猪搭小猪便车的战略意图。案例启示有:大猪必须要有大猪的力量,即抓住研发产能这个力量根底。否那么食物来了会被小猪拱到一边去;踩踏板是大猪的必然选择,如能诱使小猪一起踩,甚或煽动小猪独踩那么更好;“智猪博弈〞的均衡策略是大猪踩踏板,小猪等待,但如果大猪能成功地诱使小猪踩踏板那么大猪获食更多,这被称为“新智猪博弈〞;小猪的优选策略是后发制人,即等待为上策,宁吃不上,也不要抢着去踩踏板,因为大猪更珍惜生存时机〔即俗语说的“光脚的不怕穿鞋的〞,富人比穷人更惜命〕。只要和大猪处在生死与共的环境中,大猪最终一定会去踩踏板。小猪一定要将“搭便车〞的战略思想坚持到底。新技术产品更新快,总体趋势是降价,应以技术储藏为主,不宜进展大量的物资储藏。二三线厂商主要是在这个问题上付出了太高的踩踏板本钱。“搭便车〞策略会造成资源闲置,降低经济运行效率,可通过改良博弈规那么进展改良。4“纳什均衡〞博弈模型的重要启示“囚徒困境〞反映的理性矛盾降低了社会效益,“智猪博弈〞导致的“搭便车〞策略选择不利于资源配置,改良方法是深化制度建立。一种制度安排,要发生效力,必须是一种纳什均衡。否那么这种制度安排便不能成立。假设想将决策选择导向期望的方向,就要加强决策属性的研究与改良。例如:在囚徒困境中,不管B的策略是坦白还是抵赖,A的最优策略都是坦白;反之亦然。这种策略就叫优势策略〔dominantstrategy〕。两个囚徒即使暗自订立“攻守同盟〞,但由于个体“理性〞的作用,没有一个会相信对方的承诺是可信的。这叫“不可置信承诺〞。所以双方最后的理性选择都是“坦白〞。实践中,黑社会对于供出同伙的人,往往采取“格杀〞的惩罚。这样,囚徒困境的得益矩阵如表6-9:表6-9囚徒B坦白抵赖囚徒A坦白-∞,-∞-∞,-10抵赖-10,-∞-1,-1这时,〔抵赖,抵赖〕就成了优势策略。由于博弈决策属性的变化,决策选择也相应的发生变化。小结1.博弈论与古典经济学的区别在于,前者考虑行为人的相互影响。2.博弈论现在得到了很快的开展,已经在经济、政治、社会、文化、自然科学等领域得到了广泛的应用。3.一个完整的博弈要有局中人、行动集、时序、策略、支付、信息等要素来刻画,不同的博弈构建者可能对各种要素的不同组合感兴趣。4.囚徒困境是最著名的一个博弈,它提醒了个体理性与集体理性的矛盾。要改变囚徒困境的结局,需要改变博弈的规那么。5.纳什均衡是描述博弈均衡的一个非常重要的概念,指的是一种相对稳定的状态,在局中人的策略组合下,没有人愿意单独改变自己的行动。一个博弈可能有多个纳什均衡。6.优势策略是指无论对方采取什么行动,我都将采取的策略。比方囚徒困境中的“坦白〞。优势策略肯定构成纳什均衡,但纳什均衡不一定是优势策略。阅读材料:?纳什均衡?1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而提醒了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究根本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否认,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。纳什是一个非常天才的数学家,他的主要奉献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡〞并不是一帆风顺的。1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且创造了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开场研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(OskarMorgenstern),并与其合作才使博弈论进入经济学的广阔领域。1944年他与奥斯卡·摩根斯特恩合著的巨作?博弈论与经济行为?出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的?博弈论与经济行为?一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论根底。合作型博弈在20世纪50年代到达了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡〞应运而生了,它标志着博弈论的新时代的开场!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧X的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃〞,使原来模糊、杂乱和无绪的假设干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡〞的非合作博弈均衡的概念。纳什的主要学术奉献表达在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈〞的长篇博士论文,1950年11月登载在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理〞(minimaxsolution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人〞,代为起草致科学院的短信,系主任列夫谢茨那么亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。纳什在上大学时就开场从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的奉献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的奉献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论根底。1.囚犯的两难处境——小故事中的XX论要了解纳什的奉献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境〞的例子,每本书上的例子都XX小异。博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丧失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进展审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。〞斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最正确策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡〞,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋〞(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最正确策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择〞有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡〞,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡〞首先对亚当·斯密的“看不见的手〞的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会到达利他的效果。不妨让我们重温一下这位经济学圣人在?国富论?中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。〞从“纳什均衡〞我们引出了“看不见的手〞的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡〞提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡〞中我们还可以悟出一条真理:合作是有利的“利己策略〞。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人〞。但前提是人所不欲勿施于我。其次,“纳什均衡〞是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡〞是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大开展,甚至可以说是一场革命。从“纳什均衡〞的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境〞这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。2.价格战博弈:现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐〞。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡〞,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡〞。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡〞可能导致一个有效率的零利润结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广西壮族自治区钦州市2025届九年级下学期中考二模英语试卷(含答案)
- 第5章 液态成形技术
- 年产2300吨食品添加剂及1000吨消毒抑菌洗涤剂项目可行性研究报告模板-立项备案
- 2025北京三十五中高二(上)期中语文试题及答案
- 完整职业规划模板
- 建筑摄影就业方向解析
- 就业指导中心企划方案
- 平行四边形的判定2025-2026学年人教版八年级数学下册
- 2026八年级道德与法治上册 社会快乐体验
- 医院消毒隔离工作制度
- 2025年不动产登记代理人《不动产登记代理实务》考前必刷题库(含真题、重点440题)含答案解析
- 关于书法社团的章程范本
- 国家电网招聘之公共与行业知识题库参考答案
- 【MOOC】软件度量及应用-中南大学 中国大学慕课MOOC答案
- 33防高坠专项施工方案
- JGT163-2013钢筋机械连接用套筒
- 《建筑基坑工程监测技术标准》(50497-2019)
- 设计成果保密保证措施
- 产品合格证出厂合格证A4打印模板
- 绿化工程初验验收单
- 渑池义正诚矿业有限公司渑池小阳河铝(粘)土矿(铝土矿) 矿产资源开采与生态修复方案
评论
0/150
提交评论