博弈论案例分析_第1页
博弈论案例分析_第2页
博弈论案例分析_第3页
博弈论案例分析_第4页
博弈论案例分析_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈论博弈论( game theory) ,亦名 “ 对策论 ” 、“ 游戏理论 ” ,属应用数学的一个分支, 博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息, 从各自选择的行为或是策略进行选择并加

2、以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念. 什么是博弈论?古语有云,世事如棋。 生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“ 出棋 ” 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说, 就是研究个体如何在错综复杂的相互影响中得出最合理的策略 .现在,我们就一些例子来讨论博弈论相关内容。一、从“囚徒困境”开始在博弈论中 ,含有占优战略均衡的一个著名例子是由塔克给出的“ 囚徒困境 (prisoners dilemma)博弈

3、模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事.假设有两个小偷a 和 b 联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑 8 年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2 年,而坦白者有功被减刑8 年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1 年.下表给出了这个博弈的支付矩阵。b坦白b抵赖a坦白 8,

4、 8 0, 10 a抵赖 10, 0 1, 1 表 囚徒困境博弈 prisoners dilemma我们来看看这个博弈可预测的均衡是什么.对 a 来说,尽管他不知道b 作何选择,但他知道无论b 选择什么,他选择“ 坦白 ” 总是最优的。显然,根据对称性,b 也会选择 “ 坦白 ” ,结果是两人都被判刑8 年。但是,倘若他们都选择“ 抵赖 ,每人只被判刑1 年。在表 2.2 中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出, “ 坦白 ” 是任一犯罪嫌疑人的占优战略,而 (坦白,坦白)是一个占优战略均衡。要了

5、解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲 “ 囚犯的两难处境” 的例子 ,每本书上的例子都大同小异. 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人, 斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话. 检察官说, “ 由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁

6、,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5 年刑。 斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择-坦白或抵赖 .显然最好的策略是双方都抵赖,结果是大家都只被判一年.但是由于两人处于隔离的情况下无法串供。所以,按照亚当 斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁 -3 个月, 但前提是同伙抵赖,显然要比自己抵赖要坐10 年牢好 .这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得

7、坐10 年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白 ,至多也只判5 年,总比被判10 年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判 1 年刑 )就不会出现。这样两人都选择坦白的策略以及因此被判5 年的结局被称为“ 纳什均衡 ” , 也叫非合作均衡。因为 ,每一方在选择策略时都没有“ 共谋 (串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者 )的最佳策略组合构成.没有人会主动改变自己的策略以便使自己获得更大利益。“ 囚徒的两难选择” 有着广泛而深刻

8、的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“ 纳什均衡 ” ,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期.只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“ 纳什均衡 ” 首先对亚当 斯密的“ 看不见的手 ” 的原理提出挑战.按照斯密的理论,在市场经济中,每一个人都从利己的目的出发 ,而最终全社会达到利他的效果。从“ 纳什均衡 ” 的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“ 囚徒的两难处境” 这样的例子

9、.如价格战博弈、军奋竞赛博弈、污染博弈等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合 .其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用.所有的博弈问题都会遇到这三个要素. 二、经济学中的“智猪博弈”(pigs payoffs) 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩

10、动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。那么,两只猪各会采取什么策略?答案是 :小猪将选择 “ 搭便车 ” 策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在 ?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物.对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择.反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。“ 小猪躺着大猪跑的现象是由于故事中的游戏规则所导致的.规则的核心指标是: 每次落下的事物数量和踏板与

11、投食口之间的距离. 如果改变一下核心指标,猪圈里还会出现同样的“ 小猪躺着大猪跑” 的景象吗?试试看. 改变方案一:减量方案.投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完.谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板.反正对方不会一次把食物吃完.小猪和大猪相当于生活在物质相对丰富的 “ 共产主义 ” 社会 ,所以竞争意识却不会很强。对于游戏规则的设计

12、者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。改变方案三 :减量加移位方案。 投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完 . 对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。原版的 “ 智猪博弈 故事给了竞争中的弱者(小猪) 以等待为最佳策略的启发.但是对于社会而言, 因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置 ,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此.而能否完全杜

13、绝 “ 搭便车 ” 现象,就要看游戏规则的核心指标设置是否合适了。比如 ,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“ 智猪博弈 ” 增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“ 小猪 ” 也有),一度十分努力的大猪也不会有动力了- 就象 “ 智猪博弈 减量方案一所描述的情形.最好的激励机制设计就象改变方案三 -减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成 ),既节约了成本(对公司而言),又消除了 “ 搭便车 ” 现象,能实现有效的激励。许多人并未读过“ 智猪

14、博弈 ” 的故事, 但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户; 等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等.因此,对于制订各种经济管理的游戏规则的人,必须深谙 “ 智猪博弈 指标改变的个中道理。三、生活中的“占座大战 大学生活中 ,生活也是比较的丰富,其中,吃饭也是很重要的部分,大家一般都是在学校食堂吃饭,由于大家吃饭的时间比较集中,所以吃饭的时候人数特别多,食堂座位有限,同学们也希望在食堂买完饭后不用再找座位,因此很多同学在买饭之前就用自己的私人物品占座位 ,为此,食堂也经常发生因为占座位而引起的纠纷。在这里称为“占座

15、大战”博弈,就这个博弈问题进行讨论; 现在就这个问题来进行一个博弈论的分析,两个发生纠纷的人都有两个选择,分别是 u(冲上去进行理论,争取座位),d(选择退让,找其他的座位),若两人都进行理论,争取座位的话,很有可能就是两败俱伤,两个人也可能因意见不合而进而出现打架的现象,而且在食堂这个公共场所,对大家的形象都有着很不好的影响;如果一方选择退让,而另外一方则选择理论,则结果可能就是一方另找座位,有些损失,一方占领了座位,取得了胜利;还有就是双方都选择了退让,将座位让给其他人;根据以上的分析,现在有如下的支付图: 参与人 2 u d u 2,-2 1,-1 参与人 1 d -1,1 0,0 求解

16、过程(箭头法) :参与人 2 u d u -2,-2 1,-1 参与人 1 d 1,1 0,0 现在求解这个博弈问题:由博弈问题的nash 均衡可以知道,在以上的博弈问题中存在着两个纯战略nash 均衡 -(u,d )和( d,u) ,就是说,在整个的博弈中,两个人中有一个人退让,寻找其他的座位,另外一个人进行争论得到座位. 对于这个结果, 我们可以这样认识:我们现在认为两个人都是理性的,在一个参与人预测到另一方将会进行理论时,明智的选择就是退让,避免更大的损失,而当预测到对方将会选择退让时,则进行理论,以求得最大的胜利;可以将nash均衡作为此次“抢座大战的一致性预测,而其它的结果(u,u

17、)和( d,d)都将不会是一致性预测,就(u,u)来说,对双方而言都不是最好的结果,且受到的损失也会是最大的;再就是(d,d ) ,双方都进行退让,也是不太可能的,当有一方有退让的迹象,另外一方就可能进行理论来求得利益的最大,因此这个结果也不会是一致性的预测,不会是一个均衡,必然会偏离的,向着nash 均衡的方向偏移 . 在上面的这个博弈中,出现了两个nash 均衡,在一个博弈问题中,如果只存在一个nash均衡,那么 nash 均衡作为一致性的预测,应该说是很有效的.但是,如果像这个 “座位大战”博弈一样,存在两个nash 均衡,那么nash 均衡作为博弈解的意义也就相对弱化了。我们不能进行预

18、测,到底是谁进行了退让,是谁进行了进一步的理论,得到座位;如果两个人对两个均衡到底哪一个会出现的预测不一致就会出现问题,比如说, 参与人 1 预测博弈的解为自己理论 ,对方退让 ,而参与人2 预测的是对方退让,自己理论,那么最后出现的真正的结果将不会是 nash 均衡( u,d),也不会是( d,u ) ,而会是损伤最大的非nash 均衡( u,u) . 由以上的分析,出现了nash均衡的多重性,我们暂且用schellling 的“焦点效应”来解决,将均衡聚焦到一个上,我们分以下情况:(1),两个参与者之间,有一个是女生, 一个是男生, 则很有可能是博弈的解偏向女生的一边 ,男生让着女生;(2) ,两个参与者之间,有一个是年轻人,一个是相对年老的人(或者小孩,残疾

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论