版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、合作博弈举例【篇一:合作博弈举例】博弈论是指某个个人或是组织,面对一定的环境条件 ,在一定的规则约束下,依靠所掌握的信息 ,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程 ,在经济学上博弈论是个非常重要的理论概念 .什么是博弈论?古语有云 ,世事如棋 .生活中每个人如同棋手 ,其每一个行为如同在一张看不见的棋盘上布一个子 ,精明慎重的棋手们相互揣摩、相互牵制 ,人人争赢,下出诸多精彩纷呈、变化多端的棋局 .博弈论是研究棋手们“出棋 ”着数中理性化、逻辑化的部分 ,并将其系统化为一门科学 .换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略 .事实上
2、,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等.数学家们将具体的问题抽象化 ,通过建立自完备的逻辑框架、体系研究其规律及变化 .这可不是件容易的事情 ,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最 “理性 ”的棋手 ,甲出子的时候 ,为了赢棋 ,得仔细考虑乙的想法 ,而乙出子时也得考虑甲的想法 ,所以甲还得想到乙在想他的想法 ,乙当然也知道甲想到了他在想甲的想法 经济学中的 “智猪博弈 ”(pigs payoffs)这个例子讲的是:猪圈里有两头猪 ,一头大猪 ,一头小猪 .猪圈的一边有个踏板,每踩一下踏板 ,在远离踏板的猪圈的另一边的
3、投食口就会落下少量的食物 .如果有一只猪去踩踏板 ,另一只猪就有机会抢先吃到另一边落下的食物 .当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板 ,则还有机会在小猪吃完落下的食物之前跑到食槽 ,争吃到另一半残羹 .原因何在 ?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物 .对小猪而言 ,无论大猪是否踩动踏板 ,不踩踏板总是好的选择.反观大猪 ,已明知小猪是不会去踩动踏板的 ,自己亲自去踩踏板总比不踩强吧 ,所以只好亲力亲为了 .“小猪躺着大猪跑 ”的现象是由于故事中的游戏规则所导致的 .规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离 .如果改
4、变一下核心指标,猪圈里还会出现同样的 “小猪躺着大猪跑 ”的景象吗?试试看 .改变方案一:减量方案 .投食仅原来的一半分量 .结果是小猪大猪都不去踩踏板了 .小猪去踩 ,大猪将会把食物吃完;大猪去踩 ,小猪将也会把食物吃完 .谁去踩踏板 ,就意味着为对方贡献食物 ,所以谁也不会有踩踏板的动力了 .如果目的是想让猪们去多踩踏板 ,这个游戏规则的设计显然是失败的 .改变方案二:增量方案 .投食为原来的一倍分量 .结果是小猪、大猪都会去踩踏板 .谁想吃 ,谁就会去踩踏板 .反正对方不会一次把食物吃完 .小猪和大猪相当于生活在物质相对丰富的 “共产主义 ”社会,所以竞争意识却不会很强 .对于游戏规则的
5、设计者来说 ,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈 ,想让猪们去多踩踏板的效果并不好 .改变方案三:减量加移位方案 .投食仅原来的一半分量 ,但同时将投食口移到踏板附近 .结果呢 ,小猪和大猪都在拼命地抢着踩踏板 .等待者不得食,而多劳者多得 .每次的收获刚好消费完 .对于游戏设计者 ,这是一个最好的方案 .成本不高 ,但收获最大 .原版的 “智猪博弈 ”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发 .但是对于社会而言 ,因为小猪未能参与竞争 ,小猪搭便车时的社会资源配置的并不是最佳状态 .为使资源最有效配置 ,规则的设计者是不愿看见有人搭便车的 ,政府如此 ,
6、公司的老板也是如此 .而能否完全杜绝 “搭便车 ”现象,就要看游戏规则的核心指标设置是否合适了 .比如,公司的激励制度设计 ,奖励力度太大 ,又是持股 ,又是期权 ,公司职员个个都成了百万富翁 ,成本高不说 ,员工的积极性并不一定很高 .这相当于 “智猪博弈 ”增量方案所描述的情形 .但是如果奖励力度不大 ,而且见者有份(不劳动的 “小猪 ”也有) ,一度十分努力的大猪也不会有动力了-就象 “智猪博弈 ”减量方案一所描述的情形 .最好的激励机制设计就象改变方案三 - 减量加移位的办法 ,奖励并非人人有份 ,而是直接针对个人(如业务按比例提成) ,既节约了成本(对公司而言) ,又消除了 “搭便车
7、 ”现象,能实现有效的激励 .许多人并未读过 “智猪博弈 ”的故事 ,但是却在自觉地使用小猪的策略 .股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等.【篇二:合作博弈举例】寡头厂商默契合谋,约束自己的价格行为而共同维持在一个垄断价格水平,就是合作博弈的一种。比如卡特尔中为数不多的成功者opec (国际石油输出国组织),合作限产来共同增加利润。他们控制了绝大部分石油储量,谁不遵守组织内部协定,就予以一定制裁。opec 里面违约最多的就是沙特了。上面的例子太老了,不好玩儿。再给一个生活化的例子,假如一个区域里有沃尔玛
8、、家乐福、红旗、家润多、华联几个大型超市。由于太集中了,经常打促销战,造成销售净利率下降。为此,他们组成一个价格联盟来限制各自竞争行为。然后设置了一个惩罚机制,比如你在家乐福经常会看到:如果顾客在 5公里之内同等规模的超市内发现更低价,我们将双倍退还差价(我看到家乐福真的有喔,记不清是十倍还是双倍了)。这样消费者就承担起了发现价格下降的信息提供者的职能,如果一个商场降了价,其他商场会联合更大幅度地降价,从而可以约束单个厂商行为。参考资料:如果您的回答是从其他地方引用,请表明出处【篇三:合作博弈举例】博弈论的几个经典例子 博弈论的几个经典例子博弈论的几个经典例子 2016-10-31 16:12
9、 推荐 973 次请点击上面 “m 龙的微观 ”欢迎订阅关注!一、囚徒困境故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各
10、判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性 聪明的人类会因自己的聪明而作茧自缚。二、旅行者困境两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。航空公司知道花瓶的价格大概在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。于是,航空公司请两位旅客在 100 元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,
11、并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励 2 元,对讲假话的旅客罚款 2 元。为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写 100元,这样两人都能够获赔100 元。可是不,甲很聪明,他想:如果我少写 1 元变成 99 元,而乙会写 100 元,这样我将得到 101 元。何乐而不为?所以他准备写 99 元。可是乙更聪明,他算计到甲要算计他写 99 元,于是他准备写 98 元。想不到甲还要更聪明一个层次,估计到乙要写 98 元来坑他,于是他准备写 97 元 大家知道,下象棋的时候,不是说要多 “看 ”几步吗, “看 ”得越远,胜算越大。你多看两步,我比你更强多看三步
12、,你多看四步,我比你更老谋深算多看五步。在花瓶索赔的例子中,如果两个人都 “彻底理性 ”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡,是两人都写 0。三、是竞争也是劫持四、酒吧博弈问题( bar problem )酒吧博弈问题是美国人 w. b.arthur1994 年在美国经济评论发表的题为归纳论证和有界理性一问中提出的,然后他又从 1999 年的科学杂志上发表的复杂性和经济学一文中阐述了这个博弈。该博弈是说:有一群人,例如 n100 ,每个周末,均要决定是去一酒吧活动还是呆在家里。酒
13、吧的容量是有限的,假定是 60 人。如果某人预测去酒吧的人超过60 人,那么他决定去还是不去? .每个参与者或决策者面临的信息只是以前去酒吧的人数,只能根据以前的人数的信息来归纳出策略来。这是一个典型的动态博弈问题。 .通过计算机的模型实验,阿瑟得出了一个有意思的结果:不同的行动者是根据自己的归纳来行动的,并且,去酒吧的人数没有一个固定的规律,然而,经过一段时间以后,去的平均人数总是趋于 60。阿瑟说,预测者自组织到一个均衡系统中去和不去的人群,或形成一个生态稳定系统。 .这就是酒吧问题。酒吧问题所反映的是这样一个社会现象,正象阿瑟教授说的那样,我们在许多行动中,要猜测别人的行动,然而我们没有
14、更多关于他人的信息,我们只有通过分析过去的历史来预测未来。五、枪手博弈今天,我讲一个有关博弈论的经典故事。彼此痛恨的甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。先提第一个问题:如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。我们来分析一下各个枪手的策略。枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。同样的道理,枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉,乙和丙进行对决
15、,乙胜算的概率自然大很多。枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。我们计算一下三个枪手在上述情况下的存活几率:甲:24% (被乙丙合射 40% x 60% = 24% )乙:20% (被甲射 100% - 80% = 20% )丙:100% (无人射丙)通过概率分析,我们发现枪法最差的丙存活的几率最大,枪法好于丙的甲和乙的存活几率远低于丙的存活几率。但是,上面的例子隐含一个假定,那就是甲乙丙三人都清楚地了解对手打枪的命中率。但现实生活中,因为信息不对称,比如枪手甲伪装自己,让枪手乙和丙认为甲的枪法最差,在这种情况下,最终的幸
16、存者一定是甲。所以,无论是历史,还是现实,那些城府很深的奸雄往往能成为最后的胜利者。这样的例子,对你的职场生涯或者官场生涯是否很有启发呢?我们继续假定,甲乙丙三人互相不了解对手的枪法水平。在这种情况下,甲被乙射、甲被丙射、甲被乙丙射及甲不被乙丙射的机率各为 25% ,按贝氏 (bayes) 定理计算甲的存活率:甲活率: 31% (被乙射: 25% x 40% = 10% + 被丙射: 25% x 60%= 15% + 被乙丙射: 25% x 40% x 60% = 6% )。乙活率: 23% (被甲射: 25% x 20% = 5% + 被丙射: 25% x 60%= 15% + 被甲丙射:
17、25%x20%x60% = 3% )。丙活率: 17% (被甲射: 25% x 20% = 5% + 被乙射: 25% x 40%= 10% + 被甲乙射: 25% x 20% x 40% = 2% )。在枪手互相不知道对手命中率的信息的情况下,这时命中率最高的枪手甲存活的几率最大,枪法最差的丙存活的可能性最小。我们现在回到甲乙丙都知道对手命中率的情形,进行第二轮枪战的分析。在第一轮枪战后,丙有可能面对甲,也可能面对乙,甚至同时面对甲与乙,除非第一轮中甲乙皆死。尽管第一轮结束后,丙极有可能获胜(即甲乙双亡),但是第二轮开始,丙就一定处于劣势,因为不论甲或乙,他们的命中率都比丙的命中率为高。这就
18、是枪手丙的悲哀。能力不行的丙玩些花样虽然能在第一轮枪战中暂时获胜。但是,如果甲乙在第一轮枪战中没有双亡的话,在第二轮枪战结束后,丙的存活的几率就一定比甲或乙为低。第二轮枪战中甲乙丙存活的几率粗算如下:(1) 假设甲丙对决:甲的存活率为 60%,丙的存活率为 20%。(2) 假设乙丙对决:乙的存活率为 60%,丙的存活率为 40%。这似乎说明,能力差的人在竞争中耍弄手腕能赢一时,但最终往往不能成事。我们现在用严格的概率方法计算一下两轮枪战后,甲乙丙各自的存活的几率。(1) 第一轮:甲射乙,乙射甲,丙射甲。甲的活率为 24% (40% x 60% ),乙的活率为 20%(100% - 80%) ,
19、丙的活率为 100% (无人射丙)。(2) 第二轮:情况 1:甲活乙死( 24% x 80% = 19.2% )甲射丙,丙射甲 甲的活率为 60% ,丙的活率为 20% 。情况 2:乙活甲死( 20% x 76% = 15.2% )乙射丙,丙射乙 乙的活率为 60% ,丙的活率为 40% 。情况 3:甲乙皆活( 24% x 20% = 4.8% )重复第一轮。情况 4:甲乙皆死( 76% x 80% = 60.8% )枪战结束。甲的活率为 12.672%(19.2% x 60%) + (4.8% x 24%) = 12.672% 乙的活率为 10.08%(15.2% x 60%) + (4.8
20、% x 20%) = 10.08% 丙的活率为 75.52%(19.2% x 20%) + (15.2% x 40%) + (4.8% x 100%) + (60.8% x100%) = 75.52%通过对两轮枪战的详细概率计算,我们仍然发现枪法最差的丙存活的几率最大,枪法较好的甲和乙的存活几率仍远低于丙的存活几率。对于这样的例子,有人会发出 “英雄创造历史,庸人繁衍子孙 ”的感叹。我们现在改变游戏规则,假定甲乙丙不是同时开枪,而是他们轮流开一枪。在这个例子中,我们发现丙的机会好于他的实力,丙不会被第一枪干掉,并且他可能极有机会在下一轮中先开枪。先假定开枪的顺序是甲、乙、丙,甲一枪将乙干掉后(
21、 80% 的几率),就轮到丙开枪,丙有 40% 的几率一枪将甲干掉。即使乙躲过甲的第一枪,轮到乙开枪,乙还是会瞄准枪法最好的甲开枪,即使乙这一枪干掉了甲,下一轮仍然是轮到丙开枪。无论是甲或者乙先开枪,乙都有在下一轮先开枪的优势。如果是丙先开枪,情况又如何呢?丙可以向甲先开枪,即使丙打不中甲,甲的最佳策略仍然是向乙开枪。但是,如果丙打中了甲,下一轮可就是乙开枪打丙了。因此,丙的最佳策略是胡乱开一枪,只要丙不打中甲或者乙,在下一轮射击中他就处于有利的形势。我们通过这个例子,可以理解人们在博弈中能否获胜,不单纯取决于他们的实力,更重要的是取决于博弈方实力对比所形成的关系。在上面的例子中,乙和丙实际上
22、是一种联盟关系,先把甲干掉,他们的生存几率都上升了。我们现在来判断一下,乙和丙之中,谁更有可能背叛,谁更可能忠诚?任何一个联盟的成员都会时刻权衡利弊,一旦背叛的好处大于忠诚的好处,联盟就会破裂。在乙和丙的联盟中,乙是最忠诚的。这不是因为乙本身具有更加忠诚的品质,而是利益关系使然。只要甲不死,乙的枪口就一定会瞄准甲。但丙就不是这样了,丙不瞄准甲而胡乱开一枪显然违背了联盟关系,丙这样做的结果,将使乙处于更危险的境地。合作才能对抗强敌。只有乙丙合作,才能把甲先干掉。如果,乙丙不和,乙或丙单独对甲都不占优,必然被甲先后解决。六、智猪博弈猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏
23、板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。那么,两只猪各会采取什么策略?答案是:小猪将选择 “搭便车 ”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 空调租赁合同
- 甘肃省红十字救护员中级职业认证试卷与答案
- 2025-2030民办早教机构行业竞争态势与投资前景预测报告
- 2025-2030民办教育跨界合作与资源整合路径探索
- 审计局公务员考试面试题及答案
- 2025-2030民办教育机构合规审计重点与风险预警机制
- 2025-2030民办教育保险行业市场调研及竞争策略报告
- 2025-2030民办托育机构市场发展现状及需求趋势与投资机会分析报告
- 青海消防教育题库及答案
- 口腔颌面外科学考试题库含答案(一)
- 贸易安全意识培训课件
- 保温材料安全培训课件
- 颜勤礼碑课件详解
- 汽车内饰设计2025年流行趋势及消费者偏好研究报告
- 河北省衡水市安平中学2025-2026学年高一上学期9月第一次半月考生物试卷
- 山楂创意画课件
- 2025-2026学年江苏省镇江市初三上学期数学月考试题【附答案】
- 2025年许昌禹州市特招医学院校毕业生招聘86名备考练习试题及答案解析
- 2024广东政务服务数据管理局事业单位笔试试题
- 脑梗阿替普酶溶栓课件
- 硅溶胶产业需求量预测及未来发展规模预警报告
评论
0/150
提交评论