




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博弈论原理WWW.ZJGSU.EDU.CN工商管理学院基本信息pwa2002@163.com;qihuilu@163.com电话686018
课程名称:博弈论原理
GameTheory
授课教师:潘文安、鲁其辉
经济博弈论(第三版),谢识予编著,复旦大学出版社,2008.5。
教材博弈论与信息经济学张维迎上海人民出版社经济博弈论谢识予复旦大学出版社博弈论基础罗伯特·吉本斯中国社会科学出版社博弈论弗登博格中国人民大学出版社科普读物:《身边的博弈》,董志强,机械工业出版社
《无处不在的博弈》,蒲勇健,重庆大学出版社参考书3课程考核要求课程考核课堂要求课程成绩课堂表现和作业(30%)期末考试(70%)考试形式闭卷课程按时到课,端正态度。开动脑筋,积极参与讨论。静音通讯工具,不得抽烟。认真思考,按时完成作业。新古典经济学的基本假设:(1)市场竞争是完全的;(2)信息是完全的。经济学诺贝尔奖先后5个年度颁发给研究博弈论及其相关领域的13位经济学家/数学家
1994年3位:纳什、海萨尼、泽尔滕
1996年2位:米/莫里斯、维克瑞
2001年3位:斯宾塞、阿科诺夫、斯蒂格勒茨
2005年2位:奥曼、谢林
2007年3位:梅耶森、马斯汀、赫维兹经济管理学科一种主流的研究方法或工具课程性质5课程性质你随时都在博弈。与父母、朋友、老师等等;(虎妈妈与羊妈妈;杀熟;承诺与威胁)你可能已经获得大量本能性技巧,而你通过博弈论的学习发现你已经学到的经验;博弈论是对这些经验的系统整理,以便你提高策略技巧并运用自如。萨缪尔森:要在现代社会做一个有文化的人,你必须对博弈论有大致的了解
日常生活中一种极重要的思维方式6课程性质博弈论覆盖广泛领域:商业、外交、战争、法律、政治等博弈论帮助你学习其他学科(如,生物学深受进化博弈的影响)洞悉这样的博弈,可以丰富你对世界的理解。——事实上,只要人为了达成协议或解决冲突而彼此互动时,博弈就发生7课程性质对于大多数人而言,学习博弈论不轻松。正式的博弈论往往用数学语言表达出来;大多数人把博弈论学习看作是一件艰难而痛苦的事情;其实,博弈论是非常有趣的学问,把博弈论的学习看作是一件痛苦之事,实在不应该。——快乐地学习博弈论8主要内容
第五讲不完全信息静态博弈第四讲完全但不完美信息动态博弈第三讲完全且完美信息动态博弈第二讲完全信息静态博弈第一讲导论第六讲不完全信息动态博弈9第一讲导论什么是博弈论1几类经典博弈模型3博弈结构和博弈的分类4博弈论的基本概念21、什么是博弈(Game)game:游戏。如何在游戏中获胜?策略思维:本质上是你与他人之间的互动,别人也在进行类似的思考。机会/运气:除非传说中的魔法,运气是不能改变的技巧:虽然后天锻炼可以改进,但是改进程度有限。策略:绝大多数人可以通过学习,提高在竞争中策略性地选择自己行为的技能。博弈论就是这样的互动决策分析的科学。1.1什么是博弈论
请10个志愿者来参加,每人在字条上写一个数字,该数字是0-100之间任何一个整数。只有一个人是赢家,他怎么会赢呢?游戏规则:谁写的数字最接近平均数的一半,谁就是赢家。“赌博式”实验1.1什么是博弈论12分析:每个人获胜的概率不仅取决于自己写什么数字,也取决于别人写什么。——你们的决策相互影响和依赖拳击手的决策:一拳击手打算攻击对方要害时,不仅他的每一步计划都会招致抵抗,而且他还面临对方主动攻击。他须设法克服这些抵抗和攻击。博弈最本质的特征:决策主体的行为选择相互作用博弈即策略性的互动。
——罗伯特·奥曼(05年Nobel经济学)1.1什么是博弈论13博弈论:研究互动情形下人们如何进行决策、以及这种决策如何达到均衡的问题。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略博弈论衍生于古老的游戏如象棋、扑克等。研究游戏过程中如何“出招”。又称“对策论”2、什么是博弈论(GameTheory)1.1什么是博弈论14学习博弈论,就是训练策略思维,提高在互动环境中的谋略技巧。不能说博弈论可以交给你精于对抗的秘诀,它能提供的仅仅是一些思考策略互动问题的一般原理。博弈论:就是研究在互动局势中如何策略性选择自己行为的系统理论3、为什么学习博弈论(GameTheory)1.1什么是博弈论15因此,当代最伟大的经济学家萨缪尔森说:要在现代社会做一个有文化的人,你必须对博弈论有大致的了解。学习博弈论的目的学习一种谋略技巧,提高人生成功的可能性学习一种思维方式,加深对社会现象的认识程度学习一种交流语言,扩大交流圈子学习一种研究方法,提高学术研究水平1.1什么是博弈论16博弈论的用处
解释——许多事件促使我们探寻其发生的原因预测——在观察多名决策者策略互动时,可用博弈论预测他们将采取的行动以及结果提出建议或者找出解决的办法——辅助参与人,告诉他们哪些策略可能获得良好的结果,哪些可能带来糟糕的结果。1.1什么是博弈论174、几个有趣的博弈事例1)别人的红包更诱人
地主在年终给长工张三和李四每人一个红包,他们都知道自己红包里有1000元,但是不知道对方红包里有多少钱。地主说:“每人的红包里可能是1000元,也可能是3000元。如果你们都愿意和对方换的话,那么我来做公证人,收取每人公证费100元。你们愿不愿和对方交换?”张三想,假定换,若他是1000元,则亏100公证费,可能性仅50%;若他是3000元,则扣除公证费,净赚1900,可能性50%。预期净赚900元。所以应该换。1.1什么是博弈论18在互动情形中,缺乏策略思维,难免会犯错误
于是,张三和李四异口同声地说:“愿意。”地主露出一丝狡诈的微笑:“真的?”张三和李四又异口同声地说:“真的!”结果,张三、李四各亏损100,地主用他小小伎俩骗了200元1.1什么是博弈论19如果你选了门课程,课程成绩评定按某曲线分布进行。无论你如何用功,都只有40%的学生得A,40%
学生得B。因此你需相对于其他同学更用功。全班同学在第一次课后大家开会,达成一个协议,大家都不要太用功。2)无谓竞争
想法不错,但无法实施!
稍加努力即可胜过他人,诱惑大。毕竟,其他人并不能观察到你的用功程度,对你也没有实际约束力。1.1什么是博弈论20问题是,大家都这么做。这样一来,所有人的成绩都不比大家遵守协议来得高。而且,大家还付出了更多的功夫。——囚徒困境囚徒困境有可能导致两败俱伤。Q:每个博弈必有输赢?正因为这样的博弈对所有参与者存在着或大或小的潜在成本,如何达成和维护互利的合作就成为一个值得探究的重要问题。1.1什么是博弈论21上海一男一女,各自拥有一套廉租房;但是他们的关系已发展到同居的地步,只需要其中一套。女人建议男人退房,与她合租。男士坚持拥有更多的(住房)选择,即使他认为他们分手的可能性很小,但是只要有分手的可能,保留第二套房子留作后备,不至于狼狈不堪,四处求房。女方反应强烈,宣布分手。3)约会博弈1.1什么是博弈论22
在这样的博弈中,真正的策略问题是信息披露。诱使他人采取行动,以可靠地显示其私人信息(好或坏),这样的策略称为“筛选”。传递关于自己的好信息的策略称作“信号”。
女人无法确认男人的爱,建议放弃一套公寓,是一种筛选策略,让男方要么放弃公寓(显示很爱对方),要么反对(显示缺乏真心)。——口头的爱总是很廉价。而他拒绝这样做实际上是给出了负面证明,女人选择分手是明智的。1.1什么是博弈论23曾经有个乞丐小孩,面对他人施舍只要1元,而不要10元。因“傻”而出名,结果不断有人闻讯前来试验,每次都发现小孩真的“傻”。4)为什么要1元而不要10元小乞丐面临的是一个长期重复博弈:单期中,对他来说最好选择10元而放弃1元一旦接受了10元就不会再有人出于好奇给他1元。所以,如果贪眼前小财而却会损失后面细水长流的许许多多1元。乞丐通过“装傻”的策略性行为,树立起“傻”的声誉,获得长期接受他人施舍的好处长期关系对博弈的重要影响1.1什么是博弈论24暗度陈仓:偷偷地沿着陈仓通道突破楚河(兵分两路,一路明攻,另一路暗攻,使敌人预料不到在最后一刻才分兵抵抗)打草惊蛇:拍打周边草丛惊动蛇(当你不了解对手策略时,可发起直接迅速进攻,观察对手反应。敌人的行为会显出其策略)5)中国在策略方面的智慧——《孙子兵法》
《三十六计》1.1什么是博弈论25三国演义中的博弈思想火枪手的故事与孙刘联盟
假设三个火枪手相约决斗,谁能生存下来谁就是最终的赢家。甲的命中率为80%,乙的命中率为60%,丙的命中率为40%。
你认为谁生存下来的几率最大呢?26三国演义中的博弈思想
在枪手博弈中,乙是甲的头号敌人,因此甲一定会首先攻击乙。而对于乙来讲,甲同样是他的头号敌人,他不可能首先去对付丙,所以不会有子弹射向丙,他生存下来的概率为100%,甲的生存概率是40%*60%=24%,乙生存的概率是100%-80%=20%。乙与丙有一个共同的目标甲,在表面上双方达成了一种同盟的关系。但这种同盟是极不稳固的,由于甲一定会攻击乙,所以乙是这个同盟的忠实执行者,而丙没有来自甲和乙两方面的压力,只要有利可图他便随时可能退出同盟。三国演义中的博弈思想
三个枪手决斗的博弈揭示了一个道理:在一个弱者、次强者、强者的三方对决中,如果次强者水平较高,则弱者最好是挑起次强者和强者之间的争斗,而自己就袖手旁观坐收渔人之利;如果次强者水平较低,那么弱者为了争取更大的生存机会,就应当首先帮助次强者一起对付强者。否则,次强者难以对强者构成足够的威胁,那么弱者也将难以自保。这就是弱者在夹缝中的生存之道。隆中对“今操已拥百万之众,挟天子而令诸侯,此诚不可与争锋。孙权据有江东,已历三世,国险而民附,贤能为之用,此可以为援而不可图也。荆州北据汉、沔,利尽南海,东连吴会,西通巴蜀,此用武之国,而其主不能守,此殆天所以资将军,将军岂有意乎?益州险塞,沃野千里,天府之土,高祖因之以成帝业。刘璋暗弱,张鲁在北,民殷国富而不知存恤,智能之士思得明君。将军既帝室之胄,信义著于四海,总揽英雄,思贤如渴,若跨有荆、益,保其岩阻,西和诸戎,南抚夷越,外结好孙权,内修政理;天下有变,则命一上将将荆州之军以向宛、洛,将军身率益州之众出于秦川,百姓孰敢不箪食壶浆,以迎将军者乎?诚如是,则霸业可成,汉室可兴矣。”
三国演义中的博弈思想1、赤壁之战背景:曹操此时基本统一长江以北的中原大部分地区,三分天下有其二,在进一步吞并荆州之后,把刘备追逐到了江夏,并威胁到江东孙氏政权。相对实力弱小的孙刘两家只有联合抗曹才能生存。舌战群儒智激周瑜草船借箭黄盖诈降火烧战船曹操三笑三国演义中的博弈思想30三国演义中的博弈思想
但是,对于弱者刘备而言,若能够与次强者孙权联盟对抗强者曹操,那么将曹操灭掉是否就是最佳选择呢?非也!可以想象,当刘备与孙权一起灭掉曹操,那么接下来的历史很可能就是孙权灭掉刘备。所以,弱者总有动力去维持一个稳定三角形结构:与次强者联盟,但是却并不愿真正消灭强者。赤壁之战胜利并不能保证曹操势力瓦解。由于曹操这一威胁长期存在,孙权和刘备就有长期合作的必要。基于这一点孙、刘两家继续联盟就是顺理成章的事情。赤壁之战后三分雏形出现,曹操无力南下只得静观其变,孙权刘备只有联合才能抵挡曹操,三方形成了一种均衡,理性的各方在他人不改变策略情况下其现有策略是最优的,谁单独改变自己的策略都要付出大的代价,这就是一个纳什均衡的体现,其均衡点就是战后三方均采取和平共处政策。31三国演义中的博弈思想2、曹操败走华容道
背景:曹操在赤壁大战中一败涂地,率残兵败将向许都方向逃。窜。诸葛亮在曹操溃逃的路上布置了三重防范:第一批拦截大军是赵云率领的,第二批拦截大军是张飞带队的,第三批是关羽率部伏击。诸葛亮要求赵云和张飞的主要任务是放火骚扰,真正捉曹操的任务落在了关羽身上。后来在华容道上,关羽念旧情而放掉了曹操。
诸葛亮明明知道关羽重义气,必然放走曹操,为何还要将捉曹操的任务交给关羽?
诸葛亮的目的何在?三国演义中的博弈思想曹操孔明华容道大路华容道(捉住曹操,被捉)(白等,逃脱)大路(白等,逃脱)(捉住曹操,被捉)华容道博弈矩阵诸葛亮的目的:一是给曹操一个教训,使之不敢轻易犯敌;二是为了维持孙刘联盟。三国演义中的博弈思想
这是一个零和博弈,它没有纳什均衡点。零和博弈是指双方的得益之和为零,一方所得增加,另一方所得便减少。在博弈中,双方无法知道对方的策略选择,而只能进行猜测。曹操要选择走诸葛亮的军队不在的路,这是他的最优选择结果。而诸葛亮的最优结果是埋伏在曹操要走的路上。诸葛亮制造埋伏在大路的假象,其实则派关羽埋伏在小路。这里是谁能真正猜到对方的策略,谁就是赢家。诸葛亮胜曹操一筹。这个博弈的结果是:曹操选择了走华容道,结果被抓;关羽在华容道守候,抓住了曹操。
曹操为何进了孔明的圈套呢?三国演义中的博弈思想3、空城计的博弈解读
空城计,大家耳熟能详。但现在很多学者对这一故事的真实性有争议,易中天在品三国中认为!这个故事不是事实,也不符合逻辑。认为空城计不是事实,主要理由归结为以下几点:其一,以司马懿卓越的军事才能不至于看不出空城计;其二,司马懿即使不敢攻城,也完全可以派出一个小分队搞火力侦察,探明虚实再作决断。这样即使孔明真的设下了埋伏,他的损失也不大;如果没有埋伏,就可以进攻活捉孔明。其三,以双方兵力的悬殊,司马懿完全可以围而不攻,围他三天,不至于掉头就走。
你认为是这样吗三国演义中的博弈思想
而从博弈分析的角度来看,并非司马懿不敢攻城,而是司马懿并不想过早除掉诸葛亮。为什么呢?因为司马懿一直受曹真等人的排挤,曾经被贬为平民。只因诸葛亮伐魏无人可挡,最后曹操又不得不请司马懿出山。可以说,正因为诸葛亮的存在,才使得曹魏对司马懿有所依赖。司马懿自己也很清楚,在自己未能掌握军国大权的时候,一旦诸葛亮倒下,也就是自己被逐出朝廷甚至遭迫害的日子。于是,司马懿在空城计面前退却了。后来,司马懿不断扩充军权,大权独揽。那是为了自己和家族不至于在诸葛亮死后被曹魏挟制和迫害。决策与博弈
博弈与决策的区别:
人与人的行为存在互动效应:一个人的行为影响另一个人的结果。参与人相互意识到这种互动效应这种对互动效应的相互意识,以及双方据此认识而采取的行动,构成策略中最有趣的部分。
决策无须考虑他人反应的场合下选择行为;博弈必须有两个以上参与人,每个参与人都对他人的行为作出反应,否则就不是博弈。1.2博弈论的基本概念决策决策一般需要经历三个阶段输入阶段(决策依据)1、自身的目标和要求2、历史数据和经验3、利益相关者的目标和需求4、其他工具和方法阶段(决策方法)1、定量方法2、定性的方法输出阶段(决策结果)38两个小偷行窃未果被抓,隔离审讯。“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。坦白否?囚徒困境(Prisoners’Dilemma)(塔克,1950)1.2博弈论的基本概念-8,-80,-10-10,0-1,-1囚徒A坦白抵赖坦白抵赖囚徒B基于收益矩阵的模型描述:参与人囚徒B的支付囚徒B的可选策略囚徒A的支付1.2博弈论的基本概念403,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齐威王田忌赛马1.2博弈论的基本概念41博弈的定义(P4)处于互动局势中的个体在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。博弈的基本要素:
例:田忌赛马
田忌的战略是:{下,上,中}。齐威王的战略是:{上,中,下}
参与人(players):博弈中的决策主体行动(actions/moves):局中人可能选择的决策变量战略/策略(strategies):参与人一套完整的行动计划1.2博弈论的基本概念42描述一个博弈所需要的最少的要素:参与人战略支付
收益/支付/得益(payoffs):每个人在不同战略组合下获得的好处,可以是利益或者效用次序(order):各博弈方选择实施行为的先后顺序均衡(equilibrium):所有参与人最优战略或行动的组合结果:博弈分析者感兴趣的要素集合。1.2博弈论的基本概念43每个参与人均以获取最大支付为目标。但是参与人达成其目标的能力如何?能否计算出对自己最有利的策略,并在实际的博弈中依计而行?理性≠自私。一项基本假设:完全理性(completerationality)
追求个人最大利益非常聪明——在任何情况下都知如何追求个人最大利益(参与人都精于计算并严格按照其最优策略行事)1.2博弈论的基本概念44假设参与人在某种程度上对博弈的规则有共同认知——共同知识(commonknowledge)
博弈规则包括(1)参与人名单;(2)每个参与人的可行策略;(3)每个参与人在所有参与人可能的策略组合下获得的支付;(4)参与人都是理性的共同知识本质在于保证所有信息在双方之间是完全的,这样博弈的双方才不致因为对博弈的规则的认知不同而使得均衡力量被一方所打破。1.2博弈论的基本概念45461)囚徒困境警察抓住了两个罪犯,但是却缺乏足够的证据指证他们所犯的罪行,但如果两人至少有一人供认犯罪,就能确认罪名成立。为了得到所需口供,警察将这两名罪犯分别关押,以防止他们串供或结成攻守联盟,并分别跟他们讲清他们的处境和面临的选择。如何决策?1.都拒不认罪,以较轻的妨碍公务罪各判1年徒刑;2.如果一人认罪,坦白者马上释放,另一人将重判8年徒刑;3.都坦白认罪,各判刑5年监禁。1.3几个经典博弈论模型4647-1,-1-8,0
0,-8-5,-5囚徒1不坦白不坦白坦白坦白囚徒2得益矩阵(PayoffMatrix)囚徒1:正向结论囚徒1:反向反之,若囚徒2坦白,则自己坦白得益为-5,不坦白得益为-8,还是应该选择坦白。“坦白”是1的上策,同样的选择过程,这也是囚徒2的上策。如果囚徒2不坦白,则自己坦白的得益为0,不坦白得益为-1,应该选择坦白。1.3几个经典博弈论模型不妨将条件放宽,允许囚犯A和B在审讯室李一起单独呆上10分钟,然后再决定是否坦白。很明显,双方交流的主旨就是建立攻守同盟,克服自利心理,甚至可能订立一个口头协议,要求双方都不去坦白。然后,双方再单独被提审。想一想,情况会如何?如果囚犯B遵守约定的话,则自己坦白就可获得自由;如果囚犯B告密的话,若不坦白就会被囚禁;事实上,囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。囚犯A的心理1.3几个经典博弈论模型囚徒困境的意义囚徒的两难选择反映出个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁结果。寡头2寡头1高价低价高价100,10020,150低价150,2070,70双寡头削价竞争的得益矩阵“囚徒困境”在市场竞争中的表现:双寡头削价竞争1.3几个经典博弈论模型设想乡下地方有一个只有两户人家的小居民点,由于道路情况不好,与外界的交通比较困难。如果修一条路出去,每家都能得到3那么多好处,但是修路的成本相当于4。要是没有人协调,张三李四各自打着小算盘,最后结果如何呢?1、1
-1、33、-10、0李四修不修
修张三不修结论:公共品问题一定要有人协调囚徒困境的应用:公共产品的供给
对甲和乙两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。
这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,私人一般没有积极性承担这方面服务的积极性和能力。51
如果双方都扩军,则各自花费2000亿美元用于军费;彻底裁军,则军费为零;若一方扩军,另一方裁军,其情形会怎样呢?我们的想法是:赢方掠夺的财富是有限的,比方说10000亿美元,而输方遭到的损失是无法估量的。-2,-28,-∞-∞,80,0苏联扩军裁军
扩军美国裁军问题:人类为什么那么傻,不选择右下角?囚徒困境的应用:军备竞赛52
“囚徒困境”不仅可以解释政治、经济领域的竞争,在广阔的社会生活中,这一困境的影响也随处可见。例如,我国目前的基础教育,可以说就是一个“囚徒困境”。
囚徒困境的应用:应试教育532)赌胜博弈赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示赌胜博弈的特点是一方得等于另一方失,不可能双赢,属于“零和博弈”1.3几个经典博弈论模型543,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齐威王得益矩阵取胜关键:不让对方猜到自己策略,尽可能猜出对方策略田忌赛马1.3几个经典博弈论模型在这个博弈中齐威王和田忌应该怎样选择自己的策略,才能最终获得满意的结果呢?首先,作为博弈方的齐威王和田忌不能让对方知道或猜中自己的策略,从而导致自己输掉比赛。这也意味着任何一方的策略选择不能一成不变,或者不能有规律性地变动,即必须以随机的方式选择策略,否则一旦对方捕捉到这种规律性的变动,就可以针对性地采取应对措施。其次,无论对齐威王还是田忌,可选择的六种策略之间没有优劣之分。从图可以看出,对齐威王来说,每一种策略都可能有六种不同的结果,究竟最终得到哪种结果,主要看对方策略与自己策略的对应状况,而不是自己的策略本身。同样的,对田忌来讲六种策略本身也无好坏之分。因此,两博弈方在决策时对自已的可选策略并无偏好,应以相同的概率选用。-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面猜硬币1.3几个经典博弈论模型570,01,-1-1,1-1,11,-10,01,-1-1,10,0石头剪子布博弈方2石头剪子布博弈方11.3几个经典博弈论模型石头、剪子、布3)产量决策的古诺模型古诺模型是寡头产量竞争,是市场经济中最常见的问题之一古诺1838年提出,直到现在还是经常使用古诺模型有很多扩展古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值1.3几个经典博弈论模型{0P4455376281612856520253056420202455525252543113333333734921213三厂商离散产量1.3几个经典博弈论模型n个厂商连续产量1.3几个经典博弈论模型博弈的定义博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行动或策略中进行选择并加以实施,并从中各自取得相应结果的过程。人是对应博弈方的每一组可能的选择都有一个结果表示该策略组合下各博弈方的所得或所失。博弈方的得益(Payoffs)博弈方的决策有先后之分,有时一个博弈方还要不止一次做出选择,次序不同一般就是不同的博弈。进行博弈的次序(Orders)博弈方进行决策时可以选择的方法、做法或经济活动的水平、量值等。各自可选择的策略(Strategies)博弈中独立决策、独立承担后果的个人或组织。博弈的参加者(Players)博弈四个基本构成要素1.4博弈结构和博弈的分类博弈中的博弈方博弈中的得益博弈的信息结构博弈的过程博弈中的策略博弈方的能力和理性博弈分类维度有限博弈无限博弈完全理性有限理性个体理性集体理性零和博弈常和博弈变和博弈完全信息不完全信息完美信息不完美信息单人博弈两人博弈多人博弈静态博弈动态博弈重复博弈博弈分类1.4博弈结构和博弈的分类1.4.1博弈中的博弈方:单人博弈单人博弈即只有一个博弈方的博弈。单人博弈多为一般的最优化问题,它使博弈理论的结构更加完整,而且可以为分析复杂的多人博弈提供启示,因此它是博弈分析的基础。AB出口(奖金M)博弈方策略得益游戏者
0
M
0
0A左B左A左B右A右B左A右B右单人迷宫得益矩阵例:单人迷宫1.4.1博弈中的博弈方:单人博弈单人迷宫扩展形A1
•(0)B1
•(M)•(0)右左右左博弈的扩展形表示法能比较形象地反映出博弈中实现每个得益的策略路径,与得益矩阵相比,能反映出博弈过程中选择、行为的先后次序,因此,特别适合后面将要讲的“动态博弈”。信息集博弈终端1.4.1博弈中的博弈方:单人博弈-7000-16000-10000-10000好天气(75%)坏天气(25%)自然商人水路陆路运输路线的得益矩阵自然起随机选择作用。运输路线有一个商人需要将一批商品从A地向B地运输,从A地到B地有水、陆两条路线,走陆路运输成本为10000元,走水路的运输成本为7000元。走陆路比较安全,走水路则有一定的风险,如果遇到恶劣天气将会造成这批货物总价值10%的损失。假设已知该批货物的总价值为90000元,运输期间出现暴风雨天气的概率为1/4,问该商人该选择哪条运输路线?01-7000-10000-16000-10000运输路线扩展形好天气(75%)坏天气(25%)水陆水陆决策:水路的期望得益为(-7000)*75%+(-16000)*25%=-9250走陆路的得益是确定的,为-10000,-9250>-10000,因此会选择走水路。单人博弈实质是个体的最优化问题。1.4.1博弈中的博弈方:单人博弈1.4.1博弈中的博弈方:两人博弈两人博弈两人博弈就是两个各自独立决策,但策略和利益具有相互依存关系的博弈方的决策问题,是博弈问题最常见、研究的最多的博弈类型。如:“囚徒困境”、“齐威王田忌赛马”等。个人追求最大自身利益的行为常常并不能实现社会的最大利益,也常常不能真正实现个人自身的最大利益。(社会冷漠)收益两方中掌握信息较多并不能保证利益也一定较多(为何创业成功的学历往往不高?)。信息两博弈方并不总是相互对抗,有时也会出现利益方向一致的情形(想想国共合作)。合作与非合作1.4.1博弈中的博弈方:多人博弈多人博弈有三个或三个以上博弈方参加的博弈成为“多人博弈”。战国时期各国之间的纷争,家电产业的价格战等都是多人博弈。多以博弈在表示方法上也与两人博弈有所不同。得益矩阵一般只适合单人博弈和两人博弈,只有少数离散策略的三人博弈还可以用两个或多个得益矩阵合起来表示,复杂的多人博弈和非有限策略的博弈等只能通过文字描述和函数式加以表达。表示方法的区别可能存在“破坏者”。破坏者的策略选择对其自身的利益没有影响,但却会对其他博弈方的得益产生很大的、甚至是决定性的影响。(想想张学良在军阀混战中的表现)与两人博弈的本质区别策略博弈中各博弈
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论