经济学第五章博弈论.ppt

上传人：1*** IP属地：浙江上传时间：2020-07-26 格式：PPT 页数：29 大小：623.01KB 积分：20 举报 版权申诉

免费预览已结束，剩余24页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第五章：博弈论,博弈论关注的是对策略互动的一般性分析，它可以应用于企业运营博弈、政治谈判和经济行为。,著名经济学家保罗萨缪尔森甚至说：“要想在现代社会做一个有文化的人，就必须对博弈有一个大致的了解。”,从1994年诺贝尔经济学奖授予3位博弈论专家开始，共有5届的诺贝尔经济学奖与博弈论的研究有关，分别为： 1994年，授予美国伯克利加利福尼亚大学的约翰海萨尼（J.Narsanyi）、普林斯顿大学约翰纳什（J.Nash）和德国波恩大学的赖因哈德泽尔滕（Reinhard Selten）。 1996年，授予英国剑桥大学的詹姆斯莫里斯（James A. Mirrlees）与美国哥伦比亚大学的威廉维克瑞

2、（William Vickrey）。 2001年，授予美国加州大学伯克莱分校的乔治阿克尔洛夫（George A. Akerlof ）生于1940年、美国斯坦福大学的迈克尔斯宾塞（A. Michael Spence ）和美国纽约哥伦比亚大学的约瑟夫斯蒂格利茨（Joseph E. Stiglitz）。 2005年，授予美国马里兰大的托马斯克罗姆比谢林(Thomas Crombie Schelling)和耶路撒冷希伯来大学的罗伯特约翰奥曼(Robert John Aumann)。 2007年，授予美国明尼苏达大学的里奥尼德赫维茨(Leonid Hurwicz）、美国普林斯顿大学的埃里克马斯金(Eri

3、c S. Maskin)以及美国芝加哥大学的罗杰迈尔森(Roger B. Myerson)。作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见。,约翰纳什生于1928年6月13日。父亲是电子工程师与教师，第一次世界大战的老兵。纳什小时孤独内向，虽然父母对他照顾有加，但老师认为他不合群不善社交。纳什在上大学时就开始从事纯数学的博弈论研究，1948年进入普林斯顿大学后更是如鱼得水。他在普林斯顿大学读博士时刚刚二十出头，但他的一篇关于非合作博弈的博士论文和其他相关文章，确立了他博弈论大师的地位。在20世纪50年代末，他已是闻名世界的科学家了。特别是在经济博弈论领域，他做出了划时代的

4、贡献，是继冯诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献，都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。,约翰冯诺依曼（JohnVonNouma，19031957），美藉匈牙利人，1903年12月28日生于匈牙利的布达佩斯，父亲是一个银行家，家境富裕，十分注意对孩子的教育冯诺依曼从小聪颖过人，兴趣广泛，读书过目不忘据说他6岁时就能用古希腊语同父亲闲谈，一生掌握了七种语言最擅德语，可在他用德语思考种种设想时，又能以阅读的速度译

5、成英语他对读过的书籍和论文能很快一句不差地将内容复述出来，而且若干年之后，仍可如此1911年一1921年，冯诺依曼在布达佩斯的卢瑟伦中学读书期间，就崭露头角而深受老师的器重在费克特老师的个别指导下并合作发表了第一篇数学论文，此时冯诺依曼还不到18岁1921年一1923年在苏黎世大学学习很快又在1926年以优异的成绩获得了布达佩斯大学数学博士学位，此时冯诺依曼年仅22岁1944年与摩根斯坦因（Morgensten）合著的对策论与经济行为已成为博弈论的奠基之作。,一、博弈的收益矩阵,策略互动可以涉及许多参与人和许多策略，但我们的分析却只限于策略数量有限的双人博弈。我们用收益矩阵来表示博弈。收益

6、矩阵可以描述策略参与人在选择策略时各自的收益。它可以帮助参与人做出策略选择。,收益矩阵,假如有两位同学A和B玩一个游戏， A在纸上单独写“上和下”，B在纸上单独写“左和右” 。如果A写了“上”，B写了“左”，则A得1块钱奖励，B得2块钱奖励。如果A写了“上”，B写了“右”，则A得0块钱奖励，B得1块钱奖励。如果A写了“下”，B写了“左”，则A得2块钱奖励，B得1块钱奖励。如果A写了“下”，B写了“右”，则A得1块钱奖励，B得0块钱奖励。你如果是A，你该写什么，如果是B，该写什么？,画收益矩阵,首先描述参与人，一个左，一个上；再描述每个参与人各自可选的策略；再写出每个策略下参与人的

7、收益，左边的数字代表写在左边的参与人的收益，右边的数字代表写在上边的参与人的收益。,同学A,同学B,上,下,左,右,1，2,0，1,2，1,1，0,博弈的结果,如果你是A，选择“下”总是要好一些，因为他选“下”的收益（2或1）大于他选择“上”的收益（1或0）。如果是B，选择“左”的结果总是要好一些，因为他选“左”的收益（2或1）大于他选择“右”的收益（1或0）。在这种情况下，出现了占优策略。它指无论其他参与人如何选择，每个参与人都有一个最有选择。即无论B选什么，A选“下”都要好一些，无论A选什么，B选“左”要好一些。,占优策略,如果在某个博弈中，每人参与人都有一个占优策略，那么，这个占优策

8、略组合（即A选“下”B选“左”）是该博弈的均衡结果。因为无论其他参与人如何选择，占优策略都是该参与人最优的策略。,二、纳什均衡,在上一个例子中，我们发现无论B选什么，A选“下”都要好，但有时这种情况不能满足。例如: B选“左”时，A选“上”好；B选“右”时，A选“下”好。A的最优选择取决于他对B的选择的预期。因此，每个人都有动机去了解对方的最优选择。,同学A,同学B,上,下,左,右,2 ，1,0，0,0，0,1，2,纳什均衡,如果给定B的选择，A的选择是最优的，并且给定A的选择，B的选择也是最优的，那么，这样一组策略就是一个纳什均衡。注意：每个人在做选择时，都不知道另一个人的策略，但每个

9、人都会对另一个人将要选择的策略作出预期。一个纳什均衡可以看作是关于每个参与人的策略选择的一组预期，这些预期使得当任何一个人的选择被揭示后，没有人愿意改变自己的行为。,存在多个纳什均衡的博弈,在以下收益矩阵中，策略（上，左）是一个纳什均衡。因为如果A的最优选择是“上”，B的最优选择是“左”；如果B的最优选择是“左”，A的最优选择是“上”。即给定期他人的选择，每个参与人都做出了最优的选择。同时，（下，右）也是一个纳什均衡。古诺均衡也是纳什均衡。,同学A,同学B,上,下,左,右,2 ，1,0，0,0，0,1，2,海滩售货博弈,0,200,A,甲乙,甲乙二人在长200米的海滩上卖饮料，海滩上的

10、游客均匀散布。二人以相同的价格卖同样的饮料，所以买主会向最近的卖主购买。此时惟一的纳什均衡是什么？为什么？,不存在纳什均衡的博弈,如果A选择“上”，B会选择“左”，而B选择“左”，A又选择“下”。同样，如果A选择“下” ，B会选择“右”，但如果B会选择“右”， A又会选择“上”。此时，不存在纳什均衡。,同学A,同学B,上,下,左,右,0 ，0,0，-1,1，0,-1，3,三、混合策略,纯策略：每个人只选择一种策略并一直坚持这个选择。前面我们所讲到的博弈是一种纯策略。混合策略：参与人选择策略是随机的。即参与人一定的概率来选择策略。例如：A可能以50%的概率选择“上” ， 50%的概率选择“下”

11、，B以50%的概率选择“左” ，以50%的概率选择“右”，此时，A的平均收益为0，B的平均收益为1/2。混合策略纳什均衡：给定其他人参与人的策略选择概率，每个参与人都为自己确定了选择每一种策略的最优概率。,四、囚徒困境,该问题要说明：博弈的纳什均衡并不一定导致帕累托有效率。有两个囚徒被单独关在两个房间里接受审讯。每个囚徒都可选择坦白或抵赖。如果两个都坦白，他们将被拘留3个月；如果只有一个人坦白，那么坦白的可以免予刑事处分，而抵赖的那一位将入狱6个月。如果两个都抵赖，根据法律，两位都只能被拘留1个月。请问：两个囚徒的最优选择是什么？有没有纳什均衡？,囚徒困境的收益矩阵,从囚徒A的角度来看

12、，不管囚徒B是否坦白，A坦白要好。同样的情形适用于B。因此，两个囚徒都坦白，是占优策略均衡，也是纳什均衡。但这个均衡是低效率的。如果双方都选择抵赖，其境况要好一些。（抵赖，抵赖）是怕累托低效率的策略组合没有其他策略选择能够使他们的境况变得更好。,囚徒A,囚徒B,坦白,抵赖,坦白,抵赖,-3，-3,0，-6,-6，0,-1，-1,囚徒困境在经济和政治生活中有着广泛的应用。例如，军备竞赛问题，我们把策略“坦白”改为“部署导弹”，把抵赖改为“不部署导弹”。纳什均衡是双方都会部署导弹。这是低效率的。例如，卡特尔中的欺骗问题。假如当初约定好安限额生产，即“抵赖”，但每家厂商只要超额生产（“坦白”）

13、是有利可图的，则每家企业都将超额生产“坦白”。在上述例子中，双方约定“抵赖”是没用的。如果要实现这一策略，就必须有惩罚机制。重复博弈。,五、重复博弈,如果参与人仅“相遇”一次，博弈的结果是使他们陷入囚徒困境。但是，如果相同的参与人重复地进行这个博弈，每个参与人将面对新的可选择策略。因为如果某参与人在某局博弈中被背信，那么，其他参与人在下一局中也选择背信。因此，背信人将“受到惩罚”。从而激励参与人“守信”。但这种策略可行，要取决于这种博弈是有限次重复博弈还是无限次重复博弈。,5.1、有限次重复博弈,如果参与人事先都知道，博弈将进行某个固定的次数，如10次。则每个参与人会在每一局选择背信。因为

14、如果参与人无法在最后一局实行合作，那么，在倒数第2局也将无法实行合作。假如参与人处在第10局（最后一局），因为这是最后一次博弈，每个参与人都会选择背信（这是占优策略均衡），即最后一次博弈如一次性博弈。那么在第9局，参与人也就都会采取背信。因为如果你选择合作，另一个人将利用你的善良获利，背信仍是他的占优策略。以此类推，在每一局中，参与人都会不守信。,5.2、无限次重复博弈,参与人之所以合作，是因为他们希望合作会引致将来的进一步合作，在有限次重复博弈中，由于最后一局不再有将来博弈的可能，没有人愿意合作。而如果是无限次重复博弈，你就有办法影响对手的行为：如果这次他拒绝合作，那么下一次，你也可以拒

15、绝合作。只要双方都关心将来的收益，那么，将来不合作的威胁就足以使他们采取帕累托有效率的策略合作。,无限次重复博弈和卡特尔,实行卡特尔是指两家垄断厂商共同索要高价从而获取巨额利润。如果有一家厂商索要高价，则另一家厂商稍微降价就能夺取对方的市场，获得比合作更高的利润。如果两家厂商都选择降价，他们只能获得比合作更低的利润。无论对手索要什么价格，你降价总是有利。因此，纳什均衡是双方都降价。但是如果博弈重复无限次，则每家厂商会采取针锋相对的策略，即你降价我也降价，并且每个参与人都知道对方会采取针锋相对的策略，则每个人就会担心因自己的降价而触发价格战。因此，针锋相对所隐含的威胁将维持卡特尔。（例如：机

16、票定价）,六、序贯博弈,我们前面所研究的博弈都是参与人同时采取行动，但在许多情况下，一个参与人先采取行动，一个参与人在做出反应。例如：前面的斯塔克尔伯格模型。序贯博弈的收益矩阵。假如A先做选择，B后做选择,参与人A,参与人B,上,下,左,右,1，8,1，9,0，0,2，1,当博弈以这种形式表达时，有两个纳什均衡: （上，左）和（下，右），但其实有一个均衡是不存在的。,博弈的扩展形式,用收益矩阵表达博弈时，容易掩盖这样一个事实：其中一个参与人在做出自己的选择以前，必须先要揣测另一个人的选择。因此，我们用扩展形式来表达博弈。它可以显示选择的次序。,参与人A的选择,上,下,参与人B的选择,左,A

17、,B 1,8,1,9,0,0,2,1,右,左,右,最终选择 Why?,因为A一开始只会选择“下”，因为他知道自己如果选“下”，B肯定选“右”,B“威胁”A,现在假设B威胁A，自己只会选择“左”，因为在自己选择“左”的时候，如果A还选择“下”，则收益为0，小于选“上”是的收益1，此时，A害怕收益为0，选“上”。但一定要使威胁可信。,参与人A的选择,上,下,参与人B的选择,左,A,B 1,9,1,9,0,0,2,1,右,左,右,最终选择,B先做选择：“谁先动谁占优”,现在假设B先做选择，A后做选择。,参与人B的选择,左,右,参与人A的选择,上,A,B 1,9,0,0,1,9,2,1,下,上,下,最

18、终选择,则B只会选择“左”，选“右”的时候，A会选“下”此时，B获得收益大于A先做选择时的收益。,A先动时的均衡,因此，在序贯博弈中，选择的次序是很重要的。在无法排出先后次序的情况下，如果参与人能够让对方相信自己一定会选择某种策略，则对方将会在自己选择的策略条件做出选择，这将最终对自己有利。即：在这种博弈中，参与人找到一种能够事先承诺一条特定选择路径的方法通常对自己是有利的。,序贯博弈的一个案例,海盗分赃有五个海盗抢了一百根金条，商量怎么样分这笔财富。我们假设这些人都是理性人，不存在要考虑什么兄弟感情，只考虑利益最大化，而且这个规则严格执行，不管还剩下多少人。于是他们想了一个办法：抓阄决定每个人的编号，编号为一到五。抽到编号一的人先站出来说一个方案，如果超过半数（不包括半数）的人同意，那

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

经济学第五章博弈论.ppt

文档简介

温馨提示

最新文档

评论

经济学第五章博弈论.ppt

文档简介

温馨提示

最新文档

评论

相关文档