东南大学博弈论课件_第1页
东南大学博弈论课件_第2页
东南大学博弈论课件_第3页
东南大学博弈论课件_第4页
东南大学博弈论课件_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《经济博弈论》2023/9/152课前思考为什么要学习这门课?2023/9/1532023/9/1542023/9/155重要启示看到什么,取决于注意什么和希望看到什么学到什么,取决于注意什么和希望学到什么2023/9/156看到9张脸,智商为180,你呢?2023/9/157课程性质迄今为止,你经历过的最重大的决策是什么?当你做决策时,你最想拥有或者最想知道的是什么?在你做决策过程中,你会假设一些什么来约束自己的行为?什么是决策?决策就是优化行为选择教材及参考书主要参考书:1.张维迎,博弈论与信息经济学,上海三联书店,上海人民出版社.1996.2.

Gibbons,Robert,GameTheoryforAppliedEconomists,PrincetonUniversityPress,1992.3.吉本斯,博弈论基础(中文版),中国社会科学出版社,1999。4.A.迪克西特和S.斯克斯,策略博弈,中国人民大学出版社,2009。5.[美]朱•弗登博格,[法]让•梯若尔(JeanTirole),博弈论,中国人民大学出版社,2010。我的联系方式手机-mail:fengweiseu@126.com办公地点:九龙湖校区经管学院B304第一章导论

本章介绍博弈论的基本概念,包括什么是博弈和博弈论,给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论。目标是让大家对博弈论的内容和博弈模型有更直观的概念和印象。本章分三节1.1什么是博弈论1.2几类经典博弈模型1.3博弈结构和博弈的分类1.1什么是博弈论1.1.1从游戏到博弈1.1.2一个非技术性定义1.1.1从游戏到博弈博弈就是策略对抗,或策略有关键作用的游戏博弈Game,博弈论GameTheory,Game即游戏、竞技游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦1.1.2一个非技术性定义定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。博弈论(gametheory,又译为对策论,游戏论)定义:研究决策主体的行为在直接相互作用时,人们如何进行决策以及这种决策如何达到均衡——张维迎Gametheoryisaformalwaytoanalyzestrategicinteractionamongagroupofrationalplayers(oragents)whobehavestrategically——Gibbons博弈定义注意两点:1、是两个或两个以上参与者之间的对策论当鲁滨逊遇到了“星期五”石匠的决策与拳击手的决策的区别博弈定义2、理性人假设理性人是在面临既定的约束条件下最大化自己的偏好。博弈论说起来有些绕嘴,但理解起来很好理解,那就是每个对弈者在决定采取哪种行动时,不但要根据自身的利益和目的行事,而且要考虑到他的决策行为对其他人可能的影响,通过选择最佳行动计划,来寻求收益或效用的最大化。

17

你自认为是一个“经济人”吗?先来看看自己是不是一个理性的人?

18小实验:你会如何选择

第一选项你100%能赚30000元。

第二选项20%可能性什么也得不到。80%可能赚40000元

19你的选择是理性的吗?“理性人”选择预期收益最大的那个选项:第一:30000×100%=30000第二:40000×80%+0×20%=32000比较一下,第二选项的预期收益要大于第一选项。

20确定效应:理性人的一个挑战大多数人处于收益状态时,往往小心翼翼、厌恶风险、害怕失去已有的利润,这称为“确定效应”。就是在确定的好处和“赌一把”之间,做一个抉择,多数人会选择确定的好处。

21再来一个小实验:你会如何选择

甲.你已经100%的亏损30000元。放弃,认栽!

乙.你可以再拿10000元来拼一把,结果是:你有90%的可能性会亏光这40000元,但还有10%的可能性可以把投入的40000元都赚回来。

22你的选择是理性的吗?“理性人”选择预期收益最大的那个选项。比较一下:甲:-30000×100%=-30000乙:-40000×90%+40000×10%=-32000选项甲的期望值要大于乙,因为甲亏损的预期要小。

23很可能与你的选择一样根据经济学家的实验,投票结果是,只有少数人情愿“花钱消灾”选择甲。相反,大部分人愿意和命运抗一抗,选择乙。

24“反射效应”:理性人的又一个挑战

当一个人在面对两种都损失的抉择时,会激起他的冒险精神。在确定的坏处(损失)和“赌一把”之间,做一个抉择,多数人会选择“赌一把”,这叫“反射效应”。

面对两种损害,你是会选择躲避呢,还是勇往直前呢?

25

现在,你还认为自己足够理性吗?

再来看看你是不是一个完全自利的人?

26

“最后通牒”游戏甲有100元钱,但必须与乙共同分配,分配额的决定权在甲,若乙不接受甲的分配方案,这100元钱就会自动消失,谁也不能得到任何好处。问题:如果你是甲,你将怎么分配?为什么?如果你是乙,会答应甲的“抠门”的分配方案吗?

27实验结果令大跌眼镜:

甲常常会与乙对半分享这100元钱。乙会拒绝甲提出的“抠门”方案。

现实的博弈表明人并没有遵循“最大化”的人性假设,而是倾向于“合作”和“互惠”!人是有追求公平与正义的意愿!

28对“理性”的深化感受我们的晚餐不是来自屠夫、酿酒的商人或面包师傅的仁慈之心,而是因为他们对自己的利益特别关注。。—亚当-斯密理性是人在作决策的时候,在他所能选择的范围内作出他认为最好的选择。——林毅夫需要注意的是:理性或自私并不等同于“损人利己”;很多时候,“利他”是为了更好地“利己”。博弈定义四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions)

博弈的次序(Order)

博弈方的得益(Payoffs)博弈论方法的核心思想研究决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题.每个“游戏”参与者希望极大化自己的利益,为此目的,他们必须考虑并预测游戏的对手可能怎么做,从而选定对自己有利的决策。即:以对方的行动做为自己决策的依据。博弈论的产生和发展将博弈的思想明确地应用于经济领域,始于古诺(Cournot,1838)、伯特兰德(伯川德)(Bertrand,1883)和艾奇沃斯(Edgeworth,1925)等人关于两寡头的产量和价格垄断、产品交易行为的研究。近半个多世纪以来,博弈论引起了众多经济学家的极大兴趣,使得博弈论在经济学中的应用模型越来越多。大约从20世纪80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。博弈论的产生和发展开始于冯.诺依曼(VonNeumann)与摩根斯坦(Morgenstern)在1944年合作的《博弈论与经济行为》(TheTheoryofGamesandEconomicBehavior),标志着博弈理论的初步形成;Nash(1950,1951)两篇关于非合作博弈的重要文章,在非常一般的意义下,定义了非合作博弈及其均衡解,并证明了均衡解的存在,基本上奠定了现代非合作博弈论的基石。Nash,J.,1950,“EquilibriumPointsinn-PersonGames”,ProceedingsoftheNationalAcademyofSciences36:48-49.值得尊敬的人——1994年获奖者因对博弈论研究作出杰出贡献而获诺贝尔经济学奖的经济学家:●纳什(Nash):Nash-Equilibrium约翰·纳什,1928年生于美国1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。1994年获奖者泽尔藤(Selten):Subgame-PerfectNashEquilibrium,1930年生于德国1994年获奖者海萨尼(Harsanyi):Bayes-NashEquilibrium,1920年生于美国1996年获奖者莫里斯

1996年获奖詹姆斯·莫里斯

1936年生于英国在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论1996年获奖者威廉·维克瑞,1914-1996,生于美国,1996年获奖在信息经济学、激励理论、博弈论、拍卖理论等方面都做出了重大贡献。2001年获奖者迈克尔·斯宾斯(Spence)2001年获奖斯宾斯(A.MichaelSpence)生于1943年,美国加州斯坦福大学教授为不对称信息市场的一般理论奠定了基石。他们的理论迅速得到了应用,从传统的农业市场到现代的金融市场。他们的贡献来自于现代信息经济学的核心部分......2001年获奖者阿克洛夫(GeorgeA.Akerlof)生于1940年,美国加州大学伯克莱分校教授2001年获奖者斯蒂格利兹(JosephE.Stiglitz)生于1943年,美国纽约哥伦比亚大学教授2005年获奖者罗伯特·奥曼(RobertJ.Aumann)1930年6月出生于德国的法兰克福,拥有以色列和美国双重国籍。通过博弈论分析,促进了人们对冲突和合作的理解2005年获奖者托马斯·谢林(ThomasC.Schelling)1921年出生于美国加利福尼亚州的奥克兰市。2007年获奖者赫维奇1917年出生于俄罗斯莫斯科,后加入美国国籍,目前为美国明尼苏达大学经济学荣誉教授创立和发展了“机制设计理论”。这一理论有助于经济学家、各国政府和企业识别在哪些情况下市场机制有效,哪些情况下市场机制无效。此外,借助“机制设计理论”,人们还可以确定最佳和最有效的资源分配方式。2007年获奖者马斯金1950年出生于美国纽约,现任美国普林斯顿进修学院教授2012年获奖者劳埃德·沙普利(LloydS.Shapley)1923年生于美国马萨诸塞州剑桥市,1953年在美国普林斯顿大学获得博士学位,现为美国加利福尼亚大学荣誉教授。沙普利采用了所谓的合作博弈理论并比较了不同的匹配方法。2012年获奖者阿尔文·埃利奥特·罗思(AlvinEliotRoth,1951年12月19日-)是美国经济学家,目前在哈佛商学院担任乔治·冈德经济与工商管理学教授。罗思在博弈论、市场设计和实验经济学领域做出显著贡献。在2012年,他与劳埃德·沙普利共同获得了诺贝尔经济学奖。2023/9/1547学习博弈与决策的目的学习一种谋略技巧,提高人生成功的可能性;学习一种思维方式,加深对社会现象的认识程度;学习一种交流语言,扩大交流圈子;学习一种分析方法,提高知识水平。2023/9/1548博弈故事示例为什么要1美元而不要10美元?有一个乞丐小孩,面对他人施舍,他只要1美元,而不会要10美元。由此因“傻”而出名,结果不断有人闻讯前来试验,每次都发现小孩真的很“傻”。2023/9/1549别人的红包更诱人地主在年终给长工张三和李四每人一个红包,他们都知道自己红包里有1000元,但是不知道对方红包里有多少钱。地主说:“每个人的红包里可能有1000元,也可能有3000元。如果你们都愿意和对方换的话,那么我来做公证人,收取每人公证费100元。你们愿不愿和对方交换?”张三和李四异口同声地说:“愿意。”地主又问:“真的?”张三和李四又异口同声地说:“真的!”博弈故事示例1.2几个经典博弈模型1.2.1囚徒的困境1.2.2赌胜博弈1.2.3产量决策的古诺模型1.2.1囚徒的困境囚徒的困境是Tucker于1950年提出的;该博弈是博弈论最经典、著名的博弈;该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷。一、基本模型

案例1-囚徒困境-纳什均衡

-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵赖坦白抵赖-8大于-100大于-1(坦白,坦白)是纳什均衡二、双寡头削价竞争100,10020,105150,2070,70高价低价高价低价寡头2寡头1双寡头的得益矩阵政府组织协调的必要性和重要性寡头1:低价(70)寡头2:低价(70)内容拓展同样的情形发生在:公共产品的供给美苏军备竞赛中小学生减负皇帝的新装之破解版焦点博弈(wecannottaketheexam,becausewehadaflatfire.)……第一章概述-人生处处皆博弈-囚徒困境囚徒困境的性质:个人理性大于集体理性;个人的“最优策略”使整个“系统”处于不利的状态。思考:为什么会造成囚徒困境是否由于“通讯”问题造成了囚徒困境?“要害”是否在于“利己主义”即“个人理性”?囚徒困境的结果是否就一定不利?第一章概述-人生处处皆博弈-囚徒困境人类自私的天性,使他们陷入“囚徒困境”,难以自拔。

解决囚徒困境问题的“出路”“解决个人理性和集体理性之间冲突的办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性”;“一种制度安排,要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立”。囚徒困境的效果在不同情况下对社会而言可能是“负面”的,也可能是“正面”的。1.2.2赌胜博弈赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示赌胜博弈的特点是一方得等于另一方失,不可能双赢,属于“零和博弈”一、齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齐威王得益矩阵取胜关键:不让对方猜到自己策略,尽可能猜出对方策略二、猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面三、石头、剪子、布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石头剪子布博弈方2石头剪子布博弈方11.2.3产量决策的古诺模型古诺模型是寡头产量竞争,是市场经济中最常见的问题之一古诺1838年提出,直到现在还是经常使用古诺模型有很多扩展古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值一、三厂商离散产量{0P4455376281612856520253056420202455525252543113333333734921213二、n个厂商连续产量博弈1.3博弈结构和博弈分类1.3.1博弈中的博弈方1.3.2博弈中的策略1.3.3博弈中的得益1.3.4博弈的过程1.3.5博弈的信息结构1.3.6博弈方的能力和理性1.3.7博弈的分类和博弈理论的结构1.3.1博弈中的博弈方博弈方:独立决策、独立承担博弈结果的个人或组织博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈一、单人博弈——只有一个博弈方的博弈例一:单人迷宫入口AB出口(奖金M)A,1B,1右左右左M00扩展形性善还是性恶;冲动是魔鬼例二:运输路线-7000-16000-10000-10000好天气(75%)坏天气(25%)自然商人水路陆路运输路线得益矩阵01-7000-10000-16000-10000运输路线扩展形好天气(75%)坏天气(25%)单人博弈实质个体最优化问题二、两人博弈两人博弈即有两个博弈方的博弈两人博弈最常见,研究最多,是最基本和有用的博弈类型囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致三、多人博弈三个博弈方之间的博弈可能存在“破坏者”:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。申办奥运会是典型例子。多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法1.3.2博弈中的策略策略:博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同有限博弈:每个博弈方的策略数都是有限的无限博弈:至少有某些博弈方的策略有无限多个1.3.3博弈中的得益得益:各博弈方从博弈中所获得的利益得益对应博弈的结果,也就是各博弈方策略的组合得益是各博弈方追求的根本目标及行为和判断的主要依据根据得益的博弈分类:零和博弈、常和博弈、变和博弈零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同

—猜硬币,田忌赛马,石头-剪刀-布常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系

—分配固定数额的奖金、利润,遗产官司变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。

—囚徒困境、产量博弈、制式问题等1.3.4博弈的过程博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。博弈过程对博弈结果也有重要影响。根据博弈的过程,博弈可分为静态博弈、动态博弈、重复博弈。静态博弈:所有博弈方同时或可看作同时选择策略的博弈

—田忌赛马、猜硬币、古诺模型动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动

—弈棋、市场进入、领导——追随型市场结构重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效策略博弈结果的新可能

—长期客户、长期合同、信誉问题有限次重复博弈无限次重复博弈1.3.5博弈的信息结构完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈”完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈1.3.6博弈方的能力和理性完全理性和有限理性完全理性:有完美的分析判断能力和不会犯选择行为的错误有限理性:博弈方的判断选择能力有缺陷个体理性和集体理性个体理性:一个体利益最大为目标集体理性:追求集体利益最大化合作博弈:允许存在有约束力协议的博弈非合作博弈:不允许存在有约束力协议的博弈1.3.7博弈的分类和博弈理论的结构非合作博弈和合作博弈非合作博弈范围内:完全理性博弈和有限理性博弈(进化博弈)静态博弈,动态博弈,重复博弈完全信息静态博弈,不完全信息静态博弈,完全且完美信息动态博弈,完全但不完美信息动态博弈,不完全信息动态博弈零和博弈和非零和博弈,单人博弈和多人博弈分类总结博弈的划分:

行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精练纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精练贝叶斯纳什均衡泽尔腾(1965)Kreps和Wilson(1982)Fudenberg和Tirole(1991)从参与者人数分类

从合作关系分类从行动次序分类

从信息结构分类从支付角度分类2023/9/1582案例拓展-选美博弈实验假如你和很多人一起参加一项游戏:要求每个人独立地选择1到100之间的任意一个整数,选择了与大家选择的数的平均数的一半最接近的那个人将获得一笔丰厚的奖金。面对奖金的诱惑,聪明的你会选择哪个数?83游戏:从猜数中看类型

请15位同学,在0~99这100个整数中,选择一个数字。获胜的条件是你选择的数字满足:最接近所有回答数字的平均值的2/3。请问你选择的数字是什么?84猜数游戏的博弈分析分析一下过程

我们来分析一下这个游戏里的每个人。如果每个人都是真的随机选择的话,大家平均值应该在50左右。50的2/3应该是33.3。

85进一步不过多想一步,如果你写了33.3,难道其他的人不会想得和你一样,也写33.3吗?如果这样,你应该写22.2。如果继续想下去?大家的平均值应该越来越小:

最后,把问题想得非常复杂的人的答案是0。86各类型参与者分析一(莽汉)先说选超过66.67的人。解释写这个数字的原因是因为没听清楚题。先别就这样放过这个现象。在现实社会里面,没听清楚规则的人不是比比皆是吗?比方说,做产品的人认为质优价廉用户就会买,而实际上,花高价买差产品的人大有人在,我们不能指望所有的用户都和和业内人士有一样的判别力,一样的了解规则。

87各类型参与者分析再说选0的。或许这个结果很多人想都想不到,但几乎每次游戏都有选零的,而且越理性的群体,选零的比例越高。比如微软研究院30个人里面高达3个人选零。选零的人,沉浸于自己对世界了解的快感中,却知之者甚少。很可惜,在每次游戏里面,比一般人想一步的人就不多,想两步的人更少,经过重重递归迭代到达0的最终境界的人少之又少,我们只好轻叹一声,说,你是天才,但是你赢不了游戏。88各类型参与者分析(天才)天才的悲哀就在于,他搞懂了规则,却没有搞懂人。他自己想明白了,就想当然的以为别人也会想明白。他不但错误地忽略了只想到33的人的存在,更忽略了没有思考的,或者存心不按规则玩的人的存在。毕竟,这个世界不是一个只有天才的世界。

89各类型参与者分析(凡人)然后我们来说选33.3的。他们是正常的,平凡的人。就像数以百万计的洗发水的使用者或者报纸的阅读者一样,再正常和普通不过。在明白无误的规则面前,按照规则办事,用思考指导行动,却不会想得更多。90各类型参与者分析33.3的人是社会的大多数,在他们前面,有引领世界的0和推动世界的22;在他的后面,有大量的选择随机数的更平凡的人。是33们,奠定了这个社会的基调。

91各类型参与者分析(赢家)再说赢得游戏的22。他们也遵循规则,但是比规则前进了一步,不多不少,刚刚好一步。他们提出的方案让大多数人(33)感觉的有道理,却不像天才(0)提出的解决方案那么晦涩难懂。

92各类型参与者分析(捣乱人)比如说选50的。他在公布答案之前就解释说,“我知道这个数字肯定会非常小,趋近于0,而我就是想说一个大一点的数字,把平均值拉大,看看是会不会左右游戏的结果”。这叫做“搅局的”或者说“损人不利己”的。现实社会里面有吗?大有人在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论