管理经济学10-博弈论.讲述.ppt

上传人：1*** IP属地：浙江上传时间：2020-04-21 格式：PPT 页数：52 大小：331.02KB 积分：20 举报 版权申诉

免费预览已结束，剩余47页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博奕论和对策行为讲 10 博弈论和对策行为概论博奕论 theGameTheory 也就是运筹学中的对策论对策思想最早产生于我国古代早在两千多年的春秋时期孙武在孙子兵法中论述的军事思想和治国策略就蕴育了丰富和深刻的对策论思想孙武的后代孙膑为田忌谋划巧胜齐王这个著名的田忌赛马就是典型的对策思想的成功运用博弈论和对策行为概论对策思想明确地应用于经济领域始于Cournot 1838 Bertrand 1883 Edgeworth 1925 等人关于寡头竞争产量与价格垄断产品交易行为的研究然而作为一门学科的创立则是以美国数学家冯诺依曼 JohnVonNeumann 和经济学家奥斯卡摩根斯坦 OskarMorgenstern 合著的博奕论与经济行为 TheGameTheoryandEconomicBehavior 1944 一书出版为标志他们奠定和形成了这门学科的理论与方法论基础博弈论和对策行为概论博奕论是一门内容广泛且复杂的学科不仅是经济学政治学军事外交国际关系公共选择还有犯罪学等都涉及到博奕论实际上很多人把博奕论看成数学的一个分支博奕论的一个重要代表人物纳什 Nash 曾获1994年诺贝尔经济学奖该年度的诺贝尔经济学奖授与了三位博奕论专家在1951年的一篇奠基性的文章就是发表在数学杂志上而非在经济学杂志上但是本讲只是介绍博奕论的最基本的内容且限于博奕论在经济学中的应用博弈论和对策行为基本概念本书讨论博奕论模型的最基本表述方式策略型表述它主要用于表现静态对策这里介绍策略型表述中的基本概念明确有关术语的准确含义博弈论和对策行为基本概念在策略型博奕中一个对策有以下几种基本要素一局中人 players 即博奕的参与者他们是博奕的决策主体行为根据自己的利益要求决定自己的记局中人为i 局中人集合为 1 2 I 即共有I个局中人我们将某个局中人以外的其它局中人称为 i的对手记为 i 博弈论和对策行为基本概念在策略型博奕中一个对策有以下几种基本要素一局中人即指每个局中人在对策中可以选择采用的行动方案但这个方案必须是一个完整的行动而不是行动的某一步每个局中人均有可供选择的多种策略二策略 strategies 三支付或收益 payoffs 二策略一局中人在策略型博奕中一个对策有以下几种基本要素博弈论和对策行为基本概念是指一局博奕的得失或者说是局中人从各种策略组合中获得的效用它是策略组合的函数如果局中人得失的总和为零则称这种对策为零和对策否则称为非零和博奕例1 囚徒困境 prisoner sdilemma 博弈论和对策行为策略型博弈的实例和解囚徒困境例1 囚徒困境 prisoner sdilemma 博弈论和对策行为策略型博弈的实例和解囚徒困境这个例子可以看作是非合作博奕现象的一个抽象概括它讲的是两个嫌疑犯被隔离审讯他们面临的处境是如果两人都坦白各判刑8年如果两人都抵赖各判刑1年或许证据不足如果一人坦白另一人抵赖则坦白的放出去不坦白的判刑10年坦白从宽抗拒从严这里两个囚徒就是两个局中人每个局中人都有两个策略可供选择坦白或抵赖表中每一格的一对数字分别表示局中人不同策略组合的收益第一个数字是囚徒A的收益第二个数字是囚徒B的收益这种有限对策局中人是有限个每个局中人的策略数也是有限的往往用矩阵形式表示例1 囚徒困境 prisoner sdilemma 博弈论和对策行为策略型博弈的实例和解囚徒困境在对博奕局势进行描述后博奕论分析就是要求出局中人进行策略选择的理性结局或者说找出博奕问题的解在非合作博奕中有两种解的技术一种是纳什均衡一种是优超解定义1 给定其它局中人的策略s 局中人i的最优反应记为s 是指能给他带来最大收益的策略即博弈论和对策行为纳什均衡当每个局中人都选择了自己的最优反应策略并且这些最优反应形成一个策略组合便形成了纳什均衡定义2 一个策略组合s s1 s2 sn 被称为纳什均衡是指对于所有的i 博弈论和对策行为纳什均衡纳什均衡的思想就是博奕的理性结局是这样一种策略组合其中每个局中人选择的策略都已是对其它局中人所选策略的最优反应所以谁也没有积极性去选择其它策略因为每一个局中人均不能因为单方面改变自己的策略而获利于是谁也没有兴趣主动打破这种均衡在囚徒困境中考虑囚徒A对他人的最优反应如果给定囚徒B的策略是坦白那么对囚徒A来说采取坦白策略得到的收益是 8 采取抵赖策略得到的收益是 10 显然坦白为好同理如果给定囚徒B的策略是抵赖对囚徒A来说坦白也比抵赖好因此囚徒A对囚徒B的最优反应是坦白对囚徒B作同样分析如果囚徒A的策略是坦白则他采取坦白策略为好如果囚徒A的策略是抵赖他还是采取坦白策略好所以囚徒B对囚徒A的最优反应也是坦白两个最优反应形成了一个策略组合坦白坦白这就是一个纳什均衡博弈论和对策行为纳什均衡两个寡头企业选择产量的博奕就是一个囚徒困境问题回想一下古诺均衡的含义古诺均衡是指存在这样一对产量组合 q1 q2 使得假定企业2的产量为q2 时 q1 是企业1的最优产量假定企业1的产量为q1 时 q2 是企业2的最优产量按照纳什均衡的定义古诺均衡 q1 q2 也就是博奕论中的纳什均衡纳什均衡只说明博奕的稳定性结局博弈论和对策行为囚徒困境在经济学上的应用让我们再回到囚徒困境本身纳什均衡坦白坦白表明两人共同的集体选择但是这个选择是否是理性的理性选择是指使收益最大化的选择如果两人都抵赖各判刑1年显然比坦白各判刑8年好所以纳什均衡坦白坦白并不是一个集体理性选择但它却是个人理性选择的一个组合囚徒困境正是反映了一个深刻的问题这就是个人理性与集体理性的矛盾博弈论和对策行为囚徒困境在经济学上的应用博弈论和对策行为囚徒困境在经济学上的应用一个非集体理性选择如纳什均衡坦白坦白用经济学术语说其中存在帕累托改进的机会所谓帕累托改进就是说它在不使另一部分人的境况变得更坏的前提下至少能改进一部分人的境况如果不存在帕累托改进的情况便达到帕累托最优这里如果两人都选择抵赖两人的境况都有所改进所以坦白坦白不是帕累托最优集体的理性选择应该是大家都抵赖但是这个帕累托改进办不到为什么因为我们已经验证坦白坦白这个策略组合正是一个纳什均衡在一个纳什均衡中不会有人主动去打破这种格局的博弈论和对策行为囚徒困境在经济学上的应用那么两个囚徒事先订好攻守同盟两人都采取抵赖的策略不是可以改善两人的境遇吗但问题是这个攻守同盟有没有意义没有原因在于抵赖抵赖这个策略组合不是一个纳什均衡没有人有积极性去遵守这个协议一般地假设博奕中的每个局中人事先达成一项协议规定了各自的行为规则如果局中人会自觉遵守这个协议等于说这个协议构成了一个纳什均衡给定别人遵守协议的情况下自己的最好选择就是也遵守协议相反一个协议不构成纳什均衡时它就不可能自动实施因为至少有一个局中人会违背这个协议所以不满足纳什均衡要求的协议是没有意义的博弈论和对策行为囚徒困境在经济学上的应用以上的分析告诉我们用经济学的观点来看只有由满足个人理性选择的策略组成的集合才是均衡的或者说只有纳什均衡才是稳定的博弈论和对策行为囚徒困境在经济学上的应用看两个寡头合谋与价格卡特尔的情形它也存在个人理性与集体理性的冲突在两个寡头合谋条件下的产量与价格决定是基于两个寡头利润总和的最大化目标而不是每个企业自己的利润最大化因此这种最大化目标下的产量分配符合两家企业的共同利益却不是使每家企业自己的利润最大化的产量换言之并不是每家企业自己的最优反应所以卡特尔产量分配不是一个纳什均衡正因为此卡特尔下一定会有违约冲动卡特尔具有不稳定性博弈论和对策行为囚徒困境在经济学上的应用在军备竞赛中人们年复一年的谈判试图签订一个限制军备的条约但是这种条约也存在个人理性与集体理性的冲突签订条约对世界和平有利但履行条约未必是各国行动的最优反应试想如果我减少军备开支而你增加军费支出我不是受到威胁了吗所以这种条约不构成纳什均衡各国都有违约的冲动纳什均衡是各国都大量增加军费预算结果军备竞赛就只好继续下去冷战时期前苏联和美国之间的军备竞赛就是典型一例两国都在导弹上花了几万亿美元如果把资源用于民品生产两国的社会福利就会变得更好博弈论和对策行为囚徒困境在经济学上的应用企业竞争而产生的广告资源浪费也是典型例子如两家寡头竞争经理们可选择策略是多做广告和少做广告各种策略组合的盈利矩阵如下表企业1最优反应是多做广告企业2最优反应也是多做广告因此多做广告多做广告是一个纳什均衡这个纳什均衡的结果是大量资源消耗在广告上博弈论和对策行为囚徒困境在经济学上的应用纳什均衡概念的局限性在于在博奕中有可能纳什均衡不是唯一的例两家寡头价格竞争经理可选择的策略是价格不变或涨价收益矩阵如下所示结果发现纳什均衡有两个价格不变价格不变涨价涨价博奕中的实际结果取决于首先采取什么行动如果先前的情况是价格不变那么这一博奕的预期结果就是价格不变另外对有的博奕来说也可能不存在纳什均衡博弈论和对策行为策略型博弈的实例和解性别战例2 性别战 battleofthesexes 一男一女恋爱有些业余活动要安排或者去看足球比赛或者去看芭蕾舞演出男的偏好足球女的则更喜欢芭蕾舞但他们都宁愿在一起不愿分开下表给出收益矩阵博弈论和对策行为策略型博弈的实例和解性别战例2 性别战 battleofthesexes 这个博奕中有两个纳什均衡足球足球和芭蕾芭蕾就是说一方去足球场另一方也会去足球场类似地一方去看芭蕾另一方也会去看芭蕾在实际生活中也许是这一次看足球下一次看芭蕾如此循环形成一种默契这在实际生活中是指两种互补的活动应该配合尽管配合的方式可能有很多种比如两家工厂生产的产品可能是互补的一家为另一家提供零配件这里有一个标准的选择问题由于种种原因很可能在产品标准的选择上生产成品的厂家与生产零配件的厂家之间有冲突这就需要相互妥协但妥协的结果有两种可能或者是生产零配件的厂家适应生产成品的厂家或者是生产成品的厂家适应于生产零配件的厂家博弈论和对策行为策略型博弈的实例和解性别战例2 性别战 battleofthesexes 博弈论和对策行为策略型博弈的实例和解性别战例2 性别战 battleofthesexes 性别战的例子中有两个纳什均衡那么究竟那一个纳什均衡会实际发生我们不知道这里还有一个先动优势 first moveradvantage 比如说若男的先买票两人就会出现在足球场若女的买票两人就会出现在芭蕾舞剧院博弈论和对策行为策略型博弈的实例和解性别战例2 性别战 battleofthesexes 在囚徒博奕中我们隐含地假定双方下奕者是同时实施其策略的性别战中的先动优势表明了另一种类型的博奕称为顺序性博奕 sequentialgame 在顺序性博奕中有一名下奕者先博奕行动然后另一名下奕者要做出反应先下奕者有先动优势性别战的例子也有很多应用企业进入新的市场就是一种顺序性博奕新企业首先决定是否进入然后现有企业决定是不管它还是阻止它的进入博弈论和对策行为性别战在经济学上的应用设想有一家垄断企业已在市场上称为在位者另一家新企业虎视眈眈想进入称为进入者在位者想保持自己的垄断地位所以就要阻挠进入者的进入在这个博奕中进入者有两种策略可以选择进入还是不进入在位者也有两种策略默许还是斗争各种策略组合的收益矩阵如下表例市场进入阻挠 entrydeterrance 博弈论和对策行为性别战在经济学上的应用博奕也有两个纳什均衡即进入默许不进入斗争相应的收益为 40 50 0 300 就是说如果新企业首先进入在位者的最优反应是默许类似地如果在位者默许新企业的最优策略是进入尽管在新企业不进入时默许和斗争对在位者是一样的效果但在在位者选择斗争时新企业的最优选择是不进入所以不进入斗争是一个纳什均衡而不进入默许不是纳什均衡博弈论和对策行为性别战在经济学上的应用一家企业率先推出一种新产品其它企业跟进也是一种顺序性博奕把新产品率先推向市场的先动企业的成功可能性要大一些跟进者面临的困难是消费者对先动企业的品牌有了一定的忠诚度并在头脑中有了先动企业的形象而且如果消费者在学习使用先动企业的新产品时花费了学习时间往往不愿意再花时间或改动设备去使用另一家企业的类似产品文字处理和数据库软件就是很好的例子对一种程序或一种输入方法已很熟练者一般不愿意更换除非后者有很多优点博弈论和对策行为性别战在经济学上的应用下表是两个竞争企业是否推出新产品的利益矩阵这个博奕中有两个纳什均衡一家推出新产品一家无新产品推出新产品的企业赢利为10 无新产品的企业赢利为 5 究竟是企业1还是企业2赢利要看是哪一家企业首先行动假定企业1具有较高的研究和开发优势率先在市场上推出新产品那么企业2的最佳反应就是不跟进因为跟进的损失是7 不跟进的损失只有5 博弈论和对策行为优超解如果一个局中人在任何情况下从某种策略中得到的收益均大于从其它策略中得到的收益那么对他而言这个策略称为优超策略或支配性策略 dominantstrategy 其它的策略称为被优超策略或被支配策略 dominatedstrategy 博弈论和对策行为优超解在囚徒博奕中对囚徒A来说抵赖被坦白优超对囚徒B也同样所以坦白坦白就是一个优超策略均衡在这个例子中优超策略均衡也就是纳什均衡当有一名局中人具有优超策略时博奕总会有一个纳什均衡因为当该局中人采取优超策略时另一局中人就会据此做出自己的最优反应但纳什均衡不一定是优超策略均衡博弈论和对策行为优超解在市场进入阻挠博奕中在位者有一个优超解默许进入者对默许的最优反应是进入所以进入默许是一个纳什均衡大多数的博奕局势中利用优超概念只能够对博奕问题进行简化得不到对策解博弈论和对策行为优超解例2 考虑由下表给出的策略性博奕博弈论和对策行为优超解对于局中人A来说策略x被y优超了所以可以删去x使问题简化为但是对这个简化了的博奕我们仍然无法找到对策解有些博奕问题既没有优超均衡解也没有纳什均衡解博弈论和对策行为最大最小策略 Max minstrategy 冯诺依曼和摩根斯坦认为策略的选择与决策者的性格有关某些决策者可能认为冒失行动容易造成重大失误最好还是从最不利的情况出发向最好的方向努力力求做到有备无患这样的决策者属于风险厌恶型的他首先想到的是各种不利因素和风险所以他先要考虑各种最坏的结果然后从最坏结果中选出一个最好结果按这种原则选取的策略可以称为最大最小策略博弈论和对策行为混合策略和重复性博弈策略有两种概念前面我们所说的策略都是纯策略另一种策略概念为在纯策略基础上形成的混合策略 mixedstrategy 局中人I的混合策略 i是他的纯策略空间Si上的一种概率分布表示局中人实际对策时根据这种概率分布在纯策略中随机选择加以实施博弈论和对策行为混合策略和重复性博弈为了叙述问题方便下面我们主要讨论二人零和博奕零和对策是策略型对策的最基本模式其中局中人得失的总和为零或为一常数二人零和博奕是指零和博奕中有且只有两个局中人一人的所得正是另一人的所失二人零和对策在博奕论的早期发展中曾占有过重要地位二人零和博奕的支付矩阵可以记为如果支付矩阵的数值 ij为正时表示局中A的赢得值若支付矩阵的数值 ij为负时表示局中A的损失或输掉的值博弈论和对策行为混合策略和重复性博弈例二人零和博奕的收益矩阵如下表局中人A的收益值均为正而局中人B的收益值均为负即表示局中人B的损失值博弈论和对策行为混合策略和重复性博弈如果每个局中人完全清楚地知道对手将会采取什么样的策略会是什么情况呢 A如果知道B会选择b1 则会选择a2 当A连续使用策略a2时 B必定会察觉便会选择b2 当B连续使用b2时 A也会察觉从而改为选择a1 B如果知道A选择了a1 则又会选择b1 如此反复以至无穷所以双方如果使用纯策略进行博奕时就会出现不稳定状态不会有最终的均衡结果这说明双方都不能连续不变地使用某种纯策略都必须考虑如何随机地使用自己的策略使对方捉摸不到自己使用何种策略这就需要混合策略的对策博弈论和对策行为混合策略和重复性博弈假设A采取混合策略即以概率x随机的使用纯策略a1 以概率 1 x 使用纯策略a2 去对付B使用纯策略b1 A的收益便是x的函数 U x 3 1 x 3 2x若A使用上述混合策略去对付B使用纯策略b时 A的收益便是U 4x 2 1 x 2 2x 博弈论和对策行为混合策略和重复性博弈用图表示时 U 和U 的表达式是两条直线 x的取值范围为 0 1 见下图博弈论和对策行为混合策略和重复性博弈 U 的值随着x值的增长而减少 U 的值随着x值的增大而增大两条直线的交点m对应着xm 局中人A按最大最小原则选择他的策略即他的选择按Max min 3 2x 2 2x 来进行的 min 3 2x 2 2x 即折线pmq m点是折线pmq的最高点所以m点是混合策略意义下的最大最小值当U U 时可解得xm 1 4 U U 5 2 所以局中人A的最优混合策略为 A 博弈论和对策行为混合策略和重复性博弈可以用同样的方法分析局中人B的最优混合策略若B以概率y随机的使用纯策略b1 以概率 1 y 使用纯策略b2 去对付A使用纯策略a1 B的损失值为 Ub y 4 1 y 4 3y若B使用上述混合策略去对付A使用纯策略a时 B的损失值便是 Ub 3y 2 1 y 2 y 博弈论和对策行为混合策略和重复性博弈用图表示时 Ub和Ub 的表达式是两条直线 y的取值范围为 0 1 见下图博弈论和对策行为混合策略和重复性博弈注

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

管理经济学10-博弈论.讲述.ppt

文档简介

温馨提示

最新文档

评论

管理经济学10-博弈论.讲述.ppt

文档简介

温馨提示

最新文档

评论

相关文档