博弈论高级管理学讲义_第1页
博弈论高级管理学讲义_第2页
博弈论高级管理学讲义_第3页
博弈论高级管理学讲义_第4页
博弈论高级管理学讲义_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《高级管理学》

第八讲博弈论初步12/28/20221SchoolofEconomics&Management,TongjiUniversity1囚徒困境和纳什均衡

囚徒困境(prisoners’dilemma)博弈论的著名的例子,纳什均衡是博弈论的重要概念。囚徒困境说的是,两个嫌疑犯作案后被捕,起诉机构没有足够的证据证明他们抢劫了银行。所以,若犯人们不坦白,起诉者只能就非法持有武器罪起诉,判犯人有期徒刑2年。起诉者于是向犯人采取攻心战,说可以“坦白从宽、抗拒从严”。如果一人坦白,则坦白者从宽处理,判徒刑1年,抗拒者从严处理,判徒刑12年。如果两人都坦白,每人依法判徒刑10年。两个囚徒是坦白还是不坦白呢?12/28/20222SchoolofEconomics&Management,TongjiUniversity1.1囚徒困境12/28/20223SchoolofEconomics&Management,TongjiUniversity1.2博弈均衡博弈论假设博弈的参加者都是理性的,即在对手战略给定的条件下,每个参加者都会选择适当的战略来实现自己报酬的最大化(或损失最小化)。问题是博弈的一方不能控制另一方的决策。当参加者甲以最优战略对付乙的某个战略时,乙会发现原先的战略不是对付甲的实际战略的最佳战略,因而会改变其战略。要是乙改变了战略,参加者甲也要进行相应的改变。这样的改变行为会否停止?这里借用经济学常用的均衡概念,我们把博弈的稳定结果称为均衡,博弈的均衡也称为博弈的解。均衡是指所有的参加者都不想改变战略的状态。

12/28/20224SchoolofEconomics&Management,TongjiUniversity1.3占优均衡在一些特殊的博弈中,一个参加者的最优战略可能并不依赖于其他参加者的战略选择,也就是说,不论其他参加者选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(dominantstrategy)。在上述的囚徒困境博弈中,每个囚徒可选择的战略有两种:坦白与不坦白。显然,不论另外一个囚犯选择什么战略,每个囚犯的最优战略都是“坦白”。例如,如果乙选择坦白,囚犯甲选择坦白时的报酬为-10,选择不坦白的报酬为-12,因而坦白比不坦白好;如果乙选择不坦白,甲坦白的报酬为-1,不坦白的报酬为-2,所以坦白还是比不坦白好。也就是说,“坦白”是囚犯甲的占优战略。由于对称性,“坦白”也是囚犯乙的占优战略。于是,(坦白,坦白)或(-10,-10)是囚徒困境博弈的占优均衡。

12/28/20225SchoolofEconomics&Management,TongjiUniversity个人理性与集体理性甲乙两人都寻求最好的结果,而得到的却是较糟的结果。这个例子说明,在多人决策的环境里,个人理性与集体理性经常是矛盾的,这种集体利益和个人利益的之间的冲突被称为“囚徒困境”。

12/28/20226SchoolofEconomics&Management,TongjiUniversity1.4纳什均衡纳什均衡是这样一种稳定状态,博弈的任何一方参加者都不会改变其战略,如果其他参加者都不改变战略的话。

依定义,任何占优战略均衡必定是纳什均衡,但纳什均衡却不一定是占优战略均衡,占优战略均衡是比较强的均衡概念。囚徒困境中的(坦白,坦白)就是纳什均衡。经济生活中的众多集体利益和个人利益的之间的冲突带来的非帕累托有效状态都是纳什均衡。12/28/20227SchoolofEconomics&Management,TongjiUniversity纳什均衡(严格的定义)12/28/20228SchoolofEconomics&Management,TongjiUniversity完全信息静态博弈的几个著名博弈智猪博弈(boxedpigs)猪圈里有两头猪,一头大猪,一头小猪,猪圈的一头有个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10单位的猪食进槽,但谁按按钮谁就要付2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。12/28/20229SchoolofEconomics&Management,TongjiUniversity标准型支付矩阵12/28/202210SchoolofEconomics&Management,TongjiUniversity性别战战(battleofthesexes)12/21/202211SchoolofEconomics&Management,TongjiUniversity市场进进入阻阻挠博博弈12/21/202212SchoolofEconomics&Management,TongjiUniversity2动态态博弈弈静态博博弈,,即博博弈各各方同同时行行动,,但是是经济济生活活中许许多情情形是是动态态博弈弈,也也就是是指博博弈参参加者者的行行动有有先后后顺序序,又又叫序序贯博博弈。。12/21/202213SchoolofEconomics&Management,TongjiUniversity2.1完完全信息息动态博博弈的分分类博弈总的的可以分分为完全全信息的的博弈((即博弈弈参加者者的收益益函数是是共同知知识的博博弈)和和不完全全信息博博弈(博博弈中的的一些参参加者不不知道其其它参加加者的收收益函数数)。完全信息息动态博博弈又分为完完全且完完美信息息(completeandperfectinformation)的动态态博弈和和完全但但不完美美信息博博弈两类类。前者者是指在在博弈进进行的每每一步当当中,要要选择行行动的参参加者都都知道这这一步之之前博弈弈进行的的整个过过程;后后者是指指在博弈弈的某些些阶段,,要选择择行动的的参加者者并不知知道在这这一步之之前博弈弈进行的的整个过过程12/21/202214SchoolofEconomics&Management,TongjiUniversity2.2子博弈完完美纳什什均衡((SPNE)一个子博博弈是全全部博弈弈的一部部分,当当全部博博弈进行行到任何何一个阶阶段,到到此为止止的进行行过程已已经称为为博弈参参加各方方的共同同知识,,而其后后尚未开开始进行行的部分分就是一一个子博博弈。如如果博弈弈参加者者的战略略在每一一子博弈弈中都构构成纳什什均衡,,我们称称此纳什什均衡是是子博弈弈完美纳纳什均衡衡(subgameperfectNashequilibrium)(Selten,1965)。。所有动态博弈弈的中心问题题是可信任性性,所以不可可置信的威胁胁被研究较多多,子博弈完完美纳什均衡衡(SPNE)是不含不可可置信的威胁胁的。子博弈弈完美纳什均均衡可以用逆逆向归纳法((backwards-induction)找出12/21/202215SchoolofEconomics&Management,TongjiUniversity几种著名的动动态博弈Stackelbeg模模型Hotelling模型型(地点模型型)12/21/202216SchoolofEconomics&Management,TongjiUniversity3重复博弈:特特殊的动态博博弈同一博弈重复复多次,称为为重复博弈((repeatedgame),,其中的的每一次博弈弈称为“阶段段博弈”(stagegame),事实上它它是动态博弈弈的一种特殊殊情况。它的的均衡状况可可能与一次性性博弈不同,,被研究最多多的重复博弈弈还是囚徒困困境博弈。12/21/202217SchoolofEconomics&Management,TongjiUniversity例子子:古古诺诺产产量量博博弈弈12/21/202218SchoolofEconomics&Management,TongjiUniversity作为为囚囚徒徒困困境境的的一一个个例例子子,,其其占占优优战战略略均均衡衡的的结结局局双双方方都都增增加加产产量量,,它它们们的的报报酬酬各各为为900。如如果果它它们们能能合合作作,,共共同同压压缩缩产产量量,,则则可可以以实实现现各各自自1000的报报酬酬。。它它们们都都想想合合作作,,但但是是又又怕怕被被欺欺骗骗,,于于是是就就此此陷陷入入““囚囚徒徒困困境境””。。关关键键是是在在一一次次性性博博弈弈中中,,被被欺欺骗骗之之后后就就无无法法报报复复了了,,当当然然也也无无法法建建立立公公司司的的声声誉誉。。重重复复博博弈弈下下的的情情形形就就会会发发生生变变化化。。因因为为博博弈弈的的其其它它参参加加者者过过去去行行动动的的历历史史是是可可以以观观测测得得到到的的,,一一个个参参加加者者可可以以使使自自己己在在某某个个阶阶段段博博弈弈的的战战略略选选择择依依赖赖于于其其它它参参加加者者过过去去的的行行动动历历史史。。这这样样企企业业就就可可以以报报复复和和建建立立合合作作的的声声誉誉,,合合作作发发生生的的原原因因在在于于公公司司的的长长远远利利益益。。12/21/202219SchoolofEconomics&Management,TongjiUniversity在重重复复博博弈弈里里,,参参加加者者每每个个阶阶段段都都得得到到一一定定的的报报酬酬,,长长期期博博弈弈就就要要把把所所有有的的各各期期报报酬酬加加总总起起来来进进行行比比较较。。这这里里引引进进一一个个指指标标::时时间间折折扣扣率率δ,,数数值值等等于于明明年年的的一一元元前前相相当当于于今今年年的的金金额额,,δδ也也称称为为贴贴现现因因子子。。例例如如,,明明年年的的利利润润为为,,折折算算到到现现在在就就是是δδ。。熟熟悉悉财财务务的的同同学学都都知知道道这这是是货货币币的的时时间间价价值值,,但但是是δδ不不是是贴贴现现率率r,,而而是是1-r,,这这里里不不多多解解释释。。还还有有一一点点不不一一样样,,贴贴现现率率r更更多多的的是是由由社社会会决决定定的的,,而而时间间折折扣扣率率δ更更多多的的是是博博弈弈参参加加者者的的主主观观判判断断。。假定定企企业业甲甲和和企企业业乙乙从从头头到到尾尾均均合合作作,,那那么么两两家家企企业业的的总总报报酬酬为为如果果一一开开始始就就不不合合作作,,那那么么每每个个公公司司的的总总报报酬酬为为12/21/202220SchoolofEconomics&Management,TongjiUniversity9、静夜四无无邻,荒居居旧业贫。。。12月-2212月-22Wednesday,December21,202210、雨中黄叶叶树,灯下下白头人。。。18:18:3318:18:3318:1812/21/20226:18:33PM11、以我独独沈久,,愧君相相见频。。。12月-2218:18:3318:18Dec-2221-Dec-2212、故人人江海海别,,几度度隔山山川。。。18:18:3318:18:3318:18Wednesday,December21,202213、乍见翻疑疑梦,相悲悲各问年。。。12月-2212月-2218:18:3418:18:34December21,202214、他乡生白白发,旧国国见青山。。。21十二二月20226:18:34下下午18:18:3412月-2215、比不不了得得就不不比,,得不不到的的就不不要。。。。。十二月月226:18下下午午12月月-2218:18December21,202216、行动出出成果,,工作出出财富。。。2022/12/2118:18:3418:18:3421December202217、做前,,能够环环视四周周;做时时,你只只能或者者最好沿沿着以脚脚为起点点的射线线向前。。。6:18:34下午午6:18下午午18:18:3412月-229、没没有有失失败败,,只只有有暂暂时时停停止止成成功功!!。。12月月-2212月月-22Wednesday,December21,202210、很多多事情情努力力了未未必有有结果果,但但是不不努力力却什什么改改变也也没有有。。。18:18:3418:18:3418:1812/21/20226:18:34PM11、成功功就是是日复复一日日那一一点点点小小小努力力的积积累。。。12月月-2218:18:3418:18Dec-2221-Dec-2212、世间成成事,不不求其绝绝对圆满满,留一一份不足足,可得得无限完完美。。。18:18:3418:18:3418:18Wednesday,December21,202213、不知香积积寺,数里里入云峰。。。12月-2212月-2218:18:3418:18:34December21,202214、意志坚强强的人能把把世界放在在手中像泥泥块一样任任意揉捏。。21十二二月20226:18:34下下午18:18:3412月-2215、楚塞塞三湘湘接,,荆门门九派派通。。。。。十二月月226:18下下午午12月月-2218:18December21,202216、少年年十五五二十十时,,步行行夺得得胡马马骑。。。2022/12/2118:18:3418:18:3421December202217、空山新雨后后,天气晚来来秋。。6:18:34下午6:18下下午18:18:341

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论