博弈论的几个经典模型ppt课件.ppt

上传人：闯*** IP属地：广东上传时间：2020-03-31 格式：PPT 页数：82 大小：2.66MB 积分：25 举报 版权申诉

已阅读5页，还剩77页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 第四章博弈论的几个经典模型 2 引言博弈论又被称为对策论 GameTheory 按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的RobertAumann教授的说法博弈论就是研究互动决策的理论所谓互动决策即各行动方即局中人 player 的决策是相互影响的每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中当然也需要把别人对于自己的考虑也要纳入考虑之中在如此迭代考虑情形进行决策选择最有利于自己的战略 strategy 3 博弈论的应用领域十分广泛在经济学政治科学国内的以及国际的军事战略问题进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具此外它还与会计学统计学数学基础社会心理学以及诸如认识论与伦理学等哲学分支有重要联系引言 4 按照Aumann所撰写的新帕尔格雷夫经济学大辞典博弈论辞条的看法标准的博弈论分析出发点是理性的而不是心理的或社会的角度不过近30年来结合心理学和行为科学实验经济学的研究成就而对博弈论进行一定改造的行为博弈论 behavoiralgametheory 也日益兴起引言 5 失火了你往哪个门跑这就是博弈论一天晚上你参加一个派对屋里有很多人你玩得很开心这时候屋里突然失火火势很大无法扑灭此时你想逃生你的面前有两个门左门和右门你必须在它们之间选择但问题是其他人也要争抢这两个门出逃如果你选择的门是很多人选择的那么你将因人多拥挤冲不出去而烧死相反如果你选择的是较少人选择的那么你将逃生这里我们不考虑道德因素你将如何选择 6 你的选择必须考虑其他人的选择而其他人的选择也考虑你的选择你的结果博弈论称之为支付不仅取决于你的行动选择博弈论称之为策略选择同时取决于他人的策略选择你和这群人构成一个博弈 game 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型被称之为少数者博弈或少数派博弈 MinorityGame 生活中博弈的案例很多你会见到很多例子只要涉及到人群的互动就有博弈引言 7 什么叫博弈博弈的英文为game 我们一般将它翻译成游戏而在西方 game的意义不同于汉语中的游戏在英语中 game即是人们遵循一定规则下的活动进行活动的人的目的是使自己赢奥林匹克运动会叫OlympicGames 在英文中 game有竞赛的意思进行game的人是很认真的不同于汉语中游戏的概念在汉语中游戏有儿戏的味道因此将关于game的理论即gametheory翻译成博弈论或者对策论是恰当的引言 8 博弈论的出现只有60多年的历史博弈论的开创者为诺意曼与摩根斯坦他们1944年出版了博弈论与经济行为博弈论天才纳什 JohnNash 的开创性论文 n人博弈的均衡点 1950 非合作博弈 1951 等等给出了纳什均衡的概念和均衡存在定理今天博弈论已发展成一个较完善的学科博弈论对于社会科学有着重要的意义它正成为社会科学研究范式中的一种核心工具以至于我们可称博弈论是社会科学的数学或者说是关于社会的数学引言 9 1994年经济学诺贝尔奖颁发给三位博弈论专家纳什塞尔屯 R Selten 海萨尼 JohnC Harsanyi 而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南 1995年获得诺贝尔奖的理性主义学派的领袖卢卡斯 Lukas 其理论与博弈论都有着较深的联系现在博弈论正渗透到各门社会科学更重要的是它正深刻地改变着人们的思维引言 10 汪贤裕肖玉明编著博弈论及其应用科学出版社 2008年2月潘天群著博弈生存第二版中央编译出版社 2004年10月王春永编著博弈论的诡计中国发展出版社 2007年1月参考书 11 博弈论研究的对象是理性的行动者或参与者如何选择策略或如何作出行动的决定理性的人是对现实的人的基本假定即假定参与者努力用自己的推理能力使自己的目标最大化理性的与道德的不是一回事理性的与道德的有时会发生冲突但是理性的人不一定是不道德的基本术语 12 博弈涉及哪些内容呢博弈涉及至少两个独立的博弈参与者 player 博弈涉及行动者存在着策略 strategy 选择的可能博弈论用策略空间来表示参与者可以选择的策略参与者在不同策略组合下会得到一定的支付 payoff 对于博弈参与者来说存在着一博弈结果博弈涉及均衡重要的均衡纳什均衡基本术语 13 根据参与者能否形成约束性的协议以便集体行动博弈可分为合作性博弈和非合作性博弈纳什等博弈论专家研究得更多的是非合作性博弈合作性博弈是指参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟其结果对联盟方均有利非合作性博弈是指参与者在行动选择时无法达成约束性的协议人们分工与交换的经济活动就是合作性的博弈而囚徒困境则是非合作性的博弈博弈的类型 14 博弈又可分静态博弈和动态博弈静态博弈指参与者同时采取行动或者尽管参与者行动的采取有先后顺序但后行动的人不知道先采取行动的人采取的是什么行动动态博弈指参与者的行动有先后顺序并且后采取行动的人可以知道先采取行动的人所采取的行动博弈的类型 15 从知识的拥有程度来看博弈分为完全信息博弈和不完全信息博弈信息是博弈论中重要的内容完全信息博弈参与者对所有参与者的策略空间及策略组合下的支付有完全的了解否则是不完全信息博弈严格地讲完全信息博弈是指参与者的策略空间及策略组合下的支付是博弈中所有参与者的公共知识的博弈不完全信息博弈参与者所做的是努力使自己的期望支付或期望效用最大化博弈的类型 16 例猪圈里有两只猪一只比较大一只比较小猪圈狭长猪食槽在一头猪食按钮在另一头按一下会有10个单位的猪食落进槽里由于按钮和食槽距离较远按按钮的体力耗费相当于2个单位的食物模型一智猪博弈完全信息静态博弈大猪和小猪分别该如何选择 17 选择等待是小猪的占优策略大猪的最佳选择取决于小猪的行动如果小猪去按大猪最好选择等待如果小猪不去按则最佳选择是大猪亲自去按也就是说在智猪博弈中大猪没有占优策略而小猪有占优策略它的最佳选择就是耐心等待大猪去按钮才能获得最佳结果小猪躺着大猪跑的现象是由于故事中的游戏规则所导致的规则的核心指标是每次落下的事物数量和踏板与投食口之间的距离模型一智猪博弈完全信息静态博弈 18 如果改变一下核心指标猪圈里还会出现同样的小猪躺着大猪跑的景象吗试试看改变方案一减量方案改变方案二增量方案改变方案三减量加移位方案投食仅原来的一半分量但同时将投食口移到踏板附近结果呢小猪和大猪都在拼命地抢着踩踏板等待者不得食而多劳者多得每次的收获刚好消费完对于游戏设计者这是一个最好的方案成本不高但收获最大模型一智猪博弈完全信息静态博弈 19 在博弈论中含有占优战略均衡的一个著名例子是由塔克给出的囚徒困境 prisoners dilemma 博弈模型该模型用一种特别的方式为我们讲述了一个警察与小偷的故事模型二囚徒困境非合作博弈 20 假设有两个小偷A和B联合犯事私入民宅被警察抓住警方将两人分别置于不同的两个房间内进行审讯对每一个犯罪嫌疑人警方给出的政策是如果一个犯罪嫌疑人坦白了罪行交出了赃物于是证据确凿两人都被判有罪如果另一个犯罪嫌疑人也作了坦白则两人各被判刑8年如果另一个犯罪嫌人没有坦白而是抵赖则以妨碍公务罪因已有证据表明其有罪再加刑2年而坦白者有功被减刑8年立即释放如果两人都抵赖则警方因证据不足不能判两人的偷窃罪但可以私入民宅的罪名将两人各判入狱1年模型二囚徒困境非合作博弈 21 不难看出坦白是任一犯罪嫌疑人的占优战略而坦白坦白是一个占优战略均衡模型二囚徒困境非合作博弈 22 对于两个犯罪嫌疑人总体而言他们设想的最好的策略可能是都不交代但任何一个犯罪嫌疑人在选择不交代的策略时都要冒很大的风险一旦自己不交代而另一犯罪嫌疑人交代了自己就将可能处于非常不利的境地对于A而言不管B采取何种策略他的最佳策略都是交代对于B而言也是如此最后两人都会选择交代模型二囚徒困境非合作博弈 23 该博弈刻划了两大难题冲突情形下参与人的目标是什么是采用作为个人他自己的最好策略还是采用作为集体的一员他们共同的最好策略前者导致均衡策略坦白坦白支付为 8 8 后者的最好策略是抵赖抵赖支付为 1 1 这里反映了个体理性行为与集体理性行为之间的矛盾冲突此博弈只进行一次还是重复进行如果博弈只进行一次参与人似乎只有坦白才是最好的策略因为没有理由相信对手会对你有信心他总认为你自己会坦白因此双方都采取坦白策略然而若博弈进行多次则结论将会发生变化模型二囚徒困境非合作博弈 24 囚徒困境可以用来说明许多现象寡头定价拍卖出价推销员的努力政治上的讨价还价军备竞赛等冲突中出现两败俱伤的情况往往要考虑到囚徒困境纯策略纳什均衡模型二囚徒困境非合作博弈 25 什么是博弈论试举两个你生活中的例子说明某年在荷兰召开了一次合作及社会两难困境研讨会与会者都是博弈论的专家当大会结束之后有两个学者麦息克和路特提议大家玩一个游戏他们将一个大信封拿出来请在场的位专家拿出金钱装到这个信封里如果到最后这信封里的钱超过元麦息克和路特将自己掏腰包退还每人元不过如果最后信封内的钱不足元就统统没收大家拿不到半毛钱仔细想一想如果你也在场你会奉献多少钱呢问题与思考 26 什么是海萨尼转换海萨尼提出了一种处理不完全信息博弈的方法即引入一个虚拟的局中人自然自然首先行动它决定每个局中人的特征每个局中人知道自己的特征但不知道别的局中人特征这种方法将不完全信息静态博弈变成一个两阶段动态博弈第一个阶段是自然N的行动选择第二阶段是除N外的局中人的静态博弈这种转换被称为海萨尼转换这个转换把不完全信息转变成为完全但不完美信息从而可以用分析完全信息博弈的方法进行分析模型三独立私人价值下的一级密封拍卖不完全信息静态博弈 27 海萨尼转换的具体方法一个虚拟的参与人自然自然首先决定参与人的类型赋予各参与人的类型向量其中自然告知参与者自己的类型却不告诉其他参与者的类型参与者同时选择行动每一参与者从可行集中选择行动方案各方得到收益借助于第一步和第二步中虚构的参与者自然的行动我们可以把一个不完全信息的博弈表述为一个不完美信息的博弈模型三独立私人价值下的一级密封拍卖不完全信息静态博弈 28 海萨尼转换分析海萨尼转换是处理不完全信息博弈的标准方法一般地自然在博弈开始的时候选择参与人的类型参与人的某个类型包括表征类型的各个特征如策略空间信息集得益函数等这些又称为该类型参与人所拥有的个人信息不完全信息意味着博弈各方中至少有一个参与人有多个类型模型三独立私人价值下的一级密封拍卖不完全信息静态博弈 29 通过海萨尼转换博弈开始时所有参与人有关自然的行动有一致的信念即都知道所有参与人类型的概率分布函数此即海萨尼公理模型三独立私人价值下的一级密封拍卖不完全信息静态博弈 30 经典案例解析例某一市场原来被A企业所垄断现在B企业考虑是否进入 B企业知道 A企业是否允许它进入取决于A企业阻挠B企业进入所花费的成本如果阻挠的成本低那么正如下表后两列所表示的 A企业的占优战略是阻挠博弈有重复剔除的占优战略均衡 A阻挠 B不进入如果阻挠的成本高那么正如下表前两列所表示的 A企业的占优战略是默许B进入博弈有重复剔除的占优战略均衡 A默许 B进入 B企业所不知道的是A企业的阻挠成本是高是低这里某一参与人本人知道其他参与人则不知道的信息称为私人信息某一参与人所拥有的全部私人信息称为他的类型在本例中阻挠成本就是A的私人信息高阻挠成本和低阻挠成本则是两种不同的类型模型三独立私人价值下的一级密封拍卖不完全信息静态博弈 31 海萨尼转换后的市场进入博弈模型三独立私人价值下的一级密封拍卖不完全信息静态博弈显然在这里 B所遇到的是不确定性条件下的选择问题因为B不仅不知道A的类型是高还是低而且不知道不同类型的分布概率 32 按照海萨尼的方法所有参与人的真实类型都是给定的其他参与人虽然不清楚某一参与人的真实类型但知道这些可能出现的类型的分布概率而且这种概率是公共知识用本例来说公共知识不仅意味着B企业知道A企业高阻挠成本与低阻挠成本的分布概率而且意味着A也清楚B知道这一概率模型三独立私人价值下的一级密封拍卖不完全信息静态博弈 33 模型三独立私人价值下的一级密封拍卖不完全信息静态博弈 N 低成本高成本 A B B 50 40 300 0 0 10 300 0 100 30 400 0 140 10 400 0 A B B 默许默许阻挠阻挠进入不进入进入进入进入不进入不进入不进入贝叶斯纳什均衡 34 言语博弈中的威胁与承诺在现实中我们经常看到声称的策略决定但是这些声称的策略可信吗声称的策略包括威胁与承诺在国际核武器问题上我国及其他一些国家承诺不首先使用核武器就是一种言语承诺博弈论中经常用可置信和不可置信的威胁或承诺来区分行动者说出来的策略我们在对动态博弈的分析中会分析什么样的策略是可置信的什么样的策略是不可置信的而分析威胁或承诺是可置信的还是不可置信的方法是倒推法模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈 35 倒推法 backwardinduction 也叫逆向归纳法那么什么是倒推法要理解什么是倒推法先来看一下商界里经常见到的博弈在某个城市假定只有一家房地产开发商A 我们知道任何没有竞争下的垄断利润是很高的假定A此时每年的垄断利润是10亿元模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈 36 现在假定有另外一个企业B 准备从事房地产开发面对着B要进入其垄断的行业 A想一旦B进入 A的利润将受损很多 B最好不要进入所以A向B表示你进入的话我将阻挠你进入假定当B进入时A阻挠的话 A的利润降低到2 B的利润是 1 而如果A不阻挠的话 A的利润是4 B的利润也是4 模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈 37 这样一个博弈可用下图表示模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈 B 进入不进入 A A 10 B 0 阻挠不阻挠 A 2 B 1 A 4 B 4 38 上图称之为博弈树由上图可见这个博弈由两阶段构成我们称之为动态博弈或者两阶段的动态博弈博弈树是表示动态博弈的一个好方法现在让我们回到房地产开发商之间的博弈问题 A的最好结局是 B不进入而B的最好结局是进入而A 不阻挠这两个最好的结局不能构成均衡那么结果是什么呢模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈 39 A向B发出威胁如果你进入我将阻挠而对B来说如果进入 A真的阻挠的话它将受损失 1 假定 1是它的机会成本当然此时A也有损失对于B来说问题是 A的威胁可置信吗 B通过分析得出 A的威胁是不可置信的原因是当B进入的时候 A阻挠的收益是2 而不阻挠的收益是4 4 2 理性人是不会选择做非理性的事情的也就是说一旦B进入 A的最好策略是合作而不是阻挠因此通过分析 B选择了进入而A选择了合作双方的收益各为4 模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈 40 在这个博弈中 B采用的方法为倒推法或者说逆向归纳法即当参与者作出决策时他要通过对最后阶段的分析准确预测对方的行为从而确定自己的行为在这里双方必须都是理性的如果不满足这个条件就无法进行分析了这个例子只是简单的两阶段博弈而三阶段或更多阶段的博弈可用同样方法加以分析在动态博弈中涉及威胁与承诺是不是可信的问题静态地看一博弈存在许多均衡模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈 41 上述进入阻挠问题的博弈树可用支付矩阵表示模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈在这个矩阵中纳什均衡点有两个合作进入和阻挠不进入我们可以验证在这两点上谁都不愿意改变策略然而阻挠不进入这个均衡是达不到的因为这是动态博弈在这个动态博弈中存在着先后策略选择顺序 42 这里分析的是完全且完美信息下的动态博弈所谓完全信息是指博弈的支付函数是公共知识本书中未涉及不完全信息的博弈问题如囚徒困境这样的静态博弈也是完全信息博弈完美信息是针对动态博弈而言的指参与者知道博弈的所有历史倒推法是动态博弈中有用的工具它可以说是理性的人自然的推理方式然而倒推法面临着一个困难这就是蜈蚣博弈的悖论模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈 43 前面我们分析了威胁是否可信我们也可用同样的思路分析一个承诺是否可信不首先使用核武器的承诺可信吗子博弈完美纳什均衡模型四 Stackelberg双寡头竞争模型完全且完美信息动态博弈 44 光天化日之下的违法行为为什么总能成功人类有许多关于猴子的故事比如朝三暮四杀鸡给猴看其实猴子是没有思维的它们有一定的群体意识但没有社会意识人们关于它们的故事其实是说人自己的我们这里也讲一个猴子的故事在现实社会中窃贼在公共场所比如公共汽车上偷东西时车上的乘客看到了但不敢吭声没有被偷的人想反正被偷的待宰猴群的结局人不是我我反抗了我得不到任何好处反而遭到伤害而不反抗虽不得益但也不受损我何必要反抗呢这就是光天化日之下的偷窃行为为什么总能成功的原因模型五信号博弈不完全信息动态博弈 45 窃贼在偷东西时发出这样的信号如果谁反抗将殴打谁乘客想窃贼的威胁是可信的因为如果个别乘客反抗而窃贼不殴打该乘客的话就会有更多的乘客抓窃贼窃贼将有可能被抓因此窃贼必然欧打反抗的乘客乘客的策略及可能的支付为反抗有可能被殴打甚至受伤不反抗无所得也无所失模型五信号博弈不完全信息动态博弈 46 乘客反抗不反抗偷东西窃贼窃贼殴打不殴打乘客受伤窃贼可能被抓可能逃脱乘客无所得无所失窃贼被抓窃贼殴打不殴打乘客受伤窃贼得到赃物乘客无所得无所失窃贼得到赃物 47 对于乘客来说窃贼的威胁是可信的因而乘客的最优策略是不反抗而对于窃贼来说乘客不反抗下的不殴打策略为最忧这一博弈的结果是窃贼偷东西时乘客不反抗窃贼不敢打这是一子精炼纳什均衡这样一种群体不反抗的结果将使社会风气恶化偷窃之风盛行对个体来说虽然这一次被偷的不是你但下次你被偷的几率增加了这使得我们都如同待宰的猴子我们不知道什么时候轮到我们自己这样我们每个人的处境比以前更差模型五信号博弈不完全信息动态博弈 48 如何从这种困境中摆脱出来我们看到使乘客采取反抗策略而非不反抗策略在于加大采取反抗策略的获益而减少不反抗的获益当反抗策略下的获益大于不反抗策略下的获益时乘客就会采取反抗的策略加大道德宣传培养人的道德感可以解决这个囚徒困境模型五信号博弈不完全信息动态博弈 49 乘客反抗不反抗偷东西窃贼窃贼殴打不殴打乘客受伤但没有道德满足感窃贼可能被抓可能逃脱乘客没有受伤并有道德满足感窃贼被抓窃贼殴打不殴打乘客受伤并有道德耻辱感窃贼得到赃物乘客道德耻辱感窃贼得到赃物上述博弈过程为 50 这样当小偷偷东西时尽管乘客认为窃贼的威胁是可信的但是如果乘客是道德感强的人那么博弈结果是乘客反抗小偷殴打从而小偷有可能被抓住这也是一子精炼纳什均衡博弈论对不合作的博弈结果的预测是令人悲哀的但是从这个例子我们看到道德就是由群体实施的对所谓非道德的行为进行非强制性的惩罚机制而法律及实施法律的国家的形成与改进就是建立一个对所谓违法行为实施的中心惩罚机制精炼贝叶斯纳什均衡混同均衡分离均衡模型五信号博弈不完全信息动态博弈 51 哪种策略更能赢假定我们的社会已经形成约束行动者的道德规范如果对不道德的行为不能产生即时的惩罚不道德的行为在社会中往往能给行为者带来好处这表现在一次性的非合作的博弈中行为者理性地选取对自己有利的行动但是如果存在重复博弈参与者之间对不合作行为就会形成惩罚机制对囚徒困境进行无限次的重复博弈什么样的策略会赢模型六有效工资率重复博弈 52 这里涉及参与者以什么样的态度对待对方的不合作策略在博弈论里有两个著名的策略如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略在博弈论里面称之为触发策略或称冷酷策略英文叫triggerstrategy 模型六有效工资率重复博弈 53 如果对方知道你的策略是触发策略那么对方将不敢采取不合作策略因为一旦他采取了不合作策略双方便永远进入不合作的困境因此只要有人采取触发策略那么双方均愿意采取合作策略但是这个策略面临着这样一个问题如果双方存在误解或者由于一方发生选择性的错误这个错误是无意的那么结果将是双方均采取不合作的策略也就是说这种策略不给对方一个改正错误或解释错误的机会模型六有效工资率重复博弈 54 第二种策略是若你采取不合作策略我也采取不合作策略但是如果你采取了合作策略我也采取合作策略这叫一报还一报策略或者称之为针锋相对英文叫tit for tat 美国密执安大学的罗伯特埃克斯罗德 RobertAxerold 主持了一次计算机比赛看谁写出来的程序能够赢参加者有政治学家数学家经济学家社会学家他们都详细研究过囚徒困境获胜者是加拿大多伦多大学的拉波波特写出的tit for tat策略这个程序非常简单第一步采取合作接着对方采取什么策略他便跟着做什么模型六有效工资率重复博弈 55 当然有多种策略如对方采取了不合作但自己永远采取合作策略这个策略可以叫做以德报怨策略这个策略对行动者最为不利因为对方知道你采取这种策略他会永远采取不合作的策略因而理性的人是不会采取这种以德报怨策略的然而极端道德的人是超越理性的限制的此时他会采取以德报怨策略佛说我不入地狱谁入地狱基督说爱你的敌人他们爱一切人而不会计算他爱的行动会给他带来利益或灾难而是希望他的行动感化众生模型六有效工资率重复博弈 56 如果是有限次的囚徒困境那么情况就不同于上述无限次的囚徒困境的重复博弈当临近博弈的终点时采取不合作策略的可能性加大如果参与人以前的所有策略均为合作策略并且被告知下一次博弈是最后一次那么双方肯定采取不合作的策略这可以解释许多商业行为一次性的买卖往往发生在双方以后不再有买卖机会的时候尽量谋取高利并且带欺骗性是其特点而靠熟客回头客便是通过薄利行为使得双方能继续合作下去模型六有效工资率重复博弈 57 非合作博弈理论把存在于如银行业经营国际融资选择商业周期出现社会习俗形成和中介机构出现及制度设计等各经济领域的协调问题模型化为协调博弈存在多个严格纳什均衡是这类博弈根本特点协调博弈成为了继囚徒困境博弈之后又一被广泛研究的博弈类型多重均衡是对传统经济理论的一个挑战也是非合作博弈理论致命之所在为寻找解决协调问题的方法学者们从理论上对协调博弈进行了广泛而深入的探讨协调博弈理论研究有助于解决非合作博弈的多重均衡问题在近十几年成了为学术界关注的焦点模型七价格竞争博弈协调博弈 58 对称协调博弈是指无角色区分的参与之间进行的协调博弈它表现在支付函数的对称上策略集是一样的从形式上看对称协调博弈就是博弈支付矩阵主对角线上的元素都是纳什均衡的博弈协调博弈的均衡选择并不涉及到激励问题而依赖于参与人之间对博弈如何进行有充分相似的信念正是由于信念形成是一个相对复杂的过程所以对协调博弈均衡问题的研究也就显得非常复杂不同的信念形成过程动态就会产生不同的均衡模型七价格竞争博弈协调博弈 59 对称协调博弈是一类特殊的博弈均衡选择不仅要满足预期的一致性而且要满足行动的一致性因此博弈结果必定收敛到纯策略而非混合策略纳什均衡更为重要的是协调博弈还有策略互补性及支付外溢性这两个重要特征它是分析协调博弈多重均衡问题的出发点对称协调博弈分成三类支付占优与风险占优不一致支付占优与风险占优一致严格纳什均衡可进行帕累托排序均衡无占优性可比的协调博弈模型七价格竞争博弈协调博弈 60 支付占优与风险占优不一致的协调博弈这类博弈最典型的例子就是猎鹿博弈有两个打猎人他们可以合作去猎鹿也可以单独去猎兔如果合作猎鹿那么两个都可以分得4个单位的支付如果一个人去猎鹿而另一个人去猎兔那么前者支付为0 因为猎鹿需要两个人合作可以成功后者的支付为2 如果两个人不合作都去猎兔那么他们都可以得到3单位的支付模型七价格竞争博弈协调博弈 61 显然该博弈有两个纯策略严格纳什均衡即要么两个合作猎鹿要么两人去猎兔与一个混合策略纳什均衡按HarsayiandSelten 1988 的定义纯策略猎鹿是支付占优纳什均衡纯策略猎兔是风险占优纳什均衡猎兔策略是一个保险策略而猎鹿博弈则是一个帕累托效率策略但行动的不确定性使猎鹿策略具有较大的风险因此均衡选择取决于参与人对风险的态度模型七价格竞争博弈协调博弈 62 由于存在两个纯策略纳什均衡现实中究竟哪个均衡会出现就是一个问题这是多重纳什均衡下的困境通过比较猎鹿博弈明显的事实是两人一起去猎鹿的好处比各自打兔的好处要大得多用一个经济学术语来说两人起去人头猎鹿比各自去打兔更符合帕累托最优原则模型七价格竞争博弈协调博弈 63 这一案例中有一个隐含的假设两个猎人的能力和贡献差不多所以双方均分猎物但是实际情况显然不会这么简单如果一个猎人的能力强贡献大他就会要求得到较大的一份这样分配的结果就可能是 14 6 或 15 5 但有一点是肯定的能力较差的猎人的所得至少要多于他独自打猎的所获否则他就没有合作的动机假设猎人甲在猎鹿过程中几乎承担了全部的工作他据此要求最后的分配结果是 17 3 这时模型七价格竞争博弈协调博弈 64 相对于分别猎兔的收益 4 4 合作猎鹿就不具有帕累托优势虽然这样17比4多改善了很多 17 3也比4 4大得多猎人总体收益也改善了很多但是由于3比4小猎人乙的境遇不仅没有改善反而恶化也就是说他的收益受到了损害所以站在乙的立场 17 3 没有 4 4 好如果合作结果是这样那么乙一定不愿合作所以为了实现帕累托最优就必须充分照顾到合作者的利益使他的收益大于不合作时他才会愿意选择合作从而实现双赢的最佳结局模型七价格竞争博弈协调博弈 65 协调合作与互动在许多研究中人们通常把协调与合作看作同一个事物容易引起混淆但博弈论却能够很好地进行区分下面以囚徒困境与猎鹿博弈来给予说明支付矩阵如下表4表5 模型七价格竞争博弈协调博弈 66 协调博弈解决的是源于参与人之间策略不确定性以及由此引起的行为预期问题猎鹿博弈中如果一个参与人选择猎兔另一个参与人选择猎鹿那么前者得到支付2 后者得到支付0 猎兔策略不是占优策略由于不能够确定其他参与人是否会选择猎鹿策略尽管每个参与人都意识到这样可以带来更多的支付但他们不会选择有较高风险的猎鹿策略因而系统难以达到帕累托效率均衡因此解决协调问题就要参与人相信其他人会选择帕累托效率策略在这里需要强化参与人之间的相互信任模型七价格竞争博弈协调博弈 67 囚徒困境博弈研究的是处于竞争关系两参与人之间的合作问题如果一个参与人选择欺骗另一个参与人选择合作那么前者得到支付3 后者得到支付0 欺骗策略是占优的求解囚徒困境博弈的困难在于个人激励与群体目标并不一致因而要求参与人把个人目标放到第二位而把集体目标放在第一位模型七价格竞争博弈协调博弈 68 协调博弈与囚徒困境博弈存在着两种不同形式的互动协调互动合作互动协调互动是指一个参与人获得的支付依赖于其他参与人是否选择了相同行动如左行右行博弈如果两个相对而行的参与人选择不同的方向行进那么他们会相碰而选择相同方向则可以顺利通过模型七价格竞争博弈协调博弈合作互动是指既存在协调又存在冲突的博弈协调是因为两个参与同时改变行动可以变得更好冲突是因为尽管其他参与人承诺行动也不一定有利于该参与人支付的增加前者可能引起无效率后者则意意味着无效率状态会成为均衡 69 猎鹿类型协调博弈由策略不确定性所引起的均衡结果依赖于参与人之间的行为预期博弈支付与策略风险当时也是最小努力类型协调博弈支付占优与风险占优是统一的均衡结果依赖于行为预期与博弈支付现在进一步分析支付值x的变化对合作与协调的影响囚徒困境博弈中随着支付值x的增加不合作的激励就会越大追求个人理性的参与人使系统更易于偏离集体目标猎鹿类型博弈中参与人对系统达到支付占优均衡的期望值会随着支付值x的增加而减少选择合作的风险就会越来越大最小努力类型博弈中尽管结果欺骗欺骗是一个均衡但x的下降使欺骗策略会面临更大的风险当时就是囚徒困境博弈个人理性并不追求集体最大化目标唯一的均衡是欺骗欺骗当时就是 70 夏普里 Shapley 值与夏普里一苏比克权力指数夏普里一苏比克权力指数是最早提出的一种权力指数它是夏普里和苏比克在1954年的一篇文章评价委员会中权力分布的一个方法中提出的而该权力指数是基于夏普里值之上的如果说纳什均衡是非合作博弈中的核心概念的话那么我们可以说夏普里值 ShapleyValue 是合作博弈或联盟博弈中的最重要的概念模型八财产分配问题和Shapley值合作博弈 71 考虑这样一个联盟博弈有一个三人财产分配问题假定财产为100万元假定这100万元在三个人之间进行分配 a拥有50 的票力 b拥有40 的票力 c拥有10 的票力规则规定当超过50 的票认可了某种方案时才能获得整个财产否则三人将一无所获我们看到任何单独一个人的票力都不超过50 从而不能单独决定财产的分配要超过50 的票力必须要形成联盟也就是说在这个例子中任何人的权力都不是决定性的也没有一个人是无权力的或权力为0 模型八财产分配问题和Shapley值合作博弈 72 夏普里 L S Shapley 提出了一种分配方式根据他的理论求得的联盟者的先验实力被称为夏普里值 ShapleyValue 夏普里值是这样的一个值在各种可能的联盟次序下参与者对联盟的边际贡献之和除以各种可能的联盟组合在财产分配问题上我们可以写出各种可能的联盟顺序而边际贡献就在于在这个顺序中谁是这个联盟的关键加入者如果是关键加入者那么他的边际贡献就为100万元模型八财产分配问题和Shapley值合作博弈 73 财产问题中各种排列下的关键加入者模型八财产分配问题和Shapley值合作博弈由上表

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论的几个经典模型ppt课件.ppt

文档简介

温馨提示

最新文档

评论

博弈论的几个经典模型ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档