




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二节混合策略纳什均衡的求解方法,二、支付最大化法例:扑克牌对色游戏(p77)无纯策略NE给定混合策略p甲=(r,1-r);p乙=(q,1-q)甲(p甲,p乙)=rq(-1)+(1-q)1+(1-r)q1+(1-q)(-1)=2r(1-2q)+(2q-1)乙(p甲,p乙)=qr1+(1-r)(-1)+(1-q)r(-1)+(1-r)1=2q(2r-1)-(2r-1)混合策略纳什均衡是甲在策略空间上以概率分布p甲*=(1/2,1/2)进行选择,乙也在策略空间p乙*=(1/2,1/2)进行选择,第二节混合策略纳什均衡的求解方法,二、反应对应法例:扑克牌对色游戏(p77)无纯策略NE给定混合策略p甲=(r,1-r);p乙=(q,1-q)甲(p甲,p乙)=2r(1-2q)+(2q-1)整理原则:一项含r,一项不含r乙(p甲,p乙)=2q(2r-1)-(2r-1)整理原则:一项含q,一项不含q按照NE的条件,一个策略组合如过是一个NE,那么其中的每一个策略都是参与人针对其他参与人策略组合的最优反应,在纯策略NE中,这个“最优反应”可能是一个具体的纯策略(离散情形),也可能是一个反应函数(reactionfunction,如连续情形、古诺模型)。而在一个混合策略NE中,这个“最优反应”将是一个概率或很多个概率被称为“反应对应”(reactioncorrespondence),第二节混合策略纳什均衡的求解方法,二、反应对应法例:扑克牌对色游戏(p77)先看甲的最优反应,记为r*=R(q):观察甲(p甲,p乙)=2r(1-2q)+(2q-1),反应对应曲线,第二节混合策略纳什均衡的求解方法,二、反应对应法例:扑克牌对色游戏(p77)再看乙的最优反应,记为q*=R(r):观察乙(p甲,p乙)=2q(2r-1)-(2r-1),反应对应曲线,第二节混合策略纳什均衡的求解方法,二、反应对应法例:扑克牌对色游戏(p77)作为NE,各个参与人的反应应该同时为最优,只有两个反应对应的交点满足NE:r*=1/2,q*=1/2NE支付为:甲(p甲,p乙)=2r(1-2q)+(2q-1)=0乙(p甲,p乙)=2q(2r-1)-(2r-1)=0,r*=R(q),第二节混合策略纳什均衡的求解方法,二、反应对应法作业:社会福利博弈。使用反应对应法找到纳什均衡。,流浪汉寻找工作游荡救济政府不救济,第三节寻找多重纳什均衡,例:情侣博弈两个(多个)纯策略纳什均衡问题:纳什均衡找完了吗?有无混合策略纳什均衡?一、支付最大化法给定混合策略p陈明=(r,1-r);p钟信=(q,1-q)Max陈明(p陈明,p钟信)=r3q+(1-q)+(1-r)0+2(1-q)=r(4q-1)+2(1-q)Max钟信(p陈明,p钟信)=q(2r+0)+(1-q)r+3(1-r)=q(4r-3)+(3-2r)NE:(r*,q*)=(3/4,1/4)二、反应对应法,r,q,第三节寻找多重纳什均衡,二、反应对应法:情侣博弈先看陈明的最优反应,记为r*=R(q):陈明(p陈明,p钟信)=r(4q-1)+2(1-q),第三节寻找多重纳什均衡,二、反应对应法:情侣博弈再看钟信的最优反应,记为q*=R(r):钟信(p陈明,p钟信)=q(4r-3)+(3-2r),第三节寻找多重纳什均衡,二、反应对应法:情侣博弈反应对应曲线有三个交点:三个NE:r*=0,q*=0纯策略(确定性)r*=3/4,q*=1/4混合策略(不确定性)r*=1,q*=1纯策略(确定性),r,q,0,1,(钟信德语),1,(陈明德语),1/4,3/4,第三节寻找多重纳什均衡,二、反应对应法:情侣博弈支付的帕累托优势:初步印象陈明=r(4q-1)+2(1-q),钟信=q(4r-3)+(3-2r)r*=0,q*=0纯策略(确定性)双方NE支付:陈明*=3,钟信*=2r*=3/4,q*=1/4混合策略(不确定性)双方NE支付:陈明*=3/2,钟信*=3/2r*=1,q*=1纯策略(确定性)双方NE支付:陈明*=2,钟信*=3纯策略纳什均衡比混合策略纳什均衡具有支付优势,这称为帕累托优势如果博弈同时存在纯策略纳什均衡和混合策略纳什均衡,前者往往得到优先考虑,第三节寻找多重纳什均衡,二、反应对应法:情侣博弈夫妻之争博弈,第四节纳什均衡的存在性,不同均衡概念的关系,第四节纳什均衡的存在性,问题:是否所有的博弈都存在NE(纯的或混合的)?Nash在1950年证明:任何有限博弈,都至少存在一个NE。纳什定理:在一个由n个博弈方的G=S1,,Sn;u1,un中,如果n是有限的,且Si都是有限集,则该博弈至少存在一个纳什均衡,但可能包含混合策略Wilson(1971)证明,几乎所有有限博弈,都存在有限奇数个NE,包括纯策略NE和混合策略NE。(纯策略)纳什均衡的存在性定理(Debreu,1952;Glicksberg,1952;Fan,1952):考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash均衡。,第四节纳什均衡的存在性,例:凹但不连续的支付函数二人博弈:策略空间为S1=S2=(0,1)支付函数:反应对应:反应对应曲线:,无纳什均衡,第四节纳什均衡的存在性,问题:是否所有的博弈都存在NE(纯的或混合的)?(纯策略)纳什均衡的存在性定理(Debreu,1952;Glicksberg,1952;Fan,1952):考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash均衡。(混合策略)纳什均衡的存在性定理(Glicksberg,1952):在n人策略式博弈中,如果每个参与人的纯粹策略空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,如果支付函数ui(s)为连续函数,那么博弈至少存在一个混合策略Nash均衡.,第五节多重纳什均衡的筛选,一个博弈可能有多个均衡,但仍然存在不稳定性你预测出现这个纳什均衡,因而有相应选择,我却以为会出现另一个,乃有我的选择,此时的组合可能并不构成纳什均衡博弈论并没有一个一般的理论证明纳什均衡结果一定能出现如何保证纳什均衡出现?一、帕累托优势标准:按照支付大小筛选纳什均衡例:猎人博弈,第五节多重纳什均衡的筛选,如何保证纳什均衡出现?二、风险优势标准:风险小的NE优先假设概率,比较期望支付大小例:虚拟博弈两个纳什均衡,哪个更优?假设r=1/2,q=1/2给定q=1/2:甲采用上策略的期望支付为:9/2+0/2=4.5甲采用下策略的期望支付为:8/2+7/2=7.5给定r=1/2:乙采用左策略的期望支付为:9/2+0/2=4.5乙采用右策略的期望支付为:8/2+7/2=7.5期望支付越大,风险越小:甲采用下策略,乙采用右策略选择的纳什均衡为:(下策略,右策略),第五节多重纳什均衡的筛选,如何保证纳什均衡出现?二、风险优势标准:风险小的NE优先风险偏离损失乘积比较法1.甲:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-0=42.乙:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-0=43.风险优势标准方法:偏离A的损失VS偏离B的损失11444.结论(1)偏离B的损失更大:16(2)不偏离B选择的纳什均衡偏离损失更大者为:B,即(下策略,右策略),第五节多重纳什均衡的筛选,如何保证纳什均衡出现?二、风险优势标准:风险小的NE优先风险偏离损失乘积比较法1.甲:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-0=42.乙:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-0=43.风险偏离损失乘积比较法:偏离A的损失VS偏离B的损失11444.结论(1)偏离B的损失更大:16(2)不偏离B选择的纳什均衡偏离损失更大者为:B,即(下策略,右策略),第五节多重纳什均衡的筛选,如何保证纳什均衡出现?二、风险优势标准:风险小的NE优先5.风险偏离损失乘积比较法的缺陷:例:假设M远远大于m1.甲:单独偏离均衡的损失(1)偏离A的损失:(M-m)-M/2=M/2-m(2)偏离B的损失:M-(M-m)=m2.乙:单独偏离均衡的损失(1)偏离A的损失:0-0=0(2)偏离B的损失:0-0=0如果使用风险偏离损失乘积比较法:偏离A的损失VS偏离B的损失(M/2-m)0=m0一种建议:甲偏离A的损失VS甲偏离B的损失M/2-mm选择的纳什均衡为:A,即(D,L),第五节多重纳什均衡的筛选,如何保证纳什均衡出现?二、帕累托优势标准和风险优势标准的关系如果帕累托优势标准和风险优势标准的选择冲突?例:帕累托优势标准法:选择的纳什均衡为A风险优势标准:1.甲:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-(-1000)=10042.乙:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-(-1000)=1004风险偏离损失乘积比较法:偏离A的损失VS偏离B的损失1110041004选择的纳什均衡为:B怎么办?,第五节多重纳什均衡的筛选,如何保证纳什均衡出现?四、聚点均衡如果帕累托优势标准和风险优势标准都无法使用呢?在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点(focalpount)”均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史等有关。(Schelling,1960)性别战:某一方的生日;社会地位提名博弈道路交通规则廉价磋商(Cheaptalk)与协调博弈尽管无法保证磋商会达成一个协议,即使达成协议也不一定会被遵守,但在一些博弈中,事前磋商确实可以使某些均衡实际上出现。例:两人同时给对方打电话,第五节多重纳什均衡的筛选,如何保证纳什均衡出现?四、聚点均衡廉价磋商(Cheaptalk)尽管无法保证磋商会达成一个协议,即使达成协议也不一定会被遵守,但在一些博弈中,事前磋商确实可以使某些均衡实际上出现。例:虚拟博弈中的事前告知例:两人同时给对方打电话重复博弈、学习过程与协调模式,R,乙,甲,U,D,L,R,乙,甲,U,D,L,聚点,第五节多重纳什均衡的筛选,如何保证纳什均衡出现?四、聚点均衡重复博弈与协调模式假定博弈重复许多次,即使参与人最初难以协调行动,在博弈若干次后,某种特定的协调模式可能会形成,特别地,假定参与人每一轮根据其对手以前的“平均”战略来选择自己的最优战略,博弈可能收敛于一个纳什均衡。以上情况并不保证必然出现纳什均衡,26,第三节多重纳什均衡的选择标准,四、相关均衡(一)案例:“地域连坐”下的产品质量博弈企业乙好产品差产品好产品企业甲差产品,27,第三节多重纳什均衡的选择标准,四、相关均衡(二)相关均衡参与人主动设计某种形式的选择机制,形成制度安排,从而确定最终均衡“三鹿”事件出现后,河北省其他食品企业以后如何做?,28,第三节多重纳什均衡的选择标准,五、抗共谋均衡(一)案例:抽象的选择乙左右上甲下,乙左右上甲下,丙:A,丙:B,29,第三节多重纳什均衡的选择标准,五、抗共谋均衡(二)共谋偏离(集体偏离)均衡的激励1.如果集体偏离(上,左,A)(1)起因:甲、乙集体偏离,选(下,右,A)(2)结果:甲的支付01,乙的支付01(3)结论:甲、乙有集体偏离的动机,(上,左,A)非抗共谋均衡,30,第三节多重纳什均衡的选择标准,五、抗共谋均衡(二)共谋偏离(集体偏离)均衡的激励2.如果集体偏离(下,右,B)(1)若甲、乙集体偏离,选(上,左,B)-1-2,-1-2(2)若甲、丙集体偏离,选(上,右,A)-1-5,50(3)若乙、丙集体偏离,选(下,左,A)-1-5,50(4)结论:缺乏集体偏离的激励,(下,右,B)为抗共谋均衡,31,猎鹿博弈:何为抗共谋均衡?,乙猎鹿打兔猎鹿甲打兔,多人博弈中的共谋问题防共谋均衡:如果一个博弈的米讴歌策略组合满足下列要求:1、没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图2、给定选择偏离的博弈方又再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果3、依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果满足上述要求的均衡策略组合成为“防共谋均衡”,2.6.2共谋和防共谋均衡,第五节多重纳什均衡的筛选,如何保证纳什均衡出现?三、帕累托优势标准和风险优势标准的关系如果帕累托优势标准和风险优势标准的选择冲突?怎么办?在帕累托优势标准和风险优势标准之间,理论给予帕累托优势标准以优先权,而风险优势只有在局中人面临不知道先哪个均衡好的不确定性时,才变得重要。当一个均衡具有帕累托优势时,局中人一定选择这个均衡,不确定性就不存在了。理性假设与确定性环境有限理性假设与不确定性环境四、聚点均衡,第四节混合策略纳什均衡的求解方法,二、对混合策略纳什均衡的进一步讨论混合策略表示使用不同纯策略的大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年公共关系专家危机处理技巧考核试卷及答案解析
- 机电电工基础知识培训课件
- 2025年安全管理培训考试模拟题及答案
- 2025年服务机器人应用技术员初级面试模拟题及答案
- 2025年安全生产监督测试题
- 2025年AI造型师职位面试准备问题集
- 2025年通信工程师中级技能考试模拟题及答案解析
- 新年祝福卡教学课件小班
- 2025年农家乐客房笔试秘籍
- 2025年工会安全检查员面试模拟题集
- 中医护理灸疗技术操作规范:督灸
- 泌尿外科手术分级管理制度
- 阿尔茨海默病药物治疗指南(2025)解读
- 报酬协议模板
- 《贵阳市公共交通场站设计导则》
- 新时代中小学教师职业行为十项准则
- 工业厂房独立基础土方开挖施工方案
- 职业指导师考试题库及答案(含各题型)
- 企业融资过程中的税务问题解析
- 足球俱乐部股权转让协议
- 电子商务在文化创意产业的应用与案例
评论
0/150
提交评论