




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 Nash均衡,本章目的:通过分析理性参与人在博弈中的选择行为,探讨完全信息静态博弈问题的求解,并给出完全信息静态博弈问题的解-Nash均衡,Company Logo,博弈论-第2章 Nash均衡,主要问题 占优行为 重复剔除劣战略行为 Nash均衡,Company Logo,博弈论-占优行为,引例(囚徒困境):问题的战略式描述:,B坦白 B抵赖 A坦白 -4,-4 0,-6 A抵赖 -6, 0 -1,-1,选择的特征: 1.不仅与自己的选择有关,还与另一个人的选 择有关。 2.不知道对方的选择。,Company Logo,博弈论-占优行为,参与人的决策过程:,对方坦白,自己坦白,自己抵
2、赖,-8,-10,对方抵赖,自己坦白,自己抵赖,0,-10,Company Logo,博弈论-占优行为,最终选择:由于两个参与人都是理性的,因此, 按照上述分析,最终都会选择坦白。,问题:两个参与人的所有选择策略为 (坦白,坦白) (-4,-4) (坦白,抵赖) (0,-6) (抵赖,坦白) (-6,0) (抵赖,抵赖) (-1,-1) 显然,在所有选择中,(坦白,坦白)显然不如(抵赖,抵赖)对双方都有好处,但是,为什么会出现选择(坦白,坦白)的结果呢?,(抵赖,抵赖)是帕累托优于(坦白,坦白)!,Company Logo,博弈论-占优行为,与囚徒困境类似的问题: 市场竞争中的寡头价格战(20
3、世纪90年代末期,彩电企业的价格战); 目前,中小学生的奥数班(各类兴趣班); 市场竞争中,厂商进行的广告投资、采用新技术、对公共资源的掠夺式使用。,启示: 在一定程度上否定了传统经济理论关于市场经济中有一只“看不见的手”,总会把个人的利己行为变为对集体、社会有利行为的论断; 说明了政府在社会经济活动中的组织协调工作的必要性:放任自流并不是导致全社会最大福利的有效政策; 研究囚徒困境类型问题的目的在于,可以利用这种困境达到有益于社会的目的,如打击犯罪方面,有时则是要设法避免这种困境,如环境保护和公共资源开发利用等。,Company Logo,囚徒困境中小偷战略的特点:无论对方怎样选择,“坦白”
4、总是理性小偷的最优战略。 占优战略:无论其他参与人选择什么战略,参与人的最优战略总是唯一的,这样的最优战略称为占优战略。,Company Logo,博弈论-占优行为,定义:在n人博弈中,如果对于所有其他参与人的选择s-i,si*都是参与 人i的最优选择,即,则称si*为参与人i的占优战略。,在一个博弈问题中,如果某个参与人具有占优战略,那么只要这个参与人是理性的,他肯定会选择他的占优战略。,Company Logo,占优行为选择是理性参与人选择行为的最基本特征;,博弈论-占优行为,例:囚徒困境 参与人A: uA(坦白,坦白)=-4 uA(抵赖,坦白)=-6 uA(坦白,抵赖)= 0 uA(抵赖
5、,抵赖)=-1 参与人A的占优战略:坦白 参与人B:同理可得占优战略为坦白。 囚徒困境问题的解为(坦白,坦白)。,如果所有参与人都具有占优战略,则博弈的结果就由参与人的占优战略共同决定-占优战略均衡。,Company Logo,博弈论-占优行为,例:假设有两个参与人,其中参与人1有两个战略a1和a2,参与人2有四个战略b1,b2,b3和b4.博弈矩阵如下 参与人2 b1 b2 b3 b4 a1 ( 2, 1) (-2,-6) ( 1, 2) ( 0, 1) 参与人1 a2 ( 3, 0) (-1, 2) ( 3, 3) ( 1, 2) 参与人1:u1(a1,b1)= 2 u1(a2,b1)=
6、3 u1(a1,b2)=-2 u1(a2,b2)=-1 u1(a1,b3)= 1 u1(a2,b3)= 3 u1(a1,b4)= 0 u1(a2,b4)= 1 占优战略: a2,Company Logo,博弈论-占优行为,( 2, 1) (-2,-6) ( 1, 2) ( 0, 1) ( 3, 0) (-1, 2) ( 3, 3) ( 1, 2) 参与人2: u2(a1,b1)=1,u2(a1,b2)=-6, u2(a1,b3)=2,u2(a1,b4)= 1, 最优支付:u2(a1,b3) u2(a2,b1)=0,u2(a2 ,b2)=2, u2(a2,b3)=3,u2(a2 ,b4)=2,
7、最优支付:u2(a2,b3) 占优战略: b3 博弈问题的解:(a2,b3),问题1:如果将支付矩阵的u(a2 ,b4)改为(-1,-2),则两个参与人是否还有占优战略?该问题是否还有占优战略均衡解?,Company Logo,问题2:分析新产品开发问题是否存在占优战略均衡解? (1)需求大时 (2)需求小时 企业2 企业2 开 发 不开发 开 发 不开发 开 发 300,300 800,0 开 发 -400,-400 200,0 企业1 企业1 不开发 0,800 0,0 不开发 0,200 0,0,博弈论-占优行为,需求大:企业1:u1(a,a)=300u1(b,a)=0 u1(a,b)=
8、800u1(b,b)=0, 占优战略:开发 企业2:u2(a,a)=300u2(a,b)=0 u2(b,a)=800u2(b,b)=0, 占优战略:开发 占优战略均衡解(开发,开发),需求小:企业1:u1(a,a)=-400u1(b,b)=0, 无占优战略 企业2:u2(a,a)=-400u2(b,b)=0, 无占优战略 无占优战略均衡解。,问题3:当一个博弈问题没有占优战略均衡解时,如何给出问题的解决方案?,Company Logo,博弈论-第2章 Nash均衡,主要问题 占优行为 重复剔除劣战略行为 Nash均衡,Company Logo,在博弈问题中,如果存在参与人的占优战略,则理性参与
9、人必将选择他的占优战略;但是,如果博弈问题中不存在参与人的占优战略,那么,参与人将如何选择他的战略呢?,博弈论-重复剔除劣战略行为,Company Logo,博弈论-重复剔除劣战略行为,引例:博弈矩阵 参与人2 b1 b2 b3 a1 参与人1 a2,分析: 从博弈矩阵可以知道,该问题对两个参与人均无占优战略; 观察矩阵后两列,可以看到,对于参与人2而言,策略b2虽然不是占优战略,但是,与策略b3相比,在任何情况下(不论参与人1选择a1或a2)参与人2选择策略b2的支付都比选择大b3的支付大; 理性参与人的选择:选择相对占优的策略,剔除劣战略。,Company Logo,博弈论-重复剔除劣战略
10、行为,定义:在n人博弈中,如果对于参与人i,存在战略 ,对于 ,有 则称战略 为参与人i的劣战略,或者说战略 相对于战略 占优。,在博弈中,如果一个战略是参与人的劣战略,那么参与人肯定不会选择该战略,即相当于参与人将该战略从自己的战略集中剔除掉。,Company Logo,博弈论-重复剔除劣战略行为,参与人2 b1 b2 b3 a1 参与人1 a2,由于对于参与人2而言,战略b2相对于战略b3占优,即战略b3是参与人2的劣战略,于是问题转化为,参与人2 b1 b2 a1 参与人1 a2,Company Logo,博弈论-重复剔除劣战略行为,例 参与人2 b1 b2 b3 a1 参与人1 a2
11、a3,对于参与人2而言,战略b2相对于战略b3占优,b1 b2 a1 a2 a3,对于参与人1而言,战略a2相对于战略a3占优,b1 b2 a1 a2,Company Logo,博弈论-重复剔除劣战略行为,例 b1 b2 b3 a1 a2 a3,如果上述重复剔除劣战略的过程可以不断进行下去,直到新构造出来的博弈中每个参与人都只有一个战略,那么由所有参与人剩下的唯一战略所构成的战略组合就是原博弈问题的解,称为“重复剔除的占优均衡”。,b1 b2 a1 a2 a3,b1 b2 a1 a2,b2 a1 a2,Company Logo,重复剔除劣战略过程中的问题:,均衡结果是否与劣战略的剔除顺序有关?
12、,Company Logo,博弈论-重复剔除劣战略行为,在上述的劣战略定义中,要求选择 的支付一定要严格大于选择 的支付。 如果存在这样的情形:选择战略 的支付并不一定总是大于选择 的支付,但自己在任何情况下选择 的支付都不会比选择 的支付小,而且在某些情况下选择 的支付严格大于选择 的支付。这时,参与人会如何选择自己的策略?,Company Logo,博弈论-重复剔除劣战略行为,定义:在n人博弈中,如果对于参与人i,存在战略 ,对于 ,有 且 ,使得 则称战略 为参与人i的弱劣战略,或者说战略 相对于战略 弱占优。,劣战略,严格劣战略 弱劣战略,Company Logo,博弈论-重复剔除劣战
13、略行为,重复剔除弱劣战略,例 b1 b2 b3 a1 a2 a3,b2,b3为严格劣战略 剔除b3,b1 b2 a1 a2 a3,a3为弱劣战略 剔除a3,b1 b2 a1 a2,b2为严格劣战略 剔除b2,b1 a1 a2,Company Logo,博弈论-重复剔除劣战略行为,重复剔除弱劣战略,例 b1 b2 b3 a1 a2 a3,b2,b3为严格劣战略 剔除b2,b1 b3 a1 a2 a3,a1为弱劣战略 剔除a1,b1 b2 a2 a3,b2为严格劣战略 剔除b2,b1 a2 a3,显然,b2和b3的剔除次序不同,会得到不同的博弈结果。但是,如果只允许剔除严格劣战略,则无论次序如何,
14、博弈的结果总是相同的,Company Logo,博弈论-重复剔除劣战略行为,重复剔除弱劣战略,例 b1 b2 b3 a1 a2 a3,b2,b3为严格劣战略 剔除b3,b1 b2 a1 a2 a3,a2为严格劣战略 剔除a2,b1 b2 a1 a3,b2为严格劣战略 剔除b2,b1 a1 a3,这两个组合都可以作为博弈的结果,为什么?,如果先剔除b2,结果如何?,Company Logo,博弈论-第2章 Nash均衡,主要问题 占优行为 重复剔除劣战略行为 Nash均衡,Company Logo,博弈论- Nash均衡,在相当多的博弈中,无法使用重复剔除劣战略的方法找出均衡解,例如新产品开发博
15、弈中,若市场需求为低需求时不存在占优均衡结果。 为了找出更一般博弈的均衡解,需要引入Nash均衡(Nash equilibrium)的概念。,Company Logo,博弈论- Nash均衡,一个战略组合 要成为博弈的结果,就必须满足:对于所有的参与人,当其他参与人选择战略组合 中给定的战略时,选择 中相应的战略所得到的支付不小于选择其它战略所得到的。即,, , , 或者 , 满足这样条件的战略组合,我们称之为Nash均衡(Nash equilibrium)。,Company Logo,定义5 : Nash均衡,在战略式博弈 中,战略组合 是一个Nash均衡当且仅当 , ,有,Company
16、Logo,博弈论- Nash均衡,Nash均衡是1994年诺贝尔经济学奖获得者John Nash在20世纪50年代,作为 n 人战略式博弈的解而提出来的,在传统的博弈论中,一般都将Nash均衡作为博弈的解。 一个战略组合如果不是Nash均衡的话,就不能成为博弈的解。 构成Nash均衡的战略是不可剔除的,即不存在一个战略严格优于Nash均衡战略。,Company Logo,博弈论- Nash均衡,在“囚徒困境”中,(坦白,坦白)为Nash均衡,Company Logo,新产品开发博弈 (1)需求大时 企业2 开 发 不开发 开 发 300,300 800,0 企业1 不开发 0,800 0,0
17、(开发,开发)为Nash均衡; (2)需求小时 企业2 开 发 不开发 开 发 -400,-400 200,0 企业1 不开发 0,200 0,0 (开发,不开发)和(不开发,开发)为Nash均衡。,博弈论- Nash均衡,Company Logo,2. 求解Nash均衡的两种方法:,划线法; 箭头法;,博弈论- Nash均衡,Company Logo,1) 划线法,“划线法”就是利用Nash均衡这样的性质:在两人博弈中,相互构成最优战略的战略组合就是Nash均衡。,博弈论- Nash均衡,Company Logo,划线法具体步骤如下:,针对参与人2的每个战略,分别标示参与人1的最优战略。 用
18、上述方法标示参与人2的最优战略。 找出两个参与人同时标示的战略组合,即为最优战略组合。,博弈论- Nash均衡,Company Logo,用划线法求解该博弈,博弈论- Nash均衡,Company Logo,2) 箭头法,“箭头法”则是利用了Nash均衡这样的性质:在两人博弈中,一个战略组合只有在两个参与人都不愿意偏离的情况下才能构成Nash均衡。,博弈论- Nash均衡,Company Logo,箭头法具体步骤如下:,对于每个战略组合,检查是否有参与人会偏离这个战略组合。 找出没有参与人会偏离的战略组合。,博弈论- Nash均衡,Company Logo,用箭头法求解该博弈,博弈论- Nash均衡,Company Log
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 跨文化交流能力培养在2025年国际化教育中的跨文化交际能力培养策略报告
- 2025年农业机械化智能化在农业智能农产品溯源中的应用报告
- 工业互联网网络运维 课件 任务2.3-1 网络设备选型-PLC选型
- 《低空经济引领的数字货币战略布局与协同发展研究报告》简版v1.0
- XX县XX(乡)镇 XX村脱贫攻坚明白卡
- 四川资阳试题及答案
- 台式电脑测试题及答案
- 郯城中考英语试题及答案
- 养护设计管理办法
- 养路员管理办法
- 六年级上册语文第4课《花之歌》同步练习(含答案)
- 社会工作者考试题库及答案
- 2023年江西美术出版社七、八、九年级美术基础知识测试试卷
- 2022年北海市铁山港区审计局审计业务人员招聘笔试试题及答案
- 脑外伤康复临床路径
- 动物协检员聘用合同协议书范本
- 连续下降最后进近CDFA培训
- 施工现场每周安全质量检查记录
- RB/T 047-2020检验检测机构管理和技术能力评价设施和环境通用要求
- GB/T 31838.2-2019固体绝缘材料介电和电阻特性第2部分:电阻特性(DC方法)体积电阻和体积电阻率
- DB32∕T 4117-2021 保温装饰板外墙外保温系统技术规程
评论
0/150
提交评论