混合策略纳什均衡.ppt

上传人：闯*** IP属地：广东上传时间：2020-03-29 格式：PPT 页数：35 大小：414.50KB 积分：25 举报 版权申诉

已阅读5页，还剩30页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

29 03 2020 1 混合策略纳什均衡MixedStrategyNashEquilibrium 理学院顾聪gucong 29 03 2020 2 两个参与人各拿一枚硬币并选择出正面向上还是反面向上若两枚硬币是一致的即全部正面或全部反面则参与人2赢走参与人1的硬币若两枚硬币不一致一正一反参与人1赢得参与人2的硬币支付矩阵如下由划线法可知该博弈不存在纳什均衡所以采取纯策略不存在稳定的纳什均衡解 4 1严格竞争博弈和混合策略 1 混合策略的提出猜硬币博弈 29 03 2020 3 在这类博弈中不存在纯策略纳什均衡参与人的支付取决于其他参与人的策略以某种概率分布随机地选择不同的行动每个参与人都想猜透对方的策略而每个参与人又不愿意让对方猜透自己的策略这种博弈的类型是什么如何找到均衡上述博弈的特征是 29 03 2020 4 策略参与人在给定信息集的情况下选择行动的规则它规定参与人在什么情况下选择什么行动是参与人的相机行动方案纯策略如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动称为纯策略简称策略即参与人在其策略空间中选取唯一确定的策略混合策略如果一个策略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动称为混合策略参与人采取的不是明确唯一的策略而是其策略空间上的一种概率分布 2 混合策略混合策略博弈和混合策略纳什均衡 29 03 2020 5 混合策略vs 纯策略不确定性vs 确定性在博弈中博弈方的策略空间则博弈方以概率分布随机在其个可选策略中选择的策略称为一个混合策略其中对都成立且纯策略可以理解为混合策略的特例即在诸多策略中选择该纯策略的概率为1 选其他纯策略的概率为0 为何参与人可能会选择带不确定性的混合策略而放弃确定性的纯策略参与人主观因素造成的犹豫不决外在客观因素的不确定性带来应对策略的不确定性迷惑对手为了让其它参与人不能清楚了解自己的选择 29 03 2020 6 混合策略扩展博弈博弈方在混合策略的策略空间概率分布空间的选择看作一个博弈就是原博弈的混合策略扩展博弈混合策略纳什均衡 MNE 由最优的混合策略构成的混合策略组合 29 03 2020 7 对于任意混合策略组合若各参与人最终确定的组合纯策略组合为参与人的支付为发生此情况的概率为参与人的期望效用 3 期望效用 ExpectedPayoff 29 03 2020 8 由于混合策略伴随的是支付的不确定性因此参与人关心的是其期望效用最优混合策略是指在给定对方的混合策略的情况下使期望效用函数最大的混合策略在两人博弈里混合策略纳什均衡是两个参与人的最优混合策略的组合 29 03 2020 9 流浪流浪汉政府救济不救济寻找工作虽这模型没有PNE 却有下述的MNE 参与人以一定的概率选择某种策略然后计算相应于不同概率的期望效用 4 一个例子社会福利博弈 29 03 2020 10 设政府救济的概率 1 2 不救济的概率1 1 2 流浪汉寻找工作的期望效用 1 2 2 1 2 1 1 5流浪的期望效用 1 2 3 1 2 0 1 5 3 2 1 3 1 1 0 0 救济不救济1 寻找工作游荡1 此时流浪汉选择任何混合策略的期望效用都是1 5 则流浪汉的任何一种策略纯的 1或 0或混合的0 1 都是政府所选择的混合策略的最优反应 29 03 2020 11 3 2 1 3 1 1 0 0 救济不救济1 寻找工作游荡1 而当 0 21 0 8游荡寻找工作如果流浪汉选择这个混合策略政府的任何策略混合的或纯的带给政府的期望效用为 0 2 特别的以1 2的概率分别选择救济和不救济当然也是政府对于流浪汉所选择的混合策略的最有反应这样我们得到一个混合策略组合每一个参与人的混合策略都是给定对方混合策略是的最优选择从而构成混合策略纳什均衡策略期望收益政府 0 5 0 5 0 2流浪汉 0 2 0 8 1 5 既然参与人在构成混合策略时选择不同纯策略之间是无差异的他为什么不选择一个特定的纯策略而要以特定的概率随机地选择不同的纯策略呢一个参与人选择混合策略目的是给其他参与人造成不确定性海萨尼 Harsanyi 1973 对混合战略的解释是混合策略均衡等价于不完全信息下的纯策略均衡如社会福利博弈中假定有两类特征的流浪汉一类选择寻找工作另一类选择游荡每个流浪汉都知道自己的特征但政府并不知道流浪汉的准确特征只知道流浪汉20 概率属第一类 80 概率属第二类在这种情况下政府在选择自己的策略时似乎面临的是一位选择混合策略的流浪汉 29 03 2020 13 支付最大化法支付等值法最优反应函数法 4 2混合策略纳什均衡的求解 29 03 2020 14 参与人1的混合策略为 1 q 1 q 分别以概率q和1 q选择正面和反面参与人2的混合策略为 2 r 1 r 分别以概率r和1 r选择正面和反面 1 支付最大化法求纳什均衡猜硬币博弈 29 03 2020 15 E1 正面 1 r 1 1 r 1 2r 参与人1选取反面的期望效用为 E1 反面 1 r 1 1 r 2r 1 当给定参与人2选择混合策略 1 r 1 r 时参与人1的选取正面的期望效用为 29 03 2020 16 类似地得到参与人2的期望效用为 E2 E2 正面 r E2 反面 1 r 1 2q 2r 1 由一阶条件参与人1的期望效用为 E1 E1 正面 q E1 反面 1 q 1 2r 2q 1 29 03 2020 17 流浪1 流浪汉政府救济不救济1 工作即流浪汉以0 2的概率选择寻找工作 0 8的概率选择流浪同理可以根据流浪汉的期望效用函数找到政府的最优混合策略社会福利博弈 29 03 2020 18 对 0 2的解释如果流浪汉寻找工作的概率小于0 2 政府的最优选择是不救济如果流浪汉寻找工作的概率大于0 2 政府的最优选择是救济对 0 5的解释如果政府救济的概率大于0 5 流浪汉的最优选择是流浪如果政府救济的概率小于0 5 流浪汉的最优选择是寻找工作混合策略纳什均衡的含义纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择因此在社会福利博弈中 0 2 0 5是唯一的混合策略纳什均衡 29 03 2020 19 由上面的例子可以看出参与人选择的混合策略均使对方选择纯策略的期望效用相等促使各方均采取严格策合策略所以求解混合策略纳什均衡也可以采取如下方法求出参与人的每个纯策略的期望效用令其相等即可得到混合策略纳什均衡 2 支付等值法求纳什均衡 29 03 2020 20 参与人1的选取正面的期望效用为参与人1的选取反面的期望效用为 E1 正面 1 r 1 1 r 1 2r E1 反面 1 r 1 1 r 2r 1 令纯策略期望效用相等得类似地令参与人2的纯战略期望效用相等得猜硬币博弈 29 03 2020 21 假定最优混合策略存在给定流浪汉选择混合策略流浪流浪汉政府救济不救济寻找工作政府选择纯策略救济的期望效用为选择纯策略不救济的效用为如果一个混合策略而不是纯策略是政府的最优选择一定意味着政府在救济与不救济之间是无差异的社会福利博弈 29 03 2020 22 在讨论连续纯策略均衡时如古诺模型我们使用了反应函数的概念现在我们可以使用反应对应的概念来描述一个参与人对应于其他参与人混合策略的最优选择两个概念的区别仅仅在于反应函数表示的是一个参与人只有一个特定的策略是其他人给定策略的最优选择反应对应允许一个参与人有多个甚至无穷多个策略是其他人给定策略的最优选择 3 最优反应函数法求纳什均衡 29 03 2020 23 纯策略均衡反应函数 reactionfunction 在纯策略的范畴内最优反应函数是各博弈方选择的纯策略对其他博弈方纯策略的反应纯策略纳什均衡是博弈方反应函数的交叉点混合策略均衡反应对应 reactioncorrespondence 在混合策略的范围内博弈方的决策内容为选择概率分布最优反应函数就是一方对另一方的概率分布的反应由于纯策略可以理解为混合策略因此实际上最优反应函数的概念也可以在混合策略概率分布之间反应的意义上统一起来混合战略纳什均衡也是反应函数的交叉点 29 03 2020 24 混合策略反应函数猜硬币博弈 r 1 r 盖硬币方选择正反面的混合策略概率分布 q 1 q 猜硬币方选择正反面的混合策略概率分布 29 03 2020 25 夫妻之争博弈混合策略反应函数 r 1 r 丈夫的混合策略概率分布 q 1 q 妻子的混合策略概率分布 29 03 2020 26 例题监督博弈 a c F a F a c a 0 0 a a 检查 1 不检查税收机关逃税 1 不逃税纳税人其中 a 应纳税款 C 检查成本 F 罚款 a c F 检查到逃税者 a F 除了要交税款又要交罚款求MNE两种方法支付最大化方法求一阶导数为0 支付等值法即选两个纯战略是没差异假定C a十F 在这个假设下不存在纯战略纳什均衡让我们来求解混合战略纳什均衡 29 03 2020 27 假定C a十F 在这个假设下不存在纯战略纳什均衡让我们来求解混合战略纳什均衡 a 应纳税款 C 检查成本 F 罚款 a c F 检查到逃税者 a F 除了要交税款又要交罚款用表示税收机关检查的概率表示纳税人逃税的概率给定税收机关选择检查 1 和不检查 0 的期望收益分别为令 29 03 2020 28 给定纳税人选择逃税和和不逃税的期望收益分别为得令得因此混合战略纳什均衡是税收机关以的概率检查纳税人以的概率选择逃税结论而当则纳税人选择纳税与不纳税无差异另一解释是社会中有许多个纳税人其中有比例的纳税人选择逃税比例的纳税人选择不逃税税收机关以比例随机地检查纳税人的纳税情况纳税人选逃税概率越小检查成本C越高纳税人逃税的概率就越大为什么应纳税款越多纳税人逃税的概率反而越小呢这是因为应纳税款越多税收机关检查的概率越高逃税被抓住的可能性越大因而纳税人反而不敢逃税了这一点或许可以解释为什么逃税现象在小企业中比在大企业中更为普遍在低收入阶层比在高收入阶层更普遍 29 03 2020 31 即每一个有限博弈至少存在一个纳什均衡现实中的博弈都是可以当作有限博弈来解决这样纳什均衡的存在就是普遍的纳什均衡的普遍存在性是纳什均衡概念最重要的性质 4 3纳什均衡的存在性定理 29 03 2020 32 2 纳什定理的推广纳什均衡的存在性定理2 当博弈方个数有限战略集是非空闭的有界的支付函数是连续且拟凹的则博弈至少存在一个纯战略纳什均衡 Debreu 1952 Clicksberg 1952 Fan 1952 纳什均衡的存在性定理3 当博弈方有限战略集是非空闭的有界的支付函数是连续的则博弈至少存在一个纳什均衡纯战略的或混合战略的 Clicksberg 1952 29 03 2020 33 尽管纳什均衡非常重要但不是说学到了这种分析方法你就能预测所有博弈的结果纳什均衡分析仅仅保证有个体理性的智能人的博弈结果是唯一纯策略纳什均衡时的预测实际情况是纳什均衡分析并不能保证对所有博弈的结果都作出准确的预测现实中的博弈可能是下面三种情况之一 1 有许多博弈不存在纯策略纳什均衡 2 有些博弈是多重纳什均衡 3 博弈方可

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

混合策略纳什均衡.ppt

文档简介

温馨提示

最新文档

评论

混合策略纳什均衡.ppt

文档简介

温馨提示

最新文档

评论

相关文档