完全信息静态博弈:纳什均衡.ppt_第1页
完全信息静态博弈:纳什均衡.ppt_第2页
完全信息静态博弈:纳什均衡.ppt_第3页
完全信息静态博弈:纳什均衡.ppt_第4页
完全信息静态博弈:纳什均衡.ppt_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

wuweiwei100 博弈分析的目的是预测博弈的均衡结果 即给定每个参与人都是理性的 什么是所有参与人最优的策略组合 纳什均衡是完全信息静态博弈解的一般概念 也是所有其他类型博弈解的基本要求 我们先介绍几种纳什均衡解的特殊情况 再定义一般意义下的纳什均衡 完全信息静态博弈 纳什均衡 wuweiwei100 一 占优策略均衡 什么是 占优策略均衡 占优策略均衡求解举例对 囚徒困境 模型结果的说明 囚徒困境 模型的应用 囚徒困境 与社会福利 wuweiwei100 1 什么是 占优策略均衡 一般来说 由于每个参与人的得益是博弈中所有参与人的策略的函数 因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择 但在一些特殊的博弈中 一个参与人的最优策略可能可以不依赖于其他参与人的策略选择 也就是说 不论其他参与人选择什么策略 他的最优策略是唯一的 这样的最优策略被称为 占优策略 如果一个博弈中 某个参与人有占优策略 那么该参与人的其他可选择策略就被称为 劣策略 在一个博弈中 如果所有参与人都有占优策略存在 那么占优策略均衡是可以预测到的唯一的均衡 因为没有一个理性的参与人会选择劣策略 wuweiwei100 例囚徒困境博弈 乙 招不招 不招 招 甲 wuweiwei100 对于甲来说 不论乙选择 招 还是 不招 他选择 招 都比选择 不招 为好 因此 招 是占优策略 不招 是相对于 招 的劣战略 他不会选择劣战略 类似的 招 也是乙的占优策略 所以 在 囚徒困境 模型里 招 招 是占优策略均衡 wuweiwei100 2 占优策略均衡求解举例 下面这个博弈是否存在占优策略均衡 乙 甲 a b a b 对于甲而言 不论乙选择什么 a都是甲的占优策略 类似的 a也是乙的占优策略 所以 a a 是这个博弈的占优策略均衡 wuweiwei100 3 对 囚徒困境 博弈结果的说明 如果每个人都选择不招 各被判刑1年 显然比都判刑8年好 但在这样的一次博弈中 这个结果达不到 因为它不满足个人理性的要求 不招 不招 不是一个均衡 即使两个囚徒在作案之前建立一个攻守同盟也没有用 因为事到临头没有人有积极性去遵守这个协定 这反映了一个深刻的问题 即合作与利己之间的冲突 合作的结果会使博弈各方的状况更好 但由于追求利己 使得共同利益无法达到最大化 个人理性和集体理性的冲突 wuweiwei100 4 囚徒困境 博弈的应用 应用一价格战 乙 甲 a b a b 出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利 但实际上却是相互杀价 结果都赚不到钱 百事可乐 低价 高价 可口可乐 低价 高价 wuweiwei100 应用二军备竞赛 美苏争霸的 囚徒困境 20多年前 美国和苏联是世界上的两个超级大国 他们相互对垒 假定每一方都有两种策略 一个是扩军 发展战略核武器等 另一个是裁军 直至不设军备 扩军所需军费为2000亿美元 彻底裁军则军费为0 如果一方裁军 另一方扩军 则裁军方会遭受很大损失 甚至丧失主权 我们简单地把这种情况下裁军方的得益记作 即负无穷大 假定扩军方掠夺到一个有限数额的财富10000亿美元 由于付出2000亿美元军费 则扩军方的得益是8000亿美元 wuweiwei100 美苏两国如果不搞军备竞赛 各自把资源用于民品生产 不是很好吗 问题是 如果我把资源用于民品生产 而你增加军费支出 我不就受到威胁吗 这样对我不好 纳什均衡是两国都大量增加军费预算 两国的社会福利都变得更糟 苏联 美国 扩军 裁军 扩军 裁军 军备竞赛博弈 wuweiwei100 应用三公共产品的供给 设想有两户相居为邻的农家 十分需要有一条好路从居住地通往公路 修一条路的成本为4 每个农家从修好的路上获得的好处为3 如果两户居民共同出资联合修路 并平均分摊修路成本 则每户居民获得净的好处 得益 为3 4 2 1 当只有一户人家单独出资修路时 修路的居民获得的得益为3 4 1 亏损 搭便车 不出资但仍然可以使用修好的路的另一户人家获得得益3 0 3 wuweiwei100 修路博弈 张三 修 不修 修 不修 李四 wuweiwei100 我们看到 对两家居民来说 修路 都是劣战略 因而他们都不会出资修路 这里 为了解决这条新路的建设问题 需要政府强制性地分别向每家征税2单位 然后投入4单位资金修好这条对大家都有好处的路 并使两家居民的生活水平都得到改善 wuweiwei100 这就是我们看到的为什么大多数路 桥等公共设施都是由政府出资修建的原因 同样的道理 国防 教育 社会保障 环境卫生等都由政府承担资金投入 私人一般没有积极性承担这方面服务的积极性和能力 wuweiwei100 应用四寡头竞争 设想在一个镇上只有两个居民 杰克和吉尔 拥有能生产饮用水的水井 每周六 杰克和吉尔决定抽取多少加仑水 带到镇上 并以市场所能承受的价格出售 为了简单起见 假设杰克和吉尔可以没有成本地想抽取多少水就抽取多少水 镇上水的需求可以表示如下 wuweiwei100 小镇水需求情况 wuweiwei100 如果两人合作 结成卡特尔 则能够达到总收益的最大化 即两人总共生产60加仑 二人平均划分市场的话 每人将生产30加仑 以每加仑60美元的价格出售 总收益为3600美元 每人得到1800美元收益 但是 追求私利的结果是两人将各生产40加仑 各获得收益1600美元 寡头博弈 wuweiwei100 世界石油的大部分生产国家形成了一个卡特尔 称为世界石油输出国组织 OPEC 欧佩克于1960年成立 目前共有12个成员国 它们是 阿尔及利亚 伊朗 伊拉克 科威特 利比亚 尼日利亚 卡塔尔 沙特阿拉伯 阿联酋 委内瑞拉 安哥拉 厄瓜多尔 此外 过往成员包括印度尼西亚和加蓬 这些国家控制了世界石油储藏量的四分之三 正如任何一个卡特尔一样 欧佩克努力确定每个成员国的生产水平 力图通过协调减少产量来提高其产品的价格 欧佩克想维持石油的高价格 但是 每个成员都受到增加生产以得到更大利润份额的诱惑 因此 欧佩克成员常常就减少产量达成协议 然后又私下违背协议 wuweiwei100 应用五做广告 当两个企业用广告来吸引相同的顾客时 它们面临与囚犯两难处境类似的问题 考虑两家烟草公司万宝路和骆驼面临的决策 wuweiwei100 广告博弈 骆驼 做广告 不做广告 做广告 不做广告 万宝路 wuweiwei100 尽管两家企业都不做广告状况会更好 但是两家都选择了做广告 1971年 国会通过了禁止在电视上做香烟广告的法律 令许多观察者奇怪的是 烟草公司并没有利用它们政治上相当大的影响力去反对这项法律 这项法律为烟草公司做了一件它们自己做不到的事 它通过强制实现了低广告高利润的合作 结果解决了囚犯的两难处境问题 wuweiwei100 5 囚徒困境 与社会福利 囚犯的两难处境描述生活中的许多情况 并说明了 即使合作使每个参与者的状况变好 要维持合作也是困难的 这种缺乏合作从整个社会角度来看是一个问题吗 回答取决于环境 警察审问两个嫌犯的情况下 嫌犯之间缺乏合作是合意的 因为它使警察可以制止更多的犯罪行为 这种情况对囚犯来说是两难处境 但对社会其他人来说是一种福音 在企图维持垄断利润的寡头情况下 缺乏合作是合意的 因为垄断结果对寡头是好的 但对物品的消费者是坏的 而在军备竞赛中 非合作均衡对社会和参与者都是不好的 wuweiwei100 二 重复剔除的占优均衡 在每个参与人都有占优策略的情况下 占优策略均衡是一个非常合理的预测 不过 在绝大多数博弈中 占优策略均衡是不存在的 但在有些博弈中 我们仍可以应用占优的逻辑找出均衡 重复剔除严格劣策略 的思路 智猪博弈 智猪博弈 的应用对重复剔除的占优均衡的说明 wuweiwei100 1 重复剔除严格劣策略 的思路 严格劣策略重复剔除博弈1 A 左 中 上 下 B 右 对A来讲 没有占有策略 因此该例没有占优策略均衡 观察B 无论A选 上 还是 下 右 的得益严格少于 中 的得益 我们说B的 右 策略严格劣于 中 策略 理性的B不会选择它 因此可将之剔除 得到的得益矩阵为 wuweiwei100 此时 A的 下 策略相对其 上 策略是严格劣的 再把它剔除出去 得到得益矩阵为 严格劣策略重复剔除博弈2 A 左 中 上 下 B wuweiwei100 这时 明显可以看出 最后的均衡策略是 上 中 A B各自得益为1和3 严格劣策略重复剔除博弈3 A 左 中 上 B wuweiwei100 总结 重复剔除严格劣策略 思路 首先找出某个参与人的严格劣策略 假定其存在 把这个劣策略剔除掉 重新构造一个不包含已剔除策略的新的博弈 然后再剔除这个新的博弈中某个参与人的严格劣策略 继续这个过程 一直到只剩下一个唯一的策略组合为止 这个唯一剩下的策略组合就是这个博弈的均衡解 称为 重复剔除的占优均衡 wuweiwei100 2 智猪博弈 猪圈中有一头大猪和一头小猪 在猪圈的一端设有一个按钮 每按一下 位于猪圈另一端的食槽中就会有8单位的猪食进槽 但每按一下按钮会耗去2单位的成本 如果大猪先到食槽 则大猪吃到7单位食物 小猪仅能吃到1单位食物 如果两猪同时到食槽 则大猪吃5单位 小猪吃3单位食物 如果小猪先到 大猪 小猪各吃4单位食物 乙 甲 a b a b 小猪 大猪 按 等待 按 等待 wuweiwei100 首先剔除小猪的劣策略 按 此时 等待 成为大猪的劣策略 将之剔除 剩下的唯一策略组合 按 等待 是这个博弈唯一的均衡 结果是大猪选择 按 小猪选择 等待 得益分别为2和4个单位 wuweiwei100 3 智猪博弈 的应用 应用一大股东与小股民的角色差异股份公司里 股东应承担起监督经理的职能 但是 监督成本是很高的 这里 大股东相当于智猪博弈中的大猪 小股东相当于小猪 大股东因为利益攸关会担当起搜集信息监督经理的责任 小股东则 搭便车 坐享其成 wuweiwei100 应用二公共产品的提供 囚徒困境博弈解释了各家经济实力大致相当情形下公共品的提供问题 如果双方经济实力相差很大 可以用智猪博弈来解释 村里住两户人家 一户富 一户穷 有一条路年久失修 这时候 富户一般会承担起修路的责任 穷户则很少这样干 因为富户家常常是高朋满座 坐车坐轿的都来 而穷户家只是自己穿着旧鞋走路 路修好了他走起来舒服 路修不好他也无所谓 wuweiwei100 4 对重复剔除的占优均衡的说明 参与人B 参与人A L R U D U L 是重复剔除的占优均衡 因为 A百分之百地确信B是理性的因而会选择L 那么U是A的最优选择 但是 即使有千分之一的概率B会选择R 则D就优于U 重复剔除的占优均衡不仅要求每个参与人是理性的 而且要求 理性 是参与人的共同知识 即所有人知道所有人是理性的 所有人知道所有人知道所有人是理性的 如此等等 wuweiwei100 三 纳什均衡 纳什均衡的含义对纳什均衡含义的强化理解纳什均衡的价值纳什均衡 占优策略均衡 重复剔除的占优均衡三者的关系划线法 wuweiwei100 1 纳什均衡的含义 含义 各博弈方都不愿单独改变策略 因为单独改变没好处 的策略组合 乙 招不招 不招 招 甲 囚徒困境博弈 wuweiwei100 用纳什均衡的含义检验以前的例子 A 左 中 上 下 B 右 张三 修 不修 修 不修 李四 wuweiwei100 2 对纳什均衡含义的强化理解 设想有一个居民点 居民住宅沿着一条公路均匀地排开 如下图 现在有两家杂货铺要在这个居民点开张 他们卖的东西一样 价格也完全一样 那么 两家杂货铺开在什么地方好呢 1 4 1 2 3 4 1 店铺选址 wuweiwei100 居民到哪个杂货铺买东西就看哪个离自己比较近 每个杂货铺都希望靠自己比较近的居民多一些 位于左边的要往右靠 位于右边的要往左靠 最后两家杂货铺都紧挨着位于中点1 2的位置 这是纳什均衡的位置 谁都不想偏离中点 wuweiwei100 3 纳什均衡的价值 纳什均衡的价值主要在于它有一些非常重要的性质 一致预测性 就是其中最重要的性质之一 一致预测性 是指这样一种性质 如果所有博弈方都预测一个特定的博弈结果会出现 那么所有的博弈方都不会利用该预测或者这种预测能力 选择与预测结果不一致的策略 即没有哪个博弈方有偏离这个预测结果的愿望 因此这个预测结果最终真会成为博弈的结果 只有纳什均衡才具有一致预测的性质 任何非纳什均衡的预测都不是一致预测 因此一致预测是纳什均衡的本质属性 如果一个博弈的所有博弈方都预测博弈结果是某个纳什均衡 那么由于纳什均衡策略组合中各博弈方的策略都是对其他博弈方策略的最优选择 因此任一博弈方都不会单独改变策略 因此预测的结果会成为博弈的最终结果 wuweiwei100 4 纳什均衡与占优策略均衡 重复剔除的占优均衡 每一个占优策略均衡 重复剔除的占优均衡一定是纳什均衡 但并非每一个纳什均衡都是占优策略均衡或重复剔除的占优均衡 纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉的策略组合 但没有被剔除掉的策略组合不一定是纳什均衡 除非它是唯一的 在进行博弈分析之前先通过重复剔除严格劣策略方法来简化博弈是可行的 wuweiwei100 5 划线法 划线法 在每个博弈方对其他博弈方每个策略的最佳对策对应的得益下划线 B左中右 A 下 中 上 wuweiwei100 划线法练习 有两个纳什均衡 涉及动态博弈知识 以后会提到 进入者 默许 打击 进入 不进入 在位者 静态市场进入博弈 wuweiwei100 猜硬币博弈 各博弈方的利益和偏好始终不一致 在通常策略的基础上没有纳什均衡 这类博弈可以称为 严格竞争博弈 盖硬币方 正面 反面 正面 反面 猜硬币方 wuweiwei100 情侣博弈 特点 各博弈方的利益有很大一致性 有多个纳什均衡 大海 足球 芭蕾 足球 芭蕾 丽娟 wuweiwei100 情侣博弈问题举例 情侣博弈与决策有什么关系呢 这种合作比不合作好 但是在合作的大局下又不免有小算盘的对局 不就是情侣博弈吗 陈明 德语 法语 德语 法语 钟信 美国 巴顿 蒙帅 巴顿 蒙帅 英国 wuweiwei100 四 混合策略纳什均衡 严格竞争博弈和混合策略纳什均衡多重均衡博弈和混合策略纳什均衡 wuweiwei100 1 严格竞争博弈和混合策略纳什均衡 猜硬币博弈的多次重复中 博弈方决策应遵循两个原则 一是不能让对方知道自己的策略选择 二是要避免自己的选择带有规律性 否则对手就可以轻易战胜你 很显然 当两个博弈方都以1 2的概率随机选择正面 反面时 双方都无法根据对方的选择方式 选择自己的策略获得利益 从而达到一种稳定 或说均衡 博弈方以一定的概率分布在可选策略中随机选择的决策方式成为 混合策略 则原来意义上的策略称为 纯策略 策略扩展到包括混合策略时 纳什均衡概念仍然成立 如果混合策略组合构成一个纳什均衡 称为 混合策略纳什均衡 猜硬币博弈中博弈双方都以 1 2 1 2 的概率分布随机选择正面和反面的混合策略组合就是一个混合策略纳什均衡 wuweiwei100 寻找混合策略纳什均衡的思路 令各博弈方随机选择纯策略的概率分布 满足使其他博弈方采用不同策略的期望得益相同 从而计算出各个博弈方随机选择各纯策略的概率 在猜硬币博弈中 设盖硬币方出正面的概率为p 出反面的概率为1 p 则猜硬币方猜正面的期望得益为p 1 1 p 1 2p 1 猜反面的期望得益是p 1 1 p 1 1 2p 另二者相等 得p 1 2 盖硬币方的混合策略是以 1 2 1 2 的概率随机选择正面和反面 类似的 可以计算出猜硬币方的混合策略 wuweiwei100 例社会福利博弈 政府想帮助流浪汉 但前提是后者必须试图寻找工作 而流浪汉只有在得不到政府救济时才会寻找工作 社会福利博弈 政府 找工作 游荡 救济 不救济 流浪汉 得到混合策略纳什均衡 政府以0 5的概率分别选择救济和不救济 流浪汉以0 2的概率选择找工作 0 8的概率选择游荡 每个参与人的混合策略都是给定对方混合策略时的最优选择 wuweiwei100 例为什么偷税漏税的一般是中小企业 大企业会老老实实地交税 税务部门不会对所有企业的交税情况每一次都去检查 因为这样做的成本太高 得不偿失 所以 税务部门总是随机地对企业的交税情况进行检查 企业也是随机地在交税与偷漏税之间进行选择 税收部门与企业间进行的是混合战略博弈 因为如果企业总是交税 税务部门就最好不检查 但给定不检查 企业就会偷漏税 所以 两者只有税务部门在随机地检查与不检查 企业随机地在偷漏税与交税之间选择 才会达成均衡 wuweiwei100 对于大企业 因一旦偷税就数目巨大 所以 税务部门在随机检查时放在大企业上的可能性就大一些 而给定税务部门检查大企业的可能性较大 大企业偷漏税的行为就较少 否则就容易被逮个正着 所以 偷漏税较多的就是一些中小企业 大企业纳税的积极性较高 同样 大人物或有钱人纳税的积极性应较高 至于我国在过去一段时期有钱人反而不交税的现象主要源于制度不健全或已有的制度得不到贯彻所致 同样的道理 在犯罪或对错误的监督惩罚博弈中 也是混合博弈 人们可能总是大错不犯小错不断 wuweiwei100 2 多重均衡博弈和混合策略纳什均衡 情侣博弈中 博弈双方的利益具有一致性 他们都不害怕对方猜到自己的选择 因此决策思路与严格竞争博弈不同 但是 由于有两个纳什均衡 而且两人对这两个纳什均衡的偏好明显不同 因此 当两人从自身的最大利益出发独立同时决策时 在纯策略的范围内 也是无法对博弈双方的选择提出确定性建议的 需要考虑混合策略的可能性 wuweiwei100 情侣博弈 大海 足球 芭蕾 足球 芭蕾 丽娟 设p为丽娟选择芭蕾的概率 如果她不想让大海利用自己的选择倾向占上风 则自己的概率选择应使大海选择两种策略的期望得益相同 1 p 2 p 0 1 p 1 p 1 p 0 75 同样 设大海选择足球的概率为 则其选择也要使丽娟选两种策略的期望得益相同 1 1 1 0 1 2 0 75 wuweiwei100 当丽娟以 0 75 0 25 的概率随机选择芭蕾和足球 大海以 0 75 0 25 的概率随机选择足球和芭蕾时 双方都无法通过单独改变策略而提高利益 因此这一概率分布的组合构成一个混合策略纳什均衡 该混合策略纳什均衡给丽娟带来的期望得益是 1 p 1 p 0 1 p 1 1 p 1 2 0 5给大海带来的期望得益是 1 p 2 p 0 1 p 1 1 p 1 1 0 5 这个结果明显不如两人能交流协商 任何一方迁就另一方时双方的得益好 那时任何一方都至少得1 如果不强行设定双方不能交流的博弈规则 这种博弈问题一般不应该用上述博弈方式解决 wuweiwei100 练习制式问题 生活中有许多与情侣博弈类似的博弈问题 制式问题就是典型的一例 电子设备往往有不同的相关技术标准 称之为不同的制式 如果生产相关电子设备的厂商采用相同的制式 那么产品之间就能相互匹配 这对于推广各自的产品和在生产经营中进行合作很有帮助 设两个厂商同时计划引进彩电生产线 彩电有A B两种制式 这时两厂商之间就有一个选择制式的博弈问题 得益矩阵表示如下 wuweiwei100 该博弈也有两个纯策略纳什均衡 A A 和 B B 厂商1偏好后一个均衡 厂商2偏好前一个均衡 因此 究竟哪个纳什均衡能出现也没有必然的结论 这又是一个混合策略问题 厂商1 A B A B 厂商2 容易解出该博弈的混合策略纳什均衡 即厂商1以概率分布 0 4 0 6 随机选择A和B 厂商2以概率分布 2 3 1 3 随机选择A和B 在该混合策略纳什均衡下 双方期望得益分别为0 67和1 2 如果协商 双方采用纯策略纳什均衡中的任意一个 双方得益都比混合策略的期望得益要高 wuweiwei100 五 纳什均衡的存在性和多重性 纳什均衡的存在性 纳什定理纳什均衡的多重性 wuweiwei100 通俗地讲 纳什定理说的是 每一个有限博弈都至少有一个纳什均衡 但可能包含混合策略 纳什均衡具有两个重要性质 一致预测性和普遍存在性 正因为普遍存在性 纳什均衡是博弈结果的 一致预测 的性质才有意义 纳什均衡才会成为分析博弈和预测博弈结果的中心概念和基本出发点 1 纳什均衡的存在性 纳什定理 wuweiwei100 不同均衡概念之间的关系 混合策略纳什均衡 纯策略纳什均衡 重复剔除占优均衡 占优策略均衡 wuweiwei100 2 纳什均衡的多重性 一个博弈中存在的纳什均衡不止一个时 就是一个多重纳什均衡的博弈问题 如前所述 对大多数多重纳什均衡博弈来说 引进混合策略并没有解决问题 因为混合策略本身不一定比纯策略更好 而且对于确定哪个纯策略更好也没有作用 因此有必要对多重纳什均衡导致的选择问题作进一步探讨 wuweiwei100 帕累托上策均衡 有些博弈中虽然存在多个纳什均衡 但是可能这些纳什均衡有明显的优劣差异 所有博弈方都偏好其中同一个纳什均衡 这时各博弈方的选择就会是一致的 各方不但自己会选择该纳什均衡的策略 而且可以预料其他博弈方也会选择该纳什均衡的策略 因此不会有选择困难 wuweiwei100 例战争与和平博弈 该博弈有两个纯策略纳什均衡 战争 战争 和 和平 和平 其中 和平 和平 构成帕累托上策均衡 国家1 战争 和平 战争 和平 国家2 wuweiwe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论