博弈论课件02.ppt_第1页
博弈论课件02.ppt_第2页
博弈论课件02.ppt_第3页
博弈论课件02.ppt_第4页
博弈论课件02.ppt_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论 第二章完全信息静态博弈 一博弈的策略式表述二占优策略均衡三重复剔除的占优均衡四纳什均衡五混合策略均衡六纳什均衡存在性及相关讨论 完全信息静态博弈完全信息 每个参与人对所有其他参与人的特征 包括策略空间 支付函数等 完全了解静态 所有参与人同时选择行动且只选择一次 同时 只要每个参与人在选择自己的行动时不知道其他参与人的选择 就是同时行动博弈分析的目的是预测均衡结果 第二章完全信息静态博弈 纳什均衡 一博弈的策略式表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五混合策略均衡六纳什均衡存在性及相关讨论 小游戏 两个同学一组 拿出纸和笔 在左和右之间做出你的选择 游戏规则 如果两人同时写右 两人各得8分 如果两人都写左 各得2分 如果一人写左 一人写右 写左的人得10分 写右的人得0分 在博弈论中 一个博弈可以用两种不同的方式来表达 一种是策略式表达 另一种是扩展式表达 策略式表达更适合于静态博弈 而扩展式表达更适合于讨论动态博弈 一 博弈的策略式表述 策略式表达又称为标准式表达 在这种表达中 所有参人同时选择自己的策略 所有参与人选择的策略一起决定每个参与人的得益 值得强调的是 这里参与人同时选择的是 策略 而不是 行动 在静态博弈中 参与人只选择一次 所以策略就等同于行动了 而在动态博弈中 策略是参与人在各个阶段的行动的全面计划 一 博弈的策略式表述 博弈的策略式表述 一 博弈的策略式表述 如 在两寡头产量博弈里 企业是参与人 产量是策略空间 利润是支付 博弈的策略式表述为 这里 分别为第i个企业的产量和利润 一 博弈的策略式表述 有限博弈1 参与人的个数是有限的 2 每个参与人可选的策略是有限的 两个人有限博弈的策略表述可以用矩阵形式表述 一 博弈的策略式表述 下面看看如何用博弈的策略式来描述囚徒困境 一 博弈的策略式表述 两个小偷甲和乙联手作案 私入民宅被警方逮住但未获证据 警方将两人分别置于两间房间分开审讯 政策是若一人招供但另一人未招 则招者立即被释放 未招者判入狱10年 若二人都招则两人各判刑8年 若两人都不招则未获证据但因私入民宅各拘留1年 如何描述这个博弈 他们将如何选择 囚徒困境 囚徒A 囚徒B 坦白 抵赖 坦白 抵赖 8大于 100大于 1 囚徒困境 坦白 坦白 是纳什均衡 下面看看如何用博弈的策略式来描述房地产开发博弈 一 博弈的策略式表述 房地产开发项目 假设有A B两家开发商市场需求 可能大 也可能小投入 1亿 房地产开发博弈 假定市场上有两栋楼出售 需求大时 每栋售价1 4亿 需求小时 每栋售价7千万 如果市场上只有一栋楼需求大时 可卖1 8亿需求小时 可卖1 1亿 房地产开发博弈 归纳起来有8种可能 需求大 你开发 他不开发 你利润8千万 他利润0 需求大 你不开发 他开发 你利润0 他利润8千万 需求大 你开发 他也开发 你和他利润各为4千万 需求大 你不开发 他也不开发 你和他利润各为0 需求小 你开发 他不开发 你利润1千万 他利润0 需求小 你不开发 他开发 你利润0 他利润1千万 需求小 你开发 他也开发 你和他的利润各为 3千万需求小 你不开发 他也不开发 你和他利润各为0 不开发 开发商A 开发 不开发 开发 开发商B 需求大的情况 博弈的策略式表述 房地产开发博弈 不开发 开发商A 开发 不开发 开发 需求小的情况 博弈的策略式表述 房地产开发博弈 再想想在开始的小实验中你们是如何分析的 一 博弈的策略式表述 练习 市场进入 有两个销售同样产品的销售商A和B打算进入某一区域性市场 由于这个区域市场对产品的需求是有限的 当他们都同时进入该区域市场时 他们各自占有的市场规模都偏小 从而造成1个单位的亏损 但是 当只有一个销售商进入该区域性市场时 则获得1个单位的利润 当然 不进入市场时的利润为零 假如A和B同时进行决策或者他们在进行各自的决策时并不知道另一方的选择 市场进入 博弈的策略式表述 练习 智猪博弈 有两头非常聪明的猪 一大一小 共同生活在一个猪圈里 在猪圈的一端放有一个猪食槽 在另一端安装有一个按钮 它控制着猪食的供应量 只要按一下 就会出现10个单位食物 但要付出2个单位的成本 每只猪都有按与不按两种选择 两只猪一起去按 然后一起回槽边进食 由于大猪吃得快可吃下7个单位的食物 小猪只能吃到3个单位食物 若大猪去按 小猪在槽边等候 则大猪由于来回跑耽误时间只吃得6单位食物 小猪吃得4单位 若小猪去按 小猪只吃得1单位 大猪吃9单位两只猪都不去按 则什么也吃不到 智猪博弈 等待 小猪 大猪 按 等待 按 4大于10大于 1 纳什均衡 大猪按 小猪等待各得四个单位 4 4 多劳者不多得 智猪博弈 大猪小猪博弈股份公司中大股东小股东监督纳什均衡 大股东担当监督经理的责任 小股东搭便车村中的富人穷人修路纳什均衡 大户修路改革中得到好处多的少的改革股市的大户小户炒股纳什均衡 大户搜集信息 小户跟大户 智猪博弈 这个例子讲的是一男一女谈恋爱 有些业余活动要安排 或者去看足球比赛 或者去看芭蕾舞演出 男的偏好足球 女的则更喜欢芭蕾 但他们都宁愿在一起 不愿分开 这个博弈中 有两个纳什均衡 足球 足球 芭蕾 芭蕾 就是说 给定一方去足球场 另一方也会去足球场 类似的 给定一方去看芭蕾舞 另一方也会去看芭蕾舞 那么 究竟哪一个纳什均衡会实际发生 性别战 芭蕾 女 男 足球 芭蕾 足球 纳什均衡 足球 足球 芭蕾 芭蕾先动优势 性别战 斗鸡博弈 懦夫博弈 两个司机驾车相向行驶 每个人可以在相撞前转向一边而避免相撞 但这将使其被称作 懦夫 如果两人都向前 车毁人亡 若一人转向而另一人选择继续向前 则向前的司机将被称作 勇士 退 B A 进 退 进 独木桥 纳什均衡 A进 B退 A退 B进 斗鸡博弈 懦夫博弈 斗鸡博弈 村子里有两户富户 有两种可能 一家修 另一家就不修 一家不修 另一家就得修 冷战期间美苏抢占地盘 一方抢占一块地盘 另一方就占另一块 夫妻吵架 一方厉害 另一方就出去躲躲 注意 在混合战略纳什均衡条件下 也可能两败俱伤 协调博弈 一般 用户 供应商 先进 一般 先进 第二章完全信息静态博弈 纳什均衡 一博弈的策略表述二占优策略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例六纳什均衡存在性及相关讨论 二占优策略均衡 占优策略 不论其他人选择什么策略 参与人的最优策略是唯一的 这样的最优策略称为 占优策略 dominantstrategy 二占优策略均衡 占优策略均衡定义 在博弈的策略表达式中 如果对于所有的i Si 是i的占优策略 下列策略组合称为占优策略均衡 二占优策略均衡 占优策略 dominantstrategy 一般来说 由于每个参与人的得益是博弈中所有参与人的策略的函数 因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择 但在一些特殊的博弈中 一个参与人的最优策略可能可以不依赖于其他参与人的策略选择 就是说 不论其他参与人选择什么策略 他的最优策略是唯一的 这样的最优策略被称为 占优策略 如果一个博弈中 某个参与人有占优策略 那么该参与人的其他可选择策略就被称为 劣策略 在一个博弈里 如果所有参与人都有占优策略存在 那么占优策略均衡是可以预测到的唯一的均衡 因为没有一个理性的参与人会选择劣策略 所以在囚徒困境博弈里 坦白 坦白 是占优策略均衡 二占优策略均衡 二占优策略均衡 注意 如果所有人都有 严格 占优策略存在 那么占优策略均衡就是可以预测的唯一均衡 占优策略只要求每个参与人是理性的 而不要求每个参与人知道其他参与人是理性的 也就是说 不要求理性是共同知识 为什么 二占优策略均衡 案例 囚徒困境 囚徒A 囚徒B 坦白 抵赖 坦白 抵赖 8大于 100大于 1 8大于 100大于 1 二占优战略均衡 第二次世界大战胜利在望 可是为了给自己捞取功劳 一个飞行大队的指挥官没完没了地下达提高下属的任务定额 弄得所有的人都人心惶惶 投弹手尤塞里安不想成为胜利前夕的最后一批牺牲品 千方百计逃避任务 他的上级问 假如 我的士兵都象你这样想 这仗还怎么打 可尤塞里安回答到 那我若不这么想 岂不成了一个大傻瓜 二占优策略均衡 不开发 开发商A 开发 不开发 开发 不开发 开发商B 开发商A 开发 不开发 开发 开发商B 需求小的情况 需求大的情况 等待 小猪 大猪 按 等待 按 智猪博弈 大猪有无严格占优策略 二占优策略均衡 下面参与者有占优策略吗 二占优策略均衡 性别战 芭蕾 女 男 足球 芭蕾 足球 斗鸡博弈 退 B A 进 退 进 独木桥 协调博弈 一般 用户 供应商 先进 一般 先进 第二章完全信息静态信息博弈 纳什均衡 一博弈的策略表述二占优策略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例六纳什均衡存在性及相关讨论 三重复剔除的占优均衡 重复剔除严格劣策略 思路 首先找到某个参与人的劣策略 假定存在 把这个劣策略剔除掉 重新构造一个不包含已剔除策略的新的博弈 然后再剔除这个新的博弈中的某个参与人的劣策略 一直重复这个过程 直到只剩下唯一的策略组合为止 这个唯一剩下的策略组合就是这个博弈的均衡解 称为 重复剔除的占优均衡 三重复剔除的占优均衡 注意 与占优策略均衡中的占优策略和劣策略不同 这里的占优策略或劣策略可能只是相对于另一个特定策略而言 三重复剔除的占优均衡 等待 小猪 大猪 按 等待 按 案例 智猪博弈 按 是大猪的占优策略 纳什均衡 大猪按 小猪等待 三重复剔除的占优均衡 M 列先生 行先生 U D L R 行 没有占优策略列 M严格优于R剔除R 行 L优于D列 无占优策略剔除D M优于L U M 是重复剔除的占优均衡 三重复剔除的占优均衡 卑斯麦海之战卑斯麦海之战发生在1943年的南太平洋上 日本海军上将木村受命将日本陆军运抵新几内亚 其间要穿越卑斯麦海 而美国上将肯尼欲对日军运输船进行轰炸 穿越卑斯麦海通往新几内亚的有两条航线 木村必须从中选一条 而肯尼则必须决定将其飞机派往何处去搜索日军 如果肯尼将他的飞机派到了错误的航线上 他虽可以召回他们 但可供轰炸的天数将减少 木村 肯尼 北 南 北 南 三重复剔除的占优均衡 练习 在下列策略式表达中 找出重复剔除的占优均衡 C2 R1 R2 C1 C3 R3 三重复剔除的占优均衡 注意 1 重复剔除的占优均衡结果与劣策略的剔除顺序是否有关取决于剔除的是否是严格劣策略 2 重复剔除的占优均衡要求每个参与人是理性的 而且要求 理性 是参与人的共同知识 即 所有参与人知道所有参与是理性的 所有参与人知道所有参与人知道所有参与是理性的 三重复剔除的占优均衡 C2 R1 R2 C1 C3 R3 剔除顺序 R3 C3 C2 R2 策略组合 R1 C1 故一般使用严格劣策略剔除 可以看到 R1 C3 R1 C1 都是纳什均衡 但在这里是不可解的 剔除顺序 C2 R2 C1 R3 策略组合 R1 C3 举例 三重复剔除的占优均衡 尽管许多博弈中重复剔除的占优均衡是一个合理的预测 但并不总是如此 尤其是大概支付某些极端值的时候 参与人B 参与人A U D L R U是A的最优选择 但是 只要有1 1000的概率B选R A就会选D 房地产开发中需求小情况 不开发 开发商A 开发 不开发 开发 不开发 开发商B 开发商A 开发 不开发 开发 开发商B 需求小的情况 需求大的情况 斗鸡博弈 退 B A 进 退 进 独木桥 纳什均衡 A进 B退 A退 B进 对于相当多的博弈 我们无法运用重复剔除劣策略的方法找出均衡解 为了找出这些博弈的均衡解 需要引入纳什均衡 第二章完全信息静态信息博弈 纳什均衡 一博弈的策略表述二占优策略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例六纳什均衡存在性及相关讨论 四纳什均衡 假设有n个人参与博弈 给定其他人战略的条件下 每个人选择自己的最优战略 个人最优可能依赖于也可能不依赖于其他人的战略 所有参与人的最优战略组成的一个组合就是纳什均衡 这种战略组合由所有参与人的最优战略组成 也就是说 给定别人战略的情况下 没有任何单个参与人有积极性选择其他战略 从而没任何人有积极性打破这种均衡 用句不太褒义的话来说 纳什均衡是一种 僵局 给定别人不动的情况下 没有人有兴趣动 四纳什均衡 通俗地说 纳什均衡的含义就是 给定你的策略 我的策略是最好的策略 给定我的策略 你的策略也是你的最好的策略 即双方在给定的策略下不愿意调整自己的策略 四纳什均衡 寻找纳什均衡 划线法 找出他相对于对手的每种可能的额策略选择的相对优势策略 并在自己的得益也即支付下划线 四纳什均衡 寻找纳什均衡 划线法 C2 R1 R2 C1 C3 R3 参与人B 参与人A R3 C3 是纳什均衡 64 寻找纳什均衡 划线法 市场进入阻挠博弈 有一个垄断者已在市场上 称为在位者 另一个企业虎视耽耽想进入 称为进入者 进入者有两个战略可以选择 进入 不进入 在位者也有两个战略 默许 斗争 假定进入之前的垄断利润为300 进入之后寡头利润为100 进入成本为10 最终结果会如何 高成本 市场进入阻挠博弈 如果我们想用重复剔除弱劣战略的方法找到博弈的解 斗争是在位者的弱劣策略 50 0 300 300 因而被剔除 进入 默许 是唯一剩下的没有被剔除的策略组合 因而是重复剔除的占优均衡 纳什均衡 不进入 斗争 被剔除掉了 这个例子也说明 弱 纳什均衡允许弱劣策略的存在 68 寻找纳什均衡 箭头法 对博弈中的每个策略组合进行分析 考虑在这个策略组合下各个局中人是否能够通过单独改变自己的策略而增加支付 如果能够在对手保持策略不变的情况下 通过单独改变自己的策略选择 形成新的策略组合而增加自己的支付 那么原来的策略组合就不是博弈的具有稳定性的结果 把它排除在均衡之外 剩下没有被排除的就是博弈的纳什均衡 69 寻找纳什均衡 箭头法 70 寻找纳什均衡 箭头法 四纳什均衡 美苏古巴导弹危机冷战期间美苏争霸最严重的一次危机 苏联 面临将导弹撤回国还是坚持部署在古巴的选择 美国 挑起战争还是容忍苏联的了挑衅行为 结果 苏联 将导弹从古巴撤回 做了丢面子的 撤退的鸡 美国 坚持自己的的策略 做了 不退的鸡 但是象征性地从土耳其撤回了一些导弹 给苏联一点面子 独木桥 四纳什均衡 C2 R1 R2 C1 C3 R3 剔除顺序 R3 C3 C2 R2 策略组合 R1 C1 故一般使用严格劣策略剔除 可以看到 R1 C3 R1 C1 都是纳什均衡 但在这里是不可解的 剔除顺序 C2 R2 C1 R3 策略组合 R1 C3 请用上述划线法寻找下列纳什均衡 囚徒A 囚徒B 坦白 抵赖 坦白 抵赖 囚徒困境 练习 等待 小猪 大猪 按 等待 按 智猪博弈 性别战 芭蕾 女 男 足球 芭蕾 足球 斗鸡博弈 退 B A 进 退 进 独木桥 协调博弈 一般 用户 供应商 先进 一般 先进 练习 找出下列两队夫妻的纳什均衡 死了 恩爱夫妻 活着 死了 活着 死了 妻子 相互仇恨夫妻 活着 死了 活着 妻子 丈夫 丈夫 四纳什均衡 纳什均衡与占优策略均衡及重复剔除的占优均衡 1 每一个占优策略均衡及重复剔除的占优均衡一定是纳什均衡 但并非每一个纳什均衡都是占优策略均衡或重复剔除的占优均衡 2 纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉的策略组合 但没有被剔除掉的组合不一定是纳什均衡 除非它是唯一的 不适用于严格弱劣策略的情况 市场进入阻挠 斗争 在位者 进入者 进入 不进入 默许 纳什均衡 进入 默许 不进入 斗争 四纳什均衡 用重复剔除弱劣策略的方法找均衡 第二章完全信息静态信息博弈 纳什均衡 一博弈的战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五混合战略纳什均衡六纳什均衡存在性及相关讨论 五混合策略纳什均衡 社会福利博弈 流浪 流浪汉 政府 救济 不救济 寻找工作 没有一个战略组合构成纳什均衡 五混合战略纳什均衡 反面 正面 反面 正面 猜谜游戏两个儿童各拿一枚硬币 若同时正面朝上或朝下 A给B1分钱 若只有一面朝上 B给A1分钱 零和博弈博弈参与者有输有赢 但结果永远是0 没有一个战略组合构成纳什均衡 五混合战略纳什均衡 警察与小偷 银行 酒馆 警察 小偷 2万元 1万元 东边 西边 警察与小偷的最优策略各是什么 五混合战略纳什均衡 上述博弈的特征是 在这类博弈中 都不存在纯纳什均衡 参与人的支付取决于其他参与人的战略 以某种概率分布随机地选择不同的行动每个参与人都想猜透对方的战略 而每个参与人又不愿意让对方猜透自己的战略 这种博弈的类型是什么 如何找到均衡 五混合战略纳什均衡 请举一些这样的例子 石头 剪子 布游戏老虎 杠子 鸡 虫子游戏扑克游戏橄榄球赛战争中 西边 东边 西边 东边 五混合战略纳什均衡 警察抽签决定去银行还是酒馆 2 3的机会去银行 1 3的机会去酒馆 同样 小偷也抽签决定去银行还是酒馆 2 3的机会去酒馆 1 3的机会去银行 五混合战略纳什均衡 社会福利博弈 流浪 流浪汉 政府 救济 不救济 寻找工作 设 政府救济的概率 1 2 不救济的概率 1 2 流浪汉 寻找工作的期望效用 1 2 2 1 2 1 1 5流浪的期望效用 1 2 3 1 2 0 1 5因此 流浪汉的任何一种战略都是都是对政府混合战略的最优反应 五混合战略纳什均衡 社会福利博弈 流浪 流浪汉 政府 救济 不救济 寻找工作 设 政府救济的概率 1 2 不救济的概率 1 2 流浪汉 寻找工作的概率 0 2 流浪的概率 0 8每个参与人的战略都是给定对方混合战略时的最优战略 五混合战略纳什均衡 反面 正面 反面 正面 猜谜游戏两个小孩的最优策略是采取每个策略的可能性均为1 2 每个小孩各取策略的1 2是纳什均衡 零和博弈 五混合战略纳什均衡 请举一些这样的例子 石头 剪子 布游戏老虎 杠子 鸡 虫子游戏扑克游戏橄榄球赛战争中这样的博弈的均衡是混合战略纳什均衡 五混合战略纳什均衡 战略 参与人在给定信息集的情况下选择行动的规则 它规定参与人在什么情况下选择什么行动 是参与人的 相机行动方案 纯战略 如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动 该战略为纯战略 混合战略 如果一个战略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动 则该战略为混合战略 五混合战略纳什均衡 混合战略 如果一个战略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动 则该战略为混合战略 五混合战略纳什均衡 纯战略可以理解为混合战略的特例 即在诸多战略中 选该纯战略si的概率为1 选其他纯战略的概率为0 等待 小猪 大猪 按 等待 按 反面 正面 反面 正面 五混合战略纳什均衡 如何寻找混合战略纳什均衡 支付最大化法支付等值法由于混合战略伴随的是支付的不确定性 因此参与人关心的是其期望效用 最优混合战略 是指使期望效用函数最大的混合战略 给定对方的混合战略 在两人博弈里 混合战略纳什均衡是两个参与人的最优混合战略的组合 五混合战略纳什均衡 流浪 流浪汉 政府 救济 不救济 寻找工作 即 流浪汉以0 2的概率选择寻找工作 0 8的概率选择游荡 同样 可以根据流浪汉的期望效用函数找到政府的最优混合战略 支付最大化法 五混合战略纳什均衡 社会福利博弈 流浪 流浪汉 政府 救济 不救济 寻找工作 设 政府救济的概率 1 2 不救济的概率 1 2 流浪汉 寻找工作的概率 0 2 流浪的概率 0 8每个参与人的战略都是给定对方混合战略时的最优战略 五混合战略纳什均衡 假定最优混合战略存在 给定流浪汉选择混合战略 r 1 r 政府选择纯战略救济的期望效用为 3r 1 1 r 4r 1选择纯战略不救济的效用为 1r 0 1 r r如果一个混合战略 而不是纯战略 是政府的最优选择 一定意味着政府在救济与不救济之间是无差异的 4r 1 rr 0 2 流浪 流浪汉 政府 救济 不救济 寻找工作 支付等值法 五混合战略纳什均衡 社会福利博弈 流浪 流浪汉 政府 救济 不救济 寻找工作 设 政府救济的概率 1 2 不救济的概率 1 2 流浪汉 寻找工作的概率 0 2 流浪的概率 0 8每个参与人的战略都是给定对方混合战略时的最优战略 五混合战略纳什均衡 对的解释 如果流浪汉以找工作的概率小于0 2 则政府选择不救济 如果大于0 2 政府选择救济 只有当概率等于0 2时 政府才会选择混合战略或任何纯战略 对 0 5的解释如果政府救济的概率大于0 5 流浪汉的最优选择是流浪 如果政府救济的概率小于0 5 流浪汉的最优选择是寻找工作 五混合战略纳什均衡 混合战略纳什均衡的含义 纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择 因此在社会福利博弈中 0 5是唯一的混合战略纳什均衡 从反面来说 如果政府认为流浪汉选择寻找工作的概率严格小于0 2 那么政府的唯一最优选择是纯战略 不救济 如果政府以1的概率选择不救济 流浪汉的最优选择是寻找工作 这又将导致政府选择救济的战略 流浪汉则选择游荡 如此等等 五混合战略纳什均衡 反面 正面 反面 正面 用上述方法 求该猜谜游戏的混合战略纳什均衡 五混合战略纳什均衡 练习 模型化下述划拳博弈 两个老朋友在一起喝酒 每个人有四个纯战略 杠子 老虎 鸡和虫子 输赢规则是 杠子降鸡 鸡吃虫子 虫子降杠子 两人同时出令 如果一个打败另一个 赢的效用为1 输的效用为 1 否则效用为0 写出这个博弈的支付矩阵 这个博弈有纯战略均衡吗 计算其混合战略纳什均衡 第二章完全信息静态信息博弈 纳什均衡 一博弈的战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五混合战略纳什均衡六纳什均衡存在性及相关讨论 六纳什均衡存在性及相关讨论 不同均衡概念的关系 占优均衡DSE 重复剔除占优均衡IEDE 纯战略纳什均衡PNE 混合战略纳什均衡MNE 六纳什均衡存在性及相关讨论 纳什均衡存在性定理 每一个有限博弈至少存在一个纳什均衡 纯战略的或混合战略的 六纳什均衡存在性及相关讨论 一个博弈可能有多个均衡 两个人分蛋糕 性别战中的博弈 纳什均衡的多重性 博弈论并没有一个一般的理论证明纳什均衡结果一定能出现 芭蕾 女 男 足球 芭蕾 足球 六纳什均衡存在性及相关讨论 如何保证均衡出现 1 聚点 均衡 参与人可以使用某些被抽象掉的信息达到一个 聚点均衡 两个人分蛋糕 性别战中的博弈 两人同时给对方打电话 六纳什均衡存在性及相关讨论 2 廉价磋商 协调博弈 尽管无法保证磋商会达成一个协议 即使达成协议也不一定会被遵守 但在一些博弈中 事前磋商确实可以使某些均衡实际上出现 R B A U D L R B A U D L 聚点 六纳什均衡存在性及相关讨论 猎人博弈和帕累托优势 打兔 猎人乙 猎人甲 猎鹿 打兔 猎鹿 有两个纳什均衡 10 10 与 4 4 可以认为 10 10 比 4 4 有帕累托优势 六纳什均衡存在性及相关讨论 大流士阴谋推翻波斯王国的故事 当时 一群波斯贵族聚在一起决定推翻国王 其间有人提议休会 大流士此时站出来大声疾呼 说如果休会的话 就一定会有人去国王那里告密 因为如果别人不那么做的话 他自己就会去做 大流士说唯一的办法就是冲进皇宫 杀死国王 这个谋反的故事还提供了关于协调博弈的出路 在杀死国王之后 贵族们想从自己人中推选出一个人当国王 他们决定不自相残杀 而是在佛晓十分到山上去 谁的马先叫谁就当国王 大流士的马夫在这场随机的安排中做了手脚 从而成为国王 六纳什均衡存在性及相关讨论 3 学习过程假定博弈重复多次 即使参与人最初难以协调行动 在博弈若干次后 某种特定的协调模式可能会形成 特别地 假定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论