已阅读5页,还剩164页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 完全信息静态博弈 即各博弈方同时决策,且所有博弈方对博弈 中的各种情况下的得益都完全了解的博弈问题。 2004-9-222 在纳什均衡中,各方的预期全部会实 现,所选的策略亦属最佳 -1994年宣布诺贝尔经济学奖得主时的新闻稿 均衡分析是经济学中的重要分析 n均衡即是平衡的意思,在英文中是equilibrium。 n在经济学中,均衡意即相关量处于稳定值。 n那么什么是博弈均衡呢?博弈均衡是一个稳 定的博弈结果。均衡是博弈的一种结果,但 不是说博弈的结果都能成为均衡。博弈的均 衡是稳定的,在某种情况下是可以预测的。 均衡分析是经济学中的重要分析 n均衡即是平衡的意思,在英文中是equilibrium。 n在经济学中,均衡意即相关量处于稳定值。 n那么什么是博弈均衡呢?博弈均衡是一个稳 定的博弈结果。均衡是博弈的一种结果,但 不是说博弈的结果都能成为均衡。博弈的均 衡是稳定的,在某种情况下是可以预测的。 均衡分析是经济学中的重要分析 根据普利高津的定律,系统总是处于一个 平衡态向另一个更高级的平衡态转变的过程, 但是平衡是有条件的,一旦打破这种平衡,系 统就会进入不平衡的状态,系统要素之间互动 ,就有可能进入更高一级的平衡态。 纳什均衡 n纳什均衡是一种最常见的均衡。 n它的含义是:在对方策略确定的情况下,每 个参与人的策略是最好的,此时没有人愿意 先改变或主动改变自己的策略。 纳什均衡纳什均衡 2.1纳什均衡(Nash Equilibrium) n 常用G表示一个博弈; nG有n个博弈方; n每个博弈方的全部可选策略的集合称策略空间 ,分用S1,Sn表示; nsijSi表示博弈方i的第j个策略(j可取有限个 值值(有限策略博弈),也可取无限个值值(无穷穷 策略博弈); nUi表示博弈方i的得益; nG=S1,Sn;u1,un 纳什均衡的定义1 n在博弈 中,如果由各个博弈方的各一 个策略组成的某个策略组合 中,任一博弈 方i的策略 ,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为G的一个“纳什均 衡”(Nash Equilibrium)。 n各博弈方都不愿单独改变策略的策略组合是纳 什均衡。 2.1纳什均衡(Nash Equilibrium) n某个参与人i,用-i指除了i之外的所有其他参与人 n将一个策略组合s分为参与人i的策略和其他参与人 的策略,可以写为:S= (Si,S-i); 2004-9-2210 纯策略纳什均衡的定义2: 即在一个纯策略组合中,如果给定其他人的策略 不变,任何局中人都没有积极性改变自己的策略 ,则该策略组合为一个纳什均衡。 2004-9-2211 纳什均衡的通俗解释: n给定你的策略,我的策略是我最好的策 略;给定我的策略,你的策略也是你的 最好的策略衡。 n双方在对方给定的策略下不愿意调整自 己的策略 n每个参与人所采取的策略都是对于其他 参与人的策略的最优反应 n定义1:在G=(S,U)中,Si和Si”表示Pi的两个策 略,若Ui(Si,S-i)Ui(Si”,S-i),对任意S-i S-i,则 称Si严格超于Si”,Si”相对于Si是严格劣策略。 n定义2:在G=(S,U)中,如果存在S*=(Si*,S-i*) ,满足Ui(Si*,S-i*)Ui(Si,S-i*),对任意S-i S-i*, 则称S*是G的一个NE。 n定义3:在一个策略组合Si*中,在其他参与人不会 改变已有策略的条件下,如果没有参与人用激励 去改变自身的策略,则称Si*为NE。 说明: n理解NE的最好办法就是构造一个策略组合,然后看每 个参与人的策略是否是参其他参与人策略的最好回应 。 n一个NE策略只要是对人其他NE策略的最佳应对,而不 必是对全部可能策略的最佳对。 n每一个优势策略均衡都是NE,但并非每一个NE都是优 势策略均衡。如果某一策略是优势的,那么它对于其 他参与人选择的任何策略而言都 是最佳应对,这其中 也包括其他参与人的均衡策略。而如果某一策略是NE 的组成部分,那么它只需对其他参与人的均衡策略而 言是最佳应对就可以了。 n在许多博弈中,NE并不是帕累托有效的。 nNE有强弱之分。 2.2基本分析思路和方法(NE求解) n2.2.1 占优优均衡(上策均衡) nDominant-strategy nDominant-strategy equilibrium:博弈分 析中最基本的均衡概念之一。占优均衡 分析是最基本的博弈分析方法。囚徒困 境(坦白,坦白) 2.2.2 重复剔除严严格劣策略(战战略) n重复剔除严格劣策略(严格下策反复消去法)iterated elimination of strictly dominated strategies n严格下策:strictly dominated strategy在一个博弈中, 不管其他博弈方的策略如何变化,一个博弈方的某种 策略给他带来的支付,总是比另一种策略给他带来的 支付要小,那么我们称前一种策略为相对于后一种策 略的严格劣策略(严格下策) n重复剔除的占优均衡 n 乙 坦白 抵赖 坦白 甲 抵赖 注:两博弈方同有两种相同的可选策略,策略和得益都 对称。两博弈方的唯一目标就是要实现自身价值的最 大得益。 -3,-3 0,-5 -5,0 -1,-1 17 宇宙法则的均衡点-1 n犹太人的宇宙法则:世界的一切都是按 78/22的比例存在的 n日本人藤田田在犹太人生意经开篇:“ 犹太人生意经里面存在着一条法则。犹太人 正是因循了这条法则,所以做起生意来才得 心应手,常胜不败,这条法则就是” 78/22 法则“,它构成了犹太生意经的根本。” 18 宇宙法则的均衡点-2 n美国理查得。考茨提出:80/ 20法则,改变 命运的黄金法则 n一个成功企业经营者的成功之处就在于他能 从企业发展的过程中找到创造78%利益的那 关键22% 大19 80/ 20法则 n80/ 20法则:帕累托法则、最省力法则、不 na 平衡法则 n管理大师师杜拉克:在一个产产品系列中,可能只 有其中的一两种是企业业利润润的真正源泉,而大 部分的其他产产品可能仅仅仅仅 是收支平衡,甚至有 很多是入不敷出 n在成千上万的客户户中,少数几个大客户户的订订 单单占了订单订单 的大部分,所有新开拓业务业务 中的 大部分可能是由数百名销销售人员员中的几个人发发 展起来的 n典型的情况是:80%的收获获来自20%的努力 ;其他80%的力气只带带来20%的结结果 大20 杜拉克认为管理者首先设立几条 管理的集中原则-1: n要想取得经济效益,管理者的精力应当集中于尽可能少的产品类别上 ,要善于发现20%的核心产品,在那些能创造高利润的产品上下功 夫 n企业员工的精力也应当集中于少数几项能真正带来商业效益的活动上 ,而在其他方面的投入则越少越好 n在企业的成本控制工作中,在效的控制也源自管理者将注意力集中于 少数几个领域上,它们在成本控制方面的改善可能对整个公司的业绩 产生显著的影响。即在这些领域中,效率方面较小的改善将引起整体 经济效益的大大提高 n在人力资源管理方面,要精挑细选,发现“关键少数”成员 n人员配置,特别是高级人才的配置必须向能够产生高额经济效益的业 务方向倾斜 大21 杜拉克认为管理者首先设立几条 管理的集中原则-2: n留住20%的关键顾客,如果企业80%的利润源自于20%的顾客, 就应尽力扩大对那20%顾客的影响力。把注意力分散给所有顾客, 是不明智的。作为营销人员,最重要的是确保顾客中关键的20%, 并把这20%顾客变成我们的顾客 n生产线、市场、营销渠道、最终用途等等也都适用这一原则 n企业管理中切忌把精力放在那些消耗了企业主要成本,但数量小、利 润薄的事情上 2.2.2 重复剔除严格劣策略(战略) n应用 n博弈方1 n博弈方2 2004-9-2223 例2:博弈G如右图: 1 , 01 , 3-1 , 1 0 , 40 , 20 , 0 局中人 左 中 右 反复消去严格被优超策略 2004-9-2224 解:局中人的策略“ 右”是策略“中”的严格被优 超策略,消去策略“右”后为 : 0 , 4 1 , 0 0 , 2 1 , 3 左 中 局中人的策略“下” 是策略“上”的严格被优超 策略,消去策略“下”后为 : 1 , 01 , 3 左 中 上 局中人的策略“左”是策 略“中”的严格被优超策略, 消去策略“左”后为可知(上 ,中)就是该博弈反复消去 严格被优超策略均衡。 1 , 01 , 3-1 , 1 0 , 40 , 20 , 0 1 3 2004-9-2225 严格被优超策略反复消去法中每次消 去的必须是严格优超策略,否则会出现一 些意想不到的结果。 例2:博弈G如下图: 1 , 81 , 62 , 8 0 , 8 0 , 8 0 , 91 , 5 0 , 80 , 6 局中人 L M R 注意 2004-9-2226 1 , 81 , 62 , 8 0 , 8 0 , 8 0 , 91 , 5 0 , 80 , 6 解:1)局中人的策 略“L”和“M”都是策略“R” 的被优超策略(不是严格被 优超策略),消去策略“L” 和“M”后为: 0 , 9 0 , 8 1 , 8 R 局中人的策略“S”和“D”都是策 略“U”的严格被优超策略,消去策略 “S”和“D” 后剩下唯一策略组合( U,R)。 L M R 2004-9-2227 2)局中人的策 略“S”和“D”都是策略 “U”的被优超策略(不 是严格被优超策略), 消去策略“S”和“D” 后 为: 1 , 81 , 62 , 8 L M R U 局中人的策略“M”和“R”都是策略“L”的被 优超策略(不是严格被优超策略) ,消去策略 “M”和“L”后剩下唯一策略组合(U,L)。 1 , 81 , 62 , 8 0 , 8 0 , 8 0 , 91 , 5 0 , 80 , 6 U S D 例:俾斯麦之战 n“俾斯麦之战”发生在1943年的南太平洋 上。日本海军上将木村受命将日本陆军 运抵新几内亚,其间要穿越俾斯麦海通 往新几内亚有两条航线:较短的北线和 较长的南线,木村必须从中选择一条。 而肯尼则必须决定将其飞机派往何处去 搜索日军。如果肯尼将他的飞机派到了 错误的航线上,他虽然可以召回它们, 但可供轰的天数就会减少。 双方行动集相同:北,南 n 木村 北 南 北 肯尼 南 注:弱优势策略均衡:在剔除了每个参与人的全部弱劣势策略后 所得到的一个策略组合。 重复剔除优势均衡:首先从一参与人的策略集里剔除掉一个弱劣策 略,再重新考察各个参与人剩下的策略中哪些是弱劣的并剔除其 中之一,继续这一过程直到每一个参与人都仅剩一个策略。这样 得到的策略组合就称之为重复剔除优势均衡。 2,-2 2,-2 1,-1 3,-3 2.2.3 划线线法 n博弈方的最终目标:实现自身利益的最大化 n取决于自己选择的策略,也取决于其他博弈方 的策略选择 n决策思路:先找出自己针对其他博弈方每种策 略或策略组合(对于多人博弈)的最佳对策( 不一定惟一),然后,在此基础之上,通过对 其他博弈方策略选择的判断,包括对其他博弈 方对自己策略判断的判断等,预测博弈的可能 结果和确定自己的最优策略。 2004-9-2231 划线法 对其他局中人的任一策略组合,找出局 中人i的最佳策略,并在其得益值下划线。若 存在一个策略组合,使得所有局中人的得益 值下都划了线,则该策略组合就是一个纳什 均衡。 2004-9-2232 例:博弈G如右图 : 0 , 4 1 , 0 0 , 00 , 2 0 , 11 , 3 局中人 左 中 右 解:该博弈的纳什均衡为(上,中)。 2004-9-2233 例:博弈G如下图: 2 , 81 , 61 , 8 0 , 80 , 60 , 8 0 , 81 , 50 , 9 局中人 L M R 解:该博弈有两个纳什均衡(U,L)和(U,R)。 n 乙 坦白 抵赖 坦白 甲 抵赖 -3,-3 0,-5 -5,0 -1,-1 划线法总结: n1、划线法,以策略之间的相对优劣关系 为基础,在分析支付矩阵表示的博弈问 题时具有普遍性 n2、不是每个支付矩阵都能用划线法求出 确定性的博弈结果,例:猜硬币博弈。 n3、许多博弈根本不存在确定性的结果 n4、有时存在不止一个的策略组合 例:情人博弈 n 猜硬币方 正面 反面 正面 盖方 反面 结论:不存在所有数字下都划有短线的得益数组,意味着该博弈 中没有一种策略组合中的双方策略正好相互都是关于对方策略的 最佳对策,即没有一个策略组合会是双方都自愿接受的,该博弈 不可能有确定的,或者至少具有稳定性的结果。 -1,1 1,-1 1,-1 -1,1 不会漏过过NE的相对优势对优势 策略圈定法 n 丽娟 足球 芭蕾 足球 大海 芭蕾 结论1:该博弈有稳定性的解却没有确定性的解 。 结论2: 双方的相对优势策略都圈定以后,如果 哪个格子里面两个数字都被圈住,这个格子所 对应的相对优势策略组合,就是NE. 2,1 0,0 0,0 1,2 2.2.4 箭头法 n思路:对博弈中的每个 策略组合,判断各博弈 方能否通过单独改变自 己的策略而改善自己的 得益,如能,则从所考 察的策略组合的得益引 一箭头到改变策略后的 策略组合对应的得益。 这样对每个可能的策略 组合都考察过以后,根 据箭头反映的情况来判 断博弈的结果。 2.2.4 箭头法 n只有指向的箭头,没 有指离的箭头 n惟一具有稳定性的策 略组合 2.2.4 箭头法 n箭头法与划线不同,但二者都是基于策 略之间相对优劣关系进行分析,得到的 结论一致,是两种可以相互替代的方法 。 n猜硬币博弈 n情人博弈 n 猜硬币方 正面 反面 正面 盖方 反面 结论:取胜的关键都是不能让另一方猜到自己的 策略而同时自己又要尽可能猜出对方的策略。 -1,1 1,-1 1,-1 -1,1 n 丽娟 足球 芭蕾 足球 大海 芭蕾 结论:在情侣博弈中,双方都没有严格优 势策略和严格劣势策略。 2,1 0,0 0,0 1,2 例:“智猪博弈”和“搭便车”行为 “game of boxed pigs” n笼子里有一只大猪,一只小猪。笼子的一头有 一按钮,另一头是饲料的出口和食槽。按一下 按钮,将有相当于10个单位的猪食进槽,但是 按按钮所需要付出劳动,要消耗相当于2个单 位的猪食。问题是按钮和食槽分置笼子的两端 ,付出劳动按按钮的猪跑到食槽的时候,坐享 其成的另一头猪早已吃了不少。 n如果大猪先到,大猪吃到9个单单位,小猪只能吃到1个单单位; n如果同时时到达,大猪吃到7个单单位,小猪吃到3个单单位; n如果小猪先到,小猪可以吃到4个单单位,而大猪吃到6个单单位 。 2004-9-2244 例:智猪博弈 东奔西走,要喝宋河老酒 大猪 有了XX老酒,何必东奔西走小猪 小猪 按 等待(先到) 0,09,1 4,45,1 大猪 按 等待 n 小猪 按 等 按 大猪 等 结论:大猪选择在主观上是为了自己的利 益,但在客观上小猪也享受到了好处 5,1 4,4 9,-1 0,0 “搭便车” n智猪博弈有许多应用。如美国的大湖地 区,你可以看到许多灯塔。大航运公司 因为船舶多,航班频密,迫切需要建灯 塔,但是小航运公司在这方面的积极性 就比较低。结果大公司花钱建灯塔,公 司从设置灯塔所获得的效益超过了灯塔 的花费,所以这项投资对于大公司是值 得的。小公司因此就可以“搭便车”,也得 到好处。 “搭便车”原理 n原理:亚当.斯密“看不见的手” n社会上每个人为了自己的利益而采取行 动,但这些行动在客观上也为社会上其 他的人带来了好处。 n搭便车行为的产生,很大程度上与缺乏 产权界定或产权配置的无效率有关。 n在发达国家,除了日本许多人口稠密的地区和纽约这 样人口稠密的城市以外,大部分家庭都有自己的汽车 。人们出门,都要自己开车。在那样的地月,公共交 通一般都不发达,如果你没有自己的汽车,往往就会 寸步难行。我们在美国的留学生,哪怕经济很不富裕 ,也要先买辆二手车来用,就是这个道理。 n你早就想到一个地方去,因为没有车子一直未能成行 ,碰巧某一天你的一位有车的朋友要去那个地方,并 且车子有空位,你就可以搭他的“顺风车”了结你的宿 愿。这就是:“搭便车”说法的由来。在经济生活中, 如果不考虑朋友这样的关系,只有公共品才会发生”搭 便车“问题。 n(中小股民,郎咸平引风波,大陆经济学家怎 么啦?) 为什么大股东挑起监督经理的重任 n监督成本 n在大小股东 是否密切监督经理工作 的博弈中,大股东 因为利益攸关会担当起得益 n启示:一项改革,总是得益最多的一方最乐意力促其 成 智猪博弈的解决办法 n小股东与大股东 nAA制 n广告便车 n技术创新便车 n公司员工的搭便车行为 n公司并购中的搭便车行为 n郎咸平引风波,大陆经济学家怎么小啦? n智猪博弈的解决办法:合理地界定权利改革与 制度锁定 总结: n求解博弈的主要关键在于寻找各博弈方 都不愿或不会单独改变自己策略的策略 组合,只要这种策略组合存在且是唯一 的,博弈就有绝对确定的解。 n这种各博弈方都不愿单独改变策略的策 略组合就是博弈论中最重要的概念“NE” 。 2.3 纳什均衡的一致预测性质 n一致预测性质:如果所有博弈方都预测一个特 定的博弈结果会出现,那么,所有博弈方都不 会利用该预测或者这种预测能力,选择与预测 结果不一致的策略,即没有哪个博弈方有偏离 这个预测结果的愿望,因此这个预测结果最终 真会称为博弈的结果。 n一致预测性在博弈分析中具有重要地位 n只有纳什均衡才具有一致预测的性质 n稳定的,自我实施的(self-enforcing,自我强 制的) 2.3 纳什均衡的意义 n 它是关于博弈结局的一致性预测,如果所有 局中人预测一个特定的NE会出现,那么这种均衡 就会出现,预测之间没有矛盾,不会因为有的局 中人认为不符合自己的利益要求而失败 2.4 纳什均衡(严格下策反复 消去法) n占优均衡(上策均衡)与纳什均衡 n划线法、箭头法与纳什均衡 n纳什均衡与重复剔除严格劣策略(严格 下策反复消去法):二者之间是否存在 相容性,严格下策反复消去法是否会消 去纳什均衡? n命题2.1 在个博弈方的博弈 中, 如果严格下策反复消去法排除 了 之外的所有策略组合,那么 一定是 该博弈的惟一纳什均衡。 n命题2.2 在个博弈方的博弈 中, 如果 的一个纳什均衡,那么严格下 策反复消去法一定不会将它消去。 n(反证法) 案例:银行挤兑的成因和预防 n一假定有一人银银行,只有两个存户户,银银行的 全部资资金就是这这两个储户储户 的存款。每个存户户 存了100万的定期存款,银银行就拿总总数为为 200万的这这笔钱钱做投资资。项项目完成投资资收回 后,银银行可拿出240万元偿还给偿还给 存户户,每个 存户户得到120万。但未到期抽回存款,银银行 只可拿出140万付给储户给储户 。 n如果双方同时提前抽调存款,每人只能得70万; n如果双方期满支取存款,每人可得120万; n如果只有一方提前支取,那么他得到原来的存额 100万,而银行被迫提前抽回投资,可动用资金只 有140万,而另一储户期满时来兑现其存款时,银 行就要破产,他只能得到40万的补偿; n 储户乙 提前取款 到期取款 提前 储户甲 到期 结论 :两个NE:一个是到好的,即到期取款各得( 120,120);另一个就很不好,双方争先都要同时提 前取款各得(70,70),这就是银行挤兑。 70,70 100,40 40,100 120,120 总结: n银行一定要使自己的资金来源多元化; n一定要使自己的投资适当分散; n一定要注意良好的经营业绩; n一定要掌握相当比例的准备金 n中央银行一定要规范商业银行的运作 “控制谣言”是防止银行挤兑的有效的策略 案例:如何让禁鸣喇叭成为交通顺 畅的开始 n广州市区禁止机动车动车 喇叭叫鸣鸣。汽车车有喇叭 ,但是不许许叫,可算是中国特色的制度创创新 。 n行人和车辆车辆 守与不守交通规则问题规则问题 研究,即 “交通博弈”式的“囚徒困境”。 n如果对方礼让我也礼让,大家顺畅都得8; n如果我抢行占了便易得9,对方礼让寸步难得只得 1; n如果都抢行,大家 挤死只能得2; n如果对方抢行占了便得9,我礼让寸步难行只得1 ; n 行人 礼让 抢行 礼让 汽车 抢行 结论:NE得(2,2)。但禁鸣礼让最后是否能同时 达到交通改善的结果?是否能真正把交通引导 到规矩礼让大家受益的“双赢对局”(8,8)中 呢? 8,8 1,9 9,1 2,2 案例:美苏争霸的“囚徒困境” n从军军事上看,20年前美国和苏联苏联 是世界上两 个超级级大国,他们们相互对垒对垒 。假定每一方都 有两种策略选择选择 ,一个是扩军扩军 ,发发展战战略核 武器,实实施“星球大战战”计计划等等,另一个是 彻彻底裁军军,直到不设军备设军备 。 n如果双方都扩军,各花2000亿美元用于军费,赢 利为-2000; n如果双方彻底裁军,则军费为零; n如果美国裁军不设防但苏联扩军,苏联就可以任意 斯侮和损害美国,苏联赢利8000亿美元(得10000 亿成本2000亿=8000亿),而美国会受到很大 损失,甚至丧失主权,则得负无穷-;反之亦然 。 n 苏联 扩军 裁军 扩军 美国 裁军 结论 :两方都扩军是争霸博弈唯一的NE。 思考:人类为何那么愚蠢,不和平共处于不花费军 费的右下角呢? 2000, -2000 8000, - -,8000 0,0 案例:串谋博弈和风险优势 n甲有上策略和下策略,乙有左策略和右策略 n在一名涉及名额额挑选选的十分制考试试中,考官 规规定一旦发现谁发现谁 作弊将给给予0分,揭发发他人 作弊,得奖奖励1分;甲乙功课课相当,者得 7+1=8 n都不作弊可得7分; n若串谋谋作弊没给发现给发现 ,每人可得9分; n如果一人作弊另一人告发发,作弊者得0,告发发者得 7+1=8 n 乙 左 右 上 甲 下 结论 :两个NE:“甲上乙左”得(9,9)和“甲下乙右”得 (7,7);但“甲下乙右”得(7,7)的NE具有风险优 势。(风险优势不是表示风险大,恰是风险比较小的 优势。) 9,9 0,8 8,0 7,7 n 乙 作弊 不作弊 作弊 甲 不作弊 结论 :两个NE:一个双方都作弊,各得(90,90); 另一个都不作弊,双方各得(7,7),这就是风险优 势。 9,9 0,8 8,0 7,7 案例:营造克已奉公的制度环境 n“高薪养廉”是公务员务员 制度方面的一种理论论。 n甲乙是关系密切的国家公务员务员 ,7是政府所发发 高薪;双方串谋谋受贿贿每人可得9;一旦发现发现 受贿贿将给给予0分;揭发发他人,得奖奖励1分; n都不受贿贿可得7; n若受贿贿,因串谋谋没给发现给发现 ,每人可得9; n如果一旦东东窗事发发,就要撤职查办职查办 0; n 乙 受贿 不受 受 甲 不受 结论 :两个NE:(受,受)和(不受,不受) ;但(不受,不受)的NE具有风险优势。 9,9 0,8 8,0 7,7 改变数据:薪水只有2 n 乙 受贿 不受 受 甲 不受 结论 :两个NE:(受,受)和(不受,不受) ;但(不受,不受)的NE具有风险优势。 9,9 0,3 3,0 2,2 改变数据:加重惩罚为-20 n 乙 受贿 不受 受 甲 不受 结论 :两个NE:(受,受)和(不受,不受) ;但(不受,不受)的NE具有风险优势。 9,9 -20,3 3,-20 2,2 案例:猎人博弈(法国哲学家卢梭) 和帕累托优势 n在古代的一个地方,有两个猎猎人,狩猎猎是主 要生计计。 n假设猎设猎 物只有两种:鹿和兔子; n假设设两个猎猎人一起去猎猎鹿,才能猎获猎获 一只鹿 ,如果一个猎猎人单单兵作战战,他只能打到四个 兔子。 n从填 饱饱肚子的角度说说,4只兔子算它能管4天 ,一只鹿却差不多解决一个月的问题问题 。 n 乙 猎鹿 打兔子 猎鹿 甲 打兔子 结论1 :两个NE:一个是两人一起去猎鹿,得(10,10 );另一个是两人各去打兔子,得(4,4)。 结论2:两家一起去猎鹿的赢利比各自去打兔子的赢利要 大得多。即甲乙一起去猎鹿得(10,10)的NE,比两 人各自去打兔子得(4,4)的NE ,具有帕累托优势。 10,10 0,4 4,0 4,4 帕累托最优: n帕累托是法国巴黎出生的意大利经济学家。 n帕累托效率准则:经济的效率体现于配置社会 资源以改善人们的境况,主要看资源是否已被 充分利用。如果资源已被充分利用,要想再改 善任何人都必须损害别的人,这时候就说一个 经济已经实现了帕累托效率。相反,如果还可 以在不损害别人的情况下改善任何人,就是说 经济资源淌未充分利用,经济没有达到帕累托 最优。 帕累托最优和风险优势的关系 : n帕累托最优和风险优势之间,理论给帕累托优 势以优先权,而风险优势只有在局中人面临不 知道选哪个均衡好的不确定性的是时候才变得 重要 2.4 混合策略和混合策略纳什均衡 n2.4.1 严格竞争博弈和混合策略的引进 n各博弈方的利益和偏好始终不一致,在通常策 略的基础上没有纳什均衡的博弈,就称为“严 格竞争博弈”。 nNe在解博弈时的弱点:即只在当博弈中有唯一 的NE时才能解出博弈的结果,才能说出各博弈 方的做法。但许多现实中决策问题构成的博弈 中,根本不存在具有稳定性的各博弈方都接受 的NE策略组合;而另一些博弈却有多于一个没 有哪个博弈方愿意单独改变策略的NE策略组合 2004-9-2275 双矩阵博弈的混合扩张 1.二人有限博弈的纯策略形式 设G=(S,U) 1n 1a11,b11a1n,b1n mam1,bm1amn,bmn 可表为:G=(S1,S2,A,B),其中: 2004-9-2276 G*=( ) 2.二人有限博弈的混合策略形式 2004-9-2277 将扩充为,因此,如果 ,满足 则是该博弈的一个纳什均衡。 例2:猜硬币博弈 n两人通过过猜硬币币的正反面赌输赢赌输赢 ,其 中一人用手盖住硬币币,由另一方猜是正 面朝上还还是反面朝上: n如果猜对,则猜者赢1元,盖硬币者 输1元; n否则,猜者输1元,盖硬币者赢1元; n 猜硬币方 正面 反面 正面 盖方 反面 第一个原则:自己的策略选择千万不能预先被另 一方侦知或猜到。 第二个原则:博弈方必随机地选择策略。 -1,1 1,-1 1,-1 -1,1 n博弈方如何避免自己的选择带有规律性 ? n随机选择的方法 n设盖硬币方出正面的概率为p,出反面的 概率就是1-p,出正面多于出反面意味着 p1-p或p1/2。在这种情况下,如果猜 硬币方全猜正面,则其期望支付为: nPg+(1-p)g(-1)=2p-1=2(p-1/2)0 2.4.2 混合策略、混合策略博 弈和混合策略纳什均衡 n混合策略(mixed strategies):博弈方以一定的概率分布 在可选策略中随机选择的决策方式,在分析原来没有 纳什均衡的博弈和有多个纳什均衡的博弈时有非常重 要的意义。这种策略选择方式为“混合策略”。 n混合策略,不是纯粹这样做或纯粹那样做,而是百分 之多少选择这样做,百分之多少选择那样做,这两个 百分数加起来,应该是一,即百分之一百。 n纯策略(pure strategies):相对于这种以一定概率分 布在一些策略中随机选择的混合策略,确定性的具体 的策略,称之为:纯策略;任何博弈方都不愿单独改 变策略的纯策略组成的策略组合称为“纯策略NE”。 n定义 在博弈 中,博弈方i的策略空间 ,则博弈方i以概率分布 随机在其k个可 选策略中选择的“策略”,称为一个“混合策略” ,其中01/2 p= 0,1 若q=1/2 1 若q1/2 q= 0,1 若p=1/2 0 若p1/4 p= 0,1 若q=1/4 0 若q3/4 q= 0,1 若p=1/4 0 若p4.但这种协 议缺乏足够的强制力,最终很难维持。原因:(1.5, 1.5)不是NE 2 159 两寡头间的囚徒困境 n 厂商2 不突破 突破 不突破 厂商1 突破 结论:NE就是各博弈方的一组相互为最佳反应 对策的策略。NE定义:是没有单独改变策略 的激励,即单独改变策略不会得到额外的好处 。 4.5,4.5 3.75 ,5 5, 3.75 4,4 160 反应函数 n对厂商2的任意产量q2,厂商1的反应函数: q1=R1(q2)=(6- q2)/2 n对厂商1的任意产量q2,厂商2的反应函数: q2=R2(q1)=(6- q1)/2 ( 6,0 ) (0,6 ) (0,3 ) (3,0 ) (2,2) q1 q2 161 2.5.3 伯川德寡头模型 n伯川德(Bertrand,又译为“伯特兰德”) 1883年提出了另一种形式的寡头模型。 n厂商所选择的是价格而不是产量,且产 品有一定差别(是指两厂商的产品在品 牌、质量、包装等方面有所不同),因 此厂商的产品之间有很强的替代性,但 又不是完全替代,即:价格不同时,价 格较高的不会完全销不出去。 162 设一市场有1,2两厂商,生产同质产品, 同时决定各自的产量; n价格分为P1、P2,产量分为q1、q2,总 产量Q= q1+q2 n各自的需求函数: nq1= q1(P1,P2 )=(a1-b1P1+d1P2) nq2= q2(P1,P2 )=(a2-b2P2+d2P1) nd1、d2两厂商产品替代系数,两厂商无固 定成本,边际生产成本分别为C1、 C2,两 厂商同时决策 163 nU1= P1q1-C1q1= (P1-C1 )q1 =(P1-C1 )(a1-b1P1+d1P2) nU2= P2q2-C2q2= (P2-C2 )q2 =(P2-C2 )(a2-b2P2+d2P1) nP1=(a1+b1C1+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中生演讲稿三分钟青春励志
- 2025年护理服务知识试题及答案
- 2025年服务业试题及答案
- 2025年玻璃成型工试题及答案
- 2025年小学二年级语文下学期单元测试
- 2025年土木工程师考试岩土上学期试卷
- 2025防火门采购合同
- 2025自行买卖公寓定金合同
- 2025年下半年嘉兴市秀洲区委宣传部招考易考易错模拟试题(共500题)试卷后附参考答案
- 2025年下半年嘉兴市平湖市独山港镇招考城建监察中队队员易考易错模拟试题(共500题)试卷后附参考答案
- 加盟瑞幸合伙合同范本
- 校园监控维护记录表
- 英语A级词汇表
- 骨科品管圈提高住院患者对耳穴贴压的依从性
- 医疗器械定期风险评价报告
- 合并财务报表模板案例含抵消分录公式及数据-直接生成报表
- 高填方路基施工危险源辨识及风险评价
- 蛙心起搏点分析医学PPT课件
- 污泥运输合同
- 如何唤醒孩子的内驱力
- 妊娠期急性脂肪肝
评论
0/150
提交评论