




已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章完全信息静态博弈,本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。如:囚徒困境、田忌赛马、猜硬币、石头剪子布、古诺产量决策。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。,2.1基本分析方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展,2.1基本分析方法,2.1.1上策均衡2.1.2严格下策反复消去法2.1.3划线法2.1.4箭头法,2.1.1上策均衡(Dominant-strategyEquilibrium),上策(Dominant-strateg):不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略囚徒的困境中的“坦白”;双寡头削价中“低价”上策均衡:由每个参与人的上策所组成的策略组合。例:囚徒困境,“坦白”相对于“不坦白”是每个囚徒的优势策略,双寡头削价竞争,专栏的博弈分析(制药公司销售大战),默克,辉瑞,纳什均衡,上策均衡是否普遍存在?例:,参与者2,参与者1,寻找优势策略检查一下你是否存在优势策略,如果有,就选择优势策略站在对手的位置上思考问题如果你没有优势策略,那么从你对手角度考虑博弈。如果对手有优势策略,预期他将按优势策略行动,2.1.2严格下策反复消去法,严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。例:,大猪小猪博弈,猪圈中有一头大猪一头小猪,猪圈一端有个按钮,每按一下猪圈另一端食槽中会有10个单位猪食进槽,但按一下会耗去相当于2单位猪食的成本。如果大猪先到食槽,大猪吃到9单位食物,小猪只能吃到1单位;如小猪先到,小猪吃4单位而大猪吃6单位;如果同时按并同时到食槽,则大猪吃7单位而小猪吃3单位食物。,富人与穷人,处于强势的参与者为维护自己利益采取某种决策时,为其他弱势参与者提供了搭便车的机会公司里的大股东与小股东新产品研发与中小企业可口可乐、百事可乐与非品牌软饮料产品,2.1.3划线法,在每一博弈方针对其他方每一策略的最大可能得益下划线。,2.1.4箭头法,纳什均衡:各博弈方都不愿单独改变策略的策略组合。,2.2纳什均衡,策略空间:博弈方的第个策略:博弈方的得益:博弈:纳什均衡:在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,也即对任意都成立,则称为的一个纳什均衡,纳什均衡的一致预测性质,一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果。只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能,纳什均衡与严格下策反复消去法,命题2.1:在n个博弈方的博弈中,如果严格下策反复消去法排除了除之外的所有策略组合,那么一定是该博弈的唯一的纳什均衡。命题2.2:在n个博弈方的博弈中中,如果是的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法来简化博弈是可行的,2.3无限策略分析和反应函数,2.3.1古诺寡头模型2.3.2反应函数2.3.3伯特兰德寡头模型2.3.4公共资源问题2.3.5反应函数的局限性,2.3.1产量决策的古诺模型,古诺模型是寡头产量竞争,是市场经济中最常见的问题之一古诺1838年提出,直到现在还是经常使用古诺模型有很多扩展古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值,2.3.1古诺模型寡头产量竞争,问题的提出:某市场有n个厂商生产完全相同的产品;市场容量有限,如果厂商向市场投放产品超过一定数量,则降价才能售空。假设:1、n个厂商的产量决策在同一时间做出2、产量连续可分,即可选策略无穷多,设厂商i的产量为,则总产量为市场出清价格厂商i的收入厂商i的成本(c为单位固定成本)厂商i的得益,2.3.1古诺模型寡头产量竞争,2.3.1古诺模型以两厂商为例,设两厂商产量分别为,市场总产量市场出清价格无固定成本,边际生产成本为策略空间:同时决策自己生产产量,设产量为连续可分的两厂商得益函数:,2.3.1古诺模型,运用纳什均衡思想,找策略组合和为对对方策略的最佳策略,即为纳什均衡组合,同时也是博弈的解。,从两厂商总体利益垄断出发,可得:,两寡头间囚徒困境博弈,2.3.2反应函数,反应函数:当得益为策略的多元连续函数时,每个博弈方针对其它博弈方所有策略的最佳反应所构成的函数古诺模型中反应函数:,2.3.3伯特兰德寡头模型,价格竞争的寡头博弈模型,同时决定价格产品有一定差别,消费者对价格不十分敏感厂商决定价格和,各自需求函数为设厂商无固定成本,边际生产成本为和策略空间:,2.3.3伯特兰德寡头模型,得益函数:用反应函数方法求解,纳什均衡为两反应函数交点,2.3.4公共资源问题,公共草地养羊问题,以三农户为例,设n=3c=4V=100-Q,得益:,竞争:个体利益最大化,合作:总体利益最大化,公共产品的供给如果大家都出钱兴办公用事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以每个人的最优选择都是“不出钱”,结果使所有人的福利都得不到提高。军备竞赛两国都不搞军备竞赛,都把资源用于民用,两国福利都变好。但由于都怕受威胁而大搞军备竞赛,结果两国福利都变得更糟。经济改革经济改革要付出成本(包括风险),而改革的成果大家享受,结果是,尽管人人都认为改革好,却很难有人真正去改革,大家只好在都不满意的体制下继续生活下去。,结论,纳什均衡往往是低效率的政府的组织和协调是必要的,2.3.5反应函数的局限性,在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。,思考题,如果给你两个师的兵力,由你来当司令,任务是攻克敌人占据的一座城市,敌军的守备力量是三个师,规定双方兵力只能整师调动。通往城市的道路只有甲乙两条。当你发起攻击时,你的兵力超过敌人,你将获胜;若你的兵力比敌人的守备兵力少或者相等,你就失败。那么,你将如何制定攻城方案?,2.4混合策略和混合策略纳什均衡,2.4.1严格竞争博弈和混合策略2.4.2多重均衡博弈和混合策略2.4.3混合策略和严格下策反复消去法2.4.4混合策略反应函数,2.4.1严格竞争博弈和混合策略,一、例:康科德军火库A表示美军;B表示英军A-=陆上防御,然后伏击B-=从海路来,然后立即离开A-=陆上防御,然后进攻B-=从海路来,然后夜间离开A-=海路防御,然后伏击B-=从陆上来,然后立即离开A-=海路防御,然后进攻B-=从陆上来,然后夜间离开,英方,美方,例:石头剪子布,Min,Max,两人以相等的概率从三项行动中选择。平均而言,两人的期望得益为零。,假设Min继续以三分之一的概率在石头、剪子、布中选择,Max以六分之一概率选石头,二分之一概率选剪刀,三分之一概率选布,Max的期望得益将为多少?,猜硬币博弈,混合策略、混合策略博弈和混合策略纳什均衡,混合策略:在博弈中,博弈方的策略空间为,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈”。混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,一个例子,求解混合策略原则:1、在决策时利用随机性;2、在选择概率时,恰好使对方无机可乘。,策略得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6,博弈方1的策略选择,博弈方2的策略选择,齐威王田忌赛马,小偷和守卫的博弈,小偷和守卫的博弈,“激励的悖论”,加重对小偷的处罚,短期内能抑制盗窃发生率;但长期内并不能抑制盗窃,只会使得守卫更多地偷懒加重对守卫的处罚,短期中的效果是使守卫真正尽职;虽然在长期中并不能使守卫更尽职,却能降低盗窃发生的概率,2.4.2多重均衡博弈和混合策略,一、夫妻之争,妻子的混合策略,丈夫的混合策略,夫妻之争博弈的混合策略纳什均衡策略得益妻子(0.75,0.25)0.67丈夫(1/3,2/3)0.75,二、制式问题,制式问题混合策略纳什均衡AB得益厂商1:0.40.60.664厂商2:0.670.331.296,三、市场机会博弈,进不进得益厂商1:2/31/30厂商2:2/31/30,博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益,博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益,2.4.3混合策略和严格下策反复消去法,2.4.3混合策略和严格下策反复消去法,包括混合策略之后,严格下策反复消去法仍然成立。(1)任何博弈方都不会采取任何严格下策,不论是纯策略或是混合策略。(2)严格下策反复消去法不会消去任何纳什均衡,包括混合策略纳什均衡。(3)如果经过反复消去法后留下的策略组合是唯一的,那么一定是纳什均衡。,2.4.4混合策略反应函数,猜硬币博弈,夫妻之争,2.5纳什均衡的存在性,纳什定理:在一个由n个博弈方的博弈中,如果n是有限的,且都是有限集(对),则该博弈至少存在一个纳什均衡,但可能包含混合策略。经济博弈论89页证明。主要根据是布鲁威尔和角谷的不动点定理。纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。,纯策略纳什均衡,占优均衡,重复剔除占优均衡,混合策略纳什均衡,2.6纳什均衡选择和分析方法扩展,2.6.1多重纳什均衡2.6.2共谋和防共谋均衡,2.6.1多重纳什均衡,帕累托上策均衡风险上策均衡聚点均衡相关均衡,一、帕累托上策均衡,(鹰鸽博弈)这个博弈中有两个纯策略纳什均衡,(战争,战争)和(和平,和平),显然后者帕累托优于前者,所以,(和平,和平)是本博弈的一个帕累托上策均衡。,猎鹿游戏,二、风险上策均衡,考虑、顾忌博弈方、其他博弈方可能发生错误时,帕累托上策均衡并不一定是最优选择,此时需要考虑风险上策均衡。,三、聚点均衡,利用博弈设定以外的信息和依据选择的均衡文化、习惯或者其他各种特征都可能是聚点均衡的依据城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子,协调博弈,情侣博弈,女,男,企业B,企业A,此协调博弈有两个纳什均衡,产业标准(软盘、CD的大小等)国家标准(电压、交通法等),关键点,不是所有的博弈都涉及到利益冲突沟通能够帮助解决协调问题顺序行动能够帮助解决协调问题先动优势的作用,靠左走还是靠右走假如一个博弈有多个均衡点,所有参与者必须就选择哪一个达成共识,否则就会导致麻烦打电话问题:明天某个时候你要在南昌市和某人见面,他已被告知要去见你。但你们双方都没有更多信息,都不知道究竟几点钟或在哪里会面。那么,你应该几点钟到达哪里呢?,四、相关均衡,三个纳什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)结果都不理想,不如(D,L)。,可利用聚点均衡(天气,抛硬币),但仍不理想。,相关装置:掷色子12点出现,A选U;36点出现,A选D14点出现,B选L;56点出现,B选R,最坏情况不出现;得益更好;为纳什均衡;不影响原来均衡,一、多人博弈中的共谋问题本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B)前者帕累托优于后者。博弈的结果会是什么呢?(U,L,A)有共谋(Coalition)问题:博弈方1和2同时偏离。,2.6.2共谋和防共谋均衡,二、防共谋均衡,如果一个博弈的某个策
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论