




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第8讲 完全信息静态博弈,博弈规则,参与人 行动 支付 信息 知道对手的支付,但是不知道对手的行动,博弈的标准型表示,例如双变量矩阵,求解博弈,策略 策略与行动不可区分 均衡概念 占优策略 重复剔除严格劣策略 纳什均衡,占优策略,在讨论均衡概念的时候,可以简写“所有其他参与人的策略” 对于任何向量y=(y1,yn),利用表示y-i向量(y1,yi-1, yi+1,yn)。 参与人i对于所有其他参与人选择的策略s-i的最优反应是策略s*i,这个策略可以为他带来最大的支付;也就是:,占优策略,如果没有其他的策略一样好,那么最优反应是强最优,否则是弱最优。 第一个重要的均衡概念基于占优这个思想。 策
2、略sdi是一个被占优策略,如果这个策略严格劣于其他某个策略,而不论其他参与人选择什么策略。从数学上看, sdi被占优,如果存在一个策略si满足:,占优策略,有的时候某个策略可以击败所有的其他策略,这种策略称为“占优策略” 策略s*i是一个占优策略,如果其对于其他参与人能够挑选的所有策略都是最优反应。从数学上来看:,占优策略,一个占优策略均衡是一个策略组合,包含了每一个参与人的占优策略。,占优均衡,因为(招认,招认)是一个占优均衡,信息结构都不发生作用。 例如,两人先后行动也是这个均衡。,占优均衡,如果两个人可以提前交谈会怎么样? 如果承诺没有约束力,结果是一样的。,一些离题的话,合作博弈是参与
3、者可以制定有约束力的承诺,非合作博弈参与人无法进行这种承诺。 不过这两种理论真正的区分在于建模的方法。两个理论都是开始于博弈规则,不过所用的解概念是不一样的。合作博弈是公理化的,通常用帕累托最优、公平和平等这些概念。非合作博弈是经济的,其解概念依赖于约束条件下的效用最大化。,一些离题的话,另外一个角度,合作博弈是一种简式理论,更关注结果的性质,而不是获得结果的策略。如果为过程建模过于复杂的时候,这就是合适的方法。 在应用经济学中,最经常遇到的合作博弈是讨价还价。,重复剔除劣策略,很少有博弈具有占优策略均衡。 考虑一个俾斯麦海战问题。I将军希望选南北两条运输线路之一运送军队,K将军需要选择一个方
4、向进行轰炸。 这个博弈可以如下表示:,重复剔除劣策略,这个博弈没有严格占优策略。,重复剔除劣策略,策略si是弱被占优的,如果存在其他的策略si可能更好,不过从不会更坏。从数学上来看si被弱占优,如果存在si使得:,重复剔除劣策略,我们将至少与其他策略一样好,同时好于某些策略的策略称为弱占优策略。 弱占优均衡是通过剔除每个参与人所有弱被占优策略形成的策略组合。 这个均衡概念对于海战博弈帮助不大。将军I可以剔除弱被占优策略-南,不过将军K就没有弱被占优策略。,重复剔除劣策略,重复占优均衡是一个策略组合,获得方法是剔除一个参与人的弱被占优策略,然后重新计算哪些策略是弱被占优的,剔除这些策略,重复这个
5、过程,直到每个参与人剩下一个策略。,重复剔除劣策略,在海战博弈中,将军K认为将军I会选择北,因为这是弱占优策略,因此,将军K在考虑中就放弃了I会选择南这个想法。从而博弈成为:,重复剔除劣策略,此时,将军K就有了一个强占优策略-北。 因此,策略组合(北,北)就是重复占优均衡。,重复剔除劣策略,我们经常考虑剔除严格劣策略。这是一个更加吸引人的想法,但是有时候不是很实用。 剔除严格劣策略与剔除弱被占优策略之间存在两个区别。 首先,很难支持人们为什么会剔除一些产生无差异结果的策略。在经济学模型中,参与人在均衡的时候经常是无差异的。这点在我们后面的分析中还会用到。,重复剔除劣策略,剔除严格劣策略与剔除弱
6、被占优策略之间存在两个区别。 其次,剔除弱被占优策略存在多均衡问题。如果存在占优策略均衡,那么就一定是唯一的。如果是重复剔除严格劣策略,均衡存在的时候也一定是唯一的。剔除弱被占优策略就可能存在多均衡,因为剔除的顺序就很重要。考虑下面的博弈:,重复剔除劣策略,这个博弈的均衡是(r1, c1)和(r1, c3) 这是因为剔除的顺序不同。分别是(r3, c3, c2, r2)和(r2, c2, c1, r3),重复剔除劣策略,尽管存在这些问题,剔除弱被占优策略仍然是一个有用的工具,这是一个更加复杂的均衡概念的一部分。,零和博弈,上面的例子是一个典型的经济学的例子。因为当一方获得好处的时候,另一方并不
7、一定吃亏。例如,(2, 12)好于(0, 10)。 而有些博弈,例如海战博弈,其支付结果之和永远等于零。,零和博弈,零和博弈是不论参与人选择什么策略,参与人支付之和等于零。 非零和或者可变总和博弈其结果不是零。 因为效用函数在一定程度上是自由决定的,所以零和博弈实际上是支付之和等于一个常数。,零和博弈,经济学家不怎么关心零和博弈,少量的例子是讨价还价。不过,这个问题也一般用非零和博弈来分析,每讨价还价一次,总的份额就减少一个百分比。例如,离婚总要被律师拿走一些。,纳什均衡,两头猪被关在同一个猪圈里。猪圈的一头安装着一个特制的按键,另一头安装着食槽。当一头猪按下按键时,会有10单位的食物进入槽中
8、,但按键的猪会付出2单位的成本。这两头猪中,有一头是“占优的”(我们不妨假设它是头大猪)。如果大猪先到食槽,则小猪只能吃到相当于1单位的残羹冷炙;但若小猪先到的话,则它能吃到4单位的食物。若两头猪同时到,则小猪可吃到3单位的食物。这样,例如,策略组合为(按键,按键)将使得大猪得到5单位的食物(10单位的食物中,3单位由小猪吃掉,2单位为按键的成本),小猪得到1单位的食物(3单位的食物中,2单位为按键的成本)。,纳什均衡,小猪 按键 等待 按键 5,1 (4),(4) 大猪 等待 (9),1 0,(0),纳什均衡,策略组合s*是纳什均衡,如果在其他参与人步偏离自己策略的时候没有参与人有激励偏离自
9、己的策略。即,纳什均衡,策略组合(按键,等待)是一个纳什均衡。理解纳什均衡的最好办法就是构造一个策略组合,然后看看每个参与人的策略是否是对其他参与人策略的最好回应。如果大猪选择了“按键”,那么要在“按键”从而得到和“等待”从而获取之间抉择的小猪自然会选择“等待”。反过来说,如果小猪选择了“等待”,那么大猪在“按键”从而获取和“等待”从而得到之间自然会选择“按键”。这就印证了(按键,等待)确实是一个纳什均衡。,纳什均衡,一种解题的小窍门,是将优于其他支付的支付圈起来。双箭头或双圈都意味着弱优势的支付。如果在某一支付组合中,每一支付都被圈起来了,或者说从各个方向都有箭头指向这一支付组合,则该组合就
10、代表着纳什均衡。,纳什均衡,本博弈的参与者必须比“囚徒困境”中的参与人更为“聪明”。它们必须意识到惟一的一个由自洽的信念支持的策略集便是(按键,等待)。一个纳什均衡策略只需要是对其他纳什均衡策略的最佳反应,而不必是对全部可能策略的最佳反应。此外,虽然说是“最佳反应”,但由于参与人实际上是同时采取行动的,因此他们都是在预测别人的行动。若博弈是重复进行的,或者参与人之间可以交流信息,则纳什均衡就会变得更加引人注目,因为参与人的信念会更趋于一致。,纳什均衡,纳什均衡也有强弱之分。以上的定义其实是针对弱纳什均衡的。要定义一个强纳什均衡,只需要求上述不等式严格成立。,纳什均衡,纳什均衡与占优(优势)策略
11、均衡 每一个优势策略均衡都是纳什均衡,但并非每一个纳什均衡都是优势策略均衡。如果某一策略是优势的,那么它对于其他参与人选择的任何策略而言都是最佳反应,这其中自然也包括其他参与人的均衡策略。而如果某一策略是纳什均衡的组成部分,那么它只需对其他参与人的均衡策略而言是最佳反应就可以了。,纳什均衡,在n个参与人的标准型博弈G=S1,Sn; u1,un中,如果策略s1*,sn*是一个纳什均衡,那么它就不会被重复剔除严格劣战略所剔除。 在n个参与人的标准型博弈G=S1,Sn; u1,un中,如果重复剔除严格劣策略剔除掉策略组合s1*,sn*以外的所有策略,那么这一策略组合就是该博弈唯一的纳什均衡。,纳什均
12、衡,建模者困境 列 抵赖 坦白 抵赖 0,0 10,0 行 坦白 0,10 8,8,纳什均衡,(坦白、坦白)是弱占优均衡,也是重复剔除均衡,也是强纳什均衡。 不过,(抵赖、抵赖)是另一个纳什均衡。这个结果没有上面的均衡强,但是是帕累托最优。 均衡精炼:向基本的均衡概念增加限制,直到仅仅剩下一个均衡为止。,纳什均衡,第三个博弈是“性别战”(Battle of the Sexes)。这一博弈描述的是一对恋人间的矛盾。其中男方想看拳击,女方喜欢芭蕾。尽管他们都是自利的,但他们是如此深爱,以致如果需要的话,他们都会牺牲自己的喜好来陪伴对方。,纳什均衡,女 拳击 芭蕾 拳击 2,1 0,0 男 芭蕾 0
13、,0 1,2,纳什均衡,性别战中不存在重复剔除均衡。它有两个纳什均衡,(拳击,拳击)和(芭蕾,芭蕾)。 那么,现实中会实现哪一个呢?,纳什均衡,去看拳击和去欣赏芭蕾都是纳什策略,但分别是针对不同均衡而言的。纳什均衡假定参与人的信念是正确且一致的。若这对恋人事先互不通气,则彼此可能误会对方的意图,出现男方去欣赏芭蕾,女方反倒去看拳击的情况。但即使参与人不交流信息,仅仅通过博弈的重复进行,纳什均衡有时也能得以实现。如果这对恋人互不通气,但每晚都重复进行这一博弈,那么可以预见,他们将最终稳定在某一纳什均衡上。,纳什均衡,任一纳什均衡都是帕累托有效的,其他任一策略组合都不可能在不降低其他参与人支付的条
14、件下提高另一参与人的支付。 在性别战中,谁先采取行动是至关重要的。如果男方提前就买了拳击赛的票,那么他的这一承诺行为就会使得女方也去看拳击。在许多(但是决非全部)博弈中,先采取行动(这相当于承诺)的参与人拥有先动优势(Firstmover advantage)。,纳什均衡,有时,可以凭支付的大小在多个纳什均衡之间抉择。例如,史密斯和琼斯决定到底是为他们即将出售的计算机设计使用大软驱,还是使用小软驱。若他们的软驱一样,则他们的销量都会更大。,琼斯 大 小 大 2,2 -1,-1 史密斯 小 -1,-1 1, 1,纳什均衡,策略组合(大,大)和(小,小)都是纳什均衡,但是(大,大)帕累托优于(小,
15、小)。两个参与人都偏好(大,大),故而绝大多数建模者都会用帕累托有效均衡来预测实际结果。我们可以假定这一点是通过在模型设定之外所发生的史密斯和琼斯间的信息交流而实现的。但更为有趣的问题是,若信息交流是不可能的,则结果将会怎样?,纳什均衡,有一大类博弈被称为协调博弈(coordination games),其共同特点是参与人需要在几个纳什均衡中协调以选取一个。分级协调(Ranked Coordination)是其中一种。它的额外特点是均衡可按帕累托原则分级。,来看一个危险的协调。 琼斯 大 小 大 2,2 -1000,-1 史密斯 小 -1,-1 1,1,纳什均衡,(大,大)未必是好的预测。 在
16、求解均衡前,我们应该首先找到策略的数学模型 。,聚点,请你想想在这些博弈中你将采取什么策略,你的选择与其他参与人的选择一致的次数越多,你就赢得越多。 ()选择下述一个数,并画上圈:100,14,15,16,17,18. ()选择下述一个数,并画上圈:7,100,13,261,99,666. ()是要硬币的正面还是反面. ()是要硬币的反面还是正面. ()你和别人一起分蛋糕,你们各自报出欲分得的比例,但若你们报的比例之和超过百分之百,则你们都一无所获。 ()你要在北京和一个人会面,但应在何时何地碰头呢?,聚点,上述博弈中的每一个都有许多纳什均衡。 这些纳什均衡中,总有一些看起来或多或少要更可能些
17、。这些特定的策略组合就称为聚点(Focal Points),即出于心理上的原因尤为引人注目的那些纳什均衡。 要使得某一策略组合成为聚点的缘由正规地形式化并非易事,这往往有赖于具体的环境。,聚点,边境(boundary)是一种特殊的聚点。 边境一旦建立起来,就具有与众不同的重要性,因为针对边界的行为就传递了信息。 在没有清楚的聚点之时,调解(Mediation)和沟通(Communication)就变得十分重要了。,聚点,聚点的一个毛病是会导致“僵局”。均衡会在何时改变呢?,混合策略,我们考虑下面的猜硬币博弈 参与人2 正面 背面 正面 -1,1 1,-1 参与人1 背面 1,-1 -1,1,混
18、合策略,这个博弈不存在纳什均衡。 一旦每个参与人都试图猜测其他参与者的策略选择,那么就不存在我们前面定义的纳什均衡。,混合策略,这就需要引入混合策略。混合策略是一个参与人对于其他参与人行为的不确定性。 参与人i的一个混合策略是其策略空间Si中策略的概率分布。 在G=S1,Sn; u1,un中,假设Si=si1,sik。那么混合策略为概率分布pi=pi1,pik。 Si中策略称为纯策略。,混合策略,注意 一个给定的纯策略可能严格劣于一个混合策略,虽然其并不严格劣于其他任何一个纯策略。 L R T 3,- 0,- M 0,- 3,- B 1,- 1,- 参与人1对于参与人2的推断(q,1-q)都不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 奔驰制动培训课件
- 农业物联网技术应用推广合同书
- 2025年北京信息科技大学招聘考试试题【答案】
- 2025年安康市大学生到市政府机关考试试题【答案】
- 雨水管道老化更新改造项目规划设计方案
- 儿童画手工葡萄课件
- 养殖场粪污处理设施改造提升工程规划设计方案(参考范文)
- 大厂培训课件下载
- 污水处理厂处理设施设备更新改造工程项目实施方案(模板范文)
- 人教版认识面积说课课件
- 狮子王-中英文-剧本台词(全)
- 13G322-1~4《钢筋混凝土过梁(2013年合订本)》
- 商铺租赁合同(有利于承租方)
- C语言开发基础教程(Dev-C++)(第2版)PPT完整全套教学课件
- 宁波大学岗位设置管理实施办法汇编-征求意见稿
- 外研版(2019)选择性必修第三册 Unit 1-6 课文知识点语法填空(含答案)
- 施耐德ATS48软启动器使用手册
- 兴隆百货集团企业文化
- 人防领域专项审计发现的问题及建议
- 殡葬技能人才队伍职业化建设实施状况与发展规划
- GB/T 9444-2019铸钢铸铁件磁粉检测
评论
0/150
提交评论