版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、再论混合策略均衡再论混合策略均衡Information Sets and Information Sets and Mixed Strategy EquilibriumMixed Strategy Equilibrium张醒洲2014/3/26张醒洲,大连1猜硬币博弈,石头猜硬币博弈,石头- -剪刀剪刀- -布博弈,布博弈,性别战博弈性别战博弈回顾我们在讨论过的回顾我们在讨论过的纳什均衡与混合策略纳什均衡与混合策略均衡均衡2014/3/26张醒洲,大连2纳什均衡纳什均衡求解思路:最佳应对(最佳反应)。求解思路:最佳应对(最佳反应)。均衡判据:互为最佳反应策略导致的结果。均衡判据:互为最佳反应策
2、略导致的结果。稳定性:单方面偏离均衡点是非理性的。稳定性:单方面偏离均衡点是非理性的。均衡的自我实现:尽管没有签订有约束力的均衡的自我实现:尽管没有签订有约束力的协议,局中人会自利的选择一个可以导致均协议,局中人会自利的选择一个可以导致均衡结果的策略。衡结果的策略。协调问题:当有多个均衡时协调问题:当有多个均衡时 ,协调是必要的。,协调是必要的。前提:博弈结构与理性是局中人的共同知识前提:博弈结构与理性是局中人的共同知识2014/3/26张醒洲,大连32014/3/26张醒洲,大连4猜硬币博弈猜硬币博弈 模型模型 两个参与人两个参与人 1,2 1,2 每个参与人的策略每个参与人的策略 空间为空
3、间为H,TH,T 收益收益零和零和 试着找到纳什均衡试着找到纳什均衡 参与人2参与人 1 正面 背面正面 -1, 1 1, -1背面 1, -1 -1, 1 两个男孩各自有一个硬币并且他们必须选择将硬币的正面朝上还是背面朝上。如果两个硬币朝上的面相同(即都是正面或都是背面),则参与人2将赢得参与人1的硬币;否则,参与人1将赢得参与人2的硬币。猜硬币猜硬币 如果参与人的策略一致,是如果参与人的策略一致,是( (正面,正面正面,正面) ) 或或 ( (反面,反面反面,反面) ),则参与人则参与人1 1会偏向于改变策略;会偏向于改变策略; 但是如果两者策略不一致,是但是如果两者策略不一致,是( (正
4、面正面, , 反面反面) ) 或或 ( (反面反面, , 正正 面面) ),则参与人,则参与人2 2偏向于改变策略。偏向于改变策略。 参与人 2正面背面正面 -1, 1 1, -1参与人 1背面 1, -1 -1, 1 没有一组策略满足 (NE)2014/3/26张醒洲,大连52014/3/26张醒洲,大连6石头石头- -剪刀剪刀- -布博弈布博弈 此博弈也不存在纯策略纳什均衡,实际上是无人选择纯策略。此博弈也不存在纯策略纳什均衡,实际上是无人选择纯策略。 无论参与人无论参与人1 1选择哪个纯策略,参与人选择哪个纯策略,参与人2 2都可以打败他。都可以打败他。 参与人 2石头剪刀布石头0, 0
5、1, 00, 1参与人 1剪刀0, 10, 01, 0布1, 00, 10, 02014/3/26张醒洲,大连7猜对方策略,并总结为概率分布猜对方策略,并总结为概率分布 猜硬币博弈和划拳博弈的突出特点是每个参与人猜硬币博弈和划拳博弈的突出特点是每个参与人都试图猜中对方的策略。任何此类博弈都没有纯都试图猜中对方的策略。任何此类博弈都没有纯策略纳什均衡策略纳什均衡不存在不存在1.1.C1.1.C节所定义的纳什均衡。节所定义的纳什均衡。这一类博弈的解包含了不确定性:这一类博弈的解包含了不确定性:“一个参与人无法一个参与人无法预言其他人在一次具体博弈中的行动,而代之以预测预言其他人在一次具体博弈中的行
6、动,而代之以预测行动的概率分布行动的概率分布”。参与人通过观察、推断对手的行为只能得到概率分布参与人通过观察、推断对手的行为只能得到概率分布而不是确定性判断。而不是确定性判断。2014/3/26张醒洲,大连8纯策略,混合策略纯策略,混合策略考虑策略式(标准式)博弈考虑策略式(标准式)博弈G=G=S1, Sn; u1 , un 此后我们定义此后我们定义Si 中的策略为参与人中的策略为参与人 i 的纯策略的纯策略 在完全信息同时行动博弈中,一个参与人的纯策略就是在完全信息同时行动博弈中,一个参与人的纯策略就是他可以选择的不同行动;他可以选择的不同行动; 例如,在猜硬币的博弈中,例如,在猜硬币的博弈
7、中,Si 包含两个纯策略:正面与背面。包含两个纯策略:正面与背面。参与人参与人 i 的一个混合策略是在其策略空间的一个混合策略是在其策略空间Si中的中的 (一些或全部)纯策略上的概率分布。(一些或全部)纯策略上的概率分布。2014/3/26张醒洲,大连9互为互为最优反应对应,导致纳什均衡最优反应对应,导致纳什均衡 最优反应最优反应r r* *( (q q) )和和q q* *( (r r) )的交的交点确定了猜硬币博弈的点确定了猜硬币博弈的纳什均衡:纳什均衡: 如果参与人如果参与人i的策略是的策略是 (1/2,1/2) (1/2,1/2) ,则参与人,则参与人j j的最的最 优反应是优反应是
8、(1/2,1/2)(1/2,1/2),满足,满足纳什均衡的要求。纳什均衡的要求。反之亦然。反之亦然。图 1.3.6信息信息 与与 混合策略混合策略Eric Rasmusen. Games and Information - An Introduction to Game Theory.2007/GI/download.htm艾里克艾里克. .拉斯缪森拉斯缪森. . 博弈博弈与信息:博弈论与信息:博弈论概论概论, , 第第2 2版,第版,第4 4版版2014/3/26张醒洲,大连10构建博弈模型的两种方法构建博弈模型的两种方法在前几讲中大家已经见识了两
9、种不同的建模在前几讲中大家已经见识了两种不同的建模(modelling)modelling)方法方法: :l Game Theorys Methodl 给定行为人的信息、禀赋(筹码)、能力(生产函给定行为人的信息、禀赋(筹码)、能力(生产函数),预测理性参与人互动的结果。数),预测理性参与人互动的结果。Exemplifying Theory,modelling by example (MIT-style)从一个模糊的想法开始,运用数学逻辑推导结论,从一个模糊的想法开始,运用数学逻辑推导结论,并解释博弈结果。在并解释博弈结果。在“假设假设演绎演绎解释解释”三点之三点之间循环往复,找到一个最简单、
10、符合直觉的模型。间循环往复,找到一个最简单、符合直觉的模型。2014/3/26张醒洲,大连11描述一个博弈描述一个博弈 Describing a Game建模者的目的:用博弈规则描述一个情景建模者的目的:用博弈规则描述一个情景(situation),解释在此情景将发生什么结,解释在此情景将发生什么结果果(outcome)。博弈规则博弈规则(the rules )由博弈的基本元素组由博弈的基本元素组成成(the essential elements of the game),players, actions, payoffs, and information2014/3/26张醒洲,大连12参与
11、人的行动、行动集、行动组合参与人的行动、行动集、行动组合参与人参与人 j j的一个行动(的一个行动(a action ction or movemove) 是是他的一个选择,通常记为他的一个选择,通常记为a a j j. .每个参与人有一个行动集,是他可选行动每个参与人有一个行动集,是他可选行动的范围,记为的范围,记为 A A j j. .一一个行动组合个行动组合(action profile)(action profile)是由每个参与是由每个参与人的一个行动组成的有序集,记为人的一个行动组成的有序集,记为 a =a =a a j j, , j = 1,j = 1,,n.n.2014/3/2
12、6张醒洲,大连13支付支付 payoffpayoff每个参与人的支付是行动组合的函数每个参与人的支付是行动组合的函数ui(a1,ai,an)l 参与人通过支付函数相互依赖参与人通过支付函数相互依赖2014/3/26张醒洲,大连14信息集信息集 information setsinformation sets参与人的一个信息集是他在特定时点对于参与人的一个信息集是他在特定时点对于博弈相关变量可能取的值的了解,由他认博弈相关变量可能取的值的了解,由他认为可能的不同值组成。为可能的不同值组成。在动态博弈中,信息集不仅包括对当前形在动态博弈中,信息集不仅包括对当前形势的判断,还包括关于博弈历史路径的知
13、势的判断,还包括关于博弈历史路径的知识。识。参与人根据他对局势和历史的判断采取行参与人根据他对局势和历史的判断采取行动。根据对他人的了解作出反应。动。根据对他人的了解作出反应。2014/3/26张醒洲,大连15策略策略策略是参与人的行动规划:给定他的信息策略是参与人的行动规划:给定他的信息集,一个策略决定他在相应时点所选择的集,一个策略决定他在相应时点所选择的行动。行动。一旦博弈到达他的一个信息集,参与人将一旦博弈到达他的一个信息集,参与人将采取某个由策略规定的行动。采取某个由策略规定的行动。2014/3/26张醒洲,大连16策略集与策略组合策略集与策略组合策略集是一个参与人可行策略的集合策略
14、集是一个参与人可行策略的集合一个策略组合是由博弈的所有参与人每人一个策略组合是由博弈的所有参与人每人选择一个策略组成的有序集选择一个策略组成的有序集 s = s = (s1, . . . , sn). 策略组合的实现是某个特定的行动组合。策略组合的实现是某个特定的行动组合。2014/3/26张醒洲,大连17区分策略与行动区分策略与行动 1/31/3混合策略已经展示了策略与行动的区别混合策略已经展示了策略与行动的区别在动态博弈中,参与人想采取的行动取决于在动态博弈中,参与人想采取的行动取决于自然和其他参与人过去的行动、他对历史行自然和其他参与人过去的行动、他对历史行动的了解,与这些人当前的行动无
15、关。动的了解,与这些人当前的行动无关。策略是一个完整的行动计划,参与人要用策策略是一个完整的行动计划,参与人要用策略规定在每一种可预见的情况下他将采取的略规定在每一种可预见的情况下他将采取的行动,即使这种情况并未出现。行动,即使这种情况并未出现。一一个计划在个计划在19891989年消失的人,他的策略必须规定年消失的人,他的策略必须规定如果如果19901990年他还在局中,年他还在局中,19901990年他应如何行动。年他应如何行动。2014/3/26张醒洲,大连18区分策略与区分策略与行动行动 2/32/3策略是从策略是从“全部信息集全部信息集”到到“行动集行动集”的的函数。行动只是行动集中
16、的一个点函数。行动只是行动集中的一个点。策略是不可观测的意识活动。行动是可见策略是不可观测的意识活动。行动是可见的物质实现。的物质实现。2014/3/26张醒洲,大连19区分策略组合与结果区分策略组合与结果 3/33/3参与人的策略之间的相互作用决定了可能参与人的策略之间的相互作用决定了可能出现的结果。出现的结果。回忆:他们通过支付函数相联系回忆:他们通过支付函数相联系策略组合是多人策略的一个集合;策略组合是多人策略的一个集合;结果只是一组变量的一个特定值的集合。结果只是一组变量的一个特定值的集合。在数学上,策略组合是多维映射,结果是映射在数学上,策略组合是多维映射,结果是映射值域中的点。值域
17、中的点。2014/3/26张醒洲,大连20纯策略与混合策略纯策略与混合策略本讲前几页说的策略是纯策略。本讲前几页说的策略是纯策略。纯策略纯策略(pure strategy)将参与人的每一个将参与人的每一个可能的信息集映射到一个行动上。可能的信息集映射到一个行动上。si :i ai.l 混合策略混合策略(mixed strategy)将参与人的每一将参与人的每一个可能信息集映射到一个关于行动的概率个可能信息集映射到一个关于行动的概率分布上分布上2014/3/26张醒洲,大连212014/3/26张醒洲,大连22纳什均衡纳什均衡: : 性别战博弈性别战博弈 此博弈存在两个纯策略纳什均衡 (Oper
18、a, Opera) 和 (Fight, Fight) 都是纳什均衡2014/3/26张醒洲,大连23性别战性别战博弈:博弈:混合策略纳什均衡混合策略纳什均衡 混合策略组混合策略组 : (r,1-r)=(2/3, 1/3): (r,1-r)=(2/3, 1/3)和和(q, 1-q)=(1/3, 2/3)(q, 1-q)=(1/3, 2/3)是一个是一个纳什均衡纳什均衡 PatChrisOpera qFight1-qOpera r 2, 1 0, 0Fight 1-r 0, 0 1, 2纳什均衡纳什均衡: : 性别战博弈性别战博弈纯策略纯策略NENE可以解释为协调一致或者默契可以解释为协调一致或者
19、默契混合策略混合策略NENE可以解释为长期规律,即频率。可以解释为长期规律,即频率。个人倾向于满足自己的爱好,并适当照顾个人倾向于满足自己的爱好,并适当照顾伴侣的口味。(伴侣的口味。(O O,F F)与()与(F F,O O)发生)发生的几率都是的几率都是1/91/9,即两人有,即两人有2/9=22.22%2/9=22.22%的的机会不协调,这就是生活!机会不协调,这就是生活!2014/3/26张醒洲,大连24 一对伴侣相处多年后如何看待一对伴侣相处多年后如何看待这个混合策略纳什均衡?这个混合策略纳什均衡?2014/3/26张醒洲,大连25混合策略均衡解释为信念均衡混合策略均衡解释为信念均衡信
20、念是主观概率,源于个人的信息。信念是主观概率,源于个人的信息。得出信念时切忌偏执,要全面(和)、客观得出信念时切忌偏执,要全面(和)、客观(中)。(中)。混合策略均衡是一种混合策略均衡是一种“信念均衡信念均衡”导致均衡结果的一组混合策略,可以看成一组导致均衡结果的一组混合策略,可以看成一组均衡的信念。均衡的信念。参与人的策略,是其他局中人关于该参与人将参与人的策略,是其他局中人关于该参与人将如何行动的信念或主观概率。如何行动的信念或主观概率。2014/3/26张醒洲,大连26均衡信念与随机选择的行动均衡信念与随机选择的行动在后面我们叫做在后面我们叫做“支付均等化方法支付均等化方法”Eric R
21、asmusen. Eric Rasmusen. Games and Information Martin J. Osborne, Ariel Rubinstein. A course in Game Theory. 定义32.1,引理33.2,定义44.1,httphttp:/economics.utoronto.ca/osborne/cgt/index.html:/economics.utoronto.ca/osborne/cgt/index.html支付函数支付函数的期望值(的期望值(expected value)expected value)是可能是可能支付的线性函数。微分法的一阶条件与
22、支付支付的线性函数。微分法的一阶条件与支付均等化方法是一致的。均等化方法是一致的。2014/3/26张醒洲,大连27均衡信念均衡信念与行动的随机化与行动的随机化给定给定关于其他人行动的均衡信念,局中人关于其他人行动的均衡信念,局中人的均衡策略的支撑集中的任意一个纯策略的均衡策略的支撑集中的任意一个纯策略(或叫做行动)给他带来相同(或叫做行动)给他带来相同的期望支付,的期望支付,所以他可以在这些行动中随机选择。所以他可以在这些行动中随机选择。那么,混合策略均衡就成了一那么,混合策略均衡就成了一种状态,其种状态,其中参与人无法确定对手的实际行动中参与人无法确定对手的实际行动。2014/3/26张醒
23、洲,大连28混合策略:概率解释混合策略:概率解释纯策略是直接选择行动纯策略是直接选择行动混合策略是先选一枚色子,然后根据掷色混合策略是先选一枚色子,然后根据掷色子的结果选择行动。子的结果选择行动。设想有各种色子:圆球,铜板,三面体、四面设想有各种色子:圆球,铜板,三面体、四面体、五面体,体、五面体,。 均匀的,不均匀的。均匀的,不均匀的。2014/3/26张醒洲,大连29混合策略:信息不对称解释混合策略:信息不对称解释在上一讲中,策略依赖于参与人的类型。在上一讲中,策略依赖于参与人的类型。策略也可以依赖于某些(外生)变量的实策略也可以依赖于某些(外生)变量的实现值。现值。如果在参与人之间,对类
24、型、(外生)变如果在参与人之间,对类型、(外生)变量的观察是不对称的,结果是你发现对方量的观察是不对称的,结果是你发现对方的行动是随机的,但对方对自已的行动是的行动是随机的,但对方对自已的行动是胸有成竹的。胸有成竹的。例如金融市场中的知情人与噪声交易者。例如金融市场中的知情人与噪声交易者。2014/3/26张醒洲,大连30斗鸡博弈斗鸡博弈(Chicken) (Chicken) , 鹰鹰- -鸽博弈鸽博弈(Hawk-Dove)(Hawk-Dove)the Payoff-Equating Method 2014/3/26张醒洲,大连31斗鸡博弈斗鸡博弈 这个博弈的支付关于参与人是对称的,所以他们这
25、个博弈的支付关于参与人是对称的,所以他们的混合策略相同,其中的混合策略相同,其中 表示个人坚持的概率。表示个人坚持的概率。Chicken, Hawk - Dove琼斯坚持()避让(1-)坚持()-3,-32,0史密斯避让(1-) 0, 21,1支付:(史密斯,琼斯)2014/3/26张醒洲,大连32斗鸡斗鸡博弈,博弈,payoff - equatingpayoff - equatingU U琼斯琼斯(避让)(避让)= = ( 0 0 ) + + (1- 1- ) (1 1) U U琼斯琼斯(坚持)(坚持)= = (-3-3) + + (1- 1- ) (2 2)U U琼斯琼斯(避让(避让)=
26、= U U琼斯琼斯(坚持(坚持)1- 1- = 2-5 = 2-5 , =0.25 =0.25 其中,其中, 是对方(史密斯)坚持的概率。是对方(史密斯)坚持的概率。2014/3/26张醒洲,大连33斗鸡斗鸡博弈,儿行千里母担忧博弈,儿行千里母担忧局中人同时坚持引发惨剧的概率局中人同时坚持引发惨剧的概率 = = 6.25%6.25%. .琼 斯坚持()避让(1-)坚持()-3,-32,0史密斯避让(1-) 0,21,12014/3/26张醒洲,大连34斗鸡斗鸡博弈,损失大小与面子博弈,损失大小与面子琼 斯坚持()避让(1-)坚持()x,x2,0史密斯避让(1-) 0,21,12014/3/26
27、张醒洲,大连35斗鸡斗鸡博弈博弈, , 囚徒困境囚徒困境琼 斯坚持()避让(1-)坚持()0.5,0.52,0史密斯避让(1-) 0,21,12014/3/26张醒洲,大连36先下手为强先下手为强(preemption game) (preemption game) ,抓钱博弈抓钱博弈(grab the dollar)(grab the dollar)OPTIMAL TIMING2014/3/26张醒洲,大连37酒鬼的故事,酒鬼的故事, 高处不胜寒高处不胜寒2014/3/26张醒洲,大连38“乙肝疫苗乙肝疫苗”神话难逃神话难逃“幂律幂律” 2014/3/26张醒洲,大连39抓钱博弈,抓钱博弈,
28、 桌面上的一元钱桌面上的一元钱 这个博弈有不对称的纯策略均衡,对称的混合策略均衡。这个博弈有不对称的纯策略均衡,对称的混合策略均衡。 这个博弈的支付关于参与人是对称的,所以他们的混合策略相这个博弈的支付关于参与人是对称的,所以他们的混合策略相同,其中同,其中 表示个人坚持的概率。表示个人坚持的概率。 对称均衡中对称均衡中 =0.5=0.5琼斯抓()等待(1-)抓()-1,-11,0史密斯等待(1-) 0,10,0支付:(史密斯,琼斯)2014/3/26张醒洲,大连40抓钱博弈可用于行为金融学抓钱博弈可用于行为金融学将将“抓钱抓钱”换成换成“派发派发”或或“建仓建仓”根据实情设定支付函数。例如,
29、支付根据实情设定支付函数。例如,支付反映反映账面财富变化账面财富变化2014/3/26张醒洲,大连41贡献博弈贡献博弈 contribution gamecontribution game 有两个纯策略非对称有两个纯策略非对称NENE,一一个混合策个混合策略对称均衡,后者很适合群体行为略对称均衡,后者很适合群体行为性别战,抓钱博弈,市民责任性别战,抓钱博弈,市民责任2014/3/26张醒洲,大连42市民责任博弈市民责任博弈 The Civic Duty Game向多个局中人扩展A notorious example in social psychology is the murder of K
30、itty Genovese, who was killed in New York City in 1964 despite the presence of numerous neighbors.2014/3/26张醒洲,大连43the murder of Kitty Genovese“38 Who Saw Murder Didnt Call Police”“For more than half an hour 38 respectable, law-abiding citizens in Queens watched a killer stalk and stab a woman in th
31、ree separate attacks in Kew Gardens. Twice the sound of their voices and the sudden glow of their bedroom lights interrupted him and frightened him off. Each time he returned, sought her out, and stabbed her again. Not one person telephoned the police during the assault; one witness called after the woman was dead.” Martin Gansberg. The New York Times, March 27, 1964, p. 1. 2014/3/26张醒洲,大连44市民责任博弈市民责任博弈每位邻居都希望有人报警来制止这一抢劫,个人每位邻居都希望有人报警来制止这一抢劫,个人报警成本相当于支付减少报警成本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年南昌影视传播职业学院单招职业适应性考试题库及答案详解1套
- 2026年唐山职业技术学院单招职业倾向性考试题库及参考答案详解1套
- 2026年浙江师范大学行知学院单招职业倾向性测试题库及参考答案详解
- 2026年湖南电子科技职业学院单招职业技能测试题库及参考答案详解一套
- 天津市五区县重点校联考2024-2025学年高二上学期11月期中生物试题含答案
- 仲恺教师面试题及答案
- 云南省中医院面试题及答案
- 2025年重庆标准件工业有限责任公司招聘28人备考题库及完整答案详解一套
- 2025年浙江浙商融资租赁有限公司招聘备考题库及1套完整答案详解
- 2025年中国黄金集团香港有限公司社会公开招聘备考题库附答案详解
- 2025年北京市建筑施工作业人员安全生产知识教育培训考核试卷E卷及答案
- 中铁群安员培训
- 2024年云南省第一人民医院招聘考试真题
- 2025急性高甘油三酯血症胰腺炎康复期多学科管理共识解读
- 思政大一考试试卷及答案
- 2025年事业单位面试热点题目及答案解析
- 湖北省宜昌市秭归县2026届物理八年级第一学期期末学业水平测试模拟试题含解析
- 采用烟气挡板法再热汽温控制系统的研究
- 班组长培训课件(36张)
- 工程竣工预验收会议纪要模板
- 公路水运工程施工企业主要负责人和安全生产管理人员模拟试题库含答案
评论
0/150
提交评论