博弈论及其应用-混合策略纳什均衡ppt课件_第1页
博弈论及其应用-混合策略纳什均衡ppt课件_第2页
博弈论及其应用-混合策略纳什均衡ppt课件_第3页
博弈论及其应用-混合策略纳什均衡ppt课件_第4页
博弈论及其应用-混合策略纳什均衡ppt课件_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、整理课件博弈论及其应用博弈论及其应用完全信息静态博弈:完全信息静态博弈: 混合策略纳什均衡混合策略纳什均衡张红霞国民经济管理系整理课件混合策略纳什均衡混合策略纳什均衡4混合策略4混合策略纳什均衡张红霞国民经济管理系整理课件混合策略纳什均衡混合策略纳什均衡4混合策略混合策略4混合策略纳什均衡张红霞国民经济管理系整理课件混合策略混合策略The cliffhanger混合策略期望效用NE和最优反应案例混合策略博弈的性质张红霞国民经济管理系整理课件混合策略混合策略4混合策略:把不确定性引入纯战略,即参与者以一定的概率选择他的战略,比如网球比赛中,运动员以60的概率发正手球,40的概率发反手球。张红霞国

2、民经济管理系整理课件混合策略混合策略4为什么采用“混合策略”?考虑下面的博弈:扑克牌对色游戏 两个人参与这个游戏,从自己的扑克牌中抽出一张,一起翻开,如果颜色一样,甲输给乙一根火柴;如果颜色不一样,甲赢得乙一根火柴。不允许出大小鬼。描述这个博弈,寻找纳什均衡。张红霞国民经济管理系整理课件混合策略混合策略红红黑黑-1,11,-1-1,11,-1乙甲张红霞国民经济管理系整理课件混合策略混合策略这个博弈“不存在”我们前面所讲的纳什均衡在这个游戏中,重要的是猜测对方的出牌规律,同时避免对方猜到自己的出牌规律。也就是说,要尽量让对手迷失。这种随机化自己可选策略的做法,就是采取“混合策略”的思想。局中人以

3、一定的概率p选择红,以一定的概率1-p选择黑,则(p,1-p)概括了某个局中人所有的混合策略。可知这样的混合策略有无穷多个。两个局中人的策略组合有无穷多个张红霞国民经济管理系整理课件混合策略混合策略红 p红q黑1-q黑 1-p-1,11,-1-1,11,-1乙甲张红霞国民经济管理系整理课件混合策略混合策略当参与人可以选择的策略比较多时(3个,4个,),用一个字母就不够用了,需要用多个字母表示其混合策略可以想象,混合策略情况下,参与人的支付不再是确定性的。需要用期望支付期望支付的概念张红霞国民经济管理系整理课件混合策略混合策略1)2 1 , 01),(,;,11111KkikikikikiKii

4、iKiiinnsiissSKSuuSSGn)的概率。选择参与者为的一个混合战略,称为,那么,概率分布,个参与人参加的博弈张红霞国民经济管理系整理课件混合策略混合策略为混合战略组合),(1niiii混合战略组合空间:的混合战略空间:),()(iiiivvi的期望效用函数:参与人 Ssinjjjisusv)() )()(1张红霞国民经济管理系整理课件混合策略混合策略4举例扑克牌对色游戏中,假设p0.5,q0.5,写出双方在这种情况下的期望支付张红霞国民经济管理系整理课件混合策略混合策略4举例:两人博弈的情况,2;,1232221212111sssSssS的纯战略:参与人的纯战略:参与人),(),(

5、),(),(1),(21231112322111222111121321112112322212ssussussussus1jjj时的期望效用为选择则参与人的混合策略为认为参与人参与人张红霞国民经济管理系整理课件混合策略混合策略4举例:两人博弈的情况),(112111选择混合战略如果参与人312121212312111211211),(),(),(,jjjjjjssussuv他的期望效用为那么213121121213121121),(),(kjjkjkkjjkjkssussu张红霞国民经济管理系整理课件混合策略混合策略4举例:两人博弈的情况 类似的,可以写出参与人2的期望效用Ssiisusv)

6、()()(简炼的表达关于期望效用函数更为张红霞国民经济管理系整理课件混合战略混合战略硬币博弈a1b1a2b21,-1-1, 11, -1-1, 1p(1-p)q(1-q)各种战略组合及其概率各种战略组合及其概率(a1,a2)(a1,b2)(b1,a2)(b1,b2)pqp(1-q)(1-p)(1-q)(1-p)q期望效用期望效用1)1)(1 () 1()1 () 1)(1 (1),(211qpqpqppqv) 1()1)(1 (1)1 (1)1 () 1(),(212qpqpqppqv张红霞国民经济管理系整理课件混合战略纳什均衡混合战略纳什均衡4纯战略纳什均衡 混合战略纳什均衡对于某个参与人来

7、说,最优混合战略是指期望效用最大化的混合战略对于前面的例子:二人博弈来说:222*12*2*1211*211*2*11*2*1*),(),(),(),(),(vvvv必须满足混合战略纳什均衡张红霞国民经济管理系整理课件混合战略纳什均衡混合战略纳什均衡iiiiiiiinnnvvniuuSSG),(),(, 2 , 1),(,;,*1*11,有所有的是一个纳什均衡,若对混合战略组合对于博弈衡定义:混合战略纳什均张红霞国民经济管理系整理课件混合战略纳什均衡混合战略纳什均衡4 4 iijiijiiikiikiiKiiSssvsv),(),(, 0),(1有则对所有的时的最优混合战略是给定若iijiiK

8、iiiiiiiiKiSssvsvsv),(),(),(, 0, 0211即,如果这些战略之间无差异是最优战略,参与人在优混合战略的纯战略都所有以正的概率进入最张红霞国民经济管理系整理课件混合战略纳什均衡混合战略纳什均衡iiiiiiiinssvvni),(),(, 2 , 1),(*1*,有若对所有的是一个纳什均衡,定义:混合战略组合由上述混合战略纳什均衡的定义,以及混合战略的定义,可以得到:张红霞国民经济管理系整理课件a1b1a2b23,2-1, 30, 0-1, 1社会福利博弈q(1-q)p(1-p)期望效用期望效用混合战略纳什均衡混合战略纳什均衡政府流浪汉qqpqqpqqpv) 15()0

9、)1 () 1()(1 ()1)(1 (3(),(211ppqppqppqv3) 12()0)1 (3)(1 () 1)1 (2(),(212张红霞国民经济管理系整理课件011反应函数反应函数0.50.2BR1(q)BR2(p)不救济混合策略救济qp2 . 0, 015*1qqpv5 . 0, 0) 12(*2ppqv2 . 0, 12 . 0,1 , 02 . 0, 0qifqifqifp5 . 0, 05 . 0,1 , 05 . 0, 1pifpifpifq找工作混合策略不找工作混合战略纳什均衡混合战略纳什均衡反反应应对对应应反应对应反应对应张红霞国民经济管理系整理课件混合战略纳什均衡混

10、合战略纳什均衡硬币博弈a1b1a2b21,-1-1, 11, -1-1, 1p(1-p)q(1-q)期望效用期望效用1)1)(1 () 1()1 () 1)(1 (1),(211qpqpqppqv) 1()1)(1 (1)1 (1)1 () 1(),(212qpqpqppqv张红霞国民经济管理系整理课件 111/20,11/201/2qBR qqq 201/20,11/211/2pBRppp0.50.5BR1(q)BR2(p)反应函数反应函数 142BR qq 224BRpp011p(a1)q(a2)混合战略纳什均衡混合战略纳什均衡反反应应对对应应反应对应反应对应张红霞国民经济管理系整理课件混

11、合战略纳什均衡混合战略纳什均衡4报案(reporting a crime)n个人目睹一桩罪行,每个人都希望报警,但是都倾向于其他人打电话。特别的,假定能从报警中得到v单位的收益,而打电话的人需要付出c单位的成本,vc0。分析这个问题的纯战略NE和混合战略NE。张红霞国民经济管理系整理课件混合战略纳什均衡混合战略纳什均衡分析: 参与人:n个 每个参与人的战略集:打电话,不打电话 效用:没有任何人打,所有人0支付; 打,v-c; 不打,但其他人至少有一个人打,v纯战略NE 当只有两个参与人的时候(公共产品提供的斗鸡博弈)两个NE n个人的时候:假设有m个人提供,m1 or m=1 n个NE张红霞国

12、民经济管理系整理课件混合战略纳什均衡混合战略纳什均衡混合战略NE 任何一个参与人i的期望效用函数: 假设i提供的概率为pi,第i个参与人最大化自己的期望效用,得到 )1 (1 ()1 (0)1 ()(),(ijjijjiiiiipvppcvpVvcpijj/)1 (张红霞国民经济管理系整理课件混合战略纳什均衡混合战略纳什均衡由此,c/v1,因此,随着人数n的增加,p减小,即人越多,每个人选择报案的概率就会越小,如果n1,则p1社会心理学与博弈分析ppppn21)1/(11)/(1)1 (nnvcpvcp张红霞国民经济管理系整理课件几乎所有有限博弈都有有限奇数个纳什均衡对每个参与人来讲,在构成混合战略均衡纯战略之间是无差异的,即带来的支即带来的支付是无差异的付是无差异的因此,寻找混合战略纳什均衡的方法除因此,寻找混合战略纳什均衡的方法除了优化方法,还有等值法了优化方法,还有等值法混合战略纳什均衡混合战略纳什均衡张红霞国民经济管理系整理课件案例分析案例分析4有人要打网球吗?张红霞国民经济管理系整理课件小结小结4混合策略的定义,含义4期望效用4混合策略纳什均衡:定义求解含义4案例张红霞国民经济管理系整理课件Homework1. Find all “mixed” strategy NE to a Pri

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论