《博弈论混合策略》PPT课件.ppt_第1页
《博弈论混合策略》PPT课件.ppt_第2页
《博弈论混合策略》PPT课件.ppt_第3页
《博弈论混合策略》PPT课件.ppt_第4页
《博弈论混合策略》PPT课件.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论 Game Theory,蔡树彬 66162) 科技楼1406,2,第7讲 连续策略,基本定义:划拳博弈 支付均等化:小偷与守卫 导数法:政府救助 BR函数法:性别大战,3,划拳博弈,锤,剪,包,锤,剪,包,0,0,1,-1,-1,1,-1,1,0,0,1,-1,1,-1,-1,1,0,0,1,2,1. 写出1和2所有的最佳应对:BR1(锤2)=包1. 2. 在上面的矩阵里把相应的最佳应对画上圈,这个博弈有没有占优策略? 有没有Nash均衡策略? 3. 使用箭头的方法再次寻找均衡 4. 假如是你来玩这个游戏,你将如何来玩这个游戏?,4,不存在Nash均衡,如何应对? 假定对方是个高手,你愿意和他一局定胜负还是5局3胜? 假定对方是个低手呢? 假定5局3胜,对手“包包包包包”,你有什么策略获胜? 假定5局3胜,对手“包包剪包包”,你有什么策略获胜? 假定5局3胜,对手“包包锤剪包”,你有什么策略获胜? 假定5局3胜,你知道对手会出3包1锤1剪,但是不知道顺序,你有什么策略获胜? 假定3局2胜,你知道对手会出1包1锤1剪,但是不知道顺序,你有什么策略获胜? 假定1局定胜负,你知道对手喜欢出包,你有什么策略获胜? 假定1局定胜负,你知道对手随便乱出拳,你有什么策略获胜?,5,划拳博弈,锤1,剪2,包3,锤1,剪2,包3,0,0,1,-1,-1,1,-1,1,0,0,1,-1,1,-1,-1,1,0,0,1,2,取胜关键:不能让另一方猜到自己的策略 尽可能猜出对方策略,6,混合策略的提出,利用生活经验不难知道,为了获胜,不能让对手知道自己要出什么,所以要用随机的方法来出拳,而且要等概率(为什么?) 在这个例子里,A的策略是(1/3锤,1/3剪,1/3包) 这就引出了用概率来确定采用何种策略的方法,这就是混合策略(mixed strategies)概念的由来 在此之前所说的策略,实质上是以概率1选取某个确定的策略或行动,我们称之为纯策略 (pure strategies),7,混合策略的提出,博弈G=N, Ai, ui, iN 参与人i的纯策略构成的策略集合为Si=Ai =si1, sik, 参与人i有j个不同的策略 混合策略:若参与人i以概率分布pi=(pi1, pik) 在其k个可选策略中随机选择“策略” 0pij 1,对于j=1 , k都成立 pi1+ pik=1 纯策略可看成特殊的混合策略,8,混合策略意义下的相关表述,混合策略空间: (pi1, pik) (si1, sik)T 混合策略意义下策略组合的表述 x1X1, , xnXn,其中Xi , i =1, , n表示参与人i的混合策略空间,xi为参与人i的一个具体混合策略,9,纳什均衡的存在性问题,每一个有限博弈至少存在一个纳什均衡(纯策略或混合策略); 如果一个博弈存在两个纯策略纳什均衡,那么,一定存在第三个混合策略纳什均衡,10,为什么要不能严打,加大打击力度 加大处罚力度(多判死刑) 加大酒驾的惩罚力度 猎虎行动,11,小偷和守卫的博弈,小偷和守卫的博弈,这个博弈的均衡是什么?概率是多大? 加重对小偷的处罚会有什么结果?(增大P值) 加重对守卫的处罚会有什么结果?(增大D值),12,支付均等化,如果对手猜出自己的行为,则自己必败 为了不让对手猜出自己的行为,必须以一定概率选择纯策略 该概率的选择使得每种纯策略带来的支付都相等,所以不会偏向任何一种策略,13,支付均等化,小偷以的概率偷,守卫以的概率睡觉,14,理解混合策略,1。 参与人随机做出某种行为(偷或者不偷) 2. 有许多参与人,每个人的行为是确定的,但是大家在一起表现出统计特征 3. 参与人是确定行为,但是对其他人来说是随机的。守卫随机抽取一人,并不能确定该人是偷还是不偷,15,加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,16,加重对守卫的处罚:短期效果是使守卫更尽职 但长期中并不是使守卫更尽职,而是会降低盗窃发生的概率,17,如何使失窃率下降? 加大对小偷的处罚 只会一时改善治安 长期作用是使监管者更懒惰 加大对守卫的处罚 短期使守卫更尽职 长期是使偷窃率下降 如何治理贪污? 加大对贪官的处罚力度? 加大对纪委的处罚力度 不能头痛医头,脚痛医脚 加大酒驾的惩处力度,只会使执法者更懒,不会制止酒驾 要制止救驾,就要加大对警察的惩罚力度,使得警察增大查处的概率 物价降不下来?不能只是处罚供应商,不能只是约谈。 要加大对发改委的惩处力度(干不好就下去) 引咎辞职,18,救助的困境,被救助者在老家盖房子 汶川的救助物资现在都没用(救助款更不知道到哪里去了) 郭美美事件 救助会不会养懒汉? 为治疗某个病人的捐款常在治好病之后被人侵吞,19,混合策略:政府以某个概率救济,贫民以某个概率失业,20,贫民必须以20%的概率迷惑政府,21,22,均衡是(0.5,0.5),(0.2,0.8),如果偏离均衡,会怎么样? 比如如果乐善好施的政府,其救助概率大于0.5,比如说0.6,会如何? 贫民都游手好闲 不是救助得越多越好,要有一个度 饿不死,吃不饱是救济的要领 利益高于道德(只要利益更高,人们就倾向于游手好闲,不劳而获) 自私的基因 农民和地主的区别,23,r:妻,时装,q:夫,时装,0 1/3 1 图1-19 性别战的图解法,1,r=R1(q),q=R2(r),3/4,这三个点的坐标为(0, 0), (1/3, 3/4),(1, 1)。对应的三个策略分别是:(足球,足球);丈夫、妻子分别以1/3、3/4的概率选择时装;(时装,时装)。,BR法:性别大战,策略 期望得益 妻 (0.75,0.25) 0.67 夫 (1/3,2/3) 0.75,24,制式问题,A B 得益 厂商1: 0.4 0.6 0.664 厂商2: 0.67 0.33 1.296,25,市场机会博弈,进 不进 得益 厂商1: 2/3 1/3 0 厂商2: 2/3 1/3 0,问题:,你跟舍友打球(羽毛球、乒乓球), 假设可以打远球、近球,你的击打策略是? 请建模求解 其他例子,26,27,足球点球,单号为球员,双号为守门员,选择你的策略 选择纯策略 选择混合策略 如果守门员左边的扑球技巧提高,(50,50)-(30.70),他是否应该更多地往右边射门?,28,所有的运动都要使用混合策略 篮球:三分远投还是内线

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论