专题一:零和博弈剖析课件_第1页
专题一:零和博弈剖析课件_第2页
专题一:零和博弈剖析课件_第3页
专题一:零和博弈剖析课件_第4页
专题一:零和博弈剖析课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、专题一:零和博弈2022/7/141Zero-Sum Game内容提要零和博弈最小最大方法直线交叉法对抗性排序零和博弈与非零和博弈(zero-sum game and non-zero-sum game)如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零,这个博弈就叫零和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零,这个博弈就叫非零和博弈。零和博弈是利益对抗程度最高的博弈。零和博弈:掷硬币-1,11,-1反面1,-1-1,1正面反面正面12支付常和博弈与非常和博弈(constant-sum game and variable-sum game)如果一个博

2、弈在所有各种对局下全体参与人之得益总和总是保持为一个常数,这个博弈就叫常和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数,这个博弈就叫非常和博弈。常和博弈也是利益对抗程度最高的博弈。常和博弈与归零博弈设G是一个n人常和博弈,那么在G的每种战略组合下博弈的n个参与人的支付的总和是一个常数。常数的1/n称为常和博弈支付的偏零因子。对于每个n人常和博弈G,可以从每个参与人的支付中减去博弈的偏零因子,将G转换为零和博弈G/,把G/叫做常和博弈G的归零博弈。常和博弈:掷硬币常和为-1:偏零因子-1/2-1.5,0.50.5,-1.5反面0.5,-1.5-1.5,0.5正

3、面反面正面12支付归零博弈:支付减去-0.5-1,11,-1反面1,-1-1,1正面反面正面12支付非零和博弈:囚犯困境(蕴含双赢或多赢)抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A行局中人的支付-11反面1-1正面反面正面12支付内容提要零和博弈最小最大方法直线交叉法对抗性排序最小最大方法由冯诺依曼提出基本思想: 作为局中人,对手将采取对他自己最有利的策略;相应的,对手会选择使你获得尽可能差的支付的策略。 由于零和博弈的特点和性质,以上思想即为:任何使对手得到最好结果的策略,都会使你获得最差的结果。 双方都具有这样的理性!最小最大方法的应用610下4-3上右左甲乙

4、支付max=10 max=6min=-3min=6最小最大方法:132下41上右左12支付最小最大方法:13,-32,-2下4,-41,-1上右左12支付最小最大方法:234下21上右左12支付最小最大方法:23,-34,-4下2,-21,-1上右左12支付最小最大方法:3531621100 参与人2L M R参与人1UDM最小最大方法:35,-53,-31,-16,-62,-21,-11,-10,00,0 参与人2L M R参与人1UDM最小最大方法:4532643160 参与人2L M R参与人1UDM最小最大方法:45,-53,-32,-26,-64,-43,-31,-16,-60,0

5、参与人2L M R参与人1UDM内容提要零和博弈最小最大方法直线交叉法对抗性排序最小最大方法: 适用于零和博弈的纯策略纳什均衡扩展的最小最大方法(直线交叉方法): 适用于零和博弈的混合策略纳什均衡在非零和博弈中,可能存在共同利益。 无纯策略纳什均衡的零和博弈-11反1-1正反正12支付max=1 max=1min=-1min=-11的选择-11反(1-p)1-1正(p)反正12支付p-混合 -p+(1-p) p-(1-p)min=-1min=-1min=?1的支付1-101/21-111的p混合策略2正2反参与人1的p-混合策略图解2的选择-11反1-1正反(1-q)正(q)12支付max=1

6、 max=1q-混合-q+(1-q)q-(1-q)max=?2的支付1-101/21-112的q混合策略1反1正参与人2的q-混合策略图解内容提要零和博弈最小最大方法直线交叉法对抗性排序对抗性排序 根据收益的相关性进行“你死我活”的掷硬币游戏-1,11,-1反面1,-1-1,1正面反面正面12支付出现“双赢”可能的价格大战低价高价低价3,36,1高价1,65,5支付百事可乐可口可乐个体利益与集体利益一致的性别战博弈1,20,0足球0,02,1时装足球时装妻子支付 丈夫协调博弈广义的协调博弈:包括所有能够协调出双赢对局的博弈,如囚徒困境;狭义的协调博弈:仅指个体利益与集体利益一致的博弈,对于参与

7、人而言,合作总比不合作要好。协调博弈举例:胖子进门-1,-11,2后走2,1-1,-1先走后走先走张三支付 李四协调博弈举例:交通规则博弈1,1-1,-1靠左-1,-11,1靠右靠左靠右张三支付 李四对称博弈对称博弈是指在无角色区分的参与者之间进行的协调博弈,它表现在支付函数的对称上,二者的策略集是一样的。 抑或:通俗说就是代表参与者身份的下标,在分析中可以省略掉而没有关系。对称博弈分成三类: 支付占优与风险占优不一致; 支付占优与风险占优一致; 无占优性可比的协调博弈。 支付占优与风险占优不一致3,32,0猎兔0,24,4猎鹿猎兔猎鹿甲支付 乙 纯策略猎鹿是支付占优纳什均衡、纯策略猎兔是风险占优纳什均衡。 猎兔策略是一个保险策略,而猎鹿则是一个帕累托效率策略但由于策略的不确定性而使它具有较大的风险。 因此,均衡选择取决于参与人对风险的态度。 支付占优与风险占优一致1,10,0右行0,01,1左行右行左行甲支付 乙这种情况博弈双方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论