




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈论及其应用,完全信息静态博弈: 混合策略纳什均衡,混合策略纳什均衡,混合策略 混合策略纳什均衡,混合策略纳什均衡,混合策略 混合策略纳什均衡,混合策略,The cliffhanger,混合策略 期望效用 NE和最优反应 案例 混合策略博弈的性质,混合策略,混合策略:把不确定性引入纯战略,即参与者以一定的概率选择他的战略,比如网球比赛中,运动员以60的概率发正手球,40的概率发反手球。,混合策略,为什么采用“混合策略”? 考虑下面的博弈:扑克牌对色游戏 两个人参与这个游戏,从自己的扑克牌中抽出一张,一起翻开,如果颜色一样,甲输给乙一根火柴;如果颜色不一样,甲赢得乙一根火柴。不允许出大小鬼。描
2、述这个博弈,寻找纳什均衡。,混合策略,红,红,黑,黑,-1,1,1,-1,-1,1,1,-1,乙,甲,混合策略,这个博弈“不存在”我们前面所讲的纳什均衡 在这个游戏中,重要的是猜测对方的出牌规律,同时避免对方猜到自己的出牌规律。也就是说,要尽量让对手迷失。这种随机化自己可选策略的做法,就是采取“混合策略”的思想。 局中人以一定的概率p选择红,以一定的概率1-p选择黑,则(p,1-p)概括了某个局中人所有的混合策略。可知这样的混合策略有无穷多个。两个局中人的策略组合有无穷多个,混合策略,红 p,红 q,黑 1-q,黑 1-p,-1,1,1,-1,-1,1,1,-1,乙,甲,混合策略,当参与人可以
3、选择的策略比较多时(3个,4个,),用一个字母就不够用了,需要用多个字母表示其混合策略 可以想象,混合策略情况下,参与人的支付不再是确定性的。需要用期望支付的概念,混合策略,混合策略,混合策略,举例 扑克牌对色游戏中,假设p0.5,q0.5,写出双方在这种情况下的期望支付,混合策略,举例:两人博弈的情况,混合策略,举例:两人博弈的情况,混合策略,举例:两人博弈的情况 类似的,可以写出参与人2的期望效用,混合战略,硬币博弈,a1,b1,a2,b2,1,-1,-1, 1,1, -1,-1, 1,p,(1-p),q,(1-q),各种战略组合及其概率,(a1,a2),(a1,b2),(b1,a2),(
4、b1,b2),pq,p(1-q),(1-p)(1-q),(1-p)q,期望效用,混合战略纳什均衡,纯战略纳什均衡 混合战略纳什均衡 对于某个参与人来说,最优混合战略是指期望效用最大化的混合战略 对于前面的例子:二人博弈来说:,混合战略纳什均衡,混合战略纳什均衡,混合战略纳什均衡,由上述混合战略纳什均衡的定义,以及混合战略的定义,可以得到:,a1,b1,a2,b2,3,2,-1, 3,0, 0,-1, 1,社会福利博弈,q,(1-q),p,(1-p),期望效用,混合战略纳什均衡,政府,流浪汉,1,反应函数,0.5,0.2,BR1(q),BR2(p),不救济 混合策略 救济,q,p,找工作 混合策
5、略 不找工作,混合战略纳什均衡,反应对应,反应对应,混合战略纳什均衡,硬币博弈,a1,b1,a2,b2,1,-1,-1, 1,1, -1,-1, 1,p,(1-p),q,(1-q),期望效用,0.5,BR1(q),BR2(p),反应函数,混合战略纳什均衡,反应对应,反应对应,混合战略纳什均衡,报案(reporting a crime) n个人目睹一桩罪行,每个人都希望报警,但是都倾向于其他人打电话。特别的,假定能从报警中得到v单位的收益,而打电话的人需要付出c单位的成本,vc0。分析这个问题的纯战略NE和混合战略NE。,混合战略纳什均衡,分析: 参与人:n个 每个参与人的战略集:打电话,不打电
6、话 效用:没有任何人打,所有人0支付; 打,v-c; 不打,但其他人至少有一个人打,v 纯战略NE 当只有两个参与人的时候(公共产品提供的斗鸡博弈)两个NE n个人的时候:假设有m个人提供,m1 or m=1 n个NE,混合战略纳什均衡,混合战略NE 任何一个参与人i的期望效用函数: 假设i提供的概率为pi, 第i个参与人最大化自己的期望效用,得到,混合战略纳什均衡,由此, c/v1,因此,随着人数n的增加,p减小,即人越多,每个人选择报案的概率就会越小,如果n1,则p1 社会心理学与博弈分析,几乎所有有限博弈都有有限奇数个纳什均衡 对每个参与人来讲,在构成混合战略均衡纯战略之间是无差异的,即带来的支付是无差异的 因此,寻找混合战略纳什均衡的方法除了优化方法,还有等值法,混合战略纳什均衡,案例分析,有人要打网球吗?,小结,混合策略的定义,含义 期望效用 混合策略纳什均衡: 定义 求解 含义 案例,Homework,1. Find all “mixed” strategy NE to a Prisoners Dilemma. Comment on any connection with dominant strategies.,Homework,2. Find all mixe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 校企双元合作在智能制造领域的实践与发展
- 退化林修复项目环境影响报告书
- 提高家长与托育机构的沟通与协作
- 互联网金融理财产品在普惠金融领域的实践与挑战研究报告
- 高效储能行业的市场机遇与挑战分析报告
- 无人驾驶设备助力城市生态安全保障与优化提升报告
- 交通流量预测在智慧交通系统中的路径规划与导航优化报告
- 交通流量预测技术在智慧交通系统中的数据挖掘与分析报告
- 交通设备制造业数字化转型中的智能交通信号控制系统创新报告
- 分布式能源系统中生物质能源应用的经济效益与社会影响分析报告
- 2025年上海高考英语复习必背考纲词汇手册默写
- 初中英语跨学科教学的教学方法策略
- GB/T 1634.1-2025塑料负荷变形温度的测定第1部分:通用试验方法
- 肩袖修补术护理
- 政府委托代建合同范本
- 月子中心员工手册管理制度
- DB37-T 1933-2022 氯碱安全生产技术规范
- 2025中考数学专项复习:最值问题之瓜豆原理模型(含答案)
- 2025年浙江宁波北仑热力有限公司招聘笔试参考题库含答案解析
- 人教版英语九年级全一册单词表(合订)-副本
- 2025年浙江丽水景宁畲族自治县交通发展集团有限公司招聘笔试参考题库附带答案详解
评论
0/150
提交评论