版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1第十章博弈论初步博弈论和策略行为同时博弈:纯策略均衡同时博弈:混合策略均衡序贯博弈2博弈论和策略行为博弈论(对策论):
研究在策略性环境中如何进行策略性决策、采取策略性行动的科学研究前提:策略性环境——每个人的决策和行动都会影响到其他人的这样一种作用关系研究内容:策略性对策和策略性行动策略性对策——当事人根据其他有关者的可能反应来作出决策策略性行动——当事人考虑其他有关者的可能反应而采取行动博弈论的三个基本要素参与人(局中人)——博弈中的决策个体,至少应有二人参与人的策略——参与人选择什么情况下采取什么行动的规则,通常至少应有两种策略可供选择参与人的支付——博弈的所有参与人可采用的每种策略的组合决定的博弈完成时每个参与人能够获得或可期望获得的效用。博弈的基本类型二人博弈与多人博弈零和博弈与非零和博弈有限博弈与无限博弈同时博弈与序贯博弈3第二节同时博弈:纯策略均衡同时博弈与序贯博弈条件策略与条件策略组合纳什均衡双方同时博弈的一般理论(略)4同时博弈与序贯博弈同时博弈与序贯博弈同时博弈——参与人的决策没有先后差异的博弈,就是说,没有人是在知道别人的决策之后才作决策的序贯博弈——参与人的决策有先后顺序的博弈,后决策的人可以根据别人已作的决策作出对应的决策。支付矩阵:表明两个参与人同时决策的策略组合和各自支付的矩阵例题:甲、乙两家寡头在是否遵守卡特尔协议方面(卡特尔:独立厂商共同建立的合作控制市场的价格同盟),都可选择合作或不合作的策略。如果双方合作,则甲、乙分别得到的支付是5,6;双方都不合作,则分别得到2,3;如果甲合作而乙不合作,则甲得1,乙得5;如果甲不合作而乙合作,则甲得7,乙得1。寡头甲寡头乙合作不合作合作不合作5,61,57,12,3
支付矩阵的结构
最左方、最上方分别表示两个参与人左起第二列、上起第二行分别列出各自的可能策略它们右下方的各单元格分别表示双方的各种策略组合上述各单元格内数字表示各策略组合下各参与人得到的支付,其中前一数字对应左方,后一数字对应上方也可把该矩阵拆成两个“子矩阵”,如蓝、红色分别所示5条件策略与条件策略组合
条件策略:参与人在假定其他参与人选择某一策略的条件下筛选出来的对自己而言最优的策略,称为“条件优势策略”或“相对优势策略”,简称“条件策略”。对例题中的甲而言,假定乙合作,那么甲合作只能得到5,不合作却能得到7,因此不合作是乙合作条件下甲的条件策略;假定乙不合作,那么甲的条件策略也是不合作,该策略的支付为2,比合作策略的支付多1。对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付多1,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的条件策略是也不合作,乙若合作支付只有1,不合作则可得到3。
条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与作为它的条件的对方策略之间的组合,称为“条件优势策略组合”或“相对优势策略组合”,简称“条件策略组合”。
甲有两个条件策略组合:不合作,合作;不合作,不合作
乙的两个条件策略组合则是:合作,合作;不合作,不合作乙合否甲合5,61,5否7,12,36纳什均衡纳什均衡概念:所有参与人之间的这样一种策略组合,他们中任何人都不会单独改变策略,因为单独改变策略对自己没有好处。参与人之间的博弈由此得到最终结果。在支付矩阵中寻找纳什均衡:条件策略下划线法分别在两个参与人各条件策略的己方支付值下划一横线,再找出双方支付值下都有横线的单元格,它就表示纳什均衡实现时的支付情况,它对应的策略组合就是所寻找的均衡策略组合。划线法可采用以下五个步骤:把支付矩阵分解为两个参与人各自的子支付矩阵为左方参与人找出子支付矩阵中各列的最大值并划线为上方参与人找出子支付矩阵中各行的最大值并划线把划线后的两个子矩阵合并为共同的支付矩阵由共同支付矩阵中两个数字下都划线的单元格,可找到均衡策略组合关于纳什均衡“存在性、唯一性、最优性”的说明同时博弈中,纳什均衡可能存在,也可能不存在如果纳什均衡存在,它可能是唯一的,也可能不是。如果纳什均衡存在,它可能是最优的,也可能不是。乙合否甲合5,61,5否7,12,34,69,17,32,85,61,44,12,3最优,但非均衡的组合纳什均衡组合,但非最优7第三节同时博弈:混合策略均衡不存在纯策略均衡时的混合策略均衡存在纯策略均衡时的混合策略均衡混合策略博弈的一般理论(略)8不存在纯策略均衡时的混合策略均衡1纯策略与混合策略纯策略:右表中策略组合的纳什均衡不存在,但每个参与人在给定对方策略的条件下选择的策略都是确定的,换句话说,他在己方的策略选择中都处于非此即彼的状态。前面分析的其他支付矩阵中如果存在纳什均衡,那么在均衡的策略组合中双方各自的策略也是确定的、鱼与熊掌不可兼得的。这种在给定对方策略条件下只能选一种确定策略的组合叫“纯策略组合”。
混合策略:“剪刀、石头、帕子”游戏(划拳也类似)每次仍属同时博弈,如果对方前几次总是出石头,这一次己方的条件策略似乎该以帕子战胜石头。但对方并没患手指蜷挛症、只会出石头。他估计对手很可能出帕子,他就可能不再出石头而变为出剪刀。己方估计他可能改变策略,己方就不一定出帕子,而可能学对方出石头,对方不变则战平,对方变剪刀则己方胜。双方都不能确定对方下次的策略,只能估计对方选择每种策略的概率;己方下次的策略也不是确定的,而有多种可能,各种策略的选择按一定概率分布。这种选择不同策略间分布概率的做法叫“混合策略”.“纯策略”可看作各策略被选中的概率非1即0,作为“混合策略”的一种特例。在支付矩阵中反映混合策略,可在左方第1、2列和上方第1、2行之间分别插入一列、行,用数字分别注明各策略被选择的概率(p1,p2)、(q1,q2)等。(p1,p2)、(q1,q2)等在这里被称为“概率向量”。4,69,17,32,8q1q2CDp1A4,69,1p2B7,32,8乙甲9不存在纯策略均衡时的混合策略均衡2
混合策略组合:采取混合策略的各参与人的混合策略的组合,称为“混合策略组合”,可用各参与人混合策略概率向量的组合表示。例如,甲与乙的混合策略概率向量分别为(p1,p2)、(q1,q2),那么他们的混合策略组合就可表示为概率向量组合((p1,p2),(q1,q2))。期望支付:在混合策略博弈中,每个混合策略组合有各自的支付组合,但每个参与人得到的支付是他的各种纯策略应获的支付的加权平均数,称为期望支付。加权用的权数,为与各单元格对应的双方每个策略组合中各种纯策略被采用的概率之积,也就是该策略组合被采用的概率。假定下表中参与人甲、乙的混合策略概率向量分别为(0.6,0.4)与(0.3,0.7),他们将有混合策略组合((0.6,0.4),(0.3,0.7))
[参考右下角调整后的支付矩阵]乙q1q2CD甲p1A4,69,1p2B7,32,8.6.4.3.7
那么,甲的期望支付为:E甲=p1·q1·4+p1·q2·9
+p2·q1·7+p2·q2·2(式甲)=0.6×0.3×4+0.6×0.7×9+0.4×0.3×7+0.4×0.7×2=5.90。E乙=p1·q1·6+p1·q2·1
+p2·q1·3+p2·q2·8=3.20(式乙)
由于p1,p2和q1,q2的取值有无限多的可能,混合策略组合及其支付也就有无限多的可能。10不存在纯策略均衡时的混合策略均衡3条件混合策略:参与人在假定其他参与人按某一概率选择某一策略的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合策略,称为“条件混合策略”。假定(p1,p2)、(q1,q2)的取值从0到1有无限多可能,把p2=1-p1和q2=1-q1代入甲与乙各自的期望支付表达式,经整理可得:
E甲=p1(7-10q1)+5q1+2(式1);E乙=5q1(2p1-1)-7p1+8(式2)每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时,己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。对式1的讨论:当7-10q1>0时,E甲随p1同向变动,为使E甲最大,p1应取其可达的最大值1;当7-10q1<0时,E甲随p1反向变动,为使E甲最大,p1应取其可达的最小值0;当7-10q1=0时,E甲与p1无关,p1可在0与1之间(含0和1)任意取值而E甲不变。于是,参与人甲的条件混合策略可表达为:
1q1<0.7[0,1]q1=0.7
0
q1>0.7用同样方法讨论式2,可得到乙的条件混合策略:乙q1q2CD甲p1A4,69,1p2B7,32,8
0p1<0.5
[0,1]p1=0.5
1
p1>0.5P1=q1=11不存在纯策略均衡时的混合策略均衡40p1<0.5[0,1]p1=0.5
1
p1>0.5p1=q1=1q1<0.7[0,1]q1=0.7
0
q1>0.7
混合策略的纳什均衡:当博弈双方中任何一方选择某种混合策略时,另一方选择的混合策略都能使另一方的期望支付达到最大的博弈均衡状态。因此任何一方都不会偏离自己选择的混合策略,因为偏离不能给自己带来任何好处。混合策略纳什均衡图根据前面分析出的甲乙两位参与人各自的条件混合策略(见本页下方),可以在以甲、乙各自的概率p1、q1为两轴的平面坐标系中绘出甲、乙各自的混合策略曲线。甲的混合策略曲线(以蓝色表示)和乙的混合策略曲线(以红色表示)相交于e点,e点的混合策略组合就实现混合策略博弈的纳什均衡。e点的坐标是p1=0.5,q1=0.7,则纳什均衡时p2=0.5,q2=0.3。本题中混合策略的纳什均衡还可表示为:((p1,p2),(q1,q2))=((0.5,0.5),(0.7,0.3))。本题中,只有唯一的这个纳什均衡点。q1p1O10.70.51e12存在纯策略均衡时的混合策略均衡
在混合策略博弈中求纳什均衡解的方法,也适用于纯策略纳什均衡的分析。以本章开始时分析过的两个寡头是否遵守卡特尔协议与对方合作的纯策略博弈为例,假定甲与乙选择合作策略的概率分别为p1与q1,选择不合作的概率分别为p2(=1-p1)与q2(=1-q1
),形成下面的支付矩阵。把p2=1-p1与q2=1-q1代入甲与乙各自的期望支付表达式,经整理可得:
E甲=-p1(1+q1)+5q1+2(式1);E乙=q1(3p1-2)+2p1+3(式2)由式1可知E甲随p1而反向变动,为了使E甲最大化,p1应尽可能小,因此甲的条件混合策略是p1=00≤q1≤1。这实际上是个纯策略。由式2得到乙的条件混合策略:0p1<2/3[0,1]p1=2/31p1>2/3
纳什均衡点就在原点,与纯策略博弈的均衡相同,双方都选择不合作的策略。
乙q1q2合否甲p1合5,61,5p2否7,12,3q1p11o2/31q1=因此,纯策略博弈是混合策略博弈的特例纯策略博弈均衡是混合策略博弈均衡的特例13序贯博弈和博弈树
序贯博弈的参与人决策有先后之分,后决策者可以根据先决策者的策略作出决策。例如,某市场原来被垄断者独家控制,有潜在的竞争者可能进入该市场。竞争者先决策:是否进入;垄断者后决策:是否抵抗。左下方的支付矩阵表示他们的各个策略组合及其支付组合。也可用博弈树进一步表示参与者的决策顺序。博弈树有一个起点(先决策者的决策点,注明何人决策)、不止一个中间点(后决策者的决策点,注明何人决策)与若干终点(策略组合的结果点,注明支付组合),按时间和逻辑顺序排列,并以字母或数字排序。起点与中间点之间、中间点与终点之间,以线段连接(策略线,注明发出该线段的决策者的策略)。垄断者容忍抵抗竞争进1,4-2,2者不进0,50,3竞争者垄断者垄断者进不进容忍容忍抵抗抵抗(1,4)(-2,2)(0,5)(0,3)abcdefg竞争者—垄断者模型的博弈树
右下方图中的决策顺序表示为由左向右,象左面生根而向右发出枝条的“树”,故称“博弈树”。它也可由下向上“生长”,或向左、向下“生长”。有的终点的支付状况会引起下一轮博弈,它就成为新起点(实际是新的“中间决策点”),长出新的博弈树“枝条”。14序贯博弈的纳什均衡
在有的序贯博弈中可能实现纳什均衡。以左下方的支付矩阵为例,就有唯一的纳什均衡策略组合:进入,容忍。每个参与人都不愿意单独改变自己的策略,因为变更至少无益于己。设想竞争者改选均衡组合所在列的其他组合,或垄断者改选均衡组合所在行的其他组合,都将看到变卦者的损失。双方的其他策略组合都不是纳什均衡。至少有一个参与者如果单独改变策略就能增加己方的支付。序贯博弈也许有不止一个纳什均衡的策略组合。以左下方支付矩阵表示的情侣博弈模型为例,恋爱中的男女如何度周末?可以在看足球赛与欣赏芭蕾舞这两个策略中选择。男方先决策,他可能约情侣看球赛;女方后决策,如果愿意看球赛,策略组合就是(足球,足球);如果不愿,自己去看芭蕾,策略组合就成为(足球,芭蕾)。男方也可能投女方所好,建议一起看芭蕾,女方乐意,就有策略组合(芭蕾,芭蕾);理论上还有(芭蕾,足球)策略组合的可能。每个策略组合给恋爱中双方带来不同感受,形成矩阵中的不同支付组合。俩人同度周末,看什么都行,谁拆台谁自己都会受损,就有两种纳什均衡,也叫多重纳什均衡。垄断者容忍抵抗竞争进1,4-2,2者不进0,50,3女方足球芭蕾男足球2,10,0方芭蕾-1,-11,215纳什均衡的精炼:逆向归纳法1在多重纳什均衡中,有的纳什均衡未必合理。例如情侣博弈中男方先决策却出现“芭蕾,芭蕾”策略组合的纳什均衡,就可能使人质疑男方决策的理性问题。可以采用逆向归纳法对纳什均衡实行精炼处理,排除不合理的纳什均衡。做法是,从博弈最后阶段的每个决策点出发,确定决策者选择的策略,剔除他放弃的策略,使博弈模型得到简化;再对上一阶段的策略作类似处理,直到博弈模型最简,这个最简博弈就是原模型的解。以情侣博弈为例,最后阶段决策以女方为决策者。她在两个决策点各可从两种策略中选一种。根据她可获的支付情况之间的比较,可从每个决策点删除一种对她相对不利的策略,于是情侣模型被初步简化。在上一阶段,简化后可能的策略组合只剩(足球,足球)与(芭蕾,芭蕾),女方总是作出与男方一致的选择。男方就可选择对自己更有利的足球。于是模型得到最终的简化,其他选择和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年茶叶品鉴服务合同协议(专业)
- 中国矿业大学《人际传播与沟通》2025-2026学年期末试卷
- 江西中医药大学《安全法学》2025-2026学年期末试卷
- 安徽卫生健康职业学院《音乐教育学》2025-2026学年期末试卷
- 安徽黄梅戏艺术职业学院《中医临床护理学》2025-2026学年期末试卷
- 湖南省长沙2026年九年级下学期语文期中试卷附答案
- 人工智能关键人物
- 2026年人教版小学一年级数学下册统计图表初步认识卷含答案
- 2026年人教版小学四年级语文上册古诗画面想象练习卷含答案
- 深度解析(2026)《GBT 4324.17-2012钨化学分析方法 第17部分:钠量的测定 火焰原子吸收光谱法》
- 新教科版一年级科学下册第一单元第6课《哪个流动得快》教案
- 2024年11月医用冷库建设合同3篇
- 护理CQI项目模板
- 2025年河北省职业院校技能大赛建筑工程识图(高职组)赛项参考试题库(含答案)
- 2024年洛阳职业技术学院单招职业适应性测试题库及答案解析
- 监狱新干警培训课件
- 《糖尿病饮食》课件
- 设计服务合同创意模板
- 有机磷农药中毒的急救与护理
- 2024年贵州省技能大赛白酒酿造赛项考试题库(含答案)
- 人教版六年级数学下册全套试卷附完整答案
评论
0/150
提交评论