运筹学研究生对策论_第1页
运筹学研究生对策论_第2页
运筹学研究生对策论_第3页
运筹学研究生对策论_第4页
运筹学研究生对策论_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、对策论game theory教学要求教学要求了解博弈论的基本分析方法掌握二人零和、非零和博弈模型和求解方法会运用该模型分析一些经济和管理问题了解多人非合作博弈模型和求解方法主要内容主要内容 博弈论的基本概念博弈论的基本概念 纯策略矩阵博弈纯策略矩阵博弈 混合策略矩阵博弈混合策略矩阵博弈 对策论对策论对策论(The Game Theory)也称竞赛论或博弈论,是研究具有竞争、对抗、利益分配等方面的数量化方法,并提供寻求最优策略的途径。1944年以来,对策论在投资分析、价格制定、费用分摊、财政转移支付、投标与拍卖、对抗与追踪、国际冲突、双边贸易谈判、劳资关系以及动物行为进化等领域得到广泛应用。案例

2、:俾斯麦海的海空对抗案例:俾斯麦海的海空对抗p1943年2月,第二次世界大战中的日本,在太平洋战区已经处于劣势。为扭转局势,日本统帅山本五十六大将统率下的一支舰队策划了一次军事行动:由集结地南太平洋的新不列颠群岛的蜡包尔出发,穿过俾斯麦海,开往新几内亚的莱城,支援困守在那里的日军。p 当盟军获悉此情报后,盟军统帅麦克阿梭命令太平洋战区空军司令肯尼将军组织空中打击。p 日本统帅山本五十六大将心里很明白: 在日本舰队穿过俾斯麦海的三天航行中,不可能躲开盟军的空中打击,他要策划的是尽可能减少损失。p 日美双方的指挥官及参谋人员都进行了冷静的思考与全面的谋划。p 自然条件对于双方 都是已知的。基本情况

3、如下:从蜡包尔出发开往莱城的海上航线有南北两条。通过时间均为3天。p 气象预报表明:未来3天中,北线阴雨,能见度差;而南线天气晴好,能见度好。p 肯尼将军的轰炸机布置在南线的机场,侦察机全天候进行侦察,但有一定的搜索半径。p 经测算,双方均可得到如下估计:p局势局势1: 盟军的侦察机重点搜索北线,日本舰队也恰好走北线。由于气候恶劣,能见度差,盟军只能实施两天的轰炸。p局势局势2:盟军的侦察机重点搜索北线,日本舰队走南线。由于发现晚,尽管盟军的轰炸机群在南线,但有效轰炸也只有两天。p局势3:盟军的侦察机重点搜索南线,而日本舰队走北线。由于发现晚、盟军的轰炸机群在南线,以及北线气候恶劣,故有效轰炸

4、只有一天。p局势4:盟军的侦察机重点搜索南线,日本舰队也恰好走南线。此时日本舰队迅速被发现,盟军的轰炸机群所需航程很短,加上天气晴好,有效轰炸时间三天。p 这场海空遭遇与对抗一定会发生,双方的统帅如何决策呢?历史的实际情况是:局势局势1成为现实。肯尼将军命令盟军的侦察机重点搜索北线;而山本五十六大将命令日本舰队取道北线航行。由于气候恶劣,能见度差,盟军飞机在一天后发现了日本舰队,基地在南线的盟军轰炸机群远程航行,实施了两天的有效轰炸,重创了日本舰队,但未能全歼。对策的三要素:对策的三要素:p局中人:局中人:有权决定自己行为方案的对局参加者称为局中人。案例中,美日双方的决策者为局中人。当对局中局

5、中人只有两人时,称为二人对策。p策略:策略:对局中一个实际可行的方案称为一个策略。案例中,美日双方各有二个策略。p赢得矩阵(支付):赢得矩阵(支付):当每个局中人在确定了所采取的策略后,他们就会获得相应的收益或损失,此收益或损失的值称为赢得(支付)。赢得与策略之间的对应关系称为赢得(支付)函数。p案例中,肯尼将军与山本五十六大将的赢得(支付)函数都可以用矩阵A、B表示。 p在本例中的每一个对局,双方的赢得的代数之和为零,这样的对策称为“有限零和二人对策”囚徒的困境(二人非零和对策)囚徒的困境(二人非零和对策)5,50,1010,01,1囚徒囚徒1囚徒囚徒2坦坦 白白 不坦白不坦白坦白坦白不坦白

6、不坦白双方如何采取对策使结果对自己最有利?双方如何采取对策使结果对自己最有利?双寡头削价竞争(两个厂商)双寡头削价竞争(两个厂商)100,10020,150150,2070,70亚贸亚贸中南中南高高 价价 低低 价价高价高价低价低价类似地,广告投资、采用新技术等方面,厂商之间常常耗资类似地,广告投资、采用新技术等方面,厂商之间常常耗资巨大,但不一定有利可图的争夺战;对公共资源的掠夺式使巨大,但不一定有利可图的争夺战;对公共资源的掠夺式使用等问题。用等问题。我们的目的是如何利用这种困境达到有利于社会,合理利我们的目的是如何利用这种困境达到有利于社会,合理利用和开发公共资源,保护环境。用和开发公共

7、资源,保护环境。博弈的基本要素博弈的基本要素局中人局中人策略策略支付矩阵支付矩阵局中人局中人博弈中的决策者或参与者,用I表示剧中人集合,如 I=1,2,n表示有n个局中人。局中人至少要有两个,个人和集体都可以作为局中人,如“齐王赛马”中的齐王和田忌。策略策略局中人在整个决策过程中一系列行动组成的一个方案。如用(上、中、下)表示出场参赛的三匹马依此为上马、中马和下马,这就是局中人的一个策略。 每个局中人 i 的策略集合记为Si,如田忌和齐王的策略各有6个。局势局势称每个局中人所出的一个策略形成的一个策略组为一个局势。设si是局中人i的一个策略,则n个局中人的策略形成的策略组s = (s1,s2,

8、sn)就是一个局势。记S为全部局势的集合,即S = S1S2Sn赢得函数赢得函数当一个局势s出现后,每个局中人有一个赢得值Hi(s)。显然,Hi(s)是定义在S上的一个函数,称为局中人i的赢得函数。矩阵对策矩阵对策即二人有限零和对策。二人:局中人为两个,即n=2。有限:每个局中人的策略有限,即 S1和S2为有限集。零和:在任一局势下,两个局中人的赢得值之和为零,即H1(s) + H2(s) = 0, sS纯策略和纯局势纯策略和纯局势用I和II分别表示即两个局中人。局中人I有m个纯策略,局中人II有n个纯策略。记 S1=1, 2, ,mS2 =1, 2, , n 。当局中人I选纯策略i,局中人I

9、I选纯策略j,就形成了一个纯局势(i, j)。赢得矩阵赢得矩阵对任一纯局势(i, j),用aij记局中人I的赢得值,称矩阵为局中人I的赢得矩阵。对于零和对策,局中人II的赢得矩阵为-A。mnmmnnaaaaaaaaaA212222111211参与者参与者2参参与与者者1锤子锤子剪刀剪刀布布锤子锤子01-1剪刀剪刀-101布布1-10“锤子、剪刀、布锤子、剪刀、布”的赢得矩阵的赢得矩阵齐王齐王-田忌赛马的赢得矩阵田忌赛马的赢得矩阵(GAB),(GBA),(AGB),(ABG),(BGA),(BAG)(GAB),(GBA),(AGB),(ABG),(BGA),(BAG)3111111311111-

10、13111-111311111-13111-1113KGSSA纯策略意义下的解纯策略意义下的解设G =S1, S2; A为一个矩阵对策,其中S1=1, 2, , m,S2 =1, 2, , n,A=(aij)mn。若则称该值为对策G的值,记为VG;使上式成立的纯局势(i*, j*)称为对策G在纯策略意义下的解; i*和 j*,分别为局中人I和II的最优纯策略。* *1111maxminminmaxijiji jj nj ni mi maaa 纯策略意义下解的充要条件纯策略意义下解的充要条件定理1 矩阵对策G =S1, S2; A在纯策略意义下有解的充要条件是:存在纯局势(i*, j*),使得对

11、任意i和j,有jijiij*aaa*例例432231323011局中人I局中人II1A2A3A1B2B3B4BI的最优策略(行)II的最优策略(列)对策的解为3132(,),(,)A BA B纯策略意义下解的性质纯策略意义下解的性质性质1 若(i1, j1)和(i2, j2)是对策G 的两个解,则ai1j1=ai2j2。性质2 若(i1, j1)和(i2, j2)是对策G 的两个解,则(i1, j2)和(i2, j1)也都是对策G 的解 。矩阵对策的性质矩阵对策的性质在一个矩阵对策 G = S1, S2; A 中,局中人I能保证的至少赢得是局中人II 能保证的至多损失是一般总有v1v2。当v1

12、 = v2 时,对策G在纯策略意义下有解,且VG = v1 = v2。当v1 v2 时,对策G不存在纯策略意义下的解。ijnjmiav111minmaxijminjav112maxmin矩阵对策的混合扩充矩阵对策的混合扩充设G =S1, S2; A为一个矩阵对策,其中S1=1, 2, ,m,S2 =1, 2, , n,A=(aij)mn。记S1* = xEm | xi0, i=1,2,m; i xi=1S2* = yEn | yj0, j=1,2,n; j yj=1分别称S1*和S2*为局中人I和II的混合策略集合; xS1*和yS2*称为混合策略, (x, y)称为混合局势。矩阵对策的混合扩

13、充矩阵对策的混合扩充局中人I的赢得函数记为E(x, y) = xTAy = i j aij xiyj称 G* = S1*, S2*; E 为对策G的混合扩充。混合策略 x = (x1, x2, , xm)T 中 xi ,是对策G进行多局时,局中人I选取策略i 的频率。局中人的决策局中人的决策局中人I 要保证赢得至少是局中人II 要保证损失至多是显然,有v1v2。x,yEvSySx*2*1minmax1x,yEvSxSy*1*2maxmin2混合策略意义下的解混合策略意义下的解设G*=S1*, S2*; E 是矩阵对策G =S1, S2; A的混合扩充。若则称该值为对策G的值,记为VG;使上式成

14、立的混合局势(x*, y*)称为对策G在混合策略意义下的解;x*和y*分别为局中人I和II的最优混合策略。*2211maxmin,minmax,y Sy Sx Sx SE x yE x y混合策略意义下解的充要条件混合策略意义下解的充要条件定理2 矩阵对策G在混合策略意义下有解的充要条件是:存在x*S1*和y*S2*,使得对任意xS1*和yS2*,有yxEyxEyxE,*两个局中人中有一个取纯策略两个局中人中有一个取纯策略记它们分别对应局中人I取纯策略i时的赢得值和局中人II取纯策略j时的赢得值。有miiijnjjijxajxEyayiE11,jnjjnjmiiijnjmijiijimiimi

15、njjijminjjiijyjxEyxayxayxExyiExyayxayxE 1111111111,混合策略意义下解的充要条件混合策略意义下解的充要条件定理3 设x*S1*和y*S2*,则(x*, y*)为对策G的解的充要条件是:对任意i=1,2,m和j=1,2,n,有定理3说明:当验证(x*, y*)是否为对策G的解时,只需验证上述 m+n 个不等式jxEyxEyiE,*混合策略意义下解的充要条件混合策略意义下解的充要条件定理4 设 x*S1*和 y*S2*,则(x*, y*)为对策G的解的充要条件是:存在数v,使得x*和y*分别是不等式组的解,且v=VG。mixxnjvxaimiimii

16、ij, 10,1, 1,11njyymivyajnjjnjjij, 10,1, 1,11混合策略意义下解的存在性混合策略意义下解的存在性定理5 对任一矩阵对策G =S1, S2; A,一定存在混合策略意义下的解。混合策略意义下解的性质混合策略意义下解的性质定理6 设(x*, y*)是矩阵对策G的解,v=VG,则njvxaymiyavxmiijjnjjijii, 2 , 10, 2 , 1, 01*1*混合策略意义下解的性质混合策略意义下解的性质定理7 设有两个矩阵对策G =S1, S2; A和G =S1, S2; A,其中A=(aij)mn , A=(aij+L)mn , L为任意常数,则(1

17、)VG =VG+L;(2) G和G 有相同的解集。混合策略意义下解的性质混合策略意义下解的性质定理8 设有两个矩阵对策G =S1, S2; A和G =S1, S2; A,其中A=(aij)mn , A=(aij)mn ,为任意正常数,则(1)VG = VG;(2) G和G 有相同的解集。混合策略意义下解的性质混合策略意义下解的性质定理9 设有矩阵对策G =S1, S2; A,其中A=为斜对称矩阵,即A=-AT,则(1)VG = 0;(2)局中人I和II有相同的最优策略 集。矩阵对策的图解法矩阵对策的图解法适用于赢得矩阵为2n或m2阶的情形,即局中人某一方仅2个纯策略。矩阵对策的图解法矩阵对策的

18、图解法设G =S1, S2; A为一个矩阵对策,其中S1=1, 2,S2 =1, 2 , 3,设局中人I的混合策略为(x, 1-x)T, x0,1。2571132A矩阵对策的图解法矩阵对策的图解法横坐标表示局中人I混合策略的x,纵坐标表示局中人I的赢得值v。根据定理3,对任意i=1,2,m和j=1,2,n,得到jxEyxEyiE,*jxEv,*矩阵对策的图解法矩阵对策的图解法得到即x=3/11,v=49/11。-xxv-xxv1211153111257230 x* 1 2 3矩阵对策的图解法矩阵对策的图解法局中人I最优混合策略(x*, 1-x*)T= (3/11, 8/11)T,赢得值VG=4

19、9/11。根据定理6,得到局中人II最优混合策略(y1*, y2*, y3*)T= (0, 9/11, 2/11)T。3213213211257114911321149yyyyyyyyy矩阵对策的方程组法矩阵对策的方程组法由定理6,当方程组有非负解,则该解是矩阵对策混和策略意义下的解。1, 2 , 1, 01, 2 , 1, 01111njjnjjijmiimiiijymiyavxnjxav矩阵对策的线性规划法矩阵对策的线性规划法由定理4,矩阵对策的解是不等式组的解。njyymivyamixxnjvxajnjjnjjijimiimiiij, 2 , 10,1, 2 , 1, 2 , 10,1,

20、 2 , 1,1111矩阵对策的线性规划法矩阵对策的线性规划法令该不等式组的解等价于求解一对对偶线性规划。(这里假设w,v0)njvyymiwxxjiji, 2 , 1, 2 , 1,矩阵对策的线性规划法矩阵对策的线性规划法njymiyayDmixnjxaxPjjjiiinjijnjmiijmi, 2 , 10, 2 , 1, 1. t . smax)(, 2 , 10, 2 , 1, 1. t . smin)(1111p实验多人非合作对策多人非合作对策Nash定理定理12.2 纳什均衡纳什均衡Nash对对策论的贡献有:(对对策论的贡献有:(1)合作对策中的讨价还价模型,称)合作对策中的讨价还

21、价模型,称为为Nash讨价还价解;(讨价还价解;(2)非合作对策的均衡分析。)非合作对策的均衡分析。纳什均衡纳什均衡(Nash Equilibrium) 假定有假定有n个博弈方参加博弈,在给定其个博弈方参加博弈,在给定其他博弈方策略的条件下,每个人选择自己的最优策略(个人最优策略他博弈方策略的条件下,每个人选择自己的最优策略(个人最优策略可能依赖也可能不依赖他人策略),一起构成一个策略组合(可能依赖也可能不依赖他人策略),一起构成一个策略组合(Strategy Profile),而),而Nash均衡是这样一种策略组合,由所有参与人均衡是这样一种策略组合,由所有参与人的最优策略组成,给定别人策略

22、的条件下,没有任何单个参与人有积的最优策略组成,给定别人策略的条件下,没有任何单个参与人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡,极性选择其他策略,从而没有任何人有积极性打破这种均衡,Nash均均衡是一种衡是一种“ 僵局僵局”:给定别人不动的情况下,没有人有兴趣动。:给定别人不动的情况下,没有人有兴趣动。约翰约翰纳什纳什(John F. Nash )1928年生于美国年生于美国,1994年获得诺贝尔经济学奖年获得诺贝尔经济学奖在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响弈论和经济学产生了重

23、大影响 12.2.1 纳什均衡定义纳什均衡定义另一种解释:另一种解释:假定所有博弈方事先达成一项协议,规定每个人的行假定所有博弈方事先达成一项协议,规定每个人的行为规则,在没有外在的强制力约束时,当事人会自觉遵守这个协议,为规则,在没有外在的强制力约束时,当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡:假定别人遵守协议的情况下,等于说这个协议构成一个纳什均衡:假定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。换句话说,如果没有人有积极性偏离协议规定的自己的行为规则。换句话说,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个一个协议不构成纳什均衡,它就

24、不可能自动实施,因为至少有一个参与人会违背此协议,不满足参与人会违背此协议,不满足Nash均衡要求的协议是没有意义的。均衡要求的协议是没有意义的。12.2 纳什均衡纳什均衡用用G表示一个对策,若一个对策中有表示一个对策,若一个对策中有n个局中人,则每个局中人个局中人,则每个局中人可选策略的集合称为策略集,分别用可选策略的集合称为策略集,分别用 S1,S2,Sn表示;表示;Sij表示局中人表示局中人i的第的第j个策略,其中个策略,其中j可取有限个值(有限策可取有限个值(有限策略对策),也可取无限个值(无限策略对策);对策方略对策),也可取无限个值(无限策略对策);对策方i的得益的得益则用则用hi

25、表示;表示;hi是各对策方策略的多元函数,是各对策方策略的多元函数,n个局中人的对策个局中人的对策G常写成:常写成:【定义定义12.1】 在对策在对策G=S1,S2,Sn;h1,h2hn中,如果由中,如果由各个对策方的各选取一个策略组成的某个策略组合(各个对策方的各选取一个策略组成的某个策略组合(S1*,S2*,Sn*)中,任一对策方)中,任一对策方i的策略的策略Si*,都是对其余策略方策略的组合,都是对其余策略方策略的组合(S1*,S*i-1,S*i+1,Sn*)的最佳策略,即)的最佳策略,即h i(S1*,S*i-1,Si*,S*i+1Sn*)hi(S1*,S*i-1,Sij,S*i+1,

26、Sn*)对)对任意任意SijSi都成立,则称(都成立,则称(S1*,Sn*)为)为G的一个纯策略的一个纯策略“纳什均衡纳什均衡”(Nash Equilibrium) G=S1,Sn;h1,hn12.2 纳什均衡纳什均衡各选取一个策略组成的某个策略组合构成一个各选取一个策略组成的某个策略组合构成一个局势局势,其最优局,其最优局势称为纯策略意义下的势称为纯策略意义下的最优局势最优局势【例例12.4】 假设有三个厂商在同一市场上生产销售完全相同的假设有三个厂商在同一市场上生产销售完全相同的产品,它们各自的产量分别用产品,它们各自的产量分别用m1、m2和和m3表示,再假设表示,再假设m1、m2和和m3

27、只能取只能取1、2、3等正整数值市场出清价格一定是市场等正整数值市场出清价格一定是市场总产量总产量Q=m1+m2+m3的函数,假设该函数为:的函数,假设该函数为: 12320 (),20( ) 200,20m mQP PQQQ 不妨先假设三个厂商开始时分别生产不妨先假设三个厂商开始时分别生产3单位,单位,9单位和单位和6单位产量,单位产量,这时三厂商是否满意各自的产量,要从利润进行分析这时三厂商是否满意各自的产量,要从利润进行分析由于产量不能超过由于产量不能超过20,则第,则第i个厂商的利润函数为个厂商的利润函数为 12.2 纳什均衡纳什均衡两人非零和对策两人非零和对策反应函数法反应函数法12

28、.3 反应函数法反应函数法当得益是对策的多元连续函数时,求出每个对策方的反应函数,当得益是对策的多元连续函数时,求出每个对策方的反应函数,而各个反应函数的交点就是纳什均衡而各个反应函数的交点就是纳什均衡 【例例12.5】设设A,B两厂家生产同样产品,厂商两厂家生产同样产品,厂商A产量为产量为q1,B产量产量为为q2,市场总产量为,市场总产量为Q=q1+q2,市场出清价格是市场总产量的函数,市场出清价格是市场总产量的函数P6Q。设产品产量的边际成本相等,。设产品产量的边际成本相等,C1=C2=2。求解两厂商的。求解两厂商的纳什均(假设产量连续可分)。纳什均(假设产量连续可分)。分析:这是一个连续

29、产量的古诺模型,不难看出,该对策中两厂分析:这是一个连续产量的古诺模型,不难看出,该对策中两厂商各自的利润分别为各自的销售收益减去各自成本,即:商各自的利润分别为各自的销售收益减去各自成本,即:212111211111142(6)(qqqqqqqqqCQpq222122212222242(6)(qqqqqqqqqCQpq212111)4(maxmax11qqqqqq)4(212*1qq)4(211*2qq12.3 反应函数法反应函数法)4(21)(221qqR)4(21)(112qqR作反应函数:作反应函数:(0,4)(0,2)(2,0)(4,0)(4/3,4/3)纳什均衡:纳什均衡:(4/3

30、,4/3)12.3 反应函数法反应函数法【例例12.6】 考虑上述模型的另一种情况即各厂商所选择的是价格考虑上述模型的另一种情况即各厂商所选择的是价格而不是产量,假设产量与价格的函数关系为:而不是产量,假设产量与价格的函数关系为:2111121)(pdpbapq1222212)(pdpbapq其它条件不变,边际成本为其它条件不变,边际成本为C1、C2,试求解其纳什均衡。,试求解其纳什均衡。各自的策略空间为各自的策略空间为 max22max11, 0, 0PSPS两方的得益就是各自的利润两方的得益就是各自的利润 1121 11 11111111112(,)()()()h p pp qc qpc

31、qpcab pd p2122 22 22222222222( ,)()()()h p pp qc qpc qpcab pd p12.3 反应函数法反应函数法利用得益函数在偏导数为利用得益函数在偏导数为0时有最大值,各自的反应函数分别为:时有最大值,各自的反应函数分别为:)(21)(211111211pdcbabpRP)(21)(122222122pdcbabpRP)(21)(21*122222*2*211111*1pdcbabppdcbabp)(42)(41112121222221211*1cbaddbbbcbaddbbdP)(42)(42222121111121212*2cbaddbbbcb

32、addbbdP),(*2*1PP为该对策唯一的纳什均衡为该对策唯一的纳什均衡 12.5 有限二人非零和对策有限二人非零和对策1. 图解法图解法12.5.3 22有限二人非零和对策的求解有限二人非零和对策的求解【例例11.17】图解下列非零和对策图解下列非零和对策(3,2)(2,1)(0,3)(4,4)A【解解】(1)作出坐标系图)作出坐标系图123,原点为,原点为0,在各轴值为,在各轴值为1的点分别引线段与坐标轴构成正方形,它便是的点分别引线段与坐标轴构成正方形,它便是(x,y)的定义域,的定义域,(2)局中人)局中人1的赢得的赢得(期望值期望值)为为11,21,211122122( , )(

33、1)(1)(1)(1)32 (1)0(1)4(1)(1)(52)44ijijije x ya x ya xya xyax yaxyxyxyx yxyxyy 12.5 有限二人非零和对策有限二人非零和对策11,21,211122122( , )(1)(1)(1)(1)32 (1)0(1)4(1)(1)(52)44ijijije x ya x ya xya xyax yaxyxyxyx yxyxyy 当当0y2/5,x=0 时时 e1(x,y)最大;当最大;当y=2/5,0 x1时时e1(x,y)最大;当最大;当2/5y1,x1时时e1(x,y)最大;画出的曲线即图最大;画出的曲线即图123中的曲

34、线中的曲线1,它是一条折线。它是一条折线。(3)局中人)局中人2的赢得为的赢得为 2111221221,21,2( , )(1)(1)(1)(1)21 (1)3(1)4(1)(1)(21)(43 )ijijije x ya x ya xya xyax yaxyxyxyx yxyyxx 12.5 有限二人非零和对策有限二人非零和对策(3)局中人)局中人2的赢得为的赢得为 2111221221,21,2( , )(1)(1)(1)(1)21 (1)3(1)4(1)(1)(21)(43 )ijijije x ya x ya xya xyax yaxyxyxyx yxyyxx 图图12曲线曲线l和曲线

35、和曲线2在图在图124中有三个交中有三个交点点(用用“0”号标出号标出)这三个交点上的这三个交点上的x*和和y*所构成的局势所构成的局势*)1*,(*);1*,(*)*,(yyxxyx能够同时满足平衡条件能够同时满足平衡条件 *),(*)*,(11yxeyxe)*,(*)*,(22yxeyxe12.5 有限二人非零和对策有限二人非零和对策) 1 , 0(*),1 , 0(*yx)0 , 1 (*),0 , 1 (*yx对策值为对策值为(3,2) )5/3 , 5/2(*),2/1 , 2/1 (*yx对策值为对策值为(2.4,2.5) (1)(2)(3)对策值为对策值为(4,4)(2,4)(8

36、,3)(4,3)(5,6)(4,5)(5,7)A2.优超原则法优超原则法存在某个策略绝对劣于另一个策略时,称为下策,去掉下策。存在某个策略绝对劣于另一个策略时,称为下策,去掉下策。【例例11.17】用优超原则求解下列非零和对策用优超原则求解下列非零和对策1(2,4)(4,3)(5,6)(5,7)A( *, *)(5,7)uv纳什均衡纳什均衡(纯策略纯策略)解:解:*(0,0,1), *(0,0,1)xy对策值:对策值:取混合策略!取混合策略!12.5 有限二人非零和对策有限二人非零和对策3.划线法划线法 当局中人当局中人2采取策略采取策略j时,局中人时,局中人1在对自己最有利的策略值下在对自己最有利的策略值下划一横线。划一横线。 同理,当局中人同理,当局中人1采取策略采取策略i时,局中人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论