博弈论及其在决策中的应用

上传人：5*** IP属地：湖北上传时间：2022-06-19 格式：PPT 页数：57 大小：200.50KB 积分：30 举报 版权申诉

已阅读5页，还剩52页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、1第第6章章博弈论及其在决策中的博弈论及其在决策中的应用应用内容概览内容概览6.1 博弈论的基本概念博弈论的基本概念6.2 零和博弈（矩阵博弈）零和博弈（矩阵博弈）6.3 二人非零和博弈二人非零和博弈6.4 博弈论在经济决策中的应用博弈论在经济决策中的应用2博弈论博弈论(Game Theory) ，又称对策论，策略，又称对策论，策略运筹学等，运筹学等，是研究竞争策略运筹的科学，是研究竞争策略运筹的科学，或者说或者说是研究具有竞争、冲突等问题的科是研究具有竞争、冲突等问题的科学，其应用始终与经济决策有密切的联系，学，其应用始终与经济决策有密切的联系，在市场竞争中大有用武之地在市场竞争中大有用武

2、之地。我国早在古代时期的我国早在古代时期的孙子兵法孙子兵法就闪烁着就闪烁着对策论的思想光辉。田忌与齐王赛马的故对策论的思想光辉。田忌与齐王赛马的故事就是一个经典的博弈故事。事就是一个经典的博弈故事。3o19441944年，年，冯冯诺依曼（诺依曼（VonVonNeumannNeumann）与摩）与摩根斯坦（根斯坦（MorgensternMorgenstern）合著发表了）合著发表了对策对策论与经济行为论与经济行为一书，开创了对策论的系一书，开创了对策论的系统化、公理化的研究。统化、公理化的研究。4 博弈在经济决策中的应用博弈在经济决策中的应用o到了到了2020世纪世纪8080年代，博弈论已经受到

3、年代，博弈论已经受到世界各国经济与管理学家的重视，并世界各国经济与管理学家的重视，并认为是经济理论分析和决策的核心方认为是经济理论分析和决策的核心方法，列为西方经济学有关专业学生的法，列为西方经济学有关专业学生的一门必修课程。一门必修课程。o在此期间，博弈论的思想、概念和方在此期间，博弈论的思想、概念和方法在经济学和管理学杂志上大量涌现，法在经济学和管理学杂志上大量涌现，在世界范围内兴起一股学习和研究博在世界范围内兴起一股学习和研究博弈论的热潮。弈论的热潮。5o特别是在特别是在19941994年年1010月份，瑞典皇家科学院宣布该月份，瑞典皇家科学院宣布该年度的诺贝尔经济学奖授予美国普林斯顿大

4、学数年度的诺贝尔经济学奖授予美国普林斯顿大学数学教授约翰学教授约翰纳什纳什(J. Nash)(J. Nash)、加州大学教授、加州大学教授约翰约翰哈萨尼哈萨尼(J. Harsanyi) (J. Harsanyi) 和德国波恩大和德国波恩大学教授瑞哈德学教授瑞哈德泽尔滕泽尔滕(Reinhard(Reinhard Selten) Selten) 三人，以表彰他们把博弈论应用到现代经三人，以表彰他们把博弈论应用到现代经济分析所做的贡献，使得博弈论在世界范济分析所做的贡献，使得博弈论在世界范围内影响更大。围内影响更大。6o19941994年、年、20012001年和年和 20052005年诺贝尔经济学

5、奖年诺贝尔经济学奖都颁发给了在博弈论方面做出了突出贡献都颁发给了在博弈论方面做出了突出贡献的数学家和经济学家，更加显示了博弈论的数学家和经济学家，更加显示了博弈论在经济学研究和应用中的地位。在经济学研究和应用中的地位。o发展至今发展至今，博弈论已经成功应用于经济、，博弈论已经成功应用于经济、管理、军事、政治等诸多领域，已经成为管理、军事、政治等诸多领域，已经成为经济研究和决策的重要工具。经济研究和决策的重要工具。7本章简明介绍博弈论的基本概念、本章简明介绍博弈论的基本概念、基本方法及其在决策中的应用基本方法及其在决策中的应用o博弈现象普遍存在于军事、政治、经济、博弈现象普遍存在于军事、政治、经

6、济、管理、科技等竞争活动中。虽然，博弈来管理、科技等竞争活动中。虽然，博弈来源于竞争，但并非所有竞争都构成博弈。源于竞争，但并非所有竞争都构成博弈。o例如，小孩之间玩投掷一颗筛子的竞赛，例如，小孩之间玩投掷一颗筛子的竞赛，谁掷出的点数多则为获胜者，这不是博弈，谁掷出的点数多则为获胜者，这不是博弈，但如果玩石头、手绢等游戏就构成博弈。但如果玩石头、手绢等游戏就构成博弈。o所以要构成一个博弈问题，必须具备一定所以要构成一个博弈问题，必须具备一定条件条件8 6.1 6.1 博弈论的基本概念博弈论的基本概念o例例1：儿时的游戏：儿时的游戏：“石头、剪子、布石头、剪子、布”。规则。规则为每人从中确定一种

7、出法，出法确定后，就决定为每人从中确定一种出法，出法确定后，就决定了一个了一个“局势局势”，并确定每个人的输赢。，并确定每个人的输赢。o游戏规则规定：获胜者得游戏规则规定：获胜者得1分，输者得分，输者得 -1分，出分，出现平手时各得现平手时各得0分，则可以把各种可能的局势和分，则可以把各种可能的局势和得分情况表示为如下一个矩阵：得分情况表示为如下一个矩阵：甲甲乙乙石头石头剪子剪子布布石头石头剪子剪子布布（0，0）（）（1，-1）（）（-1，1）（-1，1）（）（0，0）（）（1，-1）（1，-1）（）（-1，1）（）（0，0）9在这个例子中在这个例子中，有玩者、策略及其策略集合、，有玩

8、者、策略及其策略集合、以及损益函数（支付函数）以及损益函数（支付函数）1.局中人或参与人（局中人或参与人（player）：两个小孩：两个小孩2. 策略策略(Strategy)和策略集和策略集：石头，剪子，布石头，剪子，布.支付函数支付函数(Payment): 得到的分数。得到的分数。一般双方会形成一个得益矩阵一般双方会形成一个得益矩阵10而且，在此问题中而且，在此问题中o同一局势下，两个局同一局势下，两个局中人的得益之和等于中人的得益之和等于0，这样的博弈模型，这样的博弈模型称为称为二人零和博弈。二人零和博弈。o对于这类特殊的二人对于这类特殊的二人零和博弈，零和博弈，其得益矩其得益矩阵可简化为

9、只写出第阵可简化为只写出第一个局中人（或参与一个局中人（或参与人）的得益即可，在人）的得益即可，在上例中，上例中，支付矩阵可支付矩阵可简化写为：简化写为：01110111011例例2：囚徒困境问题：囚徒困境问题o支付矩阵为支付矩阵为o此例中两人得益之和不等于此例中两人得益之和不等于0，称为，称为二人非零和二人非零和博弈。博弈。) 1, 1()0,10()10, 0()8, 8(囚徒囚徒A坦坦白白抵抵赖赖坦白坦白抵赖抵赖囚徒囚徒B12例例3 3 ：两厂商生产产量的博弈问题：两厂商生产产量的博弈问题o某地区有某地区有、两个厂商生产同一类产品，两个厂商生产同一类产品，为了占领市场，各自制定了自己

10、的产销计为了占领市场，各自制定了自己的产销计划，假设两个局中人各有两种产出水平，划，假设两个局中人各有两种产出水平，记为（记为（A1A1，A2A2）和（）和（B1B1，B2B2）. .o如果厂商如果厂商率先进入市场，并选择一种产率先进入市场，并选择一种产出水平，然后厂商出水平，然后厂商再进入市场，并选择再进入市场，并选择相应的产出水平，相应的产出水平，这一市场竞争过程可用这一市场竞争过程可用“对策树对策树”描述如下：描述如下：13（3，2）（2，4）（6，3）（4，6）厂商厂商厂商厂商厂商厂商A1A2B2B1B1B2进入市场有先后顺序时的决策树进入市场有先后顺序时的决策树底下的为顶点底下的为顶

11、点上面的为终上面的为终点点14在以上例子中，可以看到在以上例子中，可以看到o博弈的所有参与者称为博弈的所有参与者称为局中人局中人(player)(player)，当然至，当然至少有两个少有两个；并且利益完全一致的多个参与者应；并且利益完全一致的多个参与者应视为一个局中人。如打桥牌中的相对而坐的两个视为一个局中人。如打桥牌中的相对而坐的两个人算作一个局中人。人算作一个局中人。o每一局中人都有一套可供选择的方案或办法对付每一局中人都有一套可供选择的方案或办法对付对方，这样的一套备选方案称为对方，这样的一套备选方案称为策略或战略策略或战略（strategystrategy）；o局中人各自选定某一策

12、略之后就会形成某种局势局中人各自选定某一策略之后就会形成某种局势（situation），其中），其中两个局中人各有所得，称为两个局中人各有所得，称为支付或得益支付或得益(payment)(payment)或支付函数（或支付函数（payoff payoff functionfunction），），它依赖于局势它依赖于局势。o若列出的是矩阵形式则称为若列出的是矩阵形式则称为支付矩阵支付矩阵。15博弈模型的三个要素博弈模型的三个要素o局中人（参与人，局中人（参与人，player）o策略（战略策略（战略, strategy）o支付函数（得益支付函数（得益, 赢得，赢得， payment）16所以，

13、构成博弈有三个要素：所以，构成博弈有三个要素：1.局中人或参与人（局中人或参与人（player）：有权决定选择何种策略的参：有权决定选择何种策略的参加者。加者。根据局中人的多少，分为两人对策和多人对策根据局中人的多少，分为两人对策和多人对策2. 策略策略(Strategy)和策略集和策略集：在每局对策中，参加对策的局中：在每局对策中，参加对策的局中人都有可供实际选择的完整的行动方案，成为策略集合。人都有可供实际选择的完整的行动方案，成为策略集合。其中，一种方案成为一个策略。如，其中，一种方案成为一个策略。如，石头，剪子，布石头，剪子，布就是一个策略集。就是一个策略集。根据策略集中元素个数多少，

14、可分为有限对策与无限对策根据策略集中元素个数多少，可分为有限对策与无限对策.支付函数支付函数(Payment): 又称为赢得函数，又称为赢得函数，是指每一局对策结是指每一局对策结束之后，对其中一个局中人来说，其得到的成果（也许束之后，对其中一个局中人来说，其得到的成果（也许是物质或现金之类的收入或支出），统称为得益。常常是物质或现金之类的收入或支出），统称为得益。常常以某一函数统一表示。以某一函数统一表示。17博弈模型的表示博弈模型的表示o一般形式：一般形式：G=I，S，Po其中，其中，I表示居中人的集合；表示居中人的集合；oS为策略集合；为策略集合；oP表示支付函数。表示支付函数。o若某个策

15、略若某个策略S*=（S1*，S2*，Sn*）S，使，使得满足某种均衡性质和条件，则称该策略得满足某种均衡性质和条件，则称该策略S*为为S的均衡点（或均衡解），对应的支付为均衡支付的均衡点（或均衡解），对应的支付为均衡支付P(S*)18博弈论的分类博弈论的分类o策略型博弈（策略型博弈（Strategic form）: 用支付矩阵表示。用支付矩阵表示。如例如例1，例，例2。o扩展型博弈扩展型博弈 ( Extensive form）：用对策树表示。：用对策树表示。如例如例3。o上述两种博弈中，若各局中人之间不能协商或订上述两种博弈中，若各局中人之间不能协商或订立有约束力的协议，称为立有约束力的协议，

16、称为非合作博弈非合作博弈。o否则，若局中人之间存在有约束力的协议，称为否则，若局中人之间存在有约束力的协议，称为合作博弈。合作博弈。19其中，重点介绍其中，重点介绍两人零和博弈两人零和博弈，又，又称称矩阵博弈。矩阵博弈。意思是满足两条件意思是满足两条件o局中人有两人局中人有两人：可以是公司、个人或团体，：可以是公司、个人或团体，也可以是大自然等虚拟的局中人也可以是大自然等虚拟的局中人o零和零和：，在每一局势下，两人的支付之和：，在每一局势下，两人的支付之和为为0206.2 两人零和博弈（矩阵博弈）两人零和博弈（矩阵博弈）o对于这种特殊博弈问题的支付矩阵，可用普通矩对于这种特殊博弈问题的支付矩阵

17、，可用普通矩阵（即只写出第一局中人的得益，省略第二局中阵（即只写出第一局中人的得益，省略第二局中人的得益）表示。人的得益）表示。o假设，各局中人的策略和支付是假设，各局中人的策略和支付是“共同知识共同知识（common knowledge ）”，即每一局中人不但，即每一局中人不但知道自己的策略集合和支付，而且也知道对方的知道自己的策略集合和支付，而且也知道对方的策略集与支付，还知道对方知道我知道这些。策略集与支付，还知道对方知道我知道这些。o现在的问题是现在的问题是，局中人要独立的选择自己的策略，局中人要独立的选择自己的策略，并且在不知对方到底要选取哪个策略的条件下，并且在不知对方到底要选取哪

18、个策略的条件下，要使得自己得到最大的得益（或赢得）。要使得自己得到最大的得益（或赢得）。21先介绍一般概念和符号表示：先介绍一般概念和符号表示：o假设两个局中人为假设两个局中人为、，局中人，局中人有有m m 个纯策略个纯策略11，22，, ,m.m.o局中人局中人有有n n个纯策略个纯策略1,1,2,2, , n no记为记为并称之为并称之为纯策略集合纯策略集合。o并记支付矩阵为并记支付矩阵为A=aijA=aij，o那么，矩阵博弈可简记为那么，矩阵博弈可简记为o它表示出了一个博弈的三个要素。它表示出了一个博弈的三个要素。,.,.,212211nmSS,21ASSG 22例例4: 设某个矩阵博弈

19、为设某个矩阵博弈为G=S1，S2，Ao其中策略集分别为其中策略集分别为S1=S1=11，22，33.oS2S2=1,1,2,2,33 ，o支付矩阵为支付矩阵为o由于局中人都是理性人，每一局中人必然会考由于局中人都是理性人，每一局中人必然会考虑到对方会设法使自己获益最少，同时自己又虑到对方会设法使自己获益最少，同时自己又力求在各种可能情况下谋求自己的最大利益。力求在各种可能情况下谋求自己的最大利益。626235241A11，22，3， 1，2，323o因此，因此，局中人局中人应该在应该在最不利的情况下寻找最大赢得最不利的情况下寻找最大赢得, ,即应在即应在 o而而局中人局中人也也应在最不利的应在

20、最不利的情况下寻找最大赢得情况下寻找最大赢得, ,即即应在应在o即，二人都遵循即，二人都遵循“小中取大小中取大”原则来选取策略，即在原则来选取策略，即在最不利的各种可能之中寻找最有利的策略。最不利的各种可能之中寻找最有利的策略。中求最大)3 ,2, 1(miniaijj中求最大)3 , 2 , 1(max)(minjaaiijiji24由于由于o可知，局中人可知，局中人应选择应选择22，局中人，局中人应选择应选择33，这时局势（，这时局势（22，33）是）是最稳定的，最稳定的，称该局势为该对策的均衡称该局势为该对策的均衡解。解。 o策略策略22和和33分别称为局中人分别称为局中人和和的最优纯策

21、略；的最优纯策略；o并称并称该对策该对策G G的值为的值为2 2。o注意到这里的元素注意到这里的元素a23a23满足不等式满足不等式o有下面的定义有下面的定义2maxmin)max(max2minmax2323aaaaaijijijijijji和)3 , 2 , 1; 3 , 2 , 1(2233jiaaaji123646252A11，22，3， 1，2，325定义定义1：对于矩阵博弈：对于矩阵博弈G=（S1，S2，A）o如果有某个局势满足如果有某个局势满足o则称局势则称局势为为对策对策G的解的解，此时，此时，ii* * 和和j j* * 分别为分别为二局中人的二局中人的最优纯策略最优纯策略，

22、称称为为对策对策G的值的值。),.,2 , 1;,.,2 , 1(),(*njmiaaajijiijji满足*(,)ij* *i ja26TH1：矩阵博弈：矩阵博弈G=（S1，S2，A）o在在纯策略意义下有解纯策略意义下有解的充分必要条件是的充分必要条件是ijijijjiaamaxminminmax即每行中的最小值当中的最大者即每行中的最小值当中的最大者恰好等于恰好等于每列中的最大值当中的最小者每列中的最大值当中的最小者此类对策也此类对策也称为有鞍点称为有鞍点的博弈均衡的博弈均衡解，或者是解，或者是称纯策略意称纯策略意义下有解义下有解2323max min2min max2ijjiijjia

23、aaa在例子中，与相等27但有些矩阵博弈在纯策略意义下无解但有些矩阵博弈在纯策略意义下无解o例如，小孩们玩的例如，小孩们玩的“石头、剪子、布石头、剪子、布”游游戏这个博弈就没有纯策略意义下的解。戏这个博弈就没有纯策略意义下的解。o但我们还是可以凭直觉设想得出答案，该但我们还是可以凭直觉设想得出答案，该博弈中的每个局中人应该以博弈中的每个局中人应该以1/3的等可能性的等可能性随机地选取各种策略，才是最优的。随机地选取各种策略，才是最优的。o于是，在没有纯策略意义下的最优解的情于是，在没有纯策略意义下的最优解的情况下，就产生了混合策略的概念。况下，就产生了混合策略的概念。28混合策略的概念混合策略

24、的概念o定义定义：设：设分别是定义在纯策略集分别是定义在纯策略集S1和和S2上的概率分布（即每个上的概率分布（即每个分量上的数值是概率的含义，且分量数值之和为分量上的数值是概率的含义，且分量数值之和为1），则称它们分别是局中人），则称它们分别是局中人、的混合策略，的混合策略，（x，y）称为混合局势。）称为混合局势。o这样，以前的纯策略可以看作是混合策略的特殊这样，以前的纯策略可以看作是混合策略的特殊情况。情况。o实际上，当局中人实际上，当局中人选取纯策略选取纯策略ii时，可以看作时，可以看作他选取了混合策略他选取了混合策略o所以，用混合策略的概念更具有一般性。所以，用混合策略的概念更具有一般性

25、。TnTmyyyyxxxx),.,(),.,(2121Tie)0,.,0, 1 ,0,.,0(29在混合策略意义下，得益就成为期在混合策略意义下，得益就成为期望得益的概念望得益的概念o在局势（在局势（x, y）下，局中人）下，局中人得到的得到的期望（平均值的含义）支付为期望（平均值的含义）支付为o而局中人而局中人的期望支付为的期望支付为 E（x,y）AyxyxayxETminjjiij11),(30定义定义2 ：设矩阵对策为：设矩阵对策为G=（S1，S2，A）X X，Y Y分别为两局中人的混合策略集。对于分别为两局中人的混合策略集。对于xX, yY, xX, yY, E(x,y)E(x,y)是

26、局中人是局中人的期望支付，则称的期望支付，则称G G* *=X=X，Y Y，EE为为G G的混合扩充。的混合扩充。如果存在如果存在x x* *X, yX, y* *Y,Y,使得使得对一切对一切xX, yYxX, yY都成立，都成立，则称（则称（x x* *,y,y* *）为混合扩充）为混合扩充中的解，中的解，并称并称x x* *,y,y* *分别为两局中人的分别为两局中人的最优策略。最优策略。E E（ x x* *,y,y* * ）称为对策）称为对策G G在在混合扩充下的值混合扩充下的值)*,(*)*,(*),(yxEyxEyxE31TH2：矩阵对策：矩阵对策G=（S1，S2，A）o在在混合扩

27、充意义下，混合扩充意义下，对策对策G G有解有解的充分必的充分必要条件是要条件是),(maxmin),(minmaxyxEyxEXxYyYyXx32例例5 ：公司投资决策问题：公司投资决策问题o某公司计划将某公司计划将3030万元投资到三个不同行业万元投资到三个不同行业A1A1，A2 A2 和和 A3A3中，估计一年后所得的利润将随着经济形中，估计一年后所得的利润将随着经济形势的状况而定。对于不同的经济形势，这笔投资势的状况而定。对于不同的经济形势，这笔投资可能获得的利润预测为下表所示。可能获得的利润预测为下表所示。利润预测利润预测值值行业经济形势（抽象的社会管理者）行业经济形势（抽象的社会

28、管理者）萧条萧条一般一般良好良好投资投资行业行业（公（公司可司可控）控）A1A2A3 2 0 20 3 11 2 133试问试问：该公司应如何决定其投资方案？：该公司应如何决定其投资方案？o解答解答：我们将三个行业：我们将三个行业A1、A2、A3视为投资视为投资者的三个备选策略，将经济形势的不同状态视者的三个备选策略，将经济形势的不同状态视为为另一局中人（是抽象的社会管理者）另一局中人（是抽象的社会管理者）的备选的备选策略。从而将该问题看作是一个矩阵博弈问题。策略。从而将该问题看作是一个矩阵博弈问题。o两个局中人投资者依据两个局中人投资者依据“小中取大小中取大”原则，得原则，得到到o由于

29、二者不等，所以由于二者不等，所以在纯策略意义下无解。在纯策略意义下无解。2maxmin; 1minmaxijijijjiaa34为了求出在混合扩充意义下的最优解为了求出在混合扩充意义下的最优解o需要求解下列线性规划问题：需要求解下列线性规划问题：3 , 2 , 1, 0122322. .min3213213231jyyyyvyyyvyyvyytsvj3 , 2 , 1, 0122232. .max3213213231ixxxxwyyywxxwxxtswi35采用软件（算法是单纯形法）求解，采用软件（算法是单纯形法）求解，o得到该对策的解为得到该对策的解为o对策的值为对策的值为v*=3/4万元万

30、元。o这表明，在不能确定明年的经济形势条件下，这表明，在不能确定明年的经济形势条件下，该公司的最优策略该公司的最优策略o这可解释为，向这可解释为，向A1行业行业投资投资301/3=10万元，万元，向向A3行业投资行业投资302/3=20万元，而不投资万元，而不投资A2行业，一年后预期可行业，一年后预期可至少获得利润至少获得利润4/3=1.3333万元。万元。TTyx)0,31,32(*,)32, 0,31(*Tx)32, 0,31(* 366.3 6.3 二人非零和博弈二人非零和博弈o在两人博弈中，每个局中人博弈的结果是在两人博弈中，每个局中人博弈的结果是双方的得益之和不为双方的得益之和不为

31、0，也不等于某一个常，也不等于某一个常数，而是每一结果用一个数对表示，如（数，而是每一结果用一个数对表示，如（1，3）o本小节对此作一介绍，其应用很广泛。本小节对此作一介绍，其应用很广泛。37一、囚徒困境模型一、囚徒困境模型o支付矩阵为支付矩阵为o此例中两人得益之和不等于此例中两人得益之和不等于0，称为，称为二人非零和二人非零和博弈。博弈。) 1, 1()0,10()10, 0()8, 8(囚徒囚徒A坦坦白白抵抵赖赖坦白坦白抵赖抵赖囚徒囚徒B38一、囚徒困境模型一、囚徒困境模型o最后双方博弈的结果是，双方均选择最后双方博弈的结果是，双方均选择“坦白坦白”这一策略，这一策略，o由于任何人都没

32、有单独改变自己策略的动机，由于任何人都没有单独改变自己策略的动机，它称为博弈的均衡解为它称为博弈的均衡解为 “坦白坦白”，“坦白坦白”39二、寡头削价竞争二、寡头削价竞争o囚徒困境模型在市场竞争中的应用是双寡囚徒困境模型在市场竞争中的应用是双寡头的削价竞争。头的削价竞争。o虽然降价促销手段十分普遍，但这不一定虽然降价促销手段十分普遍，但这不一定都是成功的策略，有时候仍存在较大的风都是成功的策略，有时候仍存在较大的风险。险。o例例6 ：假设：假设某地区有甲、乙两家大型超市，某地区有甲、乙两家大型超市，经营相同品种的商品。并假定在无其他竞经营相同品种的商品。并假定在无其他竞争者的条件下，这两家公司

33、均可使用争者的条件下，这两家公司均可使用“降降价价”或或“维持原价维持原价”这两种销售策略。这两种销售策略。40其盈利情况是：其盈利情况是：（1）当双方均维持原价是，每方的利润时）当双方均维持原价是，每方的利润时10万元；万元；（2）如果甲方降价，乙方维持原价，则甲方销售量）如果甲方降价，乙方维持原价，则甲方销售量迅速上升，利润升至迅速上升，利润升至15万元，而乙方销量下降，万元，而乙方销量下降，利润下降至利润下降至3万元；万元；（3）反之，如果乙方降价，甲方维持原价，则乙方）反之，如果乙方降价，甲方维持原价，则乙方销售量迅速上升，利润升至销售量迅速上升，利润升至15万元，而甲方销量万元，而甲

34、方销量下降，利润下降至下降，利润下降至3万元；万元；（4）如果双方都降价，则双方利润均为）如果双方都降价，则双方利润均为7万元。万元。41由上述得到甲、乙两方的得益状况如下由上述得到甲、乙两方的得益状况如下表所示表所示o甲、乙利润甲、乙利润乙公司乙公司维持原价维持原价降价降价o甲公司甲公司o维持原价维持原价 10，10 3，15o降价降价 15， 3 7，742 甲、乙两方的赢得矩阵为甲、乙两方的赢得矩阵为o显然，最后双方都选择显然，最后双方都选择“降价降价”策略，这是博弈的均衡策略，这是博弈的均衡解。因为双方是竞争对手，都无法相信对方，都有防备解。因为双方是竞争对手，都无法相信对方，都

35、有防备对方利用自己的信任去抢占市场，牟取收益。对方利用自己的信任去抢占市场，牟取收益。o这就是竞争有助于形成（较低的）公平价格的市场机制。这就是竞争有助于形成（较低的）公平价格的市场机制。这也是为什么政府鼓励竞争，反对垄断的原因。这也是为什么政府鼓励竞争，反对垄断的原因。o但是这对双方来讲并不是最好的策略。但是这对双方来讲并不是最好的策略。(10,10)(3,15)(15,3)(7,7)A维持原价维持原价降价降价维持原价维持原价降价降价436.4 博弈论在经济决策中的应用博弈论在经济决策中的应用主要介绍三个方面的应用主要介绍三个方面的应用一、产品决策一、产品决策二、价格决策二、价格决策三、

36、降价竞争决策三、降价竞争决策44一、产品决策问题（二人定值博弈）一、产品决策问题（二人定值博弈）：某地区彩电的总需求量为：某地区彩电的总需求量为10000台，台，有有A、B两家企业在该地进行销售竞争，两家企业在该地进行销售竞争，oA企业设计了三种不同质地的电视，分别企业设计了三种不同质地的电视，分别以以11，22，33记之，记之，oB B企业企业设计了四种不同质地的电视，分别以设计了四种不同质地的电视，分别以1，2，3，4记之。记之。oA企业对市场需求与销售量作了市场调查企业对市场需求与销售量作了市场调查和市场预测，结果如下表所示：和市场预测，结果如下表所示：45该问题属于两人定值博弈，即两企

37、业销量之该问题属于两人定值博弈，即两企业销量之和为和为10000台，故只需要给出台，故只需要给出A企业销量即可企业销量即可o双方的利益是完全冲突的双方的利益是完全冲突的：因为一个企业利润多了，另：因为一个企业利润多了，另一个企业利润就少了，因而是一种不合作的博弈，这类一个企业利润就少了，因而是一种不合作的博弈，这类博弈存在着一种局势，使其相应的策略对双方来说都是博弈存在着一种局势，使其相应的策略对双方来说都是最优的，即存在纯策略均衡解。最优的，即存在纯策略均衡解。 A企业的销售企业的销售量量企企业业 B1，2，3，4企企业业A11，22，337000 2500 5000 80002800

38、4000 5500 60007500 7200 6000 680046求均衡解的方法使用曾介绍的方法求均衡解的方法使用曾介绍的方法o首先，首先，求出每行的最小值，他们分别是求出每行的最小值，他们分别是2500，2800，6000。o然后，然后，再求出其中的最大值，即再求出其中的最大值，即 Max(2500,2800,6000)=6000台，台，o该方法简称该方法简称“小中取大小中取大”原则。原则。o这表明对企业这表明对企业A来说，从最不利的局势下来说，从最不利的局势下寻求最好的结果。寻求最好的结果。47接下来，求企业接下来，求企业B B的策略的策略o首先，首先，求出每列的最大值，他们分别是求出

39、每列的最大值，他们分别是7500，7200，6000，8000。o然后，然后，再求出其中的最小值，即再求出其中的最小值，即 Min(7500, 7200, 6000，8000)=6000台，台，o该方法简称该方法简称“大中取小大中取小”原则。原则。o这表明对企业这表明对企业B来说，从最有利的局势下寻求最坏的结果来说，从最有利的局势下寻求最坏的结果（因为二者利益完全冲突的。想一想，这与零和博弈的纯策（因为二者利益完全冲突的。想一想，这与零和博弈的纯策略均衡解的条件是一致的）。略均衡解的条件是一致的）。o由于两者都是由于两者都是6000，满足有纯策略解的充要条件，即该点称，满足有纯策略解的充要条件

40、，即该点称为鞍点，鞍点对应的的策略为鞍点，鞍点对应的的策略(3,3,3)，即为最优策略。，即为最优策略。o你能说明具体的选择策略吗？此时，企业你能说明具体的选择策略吗？此时，企业A的销售量为的销售量为6000台，企业台，企业B的销售量为的销售量为10000-60000=40000台。台。o如果企业如果企业B不生产质地为不生产质地为3的电视，而改变为其他策略，则的电视，而改变为其他策略，则市场分额将比市场分额将比4000台要少。由此可见，台要少。由此可见，3的确是企业的确是企业B的的最最优策略，优策略，48二、价格决策问题（二人非零和博弈）二、价格决策问题（二人非零和博弈）o由于市场需求量是有

41、限的，因此在价格水由于市场需求量是有限的，因此在价格水平下销售出去的产品数量也是有限的。平下销售出去的产品数量也是有限的。o如果投放市场的产品数量超过了容量，只如果投放市场的产品数量超过了容量，只能依靠降价才能销售完。能依靠降价才能销售完。假定假定面包企业面包企业每天面临的市场容量为每天面临的市场容量为2000个，甲、乙两面包商的生产成本、品个，甲、乙两面包商的生产成本、品种、价格、服务等均相同，因此几乎二者种、价格、服务等均相同，因此几乎二者平分市场份额和利润，不论哪一方要想扩平分市场份额和利润，不论哪一方要想扩大市场分额，只有降价销售才能实现。大市场分额，只有降价销售才能实现。49假设两家

42、企业均有独立的定价权假设两家企业均有独立的定价权o面包价格为面包价格为1元元/个，最高不超过个，最高不超过1.3元。元。o因此两家面包企业的价格选择只能在因此两家面包企业的价格选择只能在11.3元之间。元之间。已知两面包商的盈利情况如下表所示：已知两面包商的盈利情况如下表所示：双方盈利双方盈利面包企面包企业乙业乙 1元元/个个 1.3元元/个个面包面包企业企业甲甲1 1元元/ /个个1.31.3元元/ /个个0，0 1700，300300，1700 1200，120050面包商为了取得良好利润，根据市场行情，面包商为了取得良好利润，根据市场行情，灵活掌握销售价格（即采用混合策略）：灵活掌

43、握销售价格（即采用混合策略）：面包商甲面包商甲：以概率：以概率p的机会卖价的机会卖价1元元/个，又以个，又以概率概率1-p的机会卖价的机会卖价1.3元元/个。个。面包商乙面包商乙：同样策略：同样策略这种竞争双方的产品相同，价格策略也相同，这种竞争双方的产品相同，价格策略也相同，自然导致双方有相同的期望利润：自然导致双方有相同的期望利润：0p+1700(1-p)=300p+1200 (1-p)解此方程，得到：解此方程，得到：p=5/8, 1-p=3/851这说明，甲乙两家企业的最优策略是：以概率这说明，甲乙两家企业的最优策略是：以概率5/8的机会卖价的机会卖价1元元/个，又以概率个，又以概率3/

44、8的机会的机会卖价卖价1.3元元/个。这是一种混合策略。个。这是一种混合策略。并进一步可计算各家的每天期望利润为：并进一步可计算各家的每天期望利润为：5553( )0(1700300)88883533(3001700)(12001200)12758888E R 52三、降价竞争问题（合作博弈）三、降价竞争问题（合作博弈）o关于降价竞争对双方来说，由于所处环境关于降价竞争对双方来说，由于所处环境不同，很可能有不同的结果。不同，很可能有不同的结果。o例例9：甲、乙两家企业的竞争损益状况表示甲、乙两家企业的竞争损益状况表示为如下表格：为如下表格：(3,3)(0,8)(8,0)( 1, 1) 维持原价维持原价降价降价维持原价维持原价降价降价53它与囚徒困境与零和博弈不同的是，它与囚徒困境与零和博弈不同的是，博弈双方的利益并非完全冲突，除了有竞博弈双方的利益并非完全冲突，除了有竞争成分以外，还可通过协商进行合作，争成分以外，还可通过协商进行合作，共同分享利益，达到双赢的目的。共同分享利益，达到双赢的目的。可有不同的竞争结果：可有不同的竞

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论及其在决策中的应用

文档简介

温馨提示

最新文档

评论

博弈论及其在决策中的应用

文档简介

温馨提示

最新文档

评论

相关文档