第十讲博弈理论

上传人：w*** IP属地：湖北上传时间：2024-06-13 格式：PPT 页数：41 大小：382.50KB 积分：30 举报 版权申诉

已阅读5页，还剩36页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

YOUAREWELCOME!1EconomicsforManagers管理经济学主讲：余道先ydxdhy@武汉大学经济与管理学院2Chapter12博弈理论3第一节寡头对抗与博弈理论：基本的分析博弈：是指个人或组织在一定的环境条件下，以一定的规则进行决策并从中取得相应结果的过程。博弈论（GameTheory）：研究博弈参与者在利益冲突条件下进行决策的理论。4博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家：纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi），他们都对博弈论在经济学中的应用作出了贡献。5中国是博弈论的发源地

曹操兵败华容道•诸葛亮知道（曹操多疑），故布疑阵，在有伏兵的岔道上点烟•曹操知道[诸葛亮知道（曹操多疑）]，对疑阵进行解释，反其道而行之（走烟起之岔道）•诸葛亮知道{曹操知道[诸葛亮知道（曹操多疑）]}，更反其道而行之（在烟起处伏兵）6博弈论的研究对象博弈论是研究在利益相互影响的局势中，局中人如何选择自己的策略才能使自身的收益最大化时的均衡问题。研究既存在冲突又存在合作情况下的决策行为。博弈是一种竞争势态，在该势态中，两个或更多的局中人都在追求他们各自的利益，没有人能够支配结果。局中人都有一定资源，根据一定规则，采用一定策略行为。7博弈论与管理经济学的关系1、从经济学的研究对象来看传统观点：经济学是研究有限资源的最优配置的一门学科。现代观点：经济学是研究理性人行为的一门学科。理性人合作与冲突博弈论82、从新古典经济学的两个假设来看假设一：市场是完全竞争的；假设二：市场是完全信息的。结论：市场可以达到一般均衡，资源配置达到Pareto最优。两个假设与现实的背离，引出博弈论。9博弈论与寡头厂商竞争

严格地讲，博弈论并不是经济学的一个分支，它是一种方法，应用范围除经济学外，还包括政治学、军事学、外交学、国际关系学、犯罪学等。但为何博弈论受到管理学和经济学的重视呢？主要原因是博弈论在管理学和经济学中得到最广泛、最成功的应用，尤其在寡头市场理论中得到直接的应用。另外，博弈论的许多成果也是借助于经济学的例子来发展的。

当寡头竞争者改变其产品或定价时,企业必须要做出反应或调整，能够预见到对方行动的事前行为最佳。10博弈论对厂商策略选择的作用

•对于厂商来说，能够在实际事件发生之前，提前几步或至少提前竞争者一步正确地预测到有关进出市场、技术创新、产品开发、定价和促销方面的变化常常是其成功的关键。•需要对竞争对手的发起行动和反应作出准确而可靠的预测。这就需要运用博弈论的思想方法去制订自己的策略目标，包括预测竞争对手的行为和作出自己的选择。

11博弈论的特点：（1）参与者具有各自的目标：（2）参与者都是理性行为者；（3）参与者之间具有相关性；（4）事态发展的结果取决于全部参与者的共同行为；（5）参与者要根据对其他参与者的判断决定自己的行动，因而是对策。可见，博弈论是与优化论不同的决策理论。优化论是一种单人决策理论；博弈论所揭示的规律是一种多人决策理论。12博弈论的基本概念在博弈论中博弈基本要素被概括为以下概念：1、参与者Players（玩家）：即参加博弈过程的行为和决策主体，也是利益主体。在一个博弈中，最少要有两个参与者。2、策略Strategies（战略或策略行为）：即参与者在某个博弈时点，根据其掌握的有关博弈信息而选择的决策变量和行动计划，一个参与者的全部可行策略称为他的策略空间。13博弈论的基本概念（续）3、收益Payoff（支付、得益）和收益函数：收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略，称为收益函数。4、结局

outcome（结果）：指博弈的结果，指既定策略组合条件下全部参与者所得收益的集合。5、均衡

Equilibrium（均势）：指达到稳定的策略组合或结局。6、博弈规则：

指参与者、策略、结局之间的联系。它是由博弈环境和参与者之间的相互影响决定的。14一个例子：可口可乐与百事可乐（参与者）的价格决策：

双方都可以保持价格不变或者提高价格（策略）

博弈的目标和得失情况体现为利润的多少（收益）

利润的大小取决于双方的策略组合（收益函数）

博弈有四种策略组合，其结局是：

1、如果双方都不涨价，各得利润10单位；

2、如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；

3、如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；

4、如果双方都涨价，可口可乐利润140，百事可乐利润35；博弈的稳定状态有两个：都不涨价或者都涨价（均衡），均衡称为博弈的解，它是由博弈规则（即参与者采取什么策略会取得什么结局，市场的需求弹性、交叉价格弹性等）决定的。15博弈的表述方法博弈一般用数学模型表达，分为标准和扩展模型两种。1.博弈的标准模型包括三个要素：参与者、每个参与者可以选择的策略以及收益函数。在两个参与者的有限博弈中，标准模型可以用收益矩阵表示。如上例的可乐价格博弈可以表示如下：在收益矩阵中，包含了标准博弈模型的基本信息，表格中各组数字表示不同策略组合条件下的结局。在每个结局中，第一个数字代表参与者1的收益，第二个数字代表参与者2的收益。参与者2百事可乐参与者1

可口可乐

不涨价涨价

不涨价涨价10，10100，-30-20，30140，35162.博弈的扩展模型包括五个要素：参与者、决策时点、策略空间、信息和收益函数。在简单的博弈中，扩展模型可以用博弈树表示。如上例的可乐价格博弈可表示如图下：不涨价涨价参与者1可口可乐10，10100，-30-20，30140，35不涨价涨价参与者2百事可乐不涨价涨价参与者2百事可乐博弈树一般用来分析动态博弈。在博弈过程中，从某一个决策点开始，参与者在已有行动的基础上开始选择，到博弈结束，称为“子博弈”。子博弈是相对的，从事态发展的历史来看，所有的博弈都是子博弈。17博弈的分类（1）合作博弈与非合作博弈根据参与者之间能否通过谈判达成具有约束力的协议或合同来划分。可以达成协议的为合作博弈cooperativegame，合作博弈强调集体理性和整体最优。如买卖双方讨价还价后成交。不能达成协议的为非合作博弈non-cooperativegame，非合作博弈强调个体理性和局部最优。如寡头之间的竞争博弈，双方的利益和目标有冲突，难以达成可以实施的协议，双方都有欺骗和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领域。（2）静态博弈与动态博弈根据参与者选择策略的关系划分。参与者同时或独立选择策略的博弈是静态博弈。参与者按照一定的次序选择策略，后选择者了解先选择者的行动，这种博弈是动态博弈。（3）完全信息博弈与不完全信息博弈根据参与者对其他参与者的特征、策略空间、收益函数等信息的了解程度划分。全部相互了解即为完全信息博弈，否则是不完全信息博弈。18第二节完全信息静态博弈一．囚徒的困境与纳什均衡

1．囚徒的困境：假设有两个嫌疑犯作案后被抓获，并在不同的房间审讯。警察告诉他们，如果两人都坦白，各判刑8年；如果两人都抵赖，各判刑1年；如果其中一人坦白而另一人抵赖，坦白者释放，抵赖者判刑10年；这样，每个犯人就有两种策略，即坦白和抵赖。这个博弈的收益矩阵如下：

囚徒1坦白抵赖

囚徒2坦白抵赖-8，-80，-10-10，0-1，-1在这个博弈中，（坦白，坦白）是博弈的解，即均衡结局。因为不管对方怎样行动，两个囚徒都会选择坦白。囚徒的困境说明，个人理性（最优）与集体理性（最优）可能不一致。如寡头之间的广告投入、产量控制等。192．纳什均衡纳什均衡是指由所有参与者的最优策略组成的策略组合。在这种情况下，没有人可以从改变策略中得到好处，因而形成了一种均衡（僵局）。一种制度或者协议要能够自动实行（即得到自觉遵守），必须满足纳什均衡的条件。可以通过画圈的方法求解纳什均衡。即设定一个参与者的策略，然后把另一个参与者将会选择的策略可以带来的收益圈起来。如果收益矩阵中某个策略组合中的两个收益都被圈起来，则这个策略组合就是纳什均衡。202．纳什均衡在这个博弈中，出现了两个纳什均衡，参与者不能判断对方会采取什么策略，因而可能出现非均衡的结局（涨价，不涨价）和（不涨价，涨价）；或者对双方不利的均衡（不涨价，不涨价）。因此，纳什均衡只说明均衡存在的可能，不能解释均衡的结果。例如，前述可乐定价博弈收益矩阵可以确定有（涨价，涨价）和（不涨价，不涨价）两个纳什均衡。21纳什均衡的求法：双划线法对局中人2的每一个给定策略，为局中人1寻找使其支付最大的策略（结果可能不只一个），在其对应支付下划线；然后对局中人1进行相应的步骤；最后，凡是两个局中人支付下均被划线的结局就是纳什均衡。22例一：囚徒困境中的纳什均衡乙甲坦白不坦白坦白-6，-6-1，-8不坦白-8，-1-2，-223用双划线法可以求出纳什均衡：（坦白，坦白），（-6，-6）意义：揭示个人理性与集体理性之间的矛盾。24例二：猜左右手游戏局中人：甲，乙策略：甲：放左手，放右手乙：猜左手，猜右手支付矩阵：结论：没有纳什均衡25猜左右手游戏乙甲猜左手猜右手放左手-1，11，-1放右手1，-1-1，126二．支配性策略dominantstrategy均衡支配性策略均衡也称上策均衡或优势策略均衡。在博弈中，对有些参与者来说，不管对手采取什么策略，他的策略都保持不变。这种不取决于对手选择的最优策略称为支配性策略（上策或优势策略）。当存在支配性策略时，可以首先确定支配性策略，然后确定对手的选择，从而得出博弈的均衡解。例如，两个寡头厂商的广告博弈收益矩阵如下：参与者1可口可乐有广告无广告参与者2

百事可乐有广告无广告10，515，06，820，6在这个博弈中，百事可乐有一个支配性策略，即不管可口可乐是否有广告，他都会有广告。在此基础上，可口可乐必然也会有广告。博弈的结果就是（有广告，有广告）。这种均衡称为支配性策略均衡。它也是纳什均衡，但纳什均衡不一定是支配性策略。27三．合作的诱惑在类似囚徒的困境这样的博弈中，个体理性往往导致集体的非理性。在有多个纳什均衡的博弈中，参与者判断失误，或者某个参与者非理性行为，都会导致双方的严重损失。因此，存在着通过合作（共谋、勾结和串通）改善博弈结果的诱惑，这样可以是大家的收益都得到改善。例如，在上述广告博弈中，如果双方都不做广告，比都做广告收益高。但这种合作难以自动实现。281．对社会无害的合作，往往通过某些规则实现。如香烟广告，交通规则，重复建设。下图列出了斗鸡博弈的收益矩阵。设两辆汽车同时到达一个十字路口，每个驾驶员都有开和等两种选择，博弈结果如下：

驾驶员1开等

驾驶员2

开等

-8，-84，00，40，0在这个博弈中，（开，等）和（等，开）是两个纳什均衡，但在完全信息静态博弈中，可能由于判断失误导致交通事故，或无谓地延误时间。因此通过交通规则引导博弈。29

厂商1脆甜

厂商2

脆甜

-5，-510，2020，10-8，-8避免重复建设例如两个厂商进行产品开发博弈的收益矩阵。两个厂商同时开发一个市场（麦片），市场需要甜和脆两种产品，每个厂商只能生产其中一种产品。从收益矩阵可以看出，在理性行为条件下博弈的两个纳什均衡是（脆，甜）和（甜，脆）。但由于推出甜的厂商有较多利润，可能导致（甜，甜）的重复建设结果。因此，应该通过发布信息和政策引导。国外不允许厂商之间勾结分割市场，主要靠准确的市场信息。302．对社会有害的合作，设法制止在囚徒的困境博弈中，如果两个囚徒可以互相协商，并形成攻守同盟，则罪犯得到好处，对社会不利。例如在寡头厂商的定价博弈中，勾结定高价对双方都有好处，但对社会不利，因此受到反垄断法的严密监控。寡头厂商的价格博弈收益矩阵如下：

厂商1高价低价

厂商2

高价低价

50，5010，70

70，1030，3031四、最大最小策略纳什均衡是建立在参与者理性行为基础上的，这就使参与者的决策时面临可能出现某些非理性行为的风险。为了降低风险，决策者可以采取最大最小策略以便降低风险，即在各种策略的最小收益中，选择具有最大收益的策略。其代价是放弃最优策略。下图是一个产品开发博弈的收益矩阵。其中，按照理性行为会有两种纳什均衡，（无新产品，有新产品）以及（有新产品，无新产品）。但如果采取最大最小策略，两个企业都不推出新产品。厂商1无新品有新品厂商2无新品有新品4，43，66，32，2厂商2的最小收益32厂商1的最小收益

3232支配性策略在有些情况下，为了避免陷入被动，采取最大最小策略十分必要。在下图的博弈中，乙方采取“右”是一个支配性策略。因为不管甲方选什么，乙方采取右的策略都比左的策略好，可以得到1的收益。在期望乙方采取右的情况下，甲方应该采取“下”，并得到2的收益。这样，支配性策略均衡为（下，右）。如果甲方比较慎重，考虑到乙方可能不一定理性，或者可能故意捉弄甲方，则应该采取最大最小策略，形成（上，右）的博弈结果。

甲方上下乙方左右

1，01，1-8，02，1乙方的最小收益01甲方的最小收益

18-33第三节重复博弈和序列博弈在现实经济社会，完全信息静态博弈的条件并不经常可以得到满足。特别是在市场竞争中，厂商之间的竞争不是一次性的，而是长期和反复的。同时，厂商之间的行为往往是有先后次序的，决策者可以先了解对手的行动，在充分掌握信息的基础上，然后再决定自己的对策。这种情况称为完全信息动态博弈。它对于分析具有多个纳什均衡的博弈结果很有帮助。34一、重复博弈

Repeatedgame重复博弈是指参与者之间的博弈不是一次性的，而是可以重复的。这样，参与者就可以通过分析对手的行动采取相应的策略。1．摆脱囚徒的困境的条件以寡头之间的价格竞争为例，在下图的价格博弈中，如果是静态博弈，厂商很容易陷入囚徒的困境（低价，低价）。但如果博弈可以无限重复下去，则厂商的最佳策略是“以牙还牙”。这样，考虑到对手会以牙还牙，从长远和整体来看，降低价格不会有什么好处，博弈可能达到合作的结果。

厂商1低价高价厂商2低价高价

10，10100，-50-50，10050，50352．合作的条件和困难在现实经济运行中，寡头之间的价格默契并不容易，主要原因有：1）如果博弈重复是有限的，则最后一次博弈会采取低价策略，理性的结果是抢先低价，一直到第一次博弈；但是，只要以牙还牙的理性行为有一定折扣或（怀疑），合作以避免价格战的结果仍然会出现。2）厂商较多，使以牙还牙（对欺骗者进行报复和惩罚）难以实现，合作就十分困难。如航空运输市场3）厂商之间的成本差别较大，需求和成本变化很快，难以达成默契。36二、序列博弈

Sequentialgame在现实中较常见的是序列博弈，即一方先行动，另一方后行动。1．先行者优势在序列博弈中，先行者处于有利地位，可得到竞争优势。在下图中，两家厂商进行产品开发的博弈，如果是静态博弈，两家厂商必须同时宣布决策。根据最大最小原则，可能大家都无新产品。但如果其中某一厂商具有研发优势，可以率先推出新产品，则另一厂商只好放弃进入该市场的打算。

厂商1无新产品有新产品厂商2无新产品有新产品

2，20，10

10，0-5，-5372．空头威胁、承诺和策略性行动在序列博弈中，先行者可以用既成事实获得竞争优势。在这种情况下，怎样才能获得先行优势呢？理性的厂商都知道先行者优势，并希望让竞争者确信自己一定会推出新产品，从而放弃新产品。怎样才能做到这一点呢？（1）空头威胁

如果厂商的努力不足以使对手相信自己肯定会推出新产品，如制造舆论、研究与开发投入、广告宣传等，这种努力称为空头威胁。它不能吓退竞争者。（2）承诺和策略性行动

如果厂商想要吓退竞争者，必须作出一定推出新产品的承诺，它是一种无法反悔的行动。承诺与空头威胁的界限在哪里呢？要使对手确信自己的承诺，必须做到如果不推出新产品，会导致自己更大的损失。在上图中，推出新产品的最大损失是5，空头威胁变为承诺的转折点就是如果不推出新产品将会导致大于5的损失。38怎样作出承诺呢？必须有策略性行动，该行动使得空头威胁变为承诺。即通过某种限制自己选择范围的行动，改变竞争者对自己行动的预期，从而迫使竞争者选择对自己有利

人人文库> 全部分类> 教育资料 > 作文作品

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第十讲博弈理论

文档简介

温馨提示

最新文档

评论

第十讲博弈理论

文档简介

温馨提示

最新文档

评论

相关文档