南开大学博弈论简介.ppt

上传人：j*** IP属地：河南上传时间：2020-07-17 格式：PPT 页数：48 大小：138KB 积分：20 举报 版权申诉

已阅读5页，还剩43页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、1,博弈论简介,2,第一节博弈论的基本概念,一、市场竞争中的博弈二、现代经济学与博弈论三、博弈论的基本概念,3,一、市场竞争中的博弈,在现实经济生活中，许多产业市场是寡头断市场。寡头垄断市场是指少数几家大厂商生产一个产业中的全部或大部分产品，从而形成对一个产业的控制的产业市场。在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。,4,二、现代经济学与博弈论,从现代的观点来看，经济学是研究人的决策行为的学问。理性人是指有一个很好定义的偏好，在面临给定的约束条件下能最大化自己偏好的人，不考虑竞争对手的决策。价格理论有两个基本假

2、定：1、市场参与人的数量足够多，从而市场是竞争性的；2、参与人之间不存在信息不对称问题（完全竞争、完全信息）。然而在现实生活中，这两个假设在许多情况下是不能被满足。,5,1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞； 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨，表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特奥曼和美国人托马斯谢林，以表彰他们在博弈论领域作出的贡献。,6,三、博弈论的基本概念,(一)博弈论的定义博弈论，英文为G

3、ame theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。,7,(二)博弈的组成要素,一个博弈一般由以下几个要素组成，包括：参与人、行动、信息、策略、得益、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)； 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策； 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排；,8,4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及

4、其得益函数等知识； 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西； 6、均衡是所有参与人的最优策略或行动的组合；均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。上述要素中，参与人、行动、结果统称为博弈规则，博弈分析的目的就是使用博弈规则来决定均衡。,9,(三)博弈的分类,根据参与人的多少，可将博弈分为两人博弈或多人博弈；根据参与人是否合作，可将博弈分为合作博弈或非合作博弈；根据博弈结果的不同，又可分为零和博弈、常和博弈与变和博弈。,10,1、从行动的先后次

5、序来分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动，或虽非同时但后行动者并不知道前行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。,11,2、从参与人对其他参与人的各种特征信息的获得差异来分，博弈可分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息。将上述两个角度的划分结合起来，我们就得到四种不同类型的博弈，这就是：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈和不完全信息动态博弈。,12,博弈

6、的分类和均衡,13,第二节博弈的种类,一、完全信息静态博弈 (一)完全信息静态博弈定义所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。,14,(二)博弈的策略式表达,在博弈论中,一个博弈可以用两种不同的方式来表达：一种是策略式表达:另一种是扩展式表达.策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。,15,策略式表达又称为标准式表达，在这种表达中，所有参人同时选择自己的策略，所有参与人选择的策略一起决定每个参与人的得益。值得强调的是，这里参与

7、人同时选择的是“策略”,而不是“行动”。在静态博弈中,于参与人只选择一次,所以策略就等同于行动了。而在动态博弈中，策略是参与人在各个阶段的行动的全面计划。,16,更为准确地讲，战略式表述给出： 1、博弈的参与人集合：i，=(1,2,， n)； 2、每个参与人的战略空间：Si i1,2,3,n； 3、每个参与人的得益函数：ui(s1, ，si，sn)，i1,2,3, ，n。用GS1，Sn；u1, ，un代表战略式表述博弈。,17,(三)博弈的得益矩阵表示,一个博弈被称为有限博弈，如果：第一，参与人的个数是有限的；第二，每个参人可选择的策略个数是有限的。有限博弈的策略式表达及其求解可以方便

8、地用得益矩阵直观地给出。,18,著名的“囚徒困境”的例子,警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判一年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判10年徒刑；果两人都坦白认罪，则他们将被各判8年监禁。问：两个罪犯会如何选择（即是坦白还是抵赖）？,19,20,(四)纳什均衡,1、占优策略均衡。一般来说，由于每个参与人的得益是博弈中所有参与

9、人的策略的函数，因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中，一个参与人的最优策略可能可以不依赖于其他参与人的策略选择，就是说，不论其他参与人选择什么策略，他的最优策略是唯一的，这样的最优策略被称为“占优策略”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。,21,在一个博弈里,如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人会选择劣策略。所以在囚徒困境博弈里，坦白，坦白是占优策略均衡。囚徒困境反映了一个深刻的问题,即个人理性与团体理性的冲突。这给我们一

10、个启示,我们学习博弈论，也许更应该研究的是怎样设计一种制度,在满足个人理性的同时,去争取达到“集体理性”。,22,2、严格劣策略的重复剔除,重复剔除严格劣策略”的思路如下：首先找出某个参与人的严格劣策略(假定其存在)，把这个劣策略剔除掉，重新构造一个不包含已剔除策略的新的博弈；重复这个过程，一直到只剩下一个唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解，称为”重复剔除的占优均衡”。注意，上述表述中强调了“唯一”这个词。也就是说，如果重复剔除后剩下的策略组合不唯一，那么该博弈就不是可通过重复剔除劣策略求解的。,23,3纳什均衡,纳什均衡是完全信息静态博弈解的一般概念，构成

11、纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略，即没有任何一个策略严格优于纳什均衡策略。当然，逆定理是不存在的。更为重要的是，许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈,也存在纳什均衡。下面，我们给出纳什均衡的正式定义。,24,纳什均衡的正式定义,纳什均衡：有n个参与人的战略式表述博弈GS1，Sn；u1, ，un，战略组合S*（S1*，Sn*）是一个纳什均衡，如果对于每一个i，Si*是给定其他参与人Si*（S1*,，S-1*，Si+1*，Sn*）的情况下第i个参与人的最优战略，即：ui(si*,s-i*)ui(si,s-i*)对任意SiSi,和任意的 I都成

12、立。,25,指一组给定对手行为前提下对各博弈方存在的最佳选择；在纳什均衡状态下，只要其它参与者不变换策略选择，任何单个参与者不可能单方面通过变换策略来提高他的所获支付。,26,(五)纳什均衡的多重性,在两人的有限策略博弈中,我们还可以简单地用划线法来找出纳什均衡,从这个例子中我们知道一个博弈可能有多个纳什均衡，而具体哪个均衡会实现，纳什均衡本身不能给出回答,任何有限博弈都存在至少一个纳什均衡，若是无限博弈则不一定。,27,几个博弈案例,1.智猪博弈（占优战略均衡） 2.性别之争（多重纳什均衡） 3.斗鸡博弈； 4.市场阻挠博弈,28,第二节完全信息动态博弈,一、完全信息动态博弈定义完全信息

13、动态博弈指的是各博弈方先后行动，后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈.,29,二、动态博弈的构成要素,(1)参与人集合:I:1，n;此外我们以后将用代表虚拟的参与人“自然”； (2)参与人的行动顺序:谁在什么时候行动； (3)参与人的行动空间:在每次行动时,参与人有些什么行动可供选择； (4)参与人的信息集:每次行动时,参与人知道些什么； (5)参与人的得益函数:在博弈结束后,每个参与人得到些什么； (6)外生事件(即“自然”的选择)的概率分布。,30,三、动态博弈的表现形式 “博弈树”,结：结包括决策结和终点结。枝：博

14、弈树上，枝是从一个决策结到其直接后续结的连线，每一个枝代表参与人的一个行动选择。在每一个枝旁标注该具体行动的代号。一般地，每个决策结下有多个枝，给出每次行动时参与人的行动空间，即此时有哪些行动可供选择。信息集：将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集。,31,四、动态博弈的特点,1.动态博弈的策略特征：博弈方决策的内容也是决定博弈结果的关键，不是博弈方在单个阶段的行为，而是各博弈方在整个博弈中轮到选择的每个阶段，针对前面阶段的各种情况作出的相应选择和行为的完整计划，以及由不同博弈方的这种计划所构成的组合。这种计划就是博弈方的策略。,32,2.博弈方的非对策

15、性,在信息的占有上，后行动者往往比先行动者更占优势。但所获得的收益不一定比先行动者多。这与单人决策是不同的。 3.策略的可置信性问题：策略是博弈方自己预先设定的，在各个博弈阶段针对各种情况所作的相应行为选择的计划，本身没有强制力，且实施起来有一个过程。在该过程中，根据自己的利益需要，他完全可以改变这个计划，从而存在“相机选择”，产生策略的可置信性问题。,33,四、子博弈精炼纳什均衡动态博弈的纳什均衡,1.意义： “子博弈精炼纳什均衡”，用于区分动态博弈中的“合理纳什均衡”与“不合理纳什均衡”，将纳什均衡中包含有不可置信威胁策略的均衡剔除出去，就是说，使最后的均衡中不再包含有不可置信威胁策

16、略的存在。,34,2.子博弈精炼纳什均衡的定义,子博弈：一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。子博弈精炼纳什均衡定义：对于扩展式博弈的策略组合S*=(S1*，Si*,，Sn*) ，如果它是原博弈的纳什均衡；它在每一个子博弈上也都构成纳什均衡，则它是一个子博弈精炼纳什均衡。,35,3.子博弈精炼纳什均衡求法逆向归纳法求解,对于我们现在所讨论的有限完全信息动态博弈，逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上去，这就是逆向归纳法。所以逆向归纳法就是

17、从动态博弈的最后一个阶段或最后一个子博弈开始，逐步向前倒推以求解动态博弈均衡的方法,36,第二节寡头垄断企业的博弈行为,一、寡头垄断企业的静态博弈行为 1.博弈论（Game Theory）: 它是研究行为决策主体的行为发生直接相互作用时的决策，以及这种决策的均衡问题的经济学分支，也就是说，当一个行为主体的选择受到其他行为主体选择影响，而且反过来影响到其他行为主体选择时的决策问题和均衡问题。,37,2.博弈论与寡头垄断企业竞争行为：在博弈过程中，行为主体决策的效用函数不仅依赖于他自己的选择，而且依赖于与其具有博弈关系的其他行为方的选择：个人的最优选择及其得益是其他人选择的函数。根据上述分析

18、，寡头垄断企业的竞争行为与博弈论关于竞争主体的行为假定是一致的，由此决定了寡头垄断企业的竞争行为成为博弈论原理的重要应用领域，可以说所有的寡头垄断竞争模型都是博弈论有关原理的具体应用。,38,3.寡头垄断企业竞争的早期研究：完全信息的静态博弈寡头垄断企业竞争的早期研究主要集中于其静态的或单时期的市场竞争模型，适用于仅持续一个较短期限的市场，竞争对手同时作出决策并只竞争一次。彼此之间没有机会事先观察竞争对手的行动，从而选择相应的决策。在博弈论上，对于这样一种竞争行为主要是用完全信息的静态博弈来分析的。,39,二、完全信息动态博弈与寡头垄断企业竞争行为,1. 寡头垄断企业的现实竞争行为多为动态

19、博弈静态竞争的情况在现实经济中往往是很少存在的，现实中存在较多的是参与竞争的企业在行动顺序上有先后之分，且后行动者一般能够在自己行动之前或多或少地观察到竞争对手在此之前行动的有关信息，并以此为依据来制定自己的竞争决策。这种竞争是一种动态竞争，需要用动态博弈理论进行分析。,40,三、重复博弈与寡头垄断企业竞争行为,1.定义：同样结构的博弈重复多次，其中每次博弈称为“阶段博弈”。 2.特征： A.阶段博弈之间无物质上的联系，也就是说，前一阶段的博弈不改变后一阶段博弈的结构； B.所有参与人都观察到博弈过去的历史； C.参与人关心的是整个博弈的总得益，总得益是所有阶段博弈得益的贴现值之和。,41

20、,3.有限次重复博弈,给定一个博弈G，重复进行T次G，并且在每次重复之前各博弈方都能观察到以前博弈的结果，这样的博弈过程称为G的一个“T次重复博弈”，记为G(T)。而G则称为G(T)的原博弈。 G(T)的每次重复称为G(T)的一个阶段。,42,关于有限次重复博弈结果定理：令G是阶段博弈，G(T)是G重复T次的重复博弈。那么，如果G有唯一的纳什均衡，重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。,43,4.无限次重复博弈,与有限次重复博弈的差别：当博弈重复无穷多次时，会存在着完全不同于一次性博弈的子博弈精炼均衡。在无限次重复博弈中，因为博弈没有最后阶段,故不能用逆向归纳法求解。触发机制发挥重要的作用长远利益与眼前利益的权衡合作的实现,44,四、不完全信息博弈基本概念不完全信息博弈是指博弈的各参与人对其他参与人的得益函数不完全了解的博弈。在不完全信息情况下的博弈参与人的最优策略不仅仅依赖于其他参与人的策略，更依赖于对其他参与人情况的判断。,45,（一）海萨尼转换,1967年，海萨尼提出了“海萨尼转换”来处理这种不完全信息的博弈。其基本思路是引入一个

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

南开大学博弈论简介.ppt

文档简介

温馨提示

最新文档

评论

南开大学 博弈论简介.ppt

文档简介

温馨提示

最新文档

评论

相关文档

南开大学博弈论简介.ppt