第十章 博弈论初步_第1页
第十章 博弈论初步_第2页
第十章 博弈论初步_第3页
第十章 博弈论初步_第4页
第十章 博弈论初步_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十章第十章博弈论初步博弈论初步江苏大学人文社会科学学院西方经济学本章要点本章要点一、博弈论和策略行为二、同时博弈:纯策略行为三、同时博弈:混合策略行为四、序贯博弈第一节第一节 博弈论和策略行为博弈论和策略行为博弈论是描述和研究行为者之间策略相互依存和相互作用的一种决策理论(如同下棋)。一、博弈论的基本概念策略:如果出现了什么情况(比如,对手采取什么行动),那么,我该采取什么行动。支付(报酬):博弈带给参与者的效用或结果。支付(报酬)矩阵:以各种策略组合所对应的效用值而构建的矩阵。博弈均衡:博弈中所有参与者各自采取了最优策略而产生的一个策略组合。第一节第一节 博弈论和策略行为博弈论和策略行为博

2、弈论是描述和研究行为者之间策略相互依存和相互作用的一种决策理论(如同下棋)。二、博弈的基本要素参与人:在博弈中进行决策的人个。参与人的策略:根据规则选择如何行动。参与人的支付:博弈完成后参与人得到的效用。第一节第一节 博弈论和策略行为博弈论和策略行为博弈论是描述和研究行为者之间策略相互依存和相互作用的一种决策理论(如同下棋)。三、博弈的类型二人博弈和多人博弈;零和博弈和非零和博弈;限有博弈和无限博弈;同时博弈和序贯博弈。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡“同时”、“序贯”的界定:“同时”是指:每一个决策人在决策之前都不知道其他参与人的决策,从而进行决策或行动,这种状态称为“

3、同时博弈”。“序贯”是指:每一个参与人的决策和行动,是有先有后的博弈,这种博弈过程称为“序贯博弈”。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡一、寡头博弈构成要件:寡头市场,只有两个厂商;每个厂商只有两个选择,合作或不合作。如果合作:行为:组成垄断组织,共谋价格与产量。结果:分别得到较多的支付,比如:甲得到5个单位的支付,乙得到6个单位的支付。如果都不合作:行为:消极地以自己的产量去适应对方的产量(古诺模型)。结果:分别得到较少的支付,比如:甲得到2个单位的支付,乙得到3个单位的支付。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡一、寡头博弈如果一方采取合作另一方采取不合作

4、策略博弈及结果:甲方采取合作策略,乙方采取不合作策略。甲方执行垄断价格,乙方秘密降价,甲方得到1个单位的支付,乙得到5个单位的支付。甲方采取不合作策略,乙方采取合作策略。甲方秘密降价,乙方执行垄断价格,甲方得到7个单位的支付,乙得到1个单位的支付。基本结论:双方采取合作是一个好的策略,双方不合作是一个坏的策略(会招致对方的报复)。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡二、博弈矩阵(支付矩阵)定义:两人同时进行决策博弈的情况,用二元数组列出矩阵,进行描述和分析,称为博弈矩阵。表 10-1表10-1,列出了甲乙双方合作与不合作的各种情况下,各自得到的支付。第二节第二节 同时博弈:纯

5、策略均衡同时博弈:纯策略均衡三、条件策略和条件策略组合表 10-1甲厂商的决策:如果乙方选择合作(条件),则甲方最好选择不合作(策略),这个策略的甲方得到的支付是7个单位。不合作是甲厂商此时的最优策略。甲厂商在乙厂商选择合作条件下的最优策略(甲厂商不合作的策略)称为甲厂商的条件优势策略,简称条件策略。与甲厂商的这一条件优势策略相联系的策略组合,叫做甲厂商的条件优势策略组合(甲不合作+乙合作)。简称条件策略组合。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡三、条件策略和条件策略组合表 10-1条件策略:参与人在给定条件下的相对优势策略。比如,已明知其他参与人采取什么策略的情况下,定下己

6、方的策略。条件策略组合:参与人的策略和其他参与人的策略构成的组合。比如,在甲厂商选择合作条件下,乙厂商也选择合作,此时就乙方而言,“合作+合作”,就是条件策略组合。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡三、条件策略和条件策略组合表 10-1条件:乙厂商选择不合作。策略:甲厂商应该选择什么策略?第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡三、条件策略和条件策略组合表 10-1甲厂商的两个策略组合:不合作+合作不合作+不合作乙厂商的两个策略组合:合作+合作不合作+不合作第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡四、纳什均衡表 10-1条件策略组合实际上代表某种

7、条件下的一种均衡。甲厂商的一个策略组合(不合作+合作)是最优的,因此,他没有改变自己策略的倾向(尽管乙厂商有可能改变选择)。乙厂商的一个策略组合(合作+合作)是最优的,因此,他没有改变自己策略的倾向(尽管甲厂商有可能改变选择)。只有在一种情况下,双方都没有改变策略的可能 :不合作+不合作当两个厂商的条件策略组合正好相同,从而,两个厂商都不再有单独改变策略的倾向时,整个博弈过程就达到了某种均衡。这种均衡就称为“纳什均衡”。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡四、纳什均衡表 10-1纳什均衡:指参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。纳什均

8、衡:如果在一个策略组合中,当所有其他人都不改变策略时,没有人会单独改变自己策略,则该策略组合就是纳什均衡。纳什均衡中的关注点:单独改变策略(其他人策略不变)不会得到好处(得到的支付不会增加)第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡五、寻找纳什均衡的方法表 10-1条件策略下划线法:1、在每一方的优先策略获得的支付下,划一下划线。2、找到两个数字都有下划线的方格,就是均衡策略组合。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡六、纳什均衡的存在性、唯一性和最优性1、存在性在双方同时博弈中,纳什均衡有可能存在,也可能不存在。(表10-2,没有一个单元格的数字是都有下划线的)第

9、二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡六、纳什均衡的存在性、唯一性和最优性2、唯一性在纳什均衡的条件下,解有可能是唯一的,也可能不是唯一的。(有二个单元格的数字是都有下划线的)表10-3当纳什均衡不存在或不唯一时,无法对博弈的最终结果做出肯定的说明。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡六、纳什均衡的存在性、唯一性和最优性3、最优性如果纳什均衡存在,它既可以是最优的,也可能不是最优的。表10-3表10-3中,右下方的均衡不是最优。表10-1中,纳什均衡(不合作+不合作)也不是最优。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡六、纳什均衡的存在性、唯一性和

10、最优性4、纳什均衡实例 囚徒困境囚徒困境乙方乙方坦 白不坦白甲方坦 白-5 -5-1 -7不坦白-7 -1-2 -2囚徒困境是一种占优策略均衡,每个囚徒占优策略都是坦白,策略组合(坦白,坦白)就是该博弈的占优策略均衡,同时,也属纳什均衡。在“囚徒困境”中,(坦白、坦白)并不是博弈者共同的最优结果,因为每个人都被判5年徒刑。他们共同的最优结果应该是各判2年,但却是无法实现的。“囚徒困境”常常被经济学家作为一个经典案例用来说明:自利的个人理性行为并没有导致一个社会的最佳结果,亦即个人理性与集体理性之间存在着深刻的冲突。第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡七、二人同时博弈的一般理论

11、(略)第三节第三节 同时博弈:混合策略均衡(略)同时博弈:混合策略均衡(略)第四节第四节 序贯博弈序贯博弈条件:参与人的决策有先有后,后行动的参与人可以观察到先行动的参与人已经采取的策略。第四节第四节 序贯博弈序贯博弈一、例子:竞争者-垄断者博弈 一个现有的垄断者与一个潜在的竞争者之间的博弈。先决策:竞争先做出决策,是进入还是不进入由垄断者独占的市场。后决策:垄断后决策,对进入者的行为是抵抗还是容忍。第四节第四节 序贯博弈序贯博弈二、博弈树(扩展式博弈模型)先决策:竞争先做出决策,是进入还是不进入由垄断者独占的市场。后决策:垄断后决策,对进入者的行为是抵抗还是容忍。根(起点):是序贯博弈开始的

12、地地方:a。扩展线:代表一种决策。中间点:代表跟进决策者。终点:策略组合和支付组合。终点共有:四个策略组合、四个支付组合。第四节第四节 序贯博弈序贯博弈三、纳什均衡图10-7中的纳什均衡是:进入+容忍,分别得到支付是1,4。图10-7中,只有一个纳什均衡,其他决策组合都不是,至少有一方单独改变会增加己方的利益。在序贯博弈中,纳什均衡也可能不止一个。第四节第四节 序贯博弈序贯博弈三、纳什均衡图10-8 情侣博弈双方都有二个选择:看足球或看芭蕾。男方先决策,女方跟进决策,形成四个策略组合。四个策略组合中,有二个是纳什均衡:足球+足球;芭蕾+芭蕾。其余二个策略组合都不是纳什均衡。第四节第四节 序贯博

13、弈序贯博弈四、纳什均衡精炼:逆向归纳法图10-9、10-10 精练之一二个纳什均衡的特点:男方选择足球或芭蕾,女方跟进与男方相同(图10-9)。女方的选择完全由男方的选择所决定。既然女方的决定服从于男方,男方就可以选择最有利于己方的决策:足球。(图10-10)第四节第四节 序贯博弈序贯博弈四、纳什均衡精炼:逆向归纳法图10-11 精练之二女方先行动,则会形成有利于女方的纳什均衡:芭蕾+芭蕾。先动优势:先行动者的得益大于后行动者。逆向归纳的分析方法也适用于“垄断者、竞争者”博弈,参见教材318页。第四节第四节 序贯博弈序贯博弈五、静态博弈、动态博弈和重复博弈每个参与者只参加一次策略选择的博弈被称

14、为静态博弈。每个参与者只参加一次策略选择的博弈被称为静态博弈。动态博弈是一种反复进行的博弈。动态博弈是一种反复进行的博弈。重复博弈是同一个博弈被重复多次,是动态博弈的一种特殊情况。重复博弈是同一个博弈被重复多次,是动态博弈的一种特殊情况。在无限期重复博弈中,对于任何一个参与者的欺骗和违约行为,在无限期重复博弈中,对于任何一个参与者的欺骗和违约行为,其他参与者总会有机会给予报复。促使每一个参与者都不会采取其他参与者总会有机会给予报复。促使每一个参与者都不会采取违约或欺骗的行为,囚犯困境合作的均衡解是存在的。违约或欺骗的行为,囚犯困境合作的均衡解是存在的。在有限期重复博弈中,囚犯困境博弈的纳什均衡只能是参与者的在有限期重复博弈中,囚犯困境博弈的纳什均衡只能是参与者的不合作。然而,如果任何参与者都不能准确知道哪一次为最后一不合作。然而,如果任何参与者都不能准确知道哪一次为最后一期,囚犯困境合作的均衡解是存在的:合作期,囚犯困境合作的均衡解是存在的:合作+ +合作。合作。第四节第四节 序贯博弈序贯博弈五、静态博弈、动态博弈和重复博弈合作博弈的特点是参加博弈的各方在决策过程中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论