第二章完全信息静态博弈_第1页
第二章完全信息静态博弈_第2页
第二章完全信息静态博弈_第3页
第二章完全信息静态博弈_第4页
第二章完全信息静态博弈_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 完全信息静态博弈完全信息静态博弈(Static games of complete information)l 静态(静态(Static):参与人同时选择行动且只选择一次):参与人同时选择行动且只选择一次(若不同时,则后行动者并不知道前行动者具体采取(若不同时,则后行动者并不知道前行动者具体采取什么行动)什么行动)l 完全(完全(Complete):参与人对对手的战略空间,支):参与人对对手的战略空间,支付函数完全了解,即没有事前不确定性且自然付函数完全了解,即没有事前不确定性且自然(Nature,虚拟参与人)的初始行动被每一个参与,虚拟参与人)的初始行动被每一个参与人所观察到。

2、人所观察到。本章重点讨论本章重点讨论 一、博弈论的若干基本概念一、博弈论的若干基本概念占优战略均衡(占优战略均衡(Dominant strategy equilibrium,DSE)重复剔除占优均衡(重复剔除占优均衡(Iterated dominance equilibrium,IEDE)纳什均衡(纳什均衡(Pure Nash equilibrium,PNE)混合战略纳什均衡(混合战略纳什均衡(Mixed strategy Nash equilibrium,MNE)二、纳什均衡应用模型举例二、纳什均衡应用模型举例古诺(古诺(Cournot)寡头竞争模型()寡头竞争模型(1838)伯川德悖论(伯

3、川德悖论(Bertand Paradox,1883)豪泰林(豪泰林(Hotelling)价格竞争模型()价格竞争模型(1929)公共品供给(公共品供给(Hardin,1968)、需求模型)、需求模型基础设施建设:中央政府和地方政府之间的博弈基础设施建设:中央政府和地方政府之间的博弈三、纳什均衡的存在性和多重性的讨论三、纳什均衡的存在性和多重性的讨论博弈:参与人博弈:参与人选择行动选择行动战略战略寻找最优目标(寻找最优目标(Max)支付)支付 静态时:策略与行动一致,因为没有任何可能影响静态时:策略与行动一致,因为没有任何可能影响参与人行动选择的信息被披露出来。参与人行动选择的信息被披露出来。

4、一、博弈论的若干基本概念一、博弈论的若干基本概念例例2.1、两房地产商进行房地产开发博弈,其已知条件如表、两房地产商进行房地产开发博弈,其已知条件如表2.1所示:所示:收入收入市场需求市场需求开发资金开发资金高高低低市场供给市场供给2栋栋1.4亿元亿元7千万元千万元1亿元亿元1栋栋1.8亿元亿元1.1亿元亿元表表2.1单位:栋单位:栋依据表依据表2.1数据,用标准式(战略式)来描述该博弈如下:数据,用标准式(战略式)来描述该博弈如下:0, 00, 80008000, 04000,4000开发开发不开发不开发A开发开发不开发不开发B 高需求高需求0, 00, 10001000, 0-3000,

5、-3000开发开发A不开发不开发开发开发不开发不开发B 低需求低需求战略式包括三要素:参与人(战略式包括三要素:参与人(player),战略(),战略(strategy),支付(),支付(payoff)一、博弈论的若干基本概念一、博弈论的若干基本概念1、若干定义、若干定义2、均衡(、均衡(equilibrium)(1)占优战略均衡(占优战略均衡(DSE) (2)重复剔除占优均衡()重复剔除占优均衡(IEDE) (3 3)纳什均衡()纳什均衡(NE or PNENE or PNE )1、若干定义、若干定义(1)参与人集合)参与人集合i , =(1,2,n),上例为),上例为n=2; 虚拟参与人虚

6、拟参与人“自然自然”(外生变量),如自然以一定的概率决定需求是高(外生变量),如自然以一定的概率决定需求是高(大)还是低(小)。(大)还是低(小)。 (2)行动(行动(actions or moves):i在某时点的决策变量,用在某时点的决策变量,用ai表示,表示,i的行动的行动集合集合Ai=ai,如上例:,如上例:A1=A2=开发,不开发开发,不开发,又如古诺模型,行动是选择,又如古诺模型,行动是选择产量产量qi,则,则Ai=qi | qi 0 (3)信息(信息(information):i有关博弈的知识(特别是有关博弈的知识(特别是“自然自然”选择,对手选择,对手的特征和行动知识)的特征和

7、行动知识) (4)战略(战略(strategy):战略是:战略是i在给定信息集在给定信息集h下的行动规则,它规定下的行动规则,它规定i在什在什么时候选择什么行动。即战略是么时候选择什么行动。即战略是i的的“相机行动方案相机行动方案”(contingent action plan)。)。 (5)支付(支付(pay off):特定战略组合下参与人得到的确定效用水平,或期:特定战略组合下参与人得到的确定效用水平,或期望效用水平。望效用水平。 (6)结果()结果(outcome):均衡战略组合,均衡行动组合,均衡支付组合。如):均衡战略组合,均衡行动组合,均衡支付组合。如例例2.2.1战略组合(高,战

8、略组合(高,开发,开发开发,开发,开发),开发),行动组合(高,开发,开发),行动组合(高,开发,开发),支付组合(支付组合(uA,uB)=(4000,4000)。)。 (7)均衡(均衡(equilbrium) (2 2)行动()行动(actions or moves) 行动组合(行动组合(action profile):):N个参与人的行动组成的有序集:个参与人的行动组成的有序集:a=(aa=(a1 1,a a2 2,a ai i,a an n) ),a ai i为第为第i i个参与人的行动。个参与人的行动。 如上例共有四个行动组合:(开发,开发),(开发,不开发),如上例共有四个行动组合:

9、(开发,开发),(开发,不开发),(不开发,开发)和(不开发,不开发)(不开发,开发)和(不开发,不开发) 行动的顺序(行动的顺序(the order of movesthe order of moves):):谁在什么时候行动。谁在什么时候行动。 如例如例2.1 1自然先行动选择(高需求或低需求),然后参与人行动,自然先行动选择(高需求或低需求),然后参与人行动,A A、B B同时行动或同时行动或A A先行动先行动B B后行动或后行动或B B先行动先行动A A后行动。后行动。行动空间(行动空间(action setaction set):):在每次行动时,参与人有些什么选择。在每次行动时,参

10、与人有些什么选择。 共同知识(共同知识(CommomCommom Knowledge Knowledge):如果某一信息是所有参与人都如果某一信息是所有参与人都知道的,如果每个参与人都知道所有参与人知道这一信息,如果每个知道的,如果每个参与人都知道所有参与人知道这一信息,如果每个参与人都知道所有参与人知道所有参与人知道这一信息,且如此这般参与人都知道所有参与人知道所有参与人知道这一信息,且如此这般直至无穷,那么这一信息便称为共同知识。直至无穷,那么这一信息便称为共同知识。 在博弈论中,一般假定参与人的行动空间、行动顺序是任一参与在博弈论中,一般假定参与人的行动空间、行动顺序是任一参与人的共同知

11、识。人的共同知识。 (3 3)信息)信息(information) 扩展式和博弈树:描述一个博弈的另外两种办法是扩展式和博弈树:描述一个博弈的另外两种办法是扩展式与博弈树(见图扩展式与博弈树(见图2.1) A开发开发不开发不开发开发开发开发开发开发开发开发开发不开发不开发不开发不开发不开发不开发不开发不开发NNBBBB大大大大小小小小(1/2)(1/2) (1/2)(1/2)(4,4)(8,0) (-3,-3)(1,0) (0,8) (0,0) (0,1)(0,0) 图图2.1 房地产开发博弈房地产开发博弈I (3 3)信息)信息(information) 结(结(node):):i或或N采取

12、行动的时点(决策结),或者采取行动的时点(决策结),或者博弈结束的时点。博弈结束的时点。 结结x的后续结(的后续结(successor):):已经到达已经到达x之后才有可能之后才有可能在随后的博弈中到达的结,并定义在随后的博弈中到达的结,并定义T(x)为为x之后的所有结之后的所有结的集合,的集合,t(x)为为x的直接后续结。的直接后续结。 结结x的前列结(的前列结(predecessor):):可能到达可能到达x之前必须到之前必须到达的结,并定义达的结,并定义P(x)为为x之前的所有结的集合,之前的所有结的集合,p(x)为为x的的直接前列结。直接前列结。 起始结(起始结(starting no

13、de):):不存在前列结的结,即不存在前列结的结,即P(x)= 终点结(终点结(end node)或终点()或终点(end point):):不存在后不存在后续结,即续结,即T(x)= 枝(枝(branch):):一个特定结上某一参与人的行动集中一个特定结上某一参与人的行动集中的一个行动,即从一个决策结到它的直接后续结的连线。的一个行动,即从一个决策结到它的直接后续结的连线。 路径(路径(path):):起始结到终点结中由结和枝所组成的起始结到终点结中由结和枝所组成的系列。系列。 扩展扩展式(式(extensive form) 扩展式(扩展式(extensive form)是对博弈的一种描)是

14、对博弈的一种描述,它由下述几点组成:述,它由下述几点组成: 由结和枝所组成的整体结构,即由单个起由结和枝所组成的整体结构,即由单个起始结开始直至终点结,中间无闭合的圈(见教材始结开始直至终点结,中间无闭合的圈(见教材P139.图图2.2)。)。 有对哪个结点属于哪个参与人的说明。有对哪个结点属于哪个参与人的说明。 在自然作选择的结上,有自然选择不同枝在自然作选择的结上,有自然选择不同枝的概率。的概率。 有划分每个参与人的结的信息集。有划分每个参与人的结的信息集。 在每一个终点结上都有对每一个参与人的在每一个终点结上都有对每一个参与人的支付。支付。 博弈树(博弈树(game tree) 博弈树(

15、博弈树(game tree)除)除以外与扩展式都一样。在博弈树中,以外与扩展式都一样。在博弈树中,扩展式中的扩展式中的点变为:点变为:5在每一个终点结上都有结果。在每一个终点结上都有结果。 “博弈树博弈树”是一个比是一个比“扩展式扩展式”更为灵活的术语,如果结果更为灵活的术语,如果结果被定义为支付组合,则两者并无差别。被定义为支付组合,则两者并无差别。 信息集(信息集(information set):):描述描述i信息特征(博弈树上的信息特征(博弈树上的所有决策结分割成不同的信息集。每个信息集是决策结集合的一所有决策结分割成不同的信息集。每个信息集是决策结集合的一个子集),该子集包括所有满足

16、下列条件的决策结:个子集),该子集包括所有满足下列条件的决策结: a、每一个决策结都是同一参与人、每一个决策结都是同一参与人i的决策结;的决策结; b、i知道博弈进入该集合的某个决策结,但不知道自己究竟知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结(见教材,处于哪一个决策结(见教材,P141)。如房地产开发博弈)。如房地产开发博弈I(见(见图图2.1):):A信息集为信息集为大,小大,小,B的信息集为的信息集为大大或或小小。 完美信息(完美信息(perfect information):):i对任一对手及对任一对手及N的行的行动有准确了解,每个信息集都是单结的。(完美信息博弈

17、:博弈动有准确了解,每个信息集都是单结的。(完美信息博弈:博弈中没有任何两个参与人同时行动并且所有后行动者确切地知道前中没有任何两个参与人同时行动并且所有后行动者确切地知道前行动者选择了什么行动,所有参与人观察到自然的行动)。行动者选择了什么行动,所有参与人观察到自然的行动)。 信信 息息 种种 类类 信息种类信息种类 含含 义义 完美(完美(perfect) 每个信息集都是单结的每个信息集都是单结的 确定(确定(certain) 自然不在任一参与人行动之后行动自然不在任一参与人行动之后行动 对称(对称(symetric) 没有参与人在行动时或在终点结处有与其没有参与人在行动时或在终点结处有与

18、其他参与人不同的信息他参与人不同的信息 完全(完全(complete) 自然不首先行动或它的最初行动被每个参自然不首先行动或它的最初行动被每个参与人所观察到与人所观察到 完美与不完美信息划分完美与不完美信息划分 确定性与不确定性划分确定性与不确定性划分 对称信息与不对称信息划分对称信息与不对称信息划分 完全信息与不完全信息划分完全信息与不完全信息划分完美与不完美信息划分完美与不完美信息划分 完美与不完美信息划分:在完美信息博弈中,每个信息集都完美与不完美信息划分:在完美信息博弈中,每个信息集都是单结的,否则该博弈就是不完美信息博弈。是单结的,否则该博弈就是不完美信息博弈。 按张维迎的教科书如图

19、按张维迎的教科书如图2.1博弈等价于图博弈等价于图2.2博弈:博弈: Na1a2b1b2b3b4大大小小(1/2) (1/2)开发开发开发开发开发开发开发开发开发开发开发开发不开发不开发不开发不开发不开发不开发不开发不开发不开发不开发不开发不开发(4,4)(8,0)(0,8) (0,0) (-3, 3)(1,0)(0,1)(0,0)图图2.2 房地产开发博弈房地产开发博弈II 信息集信息集 A:a1,a2 B:b1,b2,b3,b4 因因A信息集不是单点集,故上述博弈是不完美博弈。信息集不是单点集,故上述博弈是不完美博弈。 确定性与不确定性划分确定性与不确定性划分 确定性与不确定性划分:在任一

20、参与人确定性与不确定性划分:在任一参与人行动之后,就再没有自然的行动了。否则这行动之后,就再没有自然的行动了。否则这一博弈为不确定性博弈。(按艾里克一博弈为不确定性博弈。(按艾里克拉斯缪拉斯缪森的理解:图森的理解:图2.2为确定性博弈,而图为确定性博弈,而图2.1为不为不确定性博弈)确定性博弈) 对称信息与不对称信息划分对称信息与不对称信息划分 对称信息与不对称信息划分:在对称信息博弈中,任一参对称信息与不对称信息划分:在对称信息博弈中,任一参与人在任何他应选择行动的结点或者终点结处的信息集,都至少与人在任何他应选择行动的结点或者终点结处的信息集,都至少包含与其他每个参与人的信息集相同的元素。

21、否则,该博弈就是包含与其他每个参与人的信息集相同的元素。否则,该博弈就是不对称信息博弈。(如图不对称信息博弈。(如图2.1、2.2博弈均为不对称信息,博弈均为不对称信息,B知道知道N及及A的行动,而的行动,而A不知道不知道B及及N的行动)。的行动)。 不对称信息的实质在于某一参与人拥有的私人信息不对称信息的实质在于某一参与人拥有的私人信息(Private information),即一种不同于且不劣于其他任何参与),即一种不同于且不劣于其他任何参与人的信息分割。对称信息博弈中既可以有自然的行动,也可以有人的信息分割。对称信息博弈中既可以有自然的行动,也可以有同时行动,但是没有一个参与人有哪怕一

22、点点信息优势。不对称同时行动,但是没有一个参与人有哪怕一点点信息优势。不对称信息一定是不完美信息。信息一定是不完美信息。 完全信息与不完全信息划分完全信息与不完全信息划分 完全信息与不完全信息划分:在不完全信息博弈中,自然首完全信息与不完全信息划分:在不完全信息博弈中,自然首先行动且它的行动至少对某一参与人来说是不可观测的,否则,先行动且它的行动至少对某一参与人来说是不可观测的,否则,该博弈就是一个完全信息博弈。该博弈就是一个完全信息博弈。 一个具有不完全信息的博弈一定是不完美信息博弈,因为某一个具有不完全信息的博弈一定是不完美信息博弈,因为某个参与人的信息集必然包含有多于一个的结点。有两种博

23、弈是具个参与人的信息集必然包含有多于一个的结点。有两种博弈是具有完全但不完美信息的有完全但不完美信息的同时行动的博弈,自然在博弈的后期同时行动的博弈,自然在博弈的后期才行动且这一行动并非所有参与人知晓的博弈。才行动且这一行动并非所有参与人知晓的博弈。 许多不完全信息博弈都是不对称信息博弈,但这两个概念并许多不完全信息博弈都是不对称信息博弈,但这两个概念并不等价。不等价。 不对称但完全信息的博弈:不对称但完全信息的博弈: 在房地产开发博弈中,若不存在自然的首先行动,但房地产在房地产开发博弈中,若不存在自然的首先行动,但房地产商商A采取了不为采取了不为B所知的行动且房地产商所知的行动且房地产商A在

24、随后的博弈又行动在随后的博弈又行动了,则这一博弈具有不对称但完全的信息。了,则这一博弈具有不对称但完全的信息。 不完全但对称信息的博弈:让自然首先行动,且这一行动是不完全但对称信息的博弈:让自然首先行动,且这一行动是任一囚徒都观察不到的,自然让囚徒困境中(坦白,坦白)的支任一囚徒都观察不到的,自然让囚徒困境中(坦白,坦白)的支付选择为(付选择为(-8,-8)或者()或者(-100,-100)。)。 信信 息息 种种 类类 例例2.2、信息分类的扑克牌;在下面的扑克牌博弈中,参、信息分类的扑克牌;在下面的扑克牌博弈中,参与人赌最后谁能摸到最好的牌,摸牌的顺序是事先定好的。与人赌最后谁能摸到最好的

25、牌,摸牌的顺序是事先定好的。如何分类在下注之前的下述行为规则如何分类在下注之前的下述行为规则 : 所有的牌都被洗成面朝上。所有的牌都被洗成面朝上。 所有的牌都被洗成面朝下且参与人在下注前甚至不能所有的牌都被洗成面朝下且参与人在下注前甚至不能看自己的牌。看自己的牌。 所有的牌都被洗成面朝下且参与人只能看他自己的牌。所有的牌都被洗成面朝下且参与人只能看他自己的牌。 所有的牌都被洗成面朝上,但每个参与人随后都可以所有的牌都被洗成面朝上,但每个参与人随后都可以用手护住并悄悄丢掉一张牌。用手护住并悄悄丢掉一张牌。 所有的牌都被洗成面朝上,接着参与人下注,然后每所有的牌都被洗成面朝上,接着参与人下注,然后

26、每个参与人再得到一张面朝上的牌。个参与人再得到一张面朝上的牌。 所有的牌都被洗成面朝下,但随后每个参与人都抓起所有的牌都被洗成面朝下,但随后每个参与人都抓起他的牌但并不看牌,接着把牌举过头顶以使所有其他参与人他的牌但并不看牌,接着把牌举过头顶以使所有其他参与人都能看清他的牌(印第安扑克)。都能看清他的牌(印第安扑克)。 (4 4)战略()战略(strategy) 战略集(战略集(strategy set)或战略空间()或战略空间(strategy space):):Si= si , si为为i的的一个特定战略。一个特定战略。 战略组合(战略组合(strategy profile):):s=(s

27、1,s2,si,sn) 在例在例2.1中:若中:若B在不知市场需求的情况下先行动,在不知市场需求的情况下先行动,A在得知在得知B行动后再行动后再选择自己行动,则选择自己行动,则B有两个战略有两个战略SB=si|i=1,2;s1为开发,为开发,s2为不开发为不开发,但,但A有四个战略有四个战略: SA=开发,开发开发,开发 ,开发,不开发开发,不开发 ,不开发,开发不开发,开发 ,不开发,不开发不开发,不开发 , D:开发ND:不开发D|D,D|ND,D|D,ND|ND,ND|D,D|ND,ND|D, ND|ND S=(ND|D,D|ND,D)=(不开发,开发不开发,开发,开发)是一个战,开发)

28、是一个战略组合,表为房地产商略组合,表为房地产商A选战略选战略不开发,开发不开发,开发,而房地产商,而房地产商B选开发选开发战略。战略。 注注1:战略与行动是两个不同概念:战略是行动规则而不是行动:战略与行动是两个不同概念:战略是行动规则而不是行动本身。因战略依赖于信息,但在静态中没有信息存在或信息不起作用,本身。因战略依赖于信息,但在静态中没有信息存在或信息不起作用,战略选择就简单变为行动选择。战略选择就简单变为行动选择。 注注2:战略是一种行动规则(规定什么时候才进行行动选择)。:战略是一种行动规则(规定什么时候才进行行动选择)。 战略必须是完备的(即战略要给出参与人在每一种可想象到的情战

29、略必须是完备的(即战略要给出参与人在每一种可想象到的情况下的行动选择,既使参与人并不预期这种情况会实际发生)。况下的行动选择,既使参与人并不预期这种情况会实际发生)。 毛泽东:毛泽东:“人不犯我,我不犯人(行动),人若犯我,我必犯人人不犯我,我不犯人(行动),人若犯我,我必犯人(行动)(行动)” 战略。战略。 (5)支付()支付(pay off) ui= ui(s1,s2,sn)它依赖于每一个)它依赖于每一个i的战略选择。的战略选择。 如例如例2.1: uA(高,开发,开发)(高,开发,开发)=uB(高,开发,开发)(高,开发,开发)=4000(千万元);(千万元); uA(低,开发,不开发)

30、(低,开发,不开发)=1000(千万元);(千万元); 若若A认为自然选择高需求的概率为认为自然选择高需求的概率为0.5,给定,给定B选择开发,则选择开发,则A选择选择 开发的期望效用为:开发的期望效用为: EuA(开发,开发)(开发,开发)=0.54000+0.5(- 3000)=500(千万元);(千万元); EuA(开发,不开发)(开发,不开发)=0.58000+0.51000=4500(千万元)。(千万元)。 若若A认为认为B选择开发的概率为选择开发的概率为x,A选择开发的期望效用为:选择开发的期望效用为: EuA(开发)(开发)= xEuA(开发,开发)(开发,开发)+(1- x)E

31、uA(开发,不开发)(开发,不开发) =500 x+(1- x)4500=4500- 4000 x 第第i个参与人的支付个参与人的支付u=(u1,u2,ui,un)(7)均衡()均衡(equilbrium) 均衡均衡s*=(s1*,si* sn*)是指由博弈中的是指由博弈中的n个参与人每人选个参与人每人选取的最佳战略所组成的一个战略组合。取的最佳战略所组成的一个战略组合。 均衡战略(均衡战略(equilibrium strategies)是指)是指i最大化自身的支付时最大化自身的支付时所选取的策略。所选取的策略。 均衡概念(均衡概念(equilibrium concept)或解的概念()或解的

32、概念(solution concept)G:S1,Sn ;u1,un s*是一个定义基于可能策是一个定义基于可能策略组合与支付函数之上的均衡规则。略组合与支付函数之上的均衡规则。 注注1:si*是是i在均衡情况下的最优战略,即它是在均衡情况下的最优战略,即它是i的所有可能战略的所有可能战略中使中使ui或或Eui最大化的战略。最大化的战略。 注注2:si*通常依赖于其它参与人通常依赖于其它参与人j(或(或- -i)的战略选择,令)的战略选择,令s- -i=(s1,si- -1,si+1,sn)则)则si*是给定是给定s- -i情况下情况下i的最优战略。的最优战略。 ui(s*i,s-i)ui(s

33、i,s-i), 注注3:一个博弈中可能有多个均衡:如例:一个博弈中可能有多个均衡:如例2.1中低需求时,中低需求时,(开发,不开发),(不开发,开发)均为均衡。缺乏唯一性是博(开发,不开发),(不开发,开发)均为均衡。缺乏唯一性是博弈论存在的一个困难问题。弈论存在的一个困难问题。 注注4:博弈论中的均衡:博弈论中的均衡一般均衡模型中的均衡,即博弈均衡与一般均衡模型中的均衡,即博弈均衡与价格均衡的理解是不同的,在一般均衡模型中,均衡指由经济中每价格均衡的理解是不同的,在一般均衡模型中,均衡指由经济中每个人的最优行为所导致的一组价格。但在博弈论中,这样一组价格个人的最优行为所导致的一组价格。但在博

34、弈论中,这样一组价格被称之为均衡结果,而博弈均衡指的则是产生这一结果的策略组合,被称之为均衡结果,而博弈均衡指的则是产生这一结果的策略组合,即每个人如何买卖才能达到最优的规则。即每个人如何买卖才能达到最优的规则。*iiss(7)均衡()均衡(equilbrium) 标准式也称战略式博弈,其表述为:标准式也称战略式博弈,其表述为:(1)博弈的参与人集合:)博弈的参与人集合:i,=(1,2,n)(2) 的战略空间:的战略空间:Si,i=1,2,n (3) 的支付函数:的支付函数:ui(s1,s2,si,sn),i=1,2,n 常用常用G=S1,S2,Sn;u1,u2,un表示。表示。如如Courn

35、ot模型为:模型为:G=q10,q20;1( (q1,q2) ),2( (q1,q2) )。注注1:有限博弈:有限博弈:n有限;有限;Si=si有限个。有限个。注注2:同时行动这仅是一个信息概念而非日历概念。:同时行动这仅是一个信息概念而非日历概念。注注3:博弈分析的目的是预测博弈的均衡结果。:博弈分析的目的是预测博弈的均衡结果。注注4: 为理性,且为理性,且 是的共同知识。是的共同知识。iiii占优战略均衡占优战略均衡(Dominant Strategy, DSE) 不论对手选择什么战略,参与人不论对手选择什么战略,参与人i的最优战略是唯一的,即它的最的最优战略是唯一的,即它的最优战略与其他

36、参与人的战略选择无关。优战略与其他参与人的战略选择无关。 定义定义2.1令令s- -i=(s1,s2,si- -1,si+ +1,sn),称,称si*为参与人(严为参与人(严格)占优战略,若格)占优战略,若 均成立。并称均成立。并称s*=(s1*,s2*,sn*)为占优战略均衡(为占优战略均衡(DSE)。)。 如例如例2.1中,当高需求时,房地产开发商的(开发,开发)是占优中,当高需求时,房地产开发商的(开发,开发)是占优战略均衡。战略均衡。 因对开发商因对开发商A(或或B)来说,不管来说,不管B(或或A)选择开发战略与否,均有:选择开发战略与否,均有:*(,)(,),iiiiiiiiiu s

37、 su sssss40000,80000AB 开发不开发选开发一定也选开发 反之亦然。注注1:DSE要求要求 是理性的,但不要求是理性的,但不要求 知道其他参与人是理性的,知道其他参与人是理性的,即不要求理性为共同知识。即不要求理性为共同知识。 ii重复剔除占优均衡重复剔除占优均衡(Iterated Elimination of strictly Dominanted Strategies,IEDE) 0 , 09 , -14 , 45 , 1按按按按等待等待 等待等待 小猪小猪 大猪大猪 12 ,则等待对小猪来说是占优战略,基于这,则等待对小猪来说是占优战略,基于这一信息,大猪(理性的)认为

38、有理性的小猪会选择一信息,大猪(理性的)认为有理性的小猪会选择“等等待待”。在这样前提下,大猪最优选择为。在这样前提下,大猪最优选择为“按按”。于是,。于是,(按(按 ,等待)是这个博弈的唯一均衡,即,等待)是这个博弈的唯一均衡,即IEDE。 4101 等待按因为 定义定义2.2 设设si,siSi且成立且成立 ;则称;则称si 严格劣于战略严格劣于战略si (而(而si 相对相对于于si 为占优战略)。重复剔除的占优均为占优战略)。重复剔除的占优均衡(衡(IEDE):称经过若干次重复剔除劣战略后剩下的唯一战略组合。):称经过若干次重复剔除劣战略后剩下的唯一战略组合。若它存在(即可解的),则称

39、若它存在(即可解的),则称s*=(s1*,s2*,sn*)为为IEDE。 以第一章智猪博弈模型(例以第一章智猪博弈模型(例3)为例:)为例:(,)(,),iiiiiiiu ssu sss重复剔除占优均衡重复剔除占优均衡(Iterated Elimination of strictly Dominanted Strategies,IEDE) 例例2.2 参与人参与人B L M R2 , 10 , 10 , 30 , 11 , 21 , 0UD参与人参与人A1(MR)2 (UD) 当参与人当参与人A选选U时,由于时,由于20,则(,则(U, M)是剩下的唯一战略,即)是剩下的唯一战略,即IEDE。

40、 问题问题1、均衡结果是否与劣战略剔除顺序有关?、均衡结果是否与劣战略剔除顺序有关? 无关,若剔除为严格劣战略。无关,若剔除为严格劣战略。 结论结论1、均衡结果与剔除顺序、均衡结果与剔除顺序 可能有关,若剔除为非严格劣战略。可能有关,若剔除为非严格劣战略。重复剔除占优均衡重复剔除占优均衡(Iterated Elimination of strictl Dominanted Strategies,IEDE) 例例2.3 B c1 c2 c3 0 , 130 , 100 , 120 , 110 , 100 , 121 , 121 , 102 , 12r1r2r3A第一种剔除顺序为:第一种剔除顺序为

41、: r1 c1 c1 r1 =( r1, c1) r3 c3 c2 r2第二种剔除顺序为:第二种剔除顺序为: c1 r1 c3 r1 =( r1, c3) c2 r2 c1 r3 故这个博弈有两个重复剔除占优均衡(故这个博弈有两个重复剔除占优均衡(r1, c1)和()和( r1, c3)。)。 注意注意1:重复剔除的占优均衡要求参与人是理性且理性是参:重复剔除的占优均衡要求参与人是理性且理性是参与人的共同知识。与人的共同知识。 注意注意2:一般情况重复剔除的占优均衡是一个合理的预测,:一般情况重复剔除的占优均衡是一个合理的预测,但也有例外的情况。但也有例外的情况。重复剔除占优均衡重复剔除占优均

42、衡(Iterated Elimination of strictl Dominanted Strategies,IEDE) 因为因为LR=UD得(得(U,L)为)为IEDE。 若参与人若参与人B有有1/1000的概率选的概率选R,尽管这一概率非常小,但在这,尽管这一概率非常小,但在这种情况下,种情况下,参与人参与人A的期望效用为:的期望效用为: 选选U 选选D 8 (999/1000)+(-1000)/1000 7 (999/1000)+6/1000 即即A选选U的期望效用小于选的期望效用小于选D的期望效用,故当参与人的期望效用,故当参与人B选选R的概的概率不低于率不低于1/1000时,则参与

43、人时,则参与人A将会选将会选D而不选而不选U,即(,即(D,L)优于)优于(U,R)。 例例2.4 参与人参与人 B L RUD A6 , 57 , 6-1000, 98 , 10参与人参与人纳纳 什什 均均 衡衡(Nash Equilibrium,NE or PNE) 其其NE为:(开发,不开发)或(不开发,开发)。为:(开发,不开发)或(不开发,开发)。定义定义2.3 当当si*(i= 1,2,n)对给定)对给定s-i*=(s1*,s2*,si-1*,si+1*,sn*) 满足:满足:ui(si*,s-i*)ui(si,s-i*), si Si 即即si*argmax ui(s1* ,si

44、-1*, si,si+1*,sn*),i=1,2,n则称则称s*=(s1* , s2*,si*,sn*)是一个纳什均衡(是一个纳什均衡(NE)。)。如在博弈:如在博弈: 0 , 00 , 10001000 , 0-3000, -3000A开发开发不开发不开发开发开发不开发不开发低需求低需求B纳纳 什什 均均 衡衡(Nash Equilibrium,NE or PNE) DSEPNE不同均衡概念之间的关系不同均衡概念之间的关系 MNEPNEIEDEDSE本章重点讨论本章重点讨论 一、博弈论的若干基本概念一、博弈论的若干基本概念 占优战略均衡(占优战略均衡(Dominant strategy eq

45、uilibriumDominant strategy equilibrium,DSEDSE) 重复剔除占优均衡(重复剔除占优均衡(Iterated dominance equilibrium,IEDEIterated dominance equilibrium,IEDE) 纳什均衡纳什均衡(Pure Nash equilibriumPure Nash equilibrium,PNEPNE) 混合战略纳什均衡(混合战略纳什均衡(Mixed strategy Nash equilibrium,MNEMixed strategy Nash equilibrium,MNE)二、纳什均衡应用模型举例二、

46、纳什均衡应用模型举例 古诺(古诺(Cournot)寡头竞争模型()寡头竞争模型(1838) 伯川德悖论(伯川德悖论(Bertand Paradox,1883) 豪泰林(豪泰林(Hotelling)价格竞争模型()价格竞争模型(1929) 公共品供给(公共品供给(Hardin,1968)、需求模型)、需求模型 基础设施建设:中央政府和地方政府之间的博弈基础设施建设:中央政府和地方政府之间的博弈三、纳什均衡的存在性和多重性的讨论三、纳什均衡的存在性和多重性的讨论 博弈:参与人博弈:参与人 寻找最优目标(寻找最优目标(MaxMax)支付)支付 静态时:策略与行动一致,因为没有任何可能影响参与人行动选

47、择的静态时:策略与行动一致,因为没有任何可能影响参与人行动选择的 信息被披露出来。信息被披露出来。 选择行动 战略二、纳什均衡应用举例二、纳什均衡应用举例 1、Cournot寡头竞争模型(寡头竞争模型(1838) 纳什均衡(纳什均衡(1950) 2、豪泰林、豪泰林(Hotelling)价格竞争模型价格竞争模型 3、公共地的悲剧公共地的悲剧(Tragedy of the commons) 4、公共物品的私人自愿供给公共物品的私人自愿供给 5、基础设施建设:中央政府和地方政府之间的博弈、基础设施建设:中央政府和地方政府之间的博弈假定有两企业(假定有两企业(i =1,2),战略为选择产量,支付是利润

48、且战略为选择产量,支付是利润且需求函数:需求函数:p=p(q1+q2),qi 0,+)为第)为第i企业产量企业产量成本函数:成本函数:ci=ci(qi)利润函数:利润函数:i(q1,q2)=qip(q1+q2)ci(qi),i=1,2企业目标:企业目标:Maxi (i=1,2)求纳什均衡产量(求纳什均衡产量(q1*, q2*)应满足:)应满足:q1*argmax1(q1, q2*)= q1p(q1+ q2*) c1(q1)q2*argmax2(q1*,q2) = q2p(q1*+ q2) c2(q2)1、Cournot寡头竞争模型(寡头竞争模型(1838) 纳什均衡(纳什均衡(1950)1、C

49、ournot寡头竞争模型(寡头竞争模型(1838) 纳什均衡(纳什均衡(1950)解一:纳什均衡求解,即若存在,其一阶导数为零:解一:纳什均衡求解,即若存在,其一阶导数为零:112112121()()()0(1)p qqq p qqcqq212212222()()()0(2)p qqq p qqcqq由式由式(1)、(2)可见,可见, 当求企业当求企业1的最大利润产量的最大利润产量q1*时它完全由企业时它完全由企业2的产量的产量q2的的取值决定。取值决定。 当求企业当求企业2的最大利润产量的最大利润产量q2*时它完全由企业时它完全由企业1的产量的产量q1的的取值决定。取值决定。故由式故由式(1

50、)和式和式(2)可定义下述两个反应函数:可定义下述两个反应函数: q1*=R1(q2) q1*是当企业是当企业2产量取产量取q2时企业时企业1的最大化利润时的最大化利润时的产量;的产量; q2*=R2(q1) q2*是当企业是当企业1产量取产量取q1时企业时企业2的最大化利润时的最大化利润时的产量。的产量。 当市场达到均衡时,厂商都不再变动产量,这意味着两企当市场达到均衡时,厂商都不再变动产量,这意味着两企业的产量引起对方的反应是相容的。换成博弈语言,即当业的产量引起对方的反应是相容的。换成博弈语言,即当q2*满满足足q1*=R1(q2*)时,两企业均不再变动产量(即均衡),均达到最时,两企业

51、均不再变动产量(即均衡),均达到最优,这时纳什均衡是(优,这时纳什均衡是(q1*, q2*),即),即 q1*=R1(q2) 的解。的解。 q2*= R2(q1)1、Cournot寡头竞争模型(寡头竞争模型(1838) 纳什均衡(纳什均衡(1950)联解式联解式(3)、(4)易得:易得:12( ),()iiic qcq paqq如令1121121222()0(3)()0(4)aqqqcqaqqqcq则得*121122*222111211()()()3211()()(,)() ,1,22921211(),()()()()33333iiqqacqR qaqcqR qaqcq qacipaacac

52、acacacac 1、Cournot寡头竞争模型(寡头竞争模型(1838) 纳什均衡(纳什均衡(1950)结论:垄断企业的利润大于寡头竞争企业的利润。结论:垄断企业的利润大于寡头竞争企业的利润。NEa- -c(a- -c)/2q2*q2q2q1*q1(a- -c)/2a- -cq2q1q1*=R1(q2)q2*=R2(q1)01、Cournot寡头竞争模型(寡头竞争模型(1838) 纳什均衡(纳什均衡(1950)若上例,若市场由(两企业构成的统一垄断企业控制)若上例,若市场由(两企业构成的统一垄断企业控制)1212112212121212121212() () ()()()()()()()()

53、()()Maxqqp qqc qc qqqaqqc qqqqaqqc qqQ aQcQqqQ其模型为:这里垄断企业利润最大化条件垄断企业利润最大化条件MR=MC 121212*12()2()2()22()32paqqARMRaqqaQd qqcMCcdQMRMCaQcacQqqac又已知即2*2*12()()()2()()()()()2222249McMcacacacacacacacacQQ从而得:即且 这表明寡头竞争总产量大于垄断产量从而下降了各自的这表明寡头竞争总产量大于垄断产量从而下降了各自的寡头利润,这是典型的囚徒困境问题。寡头利润,这是典型的囚徒困境问题。 1、Cournot寡头竞争

54、模型(寡头竞争模型(1838) 纳什均衡(纳什均衡(1950)解二:解二: 使用重复剔除严格劣战略的方法找出均衡解。使用重复剔除严格劣战略的方法找出均衡解。NE(q1*,q2*)q23R1(q2)= q1*R2(q1) =q2*0q22q1mq1q13abcdeq21、Cournot寡头竞争模型(寡头竞争模型(1838) 纳什均衡(纳什均衡(1950) 第一轮剔除:因为企业第一轮剔除:因为企业1的最大产量不超过的最大产量不超过q1m 企业企业2产产量不低于量不低于q22(企业企业1在在q1(q1m,)严格劣于严格劣于0,q1m,这表明企业不,这表明企业不会选择大于垄断产量会选择大于垄断产量q1

55、m,即由,即由R1第一步剔除第一步剔除a区域;而当企业区域;而当企业1的的产量不超过产量不超过q1m,则由,则由R2,企业,企业2产量不低于产量不低于q22,即:,即: 由由R2第二步剔除第二步剔除b区域;区域; 由由R1第三步剔除第三步剔除c区域;区域; 由由R2第四步剔除第四步剔除d区域;区域; 由由R1第五步剔除第五步剔除e区域;区域; 最终可得唯一均衡最终可得唯一均衡NE(q1*,q2*)。 ) 重复剔除劣战略可解的条件:重复剔除劣战略可解的条件: 利润函数是严格凹的利润函数是严格凹的(i MC,企业每增加一单位产出增加的利润为,企业每增加一单位产出增加的利润为p- -MC0;因此每一

56、同;因此每一同质厂商当质厂商当p高于高于MC时均有动机通过降价来增加市场份额,这种竞争时均有动机通过降价来增加市场份额,这种竞争的结果最终是的结果最终是pMC, =0。 悖论之解:产品非同质,即有差异性(产品本身的差异或提供服悖论之解:产品非同质,即有差异性(产品本身的差异或提供服务的差异)。务的差异)。 Hotelling模型(模型(1929):考察产品物质性能相同但市场空间位):考察产品物质性能相同但市场空间位置上有差异。置上有差异。2、豪泰林(、豪泰林(Hotelling)价格竞争模型)价格竞争模型 消费者均衡分布在消费者均衡分布在0,1上,需求函数为上,需求函数为Di(p1,p2) 单

57、位产品成本为单位产品成本为c,价格为价格为pi(i=1,2) 旅行成本,即单位距离旅行成本,即单位距离t 产品物质性能相同(若不考虑旅行成本时,消产品物质性能相同(若不考虑旅行成本时,消费者在两商店买就无差异,即存在旅行成本是其差费者在两商店买就无差异,即存在旅行成本是其差异所在)异所在) 消费者具有单位需求(消费消费者具有单位需求(消费1个或个或0个)个) 0 x1商店商店1商店商店2假定假定2、豪泰林、豪泰林(Hotelling)价格竞争模型价格竞争模型 依据上述假定,可进一步假设依据上述假定,可进一步假设x左边消费者购买商店左边消费者购买商店1,x右边消右边消费者购买商店费者购买商店2。

58、即即 D1= x,D2=1x (1)方程方程(1)中的中的x应满足:在两商店购买成本相同,即应满足:在两商店购买成本相同,即ttppxxtptxp2)1 (12212111212212(,)2(,)12pptD p pxtpptDp pxt 从而得:1121112121212221221212121(,)()(,)()()21(,)()(,)()()200p ppc D p ppcppttp ppc Dp ppcppttpp利润函数分别为:利润最大化的一阶条件:,21122020pctppctp 得方程(2)*1212,(0)2tppct得:价格不等于边际成本,利润大于2、豪泰林、豪泰林(Ho

59、telling)价格竞争模型价格竞争模型 条件:条件: 要求要求a0,b0,1- -a- -b0(即即1- -ba) 旅行成本为旅行成本为td2,这里,这里d是消费者到商是消费者到商店的距离店的距离这里仍有这里仍有 D1=x,D2=1- -x,但这里,但这里 x应满足:应满足:更一般情况更一般情况aba1- -b0 x1商店商店1商店商店2若商店位置为:若商店位置为:2212()(1)(3)pt xapt xb222212122111 2(2)2(1)(1) 2 (1)(12 )(1)( 1)(1)22 (1)apt xaxapt xbxbpptab xabaabtppabxatab商店 左边

60、个消费者商店 、之间消需求对价格费者各占一半差异的敏感性解方程(3):2、豪泰林、豪泰林(Hotelling)价格竞争模型价格竞争模型 当当a=b=0 (即两商店在两个端点处即两商店在两个端点处),得:,得:21112122121(,)22 (1)1(,)122 (1)11(1)22ppabD p pxatabppabDp pxbtabababab 故得:111222(),()pc Dpc D求:12120,0pp由,可求得纳什均衡为:*1*2()( ,1)(1)13()( ,1)(1)13abp abctabbap abctab*12(0,1)(0,1)()ppct 即上述分析的模型是一般模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论