第2章 完全信息动态博弈(博弈论吉本斯)_第1页
第2章 完全信息动态博弈(博弈论吉本斯)_第2页
第2章 完全信息动态博弈(博弈论吉本斯)_第3页
第2章 完全信息动态博弈(博弈论吉本斯)_第4页
第2章 完全信息动态博弈(博弈论吉本斯)_第5页
已阅读5页,还剩120页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Gametheory-Chapter2,1,DynamicGamesofCompleteInformation,Subgame-PerfectNashEquilibrium,Gametheory-Chapter2,2,Outlineofdynamicgamesofcompleteinformation,DynamicgamesofcompleteinformationExtensive-formrepresentationDynamicgamesofcompleteandperfectinformationGametreeSubgame-perfectNashequilibriumBackwa

2、rdinductionApplicationsDynamicgamesofcompleteandimperfectinformationMoreapplicationsRepeatedgames,Gametheory-Chapter2,3,Entrygame,一个在位的垄断者面临一个挑战者可能的进入.challenger可能选择enter或者stayout.如果challenger进入,那么incumbent可以选择accommodate或者tofight.收益是共同知识.,Challenger,In,Out,Incumbent,A,F,1,2,2,1,0,0,第一个数字是挑战者的收益.第二个

3、数字是在位者的收益.,Gametheory-Chapter2,4,Sequential-movematchingpennies,两个参与人各有一枚硬币.Player1先选择是显示Head还是Tail.在观察player1的选择之后,player2选择显示Head或Tail两个参与人都知道以下规则:如果两枚硬币一致(都是heads或都是tails)那么player2赢得player1的硬币.否则,player1赢得player2的硬币.,Player1,Player2,H,T,-1,1,1,-1,H,T,Player2,H,T,1,-1,-1,1,Gametheory-Chapter2,5,Dy

4、namic(orsequential-move)gamesofcompleteinformation,一个参与人集合谁先行动,可以采取什么行动?当参与人行动时他们知道什么?参与人的收益取决于他们的选择.所有这些都是参与人的共同知识.,Gametheory-Chapter2,6,Definition:extensive-formrepresentation,一个博弈的扩展式表述包括的要素:博弈中的参与人每个参与人在何时行动每次轮到某一参与人行动时,可供她选择的行动每次轮到某一参与人行动时,她所了解的信息每个参与人从她每个可选的行动组合中获得的收益,Gametheory-Chapter2,7,Dy

5、namicgamesofcompleteandperfectinformation,完美信息在选择下一次行动前可以观察到所有以前的行动.参与人做出决策前知道谁行动了,干了什么,Gametheory-Chapter2,8,Gametree,博弈树包括这样的节点(nodes)集合和边缘(edges)集合每个边缘连接两个节点(这两个节点应该是相连的)对任何节点组合来说,连接这两个节点的路径(path)是惟一的,x0,x1,x2,x3,x4,x5,x6,x7,x8,anode,anedgeconnectingnodesx1andx5,apathfromx0tox4,Gametheory-Chapter

6、2,9,Gametree,路径是不同节点y1,y2,y3,.,yn-1,yn的一个序列,其中对于i=1,2,.,n-1,yi和yi+1相邻.我们说这条路径是从y1到yn.我们也可以用这些节点推导出的边缘的序列来定义路径.路径的长度(length)是路径中包含的边缘的数量.例1:x0,x2,x3,x7是一条路径,长度为3.例2:x4,x1,x0,x2,x6是一条路径,长度为4.,x0,x1,x2,x3,x4,x5,x6,x7,x8,apathfromx0tox4,Gametheory-Chapter2,10,Gametree,博弈树中,博弈开始的节点x0被称为根(root)与x0相邻的节点是x0

7、的后续节(successors).x0的后续节点是x1,x2对任何两个相邻的节点来说,与根相连接的路径更长的那个节点是另一个节点的后续节.例3:x7是x3的后续节点,因为它们相邻,而且x7到x0的路径比x3到x0的路径更长,x0,x1,x2,x3,x4,x5,x6,x7,x8,Gametheory-Chapter2,11,Gametree,如果x是另一个节点y的后续节,那么y被称为x的前续节(predecessor).在博弈树中,根以外的任何节点都有惟一的前续节.没有后续节的所有节点被称为终点节(terminalnode),它是博弈可能的终点例4:x4,x5,x6,x7,x8都是终点节,x0,

8、x1,x2,x3,x4,x5,x6,x7,x8,Gametheory-Chapter2,12,Gametree,除终点节以外的任何节点都代表了某个参与人.对于终点节以外的任意节点来说,连接它和它的后续节的边缘代表了这个节点所代表的参与人可能采取的行动,Player1,Player2,H,T,-1,1,1,-1,H,T,Player2,H,T,1,-1,-1,1,Gametheory-Chapter2,13,Gametree,从根到一个终点节的路径代表了一个完全的行动序列,它决定了终点节的收益,Player1,Player2,H,T,-1,1,1,-1,H,T,Player2,H,T,1,-1,

9、-1,1,Gametheory-Chapter2,14,Strategy,参与人的一个策略是关于行动的一个完整计划.它明确了在参与人可能会遇到的每一种情况下对可行行动的选择.,Gametheory-Chapter2,15,Strategyandpayoff,在博弈树中,参与人的策略用边缘的集合(asetofedges)来表述出来.每个参与人的一个策略共同构成一个策略组合(边缘的集合)。这个策略组合推导出从根到终点节的一条路径,这决定了所有参与人的收益,Gametheory-Chapter2,16,Sequential-movematchingpennies,Player1的策略HeadTail

10、Player2的策略Hifplayer1playsH,Hifplayer1playsTHifplayer1playsH,Tifplayer1playsTTifplayer1playsH,Hifplayer1playsTTifplayer1playsH,Tifplayer1playsTPlayer2的策略分别用HH,HT,TH和TT来表示.,Gametheory-Chapter2,17,Sequential-movematchingpennies,他们的收益标准式表述,Gametheory-Chapter2,18,Nashequilibrium,完全信息动态博弈中的纳什均衡集(thesetofN

11、ashequilibrium)就是它的标准式的纳什均衡集合.,Gametheory-Chapter2,19,FindNashequilibrium,怎样找到完全信息动态博弈的纳什均衡构建完全信息动态博弈的标准式在标准式中找到纳什均衡,June4,2003,73-347GameTheory-Lecture12,20,Entrygame,Challenger的策略InOutIncumbent的策略Accommodate(如果challenger选择In)Fight(如果challenger选择In)收益标准式表述,Gametheory-Chapter2,21,Nashequilibriainent

12、rygame,两个纳什均衡(In,Accommodate)(Out,Fight)第二个纳什均衡有意义吗?不可置信的威胁(Non-creditablethreats),Gametheory-Chapter2,22,RemovenonreasonableNashequilibrium,子博弈完美纳什均衡(SubgameperfectNashequilibrium)是纳什均衡的一个精炼(refinement)它可以排除不合理的纳什均衡或不可置信的威胁我们首先需要定义子博弈(subgame),Gametheory-Chapter2,23,Subgame,博弈树的一个子博弈开始于一个非终点节,包含这个非

13、终点节之后所有的节点和边缘一个子博弈开始于一个非终点节x,排除连接x和它前续节的边缘包含x的连接部分就是这个子博弈,-1,1,Gametheory-Chapter2,24,Subgame:example,Gametheory-Chapter2,25,Subgame-perfectNashequilibrium,在动态博弈中,如果纳什均衡的策略在每一个子博弈中都构成了纳什均衡,那么动态博弈的这个纳什均衡是子博弈完美的.子博弈完美纳什均衡是一个纳什均衡.,Gametheory-Chapter2,26,Entrygame,两个纳什均衡(In,Accommodate)是子博弈完美的.(Out,Figh

14、t)不是子博弈完美的,原因是在开始于Incumbent的子博弈中它没有导出纳什均衡.,AccommodateistheNashequilibriuminthissubgame.,Gametheory-Chapter2,27,FindsubgameperfectNashequilibria:backwardinduction,开始于那些最小的子博弈然后反向移动直到到达根,Challenger,In,Out,Incumbent,A,F,1,2,2,1,0,0,第一个数字是challenger的收益.第二个数字是incumbent的收益.,Gametheory-Chapter2,28,Findsub

15、gameperfectNashequilibria:backwardinduction,子博弈完美纳什均衡(DG,E)Player1选D,且如果player2选E,则她选G如果player1选C,则Player2选E,Gametheory-Chapter2,29,Existenceofsubgame-perfectNashequilibrium,任何有限的完全且完美信息动态博弈都有一个子博弈完美纳什均衡,它可以通过逆向归纳法得到.,Gametheory-Chapter2,30,Sequentialbargaining(2.1.DofGibbons),参与人1和2就一美元的分配进行谈判.时序如下

16、:在第一阶段开始时,player1建议她分走1美元的s1,留给player2的份额为1-s1.Player2或者接受这一条件,或者拒绝这一条件(这种情况下,博弈将继续进行,进入第二阶段)在第二阶段的开始,player2提议player1分得1美元的s2,留给player2的份额为1-s2.Player1或者接受这一条件,或者拒绝这一条件(这种情况下,博弈继续进行,进入第三阶段)在第三阶段的开始,player1得到1美元的s,player2得到1-s,这里0s1.参与人都是缺乏耐心的.他们用一个因子来对他们的收益进行贴现,这里01,Gametheory-Chapter2,31,Sequentia

17、lbargaining(2.1.DofGibbons),Player2,accept,reject,proposeanoffer(s2,1-s2),Period1,Player1,accept,proposeanoffer(s1,1-s1),s1,1-s1,Player1,s2,1-s2,s,1-s,Period2,Period3,reject,Player2,Gametheory-Chapter2,32,Solvesequentialbargainingbybackwardinduction,阶段2:当且仅当s2s时,Player1接受s2.(我们假定当接受和拒绝无差异时,参与人总是选择接受

18、条件)Player2面临以下两个选择:(1)向player1提出s2=s,在这个阶段留给她自己1-s2=1-s,或者(2)向player1提出s2s(player1将会拒绝它),下阶段接受1-s.它的贴现值是(1-s)由于(1-s)1-s,player2应该提出条件(s2*,1-s2*),其中s2*=s.Player1将接受它.,Gametheory-Chapter2,33,Sequentialbargaining(2.1.DofGibbons),Player2,accept,reject,proposeanoffer(s2,1-s2),Period1,Player1,accept,propo

19、seanoffer(s1,1-s1),s1,1-s1,Player1,s2,1-s2,s,1-s,Period2,Period3,reject,Player2,s,1-s,Gametheory-Chapter2,34,Solvesequentialbargainingbybackwardinduction,阶段1:当且仅当1-s1(1-s2*)=(1-s)或s11-(1-s2*)时,Player2接受1-s1,其中s2*=s.Player1面临以下两个选择:(1)向player2提出1-s1=(1-s2*)=(1-s),在这个阶段留给她自己s1=1-(1-s2*)=1-+s,或者(2)向pla

20、yer2提出1-s1(1-s2*)(player2将会拒绝它),下阶段接受s2*=s.它的贴现值是s由于s1-+s,player1应该提出条件(s1*,1-s1*),其中s1*=1-+s,Gametheory-Chapter2,35,Backwardinduction:illustration,子博弈完美纳什均衡(C,EH).player1选C;如果player1选C,player2选E,如果player1选D,player2选H.,Gametheory-Chapter2,36,Multiplesubgame-perfectNashequilibria:illustration,子博弈完美纳什

21、均衡(D,FHK).player1选D如果player1选C,player2选F,如果player1选D,player2选H,如果player1选E,player2选K.,Player1,C,D,E,Gametheory-Chapter2,37,Multiplesubgame-perfectNashequilibria,子博弈完美纳什均衡(E,FHK).player1选E;如果player1选C,player2选F,如果player1选D,player2选H,如果player1选E,player2选K.,Player1,C,D,E,Gametheory-Chapter2,38,Multiple

22、subgame-perfectNashequilibria,子博弈完美纳什均衡(D,FIK).player1playsD;如果player1选C,player2选F,如果player1选D,player2选I,如果player1选E,player2选K.,Player1,C,D,E,Gametheory-Chapter2,39,Stackelbergmodelofduopoly,仅有firm1和firm2两家企业生产同质的产品.产量分别用q1和q2表示.博弈时间顺序如下:Firm1选择产量q10.Firm2观察到q1,然后选择产量q20.市场价格是P(Q)=aQ,这里a是常数,且Q=q1+q2

23、.firmi生产qi的成本是Ci(qi)=cqi.收益函数:u1(q1,q2)=q1(a(q1+q2)c)u2(q1,q2)=q2(a(q1+q2)c),Gametheory-Chapter2,40,Stackelbergmodelofduopoly,用逆向归纳法找到子博弈完美纳什均衡我们首先解决firm2面对任意q10的问题,得到firm2针对q1的最优反应.也就是说,我们首先解出开始于firm2的所有子博弈.然后我们解决firm1的问题.也就是说,解出开始于firm1的子博弈,Gametheory-Chapter2,41,Stackelbergmodelofduopoly,解决firm2面

24、对任意q10的问题,得到firm2针对q1的最优反应.Maxu2(q1,q2)=q2(a(q1+q2)c)subjectto0q2+FOC:a2q2q1c=0Firm2的最优反应,R2(q1)=(aq1c)/2ifq1ac=0ifq1ac,Gametheory-Chapter2,42,Stackelbergmodelofduopoly,解决firm1的问题.注意到firm1也能够解firm2的问题.即,firm1知道firm2对任意q1的最优反应.所以,firm1的问题是Maxu1(q1,R2(q1)=q1(a(q1+R2(q1)c)subjectto0q1+即,Maxu1(q1,R2(q1)

25、=q1(aq1c)/2subjectto0q1+FOC:(a2q1c)/2=0q1=(ac)/2,Gametheory-Chapter2,43,Stackelbergmodelofduopoly,子博弈完美纳什均衡(ac)/2,R2(q1),whereR2(q1)=(aq1c)/2ifq1ac=0ifq1ac即,firm1选择产量(ac)/2,firm1选择产量q1时firm2选择产量R2(q1).逆向归纳解是(ac)/2,(ac)/4).Firm1选择产量(ac)/2,firm2选择产量(ac)/4.,Gametheory-Chapter2,44,Stackelbergmodelofduop

26、oly,Firm1生产q1=(ac)/2它的利润是q1(a(q1+q2)c)=(ac)2/8Firm2生产q2=(ac)/4它的利润是q2(a(q1+q2)c)=(ac)2/16总产量是3(ac)/4.,Gametheory-Chapter2,45,Cournotmodelofduopoly,Firm1生产q1=(ac)/3它的利润是q1(a(q1+q2)c)=(ac)2/9Firm2生产q2=(ac)/3它的利润是q2(a(q1+q2)c)=(ac)2/9总产量是2(ac)/3.,Gametheory-Chapter2,46,Monopoly,假设只有一家企业,即垄断者,生产产品.垄断者解以

27、下问题来决定它的产量qm.Maxqm(aqmc)subjectto0qm+FOC:a2qmc=0qm=(ac)/2垄断者的产量qm=(ac)/2它的利润qm(aqmc)=(ac)2/4,Gametheory-Chapter2,47,Sequential-moveBertrandmodelofduopoly(differentiatedproducts),两家企业:firm1和firm2.每家企业选择它的产品的价格时不知道其他企业的选择.价格分别用p1和p2表示.博弈的时间顺序如下.Firm1选择价格p10.Firm2观察到p1然后选择价格p20.消费者对firm1产品的需求量:q1(p1,p2

28、)=ap1+bp2.消费者对firm2产品的需求量:q2(p1,p2)=ap2+bp1.firmi生产数量为qi的成本是Ci(qi)=cqi.,Gametheory-Chapter2,48,Sequential-moveBertrandmodelofduopoly(differentiatedproducts),对任何p10解firm2的问题,得到firm2对p1的最优反应.Maxu2(p1,p2)=(ap2+bp1)(p2c)subjectto0p2+FOC:a+c2p2+bp1=0p2=(a+c+bp1)/2Firm2的最优反应,R2(p1)=(a+c+bp1)/2,Gametheory-

29、Chapter2,49,Sequential-moveBertrandmodelofduopoly(differentiatedproducts),解firm1的问题.注意到firm1也能够解firm2的问题.Firm1知道firm2对p1的最优反应.所以,firm1的问题是Maxu1(p1,R2(p1)=(ap1+bR2(p1)(p1c)subjectto0p1+即,Maxu1(p1,R2(p1)=(ap1+b(a+c+bp1)/2)(p1c)subjectto0p1+FOC:ap1+b(a+c+bp1)/2+(1+b2/2)(p1c)=0p1=(a+c+(ab+bcb2c)/2)/(2b2

30、),Gametheory-Chapter2,50,Sequential-moveBertrandmodelofduopoly(differentiatedproducts),子博弈完美纳什均衡(a+c+(ab+bcb2c)/2)/(2b2),R2(p1),其中R2(p1)=(a+c+bp1)/2Firm1选择价格(a+c+(ab+bcb2c)/2)/(2b2),firm1选择价格p1时firm2选择价格R2(p1).,Gametheory-Chapter2,51,Dynamicgamesofcompleteandperfectinformation,完美信息在选择下一次行动前可以观察到所有以前

31、的行动.参与人做出决策前知道谁行动了,干了什么,Gametheory-Chapter2,52,Perfectinformation:illustration(sequentialmatchingpennies),两个参与人各有一枚硬币.Player1先选择是显示Head还是Tail.在观察player1的选择之后,player2选择显示Head或Tail两个参与人都知道以下规则:如果两枚硬币一致(都是heads或都是tails)那么player2赢得player1的硬币.否则,player1赢得player2的硬币.,Player1,Player2,H,T,-1,1,1,-1,H,T,Play

32、er2,H,T,1,-1,-1,1,Gametheory-Chapter2,53,Dynamicgamesofcompleteandimperfectinformation,不完美信息参与人做出决策前可能并不能确切的知道谁做了什么选择.例:在player1做出选择后player2进行她的选择.Player2需要在不知道player1做出什么选择的情况下进行她的决策.,Gametheory-Chapter2,54,Imperfectinformation:illustration,两个参与人各有一枚硬币.Player1先选择是显示Head还是Tail.然后player2在不知道player1选择

33、的情况下选择是显示Head还是Tail,两个参与人都知道以下规则:如果两枚硬币一致(都是heads或都是tails)那么player2赢得player1的硬币.否则,player1赢得player2的硬币.,Player2,Gametheory-Chapter2,55,Informationset,Gibbons的定义:参与人的一个信息集是指满足以下条件的决策节的集合:在此信息集中的每一个节都轮到该参与人行动,且当博弈的进行达到信息集中的一个节,应该行动的参与人并不知道达到了(或没有达到)信息集中的哪一个节.一个信息集中所有的节点都属于同一个参与人参与人在信息集中的每一个节点都必须有相同的可行

34、行动集合.,Gametheory-Chapter2,56,Informationset:illustration(pp.94-95),aninformationsetforplayer3containingthreenodes,aninformationsetforplayer3containingasinglenode,twoinformationsetsforplayer2eachcontainingasinglenode,Gametheory-Chapter2,57,Informationset:illustration,一个信息集中所有的节点都属于同一个参与人,Player1,C,D,

35、Player2,E,F,3,0,2,2,1,3,Player3,G,H,1,3,1,0,2,2,Thisisnotacorrectinformationset,Gametheory-Chapter2,58,Informationset:illustration,参与人在信息集中的每一个节点都必须有相同的可行行动集合.,Player1,C,D,Player2,E,F,3,0,2,1,Player2,G,H,1,3,0,2,1,1,Aninformationsetcannotcontainsthesetwonodes,K,Gametheory-Chapter2,59,Representastati

36、cgameasagametree:illustration,囚徒困境(图2.4.3.第一个数字是player1的收益,第二个数字是player2的收益),Gametheory-Chapter2,60,Example:mutuallyassureddestruction,两个超级大国,1和2,卷入了一起挑衅事件.博弈开始于superpower1的选择,它或者忽视这个事件(ignore,I),得到收益(0,0),或者使事态进一步升级(escalate,E).superpower1使事态升级后,superpower2可以后退(backdown,B),这会使它丧失颜面,获得收益(1,-1),或者它可以

37、选择进行核对抗(atomicconfrontation,A).这种情况下,两个超级大国会同时行动,进行以下博弈.它们或者选择撤退(retreat,R),或者选择末日(doomsday,D),从而世界被毁灭.如果两国都选择撤退,那么它们会忍受一点小的损失,收益为(-0.5,-0.5).如果它们有一方选择末日,那么世界将被毁灭,收益为(-K,-K),其中K是一个很大的数字.,Gametheory-Chapter2,61,Example:mutuallyassureddestruction,Gametheory-Chapter2,62,Perfectinformationandimperfectin

38、formation,如果一个动态博弈中每一个信息集只包含一个节,那么这个博弈被称为完美信息博弈.如果一个动态博弈中有一些信息集包含的节点多于一个,那么这个博弈被称为不完美信息博弈.,Gametheory-Chapter2,63,Strategyandpayoff,参与人的一个策略是关于行动的一个完整计划.它明确了在参与人可能会遇到的每一种情况下对可行行动的选择.它明确了参与人在她的每个信息集选择什么行动,Player1,Player2,H,T,-1,1,1,-1,H,T,Player2,H,T,1,-1,-1,1,astrategyforplayer1:H,astrategyforplayer

39、2:T,Player1spayoffis1andplayer2spayoffis-1ifplayer1playsHandplayer2playsT,Gametheory-Chapter2,64,Strategyandpayoff:illustration,astrategyforplayer1:E,andRifplayer2playsA,writtenasER,astrategyforplayer2:A,R,ifplayer1playsE,writtenasAR,Gametheory-Chapter2,65,Nashequilibriuminadynamicgame,我们也可以使用标准式来表述

40、动态博弈完全信息动态博弈的纳什均衡集就是它的标准式的纳什均衡的集合怎样在一个完全信息动态博弈中找到纳什均衡构建完全信息动态博弈的标准式在标准式中找到纳什均衡,Gametheory-Chapter2,66,RemovenonreasonableNashequilibrium,子博弈完美纳什均衡(SubgameperfectNashequilibrium)是纳什均衡的一个精炼(refinement)它可以排除不合理的纳什均衡或不可置信的威胁我们首先需要定义子博弈(subgame),Gametheory-Chapter2,67,Subgame,动态博弈树的一个子博弈始于一个单节信息集(一个信息集只包

41、含一个节点),包含这个单节信息集后的所有节点和边缘没有对任何信息集形成分割;即如果信息集的一个节点属于这个子博弈,那么这个信息集的所有节点也属于这个子博弈.,Gametheory-Chapter2,68,Subgame:illustration,asubgame,asubgame,Notasubgame,Gametheory-Chapter2,69,Subgame-perfectNashequilibrium,在动态博弈中,如果一个纳什均衡的策略在该博弈的每一个子博弈中都构成或推导出一个纳什均衡,那么这个纳什均衡是子博弈完美的.子博弈完美纳什均衡是一个纳什均衡.,Gametheory-Chap

42、ter2,70,FindsubgameperfectNashequilibria:backwardinduction,StartingwiththosesmallestsubgamesThenmovebackwarduntiltherootisreached,Onesubgame-perfectNashequilibrium(IR,AR),Gametheory-Chapter2,71,FindsubgameperfectNashequilibria:backwardinduction,StartingwiththosesmallestsubgamesThenmovebackwarduntilt

43、herootisreached,Anothersubgame-perfectNashequilibrium(ED,BD),Gametheory-Chapter2,72,FindsubgameperfectNashequilibria:backwardinduction,哪个是子博弈完美纳什均衡?(R,LL,RL)子博弈1的NE是(L,R),子博弈2的NE是(L,L),Gametheory-Chapter2,73,Bankruns(2.2.BofGibbons),两个投资者,1和2,每人存入银行一笔存款D.银行已将这些存款投入一个长期项目.如果在该项目到期前银行被迫对投资者变现,共可收回2r,这

44、里DrD/2.如果银行允许投资到期,则项目共可取得2R,这里RD.有两个日期,投资者可以从银行提款.,Gametheory-Chapter2,74,Bankruns:timingofthegame,博弈的时间顺序如下日期1(银行的投资项目到期之前)两个投资者同时行动如果两个投资者都提款,则每人可得到r,博弈结束如果只有一个投资者提款,则她可得到D,另一个投资者可得到2r-D,博弈结束(注意r2r-D)如果两人都不提款,则项目结束后在日期2博弈继续.日期2(银行的投资项目到期之后)两个投资者同时行动如果两个投资者都提款,则每人可得到R,博弈结束如果只有一个投资者提款,则她可得到2R-D,另一个投

45、资者可得到D,博弈结束(注意2R-DR)如果两个投资者都不提款,则银行向每个投资者返还R,博弈结束.,Gametheory-Chapter2,75,Bankruns:gametree,1,W,NW,2,W,NW,1,2,W,NW,W,NW,W,NW,2,asubgame,Onesubgame-perfectNashequilibrium(NWW,NWW),W,r,r,NW,Date1,Date2,W:withdrawNW:notwithdraw,2,D,2rD,2rD,D,R,R,D,2RD,2RD,D,R,R,Gametheory-Chapter2,76,Bankruns:gametree,

46、1,W,NW,2,W,NW,1,2,W,NW,W,NW,W,NW,2,Onesubgame-perfectNashequilibrium(WW,WW),W,r,r,NW,Date1,Date2,W:withdrawNW:notwithdraw,2,D,2rD,2rD,D,R,R,D,2RD,2RD,D,R,R,asubgame,Gametheory-Chapter2,77,Tariffsandimperfectinternationalcompetition(2.2.CofGibbons),两个完全相同的国家,1和2,同时选择它们的关税税率,分别记为t1,t2,.来自country1的Firm

47、1和来自country2的firm2生产同质的产品供给本国消费和出口.观察到两国的税率后,firm1和2同时选择用于本国消费和出口的产品数量,分别用(h1,e1)和(h2,e2)表示.两个国家的市场价格Pi(Qi)=aQi,fori=1,2.Q1=h1+e2,Q2=h2+e1.两个企业的边际成本为常数c.每个企业在向其他国家出口时都要支付关税.,Gametheory-Chapter2,78,Tariffsandimperfectinternationalcompetition,Gametheory-Chapter2,79,Tariffsandimperfectinternationalcomp

48、etition,Gametheory-Chapter2,80,Backwardinduction:subgamebetweenthetwofirms,Gametheory-Chapter2,81,Backwardinduction:subgamebetweenthetwofirms,Gametheory-Chapter2,82,Backwardinduction:wholegame,Gametheory-Chapter2,83,Tariffsandimperfectinternationalcompetition,Gametheory-Chapter2,84,Repeatedgame,在一个完

49、全信息动态博弈中,同一个(同时行动)的博弈进程至少进行了两次,并且在下一个进程进行前,所有以前的博弈进程都可被观察到,这样的动态博弈就是重复博弈.我们将探究重复博弈中参与人的行为.,Gametheory-Chapter2,85,Two-stagerepeatedgame,两阶段囚徒困境两个参与人要把以下同时行动博弈重复进行两次第二次博弈开始前可观察到第一次进行的结果整个博弈的收益等于两阶段各自收益的加总.即贴现因子(discountfactor)等于1.Question:whatisthesubgameperfectNashequilibrium?,Gametheory-Chapter2,86

50、,Gametreeofthetwo-stageprisonersdilemma,1,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,1+11+1,1+51+0,1+01+5,1+41+4,1,1,1,1,5+10+1,5+50+0,5+00+5,5+40+4,0+15+1,0+55+0,0+05+5,0+45+4,4+14+1,4+54+0,4+04+5,4+44+4,Gametheory-Chapter2,87,Infor

51、malgametreeofthetwo-stageprisonersdilemma,1,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,1,1,1,1,(1,1),(5,0),(0,5),(4,4),Gametheory-Chapter2,88,Informalgametreeofthetwo-stageprisonersdilemma,1,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R

52、2,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,L1,R1,2,L2,R2,2,L2,R2,1,1,1,1,(2,2),(6,1),(1,6),(5,5),Gametheory-Chapter2,89,two-stageprisonersdilemma,子博弈完美纳什均衡(L1L1L1L1L1,L2L2L2L2L2)Player1在第1阶段选择L1,并且无论第1阶段结果是什么,第2阶段都选择L1.Player2在第1阶段选择L2,并且无论第1阶段结果是什么,第2阶段都选择L2.,Gametheory-Chapter2,90,two-stagepris

53、onersdilemma,子博弈完美纳什均衡(L1L1L1L1L1,L2L2L2L2L2)Player1在第1阶段选择L1,并且无论第1阶段结果是什么,第2阶段都选择L1.Player2在第1阶段选择L2,并且无论第1阶段结果是什么,第2阶段都选择L2.,Thepayoff(1,1)ofthe2ndstagehasbeenaddedtothefirststagegame.,Gametheory-Chapter2,91,Finitelyrepeatedgame(p.65),在一个完全信息动态博弈中,同一个(同时行动)的博弈进程至少进行了有限次,并且在下一个进程进行前,所有以前的博弈进程都可被观察

54、到,这样的动态博弈就是一个有限重复博弈.如果阶段博弈(同时行动博弈)有惟一的纳什均衡,那么这个有限重复博弈有惟一的子博弈完美纳什均衡.重复博弈的每一阶段都会实现阶段博弈的纳什均衡.,Gametheory-Chapter2,92,WhathappensifthestagegamehasmorethanoneNashequilibrium?(p.66),两个参与人要把以下同时行动博弈重复进行两次第二次博弈开始前可观察到第一次进行的结果整个博弈的收益等于两阶段各自收益的加总.即贴现因子等于1.问题:如果M1,M2被选择,我们能够找到一个子博弈完美纳什均衡吗?或者说,两个参与人在一个子博弈完美均衡中能

55、够合作(cooperate)吗?,Gametheory-Chapter2,93,Informalgametree,1,L1,R1,2,2,L2,R2,M2,L2,R2,M2,L2,R2,M2,2,L1,R1,2,2,L2,R2,M2,L2,R2,M2,L2,R2,M2,2,M1,(1,1),(5,0),(0,5),(4,4),(0,0),M1,(0,0),(0,0),(0,0),(3,3),1,(1,1),(5,0),(0,5),(0,0),(0,0),(0,0),(0,0),(3,3),(4,4),Gametheory-Chapter2,94,Informalgametreeandbackw

56、ardinduction,1,L1,R1,2,2,L2,R2,M2,L2,R2,M2,L2,R2,M2,2,L1,R1,2,2,L2,R2,M2,L2,R2,M2,L2,R2,M2,2,M1,(1,1),(5,0),(0,5),(4,4),(0,0),M1,(0,0),(0,0),(0,0),(3,3),1,(1,1),(5,0),(0,5),(0,0),(0,0),(0,0),(0,0),(3,3),(4,4),(1,1),(1,1),(1,1),(3,3),(1,1),(1,1),(1,1),(1,1),(1,1),+,Gametheory-Chapter2,95,Two-stagerep

57、eatedgame,子博弈完美纳什均衡:player1在第1阶段选择M1,如果第1阶段结果是(M1,M2),则第2阶段选择R1,如果第1阶段结果不是(M1,M2),则第2阶段选择L1player2在第1阶段选择M2,如果第1阶段结果是(M1,M2),则第2阶段选择R2,如果第1阶段结果不是(M1,M2),则第2阶段选择L2,Gametheory-Chapter2,96,Two-stagerepeatedgame,子博弈完美纳什均衡:在第1阶段,player1选择M1,player2选择M2.在第2阶段,如果第1阶段结果为(M1,M2),则player1选择playsR1;如果第1阶段结果不是(M1,M2),则player1选择L1如果第1阶段结果为(M1,M2),则player2选择playsR2;如果第1阶段结果不是(M1,M2),则player2选择L2,Thepayoffsofthe2ndstagehasbeenaddedtothefirststagegame.,Gametheory-Chapter2,97,Anabstractgame:genera

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论