经济博弈论概述_第1页
经济博弈论概述_第2页
经济博弈论概述_第3页
经济博弈论概述_第4页
经济博弈论概述_第5页
已阅读5页,还剩237页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

经济博弈论,参考书,博弈与信息艾里克拉斯缪森著,北京大学出版社博弈论Drew.Fudenberg结果式表明的是每一种可能的行动组合产生的支付情况扩展式和博弈树,Information,是Player有关博弈的知识,它是重要的决策依据和决定博弈结果的重要因素,完美信息与不完美信息,完美博弈,N,大小,AA,开发不开开发不开,BBBB,(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0),不完美博弈,N,大小,AA,开发不开开发不开,BBBB,(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0),开发不开开发不开开发不开开发不开,不完美博弈,N,大小,AA,开发不开开发不开,BBBB,(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0),开发不开开发不开开发不开开发不开,不完美博弈,N,大小,BB,开发不开开发不开,A,(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0),开发不开开发不开开发不开开发不开,确定性信息与不确定性信息,对称信息与不对称信息,完全信息与不完全信息,TheorderofPlay,StaticGamemeans:每个博弈参与人几乎同时行动(不是时间概念)DynamicGamemeans:每个博弈参与人选择行动或策略有先后之分重要的是后行动方通过观察先行动方的行动来获取信息,从而使得博弈分析成为预测人的行为的一个强有力的工具RepeatedGame:是指同一个博弈反复进行所构成的博弈过程构成重复博弈的一次性博弈称为“原博弈”或“阶段博弈”,Payoff,它是指在一个特定的策略组合下player得到的确定的效用水平,或者指参与人得到的期望效用水平这是player真正关心的东西,是player博弈后所得利益他的目标就是在自己可以选择的策略集合里,选择某个战略以最大化自己的期望效用函数。,UtilityFunction,如果有n人博弈,令ui为Playeri的支付,u=(u1,uiun)为支付组合payoffprofile,博弈的一个基本特征是一个参与人的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选择,即ui是所有参与人的策略选择的函数:ui=ui(s1,si,sn)其中si是Playeri的策略选择。,Outcomeu1un是个n人博弈,策略组合s*=(s1*,,si*,sn*)是一个NE,如果对每一个i,si*是给定其他参与人选择s-i*=(s1*,s-1*,si+1*,sn*)的情况下第i个参与人的最优策略,即:ui(si*,s-i*)ui(si,s-i*)siSi,对所有的i则s*=(s1*,,si*,sn*)是NE。这是一个弱纳什均衡(weaklyNE)定义。,NE有强弱之分,StrictorstrongNE,如果给定其他参与人的策略,每一个参与人的最优选择是唯一的,就是说,s*=(s1*,,si*,sn*)是一个strictNE,当只当对于所有的i,sisi*,ui(si*,s-i*)ui(si,s-i*)则s*=(s1*,,si*,sn*)是一个StrictNE。,1.4计算纳什均衡,纳什均衡是一个策略组合,也是最优策略组合;即在给定条件下,每一个博弈方最大化自己效用选择的结果。如在G=S1,Sn;u1,un中,如果有策略组合(S1*,,Si*,Sn*),其中任一博弈方i的策略Si*都是对其余博弈方的策略组合S-i*=(S1*,,S*i-1,S*i+1,Sn*)的最佳对策,则这个策略组合就是博弈的解。,博弈问题解法,划线法-有限策略博弈的解法反应函数-无限策略博弈的解法重复剔除严格劣策略或严格下策反复消去法混合策略,下列博弈问题的解,如果以划线法解上述博弈问题,则发现:猜硬币无解囚徒的困境有唯一稳定的解智猪博弈有一个解斗鸡博弈有两个解但不唯一石头剪子布的博弈无稳定解齐威王与田忌赛马无稳定解,反应函数法,古诺寡头模型中(需求函数:p=a-Q,其中Q=q1+q2)两厂商为博弈方1,2可选择策略:产量q1、q2(无限策略型)支付函数为:u=pq-cq=(p-c)q如果假设a=8,c=2,则有u1(q1,q2)=6q1-q1q2-q12u2(q1,q2)=6q2-q1q2-q22,以CournotModel为例,这是一个完全信息的博弈模型,Reactionfunction,q1*=R(q2*)=(6-q2*)/2反应函数q2*=R(q1*)=(6-q1*)/2反应函数反应函数是指当支付payoff是策略的多元连续函数时:u=u(s1sisn),我们可以求得每个博弈方针对其他博弈方最佳策略的最佳反应构成的函数,即通过du/dsi=o,求出每个博弈策略Si*=R(S1*,Si-1*,Si+1*,Sn*),这就是反应函数。博弈的解就是各个反应函数的交点(如果有),古诺博弈解的几何意义,q1,0,q1*,q2*,E(q1*,q2*),q1*=R(q2*),q2*=R(q1*),q2,进一步阅读的例子,反应函数的概念和思路可以应用到一般的无限多种策略博弈的求解中,可以使博弈问题的解法简约如产业组织理论研究中经典的模型:Bertrand双寡头模型。它与CournotModel不同的是,该模型中厂商的可选策略是价格而不是产量。Hotelling价格竞争模型。,混合策略,以猜硬币博弈为例,这是一个零和博弈,没有NE。其显著的特征是每一个博弈方都想掌握对方选择策略的规律性,而对方又不想让对方掌握自己特征,他最好的选择是随机选择策略,即按一定的概率分布选择自己的策略。在本例中,如果盖硬币方以概率p选择正面,1-p选择反面,但如果p1-p或P1/2,即盖方出正面多于出反面,在这种情况下,他的期望收益:E=p1+(1-p)(-1)=2(P-1/2)0就平均而方,猜方获利机会要多,这样对盖方不利。,如何计算猜硬币博弈的解?,对盖方来说,最好的方法是设计一个概率分布,使猜方无法掌握其盖的规律性,即使猜方的EU正=EU反,这样猜方就不会依据你对策略的偏好占到你任何便宜。同样,猜方也以相同概率随机选择策略。在本博弈中,博弈双方的决策内容都不是确定性的具体策略,而是以一定的概率分布随机选择策略,这样的决策被称为随机策略或混合策略MixedStrategy。为了区别,将有确定性的决策内容的博弈问题中的策略称为“纯策略”,其均衡也为“纯策略纳什均衡”。,混合策略的定义,在G=S1,Sn;u1,un中,博弈方i的策略为Si=si1,sik,则博弈方i以概率分布pi=(pi1,pik)随机选择其k个可选择策略,则这Pi就称为一个随机策略或混合策略,其中0pij1,j=1,k都成立,且pi1+pik=1.,斗鸡博弈的混合策略,设A方以概率pA(进)+pA(退)=1设B方以概率pB(进)+pB(退)=1A、B如何选择PA,PB?对A方来说,他设计的概率要使B方在选择每一种策略时无差异:EB进=pA进(-3)+pA退(2)EB退=pA进(0)+pA退(0),进退,B,进退,A,令EB进=EB退-3pA进+2pA退=0pA进+pA退=1则pA进=0.6,pA退=0.4同理,pB进=0.6,pB退=0.4,随机策略决策的基本原则,第一个原则不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性。第二个原则他们选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性地倾向某一策略而在博弈中占上风。,斗鸡博弈的随机策略均衡,在纯策略中,NE是一组最优策略组合S*=(S1*Si*Sn*)如囚徒困境中,(坦白,坦白)是一个纳什均衡,其支付为(-5,-5)。在随机策略中,NE也是一组策略组合,但是以概率大小来选择相应最优策略。以斗鸡博弈来看,A方以(0.6、0.4)分别选择进和退,B方也(0.6、0.4)概率分别选择进和退,这就是混合策略的NE。其支付分别为各自期望收益(EA、EB)(-0.6,-0.6):,监督博弈,博弈方:代理人A、委托人P代理商的可选策略:工作W,偷懒S工资w,工作的花费g,且wg委托人的可选策略:检查I,不检查N委托人检查的费用h,增加的价值为v(vw)假定gh0其支付矩阵如图所示,监督博弈的随机策略均衡,用下划线求解,可知本博弈无纯策略NE。设代理商:偷懒的概率为x,工作概率为1-xp1=(x,1-x)设委托人:检查的概率为y,不检查的概率为1-yp2=(y,1-y),对代理商来说,他设计的概率p1=(x,1-x),应该使委托人在不同策略选择下的期望收益相等,即EUPI=EUPNEUPI=x(-h)+(1-x)(v-w-h)EUPN=x(-w)+(1-x)(v-w)令EUPI=EUPN,则求出x=h/w,同理对委托人,他的概率p2=(y,1-y),也使EUAW=EUAS,则y=g/w因此,本博弈混合策略的NE为(h/w,1-h/w),(g/w,1-g/w)均衡时的期望收益为(EUA,EUP),另一种求解法,设代理商的密度函数为:p1=(x,1-x)设委托人的密度函数为:p2=(y,1-y)先求代理商的期望收益EUA=x0y+w(1-y)+(1-x)(w-g)y+(w-g)(1-y)=xw(1-y)+(1-x)(w-g)再求MaxEUA,即dEUA/dx=0,即w(1-y)=(w-g)-(1)这样可以求出y=g/w,同理,可以求出委托人的期望收益EUPMaxEUP,dEUB/dy=0,则有h+x(v-w)=xv-(2)由此得到x=h/w.注意(1)、(2)的特点。,监督博弈的经济应用,求出委托人在均衡时的期望收益为EUP=v(1-h/w)-wEUp与代理商的生产价值v、委托人检查费用h以及代理商的工资w有关。假定v、h

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论