经济博弈论考试复习.doc_第1页
经济博弈论考试复习.doc_第2页
经济博弈论考试复习.doc_第3页
经济博弈论考试复习.doc_第4页
经济博弈论考试复习.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

经济博弈论考试复习一、1.什么是博弈论?“博弈论”译自英文“game theory”,直译就是“游戏理论”。是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。2.什么是纳什均衡? 在博弈g=,;,, 中,如果由各个博弈方的各一个策略组成的某个策略组合(*,, *)中,任一博弈方i的策略*,都是对其余博弈方策略组合(*,,*, *,*, *)的最佳对策,也即(*,,*, *,*, *)(*,,*, *,*, *)对任意都成立,则称(*,, *)为g的一个“纳什均衡”。(假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己利益最大化。所有局中人策略构成一个策略组合就是纳什均衡。这种策略组合由所有参与人最优策略组成,即在给定别人策略的情况下,没有人有足够理由打破这种均衡。)3.什么是囚徒困境?囚徒困境的基本模型是这样的:警察抓住了两个合伙犯罪的罪犯。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们窜供或结成攻守同盟:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白这从轻处理,立即释放,而另一人则将重判八年徒刑;如果两人同时坦白认罪,他们将各被判五年监禁。囚徒1坦白 不坦白(囚徒2)坦白-5,-50,-8不坦白-8, 0-1,-1双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。由于这两个囚徒不能串通,个人都追求自己的最大利益而不会顾及同伙的利益,又不敢相信对方,以此只能实现他们都不理想的结果。该博弈揭示了个体理性与团体立项之间的矛盾从个体理性出发的行为往往不能实现团体的最大利益,最终也不能真正实现个体的最大利益,甚至会得到相当差的结果。二、1什么是完全信息静态博弈?完全信息静态博弈是指各博弈方同时决策,且所有的博弈方对各方得益都了解的博弈。完全信息是指信息的充分性、对称性和透明性,静态是指同时决策,没有时间的差别。2如何求解纳什均衡?求解纳什均衡的4种方法: 离散、有限策略博弈:划线法 连续、无限策略博弈:反映函数法 零和博弈:最大最小法 循环相克博弈:混合战略(无差异原则)(1)离散有限划线法通过在每个博弈方对其他博弈方每个策略或策略组合的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”。例:囚徒的困境博弈囚徒1坦白 不坦白(囚徒2)坦白-5,-50,-8不坦白-8, 0-1,-1可以看出,只有策略组合(坦白,坦白)对应的得益系数(-5,-5)下面都划有短线,意味着只有这个策略满足双方的策略相互使对对方策略的最佳对策。就是博弈的结果。划线法一策略之间的相对优劣为基础,在分析用得益矩阵表示的博弈问题时十分有普遍适用性。但事实上,也有许多博弈根本不存在确定性的结果,无法用这种方法。(2)连续无限函数法(求导,建立拉格朗日方程)反应函数法:对一个一般的博弈,只要是得益是策略的多元连续函数,我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数,也就是反应函数,而解出的各个博弈方反应函数的交点就是纳什均衡。利用反应函数求博弈的纳什均衡的方法称为“反应函数法”设:ux=ux(x,y) uy=uy(x,y)x,y,ux,uy连续,ux,uy二阶可微并且 0, 0,则求解反映函数: =0 =0。其解即为nash均衡例:养羊博弈模型(p67)局限性:1)对于不连续的得益函数无法用先求导数找出各个博弈方的反应函数的方法求纳什均衡,所以无法发挥作用。 2)并不能保证各博弈方的反应函数有交点,特别是唯一的交点。(3)零和博弈1)有限离散策略最大最小值法:x给出一个策略ax,则y会给出一个行动ay,使ux(ax,ay)=minux(ax,ay),而x要选择一个ax*,使ux最大,ux(ax*,ay*)=max minux(ax,ay)=min maxux(ax*,ay*).y的一个策略ay,x却会选一个ax使ux最大,即ux(ax,ay)=maxux(ax,ay),则y会选一个ay*使ux(ax*,ay*)=minmaxux(ax,ay)2)无限连续策略反应函数方程(同上反应函数法)(4)循环相克博弈(混合战略)无差异法 1)所谓循环相克博弈是指博弈者的任何一项战略行为都受到对方某种战略的完全克制,对手之间的各个战略,形成相互克制的封闭环。如: “石头、剪子、布”游戏 2)所谓混合战略:设: ,ax=ax1,ax2,axn,ay=ay1,ay2,aym设x在ax中随机选择战略,且某种战略被选择概率是,=1,则=是x的混合战略。同理,y的混合战略 = 例:p7480 3)混合战略nash均衡的确定原则无差异原则即给定我的混合战略,你的任何战略都是无差异的。同时,给定你的混合战略,我的任何战略也都是无差异的。在循环相克博弈中,均衡的状态就是从彼此克制中摆脱,使彼此相克转为彼此都不能相克彼此不被对方克制的状态就是一种双方同时实现最优的状态。因为,任何一种纯战略都会陷入被对方克制的局面,只有采取一种混合战略,才能摆脱相互克制的局面。同时,这种混合战略还必须使对方的战略都无差异。3.如何甄别、区分多重均衡?(1)帕累托最优型nash均衡 设x,y是两个player,(ax1,ay1)和(ax2,ay2)是两组nash均衡策略,(ux1,uy1)和(ux,uy)是x和y在两种nash均衡策略下的效用()如果满足ux1ux,并且uy1uy,则称,(ax1,ay1)是帕累托最优的nash均衡。例:战争与和平博弈-5 , -58 , -10-10 , 810 , 10这里有两组nash均衡:(战争,战争),(和平,和平)。但ux和平ux战争,并且uy和平uy战争,因此,(ax和平,ay战争)是比(ax和平,ay战争)帕累托占优的nash均衡。(2)风险稳定(浮动)型nash均衡 设(ax1,ay1),(ax2,ay2)是两组nash均衡, (ux1,uy1),(ux,uy)是x和y的nash均衡效用如果ax1出现一个微量浮动ax1,则ay1就不再是y的最优策略,uy(ax1+ax1 ,ay1)uy(ax2+ax2,ay1)。则称(ax2,ay2)是风险稳定型nash均衡。(3)聚点均衡 在多重nash均衡中,如果存在某种因素使其中的一种均衡成为更可能繁盛的聚焦点,则这一nash均衡称为聚占均衡。(这种因素可能使文化、历史、信息等)(4)相关均衡 多重博弈均衡的实现与博弈的解的某种事件相关。三、1. 什么是完全信息动态博弈? 完全且完美信息动态博弈简称动态博弈,也称为多阶段博弈、序列博弈或扩展型博弈。特征是博弈方依次选择行动,后选择行为者是在看到先选择行为者的选择后在选择,博弈方互相了解得益情况。对比静态博弈:博弈选择有先后顺序,行为者可观察到对手的策略选择,博弈过程要你来我往的多个回合 序贯动态博弈:每一阶段博弈的结构(信息、策略、资源、禀赋)都不相同,博弈路径具有依赖、继承与扩展性。2.什么是子博弈精炼纳什均衡?为什么要找它?什么是子博弈?由博弈路径上一个单结信息集开始的,并且它的后续结不与其它信息集粘连的博弈过程。即动态博弈中满足一定要求的局部所构成的次级博弈。 特点:a.信息确定 b.信息不丢失,过去知道的现在亦知道。子博弈精练nash均衡如果在一个完美信息的动态博弈中,个博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的作业子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”:第一,s是原博弈的纳什均衡。第二,s在每一个子博弈上给出纳什均衡。子博弈精练nash均衡的价值在于剔除掉那些不可信的、只在特定的博弈路径(子博弈)上成立的均衡,因此是可信的、稳定的,在所有博弈路径上成立的均衡。3什么是逆向归纳法?从动态博弈的最后一级子博弈开始,逐步倒推回博弈方在各级子博弈中的最优选择,最终找出第一个阶段的分析方法。理论基础:动态博弈中先行为的理性的博弈方,在前面阶段选择行为时必然会先考虑后行为博弈方在后面阶段中将会怎样选择行为,只有在博弈的最好一个阶段选择的,不在有后续阶段牵制的博弈方,才能直接做出明确的选择。四、1.什么是演化博弈?通常把研究有限理性博弈的理论称为“演化博弈论”,它是把博弈理论分析和动态演化过程分析结合起来的一种新理论,以大样本行为群体(而不是小样本的具体的行为个体)为博弈主体;以有限理性的学习、比较、模仿(而不是完全理性的精确算计)为行为策略选择机理;其均衡是群体演化的均衡稳定状态(而不是个体博弈的战略纳什均衡)。什么是演化博弈?(1)博弈主体大样本行为群体、而不是小样本的具体的行为个体;(2)行为策略选择机理有限理性的学习、比较、模仿,而不是完全理性的精确算计;(3)演化博弈均衡群体演化的均衡稳定状态,而不是个体博弈的战略纳什均衡;(撷自网上,仅做参考:演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种新理论,最初产生于行为生态学。它从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。演化博弈理论主要研究某一群体随着时间变化的动态过程,解释为何群体将达到目前的这一状态以及如何达到。)演化博弈的特点:假定参与者理性是非常有限的,在行动上被惯例的 惰性和简单模仿所驱使,但是无法保证均衡结果的 收敛。 适用范围:侧重于人类以观察为基础的归纳能力,可以分析以 惯例、习俗体现的规则的自发演化。有限理性条件下的行为策略选择机制(1)“姜是老的辣”遵循习惯与经验;“守成式选择”。(2)“它山之石,可以攻玉”学习、比较、模仿、跟风;“模仿式选择”。(3)“摸石头过河”试错性创新法;“创新式选择”。2什么是演化方程?如何构建演化方程? 生物演化方程:设x是某生命物种在整个生物世界的占有比例,u是该物种在生存环境中的适应性,u是所有生物物种的平均适应性。 则有:dx/dt=x(u- u)复制动态方程,即演化方程。复制动态方程实质上是描述某一特定策略在一个种群中被采用的比例或频率的动态微分方程,假设: x为一个种群中博弈方采用策略s的比例;us为该博弈方采用策略s的期望得益;u为该博弈方采用其策略空间中所有策略的平均得益; dx/dt为该博弈方采用策略的比例随时间的变化率。上述动态微分方程与生物演化中描述的特性个体频数变化其自然选择过程的“复制动态”过程相一致,因此称为“复制动态方程”。 采用s 不采用s a a b c c b d d 采用s 不采用s 采用策略s的得益为:us=xa+(1-x)b不采用策略s的得益为:ut=xc+(1-x)d策略空间中所有策略的平均得益为:u=xus +(1-x)ut演化方程为:dx/dt=x(us-u)=x(1-x)x(a-c)+(1-x)(b-d)3.如何求解ess?对于dx/dt=x(us-u)=x(1-x)x(a-c)+(1-x)(b-d)若us-u0,即dx/dt0,则演化趋势为扩张;若us-u0,即dx/dt0,则演化趋势为萎缩。若us-u=0,即dx/dt

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论