




已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章有限理性和进化博弈,本章介绍有限理性基础上的进化博弈分析。完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响,有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心,以进化稳定策略为基本均衡概念的进化博弈分析,包括基本方法、概念和各种经典模型等。,本章分四节,5.1有限理性博弈及其分析框架5.2最优反应动态5.3复制动态和进化稳定性:两人对称博弈5.4复制动态和进化稳定性:两人非对称博弈,5.1有限理性博弈及其分析框架,5.1.1有限理性及其对博弈的影响5.1.2有限理性博弈分析框架,传统的博弈均衡,特别是Nash均衡及其完美是以博弈规则、参与人的理性以及参与人的得益都是共同知识(commonknowledge)为前提的,这并不完全符合现实。进化博弈的基本思路是:有限理性的经济主体不可能正确地知道自己所处的利害状态,它只是通过它认为最有利的策略逐渐模仿下去,最终到达一种均衡状态。在这样变化的系统中,采用得益高的策略的参与人的比率逐渐上升。,5.1.1有限理性及其对博弈的影响,博弈论分析研究的是参与人在特定的问题中的行为和策略,因此重要的不是人们始终一贯的理性,而是在具体问题上的理性,因此在具体问题中完全理性的假定仍有可能成立,但理性的局限的情况也很普遍。在分析复杂问题时就可能具有很大的理性局限性。如果具体的博弈中博弈方不满足完全理性的假设,称为有限理性博弈方(boundedlyrationalplayer),相应地有有限理性博弈。完全理性包括理性知识、分析推理能力、识别判断能力和准确行为能力等多方面完美性要求,其中任何一方不完美就不是完全理性。但有限理性有多种情况和层次:较高的层次和较低的层次。有限理性意味着博弈方往往不会一开始就找到最优策略而是会“在战争中学习战争”,必须通过“试错”来寻找较好的策略。,在有限理性博弈中具有真正稳定性和较强预测能力的均衡,必须是能够通过博弈方的模仿、学习的调整过程达到的,具有能经受错误偏离的干扰的均衡,是在受到少量干扰后仍然能够“恢复”的均衡。这时博弈分析的核心不是博弈方的最优策略的选择,而是有限理性的博弈方组成的群体成员的策略调整过程、趋势和稳定性,这里的稳定性是指采用特定策略的成员的比例不变,而非某个博弈方的策略不变,5.1.2有限理性博弈分析框架,有限理性博弈分析的关键是确定博弈方学习和调整的模式(机制),进化博弈主要采用的是生物进化的“模仿者动态”机制模拟博弈方的学习和动态调整,但由于博弈方的学习能力的差异,需要多种机制来模拟。,最优反应动态:有快速学习能力的小群体成员的反复博弈复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈进化稳定策略(ESS),5.2最优反应动态,5.2.1协调博弈的有限博弈方快速学习模型5.2.2古诺调整过程,5.2.1协调博弈的有限博弈方快速学习模型,前提:少数有快速学习能力的有限理性的博弈方之间的反复博弈和策略进化这种分析框架对博弈方的理性假设为相当快的学习能力,虽然在复杂局面下准确判断分析和运用预见性的能力较差,但它们能对不同策略的结果作出比较正确的事后评估并相应地调整策略。,5.2.1协调博弈的有限博弈方快速学习模型,通过纳什均衡分析不难发现,该博弈有两个纯策略纳什均衡A,A)和(B,B)。这两个纳什均衡中,后者明显帕累托优于前者。前者是相对于后名的风险上策均衡。因此、如果是在完全理性博弈方之间进行这个博弃,通常的预测结果应该是(B,B),但如果我们考虑博弈方相互对对方理性的信任问题,或者对风险的敏感性等因素,那么风险上策均衡(A,A)可能是更好的预测:也就是说,由于该博弈是一个有多重纳什均衡的博弈,因此在一次性博弈中,博弈结果也有不确定性,很难作出完全保险的预测。这种协调博弈正是人们在决策方面经常遇到的难题。,5.2.1协调博弈的有限博弈方快速学习模型,假设共有5个博弈方分别处于如图中圆周上的5个位置上(可理解为5户居民环山而居),每户居民都与各白的左右邻居反复博弈。,反应、策略调整规则推导,假设为在t时期博弈方i的邻居中采用A策略邻居的数量,该数量有0、1、2三个可能的值。采用B策略邻居的数量相应为2,也有0、1、2三个可能值。,由于取0、1、2三个整数。因此上述反应规则实际就是。如果在t时期博弈方i的两个邻居中只要有1个采用A,那么博弈方在在t1时期采用A如果两个邻居都没有采用A。那么博弈方i在t1时期采用B。特点:博弈方i在t1时期的策略与自己在第t期采取策略反而没有直接关系;,最优反应动态模拟:初次博弈1个A,5个博弈方经过4个时期的调整,最终收敛到了所有博弈方都采用A的稳定状态。,初次博弈相邻2个A,初次博弈相连3个A,结论:除了初次博弈时所有博弈方都采用B的一种情况以外,从其余所有的情况出发,经过或多或少时期的最优反应动态法则的调整,最终都会收敛到所有博弈方都采用A的稳定状态。,上述分析证明了在上述设定下,所有32种可能种初次博弈情况中,只有一种是稳定于所有博弈方采用B的状态,其余31种都会收敛到采用A的状态。这说明所有博弈方都采用A策略和所有博弈方都采用B策略都是有限理性博弈方进行协调博弈的稳定状态。,所有博弈方都采用A的稳定状态是具有稳健性的,相反,所有博弈方都采用B的均衡状态却不是稳健的。,在上述协调博弈最优反应动态的两种稳定状态中,只有所有博弈方都采用A的一种同时具有在博弈方的动态策略调整中会达到,又对少量偏离的扰动有稳健性两个性质。同时具有这两种性质的稳定状态,在进化博弈论中被称为“进化稳定策略”,A称为进化稳定策略,B则不是进化稳定策略。因为一旦某个博弈方偏离B,那么最优反应动态会使博弈方的策略离该状态越来越远,因此该均衡并不是真正稳定的。,5.2.2古诺调整过程,古诺模型反应函数,1博弈方12.5博弈方23,最优反应动态模拟:,不难看出,上述动态调整过程趋向收敛于两寡头各生产2单位产量,也就是完全理性博弈的古诺产量,也就是惟一的纯策略纳什均衡。这正是这个有限理性博弈的稳定状态,由于这个稳定状态也具有对微小扰动的稳健性,因此它是这个博弈在上述最优反应动态下的进化稳定策略(ESS)。,假设:这两个博弈方都是有限理性的,但都属于知道自己的反应函数(意味着知道自己的利润函数),只是不知道对方的利润、反应函数,也没有预见能力。,21.51.75,32.2152.25,41.8751.9375,5.3复制动态和进化稳定性:两人对称博弈,5.3.1签协议博弈的复制动态和进化稳定策略5.3.2一般两人对称博弈复制动态和进化稳定策略5.3.3协调博弈的复制动态和进化稳定博弈5.3.4鹰鸽博弈的复制动态和进化稳定策略5.3.5蛙鸣博弈的复制动态和进化稳定策略,5.3.1签协议博弈的复制动态和进化稳定策略,签协议博弈:,两个纯策略纳什均衡:(同意,同意),(不同意,不同意),前一个纳什均衡帕累托优于后一个纳什均衡。假如是在完全理性的基础上进行该博弈,可以预期结果是(同意,同意)。,下面是在理性层次较低的有限理性博弈方组成的大群体成员随机配对反复博弈的分析框架内进行分析。,5.3.1签协议博弈的复制动态和进化稳定策略,假设群体中采用“同意”博弈方的比例x,则不同策略期望得益和平均得益为:,签协议博弈:,根据上述结果可以看出,除非x0(即所有博弈方都是“不同意”类型),否则两类博弈方的得益就有明显差异,“同意”类型博弈方的得益高于“不同意”类型的,也高于平均得益(因为0x1),“不同意”类型的则低于“同意”类型的得益和平均得益。只要博弈方有基本的、包括直觉和经验的判断能力,早晚会发现上述得益差异,得益较差类型的博弈方或早或迟会发现改变策略对自己是有利的,并开始模仿另一种类型的博弃方。这意味着两种类型博弈方的比例x和1x不是固定不变的,而是随时间变化的,可以写成时间的函数。,博弈方策略类型比例动态变化是有限理性博弈分析的核心,其关键是动态变化的速度模仿的速度取决于两个因素,一是模仿对象的数量大小(可用相应类型博弈方的比例表示),因为这关系到观察和模仿的难易程度;二是模仿对象的成功程度(可用模仿对象策略得益超过平均得益的幅度表示),因为这关系到判断差异的难易程度和对模仿激励的大小。以采用“同意”策略类型博弈方的比例为例,其动态变化速度可用下列微分方程反映:,动态微分方程的相位图,稳定状态、不动点:x*=0,x*=1,可以看出,只有开始时所有博弈方都采用“不同意”策略,没有一个博弈方采用“同意”策略,即x0。除此以外,该博弈从其他所有初始情况出发的复制动态过程,最终都会使所有博弈方都趋向于“同意”,也就是x1。,需要注意的是,即使上述学习过程已经停止了,意味着所有博弈方都通过学习找到了最好的策略,也不能排除博弈方还会“犯错误”,也就是说博弈方仍然可能偏离上述复制动态收敛到的纳什均衡策略。这给我们提出的进一步问题是:如果博弃方的策略偏离复制动态收敛到的稳定状态,学习过程是否还会再回到同样的稳定状态?或者换句话说,复制动态收敛到的稳定状态对于少量“错误”的干扰具有稳健性吗?,进化稳定策略的检验,因为且接近于1,因此犯错误博弈方的期望得益远远低于没有犯错误的博弈方,也远低于群体平均得益,因此犯错误的博弈方会逐步改正错误,最终仍然会趋向于x1,即所有博弈方都采用“同意”策略。,进化稳定策略的检验,5.3.2一般两人对称博弈复制动态和进化稳定策略,一般模型,进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置是无差异的。其中a、b、c、d可以是任何得益,根据问题设定。,复制动态分析,复制动态的进化规则是生物学中生物特征进化规则设x为采用策略1的比例,复制动态相位图,复制动态方程:,复制动态分析,复制动态的进化规则是生物学中生物特征进化规则设x为采用策略1的比例,复制动态相位图,复制动态方程:,稳定性定理:设,稳健状态处F(x)的导数F(x),即该处切线的斜率小于0。,dx/dt,复制动态方程:,复制动态相位图,根据稳定性定理,x=0,x=1是该博弈的进化稳定策略,而X11/61不是该博弈的进化稳定策略。,5.3.3协调博弈的复制动态和进化稳定博弈,5.3.3协调博弈的复制动态和进化稳定博弈,dx/dt,复制动态相位图,根据上述复制动态相位图我们进一步可以得出结论,那就是当初始的x水平落在区间(0,11/61)时,复制动态会趋向于稳定状态x0,即所有博弈方都采用策略2。而当初始的x水平落在区间(11/61,1)时,复制动态会趋向于x1,即所有博弈方都采用策略1。,5.3.3协调博弈的复制动态和进化稳定博弈,dx/dt,复制动态相位图,如果初次进行这个博弈时群体成员采用两种策略的比例落在o,1区间任点的概率相同、那么通过复制动态最终实现前一种更高效率进化稳定策略均衡的机会是11/61,实现后一种相对较差进化稳定策略均衡的机会都有50/61,后者得益明显大于前者。,这个结论也说明,有限理性博弈方通过复制动态的学习和策略调整,也并不定能实现最理想的结果,并不一定能实现最优化,往往只能实现次佳的结果。上述结果的另个重要意义是,复制动态进化博弈的结果常常是取决于带有很大偶然性的初始状态的,事实上这也正是为什么在相似的规律作用下,事物的形态特点会如此丰富多彩的根本原因。,5.3.4鹰鸽博弈的复制动态和进化稳定策略,该博弈的纳什均衡取决于v和c的具体数值。,5.3.4鹰鸽博弈的复制动态和进化稳定策略,这是一个22对称博弈,因此可以直接用22对称博弈复制动态的一般公式。,设x表示采用“鹰”策略博弈方的比例,则采用“鹰”策略博弈方比例的复制动态方程为:,取v2,c12,则复制动态方程为:,三个稳定状态分别为:x*0,x*1和x*1/6。因为F(0)0,F(1)0而F(16)Pm,这时候两雄蛙都不鸣是该博弈惟一的纳什均衡。因为在这种情况下鸣叫总是不合算的,不鸣叫是双方的上策。,根据上述假设,首先可知:Pzmz是成立的。,如果mz0,也就是mz,但Pz1m仍然成立,则p1mzm。,此时还存在一个混合策略的纳什均衡,两蛙都以一定的概率随机决定是否鸣叫。,根据上述假设,首先可知:Pzmz是成立的。,如果在mz0的情况下,pz1m。,那么两雄蛙都鸣叫是惟一的纯策略纳什均衡,因为此时鸣叫对两雄蛙来说都是上策。,蛙鸣博弈不同均衡的条件,分析结论说明:在这个蛙鸣博弈中,除了鸣叫与不鸣叫在吸引雌蛙和获得交配机会方面的差异以外,鸣叫的成本代价大小也是决定雄蛙是否鸣叫的关键因素。,mz,pz1m,pz1m,mz,mz,m,0,蛙鸣博弈复制动态方程和不动点,x鸣叫雄蛙比例,可能的不动点:x*=0 x*=1x*=(m-z)/(1-p),复制动态方程,蛙鸣博弈复制动态相位图,dx/dt,0(m-z)/(1-P)1,蛙鸣博弈复制动态相位图,当0(m-z)/(1-P)1时,,有3个稳定状态:x*=0,x*=1,x*=(m-z)/(1-p),其中只有x*=(m-z)/(1-p)是进化稳定策略。,这意味着如果上述由环境条件等决定的蛙鸣的利益关系是稳定的,那么一旦发生少数雄蛙从不鸣到鸣叫的变异,那么这种变异雄蛙的数量会不断增加,直到达到占整个雄蛙数量的比重为x*(mz)/(1P)。如果雄蛙中鸣叫雄蛙所占比重超过这个水平,甚至全部是鸣叫的,那么这时候少量不鸣叫的变异则又会在种群中扩散,因为此时不鸣叫雄蛙“搭便车”的机会和利益特别大,最终仍然会回到x*(mz)/(1P)的均衡比例。,蛙鸣博弈复制动态相位图,当(m-z)/(1-P)1时,有2个稳定状态:x*=0,x*=1,根据该相位图可以看出,现在的进化稳定策略是x*=1,也就是所有雄蛙都鸣叫。这种情况在青蛙的天敌较少,而且气候不是很寒冷,从而鸣叫的好处大大超过成本代价时是合理的。,5.4复制动态和进化稳定性:两人非对称博弈,5.4.1市场阻入博弈的复制动态和进化稳定策略5.4.2非对称鹰鸽博弈的进化分析,5.4.1市场阻入博弈的复制动态和进化稳定策略,这个博弈的两个博弈方既不是同时选择,且策略选择和得益情况也不对称,因此是一个非对称的两人博弈。,两个纳什均衡策略组合,即(进,不打)和(不进,打击)。,(进,不打击)是子博弈纳什均衡。,分析框架:反复在两个群体中各随机抽取一个成员配对进行博弈,博弈方的学习和策略模仿局限在他们所在的群体内部,策略调整的机制仍然是与两人对称博弈中相似的复制动态。,5.4.1市场阻入博弈的复制动态和进化稳定策略,在有限理性基础上分析,假设博弈方1位置博弈的群体中,采取“进”策略的博弈方比例为x,那么采用“不进”策略的比例为1x;假设博弈方2位置博弈的群体中,采取“打击”策略的博弈方比例为y,那么采用“不打击”策略的比例为1y。则,博弈方1位置博弈群体复制动态相位图,dx/dt,博弈方2位置博弈群体复制动态相位图,.,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业科技示范园生态农业技术集成与应用评估报告
- 2025年铲车科目4考试题及答案
- 2025年简笔画构图考试题及答案
- 2025年山东乐理考试题及答案
- 2025年新概念日常考试题及答案
- 2025年线切割试题及答案
- UPS课件教学课件
- 2025年叉车课件题目及答案
- Scratch队列课件教学课件
- 广东省茂名市高州市四校联考2024-2025学年七年级上学期语文12月月考(第十六周素养展评)试卷(含答案)
- 电工电子技术项目教程(第3版)高职PPT完整全套教学课件
- solidworks高级培训钣金件经典课件
- 水污染控制教程第十二章+活性污泥法
- 反应釜泄漏事故应急处置卡
- GA/T 1556-2019道路交通执法人体血液采集技术规范
- GA 1800.5-2021电力系统治安反恐防范要求第5部分:太阳能发电企业
- 《大众传播学研究方法导论(第二版)》课件第一章 导论
- 2023年方正县林业系统事业单位招聘笔试题库及答案解析
- 《基于EXCEL动态模型的定量与定性分析【3000字论文】》
- 中级会计《经济法》最新精编必刷550题(后附答案解析)
- 新计算国民经济评价
评论
0/150
提交评论