在空间最后通牒博弈模型中的防御机制_第1页
在空间最后通牒博弈模型中的防御机制_第2页
在空间最后通牒博弈模型中的防御机制_第3页
在空间最后通牒博弈模型中的防御机制_第4页
在空间最后通牒博弈模型中的防御机制_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

在空间最后通牒博弈模型中的防御机制摘要最后通牒博弈的实验表明,人类热爱公平。当他们在对一笔钱进行分配时,很少人会提出不公平的分配方案,就算有人提出,也很少人能够接受这种不公平的分配方案。同理心和空间化能够促进公平的演化,然而公平演化的过程来源于图案形成,因此连续策略的采用始终阻碍着人们对这一过程的观察。在这篇论文中,我们研究了采用离散策略的空间化最后通牒博弈。研究结果表明,这个简单的改变为我们打开了观察系统丰富多姿的动力学行为的大门。除了混合稳定态,我们还对行波和各策略循环占优的现象进行了报告。在循环中的一个策略可以是两个策略的联合。高度复杂的网状相图(包括连续相变和不连续相变)揭示了人类在追求公平的过程中所暗藏的复杂性。关键字:最后通牒博弈模型 空间化 动力学Defense Mechanisms in the Spatial Ultimatum GameABSTRACTExperiments on the ultimatum game have revealed that humans are remarkably fond of fair play. When asked to share an amount of money, unfair offers are rare and their acceptance rate small. While empathy and spatiality may lead to the evolution of fairness, thus far considered continuous strategies have precluded the observation of solutions that would be driven by pattern formation. Here we introduce a spatial ultimatum game with discrete strategies, and we show that this simple alteration opens the gate to fascinatingly rich dynamical behavior. In addition to mixed stationary states, we report the occurrence of traveling waves and cyclic dominance, where one strategy in the cycle can be an alliance of two strategies. The highly webbed phase diagram, entailing continuous and discontinuous phase transitions, reveals hidden complexity in the pursuit of human fair play.Key Words: Ultimatum Game Spatial Dynamics目 录第一章 引言11.1最后通牒博弈的介绍11.1.1最后通牒博弈论研究意义1第二章 模型及动力学22.1动力学模型的引入22.2动力学部分32.3 蒙特卡洛建模过程3第三章 结果及讨论5第四章 结论14参考文献15天津理工大学2014届本科毕业论文第一章 引言1.1最后通牒博弈的介绍1.1.1最后通牒博弈论研究意义假如两个个体分享一笔钱。其中一个人提出了分割这笔钱,而另一个人可以同意也可以不同意这个提议。他们不可以讨价还价。如果双方同意的话这笔钱可以根据该提案共享。这就是Guth等人提出的通牒博弈的蓝图1。.考虑到在本博弈中回应者会接受即使是这笔钱的一小部分,理性的提议者会要求得到很大份额的一部分钱。然而人们在实验中发现了不同的结果。自私和完全理性的理性人经常让位于情感理性人2。事实上,很大程度上不论性别,年龄,和钱的数额,人们总是拒绝接受在他们看来太小的报价3,4。如果提议者分配的份额低于总资金的30%,回应者很有可能会拒绝提议者的分配。毫不奇怪的是超过三分之二的报价是非常接近公平的五五分成的。这表明在实验情形中,人们是非理性的,为了追求公平(或接近公平),人们可以忍受自身的利益损失。然而,这种非理性的表现形式是什么,通过何种方式可以达到尽可能地公平,对人们来说仍是一个难题。第二章 模型及动力学2.1动力学模型的引入尽管人类对公平分配的喜爱的解释有很多种,如从实用功能5的心理灵感定义到抓住时机的失败(这意味着在博弈结束后会有两个个体之间不会有进一步交流)6,但是理论研究表明,同理心7,8,空间结构9-11,异质性12和声誉度13起到了举足轻重的作用。尤其是K.M. Page9等人已经表明良好混合人群的自然选择喜欢合理的解决办法,而空间性可能会导致更为公平的结果。已经在各种相互作用网络,以及共同进化19针对不同类型的个体和更新规则11对此结果进行了测试14-18,虽然毫无疑问空间结构促进公平的演变,但是有趣的是,如果人口少20或者如果个体是有同理心的,也就是说,如果他们的报价p符合接受水平q 7,那么即使在非空间设置中公平竞争也可能演变。 除了偶尔研究的小版本的最后通牒博弈13,正如p一样,以前的研究作品都侧重于战略的全面连续。q0,1(不失一般性地假设总数额被平分)。这些小版本的最后通牒博弈只考虑了几个有代表性的策略,传统上也一直被用来展示具有普遍意义的原则。在次,通过提议离散战略空间最后通牒博弈,我们从这个概念出发来揭示被格局形成所驱动的解决方案。与小博弈通常有少量精心选择的战略不同,我们仍考虑了p和q的整单位间隔。然而,我们并没有使用连续无限多的策略,而是引入N离散策略Ei,i=0,1,N-1正如图1所示N=5。我们认为Ei是有同理心的个体,其特点是p=q。 但是附加策略A却有不同观点,策略A的特征是它有一个任意的p,q对。最初,我们有N+1个策略概率相等地随机分布在一个L2正方形格子,由此每个个体x被分配到一个p,q对中,与它的提供和接受的水平对应。对于采取战略A中的个体,我们会考虑固定的p和q值作为两个主要参数,这两个参数决定博弈的进化结果。然而采用一个Ei同理心策略的x个体px=qx=r+iN绘制随机实数是为了策略创建(在初始状态或在策略使用过程)。图2.1 某某某某图Fig.2.1 XXXXXX2.2动力学部分初始策略分布的演变是根据蒙特卡洛模拟程序通过重复以下基本步骤来进行的。首先,随机选择的x个体通过与其四个最近的邻居玩最后通牒博弈获得它的收益UX,靠在每一个成对相互作用中一度扮演提议者px一度扮演回应者qx。接着,一个被记为y的随机选择的邻居也以相同的方式获得其收益Uy。最后,x个体按照概率试图对游戏者y强制执行策略w=1+expUy-UxK-1其中K量化噪声的幅度21。在不失去一般性的情况下,我们设置K=0.1,使得有更好表现的个体可以将他们的策略传递给他们的邻居。但也有可能个体们偶尔会向那些表现不好的学习。我们强调在同理心策略Ei, i=0,1.,N-1的模仿过程中,为了py=qy的相应值产生了一个新的随机数r,这是为了考虑到突变的作用,所有这些也在不断的最后通牒博弈中得到了考虑13。相反,对于使用A策略来说继承的(p,q)对保持不变。这使我们能够研究同理心人群对策略A攻击的进化性回应。2.3 蒙特卡洛建模过程对进化过程来说,时间是按蒙特卡洛步骤测量的。在一个蒙特卡洛步骤中,每个玩家都有平均一次机会修改其策略。对于系统的数值分析,我们在变换p和q值时的最后的静止状态确定了策略的一部分。对于有适当精度相图的评价(参照图2),通过使用周期性边界条件,我们使用了L=4006000的相应的系统尺寸。热化和采样时间从ts,tth=104变化到106蒙特卡洛步骤,p和q的值的小的变化被用在相变的附近。在介绍主要成果前,我们简要地调查了充分混合条件下博弈的结果。在策略A消失时,公平的策略比其他同理心策略更好。E2策略也可以支配策略A但只有当q0.5时。对于p0.5,E2和A是中立稳定并且随机漂移的,因此如果人口有限总会导致固定。第三章 结果及讨论图2示出了p和q的函数在最后的静止状态的定性区分相位。如果qp或p0.82,战略A失效,并且系统演变成均匀状态,只有公平的E2战略有效,即该系统再现了以往作品所报道的众所周知的结果并且确认了同理心可能导致公平的演变7,8。但是在互补三角形内,有一个错综复杂的蹼区域,在这个区域有可能有更加复杂的结果。除了单一的(A,E0,E1)和两个策略E0+A,E1+A,E2+A,E3+A的阶段,我们可以观察到三个不同的策略阶段。在这三个阶段,三大策略陷入了周期性的主导地位E0+E1+A,E2+E3+A,或者周期中的一个策略是两个策略E1+E2+A+E2的联盟。需要强调的是,互补三角形内的PQ线下。如果非同理心驱动力(PQ)比取决于p的阈值弱,那么个体A侵入整个系统。另外一大亮点是战略E3的生存,其伪造了当个体报价超过它原有份额时“超公平”行为是不可持续的假设。另外,如相图相应区域所示,完全理性的E0战略在三个阶段仍然有效(表示为E0,E0+A和E0+E1+A)。除此之外,无论是在两个或三个战略阶段,中间战略E1还可以主宰其他策略或与他们共存。要注意的是,在蹼三角形内,公平的E2策略绝不能占主导地位,而且它只发生在比较小型的区域。 从这个观察可以得出结论,当一个不被p=q条件限制的策略存在时,通过同理心方式的公平的演变是相当脆弱的(在例子A战略中)。然而,公平的漏洞不总是源于直接的威胁,在这个意义上,战略A直接优于策略E2,而是源于它提升了其他策略的生存的事实。一个直接的后果是解决方案的高时空复杂度,从简单的两策略联盟到三大策略之间的循环主导地位,以及两种策略和两策略联盟E1+E2+A+E2之间的循环主导地位。图3.1Fig.3.1正如图3三个快照所展示的,策略部分并没有明确定义最终静止状态的所有相关功能。图3分图(a)是带有行进入侵战线和旋转螺旋的自我组织模式的典型快照。他们关系到三大策略之间E1E0AE1at p=0.02 and q=0循环主导地位22的自发兴起。同样的三个策略的共存由根本不同的机制维持,这产生了(b)分图所示的模式,其中p=0.4和q=0。后一种策略分布可以被解释为的E0+ A和E1+ A相的聚畴结构,这代表在表面活性剂的存在下水油混合物的相分离。后一个比喻是由E0+ A和E1+ A阶段的比例下的连续变化(从0到1)所支持的。图3快照(c)显示了另一个三战略状态,其中策略A(黑色)p=0.81和q=0.536使得超级公平的E3策略(橙色)能够生存下来,这在另一方面低于E2策略(绿色)。策略分布是在长瞬态过程之后形成的。也就是说,在很短的时间内随机策略分布演变成由E2主宰的带有一小点A策略的状态。在逐渐增长的A岛的一小部分中,几个E3策略仍然有效,当渗透的条件被满足时,他们的后代持续蔓延在整个系统中。图3.2.1Fig.3.2.1图3.2.2Fig.3.2.2另一个显著的自我组织模式的时间演化由图4中三个连续的快照图显示,这与静止状态对应。因为给定的p,q对出现的循环性主导地位E1E2+AE2E1,E2个体岛屿在E1个体的海上成长。一旦这些岛屿被A感染了,生长就会受阻。这导致了E2+ A相的出现,这反过来又可以被E1入侵。然而在某些情况下,一些E2个体通过形成一个足够大的核子生存,这关闭了循环主导地位的环。我们再次注意到主导环不是由三个策略形成的,例如,E0+E1+A相,而是由两个策略(E1和E2)和两种策略联盟E2+A组成。虽然同样复杂的阶段先前已经在空间生态学模型中报道过24,最近的空间公共物品游戏中也报道过25,目前观察使我们更加认识到这种奇特的解决方案可能比最初设想的更为常见,尤其是在描述人的行为的系统中。最后,我们定量检查了图2所描绘的相变特性,他描述了所有我们在图3和4中以图形描述的不同阶段。图3.3.1表示当p增大,q=0.1时,从纯A相向两战略E1+A相的连续相变,纯A相在两策略E0+A和三策略E0+E1+A相之上。如上所述,三策略E2+E3+A相位可以被视为E0+A和E1+A相的聚域组合。如图3.3.2所示,p值变大时(当q=0.1),性质上类似的连续相变可以被观察到。如图3.3.3所示,如果q增加,p=0.77,两战略E2+A和E3+A相被三策略E2+E2+A通过连续转分离。与此相反,图3.3.4表示从E1+A到E2+A的不持续相变。更有趣的是,当p=0.6483,q=0.27时,分割纯E1相和外来E1+E2+A+E2相的变化线通过三相临界点从持续变化到不持续。如图3.3.5所示,q值变大时变换持续。然而,降低q值时,变换变得不持续,有序参数fE1也逐渐增加,如图3.3.6所示。图3.3.1Fig.43.3.1图3.3.2Fig.3.3.2图3.3.3Fig.3.3.3图3.3.4Fig.3.3.4图3.3.5Fig.3.3.5图3.3.6Fig.3.3.6第四章 结论总之,我们研究了动力学的带有分离策略的空间最后通牒博弈。动力学基于随机模拟相邻策略。策略包括N同理心策略和附加A策略,A策略的特点是固定提出的(p)和接受的(q)值。我们想要强调以同理心参数为特征的可能参数的分离是一个合理的假设,因为人类讨价还价实际上就是按这个方式进行的。我们在低噪音水平对N=5进行了数值分析,以研究策略A存在于结构人群时有同理心个体的反应。然而, 图2所展示的所有主要发现对于更大的N都是合理的.自然,当A策略低于q=p对角线时,更多的同理心的策略提供更多的共同存在的可能性。我们已经测验和证实了所谓的生死策略更新的联盟的出现。在这一策略中,个体被随机选择失效,邻居竞争对应报酬的空位。这个改变也没有改变可能的解决方案,并且事实上导致了相似的相图。因此我们已经表示先前报道的通过同理心和空间性的公平性的演变在A策略中是可行的。此外,我们已经表明附加策略A并不影响当p值变大或者qp时的最终静止状态,因为采用A策略的个体在相当短的转换时间内消失了,最终公平的个体主导这一系统。相反,在p=q线下的A个体可以通过与单独或者有同理心策略联盟生存下来。 除了提到的均质状态,我们已经观察到几种类型的由不同的机制维护的策略共存,主要排在了空间网格的复杂图案的形成。这些解决方案的每种类型都表示一种特定的方式。借助于这种方式,一部分同理心个体可以在非同理心行为中生存。在一些情况下,非同理心策略可以稳定经济人将采用的合理的策略和将被完全慷慨的经济人采用的非理性的策略。同时,多种多样的解决办法突出了该系统对A策略的参数的灵敏度。本模型支持策略协会的自发出现(由特定的时空结构组成的子集策略),这个策略协会在许多人和生物的逻辑系统中发挥基础性作用,正如在这封信中所示。通过统计物理方法,可以在进化博弈的理论框架内研究。参考文献1 W. Gu th, R. Schmittberger, and B. Schwarze, J. Econ. Behav. Organ. 3, 367 (1982).2 K. Sigmund, E. Fehr, and M. A. Nowak, Sci. Am. 286, 82 (2002).3 R. H. Thaler, J. Econ. Perspect. 2, 195 (1988).4 G. E. Bolton and R. Zwick, Games Econ. Behav. 10, 95 (1995).5 G. Kirchsteiger, J. Econ. Behav. Organ. 25, 373 (1994).6 E. Fehr and K. M. Schmidt, Quarterly J. Econ. 114, 817 (1999).7 K. M. Page and M. A. Nowak, Bull. Math. Biol. 64, 1101 (2002).8 A. Sanchez and J. A. Cuesta, J. Theor. Biol. 235, 233 (2005).9 K. M. Page, M. A. Nowak, and K. Sigmund, Proc. R. Soc. B 267, 2177 (2000).10 T. Killingback and E. Studer, Proc. R. Soc. B 268, 179711 J. Iranzo, J. Roman, and A. Sanchez, J. Theor. Biol. 278, 1 (2011).12 R. da Silva and G. A. Kellerman, Braz. J. Phys. 37, 1206 (2007).13 M. A. Nowak, K. M. Page, and K. Sigmund, Science 289, 1773 (2000).14 M. N. Kuperman and S. Risau-Gusman, Eur. Phys. J. B 62, 233 (2008).15 V. M. Equluz and C. Tessone, Adv. Compl. Syst. 12, 221

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论