奖励机制在阈值公共商品博弈的作用_第1页
奖励机制在阈值公共商品博弈的作用_第2页
奖励机制在阈值公共商品博弈的作用_第3页
奖励机制在阈值公共商品博弈的作用_第4页
奖励机制在阈值公共商品博弈的作用_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

奖励机制在阈值公共商品博弈的作用摘 要妥善协调合作与解决公共商品的问题有关,比如: 清洁能源和环境保护. 然而,却很少有人知道个人是如何协调自己在一个陌生的大群体中的某种合作的程度. 在一个典型的情况下, 一个建立共识的过程是很少能成功的,因为它缺乏面对面的交流和立场. 在这种情况下合作的改进是利用阈值公益游戏来进行研究的,其中合作盛行时,它最初是足够的,否则它将会灭亡. 而惩罚是塑造人类行为的有力工具,当然, 制度的惩罚往往是过于昂贵的,开始的时候或许只有几个人,这是一个协调的问题. 在本文中,我们表明,无论初始条件,奖励基金是基于自愿的贡献可以被改进的. 自愿的奖励有效得克服了协调问题, 同时有效地转换成一个感知风险小的集体失败的合作开拓了道路.关键词: 公共商品, 博弈, 奖励机制Rewards and the evolution of cooperation in public good gamesABSTRACTProperly coordinating cooperation is relevant for resolving public good problems, such as clean energy and environmental protection. However, little is known about how individuals can coordinate themselves for a certain level of cooperation in large populations of strangers. In a typical situation, a consensus-building process rarely succeeds, owing to a lack of face and standing. The evolution of cooperation in this type of situation is studied here using threshold public good games, in which cooperation prevails when it is initially sufficient, or otherwise it perishes. While punishment is a powerful tool for shaping human behaviours, institutional punishment is often too costly to start with only a few contributors, which is another coordination problem. Here, we show that whatever the initial conditions, reward funds based on voluntary contribution can evolve. The voluntary reward paves the way for effectively overcoming the coordination problem and efficiently transforms freeloaders into cooperators with a perceived small risk of collective failure.Key words:Public goods, Game, Reward mechanism 目 录第一章 绪论1第二章 阈值公共物品博弈模型3第三章 模型结果分析4第四章 总结6参考文献7致谢8 天津理工大学2015届本科毕业论文第一章 绪论在动物社会和人类社会中,合作行为的产生和传播仍然是一个亟待解决的重要课题。因为合作是一种损己利人的行为,无论在生物学系统中,还是在人类社会系统中,合作者相较于坐享其成的背叛者,都处于一种不利的地位。在生物学系统中,这种不利表现为繁衍后代的可能性降低,在社会系统中,则表现为合作行为被系统中其他个体学习的可能性降低。然而,我们知道,在动物社会和人类社会中,合作行为无处不在,这表明在此现象的背后,必然存在能够让合作成为系统中的优于背叛的某种机制。找隐藏在现象背后的机制对于社会学、生物学、经济学等交叉领域具有重要的指导作用。公共物品,如清洁能源和环境保护,是这些地区的可持续的人类社会和失败的积木可以有深远的影响。然而,公共产品的私人供给可以构成挑战,经常协调合作不成功(例如, 1 )。第一,自愿合作提供公共物品存在自利行为。开发者可以依赖他人的努力。在集体行动,协调个体之间通常需要达到合作均衡。否则,不劳而获导致个人的非合作均衡,这便是一个社会陷阱。协调问题已被广泛研究和博弈理论的普遍性是由各种各样的名称表示:协调博弈,保证游戏,猎鹿博弈,志愿者的困境或启动问题 24 。进化博弈模型解决庞大的群体往往建立在合作和背叛的公益游戏而导致的系统有两个平衡(没有合作和一定程度的合作)。因此,它是建立一个机制,允许人口发展对合作均衡的挑战,独立的初始条件。情况最严格的情况下,一致的意见是公共利益的需要,作为唯一可取的初始条件是一个国家几乎所有的合作。理论和实证分析,阐明了现有通信或社会交换的情况下,可以促进合作均衡的选择。很少有人知道,然而,如何平衡选择可以实现从一次匿名在大群体的相互作用,如一个达成共识的过程,是不可能成功的。以往的研究表明,感知风险越高的集体失败,协调合作行动机会更高。最近的研究表明,考虑制度的惩罚也进一步放宽建立合作的初始条件。如果奖励来代替惩罚呢?奖励是研究最多的一种结构方案,在相当大的群体合作,激发合作。而在现实生活中存在的补贴鼓励合作行动系统阵列,这里我们把内源性筹款(见正式奖励)。早期的工作表明,复制动态,从而更成功的策略的进一步蔓延,导致奖励基金在公众良好的游戏合作的动态维护。该模型考虑了三种策略:(一)合作者或(ii)在标准的公共品博弈者,或(iii)一种赏赐,都有助于公共利益和奖励基金。只有那些有助于公共利益被邀请分享奖励基金收益。奖励者甚至可以在人口的叛逃者传播,因为叛逃者被排除在奖励。筹款本身,但是,是自愿的和昂贵的。因此,这种激励方案可以很容易地通过“不劳而获”二合作者有助于公共利益而不是奖励颠覆。在接下来的步骤中,对公益的贡献也是昂贵的,合作者将由“不劳而获”叛逃者流离失所的一阶。这导致了一个摇滚剪刀论文类型的更换周期在三策略。在这篇报告中,我们仅针对与我们课题直接相关的进展进行描述。首先,为了解释合作的产生与传播,国内外的研究者们针对生物学系统和人类社会系统的特点,提出了许许多多不同的用于解释合作行为的机制,并对这些机制进行了大量的理论研究和实验研究3。例如亲缘关系、直接互惠、间接互惠、惩罚、奖励、名誉、风险规避、群体结构化等。其中较为受到人们关注的是惩罚和风险规避两种机制,而奖励机制的理论研究则较少受到人们的关注。然而,惩罚对于整个社会系统的贡献为负值(因为惩罚者需要付出一定的代价来对被惩罚者进行报复,报复的结果也是伤害被惩罚者的利益,因此总体上说,对于社会系统,它起到的是降低社会效益的作用),因此从长远的角度上看,研究奖励机制对合作的促进似乎更加有益。其次,传统的公共物品博弈(public goods game)只能定性地模拟现实生活中的困境,因此找到更加贴近现实的模型,是解决合作演化的一个有效途径。因此,在本课题中,我们将采用阈值公共物品博弈模型4。在这个模型中,只有合作者足够多,才能维护公共资源,进而才能从公共资源中获得更大的利益。即,公共资源的回报率与参与博弈的合作者数量是相关的。具体的说,我们研究的模型是在均匀场(mean-field)网络下的阈值公共物品博弈模型,研究的机制是奖励机制,采用的群体动力学(population dynamics)为复制者动力学(replicator dynamics),研究的目标是确定在何种情况下,奖励能起到促进系统合作的效果,以及能促进到何种程度。2第二章 阈值公共物品博弈模型我们考虑无限大,混合人群从这个人的随机抽样形式游戏组。之后的一个互动,小组解散。我们假设三策略之前:两赏赐和合作者愿意贡献个人成本;背叛者的贡献都没有,不受成本。所有的公共利益只有贡献者的数量提供超过或等于阈值;否则,就是对公共利益的一部分,打折的风险因子,提供。然而,由此产生的效益是每一个球员都一样,不管她/他贡献。个人的利益是由决定的,如果;否则,(图1)。图1 公共商品的回报。每个成员都收到了1如果在M组参保人数超过或等于阈值K的好处(1KN);否则,1P.(在线彩色版。)Figure 1. Step returns in the public good. Each member receives benefits given by 1 if the number of contributors in the group m exceeds or equals threshold k (1 k n); otherwise, 1 p. (Online version in colour.)接下来,我们考虑一个门槛公共物品自愿奖励基金。以前,只有奖励者愿意贡献C 0基金;比赛结束后,综合基金乘以利率r 1将同样在M贡献者共享(我奖励者和M我的合作者)的公益。奖励基金是一个好的俱乐部,除了那些叛逃者。总之,一个赏金赚B(m)C + CR我C,合作者B(m)C + CRI/M和叛逃者B(m)。(可用相应的复制方程的电子辅助材料。)此外,如果奖励基金是非常有益的R n(即边际收益非负,CR/ NC0)奖励基金对二阶贪图便宜是可持续的。因此,我们也可以假设Rn。3第三章 模型结果分析首先,我们看不奖励机制改进的结果。阶跃函数B(m)与中间值K(图1)可以为1kn导致双方没有合作,合作和背叛的混合为一个足够大的风险因子P的双稳态,和K = 1,只有混合合作 10,18 。没有100%如果k = n只发生合作关系的情况下,纯粹的协调,避免集体失败,需要所有参与者之间均匀的合作。它拥有1KN,P的风险大,小(大)一个没有吸引力的(某些)合作均衡 10 。实现双稳态,关键风险因子P*取其最小值在一致同意的情况下。进化的结果奖励者剧烈变化(图2;对于细节的电子辅助材料)。调查分析表明,如果考虑到一定程度的奖励,动态复制第一领导奖励者入侵一个国家所有个人缺陷。个人是更好的回报在混合组(叛逃者和奖励者)只要基金CR最有前途的收益大于总成本C + C。非奖励合作伙伴然后侵入的奖励者人口繁衍。这对任何风险因子P和提供阈值K是常见的,导致了国家在个人合作。图2 阈值的公益游戏奖励资金. 单纯的状态空间表示。三个节点,D:100%叛逃者,C:100%合作伙伴和R:100% 奖励者,复杂的平衡。(一)风险为零(P = 0)。独特的内部均衡问周围的闭合轨道,沿线三策略动态共存。边界的轨道形成循环连接的三个节点。(B,C)的部分协议(1kn)。对于一个小的风险,有可能存在一个稳定的闭合轨道(粗体,黑色线)(B)。当P超出某一临界值,在三策略的组合是不可持续的,只有合作伙伴可以稳定共存的叛逃者在点X2。所有的内部人口的状态发展,这种状态(C)。(D,E)一致(k = n)。当P增加到P *,所有人最终与所有合作均衡C.参数:n = 5,C = C= 0.1,R= 2.5,和(B,C),k = 3。(色彩。在线版)Figure 2. Threshold public good games with reward funds. The simplex represents the state space. The three nodes, D: 100% defectors, C: 100% cooperators and R: 100% 奖励者, are trivial equilibria. (a) Risk zero (p = 0). The unique interior equilibrium Q is surrounded by closed orbits, along which the three strategies dynamically coexist. Boundary orbits form a cycle connecting the three nodes. (b,c) Partial agreement (1 k )。我们注意到,该学位的风险因素并没有影响这一结果的P是一个积极的反馈,因为增加的数量之间的奖励者和跳跃的回报。第二,是因为奖励者cooperators替换与温和的回报,assuming(rn),切换到一cooperators导致增加健身(ccrn0)。最后,在该州的需求是稳定的,尽管事实上,高的单突变体defector SAH组中cooperators净效益。p是足够大的,然而,切换到defection线索到健身的平均损失在defectors瀑布下面是cooperators学院的合作均衡,因此是稳定的。翻译结果转化为适当的协调运动defectorscooperators已获得通过考虑可选的参与机构(21、2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论