已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第置属,匕窠料炙智研宠生攀术伦瑷f2012j蜈蚣博弈悖论成因探析张峰,赵绪涛北京理工大学人文与社会科学学院摘要:蜈蚣博弈悖论是典型的逆推归纳法悖论之一,在蜈蚣博弈中应用逆推归纳法推理得到的理论预测人 们在直觉上认为是不合理的并且与现实博弈的结果不符,博弈结构的信息的差异对局中人的决策造成影响 是主要原因,如收益情况会影响主体的直觉感受,局中人的身份影响局中人做出决策时的信念。可以将各种影响决策的主观因素纳入信念影响决策的假设中,为进一步建立恰当的模型奠定基础关键词:逆推归纳法,蜈蚣博弈悖论,博弈逆推归纳法(backward induction,bi)主要用于求解完全且完美信息动态博弈,从动 态博弈的最后一个阶段局中人的行为开始分析,向后推理逐步倒推直到博弈开始阶段局中人 的行为选择,从而求得局中人的最佳策略。逆推归纳法是完全归纳推理,就单一的逆推归纳 过程来说,推理过程是演绎的,所以得到的结论应该是必然的。逆推归纳法有两个基本假设: 理性人假设和理性的公共知识(common knowledge ofrationality,ckr)假设。蜈蚣博弈悖论是一种典型的逆推归纳法悖论,运用逆推归纳法得到蜈蚣博弈唯一的子博 弈完美纳什均衡路径,分析的结果却与人们的直觉很不致,并且与实验、现实博弈结果都 出现偏离,“在这个博弈中,从个体理性出发的最优选择最终会导致极差结果的问题,发展 到了极致,【li。1蜈蚣博弈悖论蜈蚣博弈是一种完全且完美信息的动态博弈,两个局中人轮流决策,并且都清楚的知道 博弈结构的信息,前一轮的决策可以在之后阶段观察到。以下以图l所示的四阶段蜈蚣博弈 为例进行分析,蜈蚣博弈可以是有限任意长的。第三,匕柬#炙霄研究生学术伦坛reol力图1蜈蚣博弈、,6毒iittttp、一、ii60、f&吣注:t=获取(take),p=放弃(pass);括号内为a、b的收益:(a的收益,b的收益);a、 b轮流做出决策,标明a和b的节点表示在该节点上局中人a或b有决策权,局中人做 出一个决策称为一个博弈的阶段;y为5个可能的博弈结果;y=5,表示b在第四阶段上 选择了“放弃”。本例的收益为金钱,单位为元。显然,蜈蚣博弈有如下几个特点:1a、b收益总体随着博弈进行越来越高。本例中,a、b的收益在每个阶段会加倍并且交换位置。2a在第二阶段博弈结束的收益低于第一阶段博弈结束时的收益。并且第二阶段b有决策权,a无法控制博弈。3a的决策一定程度上决定了整个博奔。如果a在第一阶段结束博弈,那么b没有进行决策。运用逆推归纳法进行推理,局中人为了使自身利益最大化,在博弈的每个阶段,有决策 权的一方都会为了防止下一个阶段对方做出不利于自己的选择而结束博弈,推理的结论就是, 博弈在第一阶段结束,a先决策,选择“获取”,得到40元,b得到10元。然而,只要渡过第二个阶段,无论如何a得到的收益都会比第一阶段结束博弈获得的 收益多。如果本例的博弈足够长,a的收益将会更大,比如第30阶段结束博弈,a的收益 将高达约6亿7千万元之巨,相比之下第一阶段结束博弈得到40元的收益简直微不足道。按照逆推归纳法的预测,a将无视第一阶段之后可能得到的巨大收益,直接“获取”第一阶段 的40元收益,但是不论直觉、实验、还是现实中的这种博弈,a大都不会立刻结束博弈, 这与理论预测的第一阶段结束博弈是不一致的121。逆推归纳法是适用于蜈蚣博弈的一种逻辑 严密的推理方法,但得到的结论与现实中的博弈不符合,即一种逻辑严密的推理方法得出与 现实不符的结论,这就是蜈蚣博弈悖论。第三北京并雯蕾研究生拳术伦羞f2012)2局中人a的决策分析蜈蚣博弈与实际不一致的关键就在于局中人a的决策。根据推理,蜈蚣博弈在局中人a 的第一次决策就会结束,但是在蜈蚣博弈实验中局中人a在第一阶段选择“获取”使博弈结 束的概率非常小,如表1、表2所示。显然,这与逆推归纳法解(蜈蚣博弈在第一阶段结束) 有着明显的偏离。表1蜈蚣博弈实验结果口1博弈实验实验次数低收益四阶段281、2010010443 14高收益四阶段1001537321l 5六阶段281218561087122 4注:表示在第四阶段b选择“放弃” 表2蜈蚣博弈实验中局中人h第一阶段选择“获取”的条件概率 i博弈实验低收益四阶段高收益四阶段六阶段lo07015o0l实际博弈中,局中人a为什么没有在第一阶段结束博弈?主体做出决策的基本过程是, 主体拥有正常的逻辑思维并尽量使自身利益最大化,在接受到博弈相关的信息后,对信息进 行逻辑处理,得出决策付诸实施。因此,可以看到3个对决策有重要影响的因素;1博弈的 信息,以及主体对博弈信息接受和理解的程度;2在处理博弈信息的时候,主体的知识水平、 信念、偏好等因素;3主体对决策计划的执行程度。局中人a在蜈蚣博弈中首先进行决策,此时,他所拥有的和博弈有关的信息有:蜈蚣 博弈中的理性人假设前提,即博弈双方在一般情况下会试图得到自身的最大利益;博弈的信 息结构,包括收益情况,博弈的机制;其它和博弈关联程度不大的信息,比如,在一个蜈蚣 博弈实验中,实验的地点、实验目的、设置实验的研究者的身份等。其中,蜈蚣博弈的结构 信息和博弈的过程机制,是可以确知的,这些信息成为局中人进行理性判断的基础。但是,“博弈对手是理性的”并不一定是真的,对于一个陌生人,人们无法知道他是不是理性的,也 许他是一个偏执狂、一个彻底的利他主义者等等,尽管大多数时候,人们以为其他人都是“理 性的,或者至少“刁i是非理性的”。这种想法,就是一种信念。信念与真假没有必然联系,主 体完全可以相信 个实际l为假的命题141。如“博弈对手是理性的”这个命题完全可能是假的, 但主体依然可以相信,并且据此作出决策计划。面对蜈蚣博弈这种博弈结构的信息,局中人a知道“a、b知道博弈进行到第四、五阶4-44第三兜宗再史蕾研宅生拳术伦瑷f20_2j段a、b都会得到比第一、二阶段更高的收益”并且知道“b不知道a在第三阶段是否选择放 弃,使博弈进入后面的阶段”,但是a不知道b在第二阶段会如何决策,所以a如果想得到 第三阶段或之后阶段的较第一阶段高的收益,必须做个选择,选择是否相信b在第二阶 段会做出对自己有利的决策(即“放弃”),使博弈进入之后的阶段。如果不相信,a将在第 一阶段结束博弈:如果相信,则选择“放弃”由b决定是否进入第三阶段。命题“局中人b有 合作精神,使蜈蚣博弈进行到第五阶段”可能是一个假命题,即使如此a也可能相信它并以 此为据进行决策。显然,此时影响局中人a决策的并不是其对博弈结构信息的了解,而是其如何决策的 信念【51。根据前面的决策做出流程,影响局中人信念的是博弈的信息。我们认为有2个因素 是影响局中人a对!b有合作精神”的相信程度的主要原因:一个是博弈的收益情况;另一个是对手的身份。(5)收益信息是影响博弈中主体直观感受的主要原因收益情况是一个博弈最重要的信息之一。蜈蚣博弈中,博弈双方完全知道双方各种情况 下的收益情况,这也成为局中人理性决策判断的最主要的依据。蜈蚣博弈的逆推归纳法解在 直觉上是如此的不合理,主要是博弈的收益情况造成的。比较以下收益情况: 1a、b每个阶段的收益差别微小,比如收益为:yl=(99+4 x 10圳o,99+1 x 10圳o):y2=(99+2 x 10_1,99+8 x 10100); y3=(99+16 x 10-1,99+4 x 10100); y4=(99+8 x 10q00,99+32 x 10100);ys=(99+64 x 10。100,99+16 x 10-1);这时整个博弈第一阶段和第198阶段的收益相差无几,面对可以忽略的收益差别,局中人的 主观偏好将对博弈进行到哪个阶段起重要作用,也许a为节约时问会立刻结束这个蹲弈。 2每个阶段a的收益远远大于b的收益,但是a、b在每阶段各自的收益差别不大。比如收 益为:y1=(99+4 x 10q00,1);ad第三属,匕棠tr9巳蕾研疙生学术伦纭f2012jy2=(99+2 x 10圳o,8);y3=(99+1610100,4); y4=(99+8 x 10100,32); y5=(99+64 x 10100,16)这时看上去b进行合作使a更多的收益的可能性十分小。因为每个阶段a的收益比b多太 多了,而每个阶段a自己的收益又差不多,所以无论如何收益对a而言都是有利的。 3a的收益在第一阶段和第二阶段相差巨大,b的收益每个阶段差不多。a、b在每个阶段 的收益差别很大。比如收益为:y1=(99+4 x 10-100,1); y2=(2,8);y3=(99+4 x 10100,4);y4=(99+8 x 10100,32); ys=(99+64 x 10100,16)这时,a冒险进入第二阶段的可能性微乎其微,因为a在前两个阶段的收益差别太大 了,a在有决策权的阶段拿到与第三阶段及之后阶段相比差不多的收益而不必冒拿到微小的 收益危险,是十分符合情理的。以上三种不同的收益情况,对于理性人假设而言并无本质不同,同样可以用逆推归纳法 推理,对逆推归纳法的预测没有影响。然而对局中人信念和理性计划产生巨大影响。比如y1, 收益情况的差别十分微小,这种差别不足以影响局中人的决策或影响程度很小。而支付差距 大的时候,如y2、y3,一旦对方有决策权时可能自己的收益会非常小,那么即使198步的收 益可能很大,局中人也不太可能冒险。运用逆推归纳法推理以上三种收益情况的蜈蚣博弈,得到在第一阶段结束博弈的结论并 不能说违反了直觉,三种情况在第一阶段结束博弈都是合情合理的,尤其是y3的情况,直觉 会判断在笫一阶段结束博弈是a最明智的选择。我们还可以举出更多不同的收益情况的例子,以说明直觉是一种过于主观和随意的判断方式。蜈蚣博弈只有在某些收益情况下的i尊弈 结果和逆推归纳法解偏离时才会违背直觉,而有很多收益情况并不违背直觉。“蜈蚣博弈的 逆推归纳法解违背直觉”并不是一个严格的说法。直觉是一个过二j二主观的概念,很难严格的 做出可操作的标准来界定如何就算是违背直觉。446第三北窜*雯譬研究生学术伦坛fz012j4局中人身份是影响决策的主要原因不同的收益情况影响了观察者的直觉判断,在完美且完全信息的蜈蚣博弈中,局中人在 博弈开始前对博弈信息完全掌握同样是观察者的身份,因此博弈开始前,收益信息已经深刻 影响局中人的信念进而将影响其博弈决策的做出。此外,博弈对手身份的信息,也将影响局 中人的信念。考虑最一般的情况,a、b相互完全不了解,完全不知道对方的任何信息(如习惯偏好、 受教育程度、年龄、性别、职业等等),而蜈蚣博弈的机制使a在最开始无法通过策略影响 b,因此对b的策略没有任何信息。a对b如何决策的预测,只能进行主观的猜测,所以a 的选择可以算一种赌博。也许保险起见,a应该慎重的选择结束博弈拿走可见的较大收益。然而面对博弈之后阶段的高收益,a或许会认为b会和自己一样,期待得到更多的收益,a 将希望b与自己达成“沉默的合作”,得到更大的利益。在没有任何更多关于b的信息,并 且也没有更多策略可以限制b如何决策的情况下,a如果期待更大的利益,唯一有效的方 法是将决策权交给b,看b将如何反应。考虑另一种情况,a、b在一定程度e是相互了解的,或者通过某种方式(比如交流、约定 合作等)在博弈开始前得到了有关对方的信息,这等同于增加了判断对手如何决策的信息。我们 甚至可以假定更极端的情况:2个相互有深仇大恨的人,彼此断然不肯给对方任何超过自己的机会。 2人偶然间同时参加了同个蜈蚣博弈实验,在博弈开始之前认出了对方,但是在特定的情况下2人没有办法交流并且只能继续实验。实验组织者并不知道这一信息。在接下来的1000次实验中, 博弈次序是随机的,实验组织者惊奇的发现实验结果与逆推归纳法解完全吻合,每次博弈都是第 一次结束,其实是因为a、b是完全对抗的身份造成了这种结果。对蜈蚣博弈的一般讨论并没有区分a、b的身份,a、b的身份对蜈蚣博弈的结果有重 要的影响。如果a、b在博弈中的角色是完全对抗的,那么逆推归纳法得到的预测将不会与 现实发生偏离。现实的博弈中局中人并不会对对手毫无信息可以推测其策略,哪怕也许只是一厢情愿的信息,当完全不了解对方的身份的时候,任何一点信息都可能对信念产生巨大的 影响,从而影响其策略。比如,在实验中,一个健康的人知道对手是残疾人,很可能前者会 产生给对手更多机会的想法。前者在博弈时本能得认为“把决策机会留给后者”是一个让自己 的爱心得到满足的决策,如果将这种满足折算为收益,根据其爱心程度,可能会远远高于博 弈的收益,那么,他主观上就会认为所做的选择是收益最大化的,在博弈中会更多得使博弈 进行下去。447莘三屠北京粹炙智研究生学术伦坛f20j2j 将主体的主观感受在某种前提假设下折算为收益,计入蜈蚣博弈的总收益,从而建立模型分析和预测博弈结果,是许多学者采取的研究方式16j【7l【8】【91,如文献【8】、【9】建立的模型在 蜈蚣博弈悖论的利他主义解释的基础上用l理效应”衡量利他程度,将心理效应对主体策略 选择的冲击折算为收益计入蜈蚣博弈的总收益;按照这种思路,我们可以将信念改变对主体 进行决策造成的影响,折算为收益。在蜈蚣博弈的每个阶段,局中人有2个决策:“放弃”和“获取”,局中人选择“放弃”时, 一定是因为她认为应该选择“放弃”(如果她彻底的执行了她的决策计划)。博弈的某个阶段, a,b博弈收益为,a、b的信念改变对决策造成的影响折算为收益记为,a的折合收益为, 在局中人a的信念对决策的影响结束要做出决策时,她有选择放弃巧印“不选择放弃”两种信念,如果她认为“必须选择放弃”,则相当于,将小于其后任何阶段a的收益;如果a认为“绝 不选择放弃”,则,将大于之后任何阶段的收益。这样,我们就可以把各种将主体主观因素 折算为收益的模型纳入信念改变影响决策的这个假设中,只要考虑主观因素最终使局中人在 多大程度上认为应该“选择pass”即可确定的范围,并最终得出总的收益。四、结论主体信念的改变有很多影响因素,在蜈蚣博弈中,我们认为收益信息的不同情况,以及 局中人的身份是主要的因素。不同收益信息对直观感受的不同影响,“蜈蚣博弈的逆推归纳法解违背直觉”是个不严 格的说法。蜈蚣博弈的收益情况是引起人们在直觉上认为逆推归纳法解不合理的主要原因, 不同的收益情况影响了观察者和局中人的判断。在特定收益情况下,逆推归纳法解将不会违背直觉。局中人身份是影响局中人信念的另一个主要原因,对手是否有合作精神的了解程度、自 己是否有利他倾向等等,都会影响决策,这就导致了实际的蜈蚣博弈并不会像逆推归纳法预 测的那样在第一阶段结束。在局中人角色完全对抗的情况下,博弈结果不会偏离逆推归纳法 解。在局中人没有除博弈之外的利害关系时,局中人倾向于相信对手有合作精神,并且在博 弈的第一个阶段先决策者没有其他措施限制和影响后决策者的策略,在适当的收益情况下, 冒一定风险继续博弈是合理的选择。更进一步,信念的改变会影响局中人的决策,可以将这种影响折算为收益计入蜈蚣博弈 的总收益,这样,就为主体主观因素折算为收益的模型提供了统一的框架,为进一步建立合 理有效的预测分析模型奠定了一定的基础。448第三兜柬*雯蕾研宠生掌术伦莒f20卫2j参考文献【1】谢识予经济博弈论fml上海:复旦大学出版社,2007162164【2】张峰蜈蚣博弈悖论引发的思考【j】湖南科技大学学报(社会科学版),2005,8(1):30333mckelvey richard d,palfrey thomas ran experimental study of tlle centipede gamej econometrica,1992,60(4):803-836【4】唐晓嘉,郭美云现代认知逻辑的理论与应用【m】北京:科学出版社2010:1575alexandm baltag,sonja smets,jonathan alexander zvesperkeep hoping for rationality:a solution to the backward induction paradox阴synthese2009,069):301333【6】潘天群交流理性与逆向归纳法悖论的消解川自然辩证法研究,,2005,21(12):25-28【7】何伟,徐飞,陈洁蜈蚣博弈新视角一预期心理的应用【j】上海管理科学,20063:15【8】饶育蕾,王建新,陈永耀基于异质性公平偏好的行为博弈模型与模拟一对蜈蚣博弈实验结果的解释【j】系统工程,2009,270):93-98【9】饶育蕾,张媛,彭叠峰利他偏好是否导致博弈均衡的偏离一对蜈蚣博弈实验的解释【j】系统管理学报,2010,19(6):666-683449第三属北京科炙蕾研究生学术伦羞r20口2janalysis of causes of the centipede game paradoxzhang feng,zhao xu-taoschool of humanities and social sciences,beijing institute oftechnologyabstract:the centipede game paradox is one of typical bac
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高级城市规划师资格考试《城市规划实务》备考题库及答案解析
- 2025年执业医师《外科学综合》备考题库及答案解析
- 商铺物业费代缴协议合同2025年范本
- 商铺电路改造安全协议2025
- 软件开发合同协议2025年源代码归属
- 人工智能模型训练服务合同协议2025
- 汽车租赁服务协议2025年
- 2025年人力资源三支柱模型(COE、SSC、BP)应用考试试题及答案
- 2025年冲突管理与有效沟通考试试题及答案
- 大型泥芯销售合同范本
- 2025年贵州省贵阳市辅警考试真题及答案
- 岩棉硅酸钙板墙施工方案
- 2025年6月25日生效的欧盟REACH法规250项SVHC高度关注物质清单
- 学堂在线 大国航母与舰载机 章节测试答案
- 【MOOC】《研究生英语科技论文写作》(北京科技大学)中国大学MOOC慕课答案
- 安全生产培训的高原作业安全
- 幼儿园教育指导纲要解读
- 油菜品种筛选试验总结
- 工程法语讲义-第一部分-工程总概念
- ECPR临床应用与进展讲座
- 江苏常州BROADWAY不夜城招商手册设计稿
评论
0/150
提交评论