囚徒困境论文关于囚徒困境的解决方式探析论文范文参考资料_第1页
囚徒困境论文关于囚徒困境的解决方式探析论文范文参考资料_第2页
囚徒困境论文关于囚徒困境的解决方式探析论文范文参考资料_第3页
囚徒困境论文关于囚徒困境的解决方式探析论文范文参考资料_第4页
囚徒困境论文关于囚徒困境的解决方式探析论文范文参考资料_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

囚犯困境论文关于囚犯困境的解决方法探析论文迷文的参考资料摘要:本文通过对非合作游戏囚犯困境的简单模型和霍布斯人类原始状态的分析,探讨了人们困境结构中理性和行为特征,提出了几种可能的困境解决方案。 研究了高德理性分析和在人们追求利益的同时,在复杂行动模式达成协议的联盟中形成道德规范是解决囚犯困境的最佳方法。关键词:游戏道德规范联盟虽然我们对囚犯困境面临的问题已经很熟悉,但是本文在前人的基础上,试图通过博弈论囚犯模型提供的抽象的比较简单的模型分析,来解释囚犯困境问题的解决。 表明道德是解决囚犯困境的最佳途径。博弈论研究的对象是博弈论,它是相互作用状况的规范模型,至少涉及两个参与者。 参加者的游戏被称为决策问题。 人们的行为相互作用时,根据当事人能否达成有约束力的协议(即能否公开地“勾结、共谋”),可以将游戏分为合作游戏和不合作游戏。 前者有约束力,后者没有约束力。 关于“囚犯困境”游戏,可以在两个囚犯之间达成攻守同盟,如果这样的同盟有外部力量,他们就是合作游戏,相反,如果这个同盟没有外部力量,他们之间就有非合作游戏。要打破囚犯的困境,只有在选择个人的行动战略时正确知道对方不会背叛自己,才是违背合理选择的。 对给定参与者的选择用a表示合作,用b表示不合作。 其中PS战略表示双方合作,PS战略表示双方不合作,PS战略表示自己合作,对方不合作,PS战略表示自己不合作,对方不合作。 假设合作的收益为1,对方不合作的最大净利润为2,那么对方的收益因自己的背叛而增加了。 在个人合理考虑的战略选择中,游戏参与者的方案是BAAABBAB。但是,这种合理的选择结果与游戏参与者获得最大利益的起点相矛盾,这就是囚犯困境名称的由来。 自己选择b的行为的目的是期待BA的结果,但是最后的结果是BB,双方都不合作,得不到自己希望的那样。 假设自己做了a行为,希望对方也做a,双方的战略结果是AA,但对对方来说b是利益最大化的方案,对方在理性的选择中一定要选择b,就会出现AB这一对自己最不利的战略结果。 在行动选择上永远选择b,会成为自己最好的行动,最终导致不合作的结果。 对个人来说,保护道德的行为是不合理的行为。 在社会生活过程中,每天都有大量的经济交换行为。 每次行为过程中要互相警惕是不方便的,不是合理的结果。 无论参与者的喜好如何,非合作博弈论如果给予其他参与者的行为,参与者都会选择让自己获得最合理、没有差异的曲线,即最大化效用。 这种追求效用最大化的帕累托最优,从*的观点来看,实际上是极端利己主义的体现。 个人理性和集体理性之间的冲突,使彼此无法直接或间接交流的游戏出现在囚犯的困境中(背叛; 背叛)。 这需要外部制约机构规范双方的行为,制约稳定、信赖、成为共同知识,成为道德_的共同知识。 从这一点来看,囚犯困境模式包含了道德规范产生的前提。霍布斯在利维坦中描述了人类的原始状态,把霍布斯的人类原始状况作为囚犯的困境版本很普遍。 因为关于霍布斯原来状态的记述确实具有囚犯困境的结构特征。 自然的状态,根据霍布斯的记述,“所有人都反对所有人的战争”。 这是谁都不喜欢的状态,对所有人说“人们的生活是孤独的、贫困的、肮脏的、粗野的、短暂的”。 一方面,我们学习和平的交往。 这里暗示了和平的优点,和平的状态是所有人一致的喜好。 的确,霍布斯的状态是“任何人都应该追求和平并遵从它”。但是,这种情况有几个问题,如果一个人反对霍布斯主义的“自然规律”,就成了单独保持和平的人。 “他很谦虚,很老实,在这样的时间和地方履行所有的约定,即使那里没有别人,他自己也应该牺牲别人,即使自己带来了一定的损失”。 这意味着霍布斯在自然的最初状态下没有追求和平战略的动机。 因为一个人可能坚持和平战略,另一个人可能坚持他们的好战战略。 因此,什么时候牺牲别人而让步的人,也只是单方面地退出战争谋求和平的战略,结果只是别人占优势而受益。霍布斯清楚地认识到这一困境,当别人不希望和平的时候,是不可能得到自己的和平的。 霍布斯进一步指出,个人努力寻找和使用一切帮助,也有战争的优点。 这与自然权利的基础一致,“用我们的一切手段来保护我们自己”。 4这种自然权利事实上与最大化安全水平非常类似,也就是说,我确信这些最坏的事情不会发生在自己身上。 霍布斯意识到这种“游戏”的本质不是保持和平的选择。 除非有人知道别人的选择是一样的,否则这种情况与囚犯困境的结构特征一致。以上分析表明了不同囚犯的困境结构:这一事态的共同利益不稳定,由于每个参与的参与者屈服于不同诱惑的因素,最终不仅退化为共同的有害性,而且退化为高度稳定的结果。 这个时候,我们需要的是安定的东西。 这样的东西,成功地脱离了对个人显然是“善”的行动的诱惑。首先考虑的因素是友谊。 在囚犯困境中,友谊的关系让参加者考虑彼此的合作是合理的,即使他们在面对特定的问题时没有事前的交流。 社会团体之间比社会团体内部显示了更多的合作。 5oskin和Perlaman研究了囚犯困境游戏中友谊对合作的影响。 他们在两所大学进行了调查。 在a大学友谊的影响直接引起了高水平的合作,在b大学直接引起了高水平的竞争。 囚犯困境游戏中,友谊程度和合作程度之间没有直接联系。 正因为他们之间熟悉,他们才有不顾形象和地位继续全面竞争的能力,或者在重要的关系中互相尊敬。 这个解释的结果,作为常识性的推测,如果朋友们发现他们自己陷入了现实生活中的囚犯困境,他们的友谊可能有助于提高他们之间的合作程度。第二个因素是团结和事前交流。 囚犯在困境游戏中的实验显示,小学的成员比大学更希望合作。 他们采用更强的“归属感”和“团队精神”,无论他们不是朋友,还是彼此不知道,他们中的合作程度还很大。 这种参与者之间的附加信息交流,尤其是游戏前的交流,增加了他们之间合作的程度。 即使那是暂时的、表面的。 但是,有争论的是,如果矛盾和竞争的状态已经在一个团体中确立,短的交流什么也改变不了。这些解决方法的描述表明,经典博弈论中行为者的合理性是基于极端自私人性假设的经济合理性。 在这种经济人的理性中,人们总是选择帕累托最优策略以最大化效用,最终出现在囚犯的困境模式中(背叛; 背叛)的纳什均衡,在唯一子博弈完全均衡的完美消息扩展游戏中,合理参加者必须选择这个均衡。 最广为人知的是Herbert Simon(1982 )指出,信息处理成本高,并且人只有有限的信息处理能力。 8人追求满足而不是最大化,所以是有限的合理的,这意味着有合作的可能性。多人游戏中,参加者之间存在信息的相互交流,因此可以签订各种合同,合理分配游戏后的利益。 在参加者之间寻求各自的伙伴,以整体的形式出现,通过这个整体参加游戏活动,自己可以获得更大的利益,完成某个共同的任务。 为了保证同盟的存在可能性,参加者必须遵守大家赞成的协议,这就是博弈解。 高德把游戏解称为“协定道德”,想说明游戏参加者中为什么有道德。 高德的反应是我们误会了实践理性甚至工具理性。 效用最大化的目标并不意味着我们应该在所有的决策点把效用最大化,取而代之的是推论方式的效用最大化。 在某些情况下,好像我们已经尽了最大努力,或者至少觉得目标没有尽最大努力。 因此,行动步骤的效用最大化有时不是每个决策点的效用最大化。 关于高德的协定道德的讨论是基于“倾向选择”和明确的“制约最大化”的倾向与其他合作者合作,在背叛的情况下也是有利的选择。 基于理性计划的意图和思考模式,高德发展了他实践合理的修正主义的说明。 高德假设我们的选择倾向合理的话,我们的选择取决于这些倾向是合理的。 人们往往理性地做不合理的事,不认为在这个环境下自己的行为是不合理的。 高德在某些情况下,追求最大化个人效用的合理人,从互利的观点出发,约束各种效用最大化的行为,并同意遵守这个约定。 在这方面,“协议”发挥的作用等于道德。 协议的道德为区分人能做什么和不能做什么提供了合同理论。以上囚犯

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论