S-囚徒困境与社会的基本问题课件

上传人：上*** IP属地：江苏上传时间：2022-12-15 格式：PPT 页数：39 大小：1.88MB 积分：30 举报 版权申诉

已阅读5页，还剩34页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

囚徒困境与社会的

基本问题“我们有望得到晚餐并非源于屠夫、酿酒师或面包师的仁慈，而是源于他们关心自己的私利。”——亚当斯·斯密“合作现象随处可见，它是文明的基础。”——罗伯特·阿克塞尔罗德人类社会的两个公理自利是人的天性合作是社会的基础（一）“囚徒困境”模型的起源“囚徒困境”模型是是博弈论中最经典、最著名的模型，由普林斯顿大学数学系主任塔克（Tucker）1950年提出的；该博弈本身讲的是一个法律刑侦或犯罪学方面的问题，但可以扩展到许多经济问题，以及各种社会问题，可以揭示人类社会合作失败的重要原因。（二）囚徒困境的基本模型-5，-50，-8-8，0-1，-1坦白不坦白坦白不坦白两个罪犯的支付矩阵囚徒2囚徒1囚徒1：坦白囚徒2：坦白一般意义：囚徒困境博弈既揭示了个体理性与集体理性之间的矛盾——从个体利益出发的行为不能实现团体的最大利益，同时也揭示了个体理性本身的内在矛盾——从个体利益出发的行为最终也不一定能真正实现个体的最大利益，甚至会得到相当差的结果。（三）囚徒困境的模型的意义二、社会的基本问题三、关于这一问题的重要思想（一）西方古典社会契约理论1.霍布斯的“利维坦”理论人类的自利与欲望→避免“自然状态”下的“所有人对所有人的战争”→“利维坦”→社会合作没有利维坦（“作为国家政府的集权体制机构”）的存在，人类合作将使不可能产生的，因此一个强权的政府机构是必要的。（一）西方古典社会契约理论3.西方古典社会契约理论的一个基本假设一个具有共同利益的群体会在某种外在强制力量和社会安排下为实现共同利益而采取集体行动，并且这要么导致君主专制，要么达致共和独裁。亦即，只有通过外部的强制力量才能确保自利的个人实现社会合作。（二）奥尔森的“集体行动的逻辑”由具有自利倾向的理性“经济人”组成的集体中，因“搭便车”行为而难以实现合作：人人都想分享集体行动的成果，但不愿分担集体行动的成本。集体越大，越难克服“搭便车”行为。（二）奥尔森的“集体行动的逻辑”“除非一个集团中人数很少，或者除非存在强制或其他某些特殊手段以使个人按照他们的共同利益行事，有理性的，寻求自我利益的个人不会采取行动以实现他们共同的集团的利益。”（Olson，1980）四、阿克塞尔罗德

“重复囚徒困境博弈计算机

程序奥林匹克竞赛”罗伯特·阿克塞尔罗德1964年获得芝加哥大学数学学士，1966年和1969年相继从耶鲁大学获得政治学硕士和博士学位。现任密歇根大学政治学与公共政策学院教授，美国科学院院士，著名的行为分析及博弈论专家。（二）第一届竞赛1.过程14个策略程序+1个随机程序（随机选择“合作”或“背叛”）；225场比赛，每个比赛200回合；最大收益：15场×200回合×5分=15000分（（D，C）或（C，D））；最小收益：15场×200回合×0分=0分（（D，C）或（C，D））；基础收益：每场200回合全部选择（C，C），即双方合作，收益为600分；

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（二）第一届竞赛2.结果第一名：加拿大多伦多大学博弈论心理学家阿纳托尔•拉波波特（AnatolRapoport）提出的“一报还一报（titfortat，TFT）：第一回合选择“合作”，然后每一回合重复对手的上一个回合策略。“一报还一报”策略的平均分为504.5，即600基准分的84%，其他8个好的策略中，得基准分的28.4%和83.4%之间。

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（三）第二届竞赛1.过程62个策略程序+1个随机程序（随机选择“合作”或“背叛”）其中包括“一报还一报”策略，以及著名的生物学家、演化博弈论的奠基人约翰•梅纳德•史密斯（JohnMaynardSmith）的“超级宽恕”程序——“两怨换一报”策略。

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（三）第二届竞赛2.结果整体而言，“善良”的策略再次普遍表现得比“狡诈”的策略好。前15名中只有一个不是“善良”的策略，最后15名中只有一个不是“狡诈”策略。其中，“一报还一报”策略再次获得第一名，并且获得了基准分的96%；而“两怨换一报”的策略“死的很惨”。

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（四）第三届竞赛2.结果所有“狡诈型”策略都在200代左右完全消失。“一报还一报”策略和另外5种“善良但不怯弱”的策略获得了成功。

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（五）三届竞赛的结论1.善良的策略总不首先背叛。2.友谊对基于回报的合作的产生并不是必要的：“在合适的环境下，合作甚至可以在敌对者之间产生。”3.合作的基础不是真正的信任，而是关系的持续性。从长远来看，双方建立稳定的合作模式的条件是否成熟比双方是否相互信任来得重要。4.在适当的条件下，合作确实能够从没有集权的自私自利的世界中产生。进一步阅读的材料亚当·斯密.国民财富的性质和原因的研究（上下册），商务印书馆，1974.理查德·道金斯.自私的基因，中信出版集团股份有限公司，2012.曼瑟尔·奥尔森.集体行动的逻辑，格致出版社，2011.霍布斯.利维坦，商务印书馆，1985.卢梭.社会契约论，商务印书馆，2011.阿克塞尔罗德.合作的复杂性，上海人民出版社，2008.阿克塞尔罗德.合作的进化，上海人民出版社，2007.谢识予.经济博弈论，复旦大学出版社，2008.赫伯特·金迪斯等.走向统一的社会科学，上海世纪出版集团，2005赫伯特·金迪斯.理性的边界，格致出版社，2011（一）合作与激励合作问题的实质个体理性与集体理性的矛盾个人行为与社会利益的冲突如何把个人行为与社会利益统一起来，即实现合作？激励(incentive)物质手段（实施条件：掌握财富、信息、能力、公正的第三方）非物质的手段（二）合作与惩罚1.在长期的重复博弈关系中人们之所以可能会实现合作，是因为重视未来收益，不会为了短期利益而做出有损未来收益的当前行为。换言之，对未来的态度决定了当前的行为；2.正因为此，如果在长期的重复博弈关系中有背叛或不合作行为的出现，惩罚可能会成为实现合作的有效手段；3.重复博弈中惩罚的两种策略：针锋相对（tit-for-tat）：每一次的行动都建立在对手前一次行动的基础上。（二）合作与惩罚3.重复博弈中惩罚的两种策略：触发策略（triggerstrategy）或冷酷策略：合作中如果有任何一方采取一次背叛或不合作行为，其他博弈方就永远不与其合作。以上两种都是对不合作行为的惩罚，根据博弈论专家的社会实验，第一种方法有效性更高。（二）合作与惩罚4.但是不是所有的惩罚都有效：①惩罚对方的同时也惩罚了自己（触发策略）；②实施惩罚的条件不可信。案例：惩罚不可信博弈（二）合作与惩罚5.严厉可信惩罚战略究竟什么样的惩罚最有利于鼓励人们合作？Abreu（1986）在“ExternalEquilibriaofOligopolisticSupergame”一文中指出，当发现对方有不合作行为时，对对方的惩罚足够长、足够大，并对实施处罚的人来说是最优的，即“严厉可信惩罚战略”（thestrongestcrediblepunishment）。（二）合作与惩罚6.不确定性下的最优惩罚在确定的情况下，惩罚越严厉，越有助于合作。因为确定情况下，欺骗从来不会发生，所以惩罚实际上是没有成本的。但在不确定的情况下，即使每个人都选择合作，“坏结果”也会出现。如果坏结果总是触发惩罚，就会冤枉好人，过重的惩罚反到导致不合作；但如果总是原谅，合作也不会发生。这就有一个“最优惩罚”的问题。（二）合作与惩罚系安全带会导致事故概率提高吗？例如

人人文库> 全部分类> 行业资料 > 医学制药

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

S-囚徒困境与社会的基本问题课件

文档简介

温馨提示

最新文档

评论

S-囚徒困境与社会的基本问题课件

文档简介

温馨提示

最新文档

评论

相关文档