S-囚徒困境与社会的基本问题PPT课件.ppt

上传人：优*** IP属地：广东上传时间：2020-03-18 格式：PPT 页数：39 大小：1.09MB 积分：35 举报 版权申诉

已阅读5页，还剩34页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

囚徒困境与社会的基本问题我们有望得到晚餐并非源于屠夫酿酒师或面包师的仁慈而是源于他们关心自己的私利亚当斯斯密合作现象随处可见它是文明的基础罗伯特阿克塞尔罗德 2 人类社会的两个公理自利是人的天性合作是社会的基础 3 一囚徒困境模型及其意义一囚徒困境模型的起源囚徒困境模型是是博弈论中最经典最著名的模型由普林斯顿大学数学系主任塔克 Tucker 1950年提出的该博弈本身讲的是一个法律刑侦或犯罪学方面的问题但可以扩展到许多经济问题以及各种社会问题可以揭示人类社会合作失败的重要原因 5 二囚徒困境的基本模型 5 5 0 8 8 0 1 1 坦白不坦白坦白不坦白两个罪犯的支付矩阵囚徒2 囚徒1 囚徒1 坦白囚徒2 坦白 6 一般意义囚徒困境博弈既揭示了个体理性与集体理性之间的矛盾从个体利益出发的行为不能实现团体的最大利益同时也揭示了个体理性本身的内在矛盾从个体利益出发的行为最终也不一定能真正实现个体的最大利益甚至会得到相当差的结果三囚徒困境的模型的意义 7 二社会的基本问题人类社会与其他动物群体的一个重要区别是人与人之间可以通过运用个人理性而达致某种形式的合作合作能产生合作剩余但是问题在于在每个人都具有自利动机的情况下人们怎样才能通过社会博弈而自发产生合作换言之社会合作能否从有着自己利益最大化推理逻辑的个人的行为互动中自发产生的 9 三关于这一问题的重要思想一西方古典社会契约理论霍布斯 ThomasHobbes 的利维坦理论卢梭 Jean JacquesRousseau 的社会契约论 11 一西方古典社会契约理论 1 霍布斯的利维坦理论人类的自利与欲望避免自然状态下的所有人对所有人的战争利维坦社会合作没有利维坦作为国家政府的集权体制机构的存在人类合作将使不可能产生的因此一个强权的政府机构是必要的 12 一西方古典社会契约理论 2 卢梭的社会契约论自由人之间的公意社会契约公意的代表社会契约的维护者个人或组织社会合作自由人之间相互交往会产生公意 generalwill 在公意存在的情况下通过某种社会契约就可以达致并维持某种人类社会之间的某种合作 13 一西方古典社会契约理论 3 西方古典社会契约理论的一个基本假设一个具有共同利益的群体会在某种外在强制力量和社会安排下为实现共同利益而采取集体行动并且这要么导致君主专制要么达致共和独裁亦即只有通过外部的强制力量才能确保自利的个人实现社会合作 14 二奥尔森的集体行动的逻辑由具有自利倾向的理性经济人组成的集体中因搭便车行为而难以实现合作人人都想分享集体行动的成果但不愿分担集体行动的成本集体越大越难克服搭便车行为 15 二奥尔森的集体行动的逻辑除非一个集团中人数很少或者除非存在强制或其他某些特殊手段以使个人按照他们的共同利益行事有理性的寻求自我利益的个人不会采取行动以实现他们共同的集团的利益 Olson 1980 16 四阿克塞尔罗德重复囚徒困境博弈计算机程序奥林匹克竞赛罗伯特阿克塞尔罗德 1964年获得芝加哥大学数学学士 1966年和1969年相继从耶鲁大学获得政治学硕士和博士学位现任密歇根大学政治学与公共政策学院教授美国科学院院士著名的行为分析及博弈论专家 18 一重复囚徒困境博弈的支付矩阵 19 二第一届竞赛 1 过程14个策略程序 1个随机程序随机选择合作或背叛 225场比赛每个比赛200回合最大收益 15场 200回合 5分 15000分 D C 或 C D 最小收益 15场 200回合 0分 0分 D C 或 C D 基础收益每场200回合全部选择 C C 即双方合作收益为600分 20 二第一届竞赛 2 结果第一名加拿大多伦多大学博弈论心理学家阿纳托尔拉波波特 AnatolRapoport 提出的一报还一报 titfortat TFT 第一回合选择合作然后每一回合重复对手的上一个回合策略一报还一报策略的平均分为504 5 即600基准分的84 其他8个好的策略中得基准分的28 4 和83 4 之间 21 二第一届竞赛 3 结论好的策略有三个特征第一善良即从不主动地先背叛第二宽容即给予对方纠正错误的机会一旦对方改过即以合作对待第三不嫉妒为别人获益而感到高兴 22 三第二届竞赛 1 过程62个策略程序 1个随机程序随机选择合作或背叛其中包括一报还一报策略以及著名的生物学家演化博弈论的奠基人约翰梅纳德史密斯 JohnMaynardSmith 的超级宽恕程序两怨换一报策略 23 三第二届竞赛 2 结果整体而言善良的策略再次普遍表现得比狡诈的策略好前15名中只有一个不是善良的策略最后15名中只有一个不是狡诈策略其中一报还一报策略再次获得第一名并且获得了基准分的96 而两怨换一报的策略死的很惨 24 四第三届竞赛 1 过程原63个策略程序输入计算机迭代模拟作为演化博弈的第一代在随机PK后根据每种策略产生的后代数量来决定胜负经过1000代后策略比例基本稳定 25 四第三届竞赛 2 结果所有狡诈型策略都在200代左右完全消失一报还一报策略和另外5种善良但不怯弱的策略获得了成功 26 五三届竞赛的结论 1 善良的策略总不首先背叛 2 友谊对基于回报的合作的产生并不是必要的在合适的环境下合作甚至可以在敌对者之间产生 3 合作的基础不是真正的信任而是关系的持续性从长远来看双方建立稳定的合作模式的条件是否成熟比双方是否相互信任来得重要 4 在适当的条件下合作确实能够从没有集权的自私自利的世界中产生 27 进一步阅读的材料亚当斯密国民财富的性质和原因的研究上下册商务印书馆 1974 理查德道金斯自私的基因中信出版集团股份有限公司 2012 曼瑟尔奥尔森集体行动的逻辑格致出版社 2011 霍布斯利维坦商务印书馆 1985 卢梭社会契约论商务印书馆 2011 阿克塞尔罗德合作的复杂性上海人民出版社 2008 阿克塞尔罗德合作的进化上海人民出版社 2007 谢识予经济博弈论复旦大学出版社 2008 赫伯特金迪斯等走向统一的社会科学上海世纪出版集团 2005赫伯特金迪斯理性的边界格致出版社 2011 28 五合作与激励和惩罚一合作与激励合作问题的实质个体理性与集体理性的矛盾个人行为与社会利益的冲突如何把个人行为与社会利益统一起来即实现合作激励 incentive 物质手段实施条件掌握财富信息能力公正的第三方非物质的手段 30 二合作与惩罚 1 在长期的重复博弈关系中人们之所以可能会实现合作是因为重视未来收益不会为了短期利益而做出有损未来收益的当前行为换言之对未来的态度决定了当前的行为 2 正因为此如果在长期的重复博弈关系中有背叛或不合作行为的出现惩罚可能会成为实现合作的有效手段 31 3 重复博弈中惩罚的两种策略针锋相对 tit for tat 每一次的行动都建立在对手前一次行动的基础上二合作与惩罚 32 3 重复博弈中惩罚的两种策略触发策略 triggerstrategy 或冷酷策略合作中如果有任何一方采取一次背叛或不合作行为其他博弈方就永远不与其合作以上两种都是对不合作行为的惩罚根据博弈论专家的社会实验第一种方法有效性更高二合作与惩罚 33 4 但是不是所有的惩罚都有效惩罚对方的同时也惩罚了自己触发策略实施惩罚的条件不可信案例惩罚不可信博弈二合作与惩罚 34 5 严厉可信惩罚战略究竟什么样的惩罚最有利于鼓励人们合作 Abreu 1986 在 ExternalEquilibriaofOligopolisticSupergame 一文中指出当发现对方有不合作行为时对对方的惩罚足够长足够大并对实施处罚的人来说是最优的即严厉可信惩罚战略 thestrongestcrediblepunishment 二合作与惩罚 35 6 不确定性下的最优惩罚在确定的情况下惩罚越严厉越有助于合作因为确定情况下欺骗从来不会发生所以惩罚实际上是没有成本的但在不确定的情况下即使每个人都选择合作坏结果也会出现如果坏结果总是触发惩罚就会冤枉好人过重的惩罚反到导致不合作但如果总是原谅合作也不会发生这就有一个最优惩罚的问题二合作与惩罚 36 系安全带会导致事故概率提高

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

S-囚徒困境与社会的基本问题PPT课件.ppt

文档简介

温馨提示

最新文档

评论

S-囚徒困境与社会的基本问题PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档