




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
囚徒困境的根源与启示 囚徒困境解说 如同博弈论的其他例证 囚徒困境假定每个参与者 即 囚徒 都是利己的 即都寻求最大自身利益 而不关心另一参与者的利益 参与者某一策略所得利益 如果在任何情况下都比其他策略要低的话 此策略称为 严格劣势 理性的参与者绝不会选择 另外 没有任何其他力量干预个人决策 参与者可完全按照自己意愿选择策略 单次和多次重 单次发生的囚徒困境 和多次重复的囚徒困境结果不会一样 在重复的囚徒困境中 博弈被反复地进行 因而每个参与者都有机会去 惩罚 另一个参与者前一回合的不合作行为 这时 合作可能会作为均衡的结果出现 欺骗的动机这时可能被受到惩罚的威胁所克服 从而可能导向一个较好的 合作的结果 作为反复接近无限的数量 纳什均衡趋向于帕累托最优 固定局数的囚徒困境 试想像囚徒困境的情况进行十次 我们可以合理地设想 如果囚徒第一次被对方指控 第二次这个囚徒也会指控对方 相反 如果第一次别人保持沉默 建立了互信的关系 你也会保持沉默 达致帕累托最优 当然 两个囚徒都会有相似的想法 在第一局保持沉默 以期望建立互信关系 所以双方都会保持沉默 第二局时 双方亦应有相似的想法 继续保持沉默 以期继续在互信的情况下进行第三局 以致余下的八局 这种想法合理吗 在第十局时 互信的关系明显是没有意义的 因为十局已经完结 囚徒没有必要为维持互信的关系而沉默 没有第十一局 所以第十局囚徒一定会背叛对方的 理由和只有一局囚徒困境一样 问题是 既然大家都知道在第十局 无论如何对方都会背叛自己的 你在第九局保持沉默也是没有意思的 要知道 保持沉默 友好关系 的原因是为了希望下一局别人保持沉默 所以第九局双方都一定会背叛对方的 下一个问题是 双方都有相同的想法 明知第九局对方会背叛自己 所以第八局保持沉默也是没有意思的 第七局亦然 如此类推 纳什均衡是十局都会互相背叛 建立互信关系是没有可能的 只有在囚徒困境的局数大家都不肯定的情况下 上述的推论才不会发生 才会出现互相保持沉默的现象 经典囚徒困境来由 1950年 由就职于兰德公司的梅里尔 弗勒德 MerrillFlood 和梅尔文 德雷希尔 MelvinDresher 拟定出相关困境的理论 后来由顾问艾伯特 塔克 AlbertTucker 以囚徒方式阐述 并命名为 囚徒困境 两个嫌疑犯 甲和乙 作案后被警察抓住 隔离审讯 警方的政策是 坦白从宽 抗拒从严 如果两人都坦白则各判8年 如果一人坦白另一人不坦白 坦白的放出去 不坦白的判15年 如果都不坦白则各判 年 这两个囚犯该怎么办呢 是选择互相合作还是互相背叛 经典案例 囚徒困境 经典案例 囚徒困境 囚徒困境解说 囚徒到底应该选择哪一项策略 才能将自己个人的刑期缩至最短 两名囚徒由于隔绝监禁 并不知道对方选择 而即使他们能交谈 还是未必能够尽信对方不会反口 就个人的理性选择而言 检举背叛对方所得刑期 总比保持沉默 或抵赖 要来得低 试设想困境中两名理性囚徒会如何作出选择 若对方沉默 背叛会让我获释 所以会选择背叛 若对方背叛指控我 我也要指控对方才能得到较低的刑期 所以也是会选择背叛 囚徒困境解说 二人面对的情况一样 所以二人的理性思考都会得出相同的结论 选择背叛 背叛是两种策略之中的支配性策略 因此 这场博弈中唯一可能达到的纳什均衡 就是双方参与者都背叛对方 结果二人同样服刑8年 这场博弈的纳什均衡 显然不是顾及团体利益的帕累托最优解决方案 以全体利益而言 如果两个参与者都合作保持沉默 不坦白 两人都只会被判刑1年 总体利益更高 结果也比两人背叛对方 判刑8年的情况较佳 但根据以上假设 二人均为理性的个人 且只追求自己个人利益 均衡状况会是两个囚徒都选择背叛 结果二人判决均比合作为高 总体利益较合作为低 这里存在着矛盾 囚徒困境的内在根源 在个体之间存在行为和利益相互制约的博弈结构中 以个体理性和个体选择为基础的分散决策方式 无法有效地协调各方面的利益 并实现整体 个体利益共同的最优 简单地说 囚徒的困境 问题都是个体理性和集体理性的矛盾引起的 囚徒困境的启示 囚徒的两难选择 有着广泛而深刻的意义 个人理性与集体理性的冲突 各人追求利己行为而导致的最终结局是一个 纳什均衡 也是对所有人都不利的结局 他们两人都是在坦白与抵赖策略上首先想到自己 这样他们必然要服长的刑期 只有当他们都首先替对方着想时 或者相互合谋 串供 时 才可以得到最短时间的监禁的结果 纳什均衡 对亚当 斯密的 看不见的手 的原理提出挑战 按照斯密的理论 在市场经济中 每一个人都从利己的目的出发 而最终全社会达到利他的效果 国富论 中有这样一句名言 通过追求 个人的 自身利益 他常常会比其实际上想做的那样更有效地促进社会利益 从 纳什均衡 我们引出了 看不见的手 的原理的一个悖论 从利己目的出发 结果损人不利己 既不利己也不利他 两个囚徒的命运就是如此 从这个意义上说 纳什均衡 提出的悖论实际上动摇了西方经济学的基石 因此 从 纳什均衡 中我们还可以悟出一条真理 合作是有利的 利己策略 但它必须符合以下黄金定律 按照你愿意别人对你的方式来对别人 但只有他们也按同样方式行事才行 也就是中国人说的 己所不欲勿施于人 但前提是人所不欲勿施于我 囚徒困境的现实意义就是个人理性导致集体非理性 在囚徒博弈的模型中 只存在一个纳什均衡 即 在参与者理性的情况下 坦白为最优策略 这同时导致了集体利益的最小化 事实上 在囚徒困境中的最佳策略取决于对方采用的策略 特别是取决于这个策略为双方合作留出多大的余地 而这个原则的基础是 以后对于现在的权重足够大 即 未来是重要的 囚徒困境的现实意义 简单的说 就是如果你认为以后大家还要相处 那么最好选择合作 反之 如果你认为以后不再会相遇或对你以后的利益不太关心 那么就选择背叛 把对方供出来 这样又回到问题的原点 如果未来是重要的 那么就要选择合作 而合作的策略取决于对方的策略 于是结论是 没有最优策略 囚徒困境的现实意义 在囚徒困境中 参与者会受到背叛 坦白 的短期诱惑 但是通过与对方建立长期的合作的模式 可以获得更多的长期的好处 所以 要破解囚徒困境 就要跳出这个模型本身 从更高的层面上给以制度性的约束 或让大家都明白合作的好处 囚徒困境的现实意义 囚徒困境的实际运用 举例来是说 我是供应商 你是大超市 你可以选择拖欠货款 我也可以选择延迟发货或较低的质量 套用上面的模型 超市不合作合作不合作 5 52 8供应商合作 8211 1984年 美国联邦预算赤字实在太高了 裁减必要的巨额开支在政治上并不可行 因此 大幅增税应该是不可避免的 不过 谁愿意带头主张这么做呢 民主党总统候选人沃尔特 蒙代尔在竞选活动中提出增税政策 却被罗纳德 里根打得落花流水 因为里根许诺绝不加税 里根当选之后 这个议题陷入僵局 无论你怎么划分政治派别 民主党对共和党 众议院对参议院 还是政府对国会 各方都希望把提出加税的主动权推给对方 双方都知道 联合起来共同倡议加税和削减开支 可以共同分享荣誉 分担谴责 这么做与同时坚守被动 眼看巨额赤字上升而无所作为相比 显然会对整个国家更有利 即便对他们自己的政治生涯从长期而言也会有好处 囚徒困境的实际运用 但是 假如自己提出这样的政策 而对方并不附和 则自己会落得糟糕的下场 显而易见 对每一方而言 保持被动是一个优势策略 而这正是真实发生的情况 这一届国会根本没有作出任何加税决定 这就是为什么美国是世界上最富有的国家 却同时又是最大的债务国的原因 囚徒困境的实际运用 在这个假设的模型里 超市会想 如果供应商合作 我只要不合作 就可以得到2个单位的利润 而合作却只有1个单位的利润 显然不合作比合作好 如果供应商不合作 我若合作 则要损失8个单位的利润 但不合作却只损失5个单位的利润 显然还是不合作比较好 无论供应商是否合作 超市的最佳策略都是不合作 自然 供应商也会如此推理 按照博弈论的观点 这是唯一的平衡点 在这一点上 任何一方改变策略 都会得到更差的结果 但是 这与我们的日常经验不符合 为什么现实中的供应商与经销商都会选择合作呢 原因在于 1 不嫉妒 现实中的博弈大多是非零合的 大家赚取自己应有的利润 没有理由去嫉妒对方的高额利润 因为对方的成功是你成功的前提 2 不首先背叛 对合作或背叛都要给于惩罚 在契约社会 有法律 行规的制约 背叛是要付出巨大的代价的 再回到囚徒困境中 则是黑社会团伙对囚犯家属的行动 这会让囚徒在做决策时 偏向于合作 当双方尝到合作的甜头 又知道背叛的惩罚后 合作就会成为第一选择 囚徒困境的解决方法应该在困境本身之外 囚徒困境的实际运用 大家都合作 大家都赢利 长期利益 一方不合作 一方盈利 短期利益 都不合作全都陪钱 没有利益 一般情况下 长期赢利都会比短期赢利要高的多 囚徒困境的实际运用 囚徒困境的解释力 农业增产不增收 假设在一给封闭的小地方 只有两家农户向市场供应稻谷 而稻谷是当地居民的当家粮 是家家户户的必需品 因为稻谷是这个小地方居民的必需品 所有他们对于稻谷的需求相当稳定 大致在1000担左右 如果稻谷的供给也在1000担左右 那么稻谷的交易价格在每担100元 担 而如果稻谷的供给比1000担多了几百担 那么因为供大于求 稻谷的价格会从100元 担下滑到50元 担甚至40元 担 相反 如果稻谷的供给比居民的需求少了几百担 造成供不应求 那么物以稀为贵 稻谷的交易价格马上大幅度上升 囚徒困境的解释力 农业增产不增收 如果把生产750担稻谷叫做丰收 把生产250担叫做歉收 而每家农户生产稻谷的成本都是30000元 那么以千元为单位 两家农户净收入情况表述为如下博弈 乙丰收歉收 丰收甲歉收 粮农的困境 情况一 两家都丰收 供应量1500担 价格跌到40元 担 销售收入都是30000元 减去生产成本30000元 净收入是0 情况二 两家都歉收 供应量只有500担 价格升至240元 担 每家销售收入都是60000元 减去生产成本30000元 净收入是30000元 情况三 一家收获750担 一家收获250担 价格是100元 担 收获750担的农户销售收入是75000元 减去生产成本30000元 净收入是45000元 收获250担农户销售收入则为25000 减去30000元成本后 净收入是负5000元 稻谷的供应量之比是3 1 净收入之比却是45000 5000 一正一负 远远不止3 1 囚徒困境的解释力 农业增产不增收 上述粮农博弈没有体现参与人的策略选择 丰收歉收是老天爷的安排 所以对上述模型进行一定的改造 变成假设两家农户都丰收 但是两家农户都很有商业头脑 他们会盘算向市场供应多少稻谷能够实现最大利益 所以 上述粮农困境实际上也是囚徒困境 对于每个粮农来说 都是丰收比歉收好 但是合在一起 两家农户都丰收 不如两家农户都歉收 囚徒困境的解释力 农业增产不增收 囚徒困境的解释力 农业增产不增收 如果把博弈参与人所得的单位由千元改为万元 并且把相应的数字四舍五入 0 5变成 1 4 5变成5 乙多卖少卖 多卖甲少卖 粮农的博弈 对于每个粮农来说 不论对方多卖还是少卖 自己总是多卖比少卖好 结果 两家都选择多卖策略 得益都是0 解决三农问题的根本途径 是把大部分农业人口从农业转移出来 这样 才能够做到农产品的产量相对于总人口保持在合适的偏向于紧俏的水平 从而农民的收入就能够增加 农村也就富裕了 这时候 农业成为香饽饽 变成诱人的十分有希望的行业 现实中的囚徒困境 公共物品的提供 如 公共过道的路灯 招商引资中的 政策竞赛 文革中的 竞相揭发 贸易战 电信价格竞争的 囚徒困境 假设此博弈的参加者为电信运营商A与B 一开始的价格都是P0 A 中国电信 是老牌企业 实力雄厚 占据了绝大多数的市场份额 B 中国联通 则刚成立不久 翅膀还没有长硬 是政府为了打破垄断鼓励竞争而筹建起来的 正因为B是政府扶植起来鼓励竞争的 所以B得到了政府的一些优惠 其中B的价格可以比P0低10 这一举动 还不会对A产生多大的影响 因为A的根基实在是太牢固了 在这样的市场分配下 A B可以达到平衡 但由于B在价格方面的优势 市场份额逐步壮大 到了一定程度 对A造成了影响 这时候 A该怎么做 不妨假定 A降价而B维持 则A获利15 B损失5 整体获利10 A维持且B也维持 则A获利5 B获利10 整体获利15 A维持而B降价 则A损失10 B获利15 整体获利5 A降价且B也降价 则A损失5 B损失5 整体损失10 从A角度看 显然降价要比维持好 降价至少可以保证比B好 在概率均等的情况下 A降价的收益为15 50 5 50 5 维持的收益为5 50 10 50 2 5 为了自身利益的最大化 A就不可避免地选择了降价 从B角度看 效果也一样 降价同样比维持好 其降价收益为5 维持收益为2 5 它也同样会选择降价 在这轮博弈中 A B都将降价作为策略 因此各损失5 整体损失10 整体收益是最差的 这就是此博弈最终所出现的纳什均衡 我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象 各个局部都寻求利益的最大化 而整体利益却不是最优 甚至是最差 OPEC组织成员国之间的合作与背叛 对电信价格竞争的博弈分析中 只是一次性的 囚徒困境 博弈 因此得到了互相降价的纳什均衡 而在现实生活当中 信任与合作很少达到如此两难的境地 无论在自然界还是在人类社会 合作 都是一种随处可见的现象 比如中东石油输出国组织 的成立 本身就是要限制各石油生产国的产量 以保持石油价格 以便获取利润 是合作的产物 OPEC之所以能够成立 各组织成员国之间之所以能够合作 是因为囚徒困境如果是一次性博弈 Oneshotgame 的话 基于个人利益最大化 得到纳什均衡解 但如果是多次博弈 人们就有了合作的可能性 囚徒困境就有可能破解 合作就有可能达成 连续的合作有可能成为重复的囚徒困境的均衡解 这也是博弈论上著名的 大众定理 FolkTheorem 的含义 但合作的可能性不是必然性 博弈论的研究表明 要想使合作成为多次博弈的均衡解 博弈的一方 最好是实力更强的一方 必须主动通过可信的承诺 Crediblecommitment 向另一方表示合作的善意 努力把这个善意表达清楚 并传达出去 如果该困境同时涉及多个对手 则要在博弈对手中形成声誉 并用心地维护这个声誉 这里 可信的承诺 是一个很牵强的翻译 Crediblecommitment 并不是什么空口诺言 而是实实在在的付出 所以合作是非常困难的 所以OPEC组织经常会有成员国不遵守组织的协定 私自增加石油产量 每个成员国都这样想 只要他们不增加产量 我增加一点点产量对价格没什么影响 结果每个国家都增加产量 造成石油价格下跌 大家的利润都受到损失 当然 一些产量增加较少的国家损失更多 于是也更加大量生产 造成价格进一步下降 结果 陷入一个困境 大家都增加产量 价格下跌 大家再增加产量 价格再下跌 理论上 几乎所有的卡特尔都会遭到失败 原因就在于卡特尔的协定 类似囚犯的攻守同盟 不是一个纳什均衡 没有成员有兴趣遵守 那么是不是不可能有卡特尔合作成功了 理论上 如果是无限期的合作 双方考虑长远利益 他们的合作是会成功的 但只要是有限次的合作 合作就不会成功 比如合作 次 那么在第九次博弈参与人就会采取不合作态度 因为大家都想趁最后一次机会捞一把 反正以后我也不会跟你合作了 但是大家料到第九次会出现不合作 那么就很可能在第八次就采取不合作的态度 第八次不合作会使大家在第七次就不合作 一直到 从第一次开始大家都不会采取合作态度 学生的囚徒困境 数十道 减负令 难见效中小学生课业负担不减反增仅 年至 年的 年里 中央就下达 减负令 次 减轻中小学生过重负担喊了 多年 实际情况却是学生课业负担不但没减下来 反倒呈现出越演越烈之势 致使学生作业做到深夜 节假日仍然上课 业余时间奔忙于各种补习班等 购房者的 囚徒困境 我没买房 结果房价还是涨了 因为我们无法保证大家都不买房 可是 我错了吗 没有 当初如果我买房了 房价下跌了呢 因为我不能保证大家都买房 人们根本不能预知在疾风暴雨式的调控之下 房价竟还能且调且涨 可是 我对了吗 没有 这是一部眼下流行 充满黑色幽默的网络视频 北漂族的无房生活 中的经典对白 含泪的 调侃 折射出当下楼市的 囚徒困境 买 难担高房价重负 不买 难受房价节节攀升的煎熬 盗版书的 囚徒困境 无论怎么打击 盗版书仍是屡禁不绝 而一个更加奇怪的现象出现了 一些畅销书刚刚运作完成 还没有印刷完毕 其盗版书竟已经堂而皇之地走上了书摊 他们一改过去 跟风 的传统 抢在了正版书的前面 待正版书印出来后 人们会发现 盗版和正版几乎没有什么差别 这种情况下 人们只能得出一个结论 出版部门出了 内奸 可是 当这样的现象一次次出现 甚至已经成了某种规律的时候 人们才恍然大悟 原来 是出版者自己在盗自己的版 职业盗版者将更为廉价的书推上书摊 这对正规出版者无疑带来巨大的冲击 正规出版者惟一的反击方式就是和有关部门配合打击盗版 但是效果并不明显 为了和职业盗版者对抗 正规出版者便盗印自己的书 这部分盗印的书因为走的是 黑道 同样免除了各种费用 可以在市场上和盗版书打价格战 同时可以赖掉作者的版税 陈鲁豫亲手抓盗版书 心相约 盗版 还珠格格 烟草商与囚徒困境 烟草商为何不反对禁止烟草广告 1971年 在 禁烟运动 的声势下 美国国会通过了禁止在电视上做烟草广告的法律 令许多人奇怪的是 这一回财大气粗的烟草公司反应相当平静 并没有动用其庞大的社会资源和影响力阻止这个法律的通过 后来的统计资料表明 尽管烟草广告因受到限制而减少 可是烟草公司的利润却提高了 因为这个禁令使他们从 囚徒困境 中解放了出来 烟草行业同样竞争激烈 为了争夺市场 各大烟草公司都必须大做广告 为此 它们每年都要花费巨额广告费用 这无疑降低了它们的利润水平 也就是说 如果烟草公司都不做广告 它们的利润要更高 烟草公司本身能否达成都不做广告的协议呢 不能 因为谁遵守协议 就很可能被对手耍弄 烟草公司做不到的 国家为它做了 法律起到了协议的作用 而政府承担了监督的成本 烟草商为何不反对禁止烟草广告 烟草商与囚徒困境 如何走出囚徒困境 假如每一个拒供的囚徒都可以在刑满释放后对供认的囚徒实施报复 那么每个囚徒就可能因担心未来的报复而在现实选择拒供 使得出现 拒供 拒供 的均衡结果 合作就自然达成了 现实中 的确有很多犯罪团伙的成员 被捕后拒不坦白 很大程度上与一个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025福建泉州市泉港区部分公办学校专项招聘编制内新任教师17人(二)模拟试卷及一套答案详解
- 2025贵州黔东南州锦屏经济开发区环卫工人招聘模拟试卷及答案详解(考点梳理)
- 2025湖北茅箭区公益性岗位招聘1人考前自测高频考点模拟试题有完整答案详解
- 2025内蒙古呼和浩特市金东学校招聘模拟试卷附答案详解(黄金题型)
- 2025年新乡市诚城卓人学校招聘教师若干名模拟试卷及答案详解(网校专用)
- 2025国家卫星气象中心(国家空间天气监测预警中心)招聘留学回国人员(第二批)模拟试卷及参考答案详解一套
- 2025广东韶关市始兴县太平镇人民政府青年就业见习基地招募见习人员15人模拟试卷及答案详解(网校专用)
- 2025湖北随州市曾都医院引进急需紧缺高层次人才15人考前自测高频考点模拟试题附答案详解(典型题)
- 2025江苏盐城市东台市人力资源和社会保障局招聘劳务派遣人员3人考前自测高频考点模拟试题附答案详解(模拟题)
- 2025年黄山市中心血站招聘医学检验人员1人考前自测高频考点模拟试题及答案详解(名师系列)
- 【衢州】2025年浙江衢州市柯城区属事业单位招聘工作人员17人笔试历年典型考题及考点剖析附带答案详解
- 破解“五性”困境以优化国企外部董事制度
- 钢构农业大棚建设项目可行性研究报告
- 非货币支付管理办法
- 湖北省武汉2025-2026学年度高一上学期开学分班考试-英语(解析版)
- 氢气实验室制法课件
- 2025年宜昌专业技术人员公需科目培训考试题及答案
- 船舶高级消防课件
- 临床康复一体化讲课件
- 重症肺炎集束化治疗专题报告
- 二年级语文上册第二单元大单元教学设计
评论
0/150
提交评论