囚徒困境与纳什均衡

上传人：农*** IP属地：广东上传时间：2023-01-25 格式：PPT 页数：52 大小：3.80MB 积分：18 举报 版权申诉

已阅读5页，还剩47页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

囚徒困境与纳什均衡第一页，共五十二页，2022年，8月28日一、经典案例——囚徒困境二、现实生活中的“囚徒困境”三、纳什均衡与优势策略本章内容第二页，共五十二页，2022年，8月28日一、经典案例——囚徒困境

第三页，共五十二页，2022年，8月28日克格勃的小花招在前苏联，有一位乐队指挥在火车上翻看乐谱时，两名克格勃（KGB，苏联国家安全警察）将他作为间谍逮捕了。他们以为那乐谱是某种密码，这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲，却无济于事。第二天，审问者自鸣得意地走进来说：“我看你还是老实招了吧，我们已经抓住了你的朋友柴可夫斯基了，他这会儿正向我们交代呢。你如果再不招就枪毙了你。如果交代了，只判你10年。”第四页，共五十二页，2022年，8月28日经典案例——囚徒困境两个嫌疑犯（甲和乙）作案后被警察抓住，隔离审讯；警方的政策是“坦白从宽，抗拒从严”：如果两人都坦白则各判8年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判15年；如果都不坦白则各判１年。这两个囚犯该怎么办呢？是选择互相合作（不坦白）还是互相背叛（坦白）？

1950年，斯担福大学客座教授、数学家图克（Tucker)为了形象地说明博弈过程，构造了著名的“囚徒困境”（prisoners’dilemma）模型。第五页，共五十二页，2022年，8月28日经典案例——囚徒困境（15，0）（0，15）（1，1）乙甲不坦白不坦白坦白坦白（8，8）囚徒困境的收益矩阵第六页，共五十二页，2022年，8月28日博弈游戏：囚徒困境请2位同学上来，扮演囚徒困境中的囚徒两名玩家不得交换意见，同时做出选择。玩家可以选择“招”或者“不招”。被判年数少者获胜。胜者加4分，其余加2分。乙

（15，0）（0，15）（1，1）甲不招不招招供招供（8，8）第七页，共五十二页，2022年，8月28日两人都作出招供的选择，是其优势策略，最符合个体理性的选择。但收益却未必最大，这就是“困境”。照博弈论的说法，这是本问题惟一的纳什均衡点。只有在这一点上，任何一人单方面改变选择，他只会得到较差的结果。这一点就是纳什均衡（NashEquilibrium）。纳什均衡：局中人单独改变策略不会得到好处的对局策略组合。当博弈达到纳什均衡，并不一定是对参与者最有利的结果，更不意味着是对整个社会最有利的结果。纳什均衡纳什第八页，共五十二页，2022年，8月28日在“囚徒困境”中表现最好的策略直接取决于对方采用的策略。独立于对方所用策略之外的最好决策是不存在的。在博弈达到纳什均衡时，在外界环境没有变化的情况下，倘若各方坚持原有的利益最大化原则并理性面对现实，那么这种均衡状况就能够长期保持稳定。经典案例——囚徒困境纳什第九页，共五十二页，2022年，8月28日纳什均衡纳什均衡是一种“不后悔”均衡。张三和李四都想要加薪。假如只有一个员工要求加薪，老板会同意，但如果两个人都要求加薪，老板就会生气，并把两个人统统开除。两个员工都不要求加薪并不是纳什均衡，因为当一方知道另一方没有提出加薪要求时，就会后悔自己的选择。两个员工都要求加薪也不是纳什均衡，因为两个人事后都会被开除而后悔自己的策略。这场博弈有两个纳什均衡点，张三要求加薪而李四不要求；或李四要求而张三不要求。第十页，共五十二页，2022年，8月28日诺贝尔经济学奖得主萨缪尔森：你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词——供给与需求。纳什均衡的思想

博弈论专家坎多瑞引申说：要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是“纳什均衡”。第十一页，共五十二页，2022年，8月28日纳什均衡的思想“假如经济学家是按照他们撰写的论文平均每篇的贡献大小排定座次的话，那么约翰•纳什就有极好的理由争夺头把交椅。……假如别人每次写到或说到“纳什均衡”，纳什就能得到1美元，那么他早就变成大富翁了。”迪克西特教授在2000年6月希腊雅典大学授予约翰·纳什荣誉学位典礼上的讲话：第十二页，共五十二页，2022年，8月28日二、现实生活中的“囚徒困境”第十三页，共五十二页，2022年，8月28日“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。[明]宋濂《宋文宪公全集》记有一个故事：玉寅生与三乌丛臣是朋友，他们曾歃血盟誓：“我辈应自励，他日入朝为官，绝不趋炎附势。如有违此誓，请神明惩罚。”没多久，他们一起到晋国为官。当时赵宣子是晋王宠臣，各大夫均奔走于他家。玉寅生重申以前的誓言，三乌丛臣也说：“说过的话犹在耳畔，岂敢忘记！”但三乌丛臣后悔当初的誓言，又怕玉寅生知道。于是在一个大清早，鸡刚一报晓，他就前去拜望赵宣子。一进门，他忽然看到东边走廊有个人坐在那里，他走前举灯一照，那个人原来是玉寅生。现实生活中的“囚徒困境”第十四页，共五十二页，2022年，8月28日现实生活中的“囚徒困境”(升官或落选，升官或落选）（落选，升官）三乌丛臣玉寅生不巴结巴结不巴结巴结（升官，落选）(升官或落选，升官或落选）取决于谁巴结得更到位如果巴结上司会有升官的机会，则其他人也面对同样的局面。假定两个人竞争一个官职，则双方均巴结，则双方成本高；双方均不巴结，则双方成本低。然而“巴结”是双方的最佳的策略。第十五页，共五十二页，2022年，8月28日囚徒与战士约瑟夫·海勒《第22条军规》的一个故事：第二次世界大战胜利在望，投弹手尤塞里安不想成为胜利前夕最后一批牺牲者，千方百计逃避执行任务。他的上级军官问：“可是，假如我方士兵都这么想呢？”可尤塞里安答道：“那我若是不这么想，岂不就成了一个大傻瓜？”第十六页，共五十二页，2022年，8月28日1984年，美国联邦预算赤字实在太高了。裁减必要的巨额开支在政治上并不可行，因此，大幅增税应是不可避免的。民主党总统候选人沃尔特·蒙代尔在竞选中提出增税政策，却被罗纳德·里根打得落花流水，因为里根许诺绝不加税。

政客的囚徒困境

这就是为什么美国是世界上最富有的国家，却同时又是最大的债务国的原因。第十七页，共五十二页，2022年，8月28日电信价格竞争的“囚徒困境”第十八页，共五十二页，2022年，8月28日学生的囚徒困境数十道“减负令”难见效中小学生课业负担不减反增

仅1985年至2000年的15年里，中央就下达“减负令”49次。减轻中小学生过重负担喊了20多年，实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。为什么数十道“减负令”难见效？

第十九页，共五十二页，2022年，8月28日盗版书的“囚徒困境”无论怎么打击，盗版书仍是屡禁不绝。而一个更加奇怪的现象出现了：一些畅销书还没有印刷完毕，其盗版书竟已堂而皇之地走上了书摊———他们一改过去“跟风”的传统，抢在了正版书的前面。而且盗版和正版几乎没有什么差别。这种情况下，人们只能得出一个结论：出版部门出了“内奸”。可是，当这样的现象一次次出现，甚至已经成了某种规律的时候，人们才恍然大悟：原来，是出版者自己在盗自己的版！陈鲁豫亲手抓盗版书《心相约》第二十页，共五十二页，2022年，8月28日国家军备竞赛的“囚徒困境”（搞军备，搞军备）是双方决策的纳什均衡第二十一页，共五十二页，2022年，8月28日军事博弈中苏交恶的年代，双方都在边境地区陈兵百万，巨大的军费开支和潜在的战争风险对两国都是重负。纳什均衡点（陈兵，陈兵)第二十二页，共五十二页，2022年，8月28日博弈游戏4选A的学生将产生总体收益2分，选B不产生总体收益。选A的学生的总分将分给参与游戏的每个学生，但选B的学生可比选A的学生多分1分。请在纸上写上学号、姓名及选项每个学生均需决定选择：A：独立认真地完成作业；B：抄他人的作业。不参加游戏者扣5分第二十三页，共五十二页，2022年，8月28日三、纳什均衡与优势策略第二十四页，共五十二页，2022年，8月28日位置博弈国美与苏宁为什么总喜欢贴身撕杀?第二十五页，共五十二页，2022年，8月28日位置博弈麦当劳和肯德基为什么总是相邻设店?第二十六页，共五十二页，2022年，8月28日位置博弈假设某条路上的顾客流量是均匀分布的，且顾客对麦当劳和肯德基无偏好，而总是乐意惠顾距自己最近的快餐店。1/4麦当劳3/4肯德基1/20A1B在顾客均匀散布的情况下，从资源的最佳配置来看，麦当劳、肯德基应该分别开在1/4、3/4处是最优，各自拥有1/2的顾客量，同时顾客到快餐店的总距离最短。第二十七页，共五十二页，2022年，8月28日位置博弈1/4麦当劳3/4肯德基1/20A1B出于理性考虑，肯德基肯定会想到：如果将店铺从3/4点处向左移一点，将从麦当劳抢夺走部分顾客。而麦当劳自然也想到从1/4点处向右移动以争取更多的顾客。不难想象，双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态，相依为邻且相安无事地做起快餐生意。这在博弈论中称为位置博弈。第二十八页，共五十二页，2022年，8月28日位置博弈现实生活中，在这条路上，顾客流量不是均匀分布的，那么这个模型是否就没有用了呢？模型是现实的抽象，让我们更容易了解现象的本质以及分析的思路。在现实应用中，我们可以加入其他约束条件以完善模型。事实上，即使顾客流量不是均匀分布，结果并没有改变。11%2%23%9%15%6%2%18%9%5%第二十九页，共五十二页，2022年，8月28日位置博弈如果是三家，其位置博弈的结果又会如何？第三十页，共五十二页，2022年，8月28日政党的位置博弈

两个政党要决定自己究竟处于自由-保守意识形态的哪一个位置假定选民平均分布在整个划分表的各个区间，并选举意识形态与自己相近的党派。为使问题具体化，我们把各个政治立场定为从0到100,0代表极自由，而100代表极保守。500100自由保守第三十一页，共五十二页，2022年，8月28日政党的位置博弈在实践中，两党不可能选择完全一致的立场，但大家都在想方设法靠近中点。这一现象最早是由哥伦比亚大学经济学家哈罗德·霍特林(HaroldHotelling）在1929年发现的。霍特林指出经济和社会事务存在相似的案例：“我们的城市大得毫无经济效益，其中的商业区也太集中。卫理公会以及基督教长老会的教堂简直一模一样；苹果酒也是一个味道。”哈罗德·霍特林第三十二页，共五十二页，2022年，8月28日麦当劳与肯德基产品的位置博弈第三十三页，共五十二页，2022年，8月28日新闻大战与优势策略每个星期，《时代》和《新闻周刊》都会暗自较劲，要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面，可以吸引站在报摊前的潜在买主的目光。因此，每个星期，《时代》的编辑们一定会举行闭门会议，选择下一个封面故事。

《时代》这么做的时候，很清楚此时《新闻周刊》也在关起门来开会，选择下一个封面故事。反过来，《新闻周刊》也知道《时代》正在做同样的事情，而《时代》也知道《新闻周刊》知道这一点……这两家新闻杂志投入了一场策略博弈。第三十四页，共五十二页，2022年，8月28日假定本周有两个大新闻：一是日本核爆炸；二是老赵访美。编辑们选择封面故事的时候，首要考虑的是哪一条新闻更能吸引报摊前的买主(订户则无需考虑)。在报摊前的买主当中，假设30%的人对日本核爆炸感兴趣，70%的人对老赵访美感兴趣。买主只会购买封面故事是自己感兴趣的新闻的杂志；假如两本杂志用了同一条新闻做封面故事，那么买主就会平分为两组，一组买《时代》，另一组买《新闻周刊》。新闻大战与优势策略第三十五页，共五十二页，2022年，8月28日（30，70）（70，30）（15，15）新闻周刊时代日本核爆炸日本核爆炸老赵访美老赵访美（35，35）双方的优势策略：采用老赵访美做封面新闻大战与优势策略第三十六页，共五十二页，2022年，8月28日在《时代》和《新闻周刊》这个博弈里，双方都有一个优势策略。各方均有一个优势策略的博弈是最简单的一种博弈。

有时候，某参与者有一个优势策略，其他参与者则没有。新闻大战与优势策略第三十七页，共五十二页，2022年，8月28日假设全体读者略偏向于选择《时代》。假如两个杂志选择同样的新闻做封面故事，喜欢这个新闻的潜在买主当中有60%的人选择《时代》，40%的人选择《新闻周刊》。

这时两杂志该如何选择呢？新闻大战与优势策略第三十八页，共五十二页，2022年，8月28日（30，70）（70，30）（18，12）新闻周刊时代日本核爆炸日本核爆炸老赵访美老赵访美（42，28）对于《时代》，老赵访美仍然是优势策略，但对于《新闻周刊》，其优势策略则变为日本核爆炸。新闻大战与优势策略第三十九页，共五十二页，2022年，8月28日《时代》有一个优势策略，那一定就是他们的选择。因此，《新闻周刊》的编辑们可以很有把握地假定《时代》已经选了老赵访美，并据此选择自己的最佳策略，即日本核爆炸。

由此可见，只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略，另一方则针对这个策略采用自己的最佳策略。注意：“优势策略”的优势是指你的这个策略对你的其他策略占有优势，而不是对你的对手的策略占有优势。新闻大战与优势策略第四十页，共五十二页，2022年，8月28日优势策略优势策略是指不管对方采取任何策略，这一策略总能够显示出优势。但采用优势策略得到的最坏结果并不一定比采用另外一个策略得到的最佳结果要好。劣势策略则是指在博弈中，不论其他参与人采取什么策略，某一参与人可能采取的策略中，对自己严格不利的策略。假如你有一个优势策略，你可以选择采用，并且知道你的对手若是有一个优势策略他也会照办；同样，假如你有一个劣势策略，你应该避免采用，并且知道你的对手若是有一个劣势策略他也会规避。不是所有博弈都有优势策略。实际上，优势策略只是博弈论的一种特例。

第四十一页，共五十二页，2022年，8月28日如果《时代》和《新闻周刊》爆发了一场价格战。

假设每本杂志的制作成本是l美元，且售价只有两个可能的价位选择，分别是2美元或3美元。假设顾客永远倾向于选择价格较低的杂志，且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候，读者总数是500万；杂志价格降到2美元，读者总数将升到800万。新闻大战与优势策略第四十二页，共五十二页，2022年，8月28日（800，0）（0，800）（400，400）新闻周刊时代2元2元3元3元（500，500）双方的优势策略：2美元利润：万美元新闻大战与优势策略第四十三页，共五十二页，2022年，8月28日假如你有一个劣势策略，你应该避免采用，并且知道你的对手若是有一个劣势策略他也会规避。在你没有优势策略的情况下，你要做的就是：不能追求最佳，就要避免最差。即剔除所有劣势策略，不予考虑。如此一步一步做下去。“重复剔除严格劣势策略”(iteratedeliminationofstrictlydominatedstrategy)的思路：首先找出某博弈方的劣势策略(dominatedstrategy)，把这个劣势策略剔除后，剩下的是一个不包含已剔除劣策略的新的博弈；然后在剔除这个新的博弈中的劣策略；继续这个过程，直到没有劣策略存在。如果剩下的策略组合是唯一的，这个唯一的策略组合就是“重复剔除占优均衡”(iterateddominanceequilibrium)。重复剔除的占优均衡第四十四页，共五十二页，2022年，8月28日-8，-80，-15-15，0-1，-1囚徒A囚徒B坦白抵赖坦白抵赖-8大于-150大于-1-8大于-150大于-1抵赖是A的严格劣势策略抵赖是B的严格劣势策略囚徒困境的占优均衡第四十五页，共五十二页，2022年，8月28日优势策略的选择——迭代剔除劣势策略麦当劳和肯德基的位置博弈——为什么总相邻设店?12345678910MKFC不管对手选择哪里，选2永远比选1好，因而选1是严格劣势策略。不管对手选择哪里，选9永远比选10好，因而选10是严格劣势策略。第四十六页，共五十二页，2022年，8月28日1，01，20，30，1M小张老赵UDL0，12，0R老赵：没有占优战略小张：M严格优于R 剔除R行：u优于D列：无占优策略，剔除DM优于L（U，M）是重复剔除的占优均衡重复剔除的占优均衡第四十七页，共五十二页，2022年，8月28日一对新婚夫妇想一起回老家过年，然双方父母家在不同的省份，假如只能到一家父母家过年，夫想一起回夫家，妻想一起回娘家。这对夫妻很恩爱，不想分开过年。你

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

囚徒困境与纳什均衡

文档简介

温馨提示

最新文档

评论

囚徒困境与纳什均衡

文档简介

温馨提示

最新文档

评论

相关文档