




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 囚徒困境与纳什均衡,赵国洪,课件邮箱: 密码:123456,一、经典案例囚徒困境 二、现实生活中的“囚徒困境” 三、纳什均衡与优势策略,本章内容,一、经典案例囚徒困境,克格勃的小花招,在前苏联,有一位乐队指挥在火车上翻看乐谱时,两名克格勃(KGB,苏联国家安全警察)将他作为间谍逮捕了。他们以为那乐谱是某种密码,这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲,却无济于事。 第二天,审问者自鸣得意地走进来说:“我看你还是老实招了吧,我们已经抓住了你的朋友柴可夫斯基了,他这会儿正向我们交代呢。你如果再不招就枪毙了你。如果交代了,只判你10年。”,经典案例囚徒困境,两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”: 如果两人都坦白则各判8年; 如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年; 如果都不坦白则各判年。 这两个囚犯该怎么办呢?是选择互相合作(不坦白)还是互相背叛(坦白)?,1950年,斯担福大学客座教授、数学家图克(Tucker)为了形象地说明博弈过程,构造了著名的“囚徒困境” (prisoners dilemma)模型。,经典案例囚徒困境,囚徒困境的收益矩阵,博弈游戏:囚徒困境,请2位同学上来,扮演囚徒困境中的囚徒 两名玩家不得交换意见,同时做出选择。玩家可以选择“招”或者“不招”。 被判年数少者获胜。 胜者加4分,其余加2分。,乙,两人都作出招供的选择,是其优势策略,最符合个体理性的选择。但收益却未必最大,这就是“困境”。 照博弈论的说法,这是本问题惟一的纳什均衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。这一点就是纳什均衡(Nash Equilibrium)。纳什均衡:局中人单独改变策略不会得到好处的对局策略组合。 当博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会最有利的结果。,纳什均衡,纳什,在“囚徒困境”中表现最好的策略直接取决于对方采用的策略。独立于对方所用策略之外的最好决策是不存在的。 在博弈达到纳什均衡时,在外界环境没有变化的情况下,倘若各方坚持原有的利益最大化原则并理性面对现实,那么这种均衡状况就能够长期保持稳定。,经典案例囚徒困境,纳什,纳什均衡,纳什均衡是一种“不后悔”均衡。 张三和李四都想要加薪。假如只有一个员工要求加薪,老板会同意,但如果两个人都要求加薪,老板就会生气,并把两个人统统开除。 两个员工都不要求加薪并不是纳什均衡,因为当一方知道另一方没有提出加薪要求时,就会后悔自己的选择。 两个员工都要求加薪也不是纳什均衡,因为两个人事后都会被开除而后悔自己的策略。 这场博弈有两个纳什均衡点,张三要求加薪而李四不要求;或李四要求而张三不要求。,诺贝尔经济学奖得主萨缪尔森: 你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词供给与需求。,纳什均衡的思想,博弈论专家坎多瑞引申说: 要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。,纳什均衡的思想,“假如经济学家是按照他们撰写的论文平均每篇的贡献大小排定座次的话,那么约翰纳什就有极好的理由争夺头把交椅。假如别人每次写到或说到“纳什均衡”,纳什就能得到1美元,那么他早就变成大富翁了。”,迪克西特教授在2000年6月希腊雅典大学授予约翰纳什荣誉学位典礼上的讲话:,二、现实生活中的“囚徒困境 ”,“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。 明宋濂宋文宪公全集记有一个故事: 玉寅生与三乌丛臣是朋友,他们曾歃血盟誓:“我辈应自励,他日入朝为官,绝不趋炎附势。如有违此誓,请神明惩罚。” 没多久,他们一起到晋国为官。当时赵宣子是晋王宠臣,各大夫均奔走于他家。玉寅生重申以前的誓言,三乌丛臣也说:“说过的话犹在耳畔,岂敢忘记!” 但三乌丛臣后悔当初的誓言,又怕玉寅生知道。于是在一个大清早,鸡刚一报晓,他就前去拜望赵宣子。一进门,他忽然看到东边走廊有个人坐在那里,他走前举灯一照,那个人原来是玉寅生。,现实生活中的“囚徒困境 ”,现实生活中的“囚徒困境 ”,(升官或落选,升官或落选),(落选,升官),三乌丛臣,玉寅生,不巴结,巴结,不巴结,巴结,(升官,落选),(升官或落选,升官或落选),取决于谁巴结得更到位,如果巴结上司会有升官的机会,则其他人也面对同样的局面。假定两个人竞争一个官职,则,双方均巴结,则双方成本高;双方均不巴结,则双方成本低。然而“巴结”是双方的最佳的策略。,囚徒与战士,约瑟夫海勒第22条军规的一个故事: 第二次世界大战胜利在望,投弹手尤塞里安不想成为胜利前夕最后一批牺牲者,千方百计逃避执行任务。他的上级军官问:“可是,假如我方士兵都这么想呢?”可尤塞里安答道:“那我若是不这么想,岂不就成了一个大傻瓜?”,1984年,美国联邦预算赤字实在太高了。裁减必要的巨额开支在政治上并不可行,因此,大幅增税应是不可避免的。 民主党总统候选人沃尔特蒙代尔在竞选中提出增税政策,却被罗纳德里根打得落花流水,因为里根许诺绝不加税。,政客的囚徒困境,这就是为什么美国是世界上最富有的国家,却同时又是最大的债务国的原因。,电信价格竞争的“囚徒困境”,学生的囚徒困境,数十道“减负令”难见效 中小学生课业负担不减反增 仅1985年至2000年的15年里,中央就下达“减负令”49次。减轻中小学生过重负担喊了20多年,实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。 为什么数十道“减负令”难见效?,盗版书的“囚徒困境”,无论怎么打击,盗版书仍是屡禁不绝。而一个更加奇怪的现象出现了:一些畅销书还没有印刷完毕,其盗版书竟已堂而皇之地走上了书摊他们一改过去“跟风”的传统,抢在了正版书的前面。而且盗版和正版几乎没有什么差别。这种情况下,人们只能得出一个结论:出版部门出了“内奸” 。 可是,当这样的现象一次次出现,甚至已经成了某种规律的时候,人们才恍然大悟:原来,是出版者自己在盗自己的版!,陈鲁豫亲手抓盗版书心相约,国家军备竞赛的“囚徒困境”,(搞军备,搞军备)是双方决策的纳什均衡,军事博弈,中苏交恶的年代,双方都在边境地区陈兵百万,巨大的军费开支和潜在的战争风险对两国都是重负。,纳什均衡点(陈兵,陈兵),博弈游戏4,选A的学生将产生总体收益2分,选B不产生总体收益。选A的学生的总分将分给参与游戏的每个学生,但选B的学生可比选A的学生多分1分。,请在纸上写上学号、姓名及选项,每个学生均需决定选择: A:独立认真地完成作业; B:抄他人的作业。,不参加游戏者扣5分,三、纳什均衡与优势策略,位置博弈,国美与苏宁为什么总喜欢贴身撕杀?,位置博弈,麦当劳和肯德基为什么总是相邻设店?,位置博弈,假设某条路上的顾客流量是均匀分布的,且顾客对麦当劳和肯德基无偏好,而总是乐意惠顾距自己最近的快餐店。,在顾客均匀散布的情况下,从资源的最佳配置来看,麦当劳、肯德基应该分别开在1/4、3/4处是最优,各自拥有1/2的顾客量,同时顾客到快餐店的总距离最短。,位置博弈,出于理性考虑,肯德基肯定会想到:如果将店铺从3/4点处向左移一点,将从麦当劳抢夺走部分顾客。而麦当劳自然也想到从1/4点处向右移动以争取更多的顾客。,不难想象,双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态,相依为邻且相安无事地做起快餐生意。这在博弈论中称为位置博弈。,位置博弈,现实生活中,在这条路上,顾客流量不是均匀分布的,那么这个模型是否就没有用了呢? 模型是现实的抽象,让我们更容易了解现象的本质以及分析的思路。 在现实应用中,我们可以加入其他约束条件以完善模型。 事实上,即使顾客流量不是均匀分布,结果并没有改变。,位置博弈,如果是三家,其位置博弈的结果又会如何?,政党的位置博弈,两个政党要决定自己究竟处于自由-保守意识形态的哪一个位置 假定选民平均分布在整个划分表的各个区间,并选举意识形态与自己相近的党派。为使问题具体化,我们把各个政治立场定为从0到100, 0代表极自由,而100代表极保守。,自由,保守,政党的位置博弈,在实践中,两党不可能选择完全一致的立场,但大家都在想方设法靠近中点。这一现象最早是由哥伦比亚大学经济学家哈罗德霍特林( Harold Hotelling)在1929年发现的。 霍特林指出经济和社会事务存在相似的案例:“我们的城市大得毫无经济效益,其中的商业区也太集中。卫理公会以及基督教长老会的教堂简直一模一样;苹果酒也是一个味道。”,哈罗德霍特林,麦当劳与肯德基产品的位置博弈,新闻大战与优势策略,每个星期,时代和新闻周刊都会暗自较劲,要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面,可以吸引站在报摊前的潜在买主的目光。因此,每个星期,时代的编辑们一定会举行闭门会议,选择下一个封面故事。 时代这么做的时候,很清楚此时新闻周刊也在关起门来开会,选择下一个封面故事。反过来,新闻周刊也知道时代正在做同样的事情,而时代也知道新闻周刊知道这一点这两家新闻杂志投入了一场策略博弈。,假定本周有两个大新闻:一是日本核爆炸;二是老赵访美。 编辑们选择封面故事的时候,首要考虑的是哪一条新闻更能吸引报摊前的买主(订户则无需考虑)。 在报摊前的买主当中,假设30%的人对日本核爆炸感兴趣,70%的人对老赵访美感兴趣。买主只会购买封面故事是自己感兴趣的新闻的杂志;假如两本杂志用了同一条新闻做封面故事,那么买主就会平分为两组,一组买时代,另一组买新闻周刊。,新闻大战与优势策略,(30,70),(70,30),(15,15),新闻周刊,时代,日本核爆炸,日本核爆炸,老赵访美,老赵访美,(35,35),双方的优势策略:采用老赵访美做封面,新闻大战与优势策略,在时代和新闻周刊这个博弈里,双方都有一个优势策略。 各方均有一个优势策略的博弈是最简单的一种博弈。 有时候,某参与者有一个优势策略,其他参与者则没有。,新闻大战与优势策略,假设全体读者略偏向于选择时代。假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选择时代,40%的人选择新闻周刊。 这时两杂志该如何选择呢?,新闻大战与优势策略,(30,70),(70,30),(18,12),新闻周刊,时代,日本核爆炸,日本核爆炸,老赵访美,老赵访美,(42,28),对于时代,老赵访美仍然是优势策略,但对于新闻周刊,其优势策略则变为日本核爆炸。,新闻大战与优势策略,时代有一个优势策略,那一定就是他们的选择。因此,新闻周刊的编辑们可以很有把握地假定时代已经选了老赵访美,并据此选择自己的最佳策略,即日本核爆炸。 由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最佳策略。 注意:“优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是对你的对手的策略占有优势。,新闻大战与优势策略,优势策略,优势策略是指不管对方采取任何策略,这一策略总能够显示出优势。 但采用优势策略得到的最坏结果并不一定比采用另外一个策略得到的最佳结果要好。 劣势策略则是指在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略。 假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。 不是所有博弈都有优势策略。实际上,优势策略只是博弈论的一种特例。,如果时代和新闻周刊爆发了一场价格战。 假设每本杂志的制作成本是l美元,且售价只有两个可能的价位选择,分别是2美元或3美元。 假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。 杂志定价3美元的时候,读者总数是500万;杂志价格降到2美元,读者总数将升到800万。,新闻大战与优势策略,(800,0),(0,800),(400,400),新闻周刊,时代,2元,2元,3元,3元,(500,500),双方的优势策略:2美元,利润:万美元,新闻大战与优势策略,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。 在你没有优势策略的情况下,你要做的就是:不能追求最佳,就要避免最差。即剔除所有劣势策略,不予考虑。如此一步一步做下去。 “重复剔除严格劣势策略”(iterated elimination of strictly dominated strategy)的思路:首先找出某博弈方的劣势策略(dominated strategy) ,把这个劣势策略剔除后,剩下的是一个不包含已剔除劣策略的新的博弈;然后在剔除这个新的博弈中的劣策略;继续这个过程,直到没有劣策略存在。 如果剩下的策略组合是唯一的,这个唯一的策略组合就是“重复剔除占优均衡”(iterated dominance equilibrium)。,重复剔除的占优均衡,囚徒A,囚徒 B,坦白,抵赖,坦白,抵赖,-8大于-15 0大于-1,-8大于-15 0大于-1,囚徒困境的占优均衡,优势策略的选择迭代剔除劣势策略,麦当劳和肯德基的位置博弈为什么总相邻设店?,M,KFC,不管对手选择哪里,选2永远比选1好,因而选1是严格劣势策略。,不管对手选择哪里,选9永远比选10好,因而选10是严格劣势策略。,M,小张,老赵,U,D,L,R,老赵:没有占优战略 小张:M严格优于R 剔除 R,行:u优于D 列:无占优策略,剔除 D,M优于L,(U,M)是重复剔除的占优均衡,重复剔除的占优均衡,一对新婚夫妇想一起回老家过年,然双方父母家在不同的省份,假如只能到一家父母家过年,夫想一起回夫家,妻想一起回娘家。这对夫妻很恩爱,不想分开过年。你知道这对夫妻最终上了开往哪一家的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省池州一中2026届化学高三第一学期期末学业质量监测试题含解析
- 情景歌课件教学课件
- 全新学校清明节扫墓活动方案
- 陕西省西安市新城区西安中学2026届高一化学第一学期期中经典试题含解析
- 高校大学生联谊活动策划方案
- 幼儿园家园共庆端午节活动方案
- 恐龙大迁移课件
- 现代物业面试题及答案
- 海关监制考试题及答案
- 福建莆田秀屿下屿中学2026届化学高二上期末预测试题含答案
- 2025年静宁县城区学校选调教师考试笔试试卷【附答案】
- 2025年乒乓球二级裁判考试题及答案
- 2025年乐清辅警考试题库及答案
- 血标本采集考试试题附有答案
- 浙江省温州市龙湾区2024-2025学年七年级下学期学业水平期末检测数学试题
- 北京卷2025年高考语文真题
- 2025年工业和信息化部所属事业单位招聘28人笔试模拟试题及答案详解一套
- GB/T 45938-2025医疗保障信息平台便民服务相关技术规范
- 养老护理员培训课件模板
- 2024-2025学年北京市西城区统编版三年级下册期末考试语文试卷【含答案】
- DB31∕T 444-2022 排水管道电视和声呐检测评估技术规程
评论
0/150
提交评论