


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.论纳什均衡与“囚徒困境的解决方式摘要 本文对于“囚徒困境与纳什平均进展了简要分析,提出了静态博弈中要找出自己的优势策略以及动态博弈中合作重要性的观点。关键词:“囚徒困境 优势策略 合作一、 “囚徒困境博弈及其纳什均衡“囚徒困境博弈是图克Tucker1950年提出的一个著名的博弈模型,是完全信息静态博弈的典型例子。囚徒困境博弈的根本情况如下:警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们所犯的罪行。如果其中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择时机;如果他们两人都拒不认罪,那么他们会被以较轻的
2、阻碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,那么坦白者从轻认罪,立即释放,而另一人那么将重判8年徒刑;如果两人同时坦白认罪,那么他们将被各判5年监禁如果分别用1、5和8 表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,那么两囚徒的得益矩阵如下: 囚徒2坦白不坦白坦白-5,-50,-8不坦白-8,0-1,-1 囚徒1在上图中,“囚徒1、“囚徒2分别代表本博弈中的两个博弈方,也就是两个罪犯;他们各自都有“不坦白和“坦白两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正一样,我们都可以把他们的决策
3、看作是同时做出的。其中矩阵中第一个数字代表决策结果后囚徒1的得益,第二个数字代表决策结果后囚徒2的得益。 博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果各判5年,并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境。二、 寻找自己的优势策略从“极小极大原理到“纳什理论,都是希望提醒博弈中的策略选择和博弈结果之间的关系,使博弈论研究可以在一个博弈构造里寻找比拟稳定的结果,并为策略的选择提供依据。比方在“囚徒困境中,双方招供是“理性的解,因为就单方面来说,无论对方招不招
4、供,你招供都是最正确决策,于是结果就是双方招供,这个结果其实并不好,但最可能出现。为什么会出现这个不好的结果呢.因为对于任何一方来说,这个结果还不是最坏的总比自己单独受过要好。这符合决策的“极小极大原理的,正如著名作家卡尔维诺在"寒冬夜行人"中所说:“有时候,你能指望的最正确结果就是防止最坏情况。这句不经意的话其实完全可以作为“极小极大原理的一个浅显易懂的定义。当身处类似“囚徒困境这样同时行动的静态博弈中时最正确策略是什么.“极小极大原理告诉我们:双方的策略选择往往是有迹可循的,并形成某种“定式,既然如此,只要找到方法提醒这个定式,就可以为自己的策略选择找到依据,同时也可以
5、知道博弈的结果。什么是优势策略.即某些时候它胜于其他策略,且任何时候都不会比其他策略差。假设一个玩家拥有这么一个策略,他的决策将会变的非常简单,因为他可以选择这个优势策略,完全不必担忧其他对手怎么行事。很多人误解了优势策略的“优势终究是对什么而言的,所谓“优势策略是指无论对手采用什么策略,你的这个策略的结果都要比你选择其他策略更好,而不是对你的对手的策略占有优势。另一个常见的误解在于一个优势策略必须满足一个条件,即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最正确结果好,但这并非优势策略的普遍特征。比方“囚徒困境中“背叛是双方的优势策略,但“双方背叛结果却并不比“双方合作好。不是所有
6、博弈都有优势策略,实际上优势与其说是带有一定规律性,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规那么,但这些规那么却并不适用于大多数现实生活中的博弈。三、 重复“囚徒困境:合作是可能的一对未来的预期,是影响人们行为的重要因素。如果未来是重要的,那么就不存在制胜策略。在“囚徒困境中,“社会人和“理性人是有区别的,为什么可以在逻辑上得到完美证明的“囚徒困境,并不能成为人们普遍遵循的选择.于是,现在的问题变成了寻找如何进展合作的充分必要条件了。显然,生活中的人们打交道通常不是一次性的。那么,参加博弈次数又会怎样.设想这个游戏要进展屡次,而且双方都知道具体次数,那么双方仍然没有合作的动机
7、:首先,最后一次大家显然是不合作的。在倒数第二次时,双方还是没有合作的动机。因为她们都预知对方在最后一次会背叛。如此推理下去,对两位自私者任何次数的游戏,从第一次开场就是双方背叛。然而,这个推理并不适用于游戏要进展无限屡次的情况。当游戏次数无限时,合作是有出现的可能。在实际生活中,对未来的预期是影响人们行为的重要因素。一种是预期收益:这样做将会有什么好处;一种是预期风险:这样做将会面临什么问题。这些考虑会影响到人们现实的选择。比方像地摊、车站、旅游点这样的人群流动性大的地方,不但商品和效劳质量最差,而且假货横行,因为这里商家不必为未来考虑一个旅客不大可能因为你的饭菜可口而再次光临,一锤子买卖不
8、赚白不赚。而在比拟稳定的人际关系中,人们就普遍比拟注意礼节和诚信,因为在这个环境里,人们不能不考虑长期影响。从消极的层面看,我们互不侵犯,是为了防止没完没了、两败俱伤的循环报应。二在一个“非零和博弈中,赢得良好的结果往往不是靠战胜对方,而是靠引导对方做出对双方都有利的行为。人们往往习惯考虑零和对局,在这种情况下,一个人赢,另一个就输。为了能赢,一个参赛者必须在大局部时间里比对手做得更好。然而生活中的大多数情况都是非零和的。双方可以都做得很好,也可以都做得很差。合作是可能的,但并不是总能实现。这就是为什么“囚徒困境是各种各样的日常情形的有用模型。人们倾向于采用相对的标准,这个标准经常把对方的成功与自己对立起来,这种标准导致了嫉妒,嫉妒导致企图抵消对方已经得到的优势,在“囚徒困境的形势下,抵消对方优势只能通过背叛来实现,但是背叛将导致更多的背叛和对双方的惩罚。因此在一个非零和的世界里,没有必要非得比对方做得更好。特别要和许多不同的对手打交道时更是这样。只要自己能做得好就没有理由去嫉妒对方的成功。因为在长时间的“重复囚徒困
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 紧缺人才专项招聘与合同解除及补偿协议
- Unit8ChineseNewYear句型默写(试题)译林版英语六年级上册
- 2025【碎石采购与运输项目合同书】私营企业承包合同
- 商场临时安保协议书
- 2025年关于物业服务合同范本
- 地铁合作维修协议书
- 周末课后服务协议书
- 财务管理课程学习经验试题及答案
- 商铺烟道管理协议书
- 2025关于终止解除劳动合同证明书范本
- 第二节-金属切削机床部件
- 2024年车驾管查验业务知识考试题库(供参考)
- 阎良西飞公司招聘考试试题
- 给小学生讲桥梁课件
- 工器具管理台帐
- (完整)中医症候积分量表
- 高效液相色谱质谱联用技术在药物分析中的应用
- 工行内部控制手册总体框架
- 2024年煤矿各类牌板制作标准及使用规定附煤矿井下牌板模版及标准
- 视频会议系统投标方案(技术标)
- 《企业运营管理》题库集答案
评论
0/150
提交评论