《博弈论与信息经济学》期末考查论文.doc_第1页
《博弈论与信息经济学》期末考查论文.doc_第2页
《博弈论与信息经济学》期末考查论文.doc_第3页
《博弈论与信息经济学》期末考查论文.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论与信息经济学 期末考查论文 学 院: 化工学院 班 级: 无机111 年 级: 2 0 1 1 学 号: 12345666666666 姓 名: 12222222 博弈论视角去思考生活中的问题与现象关键词:混合策略 纳什均衡 博弈内容摘要:路边象棋切磋,实为设局诈骗骗钱财。这里所谓的“诈骗”其实是比较牵强的说法。因为这个现象在贵阳花溪这个和谐的地方尚未引起风波,据估计尚未正式得到管理部门重视。每逢周末外出,花溪公园一带,见象棋诈骗者占街道设局的现象比比皆是,花样层出不穷,手段千奇百怪。围观人群上当受骗现象屡见不鲜,不计其数。某天偶然中看到一城管叔叔出示证件要求设局者快速撤销棋局离开,并警告不得再次发生类似情况,否则以诈骗上诉。于此,深入实践科学发展观,坚持以精细化管理推进城市环境综合整治,搞好执法保障,深入开展相对集中行政处罚权工作,提升城市形象和维护社会和谐,可以说花溪城管人员和这里的“诈骗者”难免会有一场博弈。从博弈论的视角,通过混合策略纳什均衡的思路,可以提供解决问题的有效策略和最佳方案。1、 引言金庸著作天龙八部中,主人公虚竹因其慈悲为怀、无意成败,最终以反扑、倒脱靴手筋成功破解了无涯子设下的“珍珑棋局”,获得绝世武功。而今,街道上如花溪公园一带也不乏这样的棋迷,不过,他们不但没有破解街头残局获得彩金,也没有获得绝世武功,反而往往被骗取高额钱财。网上也曾有过类似报道,据说设局者几个人组织严密,作案时分工合作。根据任务不同,还各自有“身份”,分别是:“炮手”、“飘”、“敲边”等。“炮手”负责在边上看棋局,然后说摆出的棋局是红棋赢,目的是吸引旁边围观的人看。“飘”负责在地上摆棋局,故意输给“炮手”。“敲边”负责在旁边指点。等到有路人过来看的时候,炮手就说是红棋赢的,其实是故意说给路人听的。一个人摆摊,其他人在旁边看,喜欢下象棋的人就会靠近来。来看的话,两个人就开始谈起来,一个人说红的赢,一个人说黑的会赢,两个人这样谈起来。如果谁不相信的,就让他坐下来,一人下红,一人下黑,两人对决。其实,这副残局就是一盘无解之局。据犯罪嫌疑人交代:象棋残局分两种,一种是可以分出输赢的,另外一种残局的棋路是固定的,棋路全部走对结局会是和棋。街头摆出的残局就是第二种,摆棋的人已经将棋路熟记于心,从理论上来说,摆局的人只要不将棋路走乱,挑战的人就不可能赢。骗劲十足的设局者走的正酣,眼看周围有人即将上当,一黑色制服飞驰而来,边出示证件边严肃道:“赶紧收着你的东西离开!都是一家人就不要在那里装了嘛!下次让我再看到就告你诈骗!”,几个人惶惶如丧家之犬收起棋局一溜烟消失在人群里了。然而,占街道设局的现象不仅没有减少,反而是越来越泛滥,街头巷尾偷偷摸摸、躲躲藏藏随处可见他们畏缩的身影。于是引发思考:从博弈论的视角看,城管应该如何处理和象棋骗子的关系,才能使得这一问题得到很好的解决?2、 博弈模型的建立首先假设城管部门负责花溪区的两地的规范管理,现在我们假定,由于城管人力资源有限,城管人员一次只能在一个地方巡逻;而诈骗者也只能去另一个地方占街道设局坑人。再假设如果城管人员选择了象棋骗子占街道设局的地方巡逻,就能把象棋骗子抓住并制止其恶行;而如果象棋骗子选择了没有城管人员巡逻的地方占街道设局,就能够诈骗成功,且能够将预计金额数全部骗到。假定地由于人流量大,需要保护的群众财物为2万元,地人流量较小需要保护的群众财物为1万元。城管人员怎么巡逻才能使效果最好?3、 此项博弈中的策略纳什均衡在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点。所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择。简单说来,纯策略是参与者一次性选取的,并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。通常城管人员认为地需要保护的群众财物是地的倍,一种最容易被城管人员采用而且确实也更为常见的做法就诞生了,城管人员会选择对地进行巡逻。这样,城管人员可以保住2万元的群众财物不被骗取。但是假如象棋骗子去了地,骗取财物的悲剧就随之产生了。这显然不是最好的博弈策略!我们完全可以通过博弈论的知识,对这种策略加以改进。城管人员的一个最好的策略是,抽签决定去地还是地。因为地的价值是地的两倍,城管人员的合理策略应当是要倾向于A以一定概率的随机巡查。这个概率就是:p=A地价值/AB地总价值。这种情况下才能使小偷最大得手几率降至最低。 所以用两个签代表,比如抽到1、2号签去地,抽到3号签去地。这样城管人员有2/3的机会去地进行巡逻,1/3的机会去地。然而很不幸的是,此时的小偷谋求的是最小得手几率的最大化,也就说,城管人员的最优策略将把象棋骗子的最差策略改良,象棋骗子的改良策略是:以同样抽签的办法决定去地还是去地占街道设局,与城管人员不同的是抽到1、2号签去地,抽到3号签去地。这样象棋骗子有1/3的机会去地,2/3的机会去地。显而易见,城管人员与象棋骗子的博弈与“囚徒困境”的案例有一个很大的差别,就是用到了概率的知识,城管与象棋骗子没有一个一定要选择某个策略的纳什均衡,而只有选择某个策略是多少几率的纳什均衡。从博弈论的视角可以看出,这一场城管与象棋骗子的博弈近似于划拳的游戏。在这样一个游戏中,不存在纯策略均衡。对每个参与者来说,出拳策略应当是随机的,不能让对方知道自己的策略,甚至是策略的倾向性。一旦对方知道自己出某个策略的可能性增大,那么在游戏中输的可能性也就增大了。又如一种常见的混合策略样板的猜硬币游戏。由于硬币落下地的正反是随机的,概率都是1/2。那么,猜硬币游戏的参与者选择正反的概率都是1/2,这时博弈达到混合策略纳什均衡。这一类博弈与囚徒困境博弈案例另一个很大的差别就是没有纯策略纳什均衡点,只有混合策略均衡点。这个均衡点下的策略选择是每个参与者的最优(混合)策略选择。 4、 博弈模型的策略分析 城管人员与象棋骗子之间的博弈,提供了混合策略的思路,对混合策略的传统解释是,局中人应用一种随机方法来决定所选择的策略。从城管人员和象棋骗子的不同角度计算最佳混合策略,会得到一个共同点:同样的成功概率。也就是说,城管人员若采用自己的最佳混合策略,就能将象棋骗子的成功概率(5/9,收益为2*1/9+1*4/9=6/9)改良到他采用自己的最佳混合策略所能达到的成功概率(4/9,收益为2*2/9+1*2/9=6/9)。 这并非巧合,而是两个选手的利益严格对立的所有博弈的一个共同点。这个结果称为“最小最大定理”,这一定理指出,在二人零和博弈中。参与者的利益严格相反(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他的对手则努力使自己的最小收益最大化。他们这样做的时候,会出现一个令人惊讶的结果,即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的收益,因此这些策略形成这个博弈的一个均衡。最小最大定理的证明相当复杂,不过,其结论却很实用。假如你想知道的只不过是一个选手之得或者另一个选手之失。你只要计算其中一个选手的最佳混合策略并得出结果就行了。所有混合策略的均衡具有一个共同点:每个参与者并不在意自己的任何具体策略。一旦有必要采取混合策略,找出你自己的策略的方法,就是让对手觉得他们的任何策略对你的下一步都没有影响。这听上去像是朝向混沌无为的一种倒退,其实不然。因为它正好符合零和博弈的随机化动机:一方面要发现对手任何有规则的行为,并相应采取行动。假如他们确实倾向于采取某一种特别的行动,这只能表示他们选择了最糟糕的策略。反过来,也要避免一切会被对方占便宜的模式,坚持自己的最佳混合策略。因此,采取混合或者随机策略,并不等同于毫无策略地“瞎出”,这里面仍然有很强的策略性。其基本要点在于,运用偶然性防止别人发现你的有规则行为并占你的便宜。 因此,当只有混合策略均衡时。对于任何一方来说此时不可能有纯策略的占优策略。花溪城管在尽职的基础上,只需不表现出任何行动的规律性,对辖区(如A、B两地)不持收益偏见,随机巡逻,尽可能去发现象棋骗子们活动的规律性,也可择机放出诱饵引其上钩。相信不久的将来象棋骗子们将如过街老鼠般提心吊胆,乃至无处藏身、被迫弃

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论