博弈论复习题及答案_第1页
博弈论复习题及答案_第2页
博弈论复习题及答案_第3页
博弈论复习题及答案_第4页
博弈论复习题及答案_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一 、 名 词 解 释 ( 每 题 7 分 , 共 2 8 分 ) 1 、逆向选择: 逆向选择源于事前的信息不对称, 经典例子就是 “柠 檬市场” 二手车市场, 它使得市场资源逐渐流向低质量的产品 或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选 择”。2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、 相互作用和相互制约。 用策略性思维来分析问题, 从中找出合理策 略,实现目标最优。3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均 衡。4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发 送。5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡 (合理

2、策略)的问题。每个博弈者在决定采取何种行动时,不但要 根据自身的利益和目的行事, 还必须考虑到他的决策行为对其他人 的可能影响, 以及其他人的反应行为的可能后果, 通过选择最佳行 动计划,来寻求收益或效用的最大化。二、简要回答问题(每题 10 分,共 40 分)1 、博弈的基本要素有哪些 ?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收 益等五个要素。 博弈的基本特点则是需尽可能考虑到博弈对方的决 策选择以及对自身的影响,并从中选择出对自身最有利的方案决 策,从而达到收益和效用最大化。2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只

3、有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡; 故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才 能猎到所需猎物。4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察 代理人行动,造成信息不对称,从而出现代理人选择不利于委托人 的行为的一种现象; 解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。三、计算题(16分)1、求解下列博弈中的纳什均衡(包括

4、混合策略纳什均衡)。F2B25,20,00,02,4FiBi答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是 H选择F1和N选择F2,以及H选择B1和N 选择B22、A、B两者博弈:A首先行动,可以选择“左”或者“右”的行 动;B后行动,有“ L”和“ R”的行动,其收益如下:当 A选左, B选L时,A的收益为2 ,B的收益为3 ;当A选左,B选R时, A的收益为1 ,B的收益为4 ;当A选右,B选L时,A的收益为 3,B的收益为1 ;当A选右,B选R时,A的收益为0,B的收 益为2。请画出该博弈的博弈树,并求出该博弈的均衡解。四、论述题(16分)1、请结合你的工作或生活

5、,谈谈对行动的可信性的理解,有什么 方法可以建立可信的策略行动。答:每一种策略性行动都面临着可信性的问题,人们不一定相信策略性行动的提出者会实施其行动。因此提出者必须做一些辅助工作让人相信他会在第二阶段实施他已宣布的事。比如,工作中管理者对员工上班时间玩游戏的态度有所不同。 一些管理者对员工很宽容, 并不惩罚玩游戏的员工。 另一些管理者 则十分严厉,会处罚玩游戏的员工。 一些管理者虽然说了会处罚的 承诺,但禁不住员工的好话及其它员工的求情,就原谅了员工。从 博弈论角度分析,假设三种管理者手下的员工各方面都相同,哪一种管理者将得到最高的支付呢?管理者对玩游戏的态度可以是“处罚”或“原谅”,员工可

6、以“玩游戏”或“不玩游戏”,如下表所 示:员工玩游戏不玩游戏管理者处罚1,13,2原谅2,44,3管理者并不希望自己不近人情,故他们最好的结果就是(4,3),最不好的结果就是(1,1);余下的两个策略,因管理者希望员工不玩 游戏,故(3,2)好于(2,4)。员工最喜欢(4,3),最不好的结果也是(1,1), 余下的,员工(2,4)好于(3,2)。在此博弈中,若同时行动,或者是管 理者后行动,与处罚带来的1和3的支付相比,原谅能带来2和4, 是占优策略。此时,员工则会选择玩游戏。最终,均衡的结果是(2,4 )。而如果管理者一开始就承诺“处罚”的话,员工会发现不玩游戏会更好,于是管理者得到了支付3

7、。但是如果有员工曾被管理者原谅, 可能他就会认为管理者心软, 不相信管理者做出的 “处 罚”承诺,从而玩游戏。此时,就会得到一个最坏的结果,即(处 罚,玩游戏),其支付仅为( 1,1 )。通过采取某种行动, 改变博弈以得到更好的结果, 这就是策略 行动。策略行动分:承诺、威胁及许诺。这三种策略性行动最重要 的,是必须让博弈的其他参与人相信策略性行动的提出者在第二阶 段中确实会做其在第一阶段中宣布的事。 而在此每一种策略行动都 面临着可信性的问题, 人们不一定相信策略行动的提出者会实施其 行动。因此仅仅宣布是不够的。在第一阶段,提出者必须做一些辅 助工作让人相信其会在第二阶段做已宣布的事。 上述

8、博弈中涉及的 是管理者对玩游戏员工“处罚”态度的承诺。在这个事件中,管理 者为了从策略行动中获得好处, 他所做的承诺不能和同时行动博弈 的均衡策略一样,因此管理者选择了“处罚”的承诺,这个策略行 动改变了员工的期望和行动。 一旦员工相信这种承诺, 则他们会不 玩游戏,从而得到( 3, 2)的支付。如果员工们尝试玩一次游戏, 管理者可能会原谅他们,理由是“只此一次”,这里就存在了使策 略性行动不付诸实践的诱惑, 使得承诺的可信性下降。如果最终 员工不再相信“处罚”的承诺,则他们会玩游戏,从而最终管理者 和员工只得到( 1,1 )的支付,双方利益均受损。这就是管理者铁 石心肠的原因。因为他清楚破例

9、原谅员工一次的危险性。因此,管 理者需要做一些事情来确立他策略行动的可信性, 即让其他参与人 相信他们的行动如违背你的承诺, 你将一定会付诸实践, 而不会因 人情等引诱而放弃。 避免危险的办法通常只有一个, 那就是绝不越 雷池半步。并且管理者们需要找到某些方法使其的拒绝合理可信, 同时提高其策略行动的可信性。第一、通过减少未来行动的自由, 排除引诱行动,只能实施策略行动中所确定的行动。例如,管理者 可以拿规章制度或工作纪律做挡箭牌, 这些制度纪律一旦制定则个 别管理者就不能在任何特殊情况下破例。 这样做, 就等于将“原谅” 行动从他们的选择组合中剔除了, 因此他只能实施 “处罚” 的承诺。 规

10、则的存在让员工相信管理者不可能再改变想法, 所以此时管理者 “处罚”的承诺就是可信的了。第二、改变未来的支付, 减少引 诱行动的支付使实施策略行动成为最佳行动。 管理者可以通过几次 毫不让步的处罚建立起严厉的声誉, 虽然毫不让步的处罚可能不是 一件愉快的事, 也可能违背管理者的本意, 但这在漫长的工作生涯 中是有好处的。 因为如果一个管理者被认为非常严厉, 就没有员工 想用借口搪塞他, 而他也就减少了拒绝员工的不愉快。 如果管理者 在一个博弈里未能兑现他的承诺, 他的声誉将受到损害, 这也就导 致他在其他的博弈里得到低的支付。 由此观之, 提高策略行动的可 信性将有助于提高策略性博弈中获得的支

11、付。 因此, 学会运用坚守 原则、 提高声誉等方法增强自己行为的可信性, 能帮助我们在今后 的生活中选择最佳行为,获得更高的收益。 2、中国的外交政策一贯坚持和平外交, 因此, 中国一直不断裁军, 但中国同时也拥有一定数量的核武器。 请用所学的博弈理论分析这 一现象。答:以博弈论着名的案例“囚徒困境”为例:警察抓到两个纵 火案犯罪嫌疑人, 然后将它们隔离关押起来, 并要求他们坦白交代。 假定:如果两人都承认纵火,每人将被判刑 3 年;如果都不承认, 每人将被判刑 1 年;如果一个不承认而另一个坦白并作证, 那么抵 赖者将被判刑 5 年,坦白者将被释放。 这两个囚徒将做出怎样的选 择呢?显然,在

12、以上假定中,最好的结果是双方都选择抵赖,结果 是大家都只被判刑 1 年。但是, 由于两个囚徒在理论上都是从利已 的目的出发进行决策的所谓“理性行为者”,在无法获取对方的完 全信息并给予对方充分信任的情况下, 每一个人大概都会选择似乎 对自己最有利的策略, 即选择坦白。 出现了个体理性 (都选择坦白, 各被判 3 年)与集体理性(都不承认,各被判 1 年)的冲突。国与国之间的扩军、 裁军也是这样一种 “ 囚徒困境 ”,在双方 信息沟通不畅的情况下, 就会导致双方不能达成合作, 一国的个体 理性导致了国与国之间的集体非理性, 没有实现相互之间的利益最 大化。我国一贯坚持和平外交, 同时拥有一定数量

13、的核武器, 并且承 诺不首先使用核武器, 这就避免为了达到先发制人的目的, 而不得 不投巨资花大钱在军备上以确保己方克敌制胜的能力。 我国这样的 核战略, 一方面降低了我国在其他核大国眼中威胁, 另一方面保证 我们可以把更多的钱用在社会经济建设和综合国力提升上。有了最低限度核威慑战略(一报还一报的最优策略)的保障, 再通过充分的信息沟通, 就可以打破国与国之间在军备竞赛中的囚 徒困境。以中美、中俄为例, 我们主动释放善意, 不断裁军, 同时, 着力提升我国综合国力,加大中美、中俄双边经济、社会、文化、 军事方面的交流沟通,使得博弈双方认识到博弈的各种可能结果, 从而超越 “你死我活 ”的“零和

14、对局 ”,而实现 “双赢 ”乃至于 “多赢 ”,进而实现集体理性。 3、我们经常在报纸上看到很多企业(比如家电企业)经常希望建 立价格联盟,但往往是无功而返。即使价格联盟成立了,也很快就 破裂了。 请用囚徒困境的思想进行解释。 有什么办法可以让联盟达成。答:假设两囚徒被指控是一宗罪案的同案犯。 他们被分别关在 不同的牢房无法互通信息。 各囚徒都被要求坦白罪行。 如果两囚徒 都坦白,各将被判入狱 5 年; 如果两人都不坦白, 两囚徒可以期望 被从轻发落入狱 2 年;如果一个囚徒坦白而另一个囚徒不坦白, 坦 白的这个囚徒就只需入狱 1 年,而不坦白的囚徒将被判入狱 10 年。 囚徒困境的策略矩阵表

15、。每个囚徒都有两种策略:坦白或不坦白。通过划线法可知: 在囚徒困境这个模型中, 纳什均衡就是双方 都“坦白”。给定甲坦白的情况下,乙的最优策略是坦白;给定乙 坦白的情况下, 甲的最优策略也是坦白。 这里双方都坦白不仅是纳 什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优 选择是坦白。其结果是双方都坦白。市场上的价格战也是一场囚徒博弈, 在国内的家电大战中, 虽 然不是两个对手之间的博弈, 但由于在众多对手当中每一方的市场 份额都很大,每一个主体人的行为后果受对手行为的影响都很大, 因此,其情景大概也是如此。如果清楚这种前景,双方勾结或合作 起来, 都制定比较高的价格, 那么双方都可以因为避免价格大战而 获得较高的利润。但是往往这些联盟处于利益驱动的“ 囚徒困境 ”,各个厂商为了追求自身的市场份额, 都有背叛价格联盟和针 对它

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论