第二章纳什均衡与一致预测性

上传人：2*** IP属地：湖北上传时间：2022-04-30 格式：PPT 页数：30 大小：63.50KB 积分：30 举报 版权申诉

已阅读5页，还剩25页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第二章纳什均衡与一致预测性柯华庆2.1 博弈论的基本假设 2.1.1 理性人rational 非合作博弈仅仅从自己利益出发，仅仅利己。合作博弈是利人利己，利人也是为了利己，集体利益最大化以后再在集体中对个人进行补偿。 2.1.2 智能人intelligent 共同知识Common knowledge：如果每个人都知道某个知识，每个局中人都知道每个局中人都知道它，如此等等，从而行如 “（每个局中人都知道）k每个局中人都知道它”的语句对k=0,1,2都是正确的，那么我们就称这个知识为局中人中间的共同知识。有趣的例子：妻子不贞。2.1 博弈的基本结构 2.1.1 游戏(game) 很多游戏都有一

2、个特点：策略或者计谋有举足轻重的作用。 2.1.1.1齐威王田忌赛马：每次双方各出三匹马，一比一比赛三场，每一场的输方要赔一千斤铜给对方。 2.1.1.2猜硬币游戏 2.1.2 博弈的基本结构 2.1.2.1 局中人player (谁与谁玩？） 2.1.2.2 策略 strategy（几种玩法？） 2.1.2.3 次序 order（谁先玩？还是同时玩？） 2.1.2.4 信息 information(依靠什么玩？） 2.1.2.5 得益 payoff（每种玩法得到什么？不是仅仅玩）2.2 静态博弈 2.2.1 规则：所有局中人同时选择行动且只选择一次。任何一方在选择策略时都不可能知道另一

3、方的选择是什么，因此不管他们决策的时间是否相同，我们可以把他们的决策看作是同时作出的；每一方都知道对方的得益情况；这两个决定了是完全信息静态博弈。 “同时”是信息概念，不是时间概念。 2.2.2占优策略 2.2.2.1在博弈中，如果不管其他博弈方选择什么策略，一博弈方的某个策略给他带来的收益始终高于其他策略，至少不低于其他策略，此时“某个策略”必然是该博弈方愿意选择的策略。称为“上策”或“占优策略”。 2.2.2.2如果一个博弈的某个策略组合中的策略都是各个博弈方各自的上策，那么这个策略组合肯定是所有博弈方都愿意选择的，必然是该博弈比较稳定的结果。称这样的策略组合为“上策均衡”。因为上策均衡反

4、映了所有博弈方的绝对偏好，因此非常稳定，根据上策均衡可以对博弈结果作出最肯定的预测。 2.2.2.3上策均衡是博弈论中最强的观念，一个参与人如有可能总是选取一个严格占优策略并且总是不选取任何严格劣策略。上策均衡只要求每个参与人是理性的，而并不要求每个参与人知道其他参与人是理性的，这是因为，不论其他参与人是否理性，上策总是一个理性参与人的最优选择。最有名的博弈模型“囚徒困境”就有上策均衡。 2.2.2.4“囚徒困境” 两个犯罪嫌疑人被捕并受到指控，但除非至少其中有一个人供认犯罪，警方缺乏足够的证据指证他们所犯的罪行，从而将他们按罪判刑。为了得到所需的口供，警察将这两名罪犯关押在不同牢房以防止他们

5、串供或结成攻守联盟，并给他们同样的选择机会：如果他们两人都拒不认罪，则根据已经掌握的证据他们会被判以 1 年徒刑；如果双方都坦白招认，都将被判入狱 5 年（比事实上的罪行要轻）；如果两人中有一人坦白认罪，则坦白者从轻处理，立即释放（信息费用），而另一人则重判 8 年徒刑。得益矩阵如下：囚徒困境杰克约翰沉默坦白沉默 - 1 -1 0-8坦白 -80 -5-5 第一，根据个体理性行为准则和完全理性行为准则，两个博弈方的目标都想要实现也有能力判断自身的最大利益。实际上对双方来说最佳结果是（-1 ，-1 ），对单方最佳结果是（-8 ， 0 ）或（ 0 ，-8 ），问题就在于他们都看到对自己有利的结

6、果，两者之间不能串通，双方都不敢相信或者期望对方有合作精神，所以最后的结果是（-5 ，-5 ）。第二，对结果评价的多视角：就囚徒而言，是有害的；对警察有利、对社会利益来说是非常理想的结果，因为节省了信息费用（调查事实真相的费用）第三个体理性与集体理性从博弈论的一般性来看（不涉及具体人），两个决策者的立场是不明智的（“聪明反被聪明误”），因为既没有实现团体的最大利益，也没有真正实现自身的个体最大利益。一般认为该博弈揭示了个体理性与集体理性的矛盾，对经济学中斯密“看不见的手”理论是一种重创。“他受着一只看不见的手指导，去尽力达到一个并非他本意想要达到的目的。他追求自己的利益，往往使他能比

7、在真正出于本意的情况下更有效地促进社会的利益”。单个囚徒仅仅考虑自己，由于策略的相互依存性，最后的结果违背了囚徒自身的利益（仍然是个体利益）。所以囚徒困境揭示的是“事与愿违”，原因在于社会中策略的相互依存性，即个体追求自身利益要考虑其他人的策略，单纯从自身考虑最后的结果可能正好相反。第四，“囚徒困境”时有广义和狭义之分。狭义的“囚徒困境”是特指囚徒的困境。广义的“囚徒困境”是指个人追求收益最大化的策略由于策略的相互依赖性最后得到的结果违背了自身的利益。在市场竞争的各个领域、在资源利用和环境保护，以及政治、军事上大量存在“囚徒困境”。例如两个寡头的降价（反垄断法），“沉默现象”（两个乘客在遇到

8、一个歹徒抢劫财物）、当事人向法官行贿，公共产品的提供。一般性囚徒困境代数图（ABCD且2BA+D）杰克约翰合作背叛合作 B B AD背叛 DA CC公共产品的供给与囚徒困境李四修不修张三修 11 3-1不修 -13 00 2.2.2.5 囚徒困境与奖惩机制 “囚徒困境”主要是双方不信任的结果，同时没有组织性。如果相互信任的话，就不会出现这种情况。如果他们属于黑社会组织或者是其他组织，在他们内部有一个惩罚措施，这时是合作博弈，结果肯定是两个囚徒都选择抵赖。在囚徒困境中，尽管每个人都选择抵赖比选择坦白要好，但是这个帕累托改善做不到，因为它不满足个人理性要求，（抵赖，抵赖）不是一个均衡。假定

9、两个囚徒在作案之前建立一个攻守同盟（绝不坦白），这个攻守同盟也没有用，因为没有人有积极性遵守协定。这就是合作博弈与非合作博弈的区别。假定有约束力有约束力的协议：奖惩如果我们允许博弈中存在 “有约束力的协议”，使得博弈方采取符合集体利益最大化而不符合个体利益最大化的行为时，能够得到有效的补偿，那么个体利益和集体利益之间的矛盾就可以被克服，从而使博弈方按照集体理性决策和行为成为可能。黑社会中的奖惩制度！法律也是奖惩制度！用法律解决囚徒困境（ABCD且2BA+D，XA-B）杰克约翰合作背叛合作 B B A-X（B-）D背叛 DA-X （B-） CC 2.2.2 占优策略的局限性在典型的博弈问

10、题中，博弈方之间普遍存在策略依存的特征，也就是说一个博弈方的不同策略之间，往往不存在绝对的优劣关系，而只存在相对的、有条件的优劣关系，因此利用策略之间的绝对优劣关系分析筛选的上策均衡法也就无法应用。所以，上策均衡法不是普遍适用的博弈分析方法。适用性较强的博弈分析方法必然是以策略之间的相对优劣关系，而不是绝对优劣关系为基础的。博弈方的最大目标都是实现自身的最大得益。在具有策略和利益相互依存性的博弈问题中，各个博弈方的得益既取决于自己选择的策略，还与其他博弈方选择的策略有关，因此博弈方在决策时必须考虑其他博弈方的存在和策略选择。 2.2.3 纳什均衡 2.2.3.1划线法先找出自己针对其他博弈方

11、每种策略或策略组合（对多人博弈）的最佳对策，即自己的可选策略中与其他博弈方的策略或策略组合配合，给自己带来最大得益的策略（这种相对最佳策略总是存在的，不过不一定唯一），然后在此基础上，通过对其他博弈方策略选择的判断，包括对其他博弈方对自己策略判断的判断等，预测博弈的可能结果和确定自己的最优策略。这就是划线法。 2.2.3.2 箭头法箭头法对于理解博弈关系很有好处的寻找相对稳定性策略组合的分析方法。箭头法的基本思路是对博弈中的每个策略组合进行分析，考察在每个策略组合处各个博弈方能否通过改变自己的策略而增加得益。如能，则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组。

12、最后综合对每个策略组合的分析情况，形成对博弈结果的判断。划线法和箭头法的结果是一致的，可以相互替代。通过划线法和箭头法得到的具有稳定性的策略组合，不管是否唯一，都有一个共同的特性，就是其中每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。 2.2.3.3 纳什均衡的通俗定义纳什均衡是一种策略组合，给定对手的策略，每个参与人选择自己的最优策略。根据纳什均衡的定义，划线法和箭头法事实上是寻找纳什均衡的方法。 2.2.3.4 纳什均衡的存在性 “每一个有限博弈都至少有一个纳什均衡。”现实中的博弈都是可以当作有限博弈来解决。这样纳什均衡的存在就是普遍的。纳什均衡的普遍存在性是纳什均衡概

13、念最重要的性质。猜硬币博弈李四张三正面反面正面 1-1 -11反面 -11 1-1情侣博弈丽鹃大海足球芭蕾足球 12 00芭蕾 00 21 2.2.3.5纳什均衡的一致预测性纳什均衡概念之所以在现实中有广泛的应用则是因为它与一致预测性质的等价性。一致预测性是指：如果所有博弈方都预测一个特定的博弈结果会出现，那么所有的博弈方都不会利用该预测或者这种预测能力来选择与预测结果不一致的策略，即没有哪个博弈方有偏离这个预测结果的愿望，因此这个预测结果最终就真会成为博弈的结果。“一致”的意义在于各博弈方的实际行为选择与他们的预测一致。任何非纳什均衡的预测都不是一致预测，因此一致预测正是纳什均衡的本

14、质属性。一致预测性在博弈分析中重要的原因，主要在于一个博弈方在博弈中所作预测的内容包括他自己的选择，因此博弈方有可能会利用预测改变自己的选择，而具有一致预测性质的博弈分析概念就能避免这样的矛盾，从而是稳定的和自我实施的（自我强制的），相应选择也才是真正可预测的。不具有一致预测性质的博弈分析概念，在分析和预测博弈结果时，则难以避免预测和行为之间的矛盾，因此是不稳定的，甚至是自我否定的，作用和价值必然很有限。纳什均衡的一致预测性质有两个推论：推论1，各博弈方可以预测它，可以预测他们的对手预测它，还可以预测他们的对手会预测自己会预测它。推论2，预测到了任何非纳什均衡策略组合是博弈的最终结果，

15、则意味着要么各博弈方的预测其实并不相同（预测不同的纳什均衡会出现等），要么至少一个博弈方要“犯错误”，包括对博弈结构理解的错误，对其他博弈方的策略预测错误，其信息结构、理性或计算能力有问题，或者是实施策略时会出现差错等。因此在假设各博弈方预测的策略组合相同，以及各博弈方都有完全的理性，也就是不会犯错误的情况下，不可能预测任何非纳什均衡是博弈的结果。2.2.3.6 纳什均衡的立法意义纳什均衡是一种僵局，其他参与人的策略一定，没有任何人有积极性偏离这种均衡的局面。给定别人遵守协议的情况下，没有人有积极性偏离协议规定的自己的行为规则。如果一个协议不构成纳什均衡，它就不可能自动实施，因为至少有一个人会

16、违背这个协议，不满足纳什均衡要求的协议是没有意义的。这是纳什均衡的立法意义。立法的目标与其实施的结果要一致，必须使得参与博弈的各方达到纳什均衡。否则，立法就仅仅是正式或官方规则，而实际有效的支配人们的是潜规则。潜规则的要害是三方博弈：私下达成默契的双方，蒙骗正式制度和公正原则的代表。纳什均衡具有一致预测的本质属性是它在非合作博弈分析中具有不可替代重要地位的根本原因之一。预测是博弈分析最基本的目的之一。也就是说，我们之所以要进行博弈分析，最重要的原因就是预测特定博弈的博弈方究竟会采取什么行动，博弈将有怎样的结果。因此一个博弈分析概念的作用和价值很大程度上是由其对博弈结果预测能力的大小决定的。纳什均衡的一致预测性质正是其预测能力的基本保证。2.2.3.6纳什均衡应用的局限性我们对纳什均衡应用的广泛性和有效性不能过分夸大，尽管纳什均衡非常重要，但不是说学到了这种分析方法你就能预测所有博弈的结果（人类社会人与人之间的关系就是博

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第二章纳什均衡与一致预测性

文档简介

温馨提示

最新文档

评论

第二章纳什均衡与一致预测性

文档简介

温馨提示

最新文档

评论

相关文档