《第三章传统博弈理论(2动态博弈)》.ppt

上传人：低*** IP属地：江西上传时间：2020-06-09 格式：PPT 页数：37 大小：3.97MB 积分：12 举报 版权申诉

免费预览已结束，剩余32页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1,东北财经大学数学与数量经济学院刘德海ldhai2001,博弈论专题讲座（AdvancesinGameTheory),作业讲解,张维迎法律制度的信誉基础一文的重复博弈模型试计算：（1）请将该动态博弈模型转化为静态博弈模型？（2）划线法求解静态模型的纳什均衡解？（3）如果无限次重复博弈，达成信任，诚实的均衡结果，需要如何设计合适的触发策略？贴现因子的成立范围为多少？分析：冷酷的触发策略设计为“当代理人诚实交易时保持信任，否则一旦不诚实则取消交易”；无限期重复博弈，代理人诚实交易的收益：U诚实=5+5+52+=5/(1-)代理人不诚实交易的收益：U不诚实=10+0=10当5/(1-)10时，即0.5时，双方将达成信任，诚实交易结局。,主要内容：第一节传统博弈理论的研究范式；第二节纳什均衡的定义和几种实现途径；第三节纳什均衡的无效率：重复博弈和无名氏定理；第四节纳什均衡的多重性：焦点均衡和子博弈完美均衡；第五节纳什均衡的无效率：相关均衡和信号装置；第六节不完全不完美信息下纳什均衡存在性：贝叶斯均衡,第三章传统博弈理论的简介,4,思考：从博弈论角度，如何看待世界的多样性和最优性(普适性)？传统博弈理论：参与者是完全理性的，根据所处环境能够达到最优化目标。多重均衡的精炼（最优化）：如何精炼出更好的均衡结果？演化博弈理论：参与者是有限理性的，只能达到满意解。多重均衡存在的适用条件：根据不同的历史初始条件和外部随机事件干扰，存在演化的路径依赖现象。,第四节纳什均衡的多重性：静态博弈的焦点均衡,5,静态博弈中多重均衡的选择：焦点原则和社会惯例Schelling在冲突的策略（1960）提出，决策过程中考虑到对称、效率、公平、风险占优等原则，以及一些社会文化惯例。举例：如图博弈中，参与者将选择哪个策略？结果：在三个均衡中，精炼结果是帕累托效率的纯策略(2，2)思考：在什么情况下会选择(1,1)?当参与者B认为，A会采取安全策略G（即Minmax策略），则均衡结果为（1,1）,第四节纳什均衡的多重性：静态博弈的焦点均衡,6,最后通谍博弈（Ultimatumgame,简记为UG，Rothetc.1991）：100元在两个人中分摊，其中一人首先提出方案，对方不接受则双方为0。理论分析结果：首先提出方案的人应该选择99元。实验结果：美国、南斯拉夫选50:50,日本、以色列选60:40。解释：人类决策考虑了公平等社会文化规范。最后通牒实验表明，人们宁愿什么也得不到，也不愿意放弃机会均等和程序公平。“不患寡而患不均”论语季氏世界银行2006年发展报告：公平与发展：总结10年来许多可控实验结果以及近期经济学研究的成果指出，世界上不同的文化和宗教都在关注公平与公正，公正是人们的一种偏好。,第四节纳什均衡的多重性问题：焦点均衡,托马斯克罗姆比谢林（ThomasCrombieSchelling）(1921-)是美国经济学家、马里兰大学公共政策学院教授，美国科学院院士，美国艺术与科学学院院士。研究领域是外交事务、国家安全、核策略和武器控制。“通过博弈论分析改进了我们对冲突和合作的理解”，谢林与罗伯特奥曼2005年共同获奖。谢林最著名的著作冲突的战略（1960）开创了对议价和策略行为的研究，被认为是1945年以来西方影响最大的一百本书之一。1971年，他发表了广为引用的关于种族动态研究的论文“种族隔离的动态模型”。其中解释了纯白人居住区是怎样迅速变为纯黑人居住区的，即使白人居民中没有人绝对反对居住在混合居住区中。（乌鲁木齐市南区）谢林还参与了有关全球变暖的争论。,资料夹2005年诺将得主谢林（Schelling）,主流的数理博弈论：采用数学语言和公理性的方法来进行研究的。谢林认为，决策主体的期望和行为无法通过纯粹的逻辑和数学推导而得。参与人在选择博弈战略时，不仅有数学上的考虑，也有传统、声誉、个性和社会等因素。谢林放弃传统经济学的抽象假设和理性概念，基于更接近现实的观察和众多的实际应用，运用小模型和熟练的语言技巧，分析人们之间的相互影响及个人的自我控制等冲突情形中的行为。该研究方法突破了新古典经济理论分析方法，创立了“非数理博弈理论”这一新的领域，从另一个角度完善和发展了现代博弈论。概念和理论框架：（1）议价和冲突管理理论。代表性著作冲突的战略(1960)；（2）相互依存的选择和行为理论。代表性著作微观动机与宏观行为(1978)；（3）自我控制理论。代表作著作选择与结果(1984)。,资料夹非数理博弈理论,“社会嵌入性”是指现代市场经济中交易或组织嵌入在参与人“社会网络”中。格拉诺威特1985在AJS发表开创性论文EconomicActionandSocialStructure:TheProblemofEmbeddedness发起了一场“新经济社会学”运动：一方面批评了杜克海姆和帕森斯(1951)“过度社会化”的社会学传统；一方面批评了经济学效用理论“社会化不足”的缺陷，认为规范系统既是内生于市场或组织的参与者行为中，又是嵌入到具体的外部社会网络中。这篇文章中提出了著名的社会学概念“嵌入性(embeddedness)”：个体或企业的经济关系是嵌入到实际的社会网络中。,MarkGranovetter,资料夹“社会嵌入性”(socialembeddedness),Bian,Yanjie.“BringingStrongTiesBackIn:IndirectConnection,Bridges,andJobSearchinChina”.AmericanSociologicalReview62,no.3(1997):366-385.边燕杰.找回强关系：中国的间接关系、网络桥梁和求职,美国社会学评论1997,62:366-385.,格拉诺威特最著名的工作是在AJS发表的文章“TheStrengthofWeakTies”（后来形成专著“GettingAJob”），其基本的论断是“弱关系假设”，即你的家庭成员和密友(“strongties”)无法向一般熟人、较为疏远朋友等(“weakties”)提供给你多样化的知识。,西安交通大学人文学院院长边燕杰,思考：如何表述动态博弈问题？启示：运筹学的决策理论中，动态决策（序贯决策）问题的表述方法决策树是由决策点、事件点和结果构成的树图；采用逆序解法；决策准则常为最大收益期望值准则EMV。类比：决策问题是博弈的一种特例，其中一方是自然参与者博弈树VonNeumann和O.Morgenstern（1944）提出“扩展式”模型，又称博弈树。用来描述参与者的行动顺序和采取行动时拥有的信息。,复习：如何表述动态博弈问题？,博弈树（gametree）的构成：结点：包括初始结点、决策结点(作出决策)、终结点(对应参与者报酬)；若结点是有限的，则称有限次博弈。枝：从一个决策结到直接后续结的连线,每一个枝代表参与者一个行动；信息集：一个参与者无法作出区分的最大决策点集合（如图，囚徒B无法判断A的行动，因此其信息集为虚线连接）。子博弈：（1）开始于博弈树的一个结点，该节点对应一个单独信息集；（2）包含从节点开始的博弈树整个部分；（3）从不分割一个信息集(针对后续的节点),13,动态博弈的核心问题：为了影响对方下阶段的行动，作出一些威胁或承诺。但这些威胁或承诺是否可信？举例：（1）威胁和承诺（怀柔）运用与外交中：20世纪初，美国总统西奥多罗斯福提出“胡萝卜加大棒”政策，“说话温和，但带根大棒，就一定能成功。”（2）威胁和承诺运用于内政中：“宣帝作色曰：汉家自有制度，本以霸王道杂之，奈何纯任德教”汉书元帝纪，即法家的刑治与儒家的德治并用。,第四节纳什均衡的多重性：动态博弈和子博弈完美均衡,14,在预测动态博弈的可能结局时，纳什均衡存在多重性现象，其中包含一些不可信的威胁或承诺，如何剔除？该问题属于选择，还是精炼？思考：决策理论中，如何处理多阶段动态规划问题？多阶段决策又称序贯决策：决策过程可以分为若干个相互联系的阶段，每个阶段需要作出决策，本阶段的决策影响到下一阶段的决策。动态规划的最优化原理（Bellman，1951）：作为整个过程的最优策略具有这样的性质，无论过去的状态和决策如何，对先前决策形成的状态而言，余下的决策必须最优。（简言之：最优策略的子策略总是最优的）例如优秀毕业生根据贝尔曼最优化原理，逆推法求解动态规划问题。,第四节纳什均衡的多重性：动态博弈和子博弈完美均衡,BellmanR:Anintroductiontothetheoryofdynamicprogramming,RANDCorp.Report,1953,15,对于动态博弈，一种广泛认可的精练方法是子博弈完美均衡(SPE，SubgamePerfectionEquilibrium)基本思想：动态博弈中，双方都具有理性的“共同知识”。在纳什均衡的基础上（可自我实施的稳定均衡），依据反向归纳法进一步剔除那些不可信的威胁和承诺。子博弈完美均衡的定义：一个纳什均衡是子博弈完美纳什均衡，当该策略的每一个子博弈都产生一个纳什均衡，无论实际中是否能到达。理解：不仅整体上是纳什均衡，而且每一个小步骤都是纳什均衡。存在性定理（Selten,1965）：每个扩展式、完美信息博弈至少有一个纯策略子博弈完美纳什均衡。1965年，发表了最著名论文一个具有需求惯性的寡头博弈模型（德文）。这篇文章成为子博弈精炼均衡的正式定义，为获得诺奖奠定了基础。,第四节纳什均衡的多重性：动态博弈和子博弈完美均衡,16,思考：为什么动态博弈纳什均衡中，存在着一些不可信的威胁或承诺？回忆：纳什均衡的形成理性的参与者+既定的策略。但是，事先给定的对方策略是否合理？举例：如果试卷命题错误（策略），即使计算过程正确（理性），答案是否正确？该题目应该取消计分。由于动态博弈的核心问题是“可信性”，因此子博弈完美均衡是求解动态博弈问题的基本均衡概念。求解方法：后退归纳法。根据共同知识假设，参与者能够预见最后一期的行动，因此采取后退归纳法分析，从最后一个子博弈的结点出发，分析每一个子博弈的最佳策略（纳什均衡）；直至博弈开始阶段，得子博弈完美纳什均衡SPE。,第四节纳什均衡的多重性:动态博弈和子博弈完美均衡,17,台独分子的“理性”目标设定：中国面临着本世纪初二三十年的战略机遇期，不希望有台海战争。台独分子觉得这是推进台独的大好时机，通过修宪等“切香肠”渐进方式来争取独立。台独分子的认知结构：要是中国威胁动武，陈水扁相信美国众议院亲台反华势力能发挥影响力，台海发生冲突后美国必会拔刀相助。中国面对美日联合干涉将知难而退，从而在美日卵翼下实现和平独立的台独梦想。大陆的认知结构：台湾问题事关中国核心利益。当前中国快速整军备战，目标能够在美日联合干涉下仍能有效遏制台独。,举例1：台独与大陆的台海博弈,18,分析该动态博弈的纯策略纳什均衡？转化为策略时博弈模型，2个纯策略纳什均衡为大陆威胁发动台海战争，台独维持现状、台独推动台独，大陆口头抗议，其中，大陆方有一个弱占优策略“口头抗议”。策略式博弈中，给定一方策略后，双方均无动机偏离，无法预测哪一个更有可能实现。现实中，陈水扁之流通过修宪、废统、公投等“切香肠”，预期结局是台独推动台独，大陆口头抗议。台独分子为何如此张狂?台独分子认为，大陆的威胁不可信。,台独分子的黄粱美梦,19,分析纳什均衡大陆威胁发动台海战争，台独维持现状：给定大陆策略“当台独分子推动台独必将导致台海战争”时，台独分子采取“维持现状”策略是纳什均衡。问题：台独分子认为，大陆设定的“红线”是否理性？陈水扁们一厢情愿地认为：大陆面对台独事变时，威胁发动台海战争是非理性的，届时大陆在美日军事压力下虚张声势抗议了事。结论：纳什均衡大陆威胁发动台海战争，台独维持现状作为一种威胁，台独分子认为是不可信的！排除方法：逆推归纳法，求解子博弈完美纳什均衡(3,1),20,背景：2009年胡锦涛主席在纪念告台湾同胞书发表30周年座谈会上的讲话中，提出“为有利于稳定台海局势，减轻军事安全顾虑，两岸可以适时就军事问题进行接触交流，探讨建立军事安全互信机制问题。2008年6月18日马英九接受纽约时报专访，要求北京撤除对准台湾部署的上千枚短中程飞弹。“道理很简单，我们不愿意在安全被飞弹威胁的情况下进行和平协议的谈判”。2013年马英九第二任期称两岸军事议题协商，目前“主客观条件尚未成熟”。思考：台湾要求大陆取消导弹威胁，创造和谈氛围的承诺是否可信？注意：如果大陆撤销导弹后再被迫动武，将损失惨重,举例2：大陆与台湾的军事互信协定,21,如图建模。该博弈有两个纯策略纳什均衡只要策划台独H，则加强战备R，大陆撤销导弹L后坚持动武D，对岸放弃台独实现和谈K大陆撤销导弹实现和谈(2,2)是一个双赢的帕累托结局，但是台湾当局这种承诺是不可信的。一旦撤销导弹，自毁长城，台独分子的最佳选择是策划台独：此时大陆再被迫仓促动武将是非理性的。反向归纳，唯一子博弈完美纳什均衡路径R加强战备，H策划台独，M默认，即现状。,22,苏联解体前，苏联东欧地区唯一的美国软饮料制造商是“百事可乐”（假设“百事可乐”独占的盈利为5亿元）。“可口可乐”公司盘算是否进入该新兴的市场，市场潜力令人垂涎。如果“百事可乐”对潜在进入者采取“强硬”措施如发动广告大战、投入巨额资金改善服务设施、以排他性条款捆绑零售商等，双方两败俱伤，百事略损失1亿元，可乐血本无归损失2亿元；如果“百事”默许进入，则双方瓜分市场，新老厂商分别获得1亿元、2亿元。问题：百事可乐拟采取强硬措施的威胁，能否有效吓阻可口可乐进入？,举例3：可乐饮料公司的寡头竞争,23,该动态博弈有两个纯策略纳什均衡占位者强硬，潜在进入者不进入，占位者默许，潜在者进入纳什均衡占位者强硬，潜在进入者不进入是不可信的，因为一旦可口可乐进入该市场，百事可乐原先威胁采取强硬措施将是非理性的。运用反向归纳，该博弈唯一的子博弈完美纳什均衡路径可口可乐进入，百事可乐默认。,百事可乐,(0,5)(1,2)(-2,-1),可口可乐,不进入进入,默许强硬,举例4：动态博弈在产业组织理论运用：斯塔克伯格模型,斯塔克伯格（Stackelberg）模型：首先，领导者采取行动，其会预期对手的反应，并考虑对手反应后选择自己的策略；其次，追随者在接受领导者的策略后，采取最优策略。,德国经济学家斯塔克尔伯格（H.VonStackelberg）在上世纪30年代提出,小故事：罗斯柴尔德家族在拿破仑战争中投机英国国债的决策行为,斯塔克伯格双寡头模型,问题描述：两家企业生产同质产品，其中企业1为领先者，2为追随者，边际成本为常数，无固定成本：Ci=cqi,i=1,2企业选择产量（连续变量）qi，市场均衡价格为：p=a-(q1+q2)利润函数为：ui(q1,q2)=qi(p-c)均衡分析（后退归纳法）：企业2的最优产量：maxu2(q1,q2)=q2(a-q1-q2-c),求导：q2*(q1)=(a-q1-c)/2领导者1预见到追随者2的上述决策后，做出如下最优决策：maxu1(q1,q2*(q1)=q1(a-q1-q2*(q1)-c),求导：q1*=(a-c)/2均衡结果：最优产量q1*=(a-c)/2，q2*(q1)=(a-c)/4均衡利润：u1*=(a-c)2/8，u2*=(a-c)2/16思考：为什么领导者利润高于追随者？（完全信息）多寡头模型？,市场总需求曲线,思考：如果双方最大支付策略对不相容，先动者和后动者哪位获利更大？斯塔克伯格VS田忌赛马竞争先动优势的关键：完全信息下，让对方相信自己采取某种策略的承诺（捷足先登）；竞争后动优势的关键：不完全信息下，保密自己的行动，同时利用对手的策略信息（以静制动）。,举例5：动态博弈群体性事件应急管理运用,问题背景：群体性事件应急处置中，地方政府“欺软怕硬”的机会主义行为，将会导致事态复杂化。“不闹不解决，小闹小解决，大闹大解决”如何建模：哪种博弈模型？哪些参与者？哪些策略？第一阶段：分散行动的弱势群体在策略空间Sj=(b,p,f)存在一个初始分布。第二阶段：机会主义的地方政府根据弱势群体的分布状态（即社会公众是否在体制内采取行动），采取风险占优策略；均衡分析：子博弈纳什均衡路径为反抗，让步，均衡结果为（V2,-c2）如何分析事态的进一步恶化？增加演化博弈，分析群体的效仿行为。刘德海.群体性突发事件中政府机会主义行为的演化博弈分析,中国管理科学2010,18(1).175-183.,举例6：动态博弈在信息经济学中运用委托代理模型,商业经济中，某人或组织作为委托人，向另一代理人提出一项委托合同。一个典型的合同包括行动次序：（1）在第一阶段，委托人设计一个合同；（2）代理人决定是否接收；（3）如果接受合同，代理人自行决定完成工作的努力程度；（4）由于存在外部的自然因素，造成最终结果存在一定不确定性；（5）委托人根据观察到的产出水平，根据合同约定支付代理人报酬。模型的核心在于：代理人拥有努力程度的私人信息（因为结果具有不确定性造成的），委托人如何设计一个最优的合同机制。思考：如何用博弈模型表述该问题？自然因素如何表述？均衡分析过程：代理人决定最优努力程度委托人设计最优合同,2001年9月11日，恐怖分子劫持的4架民航客机撞击美国纽约世界贸易中心和华盛顿五角大楼。在911事件中共有2998人遇难。这次事件是继第二次世界大战期间珍珠港事件后，历史上第二次对美国造成重大伤亡的袭击。导致了此后国际范围内的多国合作进行反恐怖行动。2005年，卡特里娜飓风袭击了中心位于新奥尔良的墨西哥湾，持续风速为205km/h。超过50处堤坝被风暴潮破坏，造成大面积的洪水。1800多名墨西哥湾沿岸居民丧生，这场美国历史上“最昂贵的飓风”造成的损失总计超过800亿美元。反思：灾难救援为何姗姗来迟？一个原因是联邦政府灾难救援机构的权力已大不如前，因为国土安全部的主要任务是反恐。,举例7：动态博弈在反恐政策中运用,问题：如何权衡反恐投入与自然灾害防御？参与者：恐怖分子Attacker和政府部门Defender；策略设计：恐怖分子攻击目标i的努力水平ai；政府防御目标i的反恐投资d1i和防灾投资d2i。成本函数g。双方对目标价值的评估函数w和v。效用函数：UA(a,d)=EuAw(a,d)-gA(ai)UD(a,d)=EuDv(a,d)-gD(d1i+d2i)动态博弈：政府部门首先决定防御投资d1和d2，其次恐怖分子根据观察结果决定攻击程度a。均衡分析：后退归纳，首先恐怖分子的最优决策a*(d)；其次，老练的政府部门面临决策maxUDa*(d),dJunZhuang,VickiM.Bier.BalancingTerrorismandNaturalDisastersDefensiveStrategywithEndogenousAttackerEffort,OperationsResearch2007,55(5),976991,举例7：动态博弈在反恐政策中运用,进一步思考：动态博弈的SPE精炼方法适用性？,“泽尔腾马”博弈（Seltenshorse）纯策略纳什均衡马首（R1，R2，L3）和马后腿（L1，R2，R3）运用后退归纳法，两个均衡都是子博弈完美纳什均衡SPE问题：分析均衡（L1，R2，R3），该结果中参与者2未进行实际决策；但是如果到达该节点，参与者2选择R2是否理性？已知参与者3选择R3时，参与者2有动机选择L2得到4，而不是R2！同理，参与者1也有动机偏离L1，选择R1，也得到4.糟糕的是，参与者3面临不完全信息，蒙在鼓里无法知晓2的偏离行动！实际更有可能达到的结果是马前腿（R1，L2，R3），即(4,4,0)思考：对于不完全信息博弈，SPE精炼概念不适用（贝叶斯纳什均衡）,威胁,来自实验博弈的证据：蜈蚣博弈Centipedegame（Rosenthal，1981）理论结果：根据理性的共同知识假设，每个参与者能够正确理解参与者之间的相互作用，因此做出正确的预期。均衡结果（1，1）。实验结果：在一定阶段内存在合作。对偏离均衡路径的解释：对于偏离均衡行为的不同解释完全理性框架下，颤抖手均衡认为是外在干扰；不完全信息框架下，前向归纳反应出参与者的合作意图。结论：与理性原则下演绎推理不同的上述实验结果，反映出传统博弈的强理性假设过于严格。,进一步思考：动态博弈的SPE精炼方法适用性？,参考文献,Rosenthal,R.(1981).GamesofPerfectInformation,PredatoryPricing,andtheChainStore.JournalofEconomicTheory25(1):92100.Aumann,R.(1995).BackwardInductionandCommonKnowledgeofRationality.GamesandEconomicBehavior8(1):619.刘德海，群体性突发事件发生机理的多阶段动态博弈模型分析.运筹与管理,201

人人文库> 全部分类> 应用文书 > 项目管理

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《第三章 传统博弈理论(2动态博弈)》.ppt

文档简介

温馨提示

最新文档

评论

相关文档

《第三章传统博弈理论(2动态博弈)》.ppt