博弈论原理与方法PPT课件.ppt

上传人：优*** IP属地：广东上传时间：2020-03-18 格式：PPT 页数：117 大小：2.05MB 积分：88 举报 版权申诉

已阅读5页，还剩112页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论原理与方法关于均衡的分析 1 绪论 2 绪论博弈论简介博弈论的提法可能太过于学术化容易让人们退避三舍其实它有一个非常通俗的名字游戏理论博弈论的英文名字叫做 GameTheory 如果直译就是游戏理论博弈论在我国还有一个名字叫对策论这些名字都很好理解博弈字面意思就是赌博下棋赌博和下棋当然是游戏了赌博和下棋的时候常常要千方百计地应付对手自然是要讲究对策了 3 绪论博弈论简介博弈论主要研究人们的策略的相互依赖行为博弈论认为人是理性的即人人都会在一定的约束条件下最大化自身的利益非合作博弈当事人不能达成一个有约束力的协议合作博弈 4 绪论博弈论简介在博弈理论中虽然每方都要最大化自己的利益但它与优化理论有所区别优化理论可看成单人决策追求的是目标函数的优化影响结果的多个变量控制在决策者自己手中企业管理成本最小化问题运输问题车间调度博弈理论可看成多人决策追求的是策略组合的均衡影响结果的变量是由多个博弈者操纵社会经济系统中的大量问题竞价问题企业竞争决策 5 绪论博弈论的历史沿革犹太法典 Talmud 中一个男人如何将死后的财产发给三个妻子的难题在一个案例中一个男人有三个老婆丈夫在给她们各自的婚姻契约中规定一旦自己死亡她们分别接受100货币 200货币300货币这部法典明确地给出了不同的建议如果男人留下的遗产只有100货币将其平分如果遗产为200货币将其按 50 75 75 的比例划分遗产为300货币时按 50 100 150 的比例划分第一种情况容易理解而如何理解后两种划分这一问题困挠了研究犹太法典的学者达二几千年之久直到1985年有人提出犹太法典的这一建议是完全符合合作博弈理论的每一方案都符合特定博弈的要旨所在中国古代田忌赛马 Cournot的寡头竞争模型 1838年财富理论的数学研究 6 绪论博弈论的历史沿革博弈理论开始于1944年由冯诺依曼 VonNeumann 和摩根斯坦恩 OskarMorgenstern 合作的博弈论和经济行为 TheTheoryofGamesandEconomicBehaviour 一书由PrincetonUniversityPress出版 20世纪50年代以来纳什 Nash 泽尔腾 Selten 海萨尼 Harsanyi 等人对非合作博弈理论的研究使博弈论最终成熟并进入实用 7 绪论博弈论的历史沿革 JohnNash 1950年和1951年纳什的两篇关于非合作博弈论的重要论文彻底改变了人们对竞争和市场的看法他证明了非合作博弈及其均衡解并证明了均衡解的存在性即著名的纳什均衡从而揭示了博弈均衡与经济均衡的内在联系因为在现实世界中非合作博弈要比合作博弈普遍得多 8 绪论博弈论的历史沿革泽尔腾 1965 将纳什均衡的概念引入了动态分析提出了精炼纳什均衡概念以及进一步刻画不完全信息动态博弈的完备贝叶斯纳什均衡而海萨尼则发展了刻画不完全信息静态博弈的贝叶斯纳什均衡 1967 1968 总之他俩进一步将纳什均衡动态化加入了接近实际的不完全信息条件他们的工作为后人继续发展博弈论提供了基本思路和模型 9 绪论博弈论的历史沿革博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议 bindingagreement 倘若不能则称非合作博弈Non cooperativegame 合作博弈强调的是集体主义团体理性CollectiveRationality 是效率公平公正 10 绪论博弈论的历史沿革而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大强调个人理性个人最优决策其结果是有时有效率有时则不然目前经济学家谈到博弈论主要指的是非合作博弈也就是各方在给定的约束条件下如何追求各自利益最大化最后达到力量均衡 11 绪论博弈论的历史沿革博弈论相关诺贝尔奖1972年JohnR HicksandKennethJ Arrow经济均衡原理和社会福利原理 1990年HarryN Markowitz MertonM MillerandWilliamF Sharpe金融经济学原理 1994年JohnHarsanyi JohnF NashandReinhardSelten非合作博弈中均衡的研究1996年JamesA MirrlessandWilliamVickery不对称信息条件下激励机制问题 12 绪论博弈论的历史沿革 2001年JeorgeAkerlof MichaelSpenceandJosephStiglitz非对称信息市场分析2002年丹尼尔卡尼曼和弗农史密斯心理和实验经济学方面2005年ThomasSchellingandRobertAumann合作博弈方面博弈论在构成了微观经济学的基础性方法 13 绪论什么是博弈论博弈论的定义博弈论是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论是研究竞争的逻辑和规律的数学分支简单地说博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用以及不同决策主体之间决策的均衡 14 绪论什么是博弈论从博弈特性角度定义博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法也就是说当一个主体好比说一个人或一个企业的选择受到其他人其他企业选择的影响而且反过来影响到其他人其他企业选择时的决策问题和均衡问题所以在这个意义上说博弃论又称为对策论张维迎 15 绪论什么是博弈论从博弈过程角度定义博弈是指一些个人团队或其他组织面对一定的环境条件在一定的约束条件下依靠所掌握的信息同时或先后一次或多次从各自可能的行为或策略集合中进行选择并实施各自从中取得相应结果或收益的过程 16 绪论什么是博弈论 Whatisagame AGamehasthefollowingfourthings Theplayers Whoisinvolved Definingsociety system Therules Whatcantheydo Defininginteractionspossibleinthesociety Theoutcomes Whatistheresultoftheinteraction Thepayoffs Whatisthepayoff profitofeachpossibleoutcomes 17 绪论什么是博弈论示例猜硬币游戏 Theplayers 2players 1 2 Therules Bothplayerstosstheirrespectivecoinssimultaneously Outcome Coinsmatch bothheadsuportailsup ordon tmatch Payoff Ifcoinsmatch player1pays 1toplayer2andiftheydon tmatchthenplayer2pays 1toplayer1 18 绪论什么是博弈论 Thereareatleasttwoplayers Aplayermaybeanindividual acompany anation abiologicalspecies nature etc Eachplayerhasanumberofpossiblestrategies thatiscoursesofactiontheycanfollow Thestrategiestheplayersfollowdeterminetheoutcomeofthegame Associatedwitheachoutcomeisapayoff 支付 toeachplayeri e thevalueoftheoutcometoeachplayer 19 示例囚徒困境 Prisoner sDilemma 如果都不坦白每人判1年如果都坦白每人判8年如果一人坦白一人不坦白则坦白的人释放不坦白的人判9年绪论什么是博弈论 20 绪论什么是博弈论一场博弈包括参与人 players 例如囚犯A和B 每个参与人的一组策略例如坦白和不坦白支付 payoffs 参与人在所选策略策略组合 thestrategyprofile 上的效用例如如果A坦白而B不坦白 A得0 B得 9 21 绪论什么是博弈论得益矩阵坦白不坦白坦白不坦白行参与者列参与者每位参与者得策略行参与者支付列参与者支付针对每位参与者每个可能结果的支付 22 绪论几个典型模型囚徒困境描述如前分析对囚徒1来说假设囚徒2选择不坦白则对囚徒1来说不坦白的得益为 1 坦白的得益为0 他应选择坦白假设囚徒2选择坦白则对囚徒1来说不坦白的得益为 9 坦白的得益为 8 他还是应选择坦白坦白是囚徒1的一个占优的上策 DominantStrategy 同样囚徒2的上策也应是坦白最终结果两方坦白但对两个囚徒来说最佳结果应该均为不坦白既没有实现两人总体的最大利益也没有真正实现自身个体的最大利益坦白不坦白坦白不坦白 23 绪论几个典型模型寡头竞价模型高价低价高价低价分析假设寡头2采用高价策略那么寡头1采用高价策略得益80 采用低价策略得益130 显然它应采用低价策略假设寡头2采用低价策略那么寡头1采用高价策略得益20 采用低价策略得益60 它也应采用低价策略用同样方法可得寡头2也应采用低价策略低价低价对双方不是理想的结果但因为双方均无法信任所以均坚持采用低价策略 24 绪论几个典型模型猜硬币游戏正面反面正面反面猜方盖方分析在本博弈中双方的利益是严格对立的取胜的关键是不能让另一方猜到自己的策略而同时自己又要尽可能猜出对方的策略在一次博弈中结果取决于机会在多次重复中如果双方决策都正确则我们可求得平均的双方收益彼此得益相同 25 绪论博弈基本要素参与人players又称局中人或博弈方是指博弈中独立决策独立承担后果以自身利益最大化来选择行动的决策主体可以是个人也可以是团队如厂商政府国家每个参与人必须有可供选择的行动和一个很好定义的偏好函数不做决策的被动主体只能被当作环境参数博弈主体的完全理性 PerfectRationality 和有限理性个体理性和集体理性 26 绪论博弈基本要素虚拟参与人pseudo player为了分析方便自然nature被当作虚拟参与人自然代表决定外生随机变量的概率分布的机制比如房地产开发中市场需求的大小 27 绪论博弈基本要素战略strategies参与人在给定信息集的情况下的行动规则它规定参与人在什么时候选择什么行动战略与行动战略是行动的规则而不是行动本身在静态博弈中战略和行动是相同的战略必须是完备的要给出参与人在每一种可想象得到的情况下的行动选择 28 绪论博弈基本要素行动ActionorMoves指参与人所有可能的策略或行动的集合如消费效用最大化决策中的各种商品的购买量根据该集合是有限的还是无限的可分为有限博弈和无限博弈参与人在博弈的某个时点的决策变量坦白抵赖 N个参与人的行动的有序集称为行动组合例如坦白抵赖 29 绪论博弈基本要素行动的顺序 sequenceorder 指参与人作出策略选择的先后顺序决策的顺序对于博弈的结果非常重要有关静态和动态博弈的区分就是基于行动的顺序做出的同样的行动集合行动的顺序不同每个参与人的最优决策就不同博弈的结果也不同尤其在不完全信息博弈中后行动者依赖观察先行动者的行动来获取信息 30 绪论博弈基本要素信息information指参与人在博弈过程中所掌握的对选择策略有帮助的情报知识特别是有关其他参与人对手的特征和行为的知识即该参与人所掌握的其它参与人的对其决策有影响的所有知识完全信息每为参与人对其他参与人的特征策略空间收益函数有准确的信息完美信息参与人完全清楚到他决策时所有参与人的所有决策信息或者说了解博弈已进行过程的所有信息 31 绪论博弈基本要素共同知识commonknowledgexiscommonknowledgeiff Eachplayerknowsx Eachplayerknowsthateachplayerknowsx Eachplayerknowsthateachplayerknowsthateachplayerknowsthateachplayerknowsx adinfinitum 32 绪论博弈基本要素支付payoff 效用utility 又称收益指参与人从博弈中作出决策选择后的所得和所失它是所有参与人策略或行为的函数由于对博弈的分析主要是通过数量关系比较进行因此对于研究的绝大多数博弈本身都有数量关系的结果或可以量化为数量的结果例如收入利润损失个人效用和社会效用 33 绪论博弈基本要素均衡Equilibrium指参与人的最优策略或行动的组合博弈中的均衡是一种稳定的博弈结果但是不是说博弈的结果都能成为均衡博弈的均衡是稳定的是可以预测的均衡分析是博弈论的基本分析手段纳什均衡子博弈精炼纳什均衡贝叶斯纳什均衡 34 绪论博弈模型的分类博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征战略空间和支付的知识信息是否了解两个角度进行把两个角度结合就得到了种博弈完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈另外还存在重复博弈演化博弈等其它类型 35 绪论博弈模型的分类行动的顺序信息 36 绪论主要思想博弈论并不是经济学的一个分支它只是一种方法这也是为什么许多人将其看成数学的一个分支的缘故博弈论已经在政治经济外交和社会学领域有了广泛的应用它为解决不同实体的冲突和合作提供了一个宝贵的方法在对参与者行为研究这一点上博弈论和经济学家的研究模式是完全一样的经济学越来越转向人与人关系的研究特别是人与人之间行为的相互影响和相互作用人与人之间利益和冲突竞争与合作而这正是博弈论的研究对象 37 绪论主要思想博弈论告诉人们要学会理解他人都有自己的思想每个个体都是理性的所以必须了解竞争对手的思想但博弈论并不是疗法并不是处方它并不告诉你该付多少钱买东西这是计算机或者字典的任务博弈论可以解释经济中许多低效率现象的根源找出导致低效率的制度原因从而帮助政府制订修改政策完善交易制度和提高经济效率 38 完全信息静态博弈 39 完全信息静态博弈博弈方同时作出决策且各博弈方对对方的得益完全了解或者虽然决策有先后但是没有人在决策之前看到了其它博弈方的决策行为也没有交换信息一旦决策做出后就只能等待结果对博弈的发展再也不能产生任何影响前章的例子都是静态博弈 40 完全信息静态博弈标准形式博弈 NormalFormGame 的描述标准式博弈G S1 S2 Sn u1 u2 un N 参与人集合 2个囚徒 Si 参与人i的纯策略集合囚徒1可坦白 C 或不坦白 D ui 参与人i的效用函数 u1 C c 8 策略组合的集合 S1 S2 Sn 在囚徒困境博弈中一个策略组合为 C c 坦白不坦白坦白不坦白 41 完全信息静态博弈占优策略均衡如果对于博弈方面临的每一个不同的策略组合该博弈方都选择同一个策略这个被选择的策略就叫该博弈方在博弈中的占优策略 DominantStrategy 也就是说无论其他博弈方如何选择自己的策略该博弈方的最优策略选择是唯一的例如囚徒困境中的坦白就是这种策略 42 完全信息静态博弈占优策略均衡 Notation S i Purestrategyprofileofplayersotherthani s iistheelementofS i ApurestrategysibelongingtoSiisstrictly weakly dominantifui si s i ui si s i foranysi belongingtoSi anys itoS i 43 完全信息静态博弈占优策略均衡占优策略均衡不论其他参与人选择什么战略它的最优战略是唯一的这样的最优战略被称为严格占优战略 44 完全信息静态博弈占优策略均衡价格不变价格增加价格不变价格增加参与人II 参与人I 本博弈中参与人II最好保持价格不变因为不管参与人I的行动如何它均能产生最好的结果这就被成为占优策略 45 完全信息静态博弈占优策略均衡定义战略组合 s1 s2 sn 是博弈G的一个占优战略均衡如果对所有的i si 是参与人i的严格占优战略占优策略均衡是最基本的均衡概念之一占优策略均衡分析是最基本的博弈分析方法对博弈结果作出最肯定的预测但占优策略均衡并不普遍存在这正是博弈理论的价值所在这是最强的一种均衡 46 完全信息静态博弈均衡获取方法1 方法一严格下策反复消去法严格劣策略 StrictlyDominatedStrategies 指在博弈中不论其它博弈方采取什么策略在某一博弈方可能采取的策略中对自己严格不利的策略方法步骤首先找出某博弈方的严格劣策略将它剔除重新构造一个不包括已剔除策略的新博弈然后继续剔除这个新博弈中某一博弈方的严格劣策略重复进行这一过程直到博弈方剩下唯一的策略组合为止这一策略组合就是博弈的均衡解 47 完全信息静态博弈均衡获取方法1 严格下策反复消去法示例甲乙丙 AB 博弈方2 博弈方1 在本博弈中不存在上策均衡因为在博弈方1的A B两种策略中不存在始终占优的上策在博弈方2的甲乙丙三种策略中也不存在始终占优的上策 48 完全信息静态博弈均衡获取方法1 严格下策反复消去法示例对于博弈方2的三个策略策略丙与策略乙之间存在严格优劣关系因为不管博弈方1选择A还是B 博弈方2选择丙的得益都小于乙因此策略丙是相对于策略乙的严格下策可先将丙从博弈方策略空间中去掉甲乙 AB 博弈方2 博弈方1 甲乙丙 AB 博弈方2 博弈方1 49 完全信息静态博弈均衡获取方法1 严格下策反复消去法示例在这个只剩下四种策略组合的博弈中我们可以发现对于博弈方I来说策略B是相对于策略A的严格下策因此可将策略B从博弈方1的策略空间中去掉甲乙 AB 博弈方2 博弈方1 甲乙 A 博弈方2 博弈方1 50 完全信息静态博弈均衡获取方法1 严格下策反复消去法示例最后在这个仅剩两个策略组合的博弈中再比较博弈方2的两个策略显然策略甲是相对于策略乙的严格下策这样原来的博弈只剩下唯一策略组合 A 乙这即是均衡解但它并不是占优策略组合本博弈不存在占优策略组合严格下策并不总是存在如猜硬币田忌赛马有时只能消去部分策略 51 完全信息静态博弈均衡获取方法2 划线法先找出自己针对其他博弈方每种策略或策略组合的最佳对策划线然后在此基础上通过对其他博弈方策略选择的判断包括对其他博弈方对自己策略选择的判断等划线预测博弈的可能结果和确定自己的最优策略甲乙丙 AB 博弈方2 博弈方1 52 完全信息静态博弈均衡获取方法2 划线法示例坦白不坦白坦白不坦白囚徒困境性别之争歌剧足球赛歌剧足球赛妻子丈夫存在两个均衡点严格下策反复消去法无法求解 53 完全信息静态博弈纳什均衡 Formally asetofstrategiesformsaNEif foreveryplayeri ui si s i ui si s i foranysiANashequilibriumisasetofstrategiessuchthatnoneoftheplayerscanimprovetheirpayoffsgiventhestrategiesofothersWhyisthisasolution Becauseit sarestpoint noincentiveforoneplayertochangeunilaterally Whatisequilibrium Equilibriumisastrategycombinationwherenooneplayerhasanincentivetochangeher hisstrategygiventhestrategiesoftheotherplayers 54 完全信息静态博弈纳什均衡每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策每一个博弈者都确信在给定竞争对手的情况下他选择了最好的策略给定你的策略我的策略是最好的策略给定我的策略你的策略也是最好的策略双方在对方给定的策略下不愿意调整自己的策略因为单独改变对自己没有好处划线法正是寻找纳什均衡的一种方法 55 完全信息静态博弈纳什均衡占优策略均衡是一种纳什均衡但纳什均衡不一定是占优均衡占优策略均衡是比纳什均衡更强的均衡它要求任何一个博弈方对于其他博弈方的任何策略选择来说其最优策略选择都是唯一的而纳什均衡只要求任何一个博弈方在其他博弈方的策略选择给定的情况下其选择的策略是最优的判断某一结果是不是纳什均衡的通常做法是看博弈者是否可以通过单方面的背离而受益 56 完全信息静态博弈纳什均衡几种均衡的关系 Nash均衡 57 完全信息静态博弈纳什均衡纳什均衡的一致性预测性质博弈分析最基本的目的之一是预测博弈论中行动者是理性的理性的人不可能作出非理性的事情许多结果就可预测出来一致性预测指如果博弈方都预测一个特定的结果会出现那么所有的博弈方都不会不顾这种预测或者这种预测能力去选择与预测结果不一致的策略纳什均衡具有一致性预测的性质这是纳什均衡的本质属性 58 完全信息静态博弈纳什均衡智猪博弈每次按出10个萝卜按者支付2个单位成本小猪按大猪先到支付 9 1 大猪按小猪先到支付 6 4 同时按支付 7 3 按等待按等待小猪大猪小猪的占优战略等待大猪无占优战略但应该预见到小猪会选择等待 59 完全信息静态博弈纳什均衡实际生活中的智猪博弈天塌下来有高个子顶着搭便车现象公共物品穷人和富人修路博弈中产阶级对社会的稳定作用大股东对管理者的监督 60 完全信息静态博弈 Cournotduopoly寡头竞争模型模型假设两家企业生产同类产品企业1产量q1 企业2产量q2 则总产量Q q1 q2 设市场出清价格P是关于市场总产量的函数P P Q a Q 设两企业生产都无固定成本单位产量的边际成本相同均为c 则两个企业分别生产q1和q2单位产量的总成本为cq1和cq2 两企业同时决定自己的产量即它们在决策之前不知道另一方的产量两博弈方的得益是各自的利润即各自的销售收益减去成本得益分别为u1 q1P Q cq1 q1 a q1 q2 cq1 q1 a q1 q2 c 和u2 q2P Q cq2 q2 a q1 q2 cq2 q2 a q1 q2 c 可见得益均取决于双方的策略即产量 61 完全信息静态博弈 Cournotduopoly寡头竞争模型最优反应函数 BestReactionFunction 对于企业2的任意产量q2 企业1的最佳对策产量q1 就是使自己在企业2生产q2的情况下利润最大化的产量即q1是最大化问题的解令u1对q1的导数等于0 不难求出q1 R1 q2 1 2 a c q2 这就是对于企业2的每一个可能产量企业1的最佳对策产量的计算公式它是企业2产量的一个连续函数我们称它为企业1对企业2产量的最优反应函数 62 完全信息静态博弈 Cournotduopoly寡头竞争模型同样我们可再求出企业2对企业1产量q1的最优反应函数 q2 R2 q1 1 2 a c q1 由于这两个函数都是连续的线性函数所以可用坐标平面上的两条直线表达如下图所示 63 完全信息静态博弈 Cournotduopoly寡头竞争模型 64 完全信息静态博弈 Cournotduopoly寡头竞争模型我们通过求解如上两个方程来获得均衡数量和价格对于q1 我们可得q1 1 2 a c q2 1 2 a c 1 2 a c q1 q1 1 3 a c 同样可得q2 1 3 a c 而P a 2 3 a c 1 3a 2 3cu1 u2 q1 p c 1 9 a c 2 65 完全信息静态博弈 Cournotduopoly寡头竞争模型 66 完全信息静态博弈 Cournotduopoly寡头竞争模型 PerfectCompetitionUnderperfectcompetitionfirmssetpricesequaltoMC So p 12andduetodemandfunction equilibriumquantity Q a p 30 12 18Assumingbothsupplyequalamounts Firm1supplies9andsodoesFirm2 67 完全信息静态博弈 Cournotduopoly寡头竞争模型 68 完全信息静态博弈 Cournotduopoly寡头竞争模型最大化利益的策略组合总得益为U P Q c Q Q a Q cQ a c Q Q2对于上式很容易求得最大总产量Q 1 2 a c 最大总得益u 1 4 a c 2可见1 2 a c 2 9 a c 2与纳什均衡解相比而言虽然总产量较小但总利润却较高在缺乏有效保障机制的情况下它们均有突破1 4 a c 最佳产量的意愿 69 完全信息静态博弈 Cournotduopoly寡头竞争模型 70 完全信息静态博弈 Cournotduopoly寡头竞争模型 71 完全信息静态博弈公共地的悲剧该例表明如果一种资源如果没有排他性就会被过度使用基本假设假设有n个农民共同拥有一片土地每个农民都有放牧的自由令i 1 2 n gi是第农民的放羊数量 G是总的放牧数量 v代表每只羊的平均价值是G的递减函数 c是每只羊的饲养成本 ui g1 g2 gn gi v G gi c 72 完全信息静态博弈公共地的悲剧为了简化结论假设n 3 v 104 G 而c 4得出三个牧民的反应函数 g1 R1 g2 g3 50 1 2q2 1 2q3g2 R2 g1 g3 50 1 2q1 1 2q3g3 R3 g1 g1 50 1 2q1 1 2q2求得g1 g2 g3 25 u1 u2 u3 625 以总得益u G 104 G 4G 100G G2为目标函数使总得益最大得养羊数为G 50 u 2500 625 3 因此本纳什均衡将导致过渡放牧 73 完全信息静态博弈混合策略纳什均衡在某些情况下不存在纳什均衡 74 完全信息静态博弈混合策略纳什均衡社会福利问题政府与流浪汉之间的博弈政府的战略选择救济不救济流浪汉的战略选择找工作游荡找工作游荡救济不救济流浪汉政府非零和博弈 75 完全信息静态博弈混合策略纳什均衡分析类似的问题还有许多如门卫与小偷偷税与查税等以上例子都有一个共同的特征每个参与人都想猜透对方的战略同时又不想让对方猜透自己的战略这类问题都不存在原来意义上的Nash均衡因此有必要拓展Nash均衡的定义 76 完全信息静态博弈混合策略纳什均衡案例分析以猜硬币为例盖币者盖币者要使猜币者不能准确猜中自己的战略只有以随机的方式出招设盖币者出正面的概率为p 则出反面的概率为1 p 必须选择出正面和反面的概率使猜者不论猜正面或反面其期望收益是相同的猜币者猜正面的期望收益 p 1 p 1 猜反面的期望收益 1 p 1 p p 1 p 1 1 p 1 p p 1 2 正面反面正面反面猜方盖方 77 完全信息静态博弈混合策略纳什均衡案例分析同理若设猜币者猜正面的概率为q 则在均衡时其概率为 q 1 2在该例中假设了每个参与人在其策略空间上有一概率分布如盖币者 p 1 p 猜币者 q 1 q 其均衡为 1 2 1 2 1 2 1 2 78 完全信息静态博弈混合策略纳什均衡混合策略Mixedstrategy纯策略 purestrategy 如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动称为纯策略混合战略如果一个战略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动称为混合战略 79 完全信息静态博弈混合策略纳什均衡定义在博弈G S1 S2 Sn u1 u2 un 中参与人i的战略空间为Si si1 si2 sik 若 ij是参与人i选择战略sij的概率且有则称 i i1 i2 ij ik 是参与人i的一个混合战略 80 可用表示参与人的混合战略空间称为一个混合战略组合期望效用函数完全信息静态博弈混合策略纳什均衡混合战略组合MixedStrategyProfile 81 完全信息静态博弈混合策略纳什均衡混合策略纳什均衡定义是一个混合策略纳什均衡若对所有参与人i 有 82 完全信息静态博弈混合策略纳什均衡逃税不逃税检查不检查纳税人税收机关监督博弈的纳税检查A为应纳税款 C为检查成本 F是偷税罚款假定C A F 不存在纯战略纳什均衡 83 完全信息静态博弈混合策略纳什均衡税务机关检查边际p为税务机关检查的概率 q为纳税人逃税概率给定q 税收机关选择检查与否的期望收益 u 1 q A C F q A C 1 q qF A Cu 0 q 0q A 1 q A 1 q 解u 1 q u 0 q 得 q C A F 结论纳税人逃税概率小于q 税收机关的最优决策是不检查否则则反 84 完全信息静态博弈混合策略纳什均衡纳税人逃税边际给定p 纳税人选择逃税与否的期望收益是 u p 1 A F p 0 1 p A F pu p 0 Ap A 1 p A解u p 1 u p 0 得p A A F 即结论如果税收机关检查的概率小于p 纳税人的最优选择是逃税否则交税混合纳什均衡是p q 即税收机关以p 的概率查税而纳税人以q 的概率逃税 85 完全信息静态博弈 Nash均衡的存在性存在性定理 1950 Nash 每一个有限博弈至少存在一个纯战略的或混合战略的Nash均衡证明方法是运用角谷静夫 Kakutani 的不动点定理 86 完全信息静态博弈 Nash均衡的多重性 Nash均衡的多重性歌剧足球赛歌剧足球赛妻子丈夫性别之争事实上这一博弈还存在一个混合战略Nash均衡 1 3 2 3 1 3 2 3 87 完全信息静态博弈 Nash均衡的多重性奇数定理如果一个博弈存在两个纯战略Nash均衡则一定存在另一个混合战略Nash均衡 88 完全信息静态博弈 Nash均衡的多重性 Nash均衡的选择Pareto占优均衡风险规避均衡聚点均衡相关均衡 89 DynamicGameofCompleteInformation 完全信息动态博弈 90 完全信息动态博弈例房产开发商之间的博弈设有两个开发商A和B 其静态博弈的战略式表示为一个矩阵形式开发不开发开发不开发 B A 有两个Nash均衡开发不开发不开发开发 91 完全信息动态博弈 92 完全信息动态博弈动态博弈的扩展式表述Extensiveformrepresentation动态博弈扩展式的要素参与人 1 2 n N虚拟参与人自然行动的顺序 theorderofmoves 谁在什么时候行动行动空间 actionset 每次行动时参与人有何选择信息集 informationset 每次行动时参与人知道什么支付函数 payoffs 在行动结束后每个参与人得到什么环境的选择外在事件的概率分布由虚拟参与人选择如市场需求等不确定因素这里主要是参与人战略空间的扩展要给出每个战略的动态描述行动的顺序行动空间信息集 93 完全信息动态博弈博弈树的基本要素结 nodes 决策结 decisionnodes 参与人采取行动的时点终点结 terminalnodes 是博弈行动路径的终点枝 branches 每一枝代表决策人的行动选择路径 paths 从初始决策结到终点结的一条通路表示一个可能的决策序列或博弈结果信息集 informationsets 由决策结组成博弈树上所有决策结可分割成不同的信息集战略 strategies 94 完全信息动态博弈信息集 informationsets 每一个信息集是决策结集合的子集由满足以下条件的决策结组成一定是同一个参与人的决策结该参与人知道博弈进入该集合中的某个决策结但不知道自己处于哪一个决策结一个参与人在属于同一个信息集的每一个决策结上的行动空间是相同的一般用h x 表示包含决策结x的信息集 95 完全信息动态博弈 96 完全信息动态博弈 97 完全信息动态博弈 98 完全信息动态博弈完美信息 perfectinformation 是指一个参与人对其他参与人包括虚拟参与人自然的行动选择有了准确的了解即每个信息集只含有一个元素完全信息 completeinformation 指每个参与人没有私人信息即他的行动空间支付函数为所有其他参与人所知例如如果两个参与人都知道对方的支付函数行动空间以及市场需求是大还是小则信息是完全的但如果A不知B的行动选择则A的信息是不完美的 99 完全信息动态博弈战略是参与人在给定的信息集的情况下的行动规则因为参与人的每个信息集实质上代表了参与人可能会遇到的几种

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论原理与方法PPT课件.ppt

文档简介

温馨提示

最新文档

评论

博弈论原理与方法PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档