博弈论原理与方法PPT课件.ppt_第1页
博弈论原理与方法PPT课件.ppt_第2页
博弈论原理与方法PPT课件.ppt_第3页
博弈论原理与方法PPT课件.ppt_第4页
博弈论原理与方法PPT课件.ppt_第5页
已阅读5页,还剩112页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论原理与方法 关于均衡的分析 1 绪论 2 绪论 博弈论简介 博弈论的提法可能太过于学术化 容易让人们退避三舍 其实它有一个非常通俗的名字 游戏理论 博弈论的英文名字叫做 GameTheory 如果直译 就是 游戏理论 博弈论在我国还有一个名字 叫对策论 这些名字都很好理解 博弈字面意思就是赌博 下棋 赌博和下棋当然是游戏了 赌博和下棋的时候常常要千方百计地应付对手 自然是要讲究对策了 3 绪论 博弈论简介 博弈论主要研究人们的策略的相互依赖行为 博弈论认为 人是理性的 即人人都会在一定的约束条件下最大化自身的利益 非合作博弈 当事人不能达成一个有约束力的协议 合作博弈 4 绪论 博弈论简介 在博弈理论中 虽然每方都要最大化自己的利益 但它与优化理论有所区别 优化理论可看成单人决策 追求的是目标函数的优化 影响结果的多个变量控制在决策者自己手中 企业管理成本最小化问题 运输问题 车间调度 博弈理论可看成多人决策 追求的是策略组合的均衡 影响结果的变量是由多个博弈者操纵 社会经济系统中的大量问题 竞价问题 企业竞争决策 5 绪论 博弈论的历史沿革 犹太法典 Talmud 中一个男人如何将死后的财产发给三个妻子的难题 在一个案例中 一个男人有三个老婆 丈夫在给她们各自的婚姻契约中规定一旦自己死亡她们分别接受100货币 200货币300货币 这部法典明确地给出了不同的建议 如果男人留下的遗产只有100货币 将其平分 如果遗产为200货币 将其按 50 75 75 的比例划分 遗产为300货币时按 50 100 150 的比例划分 第一种情况容易理解 而如何理解后两种划分 这一问题困挠了研究犹太法典的学者达二几千年之久 直到1985年 有人提出 犹太法典的这一建议是完全符合合作博弈理论的 每一方案都符合特定博弈的要旨所在 中国古代田忌赛马 Cournot的寡头竞争模型 1838年 财富理论的数学研究 6 绪论 博弈论的历史沿革 博弈理论开始于1944年由冯 诺依曼 VonNeumann 和摩根斯坦恩 OskarMorgenstern 合作的 博弈论和经济行为 TheTheoryofGamesandEconomicBehaviour 一书由PrincetonUniversityPress出版 20世纪50年代以来 纳什 Nash 泽尔腾 Selten 海萨尼 Harsanyi 等人对非合作博弈理论的研究使博弈论最终成熟并进入实用 7 绪论 博弈论的历史沿革 JohnNash 1950年和1951年纳什的两篇关于非合作博弈论的重要论文 彻底改变了人们对竞争和市场的看法 他证明了非合作博弈及其均衡解 并证明了均衡解的存在性 即著名的纳什均衡 从而揭示了博弈均衡与经济均衡的内在联系 因为在现实世界中 非合作博弈要比合作博弈普遍得多 8 绪论 博弈论的历史沿革 泽尔腾 1965 将纳什均衡的概念引入了动态分析 提出了 精炼纳什均衡 概念 以及进一步刻画不完全信息动态博弈的 完备贝叶斯纳什均衡 而海萨尼则发展了刻画不完全信息静态博弈的 贝叶斯纳什均衡 1967 1968 总之 他俩进一步将纳什均衡动态化 加入了接近实际的不完全信息条件 他们的工作为后人继续发展博弈论 提供了基本思路和模型 9 绪论 博弈论的历史沿革 博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论 两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议 bindingagreement 倘若不能 则称非合作博弈Non cooperativegame 合作博弈强调的是集体主义 团体理性CollectiveRationality 是效率 公平 公正 10 绪论 博弈论的历史沿革 而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大 强调个人理性 个人最优决策 其结果是有时有效率 有时则不然 目前经济学家谈到博弈论主要指的是非合作博弈 也就是各方在给定的约束条件下如何追求各自利益最大化 最后达到力量均衡 11 绪论 博弈论的历史沿革 博弈论相关诺贝尔奖1972年JohnR HicksandKennethJ Arrow经济均衡原理和社会福利原理 1990年HarryN Markowitz MertonM MillerandWilliamF Sharpe金融经济学原理 1994年JohnHarsanyi JohnF NashandReinhardSelten非合作博弈中均衡的研究1996年JamesA MirrlessandWilliamVickery不对称信息条件下激励机制问题 12 绪论 博弈论的历史沿革 2001年JeorgeAkerlof MichaelSpenceandJosephStiglitz非对称信息市场分析2002年丹尼尔 卡尼曼和弗农 史密斯心理和实验经济学方面2005年ThomasSchellingandRobertAumann合作博弈方面博弈论在构成了微观经济学的基础性方法 13 绪论 什么是博弈论 博弈论的定义 博弈论是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论 是研究竞争的逻辑和规律的数学分支 简单地说 博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用 以及不同决策主体之间决策的均衡 14 绪论 什么是博弈论 从博弈特性角度定义 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法 也就是说 当一个主体 好比说一个人或一个企业的选择受到其他人 其他企业选择的影响 而且反过来影响到其他人 其他企业选择时的决策问题和均衡问题 所以在这个意义上说 博弃论又称为 对策论 张维迎 15 绪论 什么是博弈论 从博弈过程角度定义 博弈是指一些个人 团队或其他组织 面对一定的环境条件 在一定的约束条件下 依靠所掌握的信息 同时或先后 一次或多次 从各自可能的行为或策略集合中进行选择并实施 各自从中取得相应结果或收益的过程 16 绪论 什么是博弈论 Whatisagame AGamehasthefollowingfourthings Theplayers Whoisinvolved Definingsociety system Therules Whatcantheydo Defininginteractionspossibleinthesociety Theoutcomes Whatistheresultoftheinteraction Thepayoffs Whatisthepayoff profitofeachpossibleoutcomes 17 绪论 什么是博弈论 示例 猜硬币游戏 Theplayers 2players 1 2 Therules Bothplayerstosstheirrespectivecoinssimultaneously Outcome Coinsmatch bothheadsuportailsup ordon tmatch Payoff Ifcoinsmatch player1pays 1toplayer2andiftheydon tmatchthenplayer2pays 1toplayer1 18 绪论 什么是博弈论 Thereareatleasttwoplayers Aplayermaybeanindividual acompany anation abiologicalspecies nature etc Eachplayerhasanumberofpossiblestrategies thatiscoursesofactiontheycanfollow Thestrategiestheplayersfollowdeterminetheoutcomeofthegame Associatedwitheachoutcomeisapayoff 支付 toeachplayeri e thevalueoftheoutcometoeachplayer 19 示例 囚徒困境 Prisoner sDilemma 如果都不坦白 每人判1年如果都坦白 每人判8年如果一人坦白 一人不坦白 则坦白的人释放 不坦白的人判9年 绪论 什么是博弈论 20 绪论 什么是博弈论 一场博弈包括 参与人 players 例如囚犯A和B 每个参与人的一组策略 例如 坦白 和 不坦白 支付 payoffs 参与人在所选策略 策略组合 thestrategyprofile 上的效用例如如果A坦白 而B不坦白 A得0 B得 9 21 绪论 什么是博弈论 得益矩阵 坦白不坦白 坦白不坦白 行参与者 列参与者 每位参与者得策略 行参与者支付 列参与者支付 针对每位参与者 每个可能结果的支付 22 绪论 几个典型模型 囚徒困境描述如前 分析 对囚徒1来说 假设囚徒2选择不坦白 则对囚徒1来说 不坦白的得益为 1 坦白的得益为0 他应选择坦白 假设囚徒2选择坦白 则对囚徒1来说 不坦白的得益为 9 坦白的得益为 8 他还是应选择坦白 坦白是囚徒1的一个占优的 上策 DominantStrategy 同样 囚徒2的 上策 也应是坦白 最终结果两方坦白 但对两个囚徒来说 最佳结果应该均为不坦白 既没有实现两人总体的最大利益 也没有真正实现自身个体的最大利益 坦白不坦白 坦白不坦白 23 绪论 几个典型模型 寡头竞价模型 高价低价 高价低价 分析 假设寡头2采用高价策略 那么寡头1采用高价策略得益80 采用低价策略得益130 显然它应采用低价策略 假设寡头2采用低价策略 那么寡头1采用高价策略得益20 采用低价策略得益60 它也应采用低价策略 用同样方法可得寡头2也应采用低价策略 低价 低价对双方不是理想的结果 但因为双方均无法信任 所以均坚持采用低价策略 24 绪论 几个典型模型 猜硬币游戏 正面反面 正面反面 猜方 盖方 分析 在本博弈中 双方的利益是严格对立的 取胜的关键是不能让另一方猜到自己的策略而同时自己又要尽可能猜出对方的策略 在一次博弈中结果取决于机会 在多次重复中 如果双方决策都正确 则我们可求得平均的双方收益 彼此得益相同 25 绪论 博弈基本要素 参与人players又称 局中人 或 博弈方 是指博弈中独立决策 独立承担后果 以自身利益最大化来选择行动的决策主体 可以是个人 也可以是团队 如厂商 政府 国家 每个参与人必须有可供选择的行动和一个很好定义的偏好函数 不做决策的被动主体只能被当作环境参数 博弈主体的完全理性 PerfectRationality 和有限理性 个体理性和集体理性 26 绪论 博弈基本要素 虚拟参与人pseudo player为了分析方便 自然nature被当作虚拟参与人 自然代表决定外生随机变量的概率分布的机制 比如房地产开发中市场需求的大小 27 绪论 博弈基本要素 战略strategies参与人在给定信息集的情况下的行动规则 它规定参与人在什么时候选择什么行动 战略与行动 战略是行动的规则而不是行动本身 在静态博弈中 战略和行动是相同的 战略必须是完备的 要给出参与人在每一种可想象得到的情况下的行动选择 28 绪论 博弈基本要素 行动ActionorMoves指参与人所有可能的策略或行动的集合 如消费效用最大化决策中的各种商品的购买量 根据该集合是有限的还是无限的 可分为有限博弈和无限博弈 参与人在博弈的某个时点的决策变量 坦白 抵赖 N个参与人的行动的有序集称为行动组合 例如 坦白 抵赖 29 绪论 博弈基本要素 行动的顺序 sequenceorder 指参与人作出策略选择的先后顺序 决策的顺序 对于博弈的结果非常重要 有关静态和动态博弈的区分就是基于行动的顺序做出的 同样的行动集合 行动的顺序不同 每个参与人的最优决策就不同 博弈的结果也不同 尤其在不完全信息博弈中 后行动者依赖观察先行动者的行动来获取信息 30 绪论 博弈基本要素 信息information指参与人在博弈过程中所掌握的对选择策略有帮助的情报知识 特别是有关其他参与人 对手 的特征和行为的知识 即该参与人所掌握的其它参与人的 对其决策有影响的所有知识 完全信息 每为参与人对其他参与人的特征 策略空间 收益函数有准确的信息 完美信息 参与人完全清楚到他决策时 所有参与人的所有决策信息 或者说 了解博弈已进行过程的所有信息 31 绪论 博弈基本要素 共同知识commonknowledgexiscommonknowledgeiff Eachplayerknowsx Eachplayerknowsthateachplayerknowsx Eachplayerknowsthateachplayerknowsthateachplayerknowsthateachplayerknowsx adinfinitum 32 绪论 博弈基本要素 支付payoff 效用utility 又称 收益 指参与人从博弈中作出决策选择后的所得和所失 它是所有参与人策略或行为的函数 由于对博弈的分析主要是通过数量关系比较进行 因此对于研究的绝大多数博弈 本身都有数量关系的结果或可以量化为数量的结果 例如收入 利润 损失 个人效用和社会效用 33 绪论 博弈基本要素 均衡Equilibrium指参与人的最优策略或行动的组合 博弈中的均衡 是一种稳定的博弈结果 但是不是说博弈的结果都能成为均衡 博弈的均衡是稳定的 是可以预测的 均衡分析是博弈论的基本分析手段 纳什均衡 子博弈精炼纳什均衡 贝叶斯纳什均衡 34 绪论 博弈模型的分类 博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征 战略空间和支付的知识 信息 是否了解两个角度进行 把两个角度结合就得到了 种博弈 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈 另外还存在重复博弈 演化博弈等其它类型 35 绪论 博弈模型的分类 行动的顺序 信息 36 绪论 主要思想 博弈论并不是经济学的一个分支 它只是一种方法 这也是为什么许多人将其看成数学的一个分支的缘故 博弈论已经在政治 经济 外交和社会学领域有了广泛的应用 它为解决不同实体的冲突和合作提供了一个宝贵的方法 在对参与者行为研究这一点上 博弈论和经济学家的研究模式是完全一样的 经济学越来越转向人与人关系的研究 特别是人与人之间行为的相互影响和相互作用 人与人之间利益和冲突 竞争与合作 而这正是博弈论的研究对象 37 绪论 主要思想 博弈论告诉人们 要学会理解他人都有自己的思想 每个个体都是理性的 所以必须了解竞争对手的思想 但博弈论并不是疗法 并不是处方 它并不告诉你该付多少钱买东西 这是计算机或者字典的任务 博弈论可以解释经济中许多低效率现象的根源 找出导致低效率的制度原因 从而帮助政府制订 修改政策完善交易制度和提高经济效率 38 完全信息静态博弈 39 完全信息静态博弈 博弈方同时作出决策 且各博弈方对对方的得益完全了解 或者虽然决策有先后 但是没有人在决策之前看到了其它博弈方的决策行为 也没有交换信息 一旦决策做出后 就只能等待结果 对博弈的发展再也不能产生任何影响 前章的例子都是静态博弈 40 完全信息静态博弈 标准形式博弈 NormalFormGame 的描述标准式博弈G S1 S2 Sn u1 u2 un N 参与人集合 2个囚徒 Si 参与人i的纯策略集合 囚徒1可坦白 C 或不坦白 D ui 参与人i的效用函数 u1 C c 8 策略组合的集合 S1 S2 Sn 在囚徒困境博弈中 一个策略组合为 C c 坦白不坦白 坦白不坦白 41 完全信息静态博弈 占优策略均衡 如果对于博弈方面临的每一个不同的策略组合 该博弈方都选择同一个策略 这个被选择的策略就叫该博弈方在博弈中的 占优策略 DominantStrategy 也就是说无论其他博弈方如何选择自己的策略 该博弈方的最优策略选择是唯一的 例如囚徒困境中的 坦白 就是这种策略 42 完全信息静态博弈 占优策略均衡 Notation S i Purestrategyprofileofplayersotherthani s iistheelementofS i ApurestrategysibelongingtoSiisstrictly weakly dominantifui si s i ui si s i foranysi belongingtoSi anys itoS i 43 完全信息静态博弈 占优策略均衡 占优策略均衡不论其他参与人选择什么战略 它的最优战略是唯一的 这样的最优战略被称为 严格 占优战略 44 完全信息静态博弈 占优策略均衡 价格不变价格增加 价格不变价格增加 参与人II 参与人I 本博弈中 参与人II最好保持价格不变 因为不管参与人I的行动如何 它均能产生最好的结果 这就被成为占优策略 45 完全信息静态博弈 占优策略均衡 定义 战略组合 s1 s2 sn 是博弈G的一个占优战略均衡 如果对所有的i si 是参与人i的 严格 占优战略 占优策略均衡 是最基本的均衡概念之一 占优策略均衡分析是最基本的博弈分析方法 对博弈结果作出最肯定的预测 但 占优策略均衡 并不普遍存在 这正是博弈理论的价值所在 这是最强的一种均衡 46 完全信息静态博弈 均衡获取方法1 方法一 严格下策反复消去法严格劣策略 StrictlyDominatedStrategies 指 在博弈中 不论其它博弈方采取什么策略 在某一博弈方可能采取的策略中 对自己严格不利的策略 方法步骤 首先找出某博弈方的严格劣策略 将它剔除 重新构造一个不包括已剔除策略的新博弈 然后 继续剔除这个新博弈中某一博弈方的严格劣策略 重复进行这一过程 直到博弈方剩下唯一的策略组合为止 这一策略组合就是博弈的均衡解 47 完全信息静态博弈 均衡获取方法1 严格下策反复消去法 示例 甲乙丙 AB 博弈方2 博弈方1 在本博弈中 不存在上策均衡 因为在博弈方1的A B两种策略中 不存在始终占优的上策 在博弈方2的甲 乙 丙三种策略中 也不存在始终占优的上策 48 完全信息静态博弈 均衡获取方法1 严格下策反复消去法 示例对于博弈方2的三个策略 策略丙与策略乙之间存在严格优劣关系 因为不管博弈方1选择A还是B 博弈方2选择丙的得益都小于乙 因此策略丙是相对于策略乙的严格下策 可先将丙从博弈方策略空间中去掉 甲乙 AB 博弈方2 博弈方1 甲乙丙 AB 博弈方2 博弈方1 49 完全信息静态博弈 均衡获取方法1 严格下策反复消去法 示例在这个只剩下四种策略组合的博弈中 我们可以发现对于博弈方I来说 策略B是相对于策略A的严格下策 因此 可将策略B从博弈方1的策略空间中去掉 甲乙 AB 博弈方2 博弈方1 甲乙 A 博弈方2 博弈方1 50 完全信息静态博弈 均衡获取方法1 严格下策反复消去法 示例最后在这个仅剩两个策略组合的博弈中 再比较博弈方2的两个策略 显然策略甲是相对于策略乙的严格下策 这样 原来的博弈只剩下唯一策略组合 A 乙 这即是均衡解 但它并不是占优策略组合 本博弈不存在占优策略组合 严格下策并不总是存在 如猜硬币 田忌赛马 有时只能消去部分策略 51 完全信息静态博弈 均衡获取方法2 划线法先找出自己针对其他博弈方每种策略或策略组合的最佳对策 划线 然后在此基础上 通过对其他博弈方策略选择的判断 包括对其他博弈方对自己策略选择的判断等 划线 预测博弈的可能结果和确定自己的最优策略 甲乙丙 AB 博弈方2 博弈方1 52 完全信息静态博弈 均衡获取方法2 划线法示例 坦白不坦白 坦白不坦白 囚徒困境 性别之争 歌剧足球赛 歌剧足球赛 妻子 丈夫 存在两个均衡点 严格下策反复消去法无法求解 53 完全信息静态博弈 纳什均衡 Formally asetofstrategiesformsaNEif foreveryplayeri ui si s i ui si s i foranysiANashequilibriumisasetofstrategiessuchthatnoneoftheplayerscanimprovetheirpayoffsgiventhestrategiesofothersWhyisthisasolution Becauseit sarestpoint noincentiveforoneplayertochangeunilaterally Whatisequilibrium Equilibriumisastrategycombinationwherenooneplayerhasanincentivetochangeher hisstrategygiventhestrategiesoftheotherplayers 54 完全信息静态博弈 纳什均衡 每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策 每一个博弈者都确信 在给定竞争对手的情况下 他选择了最好的策略 给定你的策略 我的策略是最好的策略 给定我的策略 你的策略也是最好的策略 双方在对方给定的策略下不愿意调整自己的策略 因为单独改变对自己没有好处 划线法正是寻找纳什均衡的一种方法 55 完全信息静态博弈 纳什均衡 占优策略均衡是一种纳什均衡 但纳什均衡不一定是占优均衡 占优策略均衡是比纳什均衡更强的均衡 它要求任何一个博弈方对于其他博弈方的任何策略选择来说 其最优策略选择都是唯一的 而纳什均衡只要求任何一个博弈方在其他博弈方的策略选择给定的情况下 其选择的策略是最优的 判断某一结果是不是纳什均衡的通常做法是看博弈者是否可以通过单方面的背离而受益 56 完全信息静态博弈 纳什均衡 几种均衡的关系 Nash均衡 57 完全信息静态博弈 纳什均衡 纳什均衡的一致性预测性质博弈分析最基本的目的之一是预测 博弈论中行动者是理性的 理性的人不可能作出非理性的事情 许多结果就可预测出来 一致性预测指如果博弈方都预测一个特定的结果会出现 那么所有的博弈方都不会不顾这种预测或者这种预测能力 去选择与预测结果不一致的策略 纳什均衡具有一致性预测的性质 这是纳什均衡的本质属性 58 完全信息静态博弈 纳什均衡 智猪博弈每次按出10个萝卜 按者支付2个单位成本 小猪按 大猪先到 支付 9 1 大猪按 小猪先到 支付 6 4 同时按 支付 7 3 按等待 按等待 小猪 大猪 小猪的占优战略 等待 大猪无占优战略 但应该预见到小猪会选择 等待 59 完全信息静态博弈 纳什均衡 实际生活中的智猪博弈 天塌下来有高个子顶着 搭便车 现象 公共物品 穷人和富人修路博弈 中产阶级对社会的稳定作用 大股东对管理者的监督 60 完全信息静态博弈 Cournotduopoly寡头竞争模型 模型假设两家企业生产同类产品 企业1产量q1 企业2产量q2 则总产量Q q1 q2 设市场出清价格P是关于市场总产量的函数P P Q a Q 设两企业生产都无固定成本 单位产量的边际成本相同 均为c 则两个企业分别生产q1和q2单位产量的总成本为cq1和cq2 两企业同时决定自己的产量 即它们在决策之前不知道另一方的产量 两博弈方的得益是各自的利润 即各自的销售收益减去成本 得益分别为u1 q1P Q cq1 q1 a q1 q2 cq1 q1 a q1 q2 c 和u2 q2P Q cq2 q2 a q1 q2 cq2 q2 a q1 q2 c 可见 得益均取决于双方的策略 即产量 61 完全信息静态博弈 Cournotduopoly寡头竞争模型 最优反应函数 BestReactionFunction 对于企业2的任意产量q2 企业1的最佳对策产量q1 就是使自己在企业2生产q2的情况下利润最大化的产量 即q1是最大化问题的解 令u1对q1的导数等于0 不难求出q1 R1 q2 1 2 a c q2 这就是对于企业2的每一个可能产量 企业1的最佳对策产量的计算公式 它是企业2产量的一个连续函数 我们称它为企业1对企业2产量的 最优反应函数 62 完全信息静态博弈 Cournotduopoly寡头竞争模型 同样 我们可再求出企业2对企业1产量q1的最优反应函数 q2 R2 q1 1 2 a c q1 由于这两个函数都是连续的线性函数 所以可用坐标平面上的两条直线表达 如下图所示 63 完全信息静态博弈 Cournotduopoly寡头竞争模型 64 完全信息静态博弈 Cournotduopoly寡头竞争模型 我们通过求解如上两个方程来获得均衡数量和价格 对于q1 我们可得q1 1 2 a c q2 1 2 a c 1 2 a c q1 q1 1 3 a c 同样可得q2 1 3 a c 而P a 2 3 a c 1 3a 2 3cu1 u2 q1 p c 1 9 a c 2 65 完全信息静态博弈 Cournotduopoly寡头竞争模型 66 完全信息静态博弈 Cournotduopoly寡头竞争模型 PerfectCompetitionUnderperfectcompetitionfirmssetpricesequaltoMC So p 12andduetodemandfunction equilibriumquantity Q a p 30 12 18Assumingbothsupplyequalamounts Firm1supplies9andsodoesFirm2 67 完全信息静态博弈 Cournotduopoly寡头竞争模型 68 完全信息静态博弈 Cournotduopoly寡头竞争模型 最大化利益的策略组合总得益为U P Q c Q Q a Q cQ a c Q Q2对于上式很容易求得最大总产量Q 1 2 a c 最大总得益u 1 4 a c 2可见1 2 a c 2 9 a c 2与纳什均衡解相比而言 虽然总产量较小 但总利润却较高 在缺乏有效保障机制的情况下 它们均有突破1 4 a c 最佳产量的意愿 69 完全信息静态博弈 Cournotduopoly寡头竞争模型 70 完全信息静态博弈 Cournotduopoly寡头竞争模型 71 完全信息静态博弈 公共地的悲剧 该例表明 如果一种资源如果没有排他性 就会被过度使用 基本假设假设有n个农民共同拥有一片土地 每个农民都有放牧的自由 令i 1 2 n gi是第农民的放羊数量 G是总的放牧数量 v代表每只羊的平均价值 是G的递减函数 c是每只羊的饲养成本 ui g1 g2 gn gi v G gi c 72 完全信息静态博弈 公共地的悲剧 为了简化结论 假设n 3 v 104 G 而c 4得出三个牧民的反应函数 g1 R1 g2 g3 50 1 2q2 1 2q3g2 R2 g1 g3 50 1 2q1 1 2q3g3 R3 g1 g1 50 1 2q1 1 2q2求得g1 g2 g3 25 u1 u2 u3 625 以总得益u G 104 G 4G 100G G2为目标函数使总得益最大得养羊数为G 50 u 2500 625 3 因此本纳什均衡将导致过渡放牧 73 完全信息静态博弈 混合策略纳什均衡 在某些情况下不存在纳什均衡 74 完全信息静态博弈 混合策略纳什均衡 社会福利问题政府与流浪汉之间的博弈 政府的战略选择 救济 不救济 流浪汉的战略选择 找工作 游荡 找工作游荡 救济不救济 流浪汉 政府 非零和博弈 75 完全信息静态博弈 混合策略纳什均衡 分析类似的问题还有许多 如门卫与小偷 偷税与查税等 以上例子都有一个共同的特征 每个参与人都想猜透对方的战略 同时又不想让对方猜透自己的战略 这类问题都不存在原来意义上的Nash均衡 因此有必要拓展Nash均衡的定义 76 完全信息静态博弈 混合策略纳什均衡 案例分析以猜硬币为例盖币者 盖币者要使猜币者不能准确猜中自己的战略 只有以随机的方式出招 设盖币者出正面的概率为p 则出反面的概率为1 p 必须选择出正面和反面的概率 使猜者不论猜正面或反面 其期望收益是相同的 猜币者 猜正面的期望收益 p 1 p 1 猜反面的期望收益 1 p 1 p p 1 p 1 1 p 1 p p 1 2 正面反面 正面反面 猜方 盖方 77 完全信息静态博弈 混合策略纳什均衡 案例分析同理 若设猜币者猜正面的概率为q 则在均衡时 其概率为 q 1 2在该例中 假设了每个参与人在其策略空间上 有一概率分布 如盖币者 p 1 p 猜币者 q 1 q 其均衡为 1 2 1 2 1 2 1 2 78 完全信息静态博弈 混合策略纳什均衡 混合策略Mixedstrategy纯策略 purestrategy 如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动 称为纯策略 混合战略 如果一个战略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动 称为混合战略 79 完全信息静态博弈 混合策略纳什均衡 定义 在博弈G S1 S2 Sn u1 u2 un 中 参与人i的战略空间为Si si1 si2 sik 若 ij是参与人i选择战略sij的概率 且有 则称 i i1 i2 ij ik 是参与人i的一个混合战略 80 可用表示参与人的混合战略空间 称为一个混合战略组合 期望效用函数 完全信息静态博弈 混合策略纳什均衡 混合战略组合MixedStrategyProfile 81 完全信息静态博弈 混合策略纳什均衡 混合策略纳什均衡定义 是一个混合策略纳什均衡 若对所有参与人i 有 82 完全信息静态博弈 混合策略纳什均衡 逃税不逃税 检查不检查 纳税人 税收机关 监督博弈的纳税检查A为应纳税款 C为检查成本 F是偷税罚款 假定C A F 不存在纯战略纳什均衡 83 完全信息静态博弈 混合策略纳什均衡 税务机关检查边际p为税务机关检查的概率 q为纳税人逃税概率 给定q 税收机关选择检查与否的期望收益 u 1 q A C F q A C 1 q qF A Cu 0 q 0q A 1 q A 1 q 解u 1 q u 0 q 得 q C A F 结论 纳税人逃税概率小于q 税收机关的最优决策是不检查 否则则反 84 完全信息静态博弈 混合策略纳什均衡 纳税人逃税边际给定p 纳税人选择逃税与否的期望收益是 u p 1 A F p 0 1 p A F pu p 0 Ap A 1 p A解u p 1 u p 0 得p A A F 即 结论 如果税收机关检查的概率小于p 纳税人的最优选择是逃税 否则交税 混合纳什均衡是p q 即税收机关以p 的概率查税 而纳税人以q 的概率逃税 85 完全信息静态博弈 Nash均衡的存在性 存在性定理 1950 Nash 每一个有限博弈至少存在一个纯战略的或混合战略的Nash均衡 证明方法是运用角谷静夫 Kakutani 的不动点定理 86 完全信息静态博弈 Nash均衡的多重性 Nash均衡的多重性 歌剧足球赛 歌剧足球赛 妻子 丈夫 性别之争 事实上 这一博弈还存在一个混合战略Nash均衡 1 3 2 3 1 3 2 3 87 完全信息静态博弈 Nash均衡的多重性 奇数定理 如果一个博弈存在两个纯战略Nash均衡 则一定存在另一个混合战略Nash均衡 88 完全信息静态博弈 Nash均衡的多重性 Nash均衡的选择Pareto占优均衡风险规避均衡聚点均衡相关均衡 89 DynamicGameofCompleteInformation 完全信息动态博弈 90 完全信息动态博弈 例 房产开发商之间的博弈设有两个开发商A和B 其静态博弈的战略式表示为一个矩阵形式 开发不开发 开发不开发 B A 有两个Nash均衡 开发 不开发 不开发 开发 91 完全信息动态博弈 92 完全信息动态博弈 动态博弈的扩展式表述Extensiveformrepresentation动态博弈扩展式的要素 参与人 1 2 n N虚拟参与人 自然 行动的顺序 theorderofmoves 谁在什么时候行动 行动空间 actionset 每次行动时 参与人有何选择 信息集 informationset 每次行动时 参与人知道什么 支付函数 payoffs 在行动结束后 每个参与人得到什么 环境的选择 外在事件的概率分布 由虚拟参与人选择 如市场需求等不确定因素 这里主要是参与人战略空间的扩展 要给出每个战略的动态描述 行动的顺序 行动空间 信息集 93 完全信息动态博弈 博弈树的基本要素 结 nodes 决策结 decisionnodes 参与人采取行动的时点 终点结 terminalnodes 是博弈行动路径的终点 枝 branches 每一枝代表决策人的行动选择 路径 paths 从初始决策结到终点结的一条通路 表示一个可能的决策序列或博弈结果 信息集 informationsets 由决策结组成 博弈树上所有决策结可分割成不同的信息集 战略 strategies 94 完全信息动态博弈 信息集 informationsets 每一个信息集是决策结集合的子集 由满足以下条件的决策结组成 一定是同一个参与人的决策结 该参与人知道博弈进入该集合中的某个决策结 但不知道自己处于哪一个决策结 一个参与人在属于同一个信息集的每一个决策结上的行动空间是相同的 一般用h x 表示包含决策结x的信息集 95 完全信息动态博弈 96 完全信息动态博弈 97 完全信息动态博弈 98 完全信息动态博弈 完美信息 perfectinformation 是指一个参与人对其他参与人 包括虚拟参与人 自然 的行动选择有了准确的了解 即每个信息集只含有一个元素 完全信息 completeinformation 指每个参与人没有私人信息 即他的行动空间 支付函数为所有其他参与人所知 例如 如果两个参与人都知道对方的支付函数 行动空间 以及市场需求是大 还是小 则信息是完全的 但如果A不知B的行动选择 则A的信息是不完美的 99 完全信息动态博弈 战略是参与人在给定的信息集的情况下的行动规则 因为参与人的每个信息集实质上代表了参与人可能会遇到的几种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论