博弈论知识点总结

上传人：m*** IP属地：贵州上传时间：2020-04-02 格式：DOCX 页数：12 大小：62.17KB 积分：20 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论知识总结博弈论知识总结博弈论概述博弈论概述 1 博弈论概念博弈论概念博弈论就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题博弈论研究的假设 1 决策主体是理性的最大化自己的收益 2 完全理性是共同知识 3 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2 2 和博弈有关的变量和博弈有关的变量博弈参与人博弈中选择行动以最大化自己受益的决策主体行动参与人的决策选择战略参与人的行动规则即事件与决策主体行动之间的映射也是参与人行动的规则信息参与人在博弈中的知识尤其是其他决策主体的战略收益类型不完全信息等的信息完全信息每个参与人对其他参与人的支付函数有准确的了解完美信息在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动否则为不完美信息不完全信息参与人没有完全掌握其他参与人的特征战略空间及支付函数等信息即存在着有关其他参与人的不确定性因素支付决策主体在博弈中的收益在博弈中支付是所有决策主题所选择的行动的函数从经济学的角度讲博弈是决策主体之间的相互作用因此和传统个人决策存在着区别 3 博弈论与传统决策的区别博弈论与传统决策的区别 1 传统微观经济学的个人决策就是在给定市场价格消费者收入条件下最大化自己效用研究工具是无差异曲线可表示为 maxU P I 其中 P 为市场价格 I 为消费者可支配收入 2 其他消费者对个人的综合影响表示为一个参数市场价格所以在市场价格既定下消费者效用只依赖于自己的收入和偏好不用考虑其他消费者的影响但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数 4 博弈的表示形式博弈的表示形式战略式博弈和扩展式博弈战略式博弈战略式博弈是博弈问题的一种规范性描述有时亦称标准式博弈战略式博弈是一种假设每个参与人仅选择一次行动或战略并且参与人同时进行选择的决策模型因此从本质上来讲战略式博弈是一种静态模型一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题 1 参与人集合 2 每位参与人非空的战略集 Si 3 每位参与人定义在战略组合上的效用函数 Ui s1 s2 sn 1 2 n 1 1 n iin i ssss 扩展式博弈扩展式博弈是博弈问题的一种规范性描述与战略式博弈侧重博弈结果的描述相比扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析包含要素 1 参与人集合 2 参与人的行动顺序即每个参与人在何时行动 3 序列结构每个参与人行动时面临的决策问题包括参与人行动时可供选择的行动方案所了解的信息 4 参与人的支付函数比较比较 1 战略式博弈从本质上来讲是一种静态模型 2 扩展式博弈从本质上来讲是一种动态模型 5 博弈论分类博弈论分类按决策主体的行为相互作用时当事人能否达成一个具有约束力的协议可分为 1 合作博弈强调团体理性团体最优决策效率 2 非合作博弈强调个人理性个人最优决策按参与人行动先后顺序可分为 1 静态博弈博弈中参与人同时行动或者虽然不是同时行动但是在行动前不知道其他参与人所选择的行动 2 动态博弈参与人的行动有先后顺序后行动者获得先行动者的行动信息按参与人对信息的掌握程度可分为 1 完全信息每个参与人对其他所有参与人的特征战略空间及支付函数有精确的了解博弈开始时不存在不确定性因素 2 不完全信息参与人没有完全掌握其他参与人的特征战略空间及支付函数等信息即存在着有关其他参与人的不确定性因素按决策主体对信息的掌握程度和行动的先后顺序博弈可以分为完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈静态动态完全信息完全信息静态博弈均衡纳什均衡完全信息动态博弈均衡子博弈精炼纳什均衡不完全信息不完全信息静态博弈均衡贝叶斯纳什均衡不完全信息动态博弈均衡精炼贝叶斯纳什均衡 6 根据所学这四种博弈的特点对这四种博弈做一个对比分析根据所学这四种博弈的特点对这四种博弈做一个对比分析类型信息和行动特点均衡均衡类型特别均衡求解方法学过的例子性质完全信息静态博弈每个参与人对其他所有参与人的特征战略空间及支付函数有精确的了解博弈纳什均衡纯战略纳什均衡 PNE 占优战略纳什均衡 DSE 箭头法划线法 Hotelling 价格竞争库诺特价格竞争多重性和存在性 1 2 n 重复剔除的占有均衡 IFDE 不断剔除劣战略弱劣战略的剔除顺序会影响均衡结果一般一个博弈中存在参与者有多个行动时可以先考虑能否剔除弱战略简化博弈开始时不存在不确定性因素参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息战略和行动相同混合战略纳什均衡 MNE 聚点均衡支付最大化法支付等值法社会福利博弈小偷守卫博弈有限次重复博弈均衡与纳什均衡的唯一性有关连锁店悖论无限次重复博弈均衡无名氏定理与贴现因子有关囚徒困境冷酷战略无限期轮流讨价还价模型完全信息动态博弈在博弈开始之前参与人之间的信息不存在不确定性但是参与人行动存在先后顺序在完全信息动态博弈中为了表示参与人之间的信息掌握关系引入了信息及的概念子博弈精炼纳什均衡子博弈精炼纳什均衡一般博弈逆向归纳法求解斯坦科尔伯格寡头竞争雇主与公会之间的竞争 1 均衡结果是原博弈的 Nash 均衡 2 同时在每一个子博弈上构成 Nash 均衡混合战略不完全信息情况下纯战略均衡的极限对原混合战略加入少许不确定性因素求极限性别战不完全信息静态博弈在博弈开始之前参与人之间的信息存在不确定性但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息不确定是参与人的了性的不确定性贝叶斯纳什均衡贝叶斯纳什均衡一般贝叶斯均衡 Harsanyi 转换机制设计 1 均衡存在性 2 不确定性体现为类型的不确定性分离均衡混同均衡不完全信息动态博弈在博弈开始前参与人之间的信息存在不确定性同时参与人行动存在先后顺序不完全信息动态博弈过程不仅是参与人选择行动的过程而且是参与人不断修正信念的过程精炼贝叶斯纳什均衡信号传递博弈准分离均衡根据所得信息修正判断概率根据收益最大化决策信号传递博弈不完全信息重复博弈与声誉 Milgrom Roberts 垄断限价模型不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合二四种博弈类型具体分述二四种博弈类型具体分述 1 完全信息静态博弈完全信息静态博弈 1 1 完全信息静态博弈特点完全信息静态博弈特点每个参与人对其他所有参与人的特征战略空间及支付函数有精确的了解博弈开始时不存在不确定性因素参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息战略和行动相同 1 21 2 完全信静态博弈相关概念完全信静态博弈相关概念以新产品开发博弈举例说明参与人参与人参与人 1 和 2 参与人的集合卡表示为 1 2 n 表示所有参与人的集合在新产品开发博弈中为 1 2 行动行动开发不开发 Ai 表示参与人行动的集合新产品开发博弈中参与人的行动集合为 A1 A2 a b 其中 a 为开发 b 为不开发 a a1 a2 an 表示参与人的行动组合新产品开发博弈中为 A a a a b b a b b 战略战略参与人的行动规则在博弈中的战略可以定义为从观测集到行动集的映射关系即 Si Xi Ai 用 Si si 表示参与人所有战略的集合在 n 人博弈中用 S s1 s2 s3 sn 表示 n 个参与人的战略组合它表示博弈中每个参与人采取战略 si 的一种博弈情形在完全信息静态博弈中由于不存在决策时序上的差异所有参与人在同一决策时点即博弈开始的那一时刻决策因此所有参与人面临的决策情形都只有一种所以参与人的战略集与行动集相同支付支付是指参与人在博弈中的所得一般情况下也是用效用函数来表示参与人在博弈中的所得因此参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或期望效用水平支付一般用 ui 1 2 n 表示参与人 i 的支付效用水平支付组合 u u1 u2 un 表示参与人在特定博弈情形下所得到的支付其中为参与人 i 的支付因此参与人 i i 1 2 n 的支付就可表示为 ui ui si s i 信息信息是参与人所具有的有关博弈的所有知识如有关其它参与人行动或战略的知识有关参与人支付的知识等等在新产品开发博弈中如果两个企业都知道市场需求那么这样的博弈情形就是我们前面所提到的完全信息假设如果两个企业中至少有一个不知道市场需求那么这样的博弈情形就是我们前面所提到的不完全信息假设 1 3 纯战略纳什均衡纯战略纳什均衡纯战略纯战略参与人在给定信息下只选择一种特定或确定性的战略混合战略混合战略解释了一个参与人对其他参与人所采取的行动的不确定性它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略纯战略纳什均衡中包括占有均衡重复剔除劣战略均衡一般纯战略纳什均衡等 1 占优均衡占优均衡占优战略参与人的最优战略 si 与其他参与人的选择 s i无关无论其他参与人选择什么战略参与人的最优战略总是唯一的这样的最优战略称之为占优战略在 n 人博弈中如果对于所有的其他参与人的选择 s i si 都是参与人 i 的最优选择则称 si 为参与人的占优战略在 n 人博弈中如果对所有参与人都存在占优战略 si 则占优战略组合 si s1 si2 sn 称为占优战略均衡如果所有参与人都有占优战略存在那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果 2 重复剔除劣战略重复剔除劣战略如果在一个博弈中参与人不存在占优战略但是参与人 i 存在两个战略其中一个战略叫另一个战略的所得效用要大则理性的参与人绝对不会选择战略严格劣战略严格劣战略弱劣战略弱劣战略若重复剔除过程一直可持续到只剩下唯一的战略组合则该战略组合即为重复剔除的占优均衡此时该博弈是重复剔除战略可解要点再重复剔除过程中如果每次剔除的是严格劣战略均衡结果与剔除顺序无关如果剔除的是弱劣战略均衡结果可能与剔除顺序有关 3 一般一般 Nash 均衡均衡 Nash 均衡是完全信息静态博弈的解的概念在完全信息静态博弈中构成 Nash 均衡的战略是不可剔除的即不存在任何一个战略严格优于 Nash 均衡战略求解纳什均衡的方法求解纳什均衡的方法划线法箭头法划线法划线法 1 考察参与人 1 的最优战略 2 用上述方法找出参与人 2 的最优战略 3 找出最优战略组合箭头法箭头法 1 对于每个战略组合检查是否有参与人会偏离这个战略组合 2 直至找出没有参与人会偏离的战略组合纯战略均衡反映函数纯战略均衡反映函数各博弈方选择的纯策略对其他博弈方纯策略的反应 1 4 混合战略纳什均衡混合战略纳什均衡混合战略混合战略在博弈中对任一参与人i 设 Si Si1 Sik 则参与人i的一个混合战略为定义在战略集 Si 上的一个概率分布 i i1 ik 其中 ij j 1 k 表示参与人i选择战略表示参与人i选择战略 Sij 的概率的概率即 ij 满足 0 ij 1 其中概率之和为 1 支付混合战略的支付为各种概率下收益的加权平均混合战略纳什均衡在博弈中混合战略组合 i 1 n 为一个 Nash 均衡当且仅当混合战略 Nash 均衡的求解 1 支付最大化法 2 支付等值法混合战略均衡反映函数在混合策略的范畴内博弈方的决策是选择概率分布因此反 iiiiii u s su s s iiiiii u ssu ss iiiiii u ssu ss iiiii u ssu ss 11 nn GSS uu 11 nn GSS uu iiiiiiii ivv 有应函数就是一方对另一方选择的概率分布的反应聚点均衡在现实生活中参与人可能使用某些被博弈模型抽象掉的信息来达到一个聚点均衡这些信息可能与社会文化习惯参与人过去博弈的历史有关不同均衡概念之间的关系占优均衡重复剔除劣战略均衡纯战略纳什均衡混合战略纳什均衡 1 51 5 纳什均衡的多重性与存在性纳什均衡的多重性与存在性存在性每个有限战略式博弈参与人与相应的战略集均为有限必存在纳什均衡这个均衡可能是纯战略纳什均衡也可能是混合战略纳什均衡多重性一个博弈可能有多个均衡博弈论并没有一个一般的理论证明哪一个纳什均衡结果一定能出现 2 2 完全信息动态博弈完全信息动态博弈 2 12 1 完全信息动态博弈特点完全信息动态博弈特点在博弈开始之前参与人之间的信息不存在不确定性但是参与人行动存在先后顺序在完全信息动态博弈中为了表示参与人之间的信息掌握关系引入了信息及的概念 2 22 2 完全信息动态博弈有关概念完全信息动态博弈有关概念信息集信息集信息集Ii是参与人i决策结的一个集合它满足以下两个条件 1 Ii中的每个决策结都是参与人 i 的决策结 2 当博弈到达Ii时参与人 i 知道自己处在该信息集中的某个决策结但不知道是哪一个在博弈树中属于同一信息集的决策结一般用虚线连接起来结结包括决策结和终点结两类决策结是参与人采取行动的点时点终点结是博弈行动路径的终点一个信息集可能只包含一个决策结也可能包含多个决策结如果只包含一个决策结的信息集就是但单结信息集如果博弈中所有信息集都是单结的则成为完美信息博弈子博弈子博弈是原博弈的一部分它始于原博弈中一个单结信息集中的决策结x 并由决策结x及其后续结共同组成 1 子博弈可以作为一个独立的博弈进行分析并且与原博弈具有相同的信息结构 2 原博弈可以作为自身的一个子博弈 2 32 3 不完全信息静态博弈均衡不完全信息静态博弈均衡子博弈精炼子博弈精炼 NashNash 均衡均衡解决 Nash 均衡多重性问题的一种主要方法就是精炼的方法即在 Nash 均衡的基础上通过定义更加合理的博弈解并剔除不合理的均衡子博弈精炼纳什均衡的引入就是将那些包含不可置信威胁战略的纳什均衡从均衡中剔除从而给出动态博弈结果的一个合理预测即子博弈精炼纳什均衡要求均衡战略的行为规则在每个信息集上都是最优的扩展式博弈的战略组合是一个子博弈精炼 Nash 均衡当且仅当满足以下条件 1 是原博弈的 Nash 均衡 2 在每一个子博弈上构成 Nash 均衡一个战略组合是子博弈精炼 Nash 均衡当且仅当它对所有的子博弈包括原博弈构成 Nash 均衡同时也意味着原博弈的 Nash 均衡并不一定是子博弈精炼 Nash 均衡除非它还 1 n sss 对所有子博弈构成 Nash 均衡 2 42 4 不完全信息静态博弈均衡求解不完全信息静态博弈均衡求解逆推归纳法逆推归纳法逆推归纳法是最常用的求解子博弈精炼 Nash 均衡的方法其步骤为其中 xi 代表博弈中由最底层到博弈起点的顺序以 x3 为最底层则有 1 找出博弈的所有子博弈 2 按照博弈进程的反方向逐一求解各个子博弈即最先求解最底层的子博弈再求解上一层的子博弈直至原博弈由于逆推归纳法对各个子博弈逐一进行求解因此逆推归纳法所得到的解在各子博弈上构成 Nash 均衡即意味着逆推归纳法所得的解为子博弈精炼纳什均衡 2 52 5 完全信息动态博弈中承诺行动的均衡结果分析完全信息动态博弈中承诺行动的均衡结果分析承诺行动就是在博弈开始之前参与人采取某种改变自己支付或战略空间的行动该行动使原本不可信的威胁变得可信但是参与人的承诺行动是有成本的否则这种承诺就不可信例子例子要挟诉讼要挟诉讼就是指那种原告几乎不可能胜诉而其惟一的目的是希望通过私了而得到一笔赔偿的诉讼该博弈的结果为原告选择不指控博弈结束博弈的结果似乎与人们观测到的现实并不相符因为现实中人们常常看到各种要挟发生在上述模型中要挟之所以没有成功关键在于原告将会起诉的威胁并不可信要是威胁变得可信就必须采取承诺行动沉没成本这样参与人的威胁就会变得可信从而使其他博弈参与人改变策略 2 62 6 重复博弈议题重复博弈议题 1 将来可信的威胁或承诺如何影响到当前的行动 2 在一次博弈中无法实现的均衡在重复博弈中能否实现有限次重复博弈有限次重复博弈对于给定的阶段博弈G 令G T 表示G重复进行 T 次的有限重复博弈并且在下一次博弈开始前所有以前博弈的进程都可被观测到有限次重复博弈均衡结论有限次重复博弈均衡结论如果阶段博弈G有唯一的 Nash 均衡则对任意有限的T 重复博弈G T 有唯一的子博弈精炼解即G的 Nash 均衡结果在每一个阶段重复进行而且在有限次重复博弈中如果在单阶段博弈中均衡解不只有一个则对将来行动所作的可信威胁或承诺可以影响到当前的行动无限次重复博弈无限次重复博弈给定一阶段博弈G 令 G 表示相应的无限重复博弈其中 G 将无限次的重复进行且参与人的贴现率为对每个t 之前t 1 次阶段博弈的结果在t阶段开始进行前都可以被观测到每个参与人在 G 中的收益都是该参与人在无限次的阶段博弈中所得收益的现值无限次重复博弈的解无限次重复博弈的解无名氏定理无名氏定理令G为一个 n 人阶段博弈令 e1 e2 en 为G的一个 Nash 均衡下的收益且用 x1 x2 xn 表示G的其它任何可行收益表示可行收益的集合若存在则存在贴现率使无限重复博弈 G 存在一个子博弈精炼 Nash 均衡其平均收益可达到 x1 x2 xn 无名氏定理的解释无名氏定理的解释在无限次重复博弈中如果参与人具有足够的耐心只要满足一定的条件那么任何满足个人理性的可行收益向量都可以通过一个特定的子博弈精炼 Nash 均衡得到 iii xei xX 对影响重复博弈结果的因素影响重复博弈结果的因素影响重复博弈结果的是重复的次数和信息的完备性 2 72 7 子博弈精炼子博弈精炼 NashNash 均衡与均衡与 NashNash 均衡的区别均衡的区别由于子博弈精炼 Nash 均衡在任一决策结上都能给出最优决策这也使得子博弈精炼纳什均衡不仅在均衡路径即均衡战略组合所对应的路径上给出参与人的最优选择而且在非均衡路径即除均衡路径以外的其它路径上也能给出参与人的最优选择即子博弈精炼 Nash 均衡不会含有参与人在博弈进程中不合理的不可置信的行动 3 3 不完全信息静态博弈不完全信息静态博弈 3 3 1 1 不完全信息静态博弈特点不完全信息静态博弈特点在博弈开始之前参与人之间的信息存在不确定性但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息在不完全信息静态博弈中在博弈开始前存在关于博弈人信息的不确定性这个不确定像通常是博弈参与人的类型在市场进入博弈中不完全信息表现为在位者的成本类型高成本低成本在斗鸡博弈中不完全信息表现为参与人的性格类型强硬软弱 3 23 2 海萨尼转换海萨尼转换由于在不完全信息静态博弈中参与人的类型存在不确定性所以当一个参与人并不知道在与谁博弈时博弈的规则是无法定义的海萨尼提出了海萨尼转换解决这种不确定的问题解决方法解决方法海萨尼指出引入虚拟参与人自然由自然先决定参与人的不同类型将不完全信息博弈转换为不完美信息博弈海萨尼通过引入虚拟参与人将博弈的起始点提前从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性这种通过引入虚拟参与人来处理不完全信息博弈问题的方法称为 Harsanyi 转换海萨尼转换注意要点 1 海萨尼转换规定参与人关于自然选择的推断为共同知识 2 自然的选择在一般的不完全信息博弈问题中 Harsanyi 转换规定自然选择的是参与人的类型 type 除了根据参与人的支付来划分参与人的类型以外还可以根据参与人的行动空间甚至根据参与人掌握信息的多少或程度来划分参与人的类型 3 参与人关于自然选择的推断是基于自己类型判断的条件概率 3 33 3 不完全信息静态博弈均衡不完全信息静态博弈均衡贝叶斯纳什均衡贝叶斯纳什均衡贝叶斯博弈的定义贝叶斯博弈的定义贝叶斯博弈包含以下五个要素 1 参与人集合 B 1 2 n 2 参与人的类型集合 T1 T2 3 参与人关于其他参与人类型的推断 P1 t 1 t1 Pn t 1n tn 4 参与人类型相依的行动集 A t1 A tn 5 参与人类型相依的支付函数贝叶斯博弈的战略贝叶斯博弈的战略在贝叶斯博弈 G Ti Pi A ti ui a t ti 中参与人 i 的一个战略是从参与人的类型集 Ti到其行动集的一个函数 si ti 它包含了当自然赋予 i 的类型为 ti时 i 将从可行的行动集 Ai ti 中选择的行动贝叶斯博弈的时间顺序贝叶斯博弈的时间顺序 1 自然选择参与人的类型组合 t t1 tn 2 参与人同时选择行动每个参与人 i 从行动集 Ai ti 中选择行动 ai ti 3 参与人 i 得到支付贝叶斯纳什均衡贝叶斯纳什均衡在贝叶斯博弈中对于一个理性的参与人 i 当他只知道自己的类型 ti而不知道其他参与人的类型时给定其他参与人的战略 s i 他将选择使自己期望效用支付最大化的行动 ai ti 其中贝叶斯博弈纳什均衡的存在性贝叶斯博弈纳什均衡的存在性一个有限的贝叶斯博弈一定存在贝叶斯 Nash 均衡 3 43 4 贝叶斯博弈与混合战略均衡关于混合战略纳什均衡的一个解释贝叶斯博弈与混合战略均衡关于混合战略纳什均衡的一个解释首先混合策略均衡不是现实生活的一个合理描述人们并不是根据概率分布来选择自己行动海萨尼证明在完全信息情况下的混合策略均衡可以解释为不完全信息情况下纯策略均衡的极限混合策略的本质混合策略的本质混合策略的本质不在于参与人随机的选择行动而在于他不能确定其他参与人将选择什么纯策略这种不确定性可能来自于参与人不知道其他参与人的类型海萨尼的基本思想海萨尼的基本思想只要在原来的博弈中加入少许不完全信息因素使得参与人的支付函数中的收益不再是确定的而是和一个有范围的不确定参数有关从而通过将混合战略均衡求解转换为贝叶斯均衡的极限解但是得到的纯战略贝叶斯均衡就与完全信息下的混合战略均衡相似结论结论完全信息博弈的混合战略 Nash 均衡可以解释为与之密切相关存在一点点非完全信息的纯战略贝叶斯 Nash 均衡同时海萨尼给出了描述混合策略和纯策略之间关系的一个正式的定理混合策略均衡的纯化定理 3 53 5 贝叶斯均衡贝叶斯均衡 EgEg 机制设计问题机制设计问题机制设计问题实际上就是探讨设计者如何向参与人提供激励以促使参与人向设计者透露其掌握的信息说真话从而确定对设计者有利的结果的问题这一机制对应于一个博弈形式设计者需要设计出一个博弈形式让参与人在这个博弈形式下进行博弈从而实现他的目标博弈形式不同实现目标的程度也不一样设计者必须选择对他来说是最有利的博弈形式即最有利的机制机制设计的基本模型机制设计的基本模型机制设计是典型的 3 阶段不完全信息博弈期阶段如下阶段 1 机制设计者委托人设计一种机制或者契约或者激励方案阶段 2 代理人选择接受或拒绝该机制拒绝的代理人得到某个外生的保留效用阶段 3 接受机制的代理人选择自己的行动或者战略实现一个博弈结果机制设计模型中的有关概念机制设计模型中的有关概念参与约束由于代理人在第二阶段总可以选择不接受该机制从而获得一个保留效用因此代理人接受这个机制获得的效用必须不小于拒绝这个机制时获得的效用激励相容约束这意味着对于代理人而言代理人真实报告自己的类型时获得的效用必须不小于谎报自己类型时获得的效用可行机制满足参与约束的机制被称为可行机制可实施机制满足激励相容约束的机制称为可实施机制 arg max iii iiiiii aA t a tv a st 可行的可实施机制如果一个机制既满足参与约束又满足激励相容约束机制设计的目的机制设计的目的机制设计的目的就是要设计出可行的可实施机制从而在该机制中找出最优规则以追求最大化收益 4 4 不完全信息动态博弈不完全信息动态博弈 4 14 1 不完全信息动态博弈特点不完全信息动态博弈特点在博弈开始之前参与人之间的信息存在不确定性同时参与人行动存在先后顺序不完全信息动态博弈过程不仅是参与人选择行动的过程而且是参与人不断修正信念的过程 4 24 2 不完全信息动态博弈的有关概念不完全信息动态博弈的有关概念类型是指参与者的类型在不完全信息动态博弈中自然首先选择参与人的类型动态博弈行动有先有后所以后行动者可以观察到先行动者的行动信息从而可以修正自己对于参与人的类型的信息的判断类型相依参与者的行动传递着有关自己的类型的信息对方可通过参与人的行动来推断自己的最优行动先行动者预测到自己的行动被后行动者利用就会设法传递对自己最有利的信息 4 34 3 不完全信息动态博弈的纳什均衡不完全信息动态博弈的纳什均衡精炼贝叶斯均衡精炼贝叶斯均衡对应于不完全信息动态博弈的纳什均衡称为精炼贝叶斯均衡精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合 1 1 不完全信息动态博弈均衡求解的基本思路不完全信息动态博弈均衡求解的基本思路不完全信息动态博弈将子博弈精炼 Nash 均衡中均衡精炼的思想应用到不完全信息扩展式博弈中但是有提前条件 1 对每个参与人 i 在其信息集上给出关于自己位于该信息集中哪一个决策结的信念或推断 2 对参与人 i 的每个信息集在给定参与人i在该信息集上的信念或推断情况下参与人的战略是对其他参与人战略的一个最优反应与静态博弈不同的是在观测到先行动者第一阶段选择后后行动者可以修正对先行动者类型的先验概率因为先行动者的行动可能包含其类型的信息即行动就是类型的反映不同的行动反映不同的类型信息参与人最初对于对手类型信息概率的判断成为先验概率对于根据行动反映出得信息修正后的概率成为后验概率先验概率 prior probability 修正之前的判断后验概率 posterior probability 修正之后的判断先验概率和后验概率的转化是根据贝叶斯法则计算在不完全信息动态博弈博弈均衡解的求解过程中如果不可置信的威胁均衡就是不合理的所以要对均衡结果精炼剔除那些不可置信的威胁从而引入子博弈精练纳什均衡的概念但是在不完全信息动态博弈中只有一个子博弈不能将上述方法直接用于求不完全信息动态博弈的均衡解合理的均衡应该是满足给定每一个参与人

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论知识点总结

文档简介

温馨提示

最新文档

评论

博弈论知识点总结

文档简介

温馨提示

最新文档

评论

相关文档