博弈论与信息经济学 第二章 完全信息动态博弈.ppt_第1页
博弈论与信息经济学 第二章 完全信息动态博弈.ppt_第2页
博弈论与信息经济学 第二章 完全信息动态博弈.ppt_第3页
博弈论与信息经济学 第二章 完全信息动态博弈.ppt_第4页
博弈论与信息经济学 第二章 完全信息动态博弈.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论与信息经济学 第二章完全信息动态博弈 博弈的扩展式表述 博弈的扩展式表述包括以下要素 1 参与人的集合 i 1 n N 虚拟参与人 自然 2 参与人的行动顺序 谁在什么时候行动 3 参与人的行动空间 在每次行动时 参与人有些什么选择 4 参与人的信息集 每次行动时 参与人知道些什么 5 参与人的支付函数 在行动结束之后 每个参与人得到些什么 支付是所有行动的函数 6 外生事件 即自然的选择 的概率分布 博弈树 博弈树的基本建筑材料包括结 枝 信息集 1 结结 决策结 参与人采取行动的时点 终点结 博弈行动路径的终点 所有结的结合 表示某个特定的结 用 表示定义在X上的顺序关系 意味着 在 之前 假定 满足传递性和反对称性 从而意味着顺序关系 是半序的 即有些结之间是不可比较的 用 博弈树 1 结定义 为在之前的所有结的集合 简称为的前列集 定义 为在之后的所有结的集合 简称为的后续集 如果 称为初始结 如果 称为终点结 除了终点结之外的所有结都是决策结 在图示中 用空心圆代表初始结 实心圆代表其他决策结 博弈树 2 枝在博弈树上 枝是从一个决策结到它的直接后续结的连线 每一个枝代表参与人的一个行动选择 博弈树的枝不仅完整地描述了每一个决策结参与人的行动空间 而且给出了从一个决策结到下一个决策结的路径 正因为如此 每一个终点结才完全决定了博弈树的路径 博弈树 3 信息集博弈树上的所有决策结分割成不同的信息集 每一个信息集是决策结集合的一个子集 该子集包括所有满足下列条件的决策结 每一个决策结都是同一参与人的决策结 该参与人知道博弈进入该集合的某个决策结 但不知道自己究竟处于哪一个决策结 一个信息集可能包含多个决策结 也可能只包含一个决策结 只包含一个决策结的信息集称为单结信息集 如果博弈树的所有信息集都是单结的 该博弈称为完美信息博弈 博弈树 注 习惯上 博弈树的终点结的支付向量的第一个数字总是 第一个 参与人的支付 第二个数字总是 第二个 参与人的支付 扩展式表达博弈的纳什均衡 为了说明如何从扩展式表达构造战略式表达 让我们考虑房地产开发博弈的例子 假设房地产开发商正考虑是否要在北极光那的某地段开发一栋新写字楼 要面临的选择是开发或者不开发 如果决定开发 要投入1亿元资金 如果决定不开发 资金投入为0 在做决定时 开发商关心的是开发是否有利可图 假定在博弈开始之前自然就选择了 低需求 并且已成为参与人的共同信息 再假定开发商A先决策 开发商B在观测到A的选择后决策 那么 博弈的扩展式表述如图所示 A B B 开发 不开发 开发 不开发 开发 不开发 3 3 1 0 0 1 0 0 扩展式表达博弈的纳什均衡 为了构造出这个博弈的战略式表述 首先注意到 A只有一个信息集 两个可选择的行动 因而A的行动空间也即战略空间 SA 开发 不开发 但B有两个信息集 每个信息集上有两个可选择的行动 因而B有四个纯战略 分别为 1 不论A开发还是不开发 我开发 威胁战略S1 开发 不开发 2 A开发我开发 A不开发我不开发 跟随战略S2 开发 不开发 3 A开发我不开发 A不开发我开发 差异化战略S3 不开发 开发 4 不论A开发还是不开发 我不开发 放弃战略S4 不开发 不开发 动态博弈的表示法和特点 阶段和表示法动态博弈的基本特点 阶段 动态博弈中一个博弈方的一次行为称为一个 阶段 由于每个博弈方在动态博弈中可能不止一次行为 因此 每个博弈方在一个动态博弈中就可能有数个甚至许多个博弈阶段 用扩展法表示 扩展形表示法 动态博弈的基本特点 动态博弈的策略动态博弈的策略取决于他们整个博弈过程中的行为 因此我们主要讨论的是各博弈方在这些动态博弈中决策的全部内容 即各博弈方在每次轮到行为时 针对每种可能的情况如何选择的完整的行动计划 我们将这种行动计划称为博弈方的 策略 动态博弈的结果双方 或多方 采用的策略组合 实现的博弈路径和各博弈方的得益 动态博弈的非对称性因为博弈方的选择行为有先后次序 后行为者可能观察到前面的选择行为 各博弈方的地位是不对称的 可信性问题 动态博弈的一个中心问题是 可信性 问题 所谓可信性是指动态博弈中先行为的博弈方是否该相信后行为的博弈方会采取对自已有利的或不利的行为 因为后行为方将来会采取对先行为方有利的行为相当于一种 许诺 而将来会采取对先行为方不利的行为相当于一种 威胁 因此我们可将可信性分为 许诺的可信性 和 威胁的可信性 开金矿博弈 乙如何决策呢 乙最需要关心的就是甲采到金子后是否会履行诺言跟自己平分 因为万一甲采到金子后不但不跟乙平分 而且还赖帐或卷款潜逃 则乙连自己的本钱都收不回来 关键的是要判断甲的许诺是否可信 以自身利益最大化原则 甲必然选择不分 乙清楚甲的行为准则 最好的选择是不借 对乙来说 甲的许诺是不可信的 增加对甲的约束 加上第三阶段 乙的利益受到法律保护 甲的许诺是可信的 法律保障不足的开金矿博弈 乙的第三阶段的打官司的威胁是不可信的 乙只有选择不借 结论 从本博弈的分析可以看出 在一个个体都有私心 都只注重自身的利益的社会里 完善公正的法律制度不淡能够保障社会的公平 还能提高社会经济活动的效率 是实现最有效率的社会分工的重要保障 可信性是动态博弈分析的一个中心问题 打击的威胁是可信的 1选择不进 打击的威胁是不可信的 1选择进 结果路径为 进 不打击 得益 5 8 子博弈完美纳什均衡 动态博弈中的子博弈逆推归纳法子博弈完美纳什均衡 动态博弈中的子博弈 虚线框出的部分正是博弈方2在博弈方1选择进时所面临的决策问题 它本身构成博弈方2的一个单人博弈 我们称它为原先来后到博弈的一个 子博弈 子博弈定义 一个扩展式表述博弈的子博弈G由一个决策结x和所有该决策结的后续结组成 它满足下列条件 x是一个单结信息集 子博弈的信息集和支付向量都直接继承自原博弈 由一个动态博弈第一阶段以外的某个阶段开始的后续博弈阶段构成 它必须有初始信息集 具备进行博弈所需要的各种信息 能够自成一个博弈的原博弈的一部分 称为原动态博弈的一个 子博弈 子博弈精炼纳什均衡 子博弈精炼纳什均衡定义 扩展式表述博弈的战略组合s s1 si sn 是一个子博弈精炼纳什均衡 如果 它是原博弈的纳什均衡 它在每一个子博弈上给出纳什均衡 子博弈精炼纳什均衡必须满足 1 既是纳什均衡 从而具有策略稳定性 2 又不能包含任何的不会信守的许诺或威胁 递推归纳法 从动态博弈的最后一个阶段博弈方的行为开始分析 逐步倒推回前一个阶段相应博弈方的行为选择 一直到第一个阶段的分析方法 博弈方2选择打击 博弈方选择不进 应用 Stackelberg博弈 假设寡头市场上有两个厂商 一方强一方比较弱 它们的产量由较强的一方现进行选择 较弱的一方则根据较强的一方的产量选择自己的产量 子博弈精炼纳什均衡应用举例 1 斯坦科尔伯格寡头竞争模型例 市场上有两家企业 企业1首先选择产量 假定函数为 两个企业有相同的单位成本 子博弈精炼纳什均衡应用举例 逆向归纳法 Step1 Step2 得 子博弈精炼纳什均衡应用举例 库诺特模型的纳什均衡是 斯坦科尔伯格均衡的总产量 大于库诺特均衡的总产量 企业1的斯坦科尔伯格均衡产量 库诺特均衡的产量 企业2的斯坦科尔伯格均衡产量 库诺特均衡的产量 这就是 先动优势 讨价还价博弈 假设有两人就如何分割1万元进行谈判 并且已经定下了这样的规则 首先由甲提出一个分割比例 对此 乙可以接受也可以拒绝 如果乙拒绝甲的方案 则他自己应提出另一个方案 让甲选择接受与否 如此循环 在上述循环过程中 只要有任何一方接受对方的方案博弈就告结束 而如果方案被拒绝 则被拒绝的方案就与以后的讨价还价过程不再有关系 由于谈判费用和利息损失等 双方的得益都要打一次折扣 折扣率为 我们称它为消耗系数 如果限制讨价还价最多只能进行三个阶段 到第三阶段乙必须接受甲的方案 则这就是一个三阶段的讨价还价博弈 本博弈有两个关键点 第一是第三阶段甲的方案是有强制力的 即进行到这一阶段 甲提出的分割S 10000 S 是双方必须接受的 并且对这一点两博弈方都非常清楚 第二是多进行一个阶段总得益就会减少一个比例 因此对双方来说都是让谈判拖得太长是不利的 必须让对方得的数额 不如早点让他得到 免得自己的得益每况愈下 顺推归纳法 当博弈方存在有意识偏离子博弈完美纳什均衡和存在屡次犯错误的可能性时 逆向归纳法已经不在使用 这时要采用顺推归纳法 蜈蚣博弈 逆向归纳法在第一阶段就结束 顺推归纳法会使得合作继续下去 重复博弈 重复博弈 是指同样结构的博弈重复多次 其中的每次博弈被称为 阶段博弈 以囚徒困境为例 如果每次判刑不是很重 那么 两个囚徒在刑满释放之后再作案 作案之后再判刑 释放之后再作案 如此等等 他们直接进行的就是重复博弈 其中每次作案是一个阶段博弈 重复博弈 重复博弈的基本特征 重复性 博弈的历史 所有的参与人都观测到博弈过去的历史 如在每一个新的阶段博弈 两个囚徒都知道同伙在过去的每次博弈中选择了抵赖还是坦白 支付之和 博弈方考虑的不仅仅是一个环节 而是整个阶段 参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值 战略空间明显复杂化 参与人在重复博弈中的战略空间远远大于且复杂于再每一个阶段博弈中的战略空间 重复博弈 影响重复博弈均衡的因素 单阶段的均衡 博弈重复的次数1 有限次重复博弈例 在位者 默许 斗争 进入者 进入 不进入 在一次博弈中 如果进入者先行动 这个博弈的唯一的子博弈精炼纳什均衡结果是进入者进入 在位者默许 先假定有20个同样的市场 通过一直倒推分析 得到这个博弈的唯一子博弈精炼均衡是在位者在每一个市场上都选择默许 进入者在每一个市场上选择进入 重复博弈 上述结果可以一般化为下述定理 定理 令G是阶段博弈 G n 是G重复n次的重复博弈 n 那么 如果G有唯一的纳什均衡 重复博弈G n 的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复n次 即每个阶段博弈出现的都是一次性博弈的均衡结果 重复博弈 2 无限次重复博弈例1 乙 坦白 抵抗 甲 坦白 抵抗 假定 博弈重复无穷次 折现率 严酷战略 首先双方合作 只要对方没有背叛 就一直合作 一方看到对方一次背叛 则永远背叛下去 以囚徒困境为例 开始选择抵抗 选择抵抗知道有一方选择了坦白 然后永远选择坦白 重复博弈 甲 严酷战略乙 抵抗 抵抗 坦白 收益 1 1 0 8 8 总收益1 如果乙很守信用 一直抵抗下去 总收益2 1 1 1 V 1 V 比较总收益1和总收益2得出 若 乙就不会选择背叛 其实折现率反映了一个人重视短期 小 长期 大 行为 重复博弈 无名氏定理 Friedman1971 令G为一个人阶段博弈 为以G为阶段博弈的无限期重复博弈 是G的一个纳什

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论