5 完全信息动态博弈ppt课件_第1页
5 完全信息动态博弈ppt课件_第2页
5 完全信息动态博弈ppt课件_第3页
5 完全信息动态博弈ppt课件_第4页
5 完全信息动态博弈ppt课件_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章完全信息动态博弈 一博弈扩展式表述二子博弈精练纳什均衡三应用举例28页 博弈的策略表述 案例 房地产开发项目 假设有A B两家开发商市场需求 可能大 也可能小投入 1亿 假定市场上有两栋楼出售 需求大时 每栋售价1 4亿 需求小时 售价7千万 如果市场上只有一栋楼需求大时 可卖1 8亿需求小时 可卖1 1亿 博弈策略表述 不开发 开发商A 开发 不开发 开发 不开发 开发商B 开发商A 开发 不开发 开发 开发商B 需求小的情况 需求大的情况 博弈的策略式表述 一博弈扩展式表述 博弈的扩展式表述包括三个要素 参与人集合每个参与人的策略集合由策略组合决定的每个参与人的支付 进入者 进入 不进入 0 300 在位者 市场进入阻挠博弈树 不可置信威胁 合作 40 50 斗争 10 0 A 开发 不开发 N N 大 小 1 2 1 2 大 小 1 2 1 2 B B B B 开发 不开发 开发 不开发 开发 不开发 开发 不开发 4 4 8 0 3 3 1 0 0 8 0 0 0 1 0 0 房地产开发博弈 一博弈扩展式表述 博弈的基本构造结 包括决策结和终点结两类 决策结是参与人行动的始点 终点结是决策人行动的终点 枝 枝是从一个决策结到它的直接后续结的连线 每一个枝代表参与人的一个行动选择 信息集 每个信息集是决策结集合的一个子集 该子集包括所有满足下列条件的决策结 1每个决策结都是同一个参与人的决策结 2该参与人知道博弈进入该集合的某个决策结 但不知道自己究竟处于哪一个决策结 A 开发 不开发 N N 大 小 1 2 1 2 大 小 1 2 1 2 B B B B 开发 不开发 开发 不开发 开发 不开发 开发 不开发 4 4 8 0 3 3 1 0 0 8 0 0 0 1 0 0 B在决策时不确切地知道自然的选择 B的决策结由4个变为2个 房地产开发博弈 A 开发 不开发 N N 大 小 1 2 1 2 大 小 1 2 1 2 B B B B 开发 不开发 开发 不开发 开发 不开发 开发 不开发 4 4 8 0 3 3 1 0 0 8 0 0 0 1 0 0 B知道自然的选择 但不知道A的选择 或A B同时决策 房地产开发博弈 一博弈扩展式表述 只包含一个决策结的信息集称为单结信息集 如果博弈树的所有信息集都是单结的 该博弈称为完美信息博弈 例 2 博弈树规则 1 每一个结至多有一个其他结直接位于它的前面 2 在博弈树中没有一条路径可以使决策结与自身相连 3 博弈树必须有初始结 4 每个博弈树只有一个初始结 3 完美信息与不完美信息 定义 假如一个局中人在轮到他行动时知道自己处于博弈树的那个结上 我们称该局中人有完美信息 博弈中的每一个局中人都具有完美信息 则称该博弈有完美信息 如果局中人在不知道另外的局中人前面行动的情况下必须行动 则称该局中人具有不完美信息 倘若至少有一个局中人具有不完美信息 则称该博弈具有不完美信息 二 扩展式博弈的策略与均衡 概念信息集Hi hi hi是局中人i的信息集 行动空间A hi 局中人i基于信息集hi的行动全体Ai hi HiA hi 局中人i的所有行动的集合 纯策略空间局中人i的一个纯策略si Hi Ai hi Hi si hi A hi Si si si是局中人i的一个纯策略 Si hi HiA hi 纯策略组合S Si 局中人1信息集 H1 h1 行动空间 A h1 左 右 纯策略空间 S1 A h1 左 右 局中人2信息集 H2 h12 h22 行动空间 A h12 A B A h22 C D 纯策略空间 S2 A h12 A h22 A C A D B C B D 纯策略组合S 左 A C 左 A D 左 B C 左 B D 右 A C 右 A D 右 B C 右 B D 2 扩展式博弈的策略式表示 局中人1信息集 H1 h1 行动空间 A h1 左 右 纯策略空间 S1 A h1 左 右 局中人2信息集 H2 h2 行动空间 A h2 A B 纯策略空间 S2 A h2 A B 纯策略组合S 左 A 左 B 右 A 右 B 扩展式博弈的策略式表示 局中人1信息集 H1 h1 h21 行动空间 A h1 左 右 A h21 E F 纯策略空间 S1 A h1 A h21 左 E 左 F 右 E 右 F 局中人2信息集 H2 h12 h22 行动空间 A h12 A B A h22 C D 纯策略空间 S2 A h12 A h22 A C A D B C B D 纯策略组合S S1 S2 左 E 左 F 右 E 右 F A C A D B C B D A C A D B C B D 左 E 左 F 右 E 右 F 第三章完全信息动态博弈 一博弈扩展式表述二子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡逆向归纳法与子博弈精练纳什均衡的存在问题三应用举例 完全信息动态博弈 考虑下列问题 一个博弈可能有多个 甚至无穷多个 纳什均衡 究竟哪个更合理 纳什均衡假定每一个参与人在选择自己的最优策略时假定所有其他参与人的策略是给定的 但是如果参与人的行动有先有后 后行动者的选择空间依赖于前行动者的选择 前行动者在选择时不可能不考虑自己的行动对后行动者的影响 子博弈精练纳什均衡的一个重要改进是将 合理的纳什均衡 与 不合理的纳什均衡 分开 完全信息动态博弈 进入者 进入 不进入 0 300 在位者 默许 40 50 斗争 10 0 市场进入阻挠博弈树 特点 剔除博弈中包含的不可置信威胁 承诺行动 如破釜沉舟 背水一战等给定进入者进入 剔除 不进入 斗争 进入 默许 是唯一的子博弈精练纳什均衡 不可置信威胁 支付函数 行动 二子博弈精练纳什均衡 一个纳什均衡称为精练纳什均衡 当且仅当参与人的策略在每个子博弈中都构成纳什均衡 也就是说 组成精练纳什均衡的策略必须在每一个子博弈中都是最优的 一个精练纳什均衡首先必须是一个纳什均衡 但纳什均衡不一定是精练纳什均衡 承诺行动 当事人使自己的威胁策略变得可置信的行动 完全信息动态博弈 泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁策略的纳什均衡从均衡中剔除 从而给出动态博弈的一个合理的预测结果 简单说 子博弈精练纳什均衡要求均衡策略的行为规则在每一个信息集上是最优的 策略的表述 策略 参与人在给定信息集的情况下选择行动的规则 它规定参与人在什么情况下选择什么行动 是参与人的 相机行动方案 在静态博弈中 策略和行动是相同的 作为一种行动规则 策略必须是完备的 扩展式表述博弈的纳什均衡 足球 男的策略 足球 芭蕾 选择足球 还是选择芭蕾 女的策略 足球 芭蕾 芭蕾 足球 芭蕾 芭蕾 足球 足球 1 追随策略 他选择什么 我就选择什么2 对抗策略 他选择什么 我就偏不选什么3 芭蕾策略 不管他选什么 我都选芭蕾 4 足球策略 不管他选什么 我都选足球 策略即 如果他选择什么 我就怎样行动的相机行动方案 在扩展式博弈里 参与人是相机行事 即 等待 博弈到达一个自己的信息集 包含一个或多个决策结后 再采取行动方案 扩展式表述博弈的纳什均衡 若A先行动 B在知道A的行动后行动 则A有一个信息集 两个可选择的行动 策略空间为 开发 不开发 B有两个信息集 四个可选择的行动 B有四个纯策略 开发策略 不论A开发不开发 我开发 追随策略 A开发我开发 A不开发我不开发 对抗策略 A开发我不开发 A不开发我开发 不开发策略不论A开发不开发我不开发 简写为 开发 开发 开发 不开发 不开发 开发 不开发 不开发 括号内的第一个元素对应A选择 开发 时B的选择 第二个元素对应A选择 不开发 时B的选择 什么是参与人的策略 扩展式 开发 开发 开发 不开发 不开发 开发 不开发 不开发 开发 不开发 开发商B 开发商A 策略式 开发 开发 开发 纳什均衡与均衡结果 存在三个纯策略纳什均衡 不开发 开发 开发 开发 不开发 开发 开发 不开发 不开发 两个均衡结果 开发 不开发 不开发 开发 注意 均衡不同于均衡结果 扩展式 开发 开发 开发 不开发 不开发 开发 不开发 不开发 开发 不开发 开发商B 开发商A 策略式 开发 开发 开发 路径在扩展式博弈中 所有n个参与人的一个纯策略组合决定了博弈树上的一个路径 开发 不开发 开发 决定了博弈的路径为A 开发 B 不开发 1 0 不开发 开发 开发 决定了路径 子博弈精炼纳什均衡 泽尔腾引入子博弈精练纳什均衡概念的目的是将那些不可置信威胁策略的纳什均衡从均衡中剔除 从而给出动态博弈的一个合理的预测结果 简单说 子博弈精练纳什均衡要求均衡策略的行为规则在每一个信息集上是最优的 子博弈精炼纳什均衡 不可置信威胁 美国普林斯顿大学古尔教授在1997年的 经济学透视 里发表文章 提出一个例子说明威胁的可信性问题 两兄弟老是为玩具吵架 哥哥老是要抢弟弟的玩具 不耐烦的父亲宣布政策 好好去玩 不要吵我 不管你们谁向我告状 我都把你们两个关起来 关起来比没有玩具更可怕 现在 哥哥又把弟弟的玩具抢去玩了 弟弟没有办法 只好说 快把玩具还我 不然我就要去告诉爸爸 各个想 你真要告诉爸爸 我是要倒霉的 可是你不告状不过没有玩具玩 而告了状却要被关禁闭 告状会使你的境遇变得更坏 所以你不会告状 因此哥哥对弟弟的警告置之不理 的确 如果弟弟是会算计自己利益的理性人 在这样的环境下 还是不告状的好 可见 弟弟是理性人 他的告状威胁是不可置信的 子博弈精练纳什均衡 A 开发 不开发 B B 开发 不开发 开发 3 3 1 0 0 1 0 0 不开发 不开发 开发 开发 开发 不开发 开发 开发 不开发 不开发 如果A选择开发 B的最优选择是不开发 如果A选择不开发 B的最优选择是开发 A预测到自己的选择对B的影响 因此开发是A的最优选择 子博弈精练纳什均衡结果是 A选择开发 B选择不开发 x x 对于 不开发 开发 开发 这个组合之所以构成纳什均衡 是因为B威胁不论A开发还是不开发 他都将选择开发 A相信了B的威胁 不开发是最优选择 但是A为什么要相信B的威胁呢 毕竟 如果A真开发 B选择开发得 3 不开发得0 所以B的最优选择是不开发 如果A知道B是理性的 A将选择开发 逼迫B选择不开发 自己得1 B得0 即纳什均衡 不开发 开发 开发 是不可置信的 因为它依赖于B的一个不可置信的威胁 同样 不开发 不开发 也是一个不可置信威胁 纳什均衡 开发 不开发 不开发 是不合理的 子博弈精练纳什均衡 泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁策略的纳什均衡从均衡中剔除 从而给出动态博弈的一个合理的预测结果 简单说 子博弈精练纳什均衡要求均衡策略的行为规则在每一个信息集上是最优的 什么是子博弈 什么是子博弈精练纳什均衡 有没有更好的方法找到子博弈精练纳什均衡 完全信息动态博弈 子博弈 是原博弈的一部分 它本身也可以作为一个独立的博弈进行分析 1 子博弈必须从一个单结信息点开始 只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时 该决策结才能作为一个子博弈的初始结 如果信息集包含两个以上的决策结 则这两个都不可以作为子博弈的初始结 见下页 2 子博弈的信息集和支付向量都直接继承自原博弈 即当x 和x 在原博弈中属于同一信息集时 他们在子博弈中才属于同一信息集 习惯上 任何博弈的本身称为自身的一个子博弈 A 开发 不开发 X X 大 小 1 2 1 2 大 小 1 2 1 2 B B B B 开发 不开发 开发 不开发 开发 不开发 开发 不开发 4 4 8 0 3 3 1 0 0 8 0 0 0 1 0 0 参与人X的信息集不能开始一个子博弈 否则的话 参与人B的信息将被切割 完全信息动态博弈 不开发 不开发 房地产开发博弈 找出房地产开发博弈的子博弈 不开发 开发 开发 开发 不开发 开发 开发 不开发 不开发 完全信息动态博弈 子博弈精练纳什均衡 扩展式博弈的策略组合是一个子博弈精练纳什均衡 如果 1 它是原博弈的纳什均衡 2 它在每一个子博弈上给出纳什均衡 A 开发 不开发 B B 开发 不开发 开发 1 0 0 1 0 0 3 3 x x 房地产开发博弈 不开发 开发 开发 开发 不开发 开发 开发 不开发 不开发 在c上构成均衡 在b上不构成 在b和c上都构成在c上构成均衡 在b上不构成 完全信息动态博弈 不开发 判断下列均衡结果哪个构成子博弈精练纳什均衡 不开发 b c 完全信息动态博弈 如果一个博弈有几个子博弈 一个特定的纳什均衡决定了原博弈树上唯一的一条路径 这条路径称为 均衡路径 博弈树上的其他路径称为 非均衡路径 纳什均衡只要求均衡策略在均衡路径的决策结上是最优的 而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的 而且在非均衡路径上的决策结上也是最优的 这是纳什均衡与子博弈精练纳什均衡的实质区别 完全信息动态博弈 策略是参与人行动规则的完备描述 它要告诉参与人在每一种可预见的情况下 即每一个决策结 上选择什么行动 即使这种情况实际上没有发生 甚至参与人并不预期它会发生 因此 只有当一个策略规定的行动规则在所有可能的情况下都是最优的 它才是一个合理的可置信的策略 子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则 第三章完全信息动态博弈 一博弈扩展式表述二子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡逆向归纳法与子博弈精练纳什均衡的存在问题三应用举例 用逆向归纳法求子博弈精练纳什均衡 1 U D L 3 1 0 0 2 2 2 R 给定博弈达到最后一个决策结 该决策结上行动的参与人有一个最优选择 这个最优选择即该决策结开始的子博弈的纳什均衡倒数第二个决策结 找倒数第二个的最优选择 这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡 如此重复直到初始结 每一步都得到对应于子博弈的一个纳什均衡 并且根据定义 该纳什均衡一定是该子博弈的子博弈的纳什均衡 这个过程的最后一步得到整个博弈的纳什均衡 完全信息动态博弈 用逆向归纳法求子博弈精练纳什均衡对于有限完美信息博弈 逆向归纳法求解子博弈精练纳什均衡是一个最简便的方法 房地产开发博弈 完全信息动态博弈 1 U D L 1 1 2 2 0 R U 3 0 0 2 1 D 子博弈精练纳什均衡 U U L U 和L分别是参与人1和参与人2在非均衡路径上的选择 逆向归纳法求解子博弈精练纳什均衡的过程 实质上是重复剔除劣策略的过程 从最后一个决策结依次剔除每个子博弈的劣策略 最后生存下来的策略构成精练纳什均衡 完全信息动态博弈 用逆向归纳法求解的子博弈精练纳什均衡也要求 所有的参与人是理性的 是共同知识 如果博弈由多个阶段组成 则从逆向归纳法得到的均衡可能并不非常令人信服 完全信息动态博弈 进入者 进入 不进入 0 300 在位者 市场进入阻挠博弈树 不可置信威胁 支付函数 行动 合作 40 50 斗争 10 0 承诺行动与子博弈精练纳什均衡 承诺行动与子博弈精练纳什均衡有些策略之所以不是精练纳什均衡 是因为它包含了不可置信的威胁策略 如果参与人能在博弈之前采取某种行动改变自己的行动空间或支付函数 原来不可置信威胁将变得可置信 博弈的精练纳什均衡也会随之改变 这些改变博弈结果而采取的措施称为承诺行动 完全承诺 承诺可以使某项行动完全没有可能 破釜沉舟 不完全承诺 承诺只是增加了某个行动的成本而不是使该活动完全没有可能 承诺行动与子博弈精练纳什均衡 房地产开发博弈 如果在A决策之前 B与某客户签定了一个合同 规定B若不在特定时期内开发若干面积的写字楼 则将支付违约金3 5 这个合同就是承诺行动 1 3 5 不可置信威胁 精炼纳什均衡剔除了不可置信的威胁 使得我们可以更合理地对博弈中参与人行为的预测 不可置信威胁的根源是事前最优与事后最优不同 导致许多均衡结果无法实现 管教孩子为什么困难 家族企业为什么难以实行制度化管理 一个例子 苦恼的父母 如何处置与人私奔的女儿 Eg 司马相如与卓文君 承诺 承诺是将不可置信的威胁变成可置信的威胁的行动 威胁不仅是事前最优的 也是事后最优的 承诺意味着限制自己的自由 选择少反而对自己好 如 破釜沉舟 的故事 承诺举例 婚姻中的承诺 彩礼 昂贵的婚礼可以理解为一种对婚姻的承诺 订金 抵押物做为对交易的承诺 安营扎寨 固定资产投资可以作为承诺 所有权的承诺作用 最惠条款 生产耐用品的企业经常被 降价预期 所困扰 如果消费者预期企业将降价 他们将会等待 结果 企业只能降价 如汽车行业面临的问题 最惠条款可以起到承诺的作用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论