策略型博弈概述(PPT 74页).ppt_第1页
策略型博弈概述(PPT 74页).ppt_第2页
策略型博弈概述(PPT 74页).ppt_第3页
策略型博弈概述(PPT 74页).ppt_第4页
策略型博弈概述(PPT 74页).ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论与信息经济学GameTheoryandInformationEconomics 第二部分非合作博弈理论 第二章策略型博弈第三章扩展型博弈第四章贝叶斯博弈第五章动态贝叶斯博弈 主要内容 第一节策略型博弈的表示第二节重复剔除严格劣策略均衡第三节纳什均衡第四节混合策略纳什均衡第五节纳什均衡的存在性 第二章策略型博弈 同时行动 如何决策 策略型 标准型 表述 适合表示静态博弈扩展型表述 适合表示动态博弈 博弈有两种表述方法 一 策略型博弈的含义完全信息静态博弈又称为策略型博弈 完全信息是指局中人对自己与其他局中人的所有与博弈有关的事前信息 策略空间 支付函数等 有充分的了解 局中人的支付函数是共同知识 静态博弈是指在博弈中 局中人同时采取行动 或者局中人的行动有先有后 但后行动者不能知道先行动者的行动选择 第一节策略型博弈的表示 二 策略型博弈的三个要素 1 局中人 Players 1 2 n 2 策略 Strategies 3 支付函数 Payofffunctions 表示为 第一节策略型博弈的表示 1 有限博弈 1 博弈中局中人人数有限 2 每个局中人只有有限个策略 2 零和博弈 博弈中局中人所获支付之和为零 即一方所得为另一方所失 三 两种特殊博弈类型 1 局中人 甲 乙2 策略 坦白 不坦白 3 支付函数 支付矩阵 双人有限博弈 每个位置上第一个数字表示局中人1在对应的策略组合中得到的支付 第二个数字表示局中人2的相应所获支付 例2 1囚徒困境及其策略型表示 Tucker 1950 囚徒困境的支付矩阵 例2 2石头 剪刀 布的支付矩阵 例2 3田忌赛马的支付矩阵 局中人 男 女策略 男 看足球 看芭蕾女 看足球 看芭蕾支付矩阵 见下一页 例2 4性别大战 battleofthesexes 性别大战的支付矩阵 一 基本思想 如果一个局中人在任何情况下从某种策略中得到的支付均小于从另一种策略中得到的支付 那么显然对他而言 前一种策略劣于后一种策略 从个人利益出发 被剔除的策略不会被局中人采用 从而可以利用剔除严格劣策略的概念来简化博弈局势 可能会得到博弈的解 第二节重复剔除严格劣策略均衡 如果存在 对于所有的都有且其中至少有一个为严格不等式 则称是第i个局中人的一个严格劣策略 二 严格劣策略的定义 1 根据理性的局中人不会选择严格劣策略这一原则 可以通过重复剔除严格劣策略的方法对博弈进行求解 2 其方法是 对每个局中人寻找严格劣策略 由于它不会被局中人选择实施 所以找到一种后就可以将其从博弈局势中剔除 从而得到一种新的缩减后的博弈局势 对这种新局势重复上述过程 直到无法找到新的严格劣策略为止 三 重复剔除严格劣策略 对局中人甲而言 无论局中人乙采取何种策略 采用 不坦白 策略得到的支付都小于采用 坦白 策略 局中人甲的 不坦白 策略严格劣于 坦白 策略 不坦白 策略都是一种严格劣策略 从而可以剔除 博弈中局中人各自从自身利益出发的理性选择 博弈均衡解 就是 坦白 坦白 四 囚徒困境的解 例2 1囚徒困境的支付矩阵 甲 不坦白 相对于 坦白 是严格劣策略 乙 不坦白 相对于 坦白 是严格劣策略 例2 5利用重复剔除严格劣策略求解 乙 右 相对于 中 是严格劣策略 甲 下 相对于 上 是严格劣策略 乙 左 相对于 中 是严格劣策略 重复剔除严格劣策略均衡是 上 中 1 每一步剔除需要局中人间相互了解的更进一步假定 如果我们把这一过程应用到任意多步 需要假定 局中人是理性的 是共同知识 2 这一方法对博弈结果的预测经常是不准确的 五 重复剔除严格劣策略有两个缺陷 例2 2石头 剪刀 布的支付矩阵 利用重复剔除严格劣策略无法求解 例2 6利用重复剔除严格劣策略无法求解 大多数的博弈局势中使用剔除严格劣策略的方法能够对博弈局势进行简化 但可能得不到博弈的均衡解 需要引入非合作博弈理论中的核心概念 纳什均衡 NashEquilibrium 六 注意 一 纳什均衡的思想 双赢 或 多赢 第三节纳什均衡 它是关于博弈结局的一致性预测如果所有局中人预测一个特定的纳什均衡会出现 那么这种均衡就会出现 只有纳什均衡才能使每个局中人均认可这种结局 而且他们均知道其他局中人也认可这种结局 二 纳什均衡的意义 1 博弈的纳什均衡是这样一种最优策略组合 是一种你好 我好大家都好的理性结局 其中每一个局中人均不能也不想单方面改变自己的策略而增加收益 每个局中人选择的策略是对其他局中人所选策略的最佳反应 三 纳什均衡的定义 2 数学定义 在策略型博弈中 如果对于每个局中人i 存在 都有或则称策略组合是此博弈G的一个纳什均衡 三 纳什均衡的定义 1 双人有限博弈 双划线法首先对局中人2的每一个策略 局中人1寻找支付最大的策略 在其对应支付下划线 然后对局中人1进行相应的步骤 最后 凡是两个局中人支付下均被划线的结局就是纳什均衡 四 纳什均衡的求法 用双划线法可以求出纳什均衡 坦白 坦白 6 6 意义 揭示个人理性与集体理性之间的矛盾 例2 1囚徒困境的纳什均衡 局中人 大猪 小猪策略 大猪 按 等待小猪 按 等待支付矩阵 见下一页纳什均衡 按 等待 例2 7智猪博弈 boxedpigs 例2 7智猪博弈的支付矩阵 例2 4性别大战博弈的支付矩阵 局中人 甲 乙策略 甲 放左手 放右手乙 猜左手 猜右手支付矩阵 见下一页没有纳什均衡 例2 8猜左右手游戏 2 连续性博弈纳什均衡的求法首先求出每个局中人对其他局中人策略组合的反应函数 即在其他局中人策略组合给定时极大化自己的支付 得到的最佳反应策略表现为其他局中人策略组合的函数 然后将这些反应函数联立求解即得到博弈的纳什均衡解 四 纳什均衡的求法 局中人 厂商1 厂商2策略 厂商1 选择产量厂商2 选择产量假设 价格支付函数 利润函数 例2 9两寡头产量竞争Cournot 1838 模型 Cournot模型求解 反应函数 纳什均衡 Cournot模型求解 假设两寡头可以串谋 共同确定产量Q使总利润最大化 利润函数为 Q Q a Q c 总利润最大的产量为 称为契约曲线总利润为 比较及含义 两寡头产量串谋模型 Q1厂商2的反应曲线纳什均衡契约曲线厂商1的反应曲线OQ2 图1反应曲线 纳什均衡与契约曲线 局中人 厂商1 厂商2策略 厂商1选择价格 厂商2选择价格假设 两寡头固定成本都为0 边际成本为常数c 消费者对厂商1和2生产产品的需求量分别为 例2 10两寡头价格竞争Bertrand 1883 模型 支付 利润 函数 最优化的一阶条件是 Bertrand 1883 模型及求解 反应函数 纳什均衡价格 Bertrand 1883 模型及求解 在n个局中人的策略型博弈中 1 如果重复剔除严格劣策略剔除掉除策略组合s以外的所有策略 则这一策略组合s为该博弈的唯一的纳什均衡 2 如果策略组合s是一个纳什均衡 那么它就不会被重复剔除严格劣策略所剔除 纳什均衡是比重复剔除严格劣策略更强的解概念 五 纳什均衡与重复剔除严格劣策略均衡 一 举例说明混合策略纳什均衡例2 8猜左右手游戏 第四节混合策略纳什均衡 在甲选 乙选这种策略时 他们的期望效用分别为 混合策略与期望效用 甲和乙的目标是 最优化的一阶条件是 混合策略纳什均衡 混合策略纳什均衡为 混合策略纳什均衡 1 混合策略 mixedStrategy 局中人i的一个混合策略是在其纯策略空间上的一个概率分布 其中是i选择策略的概率 局中人i的混合策略空间是他的所有混合策略构成的集合 纯策略可以理解为混合策略的特例 如等价于 二 混合策略纳什均衡 在混合策略组合下 局中人i的期望效用函数为 其中 2 期望效用函数 在策略型博弈中 如果对于每个局中人i 存在 都有或则称是博弈G的一个混合策略纳什均衡 3 混合策略纳什均衡 奇数定理 Wilson1971 几乎所有的有限博弈都有奇数个纳什均衡 4 奇数定理 例2 11社会保障博弈局中人 政府和下岗工人策略 政府 救济 不救济下岗工人 找工作 不找工作支付矩阵为 三 应用举例 求出性别大战博弈的混合策略纳什均衡 定理1 Nash 1950 每个有限策略型博弈至少存在一个纳什均衡 纯策略的或混合策略的 第五节纳什均衡的存在性 Brouwer不动点定理 如果X是非空的有界闭凸集 f x 是X到自身的连续映射 那么至少存在一个x X 使得f x x x 称为不动点 Kakutani不动点定理 设f X 是点集X上的一个集值映射 如果X是非空的有界闭凸集 并且对于所有的x X f x 是非空的 凸的且上半连续的 那么至少存在一个x X 使得x f x x 称为不动点 纳什均衡的存在性证明 1 集值映射 对于集合X上的任何一个点x 如果f x 给出唯一的一个点y Y 则f x 称为从X到Y的映射 如果f x 给出一个集合f x Y 则f x 称为从X到Y的集值映射 映射是集值映射的特例 2 上半连续 设f x 是X到自身的一个集值映射 如果对于所有的x X和包含f x 的开集V 都存在x 的一个邻域U 使得对于所有的x U 有f x V 则称f x 是上半连续的 注 集值映射和上半连续 定理2 Debreu 1952 Glicksberg 1952

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论