博弈论专题+应用部分_第1页
博弈论专题+应用部分_第2页
博弈论专题+应用部分_第3页
博弈论专题+应用部分_第4页
博弈论专题+应用部分_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论专题 一 基本概念 参与人 players 指的是一个博弈中的决策主体 他的目的是通过选择行动 或战略 以最大化自己的支付 效用 水平 自然人 团体 企业 国家 国家集团 欧盟 北约等 自然 行动 actionsormoves 参与人在博弈的某个时点的决策变量 可以是连续的 也可能是离散的 信息 information 参与人有关博弈的知识 完美信息 perfectinformation 指一个参与人 包括虚拟参与人 自然 的行动选择有准确了解的情况 完全信息 completeinformation 指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况 共同知识 commonknowledge 支付 payoff 在一个特定的战略组合下参与人得到的确定效用水平 或者是参与人得到的期望效用水平 战略 strategies 结果 outcome 是指博弈分析者所感兴趣的所有东西 如均衡战略组合 均衡行动组合 均衡支付组合 坦白 坦白 7 7 均衡 equilibrium 所有参与人的最优战略的组合 物理学上的均衡经济学上的供求均衡纳什均衡例子 沙滩上的两个卖冰淇淋摊贩的博弈均衡 占优策略 无论其他参与者采取什么策略 某参与者的唯一的最优策略就是他的占有策略 博弈均衡直至博弈中的所有参与者都不想改变自己的策略的这样一种状态 由博弈中的所有参与者的占优策略组合所构成的均衡就是占有策略均衡 合作 不合作 不合作 合作 甲 乙 纳什均衡的定义 在一个纳什均衡里任何一个参与者都不会改变自己的策略 如果其他参与者不改变策略 如果 的选择给定 则 的选择是最优的 如果 的选择给定 则 的选择是最优的 这一对策略就是纳什均衡 甲 乙 在一个博弈中 只要每一个参与者都具有占有策略 那么 该博弈就一定存在占优策略均衡 但在有的博弈中 并不存在占优策略 仍可以达到博弈均衡 重复博弈 1 在无限期重复博弈对于任何一个参与者的欺骗和违约行为 其他参与者总会有机会报复 以牙还牙 以合作 不合作的卡特尔为例 所有成员从一开始就合作 对于每一个成员来说 只要其他成员是合作的 则他就把合作继续下去 但只要有一个成员背弃合作协议一次 其他成员就从此在也不与合作了 2 在有限期重复博弈中 和一次静态博弈一样 第 次不合作 二 分类 静态博弈 参与人同时参与选择行动 动态博弈 参与人的行动有先后顺序 且后行动者能够观察到先行动者所选择的行动 完全信息 每一个参与人对所有其他参与人 对手 的特征 战略空间及支付函数有准确的知识 不完全信息 每一个参与人对所有其他参与人 对手 的特征 战略空间及支付函数没有准确的知识 博弈的分类及对应的均衡概念 一 纳什均衡经典例子 囚徒困境 坦白 抵赖 抵赖 坦白 囚徒 囚徒 智猪博弈 按 等待 等待 按 大猪 小猪 足球 芭蕾 芭蕾 足球 男 女 性别战 进 退 退 进 4 斗鸡博弈 默许 斗争 不进入 进入 进入者 在位者 市场进入阻挠 寻找纳什均衡的方法 划线法 重复优势解法 古诺模型 假定 市场上有 两个厂商生产和销售相同的产品 它们的生产成本为零 它们共同面临的市场的需求曲线是线性的 两个厂商都准确地了解市场的需求曲线 两个厂商都是在已知对方产量的情况下 各自确定能够给自己带来最大利润的产量 即每一个厂商都是消极地以自己地结论的去适应对方已确定的产量 A 1 2 3 8 11 32 43 128 1 2 1 8 1 32 1 128 B 1 4 5 1621 64 85 256 1 4 1 16 1 64 1 256 令寡头厂商的数量为m 则可得到一般性的结论 每个厂商的均衡产量为 行业的总产量为 寻找纳什均衡 重复优势解法 逐次删去劣势策略 二 完全信息动态博弈 子博弈精炼纳什均衡 纳什均衡存在的问题 一个博弈可能有不止一个纳什均衡 哪一个会发生并不知道 静态博弈时 不考虑自己的策略对对手的影响 动态博弈中必须进行考虑 纳什均衡允许了不可置信威胁的存在 在市场进入的例子中 如果在位者摆出一幅 你进入我就斗争 的架式 不进入 斗争 便成为一个纳什均衡 默许 斗争 不进入 进入 进入者 在位者 泽尔腾的贡献 针对静态纳什均衡的问题 泽尔腾对动态博弈进行了分析 定义了子博弈精炼纳什均衡 将纳什均衡中不可置信威胁战略剔除出去 使均衡战略不再包含不可置信的威胁 它要求参与人的决策在任何时点上都是最优的 决策者要 应变 而不是 固守 扩展性博弈形式的 个要素 参与人 每个参与人选择行动的时点 每个参与人在每次行动时可供选择的行动集合 每个参与人在每次行动时有关对手过去行动选择的信息 支付函数 博弈树 是扩展型的一种形象化表述 子博弈 进入者 合作 不进入 在位者 斗争 40 50 10 0 0 300 进入 市场进入阻挠博弈树 概念 一个纳什均衡称为精炼纳什均衡 当且只当参与人的战略在每一个子博弈中都构成纳什均衡 即组成精炼纳什均衡的战略必须在每一个博弈中都是最优的 因此 进入 斗争 不是一个精炼纳什均衡 而 进入 合作 是惟一的子博弈精炼纳什均衡 不可置信的例子 谈恋爱 破釜沉舟 红军 白军抢占小岛 炸桥断后路 计算题 求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡 博弈方 博弈方 三 不完全信息静态博弈 贝叶斯纳什均衡市场进入的例子 进入者知道在位者的偏好 战略空间及各种战略组合下的利润水平 如果进入者实际上并不完全了解在位者的生产函数 成本函数及偏好 这就是不完全信息博弈 设想在位者成本函数有两种可能的情况 对应于这两种情况的支付矩阵分别如表一和表二 解释 在给定进入者选择进入的情况下 高成本在位者的最优战略是默许 而低成本在位者的最有战略是斗争 低成本情况下斗争之所以比默许优 可能是由于在位者的生产成本是如此低 从而他在非常低的价格下获得的垄断利润也高于相对高的价格下分享到的寡头利润 也可能在位者有一种好斗的天性 他更乐于与进入者斗争而不是合作 默许 斗争 不进入 进入 进入者 在位者 表一 市场进入 高成本情况 默许 斗争 不进入 进入 进入者 在位者 表一 市场进入 低成本情况 在1967年以前 遇到这种不知对手的选择情况 自己的战略自然无法选择 因此相应的问题无法解决 海萨尼的贡献在于引进了一个虚拟的参与人 自然 使得上述情况可以分析 自然首先行动 选择参与人的类型 被选择的参与人知道自己的真是类型 而其他参与人并不清楚这个被选择的参与人的真是类型 仅知道各种可能类型的概率分布 另外 被选择的参与人也知道其他参与人心目中的这个分布函数 即分布函数是一种共同知识 commonknowledge 在市场进入的这个例子中 自然 首先选择在位者的类型 高成本还是低成本 在位者本人知道自己究竟是高成本还是低成本 而进入者仅知道在位者或者高成本 或者是低成本 并且 知道高成本和低成本的可能性各为多少 海萨尼把 不完全信息博弈 转换成 完全但不完美信息博弈 贝叶斯是一位概率统计学家 贝叶斯均衡是纳什均衡在不完全信息博弈中的自然扩展 贝叶斯纳什均衡是这样一种类型战略组合 给定自己的类型和别人类型的概率分布的情况下 每个参与人的期望效用达到了最大化 也就是说 没有人有积极性选择其他战略 以市场进入为例 进入者知道高成本的可能性为x 低成本的可能性为 1 x 那么 进入者选择进入得到的期望利润为40 x 10 1 x 选择不进入的期望利润为零 当x 0 20时 进入得到的期望利润才大于不进入时的期望利润 从而 进入才是最优的 即x大于0 20 那么 贝叶斯纳什均衡是 进入者选择进入 高成本在位者选择默许 低成本在位者选择斗争 默许 斗争 不进入 进入 进入者 在位者 高成本 默许 斗争 不进入 进入 进入者 在位者 低成本 接受 不接受 不求爱 求爱 求爱者 你 表一 求爱博弈 品德优良者求爱 接受 不接受 不求爱 求爱 求爱者 你 表二 求爱博弈 品德恶劣者求爱 假设你认为求爱者品德优良的概率为x 求爱者也知道这个x为多少 则他求爱你接受时你的期望效用为100 x 100 1 x 你不接受时你的期望效用为零 当x 1 2时 你接受才是最优选择 如果x确实小于1 2 贝叶斯纳什均衡是 求爱者不求爱 你不接受 原因在于他知道他求爱会被你拒绝 这种损脸面 50 的事是不值得干的 四 不完全信息动态博弈 精炼贝叶斯均衡精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为来修正自己有关后者类型的 信念 主观概率 并由此来选择自己的行动 精炼贝叶斯均衡是所有参与人战略和信念的一种结合 它满足如下条件 给定每个人有关其他人类型的信念的情况下 他的战略选择是最优的 每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的 张三与你 恃强欺弱 早餐 辣椒 黔驴技穷 五 纯策略 混合策略及混合策略的均衡纯策略 每个行为人只作出一个选择并始终坚持这个选择 这种策略叫做纯策略 混合策略 允许行为人使他们的策略随机化 对每项选择都制定一个概率 按照这些概率作出他们的选择 混合策略的均衡 每个行为人都选定了最优频率 并在另一个行为人的频率选择给定的情况下按照这个最优频率采取他的策略 计算题 两寡头古诺模型 为市场出清价格 两个厂商的边际成本不同 分别为 如果 问纳什均衡产量各为多少 如果 则纳什均衡产量又各为多少 解 两个厂商的利润函数为 将利润函数对产量求导并令其等于 得 解得两个厂商的反应函数为 具体写成 当时 根据上述两个厂商的反应函数 直接求出两个厂商的纳什均衡产量分别为 q1 q2都大于 当时 根据反应函数求出来的厂商 产量 这意味着厂商 不会生产 这是厂商 成了垄断厂商 厂商 的最优产量选择是利润最大化的垄断产量 因此这种情况下的纳什均衡为 P590 1假定有两家厂商 它们面临的线性需求曲线p Y a bY 每家厂商边际成本都不变为c 试求古诺均衡情况下的产量 解 剪刀 剪刀 石头 石头 布 布 求纳什均衡 解 当 选择剪刀 石头和布时 三者的期望收益相等 即 同理 当 选择剪刀 石头和布时 三者的期望收益相等 即 总需求为 边际成本等于 求双头寡头数量竞争的古诺模型的总产量和斯塔克尔伯格模型的总产量 卡特尔模型 总利润最大 计算题 两个寡头企业进行价格竞争博弈 企业 的利润函数是 企业 的利润函数是 其中p是企业 的价格 q是企业 的价格 求 两个企业同时决策的纯策略纳什均衡 企业 先决策的子博弈完美纳什均衡 企业 先决策的子博弈完美纳什均衡 29 博弈论的应用 最优反应线古诺模型中即给定其他厂商的选择 每一家厂商都会选择使利润最大化的产量 伯特兰模型 是定价策略的纳什均衡 给定对其他厂商将要作出选择的预期 每一家厂商都会选择使利润最大化的价格 混合策略 例子 左c 右 1 c 下 1 r 上r 行参与人 列参与人 当r和c等于0或者1是 相应的策略就是纯策略 左c 右 1 c 下 1 r 上r 行参与人 列参与人 行参与人的期望收益 2rc 1 r 1 c 2rc 1 r c rc 假定r增加了 行参与人的收益变化为 当3c 1时 上式取正值 当3c1 3时 行参与人会提高r值 当c2 3时 列参与人会提高c值 当r 2 3时 列参与人会提高c值 当c 1 3时 他对于任意的c 0 1 无差异 c1 1 3 2 3 0 1 行参与人的最优反应曲线 列参与人的最优反应曲线 如果列参与人选择c 0 那么 行参与人就会使r值尽可能的小 所以 r 0就是c 0时行参与人的最优反应 并且 r 0一直都是行参与人的最优反应 直到c 1 3时为止 当c 1 3时 位于0和1之间的任意r值都是最优反应 对于所有的c 1 3行但育人的最优反应是r 1 r 这两条曲线分别体现了行参与人和列参与人对应于对方选择时的最优反应 曲线的交点就是纳什均衡 两个纯策略均衡 一个混合策略均衡 合作博弈 略 竞争博弈 踢球 零和博弈 假定 行参与人踢向球门的左方 那么 当列参与人扑向右方时 行参与人将在80 的时间内得分 当列参与人扑向左方时 行参与人将在50 的时间内得分 如果行参与人踢向球门的右方 那么 当列参与人扑向左方时 行参与人将在90 的时间内得分 当列参与人扑向右方时 行参与人将在20 的时间内得分 收益表如下 扑向左方 扑向右方 踢向右方 踢向左方 行参与人 列参与人 如果行参与人选择踢向左方的概率为p 那么 当列参与人扑向左方时 行参与人的期望收益为50p 90 1 p 当列参与人扑向右方时 行参与人的期望收益为80p 20 1 p 行参与人想使这个期望收益尽可能的大 而同时 列参与人却想使这个期望收益尽可能的小 20 0 0 7 1 50 62 80 100 90 行参与人得分的百分点数 行参与人踢向左方的概率p 这两条线表示的是行参与人的期望收益 它是p的函数 而p则是行参与人踢向左方的概率 无论行参与人选择怎样的p值 列参与人将竭力使行参与人的收益最小化 这些最小收益的最大值出现在什么位置 50p 90 1 p 80p 20 1 p P 0 7 同理 列参与人 假定列参与人选择扑向左方的概率为q50q 80 1 q 90q 20 1 q q 0 6 20 0 0 6 1 50 62 90 100 80 行参与人得分的百分点数 列参与人踢向左方的概率q 这两条线表示的是行参与人的期望收益 它是q的函数 而q则是行参与人踢向左方的概率 无论列参与人选择怎样的q值 行参与人将竭力最大化自己的收益 我们可以看到 当p0 7时 列参与人将扑向右方 类似地 当p0 6时 行参与人将扑向右方 如下图 0 0 7 1 1 行参与人踢向左方的概率p 最优反应曲线 列参与人的最优反应曲线 行参与人的最优反应曲线 共存博弈 当两只豺狗同时遇到一块食物时 他们必须决定是争斗还是分享食物 争斗是鹰派的策略 一方将获胜 另一方将落败 分享食物则是鸽派的策略 在对方也是鸽派时 这个策略将发挥很好的功效 但对方是鹰派时 鸽派将一无所获 收益表如下 鹰派 鸽派 鸽派 鹰派 行 列 假定鹰派的比例是p 于是 一个鹰派遇见另一个鹰派的概率是p 而遇见一个鸽派的概率是1 p 则鹰派的期望收益等于H 2p 4 1 p 鸽派的期望收益等于D 2 1 p 假定具有较高收益的类型的繁殖速度更快一些 并且 它会将其采取鹰派策略或鸽派策略的倾向遗传给后代 那么可以预期 如果H D 种群中鹰派的比例就将上升 H D 鸽派的数量就将上升 种群中处于均衡状态的惟一途径是这两种类型的收益相等即H D 得到p 1 2 如果p 1 2 鹰派的收益小于鸽派的收益 鸽派的繁殖速度较快 当p 1 2 鹰派的收益大于鸽派的收益 使得鹰派的繁殖速度更快一些 最终还是返回均衡 如下图 收益 鹰派的比例 2 4 3 1 0 5 1 0 0 3 0 7 H 承诺博弈 例子 青蛙和蝎子 乌龟和小白兔善意的绑匪 当力量成为弱势时 储蓄和社会保障敲竹杠 讨价还价 鲁宾斯坦模型 两个参与人爱丽丝和鲍勃 分配1美元 他们同意最多用三天时间协商分配问题 第一天 爱丽丝给出一个报价 第二天 鲍勃可以接受也可以拒绝这个报价 如果他拒绝 他要提出一个新报价 第三天 爱丽丝提出最终的报价 如果他们不能在3天之内达成协议 那么 双方都将一无所获 爱丽丝和鲍勃收益的贴现因子是假定任意最小量近似为 N 3 Alice 1 Bob 0 爱丽丝最优选择是向鲍勃提供一个他可以接受的最小量 依据假定鲍勃得 N 2 Alice 1 a Bob 1 a 鲍勃理性地向爱丽丝提供a 爱丽丝也会接受 N 1 Alice向Bob提供b 1 a 爱丽丝想 鲍勃只要等到第二天 就可以得到 1 a 为了避免拖延 爱丽丝必须向鲍勃提供一个至少等于这个数额现值的报价b 1 a 双方满意成交 博弈在第一阶段结束爱丽丝获得1 b 1 a 鲍勃获得b 1 a 鲍勃的收益 爱丽丝的收益 第1天 第2天 第3天 1 子博弈精炼均衡 鲍勃的收益 爱丽丝的收益 1 子博弈精炼均衡 可以证明子博弈精炼均衡的分配额是 爱丽丝获得 鲍勃获得 理论分析的分配如此即可 如鲍勃拿着 美分回家 爱丽丝得到 美分 都庆幸学过博弈论 事实并非如此 你 鲍勃 认为会得到多少会接受 趣味题 海盗分赃 5个海盗抢到了100颗宝石 每一颗都有一样的大小和一样贵重的价值 经过商议 他们决定将宝石这样分配 a 抽签决定自己的号码1 2 3 4 5 b 首先 由1号提出分配方案 然后5人进行表决 当且仅当超过半数的人同意时 就按照1号的提案进行分配 否则 他将被扔入大海喂鲨鱼 假设每个海盗都是很聪明的人 都能很理智地判断得失 从而做

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论