第九章 博弈论.ppt_第1页
第九章 博弈论.ppt_第2页
第九章 博弈论.ppt_第3页
第九章 博弈论.ppt_第4页
第九章 博弈论.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章博弈论 第一节博弈问题概述一 博弈论的基本概念博弈论 gametheory 是研实决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题 或者说 博弈论研究当某一经济主体的决策既受到其他经济主体决策的影响 而且该经济主体的相应决策又反过来影响到其他经济主体时的决策问题和均衡问题 博弈论的基本概念 要素 包括 1 参与人 player 博弈中通过选择行动 或战略 以最大化自身利益 效用水平 利润等 的决策主体 如个人 厂商 国家 每个参与人必须有可供选择的行动和一个很好定义的偏好函数 用i 1 2 n代表参与人 2 行动 actionormove 行动是参与人在博弈的某个时点的决策变量 根据参与人的策略而所做的事情 用ai表示第i个参与人的一个特定行动 Ai ai 表示可供i选择的所有行动的集合 actionset 4 战略 strategy 战略是参与人在给定信息集的情况下选择行动的规则 它规定了参与人在什么时候选择什么行动 信息集包含了一个参与人有关其他参与人之前行动的知识 战略告诉该参与人如何对其他参与人的行动作出反应 因而战略是参与人的 相机行动方案 用表示si第i个参与人的一个特定战略 S si 代表第i个参与人的所有可供选择的战略集合 其中si是第i个参与人选择的战略 3 信息 information 信息是参与人有关博弈的知识 特别是有关其他参与人 对手 或博弈对方 的特征和行动知识 5 支付 payoff 在博弈论中 支付或者是在特定的战略组合下参与人从博弈中获得的确定效用水平 或者是指参与人得到的期望效用水平 它是所有参与人战略或行动的函数 是每个参与人真正关心的东西 用ui表示第i个参与人的支付 效用水平 U u1 ui un 为n个参与人的支付组合 一个参与人的支付不仅取决于自己的战略选择 而且取决于所有其他参与人的战略选择 即ui是所有参与人的战略选择的函数 ui ui s1 si sn 6 结果 结果是博弈分析者所感兴趣的所有东西 如均衡战略组合 均衡行动组合 均衡支付组合等 7 均衡 均衡是所有参与人的最优战略或行动的组合 一般记为 s s 1 s 2 s i s n 其中 s i是第i个参与人在均衡情况下的最优战略 它是i的所有可能的战略中使ui最大化的战略 博弈分析的目的是使用博弈规则预测参与人的行为和均衡 二 博弈的战略式表述 在博弈论里 一个博弈可以用两种不同的方式表述 一种是战略式表述 另一种是扩展式表述 或称展开式表述 者两种表述形式是等价的 战略式表述更适合静态博弈 而扩展式表述更适合讨论动态博弈 战略式表述又称标准式表述 在这种表述中 所有参与人同时选择各自的战略 所有参与人选择的战略一起决定每个参与人的支付 参与人 同时选择 的是战略 而不是行动 战略是参与人行动的全面计划 战略式表述 1 博弈的参与人集合 i 1 2 n 2 每个参与人的战略空间 si i 1 2 n3 每个参与人的支付函数 ui ui s1 si sn i 1 2 n将用G S1 S2 Sn u1 u2 un 代表战略式表述博弈 三 博弈的分类 博弈可以从合作性和规则等方面进行分类1 合作博弈与非合作博弈它们的区别主要在于博弈当事人之间能否达成一个有约束力的协议 如果有 就是合作博弈 反之 就是非合作博弈 例如两个寡头企业 如果它们之间达成一个协议 联合最大化垄断利润 并且按这个协议生产 就是合作博弈 它们面临的问题就是如何分享合作带来的剩余 如果这一协议不具有约束力 每个企业都作出各自的最优决策 产量或价格 则是非合作博弈 合作博弈强调的是团体理性 强调的是效率 公正 公平 非合作博弈强调的是个人理性 个人最优决策 其结果可能是有效率的 也可能是无效率的 在非合作博弈中 根据参与人行动的先后顺序 可将博弈分成静态博弈与动态博弈2 静态博弈与动态博弈静态博弈 博弈中参与人同时选择行动 或者虽非同时行动 但行动在后者并不知道行动在先者采取了什么具体行动 动态博弈 参与人的行动有先后顺序 而且行动在后者可以观察到行动在先者的选择 并据此作出相应的选择 根据参与人对其他参与人的特征 战略空间及支付函数等知识的了解程度 将博弈分成 3 完全信息博弈和不完全信息博弈完全信息博弈 在每个参与人对所有其他参与人 对手 的特征 战略和支付函数都有精确了解的情况下 所进行的博弈 不完全信息博弈 对其他参与人的情况了解不够精确 或者不是对所有人参与人都有精确的了解 这种情况下的博弈是不完全信息博弈 将上述划分结合起来 可得到四种不同类型的博弈 4 非合作博弈又分成四种情况 完全信息静态博弈 均衡 纳什均衡完全信息动态博弈 均衡 子博弈精练纳什均衡不完全信息静态博弈 均衡 贝叶斯纳什均衡不完全信息动态博弈 均衡 精练贝叶斯纳什均衡 第二节完全信息静态博弈 一 占优战略均衡由于每个参与人的效用 支付 是博弈中所有参与人的战略函数 因此每个参与人的最优战略选择依赖于所有其他参与人的战略选择 在一些特殊博弈中 一个参与人的最优战略可能不依赖与其他参与人的战略选择 即不论其他参与人选择什么战略 他的最优战略是唯一的 这样的最优战略被称为 占优战略 举例 囚徒困境 两个合伙作案的犯罪嫌疑人被抓 警方怀疑他们作了案 但并没有他们作案的确切证据 因而对犯罪事实的认定及相应的量刑取决于他们自己的供认 假定警方对犯罪嫌疑人实行隔离审讯 每人都无法观察到对方的选择 同时警方明确地分别告诉这两人 他们面临以下后果 如果犯罪嫌疑人都供认其全部犯罪事实 由于罪行严重 两人各判8年徙刑 如果某一犯罪嫌疑人供认其全部犯罪事实 而其同伙抵赖 则供认者坦白从宽 从轻判处1年刑 而不供认者从重判处10年刑 如果两个犯罪嫌疑人都不供认警方所不知道的犯罪事实 根据已经撑握的证据 只能判处他们每人2年刑 囚徒困境 囚徒B坦白抵赖 囚徒A 坦白抵赖 8 8 1 10 10 1 2 2 每个犯罪嫌疑人都有两种可供选择的战略 坦白或抵赖 但不论同伙选择什么战略 每个犯罪嫌人的最优战略是坦白 通过分折可知 坦白是A的占优战略 坦白同样也是B的占优战略 两个犯罪嫌疑人所面临的后果见下表 在博弈中 如果所有的参与人都有占优战略存在 因而博弈将在所有参于人的占优战略的基础上达到均衡 这种均衡称为占优战略均衡 上述 A坦白 B也坦白 就是占优战略均衡 在一个博弈里 如果所有参与人都有占优战略存在 那么 占优战略均衡是可以预测到的唯一均衡 因为没有一个理性的参与人会选择劣战略 占优战略均衡只要求所有的参与人是理性的 而并不要求每个参与人知道其他参与人也是理性的 不论其他参与人是否理性 占优战略总是一个理性参与人的最优选择 囚徒困境反映了一个深刻的问题 个人理性与集体理性的冲突 类似情况 寡头竞争 军备竞赛 团队生产中的劳动供给 公共物品的供给等 二 重复剔除的占优战略均衡 在每个参与人都有占优战略的情况下 占优战略均衡是一个非常合理的预测 但在大多数博弈中 占优战略均衡是不存在的 但在博弈中 仍可用占优的逻辑找出均衡 举例 智猪博弈猪圈里圈着一头大猪和一头小猪 猪圈的一头有一个猪食槽 另一头安装着一个按钮 控制着猪食的供应 按一下按钮 8单位的猪食进槽 但需要支付2个单位的成本 若大猪先到 大猪吃到7个单位 小猪只能吃到1个单位 若小猪先到 大猪和小猪各吃到4个单位 若两猪同时到 大猪吃到5个单位 小猪吃到3个单位 举例 智猪博弈按按钮对于吃食量的影响 按按钮的猪 吃到的猪食数量大猪小猪 大猪小猪两猪同时 4单位4单位7单位1单位5单位3单位 减去按按钮的成本之后 两猪的净支付水平智猪博弈 小猪按按钮等待 大猪 按按钮等待 3 12 47 10 0 在这个博弈中 无论大猪选择什么战略 小猪的占优战略均为等待 而对大猪来说 其最优战略依赖于小猪的选择 或者说 大猪没有占优战略 博弈的唯一均衡是 大猪选择 按 小猪选择 等待 支付水平分别为2和4单位 每头猪都有两种战略 按或等待 上述博弈的均衡解 可归纳为以下具体步骤 首先找出某一博弈参与人的严格劣战略 将它剔除 重新构造一个不包括巳剔除战略的新的博弈 然后继续剔除这个新的博弈中某一参与人的严格劣战略 重复进行这一过程 直到剩下惟一的参与人战略组合为止 这个惟一剩下的参与人战略组合 就是这个博弈的均衡解 并称为重复剔除后的战略均衡 重复剔除做的占优战略均衡不仅要求博弈的所有参与人都是理性的 而且要求了解所有的其他参与人是理性的 智猪博弈的均衡是 多劳不多得 少劳不少得 在现实生活中有许多智猪博弈的例子例如 在股份公司中 股东承担着监督管理的职能 但不同的股东从监督中得到的收益大小不同 在监督成本相同的情况下 大股中从监督中得到的收益显然多于小股东 因此 股份公司中监督经理的责任往往由大股东承担 小股东则搭大股东的便车 对公共物品的使用平均主义的产生 三 纳什均衡 纳什均衡是完全信息静态博弈解的一般情况 纳什均衡 在这一均衡中 每个博弈参与人都确信 在给定其他参与人战略决定的情况下 他选择了最优战略以回应对手的战略 在占优战略均衡中 无论所有其他人选择什么战略 一个人的占优战略都是他的最优战略 这一占优战略也必定是其他参与人选择某一特定战略时该参与人的最优战略 因此 占优战略均衡一定是纳什均衡 构成纳什均衡的战略组合一定是在重复剔除严格劣战略过程中无法被剔除的战略组合 重复剔除的占优战略均衡也一定是纳什均衡 例 性别战 恋爱中的男女通常是共度周末而不愿分开活动 但对于周末干什么 男女双方各自有着自己的偏好 男方喜欢看足球 女方喜欢逛商店 不同选择下男女双方的得失见下表 女方看足球逛商店 男方 看足球逛商店 3 10 00 01 3 在这个博弈中 存在着两个纳什均衡 男女双方或者一起看足 或者一起去逛商店 如果没有进一步的信息 则无法确定男女双方在博弈中会作出什么选择 纳什均衡不仅要求博弈的所有参与人都是理性的 而且要求每个参与人都了解所有的其他参与人都是理性的 第三节完全信息动态博弈 一 子博弈精炼纳什均衡在动态博弈中 参与人的行动有先后顺序 而且后行动的参与人在自己行动之前可以观测到先行动者的行动 并选择相应的战略 由于先行动者拥有后行动者可能选择战略的完全信息 因而先行动者在选择自己的战略时 就可以预先考虑自己的选择对后行动者选择的影响 并采取相应的对策 例 房地产开发博弈 静态条件下双方参与人的得失 B开发不开发 3 31 00 10 0 A 开发不开发 在行动开始前的A看来 如果不计得失 B有四种战略可选择 第一 无论A是否开发 B都开发 第二 如果A开发 B也开发 如果A不开发 B也不开发 第三 如果A开发 B就不开发 如果A不开发 B就开发 第四 无论A是否开发 B必定不开发 将B可能采取的选择与上述表中博弈双方相应选择的得失结合起来 可得到A对B的预测 A 开发不开发 开发 开发开发 不开发不开发 开发不开发 不开发 B 3 3 3 31 01 00 10 00 10 0 上述博弈中存在着两个纳什均衡 即A开发 B不开发和A不开发 B开发 战略3包含了两个纳什均衡 上述博弈方法 为子博弈精炼纳什均衡 它是原博弈的一部分 它本身可以作为一个独立的博弈进行分析 任何博弈本身被称为自身的一个子博弈 只有当某一战略组合在每一个子博弈 包括原博弈 上都构成一个纳什均衡 这一战略组合才是子博弈精炼纳什均衡 这一博弈中唯一的子博弈精炼纳什均衡是 开发 不开发 开发 既作为后行动者的B选择战略三 而作为先行动者A选择开发 二 重复博弈 重复博弈 指同样结构的博弈重复多次 其中每次博弈称为阶段博弈 影响重复博弈均衡结果的主要因素 是博弈重复的次数和信息的完备性 重复次数的重要性来自参与人在短期利益和长期利益之间的权衡 就信息的完备性而言 当一个参与人的支付函数还不为其他参与人所知时 该参与人可能有积极性建立一个良好的声誉以换取长远利益 例 产品定价重复博弈 A 低价高价 B 低价高价 24 2440 88 4032 32 而在动态的重复博弈中 所有参与人过去的行为都是观测得到的 因而某一参与人可以通过自己在本阶段博弈中的选择 来回应其他参与人在以前的阶段博弈中的行为 博弈重复的次数对参与人的选择的影响 1 博弈重多次当无限时如果B选择与A合作维持产品高价 则B各所阶所得是 32 32 32 32 如果B选择不与A合作 并在第一阶段通过后选择低价使得选择高价的A受到损失 A则在以后阶段的博弈中选择低价以报复 则B各阶段所得为 40 24 24 24 这里 A所采取的战略称为冷酷战略 如果在一次性完全信息静态博弈中 两个参与人A与B均有占优战略 占优战略均衡为双方都定低价 按照这种战略 A起初选择合作 但如果B在某一阶段博弈中选择不合作的话 A将永远选择不合作 由于B在某一阶段博弈中的不合作排除了双方合作获得双赢的可能 则A有坚持冷酷战略的积极性 这时B为了减少损失 也就只能一直合作下去 2 博弈重复次数有限时博弈重复有限时 这味着在在所有参与人都可以预测到 最后一次 在最后的阶段博弈中 如果某一参与人选择了自己的占优战略 给其他参与人造成损失 则其他参与人不可能报复 所有参与人都明白这一点 因而在最后一次阶段博弈中都会选择占优战略 给自己的产品制定低价 从而构成与完全信息静态相同的占优战略均衡 三 动态博弈战略行动 在动态博弈中 参与人为了使其他参与人的选择对自己有利 往往采取一些行动来影响其他参与人对自己行为的预期 这称为战略行动 1 首先行动优势在博弈中首先作出战略选择并采取相应行动的参与人可以获得较多的利益 如性别战博弈 如果一方参与人首先采取了行动 则均衡就是唯一的 2 确实可信的威胁博弈的参与人通过某种行动改变自己的支付函数 从而使得自己威胁显得可信 参与人为改变博弈结果而采取的措施称为承诺 例上述房地产开发博弈 如果A在作出选择之前 B与客户签订合同 规定B在一定期限内向客户交付一定面积的住房 如果B不能按时履约 则赔偿客户5单位货币 有了这一承诺 B就有了占优战略 开发 B的这一战略 无论A是否开发 他都要开发 就成为确实可信的威胁 因而这一博弈的子博弈精炼纳什均衡 也就从原来的 开发 不开发 开发 变成现在的 不开发 开发 开发 房地产开发博弈 B承诺后 A 开发不开发 开发不开发 3 31 50 10 5 B A对B的预测 B承诺后 A 开发不开发 开发 开发开发 不开发不开发 开发不开发 不开发 3 3 3 31 51 50 10 50 10 5 B 第四节不完全信息静态博弈 在博弈中 每个参与人对所有其他参与人的类型 战略 支付函数 所有参与人的共同知识 都有精确的了解 满足这一假设的博弈称为完全信息博弈 在现实中许多博弈并不满足完全信息的要求 存在着信息的不对称 不满足假设的博弈称为不完全信息博弈 就是说 在不完全信息博弈中 至少有一个参与人不知道其他参与人的支付函数 例 市场进入博弈某一市场原来被A垄断 现在B企业考虑是否进入 B企业知道 A企业是否允许它进入 取决于A企业阻挠B企业进入所花费的成本 如果阻挠成本低那么A企业的占优战略是阻挠 博弈有重复剔除的占优战略均衡 A阻挠 B不进入 如果阻挠的成本高 那么A企业的占优战略是默许B进入 博弈有重复剔除的占优战略均衡 A默许 B进入 但B企业并不知道 A企业的阻拢成本是高还是低 B 进入者 进入不进入 高成本情况低成本情况默许阻挠默许阻挠 40 50 10 030 100 10 1400 3000 3000 4000 400 A 在位者 例 市场进入博弈 在博弈中 B遇到的是不确定性条件下的选择问题 因为B不仅不知道A的类型 是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论