第十章 博弈论.ppt_第1页
第十章 博弈论.ppt_第2页
第十章 博弈论.ppt_第3页
第十章 博弈论.ppt_第4页
第十章 博弈论.ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第十章博弈论 2 10 1博弈和博弈论 博弈和博弈论博弈的要素博弈的种类 3 10 1 1博弈的概念 传统经济学是研究市场完全竞争条件下的人们行为的选择 而且假定信息是充分的 但是 实际生活中人们的行为不是在市场完全竞争的条件下 这时人们行为的结果不仅取决于自己 还取决对手 这是人们的选择称为 策略 或者 战略 strategy 战略的典型形式是 对手采取A行动 则我采取B行动 博弈论 gametheory 研究参加各方之间相互影响 存在利益冲突和依赖的某项活动 为了实现自己的利益目标 需要在考虑其他参与人行动的条件下 应当如何选择和实施一系列行动和战略 4 猜硬币的博弈 5 可口可乐和百事可乐的价格战 6 10 1 2博弈的要素 参与人 playersoractors 行动 actionsormoves 信息 information 关于博弈的各种知识战略 strategies 支付 payoff 结果 outcome 参与人的行动 战略或者收益的各种可能出现的组合 如甲出正面 乙才正面 支付是 输 赢 7 10 1 3博弈的种类 对于博弈 根据博弈的各种要素或者其间的关系 可以有多种分类首先可以划分为合作博弈和非合作博弈 博弈论主要研究非合作博弈 每个参与人只考虑自身利益最大化为目标 非合作博弈的种类 见表经济学家主要研究了四种博弈结构 见表 8 9 四种主要的博弈类型 NE 纳什均衡BNE 贝叶斯纳什均衡SPNE 子博弈精练纳什均衡SPBE 子博弈精练贝叶斯纳什均衡 10 10 1 4博弈论 博弈论 研究理性的经济主体在相互影响的决策中的战略选择博弈论的关键 找出其他参与人选择既定条件下自己的最优反应行为 即最优战略 如果自己的最优战略和其他参与人的最优战略是相容的 则各方都没有激励改变战略 这个战略组合就是均衡战略 博弈论研究的目标就是找出均衡战略 11 10 2纳什均衡 概述案例 囚徒困境博弈的战略表达式最佳战略纳什均衡纳什均衡的解法练习 求解修路博弈纳什均衡的社会含义 12 10 2 1概述 均衡是一种稳定的状态 在此状态下 经济主体都没有单方面改变行为的动机和激励 例如市场竞争的供求均衡就是一种这样的状态在博弈情形下的均衡 就是博弈均衡 由于这种均衡的思想是最早有纳什 Nash 提出的 所以称为纳什均衡本节以完全信息的静态博弈为例 阐述博弈均衡的思想 以及人们的行为选择策略 13 10 2 2囚徒困境 张三和李四合伙抢了珠宝行 却在离现场不远的地方被逮 他们被关进分隔的牢房 检察官分别告诉他们 如果两人都不坦白 他们会因非法携带枪支的罪名各判刑 年 如果其中一人招供而另一人不招 坦白者作为证人将不会被起诉 另一人将会被重判10年 如果两人都招供 则两人都会以抢劫罪名各判8年 问 张三和李四选择坦白还是不坦白 14 10 2 3博弈的战略表达式 博弈的战略表达式 有的教科书称之为 标准表达式 是指用参与人及其战略和支付表达的博弈 包括3个方面 参与人集合 I 1 2 3 n 每个参与人的战略空间Si i 1 2 3 n 每个参与人的支付函数ui ui ui s1 s2 sn 战略表达式一般的表示方式是用一个支付矩阵表格表示 15 囚徒困境的战略表达式 前一个支付为行的支付 后一个支付为列的支付 16 10 2 4最优战略的概念 所谓最优战略 是指给定其他参与人战略的条件下 使自己收益最大的战略 如果其他参与人的战略组合用s i s1 s2 si 1 si 1 sn 表示 s i是最优战略 则有 17 写出囚徒困境的最优战略 囚徒A 给定B坦白 A的最优战略是坦白 给定B抵赖 A的最优战略是坦白 囚徒B 给定A坦白 B的最优战略是坦白 给定A抵赖 B的最优战略是坦白 18 写出猜硬币的最优战略 儿童A 给定B猜正面 A的最优战略是出反面 给定B猜反面 A的最优战略是出正面 儿童B 给定A出正面 B的最优战略是猜正面 给定A出反面 B的最优战略是猜反面 19 10 2 5纳什均衡的概念 如果一个战略组合包括了所有参与人的最优战略 即其他参与人不改变战略 则任何一个参与人都没有激励改变自身战略 该战略组合s s 1 s 2 s n 就是纳什均衡 Nashequilibrium NE 20 准确理解纳什均衡 纳什均衡是一个战略组合均衡的战略组合包含了所有参与者的最优战略 是最优战略的组合 均衡战略组合是每一个参与者最优战略的交集部分 每个参与人肯定存在最优战略 但是如果不存在交集 或者说参与人之间的最优战略是不相容的 就没有均衡的战略组合 21 囚徒困境的纳什均衡 A B最优战略的交集是坦白 所以 坦白 坦白 就是均衡战略 更具体一些说 B坦白则A坦白 A坦白则B坦白 均衡支付是 8 8 虽然 坦白 抵赖 是A的最优战略 但是B并不会选择这个战略 所以这时A B最优战略的交集是空集 同理 虽然 抵赖 坦白 是B的最优战略 但是A并不会选择这个战略 所以这时A B最优战略的交集是空集 22 猜硬币的纳什均衡 由于A的最优战略和B的最优战略没有交集 或者说二者是不相容的 所以猜硬币博弈没有纳什均衡以后我们看到 这种肯定性的战略称为纯战略 猜硬币博弈没有纯战略均衡 但是存在混合战略均衡 即一定的概率采取某种行动 23 优势战略的纳什均衡 如果一个参与人的最优战略不依赖于其他参与人的战略 这个最优战略就是优势战略 如果对于所有的i s i是的优势战略 那么 战略组合 s 1 s 2 s i s n 就是优势战略NE实际上 在囚徒困境中 坦白是两个囚徒的优势战略 因为B坦白和不坦白时 A的优势战略都是坦白 B也是如此 所以 坦白 坦白 就是一个优势战略NE优势战略均衡是纳什均衡的一个特例 24 10 2 6求解NE的方法 划线法箭头法 25 第1步任选A的每一个行动 找出B的最优战略 在B的最优战略的相应支付下划线第2步任选B的每一个行动 找出A的最优战略 并划线第3步如果一个战略组合都被划线 就是NE 划线法求解纳什均衡 26 任选一个战略组合 观察其是否稳定 如果A选择该战略 观察B的战略是否为最优战略 如果不是 找出B的最优战略 并划箭头指向之 如果B稳定 则观察A这是的战略是不是最优战略 如果不是 找出A的最优战略 并划箭头指向之 如果A也是稳定的 则该组合是NE 箭头法求解纳什均衡 27 10 2 6练习 假定张三和李四同住一村 通往公路有一段距离需要修路 修路的成本是4 如果两个人同时修 可以平担成本 张三和李四都存在出钱修路和不出钱修路的选择 考虑以下情况的博弈均衡战略 张三和李四的收益都是3 张三和李四的收益都是5 张三的收益是5 李四的收益是3求解三种情形下的NE 说明参与人的战略 28 修路的囚徒困境 29 修路的斗鸡博弈 30 修路的智猪博弈 31 10 2 7NE的社会意义 NE的结局存在改进的空间 不是帕累托最优的个人理性不能保证集体理性存在个人投机的动机 导致行为和结果的不确定性 市场机制不是有效率的 政府的干预存在可能性 32 10 3混合战略均衡 混合战略猜硬币的混合战略混合战略均衡 33 10 3 1混合战略 定义 对于博弈G I S u 假定i有K个纯战略 战略空间为Si si1 si2 siK 则pi pi1 pi2 piK 是i的一个混合战略 这里pik是选择sik的概率 k 1 2 K 且 34 儿童 出硬币 儿童 猜硬币的正反面 猜中为赢 该博弈没有纯战略 A的混合战略是 pA 1 pA B的混合战略是 pB 1 pB A的期望支付 vA pA pB 1 pB 1 pA pB 1 pB 2pA 2pB 4pApB 1 B的期望支付 vB 4pApB 2pA 2pB 1 两小猜枚 35 10 3 2混合战略纳什均衡 对于两小猜枚博弈 要使A的期望支付最大化 则需要满足 这个解的意思是说 假定A有一个最优的混合战略 这个战略就是 如果B猜正面的概率小于0 5 A就出正面 若大于0 5 则出反面 36 同理 要使B的期望支付最大化 则需要满足pA 0 5 这个解的意思是 假定B有一个最优的混合战略 这个战略就是 如果A出正面的概率大于0 5 B就猜正面 若小于0 5 则猜反面 pB pA pB pA 0 0 5 1 如果A B都知道对方的意图 就只能选择pA 0 5 pB 0 5 37 斗鸡博弈 chicken 这个博弈有纯战略NE吗 38 10 3 3斗鸡博弈的混合战略均衡 这个博弈有纯战略NE吗 39 支付均等化方法求解混合战略 斗鸡博弈的一个特点是它是一个对称博弈 其最优战略一定应当是相同的 所以其概率可以使用同一个符号表示求解最优战略的方法是 采取最优混合战略时 两个纯战略的期望支付必然是相等的 对于琼斯来说 同理 对于史密斯 得到 40 斗鸡博弈的一般化 假定都坚持的支付为x 则可以解得混合战略为 1 1 x 显然 x 3时 0 25 如果x 9时 0 1 x 99时 0 01所以 混合战略均衡的解释比纯战略均衡更加合理 41 10 3 4混合战略的特点 如果存在优势战略NE 就不存在混合战略 因为这时混合战略不如优势战略 不符合理性人假设 这时可能求解去混合战略的概率大于1或者小于0混合战略的概率大小取决于支付数值的大小 而不仅仅是数值的排序 而纯战略NE只与数值的顺序有关参与人混合战略的概率取决于另一参与人的支付 42 10 4完全信息动态博弈 基本涵义举例完全信息动态博弈的表达式完全信息动态博弈的均衡 43 10 4 1概念 完全信息动态博弈 参与人的信息是充分的 任何可能发生的事件都是确定的 不过参与人采取行动有先后顺序 而且 后行动者可以观察到先行动者的行动 44 10 4 2市场进入博弈 有一个行业 原来有一个企业 称为在位者 可以有年利润300万 现在有一个强势的新企业 称为进入者 想投资进入瓜分利润 如果在位者默许 则进入者获得50万利润 在位者利润降为40万 如果在位者采取降低价格的斗争策略 则自己要亏损10万 而进入者的利润为0 假定进入者先采取行动 在位者如何制定自己的战略 进入者是否进入 45 静态博弈的情形 46 10 4 3动态博弈的扩展表达式 先动者 后动者 支付 支付 行动A 行动2 行动B 行动1 支付的顺序为 先动者 后动者 支付 支付 后动者 支付 支付 行动A 行动B 支付 支付 决策结 枝 47 进入者 在位者 0 300 50 40 0 10 默许 不进入 斗争 进入 支付的顺序为 进入者 在位者 市场进入博弈的扩展表达式 48 10 4 4子博弈与子博弈精练纳什均衡 子博弈 是能够自成一个博弈的某个动态博弈的一个阶段 具有一个初始信息集 具备进行博弈的各种信息如果动态博弈中的参与人的战略在原博弈和所有的子博弈中都构成纳什均衡 则该战略组合是子博弈精练纳什均衡 49 动态博弈均衡的逆推归纳法 逆推归纳法 就是从动态博弈的最后一个子博弈 动态博弈的最后一个阶段 开始 逐步向前推导出动态博弈均衡的方法 逆推归纳法的依据是假定先行为的参与人总是在考虑后采取行动的参与者在后一个阶段的选择而选择自己的行动的 例如 进入者是否进入 要考虑如果自己进入 在位者的最优选择应该是什么 这样才能对是否进入做出选择 没有后采取行动的参与者的相应行动 先行动的参与者就没有依据 不符合纳什均衡的原则 50 进入者 在位者 0 300 50 40 0 10 默许 不进入 斗争 进入 如果进入者进入 在位者将采取默许的行动 这是在位者的子博弈均衡 在 进入 默许 的战略组合之下 支付组合结果是 50 40 进入者在考虑在位者的行动后 比较进入和不进入的收益 50和0 将选择进入的行动 所以 进入者进入 在位者默许 是动态博弈纳什均衡 支付的顺序为 进入者 在位者 51 威胁的可信性 威胁的不可信性 在位者阻止的行动是不可信的 因为如果进入者进入 在位者阻止的收益小于默许的收益 如果在位者斗争的成本不高 例如在进入者进入时采取斗争战略 支付为 0 80 子博弈均衡就是 进入 斗争 进入者意识到这一点 只好选择不进入的战略 均衡的战略是 不进入 斗争 结果是 0 300 或者说 在位者默许的成本如果非常高 在进入者进入时默许的支付是 50 30 那么在位者唯一的选择就是斗争 进入 斗争 是子博弈均衡 进入者认识到这一点 只有不进入 结果均衡的战略是 不进入 斗争 均衡结果是 0 300 在博弈论中 将在位者斗争的低成本或者默许的高成本称为 威胁的可信性 如果威胁是可信的 进入者将不进入 52 10 4 5承诺的可信性 甲准备开采一个价值4万元的金矿 缺1万元的资金 而乙正好有1万元资金可以用于投资 甲希望乙借钱给他 并许诺与他对半分成 但是甲借钱开矿获得利润后有两个战略选择 一个是如约向乙支付2万元 另一个战略是赖帐 自己独吞4万元收益 包括向乙借的钱 问 乙是否应当借钱给甲 均衡战略是什么 53 1 0 乙 甲 2 2 0 4 分 不借 不分 借 甲在借到钱的条件下 优势策略是不分 子博弈均衡结果是 0 乙意识到此 不借是优势策略 战略均衡是 乙不借 甲不分 博弈均衡结果是 潜在的交易没有达成 支付的顺序为 乙 甲 承诺的不可信性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论