范里安微观经济学寡头垄断Oligopoly.ppt_第1页
范里安微观经济学寡头垄断Oligopoly.ppt_第2页
范里安微观经济学寡头垄断Oligopoly.ppt_第3页
范里安微观经济学寡头垄断Oligopoly.ppt_第4页
范里安微观经济学寡头垄断Oligopoly.ppt_第5页
已阅读5页,还剩204页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二十七章 寡头垄断 寡头垄断 垄断市场只有一个厂商 双寡头市场仅有两个厂商 寡头市场有几个厂商构成 特别的是 每个厂商的价格和生产量决策影响到它竞争者的利润 寡头垄断 我们分析供给为寡头垄断的市场 考虑生产同质产品的双寡头情况 数量竞争 假设厂商通过选择产量来竞争 假如厂商1生产y1单位产品 厂商2生产y2单位产品 那么市场的总供给量为y1 y2 市场价格为p y1 y2 厂商的总成本函数为 c1 y1 和c2 y2 数量竞争 假设厂商1将厂商2的产量视为给定 那么厂商1的利润函数为 给定y2 产量y1为多少时可最大化厂商1的利润 数量竞争 一个例子 假设市场的反需求函数为 厂商的总成本函数为 和 数量竞争 一个例子 对于给定的y2 厂商1的利润函数为 数量竞争 一个例子 对于给定的y2 厂商1的利润函数为 对于给定的y2 厂商1的利润最大化产量可通过解下式获得 数量竞争 一个例子 对于给定的y2 厂商1的利润函数为 对于给定的y2 厂商1的利润最大化产量可通过解下式获得 例如 厂商1的反应函数为 数量竞争 一个例子 y2 y1 60 15 厂商1的反应曲线 数量竞争 一个例子 类似地 给定y1 厂商2的利润函数为 数量竞争 一个例子 类似地 给定y1 厂商2的利润函数为 因此给定y1 厂商2的利润最大化产量可通过解下式获得 数量竞争 一个例子 类似地 给定y1 厂商2的利润函数为 因此给定y1 厂商2的利润最大化产量可通过解下式获得 例如 厂商2的反应函数为 数量竞争 一个例子e y2 y1 厂商2的反应曲线 45 4 45 数量竞争 一个例子 但每个厂商的产量为其它厂商的反应函数产量时市场达到均衡 因为此时双方都不想改变产量 一对产出水平 y1 y2 为古诺 纳什均衡假如 和 数量竞争 一个例子 和 数量竞争 一个例子 和 将y2 代入可得 数量竞争 一个例子 和 将y2 代入可得 数量竞争 一个例子 和 将y2 代入可得 因此 数量竞争 一个例子 和 将y2 代入可得 因此 因此古诺 纳什均衡为 数量竞争 一个例子 y2 y1 厂商2的反应曲线 60 15 厂商1的反应曲线 45 4 45 数量竞争 一个例子 y2 y1 厂商2的反应曲线 48 60 厂商1的反应曲线 8 13 古诺 纳什均衡 数量竞争 一般来说 给定厂商2选择的产出水平y2 厂商1的利润函数为 利润最大化的y1产量可通过解 解得y1 R1 y2 为厂商1对于y2的古诺 纳什反应 数量竞争 类似地 给定厂商1选择的产出水平y1 厂商2的利润函数为 利润最大化的y2值可通过解 解得y2 R2 y1 为厂商2对y1的古诺 纳什反应 数量竞争 y2 y1 厂商2的反应曲线 厂商1的反应曲线 古诺 纳什均衡y1 R1 y2 和y2 R2 y1 等利润曲线 对于厂商1 一条等利润曲线包含了所有能产生利润P1的产出对 y1 y2 等利润线是什么样子 y2 y1 厂商1的等利润曲线 y1固定 厂商1的利润随着y2上升而下降 y2 y1 厂商1的利润上升 厂商1的等利润曲线 y2 y1 厂商1的等利润曲线 Q 厂商2的产量为y2 y2 时 厂商1最大化利润产出水平为多少 y2 y2 y1 厂商1的等利润曲线 Q 厂商2的产量为y2 y2 时 厂商1最大化利润产出水平为多少 A 达到厂商1最高等利润线那一点为其利润最大化点 y2 y1 y2 y1 厂商1的等利润曲线 Q 厂商2的产量为y2 y2 时 厂商1最大化利润产出水平为多少 A 达到厂商1最高等利润线那一点为其利润最大化点 y1 为厂商1对厂商2产量y2 y2 的最佳反应生产量 y2 y1 y2 y1 厂商1的等利润曲线 Q 厂商2的产量为y2 y2 时 厂商1最大化利润产出水平为多少 A 达到厂商1最高等利润线那一点为其利润最大化点 y1 为厂商1对厂商2产量y2 y2 的最佳反应生产量 y2 R1 y2 y2 y1 y2 R1 y2 y2 R1 y2 厂商1的等利润曲线 y2 y1 y2 y2 R1 y2 R1 y2 厂商1的反应函数通过厂商1等利润线的最高点 厂商1的等利润曲线 y2 y1 厂商2的等利润线 厂商2的利润上升 y2 y1 厂商2的等利润线 厂商2的反应函数通过其等利润线的最高点 y2 R2 y1 串谋 Q 古诺 纳什均衡所获利润是否为两厂商所能获利润的最大值 串谋 y2 y1 y1 y2 是否还有其它产出对 y1 y2 能使两个厂商获得更多的利润 y1 y2 为古诺 纳什均衡点 串谋 y2 y1 y1 y2 是否还有其它产出对 y1 y2 能使两个厂商获得更多的利润 y1 y2 为古诺 纳什均衡点 串谋 y2 y1 y1 y2 是否还有其它产出对 y1 y2 能使两个厂商获得更多的利润 y1 y2 为古诺 纳什均衡点 串谋 y2 y1 y1 y2 y1 y2 为古诺 纳什均衡点 更高的P2 更高的P1 串谋 y2 y1 y1 y2 更高的P2 更高的P1 y2 y1 串谋 y2 y1 y1 y2 y2 y1 更高的P2 更高的P1 串谋 y2 y1 y1 y2 y2 y1 更高的P2 更高的P1 y1 y2 比 y1 y2 使得两厂商能获得更多的利润 串谋 因此两个厂商存在通过合作降低产量而获得更多利润的动机 我们称为串谋 串谋的厂商称为卡特尔 假如厂商构成一个卡特尔 它们会如何行动 串谋 假设两厂商想最大化其利润并平分所得利润 它们的目标就是通过合作选择产量y1和y2使得下式最大化 串谋 厂商不可能通过串谋而受损 因为它们可以合作选择古诺 纳什产量且获得古诺 纳什均衡利润 因此串谋所得利润至少要比古诺 纳什均衡一样大 串谋 y2 y1 y1 y2 y2 y1 更高的P2 更高的P1 y1 y2 比 y1 y2 能使两厂商获得高的利润 串谋 y2 y1 y1 y2 y2 y1 更高的P2 更高的P1 y1 y2 比 y1 y2 能使两厂商获得高的利润 y1 y2 能使两厂商获得高多利润 y2 y1 串谋 y2 y1 y1 y2 y1 y2 使得厂商1的利润最大化 但使厂商2的利润保留在古诺 纳什均衡水平 串谋 y2 y1 y1 y2 y1 y2 使得厂商1的利润最大化 但使厂商2的利润保留在古诺 纳什均衡水平 y1 y2 使得厂商2的利润最大化 但使厂商1的利润保持在古诺 纳什均衡水平 串谋 y2 y1 y1 y2 蓝色线即为最大化厂商1的利润但同时使得厂商2的利润至少保持在古诺 纳什均衡利润的产出对路径 串谋 y2 y1 y1 y2 蓝色线即为最大化厂商1的利润但同时使得厂商2的利润至少保持在古诺 纳什均衡利润的产出对路径 线中必有一点能最大化卡特尔的联合利润 串谋 y2 y1 y1 y2 y1m y2m 表示最大化卡特尔总利润的产量 串谋 这样的卡特尔是否稳定 厂商是否有欺骗其它厂商的动机 例如 假如厂商1保持y1m的产量 最大化利润的厂商2是否会保持y2m的产量 串谋 厂商2对厂商1产量y1 y1m的利润最大化反应函数为y2 R2 y1m 串谋 y2 y1 y2 R2 y1m 为对厂商1产量y1 y1m的最佳反应产量 R2 y1m y1 R1 y2 厂商1的反应函数 y2 R2 y1 厂商2的反应曲线 串谋 厂商2对厂商1产量y1 y1m的利润最大化反应产量为 y2 R2 y1m y2m 厂商2通过欺骗厂商1将产量从y2m提高至R2 y1m 可以使其利润上升 串谋 类似地 厂商1可以通过欺骗厂商2将产量从y1m提升至R1 y2m 来增加利润 串谋 y2 y1 y2 R2 y1m 为厂商2对厂商1产量y1 y1m反应的最佳产量 R1 y2m y1 R1 y2 厂商1的反应曲线 y2 R2 y1 厂商2的反应曲线 串谋 因此通过合作来确定其产量水平以获取利润的卡特尔组织是不稳定的 例如 OPEC组织内部成员的毁约 串谋 因此通过合作来确定其产量水平以获取利润的卡特尔组织是不稳定的 例如 OPEC组织内部成员的毁约 但是假如这种博弈持续很多次而不是一次 那么卡特尔是不是稳定的 因为这样会对欺骗者有一个惩罚机制 串谋与惩罚策略 为了了解这样的卡特尔是否稳定 我们需要知道3个条件 i 每家厂商每期在卡特尔组织中的利润 ii 假如厂商在第一期中欺骗其它厂商 那么它能获得的利润为多少 iii 厂商在第一期欺骗其它厂商后 它在今后每期所能获得利润为多少 串谋与惩罚策略 假设两厂商的市场反需求函数为 p yT 24 yT总成本函数为 c1 y1 y21和c2 y2 y22 串谋与惩罚策略 i 卡特尔组织中的每家厂商每期利润维多 p yT 24 yT c1 y1 y21 c2 y2 y22 假如厂商串谋 那么它们的总利润为 M y1 y2 24 y1 y2 y1 y2 y21 y22 产出y1和y2为多少时能最大化卡特尔的利润 串谋与惩罚策略 M y1 y2 24 y1 y2 y1 y2 y21 y22 产出y1和y2为多少时能最大化卡特尔的利润 解如下式子 串谋与惩罚策略 M y1 y2 24 y1 y2 y1 y2 y21 y22 产出y1和y2为多少时能最大化卡特尔的利润 解如下式子 解为yM1 yM2 4 串谋与惩罚策略 M y1 y2 24 y1 y2 y1 y2 y21 y22 yM1 yM2 4最大化卡特尔的利润 最大化利润为 M 24 8 8 16 16 112 假设厂商平分利润 每家厂商每期获得 112 2 56的利润 串谋与惩罚策略 iii 厂商在第一期欺骗其它厂商后 它在今后每期所能获得利润为多少 这要取决于对欺骗厂商所实施的惩罚 串谋与惩罚策略 iii 厂商在第一期欺骗其它厂商后 它在今后每期所能获得利润为多少 这要取决于对欺骗厂商所实施的惩罚 假如另一厂商以后都不与欺骗厂商合作来惩罚它厂商在不合作情况下的古诺 纳什均衡利润为多少 串谋与惩罚策略 厂商在不合作情况下的古诺 纳什均衡利润为多少 p yT 24 yT c1 y1 y21 c2 y2 y22 给定y2 厂商1的利润函数为 1 y1 y2 24 y1 y2 y1 y21 串谋与惩罚策略 厂商在不合作情况下的古诺 纳什均衡利润为多少 p yT 24 yT c1 y1 y21 c2 y2 y22 给定y2 厂商1的利润函数为 1 y1 y2 24 y1 y2 y1 y21 厂商1对于厂商2的产量y2的最佳反应产量通过下式解得 串谋与惩罚策略 厂商在不合作情况下的古诺 纳什均衡利润为多少 1 y1 y2 24 y1 y2 y1 y21 类似地 串谋与惩罚策略 厂商在不合作情况下的古诺 纳什均衡利润为多少 1 y1 y2 24 y1 y2 y1 y21 类似地 古诺 纳什均衡时的产量 y 1 y 2 为 y1 R1 y2 和y2 R2 y1 y 1 y 2 4 8 串谋与惩罚策略 厂商在不合作情况下的古诺 纳什均衡利润为多少 1 y1 y2 24 y1 y2 y1 y21 y 1 y 2 4 8 每家厂商在古诺 纳什均衡时每期的利润为 1 2 14 4 4 8 4 82 46 串谋与惩罚策略 ii 假如厂商在第一期中欺骗其它厂商 那么它能获得的利润为多少 在给定厂商2合作的产量为yM2 4的前提下 厂商1欺骗厂商2而选择选择其利润最大化产量yCH1 其值为多少 串谋与惩罚策略 ii 假如厂商在第一期中欺骗其它厂商 那么它能获得的利润为多少 在给定厂商2合作的产量为yM2 4的前提下 厂商1欺骗厂商2而选择选择其利润最大化产量yCH1 其值为多少 yCH1 R1 yM2 24 yM2 4 24 4 4 5 厂商1在欺骗厂商2的当期所获利润为 CH1 24 5 1 5 52 65 串谋与惩罚策略 为了了解这样的卡特尔是否稳定 我们需要知道3个条件 i 每家厂商每期在卡特尔组织中的利润 56 ii 假如厂商在第一期中欺骗其它厂商 那么它能获得的利润为多少 65 iii 厂商在第一期欺骗其它厂商后 它在今后每期所能获得利润为多少 46 串谋与惩罚策略 每家厂商的折现因子为 1 1 r 厂商1不欺骗时所获利润的现值为多少 串谋与惩罚策略 每家厂商的折现因子为 1 1 r 厂商1不欺骗时所获利润的现值为 串谋与惩罚策略 每家厂商的折现因子为 1 1 r 厂商1不欺骗时所获利润的现值为 厂商1当期欺骗时所获总利润的现值为多少 串谋与惩罚策略 每家厂商的折现因子为 1 1 r 厂商1不欺骗时所获利润的现值为 厂商1当期欺骗时所获总利润的现值为 串谋与惩罚策略 因此卡特尔是稳定的 假如 行动的次序 到目前为止我们都假定两个厂商同时选择其产量水平 厂商之间的竞争为同步博弈 而产量则为决策变量 行动的次序 假如厂商1先选择产量水平 然后厂商最其行为做出反应 结果如何 厂商1为领导者 厂商2为追随者 竞争变为序贯博弈 而产出水平为决策变量 行动的次序 这样的博弈称为斯塔克尔伯格博弈 做领导者更好 还是做追随者更好 斯塔克尔伯格博弈 Q 对于领导厂商1的产出水平y1 厂商2的最佳反应产量为多少 斯塔克尔伯格博弈 Q 对于领导厂商1的产出水平y1 厂商2的最佳反应产量为多少 A 选择y2 R2 y1 斯塔克尔伯格博弈 Q 对于领导厂商1的产出水平y1 厂商2的最佳反应产量为多少 A 选择y2 R2 y1 厂商1知道厂商2会根据自己的产量作出决策 并且能完好地预期厂商2对其自身产量y1的反应 斯塔克尔伯格博弈 市场领导者的利润函数 斯塔克尔伯格博弈 市场领导者的利润函数 市场领导者选择产量y1来最大化其利润 斯塔克尔伯格博弈 市场领导者的利润函数 市场领导者选择产量y1来最大化其利润 Q 市场领导者是否会获得至少比古诺 纳什均衡利润一样多的利润 斯塔克尔伯格博弈 A 是的 市场领导者会选择古诺 纳什均衡的产出水平 因为追随者也会选择古诺 纳什均衡水平 此时领导者的利润即为古诺 纳什均衡利润 但是领导者不必要这么做 因此它的利润至少有古诺 纳什均衡那么多 斯塔克尔伯格博弈 一个例子 市场的反需求函数为 p 60 yT 厂商的成本函数为 c1 y1 y12和c2 y2 15y2 y22 厂商2为追随者 其反应函数为 斯塔克尔伯格博弈 一个例子 领导者的利润函数为 斯塔克尔伯格博弈 一个例子 领导者的利润函数为 对于利润最大化的厂商1有 斯塔克尔伯格博弈 一个例子 Q 厂商2对于领导者的产出的产出反应为多少 斯塔克尔伯格博弈 一个例子 Q 厂商2对于领导者的产出的产出反应为多少 A 斯塔克尔伯格博弈 一个例子 Q 厂商2对于领导者的产出的产出反应为多少 A 均衡产出水平为 y1 y2 13 8 因此领导者的产量比古诺纳什均衡产量高 而追随者产量比古诺 纳什均衡产量低 斯塔克尔伯格博弈 y2 y1 y1 y2 y1 y2 为古诺纳什均衡产量 更高的P2 更高的P1 斯塔克尔伯格博弈 y2 y1 y1 y2 y1 y2 为古诺纳什均衡产量 更高的P1 追随者的反应函数 斯塔克尔伯格博弈 y2 y1 y1 y2 y1 y2 为古诺纳什均衡产量 y1S y2S 为斯塔克伯格均衡产量 更高的P1 y1S 追随者的反应函数 y2S 斯塔克尔伯格博弈 y2 y1 y1 y2 y1 y2 为古诺纳什均衡产量 y1S y2S 为斯塔克伯格均衡产量 y1S 追随者的反应曲线 y2S 价格竞争 假如厂商仅用价格竞争而不是产量竞争策略 情况如何 厂商仅用价格竞争策略并同时做出决策的博弈称为伯特兰博弈 伯特兰博弈 每家厂商的边际产品成本为常数c 所有厂商同时决定它们的价格 Q 是否存在纳什均衡 伯特兰博弈 每家厂商的边际产品成本为常数c 所有厂商同时决定它们的价格 Q 是否存在纳什均衡 A 存在 且恰好存在一个纳什均衡 伯特兰博弈 每家厂商的边际产品成本为常数c 所有厂商同时决定它们的价格 Q 是否存在纳什均衡 A 存在 且恰好存在一个纳什均衡 所有的厂商都将价格设在边际成本c的水平 为什么 伯特兰博弈 假设有一家厂商设定的价格高于其它厂商的价格 伯特兰博弈 假设有一家厂商设定的价格高于其它厂商的价格 那么价格高的厂商将不会有购买者 伯特兰博弈 假设有一家厂商设定的价格高于其它厂商的价格 那么价格高的厂商将不会有购买者 因此 均衡时 所有的厂商都必须设定相同的价格 伯特兰博弈 假设共同的价格高于边际成本才c 伯特兰博弈 假设共同的价格高于边际成本c 那么一家厂商就可以将价格设得稍微低一点 然后卖给所有消费者 那么它的利润就会上升 伯特兰博弈 假设共同的价格高于边际成本才c 那么一家厂商就可以将价格设得稍微低一点 然后卖给所有消费者 那么它的利润就会上升 唯一的防止降价的价格为边际成本c 因此 这是唯一的纳什均衡情况 序贯价格博弈 假如所有的厂商不是同时做出价格决策 而是其中的一家厂商在其它厂商之前确定价格 这种关于价格策略的序贯博弈称为价格领导模型 在其它厂商之前设定价格的厂商称为价格领导者 序贯价格博弈 假设一个比较大的厂商 领导者 和许多竞争性的小厂商 追随者 小厂商为价格接受者 它们对于市场价格p的集中供给反应为其总供给函数Yf p 序贯价格博弈 市场的需求函数为 D p 领导者知道假如它设定一个价格p 它面对的需求为市场的剩余需求 因此领导者的利润函数为 序贯价格博弈 领导者的利润函数为 因此领导者会选择价格水平p 来最大化其利润 追随者集中供给Yf p 单位产出而领导者供给剩余需求量D p Yf p 第二十八章 博弈论 博弈论 博弈论能够帮助我们来对市场中主体的行为受到其他主体行为的影响的策略行为进行建模 博弈论的一些应用 寡头垄断的研究 行业中仅包含几个厂商 卡特尔的研究 例如OPEC外部性的研究 例如对于公共资源的使用比如捕鱼 对于军事策略的研究 讨价还价 市场的运行机制 博弈是什么 一个博弈包含 一些参与者每个参与者的策略每个参与者选择不同决策行为的收益矩阵 两人博弈 一个仅包含两个参与者的博弈称为两人博弈 我们研究的博弈仅包含两个参与者 每个参与者可以选择两种不同的行为策略 两人博弈的一个例子 参与者A和B A可以采取两种行为 上 和 下 B可以采取两种行为 左 和 右 包含了四种可能决策组合支付的表格称为博弈的收益矩阵 两人博弈的一个例子 这是博弈的收益矩阵 参与者B 参与者A 左边显示A的收益右边显示B的收益 两人博弈的一个例子 博弈的一组策略为一对决策组合如 U R 其中第一个元素为参与者A的策略 第二个元素为参与者B的策略 参与者B 参与者A 两人博弈的一个例子 例如 假如A采取上而B采取右的策略 那么A的收益为1 B的收益为8 博弈收益矩阵 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 两人博弈的一个例子 假如A采取下的策略而B采取右的策略 那么A的收益为2 B的收益为1 博弈的收益矩阵 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 两人博弈的一个例子 我们可能看到哪种策略组合结果 参与者B 参与者A 两人博弈的一个例子 U R 是否为一个有可能的策略组合结果 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 两人博弈的一个例子 假如B采取右的策略那么A的最优策略为下 因为它能使得A的收益从1变为2 因此 U R 不是一个有可能出现的策略组合结果 L R U D 3 9 0 0 1 8 2 1 U R 是否为一个有可能的策略组合结果 参与者B 参与者A 两人博弈的一个例子 L R U D 3 9 0 0 1 8 2 1 U R 是否为一个有可能的策略组合结果 参与者B 参与者A 两人博弈的一个例子 假如B采取右的策略 A的最佳策略为下 L R U D 3 9 0 0 1 8 2 1 D R 是否为一个有可能的策略组合结果 参与者B 参与者A 两人博弈的一个例子 假如B采取右的策略 A的最佳策略为下 假如A采取下的策略 B的最佳策略为右 因此 D R 是一个可能出现的策略组合结果 L R U D 3 9 0 0 1 8 2 1 D R 是否为一个有可能的策略组合结果 参与者B 参与者A 两人博弈的一个例子 L R U D 3 9 0 0 1 8 2 1 D L 是否为一个有可能的策略组合结果 参与者B 参与者A 两人博弈的一个例子 假如A采取下的策略 B的最佳策略为右 因此 D L 不是一个可能出现的策略组合结果 L R U D 3 9 0 0 1 8 2 1 D L 是否为一个有可能的策略组合结果 参与者B 参与者A 两人博弈的一个例子 L R U D 3 9 0 0 1 8 2 1 U L 是否为一个有可能的策略组合结果 参与者B 参与者A 两人博弈的一个例子 假如A采取上的策略 B的最佳策略为左 L R U D 3 9 0 0 1 8 2 1 U L 是否为一个有可能的策略组合结果 参与者B 参与者A 两人博弈的一个例子 假如A采取上的策略 B的最佳策略为左 假如B采取左的策略 A的最佳策略为上 因此 U L 为一个可能出现的策略组合结果 L R U D 3 9 0 0 1 8 2 1 U L 是否为一个有可能的策略组合结果 参与者B 参与者A 纳什均衡 博弈论中的策略组合中 每个参与者的决策都是对其它参与者决策的最佳反应决策时所达到的均衡称为纳什均衡 我们的例子中有两个纳什均衡 U L 和 D R 两人博弈的例子 U L 和 D R 为此博弈的纳什均衡 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 两人博弈的例子 U L 和 D R 为此博弈的纳什均衡 但是我们发现 对两个参与者来说 U L 比 D R 更受偏好 我们是否一定仅会看到 U L 的博弈均衡结果 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 囚徒困境 为了了解帕累托偏好结果是否一定就是一个博弈的结果 考虑一个很有名的囚徒困境博弈问题 囚徒困境 这个博弈的可能结果是什么样子 克莱德 邦妮 5 5 30 1 1 30 10 10 S C S C 囚徒困境 假如邦妮选择沉默 克莱德的最佳策略为供认 5 5 30 1 1 30 10 10 S C S C 克莱德 邦妮 囚徒困境 假如邦妮选择沉默 克莱德的最佳策略为供认 假如邦妮选择供认 克莱德的最优策略为供认 5 5 30 1 1 30 10 10 S C S C 克莱德 邦妮 囚徒困境 因此不论邦妮选择什么策略 克莱德的最优策略总是供认 供认对于克莱德来说是一个占优策略 5 5 30 1 1 30 10 10 S C S C 克莱德 邦妮 囚徒困境 同样地 不论克莱德选择什么策略 邦妮的最佳策略为供认 供认对于邦妮来说也是占优策略 5 5 30 1 1 30 10 10 S C S C 克莱德 邦妮 囚徒困境 唯一的纳什均衡为 C C 尽管 S S 能使得邦妮和克莱德的处罚更轻 这个唯一的纳什均衡是无效率的 5 5 30 1 1 30 10 10 S C S C 克莱德 邦妮 决策时机 在上面来两个例子中 参与者同时做出他们的决策 这样的博弈称为同步博弈 决策时机 在上面来两个例子中 参与者同时做出他们的决策 这样的博弈称为同步博弈 首先行动的参与者称为领导者 后行动的参与者称为追随者 序贯博弈的例子 有时一个博弈可能含有几个纳什均衡 很难确定哪一种均衡结果更有可能发生 当一个博弈为一个序贯博弈时 那么就有可能其中的一个纳什均衡比其它均衡更有可能发生 序贯博弈的例子 参与者B 参与者A U L 和 D R 都为同时决策时的纳什均衡 我们无法判断哪种均衡更有可能发生 L R U D 3 9 0 0 1 8 2 1 序贯博弈的例子 假设这个博弈为序贯博弈 A为领导者而B为追随者 我们可以把这个博弈的拓展形式写出来 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 序贯博弈的例子 A先行动B后行动 序贯博弈的例子 U L 为一个纳什均衡 U D L L R R 3 9 1 8 0 0 2 1 A B B A先行动B后行动 序贯博弈的例子 U D L L R R 3 9 1 8 0 0 2 1 A B B A先行动B后行动 U L 为一个纳什均衡 D R 也是一个纳什均衡 这两个均衡哪个更有可能发生 序贯博弈的例子 假如A先选择决策U B后选择策略L A所得收益为3 U D L L R R 3 9 1 8 0 0 2 1 A B B A先行动B后行动 序贯博弈的例子 假如A先选择决策U B后选择策略L A所得收益为3 假如A先选择策略D B后选择策略R A所得收益为2 U D L L R R 3 9 1 8 0 0 2 1 A B B A先行动B后行动 序贯博弈的例子 假如A先选择决策U B后选择策略L A所得收益为3 假如A先选择策略D B后选择策略R A所得收益为2 U D L L R R 3 9 1 8 0 0 2 1 A B B A先行动B后行动 因此 U L 很可能为均衡结果 序贯博弈的例子 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 在考虑我们之前的例子 假设博弈是同步的 我们发现这个博弈有两个纳什均衡 U L 和 D R 序贯博弈的例子 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 参与者A已经被考虑了上或者下的决策 但没有把这两种策略联合起来考虑 例如 仅做出单纯的上或下决策 上和下为参与者A的纯策略 序贯博弈的例子 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 类似地 左和右为参与者B的纯策略 序贯博弈的例子 L R U D 3 9 0 0 1 8 2 1 参与者B 参与者A 因此 U L 和 D R 为纯策略纳什均衡 是否每一个博弈都至少有一个纯策略纳什均衡 纯策略 参与者B 参与者A 这是一个新的博弈 是否存在纯策略的纳什均衡 1 2 0 4 0 5 3 2 U D L R 纯策略 参与者B 参与者A U L 是否为一个纳什均衡 1 2 0 4 0 5 3 2 U D L R 纯策略 参与者B 参与者A U L 是否为一个纳什均衡 不是 U R 是否为一个纳什均衡 1 2 0 4 0 5 3 2 U D L R 纯策略 参与者B 参与者A U L 是否为一个纳什均衡 不是 U R 是否为一个纳什均衡 不是 D L 是否为一个纳什均衡 1 2 0 4 0 5 3 2 U D L R 纯策略 参与者B 参与者A U L 是否为一个纳什均衡 不是 U R 是否为一个纳什均衡 不是 D L 是否为一个纳什均衡 不是 D R 是否为一个纳什均衡 1 2 0 4 0 5 3 2 U D L R 纯策略 参与者B 参与者A U L 是否为一个纳什均衡 不是 U R 是否为一个纳什均衡 不是 D L 是否为一个纳什均衡 不是 D R 是否为一个纳什均衡 不是 1 2 0 4 0 5 3 2 U D L R 纯策略 参与者B 参与者A 因此但采取纯策略时 该博弈没有纳什均衡 但是这个博弈在采取混合策略时有一个纳什均衡 1 2 0 4 0 5 3 2 U D L R 混合策略 参与者A选择一个概率分布 pU 1 pU 表示参与者A有pU的概率选择策略上 有1 pU的概率选择策略下 而不是单纯的选择上或者下的策略 参与者A混合了上和下的纯策略 概率分布 pU 1 pU 为参与者A的混合策略 混合策略 类似地 参与者B选择概率分布 pL 1 pL 表示有pL的概率他会选择左 有1 pL的概率他会选择右 参与者B混合了左和右的纯策略 概率分布 pL 1 pL 为参与者B的混合策略 混合策略 参与者B 参与者A 这个博弈没有纯策略纳什均衡 当有混合策略纳什均衡 混合纳什均衡结果是如何计算的 1 2 0 4 0 5 3 2 U D L R 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L L R 1 L 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L L R 1 L A选择上策略时的预期收益为多少 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L L R 1 L A选择上策略的预期收益为 L A选择下策略的预期收益为多少 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L L R 1 L A选择上策略的预期收益为 L A选择下策略的预期收益为3 1 L A选择上策略的预期收益为 L A选择下策略的预期收益为3 1 L 假如 L 3 1 L 那么A仅选择上的策略 但是当A采用上的纯策略时没有纳什均衡 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L L R 1 L 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L L R 1 L A选择上策略的预期收益为 L A选择下策略的预期收益为3 1 L 假如 L 3 1 L 那么A仅选择下策略 但是当A采用下的纯策略时没有纳什均衡 存在纳什均衡的必要必要条件为 L 3 1 L L B采用左和右的混合策略时必须要使A对采取上和下的策略所得收益无差异 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L L R 1 L 存在纳什均衡的必要必要条件为 L 3 1 L L B采用左和右的混合策略时必须要使A对采取上和下的策略所得收益无差异 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L 3 4 R 1 4 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L 3 4 R 1 4 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U B选择左的策略时的预期收益为多少 L 3 4 R 1 4 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U B选择左的策略的预期收益为2 U 5 1 U B选择右的策略的预期收益为多少 L 3 4 R 1 4 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U B选择左的策略的预期收益为2 U 5 1 U B选择右的策略的预期收益为4 U 2 1 U L 3 4 R 1 4 B选择左的策略的预期收益为2 U 5 1 U B选择右的策略的预期收益为4 U 2 1 U 假如2 U 5 1 U 4 U 2 1 U 那么B仅选择左的策略 但是当B仅采用左的策略时不存在纳什均衡 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L 3 4 R 1 4 B选择左的策略的预期收益为2 U 5 1 U B选择右的策略的预期收益为4 U 2 1 U 假如2 U 5 1 U 4 U 2 1 U 那么B仅采取右的策略 但是当B仅采取右的策略时不存在纳什均衡 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U U D 1 U L 3 4 R 1 4 存在纳什均衡的必要条件为 2 U 5 1 U 4 U 2 1 U U 3 5 A使用上和下的混合策略必须要使得B采取左和右的策略时所得收益无差异 混合策略 参与者B 参与者A 1 2 0 4 0 5 3 2 U 3 5 D 2 5 L 3 4 R 1 4 A的混合策略为 3 5 2 5 而

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论