第6.4讲：RepeatedGames(IV)：以“三价博弈”为例

上传人：5*** IP属地：湖北上传时间：2022-03-16 格式：PPT 页数：31 大小：472KB 积分：35 举报 版权申诉

已阅读5页，还剩26页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、Lecture 6: Repeated Games (IV)以以“三价博弈三价博弈”为例为例1存在多个纯策略纳什均衡博弈的有限次重复博弈存在多个纯策略纳什均衡博弈的有限次重复博弈存在存在多个多个纯策略纳什均衡博弈的纯策略纳什均衡博弈的有限次有限次重复博弈重复博弈以以“三价博弈三价博弈”的重复博弈为例的重复博弈为例 2存在多个纯策略纳什均衡博弈的有限次重复博弈（存在多个纯策略纳什均衡博弈的有限次重复博弈（续续）存在存在多个多个纯策略纳什均衡博弈的纯策略纳什均衡博弈的有限次有限次重复博弈重复博弈G(T) 由于原博弈由于原博弈G具有多重纳什均衡，那么利用逆推归纳法从最具有多重纳什均衡，那么利用

2、逆推归纳法从最后一个原博弈着手考虑问题，哪一个纳什均衡作为后一个原博弈着手考虑问题，哪一个纳什均衡作为“逆推逆推”的出发点比较合适呢？的出发点比较合适呢？3三价博弈三价博弈三价博弈三价博弈设一市场有两个生产同质产品的厂商，他们对产品设一市场有两个生产同质产品的厂商，他们对产品的定价同有高（的定价同有高（H）、中（）、中（M）、低（）、低（L）三种可能。）三种可能。设高价时市场总利润为设高价时市场总利润为10个单位，中价时市场总利个单位，中价时市场总利润为润为6个单位，低价时市场总利润为个单位，低价时市场总利润为2个单位。个单位。设两厂商同时决定价格，价格不等时的价格低者独设两厂商同时决

3、定价格，价格不等时的价格低者独享利润，价格相等时双方平分利润。享利润，价格相等时双方平分利润。4三价博弈（三价博弈（续续）三价博弈的得益矩阵三价博弈的得益矩阵5有两个纯策略纳什均衡（有两个纯策略纳什均衡（M，M）和（）和（L，L），但），但博弈中两博弈方的总利益最大，而且也符合他们个博弈中两博弈方的总利益最大，而且也符合他们个体利益的策略组合（体利益的策略组合（H，H）并不是纳什均衡。）并不是纳什均衡。厂商厂商2HML厂厂商商1H5，50，60，2M6，03，30，2L2，02，01，1三价博弈的两次重复博弈三价博弈的两次重复博弈三价博弈的两次重复博弈三价博弈的两次重复博弈？子博弈完美纳

4、什均衡？子博弈完美纳什均衡6三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）三价博弈的两次重复博弈三价博弈的两次重复博弈？如下四条博弈路径是否是重复博弈的子博弈完美纳什均如下四条博弈路径是否是重复博弈的子博弈完美纳什均衡衡 1：博弈路径：博弈路径（M，M），（），（M，M）2：博弈路径：博弈路径（L，L），（），（M，M） 3：博弈路径：博弈路径（M，M），（），（L，L） 4：博弈路径：博弈路径（L，L），（），（L，L） 7三价博弈的两次重复博弈（三价博弈的两次重复博弈（）博弈路径（博弈路径（1）（M，M），（），（M，M）和（和（2）（L，L），），（M，M）都是重复博弈的子博弈

5、完美纳什均衡都是重复博弈的子博弈完美纳什均衡首先，第二阶段选择（首先，第二阶段选择（ M，M ）是一个纳什均衡，实现得益组）是一个纳什均衡，实现得益组合（合（3，3）。）。8HMLH5，50，60，2M6，03，30，2L2，02，01，1三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）其次，把第二阶段实现的得益组合的贴现值加到原博弈的各个其次，把第二阶段实现的得益组合的贴现值加到原博弈的各个得益组合上，得到两博弈方在第一阶段博弈时面临的得益矩阵：得益组合上，得到两博弈方在第一阶段博弈时面临的得益矩阵：9厂商厂商2HML厂厂商商1H5+3，5+30+3，6+30+3，2+3M6+3，

6、0+33+3，3+30+3，2+3L2+3，0+32+3，0+31+3，1+3三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）利用划线法，得知此时的纯策略纳什均衡有两个：（利用划线法，得知此时的纯策略纳什均衡有两个：（MM，MM）和）和（L L，L L）。）。 10HMLH5+3，5+30+3，6+30+3，2+3M6+3，0+33+3，3+30+3，2+3L2+3，0+32+3，0+31+3，1+3三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）所以，博弈路径（所以，博弈路径（1 1）（MM，MM），（），（MM，MM）和（和（2 2）（L L，L L），（），（MM，

7、MM）都是重复博弈的子博弈完美纳什均衡，实现的都是重复博弈的子博弈完美纳什均衡，实现的总得益组合分别为（总得益组合分别为（3+3 3+3 ，3+3 3+3 ）、（）、（1+3 1+3 ，1+3 1+3 ）。）。11三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）博弈路径（博弈路径（3）（M，M），（），（L，L）和（和（4）（L，L），（），（L，L）都是重复博弈的子博弈完美纳什均衡都是重复博弈的子博弈完美纳什均衡首先，第二阶段选择（首先，第二阶段选择（ L，L ）是一个纳什均衡，实现得益组合）是一个纳什均衡，实现得益组合（1，1）。）。12HMLH5，50，60，2M6，0

8、3，30，2L2，02，01，1三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）其次，把第二阶段实现的得益组合的贴现值加到原博弈的各个其次，把第二阶段实现的得益组合的贴现值加到原博弈的各个得益组合上，得到两博弈方在第一阶段博弈时面临的得益矩阵：得益组合上，得到两博弈方在第一阶段博弈时面临的得益矩阵：13HMLH5+，5+0+，6+0+，2+M6+，0+3+，3+0+，2+L2+，0+2+，0+1+，1+三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）利用划线法，得知此时的纯策略纳什均衡有两个：（利用划线法，得知此时的纯策略纳什均衡有两个：（MM，MM）和）和（L L，L L）。

9、）。 14H HM ML LH H5+5+，5+5+0+0+，6+6+0+0+，2+2+M M6+6+，0+0+3+3+，3+3+0+0+，2+2+L L2+2+，0+0+2+2+，0+0+1+1+，1+1+三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）博弈路径（博弈路径（3）（M，M），（），（L，L）和（和（4）（L，L），），（L，L）都是重复博弈的子博弈完美纳什均衡实现的总得益组都是重复博弈的子博弈完美纳什均衡实现的总得益组合分别为（合分别为（3+ ，3+ ）、（）、（1+ ，1+ ）。）。15三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）总结：总结：16子博弈

10、完美纳什均衡路径子博弈完美纳什均衡路径两次重复博弈实现的总得益组合两次重复博弈实现的总得益组合1：（M，M），（），（M，M）（3+3，3+3）2：（L，L），（），（M，M）（1+3，1+3）3：（M，M），（），（L，L）（3+，3+）4：（L，L），（），（L，L）（1+，1+）5：触发策略实现的博弈路径：触发策略实现的博弈路径（5+3，5+3）三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）触发策略：触发策略：博弈方博弈方1 1：第一次选择：第一次选择H H；如果第一次博弈的结果为（；如果第一次博弈的结果为（H H，H H），），则在第二次博弈时选择则在第二次博弈时选择MM，

11、如果第一次博弈的结果为其他策略，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择组合，则在第二次博弈时选择L L。博弈方博弈方2 2：同博弈方：同博弈方1 1。17HMLH5，50，60，2M6，03，30，2L2，02，01，1三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）触发策略实现的可能博弈路径触发策略实现的可能博弈路径 (H,H) ,(H,H) , (M,M)(M,M) 非非(H,H)(H,H)策略组合策略组合， (L,L)(L,L)18HMLH5，50，60，2M6，03，30，2L2，02，01，1第一次选择第一次选择H H；如果第一次博弈的结；如果第一次博弈

12、的结果为（果为（H H，H H），则在第二次博弈时选），则在第二次博弈时选择择MM，如果第一次博弈的结果为其他，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择策略组合，则在第二次博弈时选择L L。三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）当当1/2时时,触发策略实现的博弈路径必为触发策略实现的博弈路径必为(H,H)， (M,M), 是是一个子博弈完美纳什均衡。一个子博弈完美纳什均衡。首先，考察最后一个阶段（即第二次重复）的首先，考察最后一个阶段（即第二次重复）的博弈结果。博弈结果。触发策略实现的可能博弈路径为触发策略实现的可能博弈路径为 (H,H)， (M,M)或或非非

13、(H,H)策略组合，策略组合， (L,L)。也也就是说，在触发策略组合下，第二次重复的博就是说，在触发策略组合下，第二次重复的博弈结果不外乎是（弈结果不外乎是（M,M）或（）或（L,L）。这两种）。这两种博弈结果都是纳什均衡！博弈结果都是纳什均衡！19第一次选择第一次选择H H；如果第一次博弈的结果为；如果第一次博弈的结果为（H H，H H），则在第二次博弈时选择），则在第二次博弈时选择MM，如果第一次博弈的结果为其他策略组合，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择则在第二次博弈时选择L L。HMLH5，50，60，2M6，03，30，2L2，02，01，1三价博弈的两次重

14、复博弈（三价博弈的两次重复博弈（续续）其次，考察倒数第二阶段（即第一次重复）的博弈结果。其次，考察倒数第二阶段（即第一次重复）的博弈结果。基于对第二次重复的博弈结果分析，得到两博弈方在第一次重复博基于对第二次重复的博弈结果分析，得到两博弈方在第一次重复博弈时的得益矩阵。利用划线法不难发现（弈时的得益矩阵。利用划线法不难发现（M，M）和（）和（L，L）均为）均为纳什均衡。纳什均衡。20HMLH5+3，5+30+，6+0+，2+M6+，0+3+，3+0+，2+L2+，0+2+，0+1+，1+三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）为使得（为使得（H H，H H）为纳什均衡，那么

15、需要：）为纳什均衡，那么需要：2115362三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）很显然，当很显然，当1/2时，时，5+36+3+1+ 。所以，当所以，当1/2时，纳什均衡（时，纳什均衡（H，H）实现的是两博弈方的最佳得）实现的是两博弈方的最佳得益，因此两博弈方必然会采用它！益，因此两博弈方必然会采用它！22三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）总结：总结：23子博弈完美纳什均衡路径子博弈完美纳什均衡路径两次重复博弈实现的总得益组合两次重复博弈实现的总得益组合1：（M，M），（），（M，M）（3+3，3+3）2：（L，L），（），（M，M）（1+3，1+3

16、）3：（M，M），（），（L，L）（3+，3+）4：（L，L），（），（L，L）（1+，1+）三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）？当当1/21/2时，策略组合时，策略组合5 5（触发策略）为什么能够实现较（触发策略）为什么能够实现较有效的总得益组合呢有效的总得益组合呢原因在于它具有原因在于它具有“报复机制报复机制”。24三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）在触发策略下，在第一个重复阶段，给定博弈方在触发策略下，在第一个重复阶段，给定博弈方2选择选择H，如果博弈方，如果博弈方1不选择不选择H，而选择，而选择M，得益增加，得益增加1单位；单位；但这个偏离后

17、果是他在第二阶段的得益将由但这个偏离后果是他在第二阶段的得益将由3单位下降单位下降为为1单位。这样，如果单位。这样，如果11/2），博弈方），博弈方1偏离（偏离（H，H）是得不偿失的，他将没有积极性偏离。）是得不偿失的，他将没有积极性偏离。同理，当同理，当1/2时，博弈方时，博弈方2也将没有积极性偏离（也将没有积极性偏离（H，H）。）。 25HMLH5，50，60，2M6，03，30，2L2，02，01，1第一次选择第一次选择H；如果第一次博弈的结果为；如果第一次博弈的结果为（H，H），则在第二次博弈时选择），则在第二次博弈时选择M，如果第一次博弈的结果为其他策略组合，如果第一次博弈的结果为其

18、他策略组合，则在第二次博弈时选择则在第二次博弈时选择L。三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）触发策略触发策略触发策略实际上是一种典型的策略。在这类典触发策略实际上是一种典型的策略。在这类典型策略中，两博弈方首先试探合作，一旦发现型策略中，两博弈方首先试探合作，一旦发现对方不合作则也用不合作相报复。这样的策略对方不合作则也用不合作相报复。这样的策略在博弈论中通常被称为在博弈论中通常被称为“触发策略触发策略”(Trigger (Trigger Strategy)Strategy)。26第一次选择第一次选择H H；如果第一次博弈的结果为；如果第一次博弈的结果为（H H，H H）

19、，则在第二次博弈时选择），则在第二次博弈时选择MM，如果第一次博弈的结果为其他策略组合，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择则在第二次博弈时选择L L。三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）策略组合策略组合5（触发策略）在第一阶段可以达到原博弈中比较（触发策略）在第一阶段可以达到原博弈中比较有效的非纳什均衡（有效的非纳什均衡（H，H）。）。27第一次选择第一次选择H H；如果第一次博弈的结果为；如果第一次博弈的结果为（H H，H H），则在第二次博弈时选择），则在第二次博弈时选择MM，如果第一次博弈的结果为其他策略组合，如果第一次博弈的结果为其他策略组合，则在第二次博弈时选择则在第二次博弈时选择L L。三价博弈的两次重复博弈（三价博弈的两次重复博弈（续续）（推广）对更一般问题进行叙述来总结前述（推广）对更一般问题进行叙述来总结前述“有趣有趣”的结果：的结果：如果原博弈如果原博弈G G是具有多重纳什均衡的完全是具有多重纳什均衡的完全信息静态博弈，那么可能（但不必）存在信息静态博弈，那么可能（但不必）存在重复博弈重复博弈G(T)G(T)的子博弈完美纳什均衡

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第6.4讲：RepeatedGames(IV)：以“三价博弈”为例

文档简介

温馨提示

最新文档

评论

第6.4讲：RepeatedGames(IV)：以“三价博弈”为例

文档简介

温馨提示

最新文档

评论

相关文档