第十二讲重复博弈课件

上传人：l*** IP属地：贵州上传时间：2023-08-03 格式：PPT 页数：54 大小：310.75KB 积分：25 举报 版权申诉

已阅读5页，还剩49页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第十二讲重复博弈第一节有限次重复博弈一、重复博弈的特征（一）每一阶段博弈的结构完全相同。（二）所有参与人都观测到博弈过去的历史。1第十二讲重复博弈第一节有限次重复博弈1博弈重复次数为T则总收益为（三）参与人的总收益是每一阶段

博弈收益的贴现之和。设贴现值为δ的，参与人i在第t阶段的收益为uti,2博弈重复次数为T则总收益为（三）参与人的总收益是每一阶段

博33（四）影响均衡结果的主要因素是重复次数及信息的完备。1、重复次数：当博弈重复多次时，参与人可能为了长远利益而牺牲眼前利益而选择不同的均衡策略。4（四）影响均衡结果的主要因素是重复次数及信息的完备。1、重复2、信息的完备性.当某个参与人的特征不为其他参与人所知时，他有可能有积极性，建立一个“好”的声誉以换取长远利益。52、信息的完备性.当某个参与人的特征不为其他参与人所知时，5二、有限次重复博弈例1，企业定价策略高价低价高价100，100-10，150低价150，-1050，506二、有限次重复博弈例1，企业定价策略高价低价高价100，10设贴现因子0<δ<1，重复T次企业i的最优策略为低价，总收益为7设贴现因子0<δ<1，重复T次企业i的最优策略为低价，总收益定理1.设G是价格博弈，G（T）是G重复博弈T，如果G有唯一的纳什均衡，则G（T）的唯一子博弈精炼纳什均衡是G的纳什均衡重复T次。8定理1.设G是价格博弈，G（T）是G重复博弈T，如果G有唯一例2，掷硬币游戏正反正-1，11，-1反1，-1-1，19例2，掷硬币游戏正反正-1，11，-1反1，-1-1，19此博弈有唯一的混合策略纳什均衡实验证明，它的确为最优的策略10此博弈有唯一的混合策略纳什均衡实验证明，它的确为最优的策略1第二节无限次重复博弈

例3，无限次重复囚徒困境博弈。坦白抵赖坦白-6，-60，-9抵赖-9，0-1，-111第二节无限次重复博弈例3，无限次重复囚徒困境博弈第二节无限次重复博弈例3，无限次重复囚徒困境博弈。坦白抵赖坦白-6，-60，-9抵赖-9，0-1，-112第二节无限次重复博弈例3，无限次重复囚徒困境博弈。坦白抵赖冷酷策略：（1）开始选择“抵赖”

（2）如果有一方选择“坦白”，则然后永远选择“坦白”。设δ为贴现因子，坚持冷酷策略条件：一旦坦白的总收益u0≤坚持冷酷策略的总收益u*13冷酷策略：（1）开始选择“抵赖”

（2）如果有一方选择“坦白14141515这就说，i≤500%时，双方一定会坚持冷酷策略，从而（抵赖，抵赖）为每一个阶段的均衡结果，且是帕累托最优的。其原因：如果博弈重复无穷次，且双方有足够的耐心（对未来价值的估量较大），任何短期的机会主义行为的所得都是微不足道的，参与人有积极性为自己建立一个乐于合作的声誉和惩罚对方的机会主义行为。16这就说，i≤500%时，双方一定会坚持冷酷策略，从而（抵赖例4，无限重复的古诺特寡头竞争模型。例4，无限重复的古诺特寡头竞争模型。成本函数分别为C1（g1）=cg1C2（g2）=cg2反需求函数P=a-（g1+g2）利润函数17例4，无限重复的古诺特寡头竞争模型。例4，无限重复的古诺特①1，2不合作时的最优产量最大利润18①1，2不合作时的最优产量最大利润18②1，2合作时（即各生产垄断产量的一半）的最优产量为最大利润19②1，2合作时（即各生产垄断产量的一半）最大利润19③i背叛，j合作时，i的最优生产量为i的最优利润为20③i背叛，j合作时，i的最优生产量为i的最优利润为20j的冷酷策略：（1）首先选择合作即生产量为（2）如果i选择背叛即生产量为，则j将永远选择不合作。21j的冷酷策略：（1）首先选择合作即生产量为21企业i没有积极性偏离合作均衡的条件为一直坚持合作的总收益≥背叛的总收益，即

22企业i没有积极性偏离合作均衡的条件为2223232424因此，当合谋就会是一个精炼纳什均衡。25因此，当25如果有n个寡头企业，合作均衡要求26如果有n个寡头企业，合作均衡要求26企业越多企业一次性机会主义不合作行为中的净收益相对于长远利益的比率越大，机会主义行为的诱惑越大。一般说来，小团体的合作靠非正式的规则就可以维持，而大团体则必须依赖于正式的规则和合约。即企业越多，合作越困难27企业越多企业一次性机会主义不合作行为中的净收益相对于长远利益无名氏定理：有一个一次博弈G可作为某无穷博弈的一个阶段，G有纳什均衡及其结果，对于无限博弈，肯定存在一个贴现因子，使无限博弈的结果不劣(弱优)于G的纳什均衡结果28无名氏定理：有一个一次博弈G可作为某无穷博弈的一个阶段，G有第三节无穷次重复博弈中的产品质量问题假设：n家企业生产同一种产品，有优质与劣质之分，其边际成本分别为c、0，固定成本圴为F。问题：1.企业提供优质品的条件2.竞争性条件3.市场出清条件29第三节无穷次重复博弈中的产品质量问题假设：n家企业生产同一种一、企业提供优质品的条件生产劣质品的一次性得利是pq生产优质品的无穷次性得利是30一、企业提供优质品的条件生产劣质品的一次性得利是pq30企业提供优质品的充分必要条件31企业提供优质品的充分必要条件31二、竞争性条件当期利润＝固定资本折旧q（p-c）=rF当价格p=(1+r)c时Q=F/c32二、竞争性条件当期利润＝固定资本折旧32三、市场出清条件nq=q(p)n=q(p)/q=cq(p)/F33三、市场出清条件nq=q(p)33第四节.不完全信息重复博弈与声誉一、问题的提出在完全信息情况下，假定静态博弈的纳什均衡是唯一的，不论博弈重复多少次，只要重复的次数是有限的，唯一的子博弈精炼纳什均衡是每个参与人在每次博弈中选择静态均衡战略。34第四节.不完全信息重复博弈与声誉一、问题的提出34特别地，在有限次重复囚徒博弈中，每次都选择“坦白”是每个囚徒的最优战略。这一结果与人们的直观感觉不一致。阿克斯罗德（1981）的实验结果表明，即使在有限次重复博弈中，合作行为也频繁出现。35特别地，在有限次重复囚徒博弈中，每次都选择“坦白”是每个囚徒二、悖论的破解：声誉模型克瑞普斯、米尔格罗姆、罗伯茨和威尔逊（1982）将不完全信息引入重复博弈参与人对其他参与人支付函数或策略的不完全信息对均衡结果有重要影响，合作行为在有限次博弈中会出现，只要博弈重复的次数足够长（没有必要是无限的）。特别地，“坏人”可能在相当长一段时期表现得像“好人”一样。36二、悖论的破解：声誉模型克瑞普斯、米尔格罗姆、罗伯茨和威尔（一）假定囚徒1有两种类型，理性的（rational）或非理性的（irrational），概率分别为（1-p）和p。为简单起见，假定囚徒2只有一种类型，即理性的。理性的囚徒可以选择任何战略，37（一）假定囚徒1有两种类型，理性的（rational）或非理非理性的囚徒1，只有一种战略，即“针锋相对”（tit-for-tat）：开始选择“抵赖”，然后在t阶段选择囚徒2在t-1阶段的选择即“你抵赖我就抵赖，你坦白我就坦白”）。38非理性的囚徒1，只有一种战略，即“针锋相对”（tit-for“理性囚徒”可以理解为“机会主义者”或者非合作型参与人；“非理性囚徒”可以理解为讲义气重信誉的人，或者合作型参与人。说囚徒1可能是非理性的并不是说他的行为是非理性的（即不追求效用最大化），而是说他有一种特殊的效用函数。39“理性囚徒”可以理解为“机会主义者”或者非合作型参与人；囚徒2囚徒1坦白抵赖坦白-8，-80，-10抵赖-10，0-1，-1（二）.阶段博弈的收益矩阵40囚徒2囚徒1坦白抵赖坦白-8，-80，-10抵赖-10，0-（三）.博弈的顺序如下：（1）、自然首先选择囚徒1的类型；囚徒1知道自己的类型，囚徒2只知道囚徒1,属于理性的概率是（1-p），非理性的概率是p；（2）、两个囚徒进行第一阶段博弈；41（三）.博弈的顺序如下：（1）、自然首先选择囚徒1的类型；4(3)、观测到第一阶段博弈结果后，进行第二阶段博弈；观测到第二阶段博弈结果后，进行第三阶段博弈；如此等等。(4)、理性囚徒1和囚徒2的收益是阶段博弈的支付的贴现值之和（为了简单起见，我们假定贴现因子δ=1）。42(3)、观测到第一阶段博弈结果后，进42Ⅰ.博弈只重复两次（T=2）的情况。t=1t=2非理性囚徒1DX理性囚徒1CC囚徒2XCC代表“坦白”，D代表抵赖43Ⅰ.博弈只重复两次（T=2）的情况。t=1t=2非理性囚徒如果囚徒2选择X=D，囚徒2的期望支付是[p(-1)+(1-p)(-10)]+[p×0+(1-p)(-8)]=17p-1844如果囚徒2选择X=D，囚徒2的期望支付是44如果囚徒2选择X=C，囚徒2的期望支付是：[p×0+(1-p)(-8)]+[-8]=8p-1645如果囚徒2选择X=C，囚徒2的期望支付是：45因此，如果下列条件满足，囚徒2将选择X=D：17p-18≥8p-16→p≥2/9就是说，如果囚徒1属于非理性的概率不小于2/9，囚徒2将在第一阶段选择抵赖（合作）。

46因此，如果下列条件满足，囚徒2将选择X=D：46Ⅱ.博弈重复三次（T=3）的情况t=1t=2t=3非理性囚徒1DDD理性囚徒1DCC囚徒2DDCp≥2/9

47Ⅱ.博弈重复三次（T=3）的情况t=1t=2t=3非理性囚Ⅲ.一般情况在T阶段重复囚徒博弈中，如果每个囚徒都有P>0的概率是非理性的（即只选择“针锋相对”或“冷酷战略”），且T足够大，那么存在一个T0<T，使得下列战略组合构成一个精炼贝叶斯均衡：所有理性囚徒在t≤T0阶段选择合作（抵赖），t>T0阶段选择不合作（坦白）；48Ⅲ.一般情况在T阶段重复囚徒博弈中，如果每个囚徒都48“非合作阶段的数量（T-T0）只与p有关而与T无关”T只决定合作阶段的数量而不决定非合作阶段的数量。

49“非合作阶段的数量（T-T0）只与p有关而与T无关”49（四）.直观解释尽管每一个囚徒在选择合作时冒着被其他囚徒出卖的风险（从而可能得到一个较低的现阶段支付），但如果他选择不合作，就暴露了自己是非合作型的，从而失去了获得长期合作收益的可能，如果对方是合作型的话。50（四）.直观解释尽管每一个囚徒在选择合作时冒着被其他50如果博弈重复的次数足够多，未来收益的损失就超过短期被出卖的损失，因此，在博弈的开始，每一个参与人都想树立一个合作形象（使对方认为自己是喜欢合作的），即使他在本性上并不是合作型的；只有在博弈恰似结束的时候，参与人才会一次性地把自己的过去建立的声誉利用尽，合作才会停止（因为此时，短期收益很大而未来损失很小）。51如果博弈重复的次数足够多，未来收益的51一个人干好事还是干坏事常常不取决于他是好人还是坏人，而取决于别人认为他是好人还是坏人，因为坏人也有兴趣建立一个好人的形象以谋取长远利益。即使你是一个极端自私的人，如果别人并不知道你是一个极端自私的人，你也有兴趣干一些助人为乐的事情，以使别人认为你是一个乐于助人的人。#52一个人干好

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第十二讲重复博弈课件

文档简介

温馨提示

最新文档

评论

第十二讲重复博弈课件

文档简介

温馨提示

最新文档

评论

相关文档