博弈论重复博弈PPT课件.ppt

上传人：优*** IP属地：广东上传时间：2020-03-21 格式：PPT 页数：60 大小：1.71MB 积分：68 举报 版权申诉

已阅读5页，还剩55页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第四章重复博弈重复博弈基本博弈完全信息静态博弈完全信息动态博弈重复进行构成的博弈过程 1 4 1重复博弈引论一为何研究重复博弈经济中的长期关系例如 1 两家企业在一个市场上的长期竞争 2 市场营销中的回头客问题 3 买卖问题 4 信任信誉声誉问题 2 人们的预见性由于人的思维的限制在短期行为中缺乏默契或合作的关系但在长期中这样的机会就大得多即是未来利益对当前行为的制约 3 二重复博弈的分类 1 有限次重复博弈给定一个基本博弈G 可以是静态博弈也可以是动态博弈重复进行T次G 记为G T 而G则称为G T 的原博弈 G T 中的每次重复称为G T 的一个阶段 4 2 无限次重复博弈一个基本博弈G一直重复博弈下去的博弈记为G 注 1 无法验证某个重复博弈会一直重复下去 2 如果主观上认为博弈会不断进行下去那么博弈就可无限次重复下去 5 三策略子博弈和均衡路径策略博弈方在每个阶段针对每种情况如何行为的计划子博弈从某个阶段不包括第一阶段开始包括此后所有的重复博弈部分因此动态博弈的分析方法都可用于重复博弈均衡路径由每个阶段博弈方的行为组合串联而成 6 四重复博弈的得益有限次重复博弈的总体得益方法之一计算重复博弈的总得益博弈方各次重复得益的总和有限次重复博弈的总体得益方法之二计算各阶段的平均得益 7 四重复博弈的得益 Cont 如果重复的时间很长就应考虑资金的时间价值此时考虑贴现系数重复T期的重复博弈总得益为重复无限期的重复博弈总得益为 8 四重复博弈的得益 Cont 9 4 2有限次重复博弈 4 2 1两人零和博弈的有限次重复博弈4 2 2唯一纯策略纳什均衡博弈的有限次重复博弈4 2 3多个纯策略纳什均衡博弈的有限次重复博弈4 2 4有限次重复博弈的民间定理 10 4 2 1两人零和博弈的有限次重复博弈以零和博弈为原博弈的有限次重复博弈中所有博弈方的唯一选择策略是重复一次性博弈中的纳什均衡策略混合策略纳什均衡原因重复不会改变博弈效率是利益是对立的不可调和的 11 4 2 2唯一纯策略纳什均衡博弈的有限次重复博弈唯一的Nash均衡有两种一是本身是帕雷托最优的它都符合双方的利益重复不会改变二是本身不是帕雷托最优的重复能否改变得益一有限次重复囚徒的困境博弈 12 二一般结论定理设原博弈G有唯一的纯策略纳什均衡则对任意整数T 重复博弈G T 有唯一的子博弈完美纳什均衡即各博弈方每个阶段都采用G的纳什均衡策略各博弈方在G T 中的总得益为在G中得益的T倍平均得益的与原博弈G中的得益 13 三有限次重复寡头削价竞争博弈有唯一纯策略纳什均衡 70 70 有限次重复的结果仍然是低价低价 14 四重复囚徒困境悖论和连锁店悖论有惟一纯策略Nash均衡的有限次重复博弈的分析和定理是强烈的但这与人们的直觉经验有矛盾大量的实验研究表明其结果与理论结果也不一样 1978年塞尔顿提出的连锁店悖论在n个市场例如n个城市都开设有连锁店的企业对各个市场的竞争者是否应该打击的策略选择 15 4 2 3多个纯策略纳什均衡博弈的有限次重复博弈一三价博弈的重复博弈显然 M M L L 是纯策略Nash均衡但双方最理想的策略 H H 却不能实现如果对这个博弈重复两次他的均衡路径很多的确可以实现策略 H H 16 双方策略为博弈方1 第一次选h 如第一次结果为 H H 则第二次选M 否则选L博弈方2 同博弈方1触发策略 TriggerStrategy 两博弈方先试探合作一旦发现对方不合作则也用不合作报复触发策略是重复博弈实现合作和高效的关键机制 17 Cont 等价的静态博弈如对上述博弈重复n次结果一样采用触发策略得子博弈均衡第一阶段选 H H 以后各阶段都选 M M 18 二触发策略的进一步讨论第一阶段不管选什么策略二阶段都选 M M 于是将 3 3 加到其余策略上得到右边等价的得益矩阵结果第一阶段最佳策略不是 H H 而是 M M 19 Cont 实际上触发策略的可信性是一个复杂的问题会受到各方面因素的影响例如心情性格等但并不是每个触发策略都不可信所以利用触发策略分析重复博弈是有价值的 20 三两市场博弈的重复博弈 21 4 2 4有限次重复博弈的民间定理 1 个体理性得益博弈方i的最小最大值2 可实现得益博弈中所有纯策略组合得益的加权平均数组 22 4 3无限次重复博弈 4 3 1两人零和博弈的无限次重复博弈4 3 2唯一纯策略纳什均衡博弈的无限次重复博弈4 3 3无限次重复古诺模型4 3 4有效工资率4 3 5信用问题4 3 6若干建议与启示 23 引言有限次重复博弈和无限次重复博弈的区别一是有限次重复博弈存在最后一次重复而无限次重复博弈无最后一次重复注意到正是由于有最后一次重复使得有限次重复博已无法实现高效率二是无限次重复博弈不能忽略资金的时间价值但相同之处都是试图合作和惩罚不合作关键 24 4 3 1两人零和博弈的无限次重复博弈两人零和博弈有限次重复的所有阶段都不可能发生合作因为他们的利益关系是完全对立的博弈方会一直重复原博弈的混合策略纳什均衡两人零和博弈无限次重复的所有阶段都不可能发生合作博弈方会一直重复原博弈的混合策略纳什均衡由于无限次重复博弈没有最后一个阶段所以无法用逆向归纳法证明类似的方法是从无限次重复博弈的第t阶段进行逆向归纳注意t是任意的 25 4 3 2唯一纯策略纳什均衡博弈的无限次重复博弈一种情况是唯一纯策略纳什均衡本身是帕累托最优的另一种情况是纯策略纳什均衡不是最优的可以改善一两寡头削价竞争博弈该博弈一次性博弈均衡是都采用低价是囚徒困境型博弈 26 无限次重复两寡头削价博弈两博弈方都采用触发策略第一阶段采用H 如果前t 1阶段的结果都是 H H 则继续采用H 否则采用L 先证明该策略是一个Nash均衡方法先假设博弈方1已采用了这个策略然后证明在达到一定水平时采用同样的触发策略是博弈方2的最佳反应由于对称性双方的最佳反应就构成Nash均衡 27 无限次重复两寡头削价博弈 Cont 由于在某个阶段出现与 H H 不同的结果以后博弈方1将永远采用L 此时博弈方2也只有一直选择L 因此博弈方2对博弈方1触发策略的最佳反应策略的后半部分与触发策略的后半部分是一样的现在最关键是要确定博弈方2在第一阶段的最优选择 28 无限次重复两寡头削价博弈 Cont 如果博弈方2采用L 但以后博弈方1一直采用L的报复自己也只能一直采用L 得益永远为1 总得益现值为如果博弈方2采用H 则在第一阶段它将得4 下一阶段又面临同样的选择若记V为博弈方2在该重复博弈中每阶段都采用最终的总得益现值总得益现值为或者因此当因此当时此触发策略纳什均衡策略最佳策略是H 同样如此二阶段三阶段最佳是H 证毕 29 无限次重复两寡头削价博弈 Cont 再证明触发策略是子博弈完美Nash均衡由于无限次重复博弈的子博弈还是无限次重复博弈其推理完全一样因此是是子博弈完美Nash均衡 30 无名氏定理 folktheorem 如果博弈重复无限次或者每次结束的概率足够小如果充分接近1 任何个人理性可行支付向量都可以作为子博弈精炼纳什均衡结果出现 31 4 3 3无限次重复古诺模型一古诺模型的无限次重复博弈和支持垄断产量的条件假定边际成本都为2 在一次性博弈中唯一的Nash均衡 2 2 古诺产量用qc表示如果只有一个垄断厂商垄断产量qm 3 Nash均衡的总产量4大于垄断产量3 各厂商生产垄断产量的一半1 5 双方得益都会增加但一次性博弈不能实现那么在无限次重复古诺模型中能实现吗可以证明在无限次重复古诺模型中当贴现率满足一定条件时两厂商采用下列触发策略构成一个子博弈完美纳什均衡 32 触发策略在第一阶段生产垄断产量的一半1 5 在第t阶段如果前t 1阶段结果都是 1 5 1 5 则继续生产1 5 否则生产古诺产量2 如果采用上述触发策略每阶段生产产量 1 5 1 5 每阶段双方得益为设厂商1已采用该触发策略若厂商2也采用该触发策略则每期得益4 5 无限次重复博弈总得益的现值为 33 Cont 如果厂商2偏离上述触发策略则他在第一阶段所选产量应为给定厂商1产量为1 5时自己的最大利润产量即满足解得此时利润为5 0625 高于触发策略第一阶段得益4 5 34 Cont 但从第二阶段开始厂商1将报复性地永远采用古诺产量2 这样厂商2也被迫永远采用古诺产量从此得利润4 因此无限次重复博弈第一阶段偏离的情况下总得益的现值为当上述策略是厂商2对厂商1的同样触发策略的最佳反应否则偏离是最佳反应 35 补充 36 37 例题假定两家企业A与B之间就做广告与不做广告展开博弈它们的报酬矩阵如下 38 如果博弈是重复的但我们不考虑无限次的情形假设只进行10次对局再假定企业A采取的是以牙还牙的策略并在第一次对局中不做广告企业B也将采取以牙还牙的策略对企业B 考虑两种不同的情况在第一次做广告或第一次不做广告分别计算这两种情况下企业B的累计利润试问企业B将如何行动 39 假如B在第一次做广告则B获利300 A获利为0 企业A采取以牙还牙的策略在第二次对局中也做广告则两者的获利各为100 因为企业A已经做广告此时企业B不能以降低利润为代价不做广告所以企业B累计利润300 100 9 1200 即不做做做做做做 40 企业B第一次不做广告在理性人的假设下两者在今后会出现追求私利的现象有限次数的重复博弈不能改变囚徒困境原来的均衡结果企业B的累计利润可能为200 100 9 1100 即不做不做做做做做 41 4 3 4有效工资率 EfficiencyWages 模型设定首先厂商选择工资率为然后工人选择接受或拒绝如果拒绝则他作个体户得到收入小于如果接受则工人选择努力工作负效用还是偷懒无负效用厂商只能看到产量高低高产量为低产量0 再假设工人努力工作时一定是高产量不努力时却并不一定是0 而是高产量的概率为低产量0的概率为工人努力工作时厂商得益为工人得益为工人偷懒时厂商期望得益为工人得益为 42 Cont 上述模型是一个完全信息动态博弈在一次性博弈中通常厂商要预付给工人部分工资或者即使不努力工作由于政策原因也必须支付工资于是工人必然偷懒由于厂商了解到这种思路厂商也不会去雇佣一个不努力的工人因此必然选择w 0 那么对工人也不利下面分析这种动态博弈的重复情况怎样 43 Cont 在无限次重复博弈中相当于工人是长期雇佣而非临时工这时厂商可以考虑先支付高工资并威胁一旦产量低就解雇工人使工人努力工作或者采用计件工资或者采用产量合同注这些方法都有一定不足没有一定的基本工资率效果是不理想的 44 考虑如下的触发策略厂商在第一阶段给工资率在第t阶段如果前面t 1阶段结果都是则继续给否则从此永远是工人的策略是如果则接受否则宁愿作个体户得到并在以前各期结果都是和当前工资率为时努力工作否则偷懒注意对厂商来讲先试图合作如果工人不合作就惩罚对工人来讲它是原动态博弈中第二个选择方不但能根据前面各阶段的结果选择还能根据厂商当前阶段是否偏离合作进行决策并且选择有两个是否接受和是否努力 45 在什么条件下双方采用上述触发策略构成子博弈完美Nash均衡设厂商已采用上述触发策略由于工人接受工作是最佳反应用记工人努力工作时无限次重复博弈得益的现值则即如果工人偷懒高产出的概率为p 低产出的概率为1 p 出现高产出仍会给工资出现低产出永远被解雇工人得到收入为用记工人选偷懒时无限重复博弈得益的现值则即 46 Cont 因此当即时努力是工人的最佳选择反过来设工人已采用上述触发策略若厂商给的工资率满足上式条件并且威胁一旦产量降低就解雇工人则各阶段的得益为无限次重复博弈得益现值为若不愿给则解雇工人以后得益为0 因此只要厂商选择前述触发策略就是最佳反应 47 综上所述在满足的条件下双方的触发策略构成一个纳什均衡而上述两式实际上意味着即工人努力的产出扣除努力负效用后的剩余必须不小于工人作个体户的收入即机会成本加上一定比例的取决于努力负效用贴现系数和偷懒可能得高产量概率的附加部分最后这个不等式正是存在有效工资率工作激励有效的基本条件 48 进一步研究 1 对双方的触发策略构成一个纳什均衡的条件或进行计量模型研究 2 工人一次性偷懒被厂商解雇的可能性有多大 3 厂商不止一个有多个时厂商市场是完全竞争的 4 工人有多个时某个工人一次性偷懒被厂商解雇的可能性有多大 5 低水平的合作结果怎样 6 加大惩罚力度和提高合作水平结果怎样 49 4 3 5信用 trust 为什么要讲信用一次博弈时的策略选择重复博弈中的策略选择据江苏经济报 2002年3月26日报道中国企业联合会理事长张彦宁透露中国每年因为逃废债务造成的直接损失约为1800亿由于合同欺诈造成的直接损失约为55亿产品质量低劣和制假售假造成的直接损失至少为2000亿由于三角债和现款交易增加的财务费用约为2000亿 50 如何让人们讲信用突然选择不讲信用的总收益R 5一直讲信用的收益R 3 3 3 2 3 n 3 1 在什么条件下会选择不讲信用冷酷战略 51 如何让人们讲信用信用第三方强制法律信誉机制 52 如何让人们讲信用第一个是产权制度无恒产者无恒心无恒心者无信用要规范市场一定要规范政府行为尽量减少政府部门的交易行为要求一个很好的信息传输体制强调法律的作用提高个人的组织化程度 53 4 3 6若干建议与启示若干建议不要嫉妒不要首先背叛对合作和背叛都要给于回报 assoonaspossible 不要耍小聪明若干启示合作的基础不是真正的信任而是关系的持续性为避免怨怨相报何时了一个更好的策略可能是一报还9 10报相爱总是简单相处却是太难无限次重复博弈 54 合作的进化修订版是行为领域的经典之作罗伯特阿克塞尔罗德 55 深刻的洞见合作的基础不是真正的信任而是关系的持续

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论重复博弈PPT课件.ppt

文档简介

温馨提示

最新文档

评论

博弈论重复博弈PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档