




已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章重复博弈 重复博弈 基本博弈 完全信息静态博弈 完全信息动态博弈 重复进行构成的博弈过程 1 4 1重复博弈引论一 为何研究重复博弈 经济中的长期关系 例如 1 两家企业在一个市场上的长期竞争 2 市场营销中的回头客问题 3 买卖问题 4 信任 信誉 声誉问题 2 人们的预见性 由于人的思维的限制 在短期行为中缺乏默契或合作的关系 但在长期中这样的机会就大得多 即是未来利益对当前行为的制约 3 二 重复博弈的分类 1 有限次重复博弈 给定一个基本博弈G 可以是静态博弈 也可以是动态博弈 重复进行T次G 记为G T 而G则称为G T 的 原博弈 G T 中的每次重复称为G T 的一个 阶段 4 2 无限次重复博弈 一个基本博弈G一直重复博弈下去的博弈 记为G 注 1 无法验证某个重复博弈会一直重复下去 2 如果主观上认为博弈会不断进行下去 那么博弈就可无限次重复下去 5 三 策略 子博弈和均衡路径 策略 博弈方在每个阶段针对每种情况如何行为的计划 子博弈 从某个阶段 不包括第一阶段 开始 包括此后所有的重复博弈部分 因此 动态博弈的分析方法都可用于重复博弈 均衡路径 由每个阶段博弈方的行为组合串联而成 6 四 重复博弈的得益 有限次重复博弈的总体得益方法之一 计算重复博弈的 总得益 博弈方各次重复得益的总和 有限次重复博弈的总体得益方法之二 计算各阶段的平均得益 7 四 重复博弈的得益 Cont 如果重复的时间很长 就应考虑资金的时间价值 此时考虑贴现系数重复T期的重复博弈总得益为 重复无限期的重复博弈总得益为 8 四 重复博弈的得益 Cont 9 4 2有限次重复博弈 4 2 1两人零和博弈的有限次重复博弈4 2 2唯一纯策略纳什均衡博弈的有限次重复博弈4 2 3多个纯策略纳什均衡博弈的有限次重复博弈4 2 4有限次重复博弈的民间定理 10 4 2 1两人零和博弈的有限次重复博弈 以零和博弈为原博弈的有限次重复博弈中 所有博弈方的唯一选择策略是重复一次性博弈中的纳什均衡策略 混合策略纳什均衡 原因 重复不会改变博弈效率是利益是对立的不可调和的 11 4 2 2唯一纯策略纳什均衡博弈的有限次重复博弈 唯一的Nash均衡有两种 一是 本身是帕雷托最优的 它都符合双方的利益 重复不会改变二是 本身不是帕雷托最优的 重复能否改变得益 一 有限次重复囚徒的困境博弈 12 二 一般结论 定理 设原博弈G有唯一的纯策略纳什均衡 则对任意整数T 重复博弈G T 有唯一的子博弈完美纳什均衡 即各博弈方每个阶段都采用G的纳什均衡策略 各博弈方在G T 中的总得益为在G中得益的T倍 平均得益的与原博弈G中的得益 13 三 有限次重复寡头削价竞争博弈 有唯一纯策略纳什均衡 70 70 有限次重复的结果仍然是 低价 低价 14 四 重复囚徒困境悖论和连锁店悖论 有惟一纯策略Nash均衡的有限次重复博弈的分析和定理是强烈的 但这与人们的直觉经验有矛盾 大量的实验研究表明 其结果与理论结果也不一样 1978年 塞尔顿提出的 连锁店悖论 在n个市场 例如n个城市 都开设有连锁店的企业 对各个市场的竞争者是否应该打击的策略选择 15 4 2 3多个纯策略纳什均衡博弈的有限次重复博弈 一 三价博弈的重复博弈显然 M M L L 是纯策略Nash均衡 但双方最理想的策略 H H 却不能实现 如果对这个博弈重复两次 他的均衡路径很多 的确可以实现策略 H H 16 双方策略为 博弈方1 第一次选h 如第一次结果为 H H 则第二次选M 否则选L博弈方2 同博弈方1触发策略 TriggerStrategy 两博弈方先试探合作 一旦发现对方不合作则也用不合作报复 触发策略是重复博弈实现合作和高效的关键机制 17 Cont 等价的静态博弈 如对上述博弈重复n次 结果一样 采用触发策略 得子博弈均衡 第一阶段选 H H 以后各阶段都选 M M 18 二 触发策略的进一步讨论 第一阶段不管选什么策略 二阶段都选 M M 于是将 3 3 加到其余策略上 得到右边等价的得益矩阵 结果第一阶段最佳策略不是 H H 而是 M M 19 Cont 实际上 触发策略的可信性是一个复杂的问题 会受到各方面因素的影响 例如 心情 性格等但并不是每个触发策略都不可信 所以利用触发策略分析重复博弈是有价值的 20 三 两市场博弈的重复博弈 21 4 2 4有限次重复博弈的民间定理 1 个体理性得益 博弈方i的最小最大值2 可实现得益 博弈中所有纯策略组合得益的加权平均数组 22 4 3无限次重复博弈 4 3 1两人零和博弈的无限次重复博弈4 3 2唯一纯策略纳什均衡博弈的无限次重复博弈4 3 3无限次重复古诺模型4 3 4有效工资率4 3 5信用问题4 3 6若干建议与启示 23 引言 有限次重复博弈和无限次重复博弈的区别 一是 有限次重复博弈存在最后一次重复 而无限次重复博弈无最后一次重复 注意到正是由于有最后一次重复使得有限次重复博已无法实现高效率 二是 无限次重复博弈不能忽略资金的时间价值 但相同之处 都是试图 合作 和惩罚 不合作 关键 24 4 3 1两人零和博弈的无限次重复博弈 两人零和博弈有限次重复的所有阶段都不可能发生合作 因为他们的利益关系是完全对立的 博弈方会一直重复原博弈的混合策略纳什均衡 两人零和博弈无限次重复的所有阶段都不可能发生合作 博弈方会一直重复原博弈的混合策略纳什均衡由于无限次重复博弈没有最后一个阶段 所以无法用逆向归纳法证明 类似的方法是从无限次重复博弈的第t阶段 进行逆向归纳 注意t是任意的 25 4 3 2唯一纯策略纳什均衡博弈的无限次重复博弈 一种情况是 唯一纯策略纳什均衡本身是帕累托最优的 另一种情况是 纯策略纳什均衡不是最优的 可以改善 一 两寡头削价竞争博弈该博弈一次性博弈均衡是都采用低价 是囚徒困境型博弈 26 无限次重复两寡头削价博弈 两博弈方都采用触发策略 第一阶段采用H 如果前t 1阶段的结果都是 H H 则继续采用H 否则采用L 先证明 该策略是一个Nash均衡 方法 先假设博弈方1已采用了这个策略 然后证明在达到一定水平时 采用同样的触发策略是博弈方2的最佳反应 由于对称性 双方的最佳反应就构成Nash均衡 27 无限次重复两寡头削价博弈 Cont 由于在某个阶段出现与 H H 不同的结果以后博弈方1将永远采用L 此时博弈方2也只有一直选择L 因此博弈方2对博弈方1触发策略的最佳反应策略的后半部分与触发策略的后半部分是一样的 现在最关键是要确定博弈方2在第一阶段的最优选择 28 无限次重复两寡头削价博弈 Cont 如果博弈方2采用L 但以后博弈方1一直采用L的报复 自己也只能一直采用L 得益永远为1 总得益现值为如果博弈方2采用H 则在第一阶段它将得4 下一阶段又面临同样的选择 若记V为博弈方2在该重复博弈中每阶段都采用最终的总得益现值 总得益现值为或者因此 当因此当时 此触发策略纳什均衡策略 最佳策略是H 同样如此二阶段 三阶段 最佳是H 证毕 29 无限次重复两寡头削价博弈 Cont 再证明触发策略是子博弈完美Nash均衡 由于无限次重复博弈的子博弈还是无限次重复博弈 其推理完全一样 因此是是子博弈完美Nash均衡 30 无名氏定理 folktheorem 如果博弈重复无限次 或者每次结束的概率足够小 如果 充分接近1 任何个人理性可行支付向量都可以作为子博弈精炼纳什均衡结果出现 31 4 3 3无限次重复古诺模型 一 古诺模型的无限次重复博弈和支持垄断产量的条件假定 边际成本都为2 在一次性博弈中唯一的Nash均衡 2 2 古诺产量用qc表示 如果只有一个垄断厂商 垄断产量qm 3 Nash均衡的总产量4大于垄断产量3 各厂商生产垄断产量的一半1 5 双方得益都会增加 但一次性博弈不能实现 那么 在无限次重复古诺模型中 能实现吗 可以证明 在无限次重复古诺模型中 当贴现率满足一定条件时 两厂商采用下列触发策略构成一个子博弈完美纳什均衡 32 触发策略 在第一阶段生产垄断产量的一半1 5 在第t阶段 如果前t 1阶段结果都是 1 5 1 5 则继续生产1 5 否则生产古诺产量2 如果采用上述触发策略 每阶段生产产量 1 5 1 5 每阶段双方得益为设厂商1已采用该触发策略 若厂商2也采用该触发策略 则每期得益4 5 无限次重复博弈总得益的现值为 33 Cont 如果厂商2偏离上述触发策略 则他在第一阶段所选产量应为给定厂商1产量为1 5时 自己的最大利润产量 即满足 解得 此时利润为5 0625 高于触发策略第一阶段得益4 5 34 Cont 但从第二阶段开始 厂商1将报复性地永远采用古诺产量2 这样厂商2也被迫永远采用古诺产量 从此得利润4 因此 无限次重复博弈第一阶段偏离的情况下总得益的现值为 当上述策略是厂商2对厂商1的同样触发策略的最佳反应 否则偏离是最佳反应 35 补充 36 37 例题 假定两家企业A与B之间就做广告与不做广告展开博弈 它们的报酬矩阵如下 38 如果博弈是重复的 但我们不考虑无限次的情形 假设只进行10次对局 再假定企业A采取的是 以牙还牙 的策略 并在第一次对局中不做广告 企业B也将采取 以牙还牙 的策略 对企业B 考虑两种不同的情况 在第一次做广告或第一次不做广告 分别计算这两种情况下企业B的累计利润 试问企业B将如何行动 39 假如B在第一次做广告 则B获利300 A获利为0 企业A采取 以牙还牙 的策略在第二次对局中也做广告 则两者的获利各为100 因为企业A已经做广告此时企业B不能以降低利润为代价不做广告 所以企业B累计利润300 100 9 1200 即 不做 做 做 做 做 做 40 企业B第一次不做广告 在理性人的假设下两者在今后会出现追求私利的现象 有限次数的重复博弈不能改变囚徒困境原来的均衡结果 企业B的累计利润可能为200 100 9 1100 即 不做 不做 做 做 做 做 41 4 3 4有效工资率 EfficiencyWages 模型设定 首先厂商选择工资率为 然后工人选择接受或拒绝 如果拒绝 则他作个体户得到收入小于 如果接受 则工人选择努力工作 负效用 还是偷懒 无负效用 厂商只能看到产量高低 高产量为 低产量0 再假设工人努力工作时一定是高产量 不努力时却并不一定是0 而是高产量的概率为 低产量0的概率为 工人努力工作时 厂商得益为 工人得益为 工人偷懒时 厂商期望得益为 工人得益为 42 Cont 上述模型是一个完全信息动态博弈 在一次性博弈中 通常厂商要预付给工人部分工资 或者即使不努力工作 由于政策原因也必须支付工资 于是工人必然偷懒 由于厂商了解到这种思路 厂商也不会去雇佣一个不努力的工人 因此必然选择w 0 那么对工人也不利 下面分析这种动态博弈的重复 情况怎样 43 Cont 在无限次重复博弈中 相当于工人是长期雇佣 而非临时工 这时 厂商可以考虑先支付高工资 并威胁一旦产量低就解雇工人 使工人努力工作 或者采用计件工资或者采用产量合同注 这些方法都有一定不足 没有一定的基本工资率 效果是不理想的 44 考虑如下的触发策略 厂商在第一阶段给工资率 在第t阶段 如果前面t 1阶段结果都是则继续给 否则从此永远是 工人的策略是如果则接受 否则宁愿作个体户得到 并在以前各期结果都是和当前工资率为时努力工作 否则偷懒 注意 对厂商来讲 先试图合作 如果工人不合作 就惩罚 对工人来讲 它是原动态博弈中第二个选择方 不但能根据前面各阶段的结果选择 还能根据厂商当前阶段是否偏离合作进行决策 并且选择有两个 是否接受和是否努力 45 在什么条件下 双方采用上述触发策略构成子博弈完美Nash均衡 设厂商已采用上述触发策略 由于 工人接受工作是最佳反应 用记工人努力工作时无限次重复博弈得益的现值 则即如果工人偷懒 高产出的概率为p 低产出的概率为1 p 出现高产出仍会给工资 出现低产出永远被解雇 工人得到收入为 用记工人选偷懒时无限重复博弈得益的现值 则 即 46 Cont 因此当即时 努力是工人的最佳选择 反过来 设工人已采用上述触发策略 若厂商给的工资率满足上式条件 并且威胁一旦产量降低就解雇工人 则各阶段的得益为 无限次重复博弈得益现值为 若不愿给 则解雇工人 以后得益为0 因此只要 厂商选择前述触发策略就是最佳反应 47 综上所述 在满足的条件下 双方的触发策略构成一个纳什均衡 而上述两式实际上意味着即工人努力的产出扣除努力负效用后的剩余 必须不小于工人作个体户的收入即机会成本 加上一定比例的取决于努力负效用 贴现系数和偷懒可能得高产量概率的附加部分 最后这个不等式正是存在有效工资率 工作激励有效的基本条件 48 进一步研究 1 对双方的触发策略构成一个纳什均衡的条件 或进行计量模型研究 2 工人一次性偷懒 被厂商解雇的可能性有多大 3 厂商不止一个 有多个时 厂商市场是完全竞争的 4 工人有多个时 某个工人一次性偷懒 被厂商解雇的可能性有多大 5 低水平的合作 结果怎样 6 加大惩罚力度和提高合作水平 结果怎样 49 4 3 5信用 trust 为什么要讲信用 一次博弈时的策略选择 重复博弈中的策略选择 据 江苏经济报 2002年3月26日报道 中国企业联合会理事长张彦宁透露 中国每年因为逃废债务造成的直接损失约为1800亿 由于合同欺诈造成的直接损失约为55亿 产品质量低劣和制假售假造成的直接损失至少为2000亿 由于 三角债 和现款交易增加的财务费用约为2000亿 50 如何让人们讲信用 突然选择不讲信用的总收益R 5一直讲信用的收益R 3 3 3 2 3 n 3 1 在什么条件下会选择不讲信用 冷酷战略 51 如何让人们讲信用 信用 第三方强制 法律 信誉机制 52 如何让人们讲信用 第一个是产权制度 无恒产者无恒心 无恒心者无信用 要规范市场一定要规范政府行为 尽量减少政府部门的交易行为要求一个很好的信息传输体制 强调法律的作用提高个人的组织化程度 53 4 3 6若干建议与启示 若干建议不要嫉妒不要首先背叛对合作和背叛都要给于回报 assoonaspossible 不要耍小聪明若干启示合作的基础不是真正的信任 而是关系的持续性为避免 怨怨相报何时了 一个更好的策略可能是一报还9 10报相爱总是简单 相处却是太难 无限次重复博弈 54 合作的进化 修订版 是行为领域的经典之作罗伯特 阿克塞尔罗德 55 深刻的洞见 合作的基础不是真正的信任 而是关系的持续
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025保洁公司住宅小区物业清洁聘用合同
- 2025版食堂外包服务项目合同
- 2025年度高性能金属制品采购及售后维护服务合同
- 2025保安外包服务合同样本-临时性安保需求
- 2025年度环保节能打印机租赁与售后服务合同
- 2025版外墙清洗工程设计与施工合同
- 新能源产业2025年私募股权投资热点:退出策略与风险控制研究报告
- 2025版商标注册代理及品牌维权服务合同
- 2025年度墙纸行业上下游产业链合作合同
- 智能交通系统交通流量预测与城市交通流优化策略
- 湘教版九年级美术教学计划(三篇)
- 紧急宫颈环扎术的手术指征及术后管理-课件
- “三重一大”决策 标准化流程图 20131017
- Cpk 计算标准模板
- 信息科技课程标准新课标学习心得分享
- 小学生元宵中秋猜谜语竞赛题目
- 环保与物业公司合作协议
- FZ/T 01057.2-2007纺织纤维鉴别试验方法 第2部分:燃烧法
- 面条制品-课件
- 四上科学第一单元《多样的动物》知识梳理
- 微观经济学-范里安varian中级
评论
0/150
提交评论