版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
简明博弈论教程第七章
重复博弈:对称信息简明博弈论教程本章提要第一节重复博弈中的合作均衡第二节无名氏定理第三节重复博弈的其他一些策略均衡第四节一些经典的应用例子3第一节重复博弈中的合作均衡第七章重复博弈:对称信息4重复博弈给出重复博弈定义之前,需要做若干准备,一个准备就是由于重复博弈有可能会进行一个很长的时期,甚至是无穷期,因而必须考虑收益的时间价值。相应的表达偏好的收益函数也需要给出一定的限制。5重复博弈明天的一元钱和今天的一元钱价值是不一样的,最简单的理由是今天的一元钱如果存入银行那么在明天会变成1+r,所以明天的一元钱只相当于今天的1/(1+r)元钱,1/(1+r)实际上就是经济学中的贴现率。如果假设未来没有不确定性,定义:6重复博弈未来存在收益流R1,R2,R3,…,那么这个未来收益流的贴现值之和就为7有限次重复博弈为了在理论上容纳合作解,一个重要的方法就是在重复博弈中引入多重均衡。现在,我们不妨考虑两阶段信用博弈,但对信用博弈做出修改,即阶段博弈G存在多个纳什均衡的情况,如表所示,不妨称为信用困境1。信用困境1与原信用困境不同的地方是人为构造了一个新的纳什均衡——(中,中),因而这个阶段博弈存在两个纳什均衡——(欺骗,欺骗)和(中,中)。8有限次重复博弈9商人2诚信欺骗中商人1诚信4,40,50,0欺骗5,01,10,0中0,00,03,3与原信用困境一个重要的不同是合作解有可能成为子博弈完美均衡解在重复博弈中出现。在证明之前,请同学们想一想(逆推法)。我们首先从信用困境1的第二阶段开始。在第二阶段,(欺骗,欺骗)和(中,中)都是阶段博弈G的纳什均衡,因而“策略组合”[(如果对手诚信,选择中;如果非诚信,选择欺骗),(如果对手诚信,选择中;如果非诚信,选择欺骗)]是子博弈G(1)的一个纳什均衡。把这一均衡策略下对应的收益代入第一阶段,就得到下表。有限次重复博弈11商人2诚信欺骗中商人1诚信7,71,61,1欺骗6,12,21,1中1,11,14,4表中显然存在着3个纯纳什均衡:(欺骗,欺骗)、(中,中)和(诚信,诚信)。根据逆推法,这3个纯纳什均衡都是信用困境1重复博弈的子博弈完美均衡解。前两个完美均衡都简单地由两个阶段博弈的纳什均衡组成,但第三个纳什均衡结果却由一个非纳什均衡(第一阶段)和一个纳什均衡(第二阶段)组成。它对应着的子博弈完美均衡结果为[(诚信,诚信),(中,中)],与前两个完美均衡本质不同的地方是合作解(诚信,诚信)在第一阶段中出现了。实际上,如果G是一个有着多重纳什均衡的完全信息静态博弈,则重复博弈G(T)就可能存在子博弈完美均衡解,其中对每一个t<T,第t阶段的结果都不是G的纳什均衡。13这就从一个方面揭示了为什么合作解能够在重复博弈中出现,因为合作得到奖励,不合作受到惩罚,因而每一方都会加以遵守。在人类社会中,这种奖励与惩罚机制可以通过国家意志——法律的形式得到实现,从而为人类的合作提供一种制度上的保障。所谓的契约社会,就是通过法律、道德的形式来实现这种诚信(遵守契约规定)。14无限重复信用博弈
合作解要在有限重复博弈中出现要求阶段博弈G必须存在多重纳什均衡,但在无限重复博弈中这一条件并不是必需的:即使阶段博弈G只存在唯一纳什均衡(甚至不存在纯纳什均衡),无限重复博弈中也存在子博弈完美均衡解,其中没有任何一个阶段结果是G的纳什均衡。根本的原因就在于如果博弈是无限重复的,当充分接近1,即人们有足够的耐心,那么考虑长远利益就要好于短视。
无限次重复博弈为了说明上述观点,我们仍然考虑信用困境博弈,但它无限次地进行下去。每一阶段都重复纳什均衡(欺骗,欺骗)显然是无限重复信用困境的子博弈完美均衡,问题是还存在着其他“更好”的子博弈完美均衡吗?这里我们考虑三个常见的策略:触发策略(Triggerstrategy),有限惩罚策略(Limitedpunishmentstategy)和一报还一报策略(Titfortatstrategy)。16第二节无名氏定理第七章重复博弈:对称信息17帕累托最优如果一群人按照一定的规则分配一定数量的财富或资源,当任意改变这个规则时,都会使得一些人的收益(所得、效用、收入)等减少,则称这种分配规则是帕累托最优原则(或帕累托最优状态)。18合作如果一群人(或者企业、团体、组织甚至国家、国际联盟等)之间就某种财富或资源的分配处于帕累托最优状态,我们就惩处预期中的人们是“合作”的。19囚徒困境博弈20B坦白抵赖A坦白-8,-80,-10抵赖-10,0-1,-1无名氏定理无名氏定理(FolkTheorem)即在重复博弈中,只要博弈人具有足够的耐心(贴现因子足够大),那么在满足博弈人个人理性约束的前提下,博弈人之间就总有多种可能达成合作均衡。存在无穷多对有限自动机策略,可以成为无限重复博弈的平衡点,并同时实现双方的合作。无名氏定理之所以得名,是由于重复博弈促进合作的思想,早就有很多人提出,以致无法追溯到其原创者,于是以“无名氏”命名之。21无名氏定理我们知道,单凭理性计算,有限次重复博弈,是解决个体理性与集体理性之间矛盾的。在无限重复博弈中,行为规则可以用自动机来代表,于是不同行为规则的相争,便成了机器与机器的角斗。假设甲和乙玩无限重复的囚犯博弈。22无名氏定理甲相信《美德的起源》一书作者的教导,认定仁厚忠恕既高尚又有效,于是以它为策略。乙信奉理性流氓主义,崇尚实力和实利,于是以流氓主义为策略。这样,二人间的博弈,就可以看作恕道机器与流氓机器的争斗。23无名氏定理我们可以推演出各个回合双方的行为如下:第一回合,甲仁厚玩合作H,乙宰客玩欺骗D;第二回合,甲报复玩欺骗D,乙仍然宰客玩欺骗D;第三回合,甲仍报复玩欺骗D,乙发现甲并非傻客,于是玩合作H;第四回合,甲原谅乙,玩合作H;乙却因甲上次不合作,回头玩欺骗D宰客24其它结论如果博弈G是有限博弈,最小最大支付组合向量为y=(y1,y2,…,yn),可行集里的任一点为x,并且x>y,则存在A>0使a>A时重复博弈存在纳什均衡,其平均支付组合为x。25第三节重复博弈的其他一些策略均衡第七章重复博弈:对称信息26无限次重复博弈的一次偏离定理如果在无限次重复博弈的阶段博弈中,任意两个不同的策略组合给任意参与人带来的支付之差的绝对值存在上限,则一个策略组合是子博弈精炼纳什均衡的充要条件是该策略组合满足一次偏离性质。27应用:为什么关于成为神关羽成为神不是因为武功高强;关于存在性格缺陷;对于关羽的造神运动始于满清之前;关羽成为神的原因是其义的行为规范;关羽的义是一报还
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中职(汽车运用与维修)汽车漆面修复试题及解析
- 2025年高职(冷链物流技术)冷链运输管理试题及解析
- 2025年大学(中西医临床医学)精准中西医结合医学试题及答案
- 2025年中职机电技术应用(电工仪表使用)试题及答案
- 2025年大学(预防医学)流行病学阶段测试题及解析
- 2025年大学植物保护(植物保护)试题及答案
- 2025年高职托育基础(托育基础)试题及答案
- 2025年高职通信技术(5G技术应用)试题及答案
- 2025年中职艺术(艺术基础应用)试题及答案
- 2026年河南农业职业学院单招职业技能笔试参考题库带答案解析
- 2025年天津科技大学毛泽东思想和中国特色社会主义理论体系概论期末考试模拟题及答案1套
- 南方航空安全员培训
- 2025-2026学年岭南美版(新教材)初中美术七年级上册期末综合测试卷及答案
- DB11∕T 2398-2025 水利工程巡视检查作业规范
- 2025秋国家开放大学《政府经济学》期末机考精准复习题库
- PCB设计规范-MD元器件封装库尺寸要求
- 脱硫塔制作安装施工技术方案
- 心身疾病护理科普要点
- 2025-2026学年辽宁省辽南协作校高二数学第一学期期末检测试题含解析
- 校外辅导员培训
- 2025年大学《应急管理-应急管理法律法规》考试参考题库及答案解析
评论
0/150
提交评论