




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 合作博弈和非合作博弈 合作博弈:也称正和博弈,参与人中至少有一人利益增加,同时其他参与人的利益不受损,重点是研究如何分配合作得到的利益。 非合作博弈:包括零和博弈和负和博弈,研究人们在利益相互影响的局势中如何选择决策是自己的受益最大化。 非合作博弈又分为:完全信息静态博弈(纳什均衡),完全信息动态博弈(子博弈精炼纳什均衡),不完全信息静态博弈(贝叶斯纳什均衡),不完全信息动态博弈(精炼贝叶斯纳什均衡) 2、静态博弈和动态博弈 静态博弈:指在博弈中参与人同时选择行动,或是后行动者不知道先行动者采取了什么具体行动。 动态博弈:指在博弈中,参与人的行动有先后顺序,且后行动者能观察到先行动者所选择的行为。 3、一个策略通常被定义为意图实现一个具体目标的行动计划。参与人i的一个纯策略是一个确定的行动计划。参与人i的所有纯策略组成的集合标示为 Si 。纯策略剖面(组合)(a profile of pure strategies) s=(s1,s2,sn) 描述了一个由博弈中所有n个参与人所选纯策略的一个具体的组合,其中对于所有的 i=1,2,n siSi 4、标准式博弈正式的定义 标准式博弈包括以下三个部分: 参与人的一个有限集,N=1,2,n。 纯策略集合的一个合集 S1,S2,Sn 。 支付函数的集合 v1,v2,vn ,其中每一个支付函数 vi(s1,s2,sn)R 都将一个支付值赋予到选定策略的每一个组合上,也即函数vi: S1S21SnR 的集合,其中 iN 。 5、 解概念是分析和预测博弈的一种方法,我们先对参与人的行为和信念进行假设,根据假设将所有可能的结果分成“更有可能”和“不那么可能” 5. 2 均衡分析 均衡是对于任意一个可以作为解概念预测之一而出现的策略剖面,是可能的预测,在一个博弈中可能有数个均衡预测。 均衡分析所需假设: 参与人是“理性的”:参与人选择其行动 siSi 以最大化其支付,从而与博弈中体现的信念相一致。 参与人是“智能的”:一个智能的人了解博弈的一切:行动、结果,以及所有参与人的偏好。 共同知识:每个参与人是理性和智能的事实在博弈的所有参与人间是共同知识。 -自执行(self-enforcement):解概念的任何预测(或均衡)都必然是自执行的 自执行的这一条件是我们分析的核心,也是非合作博弈理论的核心。我们将假设参与人是在以下意义上从事非合作行为的:每个参与人都能控制其自身的行动,只有在他发现一个行动能带给他更大利益时才会坚持这一行动。也就是说,如果一个策略剖面是一个均衡,我们要求给定其他人的选择之后每一个参与人对自己的选择总是满意的。你可能已经看出,在囚徒困境博弈中剖面(F,F)是自执行的:每个参与人对于选F都很满意。事实上,我们将会看到就均衡分析而言,这是一个非常稳健的结论。 如果将博弈看成是对环境的一个完备描述的话,自执行均衡的条件是很自然的。如果还有一些外部的其他团体可以通过势力或禁令的运用来执行策略剖面,那么这个我们在分析的博弈可能并没有对真正的环境给出充分的描述。在这种情况下,我们应该将第三方也作为一个参与人纳入到博弈模型中来,他也是具有可以执行的行动或策略的。 6、几种符号表达 支付函数:把参与人i从策略剖面s=(s1,s1,si-1,si,si+1,sn)中得到的支付标示为vi(s);也可表述为s=(si,s-i),支付函数为vi(si,s-i)。 除参与人i外其他参与人所选行动的一个特定策略组合: s1,s1,si-1, si+1,snS1S2Si-1Si+1Sn 其中,S-i=S1S2Si-1Si+1Sn 6、2、劣势策略 定义:令siSi和 siSi是参与人i的两个可能策略。我们称si严格劣于Si,如果对于其他参与人策略的任一可能的组合s-iS-i,参与人i从si 中得到的支付总是严格小于从Si 中得到的支付。也就是说,对于所有的s-iS-i 有:visi,s-ivi(si,s-i) 我们用sisi来表示si严格劣于Si 。 理性参与人绝不会采取严格劣策略。 6、3、占优策略 严格占优策略:siSi是i的严格优势策略,如果i的每一其他策略都严格劣于它,也即对于所有的s-iS-i和siSi(sisi),有:vi(si,s-i)vi(si,s-i) 在理性假设下,若博弈中存在严格占优策略,则参与人一定会选择该策略。 严格占优策略均衡:策略剖面 sDS是严格优势(占优)策略均衡,如果s iDSi对于所有的iN都是严格优势策略。 7、1、重复剔除所需假设: 理性假设和理性的共同知识假设。 理性假设可以保证参与人不选择严格劣策略;而理性的共同知识可以使所有参与人忽略那些他们的对手不会采取的严格劣策略。这样参与人就能将博弈限定在更小的策略组合上。 而严格占优策略只需理性假设。 7、2、 严格纯劣策略的重复剔除(IESDS):在以上两个假设条件下,我们会问“一个理性的人不会做什么”,通过不断的剔除参与人的严格劣策略,最中得到博弈的解。 8、1 、最优反应 最优反应:策略siSi是参与人i针对其对手的策略s-iS-i的最优反应,如果 visi,s-ivisi,s-i siSi 一个相信其对手在采取某个策略s-iS-i的理性参与人总会针对s-i选择一个最优反应。 如果Si对于参与人i来说是一个严格劣策略,那么它不可能是任一s-iS-i的最优反应。 8、2命题:如果在一个有限的标准式博弈中, 是一个严格优势策略均衡,或者如果它是IESDS剔除过程之后剩下的唯一结果,那么 是 的最优反应。 8、3信念和最优反应对应 信念:参与人i的一个信念就是关于其对手的策略s-iS-i的一个可能的剖面。 给定一个参与人关于其对手策略的一个特定的信念,他将能够就该信念形成最优反应。最优反应可以是唯一的,如上述性别大战;有时最优反应策略不止一个。 8、4、可理性化 有了关于信念以及参与人针对其信念的最优反应这些概念,很自然下一步就是允许参与人就针对其对手当持何种信念进行推理。这一推理必须考虑所有参与人的理性、关于理性的共同知识以及所有参与人都试图猜出其对手行为的事实。 一个理性的参与人会只选择针对其对手的某一策略剖面的最优反应的那些策略。我们可以将所有那些绝不可能是最优反应的策略尽数剔除,从而得到一个可能“更小”的简缩博弈,它只包含能够在原初博弈中作为最优反应的那些策略。我们可以一而再、再而三的使用这种推理,最终经过这个过程得以剩下的策略剖面的集合被称为可理性化策略集。 9、1、纳什均衡定义:纯策略剖面s*=(s1*,s2*,sn*)S是一个纳什均衡,如果对于所有的iN,si*是s-i*一个最优反应,也即对于所有的siSi 和所有的iN有:vi(si*,s-i*)vi(si,s-i*) 9、2、严格优势、IESDS、可理性化和纳什均衡结果之间的关系 考虑一个策略剖面s*=(s1*,s2*,sn*)S。如果s*具备以下三种情况之一, 一个严格优势策略均衡, IESDS过程之后所剩下的唯一结果, 唯一的可理性化策略剖面, 那么 就是唯一的纳什均衡。 9、3、纳什均衡的条件如下: 每个参与人都根据其信念采取最优反应。 参与人关于其对手的信念是正确的。 第一个条件是理性的直接结果。第二个条件是非常严格的,也是对我们到目前为止所讨论条件的一个巨大的飞跃。第六章 混合策略一、策略、信念和期望支付 l 有限策略集 l 连续策略集 l 信念和混合策略 l 期望支付 二、混合策略纳什均衡 举例:硬币匹配 多重均衡:纯策略和混合策略 三、再议IESDS和可理性化 四、纳什存在性定理 纳什存在性定理 布劳沃尔不动点定理 最优反应对应的合集 角谷不动点定理 1、有限策略集 A、混合策略定义:令 Si=si1,si2,sim为参与人i的有限纯策略集。定义si为Si的单形(simplex),它是定义在Si上所有概率分布的集合。参与人i的一个混合策略即一个si的元素iSi,因此i=isi1,isi2,i(sim) 是定义在Si上的一个概率分布,其中i(si)是参与人i选择si的概率. 也就是说,参与人i的一个混合策略是其纯策略上的一个概率分布。有限元素集(有限状态空间,在我们这里即Si)上的任一概率分布i(),必然满足以下两个条件: -对于所有的siSi,有i(si)0, -siSiisi=1 。 也即,任一事件发生的概率必然是非负的,所有可能事件发生的概率之和必等于1。 要注意到,每个纯策略都是一个具有选择这个纯策略的概率为1的退化分布的混合策略,这个退化分布在其他所有纯策略上概率均为零。 B、支撑: 给定参与人i的混合策略i(),我们称纯策略siSi是i()的支撑(support),当且仅当它以正概率出现,即isi0 。 比如说,在石头剪刀布博弈中,参与人可以以相同的概率来选择石头或布,而不选择剪刀。在这种情况下,iR=iP=0.5,而iS=0。那么我说,R和P是 的支撑,而S不是 C、连续策略集:令Si表示参与人i的纯策略集,假设Si是一个区间。参与人i的混合策略是一个累积分布函数Fi:Si0,1,其中Fix=Pr(six)。如果Fi()是可微的,其密度函数为fi(),那么我们称siSi当fisi0时是Fi()的支撑。 D、混合策略的信念 参与人i的一个混合策略信念是由定义在其对手策略上的概率分布iS-i来给出。我们用i(s-i)来标示参与人i赋予其对手采取s-iS-i的概率。这样以来,参与人i的一个信念就是其对手策略上的一个概率分布。 E、期望支付 定义: 当参与人i选择纯策略siSi,且其对手采取混合策略-iS-i时,参与人i的期望支付是:visi,-i=s-iS-i-is-ivi(si,s-i) 同样的,当参与人i选择混合策略iSi且其对手选择混合策略-iS-i 时他的期望支付为: 2、混合策略纳什均衡 A、混合策略纳什均衡: 混合策略剖面*=(1*,2*,n*)S是一个纳什均衡,如果对于每一个参与人来说i*都是针对-i*最优反应。也就是说,对于所有的 iN ,vii*,-i*vii,-i* iSi 我们要求每一个参与人都选择策略i*Si ,这是他在其对手选择某个剖面i*S-i时所能选的最优选择(之一)。 命题:如果i*是一个纳什均衡,而且Si和Si是i*的支撑,那么 也即,如果一个参与人在两个备择项上随机化,那么他必然在二者之间无差异。 断言1: 一个参与人选择纯策略而其他人选择混合策略,这样的组合不可能是纳什均衡。 断言2 : 至少有一个人只在两个纯策略间进行混合,这样的纳什均衡也不可能存在。 B、多重均衡:纯策略和混合策略 3 再议IESDS和可理性化 通过引入混合策略,我们完成了两个推进:参与人可以有更丰富的信念,也可以选择更丰富的行动集。当我们重新考虑IESDS和可理性化概念时,使用混合策略给出其确切形式是很有用的。特别的,我们现在给出如下两个定义: 定义1 令 iSi和 siSi为参与人i的可能策略。我们称Si严格劣于i,如果 定义 2 策略iSi绝不可能是最优反应,如果对于参与人i来说没有信念-iS-i使得 iBRi(-i) 。 A、再议IESDS:在确定一个策略为严格劣策略上,我们不再要求其他一些纯策略优于它,而允许混合策略优于它。对于那些绝不可能是最优反应的策略而言,这一样是成立的。 B、可理性化:在剔除所有绝不可能是最优反应的策略之后,一遍一遍的以我们在IESDS中所做的同一种方式使用这种推理,剩下的策略被称为是可理性化策略集。 C、IESDS和可理性化之间的联系:如果策略 是严格劣策略,那么它绝不会是一个最优反应。它表明参与人可理性化的策略集不会比IESDS过程剩下的参与人策略集更大。也的确是这样的,因为如果使用IESDS可以将一个策略删去,那么通过可理性化过程它必然已经被剔除。 D、对于任一两参与人博弈,策略i是严格劣策略,当且仅当它绝不会是一个最优反应。 4 纳什均衡存在性定理 A、定理(纳什存在性定理) 任意一个对所有n个参与人而言有有限策略集Si的n-参与人标准式博弈,都有一个(纳什)混合策略均衡。 纳什均衡存在性定理的证明是以布劳沃不动点定理为基础的。 B、布劳沃尔不动点定理:如果f(x)是一个从定义域0,1映射到其自身的连续函数,那么存在至少一个值x*0,1使得fx*=x*。 也就是说,如果f(x)从区间0,1上取值,并从同样的区间产生出结果(或f:0,10,1),那么必有某个x*0,1使得f()在x*
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 28803.1-2025消费品安全风险管理第1部分:导则
- GB/T 18204.5-2025公共场所卫生检验方法第5部分:集中空调通风系统
- 社区财务印章管理制度
- 美国生产维修管理制度
- 经营公司计划管理制度
- 幼儿园五常管理制度
- 干果店店员管理制度
- 群防群治教育管理制度
- 小作坊疫情管理制度
- 职工之家活动管理制度
- 2024年福州第十一中学招聘笔试真题
- 小学生反分裂课件
- 外科病房医院感染防控工作职责
- DB34∕T 3262.2-2018 普通公路养护预算 第二部分:定额
- 2025年省定远县第三批“曲阳雁归”工程公开招录50名村(社区)干部高频重点提升(共500题)附带答案详解
- 旅游学概论(李天元)课件
- 大数据技术原理与应用-林子雨版-课后习题答案(文档).文档
- 《特种设备安全管理员》考试通关题库(600题 含参考答案)
- 油罐换底工程施工及方案
- 2024年贵州省黔南州事业单位历年管理单位遴选500模拟题附带答案详解
- 《档案信息化建设》课件
评论
0/150
提交评论