




已阅读5页,还剩61页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
不完全信息动态博弈,不完全信息动态博弈,4.1 精炼贝叶斯纳什均衡 4.2 信号传递博弈及其应用举例 4.3 精炼贝叶斯均衡的再精炼 4.4 不完信息重复博弈与声誉模型 4.5 博弈论均衡概念简要总结,4.1.1不完全信息动态博弈简述,自然首先选择参与人的类型,然后参与人开始行动。参与人行动有先后,后行动者通过观测到先行动者的行动,修正对其类型的先验概率,选择自己的最优行动。 博弈过程是参与人选择行动和参与人不断修正信念的过程。 精炼贝叶斯均衡是不完全信息的基本概念,是完全信息动态博弈子博弈精炼纳什均衡和不完全信息静态博弈贝叶斯均衡的结合。,4.1.1市场进入阻挠,假定有两个时期,t=1,2. 假定在位者有两个可能的类型:低成本和高成本。概率分别为u和1-u。 t=1时期,在位者可选的价格4,5,6。 高成本和低成本在位者的单阶段最优垄断价格分别为p=6和p=5。 进入成本为2;进入后进行库诺特博弈(对称和非对称)。 目标:在位者高成本,则进入;否则,不进入。,4.1.1市场进入博弈,4.1.1市场进入阻挠,当且仅当进入者认为在位者是高成本的概率大于1/2时,选择进入。 第二阶段与不完全信息静态博弈不同:进入者会修正在位者成本函数的先验概率u;在位者会考虑价格的信息效应。 若 ,贝叶斯均衡:进入者选择不进入;高成本在位者选择p=6,低成本在位者选择p=5. 子博弈精炼纳什均衡无法直接用:不完全信息只有一个子博弈,所有均衡都是子博弈均衡。,4.1.1精炼贝叶斯均衡,精炼贝叶斯均衡(perfect liayesian equilibrium)是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断的结合。它要求:(1)在每个信息集上,决策者必须有个定义在属于该信息集的所有决策结上的个概率分布(信念);(2)给定该信念集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;(3)每一个参与人根据贝叶斯法则和均衡战略修正后验概率。,4.1.2贝叶斯法则,统计学上,修正之前的判断称为“先验概率”,修正之后的概率称为“后验概率”。 贝叶斯法则是人们跟据新信息从先验概率得到后验概率的基本方法,4.1.2贝叶斯法则,我们假定参与人的类型是独立分布的。假定参与人i有K个可能的类型,有H个可能的行动。我们用 和 代表一个特定的类型和一个特定的行动(因为我们现在只考虑一个参与人,我们省略了下标i)。那么,i选 的边缘率是:,4.1.2贝叶斯法则,在均衡路径上, ,但是,在非均衡路径上, ,贝叶斯公式的分母为零因而贝叶斯公式在非均衡路径上给出的条件概率是型的数,是不确定的。所以,在非均衡路径,信念形成不受贝叶斯法则的制约,但也不是任意的,因为对于精炼贝叶斯均衡来说,非均衡路径上的信念与均衡路径上按贝叶斯法则决定的信念一起共同决定局中人在每一个信息集上的行动选择所构成的战略组合是精炼贝叶斯均衡。正是在均衡路径上我们按贝叶斯法则决定信念,所以称这种精炼均衡概念为贝叶斯纳什均衡。,4.1.2贝叶斯法则举例,把所有人划分为好人GP和坏人BP两类,所有的事划分为好事GT和坏事BT两种。 一个人干好事概率为 ProbGT=p(GT|GP)p(GP)+p(GT|BP)p(BP) 如果一个人干了好事,那么这个人是好人的后验概率为: ProbGP|GT=p(GT|GP)p(GP)/Prob(GT),4.1.2贝叶斯法则举例,我们认为好人的先验概率为1/2. 第一种情况,这是一件非常好的事,好人一定干,坏人一定不干,则有: ProbGP|GT=(1*1/2)/(1*1/2+0*1/2)=1 第二种情况,这是非常一般的好事,好人会干,坏人也一定会干,则有: ProbGP|GT=(1*1/2)/(1*1/2+1*1/2)=1/2 第三种情况,介于上述两者之间,好人肯定会干,但坏人干的概率为1/2,则有: ProbGP|GT=(1*1/2)/(1*1/2+1/2*1/2)=2/3,4.1.2贝叶斯法则举例,如果我们观测到这个人干了一件坏事,我们相信,好人不会干坏事,只有坏人会干,则有 ProbGP|BT=(0*1/2)/(0*1/2+p*1/2)=0 或者 ProbBP|BT=(p*1/2)/(0*1/2+p*1/2)=1,4.1.3精炼贝叶斯均衡,定义:精炼贝叶斯均衡是一个战略组合,是一个 一个后验概率组合 满足: (P)对于所有的参与人i,在每一个信息集h, (B) 是使用叶斯法则从先验概率 得到,4.1.3精炼贝叶斯均衡,(p)是精炼条件:给定参与人的战略 和参与人i的后验概率 每个参与人i的战略在所有从信息集h开始的后续博弈上是最优的。是精炼纳什均衡的扩展,要求在后续博弈上够成贝叶斯均衡。 (B)是对应贝叶斯法则的运用。“可能的情况下”指贝叶斯法则对非均衡路径上行动a所对应的类型的后验概率没有定义。 精炼贝叶斯均衡是均衡战略和均衡信念的结合。是一个对应的不动点 后验概率依赖于战略,战略依赖于后验概率。不能用逆向归纳法,4.1.3市场进入博弈,4.1.3市场进入博弈,我们首先证明,不论先验概率声是多少,在第一阶段,高成本在位者选择单阶段最优垄断价格p=6和低成本在位者选择.单阶段最优垄断价格p=5不是一个精炼贝叶斯均衡。,4.1.3混同均衡,1首先考虑u1/2的情况。我们将证明,在这种情况下,精炼贝叶斯均衡是:不论高成本还是低成本,在位者选择p =5;进入者将进入.当只当她观测到p=6(基于 ) 2 给定两类在位者都选择p=5,进入者不能从观测到的价格巾得到任何新的信息,即u(5)=(1Xu)/(1Xu+1 X(1-u)=u1/2,进入的期姐利润是u(1)+(1-u)(-1)=2u-10,不进入的期望利润是0,因此不进入是最优的。 3 与均衡相容,小于1/2则不构成均衡。,4.1.3分离均衡,我们现在证明,如果u=1/2精炼贝叶斯均衡是:低成本的在位者选择p=4,高成本的在位者选择p=6;进入者选择不进入,如果观测到p=4; 选择进人,如果观测到p=4或p=5。 所有声u(5)=1/2与均衡是相容的,而所有不(u(5)=1/2不构成均衡因此,所假定的战略和后验概率是一个精炼贝叶斯均衡。,4.1.4不完美信息博弈的精炼贝叶斯均衡,在这个博弈中,有两个参与人,i=1,2。参与人1首先行动.选择L ,M或R如果他选择L,博弈结束,支付向量为(1,3);如果他选择M或R,参与人2选择U或B,但参与人2在作出自己的决策时并不知道参与人1是选择了M还是R,尽管他知道L没有被选择。 这个博弈有两个纯战胜各纳什均衡:(L, B)和(M,U),4.1.4不完美信息博弈的精炼贝叶斯均衡,4.1.4不完美信息博弈的精炼贝叶斯均衡,子博弈精炼均衡不能剔除(L,B). 参与人1选择M和R的概率分别p和1-p。 参与人2选择U的期望效用为: p1+(1-p) X2 =2-p 参与人2选择B的期望效用为: p0+(I一p) 1=1-p 精炼贝叶斯均衡为M,U;p=1。,4.1.4精炼贝叶斯均衡例2,考虑图4. 3,这里,有3个参与人,i=1,2,3。参与人1先行动,可以选择L或R如果他选择R ,参与人2可以选择U或B如果参与人2选择B.博弈结束;如果参与人2选择U,或参与人1选择1L(此时参与人2无选择),参与人3可以选择A或D,博弈结束。注意,当博弈进入参与人3的信息集时,参与人3不知道是参与人1选择了L还是参与人1选择了R、参与人2选择了U;因此,参与人3的信息集包含两个决策结。,4.1.4精炼贝叶斯均衡例2,4.1.4精炼贝叶斯均衡例2,两个纳什均衡(L,B,A)和(R,B,D) 精炼贝叶斯均衡为(R,B,D;p2/5),4.2信号传递博弈,信号传递博弈是一种比较简单但有广泛应用意义的不完全信息动态博弈,在这个博弈中,有两个参与人,i=1,2;参与人1称为信号发送者,参与人2称为信号接收者(因为他接收估号);参与人1的类型是私人信息,参与人2的类型是公共信息(即只台一个类型)。博弈的顺序如下: 1“自然“首先选择参与人1的类型,参与人1知道,但参与人2不知道,只1属于的先验概率。,4.2信号传递博弈,参与人1在观测到类型后选择发出信号m。 参与人2观测到参与人1发出的信号m,使用贝叶斯法则计算后验概率,然后选择行动 支付函数分别为u1(m,a,)和u2(m,a, ),4.2信号传递博弈,4.2信号传递博弈的精炼贝叶斯均衡,定义:信号传递博弈的精炼贝叶斯均衡是战略组合(m*(), a*(m)和后验概率p( |m)的结合,它满足: 1 2 是使用贝叶斯法则得到,4.2信号博弈的分离均衡,分离均衡(separating equilibrium):不同类型的发送者(参与人1)以1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号。在分离均衡下,信号准确地揭示出类型。,4.2信号博弈的混同均衡,混同均衡(pooling equilihrium):不同类型的发送者(参与人1)选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号,因此,接收者(参与人2不修正先验概率(参与人1的选择没有信息量)。,4.2信号博弈的准分离均衡,准分离均衡(semi-separlling equilibrium):一些类型的发送者(参与人1)随机地选择信号.另一些类型的发送者选择特定的信号。,4.2.1米尔格罗姆-罗伯茨垄断限价模型,假定有两个阶段,两个企业。在第一阶段,企业1(在位者)是一个垄断生产者,选择价格p1;在第二阶段,企业2(进入者)决定是否进入,如果企业2进入,市场双寡头竞争;否则,企业1继续保持垄断地位。企业1有两个潜在类型:高成本或低成本;高成本(H)的概率为u(H),低成本(L)的概率为1-u(H)。,4.2.1米尔格罗姆-罗伯茨垄断限价模型,在第一阶段,企业1知道自己的类型a,企业2不知道a。为了简单起见,让我们假定。在第二阶段,企业2一旦进入,就得知a,因此第二阶段的寡头价格独立于第一阶段的价格p1,4.2.1垄断限价模型的分离均衡,两个必要条件,即类型H的在位者不愿选择类型L的均衡价格,类型L在位者也不愿选择类型H的均衡价格。然后,我们描述进入者非均衡路径上的后验概率使得投有任何类型的在位者有兴趣偏离均衡价格。我们将看到,分离均衡的必要条件同时也是充足条件:必要条件决定的价格即是均衡价格(这里讲的均衡价格是指精炼贝叶斯均衡的均衡价格,而不是使供求相等的均衡价格;浅们假定,所有的可行的价格都是使供求相等的价格)。,4.2.1垄断限价模型的分离均衡,高成本在位者不会选择低成本在位者的均衡价格 低成本在位者的均衡价格为 应满足:,4.2.1垄断限价模型的分离均衡,为了使分析有意义,我们假定不存在对 分离均衡,即:如果 ,高成本的在位者也将选择对:,4.2.1垄断限价模型,4.2.1垄断限价模型的混同均衡,混同均衡存在的条件是 即如果进入者得不到新的信思,就选择不进入(因为期望利润小于0。如果L述条件不成立,在混同均衡下.进入者会选择进入(因为期望利润大于0);因为混同均衡不能阻止进入,在位者的最优选择是短期垄断价格,4.2.2用负债比例显示企业质量,在罗斯模型中.企业经理知道企业利润的真实分布函数,投资者不知道;企业利润分布函数是根据一阶随机占优 假定有两个时期,两个参与人(经理和投资者).令二为企业第二时期的利润,二在区间0,a上均匀分布;经理知道a.但投资者只知道a的概率分布(因此a是企业的类型)。在时期1,经理首先选择负债水平。.投资者然后根据观测到的负债水平D决定企业的市场价值v0;在时期2,企业利润实现。(从博弈i仑的角度看,第一时期包含两个博弈阶段;第二时期对我们的分析n.不重要的。,4.3精炼贝叶斯均衡再精炼,解决的问题 如何规定非均衡路径上的后验概率? 精炼贝叶斯均衡的精炼条件剔除了不可置信战略,但没有剔除不可置信信念(后验概率)。 后验概率的任意性导致了均衡结果的任意性。,4.3.1剔除劣战略,它的基本思想是,在一个博弈中,如果对f某些类型的参与人,存在某些行动或战略劣于另一些行动或战略,而对于另一些类型的参与人这点不成立,那么,当其他参与人观测到前一类行动时,他不应该以任何正的概率认为选择该行动的参与人属于前1类参与人。对非均衡路径后验概率的这个简单限制可以大大减少精炼贝叶一斯均衡的数量,4.3.1剔除劣战略,4.3.1剔除劣战略,两个纯战略精炼贝叶斯均衡:(M,U;u=1)和(L,B;u1/2),4.3.1剔除劣战略,4.3.2直观标准,4.3.2直观标准,4.3.3序贯均衡,粗略地讲,克瑞普斯一威尔逊序贯均衡的基本思想是,在子博弈精炼纳什均衡或贝川一斯均衡概念卜增加一个新的要求,这个新的要求是:在博弈到达的每一个信息集上(不论该信息集在均衡路径还是非均衡路径,参与人的行动必须由某种有关之前发生的事情(自然选择了什么类型或先行动者选择了什么行动)的信念(概率)“合理化”,4.3.3序贯均衡,克瑞警斯和威尔逊处理非均衡路径土后验概率的办法是:首先假定,在每一个信息集上,参与人选择严格混合战略(strictly mixed Strategies,即以严格正的概率选择每一个行动),从而博弈到达每一个信息集的概率严格正,贝叶斯法则在每一个信息集上都有定义;然后将均衡作为严格混合战略组合和与此相联系的后验概率的序列的极限。这样,检在一个战略组合和后验概率是否是一个均衡就变成一个纯技术性问题:亡是否是某个严格棍合战略组合和与此相联系的后验概率的序列的极限。,4.3.4泽尔腾的颤抖手均衡,纳什均衡:(U,R)和(D,L) 颤抖手均衡:(U,R),4.3.4颤抖手均衡定义不足,4.3.4颤抖手均衡定义不足,4.3.4颤抖手均衡引入代理人,4.3.4颤抖手均衡总结,颤抖手均衡一定是序贯均衡 如果均衡战略与非均衡战略的无差异不存在,颤抖手均衡与序贯均衡相同 所有的有限博弈中,至少存在一个颤抖手均衡。,4.4.1KMRW声誉模型,囚徒1有两种类型,理性的或非理性的,概率分别为(1一p)和p为简单起见,假定囚徒2只有一种类型,即理性的。假定理性的囚徒可以选择任何战略。非理性的囚徒由于某种原因只有一种战略,即针锋相对“开始选择“抵赖”,然后在,阶段选择囚徒2在t一1阶段的选择(即“你抵赖我就抵赖.你坦白我就坦白”)。博弈的顺序如下: 自然首先选择囚徒1的类型;囚徒1知道自已的类型,囚徒2只知道囚徒1属于理性的概率 ; 2. 两个囚徒进行第一阶段博弈; 3. 观测到第一阶段博弈结果后,进行第二阶段博弈;观测到第二阶段博弈结果后,进行第二阶段博弈;如此等等。 4. 理性囚徒1和囚徒2的支付是阶段博弈的支付的贴现浪之和(为了简单起见。我们假定贴现因子为1)。,4.4.1KMRW声誉模型,4.4.1KMRW声誉模型,如果选择X=D,囚徒2的期望: p(-1)+(1-p)(-10)+p*0+(1-p)(-8)=17p-18 如果选择X=C,囚徒2的期望: p*0+(1-p)(-8)+(-8)=8p-16
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年潍坊工商职业学院人才引进计划(70人)模拟试卷附答案详解(黄金题型)
- 2025年甘肃畜牧工程职业技术学院招聘工作人员15人考前自测高频考点模拟试题及答案详解(历年真题)
- 2025江苏苏州千灯镇招聘镇属公司工作人员拟录用笔试历年参考题库附带答案详解
- 2025湖南张家界市市场监督管理局招聘公益性岗位人员1人模拟试卷及完整答案详解1套
- 2025陕西西安市建总工程集团3月招聘笔试历年参考题库附带答案详解
- 2025重庆演艺集团招聘综合管理宣传推介策划执行等岗位招聘5人笔试历年参考题库附带答案详解
- 2025广西南宁市江南区翠湖路小学春季学期临聘教师招聘1人模拟试卷及参考答案详解
- 2025贵州黔凯城镇建设投资(集团)有限责任公司招聘工作人员缴费成功人数与招聘岗位人数达不到31比例岗位(截止9月17日1700)笔试历年参考题库附带答案详解
- 2025年德阳市事业单位公开考试招聘工作人员笔试模拟试卷附答案详解(黄金题型)
- 2025年4月四川乐山昶康心血管病医院招聘医护人员12人考前自测高频考点模拟试题有答案详解
- 政府人员网络安全培训课件
- GB/T 45906.8-2025变电站二次系统第8部分:电气操作防误
- 2024年安徽九华山旅游发展股份有限公司招聘笔试参考题库附带答案详解
- B级英语词汇表修改版
- 2024年山西省成考(专升本)大学政治考试真题含解析
- 最高法院第一巡回法庭关于行政审判法律适用若干问题的会议纪要
- 足球场的运营可行性方案
- GB/T 2881-2023工业硅
- 有限合伙份额质押合同完整版(包含质押登记公证手续)
- GB/T 43299-2023机动车玻璃电加热性能试验方法
- 马工程经济法学教学
评论
0/150
提交评论