版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博弈论知识總結博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行為发生直接互相作用時的决策以及這种决策的均衡問題。博弈论研究的假设:决策主体是理性的,最大化自已的收益。完全理性是共同知识每個参与人被假定為可以對所处环境以及其他参与者的行為形成對的的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行動以最大化自已受益的决策主体。行動:参与人的决策选择战略:参与人的行動规则,即事件与决策主体行動之间的映射,也是参与人行動的规则。信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。完全信息:每個参与人對其他参与人的支付函数有精确的理解;完美信息:在博弈過程的任何時點每個参与人都能观测并记忆之前各局中人所选择的行動,否则為不完美信息。不完全信息:参与人没有完全掌握其他参与人的特性、战略空间及支付函数等信息,即存在著有关其他参与人的不确定性原因。支付:决策主体在博弈中的收益。在博弈中支付是所有决策主題所选择的行動的函数。從經济學的角度讲,博弈是决策主体之间的互相作用,因此和老式個人决策存在著区别:3、博弈论与老式决策的区别:老式微观經济學的個人决策就是在給定市場价格、消费者收入条件下,最大化自已效用,研究工具是無差异曲线。可表达為:maxU(P,I),其中P為市場价格,I為消费者可支配收入。其他消费者對個人的综合影响表达為一种参数——市場价格,因此在市場价格既定下,消费者效用只依赖于自已的收入和偏好,不用考虑其他消费者的影响。不過在博弈论理個人效用函数還依赖于其他决策者的选择和效用函数。4、博弈的表达形式:战略式博弈和扩展式博弈战略式博弈:是博弈問題的一种规范性描述,有時亦称原则式博弈。战略式博弈是一种假设每個参与人仅选择一次行動或战略,并且参与人同步進行选择的决策模型,因此,從本质上来讲战略式博弈是一种静态模型,一般合用于描述不需要考虑博弈進程的完全信息静态博弈問題。1、参与人集合 : 2、每位参与人非空的战略集Si3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn).扩展式博弈:是博弈問題的一种规范性描述。与战略式博弈侧重博弈成果的描述相比,扩展式博弈更重视對参与人在博弈過程中碰到决策問題時序列构造的分析。包括要素:参与人集合 参与人的行動次序,即每個参与人在何時行動;序列构造:每個参与人行動時面临的决策問題,包括参与人行動時可供选择的行動方案、所理解的信息;参与人的支付函数。比较:1、战略式博弈從本质上来讲是一种静态模型。2、扩展式博弈從本质上来讲是一种動态模型。5、博弈论分类:按决策主体的行為互相作用時,當事人能否到达一种具有约束力的协议可分為:1、合作博弈(强调团体理性、团体最优决策、效率)2、非合作博弈(强调個人理性,個人最优决策)按参与人行動先後次序可分為:静态博弈:博弈中参与人同步行動,或者虽然不是同步行動,不過在行動前不懂得其他参与人所选择的行動。動态博弈:参与人的行動有先後次序,後行動者获得先行動者的行動信息。按参与人對信息的掌握程度可分為:完全信息:每個参与人對其他所有参与人的特性、战略空间及支付函数有精确的理解,博弈開始時不存在不确定性原因。不完全信息:参与人没有完全掌握其他参与人的特性、战略空间及支付函数等信息,即存在著有关其他参与人的不确定性原因。按决策主体對信息的掌握程度和行動的先後次序,博弈可以分為:完全信息静态博弈、完全信息動态博弈、不完全信息静态博弈、不完全信息動态博弈。静态動态完全信息完全信息静态博弈均衡:纳什均衡完全信息動态博弈均衡:子博弈精炼纳什均衡不完全信息不完全信息静态博弈均衡:贝叶斯纳什均衡不完全信息動态博弈均衡:精炼贝叶斯纳什均衡6、根据所學這四种博弈的特點對這四种博弈做一种對比分析:类型信息和行動特點均衡均衡类型尤其均衡求解措施學過的例子性质完全信息静态博弈每個参与人對其他所有参与人的特性、战略空间及支付函数有精确的理解,博弈開始時不存在不确定性原因,参与人同步行動或者不是同步行動不過後行動者不懂得行動者的行動信息。战略和行動相似。纳什均衡纯战略纳什均衡(PNE)占优战略纳什均衡(DSE)箭頭法划线法Hotelling价格竞争库诺特价格竞争多重性和存在性反复剔除的占有均衡(IFDE)不停剔除劣战略(弱劣战略的剔除次序會影响均衡成果一般一种博弈中存在参与者有多种行動時可以先考虑能否剔除弱战略简化博弈混合战略纳什均衡(MNE)聚點均衡支付最大化法支付等值法社會福利博弈小偷-守卫博弈完全信息動态博弈在博弈開始之前参与人之间的信息不存在不确定性,不過参与人行動存在先後次序。在完全信息動态博弈中,為了表达参与人之间的信息掌握关系,引入了信息及的概念。子博弈精炼纳什均衡子博弈精炼纳什均衡有限次反复博弈均衡与纳什均衡的唯一性有关连锁店悖论均衡成果是原博弈的Nash均衡;同步在每一种子博弈上构成Nash均衡無限次反复博弈均衡(無名氏定理)与贴現因子有关囚徒困境(冷酷战略)無限期轮番讨价還价模型一般博弈逆向归纳法求解斯坦科尔伯格寡頭竞争雇主与公會之间的竞争不完全信息静态博弈在博弈開始之前参与人之间的信息存在不确定性,不過参与人同步行動或者不是同步行動不過後行動者不懂得行動者的行動信息。不确定是参与人的了性的不确定性贝叶斯纳什均衡贝叶斯纳什均衡混合战略(不完全信息状况下纯战略均衡的极限)對原混合战略加入少許不确定性原因,求极限。性别战1、均衡存在性2、不确定性体現為类型的不确定性一般贝叶斯均衡Harsanyi转换机制设计不完全信息動态博弈在博弈開始前参与人之间的信息存在不确定性,同步参与人行動存在先後次序。不完全信息動态博弈過程不仅是参与人选择行動的過程,并且是参与人不停修正信念的過程。精炼贝叶斯纳什均衡信号传递博弈分离均衡根据所得信息修正判断概率,根据收益最大化决策信号传递博弈不完全信息反复博弈与声誉Milgrom-Roberts垄断限价模型不完全信息動态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的結合。混淆均衡准分离均衡二、四种博弈类型详细分述1、完全信息静态博弈1.1完全信息静态博弈特點:每個参与人對其他所有参与人的特性、战略空间及支付函数有精确的理解,博弈開始時不存在不确定性原因,参与人同步行動或者不是同步行動不過後行動者不懂得行動者的行動信息。战略和行動相似。1.2完全信静态博弈有关概念:以新产品開发博弈举例阐明:参与人:参与人1和2。参与人的集合卡表达為:Γ={1,2,…n}.表达所有参与人的集合,在新产品開发博弈中為:Γ={1,2}行動:開发、不開发。Ai表达参与人行動的集合。新产品開发博弈中参与人的行動集合為A1=A2={a,b},其中a為開发,b為不開发。a={a1,a2…an}表达参与人的行動组合。新产品開发博弈中為:A={(a,a),(a,b),(b,a),(b,b)}战略:参与人的行動规则。在博弈中的战略可以定义為從观测集到行動集的映射关系,即:Si:Xi—Ai。用Si={si}表达参与人所有战略的集合。在n人博弈中,用S=(s1,s2,s3…,sn)表达n個参与人的战略组合,它表达博弈中每個参与人采用战略si的一种博弈情形。在完全信息静态博弈中,由于不存在决策時序上的差异,所有参与人在同一决策時點即博弈開始的那一時刻决策,因此,所有参与人面临的决策情形都只有一种,因此,参与人的战略集与行動集相似。支付:是指参与人在博弈中的所得。一般状况下也是用效用函数来表达参与人在博弈中的所得。因此,参与人的支付就可表达為一种特定博弈情形下参与人得到确实定效用水平或期望效用水平。支付一般用ui(1,2,…,n)表达参与人i的支付(效用水平),支付组合u=(u1,u2,…un)表达参与人在特定博弈情形下所得到的支付,其中為参与人i的支付。因此,参与人i=(i=1,2,…,n)的支付就可表达為:ui=ui(si,s-i).信息:是参与人所具有的有关博弈的所有知识,如有关其他参与人行動或战略的知识、有关参与人支付的知识等等。在“新产品開发博弈”中,假如两個企业都懂得市場需求,那么這样的博弈情形就是我們前面所提到的完全信息假设;假如两個企业中至少有一种不懂得市場需求,那么這样的博弈情形就是我們前面所提到的不完全信息假设。1.3纯战略纳什均衡纯战略:参与人在給定信息下只选择一种特定(或确定性)的战略混合战略:混合战略解释了一种参与人對其他参与人所采用的行動的不确定性,它描述了参与人在給定信息下以某种概率分布随机地选择不一样的行動或战略。纯战略纳什均衡中包括:占有均衡、反复剔除劣战略均衡、一般纯战略纳什均衡等。1、占优均衡占优战略:参与人的最优战略si*与其他参与人的选择s-i無关。無论其他参与人选择什么战略,参与人的最优战略總是唯一的,這样的最优战略称之為“占优战略”。在n人博弈中,假如對于所有的其他参与人的选择s-i,si*都是参与人i的最优选择则称si*為参与人的占优战略。在n人博弈中,假如對所有参与人都存在占优战略si*,则占优战略组合si*=(s1*si2*,…,sn*)称為占优战略均衡。假如所有参与人均有占优战略存在,那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈成果。2、反复剔除劣战略假如在一种博弈中,参与人不存在占优战略,不過参与人i存在两個战略,其中一個战略叫另一种战略的所得效用要大,则理性的参与人绝對不會选择战略。严格劣战略:弱劣战略:若反复剔除過程一直可持续到只剩余唯一的战略组合,则该战略组合即為反复剔除的占优均衡,此時该博弈是反复剔除战略可解。要點:再反复剔除過程中,假如每次剔除的是严格劣战略,均衡成果与剔除次序無关;假如剔除的是弱劣战略,均衡成果也許与剔除次序有关。3、一般Nash均衡Nash均衡是完全信息静态博弈的解的概念,在完全信息静态博弈中,构成Nash均衡的战略是不可剔除的,即不存在任何一种战略严格优于Nash均衡战略。求解纳什均衡的措施划线法、箭頭法。划线法:1、考察参与人1的最优战略2、用上述措施找出参与人2的最优战略3、找出最优战略组合箭頭法:對于每個战略组合,检查与否有参与人會偏离這個战略组合直至找出没有参与人會偏离的战略组合纯战略均衡反应函数:各博弈方选择的纯方略對其他博弈方纯方略的反应。1.4混合战略纳什均衡混合战略:在博弈 中,對任一参与人i,设Si={Si1,…,Sik},则参与人i的一种混合战略為定义在战略集Si上的一种概率分布δi={δi1,…,δik},其中δij(j=1,…,k)表达参与人i选择战略表达参与人i选择战略Sij的概率的概率,即δij满足0≦δij≦1,其中概率之和為1。支付:混合战略的支付為多种概率下收益的加权平均。混合战略纳什均衡:在博弈中,混合战略组合δi={δ1*,…,δn*}為一种Nash均衡。當且仅當。混合战略Nash均衡的求解:支付最大化法;支付等值法;混合战略均衡反应函数:在混合方略的范围内,博弈方的决策是选择概率分布,因此,反应函数就是一方對另一方选择的概率分布的反应。聚點均衡:在現实生活中,参与人也許使用某些被博弈模型抽象掉的信息来到达一种“聚點”均衡。這些信息也許与社會文化习惯、参与人過去博弈的历史有关。不一样均衡概念之间的关系:占优均衡<反复剔除劣战略均衡<纯战略纳什均衡<混合战略纳什均衡1.5纳什均衡的多重性与存在性存在性:每個有限战略式博弈(参与人与對应的战略集均為有限)必存在纳什均衡,這個均衡也許是纯战略纳什均衡,也也許是混合战略纳什均衡。多重性:一种博弈也許有多种均衡,博弈论并没有一种一般的理论证明,哪一种纳什均衡成果一定能出現。2、完全信息動态博弈2.1完全信息動态博弈特點:在博弈開始之前参与人之间的信息不存在不确定性,不過参与人行動存在先後次序。在完全信息動态博弈中,為了表达参与人之间的信息掌握关系,引入了信息及的概念。2.2完全信息動态博弈有关概念:信息集:信息集Ii是参与人i决策結的一种集合,它满足如下两個条件:1、Ii中的每個决策結都是参与人i的决策結;2、當博弈抵达Ii時,参与人i懂得自已处在该信息集中的某個决策結,但不懂得是哪一种。在博弈树中,属于同一信息集的决策結一般用虚线连接起来。結:包括决策結和终點結两类。决策結是参与人采用行動的點時點,终點結是博弈行動途径的终點。一种信息集也許只包括一种决策結,也也許包括多种决策結。假如只包括一种决策結的信息集就是但單結信息集。假如博弈中所有信息集都是單結的则成為完美信息博弈。子博弈:是原博弈的一部分,它始于原博弈中一种單結信息集中的决策結x,并由决策結x及其後续結共同构成。子博弈可以作為一种独立的博弈進行分析,并且与原博弈具有相似的信息构造;原博弈可以作為自身的一种子博弈;2.3不完全信息静态博弈均衡——子博弈精炼Nash均衡:处理Nash均衡多重性問題的一种重要措施就是精炼的措施,即在Nash均衡的基础上,通過定义愈加合理的博弈解并剔除不合理的均衡。子博弈精炼纳什均衡的引入就是将那些包括不可置信威胁战略的纳什均衡從均衡中剔除,從而給出動态博弈成果的一种合理预测。即子博弈精炼纳什均衡规定均衡战略的行為规则在每個信息集上都是最优的。扩展式博弈的战略组合,是一种子博弈精炼Nash均衡,當且仅當满足如下条件:1、是原博弈的Nash均衡2、在每一种子博弈上构成Nash均衡一种战略组合是子博弈精炼Nash均衡當且仅當它對所有的子博弈(包括原博弈)构成Nash均衡,同步也意味著原博弈的Nash均衡并不一定是子博弈精炼Nash均衡,除非它還對所有子博弈构成Nash均衡。2.4不完全信息静态博弈均衡求解——逆推归纳法逆推归纳法是最常用的求解子博弈精炼Nash均衡的措施,其环节為:其中Γ(xi)代表博弈中由最底层到博弈起點的次序,以Γ(x3)為最底层,则有:1、找出博弈的所有子博弈;2、按照博弈進程的“反方向”逐一求解各個子博弈,即最先求解最底层的子博弈,再求解上一层的子博弈,......,直至原博弈。由于逆推归纳法對各個子博弈逐一進行求解,因此,逆推归纳法所得到的解在各子博弈上构成Nash均衡,即意味著逆推归纳法所得的解為子博弈精炼纳什均衡2.5完全信息動态博弈中承诺行動的均衡成果分析:承诺行動:就是在博弈開始之前参与人采用某种变化自已支付或战略空间的行動,该行動使原本不可信的威胁变得可信。不過参与人的承诺行動是有成本的,否则這种承诺就不可信。例子:要挟诉讼要挟诉讼就是指那种原告几乎不也許胜诉而其惟一的目的是但愿通過私了而得到一笔赔偿的诉讼。该博弈的成果為原告选择不指控,博弈結束。博弈的成果似乎与人們观测到的現实并不相符,由于現实中人們常常看到多种“要挟”发生。在上述模型中,“要挟”之因此没有成功,关键在于原告将會起诉的威胁并不可信。要是威胁变得可信,就必须采用承诺行動(沉没成本)。這样参与人的威胁就會变得可信,從而使其他博弈参与人变化方略。2.6反复博弈议題:1、未来可信的威胁或承诺怎样影响到目前的行動2、在一次博弈中無法实現的均衡,在反复博弈中能否实現有限次反复博弈:對于給定的阶段博弈G,令G(T)表达G反复進行T次的有限反复博弈,并且在下一次博弈開始前,所有此前博弈的進程都可被观测到。有限次反复博弈均衡結论:假如阶段博弈G有唯一的Nash均衡,则對任意有限的T,反复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡成果在每一种阶段反复進行。并且在有限次反复博弈中,假如在單阶段博弈中均衡解不只有一种,则對未来行動所作的可信威胁或承诺可以影响到目前的行動。無限次反复博弈:給定一阶段博弈G,令G(∞,δ)表达對应的無限反复博弈,其中G将無限次的反复進行,且参与人的贴現率為。對每個t,之前t-1次阶段博弈的成果在t阶段開始進行前都可以被观测到,每個参与人在G(∞,δ)中的收益都是该参与人在無限次的阶段博弈中所得收益的現值。無限次反复博弈的解——無名氏定理:令G為一种n人阶段博弈,令(e1,e2,…,en)為G的一种Nash均衡下的收益,且用(x1,x2,…,xn)表达G的其他任何可行收益,表达可行收益的集合。若存在则存在贴現率δ,使無限反复博弈G(∞,δ)存在一种子博弈精炼Nash均衡,其平均收益可到达(x1,x2,…,xn)。無名氏定理的解释:在無限次反复博弈中,假如参与人具有足够的耐心(只要d满足一定的条件),那么任何满足個人理性的可行收益向量都可以通過一种特定的子博弈精炼Nash均衡得到。影响反复博弈成果的原因:影响反复博弈成果的是反复的次数和信息的完备性。2.7子博弈精炼Nash均衡与Nash均衡的区别:由于子博弈精炼Nash均衡在任一决策結上都能給出最优决策,這也使得子博弈精炼纳什均衡不仅在均衡途径(即均衡战略组合所對应的途径)上給出参与人的最优选择,并且在非均衡途径(即除均衡途径以外的其他途径)上也能給出参与人的最优选择。即子博弈精炼Nash均衡不會具有参与人在博弈進程中不合理的、不可置信的行動。不完全信息静态博弈3.1不完全信息静态博弈特點:在博弈開始之前参与人之间的信息存在不确定性,不過参与人同步行動或者不是同步行動不過後行動者不懂得行動者的行動信息。在不完全信息静态博弈中,在博弈開始前存在有关博弈人信息的不确定性,這個不确定像一般是博弈参与人的类型。在市場進入博弈中不完全信息体現為:在位者的成本类型(高成本、低成本)在斗鸡博弈中不完全信息体現為:参与人的性格类型(强硬,软弱)3.2海萨尼转换由于在不完全信息静态博弈中,参与人的类型存在不确定性,因此當一种参与人并不懂得在与谁博弈時,博弈的规则是無法定义的,海萨尼提出了海萨尼转换处理這种不确定的問題。处理措施:海萨尼指出,引入虚拟参与人——自然,由自然先决定参与人的不一样类型,将不完全信息博弈转换為不完美信息博弈。海萨尼通過引入“虚拟”参与人,将博弈的起始點提前,從而将原博弈中参与人的事前不确定性转变為博弈開始後的不确定性。這种通過引入“虚拟”参与人来处理不完全信息博弈問題的措施称為Harsanyi转换。海萨尼转换注意要點:1、海萨尼转换规定:参与人有关“自然”选择的推断為共同知识。2、“自然”的选择。在一般的不完全信息博弈問題中,Harsanyi转换规定“自然”选择的是参与人的类型(type)。除了根据参与人的支付来划分参与人的类型以外,還可以根据参与人的行動空间,甚至根据参与人掌握信息的多少(或程度)来划分参与人的类型。3、参与人有关“自然”选择的推断是基于自已类型判断的条件概率。3.3不完全信息静态博弈均衡——贝叶斯纳什均衡贝叶斯博弈的定义:贝叶斯博弈包括如下五個要素:参与人集合BΓ={1,2,…,n}参与人的类型集合T1,…,T2参与人有关其他参与人类型的推断P1(t-1|t1),…,Pn(t-1n|tn)参与人类型相依的行動集A(t1),…,A(tn)参与人类型相依的支付函数贝叶斯博弈的战略:在贝叶斯博弈G={Γ;(Ti);(Pi);(A(ti);(ui(a(t);ti)}中,参与人i的一种战略是從参与人的类型集Ti到其行動集的一种函数si(ti);它包括了當自然赋予i的类型為ti時,i将從可行的行動集Ai(ti)中选择的行動。贝叶斯博弈的時间次序:1、“自然”选择参与人的类型组合t=(t1,…,tn)2、参与人同步选择行動,每個参与人i從行動集Ai(ti)中选择行動ai(ti)3、参与人i得到支付贝叶斯纳什均衡:在贝叶斯博弈中,對于一种理性的参与人i,當他只懂得自已的类型ti而不懂得其他参与人的类型時,給定其他参与人的战略s-i,他将选择使自已期望效用(支付)最大化的行動ai*(ti),其中贝叶斯博弈纳什均衡的存在性:一种有限的贝叶斯博弈一定存在贝叶斯Nash均衡。贝叶斯博弈与混合战略均衡(有关混合战略纳什均衡的一种解释)首先,混合方略均衡不是現实生活的一种合理描述,人們并不是根据概率分布来选择自已行動;海萨尼证明,在完全信息状况下的混合方略均衡可以解释為不完全信息状况下纯方略均衡的极限。混合方略的本质:混合方略的本质不在于参与人随机的选择行動,而在于他不能确定其他参与人将选择什么纯方略,這种不确定性也許来自于参与人不懂得其他参与人的类型。海萨尼的基本思想:只要在本来的博弈中加入少許不完全信息原因,使得参与人的支付函数中的收益不再是确定的,而是和一种有范围的不确定参数有关,從而通過将混合战略均衡求解转换為贝叶斯均衡的极限解,不過得到的纯战略贝叶斯均衡就与完全信息下的混合战略均衡相似。結论:完全信息博弈的混合战略Nash均衡可以解释為与之亲密有关、存在一點點非完全信息的纯战略贝叶斯Nash均衡。同步海萨尼給出了描述混合方略和纯方略之间关系的一种正式的定理:混合方略均衡的纯化定理。3.5贝叶斯均衡Eg:机制设计問題机制设计問題实际上就是探讨设计者怎样向参与人提供鼓励,以促使参与人向设计者透露其掌握的信息(說真话),從而确定對设计者有利的成果的問題。這一机制對应于一种博弈形式,设计者需要设计出一种博弈形式,让参与人在這個博弈形式下進行博弈從而实現他的目的。博弈形式不一样,实現目的的程度也不一样样,设计者必须选择對他来說是最有利的博弈形式,即最有利的机制。机制设计的基本模型:机制设计是經典的3阶段不完全信息博弈,期阶段如下:阶段1:机制设计者(委托人)设计一种“机制”,或者“契约”,或者“鼓励方案”;阶段2:代理人选择接受或拒绝该机制,拒绝的代理人得到某個外生的“保留效用”;阶段3:接受机制的代理人选择自已的行動(或者战略),实現一种博弈成果。机制设计模型中的有关概念:参与约束:由于代理人在第二阶段總可以选择不接受该机制從而获得一种保留效用,因此,代理人接受這個机制获得的效用必须不不不小于拒绝這個机制時获得的效用。鼓励相容约束:這意味著,對于代理人而言,代理人真实汇报自已的类型時获得的效用必须不不不小于谎报自已类型時获得的效用。可行机制:满足参与约束的机制被称為可行机制。可实行机制:满足鼓励相容约束的机制称為可实行机制可行的可实行机制:假如一种机制既满足参与约束,又满足鼓励相容约束。机制设计的目的:机制设计的目的就是要设计出可行的可实行机制,從而在该机制中找出最优规则以追求最大化收益。4、不完全信息動态博弈4.1不完全信息動态博弈特點:在博弈開始之前参与人之间的信息存在不确定性,同步参与人行動存在先後次序。不完全信息動态博弈過程不仅是参与人选择行動的過程,并且是参与人不停修正信念的過程。4.2不完全信息動态博弈的有关概念类型:是指参与者的类型。在不完全信息動态博弈中自然首先选择参与人的类型。動态博弈:行動有先有後。所後来行動者可以观测到先行動者的行動信息,從而可以修正自已對于参与人的类型的信息的判断。类型相依:参与者的行動传递著有关自已的类型的信息,對方可通過参与人的行動来推断自已的最优行動。先行動者预测到自已的行動被後行動者运用,就會设法传递對自已最有利的信息。4.3不完全信息動态博弈的纳什均衡——精炼贝叶斯均衡對应于不完全信息動态博弈的纳什均衡称為精炼贝叶斯均衡;精练贝叶斯均衡是泽尔腾不完全信息動态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的結合。1、不完全信息動态博弈均衡求解的基本思绪:不完全信息動态博弈将子博弈精炼Nash均衡中“均衡精炼”的思想应用到不完全信息扩展式博弈中,不過有提前条件:1、對每個参与人i,在其信息集上給出有关自已位于该信息集中哪一种决策結的信念(或推断)。2、對参与人i的每個信息集,在給定参与人i在该信息集上的信念(或推断)状况下,参与人的战略是對其他参与人战略的一种最优反应。与静态博弈不一样的是:在观测到先行動者第一阶段选择後,後行動者可以修正對先行動者类型的先验概率,由于先行動者的行動也許包括其类型的信息,即行動就是类型的反应,不一样的行動反应不一样的类型信息。参与人最初對于對手类型信息概率的判断成為先验概率,對于根据行動反应出得信息修正後的概率成為後验概率。先验概率(priorprobability):修正之前的判断;後验概率(posteriorprobability):修正之後的判断先验概率和後验概率的转化是根据贝叶斯法则计算:在不完全信息動态博弈博弈均衡解的求解過程中,假如不可置信的威胁,均衡就是不合理的,因此要對均衡成果精炼,剔除那些不可置信的威胁。從而引入子博弈精练纳什均衡的概念,不過,在不完全信息動态博弈中,只有一种子博弈,不能将上述措施直接用于求不完全信息動态博弈的均衡解。合理的均衡应當是满足:給定每一种参与人有关其他参与人类型的後验信念,参与人的战略组合在每一种後续博弈上构成贝叶斯均衡,我們将通過這种方式得到的纳什均衡称為精炼贝叶斯纳什均衡。精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼纳什均衡和贝叶斯推断的結合,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 抚州市广昌县2025-2026学年第二学期四年级语文第四单元测试卷(部编版含答案)
- 黔南布依族苗族自治州福泉市2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 日喀则地区仁布县2025-2026学年第二学期五年级语文第五单元测试卷(部编版含答案)
- 漳州市漳浦县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 乐山市市中区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 深度解析(2026)《CBT 3954-2002船用热油炉》:专家视角下的技术内涵、应用挑战与未来趋势全景洞察
- 深度解析(2026)《CBT 637-1995弹簧拖钩》:技术传承与新时代船舶系泊安全的专家视角
- 深度解析(2026)《AQ 2078-2020老龄化海上固定式生产设施主结构安全评估导则》
- 高中导数相关题目及答案
- 省考冲刺试题试题及答案
- 血透患者用药课件
- 2025年省属国企公开招聘备考题库参考答案详解
- 2025年秦皇岛市辅警考试试卷真题带答案
- DB32∕T 5156-2025 零碳园区建设指南
- DB14∕T 3508-2025 公路工程地质勘察监理指南
- 火灾风险隐患排查治理“自知、自查、自改”消防安全管理告知及承诺书
- 2025年广州市海珠区中小学教师招聘笔试参考试题及答案解析
- 清华附中招生考试原题及答案
- 消化系统疾病患者康复训练方案
- 2024~2025学年天津市第二十一中学下学期八年级历史第一次月考试卷
- 建筑外墙保温工程技术标书样本
评论
0/150
提交评论