已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
江苏大学硕士学位论文 摘要 演化博弈理论最重要的基本概念是演化稳定策略( e s s ) 。e s s 能够成功抵 御其他变异策略的入侵。另一方面,一个策略是否是种群长期演化选择的结果, 也在于其能否在种群演化过程中成功进入。进入者策略是能够成功进入种群的策 略,所以长期演化过程中也可能被种群中的个体所采用。本文旨在从抵御入侵与 可以进入两个角度分析策略的演化稳定性。 本文基于单种群多人矩阵博弈与一类非矩阵博弈模型,讨论演化稳定策略 ( e s s ) 、邻域进入者策略( m s ) 与全局进入者策略( g i s ) 三个主要概念,并 着重研究了e s s 、n i s 、g i s 的性质及关系,获得了相应的结论。 在多人矩阵博弈模型中,g i s 一定是e s s ;g i s 、e s s 不能共存,除非策略 本身是e s s ;g i s 具有唯一性;若存在多个e s s 则无g i s 。二人矩阵博弈中,e s s 与n i s 等价;g i s 是全局优超的,从而在动力系统中是全局渐近稳定的。多人矩 阵博弈与二人矩阵博弈有着不同的性质与结论。 在非矩阵博弈模型中,具有一定线性性时e s s 与n i s 等价,并且具有与矩 阵博弈相同的性质:g i s 一定是e s s ;g i s 、e s s 不能共存,除非策略本身是e s s : g i s 具有唯一性;若存在多个e s s 则无g i s 。 最后讨论了策略的可入侵性与不可入侵性,并分别得到可入侵性及不可入侵 性在连续、离散动力系统中的等价条件。 关键词:e s s ,n i s ,g i s ,矩阵博弈,非矩阵博弈,动力系统 江苏大学硕士学位论文 a b s t r a c t e v o l u t i o n a r ys t a b l es t r a t e g y ( e s s ) i st h eb a s i cc o n c e p to fe v o l u t i o n a r yg a m e t h e o r y e s sc a ns u c c e s s f u l l yr e s i s tt h ei n v a s i o no fo t h e rs t r a t e g y o nt h eo t h e rh a n d , i ti si m p o r t a n tf o ras t r a t e g yt oe n t e rt h ep o p u l a t i o no c c u p i e db yo t h e rs t r a t e g yi fi tc a n b et h ee v o l u t i o n a r ys t a b l ec h o i c eb yt h ep o p u l a t i o ni nt h el o n gr u n i n v a d e rs t r a t e g yi sa s t r a t e g yt h a tb ea b l et oi n v a d ea l le s t a b l i s h e dc o m m u n i t i e s ,s oi ta l s oc a nb ea d o p t e db yt h e i n d i v i d u a l so fp o p u l a t i o ni nt h el o n gr u n w ea n a l y z et h ee v o l u t i o n a r ys t a b i l i t yf r o m t w oa s p e c t s :r e s i s t i n gt h ei n v a s i o no fo t h e rs t r a t e g ya n ds u c c e s s f u l l yi n v a d i n gt h e p o p u l a t i o n i nt h i sp a p e r , w ed i s c u s st h ec o n c e p t so fe v o l u t i o n a r ys t a b l es t r a t e g y ( e s s ) , n e i g h b o r h o o di n v a d e rs t r a t e g y ( n i s ) a n dg l o b a li n v a d e rs t r a t e g y ( g i s ) i nm a t r i x g a m ea n dak i n do fn o n - m a t r i xg a m e t h em a i nc o n t e n ti st h ep r o p e r t i e so fe s s ,n i s , g i sa n dr e l a t i o n s h i pa m o n gt h e m ,h e n c es o m ec o r r e s p o n dc o n c l u s i o n s i nm u l t i - p l a y e rm a t r i xg a m e ,w es h o wt h a t :ag i si s a l w a y sa ne s s ;ag i s c a n n o tc o e x i s tw i t ha ne s su n l e s si ti si t s e l fa ne s s ;i fag i se x i s t s ,t h e ni ti su n i q u e ; i ft h e r ei sm o r et h a no n ee s s ,t h e nt h e r ea r en og i s w ea l s og e tt h ec o n c l u s i o nt h a t i nap a i rw i s eg a m en i si se q u i v a l e n tt oe s s ,g i si s g l o b a l l ys u p e r i o ra n di t i s g l o b a l l ya s y m p t o t i c a l l ys t a b l ei nt h ed y n a m i c so fd u p l i c a t o r a l s o ,t h e r ea r es o m e r e s u l t si nm u l t i - p l a y e rg a m e sd i f f e r e n tf r o mt h o s ei np a i rw i s eg a m e s i nn o n m a t r i xg a m e ,n i si se q u i v a l e n tt oe s so nt h ea s s u m p t i o nt h a tt h ep a y o f f i sl i n e a r a n dw eg e tt h es a m ep r o p e r t i e sa sm u l t i - p l a y e rm a t r i xg a m e :ag i si sa l w a y s a ne s s ;ag i sc a n n o tc o e x i s tw i t ha ne s su n l e s si ti si t s e l fa l le s s ;i fag i se x i s t s , t h e ni ti su n i q u e ;i ft h e r ei sm o r et h a no n ee s s ,t h e nt h e r ea r en og i s f i n a l l y , w ed i s c u s st h ei n v a s i o na n dn o n - i n v a s i o no ft h es t r a t e g y , a n dg e tt h e e q u i v a l e n tc o n d i t i o n so ft h ei n v a s i o na n dn o n - i n v a s i o ni nc o n t i n u o u s - t i m ed y n a m i c a n dd i s c r e t e t i m ed y n a m i c k e y w o r d s :e s s ,n i s ,g i s ,m a t r i xg a m e ,n o n m a t r i xg a m e ,d y n a m i c 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规 定,同意学校保留并向国家有关部门或机构送交论文的复印件和 电子版,允许论文被查阅和借阅。本人授权江苏大学可以将本学 位论文的全部内容编入有关数据库进行检索,可以采用影印、缩 印或扫描等复制手段保存和汇编本学位论文。 保密口 本学位论文属于,在年我解密后适用本授权书。 不保羽 学位论文作者签名:爰1 阮可 3 明年f 2 月2 f 日 指导教师签名:忑3 吏 明年2 月工日 独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的 指导下,独立进行研究工作所取得的成果。除文中已注明引 用的内容以外,本论文不包含任何其他个人或集体已经发表 或撰:弓过的作品成果。对本文的研究做出重要贡献的个人和 集体,均已在文中以明确方式标明。本人完全意识到本声明 的法律结果由本人承担。 学位论文作者签名:刮吮可 日期:口c i 年j 2 月二f 日 江苏大学硕士学位论文 第一章引言弟一早j li 1 1 本文的研究背景、现状及意义 1 2 1 1 1 演化博弈论的研究背景、现状及意义 演化博弈理论来自达尔文的生物进化论,自二十世纪六十年代l e w o n t i n 3 1 就用演化博弈理论来解释生态现象。这个领域的开创性工作是由英国生物学家约 翰梅纳德史密斯( j o h nm a y n a r ds m i t h ) 和g r 普里斯( g r p r i c e ) 1 9 7 3 年进行 的,即演化稳定策略f 4 1 概念的提出。自此模仿者动态与演化稳定策略( r d & e s s ) 一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定 状态和向这种稳定状态的动念收敛过程。当时该理论逐渐被广泛地用于生态学领 域。八十年代随着研究的深入,许多经济学家把演化博弈理论引入到经济学领域, 应用于分析社会制度变迁,以及股票市场等等,同时对演化博弈理论的研究也开 始由对称博弈向非对称博弈的深入,并取得了一定的成果。进入九十年代,尤其 是1 9 9 2 年关于演化博弈理论的会议在康奈尔大学召开,演化博弈理论的学术地 位得到正式认可,e s s 概念的拓展和动态化构成了演化博弈论发展的主要内容。 于是对演化博弈理论的研究进入了一个崭新的阶段,演化博弈理论的应用得到了 更迅速、广泛的发展。 演化博弈理论从发展到现在受到社会学、经济学、生态学的普遍关注。特别 是该理论的基本均衡概念一演化稳定均衡提出以后,理论界已经从不同的方面对 它进行了拓展,并取得了令人瞩目的成果,使演化博弈理论体系在发展中得到不 断完善。 演化博弈论在理论和实践两方面都有非常重大的意义。在理论方面,演化博 弈论首先克服了理性博弈分析脱离实际的问题,使得其理论基础更加扎实,实践 性更强。因为演化博弈分析的结果总体上也是支持完全理性博弈分析的,因此等 于使整个博弈论的理论基础得到了加强。其次,演化博弈分析也是从一个角度精 炼和筛选纳什均衡的方法,因此在一定程度上解决了完全理性博弈分析的均衡选 择困难,扩展和加深了我们对以完全理性为基础的博弈分析的认识。第三,演化 江苏大学硕士学位论文 博弈理论也加深和拓展了我们对人类理性和能力的局限性,以及这种局限性对于 经济问题和经济意义的认识。第四,演化博弈论是经济学与其他科学相互影响、 相互促进的良好典范。它一方面吸收、运用生物进化理论的思想和研究方法,用 于研究人类的社会经济行为,但是反过来它的理论成果又可以用于研究生物进化 演变规律,研究生物的行为特征和生物多样性等问题,使两种学科都得到了重大 进展。在实践方面,演化博弈理论更是有非常广泛的应用范围,例如可以研究国 际政治、军事中关于战争与和平的选择,研究世界政治经济格局的形成和稳定性 问题,研究不同军事策略的价值和意义,研究人类社会制度、组织和规范的发展 和演变规律,也可以研究股市中的投机者行为和股市均衡,解释企业家选择的机 制和企业文化的发展和演变等等。 1 1 2e s s 、n - i s 、g i s 的研究进程 m a y n a r ds m i t h 和p r i c e ( 1 9 7 3 ) 针对单个无限种群的对称博弈提出了最原始 的演化稳定策略( e s s ) 的概念。此后的大多数文章都是关于e s s 定义的应用, 很少涉及这个策略是否能成功入侵该种群并在其中稳定存在 5 。这种可入侵概 念一方面是由 6 - 7 首先提出的,且 8 1 0 在某特殊模型中也已经涉及到了此方 面。 1 1 - 1 5 给出了邻域进入者策略( n i s ) 的定义。 5 ,1 2 - 1 5 在不同模型中讨 论了策略的入侵性; 1 6 1 7 将此方面从n i s 中区分出来,给出了全局进入者策 略( g i s ) 的定义。 1 2 本文研究的主要内容 演化博弈理论研究博弈群体的状态。群体的状态x 既表示群体使用纯策略的 参与人人数的比例向量,也解释为群体中每个参与人都在使用同一个混合策略。 在这些研究工作中关于个体收益及种群平均收益都能够由其策略组合确定。演化 稳定策略刻画了这种策略面对微小变异的稳定性,即它能够抵抗变异策略的微小 入侵;而全局( 邻域) 进入者策略的本质在于它能够成功入侵该种群。上述这些 概念是由期望收益( 适应度) 来刻画的。虽然是静态概念,但能描述动态系统的 稳定性。本文对单种群多人矩阵博弈、非矩阵博弈分别进行了e s s 、n i s 、g i s 关系的讨论,并对多人博弈的特殊形式二人矩阵博弈的不同点进行了比较。 2 江苏大学硕士学位论文 最后在动力系统中对策略的可入侵性和不可入侵性进行了探讨。本文主要分为以 下几个部分具体结构如下: 第一章介绍了演化博弈理论的研究背景、现状及意义,着重介绍了本文的 主要内容和主要创新点。 第二章给出博弈论的理论基础,并介绍了纳什均衡的基础知识。 第三章本章首先给出了演化稳定策略、邻域进入者策略、全局进入者策略 一般描述,并给出了单种群博弈的e s s 、n i s 、g i s 的定义、性质及关系。 第四章在一类非矩阵博弈中,在一定的假设下得到更强的结论,相应地得 到三个概念之间的关系。 第五章本章在动力系统中讨论策略的可入侵性和不可入侵性。 1 3 本文的主要创新点 本文将全局进入者策略( g i s ) 从邻域进入者策略( m s ) 中区分出来,给 出了全局进入者策略( g i s ) 的定义。讨论了演化稳定策略、邻域进入者策略、 全局进入者策略的定义和性质,并着重研究了三个概念在多人矩阵博弈、非矩阵 博弈中的关系。研究表明:g i s 一定是e s s ;g i s 是唯一的;含多个e s s 的博弈 一定没有g i s ,更近一步证明在非矩阵博弈表示下,具有一定线性性时e s s 与 n i s 等价。二人博弈是一种特殊形式,经研究我们还发现许多多人博弈与二人博 弈不同的结论。最后,讨论了与策略的可入侵性和不可入侵性在动力系统下的等 价形式。 3 江苏大学硕 士 学位论文 第二章博弈论的理论基础 本章j 三要介绍博奔论的理论基础,为以后研究的演化博弈做铺挚。2 1 节介 绍演化博弈的基本概念;2 2 节介绍博弈论中最基本的概念n a s h 均衡。 2 1 博弈论的基本概念 参与人参与人是博弈主体,通常又称为局中人。参与人参加博弈的目的是 通过合理的选择自己的行为,以期取得最大化自己的收益。参与人可以是自然人, 也可以是群体或组织,如企业、国家等,只要它们内部采取一致的行动与外界进 行策略互动,就可以看出一个参与人。通常参与人用f 表示,f i 。 静态博弈如果所有的参与人都同时选择行动,更本质的,如果所有参与人 在选择行动时不知道对手选择了什么行动,则为静态博弈。 策略策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定 参与者在什么时候该选择什么行动。在静念博弈中,一个策略是参与人的一个给 定的可能行动,指明了参与人在获知任何信息的情况下所选择的行动,从而,策 略选择就变成简单的行动选择。通常最表示参与人f 的一个特定策略,大写 s = s ,l 表示参与人f 的所有可能的策略集合( 又称为参与人f 的策略空间) 。如 果个参与人每人选择一个策略,则称s = ( ,s 2 ,) 称为一个策略组合,其中 , 吼是参与人f 选择的策略。称s = 兀s i = b ,屯,如) b s ,i = 1 , 2 ,) 为策略组 i = 1 合集合。策略式博弈中有两个策略概念,一个为纯策略,一个为混合策略。纯策 略( p u r es t r a t e g y ) :每一个参与人在博弈中选择采用的行动方案,每个参与人均有 其可供选择的多种策略;混合策略( m i x e ds t r a t e g y ) :在一个给定的概率下决定参 与人决策的随机行动,作为特殊情况每一个混合策略可能是一个给定的纯策略的 确定性选择。 收益又称支付、适应度。在特定的策略组合下参与人得到的确定的收益。 如果结果是随机的,那么收益通常用概率来加权平均,即期望收益( 预期支付) 。 收益通常表现为博弈结果中的输赢、得失、盈亏,是参与人真正关心的问题。在 4 江苏大学硕士学位论文 博弈论中通常用乃表示参与人f 的收益,如果一个策略组合是( 鼍,s 2 ,如) ,每个 参与人f 的收益可以用函数乃= 乃b ,s 2 ,) ,i = 1 ,2 ,表示,且其收益不仅 与f 自己的策略s 有关,也与对手的策略组合有关。 均衡在博弈论中,均衡指的是所有参与人的最优策略的组合,通常记为 s = ( i ,i ,式) ,其中墨是参与人f 在均衡状态下的最优策略,它是参与人f 所有的可能策略中使互最大化的策略,而参与人f 的最优策略又是依赖于其他参 与人的策略选择。所以说s + 是在给定其他参与人的策略选择( 记为 i = ( 西,s h ,) ) 条件下,参与人f 的最优策略。即对s ,不等式 巧,屯,i ,s 乙,s 二) 互( i ,, s i _ l , s i ,也,s ) 恒成立。均衡是博弈论中最重刀:h ,墨- 1 ,& ,墨+ 1 ,) 2 磊【墨,+ 1 ,如”旦威且。列衡足爵笄论 尸最里 要、最基础的概念,对于不同类型、不同条件的博弈问题又形成各种各样的均衡 概念,它们构成博弈论五彩缤纷的预测结果。 2 2n a s h 均衡主要内容 2 2 1 纯策略n a s h 均衡 1 f 面我们给出纯策略n a s h 均衡的概念,它是对非常广泛的博弈问题给出更 加严格的结果。 定义1 在策略式博弈g = 墨,;巧, 中,如果对于每一个参与人 i = 1 ,2 ,n ,邑是针对给定其他一1 个参与人所选策略g ,) 的最 优反应策略,即 巧( i ,西,) 巧( i ,s ,t ,) 对s 中所有的s 都成立,亦即s + 是最优化问题 乃( i , s 2 i ) 2 鬻乃( i ,s i ,囊- ,西) ,f = 1 2 , 的解,则策略组合s + - - ( 4 ,i ,) 称为该博弈的一个纯策略n a s h 均衡。 纯策略纳什均衡的意义在于:若其他参与人均采用均衡策略,则余下的这一 5 江苏大学硕士学位论文 参与人只有采用均衡策略才是最好的。 可以从另外一个角度来认识n a s h 均衡。考察一个策略组合 s = ( 西,西) ,如果s 不是g 的一个n a s h 均衡,就意味着存在若干参与人 f ,其策略不是针对( ,墨t _ l ,+ 1 ,西) 的最优反应策略,即在爿中存在, 使得 ,t,*-、 死( 黾,岛一l ,s ,s i “,) 乃【鼍,, s i _ l , s j ,墨+ 1 ,) 这就说明,如果策略组合“,砖,西) 不是n a s h 均衡,那么至少有一个参与人 有动因偏离这个结果。 2 2 2 混合策略n a s h 均衡 2 不是所有的策略式博弈都有纯策略纳什均衡:每个参与人确定性地选择他的 一个策略。参与人也许以某个概率随机地从这些纯策略中选择,由此我们引入混 合策略及其纳什均衡。 混合策略是一种随机地选择自己的策略的方式。它指的是参与人以一定的概 率去选择某种策略。这类博弈虽然在一次操作中有输有赢,但是将这个博弈多次 重复进行,可以研究各个策略应赋予多大的概率,能获得最大的期望收益。换句 话说,参与人f 的一个混合策略是在其策略空间墨中策略s 的概率分布。 定义2 在策略式博弈g = 俩,;呵,) 中,假定参与人f 有个纯策 略:s 。= 参1 ,一,乞。) ,那么,概率分布只= ( p n ,p 拥j ) 称为参与人f 的一个混合 策略,这里,对于所有的j = 1 ,m ;,既= p ( s 玎) 表示参与人f 以概率既随机选 择纯策略,0 p 盯1 ,且珊= 1 。 j = l 参与人f 标准的单位向量勺2 ( o o ) ( 其中第个分量为1 ,其余分量为 o ) 等同于参与人f 第个歹纯策略岛,因而纯策略可以看成是特殊的混合策略。概 率分布不同就构成参与人的不同的混合策略。 虽然混合策略不能直接告诉我们一次博弈中各参与人的具体选择和博弈的 6 江苏大学硕士学位论文 确定结果,但可告诉我们参与人决策的具体方式以及平均意义上的收益( 期望收 益或称为预期支付) 。 任取p = ( a ,p 2 ,n ) 为博弈的一个混合策略组合。在此策略组合下,参与 人,的支付为预期支付 局( p ) :芝芝羔乃( ,) 魄 i 1 :1 i 2 :1 i n 2 1 。” 下面给出混合策略n a s h 均衡的一般定义 定义3 在策略式博弈g = 墨,;巧,) 中,设p 为一混合策略组合, 如果 互( a ,正f ) 巨p + ) ,v p i 只, i = 1 2 ,n 成立,则称p 是一个混合策略纳什均衡。 2 2 3 双矩阵博弈下的混合策略n a s h 均衡 2 在策略式博弈中,经常会碰到两个参与人相互竞争的情形,这种二人有限博 弈称为双矩阵博弈。下面即针对二人有限策略型博弈g - - n ,s ,s :,乃,呢) 讨论混 合策略纳什均衡问题。 设& = q ,吃,a m ,是= 届,愿,尾 。s i 上的一个概率分布为参与人 i ( = 1 ,2 ) 的一个混合策略,故可分别用 a = p = 慨,仍,陲b = l 易。,z = l 2 ,历) 妒卜c 蛳,瞽n = l 呸孔吼2 ,七 表示两个参与人的混合策略集合。p = ( a ,见,p i ) l 为参与人1 的混合策略, a ( 扛1 2 ,m ) 表示参与人1 以概率a 随机选择纯策略q 。类似地, q - - ( q ,吼,吼) a 2 为参与人2 的混合策略,留j ( j = 1 2 ,疗) 表示参与人2 以概 率纽随机选择纯策略属。 江苏大学硕士学位论文 ( p ,q ) ,p l ,q a :称为混合策略组合。对于混合策略组合,由于参与人随 机选择纯策略,因而参与人支付值也是随机地,故需用预期支付来代替支付函数。 对于给定的( p ,q ) ,参与人1 的预期支付为 u i ( p ,q ) = 乃( q ,f l j ) p i q j 参与人2 的预期支付为 u :( p ,q ) = 乃( q ,f l j ) p i q , 记巧( 呸,岛) = ,乃( 呸,岛) = i = l 2 ,m ,j = 1 2 ,栉。a = ( 口 ) 。, 曰= 魄) 。分别表示参与人1 与2 的支付矩阵。利用支付矩阵a 与b ,参与人1 与2 的预期支付可表示为 u ( p ,q ) = p a q ,u 2 ( p ,q ) = p b q 这里p 表示参与人1 的混合策略行向量,q 表示参与人2 的混合策略列向量。“” 表示内积,a q 表示矩阵a 与q 的转置的乘积,是一个列向量,为了方便,一般 省略转置符号。 根据混合策略纳什均衡的的定义,对于双矩阵博弈,我们有下面的定义 定义2 1 4 在双矩阵博弈中,如果p p 、q q ,满足 p a q + p 口+ ,v p p 且 q b p + q + b q ,v q q 则称( p ,q ) 为双矩阵的一个混合策略n a s h 均衡。 当以上两个不定式严格成立时,称( p ,口) 为严格混合策略纳什均衡。 混合策略意义下的纳什均衡q ,g 。) 的含义为:固定p ,q 是参与人2 对p 的最优反应;固定口,p 是参与人1 对口的最优反应。 8 江苏大学硕士学位论文 第三章矩阵博弈的e s s 、n is 与gis 3 1 矩阵博弈及e s s 、n i s 、g i s 的定义 3 1 1 单种群多人博弈 在一个种群中,假设共有个纯策略轰,彘,靠。个体参与人既可以使用 纯策略,也可以使用混合策略。在混合策略模型中,参与人按照一定的概率分布 选择各个纯策略,即在纯策略矗,彘,磊中赋以概率岛,p 2 p n 。种群中每个 个体的策略空间为同一个概率向量集 s = p = ( p l ,m ) :p ;o ,p ;= q 。 标准的单位向量q ( 其中第f 个分量为1 ,其余分量为0 ) 对应第f 个纯策略参( 纯 策略可以看成是特殊的混合策略) 。 假设种群的演化过程中,总是不断地有随机来自种群的m + 1 个个体进行 小+ 1 参与人的博弈称为种群的基博弈。当参与人1 2 ,m + 1 分别使用纯策 略f ,乞,乞参与基博弈时,参与人f 的收益( p a y o f f ) 由支付函数乃( 善,乞,乞) 确定。种群中所有个体无角色或地位等特征差异时,该博弈是对称的 ( s y m m e t r i c ) :当对手( 其他聊个参与人) 选用策略组合( 磊,乞) 且无论这聊 个策略被哪些个体选择时,使用策略善的参与人的收益唯一确定,记为 万( 孝,矗,乞) ,即面对策略组合( 磊,乞) 时策略乡参与博弈的收益。 本文考虑对称博弈。二人博弈时该支付函数可以由支付矩阵a = ( 吩) 。表 示,其中口 ( i = l ,2 ,n ,j = 1 ,2 ,n ) 表示行参与人选择纯策略点、列参与 人选择纯策略岛时行参与人的收益,即面对策略岛时戋的收益m t i l e s s ) 。再如, 三人博弈时支付函数可以由矩阵似,如,氐) 表示,其中a = ( 口班) 州 ( k = 1 2 ,) ,此时表示第一参与人( 行参与人) 选择纯策略磊、第二参 9 江苏大学硕 士 学位论文 与人( 列参与人) 选择纯策略岛、第三参与人( 矩阵参与人) 选择策略最时行 参与人的收益,即面对策略白、彘时磊的收益。博弈足对称的,所以还有= 口嘶。 同理,四人博弈时支付函数为( ( 卅,4 ,a :) ,( 群,髯,筋2 ) ,心,掣,硝) ,) , 其中= ( 口猁) j 。( z = 1 ,2 ,n ) 。此时,口彬表示第一参与人( 行参与人) 选 择纯策略磊、第二参与人( 列参与人) 选择纯策略、第三参与人( 单矩阵参 与人) 选择纯策略彘,第四参与人( 双矩阵参与人) 选择纯策略缶,即面对策略 白、磊、当时行参与人的收益,且有口删= 口摊= = a i 埘。 种群中的个体也可以使用混合策略,当,r j 时,策略组合( ,置,贝。) 确定的策略i 的期望收益u u ,r ,e m ) 可以通过概率向量j ,r ,氏及支付矩 阵计算。 例如,二人博弈时,u ( i ,r ) 表示行参与人选择固定策略,、列参与人选择 策略尺时行参与人的收益,即面对策略尺时,的收益。 【,u ,尺) = i 仙 三人博弈时,u ( z ,r ,r 2 ) 表示第一参与人( 行参与人) 选择固定策略j 、第 二参与人( 列参与人) 选择策略r 、第三参与人( 矩阵参与人) 选择策略恐时 行参与人的收益,l i p i s x 寸策略r 、恐时,的收益。 u u ,r ,恐) = u , 4 1 r ,i 如r ,i a n r ) r 四人博弈时,u u ,r 1 ,恐,r ) 表示第一参与人( 行参与人) 选择固定策略,、 第二参与人( 列参与人) 选择策略墨、第三参与人( 单矩阵参与人) 选择策略恐, 第四参与人( 双矩阵参与人) 选择策略r 时行参与人的收益,即面对策略墨、心、 足时,的收益。 1 0 江苏大学硕士学位论文 u u ,r ,是,尼) = ( ( ,a 。r ,i 如。r ,i a n 。r ) r , ( ,a :r ,。如墨,钆:r ) r , ( ,a r ,。如r ,。r ) r ) b 其中“”表示向量的内积。类似地,可以给出m + 1 人的基博弈的矩阵描述。不 难发现,v ( i ,r ,心) 关于每个变元都是线性的。因为万( 孝,磊,乞) 是不依赖 于 ,r m ) 中变元的选择顺序,所以u ( ,r ,如) 也是不依赖于( 乞,乞) 中 变元的选择顺序。我们称这种性质为支付函数u ( x ,r ,如) 的对称性。 每个参与个体都在按照一定的概率分布选择各个纯策略,在整个种群中分别 有相应比例的个体选择各个纯策略,这一比例向量反映了种群的一个状态。在种 群状态- ,下,随机抽取的个体的纯策略也具有概率分布- ,所以,也可以视作种 群中每个个体的混合策略。于是当种群状态为j 时,使用策略,的个体参与m + 1 人的基博弈时的期望收益为v ( i ,j ,j ) ( 因为面临的m 个参与人都在使用策略 j ) ,记为e ( i ,j ) 。也就是说 卅 e ( i ,j ) = u u ,j ,)( 3 1 1 ) 显然当,l & ,0 兄1 且j = 以。+ 0 - d ,:时,策略,的数学期望收益 e ( i ,j ) = 舾( n - 厂) + ( 1 - a ) e ( 1 2 ,j ) 。例如,在三人博弈中 e ( z ,1 + ( 1 一a ) i r 2 ,) = u 0 6 + ( 1 一五) j :,j ,厂) = ( ( 旯,1 + ( 1 一z 地) a ,( 五,1 + ( 1 一z ) ,:) 。a 2 j ,( 元,1 + ( 1 一名y 2 ) a ,) 。厂 = ml 婶,i 、婶,i 。a n 吩j 七q 一硼2 - 婶,1 2 雒,1 2 - a n n j = a u ( i l ,j ,j ) + ( 1 一力) u u 2 ,- ,) = z e ( i x ,厂) + ( 1 一见) e ( j 2 ,) 所以e ( i ,- ,) 关于第一变元是线性的,即有 e ( m l + ( 1 一d ,2 ,j ) = 旭( ,1 ,j ) + ( 1 一a ) e ( 1 2 ,j )( 3 1 2 ) 但e ( i ,) 关于第二变元不一定都是线性的,下面将讨论第二变元的线性性。 如果策略k ( 纯的或者混合的) 入侵,且入侵后使用策略k 的个体比例为g , 那么种群的状态就演化为+ 0 - s y 。如果博弈是二人博弈,策略,的参与人 1 1 江 苏大学硕士学位论文 进行基博弈时仅面临一个对手,其期望收益 e ( i ,+ ( 1 一s y ) = u ( j ,+ ( 1 一s ) j ) 0 1 3 ) = d v ( ,k ) + ( 1 一o u ( 1 ,j ) = 厦( ,k ) + ( 1 一z ) e ( i ,- 厂) 所以二人博弈条件下,e ( i ,j ) 关于第二变元也具有线性性。当种群的基博 弈是三个参与人时,策略,的参与人与其余二人博弈时的期望收益 e ( i ,+ ( 1 一o j ) = u ( ,d r + ( 1 一s ) j ,d r ( + ( 1 一s ) - ,) ( 3 1 4 ) = e 2 u ( i ,k ,k ) + 2 s ( 1 - 占) u ( ,k ,j ) + ( 1 一) 2 u ( ,j ,j ) 此时e 关于第二变元不再具有线性性质,但是e ( i ,+ o - o j ) 是占的二次多项 式。类似的,当种群的基博弈是四个参与人时,策略,的参与人与其余三人博弈 时的期望收益 e ( ,e k + 0 一s v ) = u ( ,k + ( 1 一g y ,k + ( 1 一占y ,k + ( 1 一s y ) :( ,k ,二,k ;+ 3 占2 ( 1 二- s ) j ( ,k ,k ,j ) + 3 二( 1 0 2 u ( i ,k ,j ,j ) ( 3 j 5 ) + ( 1 0 j u ( i ,j ,j ,i 厂) l t f 对e ( i ,+ o - o j ) 是s 的三次多项式。 一般地,当博弈为m + 1 人时,e ( i ,+ o - 6 p ) 是的m 次多项式。事实上, 根据u 的线性性和对称性,由( 3 1 1 ) 我们可以得到 e 放邮一妒) = u 旅:o ,- - 6 ”,旅坪吖 m 一七 ( 3 1 6 ) = z :o ( 1 一e ) m - k u ( ,k ,“,j ) 3 1 2 演化稳定性的定义 设厂为策略空间的一个策略,纯策略或者混和策略。按照【4 】中定义, 如果当,+ 被种群中大多数个体使用时,使用策略,的个体参与博弈时比使用异 于j 的其它策略,的个体可以获得更高的效用,则称,为种群的一个演化稳定策 略( e v o l u t i o n a r i l ys t a b l es t r a t e g y ,e s s ) 。当种群的状态为,时,演化稳定策略, 江苏大学硕士学位论文 较之其它策略具有更高的适应度,所以在种群策略选择的演化过程中,演化稳定 策略,+ 能够成功抵御其他变异策略的入侵。 【6 7 ,1 2 - 1 5 】在种群演化系统中研究的邻域进入者策略( n e i 曲b o r h o o di n v a d e r s t r a t e g y , n i s ) 则强调稳定性的另一方面:当厂的充分小邻域内的其它策略为种 群中大多数所选择时,使用策略厂可以获得比j 更高的适应度,从而可以成功进 入到种群中去。 【5 】将其应用到基博弈是二人矩阵博弈的单种群博弈的研究中, 尽管作者仍然称其研究的策略为n i s ,但是其定义中的策略j 不再位于厂的局部 邻域,而是s m 中异于j 的任意策略,所以这一概念较n i s 应该更强。本文称能 够成功进入种群任意状态的策略,+ 为全局进入者策略( g l o b a li n v a d e rs t r a t e g y , g i s ) 。 为了进一步讨论这几个稳定概念的性质及其关系,下面给出它们的明确定 义。设策略,和,为种群中的个体采用,且对应的个体比例分别为兄与 ( 2 + t = 1 ) ,则种群的状态为甜+ 。定义e s s 时,被大多数个体采用, = s 为小比例;定义n i s 或g i s 时,被大多数个体采用,名= 占为小比例。 定义1 如果对所有不同于厂的策略,s n ,了艿( 0 艿 1 ) ,当0 占 e ( i ,a r + ( 1 一g ) ,)( 3 1 7 ) 则称,为一个演化稳定策略( e s s ) 。 定义2如果存在,+ 的邻域n ( i + ) ,对v i ,且i n ( i + ) n s l y ,j 万 ( 0 万 1 ) ,当0 s e ( ,d + ( 1 一s ) ,)( 3 1 8 ) 那么称,为一个邻域进入者策略( n i s ) 。 定义3 如果对且,了万( 0 万 1 ) ,当0 u u ,i ) 或者( b ) u ( ,+ ,) = u ( ,i ) 且u u ,) u f f ,i ) 存在,+ 的邻域( ,) ,v i ,且,n ( i ) n i s 或者( a ) u ( ,) u ( ,) 或者( b ) u ( ,i ) = c 厂u ,i ) j t u ( i , i ) u ( ,i ) v i + g i s 或者( a ) u ( ,i ) u ( ,i ) 或者( b ) u ( f , i ) = u ( ,i ) r u ( f , i ) u ( ,) 表2 三人博弈下演化稳定性的等价条件 i 或者( a ) u ( ,+ ,+ ) u ( ,) e s s 或者( b ) u ( ,j + ,j ) = u u ,j r ) 且u ( ,j ,j ) u u ,) 或者( c ) u ( ,j ,) = u u ,厂,+ ) ,u u ,厂,) = 【,( ,j ,) 且 u ( ,。,i ) u ( ,i ,i ) 存在,f n ( 1 ) ,v i j 且,n ( i ) 或者( a ) u ( ,i ) u u ,i ,i ) 或者( b ) u ( ,i ,i ) = u ( ,i ,i ) 且u ( ,4 ,+ ,) u u ,+ ,j ) n i s 或者( c ) u u + ,i ,) = u ( ,i ,j ) ,【,u + ,+ ,) = u ( ,i ) 且 u ( 厂,j 。,i ) u ( i ,i ) v i i + 或者( a ) u u ,i ,i ) u u ,i ,) g i s 或者( b ) u ( ,i ,) = u ( i ,) 且u ( ,) u ( ,j ) 或者( c ) u u 。,i ,i ) = u ( i ,i ,) ,u ( ,i ) = u ( ,i ) 且 u u ,i ) u ( i ,i ) 1 4 江苏大学硕士学位论文 类似地可以得到肌+ 1 人博弈情形下各稳定性定义的等价条件( 不过需要 m + 1 组等式或不等式来刻画) 。例如e s s 、g i s 定义中要求对任意充分小的占成 立不等式: e ( ,。,盯+ o - c ) i ) - e ( i ,订+ 0 - c ) ) 0( 3 1 1 0 ) u ,d + + ( 1 一s ) ,) 一e u ,盯+ ( 1 - c ) i ) 0( 3 1 1 1 ) 其中左边表达式是s 的m 次多项式,故该不等式对任意充分小的g 成立的充 要条件是:或者前者的零次项系数大于后者,或者零次项系数相等时f j 者的一次 项系数大于后者,依此类推。将( 3 1 6 ) 代入,n ( 3 1 1 0 ) 、( 3 1 1 1 ) 左边可以表示为: := 。 ? :z ;j i c l z ;) “h 一 1 :,( ,:,+ ,? j ! ,) l :,l l ,:,+ ,? = - ! ,+ ) 二q ( 1 叫删p * 。m 一- i ,矿吣,“m - i 棚 当占充分接近于0 时,可得到e s s 、n i s 、g i s 的等价定义,如下: 定理1 ( a ) 是e s s 当且仅当对任意,当且仅当以下条件之一成立 ( e s s l ) u ( f , i ,+ ) u u ,i 。) ; mmm 1 m - l ( e s s 2 ) u ( f , i ,j
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 朝阳市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(各地真题)
- 榆林市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及1套参考答案详解
- 安顺市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(研优卷)
- 上海市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(培优)
- 海东地区农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及一套参考答案详解
- 台北市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)完整参考答案详解
- 淮南市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(夺分金卷)
- 铜陵市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)附答案详解ab卷
- 大庆市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(模拟题)
- 白城市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)及答案详解(名师系列)
- 2025至2030中国军用电池行业产业运行态势及投资规划深度研究报告
- 角膜内皮细胞课件
- 管道支墩施工方法
- 2025九省化学联考试题及答案
- 医院潜力分析
- 党建活动宣传方案策划与实施
- 浦发银行笔试题及答案
- 抖音上架poi需上传商家合同协议
- 肺栓塞患者急救及护理
- 《控制电机》课件-第四章 步进电动机
- DB63∕T 1952-2021 水文设施工程质量评定规范
评论
0/150
提交评论