(应用数学专业论文)一个多种群博弈模型及其ess.pdf_第1页
(应用数学专业论文)一个多种群博弈模型及其ess.pdf_第2页
(应用数学专业论文)一个多种群博弈模型及其ess.pdf_第3页
(应用数学专业论文)一个多种群博弈模型及其ess.pdf_第4页
(应用数学专业论文)一个多种群博弈模型及其ess.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

江苏大学硕士学位论文 摘要 众所周知,经典非合作博弈理论的主要缺陷是对理性的要求太高,它不仅要 求参与人自己是完全理性的,而且要求它的对手也是完全理性的。这种完全理性 假设与现实世界不完全符合。随着进化博弈理论的不断发展,经典非合作博弈理 论的缺陷得到了很好的解决。本文主要包括以下几个方面内容: 第一部分主要讲述了进化博弈理论的发展及国内外研究现状和本文的主要 研究内容。 第二部分是预备知识,主要介绍纳什均衡和种群动力学的概念。 第三部分开始是本文的主要内容,首先,文章在考虑到博弈进化过程中各群 体状态的改变都会影响参与人的收益支付,于是给出了两种群博弈的一种一般描 述,并在相应描述下建立了两种群博弈的e s s 模型。相关结果表明所定义的e s s 具有和单种群博弈的e s s 一些相似性质,并且在支付线性条件下,具有和单种 群博弈e s s 相似的一阶和二阶最优反应条件。接着讨论了支付线性的刻画方式, 给出了具有这些描述的一个博弈实例。 其次,由于第三章定义的e s s 得不到博弈相应描述下动态系统渐近稳定的 理想结果,于是第四章给出了两种群博弈的严格e s s 定义,并在假设支付映射 具有连续性,凸性或线性性的条件下得到了关于严格e s s 的等价条件。然后建 立该博弈的复制动态系统,并得到严格e s s 是此系统的局部渐近稳定点的结论。 最后,本文把两种群博弈的严格e s s 及其稳定性问题推广到n 种群博弈上, 并研究了具有本文描述特征的n 种群矩阵博弈。 关键词:n a s h 均衡,e s s ,线性支付映射,复制动态方程,矩阵博弈 i 江苏大学硕士学位论文 a b s t r a c t i ti sw e l lk n o wt h a tt h ei m p o r t a n ts h o r t c o m i n go fc l a s s i c a ln o n - c o o p e r a t i v eg a m e t h e o r yi st h er a t i o n a l i s t i cf o u n d a t i o n n o to n l yi si tr e q u i r e dt h a ta g e n t sb eo p t i m i z e r s , b u ti ta l s op r e s u m e sal a r g ed e g r e eo fc o o r d i n a t i o no fd i f f e r e n ta g e n t se x p e c t a t i o n s w i t ht h e d e v e l o p m e n t o fe v o l u t i o n a r y g a m et h e o r y , t h ep u z z l e o fc l a s s i c a l n o n c o o p e r a t i v eg a m et h e o r yh a sb e e nw e l ls o l v e d i nt h ef i r s tp a r t ,w em a i n l yi l l u s t r a t et h ed e v e l o p m e n to fe v o l u t i o n a r yg a m e t h e o r y , t h er e s e a r c hs u r v e yi nh o m ea n da b r o a da n dt h el e a d i n gc o n t e n t so f r e s e a r c hi n t h et e x t t h es e c o n dp a r ti sp r e l i m i n a r y , w ep r e s e n tt h ec o n c e p t so fn a s h e q u i l i b r i u ma n d p o p u l a t i o nd y n a m i c s t h et h i r dp a r ti st h ep r i m a r yc o n t e n to ft h i sp a p e r , f i r s t l y , u n d e rt a k i n gi n t o c o n s i d e r a t i o nt h ei n f l u e n c eo ft h ep o p u l a t i o ns t a t e so nt h ei n d i v i d u a l sp a y o f f si nt h e e v o l u t i o n a r yd y n a m i c s ,a ng e n e r a lf o r mo ft w o s p e c i e sg a m ei sp r o p o s e d t h ee s s m o d e lo ft w o s p e c i e sg a m ei nt h i sg e n e r a lf o r mi st h e ne s t a b l i s h e d t h er e s u l t ss h o w s t h a to u re s sh a st h es i m i l a rp r o p e r t i e so ft h ee s so fs i n g l es p e c i e sa n d ,w h e nt h e p a y o f fi sl i n e a r , m e e tt h es i m i l a rf i r s t - - o r d e ra n ds e c o n d - - o r d e rb e s t - - r e p l yc o n d i t i o n so f s i n g l es p e c i e s s e c o n d l y , b e c a u s eo ft h el i m i t a t i o no ft h ed e f i n i t i o no fa b o v ee s s ,t h es t a b i l i t y o ft h er e p l i c a t o rd y n a m i ci s n th o l d ,s ow eg i v et h es t r i c te s so ft w o s p e c i e s ,a n d w h e nt h ep a y o f fm a pi sc o n t i n u o u s ,c o n v e xo rl i n e a r , w eh a v es o m er e s u l t ss u c ha s t h ee q u i v a l e n tc o n d i t i o n so ft h es t r i c te s sa n di t sl o c a ls t a b i l i t yo ft h er e p l i c a t o r d y n a m i c s l a s t l y , w ee x t e n dt h es t r i c te s so ft w os p e c i e sa n di t ss t a b i l i t yi n t on s p e c i e s g a m e ,a n da sa l le x a m p l eo ft h ee x t e n s i v ef o r m ,am a t r i xg a m ei st h e ns t u d i e d k e y w o r d s :n a s he q u i l i b r i u m ,e s s ,l i n e a rp a y o f f - m a p p i n g ,r e p l i c a t o re q u a t i o n , m a t r i xg a m e 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规 定,同意学校保留并向国家有关部门或机构送交论文的复印件和 电子版,允许论文被查阅和借阅。本人授权江苏大学可以将本学 位论文的全部内容编入有关数据库进行检索,可以采用影印、缩 印或扫描等复制手段保存和汇编本学位论文。 保密口 本学位论文属于,在年我解密后适用本授权书。 不保羽 学位论文作者签名:琴嘶指导狮签名:可叉 州年胁 日年帆7 日 独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的 指导下,独立进行研究工作所取得的成果。除文中已注明引 用的内容以外,本论文不包含任何其他个人或集体已经发表 或撰写过的作品成果。对本文的研究做出重要贡献的个人和 集体,均已在文中以明确方式标明。本人完全意识到本声明 的法律结果由本人承担。 砧 户 名 月 鹤 蝴 者 年 作 冀 姚 趟 论 艮 鳓 瑚 剿 日 江苏大学硕士学位论文 1 1 进化博弈论的简介【1 】 第一章绪论 进化博弈理论来自达尔文的生物进化论,自二十世纪六十年代l e w o n t i n t 2 就用进化博弈理论来解释生态现象,在七十年代随着进化稳定策略【3 】( m a y n a r d s m i t h 和p r i c e1 9 7 3 ;m a y n a r ds m i t h1 9 7 4 ) 概念的提出,该理论逐渐被广泛地用 于生态学领域,八十年代随着对经典博弈理论研究的深入,许多经济学家把进化 博弈理论引入到经济学领域,应用于分析社会制度变迁,以及股票市场等等,同 时对进化博弈理论的研究也开始由对称博弈向非对称博弈的深入,并取得了一定 的成果。进入九十年代,尤其是1 9 9 2 年关于进化博弈理论的会议在康奈尔大学 召开,进化博弈理论的学术地位得到正式认可,于是对进化博弈理论的研究进入 , 了一个崭新的阶段,进化博弈理论的应用得到了迅速的发展。 ( 一) 经典博弈理论的困惑 传统研究博弈理论的方法其假设基础是参与人具有完全理性,在该假设中, 既要求参与博弈的行为主体始终以实现自身利益最大化为目标,又要求参与人具 有在确定和非确定性环境中追求自身利益最大化的判断和决策能力,不会犯错 误,而且还要求他们之间对彼此的理性能力深信不疑,即有理性的共同知识。事 实上,人们在参与市场竞争,面对大多数不确定性或者复杂的环境下做决策时, 很难按照完全理性假设的那样作出最优决策,同时也对竞争对手的理性问题保持 怀疑态度。所以在这种环境下,竞争的结果将不可能达到完全理性条件下的平衡, 即使一开始实现这种平衡,也会因为行为主体的理性局限而有偏离这种平衡的情 况。因而,参与竞争的行为主体的理性是有局限性的,完全理性的假设是不现实 的。而经典博弈理论在此基础上引入了博弈局中人之问的互动作用,从而使理论 和现实更为接近,但是还没有能跳出传统研究博弈理论的基本框架,他在预测博 弈局中人的行为时存在以下缺陷: ( 1 ) 在做平衡分析时,经典博弈理论不但假设参与人是完全理性的,而且 每个参与人对博弈的结构及对方的支付有完全的了解,求解子博精炼n a s h 平衡 时所利用的后向归纳法不但要求参与人是完全理性的,而且还要求序贯理性。显 然这个比理性概念要求更强的假设与现实相差太远。 1 江苏大学硕士学位论文 ( 2 ) 经典博弈理论在处理不完全信息问题时有两种方法:( 1 ) 假定参与人知 道“真实模型的结构 ,但是模型中的各参数是不可观察的;( 2 ) 假定各参与人知 道各种可能状态客观的概率分布,给定一个先念信念,当出现任何新信息时,每 个人都能够应用贝叶斯法修正自己的先念信念。这两种处理不完全信息的方法有 三大缺陷:其一,必须假定参与人知道博弈的各种可能状态;其二,必须假定参 与人知道在随机抽取状态上的客观概率分布;其三,必须假定参与人有很强的计 算、推理能力,且能够在一个大的状态空间上应用贝叶斯法则解决复杂问题。显 然,这三个假定与现实不符。 ( 3 ) 经典博弈理论作为预测工具的理论基础是n a s h 平衡及其精炼,它不但 假设参与人是完全理性的,而且要求每个参与人的预期满足一致性原则。所谓一 致性原则要求每个参与人正确知道其他参与人将会如何选择。然而,这些知识从 何而来呢? 经典博弈理论对此有过许多研究并形成了几种共同的观点,如 s c h e l l i n f 4 1 于1 9 6 0 年提出的聚点,他认为:如果博弈存在一个显式博弈规则,那 么参与人知道其他参与人将作出何种选择,但这种显式博弈规则又意味着什么 呢? 又如a u m a n n 5 1 于1 9 9 0 年提出的博弈前的交流,m y e r s o n 6 】于1 9 9 1 年提出的 自我实现预期。但是他们都不能说明参与人的知识从何而来因而缺乏说服力。 基于经典博弈理论对理性的假设的局限性,博弈理论的发展需要新的理论根 据来弥补其局限性,随着进化博弈理论的发展,这一问题得到了很好的解决。 ( - - ) 进化博弈理论的优势 由于研究方法和研究对象的不同,进化博弈理论有以下几个优点。 ( 1 ) 理性假设的优势。进化博弈理论从有限理性的个体出发,以群体为研 究对象,克服了经典博弈理论中对完全理性的苛刻要求。 “有限理性”概念的主要提倡者是若贝尔经济奖得主s i m m o n t 7 1 ,有限理性 意味着行为主体只能知道世界状态的一部分而不能知道世界的所有状态,参与人 也不可能知道各种状态出现的客观概率及不同状态对自己支付的意义,从一开始 参与人往往不能作出最优决策,个体的决策是基于某种常规而非理性的计算结 果,这种常规来自博弈的历史,因为历史已经包含了对手如何行动的相关信息, 同时通过对历史的观察有助于参与人知道什么是成功策略什么是不成功策略。 ( 2 ) 研究方法的优势。经典博弈理论以参与人个体为研究对象,他虽然认 2 江苏大学硕士学位论文 为个体之间的行为是相互影响的,但却在假定其他参与人行为选择一定的情况下 来考察个人最优化行为。即使在非对称信息动态博弈中经典博弈理论也假定每个 参与人都能从对手的选择中正确地推断博弈的支付结构进而预测到平衡结果,所 以不需要考察达到平衡的动态过程。进化博弈理论以参与人群体为研究对象,假 定各群体、个体之间的行为相互影响且不同群体的个体之间进行重复博弈,个体 在给定信息下并不一定选择最优化行为,而是在博弈过程中学习、模仿和突变等 动态过程不断寻找较好策略,其平衡的结果依赖于博弈的历史。达到平衡的过程 影响到平衡的结果,因而进化博弈理论只要利用动力学方法研究群体达到平衡的 行为调整过程,这种方法可以把从个体行为到集体行为的形成机制、组织和制度 等因素都纳入到模型中去,因此能更真实地反映主体行为的多样性和复杂性。 进化博弈理论从发展到现在受到社会学、经济学、生态学的普遍关注。特别是该 理论的基本均衡概念一进化稳定均衡提出以后,理论界已经从不同的方面对它进 行了拓展,并取得了令人瞩目的成果,使进化博弈理论体系在发展中得到不断完 善。下面简要介绍一下e s s 概念在不同条件和因素下的研究和拓展。m a y n a r d s m i t h 和p r i c e ( 1 9 7 3 ) 3 】针对单个无限种群的对称博弈提出了最原始的e s s 的概 念。该概念提出以后,为了使其与现实更加接近,许多学者就种群内个体数量规 模有限情形( 有限种群) 及多种群非对称博弈情形下的e s s 概念进行了拓展和 研究。v i c k e r y 跚( 1 9 8 8 ) g 正明如果e s s 的定义放在有限种群下考虑,该种群就可能 被突变者入侵,他同时得到有限群体的e s s 并不是纳什均衡的结论。 s c h a f f e r t 卅( 1 9 8 8 ) 放宽种群规模无限大的假定,考察了有限种群的进化稳定性并提 出了有限规模种群e s s 的概念。d a n i e lb n e i l l 1 0 1 ( 2 0 0 4 ) 在分析s c h a f f e r ( 1 9 8 8 ) 有 限规模群体模型的基础上定义了大种群的e s s ,他证明该种群不会被突变者入侵 ( 如果假设群体规模足够大,但不是无穷大) 。这些研究是单种群对称博弈在种 群规模不是无穷大情形下关于e s s 概念的拓展。现实中许多博弈可能发生在两 类或者多类群体的个体之间,他们进行的是非对称博弈,t a y l o r ( 1 9 7 9 ) ,s w i n k e l s ( 1 9 9 2 ) ,c r e s s m a n ( 1 9 9 2 ) 和h o f b a u e r ( 1 9 9 8 ) 等给出了非对称博弈的一种e s s 的概 念,但最后都等价于严格纳什均衡。g a r a y 和v a r g a 【l u ( 2 0 0 0 ) 对多种群非对称博 弈定义了严格n 种群e s s 的概念。c r e s s m a n 、g a r a y 和h o f b a u e r t l 2 】( 2 0 0 1 ) 认 为g a m y 和v a r g a ( 2 0 0 0 ) 定义的e s s 条件要求太严格,最终状态可能不会实现。 3 江苏大学硕士学位论文 于是他们研究了n 类频率依赖的种群进化稳定策略,并提出了此搏弈下e s s 充 要条件,然后分别从单态和多态两方面对e s s 进行了研究。 1 2 进化博弈论研究意义f 2 q 进化博弈论在理论和实践两方面都有非常重大的意义。在理论方面,进化博 弈论首先克服了理性博弈分析脱离实际的问题,使得其理论基础更加扎实和实践 性更强。因为进化博弈分析的结果总体上也是支持完全理性博弈分析的,因此等 于使整个博弈论的理论基础得到了加强。其次,进化博弈分析也是从一个角度精 炼和筛选纳什均衡的方法,因此在一定程度上解决了完全理性博弈分析的均衡选 择困难,扩展和加深了我们对以完全理性为基础的博弈分析的认识。第三,进化 博弈理论也加深和拓展了我们对人类理性和能力的局限性,以及这种局限性对于 经济问题和经济意义的认识。第四,进化博弈论是经济学与其他科学相互影响、 相互促进的良好典范。它一方面吸收、运用生物进化理论的思想和研究方法,用 于研究人类的社会经济行为,但是反过来它的理论成果又可以用于研究生物进化 演变规律,研究生物的行为特征和生物多样性等问题,使两种学科都得到了重大 进展。在实践方面,进化博弈理论更是有非常广泛的应用范围,例如可以研究国 际政治、军事中关于战争与和平的选择,研究世界政治经济格局的形成和稳定性 问题,研究不同军事策略的价值和意义,研究人类社会制度、组织和规范的发展 和演变规律,也可以研究股市中的投机者行为和股市均衡,解释企业家选择的机 制和企业文化的发展和演变等等。 1 3 本文研究的主要内容 进化博弈理论研究博弈群体的状态。群体的状态x 既表示群体使用纯策略的 参与人人数的比例向量,也解释为群体中每个参与人都在使用同一个混合策略。 进化稳定策略的本质在于它能够抵抗变异策略的微小入侵。上述这些研究工作中 关于个体收益及种群平均收益都能够由各种群的策略组合确定,而且可以由支付 矩阵刻画。但参与人的收益是否完全取决于各种群的策略组合( 自己和其他群体 的策略) 呢? 以生态进化为例,不同类型的种群相互博弈而演化。种群演化的收 益是适应度,可以认为,每个个体其策略选择的适应度除了与自己和其他群体的 4 江苏大学硕士学位论文 策略选择有关外,还应该与其所在群体目前的进化状态有关,个体适应度与其所 在群体休戚相关。博弈进化过程中,从一般意义讲,群体状态的演化和改变同时 改变了参与人个体的博弈环境,从而影响收益支付。所以多种群博弈的描述可以 更具一般性,把参与人的收益还与自己所在群体的状态有关这一因素纳入到模型 中去。本文就是对多种群博弈进行这种更具一般性的描述,并在此描述下定义博 弈的e s s ,然后对其进行稳定性研究。 本文主要分为以下几个部分具体结构如下: 第一章介绍了进化博弈理论的研究背景和现状,主要从两个方面来比较说 明进化博弈理论比经典博弈理论更具有现实意义,更符合现实。 第二章首先介绍了纳什均衡的概念,然后介绍了单种群演化博弈的进化稳 定策略,最后简单介绍了种群动力学的相关知识。 第三章在考虑到博弈进化过程中各群体状态的改变都会影响参与人的收益 支付,本章首先给出了两种群博弈的一种一般描述,并在相应描述下建立了两种 群博弈的e s s 模型。相关结果表明所定义的e s s 具有和单种群博弈的e s s 一些 相似性质,并且在支付线性条件下,具有和单种群博弈e s s 相似的一阶和二阶 最优反应条件。接着讨论了支付线性的刻画方式,给出了具有这些描述的一个博 弈实例。 第四章本章在第三章的基础上给出了两种群博弈的严格e s s 概念,并在假 设支付映射具有连续性,凸性或线性性的条件下得到了关于严格e s s 的等价条 件。然后建立该博弈的复制动态系统,并得到严格e s s 是此系统的局部渐近稳 定点的结论。 第五章本章把两种群博弈的严格e s s 定义和相关研究结果推广到了n 种群 博弈上,最后研究了具有本文描述特征的n 种群矩阵博弈。 5 江苏大学硕士学位论文 第二章进化博弈的理论基础 本章主要介绍演化博弈的基本概念,2 1 节介绍n a s h 均衡基本概念;2 2 节 给出单种群和两种群演化博弈的基本定义,包括单态e s s 和多态e s s 博弈的经 典定义。2 3 节给出种群动力学的简单介绍。 2 1n a s h 均衡基本概念伫7 】,【2 明 在研究n a s h 均衡基本概念之前,先来介绍几个博弈论中的基本概念。 参与者。参与者指的是一个博弈中的决策主题,通常又称为参与人或者局中 人。参与者参加博弈的目的是通过合理的选择自己的行为,以期取得最大化自己 的收益( 效用) 。参与人可以是自然人,也可以是企业、国家。通常参与者用f 表 示,f 1 。 理性。如果一个参与者寻求以一种最大化自己支付的方式进行博弈,那么这 个参与者就是理性的。 策略。策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定 参与者在什么时候该选择什么行动。或者说,策略是参与者“相机行动方案 。 通常用a ,表示参与者f 的一个特定行动,所有行动集合用a = 色) 表示。岛表示 参与者f 的一个特定战略,大写s = t ) 表示参与者f 的所有可能的战略集合( 又 称为参与者f 的战略空间) 。如果刀个参与者每人选择一个策略,那么以维向量 a = ( 口,a :,a 。) 称为一个行动组合,其中a ,是参与者f 选择的行动。 s = “,s 。) 称为一个策略组合,其中墨是参与者f 选择的策略。纯策略q u r c s t r a t e g y ) :每一个参与者在博弈中选择采用的行动方案,每个参与者均有其可供 选择的多种策略;混合策略( m i x e ds t r a t e g y ) :在一个给定的概率下决定参与者决 策的随机行动,作为特殊情况每一个混合策略可能是一个给定的纯策略的确定性 选择。 收益。在博弈论中,收益是指在特定的战略组合下参与者得到的确定的效用 或期望效用。效用通常表现为博弈结果中的输赢、得失、盈亏。收益是参与者真 6 江苏大学硕士学位论文 正关心的问题。在博弈论中通常用u 。表示参与者f 的收益,如果一个战略组合是 ( 岛,s :,s n ) ,每个参与人的收益可以表示为蚝= “,( 西,是,s 。) ,扛1 ,2 ,n 均衡。在博弈论中,均衡指的是所有参与者的最优战略的组合,通常记为 s = “+ ,墨,s n ) 其中s j + 是参与者f 在均衡状态下的最优战略,它是参与者f 所有的可能战略中使h ,或e “,最大化的战略。通常是所有参与者的战略组合的 函数,而参与者珀勺最优战略又是依赖于其他参与者的战略选择。所以说墨是在 给定其他参与者的战略选择记为s 一,= ,s j 巾岛“,s 。) 条件下参与者f 的最优 战略,即蚝( s 1 ,一,墨- 1 ,墨,墨+ l ,s n ) “,( s l ,一,s t _ l ,母,墨+ l ,s n ) 。 均衡是博弈论中 最重要、最基础的概念,对于不同类型、不同条件的博弈问题又形成各种各样的 均衡概念,它们构成博弈论五彩缤纷的预测结果。 2 1 1 纯策略n a s h 均衡 下面我们给出纯策略n a s h 均衡的概念,它是对非常广泛的博弈问题给出更 加严格的结果。 定义2 1 1 在博弈问题g = 俩,s 。;u a ,“。) 中,如果对于每一个参与者 fo = 1 ,2 ,咒) ,岛是针对其他刀一1 个参与者所选策略( s i ,s 二,s 二,西) 的最优 反应策略,即 ( i ,s 二,i ,s 二,) “,( i ,s 二,岛,s 2 1 ,) 对墨中所有的母都成立,亦即置+ 是最优化问题 嚣比, s l ,s = l ,岛,s ,) ,f _ 1 , 2 ,刀 的解,则策略组合s = ( s i - ,西,西) 称为该博弈的一个n a s h 均衡。 可以从另外一个角度来认识n a s h 均衡。考察一个策略组合,= “,;砖- - ) , 如果s 7 不是g 的一个n a s h 均衡,就意味着存在若干参与者f ,其策略不是针 对“,如,如) 的最优反应策略,即在研中存在,使得 7 江苏大学硕士学位论文 u t ( ,吐。,文l ,一,) h ,( s :,吐。,s 二s - ,s :) 这就说明,如果策略组合( s i ,) 不是n a s h 均衡,那么至少有一个参与者有动 因偏离这个结果。 2 1 2 混合策略n a s h 均衡 混合策略指的是参与者以一定的概率去选择某种策略。这类博弈虽然在一次 操作中有输有赢,但是将这个博弈多次重复进行,可以研究各个策略应赋予多大 的概率,能获得最大的期望收益。换句话说,参与者f 的一个混合策略是在其策 略空间s ,中策略s ,的概率分布。 一般地,假设参与者f 有k 个纯策略s ,= s n , ,则参与者f 的一个混合 策略是一个概率分布( a 1 一,陬) ,其中m 表示参与者f 选择策略的概率 ( k = 1 2 o9 k ) 。由概率分布的条件,对所有k = 1 2 ,k ,应有0 - x a y 7 ( c ) 要么 y b x y b x ) 那么,称 ,y + ) 为一个e s s 。 m 和n 分别代表行、列参与者的纯策略数。 2 3 种群动力学的介绍 进化博弈理论主要是利用动力学的方法研究群体中的个体选择策略( 或策略 集) 的过程。 进化博弈理论用系统论的观点看待群体行为的调整过程,主要研究群体行为 演化系统的变化,如何描述系统的状态变化是进化博弈理论的关键,对此博弈理 论学家和经济学家进行了广泛而深入的研究,根据他们考虑问题的角度不同而提 出了不同的动力学模型。 到目前为止应用最多的是复制动力学。复制动力学是选择过程的显性模型, 它说明种群是如何分配博弈中有联系的不同纯策略随时间而演化的。复制动力学 的数学公式是由t a y l o r 和j o n k e r 于1 9 7 8 年提出的。他们假定有随机配对的个体 所构成的一个大种群执行有限对策的两人博弈,个体仅仅采用纯策略。种群状态 是指在纯策略上的一个分布x ,这种状态在数学上与经典博弈论中的混合策略是 等价的。如果博弈中的收益表示成生物学上的适应性,也就是后代的数目,同时 1 3 江苏大学硕士学位论文 每一个后代继续其父母的策略,因此,采用纯策略e 的个体数目( 在大的种群中) 将以某一比率指数增长,于是等于对纯策略e 的预期收j 益u ( e i 功,当执行着表示 种群中当前策略分布的混合策略x 时,采用任何纯策略e 7 的种群分布的增长率等 于此策略的收益与种群中平均收益的差。后者,等同于混合策略x 当与其自身博 弈时的预期收益h ( x ,功。一个单种群的对称两人博弈的复制动力学是: d x _ i = 阻( ,力一比( z ,力】毛,f = 1 ,2 “i 复制动力学能够推广到n 人博弈的情形。 1 4 江苏大学硕士学位论文 第三章两种群博弈的一种描述及其e s s 前面给出了单种群和多种群博弈在矩阵描述下进化稳定策略的经典概念,从 第三章开始我们给出多种群博弈的一种描述及其e s s ( 进化稳定策略) 。 3 1 两种群博弈的一种一般表示 单种群博弈考虑仅有一种类型的博弈群体,每个参与人都有,种纯策略 , e i e 2 ,e 7 ,策略空间为s = 瓴,乞,乙) :弓= 廿,使用策略x 的参与人与策 略y 的参与人博弈时,其收益支付为比( 石,y ) 。单种群博弈描述为g = s ,;“似) ,) 。 根据m a y n a r ds m i t h 定义,策略叠称为博弈的一个e s s ,如果它满足以下一阶和二 阶最优反应条件: “( 凳,曼) h ( ) ,动,v ) ,s t ( 3 1 1 ) u ( y ,叠) = “( 毫安) j 以( 毛y ) “( y ,y ) ,v y 凳 ( 3 1 2 ) 多种群考虑参与人有多种类型,例如两种类型从而有两个群体:群体1 和群 体2 。类型1 有胛个纯策略一,孝2 ,孝”,类型2 有m 个纯策略一,f 2 ,f ”。类型1 和类型2 的策略空间分别为s 。= 【“,x 2 ,而) :五= q 及 r n s 。= ( 乃,y 2 ,) :y j = 廿。博弈在类型1 和类型2 的参与人之间进行,类型1 的策略x 与类型2 的策略y 构成的策略组合 ,y ) 完全确定了两种类型参与人各 自的支付:类型1 的支付口似y ) 及类型2 的支付6 ( z ,y ) ,此种多种群博弈就描述为 g = 碱,s m ;口( x ,y ) ,b ( x ,y ) 。这是博弈在不同类型之间进行时人们通常使用的一 种描述方式,我们这里称为标准描述。 在上述的标准描述中,群体1 与群体2 的策略x 、y 完全决定了两者的支付, 1 5 江苏大学硕士学位论文 即各自的得益。在这种描述中,当变异策略入侵后,虽然改变了所在群体的状态, 但是入侵策略与在位策略的支付只由另一群体的状态决定,与所在群体的状态无 关;或者说,一个群体中某个参与人策略选择后的得益只与另一群体的策略选择 有关,而与所在群体的其余参与人的策略选择无关。显然,这种博弈模型不具一 般性。当两个群体博弈时,两个群体的当前状态都会对参与人个体的博弈支付产 生影响。本章就是在考虑到博弈进化过程中各群体状态的改变都会影响参与人的 收益支付,于是给出了两种群博弈的一种一般描述,并在相应描述下研究了两种 群博弈的e s s 。 设两种类型都只有有限个纯策略,但参与博弈的参与人数量很大。第一种类 型的纯策略设为夕,孝2 ,孝”,第二种类型的纯策略用f 1 ,f 2 ,f ”表示。类型1 的策略空间瓯= “,x 2 ,毛) :e x , = q , 类型2 的策略空间 册 一 s ,= ( y ,y :,y 。) :y j = 9 。类型1 的混合策略x s 。可以表示为x = 薯, 类型2 的混合策略y s 。可以表示为) ,= y f i 7 。设群体1 使用纯策略孝的参与人 比例为五,则x = ( 而,x z ,) 表示其状态向量,作为策略组合它也可以解释为在 此状态下群体中每个参与人都在使用的同一个混合策略。群体2 的状态向量记为 y = ( 乃,y 2 ,咒) 。( 而y ) 称为两个群体的联合状态,或称为博弈的状态。 我们认为,类型1 的参与人使用策略与类型2 进行博弈时,一般地他的支付 取决于三个方面:( 1 ) 类型1 的状态x ;( 2 ) 类型2 的状态y ;( 3 ) 自己使用的 策略p 。故其期望支付可以表示为 u = “( x ,) ,) ( p ) ( 2 1 ) 其中,u ( x ,y ) 是鼠上的实值函数,是类型1 的参与人个体策略p 的函数。在博 弈状态( x ,y ) - f f ,参与人选择策略p 后,其支付收益就由函数“( x ,y ) 确定。或者 说,存在s 。x s 。到定义于最上的函数空间f ( s 。) 的映射“:瓯x s 。- - - f ( s 。) ,使得 在任意博弈状态o , ) ,) 下,确定了类型1 的参与人的支付函数u ( x ,y ) :当他使用 1 6 江苏大学硕士学位论文 策略p 参与博弈时,他的收益u ( x ,) ,) ( 力。 同样,博弈状态( x ,y ) 下,类型2 的参与人使用策略g 的( 期望) 支付可以表 示为 v = ,o ,y ) ( d ( 2 2 ) v ( x ,y ) 是由状态( x ,y ) 决定的类型2 的参与人的支付函数。 定义2 1 ( 支付映射) 映射“:最x s m f ( 鼠) ,1 ,:x s 。专f p 脚) 分别称 类型1 和类型2 的支付函数映射,简称支付映射。 于是两种群博弈可以扩展为g = p 。,s ,;“, ,其中“,1 ,分别是该类型1 和类 型2 的支付映射。 3 2 两种群博弈的e s s 3 2 1 两种群博弈e s s 的定义 现在考虑两种群博弈g = s ,s m ;u ,田。假设博弈位于状态 ,夕) ,即群体1 和群体2 使用各自纯策略人数的比例向量分别为童和夕,或者群体1 的参与人都 在使用混合策略叠,群体2 的参与人都在使用混合策略夕。 若群体1 中有策略p 入侵,入侵比例为占( 群体中比例为f 的参与人使用策 略p ) ,则入侵后群体1 的状态为s p + ( 1 一s ) 殳。圣能成为类型1 的进化稳定策略, 是指量能抵抗变异策略p 的入侵。 定义3 1曼的称为类型1 关于类型2 的状态夕的进化稳定策略( e s s ) ,如 果对任意的策略p 最( p 凳) ,存在于( p ) 0 ,使得当0 o ,万( g ) 0 ,使得当0 s 石( p ) , 0 ,( 毛锄+ ( 1 一d 夕) ( 彩 ( 3 2 ) 下面我们去推导,当类型1 与类型2 的支付射“ ,) ,) ,v ( x ,y ) 都是线性映射 时,这样定义的e s s 具有单种群博弈相似的一阶和二阶最优反应条件刻画方式。 3 2 2 线性支付映射下的e s s 的等价形式 当u ,是线性映射时,( 3 1 ) 、( 3 2 ) 可化为 d m ( p ,夕) ( 句“( p ,夕) ( p ) 】+ ( 1 一s ) 【“( 戈,夕) ( 甸一“ ,夕) ( p ) 】 0 ( 3 3 ) 研,( 曼,留) ( 夕) 一v f f c ,日) ( q ) 】+ ( 1 一万) 【,( 殳,夕) ( 夕) v ( 竞,夕) ( q ) 】 0 ( 3 4 ) 由于s 可以充分小,( 3 3 ) 等价于以下两个条件: 比( 毫夕) ( 甸“ 夕) ( 力,砌& ( 3 5 ) “( 量,夕) ( 句= “( 爻,夕) ( p ) ju ( p ,夕) o 叻 “( p ,夕) ( p ) ,v p 舅 ( 3 6 ) 同样( 3 4 ) 等价于以下两个条件 1 ,( 量,夕) ( 夕) y ( 戈,夕) ( q ) ,、啕a m ( 3 7 ) v ( 曼,夕) ( 夕) = y ( 竞夕) ( q ) = 1 ,( 毫d ( 夕) ,( 凳,口) ( d ,v q 夕 ( 3 8 ) ( 3 5 ) 一( 3 6 ) 以及( 3 7 ) 一( 3 8 ) 就是类似于单种群对称博弈中e s s 所 满足的一阶和二阶最优反应条件( 3 1 1 ) 。( 3 1 2 ) 。 当然,这样的结果是由u ,v 线性条件保证的。后面第四部分研究在本文的 两种群博弈中,线性支付映射u ,v 的刻画方式。 1 8 江苏大学硕士学位论文 3 2 3e s s 与纳什均衡 对于上述两种群博弈g = 瓯,& ;“似y ) , ,似y ) ,( z ,) ,) s nx s 。 ,容易定义它 的纳什均衡。 定义3 3 ( 纳什均衡) 策略组合 ,夕) 称为博弈的一个纳什均衡,如果它满 足下面两个不等式: u ( y c ,夕) ( 曼) h ( 曼,夕) ( p ) ,v ps n ( 3 9 ) ,( 戈,夕) ( 夕) v ( 毫夕) ( q ) ,v q s 。 ( 3 1 0 ) 如果p 凳,q 夕时( 3 9 ) 和( 3 1 0 ) 严格不等式成立,则称 ,夕) 为博弈的严格 纳什均衡。 性质3 1 如果类型1 与类型2 的支付映射“o ,y ) ,v ( x ,y ) 都是连续的,则 博弈的任何e s s 都是纳什均衡。 证 在( 3 1 ) 、( 3 2 ) 中分别令sj0 ,万一o ,即得( 3 9 ) 、( 3 1 0 ) 。证毕。 用腮,脚分别表示博弈的纳什均衡集合与e s s 集合。性质3 1 指出, 麟ca n s 。这一结果与单种群博弈完全一致。 性质3 2 如果支付映射“ ,_ y ) 与x 无关,v ( x ,y ) 与y 无关,则博弈的e s s 等价于严格纳什均衡。 证 u ( x ,y ) 与x 无关,v ( x ,y ) 与y 无关时,u ( x ,y ) - - u ( y ) ,v ( x , y ) - v ( x ) , 则不等式( 3 1 ) 、( 3 2 ) 等价于 材(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论