版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,东北财经大学 数量经济系 刘德海 ,博弈论前沿专题(Advances in Game Theory),2,资料夹宇宙的演化上帝的第一推动力?星云演化?,1754年,康德发表了论文论地球自转是否变化和地球是否要衰老,对“宇宙不变论”大胆提出怀疑。1755年,康德发表自然通史和天体论一书,首先提出关于太阳系起源的通过万有引力作用逐渐形成的康德拉普拉斯星云说:“太阳系是由一团星云演变来的。这团星云由大小不等的固体微粒组成,天体在吸引力最强的地方开始形成,引力最强的中心部分吸引的微粒最多,首先形成太阳” “有两种东西,我对它们的思考越是深沉和持久,它们在我心灵中唤起的惊奇和敬畏就会日新月异,不断增
2、长,这就是我头上的星空和心中的道德定律。” 这是人类思想史上最气势磅礴的名言之一,它刻在康德的墓碑上,出自康德的实践理性批判最后一章。,+,康德(Immanuel Kant,1724-1804),德国哲学家、天文学家、星云说的创立者之一、德国古典唯心主义创始人,3,恒星的演化,新恒星的诞生,一颗恒星从诞生到死亡,要经过几百万年甚至上百亿年的时间。 恒星是太空星云在引力作用下坍缩而成,坍缩使内部变热,温度升高直到发生核聚变反应,释放热能并产生向外的压力以支持恒星对抗进一步坍缩。一颗恒星一旦开始燃烧核燃料(将氢转变为氦)称为主序星,往后的生命历程(它的演化)就由质量惟一地决定。转化由爱因斯坦质量能
3、量方程描述 :E=mc2。 恒星烧完中心区的氢后,核心主要由氦构成,恒星开始收缩。如果质量足够大,内部温度升高到开氏1亿度,致使氦原子核开始聚变为碳。恒星再次稳定下来,但现在它有了一个氦燃烧核心,周围是一个氢燃烧壳层,再外面是一个巨大的外包层;它已经成了一颗红巨星。,主序星(太阳),4,根据恒星演化理论,如果有12%的质量损失,恒星将离开主星序。天文学上将恒星在主星序停留的时间作为他的寿命。 我们的太阳是宇宙中第二代恒星。也就是说我们是某个超新星的灰烬。太阳是50亿年前由星际云瓦解后的一团小云塌缩而成的,它的寿命约为100亿年。 太阳至少还能活50亿年!当太阳变成红巨星时,大气将膨胀,直到直径
4、大于水星轨道为止(有些关于太阳未来史错误地得出,红巨星阶段的太阳将吞没地球;其忽略了到太阳变成红巨星之前,它将通过向太空喷射物质损失掉大约1/4的质量)。,大小比较:红巨星和太阳,5,新恒星诞生,白矮星,大小:红巨星/太阳/白矮星,恒星作为相对稳定的红巨星的寿命比它在主序耽搁的时间短得多大约是作为单纯氢燃烧恒星寿命的5-20。 (1)低质量恒星的演化终点没有直接观察到。宇宙的年龄被认为是一百多亿年,不足以使得这些恒星耗尽核心的氢。当前的理论都是基于计算机模型。 (2)在包括太阳在内的小质量恒星(质量小于1.44个太阳质量)中,活跃的生命期行将结束时,将脱掉它的外层以形成行星状星云,剩下一个致密
5、的碳物质核(钻石!),其中一切聚变反应均已熄灭,这就是白矮星。白矮星将在数百万年内缓慢地将它的热量辐射到太空中去,最后变成黑矮星;,主序星,红巨星,6,(3)大质量恒星的氢燃烧在几干万年甚至更短时间内就结束, 进入氦燃烧后, 演化为超巨星。星核因收缩而温度极高, 极短时间内依次点燃:碳燃烧氖燃烧氧燃烧硅燃烧最后点燃铁燃烧。 铁燃烧对于恒星来说是灾难性的, 因为这种核反应不但不放出热量, 反而要吸收热量, 使得星核突然冷却下来。于是支撑星核的压力几乎消失, 星核坍缩。在其中心产生强大的压力,质子与电子结合成中子,中子不带电荷, 可以挤压到非常近的距离。于是演化成了一颗超密、超强磁场、体积很小、自
6、转极快的中子星。,新恒星的诞生,蟹状星云中心有颗中子星,主序星,超巨星,大小比较: 白矮星和中子星,7,中子星的星核不可压缩的, 外部物质继续下落, 发生反弹。形成壮观的超新星爆发,结束其一生 中子星的质量有一个上限, 超过上限后中子也被压碎,星体继续坍缩成为黑洞。 1973年,霍金考虑黑洞附近的量子效应,发现黑洞辐射,黑洞本身慢慢变小,温度越变越高,最后爆炸而告终。,新恒星的诞生,主序星,超巨星,蟹状星云中心有颗中子星,超新星爆发,大熊座星系中央黑洞,8,欧洲空间局普朗克空间望远镜绘制的全天辐射背景图,英国著名科学家罗杰彭罗斯爵士称,已经发现了宇宙大爆炸之前还存在另一个宇宙的证据。 在对宇宙
7、微波背景辐射的研究中,发现了神秘的同心圆现象,提供了在前一个宇宙中所发生事件的痕迹。 一共发现了12个同心圆辐射“印迹”,其中有五个环具有特别的意义,分别对应着宇宙演化历史上五次大规模的事件。 宇宙微波背景辐射让我们“窥视”了在大爆炸发生后三十万年的情景。 根据罗杰彭罗斯介绍:“新的宇宙循环理论”意味着黑洞将消耗掉宇宙中的一切物质,并且发生相互碰撞,最终导致又一次的宇宙大爆炸。,宇宙辐射红移:正在加速膨胀,由神秘的暗能量所驱动。,2012-06-13摘自:新华网,9,斯蒂芬威廉霍金,英国剑桥大学应用数学及理论物理学系教授,当代最重要的广义相对论和宇宙论家,是当今享有国际盛誉的伟人之一,被称为在
8、世的最伟大的科学家,还被称为“宇宙之王”。 70年代他与彭罗斯一起证明了著名的奇性定理,为此他们共同获得了1988年的沃尔夫物理奖。,10,资料夹生命的演化 达尔文进化论,伟大的生物学家、进化论的创立者查理达尔文,生于1809年,英国人。达尔文在剑桥大学获得学位后年仅22岁便乘“贝格尔”号随船考察。1859年,达尔文出版物种起源 。,11,资料夹社会的演化 马克思主义,玛雅文化:失落的高度文明,“太阳神鸟”金饰,2001年出土于成都金沙遗址的古蜀文明,成为中国文化遗产标志,“马踏飞燕”铜奔马,1969年出土于甘肃武威雷台一座东汉墓,成为中国旅游标志。,12,从北欧小国芬兰的一家木浆厂,到后来涉
9、足多个行业的跨国集团,再到移动通信时代的巨人,诺基亚,这个芬兰民族企业的骄傲,140多年间历经风雨。 20年前致力于手机业务,在功能性手机的年代下 “注重工程设计的企业文化”优势获得高度成功,快速成为行业的领导者,手机市场的份额曾一度高达40%,成为2G时代的代名词。 随着手机市场进入智能机的3G时代,用户更关心的是用户体验和功能拓展,诺基亚公司仍然固守“硬件的传统优势”,而不在软件和应用设计上面及时调整战略适应外部市场环境的新变革。 诺基亚目前为止倍受煎熬:2011年苹果一举成为全球最大智能手机厂商,现金储备726亿美元,超过厄瓜多尔、保加利亚、斯里兰卡和哥斯达黎加等126个国家的GDP之和
10、,苹果今天已是“富可敌百国”了 ;而诺基亚正在从中国、欧洲撤退; 诺基亚在高阶市场被苹果的iPhone占据,而低价市场被中国的山寨手机侵蚀。 iPhone用户三大爱好:游戏、拍照、发微博。 安卓用户三大爱好:刷机、重启、换电池。 塞班用户三大爱好:摔手机、摔手机、摔手机。 山寨用户三大爱好:凤凰传奇、凤凰传奇、凤凰传奇。,资料夹企业的演化 诺基亚的迅速衰落,13,思考: 经济学为什么不是一门演化的学问? 1898年凡伯伦提出这个问题。后来发展出演化经济学。 博弈论为什么不是一门演化的学问? 90年代以来国际上兴起演化博弈理论(evolutionary game):社会制度不是少数人理性设计结果
11、,而是不断适应环境和外部变化的适应性进化过程。,第二篇 演化博弈理论的基本知识第三章 演化博弈理论的基本知识,14,第七章 演化博弈理论及其应用,本节课程内容概述: 第一节 传统博弈理性假设的局限 第二节 演化博弈理论的兴起 第三节 演化博弈理论的有限理性假设和基本分析过程 第四节 演化博弈理论的不同动态模仿模型 第五节 演化博弈理论的均衡分析方法 第六节 演化博弈理论的最新进展和局限性 第七节 演化博弈理论在经济管理问题中的应用,15,博弈理论的研究对象:参与者互动过程中冲突与合作问题; 分析思路:,第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性,实际行为方式的无序化,产生了博
12、弈论的 “完全理性”概念,16,传统博弈理论的分析过程:参与者“完全理性”假设下,通过推理演绎达到均衡化过程。 人们行为在完全理性假设下,其行为类比于按照既定程序运行的计算机(即在完全理性假设下,人们的行为严格执行几种可行的策略选择方案) ,没有非理性的冲动、情绪因素,不会犯错误(有限理性)。,第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性,17,作为一种数学分析方法,传统博弈对参与者的“理性”要求非常苛刻: 目标理性(主观理性):参与者追求自身利益的最大化(经济学理性的内涵) 过程理性(具有理性的能力):给定参与者对外部环境的信念后最大化自己的报酬,即“前后一致的”做出选择.可
13、以分为两个推理步骤: 认知理性(cognitive)参与者对相关环境可获得的信息与形成的信念之间的一致性,即参与者具有对相关环境形成信念的能力; 具体要求:参与者了解博弈的结构和规则、以及理性的“共同知识”(递推归纳法的基础)、作为不完全信息博弈均衡求解基础的贝叶斯理性(参与者对不确定性事物具有事前概率分布的判断,在动态过程中进行更新的贝叶斯决策)。 工具理性(instrumental)参与者对外部给定的机遇与固定的偏好之间的一致性,即参与者具有从既定的信念推导出采取相应策略的能力。 具体要求:参与者具有计算推理、预见、记忆、分析判断的能力(例:求解动态博弈均衡的递推归纳法),不会犯错误(例:
14、颤抖手均衡要求犯错误时仍具有稳健性)等。,第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性,18,第七章 演化博弈理论及其应用第一节传统博弈理性假设的局限性,来自实验博弈的证据: 蜈蚣博弈Centipede game(Rosenthal,1981): 理论分析结果:根据理性的共同知识假设,每个参与者能够正确理解参与者之间的相互作用,因此做出正确的预期。均衡结果(1,1)。 实验结果:在一定阶段内存在合作。对偏离均衡路径的解释:合作意图。 最后通谍博弈(Roth et al,1991): 100¥在两个人中分摊,其中一人首先提出方案,对方不接受则双方为0。 理论分析结果:首先提出的人
15、选择99¥。 实验结果:美国、南斯拉夫选50:50,日本、以色列选60:40。考虑了公平等社会文化规范。 总结:与理性原则下演绎推理不同的上述实验结果,反映出传统博弈的强理性假设过于严格。,19,社会学家格拉诺威特提出的“社会嵌入性”(social embeddedness)概念: “社会嵌入性”是指现代市场经济中交易或组织嵌入在参与人的“社会网络”中情形。 格拉诺威特在1985开创性论文中,一方面批评了杜克海姆和帕森斯(1951)“过度社会化”的社会学传统;一方面批评了经济学效用理论“社会化不足”的缺陷,认为规范系统既是内生于市场或组织的参与者行为中,又是嵌入到具体的外部社会网络中。 从博弈
16、论的视角看,该理论可以简单概括为:社会交换域和经济交易域的关联博弈。,20,Mark Granovetter是著名的现代美国社会学家,70年代以来他提出了许多具有重大影响的现代社会学理论。 他最出色的工作是社会网络理论( social network theory)和经济社会学领域( economic sociology),尤其是他在“The Strength of Weak Ties” (1972)一文中提出的信息在一个群体中传播的理论。 Granovetter获Princeton University硕士学位,获Harvard University博士学位,曾在Northwestern U
17、niversity、 State University of New York at Stony Brook、 Johns Hopkins University任教,曾任Stanford University社会学系主任,现任School of Humanities and Sciences教授。,资料夹 社会学家格拉诺威特(Mark Granovetter),/dept/soc/people/faculty/granovetter/granovet.html,21,Mark Granovetter最著名的工作是文章“The Strength of
18、Weak Ties”(后来形成专著 “Getting A Job ”),其基本的论断是你的家庭成员和密友(“strong ties”) 无法向一般熟人、较为疏远的朋友等(“weak ties”)那样提供给你多样化的知识。 在经济社会学领域, 1985年的文章“Economic Action and Social Structure: The Problem of Embeddedness” 发起了一场“新经济社会学”运动。这篇文章中提出了著名的社会学概念“嵌入性(embeddedness)”:个体或企业的经济关系是嵌入到实际的社会网络中,不存在一个绝对理性化的市场。 他当前工作是论述“Soci
19、ety and Economy”。,资料夹 格拉诺威特(Granovetter)的学术贡献,/dept/soc/people/faculty/granovetter/granovet.html,22,理性主义分析思路存在的问题: 强理性假设受到Binmore、Simon等许多学者的批评 “全知全能的荒谬理性无异于奥林匹亚山上无知不晓的神”西蒙 思考1:自然演化形成的生物种群处于稳定状态,其互动的机理?,第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性,各个植物种群分别占据不同的空间, 使群落具有稳定的结构。,各动物种群位于食物链的不同位置
20、,形成稳定的金字塔型生态结构。,23,第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性,思考2:现实中大量的人们行为,表现出来与完全理性假设不符的非理性和有限理性特征,人类社会因此永远处于不可预知的无序冲突中?,24,第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性,Nash在其博士论文“Non-cooperative games”(1950年)给出Nash均衡的两种解释, 一种是完全理性的解释均衡是通过理性的参与者进行严密的逻辑演绎推理得到的,对参与者的理性能力有较高要求(传统博弈分析)。 一种是基于群体行为的解释参与者“有限理性”假设下,通过归纳学习的时间消耗实现均
21、衡化过程。 当时没有很好的方法对演化主义均衡实现过程构建数学模型,国际上90年代兴起演化博弈理论。,25,几个基本概念辨析: “演化”与“革命”:演化是指渐进的发展变化过程;革命是指破坏性的激进的变化。 “演化”与”进化”:系统的演化包括退化、进化和停滞等多种不同的发展前景,而进化仅仅特指单线式直线发展。,第七章 演化博弈理论及其应用第二节 演化博弈理论的兴起,停泊在涅瓦河上的“阿芙乐尔”号巡洋舰,白金汉宫是英国的王宫,26,思想渊源: 达尔文创立的生物进化论,提出在生存环境压力下生物种群特征产生适应性进化的“自然选择”基本思想,成为理论滥觞。 经济学的演化理论可追溯到古典学派。1898年,凡
22、伯伦就向经济学家们提出了,“经济学为什么不是一门进化的科学?” 20世纪初马歇尔宣称,经济学家的麦加在经济生物学。 “经济学的分析目标应当在于经济生物学,而不是经济力学。但是,生物学概念比力学的概念更复杂”经济学原理序言 经济演化思想见于马克思、熊彼特、哈耶克等大师门的论著。 凡勃伦以后,数理经济学的巨大进展上使经济演化理论难以对经济学产生影响。 演化经济学作为一门独立学科出现,则是20 世纪80年代。1982年,美国经济学家纳尔逊和温特出版了经济变迁的演化理论一书,分析了企业惯例发生演化的过程。,第七章 演化博弈理论及其应用第二节 演化博弈理论的兴起,27,资料夹现代微观经济学体系奠基人 阿
23、尔弗雷德马歇尔(Alfred Marshall),英国著名经济学家马歇尔(1842-1924),现代微观经济学体系(即剑桥学派、新古典学派)的奠基人。 标志现代经济学形成的里程碑著作经济学原理出版于1890年。书中继承了19 世纪以来英国古典经济学的传统,兼收并蓄,融合了供求论、生产费用论、边际效用论、边际生产力论,建立以完全竞争为前提、以“均衡价格论”为核心的相当完整的经济学体系。当前大多数学院派经济学理论都建立马歇尔提出的概念上,这套理论的核心观点是,我们应该相信市场能解决经济运行中的问题。 一方面:马歇尔的工作是开创性的,以前经济学家还不懂得形式化斯密理论的办法。由于他的工作,一个新的经
24、济学时代到来了,数学被广泛运用于经济学研究中,经济学的知识积累变得十分迅速。 另一方面:马歇尔意识到,经济学流行的静态分析将被生物学概念的动态分析所取代。但是他所支配的数学工具使得经济学理论分析走上了静态均衡分析的数理化道路。,28,资料夹20世纪伟大的经济学家约瑟夫熊彼特,熊彼特(Joseph Alois Schumpeter, 18831950)生于维也纳,年轻时进入维也纳大学,专业经济学与法律。当时的维也纳群星荟萃,门格尔的经济学,弗洛伊德的心理学,克林姆的建筑学,斯特劳斯的人类学,无不是人类精神的高峰。 熊彼特认为,资本主义是“一个进化过程”,“非连续历史跳跃”过程。创新是“企业家对生
25、产要素的新的组合”,是一个“创造性毁灭” 的过程。实质性的市场竞争不是价格竞争,而是创新竞争。 熊彼特的理论是经济学重要遗产,他首先提出现代创新理论,不但是知识经济的先驱者,其思想更是21世纪的主流思潮,到今天仍默默地支配着人心。他是20世纪最受推崇的经济学家之一,在经济学史上卓越地位与亚当斯密、马歇尔、凯恩斯等宗师同列。 代表作: 经济发展理论资本主义、社会主义和民主经济分析史,管理大师德鲁克说:“熊彼特智慧深邃、历久弥新。”,29,Richard R. Nelson,Sidney G. Winter,资料夹演化经济学创始者纳尔逊和温特,纳尔逊和温特的经济变迁的演化理论是现代演化经济学的奠基
26、之作,提出动态演化的企业和作为自然选择的市场机制是影响经济变迁的两个关键机制。 在书中对新古典经济学两大理论支柱 最大化计算理性和经济均衡分析方法进行替代性的否证。他们重新整拾起凡勃伦、哈耶克所采用的演化主义分析传统,采纳了西蒙关于有限理性的立场,将达尔文生物遗传变异的演化机理移植到经济过程。认为经济决策和行为选择是通过不断“试错”寻求“满意”的适应性过程,而不是依靠精确算计对最大效用值的决断。企业一般是按照“惯例”从事生产,惯例是由既有的制度、技术、知识综合构成的企业内在的稳定结构,当企业对惯例下的利润水平不满意时,则会通过“外部搜寻”或“内部搜寻”来改变惯例。 运用生物学理论解释经济现象,
27、纳尔逊指出了两点问题:一是在理解经济变迁和技术变迁的时候,找不到和生物基因机制对应的经济机制;二是来自制度方面的挑战。生物的进化有个相对隔离的环境,而演化经济学研究技术创新时,不能够忽略制度对技术变迁以及创新的影响。,30,演化博弈理论的诞生: 起源于80年代演化生物学研究:梅纳德史密斯(Maynard Simth)等研究生物种群演化现象,在1982年演化与博弈论一书提出。其他演化博弈理论学者Price,Weibull、Levine、Friedman、Binmore等。 早期一些演化生物学文献: Maynard Smith Journal of Mathematical Biology,第七章
28、 演化博弈理论及其应用第二节 演化博弈理论的兴起,31,John Maynard Smith(19202004) 。 演化生物学家,英国Sussex大学生物学教授; 1982年与Price一起提出了“演化稳定策略ESS”均衡概念,成为演化博弈理论的一个基本概念。他发起设立了许多奖项,包括欧洲演化生物学会 (European Society for Evolutionary Biology)建立的John Maynard Smith Prize, 面向演化生物学界杰出的年轻学者。 代表作: (1) John Maynard Smith (1982) Evolution and the Theor
29、y of Games (Cambridge Univ. Press, Cambridge). (2) The Theory of Evolution (Cambridge University Press 1993),资料夹 梅纳德史密斯与演化博弈理论:,/3rd_culture/maynard_smith04/maynard_smith04_index.html,32,Maynard Smith(1982)等研究生物种群竞争现象,构造了基本分析框架。 每个参与者代表一个种群,随机组合匹配,进行预先规定好收益的要素博弈; 少部分参与者的策略产生突变(试错法)
30、;大部分参与者根据不同的学习规则进行模仿,其中最有效率的参与者经选择过程得以大量复制;(物演天择,适者生存) 演化主义基于群体行为的均衡 判断标准: 当不同策略的分布构成发生一个很小的变化后,仍能维持原稳定构成。含义:击退那些突变的入侵策略。 演化博弈理论成为90年代以来博弈论最为活跃的一个领域之一,并应用在经济社会体制的起源和多样性、互补性演化研究中。,资料夹演化博弈理论的生物学起源:,33,Following the tradition of Joseph A. Schumpeter, it is designed to focus on original research with an
31、 evolutionary conception of the economy. The journal will publish articles with a strong emphasis on dynamics, changing structures (including technologies, institutions, beliefs and behaviours) and disequilibrium processes with an evolutionary perspective (innovation, selection, imitation, etc.). It
32、 favours interdisciplinary analysis and is devoted to theoretical, methodological and applied work. Editors: H. Hanusch, S. Klepper Email: helpdesklink.springer.de Publisher:Springer Berlin/Heidelberg,资料夹 国际期刊:Journal of Evolutionary Economics,34,“有限理性(bounded rationality)”的概念: Herbet Simon提出“有限理性”概
33、念:参与者具有目标的理性,但是由于面对复杂的、多元化的、不确定性的社会现实,其认知能力的有限性造成参与者在决策时只能达到满意解,即缺少理性的能力。 奈特的不确定性观点:有限理性是由于Knight提出的内在的不确定性造成的,即非线性系统固有的不可预知性。 对于具体的社会经济问题,应抽象出有限理性的具体行为特征。,第七章 演化博弈理论及其应用第三节 演化博弈理论的有限理性假设和基本分析过程,35,第七章 演化博弈理论及其应用第三节 演化博弈理论的有限理性假设和基本分析过程,演化博弈理论群体参与者的“有限理性”内涵: 惯例行为(inertia):由于参与者变更策略存在着成本,因此大多数人按惯例采取行
34、动,被锁定在已有策略中。(调整需要时间) 决策上的“近似眼”(myopia):当少部分参与者变更策略时,总是以现有策略状态作为已知条件进行分析,而不具有预测能力(由于群体人数较多,因此无法预测,也无法影响其他个体的决策)。 试错法的尝试行为(trial and experiments):少部分具有冒险精神的参与者并不拘泥于最优策略,而是尝试采取其它各种策略(产生包括生物学上遗传变异机制、社会新生代出现等)。 资料:试错法行为“懒蚂蚁” 的实验,36,日本北海道大学农学研究生院的进化生物研究小组对三个分别由30只蚂蚁组成的日本黑蚁群的活动进行了观察。 发现大约80%的蚂蚁从事某种工作,例如清理蚁
35、穴垃圾或收集食物,很少停下来休息;20%的工蚁则整日无所事事。 生物学家在这些“懒蚂蚁”身上做了标记,并且断绝了蚂蚁的食物来源,那些平时工作很勤快的蚂蚁一筹莫展,而“懒蚂蚁”则“挺身而出”,带领众伙伴向它早已侦察到的新的食物源转移。 生物学家又把“懒蚂蚁”全部抓走放在一起,神奇的是:结果其中80%的“懒蚂蚁”变成了勤劳蚂蚁,仍然有20%的蚂蚁“懒惰”依旧。它们原来所在蚁群中的所有蚂蚁都停止了工作,乱作一团,直到把那些“懒蚂蚁”放回去后,整个蚁群才恢复繁忙有序的工作。 点评:“懒蚂蚁”总能看到组织的薄弱之处,拥有让蚂蚁群在困难时刻仍然存活的本领,可以避免把全部蚁力投入到搬运食物的劳作中,总是可以
36、保持对新的食物的探索状态,可以保证群体不断得到新的食物。,资料夹试错法行为来自蚂蚁种群的实验,37,演化博弈理论的分析对象: 社会经济系统中有限理性的群体参与者通过各种具体的动态学习模仿过程,如何达到稳定的均衡状态。 演化博弈理论主要解决的问题: (1)构建体现不同理性要求的动态学习模型; (2)运用稳定性理论,分析学习调整过程中均衡的稳定性,判断动态模型是否收敛到的Nash均衡(或者演化稳定均衡ESS、演化均衡EE等均衡概念)。,第七章 演化博弈理论及其应用第三节 演化博弈理论的有限理性假设和基本分析过程,38,演化博弈的基本分析过程: 随机组合博弈:生物系统或社会经济系统中存在着许多参与者
37、(可以分为同类群体和不同类群体),通过随机抽样选出的参与者(代表某一特定的群体)进行预先规定好的要素博弈,获得相应收益; 要素博弈(factor game)反映任一时点上各群体可行的策略集和相应的收益,可用策略式或扩展式博弈表示。 有限理性的行为:根据惯性行为的假设,参与者群体通过选取要素博弈的不同策略,形成了选取不同策略的比例分布。 动态演化方程:在动态模仿过程中,上述比例分布是不断变化的。根据不同的理性水平,分为不同的动态演化过程。 均衡的稳定性:根据比例分布的动态演化方程,分析演化过程的稳定性。,第七章 演化博弈理论及其应用第三节 演化博弈理论的有限理性假设和基本分析过程,39,演化博弈
38、理论的基本要素: 群体(populations):生物系统或社会经济系统中存在着许多参与者,可以分为同类群体和不同类群体, k1 。每个群体都有自己的行动集合。 支付函数(payoff function):某种行动对应的收益。对于策略式博弈表示的要素博弈,又称为适应度函数(fitness function),与参与者选择的策略及其当前不同策略的比例分布有关。 动态(dynamics):反映群体参与者的学习、模仿过程,常见模仿者动态模型; 均衡(equilibrium):反映演化的收敛稳定状态,包括静态的ESS、动态的EE等概念。 举例:鹰鸽博弈。,第七章 演化博弈理论及其应用第三节 演化博弈理
39、论的有限理性假设和基本分析过程,40,梅纳德史密斯(Maynard Smith)以鹰鸽博弈(hawk-dove game)开始,成为生物学讨论演化稳定性的标准模式。 该博弈并不是表述老鹰和鸽子两种物种的个体之间对抗,而是同一物种中不同行为类型的个体间的竞争关系:人类作为一个种群,具有鹰派好斗(hawkish)和 鸽派柔弱(dovish)的两面性, 如图所示,争夺一种资源,其价值是v。如果鹰进攻而鸽默许,前者得到资源后者一无所获(v,0)。如果双方都进攻或都被动,则各方获得资源的机会均等。同时进攻,导致双方受伤,各自的成本为c, c v ,概率是1/2。上述即为单一种群的策略式要素博弈。 种群的
40、支付取决于选择鹰鸽策略分别在群体中所占的比例。,资料夹鹰鸽博弈,伊拉克战争期间拉姆斯菲尔德为首的鹰派 和鲍威尔为首的鸽派之间的分歧,41,演化博弈模型的动态演化机理: 演化博弈两个基本过程是选择过程(selection)和突变过程(mutation),其在生物学和社会学中分别有着不同的演化机理: (1)生物学的基因遗传变异机制; (2)社会新生代的出现; (3)市场竞争的进入和退出机制; (4)个体经验积累的学习机制; 。,第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型,42,(1)生物种群的演化机理基因遗传变异机制: 个体层次上看:基因遗传决定了个体的行为类型。
41、基于自然选择机制的演化博弈理论具有个体行为停滞的特点,无法进行个体理性的选择。 “种瓜得瓜,种豆得豆”。与达尔文进化论一致的 群体层次上看:在种群繁衍过程中,某种行为类型的适应度不仅依赖于自然环境的选择,而且依赖于社会环境(即群体中不同行为类型所占的比例)。当个体的某种行为类型的适应度高于群体加权平均水平时,其繁殖生存率更高。在群体层次上产生了种群演化的复制动力学。 缺陷:生物种群的基因遗传变异机制中,个体不具备理性选择能力,演化体现为代际繁殖率,进程缓慢。,第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型,43,资料夹地球生物的演化达尔文进化论,伟大的生物学家、进
42、化论的创立者查理达尔文,生于1809年,英国人。达尔文在剑桥大学获得学位后年仅22岁便乘“贝格尔”号随船考察。1859年,达尔文出版物种起源 。,44,(2)社会经济系统的演化机理: 问题提出:基于基因遗传的演化机制过于缓慢,人类社会通过有限理性的学习过程,能够实现行为的更快收敛。 (1)个体层次上的经验学习机制,如虚拟行动模型,个体贝叶斯决策; (2)企业层次的市场进入和退出机制; (3)社会群体层次上的模仿行为; (4)社会新生代的出现(代际演化,其与生物学机理相同)。,第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型,45,资料夹人类社会进步的时钟比喻,美国传
43、播学者弗德瑞克威廉斯把人类从开始使用语言到公元2000年大约360个世纪形象地浓缩为1天的24小时,大致框定各种传媒在这个“时钟”上的位置: 子夜12点,人类开始使用34000年前发明的语言,揭开口头传播的序幕; 上午8点,洞窟壁画出现,人类使用线条化符号传递信息由此开始; “时钟”飞快走过12个小时,到了晚上的8点40分,埃及像形文字问世了; 9点28分,成熟的字母出现; 当“时钟”接近又一个子夜前的11点38分,谷登堡的印刷机制造成功; 在最后几分钟科学技术突飞猛进,11点53分以蒸汽为动力的印刷术告成; 此后,发展以秒为计: 人类进入20世纪最后几十年。在这“一天”的最后2分钟内,记录着
44、这样一些重大的发明创造:,11点53分24秒发明电报; 11点54分38秒架设第一条横跨大西洋的有线电缆, 11点55分02秒有了电话: 11点55分47秒,无线电报、电影摄影机出现; 11点56分48秒,商业广播问世; 11点57分04秒,有声电影来到人间; 11点57分40秒,最早的电子计算机诞生。,倒数108秒,彩色电影生产开始; 倒数101秒,立体声广播开播; 倒数92秒,第一颗商用卫星升天; 倒数87秒,分时电脑问世; 倒数49秒,时近1981年,“哥伦比亚”号太空船巡航成功 。,46,演化博弈的动态模型: 演化博弈基本的选择动态(selection dynamics)表述为: 其中
45、i(t)表示在t时刻选择策略i的个体在群体中所占比例; 函数gi()表示某种具体选择过程,不同学习机制对应不同函数. 选择动态的基本特征:当初始状态下没有人采取某一纯策略i时,则永远不会被采用;参与者只能模仿那些已经存在的策略。即没有反映出突变机制。,第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型,47,演化博弈最常见的动态模型:模仿者动态(replicator dynamics) 是最常见的一种动态过程Taylor Brgers 采取鸽策略的收益:EDV(1-p)/2。 由于V p*时,采取鸽策略收益更高, (1-p)比率增加; 当p p*时,采取鹰策略收益更高
46、, p比率增加。 最终群体比率的稳定均衡状态为p p*, 即混合均衡为唯一的ESS。,第七章 演化博弈理论及其应用第五节 演化博弈理论的均衡分析方法,53,ESS是NE的一个精练概念: ESS定义的等价表述: 条件1,对所有的 , ,即严格Nash均衡; 条件2,当 时,则 。 思考:ESS与动态模仿过程是否相关? ESS均衡概念的局限性:其可以通过分析要素博弈的收益值u判断出来,是一个静态的均衡概念,没有考虑到的动态演化过程。 演化过程的稳定均衡概念应该与具体的演化过程有关。,第七章 演化博弈理论及其应用第五节 演化博弈理论的均衡分析方法,54,演化均衡EE (evolutionary eq
47、uilibrium)的概念: 不同于静态的ESS均衡概念,演化均衡EE为动态演化方程的稳定性概念,即:动态演化方程具有局部渐进稳定的均衡点。 局部渐进稳定的定义:某一状态s如果满足在s的每一个开邻域N内,每一条初始路径都充分接近于N内部的一点s,并渐进收敛到s。 EE的分析方法:根据动态方程稳定性分析理论,分析雅克比Jacobian矩阵特征值,判断稳定性。 各种稳定性概念的关系:动态方程的不动点(NP)、Nash均衡点(NE)、演化均衡点(EE)和演化稳定策略(ESS)之间具有如下关系: 注:第一个关系仅适用于马尔萨斯动力系统等某些系统的对称博弈。,第七章 演化博弈理论及其应用第五节 演化博弈
48、理论的均衡分析方法,55,演化博弈理论的演化均衡EE分析过程: 针对具体社会经济群体互动现象,建立起具体的系统动态演化方程后,如何分析其均衡的稳定性? (1)第一步:先在要素博弈中找出所有的Nash均衡解; (2)第二步:然后判断这些Nash均衡解是否满足EE稳定性条件:根据稳定性判据的特征根法,分析动力系统在平衡点处Jacobian特征方程式的根的正负,当所有的根小于零时,系统在平衡点处于稳定状态。,第七章 演化博弈理论及其应用第五节 演化博弈理论的均衡分析方法,56,对于二维平面中(二阶方程)的情形,根据平衡点的局部拓扑性状可将其分为结点、焦点、鞍点以及中心等四类,其中鞍点、中心这两种类型
49、的平衡点是不稳定的,而结点、焦点类型的平衡点还可以分为稳定与不稳定的两种情形,可参照如下示意图。其中平衡点是坐标原点O(0,1),箭头方向表示当t增加时的轨线的方向,即x(t)、y(t)的变化趋势。 1. 轨线是抛物线型的 图1不稳定结点 图2稳定结点 如果在平衡点附近的轨线具有如图1(或图2)的分布情况,我们就称该平衡点为不稳定结点(或稳定结点)。,资料夹 动态系统在平衡点的稳定性判别方法:,57,2.轨线是双曲线型的 如果在平衡点附近的轨线具有如图3或图4的分布情况,我们就称该平衡点为鞍点。,资料夹 动态系统在平衡点的稳定性判别方法:,58,3. 轨线是以原点为中心的中心直线束 如果在平衡
50、点附近的轨线具有图5(或图6)的分布情况,就称该平衡点为不稳定的(或稳定的)临界结点。,资料夹 动态系统在平衡点的稳定性判别方法:,59,4. 轨线轨线如图7、图8所示 如果在平衡点附近的轨线具有如图7(或图8)的分布情况,我们就称它是不稳定的(或稳定的)退化结点。,资料夹 动态系统在平衡点的稳定性判别方法:,60,5.轨线是对数螺线族(图9、图10) 如果在平衡点附近的轨线具有如图9(或图10)的分布情况,就称它为不稳定的(稳定的)焦点。,资料夹 动态系统在平衡点的稳定性判别方法:,61,5.轨线是以原点为中心的圆族(图11) 如果在平衡点附近的轨线具有如图11的分布情况,就称该平衡点为中心
51、。,资料夹 动态系统在平衡点的稳定性判别方法:,62,动态方程在平衡点的稳定性:分析动力系统在平衡点处特征方程式的根,当所有的根小于零时,系统在平衡点处于稳定状态。 对于一维动力系统(同类群体22博弈) ,特征根为: 对于二维动力系统(同类群体33博弈,或不同类群体22博弈) ,其雅可比矩阵为为: , 其中,矩阵的迹为 , 行列式为 。 当D 0,T 0时,系统处于渐进稳定; 其中若 ,则为稳定焦点; 若 ,则为稳定结点。,资料夹 动态系统在平衡点的稳定性判别方法:,稳定焦点,稳定结点,63,Dan Friedman(2000)在 Santa Fe Institute Workshop(圣塔菲
52、学术机构)作的演讲“Economics (and Finance) as an Evolutionary Game” 介绍的一些前沿进展: Stochastic learning in games Quantal responses, QRE smoothed fictitious play KMR, Young variants Extensive form stage games Sophisticated learning, rule learning, teaching Local interaction Evolution of institutions Biological-cul
53、tural coevolution behavioral economics,第七章 演化博弈理论及其应用第六节 演化博弈理论的最新进展和局限性,64,圣塔菲研究所号称世界复杂系统研究的“圣地”。1984年,在诺贝尔物理学奖获得“夸克之父”盖尔曼(Murray GellMann)、安德逊(Philip Anderson)和诺贝尔经济学奖获得者阿罗(Kenneth Arrow)等人的支持下,在美国新墨西哥州首府圣塔菲市,成立了一个把复杂性作为研究中心议题的研究所,这就是著名的圣塔菲研究所,并将研究复杂系统的这一学科称为复杂性科学(Complexity Seience)。 十多年来该所吸引了各国各学科领域的许多著名科学家前去进行学术访问,在美国科学杂志发表了大量复杂性科学论文,使研究所赢得了世界范围的声望,同时也掀起了世界范围内研究复杂系统的热潮。 圣塔菲研究所提倡不同学科的交流,在这儿你根本看不到闲人,大家都行色匆匆,即使在吃饭还是茶点这些空闲时间,也不乏精彩热烈的讨论 圣塔菲历来是美国
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理考研英语真题解析
- 肉类制品项目可行性研究报告
- 电力行业相关具体项目可行性研究报告
- 中枢神经系统转移瘤诊治指南2026
- 年产5000t大豆油脂厂建设项目可行性研究报告
- 民营医院设立可行性研究报告
- 2026年模拟驾驶舱反应力测试指南
- 护理康复护理学教学课件
- 竹纤维项目可行性研究报告
- 2026年综合知识点测试与解题思路分析
- 2025-2030中国频率合成器行业市场发展趋势与前景展望战略研究报告
- T/CSPSTC 72-2021隧道衬砌脱空注浆治理技术规程
- 博士论文写作精解
- 数字普惠金融对粮食供应链韧性的影响研究
- 新教科版一年级科学下册第一单元第6课《哪个流动得快》教案
- 2024年11月医用冷库建设合同3篇
- 护理CQI项目模板
- 2025年河北省职业院校技能大赛建筑工程识图(高职组)赛项参考试题库(含答案)
- 2024年洛阳职业技术学院单招职业适应性测试题库及答案解析
- 监狱新干警培训课件
- 设计服务合同创意模板
评论
0/150
提交评论