版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章第五章 有限理性和进化博弈有限理性和进化博弈 本章介绍有限理性基础上的进化博弈分析。完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响,有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心,以进化稳定策略为基本均衡概念的进化博弈分析,包括基本方法、概念和各种经典模型等。本章分四节本章分四节5.1有限理性博弈及其分析框架5.2最优反应动态5.3复制动态和进化稳定性: 两人对称博弈5.4复制动态和进化稳定性: 两人非对称博弈5.1
2、有限理性博弈及其分析框架有限理性博弈及其分析框架5.1.1 有限理性及其对博弈的影响5.1.2 有限理性博弈分析框架5.1 有限理性博弈及其分析框架有限理性博弈及其分析框架 问题的提出:Nash在其博士论文“Non-cooperative games”(1950年)给出Nash均衡的两种解释,l一种是完全理性的解释均衡是通过理性的参与者进行严密的逻辑演绎推理得到的,对参与者的理性能力有较高要求。l一种是基于群体行为的解释当时没有很好的方法构建数学模型。 传统博弈中的理性要求传统博弈中的理性要求1目标理性(主观理性):参与者追求自身利益的最大化(经济学理性的内涵);2 具有理性的能力:参与者具有
3、计算推理、预见、记忆、分析判断的能力(例如:求解动态博弈均衡的递推归纳法),不会犯错误(例如:颤抖手均衡要求犯错误时仍具有稳健性);3 认知理性:参与者了解博弈的结构和规则、以及理性的“共同知识”(递推归纳法的基础)、作为不完全信息博弈均衡求解基础的贝叶斯理性(参与者对不确定性事物具有事前概率分布的判断,在动态过程中进行更新的贝叶斯决策)。传统博弈的理性假设过于严格l有限理性的概念: a Herbet Simon提出有限理性概念,是指:参与者具有目标的理性,但是由于面对复杂的,多元化的,不确定性的社会现实,其认知能力的有限性造成参与者在决策时只能达到满意解,即缺少理性的能力。b 另一种观点:有
4、限理性是由于Knight提出的内在的不确定性造成的,即非线性系统固有的不可预知性。5.1 有限理性博弈及其分析框架有限理性博弈及其分析框架有限理性博弈分析的目标有限理性博弈分析的目标 a 放宽参与者严格的理性要求,分析有限理性的参与者通过各种学习过程,如何达到稳定的均衡状态。 b传统博弈主要解决:Nash均衡的选择(例如子博弈Nash均衡)和多重Nash均衡的精练(例如颤抖手均衡)问题。 有限理性博弈分析主要解决:针对不同条件下具体的学习过程(构建的学习模型体现了理性的不同要求)、学习调整过程中均衡的稳定性(运用稳定性理论,分析原Nash均衡是否收敛)。5.1 有限理性博弈及其分析框架有限理性
5、博弈及其分析框架有限理性博弈分析的范围有限理性博弈分析的范围a. 个体层次上的有限理性博弈:古诺模型参与者根据对手的上一期行动决定当期策略选择;虚拟行动参与者对对手行动有一个包括先验概率在内的概率分布的估计,然后最大化自己的预期收益。b群体层次上的有限理性博弈:演化博弈理论(Maynard Smith and Price与1973年研究生物种群系统的进化现象时提出生物系统的演化博弈基本概念) 。5.1.1 有限理性及其对博弈的影响有限理性及其对博弈的影响l有限理性博弈方:不满足完全理性假设的博弈方l有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略l有限理性意味着均衡是不断调整和
6、改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离l有限理性博弈方会在博弈过程中学习,博弈通过试错寻找较好的策略5.1.2 有限理性博弈分析框架有限理性博弈分析框架 有限有限博弈方构成的一定规模的特定群体内成员的某种反复博弈.关键是确定博弈方学习和策略调整的模式.l最优反应动态最优反应动态:有快速学习能力的小群体成员的反复博弈及策略调整的动态机制.l复制动态复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈及策略调整的动态机制.l进化稳定策略进化稳定策略(ESS)5.2 最优反应动态最优反应动态5.2.1 协调博弈的有限博弈方 快速学习模型5.2.2 古诺调整过程5.2 最优
7、反应动态最优反应动态5.2.1 协调博弈的有限博弈方快速学习模型考虑5个有限博弈方相互博弈的快速学习动态调整模型:50,500,4960,6049,0A博弈方博弈方2BAB博博弈弈方方1协调博弈12345反应、策略调整规则推导反应、策略调整规则推导BtxAtxtxtxBtxtxAiiiiii时,采用;当时,采用当的得益:采用的得益:采用61/22)(61/22)(60)(20)(49)(250)( )iA0,1,2ix tti 假设表示在 时期博弈方 的邻居中采用 策略邻居的数量最优反应动态模拟:初次博弈最优反应动态模拟:初次博弈1个个AABABABABBBAAAAABAAAABAABB初次博
8、弈相邻初次博弈相邻2个个AAAAAAAABAABBBAA初次博弈相连初次博弈相连3个个ABAABAAAAAAAB所有博弈方都采用 的均衡状态具有稳健性。而所有博弈方都采用 的均衡状态不具有稳健性。5.2.2 古诺调整过程古诺调整过程古诺模型反应函数23231221qqqq 1 2 3 4博弈方1 2.5 1.5 2.125 1.875博弈方2 3 1.75 2.25 1.93751|1221dqdrdqdr问题:两寡头始终假设对方产量不变最优反应动态模拟收敛条件5.3 复制动态和进化稳复制动态和进化稳: 两人对称博弈两人对称博弈5.3.1 签协议博弈的复制动态和进化稳定策略5.3.2一般两人对
9、称博弈复制动态和进化稳定策略5.3.3 协调博弈的复制动态和进化稳定博弈5.3.4 鹰鸽博弈的复制动态和进化稳定策略5.3.5 蛙鸣博弈的复制动态和进化稳定策略5.3.1 签协议博弈的复制动态和进化稳定策略签协议博弈的复制动态和进化稳定策略经济活动中的各种合作都可以用签协议博弈描述。特点理性层次低,大规模群体随机配对反复博弈。1,10,00,00,0同意博弈方博弈方2不同意同意不同意博博弈弈方方12)1 (00)1 (00)1 (1xuxuxuxxuxxxunyny 假设群体中采用“同意”比例x则不同策略期望得益和平均得益为:l博弈方策略类型比例动态变化是有限理性博弈分析的核心,其关键是动态变
10、化的速度l以采用“同意”策略类型博弈方的比例为例,其动态变化速度可用下列微分方程反映:3222)1 ()()(xxxxxxxuuxdtdxy动态微分方程的相位图动态微分方程的相位图dx/dtx010.5l稳定状态、不动点:x*=0, x*=1进化稳定策略的检验进化稳定策略的检验2)1 ()1 (000)1 (101)1 (nynyuuuuu2)1 (000)1 (10)1 (ynnyuuuuu策略选择了“不同意”意”比例的博弈方偏离“同策略选择了“同意”同意”比例的博弈方偏离“不ESSxuy是进化稳定策略101不是进化稳定策略00 xuuny5.3.2一般两人对称博弈复制动态和进化稳定策略一般
11、两人对称博弈复制动态和进化稳定策略一般模型a, ac, bd, db, c策略1博弈方博弈方2策略2策略1策略2博博弈弈方方1一般2X2对称博弈l进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。l基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置是无差异的。l其中abcd可以是任何得益,根据问题设定。复制动态分析复制动态分析2121)1()1()1(uxuxudxcxubxaxu)(1 ()()1 ()(1 (dbxcaxxxuuxxdx/dtx1x)1 ()(2111uxxuuxuuxdtdx复制动态的进化规则是生物学中生物特征进化规则设设x为采用策略为采用策略1的比例的比例复
12、制动态相位图演化博弈均衡的一个判断标准演化博弈均衡的一个判断标准演化稳定策略演化稳定策略(Evolutionary Stable Strategy, ESS)l演化稳定策略(ESS)是演化博弈的一个核心概念,其反映了均衡解的稳定性状态(另一个是模仿者动态,其反映了最常用的一种向均衡稳定状态的动态收敛过程)。lESS定义:对于非常小的正数定义:对于非常小的正数,所有的,所有的*, 。lESS等价的定义表述:等价的定义表述:条件条件1,对所有的,对所有的* , ,即严格,即严格Nash均衡;均衡;条件条件2,如果,如果 ,则,则 。)1 ( ,()1 ( ,(uu),(),(uu),(),(uu)
13、,(),(uu5.3.3 协调博弈的复制动态和进化稳定博弈协调博弈的复制动态和进化稳定博弈50,500,4960,6049,0策略1博弈方博弈方2策略2策略1策略2博博弈弈方方1一般2*2对称博弈dx/dtx111/16复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。)(1 ()()1 ()(dbxcaxxxxFdtdx)1161)(1 (xxx5.3.4 鹰鸽博弈的复制动态和进化稳定策略鹰鸽博弈的复制动态和进化稳定策略, 0, v, v, 0鹰博弈方博弈方2鸽鹰鸽博博弈弈方方1鹰鸽博弈2cv 2cv 2v2v复制动态方程和相位图复制动态方程和相位图2)1 (2)()1 ()(vxcvxxxxFdtdx)61)(1 (xxxdx/dtx11/65.3.5 蛙鸣博弈的复制动态和进化稳定策略蛙鸣博弈的复制动态和进化稳定策略l动物进化竞争是生物多样性、复杂性的基本机制动物进化竞争是生物多样性、复杂性的基本机制蛙鸣博弈:P-z, P-z1-m, m-z0, 0m-z, 1-m鸣叫雄蛙雄蛙2不鸣鸣叫不鸣雄雄蛙蛙1蛙鸣
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 事业行政单位审计制度
- 内部审计及风险管理制度
- 基金业风控制度
- 内部审计风险防控制度
- 医院政府采购审计制度
- 呆帐核销专项审计制度
- 脑外伤头痛患者的音乐疗法
- 小额贷款风控制度
- 小学控烟培训教育制度
- 员工消防培训教育制度
- 2026河北邢台市数字化城市管理服务中心公开招聘编外工作人员20名笔试备考试题及答案解析
- 水利工程运行维护与故障处理指南
- 初中地理八年级下册《北方地区自然地理特征与农业发展》教学设计
- 神州数码集团在线测评题
- 掺混肥料生产管理制度
- 2026年安徽财贸职业学院单招综合素质笔试备考试题附答案详解
- 2026内蒙古事业单位招聘第一阶段减少招聘人数岗位(公共基础知识)测试题附答案
- 胆总管结石课件
- 入孵合同解除协议
- 数据出境安全协议
- 护士交接班礼仪
评论
0/150
提交评论