博弈论与经济课件_第1页
博弈论与经济课件_第2页
博弈论与经济课件_第3页
博弈论与经济课件_第4页
博弈论与经济课件_第5页
已阅读5页,还剩492页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论基本模型什么是博弈活动博弈活动具有以下特征:1.有人参加。我们把参加的人称为参与人或局中人。2.在每一步,局中人有明确的、可以选择的行动。3.有明确的行动顺序。4.参与人在选择行动时有明确的信息。5.活动结束时有明确的支付规则。具有上述特征的活动称为博弈活动。

合作博弈与非合作博弈如果在一项活动中,参与人具有合作的意向,而且合作的行为又能得到有力的保障,则称这种博弈活动为合作博弈,否则称为非合作博弈。对于非合作博弈,从模型构建的形式上又可分为策略型博弈与扩展型博弈。1.1有限扩展型博弈模型博弈模型的构建应用博弈论方法分析研究经济管理或其它领域中的问题,首先要构造出博弈模型来,因而需要从大量的博弈活动中抽象出博弈模型的基本要素,对这些要素进行严格、准确的刻画后,形成博弈模型。将博弈活动构造成博弈模型,需要了解以下6个方面的情况:1.参与人;2.外生事件的概率分布;3.参与人选择行动的次序;4.参与人所能选择的行动;5.参与人在选择行动时所了解的信息。6.参与人的支付。构造博弈模型所需要的要素1.局中人集合

,称为局中人或参与人集合。中元素称为参与人或局中人。参与人不专指人,它泛指参与博弈活动的政府、企业、地区、国家、个人……等决策主体。通常用“0”表示虚拟局中人,它的行为是以确定的概率分布进行随机选择,表示实际参与人。2.行动集合

称参与人在博弈中所有可能选择的行动构成的集合为局中人i的行动集合。中的元素称为局中人i的行动。局中人的行动集合可能是有限集,也可能是无限集。如果博弈活动中每个局中人的行动集合都是有限集,且每个局中人行动的次数也是有限的,称该博弈为有限博弈。3.博弈树对于有限博弈,可用博弈树直观地刻画它,市场进入问题的博弈树如图1-1所示。

容许I01①①①②容许抵制②进入进入不进不进旺盛疲软图1-1市场进入博弈树II抵制

I抵制4.博弈树中终点Z下面的向量称为支付向量,它的第个分量表示博弈结束于Z时,局中人i所得的支付。支付可表示参与人的某种收益或损失。本书中的支付指收益、效用、利润等。正式地,支付向量是终点集合Z到n维向量集合的映射。5.信息集与信息集分割信息集由同一个局中人、在相同的时点上的具有相同信息的决策节点组成。用表示局中人i的第k个信息集。它满足(1)(表示空集);(2)从博弈起始点到任一终点的路径至多与交一点(描写同一信息集中的节点处于同一时点上);(3)从中的任一节点出发,局中人i可能选择的行动集合都相同(因为局中人在同一信息集的不同节点上具有相同的信息)。在博弈树上,将属于同一信息集的节点用虚线框在一起。称为局中人的信息集类(在数学上,称以集合为元素的集合为类)。称为信息集分割。有限扩展型博弈模型的定义定义1.1称为有限扩展型博弈模型。其中N为参与人集合,Y为博弈树,U为支付向量,I为信息集分割,q为外生事件的概率分布。完全信息博弈与不完全信息博弈如果所有的局中人对构成G的元素N,Y,U,I,q都完全了解,称G为完全信息博弈,否则为不完全信息博弈。静态博弈与动态博弈如果所有的局中人都同时选择行动,称G为静态博弈,否则称G为动态博弈。静态博弈更本质的特征是所有局中人在选择行动时不知道对手选择了什么行动。例1.1考虑按以下步骤进行的博弈活动。第1步局中人1从字母T,H中选一个;第2步局中人2不知第1步的选择,再从H,T中选一字母;第3步局中人知道1,2两步的选择,又从T,H中选一字母;第4步局中人2不知第3步的选择,但知1,2两步的选择,最后从T,H中选一字母,博弈结束。按照每步选择的结果,每个局中人各得一笔报酬(略)。该博弈的局中人集合.该博弈的信息集合分别为,其中。②②②①HHHTTT图1-2①①①①HHTHTHTHTHHTHTHTTHHHTTTT②②②②②②②信息集可以告诉我们以下4点1.在一个信息集上应由哪个参与人选择行动。2.从一个信息集出发,局中人可能选择哪些行动。3.局中人在一个信息集上选择行动时已知道了哪些信息。4.单点信息集表明相应的局中人完全了解博弈从开始到该信息集的博弈历程。完美信息博弈如果G的每个信息集都是单点信息集。表明博弈的每个参与人在选择行动时对博弈到现在为止的历程都完全了解,这时称G为完美信息博弈。扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈静态扩展型博弈的例子例1.2

两个参与人同时从字母T,H中选择一个,博弈结束时两个参与人各得一笔支付,该博弈的博弈树如图1-3所示。②②①HHHTTT图1-3扩展型博弈的子博弈扩展型博弈的子博弈大体上说是原博弈的一部分,但它不能破坏原博弈的信息集。定义1.2设为一有限扩展型博弈,从Y的决策节点h出发的子博弈满足(1)h是G的单点信息集;(2)N;(3)是Y的子树,它由h及其后的所有节点与终点构成;(4)不能割裂G的信息集;(5)若“自然”仍属于,则中“自然”的概率分布;(6)设Z为的终点,支付向量。1.2有限扩展型博弈的策略策略的定义定义1.3

局中人的策略集合用表示,中的元素称为局中人i的策略。它定义为局中人i的信息集类到行动集的映射:

策略是信息集的映射,行动是映射值。两者是不同的概念。例1.3

考虑图1-1所示的扩展型博弈的策略。策略表明参与人2在第1个信息集上选择行动,在第2个信息集上选择行动。其余策略可同样理解。

容许I01①①◎②容许抵制②进入进入不进不进旺盛疲软图1-1市场进入博弈树例1.4考虑例1.1所给出的扩展型博弈的策略。

例1.5

考虑例1.2给出的扩展型博弈的策略。

在静态博弈模型中,局中人策略与行动等同。1.3一般扩展型博弈模型构成一般扩展型博弈模型的要素(1)一个有限的局中人集合:,其中“0”表示虚拟局中人—“自然”,它以确定的概率分布进行随机选择。(2)一个满足下列三条性质的行动序列集合H。①H中包含一个空序列,即;②如果局中人的有限行动序列H,则对正整数,都有

H;③对于局中人的无限行动序列,若对任何正整数都有,则H,否则H。称满足以上三条性质的行动序列集合H为历史集。称历史集中的元素H为博弈的一段历史。称一段历史H为博弈的终点,如果它是无限的()或不存在使H。博弈全体终点构成集合记为Z。(3)局中人映射,表示历史h之后应由局中人i选择行动。(4)定义“自然”的行动集合上的概率分布为q。(5)信息集分割。对于每个局中人,称集合(可为无穷)为的一个信息集分割,称为局中人的信息集,如果它满足性质①;②只要与同在内,则。表示局中人在历史之后的可能选择的行动集合。③对,中至多有一段历史与h相交。(6)支付向量支付向量是终点到的映射。其中是当博弈结束于,局中人的支付值。例1.1的一般扩展型博弈模型1.局中人集合.2.历史集合H={,T,H,TT,TH,HT,HH,TTT,TTH,THT,THH,HTT,HTH,HHT,HHH,TTTT,TTTH,TTHT,TTHH,THTT,THTH,THH,THHH,HTTT,HTTH,HTHT,HTHH,HHTT,HHT,HHHT,HHHH}终点集合Z={TTTT,TTTH,TTHT,TTHH,THTT,THTH,THHT,THHH,HTTT,HTTH,HTHT,HTHH,HHTT,HHTH,HHHT,HHHH}3.局中人映射。

,,,4.信息集分割。

其中,,,,.5.支付向量。一般扩展型博弈模型的策略和有限扩展型模型一样,一般扩展型博弈模型的策略也是定义为信息集类到行动集的映射。,,(可为)。一般扩展型博弈模型的子博弈一般扩展型博弈模型的子博弈是从一个单点信息集引出,由局中人映射所确定的到终点集合的子博弈,子博弈不能割裂原博弈的信息集。1.4策略型博弈模型1.4.1策略型博弈模型的定义定义策略型博弈模型,仅需要局中人、策略、支付这三个要素。静态博弈的策略与行动是等同的。策略组合称由每个局中人的策略所构成的向量为一个策略组合,其中。称n个局中人的策略集的乘积集合为策略组合集合。支付函数局中人的支付函数是定义在策略组合集合S上,取值于实数的映射。。局中人i的支付函数是定义于策略组合集合上,而非i的自身策略集上,表明局中i人的支付不仅与自己的策略有关,也与对手的策略组合有关,即博弈论中局中人之间的利益是互相制约的。这是博弈论与决策理论的一个重要区别。定义1.5

称为一个策略型博弈模型

例1.6囚徒困境问题这个问题可以归结为下述静态信息完全的博弈模型.其中,局中人集合,1代表罪犯甲,2代表罪犯乙。两个局中人具有相同的策略集合:,其中C代表坦白,D代表抗拒的行动。对于策略组合,,两个局中人的支付函数如下:该问题对应的扩展型博弈模型可用图1-4示的博弈树直观给出。

抗拒抗拒抗拒坦白坦白坦白图1-4①②②1.4.2二人有限策略型博弈模型二人有限策略型博弈模型设是一个策略型博弈模型,如果,,,即N是两个局中人的集合,都是有限集,称G为二人有限策略型博弈模型。对于二人有限策略型博弈模型,定义,,.称以下以向量为元素的矩阵为G的支付矩阵。二人有限策略型博弈模型可由支付矩阵完全描述称为参与人1的支付矩阵,

为参与人2的支付矩阵。二人有限策略型博弈G也可称为双矩阵博弈,记为囚徒困境问题是个二人有限策略型博弈,其支付矩阵为1.4.3重复剔除被严格占优策略均衡定义1.6如果对于任何策略组合有,则称局中人i的策略严格占优策略,或被严格占优。在博弈论中,对于参与人的一个基本理性假设是:参与人偏好更高的支付。因而不会使用被严格占优的策略。在上述理性假设下,我们有理由将被严格占优的策略删除。用剩余的策略组合预测博弈的结果。重复剔除被严格占优策略均衡一个策略本来是不被严格占优的,但经过一轮删除被严格占优的策略后,它变为被严格占优的策略了,因而我们必须在第2轮中将其删除。在有限博弈中,这样的删除被严格占优策略的过程迟早会结束。如果结束时,仅剩下一个未被删除的策略组合,则称为重复剔除被严格占优策略均衡,称该博弈为严格占优可解的。我们可用重复剔除被严格占优策略均衡预测博弈的结果。在囚徒困境问题中,策略组合是重复剔除被严格占优策略均衡。例1.7伯川德价格竞争假设双寡头垄断市场中两个企业都可选择价格策略高、中、低三种,支付矩阵为该博弈是严格占优可解的,策略组合(低,低)为重复剔除被严格占优策略均衡。。并不是每个策略型博弈都是严格占优可解的。例1.8两个土地所有者共同拥有一防洪大堤,每个人分管一段进行维护,维护成本为4。如不维护,洪水造成的损失为10。该博弈的支付矩阵为该博弈不是严格占优可解的。对于不是严格占优可解的博弈,将继续讨论参与人应如何选取策略1.5扩展型博弈模型转化为策略型博弈模型例1.9

考虑以下动态博弈。第1步,局中人1从{1,2}中选择一数;第2步,局中人2知道的值。从{1,2}中选;第3步,局中人1知道的值,从{1,2}中选,博弈结束。对于给定的()值,局中人2支付给局中人1一笔费用:,,,,,,该动态博弈所对应的博弈树如图1-6所示。12122211I15I14I13I122②图1-6I21I221I112112②①①①①①该动态博弈所对应的博弈树如图1-6所示。12122211I14I13I122图1-6I211I112112②①①①①①该博弈的局中人集合,为将其转化为策略型博弈,还需要确定出局中人的策略空间及支付函数或支付矩阵。局中人1的策略空间为}.局中人2的策略空间为该博弈对应的策略型博弈可由如下的支付矩阵给出。该博弈对应的策略型博弈可由如下的支付矩阵给出。

例1.10

考虑如下动态博弈。第1步,局中人1从中选一数;第2步,局中人2知道,从中选;第3步,局中人1不知,也忘记了,从中选,博弈结束。对选定的,局中人2支付给局中人1的费用与前例相同,该博弈对应的博弈树如图1-7所示。1121222211I12①2图1-7I21I2211I11①①①①②②该博弈局中人集合为.局中人1的策略集合.局中人1的策略集合.支付矩阵为:从以上两例中,可以看到策略与行动这两个概念的明显的区别。基本概念本章要求掌握如下基本概念合作博弈非合作博弈有限扩展型博弈模型完全信息博弈不完全信息博弈静态博弈动态博弈完美信息博弈子博弈策略策略型博弈模型支付矩阵重复剔除被严格占优策略均衡严格占优可解博弈小结本章阐述了博弈论所研究的活动具有的特征,并指出博弈论与决策理论区别。决策理论中一般仅有一个决策者,他们从个人效用最大化出发进行决策,而博弈论中有多个决策主体,这些主体之间是利益相关的。博弈论主要讨论他们之间的策略互动关系。博弈论模型从形式可分为策略型博弈模型与扩展型博弈模型。扩展型模型完整地刻画了一项博弈活动。博弈树是扩展型模型的形象刻画,但它仅描述了有限的博弈模型。策略型博弈模型的结构简单,但它忽略了博弈的时序与信息,其侧重点在于分析参与人的策略选择。对于信息完全静态博弈,用策略型博弈刻画更为合适。对信息完全的动态博弈,用扩展型博弈模型描述更为合适。策略与行动是两个容易混淆的概念,其原因是在静态博中,策略与行动是等同的,而一般教材先介绍静态博弈,这可能会给自学者造成策略就是行动的先入为主的错误观念,这也是本书先介绍扩展型博弈后介绍策略型博弈的一个主要原因。本章还针对策略型博弈介绍了求解重复剔除被严格占优均衡的方法。本章重点要求掌握这个方法以及把已知扩展型博弈模型转化为策略型。重点要求能够区分策略与行动这两个概念。为了逻辑上的完整性,我们还在补充节中介绍了一般扩展型博弈。纳什均衡2.1纳什均衡的定义纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建立在纳什均衡基础之上的。纳什均衡是个策略组合,它满足两个要求。1.对每个局中人,能够预期到对手采用策略组合。2.对每个局中人,是他应对的最好的策略。纳什均衡的定义定义2.1

设为一具有完全信息的策略型博弈模型,称策略组合为G的一个纳什均衡。如果对是在i的对手策略组合为条件下局中人i的最优反应策略,即

或对。如果以上不等式对严格成立,称为G的严格纳什均衡。在完全信息静态博弈中可用纳什均衡预测每个参与人的策略,进而预测我们所关心的各种博弈结果。扩展型博弈模型的纳什均衡定义为它所对应的策略型博弈的纳什均衡。例2.1囚徒困境问题在例1.6给出的囚徒困境问题中,是惟一的严格纳什均衡。策略组合都不是纳什均衡。例2.2伯川德(Berchand)均衡设有生产同质产品的两个企业,同时独立地确定产品的价格。已知该产品市场需求函数为,满足。这里q代表产量,p代表价格。两个企业具有相同的单位成本.企业的利润函数如下:这里表示两个企业的价格分别为时,市场对于企业的产品的需求量。上述企业价格竞争问题可以归结为完全信息静态博弈模型其中局中人集合。策略集合表示企业所有可行价格构成的集合。支付函数。为求该模型的纳什均衡,可先将策略组合集合中的点分为4类,分别讨论它们是否能构成纳什均衡。第1类,第2类,第3类,第4类,(1)当,不是纳什均衡。.(2)当,不是纳什均衡。(3)当,不是纳什均衡。(4)当,是纳什均衡。称其为伯川德均衡。例2.3简单产品差异化模型考虑由商店构成的市场,A与B分别销售不同品牌的商品,进行价格竞争。假设生产的单位成本为零。消费者分为两类,个消费者偏好于产品A,个消费者偏好于产品B。A,B两种品牌价格分别为。设消费者可从A或B处购买单位商品。用表示由于购买不喜欢的产品所付出的厌恶成本,假设消费者具有如下的效用函数用表示消费者对于产品A的需求量;表示消费者对于产品B的需求量。则可以证明上述产品的差异化模型不存在纳什均衡。纳什均衡的不变性由纳什均衡的定义知,为纳什均衡的充要条件是对任何参与人支付差,而与这个差值是多少无关,由此可导出纳什均衡的一个性质:纳什均衡的不变性命题2.1

设为已知策略型博弈。(1)纳什均衡在支付函数的正仿射变换下不变。对,令,其中,则G与有相同的纳什均衡。(2)纳什均衡在支付函数的局部变换下不变。给定及.令,G与有相同的纳什均衡。重复剔除被严格占优策略均衡与纳什均衡的关系命题2.2

若是有限策略型博弈的纳什均衡,那么它不会被重复剔除被严格占优策略的过程所剔除。命题2.3在有限策略型博弈中,如果是重复剔除被严格占优策略均衡,则它必为纳什均衡。2.2 求纳什均衡的划线法划线法对于二人有限博弈,,G可由支付矩阵给出。设为G的纳什均衡。即是局中人2对于的最优反应,是局中人1对于的最优反应。G的纳什均衡可由以下划线法求得。1.对局中人1的每个策略,寻找局中人2的最优反应。若最优反应为,即,则在支付矩阵元素下划一短线。2.对局中人2的每个策略,寻找局中人1的最优反应,若最优反应为,即,则在元素下划一短线。3.如果支付矩阵中元素的每个分量都划有短线,这表明,是关于的最优反应。也是关于的最优反应,故,策略组合为G的纳什均衡。例2.4在囚徒困境问题中,其支付矩阵为应用划线法,支付矩阵中的元素(-5,-5)下都划上了短线,其所对应的策略组合为纳什均衡,且是严格的纳什均衡,例2.5

斗鸡博弈两个人举着火棍从独木桥的两端走向中央进行火拼,每个人都有两种战略:继续前进,或退下阵来。若两个人都继续前进,则两败具伤;若一方前进,另一方退下来,前进者胜利,退下来的丢了面子;若两人都退下来,两人都丢面子,支付矩阵如下:用划线法可得严格纳什均衡(退,进),(进,退)。例2.6智猪博弈猪圈里圈着两头猪,一头大猪,一头小猪。猪圈的一边有一个猪食槽,另一边安装一个按钮,按一下按钮会有10个单位的猪食进槽。但谁按按钮就需要付2个单位的成本。若大猪先到,大猪吃到9个单位,小猪吃到1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位,支付矩阵如下。严格纳什均衡为大猪“按”,小猪“等待”。例2.7在例1.8中的大堤维护博弈中,支付矩阵为利用划线法可得纳什均衡(维护,维护),(不维护,不维护)。为了保护生命财产的安全,政府可以立法,如果参与人不维护大堤,需付罚款5,则有支付矩阵这时该博弈有惟一的纳什均衡(维护,维护)。2.3最优反应映射与纳什均衡定义2.2局中人的最优反应映射局中人i的最优反应映射是一个定义于策略组合集合S,取值于策略集的子集的集值映射(映射值为集合的映射称为集值映射),,满足定义2.2表明,局中人i的最优化反应映射仅与有关。反应函数当为单点集时,称为局中人i的最优反应函数,简称反应函数。这时将记为。定义2.3最优反应映射n个参与人的最优反应映射的乘积称为博弈G的最优反应映射。博弈的最优反应映射与纳什均衡之间的关系定理2.1为策略型博弈的纳什均衡的充要条件是。设为一集值映射。若,称x为的不动点。利用不动点概念,定理2.1可以如下叙述。命题2.4

是策略型博弈G的纳什均衡的充要条件是是最优反应映射的不动点,即。例2.8

在囚徒困境问题中,是囚徒困境博弈的惟一纳什均衡。例2.9多囚徒困境问题将例1.6中两个囚徒推广为个囚徒,且量刑的规则为,如果n个囚徒都抗拒,各判1年;如n个囚徒都坦白,各判5年;如果n个囚徒中有的坦白,有的抗拒。坦白者释放,抗拒者判8年。这说明是惟一的纳什均衡。例2.9多囚徒困境问题将例1.6中两个囚徒推广为个囚徒,且量刑的规则为,如果n个囚徒都抗拒,各判1年;如n个囚徒都坦白,各判5年;如果n个囚徒中有的坦白,有的抗拒。坦白者释放,抗拒者判8年。,这说明是惟一的纳什均衡。

例2.10设有n家电视台可选择m部电视剧在某段时间同时播放。电视台的播放的收益为观众数的倍。已知偏好于第部电视剧的观众为,且。如果同时有几个电视台同时播放同一部电视剧,则它们均分观众,考虑电视台如何播放电视节目。首先建立策略型博弈模型,其中局中人集合,表示第i家电视台,策略集合,表示电视台i选择第j部电视剧播放。局中人的支付函数

且其余电视台中还有家播放。。对,且中有个1。。由知,故有,从而,对,,。可知每家电视台同时播放电视剧1是惟一的纳什均衡,该例解释了n家电视台热播同一部电视剧的实际情况。例2.11国际联盟博弈为毗邻某海岸的三个国家,他们在这个海岸附近驻扎军队。要想控制整个海湾,至少需要两个国家联合起来。三国的兵力部署与相应的支付由以下支付矩阵给出

w选择陆地

w选择近海支付向量的第1,2,3个分量分别给出的的支付值。局中人的最优反应映射为,,,。因s为纳什均衡需满足,故纳什均衡仅能存在于策略组合,,,中。

故纳什均衡存在于策略组合,,中。,,从而该博弈的纳什均衡为,,,相应的支付向量为,,。两国结成联盟控制海湾将会出现以下情况。(1)L与S联盟,分别将兵力部署于北、东,W将把兵力部署于陆地;(2)L与W联盟,分别把兵力部署于北、海,S将把兵力部署于西;(3)S与W联盟,分别将兵力部署于东、海,L将把兵力部署于南。尽管三个国家都联合起来,总支付最大,但他们之间如无具有约束力的协议,这种联盟是不稳定的,因它不是一个纳什均衡。由上例我们可以得出求多人有限策略型博弈的纳什均衡的方法,步骤如下:1.对S中所有的策略组合计算,如果,则从S剔除,剩余策略组合集合记为。2.对中所有的策略组合S计算。如,则从S中剔除,剩余集合记为。3.应用类似方法n步,如,从中剔除,最后得到。中的策略组合都是纳什均衡。特别是对于三人有限策略博弈模型,我们可给出纳什均衡的划线法。设参与人的策略集合分别为,,对

.对每个,,都可写出一个以3维向量为元素的m行n列的支付矩阵。划线法步骤如下1.对每个支付矩阵,比较每一行中的元素的第2个分量,最大者下面划线。2.对每个支付矩阵,比较每一列中的元素的第1个分量,最大者下面划线。3.对于个支付矩阵的相同行列的元素,比较第3个分量,最大者下面划线。例2.12公共物品提供对于公共物品,提供者与不提供者都享受同样的效益,且公共物品提供的成本仅与其提供的服务水平有关,而与享用其效益的人数无关。设甲、乙、丙三人决定是否提供某项公共物品。1表示提供,0表示不提供。提供者需付出成本。而收益为已被提供的公共物品的数量,分别就讨论该博弈的纳什均衡。(1)当c=0.5,支付矩阵如下。丙提供:丙不提供:由划线法知,(1,1,1)是纳什均衡。(2)当c=1时,支付矩阵为丙提供:丙不提供:

任何一个策略组合都是纳什均衡。(3)c=1.5,支付矩阵为丙提供:丙不提供:(0,0,0)为纳什均衡。2.4求纳什均衡的反应函数法如果博弈G的n个局中人的最优反应映射都是反应函数,我们有如下定理。定理2.2为博弈的纳什均衡的充要条件是是局中人的n条最优反应曲线,的交点。由定理2.2,可用以下两步求得纳什均衡。1.求出每个参与人的最优反应函数,。2.求,的交点。例2.13设策略型博弈其中,支付函数为求G的纳什均衡。为求,固定,求解优化问题:可得:为求,固定,求解优化问题:可得:两条反应曲线的交点为它们给出了G的三个纳什均衡。

例2.14

设。支付函数为为求,固定,求解优化问题可得,。为求,固定,求解优化问题由上例知两条最优反应曲线的交点为纳什均衡。例2.15投资问题两个投资主体中央政府与地方政府都可向基础设施与加工工业两个方向投资,记:中央政府对于基础设施的投资水平;:中央政府对于加工工业的投资水平;:地方政府对于基础设施的投资水平;:地方政府对于加工工业的投资水平。中央政府与地方政府的投资效益为如下的Cobb-Douglas型函数。参数。的假设表明中央政府考虑基础设施投资的外部性,而地方政府不考虑这种外部性,即中央政府对基础设施投资有更大的偏好。在这个投资博弈中,参与人1为中央政府,参与人2为地方政府。中央政府选择基础设施投资水平,加工业投资水平。地方政府也选择基础设施投资水平与加工业投资水平。中央政府的问题是,对于固定的地方政府的投资选择,选择,在投资预算约束为中央政府的投资预算)下求解最优化问题地方政府的问题是固定中央政府的选择,选择,在预算约束下最大化自己的效益。其中为地方政府的投资预算。首先考虑中央政府问题,将代入目标函数,将中央政府问题简化为由1阶条件,可得(1)同理,地方政府问题可被简化为

由1阶条件,可得(2)不妨设,对于,分以下三种情况讨论该博弈的纳什均衡。1.中央政府最优反应函数为地方政府的最优反应函数为纳什均衡为纳什均衡如图2-1(a)所示。图2-1(a)2.中央政府最优反应函数为地方政府最优反应函数为纳什均衡为即地方政府投资于加工业,中央政府投资于基础设施。纳什均衡如图2-1(b)所示。图2-1(b)3.中央政府最优反应函数为地方政府最优反应函数不变。纳什均衡为即中央政府把全部资金投资于基础设施,地方政府弥补中央政府对于基础设施的投资不足,然后将剩余资金投资于加工业。纳什均衡如图2-1(c)所示。图2-1(c)

2.5纳什均衡的性质定义与假设条件定义2.4

称为拟凹函数,如果使,则有对成立。若以上不等式严格成立,则称严格拟凹。注意,如果是单调函数,则拟凹。若为凹函数,则为拟凹函数。但为拟凹函数,不一定是凹函数。在纳什均衡的存在性与惟一性的研究中需要以下假设。假设1博弈的每个局中人的策略集合为紧凸集,

指m维实数空间,中的紧集指有界闭集。假设2对局中人i的支付函数为连续函数。假设3对,局中人i的支付函数为的凹函数。假设4对,局中人i的支付函数为的拟凹函数。假设5对,局中人i的支付函数为的严格拟凹函数。纳什均衡存在性定理定理2.3设策略型博弈G满足假设1,2,4,则G至少存在一个纳什均衡。当博弈G满足假设1,2,3或1,2,5时,G存在纳什均衡。为看到假设5的特殊作用,我们给出以下命题。命题2.5设为策略型博弈且满足假设1,2,5,则局中人的最优反应映射,恰含有一点。假设5的重要作用在于局中人的最优反应映射这个集值映射转化为局中人的最优反应函数。此时纳什均衡的惟一性问题在下面的关于博弈G纳什均衡的唯一性的讨论种中,假设局中人的最优反应映射为反应函数。定义2.5设,x到y的距离被定义为定义2.6压缩映射设映射,其中。如果存在正数,使对,,称为压缩映射。可用以下命题判断为压缩映射。命题2.6设可微,,如果存在,使对任意x成立,则为压缩映射。例2.16因,所以为压缩映射。定理2.4

若策略型博弈满足假设1,2,5,且最优反应映射为压缩映射。则G有惟一的纳什均衡。定义2.7光滑博弈称策略型博弈为光滑博弈,如果下述导数在策略型组合集合S内部上存在且连续(指S去掉边界)。定义2.8严格光滑博弈称策略型博弈G为严格光滑博弈,如果G是光滑的,且对策略组合集合的任何边界点有上述极限对于中所有趋于的序列而取。定义2.9设A为m阶方阵,若负定,称A为拟负定矩阵。用表示1阶条件系统的Jacobian矩阵,即它是由元素构成的阶方阵。例如

其中。

定理2.5设G为完全信息静态的光滑博弈,满足假设1,2,4.表示该博弈的最优反应映射的Jacobian矩阵,如果它对拟负定,且对,,则G有唯一的纳什均衡。定理2.6Rosen惟一性定理设是严格光滑博弈,满足条件1,2,5。且对任何拟负定,则G有惟一的纳什均衡。

例2.17设策略型博弈,其中,,,.而不是负定矩阵,从而不是拟负定的。另外,其中不是压缩映射。故我们不能得到G有惟一的纳什均衡的结论,在例2.13中我们已求出了G的3个纳什均衡。例2.18

设,,,显然G为严格光滑博弈,且,负定,从而拟负定。由定理2.6知,G有惟一的纳什均衡。

2.6混合策略下的纳什均衡

2.6.1混合策略下的纳什均衡例2.19“石头、剪子÷布”游戏是一个二人有限策略型博弈,它的支付矩阵为利用划线法易见,纳什均衡不存在。为了解决这类均衡不存在的问题,需要把策略的概念扩充为混合策略的概念,进而把纳什均衡的概念扩充为混合策略意义下的纳什均衡的概念。而把前面介绍过的策略与纳什均衡分别称为纯策略与纯策略意义下的纳什均衡。混合策略为方便起见,针对二人有限策略型博弈讨论这个问题。设。称上的一个概率分布为参与人的一个混合策略,故可分别用

表示两个参与人的混合策略集合。为参与人1的混合策略,表示参与人1以概率随机选择纯策略。为参与人2的混合策略,表示参与人2以概率随机选择纯策略。易知,参与人1的混合策略等同于他的纯策略。参与人2的纯策略等同于他的纯策略。因而混合策略包含了纯策略,即混合策略是纯策略概念的扩充。

称为混合策略组合。对于混合策略组合,由于参与人随机选择纯策略,因而参与人的支付值也是随机的,故需用期望支付代替博弈G中的支付函数。对于给定的,参与人1的期望支付为参与人2的期望支付为称为G的混合扩充。记,,,。分别为参与人1与2的支付矩阵。利用支付矩阵A与B,参与人1与2的期望支付可表示为这里X表示参与人1的混合策略行向量,Y表示参与人2的混合策略列向量。定义2.10

称混合策略组合为的纳什均衡或G的混合策略纳什均衡,如果,对任何成立,,对任何成立。当以上两个不等式严格成立时,称为G的严格混合策略纳什均衡。混合策略意义下的纳什均衡的含意仍为:固定是参与人2对的最优反应,固定是参与人1对的最优反应。2.72×2双矩阵博弈的纳什均衡

设为二人有限博弈,且,这时两个参与人的支付矩阵分别为对G的支付函数作正仿射变换,相当于对参与人的支付矩阵每个元素乘以一个正数再加一常数,即其中,,。对G的支付函数作局部变换,相当于A的某一列加一常数或B的某行加一常数,即可以证明与有相同的混合策略纳什均衡。当为2阶方阵时,对G的支付函数进行局部变换,可对A进行列变换将A变为对角形。对B进行行变换将B变为对角形。1(1)、(5)成立条件图形纳什均衡2(1)、(6)成立3(1)、(7)成立4(1)、(8)成立5(2)、(5)成立6(2)、(6)成立7(2)、(7)成立8(2)、(8)成立9(3)、(5)成立10(3)、(6)成立11(3)、(7)成立(3)

(1)

(2)

y10x

12(3)、(8)成立13(4)、(5)成立14(4)、(6)成立15(4)、(7)成立16(4)、(8)成立(1)

(2)

(3)

表2.1给出了除之外的双矩阵的所有纳什均衡。这里。例2.20囚徒困境对于例2.9的囚徒困境问题,两个局中人的支付矩阵经局部变换后均为,由表2.1知,囚徒困境问题仅有一个纯策略纳什均衡(坦白,坦白)。例2.21斗鸡博弈对于2.10的斗鸡博弈问题,两个参与人的支付矩阵经局部变换后均为,。由表2.1知,该博弈有两个纯策略纳什均衡(进,退)、(退,进)与一个混合策略纳什均衡。即以的概率退却,以的概率进攻。斗鸡博弈表明了参与人在竞争中总是采取避免两败俱伤的理性行为。例2.22智猪博弈对例2.11的智猪博弈问题,两个参与人的支付矩阵经局部变换后,分别为

,

。由表2.1知,该博弈仅有一个纯策略纳什均衡:大猪按,小猪等待。例2.23交通规则有的国家规定右侧通行,有的国家规定左侧通行。如果不作规定,情况如何?设两个参与人的交通规则博弈的支付矩阵如下。两个参与人的支付矩阵为,经局部变换后为以上博弈符合表2.1中第11种情况,,。纯策略纳什均衡为(左,左,),(右,右),混合策略纳什均衡为例2.24狩猎博弈两个猎人必须同时决定是猎鹿还是猎兔。如果两人均决定猎鹿。他们会获得一只鹿,然后平分。如果两人均决定猎兔,、那么每人可各获得一只野兔。如果一人决定猎鹿,另一人决定猎兔,猎兔者将获得一只野兔,而猎鹿者将一无所获。对每个猎人而言,半只鹿的收益要大于1只野兔的收益,该博弈的支付矩阵为对支付矩阵作局部变换,可得,因而纳什均衡与上例相同:,及混合策略纳什均衡这里“猎鹿”体现了参与人在政治、经济、军事等活动中的合作行为,“猎兔”体现了参与人的不合作行为。例2.25性别战有一对情侣,男士喜欢看足球,女士喜欢看歌舞,周末他们两人可选择去看足球或看歌舞。支付矩阵为由表2.1的第11种情况,,,该博弈有2个纯策略纳什均衡(足球,足球),(歌舞,歌舞)与一个混合策略纳什均衡。性别战博弈刻画了实际问题中参与人合作要优于不合作,但合作的收益还有区别的情形。例2.26公共物品提供在两个参与人的公共物品提供博弈中,参与人可从公共物品中收益1,而付出的成本分别为。支付矩阵如下。分别对两个参与人的支付矩阵作局部变换,变换后仍为。可得,。。由表2.1知,该博弈的纳什均衡为(提供,不提供),(不提供,提供)。及混合策略纳什均衡。两个纯策略纳什均衡刻画了公共物品提供问题中的参与人之间的“搭便车”行为。例2.27监督博弈监督博弈概括了诸如税收检查、质量检验、腐败惩治、雇主监督雇员等活动。以税收检查为例,博弈的参与人为税检机关与纳税人。税检机关所能选择的策略是检查与不检查,纳税人的选择是逃税与不逃税。支付矩阵如下。

其中为应纳税额,为检查成本,F是罚款,且。对两个参与人的支付矩阵作局部变换后有,,。由表2.1,可得混合策略纳什均衡,。均衡时,税检机关以概率检查,越大,这个概率也越大;纳税人以的概率逃税。检查成本c越大,应纳税款越大,罚款F越大,这个概率越小。

2.8混合策略纳什均衡的有关结论更一般的混合策略意义下的纳什均衡混合策略设为一有限策略型博弈模型,其中局中人集合,对于,纯策略集合为,上之一概率分布,,称为局中人i的一个混合策略。局中人i采用混合策略的含义是局中人i对纯策略进行随机选择,以概率选择纯策略,。记,,因而可用表示局中人的所有混合策略构成的集合。称为G的混合策略组合。期望支付如果局中人随机选择纯策略,则局中人的支付也是随机的,因而我们需要用局中人的期望支付描述局中人的选择行为。给定,局中人i的期望支付为式中,.这样

,显然,局中人i的纯策略等同于混合策略,因而混合策略集中包含了纯策略。称为G的混合扩充。定义2.10设为的一个混合策略组合,如果对及,均有(1)称为G的混合策略纳什均衡。当(1)式对为严格不等式时,称为G的混合策略严格纳什均衡。定理2.7

为的混合策略纳什均衡的充要条件:是对,,有

(2)最优反应映射局中人最优反以映射是定义于混合策略集合,取值于的子集的集值映射,,满足

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论