




已阅读5页,还剩130页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博弈论初步非合作寡占模型合作寡占模型垄断竞争模型,第六章博弈论与市场竞争模型,6.1博弈论初步,一、什么是博弈论1、博弈论的定义博弈论是研究决策主体之间的行为发生直接作用时的决策(即决策者的收益不仅取决于自己的行动,也取决于对手的行动),以及这种决策的均衡问题。2、为什么要学习博弈论?新古典企业理论认为消费者是在收入和价格的约束下追求效用最大化;企业则是在技术和市场的约束下追求利润最大化,与其他人的选择无关。因此消费者被理解为效用函数,企业被理解为生产函数。对于个体而言,所有其他个体的行为被一个参数即价格所包括。同时假定是完全信息的,不存在信息不对称。但在不完全竞争市场上必须要考虑对手的行为和不完全信息,而博弈论是研究自己的收益和选择取决于其他人的收益和选择。,3、基本概念博弈论的基本概念包括:参与人、行动、信息、战略、支付函数、结果、均衡。参与人指的是博弈中选择行动以最大化效用的决策主体(个人或团体);战略是参与人选择行动的规则,它告诉参与人在什么时候选择什么行动(如“人不犯我,我不犯人;人若犯我,我必犯人”是一种战略,“犯”与“不犯”是两种不同的行动,战略规定了何时选择“犯”,何时“不犯”);行动是参与人的决策变量;信息指参与人在博弈中的知识,特别是其他参与人(对手)的特征和行动的知识;支付函数是参与人从博弈中获得的效用水平,是所有参与人战略或行动的函数;结果是指博弈分析者感兴趣的要素的集合;均衡是所有参与人的最优战略或行动的组合。博弈分析的目的是使用博弈规则决定均衡。,4、博弈的划分博弈的划分可以从两个角度进行。第一个角度是按照参与人行动的先后顺序,划分为静态博弈(staticgame)和动态博弈(dynamicgame)。静态博弈指的是博弈中,参与人同时选择行动,或虽然不是同时行动,但后行动者并不知道前行动者采取了什么具体行动;动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到前行动者所选择的行动。第二个角度是根据参与人对其它参与人的特征,战略空间和支付函数的知识,划分为完全信息博弈和不完全信息博弈。完全信息博弈是指每一个参与人对所有其它参与者的特征、战略空间和支付函数有准确知识。否则就是不完全信息。表1博弈的分类及对应的均衡概念,二、完全信息静态博弈1、占优战略例一,囚徒困境(prisonersdilemma)。两个疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白另一人抵赖,坦白的放出去,不坦白的判刑10年。表1给出囚徒困境的战略式表述。这里,每个囚徒都有两种战略:坦白或抵赖。表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是囚徒A的支付,第二个数字为囚徒B的支付。表2囚徒困境,战略式表达:矩阵相对应的每个小格表示每位参与者采取不同的战略组合时所得到的收益,特别方便于静态分析。在每个小格左下角的数字代表参与者1所得的收益;右上角的数字则代表参与者2的收益。在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白。(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡。不论对方如何选择,个人的最优选择是坦白。结果是,每个人都选择坦白,各判刑8年。占优均衡:如果某参与方的某一战略无论何时,无论其他参与者选择什么战略,都优于可选择的其他战略时,就称该参与者拥有占优战略(dominantstrategy)。如果一位参与者拥有占优战略而且有理性,则我们预期他会选择占优战略。占优战略只需假设该参与者是理性的,而不需要假设其他参与者也有理性,甚至不需要假设该参与者知道其他参与者的收益。,囚徒困境反映了个人理性与集体理性的矛盾。如果两个人都抵赖,各判刑1年,显然比都坦白各判刑8年好。但这个帕累托改进办不到,因为它不满足个人理性要求,(抵赖,抵赖)不是纳什均衡。囚徒困境在经济学上有着广泛的应用:(1)产量选择的寡头博弈。如果两企业联合起来形成卡特尔,选择垄断利润最大化的产量,每个企业都可以得到更多利润。但卡特尔协定不是一个纳什均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果每个企业都只得到纳什均衡产量的利润,它严格小于卡特尔产量下的利润。(2)公共产品的供给。如果大家都出钱兴办公用事业,所有人的福利都会增加。但是,如果我出钱你不出钱,我得不偿失;而如果你出钱我不出钱,我就可以占便宜。所以,每个人的最优选择都是“不出钱”,这种纳什均衡使得所有人的福利都得不到提高。从囚徒困境中,可以引出一个很重要的结论:一种制度(体制)安排,要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立。,2、劣战略与重复剔除的占优均衡只有很少的博弈具有占优战略,因此需要寻找其他方法来“求解”博弈。考虑参与者1的决策。表3的博弈没有占优战略。但存在劣战略M。如果参与者2选择L,则对于参与者1来说,选择B战略要比M战略好。参与者2选择C或R时,情况也是一样的。从参与者1的角度来看,B战略要比M战略占优势(实际上,T战略也比M战略占优势)。而在囚徒困境中,无论对方选择何种战略,抵赖的战略的收益都比其他战略差,因此抵赖战略就是一个劣战略。表3重复剔除劣战略,劣战略(dominatedstrategy):当存在一种战略,无论其他参与者选择何种战略,该战略的收益都比其他战略差时,我们就定义该战略为劣战略。如果给定的参与者有劣战略且有理性,则我们预期此参与者不会选择该战略。劣战略的概念比占优战略的概念要弱一些。如果参与者1有占优战略,他肯定会选择该战略;但当参与者1有劣战略时,只能说明他不会选择该战略,仍然有许多战略可供参与者1选择。但是,如果重复剔除“劣”战略,则可能得到更明确的信息。假设参与者2知道参与者1的收益,而且还知道参与者1是有理性的。根据以上推理,参与者2预计参与者1应该不会选择战略M。给定参与者1不会选择战略M,参与者2发现C战略相对于L和R战略成为“劣”战略。需要注意的是,严格来说,C战略并不是劣战略:如果参与者1选择战略M,则C战略要比L和R战略都要好。但是,在给定参与者1不选择M战略的情况下,C战略相对于L和R战略则成为劣战略。,进一步进行此过程。如果参与者1是有理性的,而且相信参与者2也是有理性的,同时也相信参与者2会认为参与者1也是有理性的,参与者1就会发现T战略是“劣”战略。如果参与者2不选择C战略,则T战略相对于B战略而言成为“劣”战略:如果参与者2选择L战略,则对于参与者1来说,B战略更好;如果参与者2选择R战略,对于参与者1来说,仍然是B战略较好。最后,对于参与者2来说,L是“劣”战略。这样,我们剩下一对战略(B,R)。即博弈的“解”。“重复剔除严格劣战略”(iteratedeliminationofstrictlydominatedstrategies):首先找出某个参与人的劣战略(假定存在),把这个劣战略剔除掉,重新构造一个不包含已剔除战略的新的博弈;然后再剔除新博弈中某个参与人的劣战略;继续这个过程,一直到只剩下一个唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解,称为“重复剔除的占优均衡”。,注意“占优战略”和“劣战略”的区别:(1)两者的强弱不同占优战略是指一个参与人所有可选择的战略中严格优于所有其他战略的那个战略,所有的其它战略都是相对于该占优战略的劣战略。在应用重复剔除方法寻找均衡时,一个战略是劣战略可能只是相对于另一个特定战略而言的。(2)对理性和共同知识的假设要求不同重复剔除劣战略所需的假设比占优战略的假设要严格得多。在占优战略中,需要假设的就是参与者有理性以及效用最大化。重复剔除劣战略则需要假设博弈的各方都相信其他方是有理性的,而且也相信其他参与者相信自己是有理性的,即理性参与是一种共同知识。,在博弈分析中,不仅参与者是否有理性是重要的,参与者是否相信其他参与者有理性也是十分重要的。表4中的博弈中,参与者2有劣战略L,也有占优战略R。如果参与者1相信参与者2有理性,则参与者1会预期参与者2应该选择R战略而非L战略。在给定这一信念的情况下,参与者1的最佳战略选择是B,收益为2。但是,假设参与者1认为参与者2没有理性,则B战略就不再是最佳选择。因为如果参与者2选择了L战略,则参与者1的收益为-100。表4劣战略的不确定性,3、纳什均衡表5的博弈没有劣战略和占优战略。该博弈中任一参与方的最佳战略取决于其他方的战略选择。因此,必须考察参与者1对参与者2战略选择的推测以及参与者2对参与者1战略选择的推测。这个博弈的自然候选“方案”是:(1)给定对其他参与者战略选择的推测后,参与博弈的每一方都选择最佳战略。(2)上述推测与其他参与者的战略选择一致。表5纳什均衡,假设参与者1推测参与者2会选择R,而参与者2推测参与者1会选择B。在给定这些推测的条件下,参与者1的最佳战略选择是B而参与者2的最佳战略选择是R。实际上,如果参与者1推测参与者2选择R,则参与者1的最佳战略选择是B;其他任何选择都会造成较低的收益。对于参与者2而言,情况也是同样的。需要注意的是,基于这些战略,参与者的推测是一致的:参与者1认为参与者2会选择自己认为最佳的战略,反之亦然。这种情况被称为纳什均衡。它是完全信息静态博弈解的一般概念。纳什均衡(Nashequilibrium):博弈的任何一方不能够单独改变战略来提高收益的一组战略被称为纳什均衡。在表5的博弈中(B,R)是纳什均衡,其他任何战略组合都不是纳什均衡。例如,(M,C)不是纳什均衡。因为如果给定参与者2选择战略C,则T对于参与者1来说是最优战略,而非M。,与占优战略的选择相反,纳什均衡概念的应用常会产生一个均衡,有时存在不止一个均衡。表6中(T,L)和(B,R)都是纳什均衡。该博弈的一个例证就是寻求标准化。战略T,L和战略B,R与导致兼容的战略组合一致。博弈双方在兼容时的收益都较好。参与者1倾向标准(B,R)的兼容,而参与者2倾向标准(T,L)的兼容。这个例子代表了一类博弈:(1)参与者都想调和;(2)有不止一个调和点;(3)博弈各方在哪个点更好的问题上意见不一致。表6多重纳什均衡,市场进入阻挠。在位者的垄断地位受到进入者的威胁,所以要阻挠进入者进入。博弈中进入者有两种战略可以选择:进入/不进入;在位者也有两种战略:默许/斗争。假定进入前垄断利润为50,进入后寡头利润合为40(各得20),进入成本为10。各种战略组合下的支付矩阵如表7所示。这个博弈有两个纳什均衡,即(进入,默许),(不进入,斗争)。给定进入者进入,在位者选择默许时得20单位利润,选择斗争时利润为-10,所以最优战略是默许;类似地,给定在位者选择默许,进入者的最优战略就是进入。因此(进入,默许)是纳什均衡。只有当在位者选择斗争时,不进入才是进入者的最优选择,所以,(不进入,斗争)也是纳什均衡。表7多重纳什均衡与市场进入阻挠,纳什均衡与占优战略均衡及重复剔除的占优均衡之间的关系:(1)占优战略均衡、重复剔除的占优均衡一定是纳什均衡,但并非纳什均衡都是占优战略均衡或重复剔除的占优均衡。许多不存在占优战略均衡或重复剔除的占优均衡的博弈,却存在纳什均衡。因为如果参与人的占优战略是对于所有其他参与人的任何战略组合的最优选择,自然它也一定是对于所有其他人的某个特定战略的最优选择。其次,一个战略构成纳什均衡战略的唯一条件是它是参与人对于其他参与人均衡战略的最优选择。因此在重复剔除过程中,如果剩下唯一的战略组合,那它一定是纳什均衡。在囚徒困境中,(坦白,坦白)是占优战略均衡、重复剔除的占优均衡,也是纳什均衡。在表6的博弈中,(T,L)是纳什均衡,但不是重复剔除的占优均衡,无法通过重复剔除劣战略的办法找到均衡解,更不是占优战略均衡。(2)纳什均衡一定是在重复剔除严格劣战略过程中没被剔除掉的战略组合,即没有任何一个战略严格优于纳什均衡战略,但没有被剔除的战略组合不一定是纳什均衡,除非它是唯一的。如果一个战略在重复剔除过程的某个阶段严格劣于另一个战略从而被剔除,它不可能是对于其他参与人的均衡战略的最优选择。在囚徒困境中,(抵赖,抵赖)被剔除,所以它不是纳什均衡,(坦白,坦白)是一个纳什均衡,所以它不会被剔除;在表6的博弈中,没有任何一个战略严格劣于另外一个战略,因而没有一个战略组合能被剔除掉,(T,L)和(B,R)都是纳什均衡。,三、动态博弈:承诺和逆向归纳1、不可置信承诺前述的纳什均衡分析存在三个不足:第一,一个博弈可能有无数个纳什均衡,不能确信哪个纳什均衡会实际发生。第二,参与人在选择自己的战略时,把其他参与人的战略当作给定的,不考虑自己的选择如何影响对手的战略。这个假设在研究静态博弈时是成立的,因为静态博弈下所有参与人同时行动,无暇反应。但在动态博弈中,参与者的行动有先后时,后动者会根据前者的选择而调整自己的选择,先动者会理性地预期到这一点,所以不可能不考虑自己的选择对对手的选择的影响。第三,由于不考虑自己选择对别人选择的影响,纳什均衡允许了不可置信威胁的存在。如市场进入阻挠中,若进入者真的进入,在位者的最优行动显然是默许而不是斗争,因为默许带来20的利润,斗争则使利润化为负值。所以,斗争是一种不可置信的威胁。但纳什均衡承认了这种不可置信的威胁,所以(不进入,斗争)便成为一个纳什均衡。这就需要定义动态博弈中的“子博弈精炼纳什均衡”。,子博弈精炼纳什均衡:将纳什均衡中包含的不可置信的威胁战略剔除,因此构成子精炼纳什均衡的战略必须在每个子博弈中都是最优的。或者说,参与人的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。由于剔除了不可置信的威胁战略,精炼纳什均衡常常缩小了纳什均衡的个数。扩展型(extensiveform):包含五个要素:(1)参与人,(2)每个参与人选择行动的时点,(3)每个参与人在每次行动时可供选择的行动集合,(4)每个参与人在每次行动时有关对手过去行动选择的信息,(5)支付函数。博弈树(gametrees)是扩展型的一种形象化表述。,图1是“市场进入阻挠”博弈的博弈树。这里,进入者先选择行动(进入或不进入),在位者然后选择默许还是斗争,最后的数字是支付水平。如进入者选择“进入”,在位者选择默许,支付水平分别为10和20。图中,圆圈代表决策结(decisionnode)。博弈从决策结1开始。在此结上,参与者1(进入者)在e或者之间做选择,可以分别解释为进入或不进入。如果选中后者,则博弈结束,收益为1=0(进入者收益),2=50(在位者收益)。但如果参与者1选择e,我们就移到决策结2。在此结上,参与者2(在位者)在r和之间做出选择,可以分别解释为“报复进入”和“不报复进入”。图1扩展式表达:序贯进入博弈,2、逆向归纳法尽管(进入,默许),(不进入,斗争)都是纳什均衡,但是后一均衡中,参与者1不进入是因为参与者2将会报复的“威胁”。但如果参与者1进入,参与者2是否会决定报复?答案是“不会”:因为如果报复,参与者2只能收益-10,而如果不报复,则收益为20。所以,虽然(,r)是纳什均衡,但并不是对参与者选择的合理预测。反向求解博弈是除去这类“不合理”博弈的方法之一,即逆向归纳(backwardinduction)原则。首先,考虑决策结2,得出最佳决策。然后,在结2已求得决策的情况下求解结1的决策。考虑到参与者2将选择,显然在结1的最佳决策是e。因此,我们选择第一个纳什均衡作为惟一“合理”的均衡。,3、承诺的价值图1中的博弈之所以除去均衡(,r)是因为它要求参与者2做出“难以置信”的承诺,即如果参与者1选择e,他就会选择r。这一点难以置信是因为给定参与者1选择e,则参与者2的最好选择是。但如果参与者2签订了强行的、不可重新谈判的合约,承诺如果参与者1选择e,则他一定会选择r。合约规定如果参与者2不选择r而选择,则会被罚款40,其收益将会降为-20。这种情况在图2中得以说明。首先决定权现在属于参与者2,决定是否签订上述合约(b或)。如果参与者2选择,则开始图1的博弈;如果参与者2选择b,则开始另一个博弈,在此博弈中需要考虑签署合约的意义。比较从参与者1决策结开始的两个子博弈。右边的子博弈与图1的博弈一样,参与者2的均衡收益为20。左边的子博弈除了参与者2在战略组合(e,)收益从20变成-20以外,其他都与右边的博弈相同。乍一看似乎参与者2的境况变糟:收益除了在一种情况下有所降低以外,其他都一样。但是,参与者2进行左边的子博弈所得的收益要比右边的好。,仍然逆向求解左边的子博弈。在参与者2选择r还是时,最佳的选择是r。因为选择的收益是-20而选择r的收益是-10(因为参与者2需要支付毁约费)。给定参与者2选择r,则参与者1的最好选择是,因为收益为0总比收益为-10好。总之,左边的子博弈给参与者2的均衡收益是50,来自于战略组合(,r)。再退回一步,考察参与者2在b和之间的最佳选择。参与者2的最佳选择是b,最终收益为50。而战略带给参与者2的收益只有20。图2承诺的价值,这个例子说明,可置信的承诺(crediblecommitment)也许有重要的战略价值。参与者2通过签订合约,可置信的承诺当其在r和之间进行选择的时候,一定会选择r,否则会得到处罚。参与者2诱导参与者1选择,这样给参与者2带来好处,使其收益从20上升到50。在这个例子中承诺的价值等于30。4、长期与短期变量在参与者既选择长期变量也选择短期变量的情况下,例如,生产能力决策通常是企业的长期选择,因为生产能力(建筑物,机器)通常会持续很多年。另一方面,定价是典型的短期变量,企业可以用相对较低的成本来频繁改变。为这类战略互动行为建模时需要假设参与者先选择长期变量再选择短期变量。短期变量是在给定长期变量值的情况下进行选择的变量。这正是我们把短期变量放在第二阶段所要得到的结果。,行动的时间将在图3中给予描述。该图也说明了表示博弈的第三种方法:行动的时间链。这种形式并不像我们前面所述的博弈的标准式与扩展式那样完整和严格;但是,这种方法被证明在分析许多博弈中是有用的。图3存在短期和长期战略选择的博弈(行动的时段)在现实情况中,随着时间的流逝,企业交替做出关于生产能力水平和定价的决策,但是后者要比前者发生的频率高。那么,应该把生产能力的决策放在第一阶段而把定价的决策放在第二阶段。同样的原则普遍适用于存在长期和短期战略决策的情况。,四、重复博弈1、重复博弈的定义“重复博弈”是指同样结构的博弈重复多次,其中每次博弈称为“阶段博弈”(stagegame)。重复次数的重要性来自于参与人在短期利益和长远利益之间的权衡。当博弈只进行一次时,每个参与人只关心一次性的支付;但如果博弈重复多次,参与人可能会为了长远利益而牺牲眼前利益从而选择不同的均衡战略。用重复博弈模型表达参与者对其他参与者的战略行动做出回应是一种有效方法。考虑同时选择的博弈,例如表1的博弈。因为参与博弈的每一方仅选择行动一次,我们称其为一次博弈(oneshotgame)。重复博弈(repeatedgame)被定义为一次博弈或阶段博弈(stagegame)的多次重复。如果重复有限次,我们称之为有限次博弈;否则,我们称之为无限次博弈。,2、重复博弈的均衡在一次博弈中行动等同于战略。但在重复博弈中区分行动和战略不同。表8中的一次博弈中,博弈的每一方都有三个行动/战略选择:参与者1选择T,M,B;参与者2选择L,C,R。现在假设一次博弈重复两次。在每一阶段,参与者1仍然有三个行动可以选择。但是,其可能的战略组合要复杂的多。参与者1的战略必须表示阶段1选择什么以及作为阶段1选择结果的函数,阶段2选择什么。表8阶段博弈,战略是参与者针对博弈中所可能出现的各种情况做出的完整的相机行动计划。因为第一阶段有九种可能的结果,在第二阶段有三种可能的行动,在第一阶段也有三种可能的行动,所以参与者1有81种可能的战略。这种战略的增加使重复博弈具有了一次博弈所没有的重要特征。我们先研究一次博弈的均衡。直接的观察表明该博弈有两个纳什均衡:(M,C)、(B,R)。从表8中可以看出,对博弈双方来说,(T,L)是最佳战略,每人收益为5,但这并不是纳什均衡。表8显示博弈双方在最佳纳什均衡的收益为4。重复博弈的均衡。首先观察到的就是一次博弈均衡战略的重复执行形成了重复博弈的均衡。例如,战略(M,C)在每一阶段都是均衡。对于参与者1来说,得到重复博弈均衡暗含的战略就是“在第一阶段选择M,而且无论第一阶段发生了什么,在第二阶段仍然选择M”:对参与者2也一样,即,博弈各方选择以往独立的战略。,考虑另外一组战略。参与者1的战略:在第一阶段选择T;如果第一阶段的行动是(T,L),则在第二阶段选择M,否则选择B。参与者2的战略:在第一阶段选择L;如果第一阶段的行动是(T,L),则第二阶段选择C,否则选择R。验证这些战略是否构成重复博弈的均衡。假设第一阶段的结果是(T,L),则选定的战略要求参与者在第二阶段中选择(M,C)。因为这些行动形成一次博弈的纳什均衡,所以第二阶段选择它们符合参与者的最大利益,即参与者不能通过任何改变来提高自身收益。同样,若第一阶段的结果不是(T,L),则选定的战略要求参与者在第二阶段选择(B,R)。因为该行动也形成一次博弈的均衡,同样的推理也适用。可以验证第一阶段的行动也是纳什均衡的一部分。对参与者1而言,选择T将在第一阶段得到收益5。因为根据假设,参与者2正在执行选定的战略(在第一阶段选择L),所以参与者1第一阶段的选择会导致第二阶段的选择(M,C),使参与者1增加收益4,故参与者1的总收益是9。现在假设参与者1在第一阶段选择M,则收益为6,因为参与者2选择L。但是在第一阶段选择M会导致在第二阶段选择(B,R),这样收益仅仅增加1,即总收益只有7,比9少。如果我们考虑博弈的任何一方对选定战略的背离,都会得到类似的这种收益比较。因此,我们认为选定的战略组成纳什均衡。,简单地说,前述的选定战略可以描述为:博弈的各方都在第一阶段选择收益最大化的行为(T,L)。因为博弈的双方都有动机去背离该选择,所以在一次博弈中这一选择无法维持。但是,如果(T,L)是两阶段博弈均衡的一部分时,这种安排就可以实现。阶段2的行动将用来“惩罚”在第一阶段背离选定战略的参与者。因为有第二阶段的惩罚,第一阶段的背离在短期(即一次博弈)看来是有利的,但是一旦考虑两个阶段,则没有益处。实际上,在第一阶段因为背离而得到的收益要少于在第二阶段由于参与者2的“报复”而导致的收益损失。结论是:因为参与方可以对其他参与方过去的行动做出回应,所以重复博弈允许在相应的一次博弈中非均衡的结果成为均衡结果。这种由参与者之间互相报复而得以执行的“协议”在解释卡特尔的运作和合谋行为的本质时起到很大的作用。,小结博弈是描述战略行为情况的模型。博弈包括参与者、规则和收益函数。博弈可以用标准式(矩阵)或者扩展式(博弈树)来表示。一般情况下同时选择的博弈用标准式来表示,而序贯选择的博弈用扩展式来表示。博弈的均衡表示预期参与者会选择的战略。最普通的均衡概念是纳什均衡在这种情况下参与博弈的每一方都不可能通过单独改变战略来达到最优。在进行博弈分析时,不仅参与者是否有理性是重要的,而且参与者是否相信其他参与者有理性也是十分重要的。序贯博弈应该逆向求解。这一过程排除了不可信的战略。对未来行动的承诺会带来战略价值。重复博弈是描述参与者之间重复战略互动的模型。因为参与者可以对其他参与者过去的行动做出回应,所以重复博弈允许在相应的一次博弈中非均衡的结果成为均衡结果。,6.2非合作寡占模型,一、非合作寡占模型的的分类完全竞争与垄断是两种极端状态。现实中的市场结构往往居于这两个极端之间。厂商的行为策略影响市场价格,即寡头结构(oligopoly)。通常,厂商博弈选择的变量不外是两种形式:产量或价格。1、以产量为变量的博弈(可再分为同时博弈与序列博弈)(1)同时博弈是指决策双方同时决策,每一方在进行决策时把对方的策略选择作为预期考虑进来,然后双方同时摊牌,双方的产量选择的合力决定了市场上的价格水平。这就是古诺模型。(2)另一种博弈是“序列”博弈,以一方先走一步,另一方相应地采取对策,然后一方再走下一步,博弈双方就分为“领导者”与“追随者”。这种在产量选择上的“领导一追随”模型称为斯塔克伯格(Stackelberg)模型。,2、以价格为变量的博弈(可再分为同时博弈与序列博弈)(1)同时的价格决定博弈就是“Bertrand均衡”所分析的对象;(2)价格决定的“序列博弈”则称“价格领导”模型。市场竞争博弈模型,二、价格决策静态:伯川德模型1、基本模型定价也许是企业决策中的最基本战略,每个企业所面临的消费者需求的大小取决于其定价。而且,如果企业的数量比较少的话,对企业产品的需求也将取决于竞争对手的定价。我们从最简单的双寡头垄断模型伯川德模型开始分析价格决策的相互依赖性。该模型由在同一市场生产同质产品的两个企业组成,而且假定双方同时定价,具有同样的边际成本MC,MC恒定不变,需求是线性的。,因为两个企业的产品是同质因而是完全替代的,所以两个企业中定价低者将获得所有需求。特别是,假如企业1的定价p1低于企业2的定价p2,那么企业1获得的需求是D(p1)(整个市场的需求量),而企业2的需求则为零。如果双方定价相同,p1=p2=p,那么双方都将获得相当于整个市场一半的需求量1/2D(p)。在这种情况下,企业1的最优定价取决于其对企业2定价的猜测,反之亦然。假设企业1预计企业2的定价将高于垄断价格,那么企业1的最佳战略是按照垄断水平定价,此时它将获得所有的需求和垄断利润。假如企业1预计企业2的定价低于垄断水平、但高于边际成本,那么企业1的最优策略是定价略低于企业2。价格制定得偏高会导致零需求和零利润,而价格制定得略低将使企业1获得所有的需求,但利润要少一些。实际上,价格制定得越低,所得的利润越少。假如企业1预计企业2的定价低于边际成本,那么企业1的最优选择是制定高于企业2的价格,即相当于边际成本水平。,上述最优定价过程是企业1对企业2选择的最优反应。更普遍的说,企业i的最优反应函数(也被称作反应函数reactionfunction)pi*(pj)是指企业i针对企业j确定的每个价格而制定的最优价格。图6.1描述了企业1的反应函数曲线p1*(p2),不同的坐标轴分别代表每个企业的策略。由上可知:当p2pm(垄断价格)时,企业选择垄断价格p1=pm。,图6.1伯川德模型:企业1的反应函数曲线,因为企业2与企业1具有相同的边际成本,所以企业2的反应曲线与企业1相同,且对称于45。线。图6.2表示了企业2的反应函数曲线p2*(p1),及企业1的反应函数曲线p1*(p2)。纳什均衡是一对战略(这里是价格战略)均衡,此时没有哪个企业能通过单方面改变价格来获利。图6.2中反应曲线的交点N表示了该均衡,该点既是企业1的最优定价p1=p1*(p2)(因为这一点在企业1的反应曲线上),又是企业2的最优定价p2*(p1)(因为这一点也在企业2的反应曲线上)。点N反映了这两个企业的最优定价都等于边际成本MC。图6.2伯川德模型:均衡,另一种方法也可以得到同样的结论。令市场需求函数为Q=D(P),两个企业分别为i和j,则企业i所面临的需求Di可以表述为:由于各个企业是同时并且非合作地定价,这就需要参与定价的企业在推测别人要价的基础上,通过自身最优定价而实现利润最大化。对i企业而言,其纳什均衡价格Pi必须符合,如果Pi*Pj*c,企业i不面临任何市场需求,利润为零;相反,i企业如果制定比Pj*略低的价格则可以获得整个市场需求,利润为正,由此可见此时的Pi*不是i企业的最优定价。如果Pi*=Pj*c,则企业i的利润为D(Pi*)(Pi*-c)/2,如果它在此基础上将价格降到Pi*-。(这里是非常小的正数),则盈利就为D(Pi*-)(Pi*-c-)。可以证明当很小时,有D(Pi*-)(Pi*-c-)D(Pi*)(Pi*-c)/2,因此i企业仍有动力继续降价,降价竞争过程将持续到Pi*=c为止。同样,j企业在制定价格时也面临与i企业相同的情况。因此在伯川德模型中均衡解为Pi*=Pj*=c,企业都按边际成本定价,不能获取超额利润。这一结论可以一般化到有N个企业参与竞争的情况。,2、伯川德模型的含义伯川德模型表明,即使在双寡头垄断市场只要两家企业展开价格竞争,也足以实现完全竞争的市场绩效。这一结论被称为伯川德悖论。其原因在于:(1)产品差异(productdifferentiation)。在伯川德模型中,各个厂商的产品具有完全替代性,只要有价格优势就可以完全笼络用户。而现实中,各厂商的产品存在客观差异和消费者主观偏好,因此具有差别优势的企业制定高价格并不会完全失去市场,最终寡占市场的均衡价格就会高于完全竞争价格水平;(2)动态竞争(dynamiccompetition)。伯川德模型是厂商间的一次性博弈,只要定价低于竞争对手就可以占领全部市场,这时厂商很难通过缔结协议维持高于完全竞争的价格水平。而在现实中厂商间行为是重复博弈,率先降价的企业会面临其他厂商进一步降价的威胁,为了避免两败俱伤,厂商就有可能串谋,Pi*=Pj*c可能成为纳什均衡解;,(3)在伯川德模型中假定各个厂商具有相同的边际成本,且不随产量的变化而变化,这时厂商降价扩张产量不能享受到规模经济收益,只能减少单位利润。而在现实中各个厂商生产工艺、供应渠道不同,由此形成不同的生产能力和产品成本。行业内的大厂商能够通过扩张规模、创新技术等途径降低产品成本,进而确立其主导地位,实行价格领导制,制定高于竞争性的价格水平;(4)生产能力的约束(capacityconstraints)。伯川德模型假定各个厂商不存在生产能力约束,降价后产品生产完全满足全部市场需求,这一点也不是现实中厂商都能具备的。可以证明当厂商生产能力有限时,等于边际成本的价格并不是伯川德均衡。,3、伯川德悖论的解释埃奇沃思模型埃奇沃思(1897)对伯川德模型进行了修正,假定行业内双寡头厂商的生产能力有限,任何一个企业都没有足够的生产能力供应整个市场,进而证明了不会有单一价格的伯川德均衡。假设两个企业分别为i和j,它们中每个企业的最大生产能力是K,单位生产成本相同为c,且保持不变,市场需求函数为Q=D(P)。如果两个企业的价格相同,市场需求在二者之间平分;如果PiPj,则企业i的产量为企业j所不能满足的剩余需求,且不能超过其生产能力。于是,企业i所面临的需求Di为:,如果企业i定价为Pi*=c,则当K0)由于qq1+q2,因此,企业1的利润函数为为分析的简单起见,设c(qi)为零,i=1,2。这样上式称为企业1与2的“等利润线”,如果写成q1eq1;q2eq2,即在企业1的等利润线中把q2e看成是给定的,在企业2的等利润线中把q1e看成是给定的,则于是,不管q1与q2如何变化,只要使不变,就称q1与q2变化的轨迹为满足等利润的等利润线。如图6.3所示:图6.3企业1的等利润线,图6.3中画出了四条关于企业1的等利润线。等利润线有以下性质:第一,较低的等利润线代表着较高的利润水平。当q20时,企业1的等利润线就成为当市场上只有企业1提供的产量q1时,q1越高一般是利润水平越高;如果同一利润水平可以由两个产量来实现,则企业一般选择较低的产量。所以,当q2=0时,只需观察等利润线左半部分与q1轴相交点,交点越往右,则利润水平越高。第二,给定企业2的任一产量q20,企业1生产得越多说明市场相对份额越高,利润水平也就越高。因此,当q2=q20时,企业1会与q2=q20这一水平线相切的等利润线上选择产量。在图6.3中,是在上选择B点。为什么不选择,?因为;为什么不选择?因为当q2=q20时,企业1不可能达到。是q2=q20时企业1所能达到的最大利润。,(4)反应线从第二个性质出发,企业1实质上是对应着企业2的每个产出量q2,相应地在不同的利润线中寻找最大利润,找到的最大利润点必定是某一条等利润线上切线斜率为零的点。由该点所确定的q1*就是企业1对于q20的反应。因此反应函数必定是从上式可知,企业1的反应函数是a-bq2-2q10,即反映上式的线叫做企业1的“反应线”。其中q1e,q2e分别代表预测的产量。同理,企业2的反应线为图6.3中,联结点A,B,C,D的直线便是代表的反应线。可以同样画出企业2的若干条等利润线,然后画出企业2的反应线(从略)。,反应线的另外画法:图6-4展示了两企业的产量决策中一家企业决策的图解。图中有一条线性的反需求曲线和恒定的边际成本线。企业1从市场总需求曲线中减去企业2的产量,得出企业1自己的剩余需求曲线和边际收益曲线。显然,企业1利润最大化时的产量应当是其剩余边际收益等于边际成本时的产量。图6.4企业2产量给定条件下企业1的产量决策根据企业2的不同产量水平重复上述过程,就能描绘出企业1的最优反应曲线,表明了企业1对应于企业2任何产量时的相应的利润最大化产量。,图6.5考虑了两个可能的q2值。当q2=0时,企业1的剩余需求量实际上等于整个市场的需求量:d1(0)=D。毫无疑问,企业1的最优产量就是垄断产量q1*(0)=qm。如果企业2选择的产量相当于完全竞争的水平,即q2=qc,此时P(qc)=c,那么企业1的最优产量q1*(qc)=0。实际上,这时边际成本与边际收益的交点等于d1(qc)。图6.5两种极端情况,在给定了线性需求和边际成本不变的前提下,函数q1*(q2)也是线性的。根据这两点,可以画出如图6.6那样完整的函数曲线q1*(q2)。此处横坐标表示企业2的产量q2,纵坐标表示企业1的产量q1(而不是价格)。函数q1*(q2)是企业1的反应函数。它使得企业1对企业2的所有可能行为做出最优的选择。换言之,该函数是指在给定企业1对企业2的行为的预测后,企业1的决策。图6.6企业1的反应函数,(6)古诺均衡时的反应线在古诺均衡时,两条反应线必然相交,即q1q1*;q2q2*如图所示:图6.7反应线古诺均衡具有稳定性:任一离开(q1*,q2*)的点最后都会自动趋近于古诺均衡。假定初始的q1与q2的组合为a点,对应a点所代表的q2,企业1会选择以b的横坐标所代表的q1,然后企业2会选择以c点纵坐标所代表的q2,直到(q1*,q2*)。反之从e点出发,企业1会选择以d点的横坐标所代表的q1,然后企业2会选择以f点的纵坐标所代表的q2直至(q1*,q2*)。,(7)举例假设市场需求为P=100-0.5(q1+q2),c15q1;c20.5q22,求古诺均衡,并相应地求出,。解:所以把q2代入q1方程,可解得,2、n个企业条件下的古诺均衡上面讨论的是存在两个企业的古诺均衡,如果一个行业中存在N(2)个相同的企业,且第N+1个企业会被行业有效地排斥在外,每一个现存企业的成本函数相同,即成本为C(qj)cqj,(j1,2,N)(c0)设市场需求为这里a0,b0,当然ac(否则会有问题)。于是,可知企业j的利润为,所谓古诺均衡,便是存在一个产量向量:q*=(q1*,q2*,qn*),使得每个企业的利润都达到极大。即当所有别的企业的产量qk=qk*时(kj),qj*必须使上式极大化。于是,让我们有即注意到该式的右端是与我们考虑的企业j是谁无关,因此均衡时,所有的企业的bq*必然有:从上式中可以看出ac的必要性。对于每个企业j来说,在古诺均衡时,其最优产量qj*为,因此,行业的总产量为价格p为:每个企业的利润为于是,行业利润为,值得注意的是,在古诺均衡时,价格高出边际成本(这里为c)的幅度,这说明,当企业个数无穷多时,市场结构会趋于完全竞争,价格会接近于边际成本。当n=1时,该市场即为完全垄断商场,厂商所提供的产量只是完全竞争市场的1/2,而价格则比完全竞争价格高出(a-c)/2,这意味着完全垄断厂商将比竞争厂商获取更高的利润;当n=2时,即为古诺最初揭示的双边寡头垄断模型,两个寡头厂商所提供的市场产量只是完全竞争市场的2/3价格比完全竞争价格高出(a-c)/3,但比完全垄断要低(a-c)/6。即:n=1时,p-c=(a-c)/2,q=(a-c)/2b,行业利润=(a-c)2/4bn=2时,p-c=(a-c)/3,q=2(a-c)/3b,行业利润=2(a-c)2/9bn趋向无穷时,p-c=0,q=(a-c)/b,行业利润=0,另一种算法:完全垄断:=pq-cq(a-bq)q-cq=aq-bq2-cq根据一阶条件,可得a-2bq=c,于是得到q=(a-c)/2b,p=(a+c)/2完全竞争:根据MR=p,由于MC=c;于是得到p=c,q=(a-c)/b显然,与古诺模型的一般式中n=1,的均衡结果是一致的,证明古诺模型是正确的。,3垄断,双寡头垄断和完全竞争的比较双寡头垄断是介于垄断和完全竞争之间的市场结构。因此其均衡价格和产量也应该介于垄断和完全竞争之间。在图6.8中,每个企业的反应曲线与坐标轴相交于qm,qc。因此,斜率为-1的直线分别联接两条反应曲线与坐标轴较远的交点,该直线可以表示为q1n+q2n=qc;同样,斜率为-1的直线分别联接两条反应曲线与坐标轴较近的交点,该直线可以表示为q1n+q2n=qm。古诺模型中均衡点N在这两根线之间,说明古诺模型的产量比垄断多,比完全竞争少。图6.8古诺均衡、垄断和完全竞争的比较,(1)多少才算多?当企业的数量趋于无穷大时,古诺模型的结果接近于完全竞争。那么究竟企业数量要达到多少才算接近完全竞争?或者说,才使配置无效率接近于零(即完全竞争下的值)?假定企业行为与古诺模型中假定相同。可以看到,在有7个同样的企业存在时,古诺模型的结果更接近于完全竞争而非垄断(6更接近于0而不是100)。在有15个相同的企业存在时,效率的损失接近于零。换句话说,并不需要大量相同的企业,就可使古诺模型的绩效接近于完全竞争的绩效。古诺均衡中的配置无效率占垄断情况下的配置无效率的百分比,(2)哪一个模型更实际尽管古诺和伯川德的双寡头垄断模型的假定相同,但对企业行为的预测截然不同。前者认为双寡头垄断的价格比垄断低,比完全竞争高。而后者认为双寡头垄断的竞争就足以使价格降到完全竞争的水平。这种对比引出了两个问题:哪一个模型更实际些?假定相对价格决策而言,生产能力和产量决策是长期决策,即假设调整产量和生产能力要比调整价格难得多。企业应该先决定产量和生产能力,再决定价格。这时和古诺模型相一致。相反,如果假定相对于价格而言,产量是短期决策,即调整产量比调整价格容易。那么企业应该先决定价格,再决定产量。在伯川德模型中,企业同时制定价格,然后依此获得需求量。模型暗含的假设是,产量将根据价格决定的需求量而随时改变。小结如下:如果企业的生产能力和产量易于调整,那么伯川德模型更符合双寡头垄断的竞争状况;如果企业的生产能力和产量难于调整,那么古诺模型更符合双寡头垄断的竞争状况。,现实中大部分产业的生产能力难以调整。即生产能力决策和产量决策一般是长期变量,而价格是短期变量。比如小麦、水泥、钢铁、汽车和计算机等产业。但也存在生产能力比价格调整更快的情况,如软件业,保险业和银行业等,尤其是软件的拷贝,很方便就能增加产量以满足需求增加。从这一点上看,伯川德模型比古诺模型更接近实际情况。大百科全书是模型的一个例子。大英百科全书是近两个世纪以来的经典参考书,全32册精装大英百科全书的售价是1600美元。1990年初,微软与Encarta联手出版了电子百科全书(CD版),售价不超过100美元。大英百科全书立即也出版了自己的CD版。现在,这两种版本的售价都为8999美元。尽管这离伯川德模型中的均衡价格(等于CD的成本)还很远,但是相对于1600美元的垄断价格来说,要向成本靠拢多了。,(3)古诺模型存在的问题a、静态模型(如古诺模型)仅在比较静态分析中有用,并不描述从一个均衡到另一个均衡的动态过程。在古诺模型中,当根据观察到的另一个企业的产量来选择自己的产量时,每个企业都把另一个企业的产量视为独立于自己行动的变量。b、古诺模型的多时期解释说明所有阶段性的调整结束之后,系统就会收敛,其中存在两个严重问题。第一,厂商应能注意到竞争对手对自己前期产出的变动作出反应。在古诺模型中,虽然厂商认识到自己关于竞争对手不会作出反应的古诺猜想是错的,它仍继续依赖这个错误的猜想,使用单时期的最佳反应函数。因此古诺模型在实验中没有生命力。猜想变分模型将此作一讨论。第二,在多时期模型中,对厂商来说,仅在现期将利润最大化是没有意义的。厂商应是将远期利润流量的贴现值最大化。厂商可能希望为获取远期的巨额利润而牺牲今天较少的利润。古诺模型的多时期解释更多的是对调整到均衡的描述而不是对一个多时期均衡的描述。,三、斯塔克博格(Stackelberg)先走一步的优势斯塔克博格模型指这样的产业:在该产业中存在着一个支配企业和若干家小企业;小企业等待支配企业宣布其产量计划,然后相应地调整自己的产量。比如美国计算机行业。我们称先宣布产量计划的企业为产量博弈中的领导者,称那些随后决定产量计划的小企业为产量博弈中的追随者。市场上的价格决定仍与古诺模型一样。价格是由领导型企业的产量(q1)与追随型企业的产量(q2)之和(q1+q2)需求来共同决定均衡价格。即价格p是(q1+q2)的函数,记为p(q1+q2);两个企业有相同的不变单位成本c0;两个企业生产同质的产品。,在古诺模型里,两个企业各自独立且同时做出关于产量的决策,然后由(q1+q2)来决定价格水平;而斯塔克博格模型里起支配作用的是领导型企业的产量决策。假设企业1为领导者。那么,领导型企业该如何定产量才达到自己利润的极大化呢?由于领导者先走一步的好处,就会考虑,一旦自己宣布一个产出量,追随型企业会做出反应,于是领导型企业会充分估计到自己做出的产量计划所产生的追随型企业的反应函数。这就要求领导型企业是在估计到追随型企业的反应函数的基础上来做出有利于自身利益极大化的产量决策。因此,关于产量决策的序列博奔模型,得采取反向归纳(backwardinduction)的思路,先分析追随型企业的反应函数;然后把这个反应函数纳入领导型企业的决策过程,才能导出领导型企业的最优产量决策。,1、追随者的问题假定领导者宣布了自己的产量决策,对于追随者来说,q1就是一给定的量,这样就可以使用逆向归纳法求解博弈的子博弈精炼纳什均衡。追随者(企业2)的问题是:解这一问题,可得到追随者利润极大化的一阶条件。即由上述一阶条件可以解出追随者的反应函数:这实际上就是库诺特模型中企业2的反应函数,不同的是,这里q2是当企业1选择q1时企业2的实际选择,而在库诺特模型中q2*(q1)是企业2对于假设的q1的最优反应。,由此,得到追随者(企业2)的等利润线与反应线:图6.9追随者(企业2)的等利润线与反应线给定企业1(领导者)的产出决策q01,企业2(追随者)会找出利润尽可能高的等利润线与q1=q01这一直线相切的点(c)决定其相应的产出决策f2(q01)。企业2的每一条等利润线与企业1某一个相关产量决策的反应点的集合便形成了追随者的反应线(反应函数线)。,例2:如果p=100-0.5(q1+q2),c1=5q1,c2=0.5q22,则一旦q1给定,追随者的利润函数便
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论