第三讲完全且完美信息动态博弈a讲义课件_第1页
第三讲完全且完美信息动态博弈a讲义课件_第2页
第三讲完全且完美信息动态博弈a讲义课件_第3页
第三讲完全且完美信息动态博弈a讲义课件_第4页
第三讲完全且完美信息动态博弈a讲义课件_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三完全且完美信息动态博弈本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。12023/7/23动态博弈的表示法和特点:阶段和扩展性表示阶段:动态博弈中一个博弈方的一次选择行为例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒第三章完全且完美信息动态博弈22023/7/23动态博弈的基本特点策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合,构成一条路径得益对应每条路径,而不是对应每步选择、行为动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利,有“先行优势”。第三章完全且完美信息动态博弈32023/7/234第三章完全且完美信息动态博弈完全-得益完美-过程动态-先后请考虑以下问题:(1)是不是信息越多越有利?(2)过程是否重要?(3)动态博弈与静态博弈有哪些异同之处?(4)人们对已经过去的博弈是更注重结果还是更注重过程?其意义何在?2023/7/235可信性问题子博弈逆推归纳法有同时选择的两阶段动态博弈第三章完全且完美信息动态博弈2023/7/23那人·那狗:博弈人:蹲、逃狗:逃、追3.1可信性问题62023/7/237那人·那狗:博弈人为什么蹲下?——(1)阻止狗采取对人不利的行动(2)诱使狗采取对人有利的行动策略行动可信性如何?3.1可信性问题2023/7/233.1可信性问题在动态博弈中,由于过程十分重要,类似于对未来过程的了解,它本身依赖于其它博弈方的行为。那么就存在一个对其博弈方所可能采取策略的可信性问题。可信性:动态博弈中先行为的博弈方是否应该相信后行为博弈方会采取某种策略或行为。后行为博弈方将来采取对先行为博弈方有利的行为为“许诺”,采取对先行方不利的行为为“威胁”。82023/7/23多阶段博弈序列博弈参与者选择策略有时间先后的顺序,通常采用博弈的扩展形式来进行分析例子:进入博弈

·两个企业:一个在位企业(B)和一个潜在的进入者(A)

·扩展形博弈不进入进入容纳商战(900,1100)(-200,600)(0,3000)AB博弈论与企业竞争企业、政府与商业环境找出纳什均衡不进入进入容纳商战(900,1100)(-200,600)(0,3000)AB博弈论与企业竞争企业、政府与商业环境逆推归纳法和逆向思维两个纳什均衡纳什均衡之一是如果A进入市场,B就威胁选择商战,所以A不进入市场另一个纳什均衡是A选择进入,B随之选择容纳不进入进入容纳商战(900,1100)(-200,600)(0,3000)AB博弈论与企业竞争企业、政府与商业环境一个子博弈纳什精炼均衡不进入进入容纳商战(900,1100)(-200,600)(0,3000)AB子博弈精练均衡:A选择进入,B选择容纳是纳什均衡在博弈每个阶段没有一个博弈方可通过改变策略提高其得益博弈论与企业竞争企业、政府与商业环境威胁与承诺空头威胁:对对手采取的行动是不需要任何成本的,因此这种威胁是不可置信的承诺:预先花费成本来严格限制自己行为,从而使威胁成为可置信的例子:进入博弈阻止市场进入与剩余生产能力不进入进入容纳商战(900,300)(-200,600)(0,2200)AB博弈论与企业竞争企业、政府与商业环境在进入发生前在位企业通过不可逆转的投资(800万)来形成一部分剩余生产能力,这部分生产能力在无进入者进入市场时是多余的,但在进入发生时则降低了与进入者进行商战的成本,使在位者的最优选择从容纳改变成商战形成额外的剩余生产能力可以阻止进入,潜在进入者知道他一旦进入,价格战就必然发生,因而构成可置信的威胁形成剩余生产能力的行动在序列博弈中常带有先发制人的意图,因此这种行动被称为事先承诺博弈不进入进入容纳商战(900,300)(-200,600)(0,2200)AB博弈论与企业竞争企业、政府与商业环境3.1.1开金矿条件:甲去开采一价值4万元的金矿,缺1万元,乙恰好有1万元可以投资。甲向乙借1万元可以可开金矿,并“许诺”成功后与对半分成。问题:乙是否该借钱给甲?152023/7/23

相机选择和策略中的可信性问题不同版本的开金矿博弈——分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈——分钱打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈——分钱打官司都不可信3.1.1开金矿162023/7/23

纳什均衡的问题第三种开金矿博弈中,(不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题3.1.1开金矿172023/7/233.1.1开金矿可能性即甲可能成功之后不与乙分钱(分当然好),则乙损失1万元。由此,乙决策的关键在于他是否相信甲的“许诺”,而结局取决于甲是否遵守他的“许诺”。接下来乙可采取一些方法以使甲尽可能兑现他的许诺--打官司。

182023/7/233.1.1开金矿根据自身利益最大化原则,甲在轮到行为时的唯一选择是不分,而乙清楚甲的行为准则,则选择不借。对乙来讲,本博弈中甲有一个不可信的肯定不会信守的许诺。怎样使甲的许诺变为可信的呢?关键在于必须增加一些对甲行为的约束。结点,信息集乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈192023/7/233.1.1开金矿若乙采取法律手段,即打官司保护自己的利益,则博弈进程如下图所示。

不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈——分钱打官司都可信202023/7/233.1.1开金矿在本博弈中,乙的唯一选择是打官司,对甲来讲,乙打官司的威胁是可信的,是肯定会信守的,他最理智的选择就是分。即,乙的策略是在第一阶段借,如甲在第二阶段选择不分,则第三阶段选择打;甲的策略是如乙在第一阶段选择借,则他在第二阶段选择分。在双方这样的策略组合下,本博弈的路径是(借,分),双方得益为(2,2),实现有效率的理想的结果。212023/7/233.1.2先来后到

在此博弈中,后进入者博弈方1要决定是否进入市场竞争,而先进入市场的博弈方2有打击和不打击两种选择。

12进不进打击不打击(0,10)(-3,6)(5,5)222023/7/233.1.2先来后到

根据利润最大化原则,博弈方2的唯一选择是无情打击对手,这时博弈方2的打击的威胁是可信的。了解博弈方2决策原则的博弈方1在第一阶段只会选择不进。该博弈的结果为(0,10),即先占领市场者独享利润。232023/7/233.1.2先来后到

当得益变成右图情况以后,博弈方2的打击的威胁就不再是可信的了。这样,博弈方1在第一阶段的合理选择当然只有进。博弈的结果选择路径为(进,不打击),双方得益为(5,8)。后进者信息多,但利润不如先进入者。后来者不一定总是从前者利益中分出一部分,而可能创造更大的总利益,而先进入者的损失也不一定很大。进不进打击不打击(0,10)(-3,6)(5,8)242023/7/2321于《汉晋春秋》有载:其时蜀南夷帅作叛,诸葛亮来到南中,百战百捷。闻知有一个名叫孟获的人,向为本地的夷、汉所服,于是务要生擒他。后来诸葛亮果然擒孟获于盘东,并采马谡之策(《襄阳记》:「亮纳其策,赦孟获以服南方。」),让他在蜀军的营阵之间观察,问他:「这支军队怎样?」孟获答道:「我以前不知虚实,所以才会战败。如今既然承蒙你给我观看营阵,假若这军队真的祇是如此,我一定会轻易取胜。」诸葛亮大笑,便释放孟获让他再战,历经七纵七擒,而诸葛亮仍然让他离开。最后孟获止而不去,并说:「先生有上天之威,我等南人不再复反了。」于是蜀军会师滇池。南中平后,诸葛亮都沿用该地的渠帅领守当地。孟获则随诸葛亮赴成都任官。终亮之世,南方不敢复反。

《七擒孟获》252023/7/23三国时期蜀国的国君刘备死后,许多原来归属国少数民族部落都发动了叛乱,夺取蜀国很多的土地。公元225年初春,诸葛亮率领大军出发,去平息叛乱。临走的时候,马谡对诸葛亮说:“南方的少数民族依仗地形险要,离都城又远,早就不服管了。即使我们用大军把他们征服了,以后还是要闹事的。用兵的办法,主要在于攻心,丞相这次南征,只有叫南人心服,才能够长久安宁。”马谡的话,正合诸葛亮的心意。诸葛亮不禁连连点头说:“正是此意,正是此意。”到了南方,诸葛亮打听到孟获不但打仗勇猛,而且在南方中部地区各族中很有威望,就决心把孟获争取过来,于是下了一道命令:只许活捉孟获,不能伤害他。诸葛亮善于用计谋,蜀军和孟获军队交锋的时候,蜀军故意败退下来。孟获仗着他人多,一股劲儿追了过去,很快就中了蜀兵的埋伏。南兵被打得四处逃散,孟获本人就被活捉了。孟获被押到大营,心里想,这回一定没有活路了。没想到进了大营,诸葛亮立刻叫人给他松了绑,好言好语劝说他归降。但是孟获不服气,说:“我自己不小心,中了你的计,怎么能叫人心服?”诸葛亮也不勉强他,陪着他一起骑着马在大营外兜了一圈,看看蜀军的营垒和阵容。然后又孟获:“您看我们的人马怎么样?”孟获傲慢地说:“以前我没弄清楚你们的虚实,所以败了。今天承蒙您给我看了你们的阵势,我看也不过如此。像这样的阵势,要打赢你们也不难。”诸葛亮爽朗的笑了起来,说:“既然这样,咱们来个约定,如果我能抓到你七次,你就归顺蜀国,怎么样?”孟获不以为然地答应了。孟获被释放以后,回到自己的部落,重整旗鼓,又一次进攻蜀军。但是他本是一个有勇不谋的人,哪里是诸葛亮的对手,第二次又被活捉了。诸葛亮二话没说就把孟获放回去了。像这样又放又捉,一直把孟获捉了七次。到了孟获第七次被捉的时候,诸葛亮还要再放。孟获却不愿意走了。他流着眼泪说:“丞相七擒孟获,信守诺言,说到做到,待我可以说是仁至议尽了。我打心底里佩服,哪里能不遵守当初的约定呢?从今以后,不敢再反了。”孟获回去以后,还说服其他部落全部投降,重新归顺蜀国。262023/7/23诸葛亮擒纵孟获孟获逃留0,1313,-1逃留0+n,13-n13+n,0+n《七擒孟获》对策:先行决策272023/7/233.2子博弈和逆推归纳法动态博弈中的子博弈逆推归纳法子博弈完美纳什均衡寡占的斯塔克博格模型工会和厂商的博弈讨价还价博弈282023/7/23293.2子博弈和逆推归纳法一、子博弈:针对树型(展开型)博弈(二)案例:虚线圈住法不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈2023/7/2330子博弈案例:仿冒和反仿冒博弈虚线圈住法ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒2023/7/233.2.1动态博弈中的子博弈定义:子博弈即能够自成一个博弈的某个动态博弈的从其某个阶段开始的后续阶段,它必须有一个初始信息集,且具备进行博弈所需的各种信息。312023/7/23注意:原博弈的初始节点开始的博弈为原博弈本身,不称它为原博弈的子博弈;第五章将说明在不完美信息博弈中有其它的不作为子博弈的起始信息集的节点。3.2.2逆推归纳法在动态博弈中如何求解?动态博弈的特点是:在采取某一种决策时必须对其后可能进行的子博弈有充分的了解,这样才能很好的进行博弈并得到合理的结果(基于理性和可信性,相当于对后博弈行为的合理假设)。由此,对于完全且完美信息的动态博弈其基本求解方法可由最后阶段的子博弈逆推来决定采取合适的策略-逆推归纳法。322023/7/232023/7/2333决策法则向前展望,倒后推理3.2.2逆推归纳法3.2.2逆推归纳法定义:逆推归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈的方法。例借不借(2,2)(1,0)开金矿(信守)-逆推第二步342023/7/23乙不借借(1,0)甲不分分(0,4)(2,2)乙3.2.2逆推归纳法-分金币案例:5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城。他们决定这么分:1.抽签决定自己的号码(1,2,3,4,5)2.首先,由1号提出分配方案,然后大家5人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔进大海喂鲨鱼。3.如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。4.以次类推……

条件:每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择问题:第一个海盗提出怎样的分配方案才能够使自己的收益最大化352023/7/233.2.2逆推归纳法-分金币逆推过程:123450100991097021970102结果:(97,0,1,0,2)362023/7/233.2.2逆推归纳法-动态规划动态规划的理论基础是最优性原理。它是一种解决多阶段决策(序贯决策)过程最优化的一种数学方法。应用:最优路径问题、资源分配问题、生产调度、库存、装载、排序、设备更新、最优工艺等372023/7/233.2.2逆推归纳法-动态规划它认为整个过程的最优策略有这样的特点:即无论过去的状态和决策如何,对于前面的决策所形成的状态而言,余下的诸决策必定构成最优策略。这就是说,任何一个完整的最优策略的子策略总是最优的。根据这个重要的原理,用动态规划方法求解一个优化问题首先应把问题的过程分成几个相互联系的阶段,这些阶段的状态可以用阶段的某种特征来描述,而决策过程可以通过状态的演变来说明

。于是就可以根据问题的实际意义,找出由一个状态演变到另一状态的状态转移方程,再根据所求问题的有关效益指标,建立起能够联系局部与全局最优性的动态规划基本方程。382023/7/233.2.3子博弈完美纳什均衡在动态博弈中由于博弈过程是逐步深入的,这一过程由每个阶段所采取的策略构成,由此引出“路径”的概念。路径:从第一阶段开始通过每阶段一个行为,最后达到博弈结束的一个终端各博弈方的行为组合。找到了路径也就找到了一个分阶段的策略组合,这一策略组合恰似一个完整的计划,计划的最终实现取决于过程中各阶段的实现。392023/7/233.2.3子博弈完美纳什均衡在开金矿案例中,策略组合(借,分)是一个稳定的策略组合,因为如果不分,则有乙打官司的威胁,这是双方都不愿得到的结果。

“稳定”意味着博弈方都不会单独改变策略,这恰似纳什均衡的概念。乙打不打(1,0)(0,4)402023/7/23不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈——分钱打官司都可信3.2.3子博弈完美纳什均衡由于动态博弈与静态博弈有较大的差异,那么如何才能使静态博弈中的纳什均衡在动态博弈中亦有相应的概念发展?以开金矿为例(注意此例与以前开金矿例子的差异)

412023/7/233.2.3子博弈完美纳什均衡此时打官司对乙亦无好处(此情况在现实中可能出现)。在此情况中,逆推可以得出乙不借,原因在于乙在第三阶段打官司的威胁是不可信的。由此导致甲在第二阶段分的许诺也变为不可信。结局是,甲开不成金矿,乙保本,甲失去挣钱的机会。422023/7/23乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈——分钱打官司都不可信3.2.3子博弈完美纳什均衡如果按照静态博弈的分析方法,则(借,分,打)的策略组合为一个纳什均衡,因为任何一方都不会单独改变策略而降低自己的得益。这与逆推归纳法得到的结论相矛盾,原因在于路径(借,分)的纳什均衡策略组合包含了一个不可信的威胁,即乙在第三阶段会选择打官司的行为是不可信的。432023/7/233.2.3子博弈完美纳什均衡由此需要对静态博弈中的纳什均衡的概念有所调整,即应满足:是纳什均衡,从而具有策略稳定性不能包含任何的不会信守的许诺或威胁

这样的动态博弈策略组合称为子博弈纳什均衡。442023/7/233.2.3子博弈完美纳什均衡定义(Selten塞尔顿):如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡,则称该策略组合为一个“子博弈完美纳什均衡”。452023/7/233.2.3子博弈完美纳什均衡注意,用逆推归纳法所得到的解应为子博弈完美纳什均衡。动态博弈所应注意的两点:要求各博弈方的策略对每阶段每种可能的情况都设定一个行为方案。其意义在于避免出现不会信守的许诺或威胁,从而使子博弈完美纳什均衡可以用。假定所有博弈方都是理性的且不会犯错误的。462023/7/233.2.3子博弈完美纳什均衡

与实际情况的差异:后续可能性太多而无法分析,于是考虑仅知道有限后续阶段的情况?许诺有限非理性,如何考虑?比如假设非理性的次数小于等于k?下棋…K叉树算法博弈构成的“长短”与稳定性,不可预测性等472023/7/233.2.4寡占的斯塔克博格模型它是古诺模型在动态博弈中的体现例如,在古诺模型中二厂商同时决定产量q1,q2,Q=q1+q2,市场出清价格P=8-Q,边际成本C1=C2=2。解得q1*=q2*=2,总得益为4+4=8。482023/7/233.2.4寡占的斯塔克博格模型然而,许多实际问题为各厂商进入市场有先后,尤其是厂家有强弱之分,且后一厂商(跟随者)在决策时是看着前一厂商的选择的,由此引出斯塔克博格模型。斯塔克博格模型与古诺模型相比,唯一的不同是前者有一个选择的次序问题,其他如博弈方、策略空间和得益函数等完全都是相同的。492023/7/233.2.4寡占的斯塔克博格模型设两寡头为厂商1和厂商2;他们的策略空间(q1、q2的集合)都是〔0,Qmax)中的所有实数,其中Qmax可看做不至于使价格降到亏本的最大限度产量,或者是该产量与厂商生产能力之间的最大值;厂商1为先进入企业,设价格函数

,边际生产成本,固定成本为零。502023/7/233.2.4寡占的斯塔克博格模型用逆推法分析该博弈根据逆推法的思路,先分析第二个阶段厂商2的决策。在厂商2开始决策时,厂商1的选择q1实际上已经决定且为厂商2知道。因此,对于厂商2来说,相当于在给定q1的情况下,求使u2达到最大值的q2.即对u2求极值。512023/7/23令厂商2的1阶导数等于0,求得等式为该式表明厂商2根据场上1不同的产量来决定自己的最优产量,实质上这是厂商2的反应函数。3.2.4寡占的斯塔克博格模型厂商1知道厂商2的这种决策思路,因此在决定q1时,就知道厂商2会按上式进行针对性的决策。因此,可将上式直接代入其利润函数,为可以很容易地求出上式的最大值,为3.2.4寡占的斯塔克博格模型由厂商1的最优产量决策以及厂商2的最优反应函数根据上面两个表达式,可以求出厂商2的最优产量及最优产量下的利润水平3.2.4寡占的斯塔克博格模型利用斯塔克博格模型有关假设数据,可以算出二寡头古诺模型中,二厂商的均衡价格、产量、利润(过程从略)。结果与斯塔克博格模型对照,见表2-3厂商产量厂商利润市场出清价格古诺模型(2,2)(4,4)4斯塔克博格模型(3,1.5)(4.5,2.25)3.5表2-3古诺模型和斯塔克模型对照斯塔克博格模型3.2.4寡占的斯塔克博格模型利用斯塔克博格模型有关假设数据,可以算出二寡头古诺模型中,二厂商的均衡价格、产量、利润(过程从略)。结果与斯塔克博格模型对照,见表2-3厂商产量厂商利润市场出清价格古诺模型(2,2)(4,4)4斯塔克博格模型(3,1.5)(4.5,2.25)3.5表2-3古诺模型和斯塔克模型对照斯塔克博格模型3.2.4寡占的斯塔克博格模型3.2.4寡占的斯塔克博格模型以上模型说明:在信息不对称的博弈中,信息较多的博弈方(如厂商2决策之前已知厂商1的实际选择,因此他有较多的信息)不一定能得到较多的得益。原因:先行为或信息较少者认为后行为方或知识较多者作为理性的博弈方,不可能为了公平或赌气而采取任何对双方不利的行为,从而先发制人选择比同静态决策时更大的产量而获得利益和好处。572023/7/23先发优势-建立信誉1.在序列博弈中,首先作出策略选择和采取行动的博弈方可以占据有利地位,获得较多利益。2.首先行动优势的原因在于它造成了一种既成事实,为使利润最大化,另一方必须根据首先行动一方的策略来选择自己的策略。IBM公司曾经对市场公开承诺,对一些刚刚推向市场的新型电脑将在二、三年后以很低的价格销售。这似乎不可思议,因为既然二、三年后会降价,许多人就可能推迟购买,这将降低IBM的销量。但实际上,IBM公司这样做是为了阻止其他电脑公司模仿它的产品,电脑市场上存在大量的仿造者,它们往往紧跟在IBM公司之后推出仿造品,价格比IBM的电脑还低10%到30%。然而,当IBM公司作出这样的承诺之后,对那些仿造者来说,案例IBM的降价承诺582023/7/23仿造IBM的产品就变得无利可图,因为等他们花费不小的成本仿造出这种产品并推向市场的时候,IBM将很快或已经降低了售价。由于电脑技术发展的速度很快,对IBM来说,作出这一承诺实际上并不需要花费太大的成本,因为这种价格降低的趋势是必然的。由于承诺降价,IBM当前的电脑销量也许会减少,但降价承诺却在很大程度上遏制了仿造品,这是值得的。592023/7/23案例IBM的降价承诺先发优势-建立信誉破釜沉舟秦朝末年,秦国大将章邯率领数10万人攻打赵国的都城巨鹿。赵国向楚国求援,楚王派项羽率兵救赵。项羽带领人马渡过漳河后,马上命令弄沉渡船,每人只带三天的粮食。将士们知道后退的路没有了,个个奋勇杀敌,终于解了赵国之危。

《史记·卷七》:“项羽乃悉引兵渡河,皆沉船,破釜甑,烧庐舍持三日粮,以示士卒必死,无一还心。”602023/7/23秦朝末年,秦军大将章邯攻打赵国。赵军退守巨鹿(今河北平乡西南),并被秦军重重包围。楚怀王于是封宋义为上将军,项羽为副将率军救援赵国。宋义引兵至安阳(今山东曹县东南)后,接连46天按兵不动,对此项羽十分不満,于是要求进军决战,解困赵国。但宋义却希望秦赵两军交战后待秦军力竭之后才进攻。但此时军中粮草缺乏士卒困顿,而宋义仍旧饮酒自顾,项羽见此忍无可忍,进营帐杀了宋义,并声称他叛国反楚。于是将士们则拥项羽为上将军。项羽杀宋义的事,威震楚国,名闻诸侯。随后,他率所有军队悉数渡黄河前去营救赵国以解巨鹿之围。项羽在全军渡黄河之后他下令把所有的船只凿沉,打破烧饭用的锅,烧掉自己的营房,只带三天干粮,以此表决一死战,没有一点后退的打算。正是这样已无退路的大军到了巨鹿外围,并包围了秦军和截断秦军外联的通道。楚军战士以一当十,杀伐声惊天动地。经过九次的激战,楚军最终大破秦军。而前来增援的其他各路诸侯却都因胆怯,不敢近前。楚军的骁勇善战大大提高了项羽的声威。以至战胜后,项羽于辕门接见各路诸侯时,各诸侯皆不敢正眼眼看项羽。612023/7/23章邯逃跑努力项羽软弱勇敢1,0.5-1,0.3软弱勇敢0.1,-10,1《破釜沉舟》对策:0,1章邯项羽项羽逃跑努力破釜沉舟0.8,0622023/7/23后发劣势(美国沃森)后发展国家模仿发达国家的技术容易而模仿制度难,后发展国家倾向模仿技术而获得发展,但由于制度模仿的惰性,使长期发展成为不可能。后发劣势的观点:632023/7/233.2.5工会与厂商的博弈Leontief1964年提出的一个工会与厂商之间关于工资与雇佣的博弈模型。条件:假设完全由工会决定工资,而厂商则根据工资的高低来决定雇佣工人的数量。注意,此时应有一个均衡解,原因在于工资过高则雇佣的人数就会减少;而如果人数过多的,则工资过少亦非工会的希望,那就一定会存在一个较合适的值,促使工资和人数都比较合适。642023/7/233.2.5工会与厂商的博弈工会的目标就是求出适合的工资和人数,其效用函数应为工资W和人数L两者的函数

,工会的的决策就是如何选择W*,使厂商关心的只有一个目标,

即利润最大化。用逆推归纳法来求解,注意到此处只给出了示意性函数,在实际问题上可以构造对应的函数,并可得到相应的工会的无差异曲线。652023/7/233.2.5工会与厂商的博弈先由工会决定工资率,再由厂商决定雇用多少劳动力RL0WL厂商的反应函数R(L)斜率为WLW0工会的误差异曲线662023/7/233.2.6讨价还价博弈-三阶段讨价还价博弈条件:两个人就如何分割1万元进行谈判,规则如下图所示672023/7/23三回合讨价还价112不接受,出S接受不接受,出S2接受出S13.2.6讨价还价博弈-三阶段讨价还价博弈每个阶段包括一方提出一个方案和另一方选择是否接受该方案。每个阶段的费用(如谈判成本,利息等)导致收益减少,折扣率为δ,0<δ<1

过程(阶段):1.甲S1,乙10000-S1;乙接受则终止,否则进行阶段二2.甲S2,乙10000-S2;甲接受则终止,否则进行阶段三注意此时甲的收益为δS2,乙为δ(10000-S2)3.甲S,乙10000-S,此时乙必须接受。收益分别为δ2S,δ2(10000-S)682023/7/233.2.6讨价还价博弈-三阶段讨价还价博弈注意此博弈的条件:(1)第三阶段的收益是必须接受的。(2)过程越长,双方的收益之和越小。由此,如果双方是理性的话,则选择合适的时期及早结束谈判则对双方都有利。692023/7/23112不接受,出S接受不接受,出S2接受出S13.2.6讨价还价博弈-三阶段讨价还价博弈用逆推归纳法来进行求解-第三阶段的收益δ2S和δ2(10000-S)对于双方都是知道的。于是第二阶段乙应该使自己的利益最大而不进行第三阶段(即甲也接受),那么乙应该如何出价呢?-如果出S2后,甲的收益小于第三阶段的收益,则甲会进行第三阶段。于是乙的策略就是第二阶段使甲的收益不少于甲在第三阶段的收益而使自己的收益最大(比第三阶段大)。702023/7/233.2.6讨价还价博弈-三阶段讨价还价博弈-于是乙的选择为δS2=δ2S,即S2=δS(使甲二、三阶段收益相同);那么,乙的收益为δ(10000-δS)>δ2(10000-S)。同样的分析可应用于甲在第一阶段的策略,即甲在第一阶段给乙δ(10000-δS),甲的收益s1=10000-δ(10000-δS)

由此分析,双方的得益为(10000-10000δ+δ2S,10000δ-δ2S),这是双方都比较好的均衡解,即可以在第一阶段结束。712023/7/233.2.6讨价还价博弈-三阶段讨价还价博弈讨论:第三阶段甲的出价S是双方已知的,如果不知道,结果如何?如果S为如何值乙却必须接受,则S=10000是合理的,于是S1=10000(1-δ+δ2),乙的收益为10000(δ-δ2)。722023/7/233.2.6讨价还价博弈-三阶段讨价还价博弈导致最后得益取决于δ-δ2的大小,δ-δ2越大甲的收益比例越小,乙的则越大。考察函数δ-δ2,其在δ=0.5时,取极大值0.25;当0.5<δ<1时,随δ的增大,甲的收益增加,乙的收益减少;当0<δ<0.5时,随δ的增大,甲的收益减少,乙的收益增加。结论:谈判阶段越多,甲就会损失δ-δ2,这是乙可以利用的。仅当δ=0时,甲不怕与乙进行谈判。732023/7/23三回合讨价还价博弈结果的讨论3.2.6讨价还价博弈-三阶段讨价还价博弈3.2.6讨价还价博弈-无限阶段讨价还价博弈奇数由甲提方案(不接受);偶数由乙提方案(不接受)。如此下去对双方都没有利益,只有损失。注意,在这种情况下,无法用逆推归纳法。1984年,Shaked和Sutton提出一个解决思路,实际上甲乙是轮流提方案的,那么可用如下思路来处理:对一个无限阶段博弈,从第三阶段开始(如果可以达到的话),还是从第一阶段开始,结果应该是完全一样的。752023/7/233.2.6讨价还价博弈-无限阶段讨价还价博弈由此可推出(在理性的前提下)第一阶段结果与第三阶段结果应该是一样的。(此处实际上假设了收敛,由0<δ<1决定),因为δn趋于0,于是总收益趋于0。在第一阶段出价甲S1=10000-10000δ+δ2S;

乙10000-S1=10000δ-δ2S第三阶段的S应等于S1,于是

S=S1=10000-10000δ+δ2S得S=10000/(1+δ)。此即该博弈的均衡解。762023/7/233.2.7委托人代理理论(信息经济学)委托人(principle)—代理人(Agents)之间的博弈关系是现代经济学研究的重要内容,是动态博弈。如企业—工人,店主—店员,政府—国有企业,公司法人—经理等。委托人-代理人关系可根据松散程度委托内容监督难易等的不同可分为不同的情况。机制设计或激励机制设计。一无不确定性的委托人—代理人模型设定:代理人的工作成果没有不确定性,不存在监督问题。

委托不委托

接受拒绝[R(0),0]

努力偷懒[R(0),0]

[R(E)-w(E),w(E)-E][R(S)-w(S),w(s)-s]212772023/7/233.2.7委托人代理理论(信息经济学)如果w(E)-E>w(s)-s即w(E)>w(s)+E-s(努力的激励相容约束)时,代理人会选择努力。反之,如果w(s)-s>w(E)-E(偷懒的激励相容约束)时,代理人会选择偷懒。2。第二阶段代理人是否接受委托的选择。选择接受的条件:w(E)-E>0,w(s)-s>0;称为参与约束条件。既接受委托的基本条件。3。若第2阶段接受的情况下,有两种情况:

接受拒绝[R(E)-w(E),w(E)-E][R(0),0](a)代理人的选择

接受拒绝[R(s)-w(s),w(s)-s][R(0),0](b)代理人的选择22利用逆推归纳法求解子博弈纳什均衡解1。先看第三阶段代理人是否努力的选择782023/7/23激励相容约束参与约束3.2.7委托人代理理论(信息经济学)a.如果R(E)-w(E)>R(0),委托人选择委托,反之则否。b.如果R(s)-w(s)>R(0),委托人选择委托,反之则否。子博弈完美纳什均衡委托不委托[R(E)-w(E),w(E)-E][R(0),0](a)委托人的选择(1努力)

委托不委托[R(s)-w(s),w(s)-s][R(0),0](b)委托人的选择(1偷懒)11792023/7/23二有不确定性但可监督的委托—代理人博弈

代理人的努力成果有不确定性,但委托人对代理人能够完全监督。产出有不确定性,风险完全由委托人承担,与代理人无关,根据代理人的工作情况而不是工作成果支付报酬。代理人的工作成果的不确定性直接影响的只有委托人的选择,不会影响代理人的选择,但会有间接影响。

委托不委托

接受拒绝[0,0]

努力偷懒[0,0]

高产(0.9)低产(0.1)

高产(0.1)低产(0.9)[10-w(E),w(E)-E][10-w(s),w(s)-s][20-w(E),w(E)-E][20-w(s),w(s)-s]

3.2.7委托人代理理论(信息经济学)12200802023/7/23子博弈完美纳什均衡努力的激励相容约束条件:w(E)-E>w(s)-s偷懒的激励相容约束条件:w(s)-s>w(E)-E代理人接受委托的条件:努力的参与约束:w(E)-E>0;偷懒的参与约束:w(s)-s>0委托人愿意委托的条件:代理人努力时,当0.9×[20-w(E)]+0.1×[10-w(E)]>0时委托,否则不委托。代理人偷懒时,当0.1×[20-w(s)]+0.9×[10-w(s)]>0时委托,否则不委托。二有不确定性但可监督的委托—代理人博弈812023/7/23激励相容约束参与约束三有不确定性且不可监督的委托人—代理人博弈代理人的工作成果有不确定性委托人无法监督代理人的工作委托人不可能根据代理人的工作情况支付报酬,只能根据代理人的工作成果支付报酬,除非支付固定报酬委托不委托

[0,0]接受不接受

努力偷懒[0,0]

高产(0.1)低产(0.9)高产(0.9)低产(0.1)

[10-w(10),w(10)-E]

[10-w(10),w(10)-s][20-w(20),w(20)-E][20-w(20),w(20)-s]1220822023/7/23三有不确定性且不可监督的委托人—代理人博弈1努力的激励相容约束:0.9×[w(20)-E]+0.1×[W(10)-E]>0.1×[w(20)-s]+0.9×[w(10)-s]2代理人接受的参与约束:0.9×[w(20)-E]+0.1×[W(10)-E]>03委托人对代理人的决策思路是清楚的,他能判断出代理人是否努力。当0.9×[20-w(20)]+0.1×[10-w(10)]>0时,他会选择委托。-832023/7/23四选择报酬和连续努力水平的委托人—代理人模型努力成果不确定且不可监督,委托人可选择报酬函数(薪酬制度)。代理人在连续区间选择努力水平。代理人的机会成本为U努力的负效用函数C=C(e)是单调递增凸函数。代理人的产出函数是R=R(e)为一随机函数。由于是不完全监督,委托人的支付函数为w=w(R),有记件工资或利润提成。w=w(R)=w(R(e))代理人的得益函数w-C=w[R(e)]-C(e)代理人的参与约束:w[R(e)]-C(e)≥(=)U委托人的得益函数R(e)-w[R(e)]=R(e)-C(e)-U;委托人满意的代理人的努力水平e1:(e1)=(e1))激励相容约束:w[R(e1)]-C(e1)≥w[R(e)]-C(e).意味着代理人和委托人的利益完全一致。如果委托人按照上述参与约束和激励约束设计报酬函数,就可使代理人的行为符合自己的利益。842023/7/2385R,CC(e)+R(e)委托人希望的代理人努力水平(满足参与约束)2023/7/23四选择报酬和连续努力水平的委托人—代理人模型四选择报酬和连续努力水平的委托人—代理人模型—一个具体例子店主和店员(风险中性)商店的收益R=R(e)=4e+u,其中u是均值为0的随机扰动项;店员的负效用函数为C(e)=e,店员接受该工作的机会成本为U=1。R=R(e)=4e+u,u是均值为0的随机扰动项。C=C(e)=店主无法掌握店员的努力1情况,采用的报酬计算公式为S=A+B[R(e)]=A+B[4e+u].店主的得益函数为店主的期望得益为4(1-B)e-A店员的得益函数为

A+B[4e+u]-e期望得益为A+B4e-e参与约束的条件:A+B[4e+u]-e≥1期望条件A+4Be≥e+1,店员接受工作。当e1=2B时A+B4e-e最大。当B=0,e1=0;B=0.5,e1=1862023/7/23店主的选择—激励约束店主的选择必须满足店员参与约束的下限:A+B[4e+u]=e+1,从而店主的得益为4e-u-e–1,期望得益为4e-e–1,当e2=2时,店主的得益最大;由e1=e2=2得B=1,A=-3.店主的最优激励工资计算公式w=A+B(R)=-3+R结论:店员支付承包费,获得全额利润提成;店主不发固定工资,收取承包费或租金,是一种承包或租赁制。子博弈完美纳什均衡。与博弈方的风险类型有关872023/7/23四选择报酬和连续努力水平的委托人—代理人模型—一个具体例子3.3有同时选择的两阶段动态博弈问题的提出银行挤兑关税和不完全国际竞争竞赛与努力882023/7/233.3.1问题的提出与前面讨论的动态博弈一样,也是多阶段并且在后一阶段前,博弈方能看到此前的博弈过程,但在同一个阶段有两个或两个以上博弈方同时选择。严格而言,这种博弈并不是完美信息的,它们介于完美信息和被完美信息之间。可用逆推法来求解,不同的是最后阶段(每一阶段)不是单一方求利益最大化,而是由一个博弈结果来决定的。因而与以往的不有一个的差异,要详细分析才可以。892023/7/233.3.1问题的提出基本形式:(1)四个博弈方1,2,3,4(2)博弈方1、2在第一阶段同时选择各自的可选策略集a1∈A1,a2∈A2(3)博弈方3、4在看到1、2的选择(a1,a2)后,第二阶段同时在各自选择的可选策略集合A3,A4中选择a3∈A3,a4∈A4(4)所有博弈方的得益取决于a1,a2,a3,a4。即博弈方i的得益ui(a1,a2,a3,a4)是各方效率的函数。902023/7/233.3.2银行挤兑问题:客户1、2在同一银行各存有100元,银行将其投资于一个项目到期收入280元,若在到期前抽回投资,则只能收回140元;对客户来讲,抽回存款的日期也分同样的两种。各博弈方的策略和收益如下:

70,70100,4040,100下一期140,140180,100100,180140,140

1抽回不抽2抽回不抽抽回不抽银行挤兑-日期1银行挤兑-日期2912023/7/233.3.2银行挤兑采用逆推归纳法,从第二阶段日期2的博弈看起,其唯一的纳什均衡为(抽回,抽回),双方得益为(140,140)。再回到第一阶段,日期1,由于两博弈方对第二阶段的博弈结果都十分清楚,这样可直接将(140,140)作为第一阶段双方都选不抽时的得益代入日期1的得益矩阵,即得下图所示矩阵70,70100,4040,100140,140银行挤兑922023/7/233.3.2银行挤兑

银行挤兑中得益矩阵有两个纳什均衡(抽回,抽回)和(不抽,不抽),对应的得益分别为(70,70)和(140,140),这说明在银行挤兑中的一种可能的低效率均衡(70,70)的存在,不过还有一个有效率的纳什均衡(140,140),稍加控制即可使结果达到有效的均衡,比如保证金等信誉手段。这就回答了为什么各政府要建立信誉保证保障制度等的原意,同时这也是一个机制设计问题。932023/7/23建立信贷保证、保险制度,对存款进行保护、保险的原因非法集资问题现代更容易引发金融、社会风险的主要是不正规的非法金融活动,如地下钱庄和非法集资等。因为非法金融活动常常通过恶意欺骗的手段吸引人们参加,用借新债还旧债的方法,而不是经营利润偿还到期资金,信用差、管理差而且缺乏保险措施,引起金融风险并引发社会问题的可能性要大得多。3.3.2银行挤兑3.2.3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论