博弈论game theory.ppt

上传人：6*** IP属地：广东上传时间：2020-06-11 格式：PPT 页数：161 大小：19.74MB 积分：12 举报 版权申诉

已阅读5页，还剩156页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论GameTheory,焦未然,1,目录,基本概念,完全信息静态博弈,完全且完美信息动态博弈,重复博弈,完全但不完美信息动态博弈,不完全信息静态博弈,不完全信息动态博弈,进化博弈,合作博弈,2,CH1基本概念1.1博弈和博弈论,1.1.1博弈的基本描述博弈即游戏游戏的基本特征：有规则、有结果、有策略、相互依赖性例子三人决斗，开枪射杀对手，以保存自己。命中率和每一轮的开枪次序如下。命中率次序A30%1B70%2C100%3A在第一轮的策略是什么？A最怕什么？首轮之后谁的存活几率最高？,3,1.1.2博弈的基本要素非正式的定义博弈的参加者局中人（players）独立决策、独立承担结果的个人或组织策略（strategies）和行为集一局博弈中，供局中人选用的若干方案局中人的得益（payoffs）支付博弈结果的量化局中人在博弈中得到的效用策略组合的函数博弈的次序（orders）局中人决策是否同时,4,1.1.3博弈的表示方法(1)正规型（策略型）PayoffMatrix,(2)扩展型博弈树由棱和节点构成,B,A,root,outcome,5,1.2.1Tucker的囚徒困境,1.2.2抛硬币,1.2一些典型博弈,6,1.2.3田忌赛马,7,1.2.4石头、剪刀、布,8,1.3按局中人的数量对博弈分类,1.3.1单人博弈退化为一般的最优化问题（1）单人迷宫,9,（2）运输商与自然的博弈,从单人博弈的角度看，局中人拥有的信息越多，其所获得的支付越多。这一规律在多人博弈中是不成立的。,10,1.3.2多人博弈依存关系更复杂，存在“破坏者”“损人不利己者”（1）两党制与多党制两党政见会趋于中间立场，这是一个均衡。三个政党就不存在均衡。,11,（2）三厂商竞争优势博弈,12,1.4按照策略对博弈分类,1.4.1根据策略多少，博弈可分为：有限策略博弈和无限策略博弈。有限策略博弈是指所有局中人的策略均为有限时的博弈。1.4.2局中人的策略数可能不一样。有时，在同一博弈中，某些局中人存在有限的策略，而另一些局中人有无限策略。1.4.3有限策略博弈的结果为有限个，用策略式或扩展式表示。无限策略博弈，结果为无限，只能用数集或函数表示。,13,1.5按博弈中的得益（支付）对博弈分类零和博弈、正和博弈、变和博弈,1.5.1零和博弈：任意策略组合中，局中人的支付之和总为零，局中人总是对立，在重复博弈中没有合作的机会。1.5.2正和博弈：任意策略组合中，局中人的支付之和总为非零常数，会产生合作的机会。1.5.3变和博弈：局中人的支付之和并非常数。支付之和有大小排序的问题。1.5.4关于支付的信息可以是完全的，也可以是不完全的具有完全信息的博弈知道所有局中人的博弈支付。具有不完全信息的博弈至少有部分局中人不完全了解其他局中人的博弈支付。,14,1.6按博弈的过程对博弈分类,1.6.1静态博弈和动态博弈静态博弈所有局中人同时进行决策（选择策略）的博弈。动态博弈局中人先后依次进行选择，并且后选择的局中人在选择之前可以看到此前其他局中人选择的博弈。注意：在动态博弈中，缺失了对称性，策略区别于步骤。,15,1.6.2重复博弈同一个博弈反复进行的博弈过程称为重复博弈。构成重复博弈的一次性博弈称为“原博弈”或“阶段博弈”。本教程所指的重复博弈是指原博弈为静态博弈的博弈过程。有限次重复博弈：原博弈重复的次数是确定的。无限次重复博弈：没有事先确定的重复次数。大多数情况下，无法在事前、事中验证博弈的次数是否有限。局中人关心的不是原博弈的结果，而是整个博弈的总体结果。所以，重复博弈是一种特殊的动态博弈。1.6.3关于博弈进程的信息具有完美信息的局中人：对历史有完美的知识。反之，就是具有不完美信息的局中人。若局中人全是完美信息局中人，则该动态博弈称为完美信息动态博弈；否则就是不完美信息动态博弈。,16,2.1.1占优策略局中人的最优策略不依赖于其他局中人的选择，则称该局中人有占优策略。如果某策略组合中的每一个策略都是局中人各自的占优策略，此策略组合称为占优均衡。囚徒困境中的（坦白，坦白）就是占优均衡，坦白是每个囚徒的占优策略。但并不是每个博弈，每个局中人都有占优策略。,CH2完全信息静态博弈2.1博弈的解法,17,2.1.2严格劣策略的逐次消去法定义2-2不管其他局中人的策略如何变化，某一策略S总比另一策略S带来的支付大，则称S是S的严格优策略，而称S是S的严格劣策略。,18,2.1.3划线法,注A：并非所有的博弈均有稳定的解。如右图所示抛硬币博弈,19,注B：稳定性并非是确定性可能有多个稳定性的结果,性别之争斗鸡游戏,20,2.1.4箭头法：局中人能否通过单独改变自己的策略，而改善自己的支付。,21,注A：没有稳定解的情况,注B：有多个稳定解的情况,22,2.2纳什均衡（NE）,2.2.1NE定义NE是一个策略组合，对任意的局中人，当其他局中人不背离这一组合时，该局中人没有积极性选择别的策略组合。没有任何局中人单独背离,23,命题1和命题2保证了严格劣策略反复消去法与NE的相容性。保证了该方法简化博弈的可行性。,24,2.3无限策略博弈的解和反应函数,2.3.1古诺(Cournot)模型财富理论的数学原理研究1838寡头（Oligopoly）又称寡头垄断，是指少数大厂商控制了整个行业的生产和销售。有两种分类法。按产品性质：纯粹寡头垄断P=f（Q1+Q2）差别寡头垄断P1=f（Q1，Q2）P2=f（Q2，Q1）按决策变量：联合定产模型（Cournot）联合定价模型（Bertrand）Cournot模型的假定：同时决策;决策变量是产量;对手的反应方式保持不变;产品相同,线性需求曲线,MC=0。,25,26,将式代入，两式:,27,当寡头的数量为n时，每个厂商的均衡条件为,28,2.3.2Bertrand模型（1883）决策变量是价格,29,2.3.3反应函数对于其他局中人的每一个可能的决策，局中人i都选定自己的最佳决策。建立这种最佳决策与其他局中人的每一个可能的决策的映射关系，我们称之为反应函数。局中人反应函数的交点就是NE。,E,30,2.3.4公地的悲剧（1968年，哈丁）外部性往往是产权界定不清的结果一个乡村，村民在公地上放牛。两种放牧机制：（1）让私人拥有这块土地；私人决定放牧规模（2）让村民共同拥有这块地免费放牧没有限制结论：公共牧地一定是过度放牧。例子：土地承包责任制，永佃权,31,2.3.5反应函数的局限性a.反应函数无交点b反应函数有多重交点,32,2.4混合策略,2.4.1概念在前面的研究中，有许多博弈没有NE。要研究这些博弈就必须引入混合策略的概念。如果让局中人以一定的概率分布在可选择的策略中随机选择，我们就称这种策略选择方式为混合策略。同时我们称以前所讲的策略为纯策略。混合策略包括原有的纯策略。,33,2.4.2解法,34,2.4.3小偷与守卫,不存在纯策略纳什均衡，但是有混合策略NE,小偷的混合策略,35,守卫的混合策略,36,2.4.4多重均衡博弈和混合策略,混合策略NE与两个纯策略NE（看球，看球），（逛街，逛街）的支付相比是最糟糕结果。该混合策略是严格劣策略吗？,37,2.4.5混合策略和严格劣策略反复消去法严消法不会消去NE反复消去后的策略组合唯一时，该组合就是NE。,纯策略条件下没有严格劣策略引入混合策略（U，1/2；M，1/2；D，0）就会发现D是相对于的严格劣策略,38,2.4.6混合策略反应函数反应函数是一方对另一方的策略概率分布的反应，同样也是一个概率分布。,39,2.5NE的存在性,2.5.1纳什定理,2.5.2不动点定理,40,连续情形NE的必要条件,连续情形NE的检验方法,41,2.6纳什均衡的选择和分析方法的扩展,2.6.1存在性不等于唯一性许多博弈存在多重NE，哪一个NE是现实的博弈结果？2.6.2帕累托占优的NE在一系列均衡中，对于所有的局中人而言，有某一个均衡上的博弈支付优于其它任何均衡上对应的支付。,42,2.6.3风险占优的NE下列博弈中，（坦，坦）是帕累托占优的NE，但是风险很大，当局中人A偏离坦白策略时，局中人B的支付将从8变为0。但是，（不，不）就不存在这样的风险问题，所以，我们称（不，不）为风险占优的NE,43,2.6.4聚点均衡谢林（Schelling,1960）指出，局中人会根据某些被博弈模型抽象掉的信息来达到一个NE。这些信息与文化、历史有关。行车靠右教室里占座位为什么大多数都坐后面，但是有人愿意坐前面。假如大家有先来后到，哪些座位先被人占了，哪些座位后被人占了。如果没有先来后到，大家会抢座位么。为什么会有人用书占座位，而大家也承认这种潜规则。,44,2.6.5相关均衡奥曼（Aumann,1974）指出：局中人通过一个大家都能看到的信号采取行动，由此确定NE。Aumann博弈有两个纯策略均衡：（上，左），（下，右）；还有一个混合策略均衡：（1/2，1/2），（1/2，1/2）相应的支付为（5，1）、（1，5）、（2.5，2.5）。按照先来后到的顺序决定，每个人先到的概率都是0.5，则每个人的支付期望为：0.55+0.51=3。如果设计一种信号灯，以1/3的几率显示A、B、C，甲只能识别是否显示A，乙只能识别是否显示C。甲看到A就选上，否则选下。乙看到C就选左，否则选右。双方的期望支付是（10/3，10/3）。,45,2.6.6防共谋均衡a.多人博弈中的共谋问题,存在两个NE：（U，L，A）（D，R，B）。但是，如果和之间存在共谋，当选A时，和选D、R，可以改善和的支付，同时使的情况变糟。,46,b.强均衡（Aumann,1959）条件：在给定其他局中人的策略时，不存在局中人的任意子集构成的联盟，通过联合偏离使联盟中的所有成员的支付都增加。强均衡一定是帕累托占优的均衡。c.防共谋均衡（Bernheim，Peleg，Whinston,1987）任何局中人不会单独偏离没有双局中人联盟会偏离。给定选择偏离的局中人再次偏离的机会时，两人联盟中总会有人再次单独偏离。二次偏离的不稳定。以此类推，直至所有局中人联盟都不会偏离。防共谋均衡包含了强均衡。,47,CH3完全且完美信息动态博弈3.1动态博弈表示方法和特点,3.1.1动态博弈定义局中人先后依次进行选择，并且后选择的局中人在选择之前可以看到此前其他局中人选择的博弈。3.1.2扩展性博弈博弈树3.1.3特点缺失了对称性策略区别于步骤。,48,3.2可信性与纳什均衡问题,3.2.1相机抉择和策略的可信性,49,3.2.2纳什均衡与可信性在不充分法律保障的开金矿博弈中，存在一个纳什均衡：B：借打，A：分。但是，该策略组合不是稳定的博弈结果。因为，B在第三阶段的策略打是不可信的威胁。所以，NE是一个有局限性的概念。,50,3.2.3逆推归纳法从动态博弈的最后一个阶段局中人的行为反向分析前一阶段局中人的行为选择，直至分析第一阶段局中人的行为。以“不充分法律保障的开金矿博弈”为例,51,3.3子博弈与子博弈完美纳什均衡,3.3.1信息集同一时点上某局中人的若干决策节点的集合。用以判定博弈的进程。有了不同的信息集，局中人就可以区别博弈进行到了那个信息集。但是，他不知道进行到了该信息集中的那个节点上。,52,信息集反例,53,3.3.2动态博弈中的子博弈定义：在一个n人扩展型博弈G中，满足以下条件的博弈S，称为的G一个子博弈。（1）S的博弈树是G博弈树的一个分支。（2）S不能分割G的信息集，换言之，只要G的某个信息集的任一决策结点是S的决策节点，那么，G的这个信息集的每一个决策节点都必须是S的决策节点。（3）S的末端处的支付向量，与G在这些末端节点上的支付向量的有关部分重合。,54,55,子博弈的数量,56,3.3.3子博弈完美纳什均衡在完美信息动态博弈G中，策略组合S为子博弈完美纳什均衡的条件是：它在任何子博弈上都是纳什均衡。子博弈完美纳什均衡本身也是纳什均衡，是比纳什均衡更强的均衡。暗含规则:世界冠军首先应该是亚洲冠军,欧洲杯冠军第3届(1968)意大利第4届(1972)西德第6届(1980)德国第7届(1984)法国第10届(1996)德国第11届(2000)法国,世界杯冠军第8届1966年英格兰第10届1974年西德第12届1982年意大利第14届1990年西德第16届1998年法国第18届2006年意大利,57,3.4动态博弈的模型,3.4.1讨价还价模型a.三回合讨价还价乙放弃谈判是最糟糕结果，因此，甲具有主动性。乙具有某种被动性。,58,由于第三回合乙必须接受S3，否则就会终止谈判，这是最坏结果。因此加在第三回合的报价S3一定是1000。,59,b.无限回合讨价还价博弈没有明确的终点，无法逆推归纳Shaked和Sutton(1984)提出一个解决方案从第一阶段开始和从（2n+1）阶段是无差别的。假设上帝给一个逆推结果。甲乙的支付为S和1000-S，则第一回合与第三回合都应该得到这个结果。,60,3.4.2间接融资和挤兑风潮,61,CH4重复博弈4.1定义,4.1.1概念同一个博弈反复进行的博弈过程称为重复博弈。给定一个基本博弈G重复进行T次G，且每次重复G之前，各局中人都能观察到以前的博弈结果，这样的博弈过程称为“G的T此重复博弈”，记作G（T），G称为G（T）原博弈，G（T）中的每次重复称作G（T）的一个阶段。有限次重复博弈：原博弈重复的次数是确定的。无限次重复博弈：没有事先确定的重复次数。大多数情况下，无法在事前、事中验证博弈的次数是否有限。局中人关心的不是原博弈的结果，而是整个博弈的总体结果。所以，重复博弈是一种特殊的动态博弈。,62,4.1.2策略、子博弈和均衡路径策略每个阶段针对每种情况（博弈历史）的行动计划子博弈单支博弈树，子博弈完美纳什均衡、逆推归纳法都继续适用,63,4.1.3重复博弈的支付不存在重复博弈的总支付，而只有每个阶段博弈的支付。同时这些阶段博弈的支付形成了一个支付序列。重复博弈中的局中人追求支付序列总量最大化，而不是某个阶段博弈的支付最大化。货币时间价值货币经历一定时间投资和再投资所增加的价值。现值：未来某一时点的一定量货币折合为现在的价值，又称本金。终值：也称将来值，是指现在一定量货币相当于未来某一时点的价值，即本金在若干期后加上应计利息的总数，即本利和。,64,终值的计算：F=P(1+r)n现值的计算：P=F/(1+r)n,65,无限次重复博弈的平均支付,4.1.4随机停止重复博弈的贴现率在重复博弈的每个阶段进行完之后，让局中人抽签决定是否继续博弈，终止博弈的概率为p，继续博弈的概率为（1-p）。,66,4.2有限次重复博弈,4.2.1二人零和博弈的有限次重复博弈没有合作的可能性。重复博弈的正确策略就是原博弈的纳什均衡时的策略。用逆推归纳法证明以上结论。4.2.2唯一纯策略NE博弈的有限次重复博弈a.如果唯一的纯策略本身就是帕累托占优的，重复博弈的局中人不会改变在原博弈中的行为。但是，我们所关心的是非帕累托占优的NE，是否会被反复重复。定理给定原博弈G，存在唯一NE，则重复博弈G（T）有唯一子博弈完美纳什均衡，局中人在每个阶段都采用G的NE策略，各局中人的总支付为G中支付的T倍，平均支付为G中的支付。,67,b.两阶段重复囚徒困境,68,c.重复囚徒困境悖论和连锁店悖论现实中的寡头价格战并不普遍Selten(1978)提出连锁店悖论在n个市场上进行先来后到博弈，每次都不打击是子博弈完美纳什均衡，这与事实相反。4.2.3多个纯策略NE博弈的有限次重复博弈a.令为各局中人在原博弈中的最差均衡支付构成的支付数组。局中人在博弈中能保证的最低支付称为个体理性支付或保留支付。博弈中所有纯策略组合支付的加权平均数组称为可实现支付。FolkTheorem设原博弈有均衡的支付数组优于，那么，在该博弈的多次重复中，所有不小于个体理性支付的可实现支付，都至少有一个子博弈完美纳什均衡的极限平均支付来实现他们。,69,b.三价重复博弈,存在如下的子博弈完美纳什均衡,70,c.触发策略第一阶段合作，一旦发现对方不合作，就采取报复的策略称为触发策略。,71,CH5：进化博弈5.1有限理性,5.1.1有限理性局中人日常所说的理性是具体问题的理性而不是一贯的理性。但是，即使是在具体问题中，人的理性也是有限的，这与问题的复杂性有关。不满足完全理性假设的局中人称为有限理性局中人，包含有限理性局中人的博弈称为有限理性博弈。5.1.2有限理性的种类完全理性包括理性意识、分析推理能力、识别判断能力、记忆能力、准确行为能力、预见能力。当任何一方面出现不完美情况时，即出现了有限理性。所以有限理性的种类有很多。而完全理性只有一种。,72,5.1.3有限理性的分析框架有限理性条件下的博弈均衡必须满足以下两个条件：1）当在局中人之间进行反复博弈时，通过局中人的学习模仿，最终能够达到的均衡。2）经历少量偏离干扰时，能够恢复的稳健性均衡。分析局中人学习速度、调整策略的过程是关键。5.1.4有限理性的博弈模型最优反映动态有快速学习能力的小群体内部成员的两两反复博弈。复制动态大群体低理性水平随即配对反复博弈,73,CH5：进化博弈5.2最优反应动态,5.2.1协调博弈的有限局中人快速学习模型,74,5.2.2最优反应动态初次博弈的可能情况,75,5.2.3演进过程,76,5.2.3演进过程,77,CH5进化博弈5.3复制动态和进化稳定性,5.3.1分析框架：大群体低理性水平随机配对反复博弈,我们称复制动态方程在xdx/dt坐标中的曲线为复制动态相位图。,78,5.3.2例子签协议博弈,79,5.3.3一般22对称博弈的复制动态方程,80,5.3.4蛙鸣博弈,81,蛙鸣博弈的均衡条件,蛙鸣博弈的复制动态方程,82,蛙鸣博弈的相位图A,83,蛙鸣博弈的相位图B,84,蛙鸣博弈的相位图C,85,CH6完全但不完美信息动态博弈6.1基本概念,6.1.1概念部分局中人无法看清博弈的历史不完美动态博弈全部局中人无法看清博弈的历史静态博弈不完美动态博弈的关键是局中人之间的信息不对称6.1.2表示方法存在“多节点信息集”的博弈树,86,6.1.3不完美信息动态博弈的子博弈（1）S的博弈树是G博弈树的一个分支。（2）S不能分割G的信息集，换言之，只要G的某个信息集的任一决策结点是S的决策节点，那么，G的这个信息集的每一个决策节点都必须是S的决策节点。（3）S的末端处的支付向量，与G在这些末端节点上的支付向量的有关部分重合。暗含的一个条件：子博弈只能从单点集开始。下列博弈没有子博弈,87,6.2完美贝叶斯均衡,6.2.1定义完美贝叶斯均衡须满足以下四个条件：.局中人对博弈进行到信息集中哪个决策节点具有一个Belief,其实质是到达该节点的概率。.给定一个Belief，局中人的策略必须是“序列理性的”。.均衡路径上的信息集处，Belief由贝叶斯法则和局中人的均衡策略决定。.在非均衡路径上的信息集处，Belief由贝叶斯法则和局中人可能有的均衡策略决定。可以看出：子博弈完美NE是完美贝叶斯均衡的特例。更进一步，NE是特例的特例。,88,6.2.2对四个条件的解释a.Belief的重要性,b.序列理性的重要性局中人2只选D的策略是一个不可信威胁。均衡要求2没有可信威胁策略。当p(1-p)时，局中人2只能选U。c.均衡路径和非均衡路径在完全且完美的动态博弈中，信息集是否被经过，取决于是否在均衡路径上。在不完美动态博弈中这一点是不确定的。左图中，当局中人1选R时，信息集不在均衡路径上。,89,d.贝叶斯法则,e.基于贝叶斯法则和均衡选择的Belief研究局中人2的Belief没有外来信息没有条件概率局中人2认定1选L的机率为1。除此以外的选择不符合局中人1的选择。,90,f.对条件的进一步讨论考察：策略组合（B，L，U）；Belief：p=0。显然：（B，L，U）是NE对于p=0，（B，L，U）是序列理性的所论之信息集不在均衡路径上But，p=0不是局中人2的最优选择条件的作用：判断“Belief”和策略组合的稳定性,91,6.3单一价格二手车交易,6.3.1模型,92,6.3.2讨论,93,6.3.3市场类型市场完全失败好、差都没有市场完全成功有好无差市场部分成功好差都有且都能成交市场接近失败好差都有依概率成交6.3.4均衡类型合并均衡完美信息局中人采取相同的策略分开均衡完美信息局中人才用不同的策略，这种不同的策略，为买方提供了佐证Belief的证据。在接近失败的市场上，两类均衡都不存在,94,6.3.5纯策略完美贝叶斯均衡a.市场部分成功的合并均衡条件：PC,p(g)(V-P)+p(b)(W-P)0均衡：1）不管好、差，卖方卖2）只要卖方卖，买方就买3）买方的Belief是:p(g|s)=p(g)p(b|s)=p(b)验证：条件，卖方的策略符合买方的Belief条件不需要验证注意：这是唯一的纯策略完美贝叶斯均衡,95,b.市场完全成功的分开均衡条件：PC,p(g)(V-P)+p(b)(W-P)0V=3000，W=0，P=2000，C=1000，p(g)=p(b)=0.5b.市场接近失败的混合策略均衡均衡：1）卖方，好时卖，差时以概率0.5随机卖2）买方，以概率0.5随机买3）买方的Belief是:p(g|s)=2/3p(b|s)=1/3验证：,97,c.市场类型归纳,98,第七章不完全信息静态博弈,7.1.1暗标拍卖密封递交标书统一时间公正开标标价最高者中标局中人的支付取决于估价与成交价之差，但是，估价是私人信息，其他局中人无法确定。因此，至少有部分局中人不能看到博弈的支付。7.1.2静态贝叶斯博弈的表示局中人不清楚其他局中人的支付，但是，知道其他局中人的类型。,99,7.1.3Harsanyi转换a.引进虚拟的局中人（自然）为局中人抽取类型b.自然局中人将类型告诉局中人i，但不告诉其他局中人c.在此基础上，再进行原有的静态博弈，各局中人在确定自己的行为方案。,d.除自然局中人外，各局中人取得自己的支付。,经过Harsanyi转换，原来的静态贝叶斯博弈就转化为一个完全但不完美信息动态博弈。对类型的判断变成对自然“选择”的Belief。,100,7.1.4贝叶斯纳什均衡,101,7.2暗标拍卖,102,103,CH9合作博弈理论初步9.1合作博弈的特征和结构,有约束力的的协议是区分合作博弈与非合作博弈的关键。共同但不完全一致的利益个体理性和联合理性的区分存在谈判破裂点，即局中人的保留效用,104,CH9合作博弈理论初步9.2两人讨价还价,9.2.1帕累托公理,105,CH9合作博弈理论初步9.2两人讨价还价,9.2.2对称性公理,106,CH9合作博弈理论初步9.2两人讨价还价,9.2.3谈判破裂点非对称问题的解决,107,CH9合作博弈理论初步9.2两人讨价还价,9.2.4线性不变性原理,108,CH9合作博弈理论初步9.2两人讨价还价,9.2.5问题的扩展,109,CH9合作博弈理论初步9.2两人讨价还价,9.2.5问题的扩展,110,CH9合作博弈理论初步9.2两人讨价还价,9.2.6讨价还价问题Nash解,111,CH9合作博弈理论初步9.2两人讨价还价,9.2.7风险偏好不同局中人分配博弈效用配置集&Nash解,112,CH9合作博弈理论初步9.2两人讨价还价,9.2.8K-S解,113,CH9合作博弈理论初步9.3联盟博弈,9.3.1联盟博弈的描述,114,CH9合作博弈理论初步9.3联盟博弈,9.3.2优超（dominate）,115,CH9合作博弈理论初步9.3联盟博弈,9.3.3核（core）,116,CH9合作博弈理论初步9.3联盟博弈,9.3.4一些结论,117,CH9合作博弈理论初步9.3联盟博弈,9.3.5稳定集,118,CH9合作博弈理论初步9.3联盟博弈,9.3.6Shapleyvalue（1953）公理1Shapleyvalue与局中人的次序无关。公理2局中人的Shapleyvalue之和等于特征函数值。公理3两独立博弈合并，新Shapleyvalue为原博弈Shapleyvalue之和。,119,附录A:不对称信息经济学A.1新古典传统与信息经济学,A.1.1问题的产生完全信息假设市场的所有参与者了解商品的所有信息。价格传递了全部信息。对新古典经济学假设的质疑人们收集信息、处理信息都需要成本，信息传递过程还会产生噪音、信息不对称。完全信息假设下，市场机制与计划经济的效率是一样的，因为计划者也掌握完全信息。本教程所指信息经济学范围仅限于信息不对称，而不考虑信息不完全问题。,120,附录A:不对称信息经济学A.1新古典传统与信息经济学,A.1.2信息经济学发展历史F.A.Hayek(79)第一次认识到信息的重要性，价格是传递信息的机制。计划经济一定是低效率的。但价格不能包容传递所有的信息。契约所包含的信息远大于价格的包含量。G.Stigler(82)搜寻成本G.Akerlof(2001),逆向选择，1970,TheMarketfor“Lemons”:Quality,UncertaintyandMarketMechanism,QuarterlyJournalofEconomics,84(3)J.A.Mirlees(96)W.Vickrey(96)M.Spence（2001）信号发送J.Stiglitz（2001）,121,附录A:不对称信息经济学A.1新古典传统与信息经济学,A.1.3不对称信息问题基本定义私人信息（privateinformation）订立契约时和执行契约的过程中,某些信息只有部分交易者知道，另外一些交易者不知道。公共信息（publicinformation）每个交易者都能观察掌握的信息。代理人（agent）拥有私人信息的交易者。委托人（principal）不掌握私人信息的交易者。交易委托人与代理人签订的契约（contract）,122,附录A:不对称信息经济学A.1新古典传统与信息经济学,A.1.4分类逆向选择(adverseselection)私人信息是外生的道德风险(moralhazard)私人信息是内生的不可验证问题（unverifiability）,123,附录A:不对称信息经济学A.2旧车市场的逆向选择,A.2.1基本假设旧车的类型有两种（L，H），且数量各占一半，这是一个共同知识（CommonKnowledge）。买卖双方的效用函数如下。,在信息不对称的情况下，买方对旧车的判断：,124,A.2.2连续的质量类型旧车的类型是在区间（L，H）上的连续分布。,附录A:不对称信息经济学A.2旧车市场的逆向选择,125,附录A:不对称信息经济学A.2旧车市场的逆向选择,A.2.3修正买卖双方评价不同市场接近失败,126,A.2.4修正卖方之间评价不同市场接近失败,附录A:不对称信息经济学A.2旧车市场的逆向选择,127,A.2.5劳动力市场的例子a.假设：风险中性的企业，完全竞争，零利润劳动者的生产效率是私人信息企业的收益就是劳动者的效率劳动者的工资要高于保留工资b.对称信息情况所有愿意工作的劳动者都有工作，企业按效率支付工资c.不对称信息情况企业根据平均生产效率的预期给出一个固定的工资率。此结果并非帕累托最优（就业不足或滥竽充数）,附录A:不对称信息经济学A.2旧车市场的逆向选择,128,A.2.5劳动力市场的例子d.不同的保留工资让保留工资与工作效率同向变动市场完全失败：从下限保留工资开始，提高工资的过程无法提高平均工作效率。市场部分失败：企业间竞争会抬高工资水平，直至等于平均生产效率。但是，效率在这之上的人不会就业。,附录A:不对称信息经济学A.2旧车市场的逆向选择,129,A.2.6信贷市场的例子信贷配给：现有利率水平下贷款需求大于贷款供给。存在这一现象的原因：利率粘性、信息不对称。,附录A:不对称信息经济学A.2旧车市场的逆向选择,130,A.2.6信贷市场的例子市场上有两种类型的借款人：A：低风险低利润低违约概率B：高风险高利润高违约概率提高利息率会使低风险的项目退出借贷市场。市场上只剩下高风险项目。而银行只能获得固定利息收入，不能分享风险收益，却要承担高风险。因此，银行提高利息率是不经济的。,附录A:不对称信息经济学A.2旧车市场的逆向选择,131,附录A:不对称信息经济学A.2旧车市场的逆向选择,A.2.6信贷市场的例子,132,A.2.7进一步讨论旧车市场的本质属性：质量是卖者的私人信息。换言之，旧车市场上的商品是不同质的，而传统理论所讲的市场价格是同质商品的价格，应该归入不同的市场去研究。逆向选择的解决a.声誉，在动态博弈中的作用最明显，是帕累托最优的结果。b.政府与制度。c.信号发送与信号甄别。有激励降低信息不对称的人：好车卖主信号发送；好车的潜在买主信号甄别。,附录A:不对称信息经济学A.2旧车市场的逆向选择,133,附录A:不对称信息经济学A.3信号的发送-甄别,134,附录A:不对称信息经济学A.3信号的发送-甄别,A.3.2分开均衡(separatingequilibrium)可观察到的信号是代理人的受教育程度。均衡只可能是两个：A或C。区间（A，B和（C，）是没有意义的。高能力劳动者不会选A,低能力劳动者不会选C。,135,A.3.3分开均衡的条件,附录A:不对称信息经济学A.3信号的发送-甄别,136,附录A:不对称信息经济学A.3信号的发送-甄别,A.3.4合并均衡（poolingequilibrium）企业对劳动者的Belief是：受教育程度低于（S.）绝对是庸才，高于（S.）时，有（1-p）的可能是高能力者，有p的可能是庸才。,137,附录A:不对称信息经济学A.3信号的发送-甄别,A.3.5信号甄别模型设定劳动力市场上的自选择不同的企业各自设定一组契约，这些契约描述了工资和受教育程度的组合。劳动者选择受教育程度。一般的表述：不掌握私人信息的委托人主动设计特定的契约，用以筛选不同的代理人。均衡状态竞争使得企业只获得零利润，否则企业可以通过微调契约来实现超额利润。,138,附录A:不对称信息经济学A.3信号的发送-甄别,A.3.6信号甄别分离均衡在信号甄别机制下不存在合并均衡。唯一的分离均衡C点在S.=1处。,139,附录A:不对称信息经济学A.4道德风险,A.4.1股东与经理的利益冲突a)经理具有费用偏好,经理的在职消费使企业的成本增加。b）经理具有休闲偏好。c）经理与股东具有不同的抗风险能力，经理的抗风险能力弱于股东，而股东可以通过一定的资产组合来化解纯粹的非系统性风险。d）经理与股东时间偏好不同，经理具有短期化倾向，股东相反。,140,附录A:不对称信息经济学A.4道德风险,A.4.2控制道德风险的机制报酬与经营绩效挂钩。不确定性过大时，使用相对业绩来评价锦标赛。让代理人交纳抵押金。经理市场上的声誉对经理人的隐性奖励。潜在的接管威胁。,141,附录A:不对称信息经济学A.4道德风险,A.4.3委托代理模型(风险规避),142,附录A:不对称信息经济学A.4道德风险,A.4.3委托代理模型(风险规避),143,附录A:不对称信息经济学A.4道德风险,A.4.3委托代理模型(风险规避),144,附录A:不对称信息经济学A.4道德风险,A.4.3委托代理模型(风险规避),145,附录A:不对称信息经济学A.4道德风险,A.4.4不对称信息、风险规避条件下的契约安排委托人必须支付代理人努力时的高工资，这意味着代理人也要承担一定的风险。代理人的效用永远是保留工资效用。但是，委托人的利润相对对称信息的情况降低了。对称信息解帕累托优于不对称信息的解。委托人可能会放弃对代理人的激励,146,附录A:不对称信息经济学A.4道德风险,A.4.5不同工资条件下的最优监督索罗（1979）夏皮罗、斯蒂格利茨（1982）。委托人可以自由选择对代理人的了解程度。生产效率取决与工资。较高的工资是防止偷懒的激励方法。此时的工资是效率工资，效率工资是指当企业不能完全监督工人时，工人偷懒被发现时的机会成本。此时的工资高于工人的期望工资。P越小，效率工资越高（笼络成本）。代理成本=监督成本+笼络成本,147,附录A:不对称信息经济学A.4道德风险,A.4.6团队的最优委托安排团队：一组独立的选择各自努力程度、创造一组共同产出的代理人。阿尔钦、德姆赛茨（1972）：应该引入监督者（委托人），同时应赋予其剩余索求权。代理人和委托人可能倒置，问题转化成为组织内部谁应该是委托人，委托权应该如何配置。信息对称条件下：委托权配置取决于风险厌恶程度。信息不对称条件下：委托权配置取决于风险厌恶程度和激励问题。信息不对称可能是相互的。,148,附录A:不对称信息经济学A.5不可验证性,A.5.1事前无契约的原因订立的条件不具备惯例口头约定事前有契约，但执行成本过高,149,附录A:不对称信息经济学A.5不可验证性,A.5.2不可验证性问题与道德风险的区别委托人在事后可以观察到代理人的努力程度。因此，具备事后谈判条件，谈判结果取决于谈判控制权和谈判能力。韩非子外储说左上曾子之妻之市，其子随之而泣。其母曰：“女还，顾反为女杀彘。”妻适市来，曾子欲捕彘而杀之。妻止之曰：“特与婴儿戏耳。”曾子曰：“婴儿非与戏也。婴儿非有知也，待父母而学者也，听父母之教。今子欺之，是教子欺也。母欺子而不信其母，非以成教也。”遂烹彘也。,150,附录A:不对称信息经济学A.5不可验证性,A.5.4委托人拥有完全控制权的谈判此时，委托人具有事后反悔的激励，事前

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论game theory.ppt

文档简介

温馨提示

最新文档

评论

博弈论game theory.ppt

文档简介

温馨提示

最新文档

评论

相关文档