《讲博弈论基础》PPT课件.ppt_第1页
《讲博弈论基础》PPT课件.ppt_第2页
《讲博弈论基础》PPT课件.ppt_第3页
《讲博弈论基础》PPT课件.ppt_第4页
《讲博弈论基础》PPT课件.ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五讲 博弈论基础,效率标准,问题:社会是由人组成的,每个人的行为都会影响到他人的利益。那么,我们用什么样的标准判断个人的行为是否正当? 考虑两种情形: 情形A:某店主雇人将竞争对手的店门堵上,使后者不能营业; 情形B:某店主以更低的价格和更优良的服务将竞争对手打垮。 这两种情形有什么不同?为什么法律允许第二种情形而不允许第一种情形?,几个经济学概念,帕累托效率,定义:一种状态(资源配置、社会制度等)被称为帕累托最优状态,如果不存在另一种状态能使得没有任何人的处境变坏同时至少有一个人的处境变得更好。 简单的说法是:对每个人来说,除非“损人”就不可能“利己”,社会就达到了帕累托最优状态。 不同帕累托状态之间不可以比较 所以,帕累托最优可能意味着收入分配的不公平;极端地,一个人得到所有收入,另一个人一无所有,也是一个帕累托最优,以两人社会为例,A的收入,B的收入,X,Y,Z,。,。,。,X和Y都是帕累托最优状态, 但Z不是帕累托最优状态,帕累托改进与帕累托标准,定义:一种变革没有使任何人的处境变坏,至少有一个人的处境变好。 如果一种状态不是帕累托最优,意味着存在帕累托改进的可能。 如果社会已经处在帕累托最优状态,就不可能有帕累托改进的余地。 状态X帕累托优于状态Y,如果在状态X下,至少有一个人的处境比状态Y下更好,而没有任何人的处境比在状态Y下坏。,两人社会为例,A的收入,B的收入,。,Z,。,F,。,X,。,G,。,H,从Z到F、X是帕累托改进; 从Z到H、G不是帕累托改进; 从H、G到X、F、Z都不是帕累托改进,卡尔多-希克斯(Kaldor-Hicks)标准,设想:状态X下,A的收入是100,B的收入也是100;在状态Y下,A的收入是1000,B的收入是99。依帕累托标准,这两个状态是不可比较的:A在状态Y下更好,B在状态X下更好。 卡尔多-希克斯标准:如果一种变革使得受益者的所得足以弥补受损者的所失,这种变革就是一个卡尔多-希克斯改进。如果补偿实际发生,就是帕累托改进。因此,“卡尔多-希克斯标准”就是“财富最大化”。,应用:交易效率,人们为什么交易: 偏好不同; 生产成本不同; 信息不同; 风险态度不同。 自愿的交易一定是一个帕累托改进(假定没有欺诈) 设想:A拥有10个苹果,0个桃;B拥有0个桃,10个苹果。如果边际效用是递减的,A用5个苹果换B的5个桃,对双方是一个帕累托改进;交易的结果:各有5个苹果和5个桃。,?,问题:“一个两人世界构成的经济中,甲比乙做任何工作的产出都高,则对甲来说,交易是不必要的”。这个判断对吗?,下图是张三和王二在东北野外原始森林中的生产信息。假设野人参和野灵芝生长在不同的两座高山上,一个人一天只能采摘其中一种。,单位:一天,假设野人参与野灵芝的价值相当,都为200元。 问题:现王二需要4颗野人参治疗某种疾病,他自己上山采摘划算还是向张三购买划算?,应用:社会改革,如果改革中没有人受损,至少有一些人受益,改革就是一个帕累托改进; 如果改革使一部分人受益,另一部分人受损,但受益者所得大于受损者所失,改革是一个卡儿多-希克斯改进,或者说,潜在的帕累托改进;如果受损者得到足够的补偿,就是一个帕累托改进; 革命通常不是一个帕累托改进。,外部性与科斯定理,个人收益与社会收益:一项活动的社会收益等于决策者个人得到的收益加社会其他成员得到的收益,如养花; 个人成本与社会成本:社会成本等于决策者的个人承担的成本加社会其他成员承担的成本,如环境污染,交通堵塞; 如果个人收益(/成本)不等于社会收益,我们说存在外部性。,个人最优决策与社会最优,理性人的最优决策:边际个人成本等于边际个人收益; 社会最优决策(帕累托最优):边际社会成本等于边际社会收益; 因此,除非没有外部性,个人最优决策不等于社会最优决策。,图示说明:社会成本大于个人成本 公海捕鱼为例,产量,边际成本 与 边际收益,边际个人收益 (等于边际社会收益),边际个人成本,边际社会成本,个人最优产量,社会最优产量,边际外部成本,图示说明:社会收益大于个人收益 养花为例,产量,边际成本 与 边际收益,边际个人收益,边际个人成本(等于边际社会成本),个人最优产量,社会最优产量,边际社会收益,举例,环境污染; 夜间施工; 交通事故; 垄断定价; 国有企业的恶性竞争; 教育;,政府管制、皮古税与科斯定理,个人最优与社会最优的不一致意味着有帕累托改进的余地; 核心是如何将外部性内部化:如果有办法使得个人在边际上承担全部的社会成本和获得全部的社会收益,问题就解决了; 传统的理论:政府管制或对个人征收皮古税(或补贴); 在负外部性的情况,征税和补贴代表不同的产权安排。,皮古税或补贴如何解决问题?,产量,边际成本 与 边际收益,边际个人收益 (等于边际社会收益),边际个人成本(无税情况),边际社会成本 (加税后的边际个人成本),个人最优产量,社会最优产量,边际税率=边际外部成本,科斯定理,Coase(1960):只要产权界定是明晰的,如果交易成本为零,外部性可以通过当事人之间谈判解决,帕累托效率可以实现;并且,最终的资源配置与初始的产权安排无关。 比如说:夜间唱歌,科斯定理图示,牧养人放牧的数量,牧羊的边际利润,农场主的边际净损失,社会最优量,P,S,O,说明,如果产权归农场主,农场主可以禁止放牧(点0),小于社会最优量S;但此时,增加放牧给牧羊人带来的边际利润大于给农场主造成的损失,牧羊人将有积极性贿赂农场主,直到放牧量达到S为止; 如果产权归牧羊人,牧羊人的利润最大点是P,大于社会最优量S;但此时,减少放牧量对牧羊人的边际利润损失小于给农场主节约的边际成本,所以,农场主将有积极性贿赂牧羊人,直到S; 因此,无论初始产权如何安排,双方谈判可以实现帕累托最优。 科斯定理意味着:如果没有交易成本,公司治理结构(包括股权结构)是无关紧要的,交易成本与次优选择,定义:交易成本包括所有与交易有关的成本,包括发现交易对象的成本、谈判成本、签约成本、执行成本,以及所有可能的效率损失(与帕累托最优相比); 交易成本存在的原因: 交易者的数量(人越多,达成本协议越难) 信息不对称(信息越不对称,谈判越难,合同的执行也越难) 交易成本意味着:只有次优,没有最优;,作为激励机制的法律,法律通过责任的分配和赔偿/惩罚规则是实施,将个人行为的外部成本内部化,诱导个人选择社会最优的行动; 如果个人之间签约的交易成本太高,法律可以节约交易成本; 以交通事故为例:司机开车可能伤害他人,但要每个司机与所有可能的受害人签定合同是不可能的,有关交通的法律法规(侵权赔偿)替代了合同; 但法律面临信息约束。,第一节 博弈论导论 什么是博弈论(Game theory) 研究决策主体的行为直接发生相互作用的时候,主体如何决策以及决策的结果(均衡)是什么。 博奕论前提假设:博弈的参与者都是理性人 所谓理性人是指有一个很好定义的偏好,在面临给定的约束下最大化自己的偏好。 理性人可能是利己主义者,也可能是利它主义者。,第一节 博弈论导论,例:囚徒困境,均衡结果为:A、B都选择坦白,各判8年刑,第一节 博弈论导论,“囚徒困境”的博弈树,均衡结果为:A、B都选择坦白,各判8年刑,注意理解: 1.纳什均衡是如何产生的? 2.囚徒困境反映的个人理性与集体理性的矛盾性。 3.现实中那些问题属于囚徒困境问题? 彩电业的价格联盟、人民公社制度的效率低下、 公海捕鱼(外部性与科斯定理) 、军备竞赛、改革与搭便车等 4.纳什均衡的哲学思想:只有构成纳什均衡的协议,才没有人有积极性偏离协议规定,才能被参与人自动、自觉的实施。,博弈论又称对策论,它与决策论的区别: 决策论指决策者依据自然环境、状态、条件做出最有利于自己的选择,是“人与自然的博弈”,自然不会对人的选择做出应对性的反应。决策方法有熵决策法、多属性多目标决策、群决策、随机决策、模糊决策、线性规划决策等。 博弈论是多个能对其他可以做出应对性反应的参与方做出应对性反应的决策方法,其中参与各方都具有理性假设,都是具有决策能力的。,博弈的四要素: 1.博奕的参加者,即博奕方或参与人。 2.各博奕方可选择的全部策略或行为的集合。 3.进行博奕的次序。 4.博奕方的得益。,例:囚徒困境,囚徒B,囚徒A,坦白 抵赖,坦白 抵赖,均衡结果为:A、B都选择坦白,各判8年刑,博弈论的历史发展 1.国外 产生的标志:1944年冯诺伊曼和摩根斯坦恩合作博弈论和经济行为 50年代是博弈论巨人出现的年代:纳什(Nash)提出纳什均衡概念、塔克尔( Tucker )讨论了“囚徒困境”。 60年代泽尔腾(Selten)引入动态博弈分析,提出“精练纳什均衡”概念;海莎尼(Harsanyi)引入不完全信息博弈. 80年代克瑞普斯和威尔逊引入不完全信息重复博弈,1994年纳什(Nash)、泽尔腾(Selten)、海莎尼(Harsanyi)被授予诺贝尔经济学奖。 2.国内 国内学者对博弈论的发展没有开创性的贡献。 90年代初一批留学人员归国,引入“博弈论与信息经济学”,其中以北大教授张维迎的博弈论与信息经济学(1996年出版)一书最引人注目。,博弈论的基本概念,1.参与人:博奕中选择行动以最大化自己效用的决策主体(个人、团体、国家、企业)。 2.行动:参与人的决策变量。用ai表示第i个参与人的一个特定行动,Ai=ai表示可供i选择的所有行动的集合。 n人博奕中,n个参与人的行动的有序集a=(a1aian)称为行动组合。 注:博奕论中,一般假定参与人的行动空间和行动顺序是所有参与人的共同知识。,3.战略:是参与人选择行动的规则,他告诉参与人在什么时候选择什么行动。用si表示第i个参与人的一个特定战略,Si=si代表第i个参与人的所有可能选择的战略的集合。n维向量s(s1,si,sn)称为一个战略组合。 注:战略与行动是两个不同的概念,战略是行动规则,规定什么时候采取什么行动。 4.信息:指参与人在博奕中的知识,特别是有关“自然”的选择,其它参与人(对手)的特征和行动的知识。 注:与信息有关的一个重要概念是共同知识,它指“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道”的知识。,例:空城计与共同知识 懿果见孔明坐于城楼之上,笑容可掬,焚香操琴。城门内外,有十余百姓,低头洒扫,旁若无人。懿见毕大疑,急令军速退。次子司马昭曰:“莫非诸葛亮无军,故作此态?父亲何故退兵?”懿曰:“亮生平谨慎,不曾弄险。今城门大开,必有埋伏。宜速退”。见魏兵退去,众人无不骇然,乃问孔明曰:“司马乃魏之名将,今统十五万精兵到此,见了丞相,便速退去,何也?”孔明曰:“此人料吾生平谨慎,必不弄险;见此模样,疑有伏兵,所以退去。吾非行险,盖不得已而用之”“吾若为司马懿,便不速退也” 试问:“空城计”中双方是否满足拥有“共同知识”的要求?,司马知孔明“平生谨慎,不曾弄险”退兵 孔明知空城计 司马不知“孔明知”退兵 孔明知司马不知“孔明知” 空城计,5.支付函数:是指在一个特定的战略组合下参与人获得的确定效用水平,或是参与人得到的期望效用水平,它是所有参与人战略或行动的函数,是每个参与人真正所关心的。 6.结果:是博奕分析者感兴趣的要素的集合,如均衡战略组合,均衡行动组合,均衡支付组合等。 7.均衡:是所有参与人考虑到其他参与人做出理性反应的前提下的最优战略或行动的组合,,博弈分类所涉及的概念 1.静态博奕:指博奕中,参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体的行动 2.动态博奕:指博奕中,参与人的行动有先后顺序,且后行动者能观察到先行动者所选择的行动。 3.完全信息:指每一个参与人对所有其它参与人(对手)的特征、战略空间及支付函数有准确的知识;否则即为不完全信息。 4.非对称信息:指的是某些参与人拥有但另一些参与人不拥有的信息。 注意:非对称的一定是不完全的,反之不然。,博弈的分类,博弈的分类,例1:囚徒困境,-1,-1,-10,0,0,-10,-8,-8,囚徒B,囚徒A,坦白 抵赖,坦白 抵赖,占优战略:一个参与人的战略不依赖于其他参与 人的任何战略选择。,“囚徒困境”实验与法律制度 美国密西根大学的罗伯特.爱克斯罗德的实验证明:在无限次重复博弈中,“忍让”不是集体最优策略。无节制的报复也不是最优策略。“一报还一报”的状态依存战略是最优的。一报还一报,我们习惯上把它叫做“以其人之道,还治其人之身”。 思考:为什么“以德治国”的提法较“依法治国”来说是一种倒退?,例2 智猪博奕 猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一边有一个猪食槽,另一边安装一个按钮,控制着猪食的供应。按一下电钮会有10个单位的猪食进槽,但谁按电钮谁需付两个单位的成本。若大猪先到,大猪吃9个单位,小猪只能吃一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。相应于不同战略的支付见下表:,这里纳什均衡是:大猪按,小猪等待,各得4个单位。 注:智猪博奕可解释如下情况 1.股份公司中,大股东承担监督职能,小股东搭便车。 2.小企业、大企业新产品研发、广告决策。 3.改革中的“大猪”与“小猪”。 4.村庄里富人、穷人与修路 还有那些事例中博弈双方是“大猪”和“小猪”的关系? 试思考,本博奕是否有占优战略?为什么?,纳什均衡(Nash Equilibrium): 纳什均衡是一个战略组合,当其余参与人不改变各自的战略选择时,某参与人也没有动力单独改变自己的选择,这一点对所有参与人都成立。 这就意味着,在纳什均衡的战略组合中,每一个参与人的战略选择都是针对其他参与人战略组合的最优选择。,例3 性别战,试找出本例的纳什均衡。 说明:纳什均衡的多重性与聚点均衡,例4 市场进入阻挠( 完全信息情况) 设想有一个垄断企业已在市场上(称为“在位者”),另一个企业虎视眈眈想进入(称为“进入者”)。在位者想保持自己的垄断地位,所以要阻挠进入者进入。他们各有两个战略可以选择。假定进入之前垄断利润为300,进入之后寡头利润合为100(各得50),进入成本为10,具体见下表,有两个纳什均衡:(进入,默许),(不进入,斗争),注:上述的(不进入,斗争)纳什均衡允许了不可置信威胁的存在,因为“斗争”对在位者企业也带来损失,是把“双刃剑”。可通过“承诺行动”使威胁变得可置信。 承诺行动:是当事人使自己的威胁战略变得可置信的行动。承诺行动意味着当事人要为自己的“失信”付出成本。 在位企业投资过剩生产能力。 军事上的破釜沉舟,例5 试用划线法求解以下两个博奕问题,2,0,0,1,0,3,0,1,1,2,1,0,参与人B,L M R,U D,参与人A,0,13,0,10,0,12,0,11,0,10,0,12,1,12,1,10,2,12,参与人B,C1 C2 C3,R1 R2 R3,参与人A,例6 社会福利博奕:参与人是政府和一个流浪汉,见下表。政府想帮助流浪汉,但前提是后者必须试图寻找工作,否则不予帮助;而流浪汉只有在得不到政府救济时才会寻找工作。,思考:本博奕纳什均衡是?,两个相关概念: 1.纯战略:若一个战略规定参与人在每一个给定的信息情况下,只选择一种特定的行动,称该战略为纯战略。 2.混合战略:若一个战略规定参与人在每一个给定的信息情况下以某种概率分布随机地选择不同的行动,称该战略为混合战略。 是政府的一个混合战略。 是流浪汉的混合战略。,政府的期望效用为:,易求政府最优化一阶条件为,流浪汉的期望效用函数为,混合战略纳什均衡是:政府以0.5的概率选择救济,0.5的概率选择不救济;流浪汉以0.2的概率选择工作,0.8的概率选择游荡。,纳什于1950年证明,每一个有限博弈,至少存在一个纳什均衡(纯战略纳什均衡或混合战略纳什均衡)。,纳什均衡的存在性,例7 分蛋糕博弈(纳什均衡的多重性),考虑两人分一块蛋糕,每个人独立地提出自己要求的份额。设x1为第一个人要求的份额, x2为第二个人要求的份额,若 ,每个人得到自己要求的份额;否则,谁也的不到什么。试给出本博奕的纳什均衡解。 思考:纳什均衡解是?,例8:一群赌徒围成一圈赌博,每个人将自己的钱放到身边地上(每个人都知道自己有多少钱,而不知他人有多少钱),一阵风吹来把所有钱混在一起,他们由于钱无法分辨是谁的而发生争执,后请来一位律师解决。律师宣布规则:每人将自己钱数写在纸条上,然后将纸条交给律师;如果所有人要求的加总不大于钱的总数,每个人得到自己要求的部分(如果剩余归律师所有);如果所有人要求的加总大于钱的总数,钱全部归律师所有。 思考:本例均衡是什么?,例9:库诺特寡头竞争模型: 设有两个参与人,分别称为企业1与企业2;每个企业的战略是选择产量;支付是利润,它是两个企业产量的函数。 令 代表第i个企业的产量 Ci(qi)代表成本函数 P=P(q1q2)代表逆需求函数 则第i个企业的利润函数为:,(q1*,q2*)是纳什均衡意味着,令,上述两个一阶条件分别定义了两个反应函数:,两个反应函数的交叉点即为纳什均衡q*= (q1*,q2*),q1*,q2*,R1(q2),R2(q1),N,特别地取C1(q1)=q1c, C2(q2)=q2c 即单位成本都是c,逆需求函数取 Pa(q1+ q2),依上述方法求得纳什均衡为: q1*q2*1/3(ac),每个企业的均衡利润都为:,又垄断企业的最优产量问题是:,由以上结果可知:寡头竞争的结果行业总产量增加,但行业总利润却减少。是典型的囚徒困境问题。,(一)无限重复博弈,1现值,其中i为利率,1/(1+i)为贴现率。,2触发战略,一次博弈时,纳什均衡为(低价,低价)。,当无限重复博弈时,双方企业可以通过“触发战略”,实现(高价,高价)均衡。,2触发战略,触发战略trigger strategies:又称冷酷战略grim strategies,任何参与人的一次性不合作将触发永远的不合作。,企业A违背合作协议,不合作的利润现值是PVA不=50+0+0+=50,企业A不违背合作协议,合作的利润现值是,企业A合作的条件是,2触发战略,因此触发战略维持合作的条件是,其中,不为参与人在一次博弈中不合作时的支付,合为参与人在一次博弈中合作时的支付,N为一次博弈中纳什均衡的支付。即当此条件满足,用以下的触发战略在无限次博弈中总能得到合作(共谋)结果:“只要没有参与人曾经欺骗过对方,合作就继续下去。如果任何一方欺骗了另一方,另一方就永远选择一次博弈的纳什均衡战略(即不合作)惩罚对方。”,2触发战略,上述条件的一个直观解释是:,左边表示现在不合作得到的一次性收益的增加值,右边表示由于今天的不合作使将来必须放弃的收益的现值。,例:无限重复博弈在产品质量上的应用,有限重复博弈,1子博弈精炼纳什均衡,重复博弈可以分为两种情况:(1)参与人不知道博弈什么时候结束;(2)参与人知道博弈什么时候结束。,第一种情况下,均衡同无限重复博弈。 第二种情况下,博弈的均衡为阶段博弈的纳

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论