已阅读5页,还剩534页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
-,1,博弈与社会导论:个人理性与社会效率,张维迎教授北京大学光华管理学院,-,2,纳什均衡与一致预期,张维迎教授北京大学光华管理学院,-,3,博弈的基本概念(1),参与人(players):博弈中决策主体的集合:什么人参与博弈?每个人是什么角色?行动(actions):每个人有些什么样行动可以选择?在什么时候行动?信息(information):在博弈中的知识;每个人知道些什么(包括特征、行动等)?战略(strategies):行动计划;每个人有什么战略可供选择?战略的完备性;,-,4,博弈的基本概念(2),支付(payoffs):每个人在不同战略组合下得到些什么?依赖于所有参与人的选择;均衡(equilibrium):所有参与人最优战略的组合;结果(outcomes):我们所感兴趣的东西。,-,5,静态博弈,最简单的博弈:所有参与人同时选择行动,并且只选择一次;“同时”是一个信息概念,而不一定与日历上的时间一致;,-,6,囚徒困境(prisonersdilemma),囚徒困境,坦白,不坦白,坦白,不坦白,8,8,0,10,10,0,1,1,无论对方如何选择,每个人的最优选择:坦白。所以,我们可以预测,结果将是(坦白,坦白),-,7,占优均衡(dominant-strategyequilibrium),一般来说,由于每个参与人的效用依赖于所有人的选择,因此每个人的最优选择(战略)也依赖于所有其他人的选择(战略)。但在上述例子中,一个人的最优选择并不依赖于他人的选择。这样的最优战略,被称为“占优战略”(dominantstrategy)。由所有参与人的占优战略构成的战略组合被称为“占优均衡”。占优战略均衡的出现只要求所有人都是理性的,但不要求每个参与人知道其他参与人是否理性。囚徒困境博弈有占优均衡,所以其结果很容易预测。,-,8,个人理性与集体理性的冲突,“囚徒困境”表明个人理性与集体理性的冲突。这样的例子很多:寡头竞争,军备竞赛,团队生产中的劳动供给,公共产品的供给,等等;许多的制度就是为解决“囚徒困境”而存在的;,-,9,公共产品(publicgoods),提供,不提供,提供,不提供,4,4,-1,5,5,-1,0,0,无论对方如何选择,每个人的最优选择:不提供。所以,我们可以预测,结果将是(不提供,不提供),-,10,公共产品与税收制度,比较私人产品与公共产品的不同:使用上排他性;私人产品是志愿购买的,但公共产品可能需要强制购买;税收制度就是保证公共产品的生产,解决公共产品生产上的“囚徒困境”,-,11,“囚徒困境”的一般表示,合作,不合作,合作,不合作,T,T,S,R,R,S,P,P,满足:RTPS;(S+R)R-T,-,13,“智猪博弈”(boxedpigs),有些博弈没有占优均衡,但通过剔除“坏”战略,我们可以预测博弈的结果。如“智猪博弈”,按,等待,按,等待,3,1,2,4,7,1,0,0,这个博弈中,大猪的最优选择依赖于小猪的选择,但小猪的最优选择与大猪的选择无关。如果大猪知道小猪的理性的,大猪将选择“按”。均衡是“大猪按,小猪等待”。“劣”战略:无论对方选择什么,如果自己选择A得到的总是收益小于选择B得到的收益,A就是相对于B的劣战略。,-,14,重复剔除占优均衡,“重复剔除严格劣战略”(iteratedeliminationofstrictlydominatedstrategy)的思路:首先找出博弈参与人的劣战略(dominatedstrategy)(假定存在的话),把这个劣战略剔除后,剩下的是一个不包含已剔除劣战略的新的博弈;然后在剔除这个新的博弈中的劣战略;继续这个过程,直到没有劣战略存在。如果剩下的战略组合是唯一的,这个唯一的战略组合就是“重复剔除占优均衡”(iterateddominanceequilibrium)。如果这样的解存在,我们说该博弈是“重复剔除占优可解的”(iterateddominancesolvable).,-,15,理性共识(commonknowledgeofrationality),(1)Zero-orderCKR:每个人都是理性的,但不知道其他人是否是理性的;(2)first-orderCKR:每个人是理性的,并且知道其他每个人也都是理性的,但并不知道其他人是否知道自己是理性的;(3)second-orderCKR:(1)+(2)+每个人知道(2)nth-orderCKR:R(b)C(b)R(b)C(b)Risrational,-,16,重复剔除与理性共识,重复剔除不仅要求每个人是理性的,而且要求每个人知道其他人是理性的,每个人知道每个人知道每个人是理性的,如此等等,即理性是“共同知识”(共识),C1,C2,C3,R1,R2,R3,10,4,1,5,98,4,9,9,0,3,99,8,1,98,0,100,100,98,这个博弈只要求一阶理性共识就可以预测均衡结果。如果把(下左)的第一个数字改为11呢?,-,17,最优选择,这个博弈只要求一阶理性共识就可以预测均衡结果:如果R相信C是理性的,R就知道C不会选择C3,所以R的最优选择是R1;如果C相信R是理性的,C就知道R不会选择R2,所以C的最优选择是C2。但要C预期R不会选择R3,需要二阶理性共识;要R不预期C会选择C1,需要三阶理性共识。,-,18,R排除C选择C1,RbelievesCbelievesRbelievesCisrational,(C1,C2),R1,C2,-,19,好事变坏事?,在单人决策中,个人给定选择在所有情况下的收益都增加,一个人的状况不会变得更坏,但博弈中则不同。,上,下,左,右,上,下,左,右,-1,3,2,1,0,2,3,4,1,3,4,1,0,2,3,4,-,20,选择越多,对理性共识的要求越高,R1,R2,R3,R4,C1,C2,C3,C4,5,10,0,11,1,20,10,10,4,0,1,1,2,0,20,0,3,2,0,4,4,3,50,1,2,93,0,92,0,91,100,90,-,21,(1)Zero-orderCKR:CnotchooseC4forCisrational(2)1st-orderCKR:RnotchooseR4forR(b)C(3)2nd-orderCKR:CnotchooseC1forC(b)R(b)C(4)3rd-orderCKR:RnotchooseR1forR(b)C(b)R(b)C(5)4th-orderCKR:CnotchooseC3forC(b)R(b)C(b)R(b)C(6)5th-orderCKR:RnotchooseR3forR(b)C(b)R(b)C(b)R(b)Cso,(R2,C2)isanequilibrium,-,22,不能用重复剔除解的博弈,许多博弈没有占优均衡,也没有重复剔除的占优均衡。考虑如下博弈:,C1,C2,C3,R1,R2,R3,0,4,4,0,5,3,4,0,0,4,5,3,3,5,3,5,6,6,-,23,可理性化的选择,Rationalizablestrategy:不能被重复剔除的战略;或者说,可以被合理的信念(belief)所支持的行为;例如:R理性化选择R1:如果R(b)C选择C2,如果R(b)C(b)R会选择R2;如果R(b)C(b)R(b)C会选择C1;如果R(b)C(b)R(b)C(b)R会选择R1,-,24,Consistentlyalignedbeliefs(CAB),考虑(R3,C3):对方不会犯预期错误:R选择R3,如果他认为C会选择C3;C会选择C3,如果他认为R会选择R3。CAB:每个人对别人行为的预期(信念)是正确的;Harsanyidoctrine:如果两个理性的人具有相同的信息,他们一定会得出相同的推断和相同的结论;RobertAumann:rationalagentscannotagreetodisagree.,-,25,纳什均衡与一致预期,纳什均衡:所有参与人的最优战略的组合:给定该战略中别人的选择,没有人有积极性改变自己的选择。一致预期:基于信念的选择是合理的;支持选择的信念是正确的;预期的自我实现:如何所有人认为这个结果会出现,这个结果就会出现。预期是自我实现的,预期不会错误。如果你认为我预期你将选择X,你就真的会选择X。,-,26,哲学思考,如果参与人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。,-,27,寻找纳什均衡,C1,C2,C3,R1,R2,R3,100,100,0,0,50,101,50,0,1,1,60,0,0,300,0,0,200,200,-,28,纳什均衡:举例,广告博弈纳什均衡:(做广告,做广告),企业1,企业2,-,29,利用纳什均衡寻租,考虑股票市场融资的例子:设想企业价值是100,现在发行的流通股为100股,每股价值1元。现在假定经理想筹集100元,投资价值只有50元。有人买新股吗?假定每一股配4股,价格为0.25元。如果股东不接受配股:原来一股1元的价值就变成0.3元(=150/500);如果接受配股,他持有的股票的价值是1.5元;因为配股的成本是1元,所以他的最优选择是接受配股。,-,30,所有权配置与等级结构,考虑团队生产:让其中的一个人变成所有者,工作,偷懒,工作,偷懒,6,6,2,2,0,8,8,0,-,31,纳什均衡与学习过程,R2,R1,NE,q1,q2,-,32,双寡头竞争:Cournot博弈,两个企业同时选择产量,价格由市场决定;假定需求函数为其中为企业1的产量,为企业2的产量假定成本函数为:那么,利润函数为:,-,33,双寡头竞争(续),企业最大化利润的一阶条件为:纳什均衡产量:纳什均衡利润为,-,34,垄断产量和垄断利润,垄断企业的目标函数:垄断产量:垄断利润:,-,35,划拳博弈,老虎,鸡,虫,杠子,老虎,鸡,虫,杠子,0,0,1,-1,0,0,-1,1,-1,1,0,0,1,-1,0,0,0,0,-1,1,0,0,1,-1,1,-1,0,0,-1,1,0,0,-,36,混合战略纳什均衡,有些博弈没有“纯战略”纳什均衡,但有混合战略纳什均衡,如监督博弈。,监督,不监督,偷懒,不偷懒,1,1,1,2,2,3,2,2,给定工人偷懒,老板的最优选择是监督;给定老板监督,工人的最优选择是不偷懒;给定工人不偷懒,老板的最优选择是不监督;给定老板不监督,工人的最优选择是偷懒;如此循环。,-,37,纳什均衡的存在性问题,每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略);如果一个博弈存在两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡。,-,38,风险与均衡,由于纳什均衡要求理性共识和一致预期,当人们可能犯小小的错误时,纳什均衡不一定被选择。如下面这个博弈中,多数人将选择“下”而不是“上”。,上,下,左,右,8,10,-1000,9,7,6,6,5,只要B有千分之一的概念错误地选择右,A将选择下;如果B怀疑A怀疑自己可能犯错误,B将选择右。所以,出现的不是纳什均衡,-,39,有问题的纳什均衡?,C1,C2,C3,R1,R2,R3,2,2,3,1,0,2,1,3,2,2,3,2,2,0,2,3,2,2,-,40,第三章多重均衡与制度和文化,张维迎北京大学光华管理学院,-,41,实验:选数博弈,规则:有两个人,110十个数字,每个人可以选择其中的任意五个;如果两个人的选择没有重复,每人得到50元;否则,各为0。,-,42,多重纳什均衡:产品标准,许多博弈可能有多个纳什均衡,3.5“,5.5“,3.5“,5.5“,8,8,3,2,2,3,6,6,这个博弈被称为“协调博弈”:有两个纯战略纳什均衡,一个混合战略均衡。哪一个将出现呢?,-,43,交通博弈,靠左行,靠右行,靠左行,靠右行,1,1,1,1,-1,-1,-1,-1,-,44,约会博弈,芭蕾舞,足球场,芭蕾舞,足球场,1,2,0,0,0,0,2,1,-,45,进门博弈,先进,后进,先进,后进,-1,-1,-1,-1,2,1,1,2,-,46,分蛋糕博弈,x1,x2,1,1,任何满足x1+x2=1的点都是纳什均衡。,-,47,资源争夺博弈(chicken),Hawk,Dove,Hawk,Dove,-1,-1,5,5,10,0,0,10,-,48,如何协调?,仅仅“理性”是不够的;FOCALPOINT(PROMINENCE):Schelling(1960);帕累托最优均衡:可以通过协商选择一个纳什均衡;cheaptalking;文化与制度行业组织;,-,49,帕累托最优均衡,3.5“,5.5“,3.5“,5.5“,8,8,3,2,2,3,6,6,(3.5“,3.5”)帕累托优于(5.5“,5.5”),Cheaptalk可以帮助协调到一个帕累托最优均衡,-,50,为什么要相信?,C1,C2,R1,R2,9,9,0,8,8,0,7,7,不论C选择什么,他都有积极性告诉R他将选择C1;所以没有理由认为R应该相信C的话。,R,C,-,51,锁定效应与路径依赖,如果博弈参与人很多,达成协议的成本很高,最初的非帕累托均衡可以被锁定(lock-in),导致路径依赖(pathdependence):每个人多偏好于新产品(或标准),如果其他人都选择新产品的话;但由于每个人都预期其他人不会选择新产品,所以每个人的最优选择是不转向新产品,结果是整个社会被锁定在现有的产品(标准)(非帕累托最优);这常被用来作为市场失灵的理论证据;经验证据:QWERTvsDvorak键盘;BetavsVHS录象机;MAC与IBM计算机软件;但最新的研究似乎正在推翻这些广泛流行的结论。,-,52,键盘的寓言,1868年ChristopherL.Stoles发明QWERT键盘;由Remington公司生产;1936年Dvorak发明简化键盘(DSK,DvorakSimplifiedKeyboard):认为这一键盘通过平衡双手和更有力的手指之间的工作量,极大地减少了打字产生的手指运动,其优势在于提高速度、减少疲劳,以及更容易的学习。为什么没有被采用?最初的打字员不选择学习Dvorak,因为Dvorak机器很难找到;办公室不原配置Dvorak,因为找不到打字员;但这些说服并不成立:(1)支持Dvorak更好的论点证据不足,许多是猜测;(2)人体过程学方面的研究发现,它没有任何在科学上可靠、重要的优势;(3)打字机市场上的竞争要比通常报告的要激烈的多;(4)其他许多比赛证明其他键盘的优越性。,-,53,VHS与Betamax,Sony公司1975年开始销售Betamax,并把一再把该技术提供给松下、JVC;1976年4月三家公司最终同意召开一次会议来比较Betamax,VHS和VX;但由于JVC的侵权,SONY和松下-JVC分道扬镳;SONY相信“小”,松下相信“长”;SONY吸引东芝和三洋支持Beta,松下则把日立、夏普和三菱拉入阵营;一种制式的任何改进都伴随着另一阵营的相同改进;一方降价,另一方也跟进。两中制式在几乎所有方面都被证明是完全相同的,除了一方面:VHS播放时间更长,Beta两小时,VHS4小时;Beta5小时,VHS8小时。市场在播放时间和磁带压缩之间的投票是决定性的:1979年前,VHS在美国的销售是Beta的三倍,1983年前,Beta的在世界市场份额的份额下降到12%;1984年,只有SONY在生产Beta。,-,54,MAC与IBM,据称:Macitosh要比命令行DOS好得多,甚至比基于DOS的Windows好,但为什么消亡了?通常的解释:DOS成功了是因为它成功了:有更多的软件,更多的用户;事实是:(1)成本优势;(2)速度优势;(3)商业环境中,一台机器只用于一种软件,一旦操作员学会,Macitosh的界面优势就没有了;(4)为DOS写软件要容易的多。StanLiebowitz,andStephenMargolis,“TheFableoftheKeys”,JLE(1990);Beta,MacitoshandotherFabulousTales”,1999(Winner,LosersandMicrosoft).,-,55,大学改革:教师招聘,只留本校生,不留本校生,只留本校生,不留本校生,2,2,2,0,0,2,10,10,-,56,交通博弈与交通规则,靠左行,靠右行,靠左行,靠右行,1,1,1,1,-1,-1,-1,-1,-,57,法律和社会规范如何协调预期,法律和社会规范就是这种协调预期的规则,帮助人们在多个纳什均衡中筛选一个特定的纳什均衡。社会规范是通过习惯、长期的交互博弈产生的行为规则,法律是立法机关制定的行为规则,但不论是法律还是社会规范,它们的功能都是协调预期。,-,58,交通规则的演变,在多个纳什均衡之间不存在优劣之分时,偶然事件对选择具有重要意义;从历史上来考察,许多交通规则一开始并不体现为法律,而是长期演化而来的。在欧洲大陆的早期,道路行走规范是非常地方化的,有些地方采用靠左走的习惯,有些地方采用靠右走的习惯,是不统一的。只是随着道路的增加和地区间交往的扩大,地方性的习惯才逐步演变为区域性的规范,然后有演变为全国性的规范。但直到世纪前,道路规则也仅仅是作为规范而得到遵守,而不是作为交通法律而得到执行。现在欧洲大陆的靠右走的规则是在法国兴起的。,-,59,交通规则的演变,在法国大革命以前,贵族的马车习惯上是靠左行的,穷人在路上看到富人的马车来了,要站在马路的右边。因此,靠左行与“特权阶级”相联系,而靠右行被认为更为“民主”。随着法国大革命,作为一个革命的象征,规定所有的车都要靠右走。随着拿破仑对欧洲大陆的征服,拿破仑将法国的规则带给了欧洲,也包括靠右行驶的规则。当然,在地域上这个规则的转变也是从西到东逐步完成的。比如说,与靠右行的西班牙接壤的葡萄牙是在一战之后才转为靠右行,奥地利是从西到东一个省一个省逐步转变的,匈牙利、捷克和德国是在二战前才由左行转向右行的。瑞典,一直到1967年,才通过法律宣布从靠左行改为靠右行。,-,60,文化的冲突与协调,为什么欧洲大陆的交通规则收敛于一致?英国将如何办?文化冲突,无论是组织和组织之间的,还是国家和国家之间的,大部分不过是游戏规则社会规范和法律的冲突,用博弈论的话来说,是一个均衡的选择问题;全球化意味着资源的重新分配。,-,61,解决规则冲突的三个方式,一是一个规则取代其他的规则,让一部分人改变行为规范适应另一部分人,也就是所谓的“接轨”,如前面讲的欧洲大陆交通规则的演变所显示的。二是建立全新的规则,如中国人和德国人在一起交流时都用英语,而不是中文,也不是德文;三是建立协调规则的规则。如“入乡随俗”,“客随主便”。究竟哪一种,与规则要解决的问题有关,也与其他因素有关。,-,62,一致与冲突,先走,后走,先走,后走,-1,-1,2,1,1,2,-1,-1,进门博弈,-,63,文化既解决冲突又协调预期,尊老爱幼;妇幼保护;遵师重教;先来后到;社会分层与非对称权力(排位问题;黑社会组织);公平观念(如分蛋糕博弈);抓阄;,-,64,分蛋糕问题与公平观念,x1,x2,0.5,0.5,-,65,信息与身份(identity),信息对预期的协调很重要:如果不知道谁是谁,协调就很困难;身份是传递信息的重要工具;身份的外在化:服饰,车座,秘书;学界的官本位问题;,-,66,资源争夺博弈(chicken),Hawk,Dove,Hawk,Dove,-1,-1,5,5,10,0,0,10,-,67,产权的先占规则,人们为什么遵守这个规则?人们希望得到别人认可的愿望:一旦规则建立,每个人都预期其他人会遵守规则;给定这个预期,每个人发现遵守规则是自己的利益所在,也希望别人能遵守这个规则。任何不守规则的行为都会使守规则的人受到损害或者感到威胁,从而引起后者的愤怒;任何其他人也因此会觉得自己未来的利益受到威胁,对此种行为表示不满,对受害人表示同情;少数人不守规则并不会导致规则的消失;但如果规则总是偏向于某一组特定的人群,受到不公正对待的人并不会蔑视不守规则的人,规则就容易被违反。罗尔斯(Rawls)的正义论,-,68,关于论资排辈问题,容易被个人操纵的信息是没有价值的;当缺乏其他有效的信息时,资历可以成为协调博弈的信息;孙丕扬于万历22年(1595年)出任吏部尚书,创建了“掣签法”:官员们无论贤愚清浊,一律抽签上岗。(吴思潜规则),-,69,为什么制度要有稳定性?,制度是为了稳定预期,频繁的变化会打乱人们的预期;希思罗机场的MeetingPoint;,-,70,第四章动态博弈与承诺,张维迎北京大学光华管理学院,-,71,动态博弈,行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做出最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?如下棋,-,72,博弈树(gametree),A,B,B,进入,不进入,进入,不进入,进入,不进入,(-1,-1),(1,0),(0,1),(0,0),-,73,动态博弈中的战略,战略是一个完备的行动计划:在博弈开始之前就规定出每一个决策点上的选择,即使这个决策点实际上不会出现。考虑老师与学生之间考试之后的一个博弈:老师先行动(判分),学生后行动(在不同分数下如何应对)。假定学生的实际成绩是不及格。,-,74,战略表式下的纳什均衡,及格,不及格,老师,学生,A,F,F,A,A,A,F,F,-1,1,-10,-10,-1,1,-10,-10,-10,-10,1,-1,1,-1,-10,-10,-,75,三个纳什均衡,(及格;A,F);(不及格;F,A);(不及格;A,A)问题:哪一个会出现呢?,-,76,不可置信的威胁(noncrediblethreat),在(及格;A,F)和(不及格;F,A)中,学生“报复(F)”的威胁是不可信的:无论老师判“及格”还是“不及格”,“报复”不是学生的最优选择;事前(exante)和事后(expost):一种战略所规定的行动在事前看来是最优的,但事后看并不是当事人的最优选择,这种行动就不可置信,该战略就不是一个合理的战略。,-,77,精炼纳什均衡(perfectNE),不包含不可置信的行动的战略所组成的纳什均衡被称为“精炼纳什均衡”;也就是说,不论过去发生了什么,构成精炼纳什均衡的战略,其所规定的行动在每一个决策点上都是最优的。所以,又称为“序惯均衡”(sequentialequilibrium);首先必须是“纳什均衡”,但并非所有纳什均衡都是合理的;只有其战略不包含不可置信行动的纳什均衡才是合理的。,-,78,子博弈(subgame),由原博弈中某个决策点(信息集)开始的部分构成一个子博弈。,1,2,3,2,3,原博弈,子博弈I,子博弈II,-,79,子博弈精炼纳什均衡,精炼纳什均衡:(1)在原博弈是一个纳什均衡;(2)在每一个子博弈上都是纳什均衡。考试博弈:(及格;A,F)在第二个子博弈上不构成纳什均衡;(不及格;F,A)在第一个子博弈不构成纳什均衡;(不及格;A,A)在所有子博弈上都构成纳什均衡。,-,80,老师,学生,学生,及格,不及格,报复,接受,报复,接受,(-10,-10),(-1,1),(-10,-10),(1,-1),考试博弈,-,81,逆向归纳法(backwardinduction),在有限博弈中,我们可以用逆向归纳法求解精炼纳什均衡:从最后一个决策点开始,找出该子博弈的纳什均衡;然后再倒回到倒数第二个决策点,找出决策者的最优决策(假定最后一个决策者的决策是最有的;如此一直到初始决策点,所有子博弈上的最优选择就是精炼纳什均衡。又称“rollback”.,-,82,举例,1,2,1,(2,0),(5,0),(4,2),(1,1),U,D,R,L,U,D,-,83,均衡路径与非均衡路径,精炼纳什均衡下所经过的决策点和最优选择构成的路径,称为均衡路径(equilibriumpath);其他的路径是非均衡路径(off-equilibriumpath);均衡结果依赖于非均衡路径上的选择:1只所以一开始就选择U,是因为他预期如果选择D的话,2将选择L;而2只所以选择L,是因为她预期如果选择R的话,1将选择U。,-,84,精炼均衡与理性共识,逆向归纳的过程实际上就是重复剔除劣战略的过程,其前提是博弈规则和理性共识:每个人是理性的,每个人知道每个人是理性的,如此等等。因此,精炼纳什均衡的合理性取决于理性共识的合理性。后面再讨论。,-,85,先动优势与后动优势,在动态博弈中,行动总有先后顺序。有些博弈具有先动优势(first-moveradvantage),但有些博弈具有后动优势(second-moveradvantage).让产量竞争具有先动优势,而价格竞争可能是后动优势;开会发言?在不完全信息下,顺序更重要。但有些博弈既没有先动优势,也没有后动优势,如抓阄。,-,86,练习:数30博弈,数30游戏:两个人,交替选择数字,每次只能选择一个或两个数字。每次可以选择1-3个数字呢?,-,87,不可置信威胁,精炼纳什均衡剔除了不可置信的威胁,使得我们可以更合理地对博弈中参与人行为的预测;不可置信威胁的根源是事前最优与事后最优不同,导致许多帕累托效率无法实现;劫机事件为什么会发生?管教孩子为什么困难?家族企业为什么难以实行制度化管理?大企业为什么效率低?(TBTF)研究学录取中的问题;,-,88,承诺,承诺是将不可置信的威胁变成可置信的威胁的行动:威胁不仅是事前最优的,也是事后最优的。承诺意味着限制自己的自由:选择少反而对自己好。如“破釜沉舟”的故事。围城战略。,-,89,举例:如果1承诺不选择U,1,2,1,(2,0),(5,0),(4,2),(1,1),U,D,R,L,U,D,-,90,承诺举例,婚姻中的承诺:彩礼、昂贵的婚礼可以理解为一种对婚姻的承诺;订金、抵押物做为对交易的承诺;“安营扎寨”;固定资产投资可以作为承诺;所有权的承诺作用;,-,91,最惠条款,生产耐用品的企业经常被“降价预期”所困扰:如果消费者预期企业将降价,他们将会等待,结果,企业只能降价。如汽车行业面临的问题;最惠条款可以起到承诺的作用:企业不会降价了。,-,92,例子,产量,价格,收入,1,2,3,4,100,80,40,30,100,160,120,120,假定企业一开始定价80,如果前两个消费者购买了,企业将有积极性在50的价格下向第三个顾客出售。预期到这一点,前两个顾客将不会购买。如果企业向保证,任何降价的差额将返还顾客,前两个顾客将会购买。因为企业事实上不会降价了。,-,93,大学改革:不升即走(up-or-out),没有这样的制度,人才就可能得不到公正评价;“不升即走”是大学对教员的承诺:不会压制优秀人才。,-,94,Up-or-out博弈,教员,学校,学校,努力,不努力,提升,不提升,提升,不提升,(4,4),(1,7),(3,3),(2,4),(4,4),(x,0),(3,3),(y,0),老制度,新制度,-,95,画家和政府的苦恼,名画的价值取决于数量,画家常为无法承诺而苦恼:谁相信他不会再画呢?这可能是为什么死了画家的画最值钱。政府也有类似的问题。政府经常缺乏承诺:给定投资者进入的情况下,多征税是最优的;但投资者预期到这一点,将不愿意进入。中国许多地方支付有严重的机会主义行为。“坦白从宽,抗拒从严”面临的问题也如此。,-,96,作为承诺的法律,法律改变事后的选择空间或选择成本,所以可以起到承诺的作用;合同的承诺作用(违约的成本增加,使得遵守合同更可能是事后最优的选择);刑法:为什么不能商量?为什么对严重犯罪要执行死刑?台湾问题:立法还是政府随机应变?“法治”(ruleoflaw)是政府的承诺;,-,97,有限政府(limitedgovernment),市场要求有限政府:政府不仅要保护个人的基本权利不受其他人的侵犯,而且要把尊重这些权利作为对政府行为的限制。如果政府的自由裁量权过大,政府官员为所欲为,政府本身会受到损害;这里的关键是:老百姓与政府之间的博弈。,-,98,光荣革命与英国政府的财政,年份总收入总支出总国债1668-16881.92.12.016954.16.28.416973.37.916.717206.35.654.0177011.410.5130.6178012.522.6167.2179017.016.8244.0,-,99,-,100,主权债模型,L,D,G,L,L,H,R,P(a),P(a),-,101,政府的举债能力,假定政府借D的债务,利息率是r,贷款人对政府所能实施的最大可信惩罚是P,那么,如果D(1+r)P(a),政府将还钱,否则政府将不还钱。所以政府的举债能力为DTPS;(S+R)=0.25;结论:如果B认为A非理性的概率不小于0.25,B在第1阶段会选择合作,即使博弈只重复两次。,-,213,博弈重复3次,t=1,t=2,A,非理性(p),理性型(1-p),B(理性型),合作,X,?,背叛,X,X,t=3,X,背叛,背叛,-,214,参与人A(理性)的选择,如果A是理性的,在第2阶段和第3阶段一定会选择背叛,但第1阶段也可能选择合作,因为建立一个合作的形象可以换取B在第2阶段的合作;如果p=0.25,并且A认为B在第1阶段会合作,给定A在第2阶段合作的话B在在第2阶段也会合作,那么A选择合作得到:3+4+0=5;如果A选择背叛,得到:4+0+0=4;所以合作是最优的。,-,215,参与人B的选择,B有四种战略:(合作,合作,背叛);(合作,背叛,背叛);(背叛,背叛,背叛);(背叛,合作,背叛),-,216,(合作,合作,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B(理性型),合作,X=合作,合作,背叛,X=合作,X=合作,t=3,X=合作,背叛,背叛,3+3p+(-1)(1-p)+4p+0=8p+2,预期效用=,-,217,(合作,背叛,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B(理性型),合作,X=合作,合作,背叛,X=合作,X=背叛,t=3,X=背叛,背叛,背叛,3+4p+0(1-p)+0=4p+3,预期效用=,-,218,(背叛,背叛,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B(理性型),合作,X=背叛,合作,背叛,X=背叛,X=背叛,t=3,X=背叛,背叛,背叛,4+0+0=4,预期效用=,-,219,(背叛,合作,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B(理性型),合作,X=背叛,合作,背叛,X=背叛,X=合作,t=3,X=合作,背叛,背叛,4+(-1)+4p+0(1-p)=4p+3,预期效用=,-,220,P=1,8p+2(合作,合作,背叛),0.2,4p+3(合作,合作,背叛)(背叛,合作,背叛),=4(背叛,背叛,背叛),-,221,结论,只要p=0.25,下表所列战略组合是一个精炼纳什均衡:理性型A在第1阶段选择合作,然后在第2和第3阶段选择背叛;B在第1和第2阶段选择合作,然后在第3阶段背叛。,-,222,精炼纳什均衡,t=1,t=2,A,非理性(p),理性型(1-p),B(理性型),合作,X=合作,合作,背叛,X=合作,X=合作,t=3,X=合作,背叛,背叛,-,223,一般结论,可以证明:如果博弈重复T次,只要p=0.25,对于所有的T=3,下列战略组合构成一个精炼纳什均衡:理性型A在t=1.T-2阶段选择合作,在T-1和T阶段选择背叛;B在t=1.T-1阶段选择合作,在最后阶段T选择背叛。背叛只在最后两阶段出现。,-,224,双方不完全信息,在单方不完全信息下,只要p=4;T*=(5-p)/p;所以,无论p多小,只要博弈重复的次数足够大,一开始就选择背叛不是最优的。,-,227,KMRW定理,在不完全信息的情况下,只要博弈重复的次数足够长,参与人就有积极性在博弈的早期建立一个“合作”的声誉;只是在博弈的后期,才会选择背叛;并且,非合作阶段的数量只与p有关,而与博弈的次数T无关。看似不理性的行为其实是理性的;,-,228,“大智若愚”,应该树立什么样的形象?合作与非合作;强硬与懦弱;对“不理智”(情绪化)行为的新解释;,-,229,解开“连锁店悖论”,Selten(1978);,进入者,在位者,进入,不进入,默许,斗争,(40,50),(-10,0),(0,100),-,230,声誉的积累,-,231,举例,为什么越有名气的人越在乎自己的声誉?(终身教授的激励问题);画家烦恼;政府的声誉;(中国与英国有关香港问题的争论);,-,232,第8章非对称信息与逆向选择,张维迎北京大学光华管理学院,-,233,关于“禁乞令”的争论,实施“禁乞令”的城市:北京:2003年12月:苏州:2003年12月15日;南京:2004年3月1日;广州:长沙,成都:劝戒市民不要向乞讨者施舍钱财;争论:,-,234,真乞丐与假乞丐,乞丐的“职业化”;南京市公安局:他们去年曾在此次公布的重点救助区域内,对流浪乞讨者做过登记.目前,该区域内共有乞丐1733人,只有85人表示愿意接受救助,只占不到5%,而愿意去救助站的更是少到只有13人.,-,235,非对称信息,Asymmetricinformation定义:交易关系中一方知道而另一方不知道的信息,如果卖者知道商品的质量,而买者不知道;职工知道自己的能力,经理不知道。双方都不知道的不是非对称信息,-,236,分类,非对称信息可以分为事前(exante)非对称和事后(expost)非对称。事前非对称信息是指签约之前存在的非对称信息,所以,又称为隐藏信息(hiddeninformation),如产品质量;事后非对称信息指签约之后发生的非对称信息,又称隐藏行动(hiddenaction),如工人的努力水平。,-,237,事前非对称信息举例,保险公司/投保人;卖者/买者;雇主/雇员;债权人/债务人;股东/经理人;患者/大夫;陌生人之间;,-,238,逆向选择,旧车市场:卖车人知道车的质量,买车人不知道,只知道平均质量,按照平均质量付价格。但此时,高质量车将退出市场,在市场上的车的平均质量将
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医学围绝经期综合征案例分析课件
- 农业部门全年总结
- 2025年黑龙江省双鸭山市集贤县辅警招聘考试题库附答案解析
- 2025年自贡市沿滩区辅警招聘考试题库附答案解析
- 2026 年高职健身指导与管理(健身指导)试题及答案
- 2025年贵阳银行秋招考试真题及答案
- 2025年无人机驾驶员执照考试押题卷及解析(含答案)
- 电子商务员计算机网络基础模块测试题(答案)
- 2025年度安徽省招聘社区工作者考前训练题(含答案)
- 性传播感染与HIV预防:协同防控策略
- 2025年6月大学英语六级考试真题第1套(含答案+听力原文+听力音频)
- 人教统编版高中语文 选择性必修中册《第三单元回到历史现场研习任务》教学设计
- 2025贵州毕节市市直事业单位面向基层公开考调工作人员笔试考试参考试题及答案解析
- 重庆大学硕士研究生论文开题报告格式及范文剖析
- 2025化工维修岗位试题及答案
- 成都交子金融控股集团有限公司招聘笔试题库2025
- 2025浙江省测绘科学技术研究院招聘编外人员12人笔试考试参考试题附答案解析
- 基于PLC的自动洗车控制系统设计
- 2025年铁路招聘考试题库及答案
- 隆鼻护理查房
- 食品安全管理员考试题库及答案(2025版)
评论
0/150
提交评论