博弈论讲义课件

上传人：阿*** IP属地：江苏上传时间：2022-10-08 格式：PPT 页数：271 大小：2.93MB 积分：50 举报 版权申诉

已阅读5页，还剩266页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、博弈论Game Theory上海财经大学金融学院韩其恒hqheng参考书籍Herbert Ginis(2009), The Bounds of Reasons Game Theory and the Unification of the Behavioral Sciences, Prinston University PressKen Binmore(2007): Does Game Theory Work? The Bargaining Challenge, The MIT Press, London, EnglandColin F. Camerer(2006)，Behavior Game

2、Therory: experiments in Strategic Interaction. 中国人民大学出版社。谢始予（2002），第二版，经济博弈论。复旦大学出版社美罗伯特吉本斯（1999），博弈论基础。中国社会科学出版社张维迎（1996），博弈论与信息经济学。上海人民出版社，上海三联书店美普拉伊特 K 杜塔（2005），策略与博弈：理论与实践。上海财经大学出版社。施锡铨（2002），博弈论。上海财经大学出版社。美朱弗登博格，法让梯若尔（2003），博弈论。中国人民大学出版社Martin J.Osborne(2005)，博弈入门。上海财经大学出版社。Other Reference陈学彬

3、（1999），宏观金融博弈分析。上海财经大学出版社。Avish Dixit与Susan Skeath（2002），策略的赛局。弘智文化事业有限公司美肯.宾默尔（2003），博弈论与社会契约-公平博弈。上海财经大学出版社。王则柯（2003），新编博弈论平话。中信出版社白波（2004），博弈游戏。哈尔滨出版社马广奇(2006)，资本市场博弈论。上海财经大学出版社美罗杰 A.麦凯恩（2006），博弈论：战略分析入门。机械工业出版社王永春（2007），博弈论的诡计：日常生活中的博弈策略。中国发展出版社James Miller(2003), GAME THEORY AT WORK: How to Use

4、 Game Theory to Outthink and Outmaneuver Your Competition. McGraw-Hill李维（2007），博弈全书。中央翻译出版社, an excellent web resource for game theory主要内容导论Nash均衡进化博弈有限重复博弈无限重复博弈拍卖与Bayes均衡机制设计信号博弈人生是永不停息的博弈过程经济学家梯若尔(Jean Tirole)： “正如理性预期使宏观经济学发生革命一样，博弈论广泛而深远的改变了经济学家的思维方式。”如果情况确实如此，对今天的经济学家来说，不懂得博弈论显然是不行了。保罗. 萨缪尔森：

5、要想在现代社会做一个有文化的人，你必须对博弈论有一个大致的了解。The Brute Force Approach （Simon Singh, Fermats last theorem）In 1944 John von Neumann cowrote the book The Theory of Games and Economic Behavior, in which he coined the term game theory. Game theory was von Neumanns attempt to use mathematics to describe the structure

6、of games and how humans play them.After Second World War the RAND corporation realized the potential of von Neumanns ideas and hired him to work on developing Cold War strategies. From that point on, mathematical game theory has become a basic tool for generals to test their military strategies by t

7、reating battles as complex games as chess. A simple illustration of the application of game theory in battles is the story of the truel.A TruelRule: Mr Black, Mr Grey, Mr WhiteQuestion: where should Mr Black aim at his first shot?这个故事告诉我们：在多人博弈中常常由于复杂关系的存在，而导致出人意料的结局。导论1. 什么是博弈论定义：关于包含相互依存情况中理性行为的研究

8、。诺贝尔经济学奖得主奥曼在权威的帕尔格雷夫大词典中，对“博弈论”词条的解释十分精辟和凝练。他认为，博弈论描述性的名称应是“互动的决策论”。决策的决策决策与博弈：田忌赛马-3，3-1，1-1，11，-1-1，1-1，1-1，1-3，31，-1-1，1-1，1-1，1-1，1-1，1-3，3-1，1-1，11，-1-1，1-1，1-1，1-3，31，-1-1，11，-1-1，1-1，1-1，1-3，3-1，1-1，11，-1-1，1-1，1-1，1-3，32462644264626246421351533153515135312、相互依存博弈：动态的决策过程有限性与具体问题具体分析本质上一般均衡应

9、当是博弈均衡的一个特例。The Travelers Dilemma: Paradoxes of Rationality in Game TheoryBasu, K. ，Indian，Permanent Resident: USA，Department of Economics, Cornell UniversityAmerican Economic Review， 1994这个故事对于理性行为假设的适用性提出了警告。理性： CKR (Common Knowledge of Rationality)Dirty faces game (Littlewood, 1953): the game sud

10、denly. Three people in the house, not allowed to speak. Beautiful women come in, said: at least one of you is a dirty face. Three ring of view, there was no response. Beauty said: you know what? the beginning of the common knowledge, and truth: the three faces are dirty, all blushed. Behavior and le

11、arning in the “dirty faces gameRobertoA.WeberExperimental Economics, 2001理性是一个学习的过程ADAPTIVE BEHAVIOR AND COORDINATION FAILUREJohn B. Van Huyck, Joseph P. Cook, and Raymond C. Battalio，1996，Journal of Economic Behavior“Continental Divide” Games分水岭实验In coordination games, players want to conform to wh

12、at others do (although they may have different ideas about which conformist convention is best).奇数个参与者从114中选个数字，然后算出他们的中值，后面列出他们的损益。10组实验：5组从7或以下的中位数开始，无一例外的流向了低支付均衡3。另外5组从8或以上开始，并流向了高支付均衡12。在水壶里出发时两滴紧紧相靠的水滴却最终分开了数千英里。历史趋势是强大的，造成了对”初试形势的极端敏感”。实验博弈论已经取得的进展实际的人类理性是有限理性，而不是理性假定认为的绝对理性。实际中的博弈行为往往趋近于合作，而

13、不是非合作。实际中的博弈行为受非自利动机的影响，如互惠原则。实际中的博弈行为是非常复杂的，人们出于实用的目的，有相当部分的行为可能是随机的。丈夫|妻子BFB1，20，0F0，02，16. 博弈的例子性别战（battle of sexes）官员|政府监督不监督贪污R-F，F-C-SR，-S不贪污0，-C0，0腐败问题的博弈分析庄家|交易所控制不控制大交易量-5，410，-4中等交易量0，15，2庄家与交易所之间的博弈庄家|政府惩罚不惩罚=5%-5，-55，-5h0（为限制考察的数量）w表示代理人的工资，wgv表示委托人工作所产生的价值纯策略Nash均衡结论：无纯策略Nash均衡代理人|委托人监

14、察不监察偷懒0，-hw,-w工作w-g,v-w-hw-g,v-w混合策略Nash均衡代理人|委托人监察（q）不监察（1-q）偷懒（p）0，-hw,-w工作（1-p）w-g,v-w-hw-g,v-w代理人|委托人监察（q）不监察（1-q）偷懒（p）0，-hw,-w工作（1-p）w-g,v-w-hw-g,v-wNonmetric test of the minimax theory of two-person zerosum gamesBARRY ONEILL, Economic Sciences, 1987现代实验：人vs人row player payoff5、多重Nash均衡高红阳（纳什均衡的

15、重要影响及其问题局限）:纳什均衡的多重性问题也是一个普遍的问题，甚至某些仅有少数几个可选策略的简单博弈也存在多重纳什均衡，这也是使纳什均衡分析的有效性大打折扣的原因之一，尤其是当某些博弈出现无穷多个纳什均衡时，情况更是糟糕。因此，研究“从多重纳什均衡中挑选一个作为合理且正确预测”的一般性规律，将有助于多重问题的解决。师生博弈交通博弈靠左行靠右行靠左行1，1-1，-1靠右行-1，-10，0协调博弈：法律和社会规范就是这种协调预期的规则，帮助人们在多个纳什均衡中筛选一个特定的纳什均衡。现在欧洲大陆的靠右走的规则是在法国兴起的。N人共同投资问题（海萨尼和泽尔腾，1988）大小大10，10-1，1小

16、1，-12，2风险占优Self-fulfilling（自我实现）均衡银行挤兑协调提款不提款提款1，12，0不提款0，23，3投资博弈投资者在期初投资，投资额可以是10元或0元，如果90%以上的人投资10元，那么期末可得15元，否则一无所获。非对称参与者：Battle of SexesCooper et al. (1994); Straub (1995)彩票数量1210，0200，6002600，2000，0文化既解决冲突又协调预期尊老爱幼；妇幼保护；遵师重教；先来后到；社会分层与非对称权力（排位问题；黑社会组织）；公平观念（如分蛋糕博弈）；抓阄；Thomas Schelling于1960年在他

17、的“冲突的策略”（The Strategy of Conflict）一书中提出。例：要求两个局中人各自独立写出(-0.5,0.5)中任意一个数，若两个人写的数一样，则给予奖励，否则给予惩罚。聚焦法(Focal point)-0.50.50.520世纪60年代，谢林在课堂上做了一项头脑实验，他问了学生们一个问题：有一天，你要和朋友在纽约见面，但不知道时间和地点，你的朋友也不知道，那么你将会在什么时间、什么地点见你的朋友？谢林点或焦点：一个均衡发生的概率大于另一个均衡（博弈各方的文化和经验使他们相信是大家容易想到的、习惯选择的点）。为了纪念伟大的博弈理论家Thomas Schelling，人们把这

18、种以线索为基础选择的均衡点称为(Schelling Point)谢林点或焦点。The Nature of Salience: An Experimental Investigation of Pure Coordination GamesJudith Mehta, Chris Starmer, Robert SugdenThe American Economic Review, 19946、Nash均衡存在性定理Brower不动点定理定理：如果f(x)连续的将一个非退化的单纯形映射到自身，则至少存在一个不动点x*= f(x*)（3）Nash(1950）均衡存在性定理定理：任何有限正则型（或策略

19、型）博弈具有混合策略均衡。有限理性Models of Thinking, Learning, and Teaching in GamesColin Camerer, Tec Ho, and Kuan ChongThe American Economic Review, 2003p-beauty contest (PBC)Players choose numbers in an interval, say, 0, 100. For p=2/3, the players whose number is closest to two-thirds of the average wins a fixe

20、d prize (generally playing for $20).In the Beauty Contest Game, each of n 2 players chooses a whole number between 0 and 100. Suppose the average of these n numbers is k. Then, the players whose choices are closest to 2k=3 share a prize equally.ThinkingAdaptive-learning model: Cognitive hierarchy (C

21、H) model starts with 0-step players who randomize equally across strategies; k-step players (k=1) believe all other players use only 0 to k-1 steps.PlayersPoisson distribution: more and more thinking steps are increasingly rare, expressed by f(k)/f(k-1) proportional to 1/k.Where is the mean and vari

22、ance of the number of thinking steps.is usually between 1 and 2.Data and estimates of in PBC games (equilibrium=0)Data and estimates of in PBC games (equilibrium=0)Prediction: fix =1.5 predicts a mean of 27(33.49), which is too high or low in some groups but is always accurate than the Nash predicti

23、on of zero.进化博弈理论谢始予编著（2002）经济博弈论（第二版），复旦大学出版社进化博弈理论的产生1970年代，生态学家Maynard Smith和Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上提出了进化博弈理论的基本均衡概念-进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念-模仿者动态（Replicator Dynamics）。至此，

24、进化博弈理论有了明确的研究目标。进化博弈理论的发展1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可。目前，进化博弈理论仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。进化稳定策略(ESS)假设存在一个全部选择某一特定策略的大群体和一个选择不同策略的突变小群体，突变小群体进入到大群体而形成一个混合群体，如果突变小群体在混合群体中博弈所得到的支付大于原群体中个体在混合群

25、体中博弈所得到的支付，那么小群体就能够侵入大群体，反之就不能够侵入大群体而在演化过程中消失。如果一个群体能够消除任何小突变群体的侵入，那么就称该群体达到了一种进化稳定状态，此时该群体所选择的策略就是进化稳定策略。对称鹰鸽博弈的进化博弈分析鹰鸽鹰(v-c)/2, (v-c)/2v,0鸽0,vv/2,v/2同一物种、种群内部竞争和冲突中的策略和均衡问题，腐和鸽这两种鸟类分别代表“攻击型”和“和平型”两种策略类型。设v=2，c=12(通过战争，激烈冲突所获得的利益常常是低于为此造成的损失的，特别是战败的一方)鹰鸽鹰-5, -52, 0鸽0, 21, 1有限理性博弈的复制动态状态：s=(x,1-x)，

26、有比例为x的博弈方采用鹰策略,比例为1-x的博弈方采用鸽策略。u(鹰)=-5x+2(1-x)=2-7xu(鸽)=0*x+(1-x)=(1-x)所有博弈方的平均期望收益：=x*u(鹰)+(1-x)*u(鸽)=x(2-7x)+(1-x)2=1-6x2鹰策略博弈方的比例x的变化速率可用动态方程表示：dx/dt=F(x)=x(u(鹰)-)=x(1-x)(1-6x)进化稳定策略(ESS)：F(x)=0；F(x)0; F(1/6)0唯一的进化稳定策略(ESS)：x=1/6dx/dt=F(x)=x(1-x)(1-6x)三个稳定状态：x=0；x=1/6；x=1进化博弈均衡的现实意义当人们竞争、争夺的利益和严重

27、冲突的后果损失符合上述设定时，在较大规模群体的长期进化中，采取攻击性策略的博弈方的数量最终会大约稳定在1/6左右的水平，大多数人（5/6）会采用比较和平的策略。这意味着发生严重战争的机会虽然存在，但可能性比较小（大约1/36），相互间和平共处的可能性最大（大约25/36），比较忍让的一方受到比较霸道一方欺负的可能性居中（约占10/36）。这是比较稳定的状态，实际情况通常会在该水平上下波动。这样的格局与国际政治，军事关系的实际情况还是很相似的。证券市场中的进化博弈理论济南金融，2004年第3期证券市场中的鹰鸽博弈假定市场上的投资人选择两种不同风格的投资策略：噪声交易和理性交易，买卖同一支股票。噪

28、声交易策略理性交易策略噪声交易策略-50, -50100, 0理性交易策略0, 10050, 50我国证券市场噪声交易者存在的原因一部分采用投机行为的噪声交易者获得了超常收益, 使其他投资者纷纷效仿其行为; 由噪声交易产生的巨大财富效应强化投资者的暴富心理; 为数庞大的中国证券市场投资者的总体受教育程度较低; 政策不透明, 政策市现象严重; 市场信息不透明, 信息传导不畅; 我国一开始就将证券市场定位为国有企业的融资, 上市公司素质不高, 盈利能力不强, 投资者收益主要来源于股票价差。进化稳定均衡与纳什均衡张良桥（2007）：如果策略s是进化稳定的，(s,s)一定是Nash均衡策略，所以进化稳

29、定均衡一定是Nash均衡，但并非所有的Nash均衡是进化稳定均衡，因此进化稳定均衡是Nash均衡的精炼。合作博弈施锡铨（2012），合作博弈引论。上海财经大学出版社合作博弈合作博弈：是指一些参与者以同盟、合作的方式进行的博弈，这样一来博弈活动就变成了不同集团之间的对抗。在合作博弈中，参与者未必会做出合作行为，然而会有一个来自外部的机构惩罚非合作者。兼并重组社会财富再分配邓小平的“一国两制”第二部分完全信息动态博弈第二章展开型博弈一、博弈树1. 博弈树的所包含的信息（1）局中人的集合（2）行动的次序（3）局中人行动时的纯策略空间（4）局中人作出行动决策时所获得的信息集合。（5）局中人的盈利或

30、效用（6）任何外生事件上的概率分布。例：市场进入可口百事不进入进入强硬宽容(0，5)(-2，-1)(1，2)注释：在苏联未解体前，出现在苏维埃集团所有国家的唯一软饮料制造商是“百事可乐”。在苏联解体后，“可口可乐”不得不就是否进入这些市场作出决策。借款人不贷款贷款（0,0）（10,10）（-200,100）还款不还款银行2、完美信息与不完美信息定义：假如一个局中人在轮到他行动时知道自己处于博弈树的那个结上，我们称该局中人有完美信息。博弈中的每一个局中人都具有完美信息，则称该博弈有完美信息。如果局中人在不知道另外的局中人前面行动的情况下必须行动，则称该局中人具有不完美信息。倘若至少有一个局中人具

31、有不完美信息，则称该博弈具有不完美信息。122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h21h22（3,1）（2,7）122左右ABAB（5,6）（4,2）h1h2h2(-2, -1)(0,-3)CocaPepsiNETA(0, 5)(-3, 1)(1, 2)CocaTTAA(-2, -1)(0,-3)CocaPepsiNETA(0, 5)(-3, 1)(1, 2)CocaTTAACoca麦当劳与肯得基二、展开型博弈的策略与均衡概念信息集Hi=hi： hi是局中人i的信息集行动空间A(hi)：局中人i基于信息集hi的行动全体Ai= hiHiA(hi)：局中人i的所有行动的集合纯

32、策略空间局中人i的一个纯策略si：HiAi ( hiHi， si (hi) Ai)Si=si： si是局中人i的一个纯策略Si= hiHiA(hi)纯策略组合S=Si局中人1信息集：H1=h1；行动空间：A(h1)=左,右纯策略空间：S1=A(h1)=左,右122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h21h22局中人2信息集：H2=h21，h22；行动空间：A(h21)=A,B; A(h22)=C,D纯策略空间：S2=(A(h21), A(h22)=(A,C),(A,D),(B,C),(B,D)纯策略组合S=左, (A,C),左, (A,D),左, (B,C),左, (B,

33、D), 右, (A,C),右, (A,D),右, (B,C),右, (B,D)122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h12h222、展开型博弈的策略型表示3,13,15,65,64,22,74,22,7左右（A,C）（A,D）（B,C）（B,D）122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h12h22围棋走两步的策略个数国际象棋程序机器能够下出人想不到的策略。还没有能力构造一个策略,局部的定式可近似认为是一个策略组合。检验策略是否完整的一个简单方法一个完整的计划必须针对各种可能发生的情况拟订相应的行动原则也就是说，当你把该计划写在纸上交由他人代为执行时

34、，他可以依此行事，宛如你本人亲临现场参与赛局一样，不会出现事先未预料到的情况。战略是一个完备的行动计划：在博弈开始之前就规定出每一个决策点上的选择，即使这个决策点实际上不会出现。3、展开型博弈的纯策略Nash均衡定义：纯策略组合s*是展开型博弈的纯策略Nash均衡，如果在给定局中人i的对手策略s*-i时，每一个局中人i的策略s*i使他的条件盈利达到极大化。3,13,15,65,64,22,74,22,7左右（A,C）（A,D）（B,C）（B,D）122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h12h224、Nash均衡的存在性结论：有限展开型博弈至少存在Nash均衡（可能是混合

35、型）。三、完美信息有限博弈后退归纳法：Stackelberg 博弈3,13,15,65,64,22,74,22,7左右（A,C）（A,D）（B,C）（B,D）122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h12h223,13,15,65,64,22,74,22,7左右（A,C）（A,D）（B,C）（B,D）122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h12h22后退归纳法customerCompany ANot go to company AGo to company Afairlyexploit(0,0)(100,100)(-2000,1000)When b

36、usiness should be honest0, 00, 0100, 100-2000, 1000Not goGofairlyexploitcustomerCompany ANot go to company AGo to company Afairlyexploit(0,0)(100,100)(-2000,1000)后退归纳法customerCompany ANot go to company AGo to company Afairlyexploit(0,0)(100,100)(-2000,1000)后退归纳法（蜈蚣wu gong）Centipede gameABABABAstop1

37、043161564021873231由Rosenthal提出个体理性并没有导致集体理性倒推法是严密的，但结论是违反直觉的。现实：参与者不会在开始时确定他的策略为“不合作”，但他难以确定在何处采取“不合作”策略。An experimental study on centipede gamesRichard D. McKelvey, Thomas R. PalfreyEconometrica, 1992纳什均衡的重要影响及其问题局限（高红阳）对该博弈进行实验的结果也证实，在绝大多数任意选择的博弈方之间进行该博弈，一般都不会出现逆推归纳法所预测的结论。麦克凯维和帕弗利（Mckelvey and Pa

38、lfrey，1990）给出了细致的实证检验的证据，证明上述理论上的均衡结果一般不会在实践中出现；克瑞普斯（1990）也报告曾与学生进行过该博弈，结论在A第一次就选择D的情况是很少见的。笔者对学生的检测也符合上述结论。蜈蚣博弈是揭示纳什均衡分析的某些深刻的内在矛盾和弱点的最好范例。象棋博弈揭示了纳什均衡分析一个重要的薄弱环节，即无力解决步骤过多的博弈问题。四、子博弈和子博弈完美均衡目标：使“合理的”Nash均衡与“不合理的”Nash均衡分离。后退归纳法是剔除“不合理”Nash均衡的有力工具之一。子博弈概念展开型博弈GT的一个子博弈Gs是如下的博弈构造:（1） Gs拥有与GT相同的局中人，尽管这些

39、局中人的某些人可能在Gs中不采取行动。（2） Gs的一个初始结是GT的一个单结， Gs的博弈数由这个单结，以及这个单结的所有后续结，还有这些结之间所有的枝一起组成。（3）在Gs的终点结上每一个局中人的盈利等于原博弈GT在同一个终点结的盈利。注：每一个博弈是其自身的（平凡）自博弈。子博弈（subgame)由原博弈中某个决策点（信息集）开始的部分构成一个子博弈。123原博弈2子博弈I3子博弈II子博弈完美均衡（Subgame perfect equilibrium）泽尔腾于1965年发表了他最著名的博弈论论文一个具有需求惯性的寡头博弈模型。泽尔腾当时没有想到他的这篇文章后来会被广泛引用，并成为了子

40、博弈精炼均衡（subgameperfeetNashequilibrinm）的正式定义，同时为后来获得诺贝尔经济学奖奠定了基础。子博弈完美均衡（Subgame perfect equilibrium）定义：展开型博弈的一个策略组合称为子博弈完美均衡，如果对于该展开型博弈的每一个子博弈，该策略组合都是Nash均衡。后退归纳法相应的策略组合是子博弈完美均衡。3,13,15,65,64,22,74,22,7左右（A,C）（A,D）（B,C）（B,D）122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h12h22例1结论：策略组合左, (B,D)是子博弈完美均衡。How to identif

41、y trust and reciprocityJames C. Cox, 2004Games and Economic Behavior The investment game： Treatment A甲乙不给给x不返还返还y(10，10)(10-x，10+3x)(10-x+y，10+3x-y)Subgame perfect equilibrium: room B subjects will keep all of any tripled amounts transferred by room A subjects because room B subjects prefer more mon

42、ey to less; and knowing this, room A subjects will not transfer any positive amount.dataSend meanStdNumberReturn meanstdnumberTreatment A5.973.87324.946.6332ConclusionOur experiment provides evidence of altruistic other-regarding preferences, trust, and reciprocity. These results have the following

43、implications for constructing a model that will be consistent with the observed behavior. First, utility should not be assumed to be a constant function of others money payoffs, as in the self-regarding preferences model. Second, beliefs about others altruistic and reciprocating behavior should be i

44、ncorporated in the model. Third, the other regarding preferences should be conditional on the perceived intentions behind others actions.Studies on Ultimutum GameHenrick (2002)Gender (2006), countries, beauty, age, education, professions, etc从博弈论视角浅析人民币汇率若干问题2009届金融工程在职研究生宏观动态经济博弈陈学彬（1999），宏观金融博弈分析。

45、上海财经大学出版社。第二部分完全信息动态博弈第三章重复博弈3、无限重复博弈：囚徒困境MTalor（The Possibility of Cooperation）：囚徒困境中理性合作的不可能性的事实对于人类社会的成功合作来讲并不苛刻，否则，理性人就不会进化成社会动物。如果要理解有关人类合作和真正困难所在，我们需要对更复杂的博弈进行研究。必须重复面对大量的合作问题的原因是，它打开了通往互惠之门的通道。阶段博弈为囚徒困境甲/乙不合作合作不合作0,02,-1合作-1,21,1重复博弈中战略举例总是不合作: 不论过去什么发生，总是选择不合作。总是合作: 不论过去什么发生，总是选择合作。合作-不合作交

46、替进行。针锋相对(tit-for-tat,TFT): 从合作开始，之后每次选择对方前一阶段的行动。触发策略（ trigger strategies ）:如果任何一个局中人的一次性不合作（偏离）将触发局中人永远地不合作开关；从合作开始，一直到有一方不合作，然后永远选择不合作。两阶段策略个数：25；策略组合个数： 25* 25 总是不合作122不合不合不合122不合不合不合122不合不合不合122不合不合不合122不合不合不合总是合作122不合不合不合122不合不合不合122不合不合不合122不合不合不合122不合不合不合针锋相对(tit-for-tat,TFT)122不合不合不合122不合不合

47、不合122不合不合不合122不合不合不合122不合不合不合触发策略（ trigger strategies ）122不合不合不合122不合不合不合122不合不合不合122不合不合不合122不合不合不合无限多阶段博弈：子博弈完美均衡由一阶段偏离准则知：（不合作，不合作）仍然是无限次重复囚徒博弈的子博弈完美均衡。当 b，卖者知道蛋糕的大小，而买者并不知道，买者知道蛋糕以概率p取值g，以概率1-p取值b。局中人：买者，卖者类型空间：买者是一种类型，卖者有两种类型TA= (g, b)。信念： P(g)=p, P(b)=1-p例：p=0.5； g=100； b=40。（ pg=50b）p=0.5； g=100； b=80。（pg=50b）p=0.5； g=100； b=80。（pg=50bg0g0.00b0bpgbgg01-pb00pg4010010000.54000信息价值(效率损失)完备信息时的盈利100/2+40/2=70-买者的平均盈利为100/2

人人文库> 全部分类> 行业资料 > 医学制药

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论讲义课件

文档简介

温馨提示

最新文档

评论

博弈论讲义课件

文档简介

温馨提示

最新文档

评论

相关文档