博弈论第二章——博弈规则.ppt_第1页
博弈论第二章——博弈规则.ppt_第2页
博弈论第二章——博弈规则.ppt_第3页
博弈论第二章——博弈规则.ppt_第4页
博弈论第二章——博弈规则.ppt_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参考书目,1.美阿维纳什K迪克西特.策略思维.中国人民大学出版社,20022.王则柯.新编博弈论平话.中信出版社,20033.谢识予.经济博弈论(第二版).复旦大学出版社,20024.美埃里克拉斯缪森.博弈与信息:博弈论概论.北京大学出版社,20035.张维迎.博弈论与信息经济学.上海三联书店,2004,第二章博弈论基本知识,2.1什么是博弈论2.2博弈的结构和分类2.3博弈的表达方式2.4几类经典的博弈模型,2.1.1从游戏到博弈2.1.2一个非技术性的定义2.1.3博弈论模型简介,第一节什么是博弈论,2.1.1从游戏到博弈,“博弈论”译自英文“GameTheory”,直译就是“游戏理论”。,游戏的共有特征1.一定的规则2.有一个结果(且可以折算成数字)3.策略的相互依存性4.策略至关重要,博弈论-无处不在的游戏,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”。保罗萨缪尔森,年光似鸟翩翩过,世事如棋局局新。(宋)僧志文,博弈论(gametheory):又称对策论,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。,2.1.2博弈论的基本概念,GoverningDynamics,博弈论的基本假设人是理性人(rational,也说自私人):行动者具有推理能力,在具体策略选择时的目的是使决策者自己的目标效用最大化。,2.1.2博弈论的基本概念,通俗地讲,博弈论是一种“游戏理论”。其较对博弈为准确的理解是:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。,博弈论模型可以用七个方面来描述GP,A,S,I,U,O,E,2.1.3博弈论的模型简介,P(players),P(players):为局中人,博弈的参与者,也称为“博弈方”,局中人以最终实现自身利益最大化为目标。,个人团体,双方多方,虚拟参与人:Nature,A(action),A(action):为各局中人的所有可能的策略或行动的集合。行动的顺序(Theorderofplay)根据该集合是有限还是无限进行分类:,先动优势,后动优势,S(strategies),S(strategies):博弈的进程,也是博弈进行的次序。它规定什么人在什么时候选择什么行动。因此,战略是参与人的“相机行动方案”(contingentactionplan)分类:根据后行动的人是否能够看到先行动人的具体行动,静态博弈,动态博弈,行动与策略的区别?,行动是指参与者可能有的具体行动战略是行动的规则而不是行动本身,毛泽东:人不犯我我不犯人人若犯我我必犯人,敌进我退敌退我追敌驻我扰敌疲我打,I(information),I(information):博弈信息。指的是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行为的知识分类:根据博弈各方对各种局势下所有局中人的信息掌握情况分:,完全信息博弈,不完全信息博弈,U(utility),U(utility):也称为支付(payoff).为局中人获得利益,或者是指参与人的期望效用水平。也是博弈各方追求的最终目标。分类:根据各方得益的不同情况,零和博弈,变和博弈,田忌赛马,囚徒困境,Ua(t,t)=-8Ua(t,n)=0Ua(n,n)=-1Ua(n,t)=-10Ub(t,t)=-8Ub(t,n)=-10Ub(n,n)=-1Ub(n,t)=0,嫌疑人a,嫌疑人b,U(t,t)=0.5*(-8)+0.5*(-8)=-8U(t,n)=0.5*0+0.5*(-10)=-5U(n,t)=0.5*(-10)+0.5*0=-5U(n,n)=0.5*(-1)+0.5*(-1)=-1,结果(outcome)是指博弈分析者感兴趣的要素的集合。是均衡行动的组合。,嫌疑人A,嫌疑人B,E(equilibrium),均衡(equilibrium):是所有参与人的最优战略的组合。所谓博弈均衡,它是一种稳定的博弈结果。纳什均衡(NashEquilibrium):一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。谢识予:给定你的策略,我的策略是最好的的策略,给定我的策略,你的策略也是最好的的策略,两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。,囚徒困境,嫌疑人A,嫌疑人B,-8,-8,-1,-1,-10,0,0,-10,一个纳什均衡点!,情侣博弈,王菲,李亚鹏,2,1,1,2,1,1,0,0,两个纳什均衡点!,博弈论模型可以用五个方面来描述GP,A,S,I,U,O,E描述博弈的最少要素:参与人,战略,支付。行动和信息是其积木参与人、行动、结果统称为“博弈规则”博弈分析的目的:是使用博弈规则预测均衡,2.1.3博弈论的模型简介,博弈论模型可以用七个方面来描述GP,A,S,I,U,O,E2.2.1博弈方2.2.2博弈的行动过程2.2.3策略2.2.4支付(效用、得益)2.2.5博弈的信息结构2.2.6博弈方的能力和理性2.2.7博弈的分类和理论结构,第二节博弈论的结构与分类,2.2.1博弈中的博弈方,博弈方(player/players)博弈中独立决策、独立承担博弈结果的个人或组织称为博弈方。1.单人博弈2.双人博弈3.多人博弈,1.单人博弈,设有一商人要从A地运输一批货物,从A地到B地有水、陆两条路线,走陆路运输成本10000元,而走水路运输成本只要7000元。但非常危险,出现坏天气的概率为0.25,此时会损失10%的货物。货物总价值90000元。此人怎样决策?,自然,商人,-7000,-10000,-10000,-16000,囚徒困境,嫌疑人A,嫌疑人B,-8,-8,-1,-1,-10,0,0,-10,2.双人博弈,情侣博弈,王菲,李亚鹏,2,1,1,2,1,1,0,0,选修课另一版本,王菲,李亚鹏,4,3,3,4,1,1,2,2,石头剪子布,博弈方2,博弈方1,双人博弈小结,注意二点:1.博弈方之间并非总是对抗的。2.个人理性决策常不能实现自己的最大利益。,3、多人博弈,三个或三个以上的博弈方参加的博弈。,竞争者,破坏者,竞争者,北京申办2000年奥运会失利,2.2.2策略,有限博弈(finitegames):如果博弈中每个博弈方的策略是有限的,称为有限博弈。2.无限博弈(infinitegames):如果博弈中至少有某些博弈方的策略是无限多个的,称为无限博弈。(函数表示),2.2.3博弈的行动过程,1.静态博弈(staticgames):所有博弈方同时选择策略的博弈。2.动态博弈(dynamicgames):各博弈方的选择和行动有先后次序,而且后选择的、后行动的博弈方,在自己选择行动方案之前,可以看到其他博弈方的选择和行动。也称为多阶段博弈(multistagegames)3.重复博弈(repeatedgames):同一个博弈反复进行多构成的博弈。,2.2.4博弈的支付(效用,得益),效用的计算方法:将每一个博弈方在同一策略结果中的得益相加,算出所有博弈方的得益总和。Ua(1,2)=Ua1+Ua2Ub(1,2)=Ub1+Ub21.零和博弈:Ua(1,2)=Ub(1,2)=02.常和博弈:Ua(1,2)=Ub(1,2)=m3.变和博弈:Ua(1,2)Ub(1,2),两个人通过猜硬币的正反赌输赢,其中一人用手盖住一枚硬币,有另一方在是正面还是反面朝上。若猜对,则猜着赢1元,盖着输1元;若猜错,则猜着输1元,盖着赢1元。假设赢着收益为1,输者收益为-1。,猜硬币游戏,猜硬币游戏,猜硬币方-2,U1z(z,z)=-1U1z(z,f)=1U1f(f,z)=1U1f(f,f)=-1U2z(z,z)=-1U2z(f,z)=1U2f(z,f)=1U2f(f,f)=-1,Uz=U1z+U2z=-1+1-1+1=0,Uf=U1f+U2f=1-1+1-1=0,盖硬币方-1,石头剪子布,博弈方2,博弈方1,周末约会,王菲b,李亚鹏a,Uag(g,g)=2Uag(g,d)=0Uad(d,g)=-1Uad(d,d)=1Ubg(g,g)=1Ubg(d,g)=-1Ubd(g,d)=0Ubd(d,d)=2,UU=Uag+Ubg=2+0+1-1=2,Ud=Uad+Ubd=-1+1+0+2=2,Un=Uan+Ubn=-1-10-10-1=-22,Uat(t,t)=-8Uat(t,n)=0Uan(n,t)=-10Uan(n,n)=-1Ubt(t,t)=-8Ubt(n,t)=0Ubn(t,n)=-10Ubn(n,n)=-1,嫌疑人b,嫌疑人a,Ut=Uat+Ubt=-8+0-8+0=-16,囚徒困境,奖金分配,王菲b,李亚鹏a,5,5,5,5,3,7,7,3,Uag(g,g)=5Uag(g,d)=7Uad(d,g)=3Uad(d,d)=5Ubg(g,g)=5Ubg(d,g)=7Ubd(g,d)=3Ubd(d,d)=5,Ug=Uag+Ubg=5+7+5+7=24,Ud=Uad+Ubd=3+5+3+5=16,Ud=Uad+Ubd=30+80+30+80=220,Uag(g,g)=50Uag(g,d)=10Uad(d,g)=80Uad(d,d)=30Ubg(g,g)=50Ubg(d,g)=10Ubd(g,d)=80Ubd(d,d)=30,联通b,移动a,Ug=Uag+Ubg=50+10+50+10=120,寡头定价,2.2.5博弈的信息结构,1.关于得益的信息完全信息和不完全信息(1)完全信息(completeinformation)是指在博弈过程中,每一位博弈方对其他博弈方的特征、策略空间及收益函数有准确的信息。(2)不完全信息(incompleteinformation):如果博弈方对其他博弈方的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有博弈方的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。也成不对称信息或者信息不对称(asymmetricinformation),2.关于博弈过程的信息完美信息和不完美信息完美信息(perfectinformation):对已经发生的的事情有清楚的了解,称具有完美信息。否则,称为不完美信息(imperfectinformation),2.2.6博弈方的理性与能力,完全理性与有限理性个体理性与集体理性,A国,B国,战争与和平,2.2.7博弈的类型1,根据参与者能否形成约束性的协议,以便集体行动(1)合作博弈(cooperativegame)研究人们达成合作时如何分配合作得到的收益,即收益分配问题。(2)非合作博弈(non-cooperative/uncooperativegame)研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。,2.2.7博弈的分类2,囚徒困境(prisonersdilemma),完全信息静态博弈,空城计,诸葛亮,司马懿,不完全信息静态博弈,诸葛亮(关羽),曹操,不完全信息静态博弈,曹操败走华容道,相亲,王实甫,张生和崔莺莺红娘,王实甫.西厢记,不完全信息静态博弈,完全信息动态博弈,黔之驴黔驴技穷,柳宗元(唐),不完全信息动态博弈,斗鸡博弈,斗鸡博弈(ChickenGame)其实是一种误译。Chicken在美国口语中是“懦夫”之意,ChickenGame本应译成懦夫博弈。不过这个错误并不算太严重,非要把chickengame叫作斗鸡博弈,也不是不可以。试想有两人狭路相逢,每人有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。因此,对每个人来说,最好的结果是,对方退下来,而自己不退。赢利矩阵(payoffmatrix)如下:甲/乙前进后退前进(-2,-2)(1,-1)后退(-1,1)(-1,-1)上表中的数字的意思是:两者如果均选择“前进”,结果是两败俱伤,两者均获得-2的支付;如果一方“前进”,另外一方“后退”,前进者获得1的支付,赢得了面子,而后退者获得-1的支付,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子,获得-1的支付。当然表中的数字只是相对的值。这个博弈有两个纯策略纳什均衡:一方前进,另一方后退;或一方后退,另一方前进。但关键是谁进谁退?当然,该博弈也存在一个混合策略均衡,即大家随机的选择前进或后退。不过相对而言,我们更关注于纯策略均衡。一博弈,如果有惟一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是事先知道的惟一的博弈结果。但是如果一博弈有多个纳什均衡,则要预测结果就必须附加另外的有关博弈的细节信息。比如,这里谁进谁退,可能就需要附加额外的细节信息才能做出判断。,斗鸡博弈,斗鸡博弈(ChickenGame)试想有两人(鸡)狭路相逢,每人有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。假设两败俱伤为-2,赢的一方为1,输的一方为-1。请用战略式和扩展式写出他们的表达方式。并说明纳什均衡点。,斗鸡博弈,ChickenA,ChickenB,完全信息动态博弈,2.2.7博弈的分类和均衡,2.3.1战略式表达2.3.2扩展式表达,第三节博弈的表达方式,2.3.1战略式表达,战略式表达(strategicrepresentation),又称标准式表达(normalfromrepresentation)。更适合静态博弈。用支付矩阵表示。三个要素:1.博弈的参与人集合2.每个参与人的战略空间3.每个参与人的支付函数(由战略组合决定),囚徒困境,嫌疑人A,嫌疑人B,-8,-8,-1,-1,-10,0,0,-10,案例:智猪博弈(pigsgame),猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。请用战略式和扩展式写出他们的表达方式。并说明纳什均衡点,智猪博弈,局中人:大猪,小猪策略:大猪:按,等待小猪:按,等待支付矩阵:,智猪博弈,小猪,大猪,5,1,0,0,9,1,4,4,完全信息静态博弈,案例:田忌赛马,田忌,齐威王,2.3.2扩展式表达,扩展式表达(extensiveformrepresentation)。更适合动态博弈。用博弈树来表示六个要素:1.博弈的参与人集合2.参与人的行动顺序3.参与人的战略行动空间4.参与人的信息集5.参与人的支付函数6.外生事件(即自然选择)的概率分布),博弈树的基本建筑材料1,1.结(nodes):2.枝(branches):3.信息集(informationsets),博弈树的基本建筑材料1,1.结(nodes):初始结(beginingnodes)决策结(decisionnodes)终点结(terminalnodes)博弈从空心圆开始,空心圆表示开始决策,A选择后,博弈进入标有B的实心圆。初始结用其他决策结用,博弈树的基本建筑材料2,2.枝(branches):是从一个决策结到它的直接后续结的连线,某一个枝代表参与人的一个行动选择。,博弈树的基本建筑材料2,3.信息集(informationsets):某个参与人都知道些什么。信息集是用来标注某个人知道些什么信息的,不同的标注表示这个人知道不同的信息。博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结。(1)每一个决策结都是同一个参与人的决策结(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结,2.3.2扩展式表达,坦白,坦白,不坦白,(-8,-8),(0,-10),不坦白,坦白,囚徒困境,不坦白,(-10,0),(-1,-1),A,B,B,案例,案例一:姑娘(girl)爱上小伙子,父亲(father)不同意。威胁说,如果分手,我们还是好父女,两人和好;如果嫁给小伙子,那就一刀两断。局中人:姑娘(girl),父亲(father)策略:girl:分手,不分手father:和好,不和好支付矩阵:,2.3.2扩展式表达,girl,不分手,和好,不和好,father,(2,1),(1,0),father,分手,和好,父女威胁,不和好,(1,1),(0,0),girl,father,有两家房地产公司,决定是否开发房地产。需求大,开发者利润8千万,不开发者利润0。需求大,两者都开发利润各为4千万。需求小,开发者利润1千万,不开发者利润0。需求小,两者都开发利润各为-3千万两者都不开发利润各为0。,博弈树:房地产开发博弈I,博弈树:房地产开发博弈I,博弈树:不允许的情形,博弈树的基本建筑材料2,3.信息集(informationsets):某个参与人都知道些什么。信息集是用来标注某个人知道些什么信息的,不同的标注表示这个人知道不同的信息。博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结。(1)每一个决策结都是同一个参与人的决策结(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结,博弈树:房地产开发博弈I,另一种描述:房地产开发博弈I,信息集:房地产博弈II,信息集:房地产博弈III,第二种描述:房地产开发博弈III,第三种描述:房地产博弈IV,囚徒困境,A,坦白抵赖坦白抵赖,BB,坦白抵赖,(-8,-8)(0,-10)(-10,0)(-1,-1),B,坦白抵赖,坦白抵赖坦白抵赖,(-8,-8)(0,-10)(-10,0)(-1,-1),AA,囚徒困境,A,坦白抵赖坦白抵赖,BB,坦白抵赖,(-8,-8)(0,-10)(-10,0)(-1,-1),B,坦白抵赖,坦白抵赖坦白抵赖,(-8,-8)(0,-10)(-10,0)(-1,-1),AA,2.4.1静态博弈2.4.2动态博弈,第四节如何寻找博弈的均衡点,纳什均衡,纳什均衡的定义对于一个给定的策略组合,如果各博弈方都没有单独改变策略组合的意愿,则称该策略组合为纳什均衡.纳什均衡的一致预测性质各博弈方都能预测到,并且能预测到其他博弈方能预测到,能预测到其他博弈方也能预测到自己能预测到.,完全信息静态博弈纳什均衡,各博弈方同时决策,且所有博弈方对博弈中的各种情况下的得益都完全了解的博弈问题。1.基本分析思路和方法2.纳什均衡3.无限策略博弈分析,1.基本分析思路和方法,1优势策略均衡2箭头法3画线法4严格劣势反复消去法,1优势策略均衡,不管其他博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其他策略,就称此策略为“优势”一策略组合中的策略都是博弈方的优势策略,则称该策略为“优势策略均衡”如“囚徒困境”,2箭头法,思路是:判断各博弈方能否通过单独改变自己的策略而改善自己的得益,如能,则引一箭头。对可能的策略组合都考察过后,根据箭头反映的情况来判断博弈的结果。,犯人A,犯人B,小猪,大猪,王菲

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论