博弈论ppt课件_第1页
博弈论ppt课件_第2页
博弈论ppt课件_第3页
博弈论ppt课件_第4页
博弈论ppt课件_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论,博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。,博弈论分类,经典博弈 合作博弈 非合作博弈 是否允许存在有约束力协议的博弈是区分合作博弈与非合作博弈的标准。 “非典型”博弈,如学习博弈、演化博弈(进化博弈)等 是否假定参与者是理性的是区分经典博弈与“非典型”博弈的标准。,从游戏到博弈,博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用 游戏下棋、猜大小 经济寡头产量决策、市场阻入、投标拍卖 政治、军事美国和伊朗、以色列和巴勒斯坦、中国和日本等等。,博弈的基本要素,博弈的参加者(Player)博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益),博弈方,博弈方:独立决策、独立承担博弈结果的个人或组织 博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变 博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈,策略,策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限多个,收益,收益:各博弈方从博弈中所获得的利益 收益对应博弈的结果,也就是各博弈方策略的组合 收益是各博弈方追求的根本目标及行为和判断的主要依据 根据收益的博弈分类:零和博弈、常和博弈、变和博弈,策略型(或标准型)博弈,三要素:名单、策略单和收益单。可用矩阵,或函数形式表示的博弈收益情况。 猜硬币模型 三人古诺模型,几个经典博弈模型,囚徒的困境 赌胜博弈 审计博弈 性别之战 产量决策的古诺模型,囚徒的困境,囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈,赌胜博弈,赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示 赌胜博弈的特点是一方得等于另一方失,不可能双赢,属于“零和博弈”,田忌赛马,取胜关键:不让对方猜到自己策略,尽可能猜出对方策略,审计博弈,简单版(BC,Ft),性别之战,是一种有两个以上纯策略均衡的博弈,例子(石头、剪子、布)中的博弈方、策略和收益,博弈方I(孩子A,孩子B) 策略集SASB石头,剪刀,布 收益就是这个矩阵,占优均衡,占优:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 (囚徒的困境中的“坦白”) 占优均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优,必然是该博弈比较稳定的结果 占优均衡不是普遍存在的(性别之战),严格下策反复消去法,严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略 严格下策反复消去,纳什均衡,策略空间:S1,Sn 博弈方i的第j个策略:sijSi 博弈方i的得益:ui 博弈:GS1 ,Sn,u1,un 纳什均衡:在博弈GS1 ,Sn,u1,un中,如果由各个博弈方的各一个策略组成的某个策略组合( s1*,sn* )中,任一i博弈方si*的策略,都是对其余博弈方策略的组合( s1*,si-1*,si+1*,sn* )的最佳对策,即ui( s1*,si-1*,si*,si+1*,sn* ) ui( s1*,si-1*,sij,si+1*,sn* ) 对任意sijSi都成立,则称( s1*,sn* )为G的一个纳什均衡,所有别的游戏者策略的简记法,s-i(s1,si-1,si+1, sn) 纳什均衡简述为: ui(si*,s-i*)ui(si,s-i*), siSi,A,纳什均衡的求解划线法,囚徒困境 猜硬币,纳什均衡的求解箭头法,审计博弈(B C,Ft),连续变量的纳什均衡,古诺的寡头模型,连续变量的纳什均衡,解: 一阶最优条件为: 得到:q1q22,混合策略的引进,猜硬币博弈 (1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什均衡概念,猜方是否会老猜正面,或反面?,其实“一会儿猜正面,一会儿又猜反面”也是一种策略。,田忌赛马中齐王是如何输掉比赛的?,混合策略的定义,对于游戏者i,其一个混合策略是一个概率密度函数i:SiR,使得,对于所有的siSi,都有 这就是混合策略。,混合策略的纳什均衡定义,如果对于博弈中所有的游戏者i,对于所有的iMi,都有ui*uii,-i*,则称*就是一个混合策略的纳什均。,如何求混合策略的纳什均衡,猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1p;设盖方盖正方的概率为q ,盖反方的概率则为1q。 猜方的期望收益: zqp(1p) (1q)p1p 期望收益最大的一阶条件是: dz/dq(12p)(12p)0 即p0.5,同理可得q0.5。,混合纳什均衡的求解几何法,加重对守位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略,P,P,几何法的证明,设守卫睡的概率为Q,小偷偷的概率为P。 守卫的期望支付为: PQ( d)(1Q)0 (1P)Qs (1Q)0 PQd(1P)Qs /Q Pd(1P)s0 P s/(d s )P/1P(),广延型(扩展型)博弈,四要素名单、博弈分枝结构(节点,或博弈点)、信息集和收益,用对策树形式表示。 左右博弈,广延型博弈与策略型博弈,【定理】对于每一个广延型博弈,都存在着一个对应的策略型博弈,我们可以把此策略型博弈视为是游戏者同时选择策略的结果。但是,给出一个策略型博弈,一般地,总存在着若干个与此相对应的广延型博弈。(证明从略),将广延型博弈转化为策略型博弈的例子,讲真话博弈,将策略型博弈转化为广延型博弈的例子,囚犯困境博弈,广延型博弈的解反向归纳,【定义】 反向归纳是指从博弈的最终结局出发,游戏者总是选择对自己最有利的结果;一旦知道博弈的最终结果是什么,然后转向次结局的那个决策点,以同样方法找出该点上的决策者会选择什么决策;然后回到次次结局的那个点如此反复,直到博弈的初始点,在初始点上决策的那个游戏者决定博弈的最终结果。,反向归纳的例子,例子A,子博弈,定义子博弈是展开型的一部分;它是满足下述三个性质的节点和枝的集合:(1)从单个决策节出发。(2)包含了这个节点的每一个后续节。(节点x的后续节是指沿着由x发出的一系列枝可以到达的所有节点。)(3)如果它包含了一个信息集的若干部分,那么它一定包含该信息集中的所有节点。,子博弈的例子,例子,子博弈的例子,两个不是子博弈的例子,子博弈完美纳什均衡,子博弈完美纳什均衡:一个策略组合是子博弈完美纳什均衡,如果它满足: 对于整个博弈来说,它是一个纳什均衡; 对于任一个子博弈来说,它也是一个纳什均衡。,子博弈完美纳什均衡的例子,均衡1(借,分);均衡2(不借),子博弈与完美性,配套博弈,重复博弈,囚犯困境的重复博弈 如果存在下列三个条件,则“价格勾结”(高价,高价)便会出现: 第一,博弈重复无穷次。 第二,双方都采取“冷酷”战略“以牙还牙”战略,即: (1)从选择“合作”(高价)开始; (2)只要对方一直选择“合作”(高价),便一直“高价”下去;直到有一天发现对方偷偷实行了“不合作”(低价),便由此而采取“不合作”(低价)至永远。 第三,贴现因子1/(1r)足够的大(r0)。这个条件是说,将来的收益经贴现之后还比较值钱。即人们对于时间比较有耐心,而不是只图眼前享受。,以牙还牙策略,以牙还牙策略:称下列策略为“以牙还牙”策略,如果: 从一开始便选择“合作”; 在时期t选对方在时期t1期所采用的策略,即如对方在t1期不合作,则我在t期不合作。,无名氏(大众)定理,无名氏定理:在无穷次重复的由n个游戏者参与的博弈里,如果在每一次重复中博弈的行动集是有限的,则在满足下列三个条件时,在任何有限次重复中所观察到的任何行动组合都是某个子博弈完美均衡的惟一结果: 条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的那个收益组合集是n维的。,无名氏定理说明,以囚徒困境问题说明此定理 设此囚徒困境的收益矩阵为:,无限重复博弈子博弈精练均衡的例子,( R1 , R2 )就是一个子博弈精练均衡(假定1) 假定企业1在t期之前选择了R1,而在t期选择采取“机会主义”L1,而企业2直到t期都选择R2,根据“以牙还牙”策略,从t1期开始将一直选择L2,那么企业1从t1期也将一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论