博弈论总结(精品).doc_第1页
博弈论总结(精品).doc_第2页
博弈论总结(精品).doc_第3页
博弈论总结(精品).doc_第4页
博弈论总结(精品).doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论总结(精品) 天才的悲哀就在于,他搞懂了规则,却没有搞懂人。 他自己想明白了,就想当然的以为别人也会想明白。 他不但错误的忽略了只想到普通人的存在,更忽略了没有思考的,或者存心不按规则玩的人的存在。 毕竟,这个世界不是一个只有天才的世界。 博弈论(game theory)是由美国数学家冯诺依曼(Von.Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。 为什么博弈论会产生如此大的影响呢?这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。 博弈论又称对策论,是使用严谨的数学模型研究冲突对抗情况下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。 简单的话,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同主体间的决策均衡。 甲或乙可以作出的选择被称为“策略”,甲和乙是参与博弈的人,称为“局中人”。 表中每一个小方格内的数字被称为局中人的支付(payoff),其中左边的数字代表甲的支付,右边的是乙的支付。 表 1、中的双变量矩阵称为博弈支付矩阵。 局中人所选择的策略构成的组合(招,招)被称为博弈均衡。 这个组合中前后两个策略分别表示甲和乙所选择的战略。 甲和乙都不会选择劣策略“不招”,称为“剔除劣策略的占优策略均衡”。 其中“招”是占优于(优于)“不招”的占优策略。 在其中每一条“路径”的末端用向量给出A和B的支付,称为支付向量。 都有劣策略,则用占优策略解决。 甲和乙有一方有劣战略,则使用重复剔除劣战略获得博弈结果。 重复剔除劣战略。 纳什均衡与商业中心区的形成。 承诺行动原理将不可信变为可信。 从而得到利益。 信号传递博弈”的原理解释为何一些垄断厂商长期在低价格水平上经营。 混合战略博弈当双方都以每个战略按1/3的概率出招时,达成一种双方都不愿改变这种概率分布的局面。 这被称为“混合战略纳什均衡”,而这种以随机方式选择纯战略的博弈被称为“混合战略博弈”。 博弈论是有关取舍策略的科学,它的方程式告诉你在与人接触中怎样得到最大的好处。 博弈中的决策者。 每个参与人的目标是选择一个期望最大化的策略决策者的含义,要求博弈的决策主体具有行为选择能力,并且对博弈结果负责的能力。 否则不是参与人。 众所周知的田忌赛马博弈,参与人是田忌和齐威王,孙膑仅仅是一个策略分析者。 孙膑并不是决策者,因而不是参与人,虚拟参与人,又称为自然(nature)。 自然在博弈的一些特定点按照给定的概率随机选择行动。 虚拟参与人与正常的参与人之间在概念上的差异是参与人有预先设定的效用函数,而虚拟的参与人对于给定的结局,不存在任何效用感受。 设定先验分布的常用方法比较法直方图法/连续变量/最大熵法完全信息静态博弈不完全信息静态博弈完全信息动态博弈不完全信息动态博弈占优均衡一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 (ui(si*,s-i)ui(si,s-i)对任意的s-i,并且si不等于si*)重复剔除严劣策略均衡设si和si是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i,均成立ui(si,s-i) 上面式子中,若将“”改为“”,则说策略si弱劣于策略si重复剔除严格策略就是各参与人在其各自策略集中,不断剔除严劣策略如果最终各参与人仅剩下一个策略,则该策略组合就被称为重复剔除严劣策略均衡重复剔除严劣策略和共同知识重复剔除严劣策略实质上涉及到了博弈论一个重要假设理性是共同知识所谓理性共同知识是指参与人是理性的,所有参与人知道所有参与人是理性的,所有参与人知道所有参与人知道所有参与人是理性的结合重复剔除严劣策略机制,重复剔除的次数越多,对共同知识的要求越严格纳什均衡定义。 对于一个策略式表述的博弈G=N,Si,ui,i是一个纳什均衡,如果对于每一个i N,si*是给定其他参与人选择s-i*=s1*,si-1*,si+1*,sn*情况下参与人i的最优策略(经济理性策略),即ui(si*,s-i*)ui(si,s-i*),对于任意的siSi,纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理a每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡,但反过来不一定成立;定理b纳什均衡一定不能通过重复剔除严劣策略方法剔除。 纳什均衡的一致预测性质N。 称策略组合s*=(s1,si,sn)任意的iN均成立。 一致预测性如果所有参与人都预测一个特定的博弈结果会出现,那么所有的参与人都没有偏离这个结果的愿望,这个预测结果最终将成为博弈的结果。 纳什均衡应用举例古诺模型两个企业,分别表示为企业 1、企业2每个企业的策略是选择产量(用qi表示),支付是利润(用i表示),它是两个企业产量的函数,生产成本与产量有关,用Ci(qi)表示,市场出清价格为P=P(q1+q2)第i个企业的利润函数为i=qi P(q1+q2)Ci(qi),i=1,2(q1*,q2*)是均衡产量意味着q1*argmax1(q1,q2*)q2*argmax2(q1*,q2)根据上面两个式子可以得出反应函数(reaction function)q1*=R1(q2)q2*=R2(q1)两个反应函数的交叉点就是纳什均衡(q1*,q2*),q2R1假定每个企业具有相同的不变单位成本,即C1(q1)=q1c,C2(q2)=q2c,价格出清函数取线性形式P=a-(q1+q2)。 根据q1*argmax1(q1,q2*)=q1P(q1+q2*)C1(q1)q2*argmax2(q1*,q2)=q2P(q1*+q2)C2(q2)通过求一阶导数,得q1NE R2图1-9古诺模型的纳什均衡于是可得到反应函数为进而可以得出每个企业的纳什均衡产量下的利润,为寡头竞争的总产量大于垄断竞争产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。 这是一个典型的囚徒困境在此之前所说的策略,实质上是以概率1选取某个确定的策略或行动,我们称之为纯策略利用生活经验不难知道,若硬币是均匀的,以0.5的概率去猜测正面无疑是最佳决策这就引出了用概率来确定采用何种策略的方法,这就是混合策略(mixed strategies)概念的由来在博弈G=N,Si,ui,iN中,假设参与人i的纯策略构成的策略集合为Si=si1,sik,若参与人i以概率分布pi=(pi1,pik)在其k个可选策略中随机选择“策略”,称这样的选择方式为混合策略。 这里,0pij1,对于j=1,k都成立,且有,pi1+pik=1纯策略可看成特殊的混合策略上述定义是在有限博弈前提下进行的混合博弈下的纳什策略均衡基于(v-N-M效用的)策略式博弈由参与人集合每个参与人有一个(纯)策略集合对于每一个参与人来说,由所有参与人纯策略组合构成的风险结果空间,存在一个v-N-M效用对于博弈G=N,Si,ui,iN,基于v-N-M效用的混合策略组合*是一个纳什均衡,若对于每一个i,以及i的任意一个混合策略i,*对应的期望支付至少和(i,*-i)的期望支付一样大纳什定理的主要内容为0) (0)(2212212111?cqqqaqcqqqaq?) (21)() (21)(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论