付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈论G a m e T h e o r y,焦点未然,目录,基本概念,完全信息静态博弈,完全完美信息动态博弈,重复博弈,完全不完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈,进化博弈,协调博弈, CH1基本概念1.1.1游戏的基本描写游戏即游戏的基本特征:有规则,有结果,有策略,有相互依存性的例子3人决斗,射击对方保存自己。 命中率和各回合的开枪顺序如下。 命中率顺序A 30% 1 B 70% 2 C 100% 3 A在第一个回合中的战略是什么? a最害怕什么? 第一个回合后,谁的生存概率最高? 1.1.2游戏的基本要素非正式定义游戏的参与者局中人(players )独立决定、独立
2、接受结果的个人或组织战略(strategies )和行动集在一局游戏中供局中人选择的一些方案局中人的利益(payoffss ) 是支付游戏结果的量化局中人在游戏中得到的效用政策组合的函数游戏顺序(orders )局中人同时决定1.1.3游戏的表示方法(1)正规型(策略型) payoff的a、root、outcome、1.2.1 Tucker的囚犯1.3.2多人游戏的依赖关系更加复杂,“破坏者”“损人不利己者”(1)两党制和多党制两党政见处于中间立场是平衡的。 三个政党没有均衡。 (2)三厂商竞争优势游戏,基于1.4战略的游戏分类,基于1.4.1战略的游戏分为有限战略游戏和无限战略游戏。 有限战
3、略博弈是指,所有局面上人的战略都有限时的博弈。 1.4.2局中人的策略数可能不同。 在一些情况下,在同一游戏中,在一些站存在有限的策略,而在其它站存在无穷的策略。 1.4.3有限策略博弈的结果有限个,用策略式或扩展式表示。 无限战略游戏,结果是无限的,只能用数集或函数表示。 1.5根据游戏中的利益(支付)进行游戏分类零和游戏、正和游戏、变和游戏、变和游戏、1.5.1零和游戏:任意战略的组合中,局中人的支付总是为零,局中人总是对立,重复游戏中合作的机会1.5.2正和博弈:在任意战略组合中,局中人的支付和总是非零常数,将产生合作机会。 1.5.3变和游戏:局中人的支付之和不一定。 支付总额有大小排
4、序的问题。 1.5.4关于支付的信息,无论是完整的,还是具有不完整的信息的游戏,都知道所有局的人的游戏支付。 具有不完整信息的游戏至少一些站的人不完全理解其他站的人的游戏支付。 1.6在游戏过程中对游戏进行分类,1.6.1静态游戏和动态游戏静态游戏所有局的人同时进行决定(选择策略)的游戏。 在动态游戏局中,人们可以依次进行选择,在之后选择的局中,人们可以在进行选择之前,看到其他局中人们选择的游戏。 注意:动态游戏缺乏对称性,策略与步骤有所区别。 1.6.2重复游戏重复进行相同游戏的游戏过程称为重复游戏。 构成重复游戏的一次性游戏称为“原游戏”或“阶段游戏”。 在本教程中重复游戏是指原来的游戏是
5、静态游戏的游戏过程。 有限次重复游戏:原游戏的重复次数是固定的。 无限次重复游戏:没有预先决定的重复次数。 很多情况下,事前无法验证事件中游戏的次数是否有限。全局人士感兴趣的不是原游戏的结果,而是整个游戏的整体结果。 所以重复游戏是一种特殊的动态游戏。 1.6.3关于游戏过程的信息有完美的信息的局中人:对历史有完美的知识。 相反,是具有不完整信息的局员。 如果局中人都是完美情报局中人,那么这个动态游戏就叫做完美信息动态游戏,否则就是不完整的信息动态游戏。如果2.1.1优先战略局中人的最佳战略不取决于其他局中人的选择,那么该局中人就有优先战略。 如果策略组合中的每个策略都是局内人的优先策略,则此
6、策略组合称为优先平衡。 囚犯困境中的(告白、告白)占优势均衡,告白是各囚犯的优势战略。 但不是所有的游戏,而是所有局里的人都有优秀的战略。 CH2完全信息静态游戏2.1游戏的解法,2.1.2严格劣化战略的逐次消去法定义2-2无论其他站的人的战略如何变化,如果某个战略s总是大于其他战略s的支付,则s称为s的严格优先战略,s称为s的严格劣化战略。2.1.3划线法,注a :并非所有游戏都有稳定的解。 右图的掷硬币游戏,注b :稳定性不是确定性有多个稳定性可能的结果,而是性别的斗鸡游戏,2.1.4箭头法:局里的人能否单独改变自己的策略,改善自己的支付。 注a :没有稳定解时,注b :有多个稳定解时,2
7、.2纳什均衡(NE )、2.2.1NE定义NE是一个政策组合,对于任何站中人,其他站中人不离开该组合时,该站中人不积极地选择其他政策组合。 在任何局面都不会有人单独背离,命题1和命题2保证了严格的劣化战略重复消去法和NE的相容性。 保证了该方法简化了游戏的可行性。 2.3无限策略博弈的解和反应函数,2.3.1古诺模型的财富理论的数学原理研究1838寡头(Oligopoly )又称寡头垄断,意味着少数大厂商控制了整个行业的生产和销售。 有两种分类法。 按产品分类的性质:纯寡头垄断P=f(Q1 Q2)差寡头垄断P1=f(Q1,Q2) P2=f(Q2,Q1)决定变量分类:共同定产模型(Cournot
8、 )共同定价模型() 决定变量是生产量。对方的反应方式不变。产品相同,线性需求曲线,MC=0。 代入公式,2公式:当寡头的数量是n时,各制造商的均衡条件是,2.3.2 Bertrand模型(1883 )决策变量是价格,2.3.3反应函数是其他站的每个人可能的决策,站中人这样的最佳决策和其他站的人的可能的意思局中人的反应函数的交点是NE。 e,2.3.4公地悲剧(1968年,哈丁)的外部性是产权不明的结果的乡村,村民在公地放牛的情况很多。 两种放牧机制: (1)个人拥有该地的个人放牧规模;(2)不限于让村民共同拥有该地的免费放牧:公共牧区一定是过度放牧。 例如土地承包责任制、永传权、2.3.5反
9、应函数的局限性a .反应函数无交点b反应函数有多交点,2.4混合策略,2.4.1概念在以前的研究中,很多博弈都没有NE。 研究这些游戏必须引入混合战略的概念。 当局中的人在一定概率下可选择的战略中随机选择时,这种战略选择方式称为混合战略。 我们把以前所说的战略称为纯粹的战略。 混合战略包括传统的纯粹战略。2.4.2解法、2.4.3小偷和守卫,不存在纯策略纳什均衡,但有混合策略NE、小偷的混合策略、守卫的混合策略、2.4.4多重均衡博弈和混合策略、混合策略NE两个纯策略NE这个混合战略是严格的劣化战略吗? 2.4.5混合战略和严格劣化战略重复消去法严格消去法在NE重复消去后的战略组合不是唯一消去
10、的情况下,该组合是NE。 在纯战略条件下没有严格的退化战略,引入混合战略(u,1/2 )的m,1/2 d,0 )发现d是相对严格的退化战略,2.4.6混合战略反应函数反应函数是对一个战略概率分布的反应,同样是一个概率、2.5NE的存在性、2.5.1纳什定理、2.5.2不动点定理、连续案例NE的必要条件、连续案例NE的检验方法、2.6纳什均衡的选择和分析方法的扩展、2.6.1存在性与唯一性不相等的很多游戏存在于多重NE中。 2.6.2帕累托优秀的NE在一系列均衡中,对于所有局中的人来说,某一均衡上的游戏支付优于其他任何均衡上的对应支付。 2.6.3风险优良的NE以下游戏中,(丁、丁)是帕累托优良
11、的NE,但风险大,当局中的人a脱离自白策略时,局中的人b的支付从8变为0。 但是,由于不存在这样的风险问题,所以被称为风险优越的NE,2.6.4集点均衡谢林(Schelling,1960 ),局中人会发现这些信息与文化历史有关。 汽车在右教室占座位为什么有很多人坐在后面,但是有人想坐在前面。 如果大家先来,哪个座位先被人占领,哪个座位后被人占领。 先来后不来的话,大家会抢座位吗? 为什么有人在日本占据座位,大家都承认这个潜在的规则。 2.6.5相关均衡阿曼(Aumann,1974 )指出,NE是通过站内的人都可以看到的信号来确定的。 Aumann游戏有两个单纯的战略平衡:(上、左)、(下、右)
12、另一个混合策略均衡: (1/2,1/2 )、(1/2,1/2 )对应的付款是(5,1 )、(1,5 )、(2. 5,2.5 )。 按先到先得的顺序决定的话,每个人先到的概率都是0.5,每个人的支付希望是0.55 0.51=3。 如果设置信号机,a、b、c以1/3的概率表示,甲只能识别是否表示a,乙只能识别是否表示c。 甲看了a就选了,要不然就选了。 看到洛克就选左边,否则就选右边。 双方愿意支付的是(10/3,10/3 )。 2.6.6防止共谋均衡a .多人游戏中的共谋问题存在2个NE:(U,l,A)(D,r,b )。 但是,如果和之间有共谋,当选a时,选择d、r,就可以改善和的支付,同时使状
13、况恶化。 b .强均衡(Aumann,1959 )条件:给予他局中人的策略时,局中不存在由人的任意子集构成的联盟,联盟中全部成员的支付因联盟脱离而增加。 强均衡一定是帕累托出色的均衡。 c .防止共谋均衡(Bernheim、Peleg、Whinston、1987 )任何一局中人都不会单独偏离,两局中人联盟也不会偏离。 偏差局里的人再次给予偏差的机会,两个联盟中总是有再次单独偏差的人。 二次偏差的不稳定。 这样类推,以免所有局里的人联盟错位。 共谋防止均衡包含着较强的均衡。 CH3完整且完美的信息动态游戏3.1动态游戏显示方法和特征,3.1.1动态游戏定义站中人可以依次选择,并且所选择的站中人可
14、以在选择之前看到其他站中人选择的游戏。 3.1.2可扩展性游戏树3.1.3的特征是缺乏对称性策略,与步骤有所区别。3.2可靠性和纳什均衡问题、3.2.1摄像机选择和策略的可靠性、3.2.2纳什均衡和可靠性在法律保障不充分的金矿博弈中,存在纳什均衡: b :借,a :分。 但是,这个战略的组合并不是稳定的游戏结果。 因为b在第三阶段的战略打击是不可靠的威胁。 因此,NE是一个有限的概念。3.2.3反推归纳法从动态游戏的最终阶段的人的行动反向分析前阶段的人的行动选择,分析第一阶段的人的行动。 以“法律保障不充分的金矿博弈”为例,3.3子博弈和子博弈是完全的纳什均衡,3.3.1信息集同时是某局中人的
15、一些决策节点的集合。 如果存在用于确定游戏进展的不同信息组,那么全局人员可以区分游戏并进入该信息组。 但是,他不知道前进到了那个信息集中的那个节点。 信息集反例,3.3.2动态游戏中的子游戏定义:在一个n人扩展型游戏g中,将满足以下条件的游戏s称为g1子游戏。 (1)S的游戏树是g游戏树的一个分支。 (2)S不能划分g的信息集,换句话说,如果g的信息集的任何确定节点是s的确定节点,则g的该信息集的每一确定节点必须是s的确定节点。 (3)S末端的支付向量与这些末端节点处的有关g的支付向量的部分重叠。 在子游戏的数量、3.3.3子游戏完美纳什均衡完美信息动态游戏g中,策略组合s是子游戏完美纳什均衡
16、的条件,无论哪个子游戏都是纳什均衡。 子博弈的完美纳什均衡本身也是纳什均衡,是比纳什均衡更强的均衡。 默示规则:世界冠军首先应该是亚洲冠军,欧洲杯冠军第三届(1968 )意大利第四届(1972 )西德第六届(1980 )德国第七届(1984 )法国第十届(1996 )德国世界杯冠军第八届1966年英格兰第十届1974年西德第十二届1982年意大利第十四届1990年西德第十六届1998年法国第十八届2006年意大利、3.4动态游戏模式、3.4.1谈判模式a.3回合第三轮乙方必须接受S3,否则中止谈判。 这是最坏的结果。 因此,加到第三回合的估计数S3一定是1000。 b .无限回合谈判游戏没有明确的目标,Shaked和Sutton(1984 )提出的解决方案从第一阶段到(2n 1)阶段没有差别。 假设上帝给了我们一个反推的结果。 甲乙的支付如果是s和1000-S的话,第一回合和第三回合都应该得到这个结果。 3.4.2间接融资和兑换热潮,CH4重复游戏4.1定义,4.1.1概念重复同一游戏的游戏过程称为重复游戏。 每次给出基本游戏g重复g,重复g时,各局的人都能观察以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个性化推送式广告制作规范
- 华为公司战略布局顾问面试全解析
- 制造业生产技术部总经理的生产效率提升策略
- 制造业生产经理的招聘与选拔经验
- 政府采购专家评审团成员的选拔与培训经验
- 现代办公场所绿色改造及维护策略
- 首创科技公司行政主管的年度工作计划
- 介绍自己的物品作文
- 航空航天企业工程师面试技巧
- 京東電商平台數據分析的關鍵成功因素
- 都兰宏源实业有限公司大海滩铁矿采矿权出让收益评估报告
- 新媒体编创-图文 短视频 直播(微课版)PPT完整全套教学课件
- 内蒙古自治区锡林郭勒盟高职单招2023年职业技能真题及答案
- 1-船舶碰撞应急预案(预案-001)
- 教育研究方法完整PPT
- 医疗器械相关压力性损伤及预防
- 广联达软件学习报告
- 任务3.3 空间数据误差校正
- GB/T 6533-2012原油中水和沉淀物的测定离心法
- GB/T 37612-2019耐蚀合金焊丝
- GB 28380-2012微型计算机能效限定值及能效等级
评论
0/150
提交评论