博弈论与信息经济学.ppt

上传人：伐*** IP属地：宁夏上传时间：2020-04-11 格式：PPT 页数：116 大小：1.03MB 积分：20 举报 版权申诉

已阅读5页，还剩111页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论与信息经济学主讲何一鸣博士联系 hym0509 教材经济博弈论第三版复旦大学出版社 2007年版出勤 30 点名概率随上课人数的变化相机决策博弈考试开卷有益论文或出题形式取决于学生与学院的博弈结果 70 参考书目阅读书目第一章导论 1 1什么是博弈论 1 1 1从游戏到博弈博弈就是策略对抗或策略有关键作用的游戏博弈game 博弈论gametheory game即游戏竞技游戏和经济等决策竞争较量的共同特征规则结果策略选择策略和利益相互依存策略的关键作用游戏下棋猜大小经济寡头产量决策市场阻入投标拍卖政治军事美国和伊拉克以色列和巴勒斯坦 1 1 2一个非技术性定义四个核心方面博弈的参加者 player 博弈方各博弈方的策略 strategies 或行为 actions 博弈的次序 order 博弈方的得益 payoffs 1 2几个经典博弈模型1 2 1囚徒的困境囚徒的困境是图克 tucker 1950年提出的该博弈是博弈论最经典著名的博弈该博弈本身讲的是一个法律刑侦或犯罪学方面的问题但可以扩展到许多经济问题以及各种社会问题可以揭示市场经济的根本缺陷一基本模型 5 5 0 8 8 0 1 1 坦白不坦白坦白不坦白两个罪犯的得益矩阵囚徒2 囚徒1 囚徒1 坦白囚徒2 坦白二双寡头削价竞争政府组织协调的必要性和重要性寡头1 低价 70 寡头2 低价 70 1 3博弈论历史和发展简述 2000年前我国古代的齐威王田忌赛马 1500年前巴比伦犹太教法典婚姻合同问题等 1838年古诺寡头模型 1883年伯特兰德寡头竞争模型 1913年齐默罗象棋博弈定理逆推归纳法 1921 1927年波雷尔混合策略的第一个现代表述有数种策略两人博弈的极小化极大解1928年诺伊曼和摩根斯坦扩展形博弈定义证明有限策略两人零和博弈有确定结果 1 3 1博弈论的形成冯诺伊曼和摩根斯坦博弈论和经济行为 theoryofgamesandeconomicbehavior1944引进扩展形 extensiveform 表示和正规形 normalform 或称策略形 strategyform 矩阵形 matrixform 表示提出稳定集 stablesets 解概念正式提出创造博弈论一般理论的主意给出博弈论研究的一般框架概念术语和表述方法 1 3 2博弈论的成长和发展一第一个研究高潮本世纪40年代末和50年代初 1950年纳什提出纳什均衡 nashequilibrium 概念和证明纳什定理发展非合作博弈的基础理论 1950年melvindresher和merrillflood在兰德公司美国空军囚徒的困境 prison sdilemma 博弈实验 howardraiffa 独立进行这个博弈实验 1952 1953年期间 l s shapley 和 d b gillies 提出核 core 作为合作博弈的一般解概念shapley提出了合作博弈的 shapley值 shapleyvalue 概念等奥曼 r j aumann 40年代末50年代初是博弈论历史上令人振奋的时期原理已经破茧而出正在试飞它们的双翅活跃着一批巨人二 50年代中后期一直到70年代博弈论发展的青年期 1954 1955年提出了微分博弈 differentialgames 的概念奥曼则在1959年提出了强均衡 strongequilibrium 的概念重复博弈 repeatedgames 也是在50年代末开始研究的这自然引出了关于重复博弈的民间定理 folktheorem 1960年 thomasc schelling 引进了焦点 focalpoint 的概念博弈论在进化生物学 evolutionarybiology 中的公开应用也是在60年代初出现的塞尔腾 selten 1965提出子博弈完美纳什均衡 subgameperfectnashequilibrium 1975年提出的颤抖手均衡 tremblinghandperfectequilibrium 海萨尼 harsanyi 1967 1968三篇构造不完全信息博弈理论的系列论文贝叶斯纳什均衡 bayesiannashequilibrium 海萨尼1973年提出关于混合策略的不完全信息解释以及严格纳什均衡 strictnashequilibrium 70年代进化博弈论 evolutionarygametheory 的重要发展 johnmaynardsmith 1972年引进进化稳定策略 evolutionarilystablestrategy ess 等共同知识 commonknowledge 的重要性因为奥曼1976年的文章引起广泛的重视三 40年代末到70年代末是博弈论发展的重要阶段这个时期博弈理论仍然没有成熟理论体系还比较乱概念和分析方法很不统一在经济学中的作用和影响还比较有限但这个时期博弈论研究的繁荣和进展却是非常显著的对这一阶段博弈论研究的迅速发展除了理论发展自身规律的作用以外全球政治军事经济特定环境条件的影响战争和冷战时期的军事对抗和威慑策略研究的需要经济竞争国际经济竞争的加剧以及经济学理论发展本身的需要等都起了重要的作用正是因为有了这一阶段博弈论研究的繁荣发展才有80 90年代博弈论的成熟和对经济学的博弈论革命 1 3 3博弈论的成熟及与主流经济学的融合一 80 90年代是博弈论走向成熟的时期 1981 elonkohlberg 顺推归纳法 forwardinduction 克瑞泼斯 davidm kreps 和威尔孙 robertwilson 1982年提出序列均衡 sequentialequilibria 1982年斯密 johnmaynardsmith 出版了进化和博弈论 1984年由伯恩海姆 b d bernheim 和皮尔斯 d g pearce 提出可理性化性 rationalizability 海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准 1991年弗得伯格 d fudenberg 和泰勒尔 j tirole 首先提出了完美贝叶斯均衡 perfextbayesianequilibrium 的概念二博弈论和经济学诺贝尔奖 1994 非合作博弈纳什 nash 海萨尼 harsanyi 泽尔腾 selten 1996 不对称信息激励理论莫里斯 mirrlees 和维克瑞 vickrey 2001 不完全信息市场博弈阿克罗夫 akerlof 斯宾斯 spence 斯蒂格里兹 stiglitze 2005 合作博弈论 aumann shcelling2007 机制设计 hurwicz maskin myerson 生于1928年6月13日任普林斯顿大学数学系教授 1950 约翰纳什获得美国普林斯顿高等研究院的应用博士学位他那篇仅仅27页的博士论文中有一个重要发现这就是后来被称为纳什均衡的博弈理论 1920年5月29日出生于匈牙利布达佩斯 2000年在美国柏克莱逝世海萨尼的父母曾希望他将来成为一个药商但海萨尼自己爱好研究哲学和数学但选择了布达佩斯大学的药学专业 1944年初他获得了药学硕士学位但是 1944年3月德国军队占领了匈牙利海萨尼从5月到11月被强迫到一个苦力营中劳动同年11月纳粹当局决定将海萨尼所在的苦力营从布达佩斯放逐到奥地利的一个集中营去但是海萨尼很幸运地就在列车开往奥地利之前从布达佩斯火车站逃脱一位他认识的耶钱教神父让他躲在修道院的地窖里避难海萨尼确实是够幸运的因为后来他那些苦力营的同伴绝大多数都死于集中营里战后的1946年海萨尼重新到布达佩斯大学注册入学攻读博士学位专业是哲学兼修社会学和心理学海萨尼于1947年6月获得布达佩斯大学哲学博士学位 1948年6月由于海萨尼与当局政见不同他被迫从研究所辞职 1950年4月海萨尼逃到了奥地利 1950年12月30日他到达澳大利亚的悉尼在悉尼的工厂当劳工的同时在悉尼大学修读经济学夜间课程并于1953年取得文学硕士在悉尼读书时他开始在经济期刊包括 journalofpoliticaleconomy 和 thereviewofeconomicstudies 发表研究论文由于拥有学位他得以于1956年在布里斯班昆士兰大学取得教席在1958年他获得了洛克菲勒奖学金在美国斯坦福大学肯尼斯约瑟夫阿罗的指导下写了一篇关于博弈论的论文并于1959年取得了第二个经济学博士学位 1958年在堪培拉澳大利亚国立大学以研究员身份工作一段很短的时间后因为博弈论在澳大利亚仍是默默无闻而感到被孤立在肯尼斯阿罗和詹姆斯托宾的帮助下他得以能够迁移到美国同时于1961年至1963年之间在底特律韦恩州立大学担任经济学教授 1964年他转到美国柏克莱加州大学并一直留在那里直至他于1990年退休 1930年10月10日出生于德国的不莱斯劳 breslau 泽尔腾考入了法兰克福大学数学系 1957年毕业获数学硕士学位而后从事着博弈论及其应用实验经济学等博弈论的学术研究 1961年泽尔腾获得法兰克福大学数学博士学位 60年代早期泽尔腾做了寡头博弈的实验 1967 1968年度泽尔腾到加州伯克利分校作访问教授 1972年转到比勒菲尔德大学 universityofbielefeld 工作 1984年至今一直在波恩大学工作 1936 07 05亚当斯密的同乡莫里斯从小就显露出了对数学的浓厚兴趣和超乎寻常的天分 1957年莫里斯以第一名的骄人成绩从爱丁堡大学数学系毕业顺利进入剑桥大学拿下了博士学位后来近30年的时间里莫里斯一直执教于牛津现在是剑桥大学和香港中文大学的经济学教授除了担任过国际计量经济学会会长英国皇家经济学会会长中国政府经济顾问等职 1997年莫里斯教授还被英国女王授予了爵士爵位 1914年维克瑞生于加拿大 1935年获耶鲁大学理学学士学位 1937年获哥伦比亚大学硕士学位 1945年起维克瑞任职于哥伦比亚大学 1947年又获哥伦比亚大学哲学博士学位 1964 1967年他担任哥伦比亚大学经济系主任在此期间曾任纽约市城市经济协会会长 1967年成为加利福尼亚斯坦福行为科学高级研究中心研究员与经济计量学会会员 1971年出任澳大利亚纳施大学客座讲师 1973年出任美国经济研究局局长 1974年他出任联合国发展规划预测和政策中心财政顾问并成为美国文理研究院研究员 1979年获芝加哥大学人文学博士在得奖三天之后在前去开会的途中去世他在诺贝尔的光环照耀中倒下了其一生为学术研究鞠躬尽瘁最后为其人生画上了一个美丽的句号 1940 6 17 1966年获美国麻省理工学院博士头衔现为美国加利福尼亚州大学伯克利 ucberkeley 经济学教授 1943 11 7生于美国新泽西州 1962 1966年就读于普林斯顿大学并获哲学学士学位 1968年在牛津大学获数学硕士学位并获得该校罗氏奖学金 1972年在哈佛大学获经济学博士学位约瑟夫斯蒂格利茨 josephe stiglitz 2001年诺贝尔经济学奖获得者 josepheugenestiglitz formemrs fba bornfebruary9 1943 isanamericaneconomistandaprofessoratcolumbiauniversity heisarecipientofthenobelmemorialprizeineconomicsciences 2001 andthejohnbatesclarkmedal 1979 heisalsotheformerseniorvicepresidentandchiefeconomistoftheworldbank aumann bornjune8 1930 isanisraeli americanmathematicianandamemberoftheunitedstatesnationalacademyofsciences heisaprofessoratthecenterforthestudyofrationalityinthehebrewuniversityofjerusaleminisrael healsoholdsavisitingpositionatstonybrookuniversityandisoneofthefoundingmembersofthecenterforgametheoryineconomicsatstonybrook thomascrombieschelling born14april1921 isanamericaneconomistandprofessorofforeignaffairs nationalsecurity nuclearstrategy andarmscontrolattheschoolofpublicpolicyatuniversityofmaryland collegepark heisalsoco facultyatthenewenglandcomplexsystemsinstitute hewasawardedthe2005nobelmemorialprizeineconomicsciences sharedwithrobertaumann for havingenhancedourunderstandingofconflictandcooperationthroughgame theoryanalysis hurwicz august21 1917 june24 2008 wasarussian bornamericaneconomistandmathematician hisnationalityoforiginwaspolish hewasjewish heoriginatedincentivecompatibilityandmechanismdesign whichshowhowdesiredoutcomesareachievedineconomics socialscienceandpoliticalscience interactionsofindividualsandinstitutions marketsandtradeareanalyzedandunderstoodtodayusingthemodelshurwiczdeveloped maskin borndecember12 1950 isanamericaneconomistandnobellaureaterecognizedwithleonidhurwiczandrogermyerson forhavinglaidthefoundationsofmechanismdesigntheory heisthealberto hirschmanprofessorofsocialscienceattheinstituteforadvancedstudy andavisitinglecturerwiththerankofprofessoratprincetonuniversity myerson bornmarch29 1951 isanamericaneconomistandnobellaureaterecognizedwithleonidhurwiczandericmaskinfor havinglaidthefoundationsofmechanismdesigntheory aprofessorattheuniversityofchicago hehasmadecontributionsasaneconomist asanappliedmathematician andasapoliticalscientist 第二章完全信息静态博弈2 1上策均衡上策不管其它博弈方选择什么策略一博弈方的某个策略给他带来的得益始终高于其它的策略至少不低于其他策略的策略囚徒的困境中的坦白双寡头削价中低价上策均衡一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策必然是该博弈比较稳定的结果上策均衡不是普遍存在的 2 1 1严格下策反复消去法严格下策不管其它博弈方的策略如何变化给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去 2 1 2划线法 2 1 3箭头法 2 2纳什均衡2 2 1纳什均衡的定义策略空间博弈方的第个策略博弈方的得益博弈纳什均衡在博弈中如果由各个博弈方的各一个策略组成的某个策略组合中任一博弈方的策略都是对其余博弈方策略的组合的最佳对策也即对任意都成立则称为的一个纳什均衡 2 2 2纳什均衡与严格下策反复消去法上策均衡肯定是纳什均衡但纳什均衡不一定是上策均衡命题2 1 在n个博弈方的博弈中如果严格下策反复消去法排除了除之外的所有策略组合那么一定是该博弈的唯一的纳什均衡命题2 2 在n个博弈方的博弈中中如果是的一个纳什均衡那么严格下策反复消去法一定不会将它消去上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的 2 3无限策略分析和反应函数2 3 1古诺的寡头模型寡头产量竞争以两厂商产量竞争为例 4 5 4 5 5 3 75 3 75 5 4 4 不突破突破厂商2 不突破突破厂商1 以自身最大利益为目标各生产2单位产量各自得益为4以两厂商总体利益最大各生产1 5单位产量各自得益为4 5 两寡头间的囚徒困境博弈 2 3 2反应函数古诺模型的反应函数理性局限和古诺调整 2 3 3伯特兰德寡头模型价格竞争寡头的博弈模型产品无差别消费者对价格不十分敏感 2 3 4公共资源问题公共草地养羊问题以三农户为例n 3 c 4 合作总体利益最大化竞争个体利益最大化 2 4混合策略和混合策略纳什均衡2 4 1严格竞争博弈和混合策略的引进一猜硬币博弈 1 不存在前面定义的纳什均衡策略组合 2 关键是不能让对方猜到自己策略这类博弈很多引出混合策略纳什均衡概念二混合策略混合策略博弈和混合策略纳什均衡混合策略在博弈中博弈方的策略空间为则博弈方以概率分布随机在其个可选策略中选择的策略称为一个混合策略其中对都成立且混合策略扩展博弈博弈方在混合策略的策略空间概率分布空间的选择看作一个博弈就是原博弈的混合策略扩展博弈混合策略纳什均衡包含混合策略的策略组合构成纳什均衡三一个例子该博弈无纯策略纳什均衡可用混合策略纳什均衡分析策略得益博弈方1 0 8 0 2 2 6博弈方2 0 8 0 2 2 6 2 4 2多重均衡博弈和混合策略一夫妻之争的混合策略纳什均衡夫妻之争博弈的混合策略纳什均衡策略得益博弈方1 0 75 0 25 0 67博弈方2 1 3 2 3 0 75 2 4 3混合策略和严格下策反复消去法 2 4 4混合策略反应函数猜硬币博弈第三章完全且完美信息动态博弈3 1动态博弈的表示法和特点3 1 1阶段和扩展性表示阶段动态博弈中一个博弈方的一次选择行为例子仿冒和反仿冒博弈 3 1 2动态博弈的基本特点策略是在整个博弈中所有选择行为的计划结果是上述计划型策略的策略组合构成一条路径得益对应每条路径而不是对应每步选择行为动态博弈的非对称性先后次序决定动态博弈必然是非对称的先选择行为的博弈方常常更有利有先行优势 3 2可信性和纳什均衡的问题3 2 1相机选择和策略中的可信性问题不同版本的开金矿博弈分钱和打官司的可信性 3 2 2纳什均衡的问题第三种开金矿博弈中不借不打不分和借打分都是纳什均衡但后者不可信不可能实现或稳定结论纳什均衡在动态博弈可能缺乏稳定性也就是说在完全信息静态博弈中稳定的纳什均衡在动态博弈中可能是不稳定的不能作为预测的基础根源纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定不能解决动态博弈的相机选择引起的可信性问题 3 3子博弈和子博弈完美纳什均衡3 3 1子博弈定义由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的有初始信息集和进行博弈所需要的全部信息能够自成一个博弈的原博弈的一部分称为原动态博弈的一个子博弈 3 3 2子博弈完美纳什均衡定义如果一个完美信息的动态博弈中各博弈方的策略构成的一个策略组合满足在整个动态博弈及它的所有子博弈中都构成纳什均衡那么这个策略组合称为该动态博弈的一个子博弈完美纳什均衡子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺因此是真正稳定的逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法 3 4两个经典动态博弈模型3 4 1寡占的斯塔克博格模型先后选择产量的产量竞争博弈把古诺模型改为厂商1先选择厂商2后选择而非同时选择即可产量得益厂商13单位4 5厂商21 5单位2 25 先行优势 3 4 3讨价还价博弈三回合讨价还价三回合讨价还价博弈结果的讨论无限回合讨价还价 3 4 4委托人代理人理论一委托人代理人关系经济活动和社会活动中有很多委托人代理人关系有明显的也有隐蔽的工厂和工人店主和店员客户和律师市民和政府基金购买者和基金管理人等都是委托人代理人关系的关键特征不能直接控制监督不完全信息不完全利益的相关性委托人代理人涉及问题激励机制设计机制设计理论委托合同设计问题等二无不确定性的委托人代理人模型 r s w s w s s r e w e w e e r 0 0 r 0 0 代理人的选择激励相容约束 w e e w s sw e w s e s 参与约束参与约束委托人的选择数值例子 12 2 0 0 0 0 7 1 e 2 s 1 w e 4 w s 2 三有不确定性但可监督的委托人代理人博弈偷懒委托 0 1 20 w s 0 9 10 w s 0不委托 0 1 20 w s 0 9 10 w s 0 努力委托 0 9 20 w e 0 1 10 w e 0不委托 0 9 20 w e 0 1 10 w e 0 因为可监督因此代理人报酬与成果无关只与努力情况有关不确定性风险由委托人承担代理人选择同无不确定性情况四有不确定性且不可监督的委托人代理人博弈只能根据成果付酬 w是成果函数而非努力程度函数不确定性对代理人利益选择有影响努力 0 9 w 20 e 0 1 w 10 e 0 1 w 20 s 0 9 w 10 s 接受 0 9 w 20 e 0 1 w 10 e 0 委托 0 9 20 w 20 0 1 10 w 10 0 激励相容约束促使代理人努力的激励相容约束参与约束以及委托人选择委托的条件参与约束对于委托人来说就是要根据上述两个条件以及e s的值选择最佳的工资水平w 20 和w 10 或者它们的差额w 20 w 10 五选择报酬和连续努力水平的委托人代理人博弈店主和店员的问题商店的利润是均值为0的随机变量店员的负效用是店员的努力机会成本为1店主采用的报酬计算公式店员的得益店员期望得益为店主的得益为 3 5有同时选择的动态博弈模型3 5 1国际竞争和最优关税厂商的得益函数为第二阶段厂商选择第一阶段政府选择先把第二阶段根据厂商选择得到结果代入政府得益再求最优化政府的得益函数第四章重复博弈4 1重复博弈引论4 1 1为何研究重复博弈经济中的长期关系人们的预见性未来利益对当前行为的制约长期合同回头客长客和一次性买卖的区别有无确定的结束时间 4 1 2基本概念有限次重复博弈给定一个基本博弈g 可以是静态博弈也可以是动态博弈重复进行t次g 并且在每次重复g之前各博弈方都能观察到以前博弈的结果这样的博弈过程称为 g的t次重复博弈记为g t 而g则称为g t 的原博弈 g t 中的每次重复称为g t 的一个阶段无限次重复博弈一个基本博弈g一直重复博弈下去的博弈记为g 策略博弈方在每个阶段针对每种情况如何行为的计划子博弈从某个阶段不包括第一阶段开始包括此后所有的重复博弈部分均衡路径由每个阶段博弈方的行为组合串联而成重复博弈的得益 4 2有限次重复博弈4 2 1两人零和博弈的有限次重复博弈零和博弈是严格竞争的重复博弈并不改变这一点以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样博弈方的正确策略是重复一次性博弈中的纳什均衡策略 4 2 2唯一纯策略纳什均衡博弈的有限次重复博弈定理设原博弈g有唯一的纯策略纳什均衡则对任意整数t 重复博弈g t 有唯一的子博弈完美纳什均衡即各博弈方每个阶段都采用g的纳什均衡策略各博弈方在g t 中的总得益为在g中得益的t倍平均得益的与原博弈g中的得益有限次重复削价竞争博弈有唯一纯策略纳什均衡 70 70 有限次重复的结果仍然是低价低价 4 2 3有限次重复博弈的民间定理个体理性得益不管其它博弈方的行为如何一博弈方在某个博弈中只要自己采取某种特定的策略最低限度保证能获得的得益可实现得益博弈中所有纯策略组合得益的加权平均数组定理设原博弈的一次性博弈有均衡得益数组优于w 那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们 4 3无限次重复博弈4 3 1两人零和博弈的无限次重复博弈两人零和博弈无限次重复的所有阶段都不可能发生合作博弈方会一直重复原博弈的混合策略纳什均衡 4 3 2唯一纯策略纳什均衡博弈的无限次重复博弈两寡头削价竞争博弈该博弈一次性博弈均衡是都采用低价是囚徒困境型博弈无限次重复两寡头削价博弈触发策略第一阶段采用h 如果前t 1阶段的结果都是 h h 则继续采用h 否则采用l 如果博弈方2采用l 总得益现值为如果博弈方2采用h 总得益现值为因此当时此触发策略纳什均衡策略两寡头削价竞争无限次重复博弈的民间定理 4 3 3无限次重复古诺模型假定边际成本都为2 在无限次重复古诺模型中当贴现率满足一定条件时两厂商采用下列触发策略构成一个子博弈完美纳什均衡在第一阶段生产垄断产量的一半1 5 在第t阶段如果前t 1阶段结果都是 1 5 1 5 则继续生产1 5 否则生产古诺产量2 设厂商1已采用该触发策略若厂商2也采用该触发策略则每期得益4 5 无限次重复博弈总得益的现值为如果厂商2偏离上述触发策略则他在第一阶段所选产量应为给定厂商1产量为1 5时自己的最大利润产量即满足解得此时利润为5 0625 高于触发策略第一阶段得益4 5 但从第二阶段开始厂商1将报复性地永远采用古诺产量2 这样厂商2也被迫永远采用古诺产量从此得利润4 因此无限次重复博弈第一阶段偏离的情况下总得益的现值为当上述策略是厂商2对厂商1的同样触发策略的最佳反应否则偏离是最佳反应第六章完全但不完美信息动态博弈6 1不完美信息动态博弈6 1 2不完美信息动态博弈的表示多节点信息集扩展形表示 6 1 3不完美信息动态博弈的子博弈因为原博弈本身不会成为原博弈的后续阶段因此子博弈不能从原博弈的第一个节点开始即原博弈不是自己的子博弈包含所有在初始节点和终点但不包含不跟在此初始节点之后的节点不分割任何的信息集 6 2完美贝叶斯均衡6 2 1完美贝叶斯均衡定义在不完美信息动态博弈中纳什均衡和子博弈完美纳什均衡都不能解决问题需要引进新的均衡概念纳什均衡和子博弈完美纳什均衡分析方法反应函数和逆推归纳法等同样也要改进变化一个策略组合和相应的判断满足下列4个要求称为一个完美贝叶斯均衡要求1 在各个信息集轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的判断对非单节点信息集一个判断就是博弈达到该信息集中各个节点可能性的概率分布对单节点信息集则可理解为判断达到该节点的概率为1 要求2 给定各博弈方的判断他们的策略必须是序列理性的即在各个信息集给定轮到选择博弈方的判断和其他博弈方的后续策略该博弈方的行为及以后阶段的后续策略必须使自己的得益或期望得益最大此处所谓后续策略即相应的博弈方在所讨论信息集以后的阶段中针对所有可能情况如何行为的完整计划要求3 在均衡路径上的信息集处判断由贝叶斯法则和各博弈方的均衡策略决定要求4 在不处于均衡路径上的信息集处判断由贝叶斯法则和各博弈方在此处可能有的均衡策略决定 6 2 2均衡要求的初步解释 1 判断的必要性2 序列理性要求实质是利益最大化要求3 判断与策略的一致性符合策略和bayes法则包括均衡路径和非均衡路径上什么是均衡路径上的信息集在均衡路径上的信息集如果博弈按照均衡策略进行则该信息集会以正的概率达到不在均衡路径上的信息集博弈按均衡策略进行时绝对不可能达到或者达到的概率为0 1 均衡策略组合博弈方1第一阶段l 博弈方2第二阶段u 均衡路径上判断 p

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论与信息经济学.ppt

文档简介

温馨提示

最新文档

评论

博弈论与信息经济学.ppt

文档简介

温馨提示

最新文档

评论

相关文档