《第二章写在前面的话2》_第1页
《第二章写在前面的话2》_第2页
《第二章写在前面的话2》_第3页
《第二章写在前面的话2》_第4页
《第二章写在前面的话2》_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 东北财经大学 数量经济系 刘德海 博弈论前沿专题(Advances in Game Theory)2第二章第二章 预备知识(预备知识(2 2)n上一章主要内容: 第一节 博弈论学科的产生、发展和演变过程 第二节 博弈论与“理性”概念; n本章主要内容: 第一节 博弈论的一些重要概念:经验主义,均衡,合作,信息 第二节 博弈的基本要素; 第三节 博弈模型的三种正规表述。3复习复习:作为一种数学分析方法,传统博弈对参与者的“理性”要求非常苛刻n目标理性目标理性( (主观理性主观理性):):参与者追求自身利益的最大化(经济学理性的内涵)n过程理性(具有理性的能力)过程理性(具有理性的能力):给定

2、参与者对外部环境的信念后最大化自己的报酬,即“前后一致的”做出选择.可以分为两个推理步骤:认知理性(cognitive)参与者对相关环境可获得的信息与形成的信念之间的一致性,即参与者具有对相关环境形成信念的能力; 具体要求:参与者了解博弈的结构和规则、以及理性的“共同知识”(递推归纳法的基础)、作为不完全信息博弈均衡求解基础的贝叶斯理性(参与者对不确定性事物具有事前概率分布的判断,在动态过程中进行更新的贝叶斯决策)。工具理性(instrumental)参与者对外部给定的机遇与固定的偏好之间的一致性,即参与者具有从既定的信念推导出采取相应策略的能力。 具体要求:参与者具有计算推理、预见、记忆、分

3、析判断的能力(例:求解动态博弈均衡的递推归纳法),不会犯错误(例:颤抖手均衡要求犯错误时仍具有稳健性)等。信念采取相应策略最大化目标相关环境认知理性工具理性目标理性第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息4n王国维人间词话三种境界:n 古今之成大事业、大学问者,必经过三种之境界:“昨夜西风凋碧树。独上高楼,望尽天涯路。”此第一境也。n“衣带渐宽终不悔,为伊消得人憔悴。”此第二境也。n“众里寻他千百度,回头蓦见,那人正在,灯火阑珊处。”此第三境也。 5理论分析实验检验理性主义均衡分析传统

4、博弈演化主义均衡分析机制设计理论、信息经济学实验博弈演化博弈非合作博弈合作博弈不完全或不完美信息博弈完全完美信息博弈博弈论的理论体系博弈论的理论体系:经验主义经验主义均衡均衡合作合作信息信息第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息静态博弈、动态博弈、重复博弈6博弈论与经验主义博弈论与经验主义:n博弈论并不是仅用于示意性说明的智力游戏,而是来源于社会现实中的矛盾冲突与合作。 博弈模型需要经验证明:或者实验室进行;或者实地检验博弈模型需要经验证明:或者实验室进行;或者实地检验。(1) 实验

5、博弈:在可控的实验条件下进行有关策略相互作用的经验性研究。(2) 通过分析经济社会的历史数据分析,可以对博弈模型的“理性”行为加以检验即计量革命。第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息1 经验主义经验主义7博弈中均衡(纳什均衡)的不同理解博弈中均衡(纳什均衡)的不同理解:n观点1:参与者们采取的最佳应对策略一致同意达到的结果,其具有“可自我实施”(self-enforcement)的特征(即:独自偏离均衡策略不会带来更好结果)。该观点认为,均衡是一种结果。n观点2:博弈均衡,当且仅当

6、每一个参与者对所有参与者的行为有正确的预期。该观点认为,均衡是一种信念。n观点3:该观点认为,均衡是一种规则。 因此,在理性假设下,三种观点是等价的(化蝶)。博弈的规则信念结果认知理性工具理性第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息2 均衡均衡8n均衡的存在性均衡的存在性:纳什定理(1950,利用不动点定理证明)n均衡的唯一性均衡的唯一性:非常不幸,经常面临的一个苦恼就是多个均衡同时存在(世界的多样性) 非合作博弈理论的主要研究问题:多重均衡的精练问题n选择选择(selection)与

7、精练与精练(perfection) 选择问题:在非合作博弈中,一些威胁和承诺是不可信的(三马食槽故事、96军演威胁),如何选择那些能够实现一致预期的均衡结果; 精练问题:对于博弈存在多重均衡的情况,如何判断哪些均衡更有可能实现。多重均衡的意义多重均衡的意义第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息2 均衡均衡9资料夹资料夹三马食槽三马食槽承诺的可信性:承诺的可信性:n 明帝托孤托给曹爽与司马懿。曹爽党羽李胜要到荆州任刺史,临行前去拜望司马懿。司马懿假装病重,耳聋并且胡涂,曹爽等从此不再防

8、备司马懿。魏帝曹芳离开洛阳去祭扫魏明帝的坟墓高平陵,曹爽兄弟均跟从。司马懿乘机上奏永宁太后,请废曹爽兄弟,史称“高平陵事变”。n 司马懿自己率太尉等勒兵出迎天子,驻扎在洛水浮桥。桓范劝曹爽挟持皇帝到许昌去,发文书征调天下兵马勤王。曹爽优柔寡断,夜里遣人见司马懿,探听动静。司马懿乘机劝诱,朝廷只是免他的官职罢了,并以洛水为誓。顾及城中家小,欲信其言。桓范等人援引古今,百般劝谏无效。曹爽请皇帝下诏免去自己官职,随皇帝进入京城。n 曹爽兄弟一回府,即被司马懿派兵包围。不久,司马懿以谋反的罪名,杀曹爽及其党羽,并灭三族。后阮籍“天下无英雄,使竖子成名” n思考:曹真的理性选择?(勤王) 10n96军演

9、威胁威胁的不可信 96李登辉访美,抛出“两国论”。在台湾当局“总统”大选前大陆举行军事演习,预定落弹点台湾东部,美国出动航母战斗群。 由于大陆高层军事将领叛国提前泄露情报,李登辉指出导弹是空弹壳,叫嚣不怕。大选支持率反而上升。n大陆放弃武力犯台,台湾以不独立回应承诺不可信 这是典型的动态不一致的例子。因为给定大陆已经同意不武力防独的情况下,台湾没有必要再保持不独立的承诺,到那时,最佳的策略是独立。所以大陆先放弃武力犯台的威胁,台湾再以不独立回应大陆的善意 不可能是一个子博弈均衡(Subgame perfect equilibrium).资料夹资料夹台海局势中威胁与承诺的可信性:台海局势中威胁与

10、承诺的可信性:11n经济学,报酬递增产生多重均衡n多重均衡产生“路径依赖”现象,“锁定(lock-in)”在低效率的均衡:其中的一种均衡状态比另一种均衡状态有着更高的劳动分工和生产率水平,但由于生产者之间的“协调失灵”,经济无法由低分工水平均衡跃迁到高分工水平均衡。n举例:计算机键盘沿袭打字机,为防止机械机构纠缠故意设计别扭; 现代类人猿锁定在进化死胡同中。n比较优势理论的局限性:单一均衡,可以发挥比较优势,尽快收敛到工业化国家均衡点;对于多重均衡,农业技术运用上可能导致“传统农业技术陷阱”;国际分工当中可能导致“贸易陷阱”,被锁定在国际产业分工链的低端。资料夹资料夹多重均衡的意义:多重均衡的

11、意义:SDQP供给S增加,同时价格P下降12博弈均衡是如何形成的?博弈均衡是如何形成的? Nash在其博士论文“Non-cooperative games”(1950年)给出Nash均衡的两种解释,n一种是“理性主义”的、内省的、演绎的传统解说均衡是通过理性的参与者进行严密的逻辑演绎推理得到的,对参与者的理性能力有较高要求(传统博弈分析,顿悟)。n一种是学习的、归纳的、演化的解说当时没有很好的方法构建数学模型(国际上90年代兴起演化博弈理论,渐悟)。第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、

12、信息2 均衡均衡13资料夹资料夹佛教禅宗六祖慧能佛教禅宗六祖慧能“顿悟顿悟”:n 六祖慧能原在一家小旅馆里打杂,有一天在给客人收拾东西的时候听客人在念金刚经。六祖慧能听罢便觉其中奥义博大,于是决心出家为僧。他投在五祖弘忍门下,每日做些杂务。n 有一日,五祖要门下众人将自己领悟的佛法写做一偈,大弟子神秀在门前徘徊许久,又返回居所。后来在墙上写的是:身若菩提树,心如明镜身若菩提树,心如明镜台。时时勤拂拭,莫使惹尘埃(渐悟)台。时时勤拂拭,莫使惹尘埃(渐悟)。弟子们看见了十分钦佩。五祖看了,却说他还没有领悟佛法的真谛。众弟子自然不明白其中的道理。n 又一日,有游客入寺。慧能请求游客帮忙,游客问他你为

13、什么不自己写呢?慧能说我不识得字。游客笑他说:你连字都不识还能领悟佛法?慧能说我能否领悟,你看偈语便知道了。游客笑道:那好,你若能领悟,别忘记引我入法门啊!n 于是,慧能说,那游客写道:菩提本无树,明镜亦非台。本来无一物,菩提本无树,明镜亦非台。本来无一物,何处惹尘埃?(顿悟)何处惹尘埃?(顿悟)众人看后大惊,才知慧能果然领悟了佛法真谛!就这样,五祖将衣钵传与六祖慧能。而神秀则是北派佛教一代宗师!14理性主义的均衡实现理性主义的均衡实现:n均衡形成的“理性主义”的传统博弈观点,认为均衡形成纯粹是一个高度理性的智力游戏,并在瞬间实现了均衡。n思考:该实现途径是否合理?实验检验n分钱博弈:两个参与

14、者对100美圆协商进行分配,如果无法达成一致意见,则都得不到。理论分析结果:在0,100之间的连续集合上有无限多均衡。实际结果将是50:50因为这一均衡具有符合公平的社会原则特点,成为吸引注意力的焦点。n解决方法:Schelling(1960)提出焦点理论(focal-point)多重均衡中考虑公平、效率、对等原则等社会和文化习俗因素。n解读:该观点是在个体“冰冷的”理性选择中(经济学规范),引入了社会准则的伦理道德(社会学规范)。第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息2 均衡均衡1

15、5演化主义的均衡实现演化主义的均衡实现:n真实世界中,有限理性的人们,行为具有模仿、经验主义的、惯例特征,从错误和尝试中进行学习。(80年代改革“摸石头过河”)n由于实际中会发生重复,时间弥补了较弱的理性时间弥补了较弱的理性。n在学习过程中,有限理性的参与者在观察对手的行动后,根据一些实用主义的修正原则(各种动态调整过程),修改关于对手未来采取行动的预期。n一个有意思的结果:如果动态的过程是收敛的,则将趋向于传统博弈的均衡点。即使参与者行为是有限理性的,群体行为的演化最终也学会达到理性均衡。(真实世界里的市场经济图景)n根据进化论的均衡观点,传统博弈对多重均衡进行精练没有太大意义,因为真实世界

16、中的均衡来自于历史演化的初始条件和演化过程中引起突变的一些随机事件。第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息2 均衡均衡16nMaynard Smith(1982)等研究鹰鸽博弈等生物种群竞争现象,构造了基本分析框架。n每个参与者代表一个种群,随机组合匹配,进行预先规定好收益的要素博弈;n少部分参与者的策略产生突变突变(试错法);大部分参与者根据不同的学习规则进行模仿,其中最有效率的参与者经选择选择过程得以大量复制;(物演天择,适者生存)n演化主义基于群体行为的均衡 判断标准:当群体发

17、生少部分突变策略产生入侵,造成不同策略的分布构成发生一个很小的变化后,仍能维持原稳定构成。n演化博弈理论成为90年代以来博弈论最为活跃的一个领域之一,并应用在经济社会体制的起源和多样性、互补性演化研究中。 资料夹资料夹演化主义均衡形成观的生物学起源:演化主义均衡形成观的生物学起源:17n非合作博弈非合作博弈:除了规则允许的协议以外,参与者之间无法达成有约束力的协议,作出的威胁、许诺是无法强制实施的,因此参与者只能根据“可察觉到的自我利益(perceived self-interest)”决策. 例子:一次性囚徒困境博弈中攻守同盟的瓦解n在非合作博弈中,仍可以出现内生的合作行为: 1 无名氏定理

18、揭示出,无限次重复博弈可摆脱“囚徒困境”; 2 考虑声誉效应后,可以在有限次重复博弈中实现合作 3 互惠机制 4 复杂网络上的演化博弈P NP-1,-1-8,0 0,-8-5,-5PNP21第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息3 合作合作18n合作博弈合作博弈:参与者之间的协议是有完全约束力并能够实施的,即外生给定的。n合作博弈研究的主要问题:如何实现有约束力的协议的参与者之间无冲突的串谋?不同于非合作博弈主要分析个人行为,合作博弈分析的是参与者形成什么样的联盟?如何瓜分合作的收益

19、?如果合作能够带来收益,但不是所有参与者都接受分配方案,则假定存在强制实施协议的外在机制(制度、仲裁者等)举例:我国汽车行业的串谋第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息3 合作合作19思考:人类进入信息社会,什么是信息?n1948年,信息论奠基人之一香农(Shanon, 美国数学家)第一个以信息公式的方式定义“信息是熵的减少信息是熵的减少”,这里用到的“熵”是不确定性的度量。实际上该定义是说,信息是“用来消除不确定的东西”。n控制论的奠基人维纳(Wiener)1948年指出:“信息就

20、是信息,不信息就是信息,不是物质,也不是能量是物质,也不是能量”。专门指出了信息是区别于物质与能量的第三类资源。n知识管理中,信息是用语言、文字、数字、符号、图象、声音、表情、状态等方式传递的内容。思考:信息知识智慧?第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息4 信息信息20博弈论中的两种信息特性博弈论中的两种信息特性:n完美信息(perfective information)参与者在选择行动时了解以前的历史,并且双方没有同时行动。“纵有千古”少年中国说举例:玩跳棋时的信息?喝酒猜拳的信

21、息?n完备信息(complete information)参与者对博弈的信息是否完全了解,又称完全信息。当各个要素(参与者、规则、得益、策略)都是共同知识时,为完备信息。 。“横有八荒”少年中国说n根据博弈的信息特征,传统博弈理论分为: 完全完美信息博弈、 不完全或不完美信息博弈第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息4 信息信息21信息问题在传统博弈理论中占据着核心地位信息问题在传统博弈理论中占据着核心地位:n由于私人信息的存在造成不完全信息n小典故:庄子与惠子游于濠梁之上。庄子曰:

22、“儵鱼出游从容,是鱼之乐也?”惠子曰:“子非鱼,安知鱼之乐?”庄子曰:“子非吾,安知吾不知鱼之乐?”庄子。秋水n产生了参与者的道德风险行为和逆向选择行为,导致效率损失(人民公社后期低效率)。n为此,要设计一种激励相容的机制(博弈规则),机制设计理论信息经济学第二章第二章 预备知识(预备知识(2) 第一节第一节 博弈论的一些重要概念:经验主义、均衡、合作、信息博弈论的一些重要概念:经验主义、均衡、合作、信息4 信息信息22n初期50、60年代合作化高效率数据,“傻子”雷锋原因:共产党人的革命理想主义和群众的热情,不符合经济学的“自私”人性假设。(当今河南的南街村)n后期70年代人民公社低效率由于

23、集体行动中私人信息的存在,造成考核时信息不完全,计时制道德风险行为:走后门,偷懒;逆向选择行为:出工高的反而是笨手,前苏联发起反酗酒运动n80年代大包干的激励机制分散劳动,交足国家的,剩下都是自己的。农民的劳动和自身利益直接挂钩,激励相容问题:分散劳动与农业机械化大生产的矛盾、水利设施等建设、勤劳能致富吗?资料夹资料夹人民公社后期低效率人民公社后期低效率一个信息问题的例子:一个信息问题的例子:23参与者(参与者(player):):n可以是个体(包括自然人和企业、国家、国家集团等团体)、群体(演化博弈);包括自然(此时为决策问题);n自然:指决定外生的随机变量的机制。为分析方便引入,自然作为虚

24、拟参与人没有自己的支付和目标函数(即所有结果对它是无差异的);n参与人决策的后果依赖于自然的选择。在不完全信息博弈中,自然选择参与人的类型。第二章第二章 预备知识(预备知识(2 2) 第二节第二节 博弈的基本要素博弈的基本要素24行动(行动(action):n参与者在某个时点的决策变量,用Ai表示第i个参与人的一个特定行动;n行动的顺序:行动的顺序对于博弈的结果是非常重要的,事实上,不同的行动顺序意味着不同的博弈。n一般假设参与者的行动空间和行动顺序是所有参与者的共同知识, 但是对参与者采用某一具体行动的信息可以是不完备的。静态博弈静态博弈(static game),又称同时行动博弈同时行动博

25、弈(simultaneous-move game):参与者们同时行动(或秘密行动),且独立行动(参与者做出决策前无法获得其他人的决策信息)。 思考:此时的信息特征?(不完美信息)动态博弈动态博弈(dynamic game),又称序贯行动博弈:不同参与者具有先后行动顺序,并能够为对方观察到。第二章第二章 预备知识(预备知识(2 2) 第二节第二节 博弈的基本要素博弈的基本要素25策略(策略(strategy):n参与者在给定信息集的情况下选择行动的规则,它规定参与者在什么情况下选择什么行动,是参与者的“相机行动方案”,包括参与者采取行动的完整描述。n对于静态博弈,策略等于行动;n对于动态博弈,策

26、略针对不同情况由一系列不同阶段分别采取的行动构成。“敌不犯我,我不犯敌;敌若犯我,我必犯敌”n理解:策略可以理解成指示参与人进行博弈的一系列指令,必须毫无遗漏;参与人按照指令参与博弈,本身没有任何主观的直觉判断意图。 相当于计算机按照既定程序运行,从而简化了行为的分析n思考:理性限制使得参与者的思考过程机械化,从而实现数学建模第二章第二章 预备知识(预备知识(2 2) 第二节第二节 博弈的基本要素博弈的基本要素26收益(或者支付,收益(或者支付,payoff):n参与者采取某一策略所对应的结果;n假定支付代表了参与者对博弈结果的主观评价,此时等价于效用(utility),直接反映了参与者对风险

27、的评价(决策理论中期望效用函数的凹凸程度代表对风险态度,凹的表示风险规避的);n如果实验博弈等研究参与者对风险态度时,支付不同于效用。规则(规则(rule):n外生规则:行动结果;n内生规则:即均衡n规则的学习(rule learning)博弈的外部环境(博弈的外部环境(environoment):n外部环境的改变将影响博弈均衡第二章第二章 预备知识(预备知识(2 2) 第二节第二节 博弈的基本要素博弈的基本要素27讨论:效用函数讨论:效用函数=支付函数?支付函数?n对公平分配规则的感受:“In addition to purely selfish subjects, there are su

28、bjects who dislike inequitable outcomes”.见Fehr和Schmidt (1999)A theory of fairness, competition, and cooperation( )11-max- , 0 -max-, 0-1-1iiijiiijj ij iUxxx xx xnnn刘德海群体性突发事件产生根源的多阶段动态博弈分析 ,运筹与管理2011)(ijjjjpppun互惠模型: Dufwenberg和Kirchsteiger(2004)在扩展式博弈中分析,参与者i的效用是物质支付与心理互惠支付的加总,1,=,-max,+min,2iiijij

29、iiiijijijiijijiijijijijiijjiijjiijjiijUa b ca bYKa bb cKa ba ba ba b28n对弈:第二章第二章 预备知识(预备知识(2) 第三节第三节 博弈模型的三种正规表述博弈模型的三种正规表述 仙人对弈图(局部放大图,作者:陈玉圃)29“策略式策略式”模型模型(Shapley,1973采用这一术语,最初采用“标准式”)n策略式表述模型是把每一可行的策略向量 与支付向量 相联系的函数(X1,X n;u1,u n)。n“策略式”表述模型必须说明:(1)参与者集合A,B;(2)每个参与者的可行策略集合N,NP;(3)每个参与者采取某一可行的行动组

30、合时,所获得的支付。n策略式博弈的均衡求解方法:划线法 其中,均划线的组合即为双方一致同意的结果:纳什均衡,1,iixX in 1( ),( )nu xux-8,-80,-10-10,0-1,-1坦白P抵赖NP坦白P抵赖NP囚徒A囚徒 B第二章第二章 预备知识(预备知识(2) 第三节第三节 博弈模型的三种正规表述博弈模型的三种正规表述 30“策略式策略式”模型的几点说明:模型的几点说明:n混合策略:参与者随机地在所有可行策略集中选出要采取的策略。 其中, p j 为参与者选择纯策略 x j的概率:n不确定性来源:(1)一个外部的偶然行动介入博弈; (2)参与者对策略进行随机化。n策略式表述模型

31、用于双人、有限博弈双人、有限博弈比较方便(表示为双矩阵,by-matrix);n策略式模型中所有参与者一次性选择策略,仅适用于静态博弈静态博弈问题。 11(,),0, 1,mmjjjppppp其中第二章第二章 预备知识(预备知识(2) 第三节第三节 博弈模型的三种正规表述博弈模型的三种正规表述 31n静态混合策略的示例:守卫与小偷博弈n均衡点计算:假设小偷采取偷窃策略的概率为pA,则采取不偷策略的概率为(1- pA ); 守卫采取睡觉和不睡觉的收益相等: n分析:小偷偷窃的均衡概率p*A与守卫疲劳程度S成正比, 与守卫失窃后惩罚D成反比。n小作业:求守卫睡觉的混合均衡概率?(小作业:求守卫睡觉

32、的混合均衡概率?(试一试)V,-D-P,00,S0,0偷窃不偷睡觉不睡觉守卫小偷 -1010=0AAAAupDpSupp 睡觉守卫不睡觉守卫AuupS D S睡觉不睡觉守卫守卫,求解:32n小作业:求守卫睡觉的混合均衡概率?V,-D-P,00,S0,0第二章第二章 预备知识(预备知识(2) 第三节第三节 博弈模型的三种正规表述博弈模型的三种正规表述 偷窃不偷睡觉不睡觉守卫小偷 1010=0BBBBupVpPupp 偷窃小偷不偷窃小偷BuupP VP偷窃不偷窃小偷小偷,求解:n分析:守卫睡觉的均衡概率p*B与小偷被抓体罚P成正比, 与看管物品价值V成反比33n动态决策(序贯决策)问题: 决策树是

33、由决策点、事件点和结果构成的树图;采用逆序解法;决策准则常为最大收益期望值准则EMV。 n决策问题是博弈的一种特例,其中一方是自然参与者。 钻井 出油0.55 800 150 无油0.45 0 转让开采权 16011第二章第二章 预备知识(预备知识(2) 第三节第三节 博弈模型的三种正规表述博弈模型的三种正规表述 34“扩展式扩展式”模型模型(Von Neumann和O. Morgenstern,1944)n扩展式表述模型描述参与者的行动顺序和采取行动时拥有的信息n“扩展式”表述模型必须说明:(1)参与者集合;(2)该轮到谁采取行动;(3)在他(她)的每个信息集中,可以选择什么;(4)在他(她

34、)做出决策时,知道什么;(5)每个参与者采取某一可行的行动组合时,所获得的支付。n思考:静态博弈是否可采用扩展式表述模型?例:扩展式囚徒困境B(-8,-8)(0,-10) (-10,0)(-1,-1)A坦白 抵赖 坦白 抵赖 坦白 抵赖35扩展式博弈用博弈树(扩展式博弈用博弈树(game treegame tree)表示)表示:n结点:包括初始结点、决策结点(作出决策)、终结点(对应参与者报酬);若结点是有限的,则称有限次博弈。n枝:从一个决策结到它的直接后续结的连线,每一个枝代表参与者的一个行动选择;n信息集:一个参与者无法作出区分的最大决策点集合(如图,囚徒B无法判断A的行动,因此其信息集

35、为虚线连接)。例:扩展式囚徒困境B(-8,-8)(0,-10) (-10,0)(-1,-1)A坦白 抵赖 坦白 抵赖 坦白 抵赖第二章第二章 预备知识(预备知识(2) 第三节第三节 博弈模型的三种正规表述博弈模型的三种正规表述 36“扩展式扩展式”模型的几点说明:模型的几点说明:n当事件中有偶然因素介入时,在初始结点引入“自然”参与者,因为偶然因素等价于“自然”在参与人之前行动但参与人不能观测到。n完美回忆完美回忆(perfect recall)通俗描述:当轮到某个参与者行动时,从不会忘记过去知道什么,做了些什么。标准描述:在博弈树的每个信息集处,每个参与者知道以前的所有信息集,和在那些信息集

36、所做的决策n完美信息完美信息:参与者在选择行动时了解以前的历史(即完美回忆),并且没有同时行动。如果博弈树的所有信息都是单结的,该博弈称为完美信息博弈。第二章第二章 预备知识(预备知识(2) 第三节第三节 博弈模型的三种正规表述博弈模型的三种正规表述 372006-3-737n扩展式博弈的子博弈定义扩展式博弈的子博弈定义: (1)开始于博弈树一个结点,该节点对应一个单独信息集; (2)包含从节点开始的博弈树整个部分; (3)从不分割一个信息集(如不完全信息时要全部包括)n子博弈完美均衡的定义子博弈完美均衡的定义:一个纳什均衡是子博弈完美纳什均衡,当且仅当该策略的每一个子博弈都产生一个纳什均衡

37、,无论实际中是否能到达 。 理解:不仅博弈在整体上是纳什均衡,而且每一个小步骤都是纳什均衡。n子博弈完美均衡子博弈完美均衡存在性定理存在性定理(Selten, 1965):每个扩展式、完美信息博弈至少有一个纯策略子博弈完美纳什均衡。动态博弈的求解:子博弈完美均衡动态博弈的求解:子博弈完美均衡382006-3-738动态博弈的求解:子博弈完美均衡动态博弈的求解:子博弈完美均衡大陆(2,2) (3,1) (0,0)台独分子r维持现状 l推动台独k口头抗议 h台海战争n子博弈完美纳什均衡的求解过程:根据“共同知识”假设,参与者能够预见最后一期行动,因此采取后退归纳法后退归纳法分析;n子博弈完美纳什均

38、衡概念包含了后退归纳法的思想,即从最后一个子博弈的结点出发,分析最佳策略(纳什均衡);n依此类推,直至博弈开始阶段,得解。n例子:最后子博弈中,大陆收益比较:10,发动台海战争; 最初的子博弈中,台独收益比较:32,(推动台独,口头抗议)392006-3-739应用(动态博弈):低碳政策设计应用(动态博弈):低碳政策设计n低碳减排政策可分为两类:(1)惩罚性政策。如,政府推出实行排污权有偿取得、提高排污收费标准、征收碳税等。(2)激励性政策。如,政府提供低息贷款、技术扶持、产品优先采购、税收优惠等政策,鼓励企业进行节能减排 ;n政府如何针对高能耗企业设计合适的减排政策 ?40动态博弈的求解:子

39、博弈完美均衡动态博弈的求解:子博弈完美均衡n政府面临着三个策略减排补贴;中性政策;征收碳税;n企业面临着两个策略减排;保持现状;n减排的社会收益r,企业减排成本为c,政府补贴为s,碳税为tn假设:政府提供补贴s过低,不足于弥补减排成本c,c s,同时政府征收较高碳税,t cn求解求解:子博弈完美纳什均衡? 企业企业j保持现状保持现状M政府政府i减排减排R减排补贴减排补贴S(r-s, s-c) (0, 0)征收碳税征收碳税T保持现状保持现状M减排减排R保持现状保持现状M减排减排R中性中性N(r, -c) (0, 0)(r, -c) (t, -t)41动态博弈的求解:子博弈完美均衡动态博弈的求解:子博弈完美均衡企业企业j保持现状保持现状M政府政府i减排减排R减排补贴减排补贴S征收碳税征收碳税T保持现状保持现状M减排减排R保持现状保持现状M减排减排R中性中性N(r-s, s-c) (0, 0)(r, -c) (0, 0)(r, -c) (t, -t)n已知:政府提供补贴s小于减排成本c:c s, 政府征收较高碳税c大于减排成本:t cn逆推归纳法:逆推归纳法: 最后一阶段,企业分别选择:保持现状,保持现状,减排; 第一阶段,政府选择:征收碳税。n均衡路径征收碳税,减排,均衡结果(r,-c) 42练习练习1:“扩展式扩展式”表述模型的一个例子表述模型的一个例子n双人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论