




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
21教案5第二章 完全信息静态博弈教 案 4 教学题目:(第二章 完全信息静态博弈,23)学时数2教学目的和要求:理解Nash均衡的表达。掌握Nash均衡的应用。教学基本内容:基本方法:理解Nash均衡的表达。掌握Nash均衡的应用。教学重点与难点:重点在于Nash均衡的应用;难点在于例2.6的讨论。教学过程:1 课前复习理解博弈均衡的概念。2 讲授新课:2.2 Nash均衡我们再以囚徒困境为例讨论如下:囚徒B坦白囚徒B抗拒囚徒A坦白-6,-60,-10囚徒A抗拒-10,0-1,-1显然,不论囚徒A选择坦白还是抗拒,囚徒B的最优策略都是坦白;不论囚徒B选择坦白还是抗拒,囚徒A的最优策略都是坦白;由收益函数:(抗拒,坦白)10; (坦白,坦白)6;(抗拒,抗拒)1; (坦白,抗拒)0 。(抗拒,坦白)0; (坦白,坦白)6;(抗拒,抗拒)1;(坦白,抗拒)10 。(坦白, ) (抗拒, );( , 坦白) ( , 抗拒);这时,“坦白”策略就成为囚徒A,B的严格优策略,如果一个博弈中的所有局中人都存在严格优策略,那么由这些严格优策略组成的局势,就是该博弈的惟一均衡解。在囚徒困境中的囚徒A,B的严格优策略“坦白”组成的局势(坦白,坦白)就是该博弈的惟一均衡解。记 ,则局势。定义 22 (严格优策略)在n人博弈中,除局中人外,其余n1个局中人的所有可能的局势,局中人存在着一个自己的策略,使得对一切的,有,则称是局中人的严格优策略。囚徒A,B在囚徒困境中都有自己的严格优策略“坦白”,组成的局势(坦白,坦白)为该博弈的惟一均衡解。这种现象是一般规律吗?命题 21 在n人博弈中,如果每一个局中人都有自己的严格优策略,那么,n个局中人每人的严格优策略组成的局势是博弈的惟一均衡解, 并称为严格优策略均衡局势或严格优策略均衡解。证明:由以上的讨论,n个局中人的严格优策略组成的局势是博弈的一个均衡解。如果博弈有两个均衡解,则至少有一个局中人有两个严格优策略, 设, .因为是局中人的严格优策略, 所以(1) ; 又因为也是局中人的严格优策略, 所以(2) .结合(1) (2) 两式有:,此为矛盾. 因此, . 从而, , 即解是唯一的. 定义 24 (优策略)在n人博弈中,除局中人外,其余n1个局中人的所有可能的局势,局中人存在着一个自己的策略,使得对一切的,有,并且, 局中人至少存在着一个自己的策略,使得,则称是局中人的优策略。显然, 严格优策略一定是优策略.但在许多情况下,不要说严格优策略,就是优策略都未必存在!我们以例 2-1(猎鹿博弈)为例讨论如下:猎人B-猎鹿猎人B-猎兔猎人A-猎鹿10, 100, 1 猎人A-猎兔1, 01, 1由收益函数:(猎鹿,猎鹿)10; (猎兔,猎鹿)1;(猎鹿,猎兔)0; (猎兔,猎兔)1 。(猎鹿,猎鹿)10; (猎兔,猎鹿)1;(猎鹿,猎兔)0; (猎兔,猎兔)1 。但是,(猎鹿,)(猎兔,)不成立,因为 (猎鹿,猎鹿)10 (猎兔,猎鹿)1;(猎鹿,猎兔)0 (猎兔,)成立,因为 (猎鹿,猎鹿)10 (猎兔,猎鹿)1; (猎鹿,猎兔)1 (猎兔,猎兔)=0;因此,猎人A有严格劣策略“猎兔”;同理,猎人B也有严格劣策略“猎兔”。我们在上述基本式中剔除严格劣策略,我们就只剩下一个均衡解:猎人B-猎鹿 猎人A-猎鹿10, 10我们为什么要割资本主义的尾巴?智猪博弈产生了, 我的经历:猎鹿博弈 智猪博弈 囚徒困境例 2-2 斗鸡博弈首先, 依据情景描述写出博弈的基本式:再列出博弈双方的收益矩阵(双矩阵)飞车党党徒B让飞车党党徒B撞飞车党党徒A让10 1010 10飞车党党徒A撞10 10 最后, 用相对优势策略的划线法求解:飞车党党徒B让飞车党党徒B撞飞车党党徒A让10 1010 10飞车党党徒A撞10 10 博弈解的第一组值为(10, +10)(双值),对应博弈的解为(让,撞);博弈解的第二组值为(+10, 10)(双值),对应博弈的解为(撞, 让),它们都是Nash均衡, 即此博弈有2个解, 或两个均衡点。例 2-3 双寡头垄断博弈(Cournot 模型(1838年)首先, 依据情景描述写出博弈的基本式;再列出博弈双方的收益矩阵(双矩阵)企业乙-定高价企业乙-定低价企业甲-定高价1000, 1000500, 1500企业甲-定低价1500, 500700, 700最后, 用相对优势策略的划线法求解:企业乙-定高价企业乙-定低价企业甲-定高价1000, 1000500, 1500企业甲-定低价1500, 500700, 700博弈的值为(700, 700)(双值),对应博弈的解为(低价,低价);它是Nash均衡。思考: 它与哪一个博弈是一致的?例 24 (双人抬物)博弈的基本式为:局中人的集合;策略空间出力,不出力出力,不出力;收益函数:(出力,出力), (出力,出力), (出力,不出力), (出力,不出力),(不出力,出力), (出力,不出力),(不出力,不出力)。 (不出力,不出力)。容易看出局中人1的偏好序为: (不出力,出力)(出力,出力)(不出力,不出力)(出力,不出力);容易看出局中人2的偏好序为: (出力,不出力)(出力,出力)(不出力,不出力)(不出力,出力);显然,两局中人均有(不出力,)(出力,),(不出力,)(出力,);即,选择“不出力”是两局中人的严格优策略,因此,惟一的Nash均衡为(不出力,不出力),博弈的值为(0, 0)。我们还可以用划线法解决:局中人2出力局中人2不出力局中人1出力,局中人1不出力,0, 0讨论:1. 例 25 (双人抬物)和哪一个博弈一致?2. 关于道德风险;3. 如何从技术上改变这种情况? 例 26(双虎争猎物)博弈的基本式为:局中人的集合;策略空间坚持,放弃坚持,放弃;收益函数:(坚持,坚持)(坚持,坚持), (坚持,放弃)(放弃,坚持),(放弃,坚持)(坚持,放弃),(放弃, 放弃)(放弃, 放弃)。容易看出两老虎没有严格优策略,我们还是用划线法解决:老虎B坚持老虎B放弃老虎A坚持,0 老虎A放弃0,0, 0因此,Nash均衡为(坚持,放弃)和(放弃, 坚持),博弈的值分别为(, 0)和(0,)。讨论:1. 例 210和哪一个博弈一致?2. 现实中有何意义? 例 27(情侣分歧)博弈的基本式为:局中人的集合;策略空间古典音乐,流行音乐古典音乐,流行音乐。收益函数用矩阵表示为:乙古典音乐乙流行音乐甲古典音乐, 0, 0甲流行音乐0, 0, ,用划线法解决:乙古典音乐乙流行音乐甲古典音乐, 0, 0甲流行音乐0, 0, 因此,Nash均衡为(古典音乐,古典音乐)和(流行音乐,流行音乐),博弈的值分别为(, )和(, ),()。讨论:1. 例 27和哪一个博弈一致?2. 协调型博弈在现实中有何意义? (总收益高)例 28 (公共产品的提供集资建桥)博弈的基本式为:局中人的集合;策略空间出资,不出资出资,不出资;收益函数根据参加出资的人数有不同的情况:1) 出资人数(人人出资才能建桥)(出资,出资), 出资居民的收益(至少有一个人不出资), 不出资居民的收益(至少有一个人不出资)。我们简化问题为两个局中人的情况:局中人出资局中人不出资局中人出资, ,0局中人不出资0, 0, 0因此,Nash均衡为(出资,出资)和(不出资,不出资)。2) 出资人数如果恰有个居民出资而个居民不出资。有2种情况,讨论如下:如果已经有个居民出资而个居民不出资,局中人将选择出资:个局中人出资,个局中人不出资局中人出资 局中人不出资0如果已经有个居民出资而个居民不出资个局中人出资,个局中人不出资局中人出资 局中人不出资Nash均衡出现了:(个居民出资,个居民不出资);根据组合的知识,这样的均衡共有种。如果已经有个居民出资,那么局中人的选择是不出资,因为个局中人出资局中人出资 局中人不出资0由于每一个局中人面对()个局中人出资时,必选择不出资,因此,Nash均衡为(不出资,不出资)。对()个居民出资,局中人的选择是不出资,因为()个局中人出资局中人出资 局中人不出资Nash均衡出现了:(个居民出资,个居民不出资);综上所述,这样的均衡共有2种。讨论:1.通过例 27,谈谈集资建设和公共产品如何摊派和收取集资款?例 28 (经济学著名例子:公共地悲剧)n个牧民共同拥有一片草地,每年,他们在这片草地上放牧养羊。设牧民放牧的羊为只,则全体牧民养羊 ,照看一只羊的平均成本为c ,当草地上有只羊时,牧民养每只羊的价值为。假设使草地上草的生长和羊群达到平衡的羊的只数为,如果羊的数量超过了,必将使草地的生态受到损害,从而使整个羊群不能吃饱,使羊的价值下降(此地将自变量看作连续变量),这就可以用数学语言来表达为() .公共地悲剧博弈 的基本式为:局中人的集合;策略空间;收益函数:博弈问题:每一个牧民如何确定自己羊群的数量,以获得自己的最大收益(仅仅考虑个人利益的最大化)?根据微积分的知识,这需要去求n元函数的极值, 而方法是先求n个变量的偏导数: .再令(),当为已知函数时,由以上n个方程,可以解出n个数,则得到Nash均衡局势。记 。我们以为例,有个方程构成的方程组:解出为简单起见,我们进一步假设这n个牧民的基本情况相同,因此,我们不妨设则n个收益函数成为,于是据()式,那么,为什么称作公共地悲剧呢?这n个牧民的总收益函数是(3) .这n个牧民在Nash均衡下的总收益是(4) .如果这块草地是由政府管理的,专家认定最佳的放牧量是, 即是使得收益最优的值,即(5) ,或对一切的总收益.根据极值的必要条件应当有(边际收益边际成本)。从(3)式推得代入有: .令我们首先有所以函数是递减的,其次我们得到,即.牧民在均衡处的羊多于专家设定的羊的最佳数量,又由于是使得收益函数取得最大值的点,有: .公共地悲剧指出: 如果每个牧民仅仅考虑个人利益的最大化, 那么, 在Nash均衡处, 羊群的数量大, 但不如羊群为的收益, 而且, 草地将退化, 所以, 生产应当是有组织的, 公共资源应当科学地开发. 怎么组织, 学问很深!公共地悲剧(P. 87)公共卫生国家资源例 2-9(密封式二级价格拍卖) 密封式二级价格拍卖规则介绍分析 局中人的集合:; 策略集: ,策略空间:; 局势: 是一个无限集。 收益函数: 。表示为局中人12。n标的物价值。竞拍报价。收益。为讨论方便,除第个局中人的报价外,把其余的个局中人报价的最大值记作我们讨论如下: 这8种情况归纳起来就是3种情况下有非负收益: 。由于是由局中人在报价前主观决定的,不是由局中人决定的,所以局中人的报价即可,是局中人的严格优策略。每一个局中人都有这样的严格优策略,由这些策略构成的局势是此博弈的均衡解,其值为,即,每个局中人都把自己的标的物价值作为自己的竞拍报价。通过许多的例子,我们可以得到结论:企图通过严格优策略来获取博弈均衡解的情况是不多见的。下面,我们比较严格的来叙述Nash均衡的概念:在一个n个局中人的博弈中,如果局势是博弈的一个均衡的话,对任意的一个局中人,当其面对其余n1个局中人的策略时,他在均衡中的策略选择一定是最优的(最优的意思是:如果他想改变在均衡中的策略选择,则其收益必将下降)。定义2 (Nash均衡的数学定义)局势是博弈的一个Nash
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45797-2025道路车辆低压电气系统性能要求及试验方法
- 工程征用土地合同
- 有限公司内部股权转让协议
- 2025-2026年北京市中考英语综合提高练习试卷3
- DB43-T 3160-2024 新能源汽车废旧动力蓄电池综合利用规范企业评价方法
- 2025企业租赁合同诉讼状范本
- 生长发育规律授课田甜工作单位山东医学高等专科学校84课件
- 机电设备安装冷却系统方案
- 水粉基础知识课件
- 建筑工程项目施工人员健康管理方案
- 软件对接方案
- 普通高中语文课程标准解读课件
- 有机化学第十版
- 肾功能不全患者合理用药课件
- 纤维支气管镜(可弯曲支气管镜)临床应用指南(草案)
- 2022年新高考II卷高考语文试卷试题深度解读及答案详解(精校版)
- 一次调频综合指标计算及考核度量方法
- 车辆段平面布置设计
- 数字媒体艺术概论-第一章-概述
- 四大会计师事务所面试题
- GB/T 4669-2008纺织品机织物单位长度质量和单位面积质量的测定
评论
0/150
提交评论