




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,上一讲内容回顾,博弈论用处(解释、预测和提出建议) 猜数游戏-博弈关注的(interdependence) 博弈论发展简史 囚徒困境 智猪博弈 商业中心区(CBD)的形成 动态博弈与承诺行动 信息不对称(二手车市场) 混合策略 机制设计(定价策略、制度设计等),2,通俗理解博弈论,博弈论是有关取舍策略的科学,它的方程式告诉你在与人接触中怎样得到最大的好处。 博弈论刚开始运用到经济领域,现在几乎在哪个科学领域都能看到它的身影,尤其是那些涉及到人性与人的行为的科学。,3,4,上述问题都有如下共同点 都有若干决策者,我们称之为参与人(players) N-人博弈问题的决策者集合,习惯上也用N表示
2、 针对具体问题,参与人可以是 个人 一个政府 公司的整个董事会,博弈的基本要素,5,6,7,对参与人的理解,博弈中的决策者。每个参与人的目标是选择一个期望最大化的策略, 要求博弈的决策主体具有行为选择能力,并且对博弈结果负责的能力,否则不是参与人。众所周知的田忌赛马博弈,参与人是田忌和齐威王,孙膑仅仅是一个策略分析者。孙膑并不是决策者,因而不是参与人. 虚拟参与人,又称为自然(nature)。自然在博弈的一些特定点按照给定的概率随机选择行动。 虚拟参与人与正常的参与人之间在概念上的差异是:参与人有预先设定的效用函数,而虚拟的参与人对于给定的结局,不存在任何效用感受。,8,博弈论对参与人做两个基
3、本假设,1 理性的(rational)?,1如果一个决策者在追逐其目标时能前后一致地做决策,就称他为rational。Roger BMyerson (P2) 2广义而言指的是一种行为方式,他同在给定条件或约束下最有效地实现预期目标相关。具体地讲,理性含义如下:,9,(1)存在一组可供选择的备选或替代方案; (2)每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度; (3)人们总是选择那个能够带来最大预期净收益的方案。 (西蒙,1964),博弈论对参与人做两个基本假设,10,2 智能的(intelligent)?,当我们像博弈论专家那样分析一个博弈时,如果参与人知道我们对此博弈所知道
4、的一切,并能做出我们对此博弈所能做出的一切推断,我们就说此博弈的参与人是智能的。Roger BMyerson (P3),博弈论对参与人做两个基本假设,11,参与人都存在若干策略(strategies)或行动(actions) 参与人i的策略用si表示,参与人i的所有策略构成的集合称为策略集,记为Si , si Si 注意行动与策略的区别,博弈的基本要素,12,13,14,支付(收益、效用)(payoff) 各参与人对所有参与人不同策略组合(strategy profile),构成了博弈的一个局势。记为 s 参与人 i (iN)对局势s 有一个主观的偏好,可用一个函数表示这种偏好,这个偏好函数称
5、为参与人 i 的支付,博弈的基本要素,15,16,参与人、各参与人的策略集、各参与人的支付函数,是博弈最重要的基本要素。,博弈的基本要素,17,1:博弈的基本特征是一个参与人 的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选择;是策略组合的函数。 2:效用是参与人真正关心的东西,参与人在博弈中的目标就是选择自己的策略以最大化自己的效用函数。,18,19,20,21,22,An item of information in a game is common knowledge if all of the players know it and all of the players
6、 know that all other players know it and all other players know that all other players know that all other players know it, and so on. This is much more than simply saying that something is known by all, but also implies that the fact that it is known is also known by all, etc.,23,Consider a simple
7、example of two allied armies situated on opposite hilltops waiting to attack their foe. Neither commander will attack unless he is sure that the other will attack at exactly the same time. The first commander sends a messenger to the other hilltop with the message I plan to attack in the morning. Th
8、e messengers journey is perilous and he may die on the way to delivering the message.,24,If he gets to the other hilltop and informs the other commander - can we be certain that both will attack in the morning? Note that both commanders now know the message, but the first cannot be sure that the sec
9、ond got the message. Thus, common knowledge implies not only that both know some piece of information, but can also be absolutely confident that the rest know it, and that the rest know that we know it, and so on.,25,共同知识趣题,有一群人围坐在一起,假定只有4个人,每人头上带着戴着一顶帽子,颜色为黑色和白色,每个人看不到自己头上帽子的颜色,但能看到别人帽子的颜色. 为了分析的方便
10、,我们假定这四个人均戴的是黑色帽子。这时候,一个局外人来到他们集体当中,对他们说:“你们其中至少一个头戴的是黑色帽子。”当他说完这句话后,他问:“你们知道你们头上的帽子颜色吗?”4个人都说不知道。这个局外人第二次问道:“你们知道你们头上帽子的颜色吗?”4个人又都说不知道。局外人第三次问:“你们知道你们头上帽子的颜色吗?”4个人又说不知道。局外人第四次问道:“你们知道你们头上帽子的颜色吗?”这时4个人均说知道了。 你能知道这是为什么吗?,26,博弈概念的理解,OPEC成员国选择其年产量; 两家制造商,一家做螺钉,一一家做螺帽,决定是采用美制标准还是公制标准; 公司董事会为其总经理设立一项期股安排
11、; 一家电力公司在估计了未来10年对电力的需求后,决定是否购置一套新的发电机组; 明天出去玩,决定是否带伞; 诸葛亮和司马懿进行的空城计;,27,Definition of a Game,Must consider the strategic environment Who are the PLAYERS? (Decision makers) What STRATEGIES are available? (Feasible actions) What are the PAYOFFS? (Objectives) Rules of the game What is the time-frame f
12、or decisions? What is the nature of the conflict? What is the nature of interaction? What information is available?,28,29,30,31,32,课程主要内容,完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 机制设计 合作博弈,33,完全信息静态博弈概念,概念:各参与人对彼此的策略集、支付函数有准确了解 博弈行为同时进行 一些实例 石头、剪子、布游戏 彼此了解的两个厂商的价格战,34,完全信息静态博弈概念,有些实际博弈 虽然决策不是在绝对时间意义上的“同时”, 但决策的时
13、间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。 如不同竞标单位作出的工程投标决策,35,博弈的策略式表述,常用G表示一个博弈 博弈模型的两种表示形式 策略式表述 (Strategic form), 扩展式表述(Extensive form) 本章主要介绍博弈的策略式表述,36,博弈的策略式表述,参与人集合 N人博弈的参与人集合,往往也记为N。参与人则记为i, i N 参与人i的策略集,记为Si ,其中的一个特定策略,可记为si.有si Si.,37,对于给定的参与人i, i=1,2,N, 卡氏积 S1S2 Si-1 Si+1 Sn 表示除了参与人i外所有参与人所有策略的可能组合,
14、通 常记为S-i; 于是所有参与人不同策略组合构成的策略空间可表示为 S=(Si , S-i),博弈的策略式表述,38,Si中的元素 si 表示参与人i的一个具体策略 一旦确定了所有参与人的策略,便形成了一个博弈局势,表示为s=(s1, s2, sN),sS。,博弈的策略式表述,39,参与人i的效用函数 参与人 i的支付函数,是从博弈局势集 S=S1S2 SN 到实数集R的一个映射,记为 ui(s1, s2, s N),表示参与人i对局势s = (s1, s2, sn)的偏好。 一个博弈可以表示为 G = S1, ,SN; u1, ,uN, i N 这就是博弈的策略式表述,博弈的策略式表述,4
15、0,博弈的策略式表述,例 写出囚徒问题的策略式表述 参与人集合N=囚徒1,囚徒2 参与人的策略集S1=S2= 坦白,不坦白 各参与人的支付,可用图1-1表示。,图1-1 囚徒问题的支付矩阵,囚徒1,囚徒2,41,博弈的策略式表述,实质上,图1-1已经完全表述了囚徒困境的策略式表述信息 称图1-1为二人有限博弈的双矩阵 (bimatrix)表述,图1-1 囚徒问题的支付矩阵,囚徒1,囚徒2,42,占优均衡,英文术语:Dominant-strategy Equilibrium 定义:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,
16、则称该策略为该参与人的严格占优策略或占优策略。,43,占优策略,对于所有的s-i, si*称为参与人i的严格占优战略,如果满足: ui(si*,s-i)ui(si,s-i) s-i, si si*,44,占优均衡,占优均衡定义 一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。,45,占优均衡,占优战略均衡:每个参与人的占优战略组合(如果存在的话)被称为占优战略均衡。,图1-2 囚徒问题的支付矩阵,囚徒1,囚徒2,46,占优均衡,以囚徒1为例,无论囚徒2采取什么策略,图1-2 囚徒问题的支付矩阵,囚徒1,囚徒2,47,占优均衡,坦白总是占
17、优策略,图1-2 囚徒问题的支付矩阵,囚徒1,囚徒2,48,占优均衡,由于矩阵的对称性,对囚徒2来说亦可得出类似结论,图1-2 囚徒问题的支付矩阵,囚徒1,囚徒2,49,占优均衡,因此,该博弈的策略组合(坦白、坦白)是占优均衡。,图1-2 囚徒问题的支付矩阵,囚徒1,囚徒2,50,占优均衡,但该占优均衡的收益,却劣于另外一个策略组合(不坦白,不坦白)。,图1-2 囚徒问题的支付矩阵,囚徒1,囚徒2,51,成绩博弈,分析占优策略和占优均衡,52,重复剔除严劣策略均衡,前面介绍了第一均衡概念占优均衡 (显然)并非所有博弈都存在占优均衡,如石头、剪子、布游戏 对占优均衡概念稍加扩展,就得到重复剔除严
18、劣策略均衡概念,53,选举实例,中间选民定理,54,重复剔除严劣策略均衡,“严劣”和“弱劣”的含义: 设 si和si是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 ui(si, s-i) ui(si, s-i), 则说策略si严劣于策略si 。 上面式子中,若将“”改为“”,则说策略si弱劣于策略si 。,55,重复剔除严劣策略均衡,重复剔除严劣策略均衡的定义 重复剔除严格策略就是各参与人在其各自策略集中,不断剔除严劣策略 如果最终各参与人仅剩下一个策略,则该策略组合就被称为重复剔除严劣策略均衡。,56,重复剔除严劣策略均衡,实例 一个虚拟的博弈,见图1-4。 该博弈不存在占优均衡。,图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 63241-3-9:2025 EN Electric motor-operated tools - Dust measurement procedure - Part 3-9: Particular requirements for transportable mitre saws
- 华大联盟数学试卷
- 健康管理课件制作方法
- 中国女士呢行业市场发展前景及发展趋势与投资战略研究报告(2024-2030)
- 升压站施工场地防汛安全风险评估报告
- 油茶行业研究报告
- 安全风险评估报告52917
- 中国海豹鱼鳞块褥子项目投资可行性研究报告
- 健康男性课件视频
- 药品注册管理办法中国
- 2024初中数学竞赛七年级竞赛辅导讲义七年级专题01 质数那些事
- 德宏傣族景颇族自治州缅籍“三非”人员管理问题研究的开题报告
- 手绘pop海报制作
- 个性化儿童发展方案
- 干湿交替环境下混凝土受硫酸盐侵蚀劣化机理
- 安全风险分级管控清单(大全)
- 统计职业道德规范内容和要求
- 建筑声学-11室内声学与厅堂音质设计
- GB/T 16886.12-2023医疗器械生物学评价第12部分:样品制备与参照材料
- 四川省乐山市马边彝族自治县2022-2023学年五年下学期期末学情跟踪监测数学试卷
- 石油工程概论
评论
0/150
提交评论