版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、PPT模板下载:/moban/ 博弈论基础吉林大学行政学院电子政务系第四讲 序贯决策博弈本讲主要概念序贯决策博弈、博弈树、倒推法、先动优势与后动优势4.1 序贯决策博弈与博弈树 在现实生活中,会碰到局中人的决策有先有后的情形,后决策的参与人知道先决策的参与人已经做出的决策。这种决策有先后的博弈,称为序贯决策博弈(sequential-move games) ,或者简单地称为序贯博弈4.1 序贯决策博弈与博弈树 某个垄断企业一年可以赚10亿元的利润,假定别的企业为了进入该行业需要投资4亿元。当新的企业准备进入时,原有垄断企业有两种决策:(1)“容忍”,即表现为他收缩产量以维持高价,但利润要变为5
2、亿元。这时新的企业利润也将是5亿,减去4亿投资,仍有1亿。(2)“抵抗”,即展开商战,例如加大产量,降低价格,力图把进入者挤出去,企业的利润将变为2亿。且新的企业也只得2亿,却不抵投资的4 亿元,亏损2亿。 可以自然地把潜在的进人者放在先行动的位置,原有的垄断企业随后行动。这样就形成了一个序贯博弈。将原有的垄断企业简短地称为垄断者,把潜在的进入者简短地称为进入者。进入不进垄断者容忍抵抗容忍抵抗(1,5)(-2,2)(0,10)(0,4)垄断者abc4.1 序贯决策博弈与博弈树 博弈树:它描述了博弈参与人的一个序贯决策过程,从博弈数的根开始,到末端点结束。 拥有初始决策节点的局中人先做出决策,他
3、的决策引出博弈树的棱,而棱的末端将是下一个局中人做出决策,依此类推。4.1 序贯决策博弈与博弈树 博弈树由节点( nodes)以及棱(edges) 组成,节点又分为决策节点(decision nodes) 和末端节点(terminal nodes) 。 仅仅出于画图习惯和方便,博弈树通常是从左往右延伸,或者从上往下延伸。 每棵博弈树都有一个初始决策节点(the initial decision node) ,初始决策节点也叫做博弈树的根(root) ,它是博弈开始的地方。末端节点是博弈结束的地方,一个未端节点就是博弈的一个可能的结果(outcome)。 圆点表示博弈树的决策节点,小方块或者小菱
4、形表示博弈树的末端节点即结果。有时候,我们还用比较大的圆点标记博弈树的根,即博弈的初始决策节点。4.2 策略与行动 当一个博弈按照局中人决策的先后次序进行时,后行动的局中人可以对其他局中人先前采取的行动以及他自己先前采取的行动作出回应。因此,我们可以设想每一个可能在别人行动后行动的局中人,应该盘算一个完整的行动计划。 例如,可以制定如下模式的行动计划:如果对手或者其他人采取行动A ,则我将采取行动X ,但如果对于或者其他人采取行动B ,则我将采取行动Y。 类似这样的多半更复杂的一个完整的行动计划,就构成局中人在博弈中的一个策略。4.2 策略与行动例如:对于垄断者来讲,他有四个可能的纯策略:一、
5、不管你怎样,我总容忍二、不管你怎样,我总对抗三、你进入我对抗,你不进入我容忍四、你进入我容忍,你不进入我对抗。 这样,垄断者的上述全部四个纯策略是: 容忍,容忍、对抗,对抗)、(对抗,容忍)、(容忍,对抗 ,其中每个花括号中的第一项表示垄断者在上面的决策节点b (即进入者选择进入时)他要选择的行动,第二项表示垄断者在下面的决策节点c (即进入者选择不进入时)他要选择的行动。4.2 策略与行动 一个策略必须是一个完整的行动计划,使得你可以把它交给另外一个人,让他知道如何代表你去执行这个策略。 (对抗,容忍)这么简单的行动集,作为垄断者的一个策略,已经足够完整,因为这是每个局中人只行动一次而且每次
6、行动只有两个选择的二人博弈。 一个策略就是一个完整的行动计划。4.3 序贯博弈的纳什均衡 纳什均衡概念的本身,在序贯决策博弈中实际上与在同时决策博弈中并无二致。一个策略组合之所以成为纳什均衡,最本质的要求,仍然是每个局中人的策略都是针对其他局中人的策略或策略组合的最佳策略选择,仍然是没有局中人愿意单独偏离这个策略组合,或者说单独改变自己在这个策略组合之下的策略选择。男足球芭蕾女(上)足球(上)芭蕾(下)足球(下)芭蕾(2,1)(0,0)(-1,-1)(1,2)情侣博弈4.3 序贯博弈的纳什均衡 该博弈有八种可能的策略组合:( 足球,(上)足球,(下)足球 )( 足球,(上)足球,(下)芭蕾 )
7、( 足球,(上)芭蕾,(下)足球 )( 足球,(上)芭蕾,(下)芭蕾 )( 芭蕾,(上)足球,(下)足球 )( 芭蕾,(上)足球,(下)芭蕾 )( 芭蕾,(上)芭蕾,(下)足球 )( 芭蕾,(上)芭蕾,(下)芭蕾 ) (足球, 足球,足球)对局,是纳什均衡,因为在这个对局形势之下,男方如果单独改变策略选择,他的所得将由2 降为一1,所以男方没有单独改变策略选择的激励,同样,女方也没有单独改变策略选择的激励。 (芭蕾, 芭蕾,芭营)对局,也是纳什均衡,因为男方单独改变所得将从1 降为0 ,女方单独改变的话,要么不影响所得,要么使所得从2 降为一1 。所以,处于这样的对局形势,双方都没有单独改变策
8、略选择的激励。女方的策略一共有四个:一、追随策略:他选择什么,我就选择什么;二、对抗策略:他选择什么,我就偏不选什么;三、芭蕾策略:无论他选什么,我都选我喜欢的芭蕾;四、足球策略:无论他选什么,我都选他喜欢的足球。4.4 倒推法 从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“倒推法” 或者“逆推归纳法”。 倒推法是动态博弈分析最重要、基本的方法。步骤: 从博弈的最后一个阶段开始分析,通过比较最后一个参与决策的局中人的支付,推断他或她的选择,从而将他不会选的策略“枝桠”砍掉,从而回到上一个阶段,比较该阶段参与决策的局中人
9、的支付,将他或她不会选的策略砍掉,依此类推。4.4 倒推法男足球芭蕾女足球芭蕾足球芭蕾(2,1)(0,0)(-1,-1)(1,2)女进入者进入不进(1,5)(0,10)例如:4.5 先动优势与后动优势 任何一方率先采取行动可能得到的支付,比他或者她后行动可能得到的支付大。这种局中人先行得益大于后行得益的情况,叫做先动优势(first-move advantage) 。男足球芭蕾女足球芭蕾足球(2,1)(0,0)(-1,-1)女序贯情侣博弈:(1,2)4.5 先动优势与后动优势女足球芭蕾男足球芭蕾足球(1,2)(-1,-1)(0,0)男女先动:(2,1) 当男方先动时,男方得2,女方得1,但当女
10、方先动时,男方得1,女方得2。 先行动的一方收益大。4.5 先动优势与后动优势后动优势:后行动的得益比先行动的得益大的情况。1.石头、剪刀、布的游戏。2.两家价格竞争的企业,在定价方面有后动优势 你跟你的一位朋友用一把小刀瓜分一块蛋糕,且你们都是想多吃一点的理性人。因此,决定让你们当中的一个人负责切蛋糕,另外一个人负责蛋糕的分配。在这个博弈中,切蛋糕的一方先行动,负责分配蛋糕的一方后行动。显然,负责蛋糕分配的一方在这个博弈中具有优势,他可以仔细地观察切蛋糕一方的行动后果,即切得怎么样,然后决定自己应当挑选哪块蛋糕。因为是理性人,他当然挑选比较大的一块。彻底理性未必符合现实旅行博弈: 两个旅行者
11、从出产花瓶的地方旅行回来,提取行李的时发现花瓶破损。他们向航空公司索赔。航空公司知道花瓶的价格总在八九十元的价位浮动,于是请两位旅客在一百元以内自己写下花瓶的价格。如果两人写的一样,认定他们讲真话,按照他们写的数额赔偿;如果两人写的不一样,论定写得低的旅客讲的是真话,并且照这个低的价格赔偿,但是对讲真话的旅客奖励2 元钱,对讲假话的旅客罚款2 元。 就为了获取最大赔偿而言,甲乙双方最好的策略,是都写100 元。但甲很聪明,他想:如果我少写1 元变成99 元,而乙会写100 元,这样我将得到101 元。可是乙更加聪明,他算计到甲要算计他写99 元,他准备写98 元。想不到甲还要更聪明一个层次,计算出乙要这样写98 元来坑他,他准备写97 元 彻底理性未必符合现实 在花瓶索赔的例子中,如果两个人都彻底理性,那么上面那样精明比赛的结果,最后落到每个人都只写0元的地步。事实上,在彻底理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国城市配送行业发展分析及投资风险预警与发展策略研究报告
- 导游实物团队协作技能
- 参考知识产权培训心得体会例文七篇
- 七年级数学备课组工作计划锦集(15篇)
- 电竞行业就业
- 2026年海南高考物理考试真题
- 2025年吉林省白城市初二学业水平地理生物会考题库及答案
- 2026年广西壮族自治区桂林市高职单招英语试题解析及答案
- 镇江职业规划难度解析
- 财政管理专业就业方向解析
- 2025中联重科校园招聘笔试历年参考题库附带答案详解
- (二模)2026年茂名市高三年级第二次综合测试英语试卷(含答案)
- 国家级临床重点专科建设评估标准
- 信息化系统项目实施方案
- 房屋渗水解决方案
- 《为未知而教 为未来而学》读书笔记思维导图
- 小升初六级下册英语阅读理解专项训练人教精通版
- 国家开放大学《高等数学基础》形考任务1-4参考答案
- 光伏组件安装技术交底
- 操作维护波尔滤油机
- 2023年《高等教育学》考点速记速练300题(详细解析)
评论
0/150
提交评论