版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章扩展型博弈授课人:吴有k>=1堆硬币,各堆分别含有N1,N2,……NK枚。游戏法则如下:1.两个游戏人交替进行游戏;2.当轮到每个游戏人取子时,选择这些堆中的一堆,并从所选的堆中取走至少一枚硬币(可以取走所选堆中的全部硬币);3.如果轮到某个游戏人时所有的硬币堆都已经被拿空了,则判负。第一节扩展型博弈的含义及其表示在完全信息博弈中,局中人的行动有先有后,后行动者可以观察到先行动者的行动,又可称为完全信息动态博弈,或者序贯博弈。只剩一张门票免费发送,先到先得,若得到效用都为100。甲、乙二人可以选择两种交通工具,B或T,B需要花5个单位,T需要花50个单位。假设甲先下班先行动,乙可以观察到甲的行动选择后行动。
博弈树(1)同一个局中人的一些结点构成的集合;(2)表示博弈到了这个集合,但不知到了这个集合的哪一个结点上。决策结:局中人采取行动的时点
初始结(根)终点结:博弈行动路径的终点枝:局中人采取的行动甲BTBTBT乙乙(95,-5)(-5,50)(50,-5)(50,-50)信息集:决策结的子集,用来描述局
中人所知道的信息结点完美信息博弈:博弈树中的所有信息集都只有一个决策结——博弈中没有任何两个局中人同时行动,并且所有后行动者能够确切地知道先行动者的行动选择
构成要素:局中人
策略支付函数
行动顺序
行动信息集策略:
博弈局中人在给定信息集的情况下的行动规则或者行动指南,规定局中人在什么时候选择什么行动。
甲的策略:B或者T
乙的策略:(B,B)(B,T)(T,B)(T,T)相机性——策略是有条件的,只有博弈达到某一决策结,局中人才会采取某一行动。完备性——策略是关于行动的一个完整的计划,它明确了在局中人可能会遇到的各种情况下对可行行动的选择。第二节扩展型博弈的纳什均衡
乙甲(B,B)(B,T)(T,B)(T,T)B95,-595,-5-5,50-5,50T50,-550,-5050,-550,-50两个连锁店A与B销售几乎同样的产品,他们在考虑是否进入同一个区域市场的决策问题,A先决策,B后决策。ENB(0,1)(0,0)EAENNB(-3,-3)(1,0)BA(E,E)(E,N)(N,E)(N,N)E-3,-3-3,-31,01,0N0,10,00,10,0练习:
利用扩展型描述囚徒困境
乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2甲BTBTBT乙乙(95,-5)(-5,50)(50,-5)(50,-50)信息集:
决策结的子集,用来描述局中人所知道的信息(1)同一个局中人的一些决策结构成的集合;(2)如果决策结属于同一个信息集,用折弯的虚线将这些决策结相连;(3)表示博弈到了这个集合,但不知到了这个集合的哪一个结点上。策略:
博弈局中人在给定信息集的情况下的行动规则或者行动指南,规定局中人在什么时候选择什么行动。
甲的策略:B或者T
乙的策略:(B,B)(B,T)(T,B)(T,T)甲BTBTBT乙乙(95,-5)(-5,50)(50,-5)(50,-50)
乙甲
(B,B)(B,T)(T,B)(T,T)B95,-595,-5-5,50-5,50T50,-550,-5050,-550,-50甲在开采一价值4万元的金矿时缺1万元资金,而乙正好有1万元资金可以投资,设甲试图说服乙将1万元资金借给自己,并许诺采到金子后与乙对半分成,乙是否该借钱给甲?分乙借不借不分甲(2,2)(0,4)(1,0)是否有办法使甲的许诺变成可信?乙在甲违约时,可以采用“打官司”的方式来保护自己的利益。但打官司要消耗人力物力,假设打官司的结果是乙能收回本钱1万元,甲失去全部采金收入。打不打(1,0)(0,4)乙如果法律不能充分保障胜诉当事人的全部收益(保护力度不够大)或对侵害他人利益者没有足够的震慑作用?(-1,0)开金矿博弈练习:“仿冒和反仿冒博弈”请给出扩展型设有一家企业的产品被另一家企业仿冒,如果被仿冒企业采取措施制止,仿冒企业就会停止仿冒;如果被仿冒企业不采取措施制止,那么仿冒企业就会继续仿冒。假设仿冒最多进行两次,第一次不仿冒、仿冒被制止、及仿冒没被制止情况下,第二次不仿冒、仿冒被制止、仿冒没被制止的情况下,仿冒和被仿冒企业的得益分别为0和10,-2和5,5和5,2和2,10和4。第三节子博弈完美纳什均衡从单一决策结出发包含了这个决策结的每一个后续结如果它包含了一个信息集的若干部分,那么它一定包含该信息集的所有节点子博弈1abcd2(2,4)(4,3)(8,5)(5,3)1efgh2(3,6)1223333问题:
完全信息博弈与完美信息博弈的区别?
完全信息博弈强调局中人互相清楚得益情况;完美信息博弈强调后选择行为者清楚先选择行为者的策略选择。是原博弈上的纳什均衡子博弈内的策略组合是每个子博弈的纳什均衡
“策略组合是任何子博弈的纳什均衡”子博弈完美纳什均衡任何有限的完美信息动态博弈都至少存在一个子博弈完美纳什均衡存在定理从位置在最后决策结的子博弈开始,求出对应的局中人的最佳选择,然后在这种选择给定的情况下,倒推至该节点的前一个节点,求出相应局中人的最佳选择,然后再向前倒推,直至初始结,这样得到的策略组合就是子博弈完美纳什均衡。子博弈完美纳什均衡的求法——倒推法ENB(0,1)(0,0)EAENNB(-3,-3)(1,0)(N,E)斯塔克尔伯格模型两个寡头地位不对等进行产量竞争,企业1是领头者,先选择产量q1,企业2是跟随者,观察到q1后再选择自己的产量q2,其他条件不变。古诺模型两家处于同等地位的寡头同时做出产量决策,企业1产量为q1,企业2产量为q2,假定逆需求函数为P(q1,q2)=a-(q1+q2),两个企业有相同的不变单位成本c,固定成本为0。给定q1的情况下,企业2的最优选择:例子:春节前夕,某小镇上两个商铺主甲和乙同时看到一个赚钱机会:去城里批发一批鞭炮回来零售,购货款加上运输费用共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元,请求出纳什均衡?假设甲先行动,商铺乙看到对方的选择后再决定是否进货,请求出子博弈完美纳什均衡?如果甲先行动,但在博弈开始前商铺主乙有一次行动A的机会,请利用子博弈完美纳什均衡概念分析下述两种情况下的博弈结果(1)A:商铺主乙逢人便说自己一定要进货,无论对方如何行动他都不会改变这个决定;(2)A:商铺主乙与某个嘲笑他说大话的第三者丙打赌:如果自己到时不进货,向丙支付1500元;如果自己到时候进货,丙向他支付100元。并且,乙将这个赌局通知甲。甲进不进进不进进不进乙乙(-1000,-1000)(1000,0)(0,1000)(0,0)甲进不进进不进进不进乙乙(-1000,-900)(1000,-1500)(0,1100)(0,-1500)作业:
阅读“蜈蚣博弈”拍卖人拿出一张10元钞票,请大家给这张钞票开价,无底价,竞拍者可无限制的轮流叫价,每次叫价的增幅以5毛为单位,出价最高者可以得到这张10元钞票,但出价最高和次高者都要向拍卖人支付出价数目的费用。——苏比克拍卖模型第四节重复博弈
单次博弈重复进行构成的博弈过程,但博弈方的行为和博弈结果不一定是单次博弈的简单重复,其中,单次博弈可称为阶段博弈重复博弈重复博弈的基本特征:单次博弈之间没有实质联系,即前一阶段的博弈不改变其它阶段的博弈结构;所有局中人能够观测并记忆以往的博弈历史;局中人的总支付为各阶段支付的贴现值之和或者加权平均值。重复博弈的分类:有限次博弈由单次博弈的有限次重复构成的重复博弈,有明确的重复次数或结束时间无限次博弈由单次博弈一直重复进行下去的重复博弈,没有可以预见的结束时间,各博弈方主观上认为博弈会不断进行下去
企业甲(在位者)在20个相同的市场各开了一家连锁店,每个市场有一个潜在进入者,每个进入者序贯决定是否进入相应市场,企业甲对各个市场的进入者选择默认或者打压策略,忽略进入者之间的微小差异,这个问题可以看成是一个20次(阶段)重复博弈。有限次重复博弈-连锁店悖论(0,300)默认进入者EN打压甲(40,50)(-10,0)思考:在位者是否应对开头几个市场的进入者采取打击策略,使打击的示范效应吓退其他市场的潜在进入者,从而能够独享其余市场的利益?子博弈完美纳什均衡为:在位者在每一个市场选择默许,进入者在每一个市场选择进入。以阶段博弈G构成的重复T次(T<∞)的重复博弈中,如果G中仅存在唯一的纳什均衡,那么重复博弈G(T)的唯一子博弈完美均衡是阶段博弈的唯一纳什均衡重复T次,即每次博弈结局都是该纳什均衡。无限次重复博弈
乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2支付函数的表达——贴现因子贴现因子在数值上可以理解为贴现率,就是1个份额经过一段时间后所等同的现在份额。设局中人的支付函数为,并且在第t(t=1,2,…)次阶段博弈中获得的阶段博弈支付是,则冷酷策略
也称作触发策略,以囚徒困境为例:开始选择“不坦白”,一旦对手“坦白”,那么以后永远选择“坦白”。思考:局中人都选择冷酷策略时是否会构成一个子博弈完美纳什均衡?
乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2(1)若之前没有人选“坦白”,A若选“坦白”,该阶段得益为-1,但此举将触发B之后永远的报复,即B在之后永远选“坦白”,A在之后也只能永远选“坦白”,其总得益贴现最多为
A若选“不坦白”,并且之后每阶段都选“不坦白”时,B之后也会配合,即每阶段都选“不坦白”,A总得益贴现为当时,A选“不坦白”是最优的,即给定囚徒B选择冷酷策略,证明囚徒A选择冷酷策略是最优的。当时,A在没有人先选“坦白”时选“不坦白”是最优的,并且A在之后每阶段都选“不坦白”是最优的选择。
乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2(2)若之前有人选“坦白”,B若在之前选了“坦白”,则B之后
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某铝业厂环保生产操作细则
- 美丽乡村环境整治提升项目施工总结
- 专题07 摩擦力(解析版)
- 黑龙江省鹤岗市2026届高三第7次月考化学试题含解析
- 2026年山西省太原市六十六中高三下学期第一次诊断测试化学试题试卷含解析
- DB23∕Z 0001-2026 广电运维数字孪生平台微波业务建设要求
- 专题十五:热学和光学实验(解析版)
- 2026年福建省罗源一中高考复习全程精练模拟卷(全国卷)化学试题含解析
- 2026届天津市十二区县重点高中高三下学期冲刺(三)化学试题含解析
- 广东省广州越秀区培正中学2026届高三下学期4月教学质量测评化学试题试卷含解析
- 2025年全国设备监理师设备工程质量管理与检验真题及答案
- 活动板房回收合同范本
- GB/T 46075.3-2025电子束焊机验收检验第3部分:电子束电流特性的测量
- 【小升初真题】2025年河北省廊坊市三河市小升初数学试卷(含答案)
- 网络数据通信课件
- 青田县小溪流域仁宫至巨浦段综合治理工程项目环评报告
- 电力行业智能巡检体系建设实施方案
- 仪表联锁培训课件
- 职工退休及养老待遇证明书(6篇)
- 可再生能源法解读
- 殡仪服务员职业技能竞赛考试题(附答案)
评论
0/150
提交评论