




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博弈与决策gametheory,河北经贸大学商学院,GameTheory-Lecture2,2,课程安排,第一章导论第二章完全信息静态博弈第三章完全且完美信息动态博弈第四章重复博弈第五章完全但不完美信息动态博弈第六章不完全信息静态博弈第七章不完全信息动态博弈第八章有限理性和进化博弈,河北经贸大学商学院,GameTheory-Lecture2,3,第二章完全信息静态博弈,本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等,河北经贸大学商学院,GameTheory-Lecture2,4,2.1基本分析思路和方法,一、上策均衡上策(dominantstrategy):不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略例如:囚徒困境中“坦白”给博弈方带来的收益总是大于“抵赖”给博弈方带来的收益,“坦白”策略就是博弈方的上策(0-1-5-8),河北经贸大学商学院,GameTheory-Lecture2,5,2.1基本分析思路和方法,一、上策均衡上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果上策均衡不是普遍存在的例如:博弈方2有上策“R”;而博弈方1不存在上策。,河北经贸大学商学院,GameTheory-Lecture2,6,2.1基本分析思路和方法,二、严格下策反复消去法(一)思路与原理排除法:两两对比排除较差的剩下的较好严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略理性博弈方不可能采用严格下策,消去!严格下策反复消去法:反复寻找各博弈方在策略之间两两比较意义上的“严格下策”并将它们消去,河北经贸大学商学院,GameTheory-Lecture2,7,(二)举例应用,剩下唯一策略组合(上,中),河北经贸大学商学院,GameTheory-Lecture2,8,2.1基本分析思路和方法,三、划线法(一)思路找出自己针对其他博弈方的每种策略(或策略组合)的最佳策略通过对其他博弈方策略选择的判断,以及对其他博弈方对己方策略选择的判断推定出博弈可能结果和己方最优策略,河北经贸大学商学院,GameTheory-Lecture2,9,(二)举例应用1,博弈方1,博弈方2,中,上,下,左,右,河北经贸大学商学院,GameTheory-Lecture2,10,(二)举例应用2,课堂练习(斗鸡博弈):两男孩在以独木桥两头,各自决策是否冲上独木桥,退却方很没面子,获得-1个单位的得益;向前冲者很风光,获得1个单位的得益,两人都冲上桥必然是两人相撞落水,成为落汤鸡后就很不风光了,此时得益为-2个单位。,河北经贸大学商学院,GameTheory-Lecture2,11,2.1基本分析思路和方法,三、箭头法(一)思路分析博弈的每个策略组合,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益,若能,则从该策略组合对应的得益数组引一箭头到改变策略组合对应的得益数组,最后综合形成判断:只有箭头指向没有任何箭头指离的策略组合具有稳定性,河北经贸大学商学院,GameTheory-Lecture2,12,(二)举例应用1,博弈方1,博弈方2,中,上,下,左,右,河北经贸大学商学院,GameTheory-Lecture2,13,(二)举例应用2,课堂练习:智猪博弈:按一下,有10份猪食进槽,跑过去耗食2份,大猪先到吃9份余1份;小猪先到,吃4份余6份;同时到,大猪吃7份,小猪吃3份。,河北经贸大学商学院,GameTheory-Lecture2,14,2.2纳什均衡(NashEquilibrium),一、定义策略空间:博弈方的第个策略:博弈方的得益:博弈:纳什均衡:在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,也即对任意都成立,则称为的一个纳什均衡使得各博弈方都不愿单独改变策略时的那组策略组合,河北经贸大学商学院,GameTheory-Lecture2,15,2.2纳什均衡(NE),二、纳什均衡的一致预测性质一致预测:如果所有博弈方都预测一个特定博弈结果会出现,且所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能,河北经贸大学商学院,GameTheory-Lecture2,16,2.2纳什均衡,例如:约会博弈:热恋中的男孩和女孩,为周末如何度过进行决策。假如学校正进行足球年度冠军赛,本周末将有一场势均力敌的比赛,男孩虽非球员,但却是足球爱好者;女孩则通过手机短信获知这周末商场将举行大型的促销活动,很多时尚、漂亮的服装将低于5折出售。,河北经贸大学商学院,GameTheory-Lecture2,17,2.2纳什均衡(NE),三、纳什均衡与严格下策反复消去法1、上策均衡与纳什均衡上策均衡一定是纳什均衡,但纳什均衡不一定是上策均衡2、纳什均衡与严格下策反复消去法之间具有相容性严格下策:在各种情况下,某策略给博弈方带来的得益总是小于另一策略给博弈方带来的得益,该策略为严格下策下策:在各种情况下,某策略给博弈方带来的得益总是不大于(小于或等于)另一策略给博弈方带来的得益,纳什均衡,上策均衡,河北经贸大学商学院,GameTheory-Lecture2,18,2.2纳什均衡,如果消去的不是严格下策,而仅仅是下策,则会造成一些均衡解被消除的问题路径依赖,河北经贸大学商学院,GameTheory-Lecture2,19,2.3无限策略博弈分析和反应函数,完全信息静态博弈分析的核心:找出纳什均衡一、古诺模型1,2两个厂商,生产同样产品,产量为q1和q2,市场总产量Q=q1+q2,市场出清价格P=P(Q)=8-Q,两厂商生产无固定成本,边际成本为:c1=c2=2,两厂商同时决策各自产量(即决策前不知另一方产量)博弈方:厂商1,厂商2策略:产量q1;q2次序:同时决策收益:利润,河北经贸大学商学院,GameTheory-Lecture2,20,2.3无限策略博弈分析和反应函数,纳什均衡:相互是最与策略性质的各博弈方组成的策略组合,河北经贸大学商学院,GameTheory-Lecture2,21,2.3无限策略博弈分析和反应函数,二、反应函数,(2,2)理性局限古诺调整,q1=2q2=2,河北经贸大学商学院,GameTheory-Lecture2,22,三、伯特兰德寡头模型区别:古诺模型中厂商先决定产量,然后是市场价格,伯特兰德模型中厂商先决定价格,然后是产量(销量)1,2两个厂商,生产同类产品,两厂商的产品在品牌、质量、包装方面存在一定差异,因而产品之间存在一定的可替代性,两厂商决策的产品价格分别为p1和p2,相应的市场需求函数分别为:两厂商生产无固定成本,边际成本为:c1=c2=2,两厂商同时决策各自价格(即决策前不知另一方价格)博弈方:厂商1,厂商2策略:产品价格p1、p2次序:同时决策收益:利润,2.3无限策略博弈分析和反应函数,河北经贸大学商学院,GameTheory-Lecture2,23,2.3无限策略博弈分析和反应函数,利用导数求利润最大化:,河北经贸大学商学院,GameTheory-Lecture2,24,2.3无限策略博弈分析和反应函数,该博弈的纳什均衡解为:厂商1确定自己产品价格为20,厂商2确定自己产品价格为20,厂商1的均衡利润为324,厂商2的均衡利润也为324。,河北经贸大学商学院,GameTheory-Lecture2,25,2.3无限策略博弈分析和反应函数,四、公共资源问题(课堂练习)某村庄有3个养羊户,村里有一片可自由放牧的公共草地,草地面积有限。3养羊户在春天决定自己养羊的数量qi(i=1,2,3且决策时并不知道其他养羊户的羊羔数量),到夏天将羊赶到公共草地吃草,秋天将羊拿到市场出售获得利润:其中利用反应函数求出3养羊户将决定养多少只羊?,河北经贸大学商学院,GameTheory-Lecture2,26,2.3无限策略博弈分析和反应函数,五、反应函数的问题和局限性在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。,河北经贸大学商学院,GameTheory-Lecture2,27,2.4混合策略和混合策略纳什均衡,一、严格竞争博弈和混合策略的引进严格竞争博弈:各博弈方的利益和偏好始终不一致的博弈(一)猜硬币博弈不存在前面定义的纳什均衡策略组合关键是不能让对方猜到自己策略,避免有规律地选择策略正面的概率和反面的概率相等,河北经贸大学商学院,GameTheory-Lecture2,28,2.4混合策略和混合策略纳什均衡,(二)混合策略(mixedstrategies)混合策略:在博弈中,博弈方的策略空间为,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。纯策略纳什均衡;所选策略概率为1,其余策略概率为0,河北经贸大学商学院,GameTheory-Lecture2,29,2.4混合策略和混合策略纳什均衡(三)、姐弟博弈,无纯策略纳什均衡但有混合策略纳什均衡原则:1、不让对方猜到自己的选择-选择要随机2、选择每种策略的概率让对方无机可乘-在这样的概率分布下,对方选择任一策略的期望得益相等,河北经贸大学商学院,GameTheory-Lecture2,30,2.4混合策略和混合策略纳什均衡(三)、姐弟博弈,假设姐姐以(PA,PB)的概率随机地选择(房间,院子)两策略,则使得弟弟无机可乘应满足弟弟以(PC,PD)的概率随机地选择(房间,院子)两策略,则使得姐姐无机可乘应满足;,河北经贸大学商学院,GameTheory-Lecture2,31,2.4混合策略和混合策略纳什均衡(三)、姐弟博弈,解得:姐弟俩的期望得益:,该博弈的纳什均衡解为:姐姐以(0.8,0.2)的概率随机选择(房间,院子)两策略;弟弟以(0.8,0.2)概率随机选择(房间,院子)两策略,姐姐和弟弟的期望得益各为(2.6,2.6),河北经贸大学商学院,GameTheory-Lecture2,32,2.4混合策略和混合策略纳什均衡(四)、小偷和守卫的博弈(塞尔顿),该博弈不存在纯策略的纳什均衡解,但有混合策略的纳什均衡解假设小偷以Pt的概率选择“偷”策略,则“不偷”的概率为:1-Pt;守卫以Pg的概率选择“睡”策略,则“不睡”的概率为:1-Pg,河北经贸大学商学院,GameTheory-Lecture2,33,2.4混合策略和混合策略纳什均衡(四)、小偷和守卫的博弈(塞尔顿),守卫睡的期望得益:守卫不睡的期望得益:,加重对守卫的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概略,河北经贸大学商学院,GameTheory-Lecture2,34,2.4混合策略和混合策略纳什均衡(四)、小偷和守卫的博弈(塞尔顿),小偷偷的期望得益:小偷不偷的期望得益,加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,河北经贸大学商学院,GameTheory-Lecture2,35,2.4混合策略和混合策略纳什均衡,二、多重均衡博弈和混合策略(一)约会博弈有两个纯策略纳什均衡解(NE)(逛商场,逛商场)得益(2,1)(看足球,看足球)得益(1,3)明智选择:在指导一方选择了某种策略时,己方选择与对方保持一致。但男孩与女孩对两个均衡的偏好存在矛盾。若都从自身利益最大独立决策-无法知道博弈结果的最终策略组合考虑采用混合策略,河北经贸大学商学院,GameTheory-Lecture2,36,2.4混合策略和混合策略纳什均衡,(一)约会博弈假设女孩以Pgs和Pgf的概率随机选择“逛商场”和“看足球”,则为了让男孩左右为难,应满足:男孩以Pbs和Pbf的概率随机选择“逛商场”和“看足球”,则为了让女孩左右为难,应满足,河北经贸大学商学院,GameTheory-Lecture2,37,可以求出女孩和男孩的期望得益:,其实,不如双方协商,一方迁就另一方,至少得益能为1,该博弈的混合策略纳什均衡为:女孩以(3/4,1/4)的概率随机地选择(逛商场,看足球)策略;男孩以(1/3,2/3)的概率随机选择(逛商场,看足球)策略,女孩与男孩的期望得益各为(2/3,3/4),河北经贸大学商学院,GameTheory-Lecture2,38,2.4混合策略和混合策略纳什均衡,(二)麦琪的礼物(欧亨利小说)(课堂练习)一对深爱对方的贫穷夫妻:约翰和德拉。约翰有一宝:祖传金怀表;德拉有一宝:金色的长发。圣诞节到了,都想给对方送礼物。找出该博弈的所有的纳什均衡解(纯策略、混合策略)以及均衡时给博弈方的(期望)得益,河北经贸大学商学院,GameTheory-Lecture2,39,2.5纳什均衡的存在性,纳什定理:在一个由n个博弈方的博弈中,如果n是有限的,且都是有限集(对),则该博弈至少存在一个纳什均衡,但可能包含混合策略。(证明略)纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。,河北经贸大学商学院,GameTheory-Lecture2,40,2.6纳什均衡的选择和分析方法扩展,纳什均衡存在性=唯一性一、多重纳什均衡博弈的分析(一)帕累托上策均衡多个纳什均衡有明显的优劣差异,且所有的博弈方都偏好其中某一个纳什均衡(这一纳什均衡给所有博弈方带来的利益大于其他纳什均衡给所有博弈方带来的利益)由于选择依据帕累托效率意义上的优劣关系,此时所选出的纳什均衡,称为“帕累托上策均衡”,河北经贸大学商学院,GameTheory-Lecture2,41,2.6纳什均衡的选择和分析方法扩展-帕累托上策均衡,“战争与和平”博弈有两个纯策略纳什均衡(战争,战争)均衡得益(-5,-5)(和平,和平)均衡得益(10,10)显然(和平,和平)在帕累托效率意义上明显好,河北经贸大学商学院,GameTheory-Lecture2,42,2.6纳什均衡的选择和分析方法扩展-风险上策均衡,课堂实验:分两组,一组为博弈方1,另一组为博弈方2每一组内每一同学分别,独自进行选择,不许商议组1:A人;B人组2:A人;B人,河北经贸大学商学院,GameTheory-Lecture2,43,2.6纳什均衡的选择和分析方法扩展-风险上策均衡,两个纯策略纳什均衡:(A,A)均衡得益(9,9)(B,B)均衡得益(7,7),帕累托上策均衡,但是(A,A)风险极大,只要对方偏离A的可能性大于1/23,则(B,B)比(A,A)是更明智的选择,(B,B):风险上策均衡,河北经贸大学商学院,GameTheory-Lecture2,44,2.6纳什均衡的选择和分析方法扩展-风险上策均衡,上例中;博弈方1的纳什均衡策略为A,B,假设被采用的概率相同(各为0.5)则博弈方2采用A策略的期望得益=0.5X9+0.5X(-15)=-3采用B策略的期望得益=0.5X8+0.5X7=7.5显然,博弈方2偏好B策略,同样地,博弈方2的纳什均衡策略为A,B,假设被采用的概率相同(各为0.5)则博弈方1采用A策略的期望得益=0.5X9+0.5X(-15)=-3采用B策略的期望得益=0.5X8+0.5X7=7.5显然,博弈方1偏好B策略,若所有博弈方在预期其他博弈方采用所有纳什均衡的策略的概率相同时,都偏爱其中某一纳什均衡,则该纳什均衡就是一个风险上策均衡,(B,B)是风险上策均衡,河北经贸大学商学院,GameTheory-Lecture2,45,2.6纳什均衡的选择和分析方法扩展-风险上策均衡,猎鹿博弈:两人同时发现1头鹿和2只兔,若两人合力抓鹿,可将价值10的鹿抓住,兔子当然跑了,如两人都去抓兔,各获价值3的兔,一人抓兔一人抓鹿,则鹿会跑掉,抓兔子的人能抓住1只兔,抓鹿的人一无所获。该博弈的纯策略纳什均衡?并分析这些纳什均衡的性质。,河北经贸大学商学院,GameTheory-Lecture2,46,2.6纳什均衡的选择和分析方法扩展-聚点(焦点)均衡,利用博弈设定以外的信息和依据选择的均衡文化、习惯或者其他各种特征都可能是聚点均衡的依据城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子,河北经贸大学商学院,GameTheory-Lecture2,47,2.6纳什均衡的选择和分析方法扩展,二、共谋和防共谋均衡(一)多人博弈中的共谋问题多人博弈中,若部分博弈方通过某种形式的默契或串通形成小团体,可能比不串通时得到更大的利益,则这些博弈方就与很强的相互串通动力联合行动-影响纳什均衡的稳定性,河北经贸大学商学院,GameTheory-Lecture2,48,2.6纳什均衡的选择和分析方法扩展,本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B)前者帕累托优于后者。博弈的结果会是什么呢?(U,L,A)有共谋(Coalition)问题:博弈方1和2同时偏离。,河北经贸大学商学院,GameTheory-Lecture2,49,2.6纳什均衡的选择和分析方法扩展,(二)防共谋均衡如果一个博弈的某个策略组合满足下列要求:(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【教案版】小学五班级上册 小足球2
- 2025年物联网技术中级工程师岗位知识模拟题集萃
- 电力器具基础知识培训总结
- 2025年建筑设计师招聘考试试题及标准答案指南
- 2025年初级软件架构师认证模拟试题及答案解析
- 2025年山东省威海市荣成市中考化学模拟试卷(二)
- 2025年特岗教师招聘考试初中数学知识点回顾与面试预测题
- 2025年中级火电运行值班员考试复习策略与技巧
- 电信基础业务知识培训课件
- 2025年互联网产品经理面试题详解与解析思路
- GB/T 13762-2009土工合成材料土工布及土工布有关产品单位面积质量的测定方法
- 药品出、入库验收制度
- 个人房地产抵押合同书
- 车间员工技能管理办法
- 医院零星维修管理制度及零星维修审批单
- DB11T 1581-2018 生产经营单位应急能力评估规范
- 青年教师成长之路
- 汶川地震波时程记录(卧龙3向)
- 吴迪完胜股市学习笔记
- HB 4-1-2020 扩口管路连接件通用规范
- 霸王集团盘中盘路演模式课件
评论
0/150
提交评论