序贯决策博弈ppt课件

上传人：腾*** IP属地：广东上传时间：2022-07-16 格式：PPT 页数：85 大小：1.18MB 积分：25 举报 版权申诉

已阅读5页，还剩80页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、序贯决策博弈第一部分同时博弈与序贯博弈主要内容本章主要引见：1、如何用正规型表示和展开型表示来表述同一个博弈。2、博弈论中的两个重要概念：信息集和不完美信息。3、调查包含同时决策行动和序贯决策行动的复合型博弈混合博弈的纳什平衡。第一节博弈的正规型表示与展开型表示第二节同时决策与序贯决策的混合博弈第三节树形博弈的子博弈第四节子博弈精炼纳什平衡第五节完美博弈的库恩定理第六节动态博弈的运用第一节博弈的正规型表示与展开型表示一、如何将博弈的展开型方式转化为正规型表示案例：“进入妨碍博弈进入者进入不进垄断者容忍抵抗容忍抵抗1，5-2，20，100，4垄断者abc“进入妨碍的矩

2、阵表达1，5-2，2-2，21，50，100，40，100，4进入者垄断者进入不进入容忍，容忍抵抗，抵抗抵抗，容忍容忍，抵抗小结1、普通我们将先行动者放在行局中人的位置，把后行动者放在列局中人的位置。2、每个局中人的战略必需是一个完好的方案，必需思索本人在对方每一个行动下的行动。例如：容忍，容忍。在本例中，进入者有两个纯战略，而垄断者有四个纯战略。3、每个局中人的决策轮数越多，那么他的纯战略选择的数目越多。思索：假设有三轮博弈，如何写矩阵方式。4、矩阵方式表示的能够的博弈结果比树形表示的结果要多，这是由于有不止一个纯战略可以导致一样的博弈结果。二、如何将正规型的博弈转化为展开型比前面简单，

3、尤其是序贯博弈，但假设是同时博弈，如何表示？信息集案例：情侣博弈2， 10， 00， 01， 2足球芭蕾足球芭蕾丈夫妻子夫妻之争信息集根据同时博弈的定义，每个局中人决策时不知道他人的战略，即每个局中人在做本人的行动选择时，并不知道本人处在哪个决策节点上。例如妻子在选芭蕾时，并不知道丈夫选的是芭蕾还是足球。局中人不能是他人对方“曾经做出的行动或决策，就等于同时行动或决策。此时，我们用一个扁椭圆形的虚线的圈，把所论局中人的假设干决策节点罩起来，成为他的一个信息集。即局中人知道博弈曾经进展到他的这个信息集，但不知道博弈终究进展到这个信息集中的哪个决策节点。信息集妻子虽然知道博弈曾经进展到她的信息集

4、，但不知道进展到信息集中的那个决策点，即她不知道丈夫会选什么，因此是同时博弈。丈夫足球芭蕾妻子足球芭蕾足球芭蕾2，10，0-1，-11，2妻子注意一个信息集罩住的必需是同一个局中人的决策点。必需是同一个局中人在同一个时点的决策节点。ABBA不制止制止-2，52，210，45，5不仿冒0，10仿冒不制止制止仿冒不仿冒这两个虚线罩住的都不是信息集。注意同时，即使是同一个人在同一时点进展决策，也不一定构成一个信息集，他还必需满足：在每一个决策点他的行动选择集合必需是一样的。由于局中人在做行动选择时并不知道本人位于哪个决策点，因此，他不能够做出不同的行动选择。ABB该虚线罩住的不是信息集。其必需满

5、足：同集同注，即从各个决策点出发的战略选择数目一样，称号也一样。单点集和非单点集我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的位置，称为单点集。因此，每一个决策位置都是一个信息集，只需单点集和非单点集之分。ABB非单点集单点集完美信息博弈和不完美信息博弈当博弈走到一个单点集的信息集时，面临决策的局中人对于博弈迄今的历史清清楚楚，他清楚了博弈详细走到了他的这个决策节点而不是别的决策点。我们把这种历史清楚的博弈称为完美信息博弈。但是当博弈走到一个非单点集的信息集时，面临决策的局中人对于博弈迄今的历史是不清楚的，他不清楚博弈详细走到了他的这个信息集里面的那个决策点。我们把这种历史不清楚的博弈称

6、为不完美信息博弈。假设一个序贯博弈的每个信息集都是一个单点集，那么该序贯博弈就是完美信息博弈，否那么他就是不完美信息博弈。信息集举例情爱博弈的扩展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)0，0)(2,1)xx女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1，-1)0，0)(2,1)xxA开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8

7、,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的选择;但不知道A的选择(或A、B同时决策) 房地产开发博弈第二节同时决策与序贯决策的混合博弈完全不完美信息的两阶段博弈我们把包含同时决策行动和序贯决策行动的博弈称为混合博弈。假设有两家计算机公司：方正和联想。彼此对新产品的研发和定价进展博弈竞争。该博弈分为两个阶段：第一阶段，两个公司进展研发投入竞争，每个公司都可以选择“大投入和“小投入的研发预算，同时每个公司都不公开公布本人的预算；第二阶段，当产品开发出来并面世以后，厂商会观摩对方研制出来的新产品对本人的新产品定价，每个厂商可以定高价也可以定低价，但定价之前

8、看不到对方的定价。联想大投入小投入大投入小投入方正高价钱低价钱5，52，66，24，44，33，42，11，26，63，77，35，53，41，24，32，1高价钱高价钱高价钱高价钱高价钱高价钱高价钱低价钱低价钱低价钱低价钱低价钱低价钱低价钱联想大投入小投入大投入小投入方正5，52，66，24，44，33，42，11，23，41，24，32，16，63，77，35，5联想大投入小投入大投入小投入4，43，44，35，5方正该博弈的结果为：两个公司都在第一个阶段采取小投入帕累优势原那么，在第二个阶段采取低价钱。但纳什平衡有16个过程略，由于很多战略导致同一个结果。该博弈的展开型表述见P173页银

9、行挤兑博弈案例案例情况：两个投资者每人存入银行一笔存款D，银行已将这些存款投入一个长期工程。假设在该工程到期前银行被迫对投资者变现，共可收回2r，这里DrD/2。不过，假设银行允许投资工程到期，那么工程共可获得2R，这里RD。有两个时间，投资者可以从银行提款:在银行的投资工程到期之前或者在到期之后。为使分析简化，假设不存在贴现。两个投资者的提款日期可以有如下能够：A、两个都提早，都得到rB、一个提早提取另一个不动，那么第一人得D,另一人得2r-D.C、两个在到期后提，各得RD、两个都不提，等到投资工程终了，都得到RE、假设一个人在期满后提取，另一人不动那么分别得：2R-D,D。如以下图所示：

10、我们运用逆向归纳法分析问题从日期2开场先思索日期2的规范式博弈，由于明显的RD,也就是说2R-DR。我们可以得到这个博弈的纳什平衡R,R。由于不存在贴现，我们可以直接带入日期1的博弈矩阵表示式。由于rD(并且由此可得2r-D r)，这一由两阶段博弈变形得到的单阶段博弈存在两个纯战略纳什平衡:(1)两个投资者都提款，最终收益情况为(r , r); 两个投资者都不提款，最终收益为(R,R)。从而，最初的两阶段银行挤提博弈就有2个子博弈精炼解。银行挤兑(1)王那么柯“银行挤兑的成因和预防两客户在同一银行各存有100元，银行将这200元投资于一个长期工程。假设在工程到期前银行要抽回资金，那么只能收回1

11、40元；但假设到期后再收回投资，那么可收回本息280元。对客户来说，抽回存款的日期也有两种：一是在银行投资工程到期之前，称日期1；一是在到期之后，称日期2。假定假设两客户在日期1要求抽回资金那么各得70元；假设只需一个客户在日期1要抽回资金那么该客户得100元，另一客户只能得到剩余的40元。假设等到日期2两客户同时要收回资金，那么各得140元；假设到日期2还只需一方要求收回资金，那么要求收回资金一方得180元，另一方得100元；假设到日期2没有客户要求收回资金，那么银行还是分给他们各140元。周瑜存不存存不存诸葛亮40,100100,4070,70周瑜抽回不抽回不诸葛亮40,100100,40

12、70,70银行挤兑(3)日期1周瑜诸葛亮抽回不抽回抽回70,70100,40不抽回40,100140,140 前一种结果可以解释为对银行的一次挤提。假设投资者1置信投资者2将在日期1提款、那么投资者1的最优反响也是去提款，即使他们等到日期2再去提款的话两人的福利都会提高。这里的银行挤提博弈在一个很重要的方面不同于第1章中讨论的囚徒姿态:虽然两个博弈都存在一个对整个社会是低效率的纳什平衡;但在囚徒姿态中这一平衡是独一的(并且是参与者的严厉占优战略)，而在这里还同时存在另一个有效率的平衡。从而，这一模型并不能预侧何时会发生对银行的挤提，但确实显示出挤提会作为一个平衡结果而出现。经典案例之关税竞争

13、在国际争端中，关税与贸易争端最为猛烈。由于贸易能增进双方的福利，而关税是妨碍贸易自在的最大妨碍。在早期，政府自在选择关税税率时将如何决策？思索两个完全一样的国家i=1,2，思索两个完全一样的国家i=1,2，政府担任确定关税税率(t1,t2)；思索两个完全一样的国家i=1,2，一个政府担任确定关税税率(t1,t2)；企业1制造产品h1供应本国,及出口e1；思索两个完全一样的国家i=1,2，一个政府担任确定关税税率(t1,t2)；企业1制造产品h1供应本国,及出口e1；企业制造产品供应本国(h1,h2)及出口(e1,e2)；思索两个完全一样的国家i=1,2，政府担任确定关税税率(t1,t2)；企业

14、制造产品供应本国(h1,h2)及出口(e1,e2)；市场1：Q1=h1+e2思索两个完全一样的国家i=1,2，政府担任确定关税税率(t1,t2)；企业制造产品供应本国(h1,h2)及出口(e1,e2)；两个市场：Qi=hi+ej思索两个完全一样的国家i=1,2，政府担任确定关税税率(t1,t2)；企业制造产品供应本国(h1,h2)及出口(e1,e2)；两个市场：Qi=hi+ej, pi(Qi)=a-Qi思索两个完全一样的国家i=1,2，每个国家有一个政府担任确定关税税率(t1,t2)；一个企业制造产品供应本国(h1,h2)及出口(e1,e2)；博弈的时间顺序如下：(1)政府同时选择关税税率t

15、1和t2；(2)企业察看到关税税率，并同时选择其提供国内消费和出口的产量(h1, e1)和(h2, e2)；企业的收益为其利润i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei由于i (ti,tj,hi,ei,hj*,ej*)可表示为:企业I 在市场i的利润 + 在市场j的利润即i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei也即i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi -chi + a-(hj+ei

16、)ei-cei-tjei企业i在市场的最优化问题就可拆为一对问题，在每个市场分别求解企业的收益为其利润i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi -chi + a-(hj+ei)ei-cei-tjei企业i在市场的最优化问题就可拆为一对问题，在每个市场分别求解 hi*须满足：max hia-(hi+ej*)-c,hi0企业的收益为其利润i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi -chi + a-(hj+ei)ei-cei-tjeiei*必需满足：maxeia-(ei+hj*)-c-tjeiei0企业的收益为其利润i：i(t

17、i, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjeihi*须满足：max hi a - (hi+ej*) - c,hi0ei*必需满足：max ei a - (ei+hj*) c - tjeiei0企业的收益为其利润i：i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjeihi*须满足：maxhia-(hi+ej*)-c,hi0且ei*必需满足：maxeia-(ei+hj*)-c-tjeiei0企业的收益为其利润i：i(ti, tj, hi,ei, h

18、j, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei解得hi*=(a-ej*-c)/2ei*=(a-hj*-c-tj)/2 同理，假设政府给定关税税率t1和t2，那么第二个企业j将选择产量(hj*, ej*)，即同理，假设政府给定关税税率t1和t2，那么第二个企业j将选择产量(hj*, ej*)，即hj*=(a-c+tj)/3 ej*=(a-c-2ti)/3假设政府给定关税税率t1和t2，那么企业i将选择产量(hi*, ei*)，即hj*=(a-c+tj)/3 ej*=(a-c-2ti)/3那么利润为i(ti, tj, hi,ei, hj, ej)=a-

19、(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei假设政府给定关税税率t1和t2，那么企业i将选择产量(hi*, ei*)，即hj*=(a-c+tj)/3 ej*=(a-c-2ti)/3那么利润为i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei政府的收益回到第一阶段政府的收益那么为其本国的总福利wi，它由消费者剩余、企业利润及关税构成，即： wi(ti, tj, hi,ei, hj, ej)= (hi+ej)2/2 + i(ti, tj, hi,ei, hj, ej) + tiej回到第一阶

20、段政府的收益那么为其本国的总福利wi，它由消费者剩余、企业利润及关税构成，即： wi(ti, tj, hi,ei, hj, ej)= (hi+ej)2/2 + i(ti, tj, hi,ei, hj, ej) + tiej回到第一阶段把第一阶段的结果代入得回到第一阶段求解一阶条件回到第一阶段求解一阶条件回到第一阶段求解一阶条件得有该博弈的子博弈完美纳什平衡：以及对应的纳什平衡结果在子博弈精炼解中，每个市场上的总量为，。进一步分析我们发现，假设政府选择0关税税率，那么每个市场上的总量为，。于是，政府就有动因签署一个相互承诺0关税税率的协定，即自在贸易。第三节树形博弈的子博弈定义：

21、由一个动态博弈第一阶段以外的某阶段开场的后续博弈阶段构成的，有初始信息集和进展博弈所需求的全部信息，可以自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈。乙甲不借借不分分1，00，42，2乙-1，0留意1、子博弈不能从第一个阶段开场，由于原来的博弈母博弈本身不能称为子博弈，即子博弈集合是一个真子集合。2、子博弈不能分割原来博弈母博弈的信息集。ABCDEFGHID、E、F、G点以后都不能构成子博弈.这个博弈有几个子博弈?第四节子博弈精炼纳什平衡定义：假设一个完美信息的动态博弈中，各博弈方的战略构成的一个战略组合满足，在整个动态博弈及它的一切子博弈中都构成纳什平衡，那么这个战略组合称为

22、该动态博弈的一个“子博弈完美纳什平衡。子博弈完美纳什平衡可以排除平衡战略中不可信的要挟(许愿)和承诺，因此是真正稳定的。逆推归纳法(倒推法)是求完美信息动态博弈子博弈完美纳什平衡的根本方法。留意子博弈精炼纳什平衡本身也是纳什平衡，但却比纳什平衡更强的平衡概念。子博弈精炼纳什平衡可以排除不是结果的纳什平衡。例如：情侣博弈中，足球，足球，足球和芭蕾，芭蕾，芭蕾战略不是子博弈精炼纳什平衡，因此不是最终的结果。图见P179。假设一个战略组合的某个战略成分有偏离的鼓励，我们可以说这个战略组合缺乏部分稳定性，不是子博弈精炼纳什平衡。完美博弈的库恩定理：完美信息的有限序贯博弈都有纳什平衡。动态博弈分析中为什么要引进子博弈完美纳什平衡，它与纳什平衡是什么关系？子博弈完美纳什平衡是一种战略组合,它们不仅在整个博弈中构

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

序贯决策博弈ppt课件

文档简介

温馨提示

最新文档

评论

序贯决策博弈ppt课件

文档简介

温馨提示

最新文档

评论

相关文档