动态博弈理论

上传人：m*** IP属地：天津上传时间：2023-04-13 格式：DOCX 页数：7 大小：223.67KB 积分：9.6 举报 版权申诉

已阅读5页，还剩2页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

动态博弈理论基本概念静态博弈：所有局中人同时行动；后者局中人的行动有先后顺序，但是，后行动者不能观测到先行动者的行动。动态博弈：局中人的行动有先后顺序，后行动者可以观测到先行动者的行动。静态博弈的表示：局中人集合；局中人的决策集；局中人的支付（收益）函数。动态博弈的表示（博弈的扩展式表达）1、局中人集合；（其中包括虚拟局中人“自然”）2、局中人的行动顺序：谁在什么时候行动；3、局中人的行动空间（决策集）：在每次行动时，局中人的可供选择的决策；4、局中人的信息集：在每次行动时，局中人所知道的以前博弈过程的信息；5、局中人的支付函数：每次行动时，局中人的所得（它是所有行动的函数）；6、外生事件（“自然”的选择）的概率分布。博弈树：多人有限策略的扩展式可以用博弈树表示例：有房产商A和B各可以开发一栋楼，开发成本为1亿。若市场有两栋楼，当市场需求大时，每栋楼售价为1.4亿；当市场需求小时，每栋楼售价为7千万。若市场只有一栋楼，当市场需求大时，售价为1.8亿；当市场需求小时，每栋楼售价为1.1亿。房产商的决策选择为开发或不开发。这样，共有下列8种可能结果：1、需求大，A开发，B不开发，则A的利润为0.8亿，B的利润为0；2、需求大，A不开发，B开发，则A的利润为0，B的利润为0.8亿；3、需求大，A开发，B开发，则A的利润为0.4亿，B的利润为0.4亿；4、需求大，A不开发，B不开发，则A的利润为0，B的利润为0;5、需求小，A开发，B不开发，则A的利润为0.1亿，B的利润为0;6、需求小，A不开发，B开发，则A的利润为0，B的利润为0.1亿；7、需求小，A开发，B开发，则A的利润为-0.3亿，B的利润为-0.3亿；8、需求小，A不开发，B不开发，则A的利润为0，B的利润为0；假设行动顺序为房产商A先行动，然后“自然”选择需求量（假设需求大或小的概率同为0.5）。房产商B观察到房产商A行动和“自然”选择后，再选择行动。则该动态博弈的博弈树如下：

博弈树的几个基本概念：结：决策结和终点结。通常用在决策结的旁边标注局中人的方式来表示局中人行动顺序。枝：决策结到它的直接后续结的连线。一个分枝表示局中人的一个选择。信息集：按局中人对决策结是否了解，而将博弈树上的所有决策结分成不同的信息集。例如，前述房产商开发的博弈树中的7个决策结划分为7个信息集。如果房产商B无法观察到“自然”选择就需要0采取行动，则B的信息集由4个减少为2个。如下图A开发不开发N小大开发(8,0)(—趴一3)(1,0》 (0,8)(1/2)开发开发(1/2)(1/2)/BA开发不开发N小大开发(8,0)(—趴一3)(1,0》 (0,8)(1/2)开发开发(1/2)(1/2)/B/小不开发不开发不开发开发B不开发(4,4)(0.0)(0.1)(0,0)完美信息：后行动方了解此前的全部博弈过程，即他完全了解其他局中人的此前的所有行动。完全信息：博弈各方了解其他局中人的收益函数。完美且完全信息动态博弈在动态博弈中，局中人的策略虽是局中人事先设定的，但是，这并没有强制执行的限制。因此，局中人完全可以在博弈过程中改变决策。这种情况称为“相机选择”相机选择问题导致了“可信性”问题。即博弈各方是否会真正始终按自己预先选定的策略行动。动态博弈可以转化为静态博弈求解，即可以得到与静态博弈相同的纳什均衡概念。然而，可信性问题的存在使得人们对纳什均衡在动态博弈中的有效性产生了怀疑。因此，需要为动态博弈改进纳什均衡的概念。例：在“自然：已选择了低需求，且它已是局中人的共同知识的条件下，考虑房产商开发问题。其博弈树如下：

由于A先行动，故他有两个可选择的行动：开发或不开发。B在A之后行动，他有四个可选择的行动：开发；A开发则B开发，A不开发则B不开发；A不开发则B开发，A开发则B不开发；不开发。简记为｛开发，开发｝,｛开发，不开发｝,｛不开发，开发｝,｛不开发，不开发｝。由此可得收益矩阵如下｛开发，开发｝｛开发，不开发｝｛不开发，开发｝｛不开发，不开发｝开发-3,-3-3,-31,01,0不开发0,10,00,10,0容易看出，该博弈有三个纳什均衡点：1：｛开发，｛不开发，开发｝｝，2：｛开发，｛不开发，不开发｝｝，3：｛不开发，｛开发，开发｝｝。对于纳什均衡点3,成为均衡点是因为B威胁不论A是否开发，他都要开发。若A相信这个威胁，则A的最优选择是不开发。因此，当B假定A将选择不开发，此时，开发是他的最优选择。故｛不开发，｛开发，开发｝｝是纳什均衡点。但是，A凭什么要相信这个威胁呢？毕竟，若A选择开发时，B选择开发的支付是-3,选择不开发的支付是0。此时B的最优选择是不开发。因此，若A认为B是理性的，则A将选择开发，逼B选择不开发。这样，该均衡点是不可信的（不合理的）。对于纳什均衡点2,虽然其结果是A开发，B不开发是合理的。但是，该均衡策略本身是不合理的。因为，若A选择开发，B的最优选择是不开发；但是，若A选择不开发，则B的最优选择是开发。因此，B的决策｛不开发，不开发｝本身就是不合理的。即是一个不可信的策略。第一个对纳什均衡的最重要改进是泽尔腾的“子博弈精练纳什均衡”这一概念的主要思想是在纳什均衡点中，排除掉存在可信性问题的纳什均衡点。子博弈：在一个动态博弈中，从某一阶段（不能是第一阶段）开始的后续阶段构成的，拥有初始信息集和进行博弈的全部信息，能够自己进行博弈的原博弈的一部分称为原博弈的一个子博弈。定义：在动态博弈中，若一个策略组合是该博弈的纳什均衡，并且它对该博弈的每个子博弈都给出了纳什均衡，则称这个策略组合为子博弈精练纳什均衡。下面以房产商开发为例子解释子博弈精练纳什均衡的概念。（砧原博弈（C）子博弈U对于子博弈（b）,B的最优选择是不开发；对于子博弈（c）,B的最优选择是开发。因此，对于纳什均衡点3,它在子博弈（c）上构成纳什均衡，但在子博弈（b）上不构成纳什均衡；而纳什均衡点2在子博弈（c）上不构成纳什均衡，在子博弈（b）上构成纳什均衡；只有纳什均衡点1，在子博弈（c）和（b）上都构成纳什均衡。对于有限完全且完美动态博弈，可以用逆向递归方法求其子博弈精练纳什均衡点。该算法的基本思想是先从最后的决策点开始，寻找在该点决策的局中人的最优选择，再倒会到倒数第二个决策点，寻找第二个决策者的最优决策，如此等等。例如，在房产商开发中，在第二阶段，若A选择开发，则B的最优选择是不开发；若A选择不开发，则B的最优选择是开发。即B的最优策略是｛不开发，开发｝。回到第一阶段，由于A预计到B会按上述规则行动，按照这一规则，A在第一阶段的最优选择是开发,因此子博弈精练均衡点是｛开发，｛不开发，开发｝｝。不完全信息静态博弈例：（市场进入问题）假设某一市场已有一个厂商（在位者）。现有一个厂商（进入者）计划进入该市场。但是，进入者不知道在位者的成本函数，也不知道在位者是默认他进入,还是阻止他进入。为简单记，假设在位者的成本函数只有两种成本：高成本和低成本。并进一步假定的支付矩阵如下在位者高成本低成本默认阻止默认阻止进入40，50-10，030，80-10，100不进入0，3000，4000，4000，400在本例中，进入者的信息是不完全的，而在位者知道进入者的成本函数。用以前的技术是无法处理这种博弈的。因为进入似乎在与两个不同的在位者进行博弈:高成本在位者和低成本在位者。一般来说，若在位者有T种可能的成本，则进入者就象在与T个不同的在位者进行博弈。为了处理这种博弈，Harsanyi引入一个虚拟局中人 “自然”自然首先行动决定局中人的特征(成本函数)，局中人知道自己的特征，其他局中人不知道。则上述博弈转换为下列图示的博弈：此即Harsanyi转换。利用Harsanyi转换，不完全信息与不完美信息之间的区别就不重要了。一般来说，自然在博弈开始的选择包括局中人的决策集、信息集、收益函数等等。称一个局中人所拥有的所有个人信息为他的类型。不完全信息意味着至少有一个局中人有多个类型。在不完全信息博弈中，与完全信息博弈相同的是局中人都是同时行动，都有各自的策略集。不同的是，局中人的行动集不等同于策略集。局中人的行动集可能依赖他的类型。即行动集是类型相依的。同样，局中人的收益函数也是类型相依的。因此，描述不完全信息博弈需要表述局中人的类型集®，…,®；条件概率P，…,P；1 n 1 n类型相依的策略集A(0),•••,A(0)；类型相依的效用(收益)函数u(a，…,a;9)，…，11 nn 11 n1u(a，…，a;0)。n1 nn其中，局中人i知道自己的类型0 。条件概率分布p=p(0...0)表示当局中人iii iii'i的类型为0时，他有关其他局中人类型0…&0…的概率。i i i定义局中人的期望效用为

V=工p(0 卩)u(a,a...；e,e...)i iiiiiiii贝叶斯-纳什均衡：若有一个策略组合，其中每个局中人在给定自己的类型及其他局中人的类型相依策略时，最大化自己的期望效用函数，则该策略组合称为该博弈的贝叶斯-纳什均衡。例：不完全信息古诺模型某市场有两个厂商1,2。市场需求函数为p=a-q-q。各厂商的不变单位成本为c。1 2 i因此,厂商的利润函数为兀=q(a—q—q—c)ii 1 2i厂商1的单位成本是公共知识。厂商2的单位成本可能是ch或c(厂商2自己知道)。厂商1只知道c=CL的概率是卩。22为了简单，假设a=2,[=1,c;=%，c;=54,卩=%。因为厂商2知道厂商1的成本’故它选择最大化利润函数:兀=q(t—q—q)2212其中’t=

人人文库> 全部分类> 行业资料 > 各类标准

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

动态博弈理论

文档简介

温馨提示

最新文档

评论

动态博弈理论

文档简介

温馨提示

最新文档

评论

相关文档