第八章博弈论（续）

上传人：e*** IP属地：湖北上传时间：2021-10-09 格式：PPT 页数：73 大小：473.50KB 积分：19 举报 版权申诉

已阅读5页，还剩68页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、l（一）不完全信息博弈（一）不完全信息博弈 l前面的分析都假定支付函数是所有参与人的共同知识。满足前面的分析都假定支付函数是所有参与人的共同知识。满足该假设的博弈称为该假设的博弈称为“完全信息博弈完全信息博弈”。虽然它在许多情况下。虽然它在许多情况下是一个较好的近似，但现实中很多博弈并不满足上述假设。是一个较好的近似，但现实中很多博弈并不满足上述假设。如当你与一个陌生人打交道时，你并不知道他的特征是什么如当你与一个陌生人打交道时，你并不知道他的特征是什么（事实上，即使是与你长期共事的人也是如此）；当你购买（事实上，即使是与你长期共事的人也是如此）；当你购买（卖）一件名画或古董时，你并

2、不知道卖主愿意脱手的最低（卖）一件名画或古董时，你并不知道卖主愿意脱手的最低价格（或买主愿意的最高出价是多少）；当一个企业进入市价格（或买主愿意的最高出价是多少）；当一个企业进入市场时，它也不知道市场上的在位企业的成本函数是什么，等场时，它也不知道市场上的在位企业的成本函数是什么，等等。等。 l 事实上，限于人的精力和智力，参与人对事实上，限于人的精力和智力，参与人对有关信息的了解是不完全的，仅为有限理性；有关信息的了解是不完全的，仅为有限理性；同时，信息资源是稀缺的，获取完全信息的成同时，信息资源是稀缺的，获取完全信息的成本也过高。因此，信息不完全是现实的常态。本也过高。因此，信

3、息不完全是现实的常态。 l l 面对不完全信息，人们可以对不确定性做出主观推测和面对不完全信息，人们可以对不确定性做出主观推测和判断，并据此进行博弈，以实现预期收益最大化。这就是判断，并据此进行博弈，以实现预期收益最大化。这就是说，局中人虽然不确切知道对手的策略选择及其收益函数，说，局中人虽然不确切知道对手的策略选择及其收益函数，却知道其可性的大小却知道其可性的大小概率分布。通过引入概率分布，概率分布。通过引入概率分布，便将原来的不完全信息博弈转为完全但不完美信息博弈便将原来的不完全信息博弈转为完全但不完美信息博弈（complete but imperfect information

4、 game），可以），可以通过求解后者得到原博弈的均衡解，又称贝叶斯均衡通过求解后者得到原博弈的均衡解，又称贝叶斯均衡（Bayesian equilibrium）。）。完全信息与完美信息 l 如果收益函数为参与人的公共信息，是完如果收益函数为参与人的公共信息，是完全信息。如囚犯困境中的收益巨阵：全信息。如囚犯困境中的收益巨阵：A知道，知道， B也知道；也知道；A知道知道B知道，知道，B也知道也知道A知道；知道；A 知道知道B知道知道A知道，知道， B也知道也知道 A知道知道 B知道；知道； l 如果不仅收益函数是公共信息，而且后行动如果不仅收益函数是公共信息，而且后行动者能够观察到先

5、行动者此前的全部策略行为，者能够观察到先行动者此前的全部策略行为，即博弈的进程也成为公共信息，就是完美信息。即博弈的进程也成为公共信息，就是完美信息。 l 贝叶斯纳什均衡是指：在给定参与人类型和其贝叶斯纳什均衡是指：在给定参与人类型和其他参与人类型的先验概率分布的条件下，所有参他参与人类型的先验概率分布的条件下，所有参与人都达到预期收益最大化。贝叶斯纳什均衡是与人都达到预期收益最大化。贝叶斯纳什均衡是纳什均衡在不完全信息条件下的扩展，它与完全纳什均衡在不完全信息条件下的扩展，它与完全信息静态博弈的纳什均衡一样，都是给定其他参信息静态博弈的纳什均衡一样，都是给定其他参与人策略时最优反

6、应策略的组合，将收益为预期与人策略时最优反应策略的组合，将收益为预期收益。收益。 l例：市场进入博弈例：市场进入博弈 l潜在进入企业（参与人潜在进入企业（参与人1）决定是否进入一个新的产业，但）决定是否进入一个新的产业，但不知道在位企业（参与人不知道在位企业（参与人2）的成本函数，不知道它选择默）的成本函数，不知道它选择默许还是斗争。设在位者有两种可能的成本函数：高成本或低许还是斗争。设在位者有两种可能的成本函数：高成本或低成本；对应两种成本状况的不同策略组合及支付矩阵如下表：成本；对应两种成本状况的不同策略组合及支付矩阵如下表： l表1 在位者在位者高成本高成本低成本低成本默许默

7、许斗争斗争默许默许斗争斗争进入者进入者进入进入40，50-10，030，80-10，100 不进入不进入0，3000，3000，4000，400 l进入者有关在位者的成本信息是不完全的，但在位者知道进入者有关在位者的成本信息是不完全的，但在位者知道进入者的成本函数。在完全信息下，若在位者是高成本，进入者的成本函数。在完全信息下，若在位者是高成本，进入者的最优选择是进入；若在位者是低成本，进入者的进入者的最优选择是进入；若在位者是低成本，进入者的最优选择是不进入。但进入者并不知道在位者是高成本还最优选择是不进入。但进入者并不知道在位者是高成本还是低成本，故进入者的最优选择依赖于他在多在

8、程度上认是低成本，故进入者的最优选择依赖于他在多在程度上认为在位者是高成本的或低成本的。为在位者是高成本的或低成本的。 l假定进入者认为在位者是高成本的概率为假定进入者认为在位者是高成本的概率为p，低成本的概，低成本的概率为率为(1-p)。则进入者选进入的期望利润是。则进入者选进入的期望利润是p(40)+(1-p)(-10)，选不进入的期望利润为选不进入的期望利润为0。因。因此，此，进入者的最优选择是：进入者的最优选择是：若若，进入；若，进入；若，不进入（当，不进入（当时，进时，进入者进入与不进入无差异，可假定它进入）。入者进入与不进入无差异，可假定它进入）。 5/ 1p5

9、/ 1p 5/ 1p l例：生活中的求爱博弈例：生活中的求爱博弈 l设想有人向你求爱，你的选择设想有人向你求爱，你的选择接受还是拒绝依赖于你接受还是拒绝依赖于你对求爱者品德的判断。假设你准确地知道求爱者品德良好，对求爱者品德的判断。假设你准确地知道求爱者品德良好，你会选择接受，反之，拒绝。但你并不能准确地知道求爱你会选择接受，反之，拒绝。但你并不能准确地知道求爱者的品德。此时，你的决策显然取决于你在多在程度上相者的品德。此时，你的决策显然取决于你在多在程度上相信他是一个品德优良（品德恶劣）的人。下表列出了两种信他是一个品德优良（品德恶劣）的人。下表列出了两种情况下的支付矩阵。假定不论

10、求爱者品德如何，只要他求情况下的支付矩阵。假定不论求爱者品德如何，只要他求爱你接受，他就得到爱你接受，他就得到100；但你的支付依赖于求爱者的类；但你的支付依赖于求爱者的类型：接受一个品德优良的求爱者使你得到型：接受一个品德优良的求爱者使你得到100，而接受一，而接受一个品德恶劣者的求爱使你损失个品德恶劣者的求爱使你损失100。求爱者（不论何种类。求爱者（不论何种类型）在你拒绝时损失型）在你拒绝时损失50，因为他会丢面子。，因为他会丢面子。 l 求爱者博弈：品德优良者求爱求爱者博弈：品德优良者求爱你你接受接受不接受不接受求爱者求爱者求爱求爱100，100-50，0 不求爱不求爱0

11、，00，0 l 求爱者博弈：品德恶劣者求爱求爱者博弈：品德恶劣者求爱你你接受接受不接受不接受求爱者求爱者求爱求爱100，-100-50，0 不求爱不求爱0，00，0 l现在假设你认为求爱者品德优良的概率为现在假设你认为求爱者品德优良的概率为。求爱者也。求爱者也知道这个知道这个为多少，则他求爱你接受时你的期望效用为多少，则他求爱你接受时你的期望效用为为，你不接受时你的期望效用为零。，你不接受时你的期望效用为零。当当时，你接受才是最优选择。若时，你接受才是最优选择。若确实大于确实大于1/2，贝叶斯（纳什）均衡是：求爱者求爱，你接受；反之，贝叶斯（纳什）均衡是：求爱者求爱，你

12、接受；反之，如果如果，贝叶斯均衡是：求爱者不求爱，你不接受。，贝叶斯均衡是：求爱者不求爱，你不接受。此时求爱者选择不求爱的原因是，他知道他求爱会被拒此时求爱者选择不求爱的原因是，他知道他求爱会被拒绝，这种有损颜面的事不值得干。绝，这种有损颜面的事不值得干。 x x )1)(100(100 xx 2/1xx 2/1x l（二）海萨尼（二）海萨尼（Harsanyi）转换）转换 l一般地，如果在位者有T种可能的不同成本函数，进入者似乎是在与T个不同的在位者博弈。海萨尼（1967-1968）提出了一个处理不完全信息博弈的方法：引入一个虚拟的参与人“自然”；自然首先行动决定参与人的特征（

13、如成本函数），参与人知道自己的特征，但其他参与人不知道。这样，上述不完全信息博弈就转换成完全但不完美信息博弈（方括号内的数字代表自然选择不同行动的概率）（如下图），可用标准的分析技术进行分析，这就是“海萨尼转换”。 l1、引入一个虚拟局中人自然N（nature），自然没有自己的得失，惟一的作用是赋予局中人的类型t=t1，t2，tn，ti Ti（i=1，2， n），且仅将局中人i的类型告诉他自己，不让其他局中人知道； l2、局中人i在给定自己类型ti的条件下，对其他局中人可能类型t i主观判断P； l3、局中人局中人i的策略空间的策略空间Si取决于他的类型，即取决于他的类型，即

14、Si=Si（ti）；）； l4、所有局中人同时行动，局中人、所有局中人同时行动，局中人i从自己的策略空间从自己的策略空间Si选选择策略择策略si，或者说，从自己的行动空间，或者说，从自己的行动空间Ai中选择行动中选择行动ai； l5、局中人、局中人i的收益取决于他的类型和所有局中人的行动选的收益取决于他的类型和所有局中人的行动选择即择即 lUi=Ui（a1，a2，an；ti）。 lG=T1, T2，Tn；S1，S2，Sn；P1，P2，Pn； U1，U2，Un； l l 高低 N 进入者进入者 p1 p 进入进入进入进入不进入不进入不进入不进入在位者在位者在位者在位者合作合作

15、合作合作斗争斗争斗争斗争（0，300）（0，400）（40，50）（-10，0）（30，80）（-10，100） l 上例中，假定自然选择的只是在位者是高成本还是低成本。更一般地，自然在博弈的开始选择的包括参与人的策略空间、信息集、支付函数等。将参与人所拥有的个人信息称为他的类型。 l据此，可允许一个参与人不知道其他参与人是否知道自己的类型，如在市场进入博弈中，在位者不知道进入者是否知道自己是高成本还是低成本，只知道进入者有p的概率知道自己的成本函数，(1- p) 的概率不知道自己的成本函数。此时，说进入者也有两种类型：知道（在位者的成本）或不知道（在位者的成

16、本）。由于在大多数博弈中，参与人的特征由支付函数完全决定，一般将参与人的支付函数等同于他的类型。（二）、贝叶斯均衡的应用举例二）、贝叶斯均衡的应用举例 l例：不完全信息古诺模型 l在不完全信息古诺模型里，参与人的类型是成本函数。设反需求函数为，每个企业都有不变的单位成本。令为企业i的单位成本，则它的利润函数为： l l假定企业1的单位成本是共同知识；企业2的单位成本是或，且企业2知道自己的成本，但企业1只知道的可能性为， l 的可能性为，是共同知识。 21 qqaP i c 2 , 1),( 21 icqqaq iii 1 c L c2 H c2 L cc 2 2

17、 HL cc 22 H cc 2 2 1 l ) 4 3 ( 2 1 ); 4 5 ( 2 1 :.2 4/3,24/5. 12 )(2/1);( : 2.2 , 4/34/54/54/3, )( : 2,12 ).12,( 2/1, 4/5, 4/3, 1, 2, 1 2 1 2 22 11 * 2 2 * 122 2 22 1 q qq q tqtq qttq q atat qqtq q ccca HL HL HL 则的最优产量企业时为的最优产量时企业为令本的产量和自身的成的最优产量依赖于企业即企业反应函数为的得企业从最优化的一阶条件可的实际成本业依赖于企或其中化利润函数最大

18、将选择企业的成本知道企业给定企业的成本相同的成本的期望值与企业企业因而假设具体地 l企业1不知道企业2的真实成本从而不知道企业2的最优反应是还是，因此，企业1将选择最大下列期望利润函数： l L q2 H q2 1 q )1 ( 2 1 )1 ( 2 1 2 11 2 111 HL qqqqqqE l 解最优化的一阶条件可得企业1的反应函数： )1 ( 2 1 ) 2 1 2 1 1 ( 2 1 2 22 * 1 Eqqqq HL .212/2/, 22 2 产量的期望值关于企业是企业其中 HL qqEq l 均衡意味着两个反应函数同时成立。解两个反应函数可得贝叶斯均衡： 24

19、/5;24/11; 3/1 * 2 * 2 * 1 HL q qq l 比较不完全信息下的贝叶斯均衡与完全信息下的纳什均衡。若企业2的成本是，企业1知道它，则反应函数分别为： l 4/3 2 c ) 4 5 ( 2 1 );1( 2 1 1 * 22 * 1 q qqq 24/56/1; 3/112/5 24/112/1; 3/14/1 :. 6/1,12/5 :, 4/51, 4/5 2,.2 . 2/1, 4/1: * 22 * 1 1 * 22 * 1 1 2 1 2 2 21 HNE H NE H LNE L NE L NE H NE H NE L NE L q qq q q q

20、q q q qc c Lqq 故有纳什均衡产量为知道企业的成本是若企业类似地为低成本的情况企业表示当下标纳什均衡产量为 l即是说，与完全信息相比，在不完全信息下，低成本企业的产量相对较低，高成本企业的产量相对较高。原因是，当企业1不知道时，只能生产预期的最优产量，高于完全信息下面对低成本竞争对手时的产量，低于完全信息下面对高成本竞争对手时的产量；企业2对此作出反应。下图是两种均衡比较的直观显示。 2 c l 1 q 2 q )( 21 qq )( 1 2 qq L )( 1 2 qq H 2/ 1 24/11 24/5 6/ 1 3/ 1 4/ 112/5 纳什均纳什均衡衡

21、贝叶斯均贝叶斯均衡衡 Qa Qb 120 60120 60 40 40 Qa=60-Qb/2 Qb=60-Qa/2 古诺均衡点古诺均衡点(纳什均衡）纳什均衡）斯塔克伯格斯塔克伯格（精炼）（精炼） l一、精炼贝叶斯均衡的基本思路一、精炼贝叶斯均衡的基本思路 l在不完全信息动态博弈中，在不完全信息动态博弈中，“自然自然”先选择参与人的类型先选择参与人的类型（参与人自己知道，其他人不知道）（参与人自己知道，其他人不知道）参与人开始行动，后参与人开始行动，后行动者能观测到先行动者的行动，但不能观测到其类型。行动者能观测到先行动者的行动，但不能观测到其类型。由于行动是类型依存的，后行动者可

22、通过观察先行动者选择由于行动是类型依存的，后行动者可通过观察先行动者选择的行动来推断其特征或修正对其类型的先验信念（概率分的行动来推断其特征或修正对其类型的先验信念（概率分布），然后选择自己的最优行动。先行动者预测到自己的行布），然后选择自己的最优行动。先行动者预测到自己的行动将被后行动者所利用，就会设法传递对自己最有利的信息。动将被后行动者所利用，就会设法传递对自己最有利的信息。因此，博弈过程不仅是参与人选择行动的过程，而且是参与因此，博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。人不断修正信念的过程。 l精炼贝叶斯均衡是不完人信息动态博弈的基本均衡概念。精炼

23、贝叶斯均衡是不完人信息动态博弈的基本均衡概念。它是泽尔腾的完全信息动态博弈的子博弈精炼均衡与海萨它是泽尔腾的完全信息动态博弈的子博弈精炼均衡与海萨尼的不完全信息静态博弈贝叶斯均衡的结合。它要求：给尼的不完全信息静态博弈贝叶斯均衡的结合。它要求：给定有关其他参与人类型的信念，参与人的策略在每一个信定有关其他参与人类型的信念，参与人的策略在每一个信息集开始的息集开始的“后续博弈后续博弈”上构成贝叶斯均衡；且上构成贝叶斯均衡；且在所有可在所有可能的情况下能的情况下，参与人使用贝叶斯法则修正有关其他参与人，参与人使用贝叶斯法则修正有关其他参与人类型的信念。类型的信念。 l例：市场进入例：市

24、场进入 l假定有两个时期，假定有两个时期，t=1,2。在。在t=1期，市场上有一个垄断企业期，市场上有一个垄断企业（在位者），一个潜在的进入者。若进入者进入，在（在位者），一个潜在的进入者。若进入者进入，在t=2，两个企业进行古诺博弈，否则，在位者仍是一个垄断者。两个企业进行古诺博弈，否则，在位者仍是一个垄断者。假定在位者有高成本和假定在位者有高成本和 l低成本两个类型，进入者在开始时只知道在位者是高成本低成本两个类型，进入者在开始时只知道在位者是高成本的概率是的概率是，低成本的概率为，低成本的概率为1-1-。这是进入者的先验信。这是进入者的先验信念（概率）。进入者只有一个类型，其进

25、入成本为念（概率）。进入者只有一个类型，其进入成本为2 2；若；若进入，其成本函数与高成本的在位者相同。在进入，其成本函数与高成本的在位者相同。在t=1，在位，在位者要决定该时期的价格（或产量），设有三种可能的价格者要决定该时期的价格（或产量），设有三种可能的价格选择：选择：p=4，p=5或或p=6。若在位者是高成本，对应三种价。若在位者是高成本，对应三种价格选择的利润分别是：格选择的利润分别是：2、6或或7；若在位者是低成本，对；若在位者是低成本，对应利润分别为应利润分别为6、9或或8。这样，高成本和低成本在位者的。这样，高成本和低成本在位者的单阶段最优垄断价格分别是单阶段最优垄

26、断价格分别是p=6和和p=5。在。在t=2，若进入者若进入者已进入，若在位者是高成本，两者成本函数相同，对称的已进入，若在位者是高成本，两者成本函数相同，对称的古诺均衡产量下的价格是古诺均衡产量下的价格是p=5， l每个企业的利润为每个企业的利润为3，进入者的净利润为，进入者的净利润为1；若在位者是低；若在位者是低成本，两企业成本函数不同，非对称古诺均衡产量下的价成本，两企业成本函数不同，非对称古诺均衡产量下的价格是格是p=4，在位者的利润为，在位者的利润为5，进入者的利润为，进入者的利润为1，净利润，净利润为为-1。若进入者不进入，在。若进入者不进入，在t=2时的在位者仍是一个垄断

27、者，时的在位者仍是一个垄断者，不同价格选择下的利润与第一阶段相同。构造上述数字使不同价格选择下的利润与第一阶段相同。构造上述数字使得在完全信息下，若在位者是高成本，进入者选择进入；得在完全信息下，若在位者是高成本，进入者选择进入；若在位者是低成本，进入者选择不进入。若在位者是低成本，进入者选择不进入。 l该博弈的简化扩展式表述如下表。在位者有两个单结信息该博弈的简化扩展式表述如下表。在位者有两个单结信息集，即他知道集，即他知道“自然自然”的选择（自己的类型）；进入者有的选择（自己的类型）；进入者有三个信息集，每个信息集有两个决策结，即进入者能观测三个信息集，每个信息集有两个决策结，即

28、进入者能观测到在位者的价格选择，但不能观测到在位者的成本函数。到在位者的价格选择，但不能观测到在位者的成本函数。 l图中省略了第二阶段博弈的扩展式，代之以古诺均衡支图中省略了第二阶段博弈的扩展式，代之以古诺均衡支付向量和垄断利润。因为在博弈进入第二阶段后，若进付向量和垄断利润。因为在博弈进入第二阶段后，若进入者已进入，古诺均衡产量（和对应价格）是每个企业入者已进入，古诺均衡产量（和对应价格）是每个企业的最优选择；若进入者没有进入，单阶段垄断产量（和的最优选择；若进入者没有进入，单阶段垄断产量（和价格）是在位者的最优选择。价格）是在位者的最优选择。 l博弈进入第二阶段后，企业的行动选择

29、是一个简单的静博弈进入第二阶段后，企业的行动选择是一个简单的静态博弈决策，但第一阶段的选择要复杂得多。进入者是态博弈决策，但第一阶段的选择要复杂得多。进入者是否进入依赖于它对在位者成本函数的判断：给定在位者否进入依赖于它对在位者成本函数的判断：给定在位者是高成本时进入的净利润为是高成本时进入的净利润为1，低成本时进入的净利润为，低成本时进入的净利润为 -1，当且仅当进入者认为在位者是高成本的概率大于，当且仅当进入者认为在位者是高成本的概率大于1/2 时，进入者才会进入。与静态博弈不同的是，在观测到时，进入者才会进入。与静态博弈不同的是，在观测到在在 l （2,0）（2,0）（6,0）

30、（6,0）（6,0）（6,0）（8,0）（8,0）进入进入不进入进入不进入进入不进入（7,0）（7,0）（9,0）（9,0）（3,1）（7,0）（3,1）（7,0）（3,1）（7,0）（5,-1）（9,0）（5,-1）（9,0）（5,-1）（9,0）不进入进入不进入进入不进入进入者进入者高低 N 在位者在位者 4p 5p 6p 4p 5p6p 1 l位者第一阶段的价格选择后，进入者可修正对在位者成位者第一阶段的价格选择后，进入者可修正对在位者成本函数的先验概率本函数的先验概率，因为在位者的价格选择可能包含，因为在位者的价格选择可

31、能包含有关成本函数的信息。如低成本在位者不会选择有关成本函数的信息。如低成本在位者不会选择p=6（因（因为他不希望进入者认为自己是高成本），故进入者观测为他不希望进入者认为自己是高成本），故进入者观测到在位者选择了到在位者选择了p=6，可推断在位者一定是高成本，选择，可推断在位者一定是高成本，选择进入有利可图。这样，即使是高成本在位者也可能不会进入有利可图。这样，即使是高成本在位者也可能不会选择选择p=6，尽管它是单阶段最优垄断价格。类似地，低成，尽管它是单阶段最优垄断价格。类似地，低成本在位者也可能不会选择本在位者也可能不会选择p=5，如果，如果p=5会招致进入者进会招致进入者进

32、入。入。 l问题的核心是在位者必须考虑价格选择的信息效应：不问题的核心是在位者必须考虑价格选择的信息效应：不同的价格选择如何影响进入者的后验概率从而影响进入同的价格选择如何影响进入者的后验概率从而影响进入者的进入决策。一个非单阶段最优者的进入决策。一个非单阶段最优 l价格会减少现期利润，但若它能阻止进入者进入，价格会减少现期利润，但若它能阻止进入者进入，从而使在位者在第二阶段得到垄断利润而非古诺从而使在位者在第二阶段得到垄断利润而非古诺均衡利润，若两利润之差足够大，且在位者有足均衡利润，若两利润之差足够大，且在位者有足够的耐心，选择一个非单阶段最优价格可能是最够的耐心，选择一个非单

33、阶段最优价格可能是最优的。我们将看到，在均衡状态下，在位者究竟优的。我们将看到，在均衡状态下，在位者究竟选择何种价格，不仅与成本函数有关，而且与进选择何种价格，不仅与成本函数有关，而且与进入者的先验概率入者的先验概率有关；而无论有关；而无论为多少，单阶为多少，单阶段最优垄断价格不构成一个均衡。段最优垄断价格不构成一个均衡。 l对于上述动态博弈的均衡结果，仅使用上面的对于上述动态博弈的均衡结果，仅使用上面的贝叶斯纳什均衡是不够的，因为在静态贝叶斯贝叶斯纳什均衡是不够的，因为在静态贝叶斯均衡中，参与人的信念是事前给定的，均衡概均衡中，参与人的信念是事前给定的，均衡概念没有规定参与人如

34、何修正自己有关在位者成念没有规定参与人如何修正自己有关在位者成本函数的信念。（但是，若进入者可任意地修本函数的信念。（但是，若进入者可任意地修正该信念，正该信念， l上述不完全信息动态博弈可以有任意的贝叶斯上述不完全信息动态博弈可以有任意的贝叶斯均衡）。均衡）。 l精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均衡和贝叶斯法则的结合。它要求衡和贝叶斯法则的结合。它要求（1 1）在每个信）在每个信息集上，决策者必须有一个定义在属于该信息息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；集的所有决策结上的一个概率分布（信念）

35、； l（2 2）给定该信息集上的概率分布和其他参与人）给定该信息集上的概率分布和其他参与人的后续策略，参与人的行动必须是最优的；的后续策略，参与人的行动必须是最优的； l（3 3）每个参与人根据贝叶斯法则和均衡策略修）每个参与人根据贝叶斯法则和均衡策略修正后验概率。正后验概率。二、贝叶斯法则二、贝叶斯法则 l一般地，在面临不确定性时，在任一时点上，我们对某事一般地，在面临不确定性时，在任一时点上，我们对某事件发生的可能性有一个判断。然后根据新的信息来修正该件发生的可能性有一个判断。然后根据新的信息来修正该判断。统计学上，修正之前的判断称为判断。统计学上，修正之前的判断称为“先验概率先

36、验概率” （prior probability），修正之后的判断称为），修正之后的判断称为“后验概后验概率率”(posterior probability )。贝叶斯法则正是人们根据新。贝叶斯法则正是人们根据新信息从先验概率得到后验概率的方法。信息从先验概率得到后验概率的方法。 l以不完全信息博弈为例说明该法则。假定参与人的类型是以不完全信息博弈为例说明该法则。假定参与人的类型是独立分布的。假定参与人独立分布的。假定参与人i有有K个可能的类型，有个可能的类型，有H个可能个可能的行动。的行动。 l ).( ,)|( ”“ )()|( )()|(,)()|(Pr :. 1)|( ),|(,

37、; 1 )(, 0)( ).,( 1 11 1 k khh h K k kkh KKhhh h hkh khhk K k kkk hk p apa iai pap pappapaob aiap apaii ppi i a 概率他属于每种类型的先验权数是的加权平均的条件概率选择概率是每种类型的总的选择行动即参与人的边缘概率是选则的条件概率为选择属于给定的先验概率为属于类型假定故省略了下标因为只考虑一个参与人的行动型和一个特定分别代表一个特定的类和用 1 :, ? Pr|, . : (|) ()(|) () Pr| Pr (|) () . hk khh k hkkhkk kh Kh

38、hjj j ia i obaa i p app ap oba ob a p ap 问题假如我们观测到选了属于的后验概率是多少用表示该后验概率即给定的情况下属于类型的概率因此有这就是贝叶斯法则 l例：例： l若把所有的人分为好人（GP）和坏人（BP），所有的事分为好事（GT）和坏事（BT），则一个人干好事的概率=他是好人的概率p(GP)好人干好事的概率 p(GT|GP)+他是坏人的概率p(BP)坏人干好事的概率 p(GT|BP)： l# #假设观测到一个人干了一件好事，则他是好人的后验概率为： l具体地，假定我们认为这个人是好人的先验概率为1/2。则在观测他干了好事之

39、后，应如何修正他是好人的概率依赖于我们认为这件事好到什么程度。 )()|()()|(PrBPpBPGTpGPpGPGTpGTob Pr )()|( |Pr GTob GPpGPGTp GTGPob l考虑三种极端的情形。第一，这是一件非常好的好事，好人一定会干，坏人绝不可能干，即 l 则. 0)|(, 1)|(BPGT pGPGTp 1 2/102/11 2/11 |Pr GTGPob l即是说，尽管原来认为这个人是好人的可能性是1/2，但在观测到他干了这件好事后，我们会得出结论：他肯定是个好人。 l第二，这是一件非常一般的好事，好人会干，坏人也会干，即则. 1)|(, 1)|(B

40、PGT pGPGTp 2/1 2/112/11 2/11 |Pr GTGPob l即我们对他的看法不变。 l第三，介于上述两者之间：这件事好人肯定会干，但坏人可能干也可能不干，概率各为1/2，则： 3/2 2/12/12/11 2/11 |Pr GTGPob l即我们认为他是好人的可能性增加了，但他仍有1/3的可能性是坏人。 l# # 假如我们观测到这个人干了一件坏事，将如何改变对他的看法？若我们相信，好人绝不会干坏事，只有坏人才会干坏事，则可肯定他绝不是一个好人： 0 2/12/10 2/10 |Pr p BTGPob l这里p0是坏人干这件坏事的概率。或者说他肯定是一个坏人： 1

41、 2/12/10 2/1 |Pr p p BTBPob l# #若我们原来认为一个人100%的是好人，但突然发现他干了一件坏事。该如何改为对他的看法？显然有一个彻底的改变：嗨，原来他是个坏人。 l# #若原来认为他肯定是一个坏人，突然发现他干了一件好事，该如何看待他？若我们认为坏人干好事的目的仅仅是为假装好人，若他是在知道我们认为他是坏人的情况下干了好事，则我们认为他是坏人的后验概率是0， 1区间的任意数（当然，一般不会马上认为这个人一定是好人，除非这件事非常好，如若不然，坏人总是有积极性干一件好事以使我们认为他是一个好人。当然，如果认为坏人干好事并不仅仅是 l为了假装好人，则

42、对他的看法就不会改变，因为根据贝叶斯法则： 1 10 1 |Pr pq p GTBPob l这里p0是坏人干好事的概率，q0是好人干好事的概率。 l从上例中可看出，如何改变对一个人的看法不仅依赖于我们认为他是好人或坏人的先验概率，而且依赖于我们如何认为好人干好事和坏人干好事的条件概率。 l （三）市场进入博弈的精炼贝叶斯均衡。 l 由于在位者有两个潜在类型，进入者只有一个类型，因此，只有进入者修正信念。令是进入者观测到在位者的价格选择后认为在位者是高成本的后验概率（注意：这里p是指价格）。先证明：不论先验概率是多少，在第一阶阶段，高成本在位者选择单阶段最优垄断价格p=6和低成

43、本在位者选单阶段最优垄断价格p=5不是一个精炼贝叶斯均衡。 l如果在位者作出上述选择，进入者观测到p=6就知道在位者是高成本，即；观测到p=5就知道在位者是低成本，即。给定该后验 )( p 1)6( 0)5( l信念，就知道进入者将进入，当且仅当他观测到p=6。但考虑高成本在位者。若他选择p=6，第一阶段得垄断利润 7，第二阶段得寡头利润3，总利润为10。但若他模仿低成本企业，选p=5，第一阶段得利润6，第二阶段得利润7，总利润为13。因此， p=6不是高成本在位者的最优选择，上述策略不构成精炼贝叶斯均衡。 l再考虑两种不同情况下的均衡1/2和1/2.先考虑先考虑 1/21/

44、2。在这种情况下，精炼贝叶斯均衡是：不论高成本还是低成本，在位者选择p=5；进入者将进入，当且仅当进入者观测到p=6（基于 l 1)6( l给定进入者的后验概率和策略，若高成本在位者选p=6，进入者进入，他获利润10；若选p=5,进入者不进入，他获利润13。故牺牲第一阶段的1单位利润换取第二阶段的4单位利润是合算的， p=5是最优的。类似地，低成本在位者选p=5时的总利润是9+9=18，大于选其他任何价格时的利润，故p=5也是其最优选择。 l给定两类在位者都选p=5，进入者不能从观测到的价格中得到任何信息，即 =（1）/（1+1 （1-）=1/2，进入者进入的期望利润为（1）

45、+（1-）（-1）=2-10,不进入的期望利润为0,因此,不进入是最优的。 )5( l上述均衡被称为“混同均衡”(pooling equilibrium),因为两类在位者选相同的价格。 l现在证明，若1/2，精炼贝叶斯均衡是：低成本者选p=4，高成本者选p=6；进入者选择不进入，若观测到p=4（基于）；选择进入，若观测进入，若观测到p=6或 p=5(基于 ). l先考虑低成本者的策略。给定进入者的后验概率和策略，若低成本者选p=4，进入者不进入，其利润是 6+9=15；若选单阶段最优垄断价格p=5，进入者进入，其利润为9+5=14，故选p=4是最优的。考虑高成本者的策略。若高成本

46、者选p=4，进入者不进入，他的利润是 2+7=9;若他选单阶段垄断价格p=6，他的利润是7+3=10, 故选p=6是最优的。 0)4( 2/1)5( , 1)6( l上述均衡称为“分离均衡”（separating equilibrium）,因为两类在位者选不同的价格，尤其是，低成本者选非单阶段最优价格p=4，高成本者选单阶段最优垄断价格p=6。因为若低成本者选单阶段垄断价格p=5，他将无法把自己与高成本者区分开，进入者将进入，但若他选p=4，高成本者不会模仿，进入者不进入，因此，低成本者愿放弃3单位的现期利润以换取4单位的下期利润。高成本不选择p=4，因为他的成本太高，下阶段4单

47、位的利润不足以弥补现期5单位的损失。该均衡中，进入者的实际进入决策与完全信息相同（在位者是高成本时进入，低成本时不进入）；不完全信息带来的后果是：低成本在位者损失18-15=3个单位的利润，可看成是他为证明自己是低成本而支付的“认证费用”。各种均衡概念之间的关系 l 从某种意义上说，根据博弈条件的不但复杂化，后一种从某种意义上说，根据博弈条件的不但复杂化，后一种均衡都是前一种均衡在新条件下的扩展，前一种均衡只是均衡都是前一种均衡在新条件下的扩展，前一种均衡只是后一种均衡在原条件下的特例，或者说，前一种均衡只是后一种均衡在原条件下的特例，或者说，前一种均衡只是后一种均衡的子集。

48、后一种均衡的子集。 l 从各种不同的均衡概念中，可以得到一个极其重要的启从各种不同的均衡概念中，可以得到一个极其重要的启示：政治领域实行垂直领导，下级必须服从上级，因此，示：政治领域实行垂直领导，下级必须服从上级，因此， “上有决策，下有对策上有决策，下有对策”是完全错误的。但是，经济领域是完全错误的。但是，经济领域实行横向联系，彼此平等互利，因此，实行横向联系，彼此平等互利，因此，“你有决策，我有你有决策，我有对策对策”是理所当然的。是理所当然的。 l占优对占优对 l策均衡策均衡公共信息公共信息重复剔除重复剔除占优均衡占优均衡纯策略纳什纯策略纳什均衡均衡混合纯策略混合纯策略

49、纳什均衡纳什均衡子博弈精练子博弈精练纳什均衡纳什均衡贝叶斯纳什均衡贝叶斯纳什均衡精练贝叶斯纳什均衡精练贝叶斯纳什均衡 l1. 两家计算机厂商A和B正计划推出办公信息管理系统。两厂商可开发的管理系统有高速、高质（H）和低速、低质两种（L）。市场研究表明各厂商在不同策略下相应的利润由如下的收益矩阵给出。厂商B HL 厂商AH30，3050，35 L40，6020，20 l （1）如果两厂商同时做出决策且使用极大化极小（低风险）策略，结果将是什么？ l （2）假设两厂商都试图最大化利润，且A先开始计划并实施，结果会怎样？如果B先开始，结果又会如何？ l2. 北方航空公司和新华航空

50、公司分享了从北京到南方冬天度假胜地的市场。如果它们合作，各获得500000元的垄断利润，但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利900000元。 l（1）将这一市场用囚徒困境的博弈加以表示。 l（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。 l 3. 给定两家酿酒企业A、B的收益矩阵如下表： l表中每组数字前面一个表示B企业的收益，后一个数字表示A企业的收益。 l（1）求出该博弈问题的均衡解，是占优策略均衡还是纳什均衡？ l（2）存在帕累托改进吗？如果存在，在什么条件下可以

51、实现？福利增量是多少？ l（3）如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡？如何改变上述A、B企业的收益才能使该博弈不存在均衡？（北京大学2002研） A企业白酒啤酒 B企业白酒700，600900，1000 啤酒800，900600，800 l 7. 假设有两个游戏者A和B，他们分别代表两家企业，生产不同的部件，但生产的部件在型号选择上有“大”、“小” 之分。若一家企业选择的型号为“大”，另一家企业选择的型号为“小”，则会发生不匹配的问题。只有当两家企业选择的型号匹配时，才会有均衡。下表给出了这一合作博弈的形式。 B企业大小 A企业大2，2-1，-1

52、小-1，-11，1 l（1）假设企业A先走一步，企业B的策略选择有多少种？写出A和B的策略组合及相应的收益矩阵。 l（2）在这些策略组合中，有无纳什均衡？如有，哪些是？ l（3）将上述策略组合写成广延型（扩展型）博弈形式，并求出子博弈完美纳什均衡。 l1. 两家计算机厂商A和B正计划推出办公信息管理系统。两厂商可开发的管理系统有高速、高质（H）和低速、低质两种（L）。市场研究表明各厂商在不同策略下相应的利润由如下的收益矩阵给出。厂商B HL 厂商AH30，3050，35 L40，6020，20 l （1）如果两厂商同时做出决策且使用极大化极小（低风险）策略，结果将是什么？ l （

53、2）假设两厂商都试图最大化利润，且A先开始计划并实施，结果会怎样？如果B先开始，结果又会如何？ l2. 北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作，各获得500000元的垄断利润，但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利900000元。 l（1）将这一市场用囚徒困境的博弈加以表示。 l（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。 l3. A、B两企业利用广告进行竞争。若A、B两企业都做广告，在未来销售中，A企业可以获得20万元利润，B企

54、业可获得8 万元利润；若A企业做广告，B企业不做广告，A企业可获得 25万元利润，B企业可获得2万元利润；若A企业不做广告， B企业做广告，A企业可获得10万元利润，B企业可获得12万元利润；若A、B两企业都不做广告，A企业可获得30万元利润，B企业可获得6万元利润。 l （1）画出A、B两企业的支付矩阵。 l （2）求纳什均衡。（北京大学1995年研） l4. 博弈的收益矩阵如下表： l（1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、 h之间必然满足哪些关系？（尽量把所有必要的关系式都写出来） l （2）如果（上，左）是纳什均衡，则（1）中的关系式哪些必须满足？ l

55、（3）如果（上，左）是占优策略均衡，那么它是否必定是纳什均衡？为什么？ l （4）在什么情况下，纯战略纳什均衡不存在？（北京大学 2000年研）乙左右甲上a，bc，d 下e，fg，h l 5. 给定两家酿酒企业A、B的收益矩阵如下表： l表中每组数字前面一个表示B企业的收益，后一个数字表示A企业的收益。 l（1）求出该博弈问题的均衡解，是占优策略均衡还是纳什均衡？ l（2）存在帕累托改进吗？如果存在，在什么条件下可以实现？福利增量是多少？ l（3）如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡？如何改变上述A、B企业的收益才能使该博弈不存在均衡？（北京大学20

56、02研） A企业白酒啤酒 B企业白酒700，600900，1000 啤酒800，900600，800 l6.在纳税检查的博弈中，假设A为应纳税款，C为检查成本， F是偷税罚款，且CA+F；S为税务机关检查的概率，E为纳税人逃税的概率；不存在纯战略纳什均衡。 l（1）写出支付矩阵。 l（2）求混合策略纳什均衡。 l 7. 假设有两个游戏者A和B，他们分别代表两家企业，生产不同的部件，但生产的部件在型号选择上有“大”、“小” 之分。若一家企业选择的型号为“大”，另一家企业选择的型号为“小”，则会发生不匹配的问题。只有当两家企业选择的型号匹配时，才会有均衡。下表给出了这一合作博弈的形式。 B企业大小 A企业大2，2-1，-1 小-1，-11，1 l（1）假设企业A先走一步，企业B的策略选择有多少种？写出A和B的策略组合及相应的收益矩阵。 l（2）在这些策略组合中，

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第八章博弈论（续）

文档简介

温馨提示

最新文档

评论

第八章 博弈论（续）

文档简介

温馨提示

最新文档

评论

相关文档

第八章博弈论（续）