(概率论与数理统计专业论文)不完全信息价值研究及应用.pdf_第1页
(概率论与数理统计专业论文)不完全信息价值研究及应用.pdf_第2页
(概率论与数理统计专业论文)不完全信息价值研究及应用.pdf_第3页
(概率论与数理统计专业论文)不完全信息价值研究及应用.pdf_第4页
(概率论与数理统计专业论文)不完全信息价值研究及应用.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(概率论与数理统计专业论文)不完全信息价值研究及应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西南交通大学硕士研究生学位论文第1 页 摘要 当今世界,信息在日常生活中扮演了相当重要的角色,因而利用博弈 模型分析信息的构成与价值是一件很有意义的事情。 若将信息当作一个整体,在某个具体的博弈中,该博弈包含了很多信 息,但是这些信息往往并不为参与博弈的人所知,或者只知道其中的一小 部分,这就是信息的不完全。不完全信息会影响博弈的局势发展乃至均衡 支付。因而研究不完全信息的价值就很关键。由于信息总是与博弈的支付 相关,故信息函数的定义中必然有支付这个参数。同时由于很多博弈都要 进行多次,每一阶段博弈的结束必然意味着信息的一次交换,信息被“更 新 了,这里利用贝叶斯公式即可解决信息更新的问题。那么,更新的信息 会对博弈的局势发展产生什么样的影响呢? 参与博弈的局中人的利益又会 发生怎样的变化呢? 已有的研究基本上都是基于以上讨论展开的,但目前 为止该部分的研究并没有进行系统地描述以及完善,而且都局限于零和博 弈,非零和博弈中的信息价值问题研究却很少见,这些都是本文要考虑的 问题。 本文展开如下:首先介绍了研究不完全信息所需要的博弈的基本理 论,并对如何处理信息并将信息模型化给出了相关介绍,现有能查到的文 献中有两种处理方法:一是将信息划分成一个一个的小区间,某个具体博 弈所包含的信息就包含在一个小的区间里;一是定义了一个随机的信息框 架。由于现实中的很多博弈参与者大都对其所处局势了解不够充分( 对方 的可能采取策略、效用函数等等) ,也就是说这些博弈都属于不完全信息 博弈的范畴。故需要利用海萨尼转换,引入了“自然”这个特殊的参与者, 从而找到博弈的均衡点。本文还系统描述了不完全信息价值的相关理论, 指出了零和博弈中什么样的函数才能称之为信息函数,这类信息函数的特 征是什么等等,并完善了相关定理的证明;同时还给出了一定条件下不完 全信息重复博弈中信息函数的相关性质。 在系统讨论了不完全信息博弈中的信息价值函数后,本文对生活中常 西南交通大学硕士研究生学位论文第1 i 页 见的经济现象讨价还价问题作了一定的讨论,同时定义了讨价还价问题中 两类模型下的信息价值函数,并通过“货比三家”的博弈模型证明了信息的 优势:在买家了解到足够的信息后,其所获得的收益会增加,信息提高了 买家的收益,这就是信息价值的魅力所在。 关键词:博弈,不完全信息,划分,信息函数 西南交通大学硕士研究生学位论文第1 i i 页 a b s t r a c t n o w a d a y s ,i n f o r m a t i o np l a y sa ni m p o r t a n tr o l ei no u rd a i l yl i f e ,8 0i t i sas i g n i f i c a n tw o r kt om e a s u r et h ev a l u eo fi n f o r m a t i o nb yu s i n gm o d e lo f b a y e s i a ng a m e i fw ec o n s i d e ri n f o r m a t i o na sa w h o l e ,f o re x a m p l e ,i nag a m ew i t hm u c h i n f o r m a t i o n ,p l a y e r sm a yk n o wn o t h i n ga b o u tt h eg a m e ,o ro n l yap a r to fi t , t h a ti si n c o m p l e t ei n f o r m a t i o n i n f o r m a t i o nw i l la f f e c tt h ep l a y e r s b e h a v i o r , t h u st h ei n f o r m a t i o no ft h eg a m ea f f e c t si t se q u i l i b r i u mp a y o f f s a sa r e s u l t , o u rr e s e a r c ho nh o wt om e a s u r et h ev a l u eo fi n f o r m a t i o ni sv e r yc r u c i a l a s t h ev a l u eo fi n f o r m a t i o ni sa l w a y sc o m b i n e dw i t hp a y o f f s ,s oo u ri n f o r m a t i o n f u n c t i o n sm u s th a v et h ep a r a m e t e r a n dt h e r ea r em a n yr e p e a t e dg a m e s ,i n e v e r ys t a g et h ee n d i n go fg a m em e a n st h ep l a y e r se x c h a n g et h e i ri n f o r m a t i o n , i no t h e rw o r d s ,t h e i ri n f o r m a t i o ni s “u p d a t e d t h e r ew eo n l yn e e db a y e s i a n f o r m u l at os o l v et h ep r o b l e mo f “u p d a t e di n f o r m a t i o n w i t hn e wi n f o r m a - t i o n ,h o wt om e a s u r et h ec h a n g e so ft h es i t u a t i o n ,a n dh o wt om e a s u r et h e c h a n g e so ft h ep l a y e r s g a i n ,e t c r e c e n tr e s e a r c hi sb a s e do ns u c hd i s c u s s i o n s o nt h ew h o l e ,b u tt h e s er e s e a r c h e sd o n th a v ep e r f e c tv e r i f i c a t i o na n ds y s t e m - a t i c a ld e s c r i p t i o n f u r t h e r m o r e ,m a n yw o r ko n l yc o n s i d e rz e r o - s u mg a m e s , s c h o l a r ss e l d o mw o r ko nt h ev a l u eo fi n f o r m a t i o ni nn o n - z e r o - s u mg a m e s t h ep a p e ri so r g a n i z e da sf o l l o w s f i r s tw ei n t r o d u c es o m ei m p o r t a n t d e f i n i t i o n sa n dt h e o r i e so fg a m et h e o r y , a n dt h e ni n t r o d u c et h em e t h o d so f h o wt om o d e lt h ei n f o r m a t i o n :( i ) i n f o r m a t i o ni sp a r t i t i o n e di n t od i s j o i n tc e l l s , a p l a y e ri si n f o r m e do ft h ec e l lc o n t a i n i n gt h er e a l i z e ds t a t e ;( i i ) c o n s t r u c t i n g as t o c h a s t i ci n f o r m a t i o ns t r u c t u r e ,a n dt h i ss t r u c t u r ed e t e r m i n e st h es e to f p o s s i b l es i g n a l sa n dt h ep r o b a b i l i t yo fe a c hs i g n a lg i v e nas t a t e t h e r ea r e m a n yg a m e sw i t hi n c o m p l e t ei n f o r m a t i o n ,i no r d e rt of i n dt h ee q u i l i b r i u m 西南交通大学硕士研究生学位论文第页 p o i n t s w eu s eh a r s a n y it r a n s i t i o na n d a d das p e c i a lp l a y e r “n a t u r e w - ea l s o d e s c r i b et h et h e o r yo fi n c o m p l e t ei n f o r m a t i o na n df i n i s ht h ev e r i f i c a t i o no f r e l a t e dt h e o r y i nt h em e a n t i m e ,w ea l s og i v eo u tt h ep r o p e r t i e so fi n f o r m a t i o n f u n c t i o n sw i t hs o m ec o n d i t i o n si nr e p e a t e dg a m e s w ed i s c u s st h eb a r g a i n i n gp r o b l e ma tt h ee n d ,a n dg i v eo u ts o m ei n - f o r m a t i o nf u n c t i o n si nt w ot y p i c a lm o d e l 8 ,t h e nb yt h em o d e lo f “c o m p a r i n g g o o d si nt h r e es h o p s ,w ep r o v e t h ea d v a n t a g e so fi n f o r m a t i o n :t h em o r ei n f o r - m a t i o nw i l li n c r e a s et h eb u y e r sg a i n ,t h i si st h ee n c h a n t m e n to ft h er e s e a r c h o nt h ei n f o r m a t i o nv a l u e k e yw o r d s :g a m e ;i n c o m p l e t ei n f o r m a t i o n ;p a r t i t i o n ;i n f o r m a t i o nf u n c - t i o n s 西南交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅 和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论 文。 本学位论文属于 1 保密口,在年解密后适用本授权书; 2 不保密团,使用本授权书。 ( 请在以上方框内打“4 ) 学位论文作者签名:杠字 日期:淞;2 4 指导老师签名:搠秀之 日期:0 0 1 珥 西南交通大学学位论文创新性声明 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所 得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体 已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中作了明确的说明。本人完全意识到本声明的法律结果由本人承担。 本学位论文的主要创新点如下: l 、在前人的基础上,总结和完善了两人零和博弈中的信息价值研究,并完 善了相关定理和引理的证明; 2 、在已有理论基础上将信息价值研究推广到讨价还价博弈,分别定义了讨 价还价博弈中具备一方信息和两方信息时的信息价值函数,并通过“货 比三家的信息价值模型,讨论了讨价还价博弈中信息价值函数具有的 性质,同时考察了具体的两个讨价还价博弈中的信息价值。 西南交通大学硕士研究生学位论文第1 页 第1 章绪论 本文关于不完全信息价值的研究属于博弈论( g a m et h e o r y ) 的范畴,博弈 论【1 】可以被定义为对智能的理性决策者之间冲突与合作的数学模型的研究。博弈 论为分析那些涉及两个或更多个参与者且其决策会影响相互间的福利的局势提供 了一般的数学方法。就此而论,博弈论为社会科学各分支的学者和实际的决策者 提供了非常重要的视角,而信息在参与者制定相关决策的过程中扮演着相当重要 的角色,但日常生活中,人们往往不能掌握对方的所有相关信息,因而所掌握信 息的多少往往会影响其所得,这就是本文的研究意义所在。 1 1博弈论的由来 博弈论【2 】是矛盾和合作的规范研究,是系统研究决策主体的行为发生直接相 互作用情况下的决策以及这种决策均衡时的理论。1 9 9 4 年著名的博弈论专家海萨 尼在获得诺贝尔经济学奖时这样定义博弈论:博弈论是关于策略相互作用的理 论,其中每个局中人对自己行动的选择必须以他对其他局中人将如何反应的判断 为基础。早在两千多年前,孙武的后代孙膑运用了孙子兵法为田忌谋划赛马策 略,巧胜齐王,史称田忌赛马,这是博弈论思想成功应用的一个案例,而孙子 兵法就不仅是一部军事著作,而且算是最早的一部博弈论专著。古代具有博弈 思想的故事还有很多,诸如背水一战、围魏救赵、狡兔三窟等等;博弈在现代生 活中的应用更是常见,如商场谈判、与人讨价还价、如何制定生产计划等等。 博弈论【3 】【4 】是一个分析工具包,它被设计用来帮助人们理解所观察到的决策 主体相互作用时的现象,其思想的主要特征是每一个参与的局中人所实施的行为 方案相互依存,各方在冲突或合作后所实现的损益得失结果不仅取决于自己所采 用的行动方案,同时也依赖于其他局中人所实施的行为方案,是各局中人行为方 案组合的函数。但是若要求博弈论能够完全刻画真实的世界,注定是徒劳无功 的。确切地说,博弈论是一种很好的思考工具,可以对现实的客观世界进行非常 西南交通大学硕士研究生学位论文第2 页 近似的描述。就象并不完美的力学是自然科学的哲学和数学一样,博弈论是社会 科学的力学和数学。没有牛顿力学我们连最简单的物理现象都无法理解;同样的 道理,没有博弈论我们也无法分析很多现实的社会现象。 近代博弈理论的形成可以说是始于策墨 洛( z e r m e l o ,1 9 1 3 ) 5 、波雷 尔( b o r e l ,1 9 2 1 ) 、冯诺依曼( y o nn e u m a n n ,1 9 2 8 ) 6 的工作,以及冯诺依曼与摩 根斯特恩( m o r g e n s t e m ) 合著的伟大的奠基性著作博弈论与经济行为( t h e t h e o r yo fg a m e sa n de c o n o m i cb e h a v i o r ) 【7 】:它引入了可以对冲突加以数学分 析的想法,并且他们还提供了相应的术语。2 0 世纪五六十年代是博弈论研究、发 展的重要阶段。著名的经济学家兼数学家纳什【8 】【9 】在1 9 5 0 年和1 9 5 1 年发表的两篇 文章中明确提出了著名的“纳什均衡”这一基本概念,揭示了博弈论与经济均衡之间 的内在联系,对博弈研究的发展起了巨大的推动作用。泽尔滕( s e l t e n ,1 9 6 5 ) 将纳什均衡的概念引入到动态分析,提出了“子博弈完美纳什均衡”的概念;海萨 尼则将不完全信息引入博弈论的研究,提出了“贝叶斯纳什均衡”的概念。这些重 大贡献,使得博弈论的发展和完善在一些关键性环节上取得了突破。由于纳什、 泽尔滕、海萨尼三人在博弈论及其在经济应用方面的突出贡献,他们共同荣获 了1 9 9 4 年的诺贝尔经济学奖。博弈论作为经济学科分支的地位得到了最权威性的 肯定。在2 0 世纪9 0 年代末,已经开始用博弈论来设计拍卖机制。在我国,经济学 界对经济博弈论的关注和兴趣也在迅速增强。可以说,博弈论正把经济学的发展 推向一个崭新的阶段。 博弈论在现实生活中有着广泛的应用【1 0 】【l l 】【1 2 】【13 】【1 4 】【1 5 】,如经济、政治、法 律、生物以及计算机科学。事实上,在经济学及其实践中,处处都体现了博弈论 的思想。特别是在经济学研究中,博弈论更是占据着主导地位。同时我们还知道 在现代企业管理中博弈论有着极为重要的意义:它的研究成果可直接运用于现代 企业的经营决策之中。在市场经济条件下,企业之间的竞争日益加剧,行业内的 竞争逐渐表现为几个大型集团之间的直接对抗,企业在这种情况下的经营总体战 略和一般战略决策必须在充分掌握竞争对手信息和策略的情况下进行。因此,企 业运用博弈论中的决策模型进行这些问题的决策将使决策过程更加合理化,它对 现代企业管理观念和方式的改变有着重要的指导意义。 西南交通大学硕士研究生学位论文第3 页 1 2 不完全信息价值研究的发展情况 在上世纪7 0 年代,当经济学家们开始将注意力集中于研究具有理性 行为、但只拥有有限信息的个体时,信息就成了许多模型的焦点。当个 体行为受到重视后,他们采取行动的时间顺序也开始被明确地结合了进 来。这一添加开始使得博弈开始具备足够的结构,从而可以得到有趣 的且始料不及的结果。重要的”工具箱式”的文件包括早已问世但久未得 以应用的泽尔滕( s e l t e n ,1 9 6 5 ) 【1 6 】关于完美性( p e r f e c t n e s s ) 以及海萨尼 ( h a r s a u y i ) 【1 7 】关于不完全信息( i n c o m p l e t ei n f o r m a t i o n ) 的文章,包括泽 尔滕( 1 9 7 5 ) 【1 8 l 以及克瑞普斯和威尔逊( k r e p s & w i l s o n ,1 9 8 2 b ) 【1 9 】对完美 性加以扩展的文章,还包括克瑞普斯、米尔格罗姆、罗伯茨和威尔逊 ( k r e p s ,m i l g r o m ,r o b e r t s & w i l s o n ,1 9 8 2 ) 【加j 关于不完全重复信息博弈的文 章。 近十几年来,出现了较多的研究信息价值的文章,这些文章主要 从信息入手,定义了信息框架”的概念,并给出了具体问题中的信息函 数:g i l b o 瘌l e h r e r ( 1 9 9 1 ) 【2 1 】讨论了具有状态空间的一个分划的决策者问题, 即该决策者所了解到的信息只是对他所处的状态空间分划后的其中一部 分。不同的分划决定了不同的均衡支付。对于任意的分划,与支付联系 起来的函数就称之为信息价值函数。g i l b o a 和l e h r e r 研究了与贝叶斯模型想 结合后该类函数存在的条件。k a m i e n ( 1 9 9 0 ) 2 2 】和b a s s e n ( 1 9 9 9 ) 【2 3 】讨论了 非零和博弈中参与者可能会丢弃与支付无关的信息,因为这样他们的均 衡支付可能会更高一些。a u m a n n 和m a s c h l e r ( 1 9 9 5 ) l 矧介绍了具备不完全 信息的重复博弈,g o s s n e r 2 5 和m e r t e n s ( 2 0 0 1 ) 2 6 比较了具备不完全信息零和 博弈中的不同的信息框架,类似的文章参见l e h r e r 和r o s e n b e r g ( 2 0 0 3 ) 【2 7 】, 主要考察了一次性零和博弈的信息函数。e h u dl e h r e r 和d i n a hr o s e n - b e r g ( 2 0 0 4 ) f 2 8 j 将g i l b o a 和l e h r e r ( 1 9 9 1 ) 的理论加以拓展,讨论了两种类型 的信息框架:一方的和两方的( 但是相互独立) ,并考察了两种类型下基于分 划的信息函数的存在性问题,这些研究主要是在零和重复博弈中展开的。y a r o n 西南交通大学硕士研究生学位论文第4 页 a z r i e l i 和e h u dl e h r e r ( 2 0 0 5 ) 2 9 基:- :b l a c k w e l l ( 1 9 5 1 ,1 9 5 3 ) 删【3 1 】提出的信息框架 的序化工作讨论了随机的信息框架问题,并给出了定义在随机信息框架上的函数 特征。总的来说,关于信息价值的研究基本都局限在零和博弈的范畴,而非零和 博弈中的价值研究则很少见。 1 3本文的主要工作 由于信息在决策中扮演了极为重要的角色,因而关于信息研究方面的文献还 有很多 3 2 1 3 3 3 4 3 5 3 6 ,本文沿用了a u 咖( 1 9 7 6 ) 【3 7 】的观点将信息模型化( 信息 框架) ,并用函数度量其价值,该函数即可称之为信息价值函数。目前主要参考 的文献【2 8 】【2 9 】对于信息框架的处理一般采用两种方式:一是将信息框架分“块”, 局中人所了解到的信息只是其中一块中的内容;一是将该框架看作是随机的。本 文的信息处理均采用的是第一种方式。 本文结构如下:首先给出本文将要涉及到的一些基本概念、重要名词以及相 关符号解释;其次会介绍关于不完全信息价值的研究所得到的一些基本成果,指 出了什么样的函数才能被称之为信息价值函数,信息函数又是如何体现出信息的 价值的,这类函数又有一些什么性质,并且还证明了相关定理;再次将结合经济 生活中最为常见的讨价还价问题,对其中的信息价值的度量加以讨论,定义了该问 题中的信息价值函数,并通过“货比三家”的博弈模型证明了信息的优势,同时还 举例说明了信息价值的应用过程。一般地,在讨价还价的过程中,参与该博弈的 决策者对所处的局势( 比如某件商品) 都有一个估价,在某个范围内顾客会接受 商家的报价,若对方报价高于顾客价格的最高限制,则交易失败;反之,若顾客 给出的价格低于商家能接受的最低价格,交易同样宣告失败。而在该过程中,双 方对彼此关于该商品的信息实际上就是实现了一次交换,“更新”了信息。信息的 更新必然会影响交易双方的所得利益,这个利益重新分配的过程可以由信息函数 来度量,而该问题中的信息函数应该同参与博弈的局中人的估价有一定的联系, 它所体现的正是信息对博弈所起的推动作用。若某决策者所了解的信息越多,对 其所处的局势了解的更为充分,应当来说对其谈判更为有利。因而信息的量化 ( 信息价值) 研究就显得较为重要了。 西南交通大学硕士研究生学位论文第5 页 第2 章不完全信息价值研究的理论基础 2 1 博弈的基本要素 一个博弈中必不可少的要素【3 2 】【3 9 】包括:局中人( p l a y e r s ) 、行动( a c t i o n s ) 、 信息( i n f o r m a t i o n ) 、策略( s t r a t e g i e s ) 、支付( p a y o f f s ) 、结果( o u t c o m e ) 和均衡 ( e q u i l i b r i u m ) 。对一个博弈的描述至少必须包括局中人、策略和支付;而行动与 信息则相当于建筑材料。局中人、行动和结果合起来称为博弈的规则( r u l e so f t h eg a m e ) ,我们的最终目的在于运用博弈的规则来确定均衡。 局中人( p l a y e r s ) 局中人指作决策的个体( 决策者) ,如个人、厂商、国家等。每个局中人 的目标都是通过选择行动来最大化自身的效用。有时还可以引入虚拟局中人 ( p s e u d o - p l a y e r s ) ,他们以一种纯机械般的方式来采取行动。自然就是一种虚拟局 中人,它在博弈的特定时点上以特定的概率随机选择行动。 行动( a c t i o n s ) 局中人i 的行动或活动以啦表示,是他能做的某一选择。局中人i 的行动 集( a c t i o ns e t ) ,a = 口i ) ,是其可以采用的全部行动的集合。一个行动组合 ( a c t i o np r o f i l e ) 是一个由博弈中的佗个局中人每人选取一个行动所组成的有序 集,口= 0 i ) ,( i = 1 ,佗) 。 信息( i n f o r m a t i o n ) 信息是以信息集( i n f o r m a t i o ns e t ) 的概念来模型化的,可以将局中人的信息 集看作是他在特定时点对于不同变量的取值的了解。信息集的要素包括局中人认 为的可能的不同值。若信息集有很多元素的话,则表明存在局中人无法排除的许 多取值。若它只有一个元素,则表明他准确知道变量的取值。当然局中人的信息 集随着博弈的进程而变化。 策略( s t r a t e g i e s ) 西南交通大学硕士研究生学位论文第6 页 局中人i 的策略s t 是如下一项规则:给定其信息集,该策略决定在博弈的每一 时点他选择何种行动。其策略集( s t r a t e g ys e t ) 或策略空间( s t r a t e g ys p a c e ) 鼠= s i ) 是其可行策略的集合。策略组合( s t r a t e g yp r o f i l e ) s = ( 8 1 ,8 n ) 是由博弈 的n 个局中人每人选择一个策略所组成的一个有序集。既然行动包括了局中人对于 其他参与人过去行动所知的一切,那么策略就使局中人明确了如何对别人的行动 做出反应。这里要说明的是,行动是物质上的,但策略仅仅是意识上的。 例如,“人不犯我、我不犯人; 里,“犯”与“不犯”是两种不同的行动。 选择“不犯”。 支付( p a y o f f ) 人若犯我、我必犯人”是一种策略。这 策略规定了什么时候选择“犯”,什么时候 局中人i 的支付7 r i ( 8 1 ,s n ) 意味着: ( 1 ) 在所有的局中人和自然都选择了各自策略且博弈已经完成之后,局中 人i 获得的效用。 ( 2 ) 局中人i 获得的期望效用,该期望效用是局中凡以及其他局中人所选择 的策略的函数。 上述两个定义是有所不同的。但在博弈论的很多文献中,“支付”既被用作指 实际支付,也被用作指期望支付。它到底指什么在具体的场合下将不是一个问 题。 结果( o u t c o m e ) 一个博弈的结果是指在博弈结束后,建模者从行动、支付和其他变量的取值 中所挑选出来的他所感兴趣的要素的集合。 均衡( e q u i l i b r i u m ) 均衡s = ( s ;,s :) 是指由博弈中的n 个局中人每人选取的最佳策略所组成 的一个策略组合。 均衡策略( e q u i l i b r i u ms t r a t e g i e s ) 是指局中人在最大化各自支付时所选择的 策略。这一点与每个局中人随便选择一个策略所形成的许多可能策略组合是不同 的。博弈中所理解的均衡与在经济学的其他领域中所理解的均衡不同。例如在一 般均衡模型中,均衡是指由经济中每个人的最优行为所导致的一组价格。但在博 西南交通大学硕士研究生学位论文第7 页 弈论中,这样一组价格被称之为均衡结果( e q u i l i b r i u mo u t c o m e ) ,而均衡指的则是 产生这一结果的策略组合,即每个人如何买卖的规则。 2 2 博弈论的基本假设 经典的博弈论一般有三个基本假设: ( 1 ) 局中人是理性的; 局中人是理性的,是因为他们选择能够最好地满足自己偏好的行动,即力图 使自身效用最大化。理性的个人对每一件事情都有偏好,例如面包好于烧饼,烧 饼加蜂蜜好于面包加黄油,摇滚乐好于古典音乐等等。当面临多种选择时,我们 还可以设置偏好序。 ( 2 ) 局中人有这些理性的共同知识; 局中人是理性的,这是参与博弈的局中人都了解到的信息。所谓“共同信 息”就是指“所有局中人知道,所有局中人知道所有局中人知道,所有局中人知道 所有局中人知道所有局中人知道”的知识。 ( 3 ) 局中人知道博弈规则。 博弈论总是在一定的经验性原则( 或规则) 假设下进行研究的,博弈论并不 研究它们是怎样来的,而总是假设他们是给定的。 2 3 不完全信息 博弈按信息的了解程度还可分为完全信息和不完全信息博弈:局中人对所有局 中人的策略空间及策略组合下的支付等有充分了解称为完全信息;反之,则称为 不完全信息。不完全信息意味着不完美信息( 自然的选择不可观察) ,但逆命题 不成立。完美信息即为在任何时点,当只有一个局中人行动并且他知道所有先前 的行动时,那么说这个博弈有完美的信息。 西南交通大学硕士研究生学位论文第8 页 2 3 1 不完全信息博弈的定义 一个具有不完全信息的博弈就是这样的一个博弈:在局中人能够开始计划 他们在博弈中的行动的初始时间点上,某些局中人就已经具有关于这个博弈不为 其余局中人所知道的私人信息,有时也称之为贝叶斯博弈。例如,在简单摊牌博弈 中,如果局中人1 在知道博弈中抽牌做何用处的实际规则之前就已经抽出一张牌并 看到了它,那么这个博弈就成为不完全信息博弈了。具有不完全信息的博弈时常 出现于现实情形中。我们经常要研究的局势是,其中各种局中人当前已经拥有了 他们久已了解的私人信息,而将博弈的起点定义在他们知道他们的私人信息之前 的某过去时点有可能是不自然的。更何况,一个局中人私人信息的某些部分对他 来讲是如此的基本,以致在他知道这个信息( 例如关于该局中人的性别、母语及 风险厌恶水平等信息) 之前讨论他的行动毫无意义。因此,我们应该允许一个局 中人在他开始计划其博弈行动的初始时点上,可能已经具有某些私人信息。一个 局中人在这个时点上所具有的初始私人信息被称为该局中人的类型( t y p e ) 。 下面给出不完全信息博弈的经典例子【4 1 】:非对称信息下的古诺竞争。 考虑如下的古诺双头模型。其中市场需求函数由p ( q ) = a q 给出,这 里q = q l + q 2 为市场中的总产量。企业1 的成本函数为a ( q 1 ) = c q l ,不过企 业2 的成本函数以口的概率为q ( q 2 ) = c h q 2 ,以1 一口的概率为q ( q 2 ) = c l q 2 ,这 里c l c l - i 。并且信息是不对称的:企业2 知道自己的成本函数和企业1 的成本函 数,企业1 知道自己的成本函数,但却只知道企业2 边际成本为c 日的概率为p ,边际 成本为c l 的概率为1 一p ( 企业2 可能是新进入这一行业的企业,也可能刚刚发明一 项新的生产技术) 。上述一切都是共同知识:企业1 知道企业2 享有信息优势,企 业2 知道企业1 知道自己的信息优势,如此等等。 自然地,企业2 的边际成本较高时和较低时,它希望生产的产出水平是不同的 ( 一般而言,前一种情况时的产出要更低一些) 。企业1 从自己的角度,也会预测 到企业2 根据其成本情况将选择不同的产量。用虻( 明) 和虻( c l ) 分别把企业2 的产量 选择表示为成本的函数,并令甜表示企业1 的单一产量选择。如果企业2 的成本较 西南交通大学硕士研究生学位论文第9 页 高,它会选择虻( 锕) 满足: 扣唑【( 口一口:一q 2 ) 一c h q 2 ( 2 - 1 ) y j 类似地,如果企业2 的成本较低,q 苎( 钆) 应满足下式: n ! 聱 ( 口一q :一q 2 ) 一e l q 2 ( 2 - 2 ) y y 最后企业1 知道企业2 成本较高的概率为p ,并应该能预测到企业2 的产量选择 将分别为虻( c 日) 或虻( c l ) 。从而企业1 选择满足下式的酊 m 。a x e ( a 9 1 一醛( 钮) ) 一c 】9 1 + ( 1 一口) 【( 口一q l 一谚( c 五) ) 一c 】口1 ( 2 - 3 ) 以使期望的利润最大化。 上面三个最优化问题的一阶条件分别为 q ;( c l - 1 ) = 宇 ( 2 - 4 ) 虻( 钇) = 宰 扣坠堂止业争坠剑 假定这些一阶条件可以决定上述最优化问题的解。 三个一阶条件构成的方程组的解为 日) = t a - 2 c h + c + 字一吼 ( 2 - 5 ) ( 2 - 6 ) ( 2 7 ) 菘( 钇) = 芈一昙( 钾一吼 ( 2 - 8 ) :竺堡唑嬖业(2-9)qi = _ = = - 二二 j 把这里的g 主( c 日) 、畦( c l ) 、酊与成本分别为c 1 和c 2 的完全信息古诺均衡相比较,假 定c 1 、c 2 的取值可使得两个企业的均衡产量为正,在完全信息的条件下,企业1 的 产出为酊= ( n 一2 臼+ c j ) , 3 。然而与之不同的,在非完全信息条件下,醛( 啊) 要高 于( 口一2 c h + c ) 3 ,口主( 钆) 却低于( 口一2 e l + c ) 3 。之所以会出现这种情况,是 因为企业2 不仅根据自己的成本调整其产出,同时还将考虑到企业1 的情况选择最 西南交通大学硕士研究生学位论文第1 0 页 优反应。例如,如果企业2 的成本较高,它就会因成本较高而减少产量,但同时又 会生产稍多一些,因为它知道企业1 将根据期望利润最大化的原则决定产出,从而 要低于企业1 确知企业2 成本较高时的产量。 2 3 2 不完全信息博弈的标准描述 不完全信息博弈按采取行动的顺序又可以分为静态贝叶斯博弈和动态贝叶斯 博弈,静态博弈指参与者同时采取行动,或者尽管参与者行动的采取有先后顺 序,但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈指参与者 的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行 动。本节将分别给出静态和动态贝叶斯博弈的标准描述。 1 静态贝叶斯博弈 首先给出不完全信息的关键因素,不完全信息博弈与完全信息博弈的最重要 区别就在于博弈中至少有一个局中人不能确定另一局中人的收益函数,因此令局 中人i - 7 能的收益函数表示为u ( a l ,a n ;t i ) ,其中t i 称为局中人i 的类型,它属于 一个可能的类型集( 也可称为类型空间) 正,每一类型t t 都对应于局中人i 的不同 的收益函数的可能情况。我们将非完全信息同时行动博弈称之为静态贝叶斯博 弈,即该博弈中局中人是同时选择行动的。 在定义局中人的类型后,说局中人i 知道自己的收益函数也就等同于说局 中人i 知道自己的类型,类似地,说局中人i 可能不确定其他局中人的收益函 数,也就等同于说局中人i 不能确定其他局中人的类型,其他局中人的类型 用t i = 【t l ,t i 一1 ,t i + 1 ,亡n ) 来表示,并用卫i 表示t t 的所有可能的值的集 合,用概靴 一i t , ) 表示局中人在知道自己的类型是t i 的前提下,对其他局中 人类型( t 一) 的推断。当然局中人之间的类型也可以是相互独立的,这种情况 下p i ( t - tl t , ) 与t i 不相关。 下面给出静态贝叶斯博弈的标准式描述。 定义2 3 1【3 9 l 一个n 人静态贝叶斯博弈的标准描述包括:局中人的行动 空间a l ,a n ,他们的类型空间乃,死,他们的推断p 1 ,砌以及他们的收 西南交通大学硕士研究生学位论文第1 1 页 益函数u 1 ,牡n 。局中人t 的类型作为局中人i 的私人信息,决定了局中人z 的 收益函数,啦( 口1 ,a n ;t d 并且是可能的类型集乃中的一个元素。局中人i 的推 ( t - i 慨) 描述了i 在给定自己的类型t ,时,对其它死一1 个局中人可能的类型t t 的 不确定性。这里用g = a 1 ,- a n ;t 1 ,死;p 1 ,p n ;u l ,) 表示这一博 弈。 根据海萨尼( 1 9 6 7 ) 的假定,静态贝叶斯博弈的时间顺序如下:( 1 ) 自然 赋予博弈各方的类型向量t = ( t l ,t n ) ,其中t i 属于可行集觚; ( 2 ) 自然告知 局中人i 自己的类型t i ,却不告诉其他局中人的类型;( 3 ) 局中人同时选择行动, 每一个局中人i 从可行集a 中选择a i ; ( 4 ) 各方得到收益u i ( a l ,;t i ) 。借助 于第一步和第二步中虚构的参与者“自然”的行动,可以将一个非完全信息的博弈 描述为一个非完美信息的博弈,其中非完美信息的含义是在博弈的某些行动中, 行动方不知道这以前的博弈进行的整个过程。因为第二步自然告知了局中人i 自己 的类型,却没有告知局中,在第三阶段局中选择行动时,j 就不知道整个的 博弈进行过程。 静态贝叶斯博弈中还有两个技术性较强的问题,这里一并给出。第一,在有 的博弈中,局中人t 不仅对他自己的收益函数掌握私人信息,还享有其他局中人 收益函数的私人信息。例如将非对称信息古诺模型加以修改,使两个企业成本情 况完全一致,但一个企业掌握市场需求水平,另一企业却不清楚。由于需求水平 可以影响两个企业的收益函数,知道市场需求的企业的类型用就进入了另一企业 的收益函数。在n 个局中人的博弈中,我们允许局中人t 的收益不仅决定于行动组 合( 口1 ,o n ) ,还决定于所有的类型( t 1 ,厶) ,从而包含了这一可能的情况, 并据此把收益函数表示为u t ( a l ,a n ;t l ,t n ) 。 第二个技术性问题涉及到推 一t i t ) 。假定在静态贝叶斯博弈时间顺序的 第一步,即自然根据先验的概率分布p ( t ) 赋予各局中人类型向量t = ( t l ,亡n ) , 是共同知识。当随后自然告知局中人t 的类型t 时,他可以根据贝叶斯法则计算其 他参与者类型的条件概率,得出推断p i ( t - i 陬) : 地) = 帮5 哉 ( 2 - 1 0 ) 西南交通大学硕士研究生学位论文第1 2 页 而且对于乃中的每一个岛,都- i p a 计算出a ( t - i l t d 。在前面讨论了局中人的类 型相互独立的情况,这时纯( t - i i t l ) 不再依赖于如,但仍得自先验分柳( t ) ,这种情 况下,其他局中人知道局中人i 对他们类型所持有的推断。 我们知道局中人的战略是关于行动的一个完整计划,包括了局中人在可能会 遇到的每一种情况下将选择的可行行动。在给定的静态贝叶斯博弈的时间顺序 中,自然首先行动,赋予每一局中人各自的类型,局中人i 的一个( 纯) 战略必须 包括局中人i 在每一可行的类型下选择的一个可行行动。 定义2 3 2【】在静态贝叶斯博弈 g = a 1 ,厶;丑,死;p x ,p n ;u l ,t ,1 ) 中,局中人i 的一个战略是一个函数以( t d ,其中对丑中的每一类型t i ,黾( 也) 包含了 自然赋予i 的类型为t i 时,i 将从可行集a 中选择的行动。 不同于( 静态及动态的) 完全信息博弈,在贝叶斯博弈的标准式描述中没有 给出局中人的战略空间。作为替代,在静态贝叶斯博弈中战略空间可从类型空间 与行动空间中构建:局中人i 的可行的( 纯) 战略集& 是定义域为正,值域为a t 的 所有可能的函数集。 在给出了贝叶斯博弈中关于战略的定义之后,下面定义贝叶斯纳什均衡,其 中心思路是:每一局中人的战略必须是其他局中人战略的最优反应,亦即贝叶斯 纳什均衡实际上就是在贝叶斯博弈中的纳什均衡。 定义2 3 31 3 9 1 在静态贝叶斯博弈 g = a 1 ,a n ;乃,;p l ,;t 正1 ,) 中,如果对每一局中人i 及对i 的类型集五中的每一如,s :( 蠡) 满足 口m a 气x 一磊姒s 孔“) ,8 h o “) “如“l s 瓢卜纵t - “如卜 则称战略组合s = ( s i ,8 二) 是一个纯战略贝叶斯纳什均衡。 一个有限的静态贝叶斯博弈( 即博弈中扎是有限的, 并 且( a l ,厶) 和( n ,死) 都是有限集) 必然存在贝叶斯纳什均衡,尽管可 能包含混合策略。 西南交通大学硕士研究生学位论文第1 3 页 2 动态贝叶斯博弈 在非完全信息博弈中,局中人属于何种类型被假定为由“自然”赋予的概率而 确定,所谓信念实际上是先验信念。在不完全信息动态博弈中需要局中人在观察 到上一周期的行动之后“适当地修正”关于对手类型的信念统计学中称之为后 验信念,而这种后验信念可以通过b a y e s 法则得到解决。 这里给出不完全信息动态博弈中的均衡概念:完美b a y e s 均衡。下面给出一 些相关条件【4 1 】: r l :在每一个信息集,在该集中具有行动的局中人关于博弈到达信息集中的 哪一个结必须有一个信念。对于非单结信息集,信念是信息集中各个结上的概率 分布。至于单结信息集,信念则以概率1 于单决策集上。 r 2 :在给定的信念下,局中人的策略必须是序贯理性的,也就是说,在每一 个信息集,应该行动的局中人所采取的行动( 以及局中人往后的行动) 在给定该 局中人在该信息集上的信念与其他局中人以后的策略下必须是最优的。 兄1 与兄的作用已经显示出来,作为对均衡精炼的要求,r 1 与冗2 坚持局中人 必须有信念并且在这些信念下采取最优行动。可是它们没

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论