(应用数学专业论文)具有随机影响的动态对策研究.pdf_第1页
(应用数学专业论文)具有随机影响的动态对策研究.pdf_第2页
(应用数学专业论文)具有随机影响的动态对策研究.pdf_第3页
(应用数学专业论文)具有随机影响的动态对策研究.pdf_第4页
(应用数学专业论文)具有随机影响的动态对策研究.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(应用数学专业论文)具有随机影响的动态对策研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

攘要 摘要 本文主要研究的是对策中的随枕简题。针对扩展型对策、图土对策和微分对策 三种不同类型的对策,对如何引入随机因素进行了讨论和研究。通过引入随机矩阵 来描述随视影响,并给出了相应的算法以及详缨的示铡和阐述。 本文中的第一章中主要研究的是有限扩震型对策,针对非合作、完全合作和韶 分合作三种不同的合作情况,分别引入随机矩阵并建立了相应的算法并给出了详细 的示例。针对非合作情形下具有随机影响的扩展型对策中子对策精炼纳什均衡通常 不存在豹原因徽出特别说明并给出特定情况下存在的充分性条件。 第二章首先定义了如何将传统对策拓展至有限连逶匿上,嫒究了这种胬的圈上 对策绝对均衡的存在性和相应的算法。通过建立具有权向量的图上对策并引入随机 矩阵,在给出完整的算法之后透过具体的图上对策的示例进行了分桥和展示。最后, 对具有随机影响的图上对策通常不存在绝对均衡的原因进行了研究和特别说明。 第三章主要播述随机微分对策。在微分对策的基础上逶过雩 入随规矩阵( 随枕 协方差矩阵) 来描述随机影响,随后讨论了解的形式并给出了证明。最后通过一个 小的镳子来阐述随机微分对策的应用。 关键词:随机影响;随机矩阵;图上对策;权支付向量;绝对均 衡 a b s t r a c t a b s t r a c t i nt h i sp a p e r , w em a i n l yr e s e a r c ht h es t o c h a s t i cp r o b l e m f o c u s i n go ng a m e si ne x t e n s i v ef o r m , o nc o n n e c t e dg r a p ha n dd i f f e r e n t i a lg a m e ,w et r yt og e tt h ew a yo fh o wt oi n t r o d u c es t o c h a s t i c e l e m e n t s b yi n t r o d u c i n gt h e s t o c h a s t i cm a t r i xt od e s c r i b et h es t o c h a s t i ci n t e r f e r e n c e ,w e c o n s t r u c tt h ea l g o r i t h ma n dg i v ea l li l l u s t r a t i o nt oe x p l a i nt h em a i np o i n t sa tl a s t 。 o nt h ef i r s tc h a p t e 乓w em a i n l yr e s e a r c ht h ef i n i t eg a m ei ne x t e n s i v ef o r m f o c u s i n go nt h r e e d i f f e r e n tc o o p e r a t i v ef o r m s ,w h i c ha r en o n c o o p e r a t i o n ,c o m p l e t ec o o p e r a t i o na n dp a a i f l c o o p e r a t i o n ,w ei n t r o d u c et h es t o c h a s t i cm a t r i xa n dc o n s t r u c tt h ea l g o r i t h ma sw e l l a si l l u s t r a t i o n s 。 a tl a s t ,w ed i s c u s st h ee x i s t e n c eo ft h es u b g a m ep e r f e c tn a s he q u i l i b r i u mo ng a m e sw i t h s t o c h a s t i cg a m e si ne x t e n s i v ef o r m o nt h es e c o n dc h a p t e r , w ef i r s t l yd e f i n eh o wt oe x t e n dt h et r a d i t i o n a lg a m et og a m eo n c o n n e c t e dg r a p h ,a n dt h e ns t u d yt h ee x i s t e n c eo ft h ea b s o l u t ee q u i l i b r i u mo nt h i sk i n do fg a m e 。 b yi n t r o d u c i n gt h es t o c h a s t i cm a t r i xo i lg a m ew i t hw e i g h t - p a y o f f s ,w ec o n s t r u c tt h ea l g o r i t h m a n di l l u s t r a t i o n s a tl a s t ,w ee x p l a i nt h ee x i s t e n c eo ft h ea b s o l u t ee q u i l i b r i u mo ng r a p h 。g a m e w i t hs t o c h a s t i ci n t e r f e r e n c e t h el a s tc h a p t e rm a i n l yd e s c r i b e st h ed i f f e r e n t i a lg a m e 。o nt h eb a s eo ft h ed i f f e r e n t i a lg a m e , w ej n t r o d u c es t o c h a s t i cm a t r i xa sw e l la ss t o c h a s t i cc o v a r i a n c em a t r i xt od e f i n et h es t o c h a s t i c e l e m e n t s ,a n dt h e nd i s c u s st h ef o r mo ft h es o l u t i o n a tl a s t ,w es h o wt h ea p p l i c a t i o no ft h e s t o c h a s t i cd i f f e r e n t i a lg a m eb ya na p p l i c a b l ee x a m p l e k e yw o r d s :s t o c h a s t i ci n t e r f e r e n c e ;s t o c h a s t i cm a t r i x ;g a m e0 1 1g r a p h ; w e i g h t - p a y o f f ;a b s o l u t ee q u i l i b r i u m 青岛大学硕士学位论文 学位论文知识产权权属声明 i 本人在导师指导下所完成的学位论文及相关的职务作品,知识产权归属学校。 学校享有以任何方式发表、复制、公开阅览、借阅以及申请专利等权利。本人离校 后发表或使用学位论文或与该论文直接相关的学术论文或成果时,署名单位仍然为 青岛大学。 本学位论文属于: 保密口,在 年解密后适用于本声明。 不保密吼 论文作者签名:易 别磴轹翻铆 婚,mq ( 本声明的版权归青岛大学所有, ( 请在以上方框内打“) b 盼、函p 是草 5 氐b日期:力of 年么月多曰 日期沙9 年月多日 未经许可,任何单位及任何个人不得擅自使用) 引言 一- _ - 一 引言 对策论( g a m et h e o r y ) ,又称为博弈论或者赛局理论,诞生于2 0 世纪的中叶, 其奠基人为冯诺伊曼( v o nn e u m a n n ) 和莫根斯特恩( m o r g e n s t e r n ) 。这是一门以 严格的数学模型来研究和规范描述人与人之间利益相互制约下策略选择时的理性行 为以及相应结局,并在统一框架下加以严整的数学分析的理论,是一门年轻而极富 生命力的学科。 时至今日,对策论已经成为一门独立的学科,其涵盖的范围极广,当中所涉及 的学科包括:数学、运筹学、统计学、经济学、金融学、市场学、管理学、工程学、 生物学、政治科学等等,可是说得上是包罗万象,应有尽有。譬如,从军事上的战 机与导弹的最优控制,到商业上的市场拓展与资源开采的最优策略,或从国家的宏 观政策与外交到企业的投资与资本管理,都可以应用到对策论。 根据对策论的标准说法,如果一个决策情况存在多于一个决策者并存的追求各 自的目标,这个决策情况便可称为对策或博弈。而对策论所研究的是,在这些决策 情况当中,找出每位决策者的最优决策和这些最优决策所构成的每个可能结果以及 这些结果的相关特性。 在对策论的研究和应用范畴中,动态对策是最为艰深而又成果颇丰的,而合作 的闯题在动态的环境中更为复杂和困难。当前的环境中充满着动态的合作情况,包 括世界贸易谈判、境内境外的投资、跨国的污染控制、市场的共同开拓与整合、技 术和科学的研究、地方合作和军备消减等等。这些动态的合作问题,不单涉及每个 人和社会在未来的繁荣和稳定,更将决定人类文明的未来方向。如何在动态的环境 中合作可以说是人类当前最重要的问题之一。 现实的世界不仅是动态的,更是变幻无常的,正是沧海桑田、阴晴圆缺这些随 机发展,为决策增添了许多不确定性。这些随机因素使得对策的复杂性大为增加, 比决定性的情况远为难解。 在现实的环境中,无论花费多少人力物力,搜集了多少过去和现在的资讯,未 来仍是不可知的。在传统的决定性对策研究中,信息的完全性和完美性的要求以及 对策进程中诸多固化的因素和前提假设使得对策模型与实际应用存在着相当大的差 距,为了去除某些特定的局限性,在对策中考虑到随机因素的影响就成为十分重要 的问题。 随机影响在不同内容的对策中可能代表不同的因素,例如:在农作物生产中, 随机因素可以是雨水的多寡、气温的变化;在经济活动中,随机因素可以是政策的 变化、资源供应的情况;此外,诸如自然灾害、意外事故等不可预料的因素也都可 以纳入随机影响的范畴。 1 青岛大学硕士学位论文 对策的进程中不断出现的随机因素的变化都有可能影响到参与对策局中人的支 付结果,进而影响到局中人策略的选择。由于未来的不可知性,局中人仅仅能知道 已经发生和当前阶段正在发生作用的随机影响,但是却不能预见到未来可能发生的 随机影响。 随机因素在对策中的研究始于最近几年厂由俄罗斯圣彼得堡大学的彼得罗相教 授和他所领导的学派成员进行了关于合作随机微分对策的研究,进行了对于有外部 随机作用情况下复杂的冲突控制系统内合作过程的数学及信息计算机模拟。 2 0 0 7 年出版的由香港浸会大学的杨荣基教授和俄罗斯圣彼得堡大学的彼得罗相 教授合著的动态合作尖端博弈论:较诺奖贡献更复杂的解法与数式一书中, 用较多的篇幅介绍了他们对随机问题的认识和理解以及相关的研究成果。 我们的研究路线与圣彼得堡国立大学的同行是基本一致的,至少在目前,国内 尚未出现与我们的研究领域相近的研究工作。确切地说,由于我们目前的参考资料 和思维发散始点来源于国际最新发表的对策论研究成果,本题目所选择的切入点是 直接来自于彼得罗相教授的提议,从这种意义上来说,我们所做的工作在国际上也 是领先的。 2 第一章具有随机影响的扩展型对策的值 第一章具有随机影响的扩展型对策的值 1 1 具有随机影响的非合作扩展型对策的值 1 1 1 引言 我们通过在对策树的节点处引入影响矩阵来描述和研究随机因素给对策进程带 来的影响,不同性质的矩阵会给对策带来不同种类的影响。例如:全部元素为正的 对角形矩阵不会改变局中人的决策;准对角形的矩阵可能诱导局中人之间产生某种 隐性的合作,虽然没有构成联盟,局中人也没有采用合作对策的分配方式,但是在 基于各自利益的前提下,局中人可能会参与这种隐形的合作,期望获得某种意义下 的“双赢”结果。通过考察具有不同性质的矩阵,我们期望得到更为贴近现实的对 策模型,同时拓展到更深入的研究领域和层次中去。 1 1 2 符号和定义 设r ( ;u ( ) ;q ( ) ) 是一个具有随机影响的有限扩展型对策,其对策树记为 k ( 矗) 。k ( x o ) 是以x o 为根的有限扩展型对策树。石是树k ( 矗) 上的任意节点,k ) 表示以z 为根的k ( x o ) 的对策子树,z ( x ) 表示z 的所有正向直接后续节点构成的集 合,在节点x 处作决策的局中人用i ( x ) 表示。n = 但2 ,咒】- 表示所有局中人的集合, u 表示局中人i 的策略集合。q ( x ) 表示任意决策节点x 处的一个,l ,z 阶的影响矩阵, 它可以表示来自于外界的对于给定对策在节点x 处所施加的随机影响,正在进行决 策的局中人可以知道在决策节点处出现的q ( ) ,但是不知道任何后续节点处将要出 现的q ( ) 。k 叩 ) 表示以x 为根并仅仅受到来自矩阵q o ) 影响的对策子树,即局 中人在子树k 雄0 ) 中所进行的预测是在假定后续节点处的q ( ) 均是对于对策进程 不会产生影响的单位矩阵。没有任何随机影响的情况下( 原) 对策树各终端节点处 的局中人支付向量记为日( ) = 他( ) ,吃( ) ) ,对策进行到第k 步时局中人在节点 z m 处在子树k q ( x k - l o “) 考虑到q o “) 的影响而预测到的终端节点y 处的终端支 付向量记为彬k 。( y ) = ( 嘭- l l ( y ) ,h ;- 1 n ( y ) ) 。 3 青岛大学硕士学位论文 定义1 1 1 称具有下列特征的对策为具有随机影响的扩展型对策,并记为r q ( ) , 它满足: ( 1 ) 对策树k ( ) 的所有节点可分为疗+ 1 个子集e ,最,昂只+ 。,它们构成节点集 合的一个剖分,这里z p ,i - - - 1 ,2 ,l 是局中入z 的决策节点,节点z 只+ ,为终端节 点。 ( 2 ) 在每一个节点x 霉,i = l ,2 ,z 处都伴随一个拧,z 阶的矩阵q ( z ) ,它表示在 x 处可能来自外界的随机影响,设f 2 ( x o ) 为单位矩阵。 ( 3 ) 在子树k 0 ) 中,正在进行决策的局中人f 0 ) 知道q ( z ) ,并且仅仅依据q 0 ) 的影响预测子树k q 。o ) 中的各终端节点处局中人的支付。 ( 4 ) 设石z ( y ) ,k q 0 ) 和k o ( r ( y ) 的终端节点集合分别为q 和尺,显然 q 尺。假设局中人在k q 7 ( y ) 中对于终端节点珊q r 处支付的预测结果为 日, ) ; ,。 ) ,h ” ) ) ,规定影响矩阵q o ) 对于局中人在k q 。o ) 中对终端节点 处支付的预测结果胃, ) 产生的影响按下式计算: 也( 鲫) = 厅,q 定义1 1 2 称对策树k ) 上最长路径的长度,即:最长路径上所包含的节点的个 数,为对策i 瓴) 的长度。 命题1 1 1 元素非负的对角形随机矩阵不会改变对策的最优路径。 证明:设对策子树k q 。0 ) 长度为掰,z z o ) , q ( 工) = k l 0 0 k 2 o 0 o 0 砖 ,句2 0 , i 一】 ,l 在对策子树k q 。( 砷中,f ( 曲知道q ( 石) ,并且仅仅根据q 的影响预测子树 k q 。0 ) 中的各终端节点处的支付。 4 第一章具有随机影响的扩展型对策的值 设k 叩0 ) 的终端节点集合为o ,f oj = q 。局中人在k 蛳( y ) 和k 叩o ) 中对终 端节点哆处支付的预测结果分别为h ,( ) 和以( 哆) ,这里哆q ,= 1 ,q , h ,( ,) = ,( ,) q ) = 。h y ,( ) ,k n h y n ( ) ) 设k 叩( y ) 的最优路径为i ( y ) = ( y , x ,z 1 ,x 4 ) ,关于扩展型对策的逆推归纳法求 解方法本文不再详述。下面证明k 叩 ) 的最优路径为i ( 工) = ( 工,z 1 ,z “) 。 由于i ( ) ,) = ( y ,工,z 1 ,z ”) ,所以有 勺啦一) 0 ”) j z ( ) ( ) 对于v 哆q ,z ”哆,歹= 1 ,q 。 又因为t ( 一) 苫o ,故 k i ( x _ t ) h 帅一) 0 2 ) 苫七胪- 1 ) 勺- 1 ) ( q ) 因此局中人i 一1 ) 在k q “g ) 中的节点x ”1 处的选择与他在k q ( y ) 中节点石”1 处的选择是一致的。同理可证,在x ”2 处,局中人在k q 。o ) 中的选择与在k ( y ) 中是一致的。类似地,上述逆推过程进行到节点z 处,一我们得到子树k q ( j ) g ) 的最优 路径为i ( z ) = ( x ,工1 ,z “) 。命题证毕。 1 1 3 具有随机影响的非合作扩展型对策值的算法 设r ( ;【,( ) ;q ( ) ) 是一个具有随机影响的长度为丁+ 1 的扩展型对策。其中 n = 仉2 ,l 】是所有局中人的集合,阢是局中人f 的策略集合,q ( ) 是定义在对策 树的每个决策节点处的n ,z 阶矩阵。本文中我们假设最优路径是唯一的,关于路径 不唯一的情形,将在稍后给出说明。区别于扩展型对策通常采用的逆推归纳法求解 方法,针对具有随机影响的扩展型对策,最优路径的获得将具有在逆推归纳预测的 基础上进行“正向 推导的特征。 第1 步:从对策的初始节点开始,考察对策树kq ( 而) 。 5 青岛大学硕士学位论文 根据假设q ( ) 一,在初始节点处由局中人f ( ) 进行决策,局中人f ( ) 终端 节点处支付的预测结果为: 戤( ) = h ( ) q ) = 日( ) 根据终端支付i - i l x o ( ) 的预测结果,利用决定性扩展型对策求解所采用的逆推归 纳法确定k q 知( ) 的最优路径为产粕 。) ;( x o ,五1 ,z 1 ) ,0s 朋。5t ,在最优路径的 终点处局中人将获得的支付结果为n 即1 畦) 。 第2 步:沿最优路径尹如) ,考察以节点# 为初始节点对策子树k q 爿( 爿) 。 局中人依据q ( ) 对未来的支付进行预测,并假定后续节点处的f a ( ) 均是对于 对策进程不会产生影响的单位矩阵( 以后不再说明) ,终端节点处支付的预测结果变 为: t t 2 ( ) = 戤( ) q “) 利用决定性扩展型对策求解所采用的逆推归纳法,确定k q ( 叫“) 的最优路径为 i q 。d “) = “,石:2 ,2 ) ,0sm ,st ,在最优路径的终点处局中人将获得的支付结果 为n 。2 j ( x 。2 。) 。 若x ;只+ 1 ,则对策的求解进程结束。r q ( ) 的最优路径为产= o 。,x 。i ,x ;) ,对 策的值为0 ;) 。若石;诺只+ 1 ,则继续上述求解进程。 第k 步:沿最优路径i q ( 嘏一- :2 ) 考察以节点k ,- ,1 为初始节点的对策子树 k q ( 制:) 。 局中人依据q 似k 一- 。1 ) 对未来的支付进行预测,终端节点处支付的预测结果变为: n 圳k ( ) = 日一k - 1 ( ) q “k 一- 1 1 )o 1 。上一2 根据决定性扩展型对策求解所采用的逆推归纳法,r a j 碇k q 础( :) 的最优路径 为尹制“k 一- ,1 j 气吒k 圳- 1 ,k 一) ,0 1 ) 的情况, a r g m a x m s q ( 捌) 瓴) ( 或a 唱枷n 历女【制) 瓴) ) 中 1 4 第一章具有随机影响的扩展型对策的值 任取一个节点将不会对结果产生影响。最终,在对策子树k q 列饿k 一- 。1 ) 的起点k 一- 。1 处 我们可以得到联盟s 的特征函数值v q 搿 ) = m 删t 制) ) ,节点x 2 即是对策子树 k q 蒯k 一- 1 1 ) 的起点k 一- 1 i 。 定理1 2 1 具有随机影响的有限扩展型完全合作对策的特征函数满足超可加性,即 v q 卜( su r ) 2 ,q ( s ) + y q p ( r ) v x e t ,0 sts ,如果f ) su r ,贝j j i ( x ) e s 或者i ) 尺。不妨设i ( x ) e s 而 咄p ,倒飘瓮 其中一。1 a r g m a xm q t - c ) l , 纯) ,瓦f 卜1 。又因为i ( x ) 琏尺,记 。 卅憾m - i 。黜萋 其中y 卜1 a r g m a x 历q ( t - i , t ) ,r 。同样因为 吨酬p ,= 良肌x t 瓯q 芑p n + 。l 其中z ,- 1 a r g m a x历q t - 1 瓴) ,黾丁卜1 。显然有 磁卧) ) + 咄( ) ) s 蝶恤q ( ) o ) y 鲫( s ) = 肌之( ) o ) ,即得特征函数的超可加性。同理可证当i ( x ) 尺以及 1 5 青岛大学硕士学位论文 1 2 4 具有随机影响的部分合作扩展型对策值的算法 与完全合作不同,部分合作是合作对策的一种更普遍的形式,事实上,部分合 作又可分为固定联盟结构、单调增联盟结构和任意变化联盟结构三种。其中,固定 联盟结构的部分合作对策是在对策开始之前已经给定的一种联盟剖分,在对策进行 的过程中,联盟结构不会发生变化:单调增联盟结构的部分合作对策是在对策进行 的过程中随着对策的发展进行,越来越多的局中人愿意加入某个联盟进行合作,但 一旦局中人加入了某个联盟那么在对策的以后进程中都不能离开这个联盟;任意变 化联盟结构的部分合作对策是指,在对策的任意阶段,联盟的结构都可以发生变化, 在对策树上体现为不同节点处的联盟结构剖分可以任意变化,避免的对联盟形式的 限制。与前两种相比,最后一种部分合作无疑是这三种部分合作形式中最贴近现实 的一种形式,但同时又是分析和计算最为困难的一种,关于具有变化联盟结构的动 态对策的主要文献见参考文献川。三者的相同之处在于在对策开始之前,各个阶段 处的联盟结构即局中人的剖分是所有局中人的共同信息。 在本文中,我们所研究的部分合作形式为最具代表性的任意变化联盟结构。在 这种合作形式下,局中人按照最大化其所在联盟的整体收益为行动准则,其支付向 量定义为: 定义1 2 1 设n = 扎2 ,_ r z 是部分合作对策g ( ;v 卧( ) ;q ( ) ) 的所有局中人的集 r 合,针对任意的联盟剖分虬= 住,s ,这里厂 ,l ,墨7 1 s = 彩,i - ,vs = , 一 如果用瓯( ) 表示第k 个联盟,同时针对每个联盟s ( ) ,k = l , r 在联盟& ( ) 内部使用 s h a p l e y 值来分配联盟所获得的收益,然后按照局中人由1 到,z 的顺序将上述的分配 结果重新排列成一个甩维向量,即p m s ( ) 一( p m s i ( ) ,p m s ( ) ) ,称之为部分合作 对策g ( ;v q ( ) ;q ( ) ) 的p m s 向量。 第1 步:从对策的初始节点开始,考察对策树k q 而( ) 。 根据假设f 2 ( x o ) = i ,在初始节点处由局中人i ( ) 进行决策,局中人i ( ) 终端 节点处支付的预测结果为: 破( ) = h ( ) q ) = h ( ) 根据终端支付h ,( ) 的预测结果,局中人最大化其所在联盟的收益,然后利用x 文献h 1 中求解部分合作对策所采用的逆推归纳法确定k q ( 却( x o ) 的最优路径为 1 6 第一章具有随机影响的扩展型对策的值 i - q ( x o ) ) = ,# ,式) ,o m 。s 丁,在最优路径的终点处支付结果为磁皑) 。局 中人的实际收益按照p m s 向量分配: 。p m s o ( x o ) ( x o ) 一( 膦) ,p m s y ( x 。) ) , 其中删忸。) 为局中人i 于节点处所在联盟的s h a p l e y 值的分量,即: m 砰) = 铲( 足) ) ,i e s k ( x 。) 。 第2 步:沿最优路径尹知 。) ,考察以节点爿为初始节点对策子树k q “) 。 局中人依据q ( # ) 对未来的支付进行预测,并假定后续节点处的q ( ) 均是对于 对策进程不会产生影响的单位矩阵( 以后不再说明) ,终端节点处支付的预测结果变 为: h 三( ) = 日三( ) q ( 霹) 局中人最大化所在联盟的收益,利用逆推归纳法,确定k q 】j “) 的最优路径为 i q w “) = “,x :2 ,) ,os sr ,支付结果为h ,2 j 眩) 。局中人的实际收益按照 p m s 向量分配: - p m s q # 饼) = ( m 钟葺“) ,p m s 。爿甜) ) , 其中用峨q 耐( # ) 为局中人i 于节点处所在联盟的s h a p l e y 值的分量,即: 删“) = 萨茸 “) ) ,f s “) 。 若只+ l ,则对策的求解进程结束。r q ) 的最优路径为铲一瓴,彳,工:2 ) ,对 策的值为删爿“) 。若隹只+ 1 ,则继续上述求解进程。 第k 步:沿最优路径i q ( 三) 考察以节点k 一- 。i 为初始节点的对策子树 k q x k - 1 ,、晚k j ) 。 局中人依据q 饼:) 对未来的支付进行预测,终端节点处支付的预测结果变为: 哎j ( ) = 嘲( ) q “k 一- 。1 )。量l“i 2 局中人最大化所在联盟的收益,利用逆推归纳法,确定k q ( 崭:) 的最优路径 1 7 青岛大学硕士学位论文 为更- q ( e , - 1 ) k - 1 ) = :,k 一。) ,0 是a 后的图上节点的集合, ) , 的终端状态。 定义2 2 1 在图d = 翟,v ,y ,矽) 中,链0 ,气 ,拉毛; ;,气) 称为图d 的从气 到气的条路。 定义2 2 2 一条路被称为一个餍,如果它或者是无限的,或者包含了状态节点 4 ,e a ,。所有剩余的路被称为开局。 定义2 2 3 图上,1 人对策r ( d ) ;“,v ,w ,墨,s ) 具有下列性质: ( 1 ) 对状态节点集合a 的一个剖分包含n + 王个子集:4 ,幺,矗,4 + ,其中 a e 4 ,i 一1 2 ,靠称为局中人i 的决策节点,以+ ,= a i 为终端节点。 ( 2 ) 若是r ( d ) 中从麒,到口,的条弧,a ,7 ,( 蹿,) ,则局中人在k 上的权支付 向量为吃帆) = ( 1 ( ) ,。,嵫( 吒羚,其中吨以,) 为第f 个局中入在石上的权支付。以 下简记= 吼眈) ( 3 ) 状态节点a 。处作决策的局中人记为i ( a 。) ,i ( a 。) 根据最大化个体利益( 非合 作对策) 鲮其所在联盟幂| 益( 合作对策) 的原芡l 做出决策。 在本文中,我们规定图上无逆向弧,即对策中的某一时刻或阶段的选择可以指 尚未来、指向现在,但绝不可能回到过去,帮所谓的“历史 。 定义2 2 4 若 ,露2 ,q ) 是图上对策r ( d ) 的一条路,毋4 ,显然q ,口:,g 为 r ( d ) 的一个局,则称珂一维向量 矗以t ,口z , 口,) 2 荟磁似+ 1 ) 2 以t ,口:,胡,) ,。,h n ( a l , a 2 , , a l ” 羚r ( d ) 上对应于震a l , a :,。,吩的权一局支舒翔量,称其第i 个分量 岛0 l ,口2 ,a ,) ,i = l 2 ,捏为对应于局寤i ,拉2 ,a j 局中人z 的权一局支付。 定义2 2 5 按如下方式定义子集c ac _ a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论