(测试计量技术及仪器专业论文)贝叶斯博弈信息融合模型及其算法的研究和应用.pdf_第1页
(测试计量技术及仪器专业论文)贝叶斯博弈信息融合模型及其算法的研究和应用.pdf_第2页
(测试计量技术及仪器专业论文)贝叶斯博弈信息融合模型及其算法的研究和应用.pdf_第3页
(测试计量技术及仪器专业论文)贝叶斯博弈信息融合模型及其算法的研究和应用.pdf_第4页
(测试计量技术及仪器专业论文)贝叶斯博弈信息融合模型及其算法的研究和应用.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(测试计量技术及仪器专业论文)贝叶斯博弈信息融合模型及其算法的研究和应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研 究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人 或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集 体,均已在文中以明确方式标明。本声明的法律责任由本人承担。 学位论文作者: 裴车良盎日期:2 纠。年箩月2 多日 学位论文使用授权声明 本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。 根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部 门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州 大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、 缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学 位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑 州大学。保密论文在解密后应遵守此规定。 学位论文作者: 裴银尚 日期:矽f d 年岁月z 弓同 摘要 摘要 本文来源于国家自然科学基金项目课题。它将博弈论与信息融合理论相结 合,提出了一种信息融合模型贝叶斯博弈信息融合模型,用来解决多源信 息冲突环境下的信息融合问题;在融合模型的基础上,构建贝叶斯网络,并利 用贝叶斯网络算法中的多树传播算法,实现信息的博弈融合。最后,把建立的 融合模型和算法架构应用到高速公路不停车收费系统中,用以解决车辆身份识 别不准确问题,从而提高收费站不停车收费的有效性。 本文从基础理论入手,在介绍信息融合的定义、分类以及融合层次的基 础上,引入了信息融合的功能模型和各种融合算法。由于在竞争与合作 环境中信息间存在博弈,介绍了博弈基础理论中的博弈模型三要素,并 详细分析了通用的策略型博弈和扩展型博弈。基于以上博弈融合理论, 总结出博弈模型的基本思想,并建立博弈信息融合模型。 贝叶斯博弈主要用来解决不确定性条件下的博弈问题。首先构建贝叶斯 网络,并以贝叶斯网络结构表示博弈融合。用贝叶斯推理算法中的多树 传播算法实现具体的信息融合。在融合过程中以贝叶斯概率模型修正先 验概率。 在实际应用中,把以上模型和算法应用到高速公路电子不停车收费系统 中,用来解决车辆身份判别不准确问题。 博弈信息融合理论不仅适用于e t c ,更广泛应用在模式识别和人工智能 领域。 关键词:信息融合贝叶斯博弈车辆身份识别 a b s t r a c t a b s t r a c t t h i st h e s i ss u p p o r t e db yt h en a t i o n a ln a t u r a ls c i e n c ef o u n d a t i o n u n d e rc o m b i n g g a m et h e o r ya n di n f o r m a t i o nf u s i o n ,i tp r e s e n t sa ni n f o r m a t i o nf u s i o nm o d e lw h i c h i sc a l l e db a y e s i a ni n f o r m a t i o nf u s i o nm o d e l m u l t i s o u r c ei n f o r m a t i o nf u s i o nt h a tl i e s i nt h ec o n f l i c te n v i r o n m e n ti ss o l v e db a s e do nt h em o d e l b a y e s i a nn e t w o r ks t r u c t u r e i sc o n s t r u c t e db a s e do nt h em o d e l ,a n di n f o r m a t i o ng a m ef u s i o ni sa c h i e v e db yt h e m u l t i - t r e e p r o p a g a t i o na l g o r i t h m w h i c h b e l o n g s t o b a y e s i a n n e t w o r k a l g o r i t h m f i n a l l y ,t h ef u s i o na n da l g o r i t h mi sa p p l i e dt oe t c ,a n dt os o l v et h e p r o b l e ma b o u tt h ea c c u r a t eo fv e h i c l ei d e n t i f i c a t i o n ,t h e nt h ev a l i d i t yo fe t ci s i m p r o v e d , s t a r t i n gf r o mt h eb a s i ct h e o r yo ft h i sp a p e r , t h ef u n c t i o n a lm o d e lo fi n f o r m a t i o n f u s i o na n ds o m ef u s i o na l g o r i t h m sa r ei n t r o d u c e db a s e do nt h ei n t r o d u c t i o no f d e f i n i t i o n ,a n dt h el e v e lo ff u s i o n a st h ei n f o r m a t i o ng a m ee x i s ti nt h e e n v i r o n m e n to fc o m p e t i t i o na n dc o o p e r a t i o n ,t h r e ee l e m e n t so fg a m em o d e la r e i n t r o d u c e di ng a m et h e o r y ,a n ds t r a t e g yg a m ea n de x t e n d e dg a m ea r ei n t r o d u c e d d e t a i l l y f r o mt h e s eb a s i ct h e o r i e s ,s u m m a r i z e dt h eb a s i ci d e ao fg a m em o d e l , a n dt h eg a m ei n f o r m a t i o nf u s i o nm o d e li se s t a b l i s h e d b a y e s i a ng a m ei sm a i n l yu s e d t os o l v et h e g a m ep r o b l e mi n u n c e r t a i n e n v i r o n m e n t b a y e s i a nn e t w o r ki sb u i l tf i r s t l y t h e ng a m ef u s i o ne x p r e s s e db y b a y e s i a nn e t w o r ks t r u c t u r e s p e c i f i ci n f o r m a t i o nf u s i o ni sa c h i e v e dt h r o u g h m u l t i t r e ep r o p a g a t i o na l g o r i t h mw h i c h b e l o n g st ob a y e s i a nn e t w o r ka l g o r i t h m t h ep r i o rp r o b a b i l i t yi sa m e n d e db yb a y e s i a np r o b a b i l i t ym o d e li nt h ef u s i o n p r o c e s s i np r a c t i c e ,t h em o d e la n da l g o r i t h mi sa p p l i e di nt h ef r e e w a ye l e c t r o n i ct o l l c o l l e c t i o n s y s t e m ,t o s o l v et h ep r o b l e ma b o u tt h ea c c u r a t eo fv e h i c l e i d e n t i f i c a t i o n g a m ei n f o r m a t i o nf u s i o nt h e o r yi sn o to n l ya p p l i e di ne t c ,a n dm o r ew i d e l y u s e di np a t t e r nr e c o g n i t i o na n da r t if i c i a li n t e l l i g e n c e k e y w o r d s :i n f o r m a t i o nf u s i o n ;b a y e s i a ng a m e ;v e h i c l ei d e n t i f i c a t i o n i i 目录 目录 摘要i a b s t r a c t i i 目录i i i 1 绪论1 1 1 选题背景和研究现状1 1 1 1 选题背景一1 1 1 2 研究现状1 1 2 信息融合理论的引入2 1 3 课题来源3 1 4 本文的主要工作3 2 博弈信息融合理论分析4 2 1 信息融合的定义一4 2 2 信息融合的分类4 2 3 多源信息融合的功能模型7 2 4 多源信息融合算法9 3 多源信息融合中的博弈1 1 3 1 多源信息间的竞争和合作1 1 3 2 博弈论基础1 1 3 2 1 博弈论的概念1 1 3 2 2 博弈论的分类1 2 3 3 博弈模型分析1 3 3 3 1 博弈模型的三要素1 3 3 3 2 策略型博亦模型1 4 3 3 3 扩展型博弈模魁1 5 3 3 4 两种博弈模型的比较1 5 3 3 5 双人零和博弈中的最小最人值定理1 6 3 4 博弈信息融合的基本思想1 7 目录 3 4 1 竞争信息的融合- 1 8 3 4 2 合作信息的融合1 8 - 3 4 3 融合中心与环境和信息源间的博弈一1 9 - 3 5 博弈信息融合功能模型- 2 0 - 3 5 1 局中人提取一2 0 3 5 2 策略提取2 l - 3 5 3 支付提取2 2 - 3 5 4 态势评估2 3 - 3 5 5 过程提取2 3 3 5 6 数据库管理系统2 3 4 贝叶斯博弈信息融合及推理算法2 5 4 1 贝叶斯博弈理论2 5 - 4 1 1 不完全信息- 2 5 一 4 1 2 贝叶斯博弈的概率模型2 5 4 1 3 信号博弈2 6 4 2 贝叶斯网络的研究2 7 4 2 1 贝叶斯网络的提出2 7 4 2 2 贝叶斯网络的构造2 8 - 4 3 博弈融合的贝叶斯网络算法2 9 4 3 1 用贝叶斯网络表示博弈融合- 2 9 - 4 3 2 贝叶斯网络表示博弈融合的方法- 2 9 - 4 3 3 贝叶斯博弈信息融合推理算法3 l - 5 博弈信息融合在车辆身份识别中的应用3 7 5 1 车辆身份识别系统的研究一3 7 5 1 1 博弈信息融合在高速公路不停车收费系统中的应用概述3 7 5 1 2 射频i c 卡识别3 8 5 1 3 车辆牌照识别3 8 5 1 4 车型识别3 8 5 1 5 不停印称重3 9 - 5 2 策略型博弈融合在车型识别中的应用3 9 5 2 1 车型局中人提取4 0 - i v 目录 5 2 2 车型策略提取4 0 5 2 3 车型支付提取- 4 0 - 5 3 贝叶斯博弈信息融合在车辆身份识别中的应用- 4 2 5 3 1 车辆身份识别中的博弈模型三要素- 4 2 - 5 3 2 车辆身份识别的贝叶斯推理算法4 3 - 5 3 3 仿真结果分析4 9 6 总结与展望5 3 6 1 总结5 3 6 2 展望5 3 参考文献5 5 致谢5 7 攻读学位期间科研和发表论文5 8 v l 绪论 1 绪论 1 1 选题背景和研究现状 1 1 1 选题背景 不停车收费系统( n os t o pe l e c t r o n i ct o l lc o l l e c t i o ns y s t e m ,简称e t c ) 是 智能交通系统( i t s ) 的重要组成部分。它主要采用车辆识别技术、非接触i c 卡 技术等使得高速公路收费站收费过程自动化。 传统的电子不停车收费系统,是以设置在收费站路侧的读卡器与车载i c 卡 无线射频通信从而扣取卡内费用进行收费的。在收费过程中对车辆身份的判别, 是以读取i c 卡内的信息为依据的,由于i c 卡并不固定在车上,倒卡、换卡以 及大型车使用小型车卡大量存在,造成了误收费和错收费。因此,需要辅助的 证据对车辆身份的进一步的证实。 基于此,一些研究机构提出改进方案,如增加对车辆牌照的识别,车牌识 别的结果与i c 卡信息相比对,这在一定程度上提高了对车辆身份识别的精确度, 但由于受天气、光照等的影响,牌照识别达不到百分百的准确度。例如,国内 最先进的北京汉王公司的车牌识别系统,在各项参数调整到最佳状态时,现场 车牌识别率也只有9 6 。可以说,车辆身份的精确判定问题,已经成为我国高速 公路电子不停车收费乃至智能交通运输系统发展的瓶颈。 1 1 2 研究现状 传统的e t c 系统以车载i c 卡作为车辆身份判别的依据,首先建立相关车辆 的信息数据库,将通过高速公路机动车的车牌号码、车型、载重、金额等信息 存入车载i c 卡中,并同时存入工控计算机系统数据库中。当地感线圈和车辆检 测器检测到持有i c 卡的车辆进入收费道入口时,路侧射频识别设备在4 到l o 米的椭圆范围内发射电磁波,电子标签接收到电磁波并将其返回到射频设备, 射频设备启动读卡器读取i c 卡信息,中心控制计算机根据i c 中存储的信息读 1 绪论 取司机用户信息,并核对车载i c 卡中的信息与系统数据库信息的一致性,同时 将合法的车卡写入收费站入口编号;在出口处,系统计算机分析计算通过此路 段的费用,同时在i c 卡中扣除该费用。如果收费过程失败,如i c 卡余额不足 等,根据存入计算机中的该用户的数据信息和汽车牌照,引导该车进入人工收 费车道收费。这样以来,当车辆到达高速公路收费站入口时自动提取数据,出 口时自动扣费并放行,实现不停车收引1 1 。 当由辅助证据如车牌等确认车辆身份时,需要在读取i c 卡信息同时,启动 车辆牌照识别系统,对车辆进行牌照识别,识别结果与i c 存储车辆身份进行比 对,如二者一致则认定为合法车费,否则进行人工收费。 高速公路收费站不停车收费系统i c 卡收费示意图如图1 1 所示 一 图1 1e t c 收费站示意图 1 2 信息融合理论的引入 鉴于仅仅依靠单一信息达不到对车辆身份的精确识别,提出了博弈信息融 合的方法。博弈信息融合技术主要解决多源信息冲突环境下的信息融合问题, 在此理论体系指导下,将建立的融合模型应用到高速公路不停车收费系统的车 辆身份识别中。它通过建立博弈信息融合模型,把事先获得的非接触i c 卡中的 信息、车牌信息( 车牌号和车牌颜色) 、车型信息、和不停车称重的信息融合 一2 一 1 绪论 在一起,上述各路信息通过竞争与合作得到车辆身份的判定结果,从而共同证 实或者反证实车辆的真实身份。 1 3 课题来源 本文来源于国家自然科学基金项目:基于e t c 不停车收费背景下的信息 融合模型及算法研究( 编号:6 0 6 7 3 1 0 8 ) ,主要完成博弈信息融合理论分析, 信息融合模型的研究及部分算法的设计和实现。 1 4 本文的主要工作 本文主要是在信息融合和博弈理论的基础上,构建贝叶斯博弈信息融合模 型,用以解决存在不确定信息的多源信息环境下的数据融合问题。在融合模型 的基础上,构建贝叶斯网络结构,并利用贝叶斯网络算法中的多树传播算法, 实现信息博弈融合。最后,把建立的融合模型和算法架构应用到高速公路不停 车收费系统中,用以解决车辆身份识别不准确问题,从而提高收费站不停车收 费的有效性。 2 博弈信息融合理论分析 2 博弈信息融合理论分析 2 1 信息融合的定义 由于信息融合研究内容的广泛性和多样性,很难对其给出一个统一的定义。 事实上,信息融合是一种利用计算机技术,对来自多个信息源的多个传感器信 息,在一定准则下进行自动分析和综合,以获得单个或单类信息源无法获得的 有价值的综合信息,并完成其最终任务的信息处理技术【4 】。 在多传感器数据融合中,传感器是数据融合的硬件基础,信息源是数据融 合的对象,分析和融合以及识别是数据融合技术的核心。最简单的融合是合并 多个相同传感器的数据,这种融合可以获得较满意的解决。当传感器或其他数 据源的性质、精度和细节程度不同时,融合是相当复杂的。 2 2 信息融合的分类 多源信息融合有多中分类方法,如按照融合技术、融合结构和融合算法可 以分为不同的类别。 1 按融合技术分类 多源信息融合技术分为滤波跟踪型、假设检验型、模式识别型、聚类分析 型、人工智能型信息融合技术等。 人工智能信息技术将人工智能和计算机技术应用于多传感器信息融合,主 要用来解决不精确信息和不确定信息的融合,因而成为信息融合的重要发展方。 向。 2 按信息融合的目的分类 多源信息融合的目的可以分为检测融合、状态估计和属性识别。 检测融合的主要特征是对多传感器采集到的信息进行融合,可以消除单个 或单类传感器的不精确性,获得对检测对象更准确的认识。估计融合的主要方 法是基于多传感器采集的信息对目标运动轨迹进行估计。属性融合的主要目的 2 博弈信息融合理论分析 是基于多传感器检测采集到的信息对目标属性、类型的认知。 3 按融合判决方式分类 根据信息融合过程中数据处理中用于信号检测、目标识别的判决方式不同, 多源信息融合分为硬判决方式和软判决方式。 4 按传感器组合方式分类 在多传感器网络中,多种传感器可以完全是同类传感器的组合,也可以是 异类传感器的混合组合。 5 按融合信息类型分类 按融合信息类型区分,多源信息融合可分为数据融合和图像融合。 6 按信息融合结构模型分类 , 多源信息融合可分为集中式和分布式。 在集中式信息融合结构中,信息融合中心处理的是初始数据,每个传感器 获得的观测数据都被不加分析地传送给上级信息融合中心,融合中心对原始数 据进行联合、筛选、相关和合成处理,一次性的得到信息融合的结论。分布式 信息融合结构,每个传感器事先对原始数据进行初步分析处理,做出本地判决, 只把这种经初步分析可能存在的结论呈报给信息融合中心,融合中心在更高层 次上做进一步的相关合成处理,得到最终判决结论。 目前分布式结构是多源信息融合中常用的结构模型,它又分为四种拓扑结 构:即串行结构、并行结构、树状结构、分散式结构。 7 按信息融合处理层次分类 按系统中数据抽象的层次,多源信息融合可分为数据级融合、特征级融合、 决策级融合。 数据级信息融合直接对传感器原始观测数据进行综合和分析。其优点是数 据信息丢失或遗漏少,融合的精度最高;它的局限性是处理的数据量大,耗费 时间长,处理代价高,抗干扰能力差,且只能处理同类传感器的信息。此级别 的融合用于多源图像复合、图像分析以及同类雷达波形的合成。 特征级信息融合办称文件级信息融合,先由各传感器抽取自己的特征向量、 一5 一 2 博弈信息融合理论分析 并提供文件报告,再由融合中心完成特征向量的融合处理。其优点是既保证了 足够数量的重要信息,又实现了可容许的数据压缩,降低对通信带宽的要求, 提高了处理过程的实时性;其缺点是,由于损失了一部分有用信息,因而对传 感器预处理提出较严格的要求。 决策级信息融合先由每个传感器基于自己的数据做出决策,根据一定的准 则和每个传感器决策可信度执行综合评判,给出一个最终决策。决策级融合数 据损失量最大,融合精度最低,但其具有通信量小,抗干扰能力强,对传感器 依赖小的优点。 事实上,对于整个决策任务来说,通常划分为数据、特征、决策三个层次, 并不意味着整个处理过程仅仅涉及一种层次的融合。一个面向决策任务的融合 系统通常需要多个具体的融合步骤,面对不同的对象各个步骤采用的融合方法 自然产生不同的组合形式。 图2 1 表述了从传感器数据源出发,可能采用的融合层次的前后关系。进 行数据层融合的数据可能来自不同的传感器或者数据源,如图中的数据集j 和数 据集k ;数据层融合的结果一般是数据,可以通过算法提取相应的特征;特征层 融合的输入特征可以来自其他直接提取特征的信息源,也可能来自不同数据层 融合的结果,特征层输出可以直接输出相应的决策;决策层融合的输入为多种 局部决策,输出的结果是融合决策。 2 博弈信息融合理论分析 雾障b 数据集 i 盆l 子系统j 的特征 传感器j 2 卜l 口l l j 一磊磊i 赢一l 传感器k l 一j 数据集k 石翮 羹p 型 层i子系统k 的特征 融l 合l 特 征 层 融 a 口 其它子系统的特征 其它子系统的决策 图2 1 信息融合的结构层次模型 2 3 多源信息融合的功能模型 信息融合功能模型从融合的过程出发,描述信息融合包含哪些主要功能和 数据库,以及进行信息融合时系统的各组成部分之间的交互作用过程r 7 1 。信息融 合技术的研究者已经从不同角度提出融合系统的一般功能模型,其中最有代表 性的有用于军事领域的通用融合功能模型和j d l 功能模型。 1 通用融合功能模型 信息融合技术最早用于军事领域的,因此通用融合功能模型是针对军事领 域的应用而建立和开发的信息融合模型,主要用来说明融合系统的功能结构、 性能及其规模等【1 0 1 ,如图2 2 所示。 在图2 2 中,从融合的层次上看,探测、校准和相关主要是低层处理,主 要完成信息的预处理,对应了像素级融合和特征级融合。探测即传感器全方位 监视其负责的区域;校准进行时间和空间的坐标变换从而统一多传感器的时 空参考系;相关是判别不同时空的传感器数据是否来自同一目标。实际信息融 合在估计和识别阶段进行,是信息融合的高层,对应的是决策级融合。估计主 要是估算观测目标的各种参数;识别主要是完成目标分类和身份估计【m 】。 2 博弈信息融合理论分析 低层处理 高层处理 l 传感器探测 l “士件ui 行 卜棚一甘 数数 据 r 动 据 估 校相 i 计 - 准关 目标识别 i 传感器探测卜一 i “一”1 f 一 目标属性测量 态势评估 行为 企图 动向 低层数据 状态向量 特征属性 图2 2 通用信息融合功能模型 2 、j d l 信息融合模型 上述通用信息融合模型给出了融合过程中的基本信息流,但没有考虑融合 过程中有关的智能信息处理和信息管理等,j d l 信息融合模型很好的解决这一问 题。j d l 模型是用于指导军事信息融合处理的通用模型,该模型另一个显著特点 是具有与“总线类似的功能结构【2 0 1 ,如图2 3 所示。 数 据 源 ,一级处理、,二级处理、r 三级处理、 阐恻恻恻,一 。, 四级处理 过程评估 i墼塑壁竺型墨竺 广= := = 广= :二= 1 支持数据库j l 融合数据库i l、 图2 3j d l 数据融合模型 第一级处理的是目标评估( o b j e c ta s s e s s m e n t ) ,主要功能是数据配准、数 据关联、目标位置和参数估计,其目的是为更高层次的融合提供辅助决策信息。 也就是在这一级主要完成传感器数据坐标的一致转换,子对象位置、运动特性 和属性的事实估计等。 第二级处理的是念势评估( s i t u a t i o na s s e s s m e n t ) ,是对整个态势的抽象和 2 博弈信息融合理论分析 评定。也就是一个把目标的分布与各种性能数据联系起来的过程,并通过对对 象间相互关系的分析来表示当前环境,从而来识别事件和行动的可能发展趋势。 第三级处理是影响评估( i m p a c ta s s e s s m e n t ) ,是对当前的态势映射到未来, 即对融合的参与者设想。影响评估在军事领域指的是威胁估计,重点在于定量 的表示敌方的作战能力,并估计敌方的企图。 第四级处理是过程评估( p r o c e s sa s s e s s m e n t ) ,这是一个高级的处理阶段。 主要完成信息的主动收集和处理,判断传感器数据采集的有效性,优化任务及 分配传感器间的任务。 通常将信息处理划分为以上的四个阶段,事实上,实际系统的功能划分不 尽相同,需要根据实际情况来决定。 2 4 多源信息融合算法 自上世纪8 0 年代以来,多传感器信息融合技术成为处理批量数据和决策支 持的有效方法。信息融合技术集成了传统的学科和新的技术,从而实现了信息 融合的应用。数学工具是信息融合中最基本和多重的,它将所有参与融合的信 息在一个系统内加以描述,并进行有效的综合,最后再以适当的形式输出和表 现这些数据。应用在这个领域数学工具主要有概率论、推理网络、模糊理论和 神经网络等【4 1 。 1 概率论 概率论在融合技术中主要用来处理不确定性问题,根据概率或似然函数对 输入数据建模,在一定的先验概率情况下,根据贝叶斯规则合并这些概率以获 得输出假设的概率。贝叶斯方法的缺点是当数据是由低档传感器给出时对概率 分布的描述比较困难,并且在计算时必须假定信息源是独立的,而这个假定在 大多数情况下非常受限制。 2 推理网络 贝叶斯规则的推论就是贝叶斯网络,多用于分析复杂的推理,在渚多应用 中已经证明是处理不确定推理的标准有效方法。贝叶斯网络的优点是简洁,易 一9 一 2 博弈信息融合理论分析 于处理相关事件;缺点是当假设的先验概率与实际矛盾时,推理结果比较差。 3 模糊理论 模糊理论是基于分类的局部理论,在信息融合的应用中主要是通过与特征 相连的规则对专家知识进行建模;另一个特点是可以处理非精确描述问题,多 用于传感器融合、专家意见综合以及数据库融合。 4 神经网络 神经网络是由大量互联处理单元连接而成,它具有大规模并行模拟处理、 连续时间动力学和网络全局作用等特点,而且有很强的自适应能力,从而可以 替代复杂耗时的传统算法。 3 多源信息融合中的博弈 3 多源信息融合中的博弈 3 1 多源信息问的竞争和合作 世界上万事万物间的差异性是绝对的,相似性和相同性是相对的。在多源 信息融合系统中,信息源间的差异性是普遍存在的,因此,采集不同的信息源 获取的信息不可能完全相同,必然存在或多或少的差异。而没有差异的信息源 提供的绝对相同的信息没有融合的价值。相互差异的多源信息在融合过程中存 在竞争和合作。 “ 信息源间的竞争和合作不仅相互依赖,而且在一定条件相互转化。两个有 微小差异的信息源间原本由于不同而存在竞争,当又有差异较大的信息加入时, 原本由于微小差异而竞争的信息转向合作,共同对付差异较大的信息。原本由 于相似而合作的两信息,当与它们差异较大的信息退出竞争后,两个原本因一 致而合作的信息就会因不完全相同而竞争。可以说,竞争之中有合作,合作之 中有竞争;通过竞争达到合作,在合作之中又进行竞争。 多源信息间没有竞争就没有合作,竞争不能离开合作而存在,合作同样离 不开竞争而存在。信息间的竞争和合作,推动着融合系统的发展和优化。这与 辨证唯物主义中矛盾对立统一的观点是一致的,矛盾双方的既对立又统一是事 务内部的本质联系,又是事物发展演化的源泉和动力。冲突与合作研究的理论 基础是博弈论,它以定量分析方法研究了事物之间的竞争与合作现象【l4 1 。 3 2 博弈论基础 3 2 1 博弈论的概念 博弈论( g a m et h e o r y ) y 称为对策论,是利用数学的方法研究矛盾现象的基本 工具。现代博弈论起源于二十世纪初,5 0 年代发展为- i i 完整而丰富的理论学 科。博弈论研究的是人与人之间利益相互制约下策略选择时的理性行为及相应 结局。所谓的博弈论就是研究决策主体的行为发生直接相互作用时的决策及这 3 多源信息融合中的博弈 种决策的均衡问题【13 1 。 3 2 2 博弈论的分类 通常,博弈理论主要分为两大领域:非合作博弈理论和合作博弈理论。有 时,按照参与者获利之和的特性博弈论划分为零和( s u m z e r o ) 博弈与非零和博弈 问题。 1 合作博弈理论和非合作博弈理论 ( 1 ) 合作博弈( c o o p e r a t i v eg a m e ) 般是指若干参与者结成联盟,共同协作 争取联盟的最大利益,再进行利益内部分配的博弈。它的核心问题是利益分配, 研究人们已经达成合作之后如何分配利益。 ( 2 ) 非合作博弈( n o n - c o o p e r a t i v eg a m e ) 是指博弈的参与者之间相互独立, 决策主体完全根据自己的利益来决定自己的选择,违背自己利益的任何表示都 是不可信的。它的核心问题是策略选择,研究人们如何在利益相互影响下做出 最有利于自己的选择。 非合作博弈理论,是博弈论研究的主流领域,通常又将非合作博弈分为四 类:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信 息动态博弈。 根据博弈问题本身的信息结构,分为完全信息博弈和不完全信息博弈。完 全信息是指所有的博弈参与者对博弈整体结构和信息有完全的了解,没有任何 不确定性,需要考虑的仅仅是策略选择问题;不完全信息则指至少有一个参与 者对博弈结构的某些部分了解不充分,也就是存在着事前不确定性; 根据博弈问题本身所包含的参与人决策时序的差异,又将博弈问题分为静 态博弈和动态博弈。静态博弈指所有的博弈参与者同时选择策略,也就是说每 个参与者在选择时不知道其他人的策略选择;动态博弈则引入了决策的先后次 序,博弈参与者在进行选择时可以得到有关博弈历史的部分或全部消息。 这两种划分是非合作博弈理论中对理性结局影响最大的两种因素,两两组 合就形成了上述四类博弈。 3 多源信息融合中的博弈 2 零和博弈与非零和博弈问题 在零和博弈中,一个参与者的收益必然意味着另一参与者的损失,博弈双 方的收益和损失相加总和永远为“零”,双方不存在合作的可能。例如下棋、 扑克牌之类的博弈问题大多都属于零和问题。 而在非零和博弈中,参与者的获利与损失之间不必相等,即代数和不为零。 非零和博弈是数学家n a s h 首先提出并加以解决的,即著名的n a s h 均衡点及相 应的求解方法。 3 3 博弈模型分析 对局势的分析一般是从描述该局势的模型出发,在博弈论中根据博弈类型 的不同,有不同的方法来描述一个博弈模型,其中比较常用的两种方法是策略 型表示和扩展型表示。 3 3 1 博弈模型的三要素 博弈论的研究者认为,构成一种博弈最基本的要素有三个:首先是参与人, 也就是利益主体;其次,是每个参与者都可从其可以采纳的策略中进行选择, 这就是决策;最后每个参与者从结局中得到一个定量表示的收益。准确的说, 博弈模型包含了局中人、策略和支付三个基本要素。 1 局中人( p l a y e r s ) :即博弈的参与者。他们是博弈的决策主体,根据自己的 利益要求决定自己的行为。局中人不但可以是人、集体,而且可以是自然界某 一类生物或一种装置。 2 策略( s t r a t e g i e s ) :指每个局中人可以选择的行动方案。指局中人在博弈中 可以选择的行动方案,每个局中人可以选择多中策略,策略的全体构成策略集。 3 支付( p a y o f f s ) :局中人从策略组合中获得的收益,即用某个效用尺度来 度量的博弈结束时局中人的利益得失。由于支付是策略组合的函数,所以也被 成为支付函数。 由于博弈中每种特定博弈情形的出现都是参与人相互作用的结果,因此参 3 多源信息融合中的博弈 与人在每种博弈情形下的支付,不仅与自己的策略有关,而且还与其他参与人 的选择有关。在博弈中每个局中人的目标是追求个人期望支付的最大化,在博 弈论与经济行为一书中,证明了期望效用最大化定理:对于任一理性的决策 者,一定存在某种方式对他所关心的各种可能结果赋予效用数值,并且是选择 最大化期望效用【16 1 。 3 3 2 策略型博弈模型 策略型( s t r a t e g i cf o r m ) 博弈是博弈模型的一种规范性描述,也称标准型博 弈。在策略型博弈中,各局中人同时一次性的选定策略,无法表现出选择的先 后顺序,主要用来描述静态博弈。形式上一个策略型博弈模型可以表示为【1 6 】: r 5 = ( ,心) 删,0 ,) 洲) ( 3 1 ) 其中为非空集,代表博弈中的所有局中人;g 也是非空集,表示了局中人f 所 有可以采纳的策略集合;以是从洲c ,到实数集r 的一个函数,表示了局中人f 的期望支付。 在博弈中,每个j 蜀d p x i 都必须在策略组合e 中选择一个策略参与博弈,假 设所有可能的策略组合用c = 洲c ,表示,对c 中任一策略c 组合,支付函数 “( c ) 表示此时局中人f 在本次博弈中得到的预期支付收益。 用策略博弈模型来表示一个两人博弈。设博弈中存在两个局中人i 和i i ,其 中局中人i 有m 个策略q = c ,c 1 2 ,c 。 , 局中人i i 有一个策略 c 2 = c 2 。,c 2 :,c 2 。) 。当局中人i 选择策略f ,局中人i i 选择策略时,局中人i 的 期望支付为a u ,则定义两人博弈策略型表示的支付矩阵如下【】: 4 = ( 口盯) ,。州。g d l lq 1 2 d 2 1口2 2 口m i口m 2 ( 3 2 ) 一 一 晰 3 多源信息融合中的博弈 3 3 3 扩展型博弈模型 在扩展型( e x t e n s i v ef o r m ) 博弈模型的表示方法中,局中人在博弈中总是 按照一定的规则进行的,除了要说明博弈问题所涉及的局中人及每位局中人的 支付函数外,还必须对博弈过程中局中人所遇到的决策问题的序列结构进行详 细的说明,因此,扩展型博弈模型描述的是动态博弈。 扩展型博弈的决策活动用博弈树的方式来描述,所谓博弈树就是由结和有 向枝构成的“有向树 ,如图3 1 所示。 ( a l ,1 ,p 2 ) 4 图3 1 扩展博弈局势 博弈树通过节点与节点之间的连线表示整个扩展型博弈局势。连线上标注 各局中人的决策,所有属于同一信息集的节点用一条虚线连接。决策节点( 非 终止节点) 的支付通过贝叶斯推断的调节作为其后续节点的先验概率参加下一 次的博弈。没有后续节点的节点表示博弈的可能结局,每个局中人从每种结局 中获得不同的支付,标在终止节点处。 各局中人力求自身在博弈中获得尽可能大的支付,信息融合的期望是所有 局中人的联合支付达到最大值。因此,每一阶段的博弈中,各局中人采取相应 的策略以保证联合支付达到最优,而不同于一般博弈各局中人仅仅是追求自身 的利益。 3 3 4 两种博弈模型的比较 以上描述了两种博弈模型,即策略型博弈和扩展型博弈。对于常见的博弈 模型,这两种方式都可用来建模,但在实际应用中,两者还是有一定的差异的。 策略型博弈从本质上来讲是一种静态模型,它假设所有的局中人同时选择 3 多源信息融合中的博弈 策略并得到博弈的结果,但策略型博弈不考虑博弈的局中人何时行动和如何行 动问题。虽然策略型博弈也可用来对动态博弈问题进行建模,但从所得到的模 型中无法直观的看到博弈问题所具有的动态特性。 扩展型博弈从本质上来讲是一种动态模型,它不仅直观的给出了博弈的结 果,而且还对博弈的过程进行详尽的描述,如给出博弈局中人的行动顺序,以 及局中人行动时的决策环境和行动空间等。 u d ( 3 ( a ) 扩展型博弈 4 ,5 ) ( l ,l )( l ,r )( r ,l )( r ,r ) 3 。23 ,2l ,ll ,l o ,2 4 ,5o ,24 ,5 ( b ) 对应的策略型博弈表示 图3 2 扩展型博弈的策略型表示 事实上,如果给出博弈的扩展式描述,就可得到博弈问题的策略式描述; 同样,在很多情况下,给出博弈问题的策略式描述,也能构造出博弈问题的扩 展式描述。图3 2 中的例子描述了扩展型博弈的策略型表示。 3 3 5 双人零和博弈中的最小最大值定理 如果在一个博弈局势中仅有两个局中人i 和i i ,二者支付分别用一和肼i 表 示。在博弈结局的收益中两局中人收益值之和为零,即h + m i 0 ,称此博弈模 型为双人零和博弈。由于两局中人的支付之和为零,也就是说一个局中人所失 3 多源信息融合中的博弈 必为另一个所得,二者利益是完全对立的,也称此为严格竞争博弈【13 1 。 假设一双人零和博弈模型为r = ( i ,兀 ,c ,c ,“) ) ,若局中人i 采纳了策略f , 则呼n 约是局中人i 在策略f 的条件下的最小收益,m 呼n 心表示局中人l 调 整自身策略获取所有最小收益中最大者,即为其至少收益。由于在双人零和博 弈中以+ 朋i = o ,局中人i 的至少收益m 蟹m i n 约即为局中人i i 的最大损失,用 公式( 3 3 ) 表示如下 1 峄吁n 如2 吁n 峄心2 3 3 此时二者双方都不足以更改自己的策略来增大收益,达到了支付上的一个平衡。 此博弈的值用表示。 一个双人零和博弈可以用支付矩阵来表示,由于双方支付之和为零,因此 只要明确一个局中人的的支付矩阵也就等于确定了整个博弈局势。支付矩阵 ( 坳) 可以标记任何一个双人零和博弈。 若存在一对整数( f ,j f ) ,它使心既是矩阵( 坳) 第f 行的最小值,又是第列 的最大值,则称( f ,j ) 为矩阵的鞍点。对具有鞍点的两人零和博弈来说,鞍点即 为该博弈的解,对于博弈解的存在性,冯诺依曼于1 9 3 7 年证明了解存在的条件, 即最小最大定理【1 6 1 。 定理3 1 【1 6 】( 最小最大值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论