(通信与信息系统专业论文)基于博弈论的分布式认知无线电网络功率控制算法研究.pdf_第1页
(通信与信息系统专业论文)基于博弈论的分布式认知无线电网络功率控制算法研究.pdf_第2页
(通信与信息系统专业论文)基于博弈论的分布式认知无线电网络功率控制算法研究.pdf_第3页
(通信与信息系统专业论文)基于博弈论的分布式认知无线电网络功率控制算法研究.pdf_第4页
(通信与信息系统专业论文)基于博弈论的分布式认知无线电网络功率控制算法研究.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(通信与信息系统专业论文)基于博弈论的分布式认知无线电网络功率控制算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 在过去几十年中,移动通信行业对无线频谱的使用需求一直在急剧地增加。 为了克服传统静态频谱分配方式对无线网络性能的约束,满足未来无线通信对 宽带化的需求,实现网络组网灵活、抗毁性强和方便快捷等目标,分布式认知 无线电( c r ,c o g n i t i v er a d i o ) 网络日益受到人们的重视。提高认知无线电系 统频谱利用效率的重要手段之一是认知用户和主用户对频谱的共享。为了不影 响主用户的正常通信,通常要求认知用户对主用户造成的干扰低于干扰温度阈 值,因此认知用户的发射功率必须得到有效地控制。 分布式认知无线电网络的功率控制是一个多目标优化问题。在分布式认知 无线电网络中,由于不存在中心节点( 即中央控制器) ,认知用户必须竞争使用 有限的频谱资源,因此该问题主要用竞争优化的方法解决,所依据的理论基础 是博弈论。目前大多数文献把功率控制问题建模为非合作博弈,这在一定程度 上提高了分布式认知无线电系统的频谱利用率,但他并不是全局最优的,而且 不能很好地控制对主用户的干扰,同时算法的收敛速度和系统的公平性也不能 得到保证,因而本文使用博弈论中的竞争市场模型来解决上述认知无线电中的 功率控制问题。 竞争均衡( c e ) 是基于竞争市场模型的非合作博弈问题的均衡解。本论文 首先从理论上证明了分布式认知无线电网络功率控制问题的c e 是惟一存在的, 并推导出了这个惟一均衡解存在的充分条件;其次研究了竞争均衡解的收敛速 度,提出一种分布式的快速收敛的功率分配算法( f c p a a ) 。由于算法使用改 进的轮询规则来减少次用户对自身策略的调整次数,次用户的功率分配可以快 速收敛到竞争均衡解,同时也保证了主用户的干扰温度限制;为了使算法适用 于更为实际的无线环境,在此基础上,我们研究了算法在瑞利衰落信道条件下 的性能;最后,我们考虑系统的公平性,提出了一种基于f c p a a 的保证公平 性的算法( s r 虹) ,算法很好地平衡了用户的个人有效性和系统公平性。 关键词:认知无线电功率控制博弈论竞争均衡收敛速度 a b s t r a c t a b s t r a c t t h ed e m a n df o rr a d i os p e c t r u mi n d u s t r yh a sb e e ni n c r e a s e dd r a m a t i c a l l yi nm o b i l e c o m m u n i c a t i o ni nt h el a s td e c a d e i no r d e ft oo v e r c o m et h ec o n s t r a i n to ft h e t r a d i t i o n a ls t a t i cs p e c t r u ma l l o c a t i o no nt h ew i r e l e s sn e t w o r kp e r f o r m a n c e , m e e tt h e n e e d sf o rb r o a d b a n di nf u t u r ew i r e l e s sc o m m u n i c a t i o n sn e t w o r k ,a c h i e v et h ef l e x i b l e , a n t i s u r v i v a b i l i t ya n dc o n v e n i e n tt a r g e ti nn e t w o r kf o r m i n g , d i s t r i b u t e dc o g n i t i v e r a d i o ( c r ,c o g n i t i v er a d i o ) n e t w o r k sh a v e b e e np a i dm o r ea n dm o r ea t t e n t i o n a n i m p o r t a n tm e a l l st oi m p r o v et h es p e c t r u me f f i c i e n c yo fc o g n i t i v er a d i os y s t e mi st h a t t h ep r i m a r yu s e r sc a l ls h a r es p e c t r u mw i t hc o g n i t i v et l s e r s i no r d e rn o tt oa f f e c tt h e n o r m a lc o m m u n i c a t i o no ft h ep r i m a r yu s e r , t h ep r i m a r yu s e ru s u a l l yr e q u i r e s i n t e r f e r e n c ec a u s e db yc o g n i t i v eu s e i si sl o w e rt h a nt h ei n t e r f e r e n c et e m p e r a t u r e t h r e s h o l d ,t h ec o g n i t i v e u s e r st r a n s m i tp o w e rm u s tb ee f f e c t i v e l yc o n t r o l l e d t h ep o w e rc o n t r o lp r o b l e mi nd i s t r i b u t e dc o g n i t i v er a d i on e t w o r ki sg e n e r a l l ya m u l t i - o b j e c t i v eo p t i m i z a t i o np r o b l e m i nd i s t r i b u t e dc o g n i t i v er a d i on e t w o r k , t h e c o g n i t i v eu s e r sm u s tc o m p e t ef o rt h el i m i t e ds p e c t r u mr e s o u r c e sb e c a u s eo fl a c k i n g c e n t r a ln o d e ( c e n t r a lc o n t r o l l e r ) ,8 0t h i sp r o b l e mc a nb es o l v e db yt h ec o m p e t i t i v e o p t i m i z a t i o nm e t h o d ,w h i c hi sb a s e do nt h eg a m et h e o r y c u r r e n t l ym o s tl i t e r a t u r e s m o d e lt h ep o w e rc o n t r o lp r o b l e mt oan o n - c o o p e r a t i v eg a m e ,w h i c hi m p r o v e st h e s p e c t r a le f f i c i e n c yo ft h ed i s t r i b u t e dc o g n i t i v er a d i os y s t e mt os o m ee x t e n t ,b u ti ti s n o tg l o b a lo p t i m a la n dc a l ln o tc o n t r o lt h ei n t e r f e r e n c et op r i m a r yu s e r se f f e c t i v e l y a t t h e & a l l l et i m e ,t h ec o n v e r g e n c es p e e do fa l g o r i t h ma n ds y s t e mf a i r n e s sc a l ln o tb e g u a r a n t e e d ,t h u st h ec o m p e t i t i v em a r k e tm o d e li ng a m et h e o r yi su s e dt os o l v et h e p o w e rc o n t r o lp r o b l e mi nt h ec o g n i t i v er a d i on e t w o r ki no u rp a p e r t h ee q u i l i b r i u ms o l u t i o no ft h i sn o n c o o p e r a t i v eg a m eb a s e do nc o m p e t i t i v e m a r k e tm o d e li st h ec o m p e t i t i v ee q u i l i b r i u m ( c e ) w ef i r s tp r o v et h ee x i s t e n c ea n d t h eu n i q u e n e s so fc ef o rt h ep r o p o s e dc o m p e t i t i v em a r k e tm o d e la n dp r e s e n tt h e s u f f i c i e n tc o n d i t i o n sf o rt h i s s e c o n d l y , ad i s t r i b u t e da l g o r i t h mi sp r o p o s e dt h r o u g h w h i c ha l lt h es e c o n d a r yu s e r s p o w e ra l l o c a t i o nc a nc o n v e r g et ot h eu n i q u ec ew h i l e i i a b s t r a c t t h ei n t e r f e r e n c et e m p e r a t u r ec o n s t r a i n t so fp r i m a r ys y s t e ma r es a t i s f i e d t om a k et h e a l g o r i t h ma p p l i c a b l e t oam o r er e a l i s t i cw i r e l e s s e n v i r o n m e n t ,w es t u d y t h e p e r f o r m a n c eo ft h ea l g o r i t h mi nr a y l e i g hf a d i n gc h a n n e lc o n d i t i o n s f i n a l l y , w e p r o p o s ead i s t r i b u t e ds o c i a lf a i r n e s sa w a r ef c p a aa l g o r i t h m ( s f a f ) i nc o n s i d e r a t i o n o ft h es y s t e mf a i r n e s s ,a n dt h i sa l g o r i t h mb a l a n c e st h ei i s e r s p e r s o n a le f f i c i e n c ya n d s y s t e mf a i r n e s s k e yw o r d s :c o g n i t i v er a d i o p o w e rc o n t r o lg a m et h e o r y c o m p e t i t i v e e q u i l i b r i u m c o n v e r g e n ts p e e d l l 绪论 1 绪论 1 1 课题研究背景 1 1 1认知无线电技术的背景 近年来随着无线电通信需求的不断增长,无线通信技术也日新月异,无线 通信业务也越来越多,从而导致需要分配更多的无线频谱。能否实现无线频谱 的高效利用,直接影响国家经济社会持续、健康、和谐发展的能力。随着无线 通信技术的进步,我们生活中大量涌现2 g 3 g 、w i f i 、蓝牙和w i m a x 等设备, 这使无线网络用户对宽带业务的需求猛增,那么稀缺的无线电频谱资源成为制 约无线通信发展的新瓶颈。 根据文献 1 3 ,我们了解造成频谱资源紧缺的主要原因是现有的固定分配 频谱的方式。它就是将整个无线频谱划分成固定且大小不一的带宽频段,即静 态的进行频谱分配,而这种分配方式逐渐显示出了其固有的弊端。比如:某些 蜂窝移动通信频段以及工业、科学和医用( i s m ,i n d u s t r i a l s c i e n t i f i ca n dm e d i c a l ) 等热点业务频段,频谱非常拥挤,设备之间的相互干扰使系统的总体性能下降。 与这些频段成鲜明对比的是,广播电视频段的频谱利用率却非常低,存在时间 和空间上的大量频谱闲置现象;据分析已被分配频谱的使用效率( s p e e t r u r n u t i l i z a t i o l lr a d i o ) 并不高,仅为1 5 一8 5 。也就是说,适宜无线通信的频谱资 源一方面十分稀缺,一方面又浪费严重,形成了所谓“频谱资源相对匮乏与绝 对浪费 的奇怪现象。 有限的频谱资源以及对频谱使用更高效率的需求使得发展一种新的通信技 术成为必然。在这种情况下,人们提出了可以充分利用那些空闲的频谱资源, 有效解决频谱使用率低下的认知无线电( c r ) 技术。 1 1 2 认知无线电技术的发展概述 1 9 9 9 年,j o s e p hm i t o l a 博士第一次提出了认知无线电的概念喳1 。他提出的 认知无线电是以软件无线电( s d r ) 作为的理想智能实现平台,并用无线电知 识描述语言r k r l ( r a d i ok n o w l e d g er e p r e s e n t a t i o nl a n g u a g e ) 来叙述出认知 模型( 图1 1 ) ,他指出了认知无线电与普通软件无线电的区别:它能够智能的 l 1 绪论 观察周围的无线电环境;迅速的处理、分析和决策所获得的信息内容;合理以 及最优选择频谱并且在检测到授权用户时及时退出该频谱,有效的在不影响授 权用户的同时提高频谱利用率。2 0 0 5 年2 月,s i m o nh a y k i n l 教授从信号处理角 度上定义了认知无线电的概念( 如图1 2 所示) :“认知无线电是一个智能无线 通信系统,其智能表现在能够感知外部环境,并从中学习,然后改变某些操作 参数,以适应环境变化,从而达到对频谱资源的有效利用肺3 。” 图1 1m i t o l a 的认知圈 认知无线电中所有的发展方向里被业界最看好的就是他为解决频谱资源紧 张而提供的思路,图1 3 就描述了认知无线电是如何使用暂时未被使用的频谱, 即频谱孔( s p e c t r u mh o l e ) 。为此,2 0 0 3 年5 月,美国联邦通信委员会f c c 召开了 认知无线电研讨会,提出了开放的频谱共享机制并讨论了如何利用认知无线电 技术实现灵活的频谱利用的相关技术问题。2 0 0 4 年美国国防高级研究计划署 ( d a 砒) a ) 7 召丌了关于下一代网络( x g ) 计划的专题研究,其中研究了对通信 的频谱效率的影响以及大大降低每个用户的频谱分配的复杂度,研究关键技术 以实现动态的频谱接入技术和频谱共享。同时,学术界也对认知无线电展开了 广泛研究。例如,德国卡尔斯鲁厄大学的f k j o n d r a l 教授等人提出的频谱池系 2 1 绪论 统 8 1 0 。美国加州大学圣巴巴拉分校和微软亚洲研究院合作完成了n a u t i l u s 项 目 1 1 1 2 ,其主要研究的是一个分布开放式频谱接入a dh o c 网络框架。这些项目 的研究对许多领域如基本理论、数据传输等都有很大地推动,同时我们也在这 些方面取得一些不错的成果。 功率 图1 2 s i m o nh a y k i n 教授的认知环 r 频谱空洞 图1 3 频谱孔 3 时问 1 绪论 1 1 3 分布式认知无线电网络 使用认知无线电技术的多个通信节点可以与现有网络共同地、也可以独立 地构成认知无线电网络( c o g n i t i v er a d i on e t w o r k s ,c r n ) 。图1 4 给出了认知无 线电网络架构,总的来说,它分为两部分:主要分为授权网络( p r i m a r y n e t w o r k ) 和认知无线电网络( c o g n i t i v er a d i on e t w o r k ) 。授权网络即为运行在授权频段的 网络,比如现有的蜂窝网和广播电视网,他主要由主用户和主基站组成。认知 无线电网络( c r 网络) 又称为未授权网络,它主要由认知用户、认知基站和频谱 b r o k e r 组成。认知无线电网络配备有认知基站来提供认知用户的单跳连接,通 过这个连接,认知用户可以接入到其他网络,频谱b r o k e r 是认知无线电网络一 个集中式网络实体3 ,它可以连接到每一个网络来实现了多个c r 网络的共存。 其饱认知无 线电同络 图1 4 认知无线电网络结构 认知无线电网络从网络结构上看可分为集中式和分布式,如图1 4 所示。集 中式结构:一个认知用户只能以单跳地方式接入认知基站,在同一个认知基站 的传输范围内,认知用户通过认知基站进行通信,而不同的认知网络问,认知 用户必须通过频谱经纪人的协助进行通信。分布式认知无线电网络:在此网络 中,没有基础体系结构的支持,这种网络是自动生成的。如果一个认知用户发 4 b 1 绪论 现附近有其他认知用户,而且可以通过一定的通信协议进行连接,他们就可以 设置一条链路,形成一个网络。由于网络组网灵活、抗毁性强和方便快捷等特 点钔,分布式网络已经成为未来无线通信网络架构的重要趋势。分布式无线网 络体系结构具有的通用性和可靠性使得分布式认知无线电成为近年无线通信研 究的热点,这里我们主要研究分布式的认知无线电网络。 1 2 认知无线电关键技术及功率控制研究意义 1 2 1认知无线电网络中关键技术 由于认知无线电网络的特点,即认知网络与主用户网络的共存性以及他们 不同q o s 要求的性质,认知无线电网络具有一些独特的挑战。其中包括:提供 可靠的频谱感知来保护主用户的正常通信:提供高效可靠的通信、确保认知用 户的q o s 性能;共享、动态管理无线频谱资源,提高频谱利用率。这些都是认 知无线电技术中受到关注的课题,如图1 5 ,具体分为以下几个部分: 图1 5 认知无线电网络中研究中涉及的关键技术 ( 1 ) 频谱感知。我们知道认知用户只可被分配未使用的频谱,因此,频谱 感知就是要监测可用的频段,捕捉他们的信息,然后检测图1 3 中所提的“频 谱空洞 ,供认知用户占用进行通信。同时,在认知用户使用频谱空洞时,频谱 感知还需要迅速感知主用户的到来,使认知用户能及时退出以降低对主用户的 5 1 绪论 干扰。在c r 网络中,频谱感知的可靠方案是极其重要的,它是频谱共享、频 谱管理等上层技术的基础,也是c r 网络正常工作的前提。 ( 2 ) 功率控制。对于c r 网络,认知用户不允许对主用户造成不可忍受的 干扰,同样在保护主用户的同时还应确保认知用户的q o s 水平,因而,合适的 发射功率对保护主用户和认知用户的通信性能都至关重要,功率控制是认知无 线电网络研究中的一项关键技术。 ( 3 ) 频谱管理。认知用户检测到的频谱空洞类型是各种各样的,这就需要 找到最合适的频谱来满足其q o s 要求,此时就需要c r 网络对频谱资源进行管 理。频谱管理又分为频谱分析和频谱决策。频谱分析就是根据每个频谱空洞的 特性,统计频谱环境的时间变化、主用户的占用情况和频谱信息。根据得到的 信息,可以计算出利用每个频谱空洞可获得的性能,描述出主用户网络的动态 特性。经过频谱分析所有可用频谱资源,c r 网络就为认知用户选择一个合适的 频谱来满足其q o s 要求,这就是频谱决策的功能。频谱决策需要根据认知用户 的数据速率、时延限、可接受的差错率、传输模式和带宽和等需求情况,并根 据频谱决策准则,选择适合认知用户传输的频谱。 ( 4 ) 频谱共享:频谱共享是指不同的用户同时使用一个频段而互相不产生 干扰。共享包括主用户和认知用户之间的,也包括认知用户之间的协作接入频 谱。 1 2 2 认知无线电功率控制的研究意义 目前分布式认知无线电的许多方面都在进行研究,如:频谱管理、频谱检 测、频谱分配、功率控制等,这些方面从概念到应用上也已经取得一些成果, 但是由于认知无线电技术的新兴,现在的研究还处于初级阶段,很值得我们进 行深入研究。认知无线电技术的一个重要特点就是可以实现频谱共享,但是频 谱共享不仅能提高频谱利用率,同时也要求保护主用户、不影响主用户的正常 工作。功率控制作为一种保护主用户的手段,我们可以使用它来控制认知用户 的功率达到主用户的可承受的底限,同样认知用户的q o s 要求也要得到保证。 因而,良好的功率控制对认识无线电的推广应用具有极为深远的意义。 我们知道认知无线电网络是一个受限网络,不但认知用户的可用频谱资源 有限,其在某一段频率上的发射功率也是受限的。认知用户不仅要合作地共享 6 1 绪论 频谱资源,同时还会竞争地获取自身效用的最大化。因而,功率控制问题还面 临着以下要求: 1 ) 对认知用户功率控制要保护主用户。我们知道认知无线电网络在进行频 谱共享的前提就是保护主用户,因而它是首要工作。本文中假设此干扰限已从 物理层的频谱感知功能模块获得。 2 ) 对认知用户功率控制要满足认知用户的q o s 要求。用户的最基本的q o s 要求就是信干噪比( s i n r ) 要求,我们在功率控制算法中也要考虑这一点。 认知无线电网络是一个受限网络,其首要是要保护好主用户,我们不能任意地 增加认知用户的发送功率。因而这就需要我们找到一种好的算法,一种折中的 方法来解决这个矛盾。 3 ) 对认知用户功率控制要考虑功耗的问题。这是因为良好的功率控制算法 会提高对整个功率控制过程的收敛速度,而且降低功率还可以增加系统的容量 和延长电池的寿命。 4 ) 功率控制算法要有较低的复杂度。随着认知无线电网络中认知用户增多、 可用频谱增多,进行信号检测和频谱功率资源分配的工作量也会同样地增多, 这就会使功率控制算法完成这些工作需要很长时的时间以至于不能很好地适应 认知无线电中频谱快速时变的要求。而且一个好的算法应具备较低的复杂度, 所以我们要求认知系统中功率控制算法要有较低的复杂度。 由上述的四个基本要求我们知道功率控制算法面临很多要求,是一个多目 标优化问题。在分布式认知无线电网络中,由于不存在中心节点( 即中央控制 器) ,认知用户必须竞争使用有限的频谱资源,网络用户的智能行为和相互作用 必须很好地去分析,国内外很多学者和研究机构对功率控制问题已经做了很多 研究,因此,研究分布式认知无线电功率控制算法是具有重要意义的前沿研究 课题。 1 3 功率控制技术的国内外研究现状 认知无线电网络中的发射功率控制可以描述为:在可用频谱资源有限的条 件下,在不影响主用户即不违反干扰温度的限制下,合适的选择认知用户的发 射功率,从而达到最大化所有认知用户的总传输速率之和的目的。 目前国内外学者在认知无线电功率控制方面已经取得不错的成绩,根据认 7 1 绪论 知无线电网络的应用场景不同,功率控制算法可分为集中式的功率控制算法和 分布式的功率控制算法,如图1 6 所示。集中式的功率控制算法利用基站或中 心控制节点来集中进行信息处理以及最优化分配,因而他常常采用联合资源控 制算法如功率控制与频谱分配结合n 纠刀等。相比之下,由每个c r 用户都执行 分配算法的分布式功率控制算法,更适合于认知无线电中空闲频谱空穴时变的 无线环境,现有的研究更多集中于分布式场景的功率控制算法。而分布式场景 下的功率控制算法需要认知用户根据自己不同的要求做出相应的决策,因而大 多数采用基于博弈论的算法。 图1 6 认知无线电网络中功率控制算法的分类 现有解决功率控制问题所依据的理论主要为博弈论和信息论。首先,从信 息论的角度上,我们常常使用的是基于信息论的迭代注水法。在文献 1 9 中 提出一系列迭代注水( 腰) 算法用于认知无线电网络( c r n ) 中认知用户( c r ) 之间的功率分配问题。此后,i w f 的收敛性质就一直被广泛的研究( 例如:文 献 1 9 , 2 0 ) ,同时许多文献已经研究i w f 的扩展版本( 例如:文献 2 1 2 3 ) 。 在i w f 框架中,我们将通信信道模拟为一个高斯频率选择性干扰通道,认知用 户模拟为一个收发对且都是自私用户,即他们只关注于通过功率分配来最大化 自己的传输率。为了使i w f 算法可以收敛,通常要求用户之间的干扰是微弱的。 我们通过文献 2 4 可知当干扰如果过于强烈,i w f 算法就会发散不收敛。这里 8 1 绪论 值得注意的是,前面文献提到的使用i w f 框架模拟的c r n 资源分配中假设的 是:认知用户是独享频谱、无需考虑主用户的行为和存在与否。 但是我们从文献 2 5 中知道这种情况常常是不存在的,最近一些工作者在 认识到上述方法缺陷的情况下致力解决考虑主用户的c r n 资源功率控制问题。 文献 2 6 2 7 研究了一个单信道单干扰测量点的主用户与认知用户的频谱共享 问题, 2 8 2 9 中作者研究m i m o m i s o 认知无线电网络中的频谱分配和功率 控制问题,但是他只分析单个认知用户的情况,且不知此算法能否扩展到多个 认知用户的情况。 另外,我们还可以从博弈论的角度上解决多用户c r 系统的功率控制问题, 博弈论按照参与人关系来分可以划分为合作博弈和非合作博弈。如果我们将功 率控制问题看成一个合作博弈的话,它就可以简化成一个最优控制问题b o 】。但 这种合作博弈需要参与者达成有约束的协议,这会需要完全的信息就会导致大 量的信息交互以及通信负担,同时在c r n 中每个用户都试图最大化自己的功 率,所以我们常常考虑非合作博弈的情况。 y a t e s b 首先提出功率控制算法收敛两个前提条件,c h i k w o n g 日2 3 在y a t e s 研究基础上拓展了收敛条件,他提出了新的收敛标准,这些都为功率控制算法 的收敛性和纳什均衡点的证明提供了理论依据。然而基于n e 的功率分配并不是 有效的或全局最优的口3 】,这是因为在非合作博弈中每个未主用户只关注于个人 效用而忽略了全局整体效用。文献 3 4 提出一种s t a c k e l b e r g 博弈来模拟功率分 配问题,但是他并没有考虑到认知用户对主用户的干扰要小于干扰门限阂值这 个条件。 同时在一些文献中使用价格机制中提出的代价函数来试图解决c r n 中的 功率控制问题。例如文献 3 5 3 6 提出使用定价机制,但是这种机制不是自我 实施的,且在这两种情况下都未考虑控制主用户所受到的干扰。最近,文献 3 7 使用定价机制来研究具有总干扰限制的多用户多信道的认知无线电网络中的分 布式功率分配问题,他提出了一种计算均衡解的算法,但是并未证明他所给出 算法收敛性的证明。文献 3 8 提出使用拍卖理论中的竞争市场模型来研究c r n 中的功率控制问题,基于这种模型的算法不仅可以很好的满足主用户的干扰门 限,同时可以得到比基于非合作博弈的功率控制算法更高的系统总效用,然而 算法并不能很好地保证认知用户之间的公平性以及没考虑算法的收敛速度。 基于上述现状的研究总结和分析,本文将深入研究认知无线电网络中功率控 9 1 绪论 制算法是如何提高收敛速度以及平衡个人有效性和系统公平性的,并且希望借 助博弈论中的竞争市场模型给信道进行定价,从而获得新的功率控制算法不仅 改善了收敛速度同时平衡了个人有效性和系统公平性。 1 4 本论文结构安排 本文主要研究了利用博弈论的方法来分析认知无线电网络中的功率控制问 题,其内容结构安排如下: 第一章绪论。介绍了本论文的课题背景和研究意义,然后详细介绍了认知 无线电功率控制方面国内外研究现状,以及论文的结构安排。 第二章博弈论及其在认知无线电的应用。首先介绍了博弈论的基本理论, 其中包括博弈论的概念模型,博弈论的分类及纳什均衡。之后,我们将博弈论 引入认知无线电网络中资源分配分析过程中,并且给出了博弈论的认知无线电 分析流程图。最后,给出基于博弈论的功率控制模型,主要介绍了本文中所使 用的竞争拍卖博弈模型。 第三章分布式快速收敛功率分配算法设计。这一章是本论文的重点,在了 解博弈论的基础上,我们将认知无线电网络中的功率控制问题建模为一个竞争 市场模型,那么问题的解就是一个竞争均衡。我们首先理论证明了竞争均衡解 的存在唯一性;然后为了提高均衡解收敛速度,我们提出了一种快速收敛算法; 最后仿真结果证明了算法的收敛性与有效性。 第四章考虑公平性的功率分配算法设计。这一章主要是在前一章介绍的模 型的基础上做了一部分改进。首先,我们考虑信道为一个瑞利衰落信道,这虽 然会影响信道价格的收敛速度,但是它会更符合实际的信道状况。其次,我们 可以通过调整用户的预算来平衡各用户的效用,这可以达到系统的公平性。最 后,仿真证明本算法可以通过低的实施性和复杂度很好地平衡了用户的个人有 效性和系统公平性。 第五章工作总结与展望。 l o 2 博弈论及其在认知无线电的应用 2 博弈论及其在认知无线电的应用 2 1博弈论的概念模型 博弈论( g a m et h e o r y ) ,是一种关于游戏、解决冲突中的最优解问题的理 论。博弈论还是一种数学工具,在多决策者之间分析研究战略的相互作用。博 弈论主要研究决策者的策略的相互依赖行为,它认为决策者都是理性的,都会 最大化自身的利益,那么在交往中利益有冲突,行为相互影响汹1 。由于博弈论 中大多数的研究集中在博弈方之间的策略对抗、竞争、对策选择问题,博弈论 也可称为“对策论。这里我们概括一下博弈论:博弈论就是决策者从理论上进 行分析研究,并预测一个理想的结局,然后所有决策者都选择理论得出的战略, 并没有一个决策者愿意单独背离这个战略。我们可以看到,每个决策者所选择 的战略一定是针对其他人所选战略的最优反应“1 。 从上述定义中可看出,一个博弈应当包括参与人、行为策略、信息、次序、 效益五个方面,即g = p ,a ,i ,o ,u ) 。 ( 1 ) p ( p l a y e r ) ,博弈参与人,也称“局中人 。即博弈过程中独立决策, 并选择决策的个人或组织。同时,在博弈过程中,各参与人都必须平等地按照 博弈规则来进行博弈。 ( 2 ) a ( a c t i o n ) ,博弈行为策略,是指参与人的所有可能的行为或策略 的集合。它规定了参与者什么时候行动,当某个参与者行动时他该选择什么行 动等等。可以这样说,博弈行为就是参与者的“相机行为方案。 ( 3 ) o ( o r d e r ) ,博弈的次序,是指博弈参与人选择策略的先后顺序。在 多个博弈参与人进行决策时,有时为了保证公平性就让博弈方同时进行决策, 有时又会有先后顺序,而且有的博弈参与人要多次决策。因此,规定博弈中的 次序是必要的。 。 ( 4 ) i ( i n f o r m a t i o n ) ,博弈信息,是指博弈参与人在博弈的过程中所掌 握的帮助其进行决策的信息。这些信息对参与人的意义非常重大,这直接关系 到博弈的成败。 ( 5 ) u ( u t i l i t y ) ,博弈方的效益,是指博弈参与人从博弈中做出决策之后 所获得的收益。它用收益函数计算得到每个博弈方在其选择的策略下的收益大 2 博弈论及其在认知无线电的应用 小,这个结果会显示出该决策的优劣,它是博弈参与者真正关心的东西。 以上就是定义一个博弈所包含的五要素。博弈论就是解决上述博弈问题的 有效途径,它的研究方法和其他利用数学工具研究现实生活问题的方法一样, 就是从复杂的现象归纳出基本的元素,在这些元素基础上构建数学模型进行分 析。 2 2 博弈的分类及纳什均衡 2 2 1 博弈的分类 按照不同的方法分类,博弈可以分为以下几种:博弈参与人关系不同来分, 包括合作博弈和非合作博弈;博弈参与人的多少来分,包括两人博弈和多人博 弈;对于博弈的结果不同来分,包括常和博弈、零和博弈、变和博弈。具体分 类情况如图2 1 所示。 合作方式 f 合作博弈非合作博弈 图2 1 博弈分类 实际中常常使用非合作博弈,非合作博弈具体可分为: 按照博弈方之间的行动的先后分的话,博弈是可分为静态博弈和动态博弈。 其中,静态博弈是指所有博弈者一起做出决策,要么决策虽然有先后,但是没 有人在决策之前就可以看到其他人的信息,在做出决策之后就不能再做任何动 作影响博弈的发展。动态博弈是指博弈方依先后次序行动,后行动的博弈方可 以观察先行动的博弈方决策,由于受到前面行动博弈方的影响,后行动博弈方 在知道全部信息的基础上采取最有利自己的策略。 按照博弈方拥有的信息来分,博弈又是可分为完全信息博弈和不完全信息 博弈。完全信息博弈是指每一个博弈方都拥有其它博弈方的各种特征信息。在 不完全信息博弈中,博弈方只知道一部分信息。 1 2 2 博弈论及其在认知无线电的应用 将上面两种不同的分类方式结合起来,就可得到以下四种最常见的博弈, 具体如表2 1 所示: ( 1 ) 完全信息静态博弈。它是非合作博弈论的基础,其均衡解为纳什均衡。 ( 2 ) 完全信息动态博弈。它即为重复博弈,其均衡解为子博弈精炼纳什均衡。 ( 3 ) 不完全信息静态博弈。由于现实生活中很多博弈方并不知道对方的全部 信息,因而这种博弈的研究很有意义,它的均衡解为贝叶斯纳什均衡。 ( 4 ) 不完全信息动态博弈。由于实际中有限次的重复博弈也会出现合作行 为,因而需要引入不完全信息动态博弈,其均衡解为精炼贝叶斯纳什均衡。 表2 1 非合作博弈分类及均衡 完全信息 不完全信息 完全信息静态博弈 纳什均衡 不完全信息静态博弈 贝叶斯纳什均衡 完全信息动态博弈 子博弈精炼纳什均衡 不完全信息动态博弈 精炼贝叶斯纳什均衡 2 2 2 纳什均衡和帕累托最优 非合作博弈中一个重要的概念“纳什均衡( n a s he q u i l i b r i u m ) 。纳什 均衡是由著名的数学家约翰纳什( j o h n n a s h ) 提出的重要贡献之一,这一贡献 也奠定了非合作博弈论的理论基础。n a s h 在1 9 5 0 年和1 9 5 1 年在文献 4 5 4 6 中给出非合作博弈及其均衡解,并证明了均衡解的存在性与惟一性。 首先介绍什么是纳什均衡。纳什均衡就是所有博弈参与者的策略集合,每 个参与者的策略都是应对于其他所有参与者策略组合的最佳策略。即在这个策 略集合中每个博弈者都确信,他选择的是给定竞争对手情况下的最好策略。那 么,我们可知道纳什均衡就是一个平衡的策略组合,就是一个相对稳定的状态, 就是在纳什均衡中没有一个博弈者愿意、也不能通过改变他的选择策略来获得 收益。 纳什均衡定义:对于一个博弈g = s l ,s 拧;“l ,“一) ,其中 岛,咒) 表 示博弈参与者策略集合,恤”,“一) 表示对应策略爷l ,& ) 的效用。如果对于 1 3 2 博弈论及其在认知无线电的应用 每个参与者f - l ,2 ,以都有一个策略集合( s i - ,s :) 满足以下条件: ( s l 。,) u j ( s i ,s 力) ( 2 1 ) 则称( 并,) 为博弈g 的一个“纳什均衡”。 纳什均衡概念是衡量非合作博弈稳定状态的一个重要标准,利用它就可以 很好的分析博弈方的决策以及博弈的结果。在纳什均衡的定义中给出了:若其 他博弈方都采用某个可达到纳什均衡的策略时,这个博弈方如果也采用相同的 策略是符合自己利益的,是不会损害自己的利益的。因此如果一个博弈方知道 其他博弈方都采用的符合纳什均衡的策略时,若此博弈方也是追求自身利益最 大化,那么就可以很容易地判断出他的策略选择以及最终博弈结果( 即达到纳 什均衡值) 。这种分析方法也称为“纳什均衡分析纾。 博弈论中另一个重要概念帕累托最优( p a r e t oo p t i m a l ) ,它在经济学、 工程学、社会科学中都有着广泛的应用。 帕累托最优的定义:在策略空间中s 被称为帕累托最优,当且仅当对于所 有博弈参与者f 不存在其他策略s 使得式( 2 2 ) 成立: 奶( s ) ( s ) ( 2 2 ) 即如果一个策略空间中没有博弈参与者能在不损害其他人的利益的前提下 还可以提升自己的收益,那么这个策略空间就是帕累托最优。 纳什均衡和帕累托最优是不同的,这可以通过博弈论中的囚徒困境理论来 进一步解释二者区别。假设警察抓住两个小偷a 和b 私闯民宅进行偷窃,但是 警方缺乏二人进行偷窃的证据。于是警方将两人分别关在两个不同的房间进行 审讯,给犯罪嫌疑人a 和b 说明相同的坦白政策:如果两人都不坦白,警方无 法判两人的偷窃罪,只能判两人私闯民宅的罪名各1 年的牢狱;如果仅一人招 供,招供者将作为证人不用坐牢,而另一人将被判1 0 年牢狱;如果两人都招供, 两人都会被判8 年牢狱。具体如表2 2 所示。 最后两个人都招供了。这是因为小偷a 不知道小偷b 的选择,因而他选择 了对于他来说的最优“坦白一。同样b 也选择“坦白,结果是两人都被 判8 年牢狱。小偷a 和b 都是从自身的利益出发,结果是双方都坦白了。这个 结果是纳什均衡,但是它并不是整体最优,即不是p a r e t o 最优。如果小偷a 和 b 合作,就达到了p a r e t o 最优( 即二人都不坦白,仅判1 年牢狱) 。纳什均衡 只是一种平衡,而不是一种帕累托最优。 1 4 2 博弈论及其在认知无线电的应用 表2 2凶徒困境博弈 坦白 抵赖 一8 ,- 8 1 0 ,o 0 ,1 0 - l ,一l 我们可依据纳什均衡的定义概念来判断策略向量是否为纳什均衡,但并不 知道该如何得到这个纳什均衡。当博弈参与人数少、博弈者策略有限时,那么 此博弈的可能策略组合就少,就可以通过定义对可能的策略组合进行逐一检测 对比找出纳什均衡,如囚徒困境模型。但在实际情况中,很多博弈参与人数多 或策略集合多,此时就无法采取逐一检验的方法,我们就需要一个简洁的判断 方法。比如有:经验方法;严格下策反复消去法( r e p e a t e d l y e l i m i n a t i mo f s t r i c t s t r a t e g i e s ) ;反应函数法( r e a c t i o nf u n c t i o n s ) ; 递推归纳法 ( b a c k w a r di n d u c t i o n ) 等等。 2 3 博弈论在认知无线电系统中的应用 2 3 1博弈论应用于认知无线电的可行性分析 在认知无线电网络中,认知用户基于动态频谱感知和其他用户决定的通信 参数可以对频谱的使用做出明智的决定。同时,那些竞争频谱资源的认知用户 没有动机去相互合作,表现很自私。因此,我们很自然的从博弈的角度上研究 认知用户的智能行为和他们之间相互影响。 博弈论是一种数学工具,分析多决策者之间策略的相互作用,它可以使用 具体的模型来模拟认知无线电网络中用户之间的竞争和合作。它不仅提供了有 效的博弈模型,而且还指出明确的均衡标准来研究各种博弈( 静态或动态的, 完整的或不完整的信息,非合作或合作) 结果的最优性。这些博弈模型和均衡 标准已经在认知无线电的资源分配( 如:频谱分配,功率控制) 中得到广泛研 究。使用博弈论来研究认知无线电的资源分配问题的重要性是多方面的: 首先,我们模拟用户之间的资源分配( 主用户和认知用户) 为一个博弈, 1 5 2 博弈论及其在认知无线电的应用 那么就可以用标准的博弈结构来分析用户之间行为,就可以充分利用博弈论中 的理论成果。 第二,博弈论为我们解决资源分配问题上提供了不同的优化准则。比如说, 认知无线电网络中的功率控制问题一般是多目标优化问题,是很难去分析和解 决。博弈论在各种网络场景中为我们提供了明确的均衡标准去估计博弈最优化。 第三,非合作博弈理论,一个最重要的博弈理论,使我们只使用本地信息 能够为资源分配获得高效率的分配办法。 2 3 2 博弈论分析的过程 利用博弈论来分析认知无线电的资源分配问题是可行有效的,认知无线电 中资源分配的关键问题就是有关策略选择的问题,其研究的核心就是相关算法 的设计,例如功率控制问题研究的关键就是功率控制算法的分析设计。那我们 使用博弈论分析功率控制算法时着重看以下四个方面的问题: 1 ) 算法具有稳定状态吗? 2 ) 这些稳定状态是什么? 3 ) 这些稳定状态是我们所需要的吗? 4 ) 算法收敛到稳定状态还需要什么约束条件? 图2 2 给出了认知无线电的博弈分析: 下面我们将从上述的四个方面问题来阐述如何使用博弈论来分析认知无线 电中的资源分配算法。 2 3 2 1算法是否具有稳定状态 大多数非合作博弈的稳定状态都是纳什均衡。若一个策略集合s + 满足式子 ( 2 1 ) ,我们就称它为纳什均衡。也就是说,在纳什均衡中没有一个博弈者愿 意、也不能通过改变他的选择策略来获得收益。当博弈论模型比较简单时,我 们常用不动点定理来判断纳什均衡的存在性,但是这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论