




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、硕士学位论文认知无线电系统功率控制和频谱分配技术研究与闭环功率控制实现Study of Power Control and Spectrum Allocation and Implementation of Close Loop Power Control in Cognitive Radio SystemA thesis submitted toXian Jiaotong Universityin partial fulfillment of the requirementsfor the degree ofMaster of Engineering ScienceByJi Feng(Inf
2、ormation and Communication Engineering)Supervisor: Associate Prof. Xinmin LuoMay 2021论文题目:认知无线电系统功率控制和频谱分配技术研究与闭环功率控制实现 本研究得到国家高技术研究开展方案“863”方案编号:2005AA123910,陕西省自然科学基金工程编号:2006F41,陕西省科技攻关方案工程编号:2005K04-G11资助。学科专业:信息与通信工程申请人:冯冀指导教师:罗新民 副教授摘 要认知无线电技术能够主动检测频谱使用情况,自适应的改变自身通信参数。在不影响授权用户的前提下,择机选择授权用户的空闲频
3、段进行通信,具有灵活、频谱利用率高等优点,因而引起了国内外研究者的广泛关注。由于认知无线电用户与授权用户共享频段,且授权用户具有最高优先级,使认知无线电相关技术具有新的特点。论文对认知无线电系统的功率控制和频谱分配技术展开研究,并设计实现了认知无线电实验系统上的闭环功率控制模块。首先,论文在分析认知无线电自适应、交互式决策过程的根底上,建立了功率控制的博弈论模型。针对采用非共享机制的认知无线电系统,提出了基于函数的功率控制博弈算法。仿真结果说明:与已有算法相比,新算法在保证认知无线电用户信干噪比的前提下,提高了系统吞吐量。针对采用共享机制的认知无线电系统,改良了效用函数,提出了基于指数惩罚系数
4、的功率控制博弈算法。仿真结果说明:新算法保障了授权用户足够低的掉线概率和认知无线电用户的信干噪比,有效控制了发射功率。其次,针对采用OFDM技术的认知无线电系统中占用信道数和时间开销的矛盾,论文提出实际吞吐量的概念及基于此概念的一种最优频谱分配策略,并设计了基于遗传算法的最优策略求解方法。仿真结果说明:当分配给认知无线电用户的频谱资源较少时,实际吞吐量随着分配的频谱资源的增多而增大。随着占用的频谱资源进一步增多,与授权用户发生冲突的概率增大,实际吞吐量反而呈单调下降趋势。论文提出的策略对认知无线电用户占用信道数进行了优化,提高了系统性能。最后,论文在调试认知无线电实验系统射频模块的根底上,设计
5、并实现了闭环功率控制模块。调试结果说明:在射频模块工作正常的根底上,本模块能够对发射功率进行准确、实时的控制;在移动情况下,能够对信道增益的变化做出及时补偿,保障了接收端足够高的信噪比和足够低的误码率。关 键 词:认知无线电;博弈论;功率控制;频谱分配;闭环论文类型:应用研究Title:Study of Power Control and Spectrum Allocation and Implementation of Close Loop Power Control in Cognitive Radio SystemThis research was funded by the Natio
6、nal High-tech Research and Development Plan863” Plan,Shaanxi Province Natural Science FundNo.2006F41and Shaanxi Province Scientific and Technological PlanNo.2005K04-G11.Speciality:Information and Communication EngineeringApplicant:Ji FengSupervisor:Associate Prof. Xinmin LuoABSTRACTCognitive Radio t
7、echnology can detect the utilization of the spectrum initiatively, and change its communication parameters adaptively. On the premise of no prejudice to licensed users, cognitive radio can choose the idle spectrum of licensed users to communicate in proper opportunities. For its advantages of agilit
8、y, and high spectrum utilization, cognitive radio has been concerned widely by the scholars at home and abroad. Because licensed users share spetrum resource with cognitive users and have the highest priority, the technologies in cognitive radio have new characteristics. The technologies of power co
9、ntrol and spectrum allocation in cognitive radio systems is researched, and close loop power control module in cognitive radio experimental system is designed and implemented in this thesis.Firstly, based on the analysis of adaptive and interactive decision process in cognitive radio, a game theory
10、model of power control is established. Aimed at cognitive radio system based on exclusive model, a power control game algorithm based on arctan function is proposed. The simulation results show that new algorithm not only guarantees the cognitive users SINR,but also imporves the system throughput co
11、mpared with other algorithms. Aimed at cognitive radio system based on common model, the utility function is improved,and a power control game algorithm based on exponent chastisement factor is proposed. The simulation results show that new algorithm guarantees the SINR of cognitive users and low en
12、ough outage probability of licensed users, and the transmitting power is controlled effectively.Secondly, aimed at the contradiction between number of occupied channels and time cost in OFDM cognitive radio system. a goodput concept and an optimal spectrum allocation strategy based on this concept a
13、re proposed. And a method based on genetic algorithm for the solution of the optimal strategy is designed. The simulation results show that when the spectrum resource allocated to the cognitive users is small, the goodput increases with the increase of allocated spectrum resource; when the occupied
14、spectrum resource by cognitive users increases further, the conflict probability to licensed users increases, and the goodput decreases monotonically with the increase of allocated spectrum resource. This strategy proposed in the thesis optimizes the number of occupied channels by cognitive users, a
15、nd improves the OFDM cognitive radio system performance.Finally, close loop power control module in cognitive radio experimental system is designed and implemented based on debugging of RF module in experimental system. The debugging results show that transmitting power can be controlled accurately
16、and in real-time by this module based on RF modules normal operation; when the experimental terminal is moving, the change of channel gain can be compensated in time, and SNR and BER in receiver can be guaranteed.KEY WORDS: Cognitive radio; Game theory; Power control; Spectrum allocation; Close loop
17、TYPE OF THESIS: Applied Research目 录1 绪论1 选题背景及意义1 认知无线电的定义及研究现状2 论文完成工作与结构安排32 博弈论及其在认知无线电中的应用5 博弈论概述5 博弈论的定义5 博弈论的根本模型及分类6 纳什均衡的分析和求解7 博弈论在认知无线电中的应用10 认知无线电的交互作用10 博弈论在认知无线电中的应用11 认知无线电功率控制算法的博弈论建模12 本章小结133 基于博弈论的认知无线电功率控制算法14 现有的基于博弈论的功率控制算法143.1.1 SINR平衡算法143.1.2 Saraydar-Mandayam算法153.1.3 Koski
18、e-Gajic算法16 现有算法小结17 基于非共享机制的认知无线电系统功率控制算法17 基于非共享机制的认知无线电系统模型17 算法的博弈论建模193.2.3 纳什均衡求解和算法流程22 算法收敛性证明24 基于共享机制的认知无线电系统功率控制算法253. 干扰温度的提出背景和根本概念25 基于共享机制的认知无线电系统模型27 算法的博弈论建模28 纳什均衡求解和算法流程30 算法收敛性证明30 仿真实验及分析32 基于非共享机制的认知无线电系统功率控制算法32 基于共享机制的认知无线电系统功率控制算法38 本章小结414 基于实际吞吐量的认知无线电频谱分配策略43 问题描述43 系统模型4
19、3 基于OFDM技术的认知无线电系统43 通信模型44 基于实际吞吐量的频谱分配策略46 实际吞吐量46 传输时间损失率47 遗传算法求解48 仿真实验及分析49 本章小结505 认知无线电实验系统的闭环功率控制实现51 认知无线电实验系统概述51 闭环功率控制的原理52 闭环功率控制实现方案52 工作流程52 硬件系统及其接口53 帧结构设计及主要参数57 闭环功率控制的软件设计59 调试与实验结果62 射频调试结果62 闭环功率控制调试结果64 本章小结666 结论与展望67 论文总结67 下一步工作展望68致 谢70参考文献71攻读学位期间取得的研究成果74声明CONTENTS1 Pre
20、face1 1.1 Topic Significance and Background1 1.2 Definition of Cognitive Radio and Status quo of Research2 1.3 Main Work and Structure of Thesis32 Game Theory and Its Application in Cognitive Radio5 Summarization of Game Theory5 Definition of Game Theory5 Models and Categories of Game Theory6 2.1.3
21、Analysis and Solution of Nash Equilibrium7 2.2 Application of Game Theory in Cognitive Radio10 Interactions of Cognitive Radio10 2.2.2 Application of Game Theory in Cognitive Radio11 Modeling of Power Control Based on Game Theory in Cognitive Radio12 2.3 Brief Summary133 Power Control Algorithms Bas
22、ed on Game Theory in Cognitive Radio14 3.1 Current Power Control Algorithms Based on Game Theory14 SINR Balance Algorithm14 Saraydar-Mandayam Algorithm15 Koskie-Gajic Algorithm16 Summarization of Current Algorithms17 3.2 Power Control Algorithm in Cognitive Radio System of Exclusive Model17 Cognitiv
23、e Radio System Based on Exclusive Model17 Modeling of Power Control Algorithm Based on Game Theory19 Nash Equilibrium Solution and Algorithm Procedure22 3.2.4 Proof of Algorithm Convergence24 3.3 Power Control Algorithm in Cognitive Radio System of Common Model25 Background and Basic Concepts of Int
24、erference Temperature25 Cognitive Radio System Based on Common Model27 Modeling of Power Control Algorithm Based on Game Theory28 Nash Equilibrium Solution and Algorithm Procedure30 3.3.5 Proof of Algorithm Convergence30 3.4 Simulations and Analysises32 3.4.1 Power Control Algorithm in Cognitive Rad
25、io System of Exclusive Model32 3.4.2 Power Control Algorithm in Cognitive Radio System of Common Model38 3.5 Brief Summary414 A Spectrum Allocation Strategy Based on Goodput43 4.1 Problem Description43 4.2 System Model43 Cognitive Radio Systems Based on OFDM43 Communication Models of Licensed Users
26、and Cognitive Users44 4.3 A Spectrum Allocation Strategy Based on Goodput46 Goodput46 Loss Ratio of Transmitting Time47 Solution of Genetic Algorithm48 4.4 Simulations and Analysises49 4.5 Brief Summary505 Implementation of Close Loop Power Control in Cognitive Radio System51 5.1 Summarization of Co
27、gnitive Radio Experimental System51 5.2 Principle of Close Loop Power Control52 5.3 Implementation Project of Close Loop Power Control52 Work Flow52 Hardware System and Interfaces53 Design of Frame Structure and Working Parameters57 5.4 Software Design of Close Loop Power Control59 5.5 Debugging and
28、 Results of Experimentation62 Debugging and Results of Radio Frequency62 Debugging and Results of Close Loop Power Control64 5.6 Brief Summary666 Conclusions and Suggestions67 6.1 Conclusion67 6.2 Expectation68Acknowledgements70References71Achievements74Declaration在每一章的末尾插入下一章的MathType的章标记打印前将其字体颜色变
29、为白色,在打印预览中看不见即可:1 绪论1.1 选题背景及意义近年来,随着人们对无线通信业务需求的不断提高,各种无线通信技术得到前所未有的迅猛开展。在此过程中,无线频谱空间被划分给各种不同的通信技术使用,在大多数国家3GHz以下的频段几乎全局部配给了已授权的无线通信系统或称为授权用户Licensed User1。一方面,这种固定的频谱划分方式使得可用频谱资源变得越来越少。另一方面,已授权频带的不同频段频谱利用率相差悬殊,一些频段使用得非常频繁,而另一些频段大局部时间内却没有用户使用,整体上来看目前频谱利用率低下。美国联邦通信委员会Federal Communications Commissio
30、n, FCC的下属机构SPTFSpectrum Policy Task Force的报告2说明,目前美国的无线频谱资源利用率一般介于15%到85%之间;另有文献说明34 GHz频带利用率只有,45 GHz频带利用率下降到3。可以看出频谱资源的紧张的一个重要原因是当前的这种频谱分配和管理方式限制了已授权的空闲频段被非授权用户使用。为了解决这种效率低下的频谱管理方式与不断增长的频谱资源需求之间的矛盾,Joseph Mitola博士于1999年提出的认知无线电Cognitive Radio, CR的概念得到了学术界广泛的关注。他描述了认知无线电如何通过一种“无线电知识表示语言Radio Knowle
31、dge Representation Language, RKRL的新语言提高个人无线业务的灵活性4。FCC于2003年12月发出以最正确方式实现认知无线电的提议5,6,结合软件定义无线电方法,以自适应、动态的方式实现多用户共享频谱资源的频谱管理和利用。由于认知无线电系统建立在对已授权频段利用的根底上,因此以下几个问题需要研究:如何保证授权用户不受认知无线电用户影响;如何保障认知无线电用户通信质量,提高认知无线电系统容量;如何合理利用有限的频谱资源,并对认知无线电用户功率进行有效控制。功率控制和频谱分配技术是无线资源管理Radio Resource Management, RRM中的关键内容7
32、。发射功率和频谱资源如果得到有效利用,就能够使认知用户对授权用户的干扰减小,同时使认知无线电系统的容量增加、通信质量改善。因此如何设计在各种工作机制下的功率控制算法,如何确定合理的频谱分配准那么来优化系统性能,是认知无线电研究中的重要内容。当前,博弈论Game Theory应用于功率控制问题成为学者研究的热点。博弈论着重于紧缺资源的分布式求解,算法复杂度低,求解过程简单,所需全局信息较少,适合于应用到认知无线电系统中。同时,为了更好的验证认知无线电的功能,在已有的实验系统平台上实现功率控制功能是十分必要和有益的。这将为以后实验终端的组网和实现礼仪协议等功能打下扎实的根底。1.2 认知无线电的定
33、义及研究现状1999年,Mitola博士在他的文章8中首次指出认知无线电是“一种具有通过基于模型的推理来实现通信相关性能的能力的无线电设备。随后在他的博士论文9中,提出了认知循环Cognition Cycle,CC的概念,并且对各模块的功能进行了详细分析。FCC在2002年成立了SPTF小组专门研究提高频谱资源利用率的方法,给出了一个基于干扰温度Interference Temperature的认知无线电定义2。并从发射端具体操作的角度指出认知无线电是“一个能够通过与外部环境交互信息来调整自己通信参数的无线电设备10。德国的Fatih Capar等人给出了一种比拟简单,容易实现的认知无线电定义
34、11,即认知无线电用户可以检测出某个频段的授权用户是否正在发射信号,如果有那么认为有授权用户在使用该频段,如果没有那么认为可以利用这个频段来传送信息。同时认知无线电用户还必须保证,在它使用授权频段的过程中,一旦发现授权用户重新开始工作,应能够立即停止对该频段的使用,对授权用户产生尽可能小的干扰。继Mitola博士于1999年首先提出认知无线电的概念后,他以及其他组织和学者在认知无线电理论和技术方面不断取得新的成果。U. C. Berkley大学的研究人员通过利用一些现有的软件无线电平台根本验证了由Capar等人提出的简化的认知无线电定义。FCC于2004年5月开始考虑允许认知无线电可以在不对授
35、权用户产生有害干扰的情况下使用电视频段12。IEEE于2004年10月成立了工作组开始着手研究和制定工作于电视频段的、基于认知无线电技术的无线局域网Wireless Regional Area Network,WRAN技术标准13。从2005年开始,认知无线电技术在世界范围内得到了广泛关注,目前已经能看到不少关于认知无线电关键技术的研究思路和成果。国家“十一五863高技术研究开展方案申请工程指南中已经将认知无线电技术列为一项关键的研究领域。本文作者所在的课题组在863工程资助下,在认知无线电系统实验平台的设计与实现、礼仪与协议、授权用户检测等方面取得了一定的成果。随着软件无线电技术的开展,通过
36、自适应调制的方式提高单个链路的性能取得了一定的研究成果。然而,由于认知无线电具有感知环境的能力,使得一条链路参数的改变将改变其他链路的用户正在感知的无线环境,有可能导致新的自适应调整发生,如此反复,网络内用户动态的调整和相互依存关系给认知无线电网络性能的分析带来了很大困难。James Neel提出使用结合博弈论的方法来分析这一问题14,尤其在多个用户的功率控制问题上得到了很好的效果。起源于经济学的博弈论是一种对紧缺资源的系统分布式配置问题的求解方法。使用该理论分析通信网络的功率控制、频谱管理、拓扑结构生成等问题取得了丰富的研究成果15-24。近年来,众多学者在功率控制领域做出了许多成果。主要目
37、的是减小共道干扰,保证用户的信干噪比Signal to Interference Plus Noise Ratio, SINR,从而使系统具有更高的信道利用率和效劳质量Quality of Service, QoS保障。以无线网络的功率控制为例。Foschini和Miljanic等人提出了基于信干噪比平衡的功率控制分布式算法,并讨论了其收敛条件15。Famolari和Mandayam提出了干扰方程Interference Function的概念,研究了功率控制迭代算法收敛的条件16。Yates等人较早研究了在上行链路中影响功率控制问题的假设干因素17。Alpcan在功率控制中引入了支付函数,并
38、提出了两种上行链路中的改良算法18。以美国伊利诺理工大学的David J. Goodman教授为代表的国外学者和组织,自1998后相继发表了一系列文章19,20,23。Saraydar和Mandayam等人改良了用于多小区的分布式功率控制技术,提出了发射功率的“价格概念,并将之作为一种影响用户传输数据行为的控制机制19。Shah和Saraydar等人在另外两篇文献中详细讨论了基于效用函数Utility Function和价格函数Price Funciton的功率控制机制,并谈到了关于帕累托改良Pareto Improvement的问题20,23。Koskie和Gajic在引入价格函数的根底上对
39、信干噪比平衡算法进行了改良,在牺牲很小的信干噪比损失的前提下大幅降低了发射功率24。此外,一些学者将博弈论应用于功率与传输速率联合控制、功率控制与频谱接入、功率控制与波束成形,功率控制与网络拓扑结构生成等相结合,取得了珍贵的成果25-28。认知无线电中的频谱分配是指根据需要接入系统的认知无线电用户数目及其效劳要求将频谱分配给一个或多个指定用户。频谱分配策略的选择直接决定系统容量、频谱利用率以及能否满足用户因不同业务而不断变化的需求。德国Karlsruhe大学Fiedrich Jondral教授提出了频谱共享池Spectrum Pooling模型29。美国国防高级研究方案局启动了下一代XG方案n
40、eXt Generation, XG,其中实现灵活的频谱分配是该方案的主要目标之一。国内外学者在具体的频谱分配算法方面取得了一些成果30-32。但在如何确定占用的信道数方面研究较少。本论文将对这一频谱分配策略展开研究。1.3 论文完成工作与结构安排在国家高技术研究开展方案“863方案基金资助下,本文作者参与了“认知无线电系统关键技术2005AA123910工程的研究工作。主要完成的工作如下:1提出认知无线电系统的参数调整过程实质是一个交互式决策过程。该过程可通过非合作博弈方法求解。并由此建立了认知无线电系统的功率控制博弈论模型。2针对基于非共享机制的认知无线电系统,根据认知无线电用户对信干噪比
41、的满意度特点,提出了一种新的效用函数。设计了一种基于非合作博弈的功率控制算法并证明其收敛性。证明了该博弈中纳什均衡解的存在性和唯一性。通过仿真验证了算法的收敛性和稳定性,讨论了各个参数对算法性能的影响,并与其他算法的性能进行了比拟。3在以上工作的根底上,针对基于共享机制的认知无线电系统,改良了效用函数,引入了基于指数惩罚系数的价格函数,设计了新的基于非合作博弈功率控制算法并证明其收敛性。通过仿真验证了该算法收敛性、稳定性和对授权用户的有效保护。4提出了一种认知无线电频谱分配策略。推导了实际吞吐量的数学表达式,并分析了物理概念。设计了基于遗传算法的最优策略求解方法。通过仿真验证了实际吞吐量与所分
42、配子信道数的关系和最优策略求解方法的有效性。5负责了认知无线电硬件实验系统射频发射、接收模块的实现与调试,并与基带和中频模块实现了成功对接。在射频联调成功根底上,设计实现了认知无线电实验系统的闭环功率控制方案。本论文的结构安排如下:第一章,绪论。本章介绍了选题的背景和意义,认知无线电技术的定义与研究现状,论文完成的主要工作和论文结构安排。第二章,博弈论及其在认知无线电中的应用。本章介绍了博弈论的根本概念、根本模型、分类和求解方法,分析了认知无线电的交互作用和博弈论在其中的应用,建立了认知无线电功率控制算法的博弈模型。第三章,基于博弈论的认知无线电功率控制算法。本章首先介绍了已有的功率控制博弈算
43、法。分别针对基于非共享机制和共享机制的认知无线电系统,提出了新的效用函数模型,设计了新的功率控制博弈算法,对算法收敛性给出了证明。最后对两种新算法给出了仿真结果和分析。验证了算法收敛性,分析了关键参数对算法性能的影响,并与已有算法的性能进行了比拟。第四章,基于实际吞吐量的认知无线电频谱分配策略。本章首先提出了采用OFDM技术的认知无线电系统最优占用信道数的策略选择问题。推导了实际吞吐量的概念,设计了策略选择算法。最后通过仿真验证了实际吞吐量与分配信道数的关系和策略选择算法的有效性。第五章,认知无线电实验系统的闭环功率控制实现。本章首先简要介绍了实验系统的根本情况和闭环功率控制的原理。接着给出了
44、闭环功率控制的实现方案和各个模块的软件设计流程。最后在实验系统上予以实现。第六章,结论与展望。总结论文完成的工作和主要创新点,指出存在的问题以及以后的研究方向。2 博弈论及其在认知无线电中的应用2.1 博弈论概述2.1.1 博弈论的定义在人类的生活生产活动中,经常需要针对不同问题研究对策。然而某些问题的决策不仅决定于可选对策对决策人带来的收益,也决定于此决策对其他竟争对手产生的影响,这种时候决策者往往处于进退两难的境地。博弈论在这样的背景下应运而生。博弈论,也称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。当一个主体的决策受到其他人决策的影响,而且又反过来影响其
45、他人的决策时,这种决策和均衡问题就需要用博弈论的方法来解决33。众多学者给博弈论下的定义也不尽相同,比方:1博弈论提供了一种在相互作用的决策条件下建模和分析的框架及语言,该决策条件是指有着局部相互冲突目标的多个决策者互相产生影响34。2博弈论是研究博弈情景下博弈参与者的理性行为选择的理论;或者说,是关于竞争者如何根据环境和竞争对手的情况变化,采取最优策略和行为的理论35。3博弈论是一个分析工具包,它被设计用来帮助我们理解所观察到的决策主体相互作用的现象36。尽管关于博弈论的定义在描述上有些许区别,但其本质意义是一致的,即博弈论是在决策者具有相互冲突目标或交互作用条件下的一种策略选择理论。博弈论
46、与常规的优化决策理论的不同之处在于:博弈论中参与者在利益上有冲突;参与者要各自做出优化决策,并企图使个人的利益最大化;每个人的决策和他人之间有相互作用,即他人的决策会影响某个人,而某个人的决策也会影响他人;在博弈论中一般假定参与决策的个体均为“理性的Rational,从而进行理智的逻辑思维。博弈论中的所谓“理性,一般不是指道德标准。以博弈的参与者的眼光来看,他们试图去实施自己认为可能是最好的行为,尽管这种行为有可能损害了其他的参与者。因此“理性行为似乎有点“利己,而“不管是否损人。由于参与者的相互依存性,博弈中一个理性的决策必定建立在预测其他参与者的反响之上。这意味着参与者应该清楚地知道自己的
47、目标和利益,在博弈中针对其他参与者的策略尽可能地选择能使自己收益最大化的策略。这样,博弈中任何一个参与者的决策不仅会影响其他参与者的选择,也会影响博弈最终的结果。我国古代著名的“田忌赛马可以看作是最早的博弈论应用案例。大多数学者认为,博弈理论始于1944年冯.诺依曼John Von Neumann和经济学家摩根斯坦Oskar Morgenstern合作的?博弈论与经济行为The Theory Games and Economic Behavior?一书。在上个世纪50年代,纳什Nash为非合作博弈的一般理论奠定了根底,他提出了博弈论中最重要的概念纳什均衡Nash Equilibrium,开辟了
48、博弈论的一个全新领域。他规定了非合作博弈的形式,定义了著名的“纳什均衡点37。此后四十余年里,大量学者致力于开展“纳什均衡点理论,探讨其实际应用的可能性。到了20世纪80年代后期,博弈论进入繁荣时期,产生了许多研究成果,博弈论的应用范围也不只是经济学的一个分支,而成为一种方法论,在各个领域都得到了广泛应用。2.1.2 博弈论的根本模型及分类博弈论自产生到开展至今已形成了较成熟的理论体系,它具有其自身的根本模型。一个完整的博弈过程用以下5个方面来描述:。1:参与者在英文中译为Player,也可称为博弈方,是参与博弈的直接当事人,是博弈的决策主体和策略制定者。其中,表示该博弈中有个参与者。在不同的
49、博弈中参与者的含义是不同的,既可以是个人也可以是团体或者集团,关键在于这些参与者是为了一个共同的目标和利益参与博弈的。2:博弈策略在英文中译为Action,参与者可选择的全部行为或策略的集合。即规定每个参与者在进行决策时同时或先后,一次或屡次可以选择的方法、做法或经济活动的水平、量值等。它是参与者进行博弈的工具和手段,每个策略集合至少应该有两个不同的策略。所有参与者策略集合的笛卡尔积构成了博弈的策略空间,其中,表示参与者可以选择的策略集合。3:博弈次序在英文中译为Strategy。在现实的各种决策活动中,当存在多个独立参与者进行决策时,有时候这些参与者必须同时做出选择,因为这样能保证公平合理。
50、而很多时候各参与者的决策又必须有先后之分,并且在一些博弈中每个参与者还要作不止一次的决策选择,这就产生了一个次序问题。因此规定一个博弈就必须规定其中的次序。4:博弈信息在英文中译为Information。信息对于博弈参与者至关重要,掌握信息的多少将直接影响到决策的准确性,从而关系到整个博弈的成败。有经验的参与者尽可能多地收集博弈信息,力争在选取策略和进行决策时掌握主动。5:参与者效用在英文中译为Utility。也可称为参与者收益。是指参与者从博弈中付出的代价或得到的收益,它是所有参与者策略的函数,因此也可以称为效用函数。可用公式表示为:。对应于各参与者的每一组可能的决策选择,博弈都有一个结果表
51、示各参与者在该策略组合下的得与失。这就是效用函数。对于每一个参与者,效用函数的结构与取值将会影响到参与者的行为,因而也影响到了博弈的最终结局。由此可知,效用函数确实定在博弈论研究中非常重要。从博弈的不同角度和参与者的不同观点出发,可以产生许多形形色色的效用函数,并不唯一。博弈论就是系统研究用上述方法定义的各种各样的博弈问题,寻求各博弈方合理选择策略情况下博弈的解,也就是均衡Equilibrium。其中最根本的三个元素是参与者、博弈策略和效用。现实中各种博弈可以从不同的角度进行分类。根据参与人的多少,可以将博弈分为两人博弈和多人博弈;根据参与人是否合作,可以将博弈分为合作博弈Cooperativ
52、e Game和非合作博弈Non-cooperative Game;根据博弈的结果,又可以将博弈分为零和博弈,常和博弈和变和博弈。在非合作博弈中,现在最流行也最有用的分类方法是从博弈参与人的行动次序和在博弈中所获信息的差异角度来分,具体为:从决策的先后次序来分,博弈可以分为静态博弈和动态博弈;从参与人各种博弈信息的获得差异来分,博弈可以分为完全信息博弈和不完全信息博弈。静态博弈指的是博弈中参与者同时做决策,或虽非同时但后做决策者并不知道前面的决策者采取的具体策略;动态博弈指的是:参与者的决策过程有先后顺序,且后决策者能够观察到先决策者所选择的策略。完全信息指的是每一个参与者对其他参与者的特征、策
53、略空间及效用函数有准确的认识;否那么,就是不完全信息。2.1.3 纳什均衡的分析和求解均衡是一个博弈过程的最终稳定状态。在均衡点上,每个参与者都不会主动改变自己的策略。前面已经讲到非合作博弈可从两个角度分成四类,而这四类博弈对应者各自不同的均衡点。如表21所示。表21 非合作博弈的分类及对应的均衡概念博弈行动顺序静态动态完全信息完全信息静态博弈纳什均衡完全信息动态博弈子博弈精炼纳什均衡不完全信息不完全信息静态博弈贝叶斯纳什均衡不完全信息动态博弈精炼贝叶斯纳什均衡在这里,我们重点分析非合作博弈中的完全信息静态博弈及纳什均衡。非合作博弈强调的是个体理性、个体最优决策,每个用户的选择策略的原那么是最
54、大化自己的效用,即:式中:参与者在一次博弈中所选择的策略;除了参与者以外的其余个参与者在该次博弈中的策略矢量;参与者的策略集合;参与者的效用函数;本次博弈的参与者集合。纳什均衡就是各个参与者在非合作博弈过程中到达的稳定状态。下面给出纳什均衡的数学定义37:定义2-1:如果一个博弈过程,对有:式中:参与者在纳什均衡点处选择的策略,那么这个策略是博弈的纳什均衡点。对于非合作博弈中的每一个参与者,真正成功的措施应该是:针对其他参与者所采取的决策,相应地采取最有利于自己的策略。或者说,对于对手的每一决策做出最有利于自己的反响。因此,如果存在这样一种策略组合,为了极大化自己的收益,每一个参与者所采取的策
55、略是其对手所采取策略的最正确对应反响,即没有一个博弈参与者会轻率地偏离这个策略组合而使自己蒙受损失,那么博弈存在纳什均衡点,该组策略为纳什均衡策略。针对上面的分析,给出纳什均衡的第二个定义:定义2-2:在集合上的连续函数的最优策略集合称为的最正确对应反响Best Response Correspondence。即映射:根据定义2-1,纳什均衡点处应满足:式中:纳什均衡点处所有参与者所选策略的向量,即,;纳什均衡处所有参与者所选策略的最正确对应反响组成的向量,即,。纳什均衡是一个博弈的稳定状态,是博弈最可能到达的状态,是每一个参与者都不愿意背离的平衡点。当一个博弈过程到达纳什均衡时,所有用户都没
56、有动机去单独改变自己的状态。也就是到达纳什均衡后,给定其他用户的策略不变,如果某用户单独改变自己的策略,那么他的效用函数将减小。图21给出了一个2人博弈到达纳什均衡的示意图。图中两条直线的交点满足式,为纳什均衡点。图21 2人博弈纳什均衡示意图利用纳什均衡概念可以对非合作博弈中各个参与者的决策选择和博弈结果进行分析和预测。根据纳什均衡的定义,当给定其他参与者采用某个纳什均衡策略时,所考察的参与者同样选择该纳什均衡的策略是符合自己利益的。因此如果一个参与者预测或判断其他参与者都会采用某个特定的纳什均衡策略,只要这个参与者是理性的,该参与者的决策选择和博弈的结果就较易判断。这种利用博弈中的纳什均衡概念,分析判断博弈方选择和博弈结果的方法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 加装电梯属于合同范例
- 中央空调保修合同范例
- 个人股权收购合同样本
- 借款收款合同范例
- 书批发合同范例
- 代工肥料合同范例
- 路桥工程施工质量控制试题及答案
- 公会授权合同范例
- 修剪绿篱养护合同范例
- 临时群演合同范例
- 隐私与保密信息管理制度
- 《隧道防火保护板系统技术规程》
- 2025年安徽黄山旅游集团招聘笔试参考题库含答案解析
- 中铜国际贸易集团有限公司招聘笔试冲刺题2025
- 商演服务合同
- 《建筑采光分析》课件
- 海洋机器人与人工智能知到智慧树章节测试课后答案2024年秋哈尔滨工程大学
- 上海市境内旅游合同 示范文本(2013版)
- 钢构制品加工协议
- “煎炒烹炸”与中药疗效(安徽中医药大学)知道智慧树章节答案
- 病毒蛋白相互作用
评论
0/150
提交评论