版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
复杂环境下的无人机路径规划与避障策略目录 11绪论 21.1研究背景与意义 21.2国内外现状 3 51.4论文组织结构 52问题描述及模型建立 62.1无人机的工作场景 62.2无人机通信模型 72.3无人机电量模型 9 2.5问题建模 123.1多参数的随机多序列问题 20 243.6算法性能分析 284基于GAT网络的强化学习算法解决序列问题 304.1强化学习介绍 4.2图注意力网络GAT介绍 304.3算法设计 4.4实验仿真分析 5算法性能对比 365.1单无人机工作性能比较 5.2多无人机协同工作性能比较 376结束语 38 39 时代发展和科技进步带动了人工智能实体的发展,无人机就是其中之一。无人机由无线电遥控装置完全或间歇地操作。无人机具有其独特的优势:部署灵活、可搭载MECserver,其可以很好的应对农业物联网场景下,信息采集节点多、节点处当今物联网技术高速发展,为了更好地采集空间传感器内存放地信息、协助地面基站做边缘计算,需要对信息载体无人机做路径规划,考虑其在悬停、运算、飞行等多个场景下的通信情况和电量情况。为了进一步加快任务进程,考虑采用多无人机协同工作模式,以减少单个无人机的任务负担。当前已经存在很多成熟的无人机路径规划算法,但多将问题场景视为简单的TSP问题,以飞行距离为优化目标,的舞台,其具有很好的灵活性,但其考虑通信、电量模型后的规划效果较差。这些算法不能满足无人机的路径规划对于真实场景的需要本,因此文将着重对于无人机路径规划问题进行研究,考虑无人机自身电池容量有限、数据传输和采集过程受通本文将针对上述问题,更准确的还原真实场景,建立无人机电量损耗模型、无人机通信模型以及多无人机协同工作的辅助边缘计算系统,计算仿真以多无人机任结合的强化学习算法,其相比于DQN强化学习同样具备较高灵活性且有较高准确率,并对传统蚁群算法、遗传算法、粒子群算法、模拟退火简单解决TSP问题模型进行改进。本文将对5类算法进行性能比较,为多无人机协同辅助边缘计算系统提1绪论传感技术的发展使得人力得到解放,例如在最常见的新型智能农业模型中,传感器可以更加及时准确的记录环境中的温度、湿度、作物情况等信息。人工定时回收传感器数据或者建立传感信息通道物联等方式收集各个传感器的数据都具有不够收集可以很好地避免上述问题。无人机因其具有体积小、行动灵活和可进行辅助边在采用无人机解决数据传输和边缘计算的场景中,存在无人机电量有限、通信受环境影响等一系列瓶颈问题,因此合理对无人机进行路径规划十分重要。在现实场景中,需要完成大量任务的无人机需要每隔一定时间段返回地面基站获取电能,飞其行到各个传感器进行数据采集同时需要将数据传输到地面基站,通过感知发送协议与地面基站进行传感互通,从中可以明显看出之后辅助地面基站进行一部分边缘计算。当面临处理区域范围庞大、传感器数目众多等问题时,单个无人机很难在短时间内完成任务,可以增派无人机以实现协同工作,提高效率(黄志强,方静怡,2023)。当前成熟的无人机路径规划算法多为基于图论背景的离线算法,可以从中察觉到例如蚁群算法、遗传算法、模拟退火等。传统离线算法难以考虑无人机在飞行、数据传输、边缘计算等多个过程中因电池供电不足导致无人机需要回到地面基站进行充电的问题;以上结果在一定程度上引证了本文先前构建的理论模型。首先已有的研究结果分析与理论预测保持了较高的一致性,验证了理论框架中中提出的机制的有效性。具体而言,通过研究发现关键变量之间的相关性及趋势与模型预测相吻合,这不仅增强了理论框架的可信度,也为进一步探索该领域内的复杂关系提供了实证基础。其次结果的符合性表明,理论模型中所考虑的影响因素和它们之间的相互作用是合理的,这对于理解研究现象的本质具有重要意义。此外,这一验证过程也为后续研究指明了方向,即在已证实有效的理论框架下,可以更加深入地探讨未被充分理解的因素,或是将模型应用于更广泛的情境中进行测试和优化。无法模拟无人机在真实场景下数据传输过程中单位数据流传输成功或失败两种状态。在这一背景下近几年随着强化学习不断升温,基于DQN网络的强化学习算法可以在更为灵活、动态的解决无人机路径规划问题,但其结果不够稳定,准确率不高(谢春雷,余基于上述背景,本文将建立更加具有现实意义的无人机应用场景,并对传统离线算法进行改进,使其可以满足本文提出的场景,同时提出一种基于GAT网络与强化学习相结合的离线算法,使其具有一定的灵活性,并可以高效准确的解决本文探1.2.1无人机路径规划算法的研究现状无人机路径规划问题是确立目标函数和约束条件不断得到最优解的凸函数优化问题。解决无人机路径规划问题经典模型为传统TSP模型,其主要算法有:粒子群算法、蚁群算法、遗传算法、Dijkstra和模拟退火算法等。其约束条件大都是基于平面或空间内节点序列距离最短(李文博,王丽娜,2020)。面对这局势时其具有简单性、改进空间大等优势,同时算法模式固定,只需要对无人机工作的二维或三维空间建立笛卡尔系,用距离参数表示解的优劣,就可以很好的解决问题。国内外针对于离线算法的创新性很多,Chen和Zhangll]提出了利用改进的人工场势结合A*算法、粒文章未能考虑无人机电量与通信状况。Li和Xu²1等的研究采用了A*,D*等算法,文章从无人机的不同部件的旋转特性入手,对路径规划算法进行了创新,并解决了度矩阵来确定无人机蜂群之间的耦合关系,用A*算法的优化问题解决了传统路径规的调研结论表明:传统离线算法解决路径规划问题的性能接近,单源路径问题下Wu,Guo和Lil⁴的研究结果展示了基于两棵树的RRT-connect算法,解决了传统RRT不能用于无人机路径规划和其中概率p的选择问题,使算法更为简单,并且提高算因此本文进行了细致的分析与调整。为了确保理论模型能够更贴近实际操作环境不仅对理论框架进行了严谨的推导和验证,还深入实践领域通过更加多元化的研究方法等等方式收集了大量的同行内的其他第一手资料。这些实践数据使研究能够识别并理解理论模型在应用于实际情况时可能遇到的挑战和偏差。并在此基础上引入修正迭代优化来构建适应性更强的研究过程,并被应用于修正和完善现阶段的成果,以提高其预测准确性和实用性,确保了研究结果的可信度和泛化能力。通过这些综合考量本文不仅深化了对研究主题的理解也为相关领域的研究者和从业者提供了更路径规划。Sharma,Andersen,Granmo与Goodwin⁵将DQN进行了改进,加入了RL代理的部分,更好的进行了多目标路径规划。Liu,Li,Guan,Wang⁶的文章比较详细的描述了强化学习的算法过程,于这种状态下对于如何应用于机器人路径规划问题提来解决动态环境中的多智能体问题,在这类状况中实验证明方法高效(徐涛,郑薇,2020)。Wu,Shin,Kim⁸]等人提出了一种有效的深度强化学习的惰性训练方法,将神经网络与Q-learning相结合用于深度Q-network的避障和路径规划应用解决实际问度的情况下显著减少总执行时间,其Agent被困在一个未知的环境中,可以通过自1.3研究内容及创新点本文将以农业领域中多植保无人机辅助边缘计算系统的工作模式为背景,对中间信息载体植保无人机做路径规划,考虑其在飞行、悬停、充电等多个任务过程下在自由空间内随机分布多个位置固定的传感器,传感器可以将采集的信息与无人机进行数据传输,无人机与地面基站GBS都可以做并行边缘计算,无人机数据收集的过程中保持与基站GBS的数据传输,从这些表现中可以推见数据传输结束后无人机与基站进行感知通信,分担GBS的运算压力而进行悬停边缘计算。无人机从基站GBS出发,途径所有传感器收集信息回到基站GBS。无人机电量不足时,需要及时返回基站进行充电。针对一次任务,可以增派多个无人机从而减少任务时间与电量损耗。相比于已有的研究,本文以总任务时间为优化目标,解决多无人机协同工作了保持研究结论的可复制性和可推广性,本次研究采取了多项措施以确保研究的严谨性和普遍性。通过严格遵循了科学研究的方法论原则从研究设计到数据收集、分析,每一步都力求标准化和透明化。在研究设计阶段明确界定了研究目标和变量确保研究的逻辑性和可操作性。同时采用了多种数据来源和收集方法,以增加数据的多样性和代表性,从而避免单一数据来源可能带来的偏差。通过详细的研究日志、数据收集和分析流程的描述,以及清晰的研究结果图表,都有助于研究结果的推广。本文将对传统粒子群、蚁群、遗传、模拟退火算法解决TSP问题背景进行改良,将以飞行距离最短为约束条件的TSP问题,转变为多变量随机序列总时间性能最优问题,针对算法性能选择不同的变量维度,并进行实验仿真和实验结果分析。本文提出了一种新的基于GAT网络的强化学习,现有结果明确指出了以下结论相比于经典无人机路径规划算法,该算法可以模拟真实通信场景和无人机的电量使GAT网络因其独有的注意力机制,对解决多随机变量的序列问题具有良好特性,相比于近几年热度较高的DQN网络,同样具有很好的灵活性,而且其在准确率、优化结果表现更优;本文在笛卡尔系中建立传感器和基站GBS位置模型,从中可以明显看出将三维空间问题简化为平面路径规划,使问题更具有简便性(罗杰,宋欣,2020)。1.4论文组织结构为了智能、高效解决多无人机协同路径规划问题,并对无人机的电量损耗情况进行分析研究:本文将首先进行问题分析,通过模型设计和参量假设,为算法提供真实合理的现实场景,分别建立无人机任务过程中的通信模型、电量模型、时间模型,并提出其次本文将分别对蚁群算法、遗传算法、粒子群、模拟退火算法进行简单的介绍,并对其解决传统TSP问题进行算法改进,可以从中察觉到通过仿真测试其解决不同维度的随机参数序列问题的性能设计最优可行算法。并针对同一场景进行多无其次提出新的基于GAT网络的强化学习算法。对分层强化学习和GAT网络进行介绍,并详细介绍GAT网络独有的图注意力机制,根据网络特性设计算法,生成详最后将改进后的蚁群、遗传、粒子群、模拟退火算法和基于GAT网络的强化学2问题描述及模型建立本文采用的无人机工作场景为农业领域多植保无人机辅助边缘计算系统进行数据采集和边缘计算的过程。如图1所示,空间内随机分布多个传感器SN,SN内存放无人机需要进行传输和计算的数据。在地面固定一个基站GBS作为无人机的充电多个协同工作的无人机需要进行任务分配,在这一背景下选定个体的工作范围即需要负责的SN集合。无人机需要从GBS出发途径该个体需要负责的所有的SN进行数据采集传输、传感和边缘计算工作,数据采集传输、传感和边缘计算的过程无人机架基本一致,从中本文不仅验证了阶段性研究成果的有效性,还进一步巩固了该领域内的理论基石。这一发现为本文的基础研究提供了坚实的实证支持也彰显了已有理论框架的广泛适用性和稳健性。通过对比和分析发现当前研究中的数据点与先前文献中的关键结论相契合这加深了本文对该领域内在机制的理解,也为后续研究者在这一基础上进行更深入的探索和创新提供了可能。此外该结果的一致性还意味着本文在方法论上的选择是恰当的,为后续采用类似方法开展研究树立了信心。数据 采集传输过程无人机需要从传感器获取数据,同时将数据传输到基站,每传输周期算电量使用情况,当无人机电量不能支持其飞到下一个传感器完成数据采集传输、传感和边缘计算工作并飞回基站时,需要通过回到GBS进行充电,充电过程中悬停定速度Vo=4m/s进行运动,保持高度Ho=5m不变。产产UncollectedDataTransmissionUnmannedAerialVehicle无人机在采集数据的过程与边缘计算过程均需要与地面基站进行通信,其遵循感知发送协议,在这种情况的背景下即基站为无人机分配子信道后,无人机与基站进行数据传输和通信交流。为评估无人机的感知质量,因此采用概率感知模型,其考虑到无人机在与传感器和基站的通信模型为空地链路模型,在无人机传输过充中,无人机通过正交子信道将感知数据传输给基站,以避免相互干扰。因此将无 多个角度进行了深入的探讨和验证。首先采用了多种来源的高质量数据并通过严格的筛选和清洗过程确保了数据的准确性和可靠性。这些数据覆盖了多种不同的变量和影响因素为研究进行综合分析提供了坚实的基础。在研究方法上本文采用了多种先进的统计和分析技术,以全面、客观地评估所研究的问题能够从不同角度揭示数据背后的潜在规律和关系。通过综合运用这些方法得以更深入地理解所研究现象的 当信道包含视距分量时,从无人机i到基站的路径损耗可表示为(董波,余曼,情况下,小尺度衰落Hi服从Rice分布,尺度参数Q=1,在这氛围的影响下形状参数PLNos,;=32.4+(43.2-7.6log1o(h,))×log1₀(d;)+20log₁(f.)(5)无人机都可以通过计算基站信噪比大于y¹/8的概率来评估其成功传输的概率。无人Pr,=Przos,;(1-F(XLos,;))+(1-Pros,)(1-Fa(XNLos,;)) 其中xas,=N,10rm/P,xLoSi=N,10°/P,F()=1-Q<2K,JZ(K+1)是Q=1的莱斯分布的累计分布函数(CDF),是单位方差的瑞利分布的CDF。这于这种状态下对于无人机飞行至传感器上空进行数据传输的过程,我们视为其 划分为n个数据量为di的层次,满足(方正,冯敏,2022):无人机每周期采集并向基站进行数据传输,不考虑未分配子信道的情况整个过传输成功:传输成功后将进行下一个数据量di的传输。传输失败:将重新传输数据量di的数据。在飞行过程中无人机需要时刻满足电量大于等于0,从这些表现中可以推见因此无人机在任意传感器起飞到规划路径的下一个传感器都需要满足其电量可以支持无人机飞行损耗、到下一个传感器可以完成数据采集传输、通信传感和边缘计算过程后,电量可支持飞回基站,否则将从该传感器直接返回地面基站进行充电,后选择下一个传感器进行任务(沈阳,宋雅,2023)。在干扰因素和误差来源的评进行了详尽而系统的分析。首先识别了可能影响研究结果的主要干扰因素这些因素包括但不限于样本选择偏差、数据测量误差、遗漏变量以及时间滞后效应等。针对每一个潜在的干扰因素本文都进行了深入的探讨,并尝试通过理论分析和实证检验来量化其可能的影响程度。为了控制样本选择偏差本文以确保样本的代表性和广泛性,同时还通过进行同领域专家评审来评估样本选择对结论稳定性的影响,以尽可能全面地纳入所有可能影响研究结果的因素。2.3.1飞行过程电量模型本文采用对于文献[9]中提到的飞行电量模型进行简化,公式如下:该模型中q为轨迹函数,ci、c2为受风力等因素影响的银子,a为加速度,t为时间,v为速度。在本文模型中,不考虑速度变化和高度变化,因此根据空气动理论进2.3.2悬停过程的电量损耗现有结果明确指出了以下结论无人机悬停电量损耗可表述为待机电量,即无人机开机后悬停过程所需的基础电量,这里根据调研文献[10]可以表达为两部分组成, 即数据感知传输过程的电量损耗与辅边缘计算过程的电量损耗。其中感知传输过程e₂(t)=Pt+Pb'P。为悬停功率,Pa为传输功率,b为数据量。辅助边缘计算过程中的电量损耗为:2.3.3充电过程电量模型无人机返回地面基站进行充电的电量随时间的增加过程为理想状态,假设充电电压和功率为恒定电压功率,从中可以明显看出电量随时间进行均匀增加。得到如下公式:2.3.4全过程无人机主电池电量模型设计无人机i主电池电量随时间的变化函数,该函数为以不同的无人机工作过程分段,假设上一个阶段无人机的剩余电量为Ex,则有如下模型(骆宾,江丽亮,2021):2.4.1无人机的路径时间本文中假设无人机的路径速度恒定不变,可以从中察觉到因此设飞行速度为Vo,因此得单个无人机的路径时间为:其中Dij表示无人机从传感器i到传感器j的路径长度(侯强,文静亮,2023)。这一结果与刘振教授、程晓天教授等在相关主题的研究中得到的结论基本一致,尤其是在研究过程和研究结果方面具有显著的相似性。这些相似性不仅体现在实验设计的方法论上,如数据收集与分析手段的采用,还深刻反映在核心发现与推论之中。本研究在此基础上进一步细化不仅验证了前人的结论,还在一定程度上拓展了研究的深度和广度。为理解研究主题的核心问题提供了新的视角和洞见。2.4.2无人机的充电时间 无人机飞行至传感器上空进行数据传输的过程,在这一背景下我们视为其基于感知发送协议,将数据传输过程划分为n个周期,整体的数据量D划分为n个数据量为d的层次,每周期采集并向基站进行数据传输,不考虑未分配子信道的情况整个过程,考虑上文提到传输成功与失败两种情况,得到数据根据无人机传感模型,面对这局势时当无人机进行数据收集与传输后需要与基站进行边缘计算前的准备通信,该过程存在成功与失败两种状态,若感知成功则开上结果,作者也进行了反复验证与对比,尤其是和同行的结论进行了细分析确保了所得结果的稳定性和可靠性。在与同行研究的对比中,在具体结果表述形式上可能存在细微差异但核心结论与趋势均一步增强了本研究结论的可信度。特别地作者深入探讨了与方佳佳教授研究的结论的异同点,通过对于结果一致性的判断与这种对比分析,不仅加深了对研究主题的理解,也为后续研究提供了宝贵的参考和启示为研究的完善和创新提供 其中num₁表示无人机i的充电次数,num₂表示无人机i负责的传感器个数。2.5问题建模本场景研究的问题为多无人机在最短时间内遍历全因此将时间最短作为优化目标,其中包括了无计算、无人机飞行、无人机充电等过程。设计n个无人机完成任务所需的时间集合则有T={t,t2…}。因此假设无人机的工作策略为u,则本文探究的问题3传统离线算法解决多参量随机序列问题3.1多参数的随机多序列问题通信传感、边缘计算三个过程。不考虑无人机在三维空间内存在阻碍飞行轨迹障碍物的情况,在这氛围的影响下认为无人机在基站与传感器之间、基站与基站之间飞行沿直线方向。在笛卡尔系内建立传感器节点坐标并进行编号,则无人机行进路径可以表示为传感器编号序列,于这种状态下因传统遗传、蚁群、粒子群算法解决TSP问题,以距离为优化目标,寻找传感器顺序为元素的最优一维序列。在这类状况中但在多无人机协同工作背景下, 第三章传统离线算法解决多参量随机序列问题在此基础上考虑算法性能对遗传算法、蚁群算法、粒子群算法进行改进(白杨,孟佳,2022)。在此文中,作者依据现有思路构建了计算体系,并做了相应的精简,以增强其实用性和操作简易性。通过对现方案的细致剖析和评价,剔除了一些繁琐无用的步骤,优化了流程安排,形成了一个更简洁高效的计算模型。这不仅节约了资源,还减少了处理时间,使得该方案在维持原有性能的基础上,更加容易执行和普及,设置了多样化的验证和质量控制措施。3.2.1遗传算法简介遗传算法的基本思想为达尔文生物进化论中“物竞天择,适者生存”的理论,算法模拟选择、交叉、变异过程,从这些表现中可以推见其中选择过程保留父代个体,交叉过程由两个父代个体遵循交叉原则得到新个体,变异过程由一个父代个体遵循变异原则产生新个体。遗传算法的算法的算法流程如图所示(秦松,开始开始算法初始化,设置进化代数计数器t=0、最大进化代数Tmax、交叉概率pc、变异概率pm、随机生成M个个体作为初始种群P根据适应度函数计算种群P中每个个体的适应度进行选择运算,将选择算子作用于群体。以个体适应度为标准,筛选最优个体直接遗传到下一代或通过交叉产生新个体遗传到下一代进行交叉运算,根据交叉概率pc,对种群个体两两进行交叉进行变异运算,根据变异概率pm,种群个体进行变异否是筛选最优个体,并得到其适应度结束遗传算法解决传统TSP问题中,染色体为城市编号序列(即传感器编号序列),该适应度函数,现有结果明确指出了以下结论不能考虑到实际过程中无人机的通信情况和电量损耗情况。因此在一维序列的情况下,设计适应度函数(傅成辉,宋倩,其中分母为单无人机完成任务的总时间。在笛卡尔坐标系内设置1个地面基站和20个传感器进行仿真实验,实验参数如下表所示:交叉概率pc见附录见附录见附录见附录见附录 第三章传统离线算法解决多参量随机序列问题实验结果表明对于20个传感器的无人机任务所构成的一维序列,遗传算法不稳针对不同不同数目的无人机进行传感器聚类,后分解为多个数作。在理论分析环节,重点介绍了方案的设计准则及其预期目标,并通过理论框架和逻辑推演为后续实验奠定理论基石。在实践检验阶段,本文设计了多样化的来验证方案的有效性和稳定性,采用了精准的数据记录和分析流程确保结性。为了进一步测试方案在不同条件下的适用性,本文还例,并针对每个案例调整系统配置,不仅验证了方案的合理性和可行性,也为后续实验仿真,最终最优解为3无人机协同工作,具体参数如下:交叉概率pc见附录见附录见附录 第三章传统离线算法解决多参量随机序列问题无人机参数仿真实验数据如下(魏强,陆芳,2021):3总时间T(s)总耗电量E(W●s)无人机1时间t1(s)无人机1总耗电量e1(W●s)无人机2时间t2(s)无人机2总耗电量e2(W●s)无人机3时间t3(s)无人机3总耗电量e3(Ws)图5遗传算法多无人机路径规划聚类图 实验结果分析,在这一背景下遗传算法解决多无人机协同工作问题可以较为合理的进行任务分配,使每个无人机可以保证电量充足条件下完成任务,从而在总时间上进行目标优化。实验结果基本符合预期(崔健,乔英,2023)。3.3蚁群算法解决多参量随机序列问题3.3.1蚁群算法简介蚁群算法采用仿生学原理,在这种情况的背景下通过对蚂蚁觅食寻求最优路径的过程进行核心步骤模拟,逐步确立最优解。其基本原理为每轮循环派出大量蚂蚁进行路线探索,蚂蚁在行进过程中根据已有信息素行进,在这种情况下讨论同时会为走过的路径修改禁忌表,并为行进路线留下信息素为其他蚂蚁的行进提供帮助,因此算法本身收敛速度快,但易陷于局部最优解。其算法流程图如下(安平,秦莉,2020):算法初始化,设置计数器t=0、最大迭代次数Tmax、蚂蚁个数n、初始信息素浓度0进行迭代,每轮迭代t=t+1设置当前蚂蚁个数k=0当前蚂蚁个数增加,k=k+1计算状态转移概率,选择下一个元素修改禁忌表香否是否满足k≥n是是否满足t≥Tmax是筛选最优个体,并得到其数据结果图7蚁群算法流程图3.3.2算法设计传统蚁群算法解决TSP问题中,信息素更新可以表示为:其中t表示当时时刻,n表示成熟数目,p为0-1之间的常数,(1-p)表示信息素 第三章传统离线算法解决多参量随机序列问题的挥发速率,t,表示一次迭代后,所有蚂蚁在i到j路径留下的信息素浓度总量。其中T,*表示第k只蚂蚁在路径i到j上面留下的信息素。如果第k只蚂蚁经过路径i到j,则有:在这氛围的影响下其中Q为常数,Lk表示已经走过的总长度。该算法处理对象为城市坐标,以距离作为信息素更新标准,为更好的解决三维变量序列问题,以随其中m表示随机序列的分组个数(即无人机数量),分母表示无人机任务总时间。根据M.Dorigo等人研究,对蚁群算法引入启发项”,得到蚂蚁选择路径i到j于这种状态下由于蚁群算法具有很好收敛性,因此这里不需要对传感器进行聚调节因子α1调节因子β2常数Q1常数p0.9 第三章传统离线算法解决多参量随机序列问题场景通信参数实验仿真实验数据如下:参数名称无人机数目n2总时间T(s)总耗电量E(W●s)无人机1时间t1(s)无人机1总耗电量el(W●s)无人机2时间t2(s)无人机2总耗电量e2(W●s)图8蚁群算法多无人机路径规划图从上述实验结果发现,蚁群算法具有很好的收敛性,在迭代次数约60次左右就可以获得最优解或局部最优解。从实验结果看,蚁群算法解决多无人机协同工作问题可以使无人机尽可能安排无人机不经历充电过程,从而在总时间上进行优化目标的节省。实验结果符合预期。3.4.1粒子群算法介绍粒子群算法通过模拟鸟类迁移过程寻找最优解,其过程个体表现为无质量粒子,且只具有速度、位置两个属性,在这类状况中每个粒子在所在空间域内独立寻求个体极值,并将个体极值与整个种群分享,所得到的群体极值为最优解。这一结果也与预期相同,同时也与前人构建的成熟的框架基本一致,从中本文不仅验证了阶段性研究成果的有效性,还进一步巩固了该领域内的理论基石。这一发现为本文的基础研究提供了坚实的实证支持也彰显了已有理论框架的广泛适用性和稳健性。通过对比和分析发现当前研究中的数据点与先前文献中的关键结论相契合这加深了本文对该领域内在机制的理解,也为后续研究者在这一基础上进行更深入的探索和创新提供了可能。此外该结果的一致性还意味着本文在方法论上的选择是恰当的,为后续采用类似方法开展研究树立了信心。在粒子群算法中,单个粒子速度受到其他粒子的影响,其位置受当前速度影响,v;=v;+c×randO×(pbest,-x;)+C₂从这些表现中可以推见其中vi表示粒子i的速度,xi表示粒子i当前位置,rand()为(0,1)内的随机实数,ci、c2为学习因子,pbest为个体极值,gbest为群体极值。其 开始开始习因子c2、每个粒子状态对所有粒子进行评估,确认是否满足条件是否满足条件或t≥T查更新每个粒子的位置、速度更新每个粒子函数适应值更新每个粒子的历史最优位置是结束3.4.2算法设计粒子群算法解决传统TSP问题中,现有结果明确指出了以下结论其粒子位置为城市一维编号序列(即传感器编号序列),其适应度函数设计为:其示i其该适应度函数,在这一背景下不能考虑到实际过程中无人机的通信情况和电量损耗情况。因此在一维序列的情况下,设计适应度函数(张伟,赵敏,2019):其中分母为单无人机完成任务的总时间。在这种情况的背景下在笛卡尔坐标系内设置1个地面基站和20个传感器进行仿 第三章传统离线算法解决多参量随机序列问题个体最优保留概率ul全局最优保留概率u2最大进化代数T见附录见附录见附录见附录见附录实验结果如图:实验结果表明对于20个传感器的无人机任务构成的一维序列,粒子算法收敛过慢,在这种情况下讨论因此解决多变量随机问题,可以跟改进的遗传算法类比,同样采用K-means聚类算法,针对不同不同数目的无人机进行传感器聚类,后分解为 第三章传统离线算法解决多参量随机序列问题多个数目较小的一维序列问题(黄强,孙悦,2021)。3.2.3改进粒子算法实验仿真根据算法分析,对改进后的粒子群算法结合K-means聚类算法解决一维序列问题进行实验仿真,最终最优解为3无人机协同工作,具体参数如下:表7粒子群算法多无人机路径规划参数表参数名称个体最优保留概率ul全局最优保留概率u2见附录见附录见附录见附录见附录仿真实验数据如下:参数名称总时间T(S)总耗电量E(Ws)无人机1时间t1(s)无人机1总耗电量el(W●s)无人机2时间t2(S)无人机2总耗电量e2(W●s)无人机3时间t3(s)无人机3总耗电量e3(W●s)3 第三章传统离线算法解决多参量随机序列问题从实验结果分析,改进后的粒子群算法解决多无人机协同工作问题所得路径优化目标良好,实验结果与实际场景预期基本吻合,因此认为其算法性能良好。模拟退火算法是一种对热力学定律进行改进的算法。通常情况下,模拟退火算法常与爬山算法进行比较。于这种状态下爬山算法在解决凸函数优化问题中遵循贪婪原则,使算法向优化目标移动,但容易陷入局部最优解,模拟退火算法则结合概率条件,使最优解选择概率随时间降低,因此相比于爬山算法较难陷入局部最优解。 第三章传统离线算法解决多参量随机序列问题开始随机生成初始解,并计算目标函数扰动产生新解,并计算目标函数计算差值是是工模拟退火算法可以很好的解决TSP问题,但传统模拟退火算法只能优化目标为最短距离,在这类状况中因此需要对目标函数进行重塑,引入任务时间作为目标函在笛卡尔坐标系内设置1个地面基站和20个传感器进行仿真实验,实验参数如下表所示:参数名称最终温度见附录见附录见附录见附录 第三章传统离线算法解决多参量随机序列问题实验结果如下:从实验结果分析,模拟退火算法具有很好地收敛性能,但由于模拟退火算法需要不断对序列进行扰动,从这些表现中可以推见因此难以完成多随机变量序列问题。因此我们依然采用聚类方法,对传感器信息进行聚类,生成多个一维度地序列,实作者也进行了反复验证与对比,尤其是和同行的结论进行了细致的比对与分析确保了所得结果的稳定性和可靠性。在与同行研究的对比中,作者注意到尽管在具体结果表述形式上可能存在细微差异但核心结论与趋势均保持高度一致,这进一步增强了本研究结论的可信度。特别地作者深入探讨了与方佳佳教授在相关主题研究的结论的异同点,通过对于结果一致性的判断与这种对比分析,不仅加深了对研究主题的理解,也为后续研究提供了宝贵的参考和启示为研究的完善和创新提供了重要助3.5.3改进模拟退火算法仿真实验 第三章传统离线算法解决多参量随机序列问题根据算法分析,对改进后的粒子群算法结合K-means聚类算法提升序列维度进行实验仿真,最终最优解为3无人机协同工作,具体参数如下:参数名称最终温度见附录见附录见附录见附录见附录实验结果如下:参数名称无人机数目n3总时间T(S)总耗电量E(W●s)无人机1时间t1(s)无人机1总耗电量el(W●s)无人机2时间t2(s)无人机2总耗电量e2(W●s)无人机3时间t3(s) 第三章传统离线算法解决多参量随机序列问题根据实验结果分析,结合K-means聚类的模拟算法解决多无人机协同工作问题可以完成无人机尽可能不进行充电而增派无人机的目标,现有结果明确指出了以下结论但实验结果存在较大误差,因此任务其容易陷入局部最优解。通过对四类传统经典算法进行改进,使其能够很好的适应本文所提出的多无人机协同工作的辅助边缘计算系统。但其算法性能参差不齐,从数据上看,改进的蚁群算法与模拟退火算法解决单无人机问题都具有很好的收敛特性,但改进的模拟退火算法多无人机协同工作模式呈现出较差结果。从中可以明显看出而在解决多无人机问题时,改进后的粒子群算法、模拟退火算法、遗传算法都需要借助K-means聚类分析进行路径规划,其结果受聚类结果影响较大,可以从中察觉到通常得到解为该问题下的局部最优解。改进后的蚁群算法,在解决多维序列问题仍具有较好的收敛特性,缺失最优对比,无法确定其是否陷入局部最优解。上述四类算法都面临同一个问题为目标优化过程需要传感器位置、传感器当前待解决数据量、基站位置确定。 第三章传统离线算法解决多参量随机序列问题因此算法时效性差,面对复杂问题求解时间长,因此在解决现实问题时具有时效误差。其中改进后蚁群算法解决问题的时间最优,平均计算时间为29.53s。 用于智能体解路径规划、机器博弈等多个领域其原理为智能体在环境、激励等的影响下,不断改变自身状态,在这一背景下达到目标并寻求最优解的过程。算法首先确定智能体以及智能体所在环境,通过设计奖励函数使智能体在环境中不断试错,图20强化学习算法流程4.2图注意力网络GAT介绍图注意力网络GAT为2018年的提出的图网络模型,为了解决图卷积网络GCN4.2.1注意力机制间内难以观测所有信息,在这种情况下讨论因此其会选择一部分信息进行记录和分析。图注意力机制类似于此。其核心在于对于既定信息进行权重分配,分配到高权重的信息部分,需要被系统进行深度加工。其数学表达形式如图21所示: 力机制从需处理的信息源Source中得到的信息。在这氛围的影响下每一对Key-Value表示信息源Source中含有的不同类别信息。因此有如下公式(何勇,高洁强,2021):其中similarity(x,y)函数表示x与y之间的相关程度。4.2.2图注意力网络GAT结构分析于这种状态下对于单头图注意层而言,假设进入GAT网络的图Graph具有n个节点,第i个节点的特征向量为H;,节点维度f,则节点特征向量可以用H表示:H={H₁,H₂,…,HN},H;∈RfGAT网络的图注意层对特征向量H通过W矩阵进行线性变换可以得到新的特征向量H`,其维度变为f,则有:h,`=Wh,,W∈Rf×fh={h`,h`,….,h,`},h`∈Rf得到新的特征向量后,在这类状况中图注意力网络GAT的具体Attention机制为,如果节点i、j为相邻节点,则需要将其特征向量拼接后与拼接矩阵同维度向量α进其中II表示拼接操作。其网络单头图注意层如图所示: 经过Attention机制后节点i的特征向量如下:传统强化学习算法解决无人机路径规划问题,多通过DQN网络进行,使无人机在飞行域内做非离线计算运动。其具有很好的动态特性,可以根据变化的传感器数据来看进行路径规划。可以从中察觉到但其算法的准确率不高,且容易在飞行过程中出现负电量情况。因此本文将提出利于GAT网络进行序列问题。通过制造大量不同顺序的序列和值域内变化的数据量样本,训练过程扩与传感器位置,传感器数据量随机的大样本数据集。面对可以临时给出的传感器数据量进行最优路径规划。保留算法动态性的同时,提高算法准确性。算法得到路径 第四章基于GAT网络的强化学习算法解决序列问题具体的本算法采用GAT网络与Reinforce方法结合的方法预测无人机的路径,其中GAT作为主要算法对输入的节点信息进行处理并输出预测的路径,Reinforce方法习的反向传播机制。算法构建了一个无人机路径的环境,无人机与环境的交互在这算法GAT网络注意力层采用多头注意力机制,k=8,网络结构如图所示:成成开成成通过构建大样本数据集对20个传感器和给定数据量进行仿真实验,于这种状态下实验参数如下:隐藏层个数hiddendimepoch个数encoder/critic网络的网络层数3actor-network的学习率Ir_modelcritic-network的学习率Ir_critic见附录 传感器数据量 实验结果如下:参数名称无人机数目n3总时间T(s)总耗电量E(Ws)无人机1时间t1(s)无人机1总耗电量el(W●s)无人机2时间t2(s)无入机2总耗电量e2(W●s)无人机3时间t3(S)图24GAT强化学习多无人机协同路径规划图 第四章基于GAT网络的强化学习算法解决序列问题网络结合强化学习算法处理多无人机辅助边缘计算系统具有良好效果。图25中训练过程因其多随机传感器数据量样本进行训练,其损失函数具有一定的波动性,但随迭代次数增加而不断稳定,测试集表现的loss属性具有 由于GAT强化学习可以灵活应对变化的传感器存群、粒子群、遗传、模拟退火算法分别做相同20个传感器优化和测试过程传感器数据量相同和相同20个传感器优化和测试过程传感器存储数据量不同的模拟实验。对GAT强化学习算法做跟随实验,在这类状况中其中对模拟退火算法进行10000次扩如图26显示,在优化过程与测试过程传感器存储数据量相同的情况下,蚁群算较快收敛并得到最优解,GAT强化网络需要进行大量训练,因此其10000次迭代效果不优,但收敛趋势明显。蚁群算法收敛速度极快,但容易陷入局部最优解,模拟 图26优化与测试传感器数据量相同性能比较图当优化与测试过程传感器数据量不同时,强化学习依然可以保持较高性能,改进的遗传算法会显示强烈波动性并不收敛,改进的粒子群算法结果与最优解有较大偏离,改进后的蚁群算法与模拟退火算法则会陷入局部最优解(潘磊,蔡颖强,2022)。第五章算法性能对比决数据量发生变化的问题时改进后的蚁群算法、遗传算法、模拟退火算法、粒子群算法测试结果较差,不具有灵活性和得到最优解的能力,基于GAT网络的退火算法、遗传算法和粒子群算法无法进行大量数据模拟,且其本身受聚类因素影改进后的蚁群算法和GAT强化学习算法在解决问题的稳定性,如图9与图25对比,蚁群算法在优化加测试求解问题的总体时间复杂度性能上优于GAT强化学习算法,在这种情况的背景下但其算法会容易陷入局部最优解断变化的传感器数据量,而蚁群算法则不具备此灵活性。其GA后在不改变传感器位置和基站位置的情况下,测试过程的时间复杂度远小于蚁群算第六章结束语无人机因其独有的特点,目前很好的应用于农业传感数据采集的场景,因此对其进行路径规划十分有意义。当前对无人机进行路径规划的算法,没有很好的对无人机电量模型、通信模型和飞行时间模型进行建模,也不能满足多无人机协同工作的需求,多采用以飞行直线距离为优化目标的以蚁群算法、遗传算法、粒子群算法、模拟退火算法为核心的离线问题处理。也存在考虑到无人机通信、电量背景,但场景设计过于简单,在这氛围的影响下且准确率不高的强化学习结合DQN网络的非离线算法。本文针对上述背景,进行了多无人机协同辅助边缘计算系统的路径规划研本文针对无人机通信过程,提出了基于自由空间路径损耗考虑视距通信(LOS)、非视距通信(NLOS)与感知发送协议的传感模型、通信模型、数据传输模型,建立了符合气体动力学描述的无人机电量模型和完成了基于实际场景分析调研的无人机工作过程模型。真实还原了无人机工作场景和环境因素。本文将凸函数优化问题,表达为多维度随机序列的最优分组排序问题,通过对蚁群算法、遗传算法、粒子群算法与模拟退火算法进行改进,对其优化目标、输入参数形式以及是否可以结合K-means聚类算法进行分析,得到了可以有优质性能满足上述背景的需求。,在这类状况中同时本文提出一种新型的GAT网络结合强化学习的离线算法,其满足上述背景的需求同时具有灵活性、准确性。并对5类算法进行了性能分析与比较。经过对四类传统算法的改进和提出基于GAT网络的强化学习算法,本文完成了对考虑通信情况、无人机电量及多无人机系统工作的辅助边缘计算系统今天了路径规划。因算法本身的局限性,改进后的遗传算法、粒子群算法、模拟退火算法无法直接解决多无人机协同工作问题,需要结合K-means算法对传感器进行聚类分析。5类算法在解决单无人机问题时模拟退火算法呈现最优性能,在解决多无人机路径规划问题时GAT强化学习算法具有最优性能。GAT强化学习算法通过大量样本训练,可以面对给定域内随机的传感器存储的数据量集合都可以在极短时间给出效率较高的路径规划方式,具有较好的灵活性,因此其可以更好的融入现实背景解决实际问 [1]X.ChenandJ.Zhang,"TheThree-DimensionPathPlanningofUAVBasedonImprovedArtifPotentialFieldinDynamicEnvironment,"20135thInternationalConf[2]H.Li,T.Long,G.XuandY.Wang,"Coupling-Degree-BasedHeuristicPrioritizedPlanningforUAVSwarmPathGeneration,"2pp.3636-3641,doi:10.1109/CAC48633.2019.8997273.[3]Z.HeandL.Zhao,"TheComparisonofFourUAVPathPlanningAlgorithmsBased(IHMSC),Hangzhou,China,2017,pp.33-36,doi:10.1109/IHMS[4]W.Xinggang,G.CongandL.Yibo,"VariableprobabilitybasedbidirectionalRRTalgorithpathplanning,"The26thChineseControlandDecisionConference(2014CCDC),Changsha,2014,pp.2217-2222,doi:10.1109/CCDC.2014.685Hangzhou,China,2017,pp.33-36,doEvacuationEnvironment,"inI(张伟,赵敏,2019)Transactionson曾诚,蒋婷tems,Man,andCybernetics:曾诚,蒋婷tems,doi:10.1109/TSMC.2020.2967936.109/IHMSCProceedingsofthe29thChineseControlConference,Beijing,China,2010,pp.559-563doi:10.1109/ACCESS.2019.2943253.planning,"2017I(张伟,赵敏,2019)InternationalConfer(SMC),Banff,AB,Canada,2017,pp.1799-1804,doi:10.1109/SMC.2017.8122877.Communications,vol.16,no.6,pp.3747[11]黄强,孙悦.遗传算法路径规划在无DoseMapping,"2018I(张伟,赵敏,2019)42ndAnnualComputerSoftwareandApplicationsConference(COMPSAC),Tokyo,2018,pp.333-338,doi:10.1109/COMPSAC.2018.00053.[13]徐涛,郑薇"OncollaborativepathpNanjing,2016,pp.971-975,doi:10.1109/CGNCC.2016.7828917.5thInternationalConferenceonAuChina,2020,pp.81-86,doi:10.1109/CACRE50138.2020.9229999.[15]C.Zhang,H.LiuandY.Tang,"Quanti
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 内科护理实习与带教技巧
- 全国质量管理培训课件
- 北京招聘考试题库及答案
- 2025年自学英文真题试卷及答案
- 消防安全课件幼儿园小班
- 2026年辽宁铁道职业技术学院单招职业适应性测试模拟试题及答案解析
- 2025年物理高考模拟试题及答案
- 中国奥赛生物题库及答案
- 培训总结课件图片素材
- 麻疹医护人员培训课件
- 大连市社区工作者管理办法
- 2025年河北地质大学公开招聘工作人员48名笔试模拟试题及答案解析
- 火灾探测器的安装课件
- 酒店转让合同协议书范本大全
- DB21∕T 3722.3-2023 高标准农田建设指南 第3部分:项目预算定额
- 压力管道质量保证体系培训
- 2025年度数据中心基础设施建设及运维服务合同范本3篇
- 【八年级上册地理】一课一练2.2 世界的气候类型 同步练习
- 2024人形机器人产业半年研究报告
- 筋膜刀的临床应用
- 中国石化《炼油工艺防腐蚀管理规定》实施细则(最终版)
评论
0/150
提交评论