版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一种基于深度强化学习的无人机伪路径规本发明公开了一种基于深度强化学习的无禁飞区域的边界坐标和标记出无人机飞行任务知无人机当前环境状态,利用深度强化学习算法,根据得到的Q函数值选择当前环境下的偏转地接收来自地面基站发射设备给出飞行的位置数据并与环境进行交互得到的奖励回报更新Q函2地面基站发射设备给出飞行的位置数据并与环境进行交互得步骤3:飞行过程中将禁飞区域作为虚拟障碍物,判断无人机是否按照正常的航线飞若接近禁飞区域边缘,则通过深度强化学习算步骤2中,所述DoubleDQN算法是利用深度学习中的卷积神经网络和强化学习的Q-12t)的函数为:t为执行t时刻动作时的回报值;更新t+1时刻的状态行为值;深度强化学习DoubleDQN中将动作的选择和动作的评估分别34[0006]本发明所采用的技术方案是:一种基于深度强化学习的无人机伪路径规划的方到的Q函数值选择当前环境下的飞行偏转角度和动作;无人机根据在飞行过程中不断地接5收来自地面基站发射设备给出飞行的位置数据并与环境进行交互得到的奖励回报更新Q函[0015]2.本发明能够利用深度强化学习方法为无人机规划出一条躲避禁飞空域的飞行[0018]图3为本发明实施例中利用深度强化学习DoubleDQN算法的无人机伪路径规划示[0020]本发明采用一种基于深度强化学习的无人机伪路径规划的方法来避免无人机在6到的Q函数值选择当前环境下的飞行偏转角度和动作;无人机根据在飞行过程中不断地接收来自地面基站发射设备给出飞行的位置数据并与环境进行交互得到的奖励回报更新0函[0027]DoubleDQN是利用深度学习中的卷积神经网络和强化学习的Q-learning算法相tt)的函数为:t用来更新t+1时刻的状态行为值;深度强化学习DoubleDQN中将动作的选择和动作的评估[0037]动作选择时的值函数做出选择时首先选择一个动作a*,该动作a[0038]动作评估时的值函数为在选出最大的动作a*之后选择不同的网络权重θ9动作评7[0051]本发明现在利用强化学习和深度学习的神经网络相结合的深度强化学习方法进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年AI情绪调节设备太赫兹技术应用前景
- 2026届广东惠州市惠阳区中考一模英语试题含答案
- 2026届福建省泉州市永春县中考二模英语试题含答案
- 2026届江苏省南京联合体【栖霞、江宁、雨花】中考猜题语文试卷含解析
- 空压机皮带张紧规程
- 2026年幼儿园食品安全应急演练总结
- 2026年教育实习报告
- 银行从业资格考试初级真题题库
- 防动物伤害消防安全管理规定
- 学校学生结业管理规定
- 政治经济学试题及答案
- 2025国开(电大)《公司概论》期末题库(含答案)
- (2026年)一例心衰患者的护理查房课件
- (2026版)医疗保障基金使用监督管理条例实施细则培训课件
- 新苏教版科学三年级下册《声音的产生》课件
- 预拌混凝土试验仪器作业指导书
- 2026年最佳男朋友测试题目及答案
- 国家事业单位招聘2024国家基础地理信息中心考察对象笔试历年参考题库典型考点附带答案详解
- 三级模块二-项目七-认知训练 -任务二 定向力训练
- 检验科抽血课件
- 高低压配电柜设备验收与安装规范
评论
0/150
提交评论