CN119329519B 一种基于sac的汽车自适应巡航控制优化方法 (长春工业大学)_第1页
CN119329519B 一种基于sac的汽车自适应巡航控制优化方法 (长春工业大学)_第2页
CN119329519B 一种基于sac的汽车自适应巡航控制优化方法 (长春工业大学)_第3页
CN119329519B 一种基于sac的汽车自适应巡航控制优化方法 (长春工业大学)_第4页
CN119329519B 一种基于sac的汽车自适应巡航控制优化方法 (长春工业大学)_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

号一种基于SAC的汽车自适应巡航控制优化方法一种基于SAC的汽车自适应巡航控制优化方学习模块基于当前状态决策控制动作并应用于2所述行车效率奖励,用于能使快速调整车速至前车速度或者是设所述舒适性奖励,是指控制汽车加速或者减速时的动作变化平稳性,根据当前状态动态调整各部分奖励函数的大小,以适应不断变化的交所述经验分类模块根据驾驶环境对经验样本进行分区域存储;所述经验采样2.根据权利要求1所述的一种基于SAC的汽车自适应巡航控制优化方法,其特征在于,33.根据权利要求1所述的一种基于SAC的汽车自适应巡航控制优化方法,其特征在于,指首先从经验池中通过均匀随机抽取的方式抽取2M条经验,M表示每次梯度下降计算需要4汽车产业发展的重要方向之一。巡航控制是自动驾驶汽车决策控制系统的重要组成部分,5中的经验将会被抽样一部分进行神经网络梯度下降,分别更新Actor网络(动作策略网络)[0018]考虑到自适应巡航控制任务连续动作空间的要求,采用纵向连续动作空间[_1,[0021]Actor网络为动作策略网络,需要利用状态信息处理模块对原始图像信息进行处[0023]Critic网络为动作值估计网络,利用状态信息处理模块对原始图像信息进行处67明设计四个不同经验回放池分别用来存放不同驾驶环境的样本,分别是稳定跟车经验池,[0054]传统的SAC算法是均匀随机从经验池抽取经验,智能体每执行一个动作获得环境[0056]在SAC算法的传统均匀抽样中,会出现经验池中有的经验一次都没有使用到的情[0058]为了解决随机均匀抽样方式对经验的重要性使用不充分的问题和兼顾一定的效8其中,低维运动测量数据包括主车与前车实际距离与理想跟车距离之差Δs和主车与前车[0070]Carla语义分割相机的默认图片尺寸为487×487,经过图像裁剪之后图片尺寸变9[0075]考虑到自适应巡航控制任务连续动作空间的要求,采用纵向连续动作空间[_1,[0098]在安全性得到保障的基础上还要控制汽车在加速或者减[0119]在SAC算法的传统均匀抽样中,会出现经验池中有的经验一次都没有使用到的情[0121]为了解决随机均匀抽样方式对经验的重要性使用不充分的问题和兼顾一定的效率,本发明在均匀抽样的基础上提出了局部优先经验回放方法。图4是经验采样模块流程t后,经验采样模块根据不同任务类型进行经验采样,得到的经验用于训练SAC强化学习模VQ(s,a;0)是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论