版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
自动驾驶决策:让汽车学会“思考与判断”主讲教师:刘欢汽车人工智能通识讲义CONTENTS1.路况分类技术:构建环境认知的“基础图谱”3.多智能体交互建模:从“个体预测”到“群体协同”汽车人工智能通识讲义2.轨迹预测技术:预判未来的“运动蓝图”3.1自动驾驶决策:让汽车学会“思考与判断”1.基于卷积神经网络(CNN)的特征提取CNN凭借“局部连接、权值共享”的特性,成为视觉特征提取的核心架构,其在车载场景的应用需兼顾识别精度与算力适配:(1)特征提取层级与目标对应卷积层通过不同尺寸的卷积核(如3×3、5×5)逐级提取特征:浅层卷积(第1-3层)捕捉路面纹理细节(如沥青的颗粒感、砂石的不规则分布)、车道线边缘的灰度变化;中层卷积(第4-6层)识别交通标识的图形结构(如限速牌的圆形轮廓、让行标志的倒三角特征);深层卷积(第7层及以上)实现语义级分类(如“路口”“匝道”“施工区域”等宏观场景)。池化层(如最大池化、平均池化)通过下采样压缩特征维度,同时增强特征的平移不变性(如车道线轻微偏移时仍能准确识别)。路况分类技术:构建环境认知的“基础图谱”汽车人工智能通识讲义3.1自动驾驶决策:让汽车学会“思考与判断”
(2)架构选型与车载适配车载场景常用ResNet(残差网络)与MobileNet系列架构:ResNet通过残差连接解决深层网络的梯度消失问题,其ResNet50模型可提取2048维高维特征,适配高精度路况分类(如区分“干燥沥青路”与“潮湿沥青路”);MobileNet采用深度可分离卷积替代标准卷积,将参数量压缩至传统CNN的1/10,在入门级车载芯片(如地平线征程2,算力2TOPS)上仍能实现30fps以上的实时推理。(3)BatchNormalization(批归一化)的工程价值该技术通过对每批数据进行均值归零、方差归一化,解决网络训练中的“内部协变量偏移”问题——即前层特征分布变化导致后层训练不稳定。在车载场景中,其核心作用是增强模型对光照变化的适应性:例如逆光场景下,图像像素值整体偏高,BatchNormalization可快速校准特征分布,使路面纹理特征保持稳定表达,将分类准确率提升3%-5%,最终实现100+类路况的精准分类(准确率≥98%)。路况分类技术:构建环境认知的“基础图谱”汽车人工智能通识讲义3.1自动驾驶决策:让汽车学会“思考与判断”2.多尺度特征融合:破解复杂场景的“识别瓶颈”单一尺度特征难以应对车载场景的动态变化,需通过特征融合技术整合细节信息与语义信息:(1)FPN(特征金字塔网络)的融合逻辑FPN构建“自下而上+自上而下”的特征融合链路:自下而上路径通过卷积与池化生成不同尺度的特征图(如1/4、1/8、1/16原图尺寸),捕捉从细节到语义的层级特征;自上而下路径通过上采样将深层语义特征映射至浅层,再通过横向连接与浅层细节特征叠加融合。例如在隧道场景中,浅层特征可识别车道线的边缘细节,深层特征可判断“隧道入口”的语义属性,融合后能有效避免因光照突变导致的车道线丢失问题。路况分类技术:构建环境认知的“基础图谱”汽车人工智能通识讲义3.1自动驾驶决策:让汽车学会“思考与判断”(2)BEV视角融合的进阶应用传统FPN基于透视图特征融合,存在视角偏差(如远距离目标特征压缩),当前主流方案已升级为BEV-FPN(鸟瞰图特征金字塔)。以BEVFormer架构为例,其通过Cross-Attention机制将多摄像头的透视图特征映射至统一BEV空间,再通过FPN融合不同高度的BEV特征层,实现对“路面-车道-路口”的三维空间认知。例如在山区多弯道路场景中,BEV-FPN可同时融合近处路面纹理与远处道路曲率特征,分类准确率较传统FPN提升8%-12%。路况分类技术:构建环境认知的“基础图谱”汽车人工智能通识讲义3.1自动驾驶决策:让汽车学会“思考与判断”路况分类技术:构建环境认知的“基础图谱”汽车人工智能通识讲义技术类型核心方法优势局限车载应用场景传统方法手工特征(HOG+SIFT)+SVM算力消耗低,解释性强依赖人工设计,鲁棒性差低速封闭场景(如园区物流车)基础
CNN方法AlexNet/VGGNet+全连接层特征提取能力优于传统方法参数量大,深层训练不稳定高速场景基础路面分类进阶
CNN方法ResNet+FPN+BatchNorm精度高,抗光照干扰能力强算力需求中等城区复杂路况分类BEV融合方法BEVFormer+多视角CNN全局视角,空间感知精准算力需求高(需
Orin-X级芯片)高阶智驾(城市
NGP)场景表1技术演进与对比3.1自动驾驶决策:让汽车学会“思考与判断”轨迹预测技术:预判未来的“运动蓝图”汽车人工智能通识讲义轨迹预测是自动驾驶系统的核心组成部分,位于感知模块下游与规划控制模块上游。其输入通常包括感知系统所提供的交通参与者历史轨迹、道路结构信息以及其他交互动态,输出则为对各类交通参与者未来可能运动轨迹的预测如图所示。准确预测周围车辆的行为轨迹,可为自动驾驶车辆提供决策与规划依据,从而保障在异构、高动态、复杂多变的交通环境中安全行驶。3.1自动驾驶决策:让汽车学会“思考与判断”多智能体交互建模:从“个体预测”到“群体协同”汽车人工智能通识讲义1.Transformer的自注意力机制应用Transformer通过多头自注意力机制计算不同智能体间的关联权重,实现“谁影响谁”的动态判断:特征输入层:将每个智能体的“位置-速度-类型”特征编码为向量,附加位置编码(体现空间距离)与时序编码(体现时间先后);注意力计算:通过Query(当前目标特征)、Key(其他目标特征)的点积运算,生成注意力权重(如路口横穿的行人对右转车辆的权重值为0.8,对远处直行车的权重值为0.1);特征融合:将权重加权后的特征输入前馈网络,输出融合交互信息的轨迹预测结果。特斯拉FSDBeta12的“无保护左转轨迹预测”功能即采用此技术,通过8头注意力机制同时分析10个以上目标的交互关系,3秒预测误差≤0.5m。2.GNN与Transformer的协同建模图神经网络(GNN)擅长刻画结构化交互关系,可与Transformer形成优势互补:将智能体视为“节点”,交互关系视为“边”(如“前车-后车”为跟随边,“行人-车辆”为避让边),通过GNN的消息传递机制提取局部交互特征;再通过Transformer捕捉长距离依赖(如主干道车流对支线车辆的影响)。小鹏XNGP的“城区多车博弈预测”功能采用“GNN+Transformer”架构,使路口轨迹预测准确率提升至92%,较单一Transformer模型提高7%。3.1自动驾驶决策:让汽车学会“思考与判断”小鹏XNGP的轨迹预测系统汽车人工智能通识讲义小鹏G9的城市NGP功能采用“GRU局部时序建模+GNN-Transformer交互建模”的双层架构:近距离(0-1秒):
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 食品企业三标工作制度
- 高龄津贴发放工作制度
- 雅安地区宝兴县2025-2026学年第二学期三年级语文第八单元测试卷(部编版含答案)
- 阿勒泰地区吉木乃县2025-2026学年第二学期四年级语文第七单元测试卷(部编版含答案)
- 青岛市四方区2025-2026学年第二学期四年级语文第八单元测试卷(部编版含答案)
- 长春市二道区2025-2026学年第二学期二年级语文第七单元测试卷部编版含答案
- 自然水域救生员班组评比水平考核试卷含答案
- 畜禽屠宰无害化处理工操作知识考核试卷含答案
- 婴幼儿发展引导员操作能力模拟考核试卷含答案
- 静电成像感光元件(光导鼓)制造工操作安全知识考核试卷含答案
- T/CCAS 010-2019水泥窑协同处置飞灰预处理产品水洗氯化物
- 大学物理力学5功和能
- T-CPI 11037-2024 石油天然气钻采设备水力振荡器技术与应用规范
- 人教版PEP四年级英语下册全册单元测试卷(附听力材料)
- 尼康CoolPixP100中文说明书
- 《Python程序设计任务驱动教程》 课件-第2章 Python基础
- 城市道路挖掘修复工程投标方案
- 蜗牛与黄鹂鸟(课件)人音版音乐二年级上册
- 小型水库除险加固毕业设计样本
- PLC在航空航天与飞行安全中的应用与智能化控制
- 软件生存周期过程控制程序
评论
0/150
提交评论