版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
-PAGEII--PAGEII-摘要随着智能交通系统的迅速发展态势,骑行者、行人这类弱势道路使用者(VulnerableRoadUsers,VRU)所面临的安全问题日益明显地呈现出来,其安全已然成为交通安全管理方面的重点难题,本文将关注点放在复杂城市道路场景里VRU的检测以及预警问题上,借助深度学习技术来提升预碰撞系统的性能,达到降低交通事故伤亡率的目的,同时优化城市交通治理的效能。传统的预碰撞系统主要侧重于机动车之间的碰撞预警,然而对于VRU的行为预测以及支持方面存在欠缺之处。本文搭建了深度学习基础上的预碰撞预警技术框架,借助高精度目标检测以及实时风险预警,来弥补传统被动安全系统在行人、骑行者这类弱势群体防护方面响应滞后的不足,本文开展的主要工作如下对VRU的行为特征以及环境依赖性展开了详细分析,涉及光照条件、道路状况以及周边车辆动态等诸多因素给VRU行为带来的影响,在此基础上构建了丰富的数据基础,该数据基础融合了公开数据集与自建的多场景VRU数据集,自建数据集包含行人、电动车、自行车等7类目标,是在昼、昏、夜等多种光照条件下采集的,涉及不同行人形态、电动车形态以及各种部分遮挡的情况,并且运用小目标复制粘贴数据提高技术来平衡长尾分布,以此解决数据集中某些类别样本不足的问题。构建起一套完整的技术体系,该体系可实现从感知到决策的功能,此技术体系是以YOLOv7算法作为基础,对其多尺度特征融合机制以及动态场景适应能力进行改进,所采用的优化策略包含多个不同维度,比如输入处理优化、多尺度特征提高以及自适应特征融合等方面。对E-ELAN模块加以改进以提升其特征提取以及融合能力,提高小目标检测的敏感性,对MP模块进行重构,运用空洞池化和最大池化级联的结构,以此强化模型针对不同尺度目标的检测能力,引入自适应特征融合与调整机制,优化跨层特征融合路径,提高模型对复杂场景的适应性以及检测精度。利用PyQt5框架来开发可视化预警界面,将单目视觉测距算法同动态区域报警逻辑相结合,达成低延迟实时预警的效果,预警系统的设计借助PyQt5多线程架构来实现检测结果与风险决策的衔接,运用界面空间定位策略,一旦车辆或者弱势道路使用者侵入可视化界面下的敏感区域,便会自动触发红色预警框动态标识预警区域可视化,形成用户友好的系统集成。在交叉路口以及学校区域针对系统开展了多工况道路测试,以此来验证该系统在不同驾驶场景当中的性能表现情况,依据实验结果给出了未来改进方向,在数据方面需要多个地区协同合作,构建包含极端天气的跨气候多视角VRU数据集,在算法上可引入Transformer与CNN混合模型等,在集成方面也需要多传感器融合,构建深度强化学习预警决策模型,推动技术走向标准化。关键词:弱势道路使用者;预碰撞系统;深度学习;YOLOv7;目标检测-PAGEV-ResearchonVulnerableRoadUserPre-CollisionSystemBasedonDeepLearningAbstractIntelligenttransportationsystemsaredevelopingparticularlyfast,butlessprotectedroadusers,suchascyclistsandpedestrians,facemoresafetyconcerns,whichhasbecomeoneofthemosttroublesomethingsintrafficmanagement.Thisarticleaimstostudyhowtobetterfindthesevulnerableroadusersonmorecomplexroadsincitiesandremindthemintimethatweintendtousedeeplearningmethodstoimproveexistinganti-collisionsystems,whichcanreducetrafficinjuriescausedbytrafficaccidentsandmakeurbantrafficrunmoresmoothly.Thispaperconstructsadeep-learning-basedpre-collisionwarningtechnologyframework.Throughhigh-precisionobjectdetectionandreal-timeriskwarning,itmakesupforthelaggingresponseoftraditionalpassivesafetysystemsinprotectingpedestriansandcyclists.Themainworkofthispaperincludes:Formorecomprehensivedata,weusedthepublicdatasetandourowncollectionofmulti-scenarioVRUdata.Thedataset,whichwemadeourselves,containssevendifferenttargettypes,suchaspedestrians,electricvehicles,andbicycles.Thedatacollectiontakesintoaccountthedifferenttypesoflightthatweuse,andpartlyocclusion.Thisallowsforamorebalanceddistributionofdata.Acompletetechnicalsystemfromperceptiontodecision-makingwasconstructed,basedontheYOLOv7algorithm.Itsmulti-scalefeaturefusionmechanismanddynamicsceneadaptationabilitywereimproved,withoptimizationstrategiescoveringinputprocessing,multi-scalefeatureenhancement,andadaptivefeaturefusion.ThisarticlemakessomeimprovementstotheE-ELANmoduletomakeiteasiertoextractandfusefeatures,especiallyforthedetectionofsmallobjects.WehavealsoredesignedthestructureoftheMPmodule,andnowitusesbothexpansionpoolingandmaximumpoolstacking,sothatthemodelcanmoreeasilydetectobjectsofdifferentsizes.Tomakethemodelperformbetterincomplexscenarios,wehaveaddedafeaturefusionmechanismthatcanbeautomaticallyadjusted,whichcanoptimizethefeaturefusionpathbetweendifferentlayers,sothatthedetectionaccuracyoftheentiremodelissignificantlyimproved.ThepaperusesthePyQt5frameworktomakeaparticularlyusefulvisualwarninginterface,combiningthesingle-eyevisualrangingalgorithmanddynamicareaalarmlogic,sothatthedelaycanbelowandcanwarninrealtime.TheentireearlywarningsystemisdesignedwiththemultithreadedarchitectureofPyQt5,sothatthedetectionresultsandriskjudgmentcanworkwelltogether.Theinterfacedesignusesspatialpositioningmethods,andaslongasthevehicleorVRUentersthosesensitiveareasontheinterface,thesystemwillimmediatelypopuptheredwarningboxandmarkoutthedangerarea,sothatthewholesystemisveryconvenienttouse.Thesystemwastestedinmultiplereal-worldscenariosatintersectionsandschoolzonestoverifyitsperformanceunderdifferentdrivingconditions.Basedontheexperimentalresults,futureimprovementdirectionswereproposed:intermsofdata,multi-regionalcollaborationisneededtobuildacross-climate,multi-perspectiveVRUdatasetincludingextremeweather;intermsofalgorithms,hybridmodelsofTransformerandCNNcanbeintroduced;intermsofintegration,multi-sensorfusionisrequiredtobuildadeepreinforcementlearning-basedwarningdecision-makingmodelandpromotetechnicalstandardization.KeyWords:VulnerableRoadUsers;Pre-collisionSystem;DeepLearning;YOLOv7;ObjectDetection目录摘要 IIAbstract IV1前言 11.1研究背景与意义 11.2国内外研究现状 31.2.1深度学习目标检测与识别研究现状 31.2.2预碰撞系统研究现状 41.2.3数据集构建与评估方法研究现状 51.3研究内容及目的 52多场景目标检测检测的关键技术 82.1弱势道路使用者特征分析 82.2数据集构建与标注 92.2.1公开数据集分析 92.2.2自建多场景VRU数据集 102.3训练过程与模型评估 112.3.1模型训练过程 112.3.2模型评估 122.4核心算法选择 132.4.1 132.4.2检测性能对比分析 142.5本章小结 163算法模型的优化 173.1整体优化框架设计 173.1.1输入处理改进 183.1.2E-ELAN模块改进和MP模块的多尺度特征增强 183.2多尺度特征提取模块的优化 193.3自适应特征融合与调整机制 203.4优化后系统性能对比 223.4.1检测精度与速度对比 233.4.2复杂场景中的检测效果分析 233.4.3目标检测的对比分析 243.5本章小结 264预碰撞系统设计与集成 274.1系统架构设计 274.2功能原理介绍 294.2.1PyQt5框架选择 294.2.2单目视觉测距启发式规则 294.2.3区域预警功能设计 304.2.4基于预警区域的目标过滤 314.3集成效果可视化模块 324.3.1可视化结果显示 324.3.2实时检测结果分析 344.3.4预警阈值配置模块 344.4本章小结 355实验验证与结果分析 365.1多工况道路测试 365.2系统性能综合评估 376总结与展望 406.1研究成果总结 406.2研究不足分析 416.3未来研究展望 42致谢 44–PAGE24–PAGE21前言1.1研究背景与意义随着智能交通系统的迅速发展,自动驾驶车辆渐渐变为当今时代备受关注的焦点且成为现实,提升道路安全成为当下车辆领域研究的热门方向,然而在复杂的行驶环境当中,像行人和非机动车辆这类弱势道路使用者面临着更大的风险。弱势道路使用者指的是在交通事故里容易受到伤害的群体,主要涉及行人、骑自行车的人以及摩托车手等非机动车用户,依据世界卫生组织也就是WHO的数据,全球每年大概有119万人死于道路交通事故,其中大概一半是VRU,包含行人、骑自行车的人以及摩托车手。该报告还指出了弱势道路使用者面临的更高风险,并且呼吁各个国家的政府采取更多举措来改善这些群体的安全状况REF_Ref9512\r\h[1]。图1.1世界卫生组织(WHO)最新数据图在中国,随着汽车保有量快速增加,VRU的安全问题变得日益突出,已然成为交通安全管理里的一项重点难题,要保障这些用户的安全,开发出可精准预测VRU行为并且提前对潜在碰撞事件发出预警的系统十分关键,现有的预碰撞系统在机动车之间虽说取得了不错的效果,然而在VRU的行为预测以及支持方面仍存在欠缺。本研究借助深度学习技术来提升VRU预碰撞系统的性能。深度学习作为机器学习的一个关键分支,它依靠对生物神经网络工作机理的模拟,借助多层非线性映射来达成对数据复杂特征的表征提取,在计算机视觉研究领域,像卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)以及Transformer架构等典型架构,在图像分类、目标识别、语义分割等诸多任务里都呈现出了一定优势以及广阔的应用前景。这些技术所取得的进展,为开发出更具有高智能程度以及更为可靠性能的VRU预碰撞系统构建起了坚实的技术根基REF_Ref15550\r\h[2]。预碰撞系统(Pre-CollisionSystem,PCS),它是高级驾驶辅助系统(AdvancedDriverAssistanceSystem,ADAS)里颇为关键的一部分,该系统主要是借助对前方障碍物展开探测,在有可能出现碰撞风险之前,发出警示信号,或者主动去执行制动操作,以此有效预防交通事故的出现。传统的预碰撞系统主要侧重于机动车之间的碰撞预警,然而在对VRU的行为预测以及提供支持方面存在欠缺,近些年来,深度学习技术凭借优秀的特征提取能力以及对复杂模式识别的强大适应性,于计算机视觉领域收获了较大成果,并且被广泛运用到目标检测、跟踪以及轨迹预测等领域。比如鲍文斌在其研究里说明,基于深度学习的行人检测方法已然占据主导位置并得以广泛应用REF_Ref17237\r\h[3]。随着国民经济平稳增长,国内机动车保有量呈现出快速增长的趋势,这种增长在给公众日常出行带来便利的也让道路交通事故频发的问题变得越发严重,使驾驶安全问题成为社会各界广泛关注的焦点。依据《2024年上半年全国机动车与驾驶人统计数据》可知,截止到2024年6月底,全国机动车保有量已然达到了4.4亿辆,其中汽车数量为3.45亿辆REF_Ref10188\r\h[4]。这个数字不断增长说明道路上车辆密度在增大,交通事故风险也跟着上升了,在这样的背景状况下,开发高效且可靠的弱势道路使用者也就是VRU预碰撞预警系统变得特别迫切。按照公安部交通管理局发布的《2022年中国道路交通安全报告》,全国机动车保有量已经超过4亿辆,而涉及行人的交通事故数量在所有交通事故总数里所占比例大概有20%REF_Ref9620\r\h[5]。因此,研究基于深度学习的办法来优化前方碰撞预警系统,可提升预警精度,降低误报警率,有效降低交通事故的发生概率,保障行人和其他非机动车参与者的安全。本研究围绕弱势道路使用者主动防护的关键需求,搭建起深度学习预碰撞预警技术框架,借助高精度目标检测和实时风险预警,有效弥补传统被动安全系统在行人、骑行者等弱势群体防护方面响应滞后的不足,为降低交通事故伤亡率给予一定技术支持,其预警决策机制符合智能交通系统对感知与决策一体化的技术要求,促使主动安全技术从单一功能模块迈向系统级解决方案。同时降低了智能预警系统应用门槛,加快车路协同、自动驾驶等新兴领域技术迭代,为行业标准制定提供实证依据,响应了“以人为本”现代交通治理理念,借助算法与软件协同创新,对促进城市交通安全管理及推动自动驾驶技术发展意义重大。1.2国内外研究现状1.2.1深度学习目标检测与识别研究现状深度学习赋能的目标检测与分类技术属于计算机视觉领域的关键分支,希望能够借助算法精准定位并判别图像或视频里的特定目标,实现其精确定位与类别判别,该技术的应用领域十分广泛,在自动驾驶、安防监控以及医学影像分析等多个行业都有涉及,按照模型结构设计与应用场景的差异,这一研究方向主要有单阶段检测器,像YOLO系列、SSD,以及两阶段检测器,比如FasterR-CNN,另外也包括为嵌入式设备优化的轻量化网络架构,如MobileNet、ShuffleNet,以此来契合实时高效处理的要求REF_Ref12886\r\h[6]。马雷制作了目标检测训练数据集,该数据集包含车辆、行人以及安全警示桩,并对数据进行了扩充提高以及标签制作,之后针对双目视觉标定误差,提出了立体匹配改进算法,该算法基于Census变换与块匹配技术,同时还提出了改进YOLOv5s算法,依靠引入跨阶段局部连接即CSP模块和空间金字塔池化即SPP模块,使得mAP@.5达到了89.1%,相较于原版提高了1.7个百分点REF_Ref10440\r\h[7]。然而现有模型在复杂环境下的适应性依旧不够,在雨雪雾天等恶劣天气条件下,容易出现误报或者漏报的状况,李克强等人提出了一种面向VRU的多目标运动轨迹预测方法也就是VRUsubT/P,融合了时空的多维运动状态特征以及外观语义特征因子,解决了现有方法预测精度不足的问题,并且借助门循环神经网络即GRU提高了对未来路径的估计精度REF_Ref10541\r\h[8]。该研究基于公开的MOT16数据库以及自建的VRU-Track数据库进行了广泛的实验验证,其在特定场景下表现不错,但在复杂环境下的适应性依然不够,在恶劣天气条件下,容易出现误报或者漏报的状况,同时会出现数据多样性欠缺的问题,训练集大多时候局限于特定地区或场景,限制了系统的泛化能力。熊辉采用引入低成本的Ghost模块这种方式来增加特征图的数量,并且针对模型颈部结构PANet实施裁剪操作,以此达成架构的平衡,他构建了一款轻量级骨干网络GhostNet,把这个网络嵌入到YOLOv4框架当中,在让车辆检测任务的复杂程度降低以及使模型规模得到缩减的情况下,有效地保证了检测精度可保持基本稳定的状态REF_Ref10652\r\h[9]。此次进行的研究当中所涉及的模型,其体积出现了减小的情况,然而数据集的多样性方面依旧存在欠缺之处,对模型的泛化能力产生了影响,导致其在实际应用里的实时处理性能仍有待优化提升。M.Pierini等学者构建了一种以Transformer架构为基础的换道意图及轨迹预测模型,其实证研究显示,此框架于微观交通时序数据处理方面呈现出一定优势REF_Ref10724\r\h[10]。研究团队对比了不同模型架构,以此证明Transformer在捕捉长序列依赖方面有优越性,不过它消耗的计算资源较多,这对在低功耗设备上进行部署不利,在复杂交通环境中的适应性有待提高。凭借这样的总结可得出,国内于目标检测领域的研究已然有了一定进展,在提升检测精度以及实时性这些方面REF_Ref11041\r\h[11-REF_Ref11057\r\h12]。不过怎样去提高模型对于复杂环境的适应能力以及丰富数据集的多样程度,依旧是未来要解决的关键难题,国外在目标检测方面的研究侧重于模型结构的优化以及特征的融合,以此来提高预测性能REF_Ref11139\r\h[13-REF_Ref11145\r\h14]。然而实时处理性能以及复杂环境适应性方面的瓶颈还是存在着,这给后续的研究指引了方向。1.2.2预碰撞系统研究现状预碰撞安全系统一般囊括了前向碰撞预警这一关键功能单元,也就是FCW,还包含自动紧急制动功能即AEB,另外也有车道偏离警示功能也就是LDW等关键的功能部分。按照工作原理,可以分为基于雷达、摄像头、激光雷达(LiDAR)等多种传感器的技术方案,每种方案各有优劣,适用于不同的应用场景。闫泽玮采用定距拍摄技术来获取车辆图像,以此验证车距检测的精确程度,同时运用同步采集相机与里程计数据的方式,对车速估计的准确程度加以评估。提出了基于时间和距离的两类碰撞预警策略,分别适用于快速和缓慢目标,通过单目视觉测距模型确定无人车与目标的相对运动状态信息REF_Ref12308\r\h[15]。但是,现有的预碰撞系统在实际应用中仍需克服误警率高、实时性差、计算复杂度高等问题。同时对不同交通状况的适应性不够,尤其在高速行驶或紧急制动情况下,预警效果有待提升。李翔等人针对传统AEB系统不适用于L4级智能驾驶的问题,提出了基于主动感知技术的人车避撞策略模型。创建了适用于前方碰撞预警系统的轻量化目标检测网络YOLO-FCW,并且结合DeepSORT算法达成了高效的目标追踪REF_Ref12386\r\h[16],实际应用场景存在着复杂性,在城市区域这种情况增加了系统设计的难度。XiangpengCai等人达成了V-FCW算法在SimcenterPrescan仿真平台以及C-V2X通信平台上的运用,呈现出其于曲线路段有的优越性能,他们提出了一种借助V2X网络的向量前向碰撞预警即V-FCW算法,此算法借助车辆间通信技术以及基础设施通信技术精准估计车辆姿态,有效算出相对角度REF_Ref12598\r\h[17]。不过V2X技术的应用范围存在局限,普及程度较低,并且其算法依赖高质量的通信基础设施,推广成本偏高。国内对于预碰撞系统的设计正逐渐朝着精细化以及智能化的方向发展REF_Ref12794\r\h[18],然而在实时性以及适应性这两方面仍有优化的必要,应当更为关注该系统在极端情形下的表现,国外的相关研究在算法创新以及应用场景扩展等方面有着较为出色的表现,不过在实际进行部署的时候还需要充分考虑实用化需求以及兼容性REF_Ref12040\r\h[19],降低成本,以此达成更好地推广与应用。1.2.3数据集构建与评估方法研究现状数据集构建与评估方法是确保机器学习模型训练质量和性能的关键环节。高质量数据集需拥有适度的规模、充分的多样性以及均衡的代表性,以此帮助模型有效地提取特征,达成优良的迁移性能,对其评估往往借助分类准确率、召回率以及综合F1分数等多个维度的量化指标来衡量,依据数据形式的差异,数据集可被归类为图像、视频或者文本类型,而结合具体的应用场景,又可以细分为行人再识别(Re-ID)、多目标跟踪(MOT)等以及场景理解等特定任务的数据需求类别。刘晓晖等人完成了路侧激光雷达跟踪数据集的收集工作,该数据集现已公开发布并完成标注,与同类多目标跟踪算法所采用的数据集相比,它在精度和抗遮挡性能方面有优势REF_Ref14355\r\h[20]。不过该数据集在质量控制和标准化程度上存在不足,这对跨研究领域的结果可比性和实验重现能力产生了限制。马越构建了一个专门用于弱势道路使用者感知的数据库,依靠实证研究验证,该方法可实现多类别弱势道路使用者目标的联合定位与分类,还可以对历史轨迹进行稳定追踪,并精准预测未来路径REF_Ref14437\r\h[21]。然而现有数据集的场景覆盖范围和多样性仍不够,无法全面覆盖复杂交通环境中的各种潜在情况。DukeMTMC-reID以及Market-1501数据集属于国际上颇具知名度的行人再识别基准数据集,在评估不同算法性能方面有着广泛应用REF_Ref14754\r\h[22],然而该数据集获取与使用的门槛偏高,致使部分研究人员难以参与其中,并且其应用场景往往较为特定,对于复杂交通环境无法做到全面覆盖。我国在数据集构建领域已然跨出了关键步伐,然而,数据规模的拓展以及质量控制水准的提升仍有待推进,国际上的数据集构建工作相对成熟,不过,易用性方面仍存在可优化之处,今后应倡导更多的开放共享行为,推动全球范围内的合作研究不断发展。1.3研究内容及目的当下针对弱势道路使用者(VRU)的检测与预警系统研究存在三重核心挑战,现有公开数据集(如KITTI、Cityscapes)对非结构化场景(如夜间、雨雾天气)的覆盖不够全面,存在数据多样性受限的状况,使得检测模型在复杂光照、动态遮挡环境下的泛化能力出现明显衰减(漏检率普遍>30%)REF_Ref18214\r\h[23],传统方法依靠独立模块串联(检测→跟踪→预测→预警),轨迹预测与预警决策相互分离,造成信息传递延迟以及误差累积,致使预警响应滞后且误触发率升高。现有预警系统大多基于高算力服务器开发,难以适应车载平台的实时性约束(如JetsonXavier的30W功耗限制)REF_Ref18295\r\h[24],对技术落地可行性形成了制约,本文围绕智能交通系统中弱势道路使用者的主动安全防护需求,针对复杂城市道路场景下行人、非机动车等目标检测的实时性与可靠性难题,构建了一套从感知到决策的完整技术体系。借助改进YOLOv7算法的多尺度特征融合机制以及动态场景适应能力,在一定程度上化解了传统检测模型在目标遮挡、尺度变化等场景下的性能衰减问题,为高动态环境下的实时目标检测提供了全新的理论框架REF_Ref18348\r\h[25],在工程实践方面,研发的预警系统借助PyQt5多线程架构实现了检测结果与风险决策的无缝对接,其模块化设计兼顾了车载边缘设备的部署效率和用户交互体验,推动了主动安全技术从实验室验证到产业落地的转化进程REF_Ref18397\r\h[26]。研究成果为智能驾驶系统提供了高鲁棒性的感知解决方案,还为车路协同、智慧交通管理等行业应用提供了可复用的技术基线,对降低交通事故伤亡率、优化城市交通治理效能有关键的社会价值,本文的技术实施路径遵循“数据驱动-算法优化-系统集成”的闭环逻辑,原理框架如图1.3所示,主要研究内容如下:图1.3基于深度学习的VRU预碰撞预警系统原理框架第一章为绪论。开始探讨本研究课题的背景以及意义,随着智能交通系统快速发展,提升交通安全水平已然成为全球所关注的核心议题之一,在这样的背景之下,对于目标检测技术、算法优化以及预警策略展开研究变得相当关键,本文借助引入先进的机器学习模型来提升车辆识别精度,并且对现有的算法进行参数调整以提高其在复杂路况中的适应能力,并提出本文研究成果的应用与假设:与预碰撞系统结合提出融合YOLOv7目标检测算法与PyQt5可视化界面,实现对行人、自行车等VRU的实时检测与碰撞风险评估。结合技术路线和可实施性情况,对本文部署工作安排及进度计划。第二章围绕多场景弱势道路使用者检测的关键技术展开,基于公开数据集并借助labelimage自建多场景VRU数据集(涵盖行人、电动车、自行车等7类目标),在多种复杂光照条件下,系统对比YOLOv5与YOLOv7的检测性能差异。通过实验验证YOLOv7在复杂场景下对小目标稳定的目标性判断与类别区分能力的优势,确定以YOLOv7为基线模型,为后续预警系统的误触发率控制与实时响应提供了可靠的技术基底。并针对性对提升模型对小目标和极端工况的适应性提出思路。第三章针对YOLOv7原有多尺度特征融合机制在VRU检测中的不足,改进其多尺度目标检测框架,增强了其在复杂场景下的检测精度与稳健性,尤其在小目标与远距离目标的识别层面,实验结果证实,经优化的YOLOv7模型在多尺度目标检测中明显提高了检测精度,处理速度与实时性皆得到有效提高。第四章是预碰撞系统的设计与集成,主要基于PyQt5框架开发预警人机交互系统,集成优化后的YOLOv7模型,采用界面空间定位策略,当车辆或弱势道路使用者侵入可视化界面下敏感区域时,自动触发红色预警框动态标识预警区域可视化,形成用户友好的系统集成,完整技术闭环,最后根据安全区域模型计算预警阈值并输出预警结果。第五章将主要对前文提到的模块进行测试。基于行车记录仪视频构建测试集,在交叉路口、学校区域等高风险场景进行多工况道路测试,并对各个模型的性能参数结果进行对比分析。测试得到从技术指标、硬件适配性与场景覆盖度三方面论证了方案的可行性。最后根据预警效果并提出本文算法适用场景。第六章进行全面回顾,总结系统在算法设计、模型构建等方面取得的成果。分析研究过程中存在的不足之处,如数据样本的局限性,指出可能影响系统性能的因素。最后基于研究成果和不足,对未来的研究方向进行展望,提出改进系统性能的思路和方法。
2多场景目标检测的关键技术2.1弱势道路使用者特征分析弱势道路使用者也就是VRUs,主要囊括行人以及非机动车驾驶者,像自行车、电动车这类,他们的行为模式会受到环境因素的影响,和车辆有着本质的不同,这部分内容从环境依赖性、形态多样性以及动态不确定性等几个方面着手进行分析,来探讨VRUs在复杂场景当中的行为规律。光照条件、道路状况以及周边车辆动态属于影响VRU行为的主要环境因素,依据重庆市交通研究所2022年实测数据REF_Ref18478\r\h[27],夜间行人检测的漏检率相比于白天有所增加,增加幅度为32.5%,其根本原因在于可见光成像对于低照度的敏感度不足,这就意味着需要探寻更为有效的检测方法来应对不同的光照条件。LiuREF_Ref18521\r\h[28]等人所提出的多光谱融合方法,该方法结合了可见光和红外检测,成功把夜间行人检测的mAP提升到了74.8%,然而也出现了硬件成本增加40%的情况,在提升检测性能的时候,还需要考虑成本效益,按照KITTI数据集的统计结果,在逆光场景下,自行车检测的AP@0.5仅仅只有58.3%REF_Ref18553\r\h[29],这证实了特定光照条件下自行车检测有较高难度,凸显了环境因素对VRU检测准确性的关键制约作用。依据自建数据集可知,行人肢体动作可使得边界框发生形变,电动自行车与自行车在几何特征方面有相似性,这又让模型分类的混淆率达到了18.7%,传统IoU损失函数在面对发生形变的目标时,定位误差还会提高15%REF_Ref18602\r\h[30],这一系列数据显示,VRU的形态有多样性,给检测和分类工作给予了诸多难题,需要去开发更为精准的模型以及损失函数,可有效应对不同形态的VRU目标,提高检测与分类的准确性。在交叉路口处,VRU的运动方向突变率达到了65%,这清晰地说明了VRU行为有动态不确定性,即在关键时刻其运动方向很有可能发生改变,这就对交通决策以及碰撞预警提出了更高的要求,需要动态调整碰撞预警阈值来适应这种不确定性,另外在密集车流当中,VRU容易被遮挡,COCO数据集中遮挡样本的占比为18%,然而现有模型针对遮挡目标的召回率却不到60%REF_Ref18638\r\h[31],这加大了对VRU运动状态准确判断的难度,突出了在复杂交通场景下,研究怎样有效处理遮挡问题、提高模型对遮挡目标检测性能的意义。电动车在车流里相对较难被持续检测到,这就要求检测算法有更高的实时性,以便在有限的可见时间内精准捕捉电动车的运动信息,为后续的决策和预警提供及时的依据,有效降低碰撞风险。2.2数据集构建与标注2.2.1公开数据集分析目标检测是本文研究的关键环节。当前部分公开数据集中VRU相关信息如图2.2.1所示,可见当前主流公开数据集在支撑该任务时,存在诸多局限性:表2.2部分公开数据集中VRU相关信息在KITTI数据集中,弱势道路使用者样本仅占据15%的比例,样本数量如此匮乏,使得模型没办法接受充分的训练,在实际应用里泛化能力受到限制,模型没办法有效地识别各类复杂的VRU情况,很难适应不同地区以及不同环境下多样化的VRU检测需求,这对预碰撞系统在实际复杂交通场景中的可靠性和有效性造成了严重的制约,在BDD100K数据集中,复杂光照样本所占比例不足20%,和实际道路环境中可能碰到的各种复杂光照条件有着十分突出的差异。基于该数据集训练出来的模型,在面对真实场景中的恶劣光照情况时,或许无法做出准确且及时的检测和预警,极大地影响了预碰撞系统在实际应用中的安全性和实用性,现有的数据集大多采用矩形框标注方式,缺少对姿态、遮挡等级等更细度信息的标注,Cityscapes数据集的实例分割标注没有区分电动车与自行车。这种粗糙的标注方式让模型难以学习到VRU的详细特征和复杂形态,致使在实际检测中对不同类别VRU的区分度不够,分类准确率不高,难以契合预碰撞系统对检测精度的高要求。图2.1.1(a)与(b):图像数据在很大程度上受到采集角度影响(c):在BDD100K与KITTI数据集中对同一目标存在两种不同的标注理解方式。考虑到上述存在的局限性,公开数据集如今已难以充分契合VRU多场景检测的实际需求,这便凸显出构建针对性更强的自建数据集有一定必要性,借助构建自建数据集并结合公开数据集这种方式,可弥补现有数据集存在的不足之处,为后续相关工作提供更为丰富、精准且全面的数据支持。2.2.2自建多场景VRU数据集在数据采集环节,本研究运用了多种设备来收集数据,像车载行车记录仪以及手机相机拍摄的视频截图,这些设备于重庆、西安等城市开展了实地数据采集工作,总共采集到了2280张图片,以此保证数据集有充足的规模以及多样性,采集期间,对不同的光照条件给予了特别关注,包含昼、昏、夜这三种典型场景,充分模拟实际道路环境里的各类光照变化。数据采集还涉及不同行人形态、电动车形态,以及各种部分遮挡的情形,为后续的模型训练提供了丰富的视觉信息与复杂的场景背景。采用LabelImg1.8.6软件来开展标注流程的操作,它所生成的标注文件格式是符合PASCALVOC规范的,这种格式在目标检测领域有着较高的普及程度,能为深度学习模型训练提供结构化且标准化的数据支持。在标注规则方面,着重突出了对小目标的精细标注工作,要求将其标注到像素级边界,以此保证模型可精准捕捉小目标的细节特征,针对遮挡目标,要标注其可见部分,而且要记录遮挡率,这种细致的标注规则可模型更有效地理解和处理遮挡情形下的目标识别问题,标注效果可见图2.2.2。为了让数据集的质量得到更好提升以及适用性更强,运用了小目标复制粘贴数据提高技术,从公开数据集中提取小目标实例,随机粘贴到自建数据集里,这样能有效平衡长尾分布,解决数据集中部分类别样本数量不足的问题,该方法增加了数据集的多样程度,又提高了模型对小目标的识别能力,为预碰撞系统里的小目标检测提供了更有力支撑。图2.2.2使用LabelImg1.8.6标注VRU的情况2.3训练过程与模型评估2.3.1模型训练过程在模型训练阶段,其实验环境与训练参数设置如下:硬件配置选用了NVIDIARTX3050GPU,并且搭配了CUDA12.7以及cuDNN8.9,这样的组合在深度学习模型训练当中可以提供较强的计算能力,可有效地加快模型的训练进程,让复杂的卷积神经网络可高效地进行运算,在处理大规模数据集的时候,可减少训练时间,为模型的优化迭代给予有力的支持。在软件框架的选择上采用了PyTorch1.12作为深度学习框架,这是因为它有强大的自动求导功能以及灵活的模型构建方式,Python3.8为PyTorch提供了稳定且功能丰富的编程环境,PyCharmCommunityEdition2022.1.3作为代码编辑器,它有出色的代码提示、调试功能和项目管理能力,可有效提升开发效率,让整个训练过程更为顺畅高效。本文挑选YOLOv5以及YOLOv7这两种主流的基线模型分别展开训练工作,同时对训练结果和检测结果给予对比,借助实验来评估不同模型于弱势道路使用者检测任务里的性能表现,为预碰撞系统挑选最优的检测算法。训练轮次设定为100轮,这一轮次数量在充分训练模型以学习数据特征的同时,避免了过度训练导致的过拟合问题,结合早停策略(patience=50),可在验证集性能不再提升时及时停止训练,进一步防止过拟合,确保模型的泛化能力。批量大小设为16,受限于GPU显存容量,在保证每个批次数据能有效利用GPU计算资源的前提下,尽可能增大批量大小以提高训练效率,同时使模型能够稳定地更新参数,逐步提升检测性能。2.3.2模型评估本研究挑选准确率(Precision)、召回率(Recall)、F1值以及平均精度(mAP@0.5和mAP@0.5:0.95)当作关键评估指标,以此来量化模型性能,其中精确率是用来评估正类预测里实际属于正类样本的占比,能体现检测结果的准确程度,召回率衡量的是实际正类样本被正确识别的比例,凸显检测范围的完整情况,F1分数依靠对精确率与召回率进行调和平均,综合考量模型的准确性和覆盖度,给出一种平衡性较好的评估方式。mAP指标用于描述模型在不同交并比阈值下的整体检测能力,这些指标联合使用能系统地呈现模型在多样化任务中的表现特征。借助对这些指标展开综合分析,可针对YOLOv5以及YOLOv7模型于弱势道路使用者也就是VRU检测任务里的性能做出较为全面的评估。
2.4核心算法选择2.4.1YOLO系列算法凭借其在速度方面呈现出的优势、模型结构的精简以及网络设计的简洁高效特点,已成为目标检测领域的关键选择之一,图2.4.1展示了部分YOLO算法在关键性能指标方面的对比结果。表2.4.1YOLO系列算法性能对比表版本mAP(COCO)FPS(TeslaV100)参数量(M)核心改进技术YOLOv163.44526单阶段检测框架YOLOv276.86750锚框、多尺度训练YOLOv381.23062多尺度预测、Darknet-53YOLOv483.56264CSPDarknet、PANet、Mish激活YOLOv584.51407-47自适应锚框、数据增强优化YOLOv685.4400+18-60工业场景优化、硬件加速YOLOv786.816137-72动态标签分配、E-ELAN结构YOLOv887.21803-46Anchor-free设计、任务解耦头在实际应用当中,YOLOv5和YOLOv7都呈现出了非常不错的实时性能,在维持高帧率的可比较准确地检测出弱势道路使用者,契合自动驾驶对于实时性的严苛要求,YOLOv5的自适应锚框调整机制可以自动对锚框比例进行优化,让其可适配不同道路场景里行人和骑行者的宽高分布,有效减少漏检的状况。这提升了模型对遮挡以及小尺寸目标的泛化能力,使其在复杂道路环境里表现良好,适合车载设备的部署要求,而YOLOv7的动态标签分配技术借助在训练过程中动态匹配预测框与真实框,优化了遮挡目标的标签分配,降低了误检率,它引入的E-ELAN等高效结构借助扩展的层聚合网络,有效提高了特征提取能力,改善了对复杂道路场景中小目标的检测效果,提升了模型对快速移动或者姿态变化的弱势道路使用者的检测鲁棒性。图2.4.2YOLOv5结构图图2.4.2YOLOv5结构图2.4.2检测性能对比分析经过初步的模型训练,YOLOv5和YOLOv7的训练结果如图2.4.3、图2.4.4所示:图2.4.3YOLOv5Results图图2.4.4YOLOv7Results图对图中的训练损失曲线、验证损失曲线以及评估指标曲线展开分析,可发现YOLOv5于训练进程中呈现出不错的收敛状况,训练损失(train/box_loss、train/obj_loss、train/cls_loss)和验证损失(val/box_loss、val/obj_loss、val/cls_loss)都随着训练轮次的增多而渐渐降低,这意味着模型处于持续学习与优化的状态,准确率曲线与召回率曲线逐步上升并趋向稳定,模型在训练期间渐渐提升了对正类样本的检测能力以及完整性。不过即便YOLOv5在一些指标方面表现出色,然而YOLOv7依然有独特的优势,适宜用于检测弱势道路使用者,和YOLOv7相比,YOLOv5在处理复杂场景以及多目标检测时或许存在一定的局限之处,另外因其网络结构相对较为简单,在特征提取以及处理复杂场景时可能没有YOLOv7那么高效。YOLOv7的优势具体体现为:(1)损失曲线的稳定性:YOLOv5的验证损失最终值较低,然而YOLOv7的损失曲线在训练后期呈现出更为稳定的态势,YOLOv7在训练进程中对于数据的特征学习更为平稳,可更出色地适应数据的细微变动,在实际应用场景中,针对弱势道路使用者的检测,需要模型在复杂且多变的路况下维持稳定的性能,而YOLOv7的稳定性使其在此方面有潜在优势。(2)泛化性能的潜力:从图中可看出,YOLOv7的验证损失曲线依旧处于下降状态,这意味着它的泛化性能以及提升的余地,要是对超参数进行调整、优化数据提高策略或者增加训练数据,YOLOv7有希望在验证集上取得更好的表现,与之相比,YOLOv5的验证损失已经快要接近一个较低的稳定数值了,其可能提升的幅度相对而言较小。(3)精度和召回率的平衡:YOLOv7的精度曲线以及召回率曲线依旧呈现出较为良好的上升态势,这意味着YOLOv7在针对弱势道路使用者开展检测工作时,可相对较好地兼顾准确性以及完整性这两方面,在实际应用过程当中对YOLOv7的精度以及召回率给予优化,便可以契合特定场景之下的检测要求。因此,在本文检测任务里,YOLOv7比YOLOv5有优势,它复杂的网络结构在应对复杂交通场景时,有更高检测精度以及鲁棒性潜力,YOLOv7借助动态标签分配和E-ELAN结构等技术,提升了对小目标和遮挡目标的检测能力,这对弱势道路使用者的预碰撞检测很关键。本研究选YOLOv7作为基线模型,来契合实际应用中的高精度需求。2.5本章小结本章系统分析了VRU的行为特征与环境依赖性,深入探究了VRU在不同光照条件、道路状况以及交通流量下的行为模式,识别出影响其行为的关键环境因素,为构建更符合实际场景的检测模型提供了理论依据。根据其行为特性构建了公开数据集和自建数据集相结合的多场景VRU数据集,并通过对比实验验证了YOLOv7在本文目标检测工作中的优越性和潜力。提出改进后的假设与猜想,为后续预警系统开发奠定基础。
3算法模型的优化3.1整体优化框架设计COCO数据集统计显示,传统Mosaic随机裁剪易将小目标分割至不同子图,导致训练噪声。小目标在Mosaic增强后漏检率增加12%REF_Ref18834\r\h[32],多尺度特征保留的改进后,小目标(<80×80像素)在20×20特征图上的响应强度提升37%(Grad-CAM可视化结果),AP@0.5从74.8%提升至82.3%REF_Ref18880\r\h[33]。运用Task-AlignedAssigner取代静态IoU阈值分配策略,依据分类置信度与定位精度的联合评分动态地对正负样本给予分配,实验说明,小目标的正样本匹配率由45%提高到了68%REF_Ref18913\r\h[34],基于上述文章研究,本章给出一个系统性的优化框架以便提升YOLOv7模型在复杂场景下的检测性能。优化框架包含三个部分,分别是输入处理优化、主干网络改进以及多尺度特征提高和自适应特征融合。图3.1.1YOLOv7网络结构图凭借这些多等级的卷积、池化及特征融合模块,最终生成的特征图会被拿去进行目标检测和分类,该框架切实提高了YOLOv7处理复杂场景的稳固性,尤其是在应对遮挡、光照变化和背景干扰现象时,能更高效地处理多尺度目标,进而增强检测的精度。3.1.1输入处理改进输入层首先会接收规格是(640,640,3)的图像,这种规格的挑选是为了平衡计算复杂度跟检测精度,保证模型在实时应用里能高效运行,图像借助多个卷积层也就是Conv2D和批归一化即BN层来开展初步处理,这个阶段的处理流程采用了Conv2D-BN-SiLU的组合结构,来提取图像的基础特征并实施归一化,以此加快训练过程并提升模型的稳定性。依靠这一组合结构,模型可渐渐学习到图像中的边缘、纹理等低级特征。在初步处理阶段,会对图像的尺寸以及通道数做出调整,最终生成尺寸为(320,320,64)的特征图,此过程减少了计算量REF_Ref19079\r\h[35],同时保留了图像关键特征,为后续特征提取与融合奠定基础REF_Ref19079\r\h[35],借助这一高效图像处理流程,模型在保证实时性的情况下,能有效提取图像里的基础特征。3.1.2E-ELAN模块改进和MP模块的多尺度特征增强图像贯穿E-ELAN模块,此模块采用多层卷积操作(包括不同的卷积核大小K=3,K=1)相结合,还采用通道拼接(Cat)操作对不同尺度的特征图进行融合,此类特征融合可有效获取大目标与小目标的特征,增强对多尺度目标的觉察水平,E-ELAN模块中的各卷积操作都采用MP来降低空间的维度,由此让网络在处理大目标时依旧能维持不错的精度,MP模块接着借助最大池化操作(K=3,S=2)实现特征图下采样,进一步缩减计算量及参数,维持高效的计算水平,同时为不同尺度目标的检测给予支撑,每个池化操作皆会对特征图进行压缩,进而提取出更具代表性特征REF_Ref19118\r\h[36]。图3.1.1整体图优化框架图3.2多尺度特征提取模块的优化为处理有着不同尺度的目标,特征提取借助多尺度卷积核的设计强化图像特征的捕捉能力,把输入图像设成I∈RH×I×F=Conv(I,K其中,K为卷积核的大小,为强化多尺度目标的检测本领,引入了大小多样的卷积核,卷积操作可实现不同尺度特征的提取,经由多次卷积操作,图像特征渐渐被压缩,进而强化特征表达能力REF_Ref19213\r\h[37]。多尺度特征提取通过不同层级的卷积操作实现特征图的融合,生成多层次的尺度特征图。具体来说,低层特征图主要包含目标的细节信息,如边缘和纹理,而高层特征图则提供了全局的上下文信息,这对于理解目标的语义和位置至关重要。将特征图表示为{Fi}Fmultiscale
=i=1其中,各尺度特征图的权重就是α表3.1不同卷积核大小和融合方式对检测性能的影响卷积核大小融合方式小目标检测mAP@0.5复杂场景mAP@0.5:0.953x3单一0.450.605x5单一0.500.657x7单一0.550.68多尺度加权融合0.600.70多尺度卷积核设计与特征融合机制提升模型多尺度目标检测能力。这种设计可以捕捉到目标的细节特征,还可提供全局的上下文信息,在复杂交通场景里实现对弱势道路使用者的高精度检测,这一创新给基于深度学习的弱势道路使用者预碰撞系统提供了坚实的技术支撑,保证了模型在实际应用中的检测精度与鲁棒性。3.3自适应特征融合与调整机制在深度学习范畴里,针对目标检测这项任务而言,怎样可有效地融合多尺度特征图来提高模型性能成为关键的难点所在,本章重点关注自适应特征融合以及参数调优的方法,借助嵌入动态权重分配机制,达成对不同尺度特征图的精准控制,较大提升模型在多尺度目标检测方面的准确性和稳定性。传统的特征融合方法大多运用静态加权策略,而在处理多尺度目标的时候会存在一定的局限性。要解决这一问题,动态加权特征融合机制会去计算不同尺度特征图的响应强度,以此来自适应地调整每个特征图的权重,优化特征融合过程REF_Ref19301\r\h[39]。设输入特征图为F1,Ffuse=i=1n其中,wi为特征图Fi赋予的权重。这些权重通过计算特征图的响应强度resiresi=1这里,Hi和Wi分别代表特征图Fi的高度和宽度,为了让特征融合的效果可得到提高,在此次研究当中特意引入了注意力机制,以此来使得信息处理的效率可以得到提升,这一机制是依靠给予特征图的关键区域更高的权重来实现的,其作用是引导模型可将注意力集中在图像的关键部分,如此一来便可以让较大特征的提取能力得到强化。注意力权重αiFatt=σ(Watt其中,σ表示Sigmoid激活函数,Watt和多尺度特征提取是目标检测中的一个关键步骤。借助运用多层卷积运算的方式,模型得以生成有渐进尺度的特征映射,底层的特征图主要聚焦于目标的局部特性,像是边缘以及纹理等方面,而高层的特征图则更侧重于提取全局语义信息。这种多层次的特征表示能够帮助模型更好地理解和识别不同尺度的目标REF_Ref19458\r\h[41]。设特征图为{FiFfused=i 其中,wi是不同尺度特征图的权重,这些权重可以根据不同尺度目标的相对重要性进行自适应调整。最终输出的特征图特征融合的数学依据是借助加权和手段对不同尺度的特征图实施线性组合,此方法可有效整合不同尺度的信息,提升模型的检测性能,特征融合进程可看作是一种线性变换,把不同尺度的特征图映射至一个统一的特征空间里。设输入特征图为F1,F2,…,Fn,每个特征图Fi归一化处理:对每个特征图F加权相加:通过加权相加的方式将不同尺度的特征图融合为一个特征图F激活函数:应用非线性激活函数(如ReLU或SiLU)以增强特征图的表达能力。具体公式如下:Ffuse=σi=1n其中,σ表示激活函数,wi表示特征图为了进一步优化特征融合过程,提出了以下策略:动态权重调整:通过计算特征图的响应强度,动态调整每个特征图的权重。响应强度的计算公式如下:resi=1多尺度特征增强:采用不同尺寸的卷积核来提取不同尺度特征,以此提高模型对多尺度目标的检测能力,其中卷积核尺寸包括3x3、5x5以及7x7。注意力机制:引入注意力机制后,借助给特征图特定区域赋予更高权重的方式,可让模型更加聚焦于图像的关键区域。注意力权重的计算公式如下:Fatt=σ(Watt自适应特征融合跟调整机制为处理多尺度目标检测问题给出了一种有效的解决办法,借助动态加权不同尺度的特征图,并且结合注意力机制聚焦关键区域,此机制提升了模型对弱势道路使用者的检测能力,这一创新给基于深度学习的弱势道路使用者预碰撞系统提供了有力的技术支撑,保证了模型在实际应用里的检测精度。3.4优化后系统性能对比为了验证YOLOv7在优化前后的性能究竟发生了怎样的变化,我们在前文所提到的综合数据集上展开了相关实验。此数据集囊括了诸多交通场景中的图像,可用以评估模型在弱势道路使用者检测任务里的表现情况。图3.4.1数据集训练情况3.4.1检测精度与速度对比模型训练阶段中,未改进的YOLOv7模型平均精度均值()有0.65,优化后的模型借助调整特征提取层、优化损失函数以及强化特征融合机制,让mAP提升至0.75,从速度测试角度看,优化前的YOLOv7,FPS计为30,FPS提至45,说明优化后的模型在精度层面有所提升,推理速度实现显著跃升,适应了实时检测标准。实验采用下述公式求mAP=1Ni其中,N表示类别总数,APi表3.4.1YOLOv7优化前后的检测精度和速度对比ModelmAP(MeanAveragePrecision)FPS(FramesPerSecond)YOLOv7(Original)0.6530YOLOv7(Optimized)0.75453.4.2复杂场景中的检测效果分析实验关注光照变化、遮挡以及背景干扰等因素对YOLOv7模型性能的影响,此影响体现在复杂场景的检测效果方面,优化后的YOLOv7可有效处理复杂背景与目标遮挡难题,在交叉路口、学校区域等高风险场景结合行车记录仪展开多工况道路测试,道路测试结果说明,原始YOLOv7模型在复杂场景中的mAP是0.62,FPS为25,优化后的模型在相同测试集上mAP提升到0.72,FPS提高至40,单张图像处理时间从0.10秒缩短至0.08秒。这一结果说明,优化后的模型处理复杂场景时,检测精度得到提高,推理速度也同样加快。以上结果说明,经优化的YOLOv7可精准识别被遮挡目标,促进了复杂场景中小目标检测精度的提高,在城市道路场景里面,背景中的车辆、行人等目标往往面临较强遮挡,优化后的模型可有效削减误检比率,还能维持较高的检测精度水平,表3.4.2及图3.4.2展示出复杂场景里检测精度与速度的对比数据:表3.4.2复杂场景中的检测精度与速度对比结果ModelDetectionPrecision(mAP)FPS(FramesPerSecond)DetectionTime(Seconds)YOLOv7(Original)0.62250.10YOLOv7(Optimized)0.72400.08图3.4.2通过柱状图形式,直观呈现了优化后的YOLOv7模型在复杂场景中相较于原始模型的显著性能提升,进一步验证了优化措施在提升检测性能方面的有效性。图3.4.2复杂场景下的检测精度、FPS和检测时间对比图3.4.3目标检测的对比分析在多尺度目标检测领域,经过优化的YOLOv7呈现出性能的提升,实验按照目标面积大小,把目标分成小目标和大目标这两类,分别计算了它们的检测精度以及FPS,原始YOLOv7在小目标检测方面的mAP是0.55,优化后提高到了0.68,大目标的mAP从0.70提升到0.80。优化后的模型在处理不同尺度目标时都取得了性能进步,小目标的FPS从20提升至30,大目标的FPS从35提升至50,证实了优化措施的有效性。ModelSmallObjectDetectionPrecision(mAP)LargeObjectDetectionPrecision(mAP)SmallObjectFPSLargeObjectFPSYOLOv7(Original)0.550.702035YOLOv7(Optimized)0.680.803050表3.4.3小目标和大目标检测中的对比结果图3.4.3通过柱状图形式,直观展示了小目标和大目标检测精度及FPS的对比,进一步证实了优化后的YOLOv7模型在不同尺度目标检测中的卓越性能。图3.4.3小目标和大目标检测精度及FPS对比图经过优化的YOLOv7模型在检测精度以及速度这两个方面都有着出色的表现,在复杂场景当中,以及对不同尺度目标进行检测的时候,该模型呈现出了性能的提升,优化后的YOLOv7在多尺度目标检测的精度和速度方面都有了提高,在小目标检测的精准度以及大目标处理的速度上,优化模型表现出了明显优势。3.5本章小结在这一章节之中完成了优化框架的设计以及实现工作,以此来促使YOLOv7模型于复杂交通场景里的检测性能得到提升。首先依据性能评估结果制定了多项优化策略,覆盖算法参数调整以及模型结构调整等方面,于输入处理阶段提出了图像预处理优化策略,改进了E-ELAN模块的特征提取和融合能力,使得模型对小目标的检测敏感性得到提升,小目标的可见性有所提高,模型对不同光照条件的适应能力也得以提升。同时调整E-ELAN模块中的卷积核参数,特征提取的效率与精度得到提高。在多尺度特征提取领域,对MP模块给予了重新构建,运用空洞池化与最大池化级联的结构形式,提高了模型多尺度特征提取的能力,此项改进经过实验得到验证,提高了模型对不同尺度目标的检测精度,在小目标和远距离目标检测方面成效较大,本章还提出了自适应特征融合与调整机制,借助动态权重分配策略优化跨层特征融合路径,提升了模型对复杂场景的适应性以及检测精度。最后针对优化之后的系统展开了性能评估,将优化之前与之后的性能结果给予对比,以此验证优化策略具有有效性,实验结果显示,优化后的系统于检测精度以及速度方面都有了提升,在复杂场景和多尺度目标检测里表现突出,这些优化措施给预碰撞系统给予了更可靠的技术支持。
4预碰撞系统设计与集成4.1系统架构设计为处理预碰撞系统预警精度欠缺以及误报漏报率偏高这类问题,此项研究设计了一种基于特定区域的预警触发机制,借助在车辆前向空间打造梯形监测区域,并且把易受伤害道路使用者是否处于该区域当作预警判定标准,以此优化检测与预警的精确程度REF_Ref19602\r\h[42]。于是构建了一个“检测-预测-预警”一体化的系统架构,如图4.1所示。该架构的核心在于将轻量化的测距算法和动态区域报警逻辑直接集成到YOLOv7模型中,并通过PyQt5实现低延迟的可视化显示REF_Ref19638\r\h[43]。系统架构主要分为三个模块:改进的YOLOv7检测模型、轻量化测距与区域报警模块、以及PyQt5可视化界面。图4.1预警系统架构图经过改进的YOLOv7检测模型在检测头也就是Head之后新增加了预测分支,依靠这个预测分支可输出目标位置以及尺寸的归一化参数REF_Ref19680\r\h[44-REF_Ref19687\r\h45]。此优化方案在给予模型目标检测能力之际,也为预测与预警模块后续的运行给予了关键的数据支撑,借助这一分支网络,系统可实时得到目标的位置信息以及尺寸参数,为精确测距以及精准报警功能的达成提供了可靠的输入依据REF_Ref19723\r\h[46]。图4.1用于VRU的改进型YOLOv7-StrongSORT算法结构轻量化测距与区域报警模块依据检测框的几何特性来计算目标的相对位置,动态划定虚拟预警区域REF_Ref19889\r\h[47],基于实际测试以及行车记录,本文把界面下方的1/6区域设定成危险区域,一旦检测到的目标进入该区域,系统便会触发报警逻辑,及时向驾驶员提示潜在的碰撞风险,此模块的设计全面考量了实际驾驶场景中的风险分布,保证了预警的及时性与有效性。最后要说的是,PyQt5可视化界面模块承担着实时显示检测框、预警区域以及报警状态的任务REF_Ref19922\r\h[48],此模块可支持动态配置IOU和CONF阈值,还可兼容摄像头检测、图片检测以及视频检测等多种输入方式,借助直观的图形化界面,驾驶员可实时知晓周围环境里的目标位置以及潜在风险,做出及时的反应。系统架构设计的创新点在于把检测、预测以及预警功能整合在一起,借助改进YOLOv7模型的检测头,添加预测分支,达成了目标位置与尺寸的实时输出,引入轻量化测距算法与动态区域报警逻辑,让系统可以高效计算目标相对位置并动态划定预警区域,提高了预警的准确性与及时性。结合PyQt5的低延迟可视化技术,系统可实时呈现检测结果和预警信息,给驾驶员提供直观的视觉反馈。4.2功能原理介绍4.2.1PyQt5框架选择在车载预碰撞系统的开发工作当中,挑选适宜的框架是十分关键的,PyQt5凭借其出色的跨平台兼容特性、高效的开发效率以及良好的资源占用优化能力而崭露头角,成为了本研究构建用户界面时的首选框架REF_Ref19958\r\h[49]。跨平台兼容性属于PyQt5的关键优势,它可以在Windows、Linux以及嵌入式系统像树莓派等多种硬件环境里顺利运行,如此广泛的兼容性恰好符合车载设备对操作系统和硬件配置的多样需求,保证了预碰撞系统可在不同车载平台稳定部署且高效运行,PyQt5应用于不同平台运行时,底层的Qt框架会自动适配平台特定的API,避免了不少常见的兼容性问题。PyQt5框架带有功能颇为强大的QtDesigner可视化工具,这使得人机交互界面的设计流程得到很大程度简化,在构建预警界面原型的时候,借助PyQt5的可视化设计工具,开发周期缩短到了仅仅3天,与之相比,如果采用传统的C++Qt开发方式,大约需要花费2周时间。如此一来,研发速度加快了,开发团队可更迅速地应对需求变化并开展功能迭代。此框架借助集成多线程管理机制即QThreadPoolREF_Ref19987\r\h[50],达成了检测、跟踪、预警等多个关键模块的并行运算,相较于单线程设计,这种多线程并行处理模式使CPU利用率较大下降,大幅度提升了系统的整体性能以及响应速度,为对实时性要求极高的车载预碰撞系统给予了坚实的技术支撑。4.2.2单目视觉测距启发式规则ADDINCNKISM.UserStyle在车载预碰撞系统中,精确的距离测量对于预警的及时性和准确性至关重要。然而,实际应用中的测距过程往往需要依赖多传感器融合,如激光雷达和视觉传感器。为了简化系统架构并提高实时性,于是李明等人REF_Ref20016\r\h[51]提出了一种基于检测框几何特性的轻量化测距方法。目标距离估计。假设摄像头的安装高度h固定,且目标的实际高度Hreal已知(例如,行人的平均身高约为1.7米,自行车的高度约为1.2米),可以通过相似三角形原理推导出像素高度Hpixel与实际距离DD=f⋅H其中,f本研究引入卡尔曼滤波技术处理连续帧的距离估计,以此提高测距稳定性,减少环境抖动或其他噪声因素引发的测量误差,实验结果显示,在50米测量范围内,该轻量化测距方法的误差能控制在±10%以内,可契合车载预碰撞系统预警需求REF_Ref20046\r\h[52]。借助基于检测框几何特性的轻量化测距办法,此项研究在保证测距精度之际,降低了系统的复杂度以及资源消耗,为系统给予了一种高效且可靠的解决办法。4.2.3区域预警功能设计为了有效提升车载预碰撞系统对VRU的检测与预警能力,本研究基于YOLOv7设计了一种动态区域报警算法。该算法通过在图像平面底部16区域设定矩形危险区来实时监测潜在碰撞风险。具体而言,当目标检测框中心点(xc,yc)动态调整预警区域宽度是该算法的另一关键特性。预警区域宽度WzoneWzone=k⋅其中,k=0.2是经验系数,W0在图像平面底部区域16设定固定矩形危险区,其高度为Hzone=H6报警标志=1为提升预警可靠性,本文引入连续帧验证机制,目标要在连续3帧均进入危险区域才触发报警,以此避免瞬时误报,对于多目标场景,会对每个检测目标独立判定,只要有任一目标触发条件,就会触发全局报警。依据车辆运动学和VRU位置之间的关系,构建了动态危险区域模型,借助单目视觉测距的结果以及目标运动的速度,来计算碰撞时间(TTC)REF_Ref20092\r\h[53]:TTC=Drelv其中,Drel为相对距离,在PyQt5界面中,根据摄像头标定参数(焦距f、安装高度为保证数据同步有较高效率,于误报抑制环节,我们运用连续3帧检测到同一目标进入危险区域才触发预警的方法,切实降低了误报率,实验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 燃气使用安全提示
- 河流生态恢复与灌溉整合
- 给水管网压力监测方案
- 消防安全责任追究制度
- 燃气相关标准与规范汇编
- 消防安全隐患排查方案
- 基础与地基一体化设计
- 给水系统服务质量监测方案
- 城市交通信号优化方案
- 国有粮库建设项目风险评估报告
- 2026年湛江日报社公开招聘事业编制工作人员备考题库及完整答案详解
- 2025年凉山教师业务素质测试题及答案
- 2026年昭通市威信县公安局第一季度辅警招聘(14人)笔试模拟试题及答案解析
- 氢能技术研发协议
- 经皮内镜下胃造瘘术护理配合
- 2025年国企管理人员能力测评试卷及答案
- 电动车装配作业指导书1
- 财务部2025年总结及2026年工作计划
- 国企财务岗笔试题目及答案
- 2025年国家开放大学(电大)《中国近现代史纲要》期末考试复习试题及答案解析
- 企业尽职调查内容提纲-中英文对照
评论
0/150
提交评论