下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
XXXV车辆行人检测算法研究的国内外文献综述目标检测是计算机视觉领域中的一个重要且值得深入研究的方向,在自动驾驶、辅助驾驶领域都有应用。目标检测不仅要精确判断出目标属于哪一类别,又要精确定位出目标。车辆行人检测是对图像或视频中的行人车辆目标分类和定位的综合性图像处理问题。纵观目标检测技术这些年的研究,根据特征提取主要可划分为如下两个阶段:基于人工设计特征的传统目标检测和基于深度学习卷积特征的目标检测。1.1传统的车辆行人检测现状对于传统的车辆行人检测算法来说,步骤很简单,如图1-1所示,根据几个步骤进行:首先是要对交通车辆行人图像进行预处理,然后对每一张输入的图像进行滑动窗口的遍历操作,通过不同尺寸的窗口在图像上滑动提取相关的特征,利用的是人工设计构造的目标的某种特征。图1-1传统车辆行人检测Fig.1-1Traditionalvehicleandpedestriandetection相关学者根据采用的特征以及分类器的选择做了以下研究如下:Dalal等人提出一种用来描述局部图像信息的特征,梯度方向直方图(HistogramofOrientedGradient,HOG)特征,并将该特征输入支持向量机(SupportVectorMachine,SVM)分类器,用于行人检测[5]。Zhu[6]等人为了加速图像特征的提取,提出HOG特征并且和能够进行筛选特征的adaboost分类器结合,进而通过提升特征的细节信息,提高模型的检测精度和检测速度。Mu[7]等人提出了用来提取局部特征纹理的局部二值模式(LocalBinaryPatterns,LBP),特征的两个改进版本是Semantie-LBP和Fourier-LBP[8]。Lowe[9]提出了一种更具表达能力的尺度不变特性的特征(ScaleInvariantFeatureTransform,SIFT),该特征描述了图像的梯度和方向信息。2008年可变形部件模型[10](DeformablePartModels,DPM)提出人工地设置卷积核,利用卷积核提取图像的特征,最后通过分类和回归进行目标检测,DPM模型在目标检测任务中比较受欢迎。这些传统的方法都是基于人工设计的特征没有很好的鲁棒性,特征表达能力较弱,存在一定弊端的,过于依赖以往经验,不能很好地表达图像的高级语义信息且检测效果不好,检测算法的稳健性不强。由于容易出现错误检测的问题,传统的方法在复杂的交通场景中检测性能不佳。1.2基于深度学习的车辆行人检测现状近几年来,随着深度学习在很多领域都有突破性进展,目标检测也迎来了新的发展机遇。卷积神经网络CNN对特征提取地比较全面,GPU的特点是并行计算,促使CNN得以推广。车辆行人检测也开始采用卷积神经网络的方法。CNN的优势是能提取图像中高层语义特征,不再用人工设计的特征,随后很多基于神经网络的目标检测方法应运而生。CNN在ImageNet图像比赛上获得了不错的成就,2012年AlexNet通过卷积神经网络(CNN)获得ImageNet比赛的冠军[11],CNN也受到人们更多的关注了。根据检测思想原理不一样,可以将深度学习目标检测算法分成两类:基于区域生成的二阶段检测算法和基于回归预测的一阶段检测算法。这两类目标检测算法在检测精度和检测速度上各有优势,下面分别对这两类算法进行详细地介绍和分析。基于区域生成的二阶段检测方法的特点是需要使用生成算法找到不同的候选框,如图1-2所示,然后将候选框上提取出来的特征作为回归和分类的输入。Girshick等人提出了一种名为R-CNN[12]的检测方法,该方法是首先根据选择性搜索算法对输入的图像生成候选区域,其次将所有候选区域输入到CNN模型中进行特征的提取,最后将特征使用SVM分类器进行分类回归。FastR-CNN[13]是R-CNN的改进算法,改进的部分是提出了ROI池化层将不同特征图的尺寸归一化,不再重复计算。FastR-CNN的另一个特点是通过softmax层代替SVM分类器来提高检测结果。2015年,RossGirshick[14]对SPPnet[15]和R-CNN的思想进行了综合改进,提出了FasterR-CNN[16]。该模型使用了(regionproposalnetwork)RPN,RPN是全卷积区域建议网络,用卷积神经网络来进行区域生成候选框,同时引入了anchor的概念。在RPN中,每个滑动窗口位置检测到的区域就是anchor。通过不同大小的anchor进行多尺度的检测,结果也更加精确。基于FastR-CNN改进的多尺度感知行人检测模型[17]取得不错的成果。这些区域生成目标检测算法一般检测准确率较高,但是因为在区域生成的计算上花费了太多时间,检测速度相对较慢。首先生成候选区域,接着对候选区域进行分类和位置的回归,一来增加了模型的训练难度,二来导致模型的网络运行速度过于慢,用于交通场景上的车辆行人检测是没法满足实时检测的要求。图1-2基于区域生成的二阶段检测算法Fig.1-2Two-stagedetectionalgorithmbasedonregiongeneration基于回归预测的一阶段检测方法是一步到位,将整张图片输入卷积神经网络,进行卷积操作提取特征,在图像上不同的位置回归出目标的检测边框和目标的类别,完成端到端的检测。该方法的优点是提高了检测速度,但是检测的准确率却降低了。2016年YOLO(YouOnlyLookOnce,YOLO)由RedomJ[18]提出,这是一阶段(onestage)目标检测算法具有代表性的实时性检测经典模型,YOLO的检测流程是将输入图像分成S×S的网格,在每个网格上进行预测,每个预测框要预测目标的类别置信度和每个框的坐标,最后通过非极大值抑制算法把多余的预测框去掉,得到最后的预测。因为跳过了候选区域生成这一步,检测性能有了很大程度的提升,但是该算法对小尺度目标检测效果不太好。2016年,Liu提出了SSD[19](SingleShotMultiBoxDetector,SSD)算法,SSD借鉴了YOLO,采用FasterR-CNN的anchor机制,使用多尺度特征图预测。SSD算法在不同尺度的特征图上设定不同尺寸和宽高比的默认框(defaultbox),解决了YOLO算法检测精度低的问题,对小目标的漏检也得到改善。针对小目标检测及遮挡目标漏检导致检测精度低的问题,Kim[20]综合了SPP网络和YOLO-V3的特点,通过多层预测提高遮挡目标的检测精度。FUCY等人提出DSSD[21](DeconvolutionalSingleShotDetector),在反卷积操作下对高层特征和低层特征进行融合,提升小目标的检测精度。LiuS提出的RFB[22](ReceptiveFieldBlockNetforAccurateandFastObjectDetection),RFB结合SSD的优势,对感受野大小改进,提升小目标检测性能。Nguyen[23]在FasterR-CNN的基础上改进,采用了上下文感知池化,提高了小目标车辆和遮挡车辆的检测精度。Zhou等人[24]将对抗网络与级联的FasterR-CNN相结合,对小目标及遮挡目标有更好的鲁棒性。Cai等人[25]提出CascadeRCNN方法,通过级联的方式并且改变IoU阈值。ZhuCC等提出的FSAF[26]自适应学习目标特征,SSD网络中加入FSAF模块,对小目标检测友好。但目前的方法对交通场景下的小目标检测效果还是不理想。参考文献[1]邹伟.中国机动车保有量达2.64亿辆[J]广东交通,2015(1):56-56.[2]李生才,笑蕾.2018年5-6月国内生产安全事故统计分析[J].安全与环境学报,2018,18(04):1639-1640.[3]郁梅,郁伯康.智能交通系统中的计算机视觉技术应用[J].计算机工程与应用,2001,37(10):101-103.[4]李珊珊.基于深度学习的交通场景多目标检测[D].湖南大学,2017:2-3.[5]DalalN,TriggsB.HistogramsofOrientedGradientsforHumanDetection[C].IEEEConferenceonComputerVisionandPatternRecognition,SanDiego,CA,USA,2005:886-893.[6]ZhuQ,YehMC,ChengKT,eta1.FastHumanDetectionUsingACascadeofHistogramsofOrientedGradients[C].IEEEConferenceonComputerVisionandPatternRecognition,NewYork,NY,USA,2006:1491-1498.[7]MuY,YanS,LiuY,etal.Discriminativelocalbinarypatternsforhumandetectioninpersonalalbum[C].InProceedingsofComputerVisionandPatternRecognition,2008:1-8.[8]AhonenT,HadidA,PietikainenM.Facedescriptionwithlocalbinarypatterns:Applicationtofacerecognition[J].PatternAnalysisandMachineIntelligence,IEEETransactionson,2006,28(12):2037-2041.[9]LoweDG.ObjectRecognitionfromLocalScale-InvariantFeatures[C].ProceedingsoftheInternationalConferenceonComputerVision,Kerkyra,Corfu,Greece,1999:1150-1157.[10]FelzenszwalbP,McallesterD,RamananD.ADiscriminativelyTrained,Multiscale,DeformablePartModel[C].IEEEConferenceonComputerVisionandPatternRecognition,Anchorage,Alaska,USA,2008:1-8.[11]KrizhevskyA,SutskeverI,HintonGE.ImageNetclassificationwithdeepconvolutionalneuralnetworks[C]//InternationalConferenceonNeuralInformationProcessingSystems.Doha:SpringerCham,2012:1097-1105.[12]GirshickR,DonahueJ,DarrellT,etal.Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation[C]//ComputerVisionandPatternRecognition.Columbus:IEEEPress,2014:580-587.[13]GirshickR.FastR-CNN[C]//IEEEInternatonalConferenceonComputerVision.Santiago:IEEEPress,2015:1440-1448.[14]RenShaoqing,HeKaiming,GirshickR,etal.FasterR-CNN:TowardsReal-TimeObjectDetectionwithRegionProposalNetworks[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2017,39(6):1137-1138.[15]HeK,ZhangX,RenS,etal.Spatialpyramidpoolingindeepconvolutionalnetworksforvisualrecognition[J].IEEEtr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 周口文泰高级中学2026年招聘教师备考题库及一套答案详解
- 2026年长铺专职消防站招聘9人备考题库及1套完整答案详解
- 2026年达州这家国企招聘备考题库完整参考答案详解
- 2026年西安长安大学工程设计研究院有限公司招聘备考题库完整答案详解
- 供应商管理制度
- 南昌职教城教育投资发展有限公司2025年第七批公开招聘工作人员备考题库带答案详解
- 上海市宋校嘉定实验学校2026学年教师招聘备考题库附答案详解
- 2026年西安惠安医院招聘备考题库及一套参考答案详解
- 企业市场调研与分析制度
- 2026年黑河市第二人民医院长期招聘临床医生及影像科技师5人备考题库完整答案详解
- 交通安全志愿者培训课件
- 化工防止静电安全培训课件
- AI药物研发中的伦理风险防控
- 2025年江苏省泰州市保安员理论考试题库及答案(完整)
- 大数据分析在供热中的应用方案
- 污泥安全管理制度范本
- 开题报告范文基于人工智能的医学像分析与诊断系统设计
- 大黄附子细辛汤课件
- 中润盛和(孝义)新能源科技 孝义市杜村乡分散式微风发电项目可行性研究报告
- 2026年中国农业银行秋季校园招聘即将开始考试笔试试题(含答案)
- 山东济南2019-2024年中考满分作文87篇
评论
0/150
提交评论