【《目标检测算法发展文献综述》2700字】_第1页
【《目标检测算法发展文献综述》2700字】_第2页
【《目标检测算法发展文献综述》2700字】_第3页
【《目标检测算法发展文献综述》2700字】_第4页
【《目标检测算法发展文献综述》2700字】_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11目标检测算法发展文献综述目标检测方法一般分为两类:一类是基于传统的机器学习检测方法,一类是基于深度学习的检测方法[4]。传统的机器学习检测算法主要是采用滑动窗口的方式进行目标检测。深度学习出现后,基于深度学习的检测方法逐渐涌现,其中可以分为基于候选区的检测算法和不基于候选区的检测算法两大类。以下分别简要阐述了目标检测算法在国内外的研究现状。1传统检测方法传统的检测方法依靠人体自身的外观属性进行特征提取和分类。例如,通过颜色、边缘、纹理、运动等属性描述行人态势,并使用支持向量机SVM、自适应提升[5](AdaptiveBoosting,AdaBoost)等分类器判断特定区域是否存在行人目标。传统的行人检测方法主要采用统计分类的方法,首先对图像进行感兴趣区域(ROIs)分割,然后对ROIs进行特征提取,最后送入分类器进行二分类[6]。大体可分为两类方法:基于模板匹配的方法和基于统计学习的方法。Cavrila[7]等提出了全局模板法,构建了将近2500个轮廓模板进行轮廓识别。Broggi[8]等提出了局部模板法,通过提取人的头部、肩部等二值图像特征模板匹配行人。传统检测方法的基本流程如图1.2所示。该类方法往往受限于特定环境条件,导致特征表达能力不足,无法满足实际场景应用要求。图1.2传统检测方法基本流程2基于深度学习的检测算法在简单场景中的传统的检测方法可以胜任,但针对复杂场景下,传统的检测方法弊端十分明显,即传统的检测方法无法承担逐渐庞大的数据量。2013年,Sermanet[9]等人提出OverFeat算法,这是当时最早采用单一网络检测器进行目标检测的算法,该算法的成功之处在于采用了传统的滑动窗口检测方法,有效利用了卷积神经网络对预期目标的特征进行分类。Hinton[10]于2016年提出了深度学习(DeepLearning)的概念。随后,Lecun等人提出了卷积神经网络,卷积神经网络通过空间关系减少参数数目来提高现有的目标检测模型性能,行人检测的研究再次迎来新的生机。随后,基于区域的检测算法飞速发展。2014年的国际计算机视觉会议上提出了R-CNN(RegionswithCNNfeature)架构,检测的准确率大大提升,此后,目标检测开始广泛使用深度学习的方法进行目标检测。随后衍生出了SPPNet、FastR-CNN以及FasterR-CNN等多种检测模型。RossB.Girshick[11]在2016年提出的新的检测算法FasterR-CNN使得检测模型的综合性能极大提升,在此基础上又提出了例如HyperNet、R-FCN以及MS-CNN等多种算法。其中,HyperNet改进了FasterR-CNN的特征提取部分,提高了小目标检测能力;R-FCN模型使用全卷积网络,实现了共享特征计算;MS-CNN[12]对原始的RPN(RegionProposalNetwork)网络进行修改,进一步优化了检测器的性能。卷积网络把候选区的选定作为预处理,在检测精度和计算速度方面都优于传统的算法。第一类基于候选区的算法虽然在实时检测中的真阳率很高,但算法复杂度更高,而另一类不基于候选区的算法如YOLO(YouOnlyLookOnce)、SSD(SingleShotmultiboxDetector)等,则是在图片或者视频序列的不同位置进行密集抽样,使用不同大小的抽样尺寸再借助卷积神经网络直接进行分类,在实际的工程中得到更广泛的应用[13]。2015年,Joseph和Grishick等提出了第一个one-stage卷积网络检测算法YOLO[14],使用无锚框检测在深入研究后彻底解决了深度学习算法无实时性的问题;Liu[15]等人提出的SSD模型在YOLO模型实时与快速检测的基础上,改善了算法对于不同尺寸大小目标的处理方法,大大提升了算法对小目标的检测能力;Lin[16]等人提出的特征金字塔FPN(FeaturePyramidNetworks)模型则是引入了特征金字塔进行特征提取。2017年Joseph等提出了YOLOv2,在原有的YOLO版本上进行了改进优化,使用Darknet-19的特征提取网络使得模型更具优势,之后在YOLOv2算法基础上提出的YOLO9000算法使用了联合分类检测的训练模型,极大地提升了模型的检测种类范围。YOLO具备精确度和实时性的双重优势也使得它被广泛应用于除目标检测之外的其他领域之中。近年来,基于深度学习的技术在行人检测中更为流行。相比于传统的检测方法,基于深度学习的目标检测算法虽然在构建特征时需要采集更多的样本,特征训练的时间更久,对需求设备提出了更高的要求,但是获得的特征更为优良,进行检测时的速度和精度更有优势,即使在照明不足,衣服颜色融合环境背景,目标遮挡等各种复杂环境下也具有良好的结果。行人作为目标检测中变动性最大漏检率最高的特殊目标,仍是目标检测中最具挑战的项目。参考文献[1]单玉泽.基于特征融合与在线学习的行人检测算法研究与实现[D].南京:南京邮电大学,2016.[2]吴振刚.基于深度学习的目标检测技术研究进展[J].新型工业化,2019,(10):1-4.[3]NobleWS.“Whatisasupportvectormachine?”[J].Naturebiotechnology,2006,24(12):1565-1567.[4]王璟璟.基于多特征学习的行人检测方法研究[D].成都:电子科技大学,2018.[5]JONESM,VIOLAP.“Fastmulti-viewfacedetection.mitsubishielectricresearchlaboratories”[R].TechnicalReport:MERL-2003096,2003[6]单巍,王江涛,方振国,崔少华.基于深度学习的可见光图像中行人检测方法[J].武汉大学学报(理学版),2021,67(02):127-135.[7]GavrilaDM.ABayesian,“Exemplar-BasedApproachtoHierarchicalShapeMatching”[J].IEEETransactionsonPatternAnalysis&MachineIntelligence,2007,29(8):1408.[8]BroggiA,BertozziM,FascioliA,etal.“Shape-basedpedestriandetection”[C]//ProceedingsoftheIEEEIntelligentVehiclesSymposium2000(Cat.No.00TH8511).IEEE,2000:215-220.[9]SermanetP,EigenD,ZhangX,etal.“Overfeat:Integratedrecognition,localizationanddetectionusingconvolutionalnetworks”[J].arXivpreprintarXiv:1312.6229,2013.[10]LeCunY,BengioY,HintonG.“Deeplearning”[J].nature,2015,521(7553):436-444.[11]RenS,HeK,GirshickR,etal.“Fasterr-cnn:Towardsreal-timeobjectdetectionwithregionproposalnetworks”[J].arXivpreprintarXiv:1506.01497,2015.[12]何洪亮.基于卷积神经网络的交通标志检测研究[D].南京:南京理工大学,2018.[13]余卓雨.基于视频的行人检测综述[J].电子世界,2020(24):49-50.[14]RedmonJ,DivvalaS,GirshickR,etal.“Youonlylookonce:Unified,real-timeobjectdetection”[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2016:779-788.[15]LiuW,AnguelovD,ErhanD,etal.“Ssd:Singleshotmultiboxdetector”[C]//Europeanconferenceoncomputervision.2016:21-37.[16]GhiasiG,LinTY,LeQV.“Nas-fpn:Learningscalablefeaturepyramidarchitectureforobjectdetection”[C]//ProceedingsoftheIEEE/CVFConferenceonComputerVisionandPatternRecognition.2019:7036-7045.[17]任虹珊.基于深度压缩的卷积神经网络压缩算法研究[D].上海:东南大学,2019.[18]蒋芸.基于条件生成对抗网络的咬翼片图像分割[J].计算机工程,2019,(4):223-227.[19]曹川.基于深度学习的人脸识别算法研究[D].绵阳:西南科技大学,2019.[20]陈涛,路红.基于深度学习的行人检测技术研究[J].软件导刊,2021,20(01):76-80.[21]RumelhartDE,HintonGE,WilliamsRJ.“Learningrepresentationsbyback-propagatingerrors”[J].nature,1986,323(6088):533-536.[22]李涓楠.基于深度哈希的肺结节CT图像检索方法研究[D].太原:太原理工大学,2019.[23]冯川.基于深度学习的行人重识别技术研究[D].武汉:湖北工业大学,2019.[24]KrizhevskyA,SutskeverI,HintonGE.“ImageNetclassificationwithdeepconvolutionalneuralnetworks”[C]//InternationalConferenceonNeuralInformationProcessingSystems.CurranAssociatesInc.2012:1097-1105[25]SimonyanK,ZissermanA.“VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition”[J].ComputerScience,2014.[26]叶继华,祝锦泰,江爱文,李汉曦,左家莉.人脸表情识别综述[J].数据采集与处理,2020,35(01):21-34.[27]HeK,ZhangX,RenS,etal.“Deepresiduallearningforimagerecognition”[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2016:770-778.[28]张婷婷,章坚武,郭春生,陈华华,周迪,王延松,徐爱华.基于深度学习的图像目标检测算法综述[J].电信科学.2020(07):92-106[29]DengJ,DongW,SocherR,etal.“Imagenet:Alarge-scalehierarchicalimagedatabase”[C]//2009IEEEconferenceoncomputervisionandpatternrecognition.Ieee,2009:248-255.[30]LinTY,MaireM,BelongieS,etal.“Microsoftcoco:Commonobjectsincontext”[C]//Europeanconferenceoncomputervision.Springer,Cham,2014:740-755.[31]ShettyS.“ApplicationofconvolutionalneuralnetworkforimageclassificationonPascalVOCchallenge2012dataset

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论