【AGV全局识别中的目标定位研究国内外文献综述4400字】_第1页
【AGV全局识别中的目标定位研究国内外文献综述4400字】_第2页
【AGV全局识别中的目标定位研究国内外文献综述4400字】_第3页
【AGV全局识别中的目标定位研究国内外文献综述4400字】_第4页
【AGV全局识别中的目标定位研究国内外文献综述4400字】_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AGV全局识别中的目标定位研究国内外文献综述视觉定位可以通过摄像机获取丰富的环境信息,视觉导航方式根据相机安装位置可以分为全局视觉导航和局部视觉导航[2],全局视觉导航相机安装在场景正上方,与车体分离;局部视觉导航相机一般安装在AGV车体上。全局视觉对AGV定位可分为识别和定位两步,首先在全局图像中识别到AGV,然后确定AGV在世界坐标系下位姿。1.1识别方式研究现状目标识别方式根据历史发展过程可以分为传统的目标识别方式和基于深度学习的目标识别方式。传统目标识别根据原理不同可以分为基于颜色的识别方式、基于图像特征点检测于匹配的识别方式、移动目标识别、手动设计特征+分类器的识别方式。基于深度学习的识别方式一般分为基于回归的One-Stage和基于区域候选的Two-Stage方法。通过识别颜色识别特定目标一般通过OpenCV转换颜色空间即可完成检测,然后通过检测结果中目标的形状或相对位置判断是否为目标物体。该方式原理简单、计算快速,但仅应用到颜色信息,易受光照和环境颜色影响,结果准确性不高,一般不单独使用该方法检测目标。针对图像特征点的检测与匹配主要流程一般包括图像预处理、特征点检测、描述子提取、目标匹配。其中特征点检测为关键步骤,特征点包括角点和斑点。角点为图像中线段的交点,角点检测是提出最早的特征点检测方式之一[3]。1980年MoravecH[4]提出的Moravec角点检测算法通过对比目标点与周围点的相似度确定该点是否为角点,该方法可以将图像中局部特殊点提取出来,但不一定是角点。1988年HarrisC等[5]提出的Harris算法是对Moravec算法进行的改进,相比于Moravec算法使用泰勒展开检测了算有方向。为了提高角点提取速度,能够使检测算法在工程中实际应用,2006年Rosten等[6]提出FAST算法,该算法计算速度快可重复性高,在计算机视觉领域应用广泛。斑点为目标区域与周围像素有明显区别的区域,它相对于单纯的角点抗干扰性好。1999年Lowe[7]提出的SIFT算法引入尺度空间理论,有效的解决了目标旋转、缩放、光照等影响,具有十分重要的意义。2006年Bay[8]提出了SURF算法,该算法是对SIFT算法的改进,相较于SIFT算法具有复杂度低、速度快等优点。Alcantarilla针对SURF和SIFT局部精度不够的问题,分别在2012年、2013年提出KAZE算法和AKAZE算法,其中AKAZE算法[9]是对KAZE算法[10]的改进,进一步提高了速度和准确度。由于深度图像关键点与采集的图像中关键点存在区别不好定义,因此基于深度学习的关键点提取方法较少,2015年Verdie[11]提出TILDE通过训练获得特征点探测器,在光照变化明显的情况下也具有良好的性能。2019年Barroso-Laguna等[12]人通过将手工特征点输入到CNN网络中获得了更稳定的特征点。提取特征点之后需要将像素周围区域设计为一个局部特征,通过匹配算法对局部特征进行匹配,这个局部特征就是描述子,描述子在目标旋转、缩放时具有一定的鲁棒性,由于SIFT描述子计算量大,因此有大量改进算法试图解决此问题,例如BRIEF描述子[13]、ORB描述子[14]。BRIEF算法通过在特征点周围采样并比较明暗程度生成一个二值串作为描述子,该算法计算简单,但抗旋转性不好。ORB算法在BRIEF算法基础上解决的旋转不变形问题,目前此算法在SLAM系统种应用广泛。对描述子进行匹配最基本的方式为暴力匹配,该方式可根据不同描述子选用不同距离。FLANN匹配通过最邻近算法寻找匹配对,结果不一定最优,但计算速度有明显提高。基于特征点的匹配方式主要适用于同一物体在不同场景图像中的识别,当物体为同一类但不是同一个时,由于特征描述子不同容易匹配错误,此外特征点检测无法适用于光滑物体。移动目标检测的目标识别方式常用的方法有帧差法、光流法、背景减除法等[15]。光流法通过计算图像像素产生的运动场将图像中的运动目标分割出来,1981年Lucas等[16]提出的LK光流法是经典的光流算法之一,该算法首先计算首先计算图像全局光流场,然后根据运动物体于全局光流场的差异,将其分割出来。光流法一般算法复杂度较高,图像中噪声、阴影会对结果产生较大的影响。帧差法是由Jain等人提出的移动目标检测算法,该算法运算速度快,但易出现鬼影、空洞现象。背景减除法是目前广泛使用的移动目标检测方法,1999年Stauffer[17]首先提出高斯混合模型对背景进行建模,采用多个高斯分布拟合背景,该方法可以在复杂场景下检测出运动物体。2012年Barnich[18]提出VIBE算法对单帧图像进行建模,后续帧开始通过欧氏距离将像素点分为前景和背景,并采用无记忆更新和重采样更新,该算法计算快速,但仍会出现鬼影现象。移动目标简单的目标识别方式主要是对运动的目标进行识别,无法坚持特定种类的目标,常用来检测运动的行人、车辆等移动目标。手动设计特征+分类器的识别方式首先需要手动设计特征,然后分类器对特征分类,最后通过边框回归等方式定位目标。2004年PaulViola等人[19]提出将人脸图像制作成Haar特征,通过AdaBoost算法对其分类实现人脸识别。2010年PedroFelzenszwalb等人[20]提出DPM算法,该算法通过图像金字塔生成不同尺度的HOG特征图,再通过SVM分类实现目标检测。传统的特征+分类器的目标识别方式可以有效检测图像中特定类别的目标,例如行人检测、人脸检测等,但需要手动涉及特征,而且相较于卷积网络提取的特征不够深层次,语义不够丰富,因此准确率不如基于深度学习的目标检测准确度高。2012年,Hinton教授[21]通过使用深度卷积网络在ILSVRC中获得冠军,自此目标检测的方式逐渐以基于深度学习的方式为主。2014年Girshick等[22]提出R-CNN,提出区域候选框概念,在VOC2012数据集上比当时最好的算法准确率提高了17%。2015年何凯明[23]提出SPP-net,该网络模型基于空间金字塔池化层概念。以上两种方式相较于传统方法准确率具有明显提升,但具有计算量大、实时性差的缺点。Girshick对R-CNN网络进行改进提出FastR-CNN网络模型[24],该网络模型结合空间金字塔池化层概念共享卷积过程,与R-CNN相比测试速度提高到146倍,准确率在VOC2012上达到70%。2016年任少卿等[25]提出的FasterR-CNN采用RPN提取候选区域,相较于之前的SelectiveSearch方式大大提高了候选区域检测效率,候选区域可以由2000个降低到300个。2016年JosephRedmon等[26]提出的YOLO算法通过回归的方式不再检测候选区域,检测速度可以达到45fps,2020年最新的YOLO改进版本YOLOv4、YOLOv5通过大量整合计算机视觉领域的最新技术显著改善了检测性能。2016年刘伟[27]结合回归思想和anchors机制提出SSD算法,在检测速度上相较于YOLO更快,可以达到59fps。2017年Lin等人[28]提出RetinaNet,通过新的损失函数解决类别不均衡问题。基于深度学习的目标检测方法准确率较高,One-Stage方法可以满足实时检测的要求,目前广泛应用于各种识别场景,例如缺陷检测、车牌识别、无人驾驶等。1.2目标识别在全局视觉中应用研究现状目前,上述目标识别算法应用在全局视觉下的主要有特征点匹配的识别方式、识别颜色的目标识别方式和目标检测的识别方式,表1.1为不同方式再全局视觉下应用效果对比。基于特征点匹配的识别方式。中国地质大学张枭通过模板匹配的方式对机器鱼进行定位,并利用椭圆区域检测进一步提高速度和准确率[29];黄瑞民采用Camshift组合SIFT定位,为移动机器人设置一个标准模板,Camshift算法计算机器人坐标,SIFT机器人计算与模板之间的角度确定机器人位姿,针对SIFT特征点速度慢的情况使用BRISK特征进行改进[30]。通过模板匹配的方式可以有效确定机器人位姿,但是需要提前采集机器人模板,当光照较弱、特征点较少或机器人图像畸变时,容易匹配错误。此外基于匹配的全局定位方式与无人机视觉定位情形类似,可以通过图像配准方法解决[31]。识别颜色的目标识别方式。Krajnik等通过检测移动机器人上设计的黑白圆环图案设计了一套全局视觉定位系统;电子科技大学樊帮正通过识别AGV顶部两个色标和图像坐标系与世界坐标系的两个参考点,计算机器人在实验平台位姿,从而完成定位[32]。李鹏等针对单目视觉全局定位算法复杂,提出一种识别标定板的双目视觉全局定位方法,考虑了双目相机与移动机器人距离影响精度和准确的情况,并对定位方案进行了实验验证[33]。EmrahDönmez等人在机器人上设计了三个坐标,根据三个标记点与目的地组成三角形的边长和夹角控制速度和方向,并与PID和fuzzy-PID进行了实验比较[34]。此外对机器人做标记进行识别定位的方式还有设计标记卡[35]、扫描二维码[36][37]等,如S.Zickler等通过在移动机器人上设计的蝴蝶式标记进行定位,通过颜色外形等信息通过全局摄像头定位在足球机器人中应用较多[38]。识别标记的方式色标制作方便,多是基于颜色或形状进行识别,定位过程简单易实现,但识别结果易受光照影响,在AGV速度过快的情况下识别效果也会大打折扣,并且在车间环境下标记容易被遮挡,在实际生产环境中无法实际应用。目标检测的识别方式。通过目标检测方式对AGV进行定位,根据目标检测方式可分为传统目标检测方式定位和基于深度学习的检测方式进行定位。哈尔滨工业大学宁志雄通过混合高斯模型和轮廓提取完成车辆位姿的粗估,然后通过AGV调整车辆位置[39];这些方式属于传统目标检测方式检测位姿,传统方式需要提前设计特征,面对车间复杂环境检测效果不好;北京化工大学万元芳分别采用传统图像分割和基于深度学习的图像分割方式识别机器鱼的位姿[40];段晓磊等主要针对AGV遮挡丢失问题,利用LSTM(长短期记忆网络)预测目标运动状态,SVM(支持向量机)进行再识别和矫正[41]。陆玮利用YOLO算法检测目标,均值漂移跟踪目标对AGV进行定位[42]。基于深度学习的目标检测准确率和精度较高,对于光照和背景影响下检测效果优于传统方法,但是检测模型需要提起训练,速度相对较低。表1.1不同识别方式在全局视觉下效果对比全局视觉定位方式具体原理优点缺点基于特征点匹配特征点匹配受光照影响小,原理简单准确度较低,速度较慢,AGV表面不能太光滑基于识别颜色颜色、形状识别原理简单,成本低,易实现,速度快标记易受遮挡、磨损,受光影影响大基于目标检测目标检测定位准确,受光照影响小,不用对AGV做标记原理复杂,速度较慢,需要大量素材训练模型参考文献[1]王松涛.基于视觉的AGV路径识别和跟踪控制研究[D].兰州:兰州理工大学.[2]SeS,DLowe,LittleJ.Globallocalizationusingdistinctivevisualfeatures[C].IEEE/RSJInternationalConferenceonIntelligentRobots&Systems.IEEE,2002.[3]唐灿,唐亮贵,刘波.图像特征检测与匹配方法研究综述[J].南京信息工程大学学报(自然科学版),2020,12(03):261-273.[4]MoravecHP.ObstacleAvoidanceandNavigationintheRealWorldbyaSeeingRobotRover.StanfordUniversity.1980.[5]HarrisCG,StephensMJ.Acombinedcornerandedgedetector[C].Alveyvisionconference.1988.[6]RostenE.Machinelearningforveryhigh-speedcornerdetection[J].ECCV'06,May,2006.[7]LoweDG.DistinctiveImageFeaturesfromScale-InvariantKey-points.Int.J.Comput.Vision[J].InternationalJournalofComputerVision,2004,60(2)91-110.[8]BayH,TuytelaarsT,GoolLV.SURF:Speededuprobustfeatures[C].Proceedingsofthe9thEuropeanconferenceonComputerVision-VolumePartI.Springer-Verlag,2006.[9]AlcantarillaPF.FastExplicitDiffusionforAcceleratedFeaturesinNonlinearScaleSpaces[C].BritishMachineVisionConference(BMVC).2013.[10]AlcantarillaPF,BartoliA,DavisonAJ.KAZEFeatures[J].LectureNotesinComputerScience,2012,7577(1):214-227.[11]VerdieY,YiKM,FuaP,etal.TILDE:ATemporallyInvariantLearnedDEtector[C].CVPR.IEEE,2015.[12]LagunaAB,RibaE,PonsaD,etal.Key.Net:KeypointDetectionbyHandcraftedandLearnedCNNFilters[C].2019IEEE/CVFInternationalConferenceonComputerVision(ICCV).IEEE,2020[13]DaniilidisK,MaragosP,ParagiosN.[LectureNotesinComputerScience]ComputerVision–ECCV2010Volume6314||BRIEF:BinaryRobustIndependentElementaryFeatures[J].,2010,10.1007/978-3-642-15561-1(Chapter56):778-792.[14]RubleeE,RabaudV,KonoligeK,etal.ORB:anefficientalternativetoSIFTorSURF[C].IEEEInternationalConferenceonComputerVision,ICCV2011,Barcelona,Spain,November6-13,2011.IEEE,2011[15]金静.复杂视频场景下的运动目标检测与跟踪研究[D].兰州:兰州交通大学,2020.[16]LucasDD.AnIterrativeImageRegistrationTechniquewithanApplicationtoStereoVision[C].Proc.ofImagingUnderstandingWorkshop,1981.[17]StaufferC,GrimsonWel.Adaptivebackgroundmixturemodelsforreal-timetracking[C].ComputerVisionandPatternRecognition1999.[18]BarnichO,DroogenbroeckMVan.ViBe:AUniversalBackgroundSubtractionAlgorithmforVideoSequences[J].ImageProcessing,IEEETransactionson,2011,20(6):1709-1724.[19]ViolaP,JonesM,EnergyM.RobustReal-TimeFaceDetectionIntrotoFaceDetection[J].2004.[20]FelzenszwalbPF,etal.ObjectDetectionwithDiscri

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论