版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器人同时定位和建图(SLAM)技术发展研究的国内外文献综述1.1视觉SLAM研究现状视觉SLAM是指利用图像作为外部信息的来源,以确定机器人、车辆或移动摄像机在环境中的位置,同时构造探索区域地图的方法。在视觉SLAM中,采用视觉传感器被作为主要传感器,主要有单目相机、深度相机、事件相机等。在过去的20年里,由于视觉传感器性能的提升以及在嵌入式设备中的普及,视觉SLAM受到了计算机视觉和机器人社区的广泛关注。SLAM是机器人自主性的关键环节。最初,定位和建图是独立研究的,后来研究者认识到它们实际上是相互依赖的,这意味着,为了在环境中精确定位,需要一个正确的地图,但为了构造一个好的地图,当元素被添加到地图中时,也需要定位的支持,所以这个问题被称为同步定位和建图[1]。Davison等人创建的实时单目SLAM系统-MonoSLAM[2,3],是视觉SLAM领域一个里程碑式的工作。2007年,Klein和Murray[4]提出的实时视觉SLAM系统PTAM(paralleltrackingandmapping)可以并行跟踪特征点和建立地图,具有更高的精度和鲁棒性。Mur-Artal等人[5]提出ORB-SLAM2因为它的全面性受到了广泛研究。ORB-SLAM2的全面性体现在它能够处理来自多种传感器的数据,比如单目相机、双目相机和RGB-D相机,后端在建立全局的稀疏地图重建时采用了BA算法,它相比于其它同级别SLAM方法更加轻量化,不需要较多额外计算资源的支持,应用于较为精准的全局定位。它是涵盖特征点提取、回环检测、回环优化和优化策略的全面的SLAM系统,由于它的全面、精确和可靠性,被广泛应用和研究。图1-5ORB-SLAM2框架Figure1-5FrameworkofORB-SLAM2最早的基于RGB-D的SLAM系统是由Newcombe等人提出的KinectFusion[6],这种方法将深度数据进行融合,使用ICP算法来跟踪相机的位姿,在基于RGB-D的SLAM领域和三维重建领域具有里程碑的意义。但由于地图的体积表现形式限制和缺乏回环检测,这种算法只能工作在小的工作空间。如图为KinectFusion实现的稠密三维表面重建。2012年开始,在KinectFusion的基础上,ThomasWhelan等人做出了基于网格建图的改进,它通过使用通过位置定位以及位姿优化的方法来达到回环检测的目的,并将其应用于大规模复杂环境建图当中[7,8,9]。2015年,英国伦敦大学帝国理工学院Dyson机器人实验室基于RGB-D相机,提出了一种不需要位姿图和预处理的三维地图构建方法-ElasticFusion[10]。这种三维地图构建方法以地图为中心,重建和定位的准确性和鲁棒性都达到了比较良好的效果,但是由于这种方法需要额外的计算资源支持,所以目前应用于性能较好的平台或者建立小规模地图。ElasticFusion利用全局回环检测来解决漂移问题,从而提高地图全局精度的解决方式,给这个领域后来研究人员提供了参考。图1-6ORB-SLAM2地图构建Figure1-6ORB-SLAM2mapbuilding图1-7ElasticFusion地图构建Figure1-7ElasticFusionmapbuilding2017年,麻省理工大学的AngelaDai等人提出了实时性更强、全局一致性更好的三维重建SLAM模型-BundleFusion[11],这被认为是目前全局性最好的稠密SLAM方法。图1-8BundleFusion地图构建Figure1-8BundleFusionmapbuilding高质量密集表面重建实现的一种方法是在循环中使用高级场景理解来改进实时视觉SLAM系统,它具有强大的摄像机定位、更高效和压缩的场景表示和感知能力。RenatoF.Salas-Moreno等人在利用先验知识的基础上,结合深度学习,可以在三维重建的基础上,利用重建的高质量表面获取语义信息来改进实时视觉SLAM系统,与传统方法相比可以进一步增强机器人的感知能力。结合深度学习创建语义地图将是SLAM的一个重要研究方向[12]。图1-9语义地图Figure1-9Thesemanticmap深圳大学的曹龙龑等人改进了基于RGB-D的SLAM八叉树地图[13],八叉树地图结构可以解决体素结构在表示地图过程中太粗糙的缺点,做到了三维栅格占据地图的优化。图1-10体素结构地图Figure1-10Voxelstructuremap中科院自动化所国家模式识别国家重点实验室的机器视觉课题组也一直在研究三维重建工作,并在大规模古籍重建取得了良好成果[14]。苑立杉[15]针对视觉传感器在纹理不丰富和移动比较快速场景下导致系统无法正常工作的缺陷,融合IMU传感器以提高系统稳定性。当前视觉SLAM系统的精确、健壮的跟踪和高质量的重建能力通常需要专用的强大硬件,如多核CPU和GPU,它们的高计算需求消耗了大量的资源,这也导致了巨大的热量[16]。寻求高效率、低消耗的定位和建图方法是机器人领域走向实际应用领域的关键。综上所述,视觉SLAM方法在高计算支持环境下取得了良好的效果,基于RGB-D相机的SLAM重建方法相对传统视觉方法具有一些不可比拟的优势。但是在嵌入式设备上运行的实时性和稳定性仍然制约着其应用和发展。1.2三维重建几何表示方法研究现状随着三维SLAM的发展,在机器人研究和应用领域,三维地图表现形式逐渐取代了二维平面地图。三维几何建模的问题受到研究者的广泛关注,度量表示是编码环境几何图形的符号结构。为SLAM选择合适的度量表示对导航、与环境的物理交互以及人机交互有重要意义。在地图构建方面一个尚未解决的问题是如何在长期操作期间进行地图存储。数据以点云形式存储时,原始的点云表示方法在内存方面造成了资源浪费。在为基于视觉的SLAM存储特征描述符方面,一些初步的解决方案提出了针对压缩的已知地图定位[17],以及高效内存密集重建[18]。大多数SLAM方法将传感器获取的场景进行抽象表示为一组稀疏的三维地标,对应于环境中的识别特征(如线、角)[19],这些通常被称为基于地标的或基于特征的表示方法[20]。除了大量的工作集中于点特征的估计,机器人领域也扩展到了其它更复杂的几何地标,包括线,段,或弧[21]。与基于地标的度量地图表示方法相反,稠密点云地图提供三维几何图形的高分辨率模型,这是机器人实现其它复杂行为的基础。在密集的模型表示方法中,点云被广泛应用于机器人技术,主要设备有双目相机、RGB-D相机以及3D激光扫描仪[22]。原始表示法通过非结构化点集(即点云)或多边形[23]来描述三维几何图形。这些表示方法在单目SLAM中比较常见,结合使用直接法[24,25],直接从所有图像像素的强度值估计机器人的轨迹和三维模型。另外一些地图构建表示方法则直接进行曲面和边界的表示。这些表示方法将基于平面的简单边界进行建图[26,27],可以更好地适用于实现机器人的复杂上层行为,比如路径规划、避障等其它任务。在一些研究工作中,将固体的表面指定为在三维空间上定义的函数进行表示,比如径向基函数[28]、符号距离函数[29]和截断符号距离函数(TSDF)[30]。地图存储结构的空间分区表示方法先将空间分解成同构的立方体(体素),然后再在规则的三维网格中进行排列。这种方案比较有效的分区方式包括八叉树、多边形映射八叉树等。在机器人领域,八叉树表示被用于三维建图[31]。对于没有悬空障碍物的特定三维环境,Bran等人使用2.5维地图进行环境表示[32]。三维图像重建的目的是建立一个恢复场景的三维模型。在该领域主要有两个方向:基于高精度数据的稠密建图[33、34、35、36、37]和基于稀疏数据[38、39、40、41]的半稠密建图。前一种方法尽可能精确地估计模型,计算图像之间的逐像素密集对应,并通过基于体素或德洛内三角网[34、35、36、37]的方式将它们融合到3D空间,在某些情况下,还需要进一步细化步骤来提高准确度和分辨率。这种方法建图效果细节较为丰富,但计算成本很高,需要利用大量架构优化,才能有效地计算、移动和存储数据[43、44]。另一方面,在空间和存储效率更高的方法可以通过依赖于[38、39、40、41]运动方法中来自结构的稀疏数据来更好地估计稠密的地图。它们能够在CPU的单个核心上实时运行,而不需要消耗更多其它相关的资源[41]。然而,这种方法输出的3D模型分辨率较低。在前一种情况下,生成的模型通常具有丰富的冗余,而在后一种情况下的点计算结构与运动太稀疏,不足以提供足够的的信息重建现场细节。目前有部分工作涉及到这两种方法之间的权衡问题。Li等人[45]调整了重构网格的分辨率,使得细节较少的区域包含较少的顶点。该方法有效地限制了网格的尺寸,但仅适用于网格细化阶段。Lafarge等人[46]提将通过多视角立体恢复的网格与高级几何元素相结合。该方法在初始密集网格估计后,利用复杂的跳跃扩散机制和网格细化机制对拟合几何基元的网格区域进行简化。Wu等人[47]使用一般化的圆柱体和扫掠面从运动点云的结构中恢复稠密的简化结构,而Gallup等人[48]将n层映射拟合到深度映射中,以产生紧凑和鲁棒的表示。Schindler等人[49]对点云进行分段平面拟合,获得人工环境的示意图重建。除此之外,一些方法采用平面先验来限制模型噪声,但保持模型分辨率不变[50、51]。综上所述,三维空间的地图存储结构是解决建图过程性能和资源要求的关键环节,通过采用不同三维存储结构进行地图优化,可以解决空间和存储效率问题。在三维重建过程中,对地图存储结构进行选择可以更好地满足实际需要。1.3仿生视觉研究现状仿生学研究起源于上世纪中期,仿生视觉的研究有着极其重要的意义,Robison对灵长类动物的视觉神经系统进行研究,建立了关于平滑追踪运动的仿生模型,该模型采用内部主动反馈机制,降低系统延迟,作者进行大量调研进行系统参数设定,以满足人眼平滑追踪在潜伏期、响应以及误差等方面的要求[52]。人工头眼协同运动模型可以增强人机交互的自然性。Freedman等从生理学角度研究了头眼协同模型,建立了运动学模型[53]。W.JessicaLee等人建立了一套能够预测视觉跟踪的内部交换模块,模拟了人眼的两种基本运动模式:平滑跟踪和快速跟踪[54]。该模型采用PID控制实现慢相位平滑跟踪运动,提供了更大的带宽来跟踪物体的运动,具有更快的运动速度和更大的跨度,人眼运动模式的全面性对于该模型的准确性有直接的影响。人的头眼协同系统使人的视野聚焦于视网膜中央凹处,然而眼球运动的范围是有限的,当超过这个范围时,需要旋转颈部以扩大视野[55,56]。在应用方面,ZhengLiu等提出了一种基于视觉仿生的机器人激光雷达传感器,与人类视网膜的中央凹相似,这种激光雷达的中心角密度达到峰值,这种新型激光雷达设计具有安装简单、成本低、鲁棒性好等优点,类似视网膜密度分布使新型自主机器人应用成为可能[57]。综上所述,仿生视觉领域可以改善视觉人机交互性能,但是之前地仿生视觉更多地侧重于结构和控制,根据仿生视觉方法进行三维重建,在特定环境下可以降低计算复杂度和减少硬件资源消耗。参考文献高翔,等.视觉SLAM十四讲:从理论到实践[M].北京:电子工业出版社,2019.DavisonAJ.Real-timesimultaneouslocalisationandmappingwithasinglecamera[C]//ProceedingsNinthIEEEInternationalConferenceonComputerVision.IEEE,2003.DavisonAJ,ReidID,MoltonND,etal.MonoSLAM:real-timesinglecameraSLAM[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2007,29(6):1052-1067.KleinG,MurrayD.ParallelTrackingandMappingforSmallARWorkspaces[C]//IEEE&AcmInternationalSymposiumonMixed&AugmentedReality.ACM,2008.Mur-ArtalR,JDTardós.ORB-SLAM2:AnOpen-SourceSLAMSystemforMonocular,Stereo,andRGB-DCameras[J].IEEETransactionsonRobotics,2017.NewcombeRA,IzadiS,HilligesO,etal.KinectFusion:Real-timedensesurfacemappingandtracking[C]//IEEEInternationalSymposiumonMixed&AugmentedReality.IEEE,2012.T.Whelan,J.B.McDonald,M.Kaess,M.F.Fallon,H.Johannsson,andJ.J.Leonard,“Kintinuous:Spatiallyextendedkinectfusion,”inProc.RSSWorkshopRGB-D:Adv.ReasoningDepthCameras,2012.WhelanT,JohannssonH,KaessM,etal.Robustreal-timevisualodometryfordenseRGB-Dmapping[C]//2013IEEEInternationalConferenceonRoboticsandAutomation.IEEE,2013.WhelanT,KaessM,JohannssonH,etal.Real-timelarge-scaledenseRGB-DSLAMwithvolumetricfusion[J].TheInternationalJournalofRoboticsResearch,2015.ThomasWhelan,RenatoFSalas-Moreno,BenGlocker,AndrewJDavison,StefanLeutenegger.ElasticFusion:Real-timedenseSLAMandlightsourceestimation[J].TheInternationalJournalofRoboticsResearch,2016,35(14).DaiA,NienerM,ZollhferM,etal.BundleFusion:Real-TimeGloballyConsistent3DReconstructionUsingOn-the-FlySurfaceReintegration[J].ACMTransactionsonGraphics,2017,36(4):1.Salas-MorenoRF,NewcombeRA,StrasdatH,etal.SLAM++:SimultaneousLocalisationandMappingattheLevelofObjects[C]//ComputerVision&PatternRecognition.IEEE,2013.曹龙龑.基于RGB-D的室内三维SLAM研究与实现[D].深圳大学,2018.GaoX,ShenS,ZhouY,etal.AncientChinesearchitecture3Dpreservationbymerginggroundandaerialpointclouds[J].ISPRSJournalofPhotogrammetryandRemoteSensing,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年质量员之土建质量基础知识考试题库及参考答案【达标题】
- 2026年证券分析师之发布证券研究报告业务考试题库300道含答案(轻巧夺冠)
- 2026年LTE知识题库及参考答案【研优卷】
- 七年级地理期末复习试卷
- 2026年心理咨询师之心理咨询师基础知识考试题库含答案ab卷
- 2026年LTE知识题库附完整答案【考点梳理】
- 2026年县乡教师选调考试《教师职业道德》题库100道附参考答案【b卷】
- 网上教学课程设计与实施策略
- 吉林省吉林市磐石市2024-2025学年七年级上学期期末考试历史考点及答案
- 高空坠落防护专项安全检查方案
- rohs的环保协议书
- 卫勤课件教学课件
- 海尔智家应收账款管理优化研究
- 十五五特殊教育发展提升行动计划
- 原料采购定价管理办法
- 造价咨询项目工作实施方案
- 不合格食品管理制度
- QGDW10384-2023输电线路钢管塔加工技术规程
- 咖啡店5s管理制度
- 供电营业规则(2024版)
- T/SSBME 1-2024医疗器械上市后研究和风险管控计划编写指南
评论
0/150
提交评论