融合视觉特征的空地多机器人同时定位与建图方法的创新与实践

上传人：键*** IP属地：上海上传时间：2026-06-03 格式：DOCX 页数：34 大小：48.27KB 积分：15 举报 版权申诉

已阅读5页，还剩29页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

融合视觉特征的空地多机器人同时定位与建图方法的创新与实践一、引言1.1研究背景与意义随着机器人技术的飞速发展，多机器人协同作业在现代智能机器人领域中变得愈发重要。在诸如灾难救援、工业巡检、智能仓储等复杂场景下，单一机器人往往因自身能力局限，难以高效完成任务。例如在灾难救援场景中，地震后的废墟环境复杂，存在大量的障碍物和危险区域，单一机器人可能无法全面探测整个区域，而多机器人协同作业可以通过不同机器人的分工合作，更快速、准确地获取环境信息，提高救援效率。在这些复杂场景中，机器人需要实时对自身进行定位并构建环境地图，以便实现自主导航和精确作业，多机器人协同SLAM技术应运而生。其中，视觉传感器由于具有信息丰富、成本低、体积小等优势，成为多机器人SLAM系统中常用的传感器之一，多机器人协同视觉SLAM技术也因此受到广泛关注。空地多机器人系统结合了地面机器人和空中机器人的优势，地面机器人通常具有较强的负载能力和稳定性，能够携带多种高精度的传感器进行详细的数据采集，例如在工业场景中，地面机器人可以搭载激光雷达对大型设备进行高精度的扫描测量；空中机器人则具有良好的机动性和广阔的视野，能够快速覆盖大面积区域，获取全局信息，如在城市巡检中，无人机可以快速飞过整个城区，对建筑物、道路等进行整体的监测。这种空地协同的方式可以实现对复杂场景的全方位、多角度感知，为定位和建图提供更丰富的数据。然而，在实际应用中，空地多机器人的定位和建图面临诸多挑战。一方面，不同类型机器人的运动特性和传感器配置差异较大，导致数据融合难度增加。例如，无人机飞行速度快、姿态变化频繁，其视觉传感器获取的数据帧率和稳定性与地面机器人有很大不同；另一方面，复杂场景中的环境因素，如光照变化、遮挡、动态物体干扰等，会严重影响视觉传感器的性能，导致特征提取和匹配的准确性下降，进而影响定位和建图的精度。例如在室外强光或室内暗光环境下，相机图像的对比度和清晰度会受到很大影响，使得特征点难以准确提取；在人员流动频繁的场景中，动态的人体会对视觉SLAM系统造成干扰，导致错误的特征匹配。融合视觉特征对于提升空地多机器人定位和建图精度具有至关重要的意义。视觉特征包含了丰富的环境语义信息，能够为机器人提供更直观、准确的环境描述。通过对视觉特征的有效提取和匹配，可以实现不同机器人之间的信息共享和协同，提高系统对复杂环境的适应性。例如，基于尺度不变特征变换（SIFT）、加速稳健特征（SURF）、ORB（OrientedFASTandRotatedBRIEF）等特征提取算法，可以从图像中提取出具有独特性和稳定性的特征点，这些特征点在不同机器人的图像中具有一致性，从而实现机器人之间的相对位姿估计和地图融合。此外，融合视觉特征还可以与其他传感器数据（如激光雷达、惯性测量单元等）进行互补，进一步提升定位和建图的精度和鲁棒性。在视觉信息缺失或不准确的情况下，激光雷达可以提供精确的距离信息，惯性测量单元可以实时感知机器人的运动状态，从而保证系统的稳定性。1.2国内外研究现状在多机器人协同SLAM领域，国外的研究起步较早且取得了丰富成果。早期，国外研究团队主要致力于基础算法的探索与优化。例如，美国卡内基梅隆大学的研究人员在多机器人激光SLAM算法上进行了深入研究，通过改进扫描匹配算法和数据关联方法，提高了多机器人在复杂环境下构建地图的精度和一致性。随着技术的发展，视觉SLAM逐渐成为研究热点，英国帝国理工学院的团队提出了基于视觉特征的多机器人协同SLAM算法，利用ORB等特征点实现机器人之间的位姿估计和地图融合，在室内场景中取得了较好的实验效果。近年来，深度学习技术被引入多机器人协同SLAM，斯坦福大学的学者通过深度学习模型对视觉图像进行语义理解，为SLAM系统提供更丰富的环境信息，提升了系统在复杂场景下的适应性。国内的多机器人协同SLAM研究发展迅速，众多高校和科研机构积极参与。在视觉SLAM算法研究方面，清华大学的研究团队针对视觉特征提取和匹配的稳定性问题，提出了改进的特征提取算法，增强了算法在光照变化和遮挡情况下的鲁棒性。在空地多机器人协同SLAM领域，浙江工业大学提出了一种空地正交视角下的空中无人机与地面机器人协同定位与融合建图方法，通过融合惯性测量单元和图像信息修正偏移并优化轨迹，利用地面机器人上带有尺度信息的视觉标识，获得坐标系转换矩阵以融合地图，有效解决了空地正交视角的坐标系转换问题。在视觉特征融合方面，国内外学者也开展了大量研究。国外一些研究团队将视觉特征与激光雷达数据进行融合，例如德国的研究人员提出了一种将激光雷达的点云数据与视觉特征相结合的方法，利用激光雷达提供的精确距离信息来辅助视觉特征的匹配和定位，提高了系统在大场景中的定位精度。国内哈尔滨理工大学公开了一种基于深度相机的多特征融合视觉SLAM方法，通过充分使用从图像中提取的点线特征并根据点线特征构建平面特征，来解决纯点特征失效情况下的视觉定位问题，采用一种自适应阈值方法提取点特征，以获得更加均匀的点特征，提取线特征并删除短小线段、合并被分割的线段，以提高线特征匹配的准确率，通过构建融合特征的反投影误差函数，将点线面特征紧密耦合，并构建全局地图进行全局位姿优化。尽管当前空地多机器人协同SLAM及视觉特征融合的研究取得了显著进展，但仍存在一些不足。一方面，不同类型机器人之间的异构数据融合问题尚未得到完全解决，数据融合的精度和效率有待进一步提高。由于空地机器人的传感器类型、数据格式和采集频率存在差异，如何高效地融合这些数据，实现精准的定位和建图，仍然是一个具有挑战性的问题。另一方面，在复杂环境下，视觉特征的稳定性和可靠性仍需提升。例如在动态场景中，由于物体的运动和遮挡，视觉特征容易出现误匹配和丢失的情况，从而影响整个系统的性能。此外，现有算法在计算资源和实时性方面也面临一定的挑战，难以满足一些对实时性要求较高的应用场景。1.3研究目标与内容本研究旨在提出一种高效的融合视觉特征的空地多机器人同时定位与建图方法，以提高空地多机器人系统在复杂环境下的定位精度和地图构建质量，增强系统的鲁棒性和适应性，实现多机器人之间的协同作业和信息共享，具体研究内容如下：视觉特征提取与匹配算法研究：针对空地多机器人系统中不同类型机器人（如无人机、地面移动机器人）的视觉传感器特点，研究适合的视觉特征提取算法。深入分析SIFT、SURF、ORB等经典特征提取算法在空地多机器人场景中的性能表现，结合实际应用需求，对这些算法进行改进和优化，以提高特征点的提取效率和准确性。例如，针对无人机飞行过程中图像的快速运动和姿态变化，改进特征提取算法，使其能够更稳定地提取特征点；研究基于深度学习的特征提取方法，利用卷积神经网络（CNN）强大的特征学习能力，自动提取具有更高鲁棒性和区分性的视觉特征，以适应复杂环境下的特征提取需求。在特征匹配方面，研究基于描述子的匹配算法和基于深度学习的匹配算法，提高匹配的准确率和速度，降低误匹配率。空地多机器人异构数据融合方法研究：由于空地多机器人系统中不同机器人的传感器类型、数据格式和采集频率存在差异，如何有效地融合这些异构数据是提高定位和建图精度的关键。研究基于卡尔曼滤波、粒子滤波等经典滤波算法的多传感器数据融合方法，将视觉传感器数据与激光雷达、惯性测量单元（IMU）等其他传感器数据进行融合，实现对机器人位姿的准确估计。例如，利用卡尔曼滤波对视觉里程计和IMU的数据进行融合，通过预测和更新步骤，减小位姿估计的误差；探索基于图优化的多机器人数据融合方法，将不同机器人的位姿估计和地图信息构建成一个图模型，通过优化图中的节点和边，实现全局一致性的定位和建图。考虑不同传感器数据的不确定性和噪声特性，建立合理的数学模型，提高数据融合的精度和鲁棒性。基于视觉特征的地图构建与优化：在完成视觉特征提取和数据融合后，研究如何利用融合后的信息构建地图。针对空地多机器人系统的特点，研究适合的地图表示方法，如稀疏地图、稠密地图、语义地图等，根据不同的应用场景选择合适的地图表示方式。例如，在需要快速定位和导航的场景中，采用稀疏地图可以减少计算量；在需要详细环境信息的场景中，采用稠密地图可以提供更精确的环境描述；引入语义信息，构建语义地图，使地图包含更多的语义知识，便于机器人进行高级决策。研究地图优化算法，利用闭环检测、位姿图优化等技术，消除地图构建过程中的累积误差，提高地图的精度和一致性。通过实验验证不同地图构建和优化方法在空地多机器人系统中的性能表现。系统集成与实验验证：搭建空地多机器人实验平台，将研究提出的融合视觉特征的SLAM方法进行系统集成，实现空地多机器人的协同定位和建图。在实验平台上，模拟各种复杂环境，如室内场景、室外场景、光照变化场景、动态物体干扰场景等，对系统进行测试和验证。通过实验数据的分析，评估系统的定位精度、地图构建质量、鲁棒性和实时性等性能指标，与现有方法进行对比，验证所提方法的有效性和优越性。根据实验结果，对系统进行进一步的优化和改进，提高系统的性能和可靠性，为实际应用提供技术支持。1.4研究方法与技术路线本研究采用理论分析、算法设计、仿真实验和实际验证相结合的研究方法，确保研究的全面性和可靠性，具体技术路线如下：理论分析：对空地多机器人同时定位与建图的相关理论进行深入研究，包括视觉SLAM的基本原理、多机器人协同的理论基础以及不同类型机器人的运动学和动力学模型。详细分析SIFT、SURF、ORB等经典视觉特征提取算法的原理和特点，研究卡尔曼滤波、粒子滤波、图优化等数据融合和状态估计方法的数学原理和适用场景。通过理论分析，为后续的算法设计提供坚实的理论依据，明确研究的方向和重点。算法设计：基于理论分析的结果，结合空地多机器人系统的特点和实际应用需求，设计高效的融合视觉特征的SLAM算法。针对视觉特征提取与匹配，改进经典算法以适应空地多机器人场景的特殊性，探索基于深度学习的特征提取和匹配方法，提高特征处理的准确性和效率；在异构数据融合方面，研究基于卡尔曼滤波和图优化的融合算法，充分考虑不同传感器数据的特点和噪声特性，实现高精度的位姿估计和数据融合；设计适合空地多机器人系统的地图构建和优化算法，选择合适的地图表示方法，利用闭环检测和位姿图优化等技术，提高地图的精度和一致性。仿真实验：利用MATLAB、ROS（RobotOperatingSystem）等仿真平台，搭建空地多机器人SLAM仿真环境。在仿真环境中，设置各种复杂场景，如室内环境、室外环境、光照变化环境、动态物体干扰环境等，对设计的算法进行模拟测试。通过仿真实验，初步验证算法的可行性和有效性，分析算法在不同场景下的性能表现，如定位精度、地图构建质量、运行时间等。根据仿真结果，对算法进行优化和改进，调整算法参数，提高算法的性能。实际验证：搭建空地多机器人实验平台，包括无人机、地面移动机器人以及相应的传感器设备（如摄像头、激光雷达、IMU等）。在实际场景中，对经过仿真优化的算法进行实验验证，收集实验数据，如机器人的位姿信息、地图数据等。将实验结果与仿真结果进行对比分析，进一步评估算法的性能和可靠性。与现有方法进行对比实验，验证所提方法在定位精度、地图构建质量、鲁棒性等方面的优越性。根据实际验证结果，对算法和系统进行最终的优化和完善，使其能够满足实际应用的需求。研究技术路线图如图1-1所示：首先开展理论研究，对视觉特征提取与匹配算法、空地多机器人异构数据融合方法、基于视觉特征的地图构建与优化理论进行深入分析；然后基于理论研究成果进行算法设计，包括改进视觉特征提取与匹配算法、设计异构数据融合算法、构建地图及优化算法；将设计好的算法在仿真平台上进行实验，根据仿真结果优化算法；最后在实际空地多机器人平台上进行实验验证，根据实验结果进一步优化系统，最终实现融合视觉特征的空地多机器人同时定位与建图系统。[此处插入研究技术路线图]图1-1研究技术路线图二、相关理论与技术基础2.1同时定位与建图（SLAM）原理2.1.1SLAM基本概念与问题描述同时定位与建图（SimultaneousLocalizationandMapping，SLAM），又被称为并发建图与定位（ConcurrentMappingandLocalization，CML），是指机器人在未知环境中从一个未知位置开始移动，在移动过程中根据位置估计和地图进行自身定位，同时在自身定位的基础上建造增量式地图，实现机器人的自主定位和导航。简单来说，SLAM就是让机器人在运动过程中，实时确定自身位置并构建周围环境的地图。这一技术对于移动机器人的自主导航至关重要，因为机器人需要知道自己在哪里以及周围环境是什么样的，才能规划出合理的运动路径，完成各种任务，如在室内环境中，扫地机器人需要利用SLAM技术构建房间地图，从而实现高效的清扫路径规划；在自动驾驶领域，车辆需要通过SLAM技术实时定位自身位置，结合地图信息进行安全驾驶。在SLAM过程中，定位与建图是相互依赖、相互促进的关系。机器人通过对环境的感知来估计自身的位置，而准确的位置估计又有助于构建更精确的地图；同时，地图信息反过来又能为机器人的定位提供更多的约束和参考，提高定位的精度。例如，当机器人在一个未知的房间中移动时，它通过摄像头或激光雷达获取周围环境的信息，利用这些信息来计算自己相对于之前位置的变化，从而确定当前位置；同时，它将这些感知到的环境信息整合到地图中，随着机器人的不断移动，地图也在不断完善。然而，在实际应用中，SLAM面临着诸多挑战。一方面，传感器噪声和测量误差会导致机器人位姿估计和地图构建出现偏差。例如，激光雷达在测量距离时会受到环境因素的影响，产生一定的误差；相机在拍摄图像时，也可能因为光线变化、图像模糊等问题，导致特征提取和匹配不准确。这些误差会随着时间的推移逐渐累积，严重影响SLAM系统的性能。另一方面，动态环境中的物体运动和场景变化会给SLAM带来很大困难。在人员流动频繁的场景中，动态的人体会干扰激光雷达的点云数据和相机的图像信息，使得机器人难以准确识别和跟踪环境特征，从而影响定位和建图的精度。2.1.2SLAM系统的主要组成部分一个典型的SLAM系统主要由前端、后端、闭环检测和地图构建等模块组成，各模块相互协作，共同实现机器人的定位和建图功能。前端：也称为视觉里程计（VisualOdometry，VO），其主要任务是估算相邻图像间相机的运动，以及局部地图的样子。具体来说，前端根据摄像头回传的图像计算相机帧间运动，包括旋转矩阵、平移矢量、四元数、欧拉角等，以确定相机是如何运动的；同时，估计路标点大致的空间位置坐标，即获取深度信息。前端的处理速度和精度对整个SLAM系统的实时性和准确性有重要影响，它为后端提供了初始的位姿估计和局部地图信息。后端：主要接受不同时刻视觉里程计测量的相机位姿，以及回环检测的信息，对它们进行优化，得到全局一致的轨迹和地图。由于接在VO之后，所以又称为后端。后端优化的目的是消除前端位姿估计过程中产生的累积误差，提高机器人轨迹和地图的精度。它通常采用优化算法，如基于图优化的方法，将机器人的位姿和地图点作为图中的节点，位姿之间的约束关系作为边，通过最小化图中所有边的误差来优化节点的位置，从而得到更准确的机器人轨迹和地图。闭环检测：其功能是判断机器人是否曾经到达过先前的位置。当机器人在环境中移动时，由于传感器和计算过程存在误差，通常建立出的地图不能做到完全准确和一致，特别是在机器人回到曾经走过的位置时，地图可能会出现偏差。闭环检测通过识别机器人回到先前位置的情况，将这一信息提供给后端进行处理，后端利用这些信息对地图和轨迹进行修正，从而消除累积误差，保证地图与实际空间的一致性。例如，当机器人在室内环境中绕一圈回到起点时，闭环检测能够发现这一情况，并通知后端对整个轨迹和地图进行优化，使得起点和终点的位置能够准确重合。地图构建：根据估计的轨迹，建立与任务要求对应的地图。地图的表示形式有多种，如栅格地图、点云地图、语义地图等，不同的地图表示形式适用于不同的应用场景。栅格地图将环境划分为一个个小方格，每个方格表示一个区域的占用情况，适用于路径规划等任务；点云地图则直接由传感器获取的点云数据构成，能够直观地反映环境的三维结构；语义地图则包含了环境中物体的语义信息，如房间、家具等，有助于机器人进行更高级的决策。地图构建模块根据前端和后端提供的信息，选择合适的地图表示形式，并不断更新和完善地图，为机器人的导航和任务执行提供支持。2.1.3常见SLAM算法分类与特点常见的SLAM算法可以根据其实现原理分为基于滤波的SLAM算法、基于优化的SLAM算法和基于深度学习的SLAM算法，它们各自具有不同的特点和适用场景。基于滤波的SLAM算法：这类算法的核心是贝叶斯滤波及其衍生算法，如卡尔曼滤波（KalmanFilter）、扩展卡尔曼滤波（ExtendedKalmanFilter，EKF）、粒子滤波（ParticleFilter）等。其基本原理是基于上一时刻的状态量，通过控制量输入和运动方程的推演获取预测的状态量，再由相关传感器的观测对预测进行融合“补偿”，从而估计机器人的位姿和地图。卡尔曼滤波适用于线性系统且噪声服从高斯分布的情况，它通过递推的方式对状态进行估计，计算效率较高；扩展卡尔曼滤波则是将卡尔曼滤波应用于非线性系统，通过对非线性函数进行一阶泰勒展开来近似线性化；粒子滤波则采用蒙特卡罗方法，通过大量的粒子来表示状态的概率分布，适用于处理复杂的非线性和非高斯问题。基于滤波的SLAM算法计算量相对较小，实时性较好，但在处理大规模地图和复杂环境时，由于误差的累积和数据关联的困难，性能会受到一定限制。基于优化的SLAM算法：这类算法的核心是最小二乘原理，通过构建优化目标函数，最小化机器人位姿估计和地图构建过程中的误差，来获得更准确的结果。基于图优化的SLAM算法是目前的研究热点之一，它将机器人的位姿和地图点作为图中的节点，节点之间的约束关系作为边，通过优化图的结构来求解机器人的位姿和地图。例如，在Cartographer框架中，利用关键帧之间的odom约束、关键帧与submap之间的约束等作为残差项，通过最小化这些残差项来优化位姿图。基于优化的SLAM算法能够有效地处理大规模地图和复杂环境，具有较高的精度和鲁棒性，但计算量较大，对硬件性能要求较高。基于深度学习的SLAM算法：随着深度学习技术的发展，基于深度学习的SLAM算法逐渐兴起。这类算法利用神经网络强大的特征学习和模式识别能力，来实现视觉特征的提取、匹配、深度估计和位姿预测等功能。例如，通过卷积神经网络（CNN）可以自动提取图像中的特征点，并且这些特征点具有更高的鲁棒性和区分性；利用循环神经网络（RNN）可以对时间序列数据进行处理，实现对机器人位姿的实时预测。基于深度学习的SLAM算法在处理复杂场景和动态环境时表现出较好的性能，但需要大量的训练数据和计算资源，且模型的可解释性较差。2.2视觉特征提取与匹配技术2.2.1视觉特征的类型与特点视觉特征是从图像中提取出来的具有独特性质的信息，它能够帮助机器人识别和理解周围环境。常见的视觉特征有点特征、线特征和面特征，它们各自具有不同的特性和在机器人定位与建图中的应用优势。点特征：点特征是图像中具有明显局部特征的点，如角点、兴趣点等。在尺度、旋转和光照变化下具有较好的稳定性，这使得点特征在不同视角和光照条件下的图像中都能被准确识别。例如，在室外环境中，即使光照强度随时间变化，建筑物的角点等点特征依然能够保持相对稳定，为机器人提供可靠的定位参考。点特征包含了丰富的位置和方向信息，这些信息可以用于计算图像之间的相对位姿关系，从而实现机器人的定位和地图构建。在ORB特征提取算法中，通过检测图像中的FAST角点，并计算其BRIEF描述子，能够快速准确地提取点特征，用于视觉SLAM系统中的位姿估计。点特征在机器人定位与建图中具有广泛的应用，特别是在基于特征点的SLAM算法中，点特征作为关键信息，用于构建地图和估计机器人的位姿。线特征：线特征是图像中连续的边缘线段，如直线、曲线等。线特征在表示环境结构方面具有独特的优势，能够反映出物体的轮廓和形状信息。在室内场景中，墙壁、门窗的边缘等线特征可以帮助机器人构建环境的框架结构，从而更准确地理解环境布局。线特征对噪声和遮挡具有一定的鲁棒性，即使部分线段被遮挡，仍然可以通过剩余的线段信息进行分析和处理。在一些复杂的工业场景中，虽然存在大量的噪声和遮挡，但设备的轮廓线等线特征依然能够为机器人提供有效的定位和建图信息。线特征在机器人定位与建图中常用于补充点特征的不足，特别是在具有明显线性结构的环境中，线特征可以提高地图的精度和完整性。在一些基于线特征的SLAM算法中，通过提取和匹配图像中的线特征，能够实现机器人在复杂环境中的稳定定位和地图构建。面特征：面特征是由多个点和线组成的具有一定面积和形状的区域，如平面、多边形等。面特征能够提供更丰富的环境信息，包括物体的表面纹理、形状和位置等，有助于机器人对环境进行更全面的理解。在三维重建任务中，面特征可以用于构建物体的表面模型，提供更精确的环境描述。面特征在处理大规模场景时具有优势，能够减少数据量和计算复杂度。在城市规模的地图构建中，将建筑物的表面视为面特征进行处理，可以大大提高地图构建的效率和精度。面特征在机器人定位与建图中常用于构建语义地图和进行场景理解，通过对面特征的分析和识别，机器人可以获取环境中的语义信息，如房间、物体等，从而实现更高级的任务规划和决策。2.2.2经典视觉特征提取算法经典的视觉特征提取算法有SIFT、SURF、ORB等，它们在视觉SLAM系统中发挥着重要作用，下面将详细讲解这些算法的原理与实现步骤。SIFT（尺度不变特征变换）算法：SIFT算法由DavidLowe在1999年提出，并于2004年进行了完善。其核心思想是在不同尺度空间下检测稳定的关键点，并计算关键点的描述子，从而实现特征点的提取和匹配。SIFT算法的实现步骤主要包括以下几个方面：尺度空间极值检测，通过构建高斯差分（DOG）尺度空间，在不同尺度下检测图像中的极值点，这些极值点即为可能的关键点；关键点定位，对检测到的极值点进行精确定位，通过拟合三维二次函数来确定关键点的精确位置和尺度，同时去除低对比度和不稳定的关键点；方向分配，根据关键点邻域像素的梯度方向，为每个关键点分配一个或多个方向，使特征具有旋转不变性；描述子生成，以关键点为中心，在其邻域内计算梯度方向直方图，生成128维的SIFT描述子，该描述子具有尺度、旋转和光照不变性。SIFT算法具有良好的稳定性和鲁棒性，能够在不同尺度、旋转和光照变化的情况下准确提取特征点，但计算复杂度较高，实时性较差。SURF（加速稳健特征）算法：SURF算法由HerbertBay等人在2006年提出，是对SIFT算法的改进，旨在提高特征提取的速度。SURF算法利用积分图像和Haar小波响应来加速特征点的检测和描述子的计算。SURF算法的实现步骤如下：尺度空间构建，通过使用不同大小的Hessian矩阵行列式来构建尺度空间，Hessian矩阵用于检测图像中的blob结构，从而确定关键点；关键点检测，在尺度空间中检测Hessian矩阵行列式的极值点，这些极值点即为关键点；方向分配，利用Haar小波响应在关键点邻域内计算梯度方向，为每个关键点分配一个主方向，使特征具有旋转不变性；描述子生成，以关键点为中心，在其邻域内计算Haar小波响应的统计量，生成64维的SURF描述子。SURF算法在保持一定精度的前提下，计算速度比SIFT算法快很多，适用于对实时性要求较高的场景，但对噪声和遮挡的鲁棒性相对较弱。ORB（OrientedFASTandRotatedBRIEF）算法：ORB算法由EthanRublee等人在2011年提出，是一种基于FAST角点检测和BRIEF描述子的高效特征提取算法。ORB算法结合了FAST角点检测的快速性和BRIEF描述子的高效性，并通过改进使其具有旋转不变性和尺度不变性。ORB算法的实现步骤如下：FAST角点检测，通过比较像素点与周围邻域像素的亮度差异，快速检测出图像中的角点；关键点筛选，采用非极大值抑制（NMS）方法对检测到的角点进行筛选，去除冗余的角点；尺度和方向计算，通过构建图像金字塔来实现尺度不变性，利用灰度质心法计算关键点的方向，使特征具有旋转不变性；BRIEF描述子生成，以关键点为中心，在其邻域内随机选取点对，根据点对的灰度差异生成二进制描述子，通过旋转关键点邻域来实现描述子的旋转不变性。ORB算法计算速度快，占用内存少，适用于资源受限的嵌入式设备和对实时性要求极高的场景，但描述子的区分性相对较弱，在复杂场景下的匹配准确率可能较低。2.2.3视觉特征匹配方法视觉特征匹配是将不同图像中的特征点进行对应，以实现图像间的关联和位姿估计。常见的视觉特征匹配方法有基于距离的匹配方法和基于几何约束的匹配方法，它们各有其原理与适用场景。基于距离的匹配方法：这类方法通过计算特征点描述子之间的距离来衡量特征点的相似性，从而实现特征点的匹配。常用的距离度量方法有欧氏距离、汉明距离等。在基于SIFT特征的匹配中，通常使用欧氏距离来计算两个SIFT描述子之间的相似度，将距离最近的两个特征点视为匹配点。基于距离的匹配方法简单直观，计算效率较高，适用于特征点数量较少、场景较为简单的情况。在一些室内场景中，由于环境特征相对简单，基于距离的匹配方法可以快速准确地实现特征点的匹配。然而，在复杂场景下，由于存在噪声、遮挡和相似特征点等因素，基于距离的匹配方法容易出现误匹配，导致匹配准确率下降。基于几何约束的匹配方法：这类方法利用特征点之间的几何关系，如共线、共面、三角测量等，来验证匹配的正确性，从而提高匹配的准确率。在基于RANSAC（随机抽样一致性）算法的匹配中，通过随机选取一组特征点对，假设它们满足某种几何模型（如单应性矩阵、本质矩阵等），然后利用该模型对其他特征点对进行验证，去除不符合模型的点对，最终得到正确的匹配点。基于几何约束的匹配方法对噪声和误匹配具有较强的鲁棒性，适用于复杂场景下的特征匹配。在室外场景中，由于存在大量的干扰因素，基于几何约束的匹配方法可以有效地剔除误匹配点，提高匹配的可靠性。但是，基于几何约束的匹配方法计算复杂度较高，需要较多的计算资源和时间，在实时性要求较高的场景中应用可能受到限制。2.3空地多机器人协同技术2.3.1多机器人通信与协作机制空地多机器人系统要实现高效的协同定位与建图，可靠的通信与协作机制至关重要。多机器人间的通信方式主要有无线通信和有线通信两种。无线通信由于其便捷性和灵活性，在多机器人系统中应用广泛，常见的无线通信技术包括Wi-Fi、蓝牙、ZigBee、LoRa等。Wi-Fi通信距离较远，传输速率高，适用于对数据传输量要求较大的场景，如无人机向地面基站传输高清图像数据；蓝牙功耗低、成本低，常用于近距离的设备间通信，如机器人与手持控制终端之间的通信；ZigBee具有自组网能力，适合大规模的多机器人系统，在智能仓储中，多个机器人可以通过ZigBee组成网络，实现协同作业；LoRa通信距离长，且具有低功耗、低成本的特点，适用于对通信距离要求较高的室外场景。然而，无线通信容易受到环境干扰，如信号遮挡、多径效应等，导致通信质量下降。在室内环境中，墙壁、家具等障碍物会阻挡无线信号，使信号强度减弱甚至中断；在室外环境中，恶劣天气条件（如暴雨、沙尘等）也会对无线通信产生严重影响。有线通信则具有稳定性高、抗干扰能力强的优点，但布线复杂，限制了机器人的运动范围，常用于对通信稳定性要求极高且机器人运动范围相对固定的场景。协作策略是多机器人协同作业的核心，常见的协作策略有集中式、分布式和混合式。集中式协作策略中，存在一个中央控制器，它收集所有机器人的信息，并统一规划和分配任务。这种策略的优点是能够全局优化任务分配，保证系统的整体性能最优；缺点是中央控制器的计算负担重，一旦出现故障，整个系统将瘫痪。在大型工业生产线上，中央控制器可以根据生产任务和各机器人的状态，精确地分配任务，确保生产的高效进行，但如果中央控制器出现故障，整个生产线将停止运行。分布式协作策略中，每个机器人都具有一定的自主决策能力，它们通过相互通信来协调行动。这种策略的优点是系统的灵活性和鲁棒性强，即使部分机器人出现故障，其他机器人仍能继续工作；缺点是缺乏全局优化，可能导致局部最优解。在灾难救援场景中，多个机器人可以通过分布式协作策略，自主地对受灾区域进行搜索和救援，即使某个机器人遇到障碍或损坏，其他机器人也能继续完成任务。混合式协作策略结合了集中式和分布式的优点，通过中央控制器进行全局规划，各机器人在局部进行自主决策和协作，能够在一定程度上平衡系统的性能和可靠性。任务分配方法是多机器人协作中的关键环节，它直接影响到系统的效率和性能。常见的任务分配方法有匈牙利算法、拍卖算法、合同网协议等。匈牙利算法是一种经典的任务分配算法，它通过寻找最优匹配来实现任务的分配，适用于任务和机器人数量相对固定且任务之间相互独立的场景。在一个简单的物流搬运场景中，有若干个货物需要搬运，同时有若干个机器人，匈牙利算法可以根据机器人的位置、搬运能力等因素，为每个机器人分配最优的搬运任务。拍卖算法将任务分配问题转化为拍卖过程，机器人通过竞拍的方式获取任务，这种算法能够更好地适应动态变化的环境。在一个动态的巡检任务中，随着环境的变化，新的巡检点不断出现，拍卖算法可以让机器人根据自身的状态和对任务的评估，自主地竞拍任务，从而实现任务的合理分配。合同网协议是一种分布式的任务分配方法，它通过任务发布、投标和中标等过程，实现任务的分配和协作。在一个复杂的多机器人协作项目中，如大型建筑的施工，不同的施工任务可以通过合同网协议分配给不同的机器人团队，各团队之间通过协作完成整个施工项目。2.3.2机器人间相对位姿估计方法在空地多机器人协同作业中，准确估计机器人间的相对位姿是实现协同定位和建图的关键。视觉传感器和激光传感器是常用的用于估计机器人间相对位姿的传感器，它们各自具有独特的原理和优势。基于视觉传感器的相对位姿估计方法主要通过提取和匹配不同机器人视觉图像中的特征点，利用三角测量原理来计算相对位姿。例如，当两个机器人同时观测到环境中的同一特征点时，可以根据它们各自的相机模型和图像坐标，通过三角测量计算出特征点在世界坐标系中的位置，进而得到两个机器人之间的相对位姿。在实际应用中，ORB等特征提取算法常用于快速提取图像中的特征点，然后通过基于汉明距离的匹配方法，寻找不同图像中特征点的对应关系。为了提高匹配的准确性，还可以结合基于几何约束的匹配方法，如利用对极几何约束、单应性矩阵等，剔除误匹配点，从而得到更准确的相对位姿估计。然而，基于视觉传感器的方法容易受到光照变化、遮挡和动态物体干扰等因素的影响。在光照变化剧烈的环境中，图像的对比度和亮度会发生变化，导致特征点提取和匹配的准确性下降；在存在遮挡的情况下，部分特征点可能无法被观测到，从而影响相对位姿的估计；在动态物体干扰的场景中，动态物体的运动会导致错误的特征匹配，使相对位姿估计出现偏差。基于激光传感器的相对位姿估计方法则是通过匹配不同机器人激光雷达扫描得到的点云数据来实现的。激光雷达能够精确测量机器人周围环境中物体的距离信息，形成点云数据。通过将不同机器人的点云数据进行配准，可以计算出它们之间的相对位姿。常用的点云配准算法有迭代最近点（ICP）算法及其变体。ICP算法通过不断迭代寻找两个点云之间的最优匹配，使点云之间的距离误差最小化，从而得到相对位姿。为了提高ICP算法的效率和准确性，研究人员提出了许多改进方法，如基于特征的ICP算法，它先提取点云中的特征点，然后利用这些特征点进行配准，减少了计算量，提高了配准的精度。基于激光传感器的方法对光照变化不敏感，测量精度高，但在一些场景下，如弱纹理环境或存在大量相似结构的环境中，点云数据的特征不明显，导致配准困难，影响相对位姿估计的准确性。在实际应用中，为了提高机器人间相对位姿估计的精度和鲁棒性，常常将视觉传感器和激光传感器的数据进行融合。通过融合两种传感器的优势，可以弥补各自的不足。例如，利用视觉传感器提供的丰富的纹理信息和激光传感器精确的距离信息，结合基于卡尔曼滤波或粒子滤波的融合算法，对机器人间的相对位姿进行联合估计。在一个复杂的室内环境中，视觉传感器可以帮助识别环境中的特征，激光传感器可以提供精确的距离测量，两者融合后能够更准确地估计机器人间的相对位姿，提高空地多机器人系统的协同性能。2.3.3多机器人地图融合策略多机器人地图融合是将多个机器人构建的局部地图合并成一个全局一致的地图，以实现对整个环境的全面感知和理解。常见的多机器人地图融合方法有基于特征匹配的融合策略和基于图优化的融合策略，它们在不同的场景下具有各自的优势和适用性。基于特征匹配的地图融合策略主要通过提取不同机器人地图中的特征，如点特征、线特征或面特征，然后进行特征匹配，找到地图之间的对应关系，从而实现地图的融合。在基于点特征匹配的融合方法中，首先利用SIFT、SURF等特征提取算法从各个机器人的地图中提取特征点，然后通过计算特征点之间的描述子距离，寻找匹配的特征点对。根据匹配的特征点对，可以计算出不同地图之间的变换关系，将各个局部地图转换到同一坐标系下，进行合并。这种方法适用于地图特征明显、环境相对稳定的场景。在一个室内场景中，建筑物的墙角、门窗等特征点明显，通过基于点特征匹配的融合策略，可以有效地将多个机器人构建的局部地图融合成一个完整的室内地图。然而，在复杂环境下，由于特征提取和匹配的准确性受到影响，这种方法可能会出现误匹配，导致地图融合的精度下降。基于图优化的地图融合策略则是将多机器人的位姿估计和地图构建问题转化为一个图模型，通过优化图中的节点和边，实现全局一致性的地图融合。在这种方法中，机器人的位姿和地图中的特征点被表示为图中的节点，节点之间的约束关系，如机器人之间的相对位姿约束、地图特征点之间的几何约束等，被表示为边。通过最小化图中所有边的误差，来优化节点的位置，从而得到全局最优的地图。在基于图优化的融合策略中，常用的优化算法有g2o、Ceres等。g2o是一个基于图优化的开源库，它提供了丰富的优化算法和数据结构，能够方便地实现多机器人地图融合。基于图优化的方法能够有效地处理大规模地图和复杂环境下的地图融合问题，具有较高的精度和鲁棒性，但计算复杂度较高，对硬件性能要求较高。除了上述两种主要的地图融合策略外，还有一些其他的融合方法，如基于概率模型的融合方法。这种方法通过建立地图的概率模型，考虑地图中各个位置的不确定性，将多个机器人的地图进行概率融合。在基于概率模型的融合方法中，常用的模型有高斯混合模型（GaussianMixtureModel，GMM）、贝叶斯网络等。通过将不同机器人地图中的信息转化为概率分布，然后利用概率推理的方法，将这些概率分布进行融合，得到最终的地图。基于概率模型的方法能够有效地处理地图中的不确定性，但计算过程较为复杂，需要较多的计算资源。在实际应用中，需要根据具体的场景和需求，选择合适的地图融合策略，以实现高效、准确的多机器人地图融合。三、融合视觉特征的空地多机器人SLAM方法设计3.1系统总体架构设计3.1.1空地多机器人系统组成与功能划分空地多机器人系统由地面机器人和无人机组成，它们在硬件组成和任务分工上各有特点，相互协作以实现复杂环境下的高效定位与建图。地面机器人通常采用轮式或履带式底盘，以适应不同的地形条件。在硬件方面，配备有高性能的激光雷达，如VelodyneVLP-16激光雷达，它能够快速、精确地获取周围环境的三维点云数据，为地图构建提供精确的几何信息；搭载多个摄像头，如工业级的PointGreyGrasshopper3摄像头，用于采集环境的视觉图像，提取丰富的视觉特征；配备高精度的惯性测量单元（IMU），如MPU-9250，能够实时感知机器人的加速度、角速度和磁场信息，为位姿估计提供重要的数据支持。地面机器人的主要任务是在地面环境中进行详细的数据采集和局部地图构建。在工业巡检场景中，地面机器人可以利用激光雷达对工厂设备进行高精度的扫描，获取设备的精确位置和形状信息；通过摄像头采集设备表面的纹理和标识信息，利用视觉特征提取算法，如SIFT算法，提取关键特征点，与激光雷达数据进行融合，构建详细的局部地图。无人机则采用多旋翼或固定翼的结构，以实现灵活的飞行和快速的移动。在硬件上，配备小型化的激光雷达，如LivoxMid-40激光雷达，其体积小、重量轻，适合无人机搭载，能够在飞行过程中获取周围环境的距离信息；搭载高清摄像头，如大疆禅思X5S相机，具备高分辨率和良好的图像质量，可拍摄高质量的视觉图像；同样配备IMU，如ICM-20602，用于感知无人机的飞行姿态。无人机的主要任务是利用其飞行优势，快速覆盖大面积区域，获取全局环境信息，并与地面机器人进行信息交互和协同作业。在城市区域的测绘任务中，无人机可以快速飞过整个城区，利用摄像头拍摄大量的视觉图像，通过视觉SLAM算法，如ORB-SLAM3，初步构建全局地图；同时，将获取的视觉信息和初步地图信息传输给地面机器人，与地面机器人构建的局部地图进行融合。在任务分工方面，地面机器人和无人机相互配合。地面机器人负责在复杂地形和近距离范围内进行精细的数据采集和局部地图构建，为无人机提供详细的局部环境信息；无人机则负责在高空和大面积区域进行快速的全局环境感知和地图构建，为地面机器人提供全局的参考信息。在灾难救援场景中，无人机可以首先飞抵受灾区域，快速获取整个区域的大致情况，标记出危险区域和可能的救援目标；地面机器人随后进入受灾区域，对重点区域进行详细的探测和数据采集，与无人机的信息进行融合，为救援决策提供全面、准确的信息。3.1.2视觉与其他传感器数据融合框架为了充分发挥视觉传感器与激光雷达、IMU等传感器的优势，构建了如图3-1所示的数据融合框架。[此处插入视觉与其他传感器数据融合框架图]图3-1视觉与其他传感器数据融合框架图在该框架中，视觉传感器和激光雷达、IMU等传感器同时工作，各自采集环境数据。视觉传感器采集的图像数据首先经过预处理，包括图像去噪、灰度化等操作，以提高图像质量。然后，利用改进的ORB算法提取图像中的特征点，并计算特征点的描述子。激光雷达采集的点云数据经过滤波处理，去除噪声点，提高点云的质量。IMU则实时采集机器人的加速度、角速度等数据，用于估计机器人的运动状态。数据融合主要在两个层面进行：位姿估计层面和地图构建层面。在位姿估计层面，采用基于扩展卡尔曼滤波（EKF）的融合算法。将视觉里程计通过特征点匹配得到的位姿估计值和IMU测量得到的位姿预测值作为EKF的输入。视觉里程计提供的位姿估计值具有较高的精度，但存在累积误差；IMU测量得到的位姿预测值具有较高的实时性，但随着时间的推移误差会逐渐增大。通过EKF对两者进行融合，能够充分利用它们的优势，得到更准确的位姿估计结果。具体来说，EKF根据IMU的测量数据预测机器人的位姿，然后利用视觉里程计的测量数据对预测结果进行修正，通过不断地预测和修正，减小位姿估计的误差。在地图构建层面，采用基于图优化的融合方法。将激光雷达构建的点云地图和视觉SLAM构建的特征地图进行融合。激光雷达构建的点云地图具有高精度的几何信息，但缺乏语义信息；视觉SLAM构建的特征地图包含丰富的语义信息，但几何精度相对较低。通过将两者构建成一个图模型，图中的节点表示机器人的位姿和地图点，边表示节点之间的约束关系，如视觉特征匹配的约束、激光雷达点云匹配的约束等。利用g2o优化库对图模型进行优化，最小化图中所有边的误差，从而得到全局一致的地图。在室内环境中，将激光雷达扫描得到的墙壁、家具等物体的点云信息和视觉SLAM提取的墙角、门窗等特征信息进行融合，通过图优化算法，使地图中的点云信息和特征信息相互匹配，构建出更准确、完整的室内地图。通过上述视觉与其他传感器数据融合框架，能够实现不同传感器数据的有效融合，提高空地多机器人系统的定位精度和地图构建质量，增强系统在复杂环境下的适应性和鲁棒性。3.2基于视觉特征的定位算法改进3.2.1视觉特征辅助的机器人位姿估计模型为了提高空地多机器人的定位精度，构建了视觉特征辅助的机器人位姿估计模型，该模型充分利用视觉特征的丰富信息，结合其他传感器数据，实现对机器人位姿的准确估计。在视觉特征提取方面，对ORB算法进行了改进。传统ORB算法在提取特征点时，对图像尺度变化的适应性有限。为了增强其在不同尺度下的性能，采用了多尺度图像金字塔构建方式。通过对原始图像进行不同尺度的下采样，得到一系列不同分辨率的图像，然后在每个尺度的图像上进行ORB特征点提取。这样可以使算法在不同尺度下都能检测到稳定的特征点，提高了特征点的多样性和稳定性。在无人机拍摄的不同距离的场景图像中，多尺度ORB算法能够更全面地提取特征点，即使在图像尺度变化较大的情况下，也能保持较高的特征点提取率。在特征匹配阶段，引入了基于深度学习的匹配方法。利用卷积神经网络（CNN）强大的特征学习能力，训练一个特征匹配模型。该模型以两幅图像的特征点描述子为输入，输出特征点之间的匹配概率。通过大量的图像对进行训练，模型能够学习到特征点之间的相似性模式，从而提高匹配的准确率。在复杂环境下，基于深度学习的匹配方法能够有效地识别出真正匹配的特征点，减少误匹配的发生，提高了机器人位姿估计的可靠性。将视觉特征与IMU数据进行融合，利用扩展卡尔曼滤波（EKF）算法估计机器人的位姿。IMU能够实时测量机器人的加速度和角速度，提供高频的运动信息，但存在累积误差；视觉特征则提供了机器人周围环境的相对位置信息，精度较高，但更新频率相对较低。通过EKF，将IMU的预测值和视觉特征的观测值进行融合，能够充分发挥两者的优势。在实际应用中，当机器人快速移动时，IMU数据能够快速提供位姿的初步估计；当机器人经过特征丰富的区域时，视觉特征能够对IMU的估计结果进行修正，从而得到更准确的位姿估计。具体来说，EKF根据IMU的测量数据预测机器人在下一时刻的位姿，包括位置和姿态；然后，利用视觉特征匹配得到的相对位姿信息，对预测结果进行更新，通过不断地预测和更新，减小位姿估计的误差。3.2.2针对复杂环境的视觉定位优化策略针对复杂环境下视觉定位面临的遮挡、光照变化等问题，提出了一系列优化策略，以提高视觉定位的稳定性和可靠性。在遮挡情况下，采用基于多视角信息的视觉定位方法。当部分视觉特征被遮挡时，利用空地多机器人系统中不同机器人的视角信息进行互补。例如，无人机可以从上方获取全局视角，地面机器人可以从不同的地面角度获取局部视角。通过融合不同视角的图像信息，能够增加可见的视觉特征数量，提高定位的准确性。在室内场景中，当某个区域被家具遮挡时，无人机可以从上方拍摄该区域，获取未被遮挡的部分信息；地面机器人可以从其他角度靠近该区域，获取更多的局部信息，然后将两者的信息进行融合，从而实现对被遮挡区域的定位。同时，引入遮挡检测算法，通过分析图像中特征点的分布和变化情况，判断是否存在遮挡。当检测到遮挡时，及时调整定位策略，优先使用未被遮挡的特征点进行定位，或者利用历史位姿信息进行预测，以保证定位的连续性。对于光照变化问题，采用光照不变特征提取和自适应阈值调整策略。在特征提取阶段，对ORB算法进行改进，使其能够提取具有光照不变性的特征点。通过对特征点周围邻域的像素进行归一化处理，消除光照强度变化对特征点描述子的影响。在光照变化剧烈的室外场景中，改进后的ORB算法能够稳定地提取特征点，不受光照强度变化的影响。在特征匹配阶段，根据图像的光照情况自适应调整匹配阈值。当光照较暗时，适当降低匹配阈值，以增加匹配的可能性；当光照较亮时，提高匹配阈值，减少误匹配。通过这种自适应阈值调整策略，能够提高特征匹配在不同光照条件下的准确率，从而提高视觉定位的稳定性。为了应对动态物体干扰，提出基于运动检测和特征筛选的方法。通过分析图像中像素的运动信息，利用光流法等技术检测出动态物体。在特征提取和匹配过程中，将动态物体上的特征点进行筛选和剔除，避免动态物体对定位造成干扰。在人员流动频繁的场景中，能够准确检测出人员等动态物体，并将其从视觉定位过程中排除，从而保证定位的准确性。同时，利用运动物体的运动轨迹信息，对其进行跟踪和预测，以便在后续的定位过程中更好地处理动态物体的影响。3.3空地多机器人地图构建与融合算法3.3.1地面机器人与无人机的地图构建方法地面机器人主要基于激光雷达进行地图构建，采用Cartographer算法。该算法利用激光雷达扫描环境，获取周围物体的距离信息，生成点云数据。通过对连续的点云数据进行处理，实现激光雷达扫描匹配和位姿估计。具体来说，Cartographer算法将激光雷达数据划分为多个子地图，每个子地图由一系列的激光扫描帧组成。在构建子地图时，算法通过扫描匹配，找到相邻扫描帧之间的相对位姿变换，从而将各个扫描帧拼接成一个局部地图。为了提高地图构建的精度和效率，Cartographer算法采用了回环检测机制。当机器人检测到回到之前访问过的区域时，通过回环检测算法，将当前子地图与之前的子地图进行匹配，计算出两者之间的位姿变换，对地图进行修正，消除累积误差，使地图更加准确和一致。在一个室内仓库场景中，地面机器人利用Cartographer算法，通过不断地扫描环境和回环检测，构建出了仓库的精确地图，包括货架的位置、通道的布局等信息，为后续的导航和货物搬运任务提供了可靠的基础。无人机则基于视觉进行地图构建，采用ORB-SLAM3算法。该算法利用无人机搭载的摄像头采集环境图像，通过ORB特征提取算法，从图像中提取大量的特征点，并计算特征点的描述子。在地图构建过程中，ORB-SLAM3算法首先通过特征点匹配，计算出相邻图像之间的相对位姿变换，实现视觉里程计功能，初步估计无人机的运动轨迹。随着无人机的飞行，不断有新的图像加入，ORB-SLAM3算法将这些新的图像与已构建的地图进行融合。通过关键帧管理机制，选择具有代表性的图像作为关键帧，将关键帧中的特征点和位姿信息加入地图中。同时，利用局部地图优化算法，对关键帧的位姿和地图点的位置进行优化，提高地图的精度。为了实现全局一致性的地图构建，ORB-SLAM3算法引入了闭环检测模块。当检测到闭环时，通过计算闭环处的位姿变换，对整个地图进行全局优化，消除累积误差，使地图在全局范围内保持一致。在城市区域的地图构建中，无人机利用ORB-SLAM3算法，快速飞行并采集大量的图像，通过特征点提取、匹配和地图优化，构建出了城市区域的视觉地图，包括建筑物的外观、道路的走向等信息，为城市规划和监测提供了直观的视觉数据。3.3.2基于视觉特征关联的地图融合算法为了实现地面机器人和无人机构建的地图的有效融合，提出了基于视觉特征关联的地图融合算法。该算法的核心思想是通过寻找地面机器人和无人机地图中的共同视觉特征，建立两者之间的关联关系，从而将两个地图合并成一个全局一致的地图。在特征关联阶段，利用改进的ORB算法分别从地面机器人和无人机的地图中提取视觉特征点。由于地面机器人和无人机的视角和运动方式不同，提取的特征点可能存在一定的差异。为了提高特征匹配的准确性，采用基于深度学习的特征匹配模型，对提取的特征点进行匹配。该模型通过大量的训练数据学习到不同视角下特征点之间的相似性模式，能够更准确地识别出地面机器人和无人机地图中对应的特征点。在一个实际场景中，地面机器人和无人机同时观测到一个建筑物的墙角，通过基于深度学习的特征匹配模型，能够准确地找到两者地图中关于该墙角的特征点对应关系。根据匹配的特征点对，计算地面机器人和无人机地图之间的变换关系。采用基于RANSAC（随机抽样一致性）算法的方法，从匹配的特征点对中随机选取一组点对，假设它们满足某种几何模型（如单应性矩阵、本质矩阵等），然后利用该模型对其他特征点对进行验证，去除不符合模型的点对，最终得到准确的变换关系。通过RANSAC算法的迭代优化，能够有效地剔除误匹配点，提高变换关系计算的准确性。在得到地图之间的变换关系后，将无人机的地图转换到地面机器人的地图坐标系下，进行地图融合。对于地图中的点云数据和特征信息，根据变换关系进行相应的转换和合并。在融合过程中，考虑到地图数据的不确定性和噪声，采用基于概率模型的融合方法，对重叠区域的地图数据进行加权融合，使融合后的地图更加平滑和准确。在室内场景中，将地面机器人构建的激光雷达点云地图和无人机构建的视觉地图进行融合，通过基于视觉特征关联的地图融合算法，有效地将两者的地图合并成一个全局一致的地图，既包含了激光雷达地图的高精度几何信息，又包含了视觉地图的丰富语义信息，为机器人的导航和任务执行提供了更全面、准确的环境信息。四、实验与结果分析4.1实验平台搭建与数据采集4.1.1硬件实验平台的选择与配置为了验证融合视觉特征的空地多机器人同时定位与建图方法的有效性，搭建了由地面机器人和无人机组成的硬件实验平台。地面机器人选用了ClearpathRobotics公司的Jackal机器人，其搭载了高性能的NVIDIAJetsonXavierNX计算模块，拥有强大的计算能力，能够满足实时处理大量传感器数据的需求。在传感器配置方面，配备了VelodyneVLP-16激光雷达，该激光雷达具有16线扫描，能够快速获取周围环境的三维点云数据，扫描范围可达100米，角度分辨率为0.1°-0.4°，为地图构建提供了精确的几何信息；搭载了两个PointGreyGrasshopper3工业相机，分辨率为1920×1200像素，帧率可达30fps，用于采集环境的视觉图像，提取丰富的视觉特征；还配备了高精度的惯性测量单元（IMU），型号为MPU-9250，能够实时感知机器人的加速度、角速度和磁场信息，为位姿估计提供重要的数据支持。无人机选用了大疆Matrice300RTK无人机，其具备强大的飞行性能和稳定性。搭载了LivoxMid-40激光雷达，体积小、重量轻，适合无人机搭载，扫描范围可达150米，点云密度高，能够在飞行过程中快速获取周围环境的距离信息；配备了大疆禅思X5S相机，拥有2000万像素，支持4K视频拍摄，可拍摄高质量的视觉图像；同样配备了IMU，型号为ICM-20602，用于感知无人机的飞行姿态。此外，为了实现空地多机器人之间的通信，采用了无线通信模块。地面机器人和无人机均配备了高性能的Wi-Fi模块，通信距离可达1公里，传输速率高，能够满足实时传输大量数据的需求。同时，为了确保通信的稳定性，还采用了Mesh网络技术，实现了多机器人之间的自组网通信，提高了通信的可靠性和覆盖范围。4.1.2实验场景的设置与数据采集方法实验场景设置了室内和室外两种典型环境，以全面测试融合视觉特征的空地多机器人SLAM方法在不同场景下的性能。室内实验场景选择了一个大型仓库，面积约为1000平方米，仓库内包含了各种货架、通道和障碍物，具有丰富的几何结构和纹理信息。在仓库的不同位置放置了一些具有明显特征的标志物，如彩色方块、圆柱等，用于辅助视觉特征的提取和匹配。室外实验场景选择了一个校园区域，包含了建筑物、道路、树木等自然和人工环境元素，场景复杂且具有较大的尺度变化。在校园内设置了一些固定的地标点，如路灯、指示牌等，用于验证机器人的定位精度和地图构建的准确性。在数据采集过程中，地面机器人和无人机同时工作。地面机器人沿着预设的路径在室内仓库或室外校园区域中移动，通过激光雷达实时扫描周围环境，获取点云数据；同时，两个工业相机采集视觉图像，IMU记录机器人的运动状态数据。无人机则在地面机器人上方一定高度飞行，通过LivoxMid-40激光雷达获取周围环境的距离信息，禅思X5S相机拍摄视觉图像，IMU感知飞行姿态数据。为了保证数据的准确性和可靠性，在数据采集前对所有传感器进行了校准。对于激光雷达，采用了标准的标定板进行校准，确保其测量的距离数据准确无误；对于相机，利用张氏标定法进行标定，获取相机的内参和外参，以提高视觉特征提取和匹配的精度。在数据采集过程中，对传感器数据进行了实时记录和存储，以便后续的数据分析和算法验证。同时，为了模拟实际应用中的复杂情况，在数据采集过程中还人为引入了一些干扰因素，如光照变化、动态物体干扰等，以测试算法在不同环境下的鲁棒性。4.2算法性能评估指标与方法4.2.1定位精度评估指标为了准确评估融合视觉特征的空地多机器人SLAM算法的定位精度，采用均方根误差（RMSE）、平均绝对误差（MAE）和最大绝对误差（MaxAE）等指标。均方根误差（RMSE）是评估定位精度的常用指标，它表示估计值与真实值之间偏差的平方均值的平方根，计算公式为：RMSE=\sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i-\hat{x}_i)^2}其中，x_i是真实位置，\hat{x}_i是估计位置，N是样本数量。RMSE对误差进行了平方根运算，使得其单位与预测值和真实值的单位保持一致，能够直观地反映定位误差的大小。在评估地面机器人的定位精度时，通过多次实验记录机器人的真实位置和算法估计的位置，利用上述公式计算RMSE，RMSE值越小，说明定位精度越高。平均绝对误差（MAE）是另一种评估误差的指标，它计算估计值与真实值之间绝对差的平均值，公式为：MAE=\frac{1}{N}\sum_{i=1}^{N}|x_i-\hat{x}_i|MAE能够反映定位误差的平均水平，不受误差正负的影响。在实际应用中，MAE可以帮助评估算法在不同位置的定位误差的平均情况，对于判断算法的稳定性具有重要意义。在无人机的定位精度评估中，通过计算MAE，可以了解无人机在飞行过程中定位误差的平均大小，从而评估算法对无人机定位的可靠性。最大绝对误差（MaxAE）用于评估在所有估计中出现的最大误差，公式为：MaxAE=\max_{i=1}^{N}|x_i-\hat{x}_i|MaxAE能够反映算法在极端情况下的定位误差，对于评估算法的鲁棒性非常重要。在复杂环境下，如存在遮挡、光照变化等情况时，算法可能会出现较大的定位误差，MaxAE可以帮助检测出这些极端情况，从而为算法的改进提供方向。在室外场景实验中，当无人机遇到突然的光照变化或短暂的遮挡时，通过监测MaxAE，可以了解算法在这种极端情况下的定位误差是否在可接受范围内。4.2.2地图质量评估指标地图质量评估对于验证空地多机器人SLAM算法的有效性至关重要，主要从地图完整性、准确性和一致性等方面进行评估。地图完整性是指地图所表达的地理信息是否全面，是否涵盖了所需表达的全部内容。在评估地图完整性时，可以通过对比实际环境与构建的地图，统计地图中缺失的关键区域或物体的比例。在室内仓库场景中，实际环境中存在多个货架和通道，如果构建的地图中缺失了部分货架或通道的信息，则说明地图的完整性存在问题。可以采用覆盖率指标来量化地图完整性，覆盖率的计算公式为：è¦çç=\frac{å°å¾ä¸åå«çå®éç¯å¢åºå}{å®éç¯å¢æ»é¢ç§¯}\times100\%覆盖率越高，说明地图的完整性越好。地图准确性是指地图所表达的地理信息与实际地理情况相符的程度。准确性是地图语义质量的核心要素，直接关系到地图的使用价值。对于点云地图，可以通过计算点云数据与实际物体表面的距离误差来评估准确性；对于视觉特征地图，可以通过检查特征点的匹配准确率和位置精度来判断地图的准确性。在评估地面机器人构建的激光雷达点云地图的准确性时，可以利用三维激光扫描仪获取实际环境的高精度点云数据作为参考，计算构建的点云地图与参考点云之间的均方根误差（RMSE），RMSE越小，说明地图的准确性越高。地图一致性是指地图所表达的地理信息在各个要素、各个层次之间是否协调一致。在多机器人地图融合过程中，一致性尤为重要，它有助于提高地图的可读性和可信度。可以通过检查不同机器人构建的局部地图在融合后的重叠区域是否平滑过渡，以及地图中物体的位置和姿态是否一致来评估地图的一致性。在基于视觉特征关联的地图融合算法中，通过计算融合后地图中特征点的位置偏差和方向偏差，来评估地图的一致性。如果特征点的位置偏差和方向偏差在一定范围内，则说明地图具有较好的一致性。4.3实验结果与对比分析4.3.1融合视觉特征的SLAM算法实验结果在室内仓库场景实验中，采用融合视觉特征的SLAM算法，地面机器人和无人机协同作业，成功构建出了仓库的三维地图。从定位精度来看，地面机器人的定位误差在x、y、z三个方向上的RMSE分别为0.12m、0.15m、0.10m，MAE分别为0.10m、0.13m、0.08m，MaxAE分别为0.20m、0.25m、0.18m；无人机的定位误差在x、y、z三个方向上的RMSE分别为0.20m、0.23m、0.15m，MAE分别为0.18m、0.20m、0.13m，MaxAE分别为0.30m、0.35m、0.25m。通过分析实验数据可知，地面机器人的定位精度相对较高，这主要得益于激光雷达提供的精确距离信息以及视觉特征的辅助；无人机由于飞行过程中的姿态变化和环境干扰相对较多，定位误差相对较大，但在可接受范围内。在地图构建方面，融合视觉特征的SLAM算法构建的地图完整性较高，仓库内的货架、通道等主要结构均被准确地映射到地图中，地图覆盖率达到了95%以上。地图的准确性也得到了有效保证，通过与实际环境的对比，地图中物体的位置和形状与实际情况相符，点云地图中物体表面的点云数据与实际物体表面的距离误差均值在0.15m以内，视觉特征地图中特征点的位置精度较高，匹配准确率达到了90%以上。地图的一致性表现良好，在多机器人地图融合过程中，不同机器人构建的局部地图在重叠区域能够平滑过渡，特征点的位置偏差和方向偏差均在合理范围内。在室外校园场景实验中，融合视觉特征的SLAM算法同样取得了较好的实验结果。地面机器人在复杂的校园道路和建筑物环境中，能够准确地定位自身位置，定位误差在x、y、z三个方向上的RMSE分别为0.15m、0.18m、0.12m，MAE分别为0.13m、0.16m、0.10m，MaxAE分别为0.25m、0.30m、0.20m；无人机在飞行过程中，能够快速获取校园的全局信息，定位误差在x、y、z三个方向上的RMSE分别为0.25m、0.28m、0.18m，MAE分别为0.23m、0.25m、0.16m，MaxAE分别为0.40m、0.45m、0.30m。在地图构建方面，构建的校园地图完整地呈现了校园内的建筑物、道路、树木等环境元素，地图覆盖率达到了93%以上。地图的准确性较高，点云地图与实际环境的误差在可接受范围内，视觉特征地图中的特征点能够准确地反映环境特征，匹配准确率达到了88%以上。地图的一致性也得到了很好的保证，不同机器人构建的地图在融合后，重叠区域的误差较小，整体地图的质量较高。4.3.2与传统SLAM算法的对比分析将融合视觉特征的SLAM算法与传统的基于激光雷达的SLAM算法（如Cartographer算法）和基于视觉的SLAM算法（如ORB-SLAM2算法）进行对比，以进一步验证所提算法的优越性。在定位精度方面，以室内仓库场景为例，传统Cartographer算法在地面机器人定位时，定位误差在x、y、z三个方向上的RMSE分别为0.18m、0.20m、0.15m，MAE分别为0.16m、0.18m、0.13m，MaxAE分别为0.30m、0.35m、0.25m；传统ORB-SLAM2算法在无人机定位时，定位误差在x、y、z三个方向上的RMSE分别为0.30m、0.35m、0.20m，MAE分别为0.28m、0.32m、0.18m，MaxAE分别为0.50m、0.60m、0.35m。与融合视觉特征的SLAM算法相比，传统Cartographer算法在缺乏视觉特征辅助时，对环境中的纹理信息利用不足，导致在一些特征不明显的区域定位精度下降；传统ORB-SLAM2算法在处理无人机飞行过程中的快速运动和姿态变化时，容易出现特征点丢失和误匹配，从而影响定位精度。而融合视觉特征的SLAM算法通过将视觉特征与激光雷达数据、IMU数据进行有效融合，充分发挥了各传感器的优势，提高了定位精度。在地图构建方面，传统Cartographer算法构建的地图虽然在几何精度上较高，但由于缺乏视觉特征提供的语义信息，地图的可读性和对复杂环境的描述能力相对较弱；传统ORB-SLAM2算法构建的地图在纹理信息表达上较好，但由于视觉传感器的局限性，地图的完整性和准确性在一些场景下存在不足，如在大面积空旷区域或遮挡严重的区域，地图构建效果不佳。融合视觉特征的SLAM算法构建的地图不仅具有较高的几何精度，还包含丰富的语义信息，能够更全面、准确地描述环境，在地图完整性、准确性和一致性方面都优于传统算法。在室外校园场景中，融合视觉特征的SLAM算法同样在定位精度和地图构建质量上表现出明显的优势，能够更好地适应复杂的室外环境，为机器人的导航和任务执行提供更可靠的支持。4.3.3不同环境下的算法性能分析为了研究融合视觉特征的SLAM算法在不同环境下的性能表现及适应性，在实验中设置了多种不同的环境条件，包括复杂地形、光照变化等。在复杂地形环境下，如室外山区场景，地面机器人和无人机面临着地形起伏、障碍物众多等挑战。实验结果表明，融合视觉特征的SLAM算法能够较好地适应这种复杂地形。地面机器人通过激光雷达和视觉传感器的协同工作，能够准确地感知地形变化，规划合理的运动路径，定位误差在x、y、z三个方向上的RMSE分别为0.20m、0.25m、0.18m，MAE分别为0.18m、0.22m、0.16m，MaxAE分别为0.35m、0.40m、0.30m；无人机在飞行过程中，利用视觉特征和IMU数据，能够稳定地保持飞行姿态，准确地定位自身位置，定位误差在x、y、z三个方向上的RMSE分别为0.30m、0.35m、0.20m，MAE分别为0.28m、0.32m、0.18m，MaxAE分别为0.50m、0.60m、0.35m。通过分析实验数据可知，在复杂地形环境下，视觉特征能够提供丰富的环境细节信息，帮助机器人更好地识别地形特征，结合激光雷达和IMU数据，有效地提高了机器人的定位精度和对复杂地形的适应性。在光照变化环境下，如从室内到室外的过渡场景，光照强度和颜色温度会发生剧烈变化。实验结果显示，融合视觉特征的SLAM算法通过采用光照不变特征提取和自适应阈值调整策略，在光照变化时仍能稳定地提取视觉特征，保持较高的定位精度和地图构建质量。地面机器人的定位误差在x、y、z三个方向上的RMSE分别为0.15m、0.18m、0.12m，MAE分别为0.13m、0.16m、0.10m，MaxAE分别为0.25m、0.30m、0.20m；无人机的定位误差在x、y、z三个方向上的RMSE分别为0.25m、0.28m、0.18m，MAE分别为0.23m、0.25m、0.16m，MaxAE分别为0.40m、0.45m、0.30m。与未采用优化策略的算法相比，融合视觉特征的SLAM算法在光照变化环境下的定位误差明显减小，地图构建的准确性和完整性也得到了有效保证，表明该算法对光

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

融合视觉特征的空地多机器人同时定位与建图方法的创新与实践

文档简介

温馨提示

最新文档

评论

融合视觉特征的空地多机器人同时定位与建图方法的创新与实践

文档简介

温馨提示

最新文档

评论

相关文档