版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
导论基于机器视觉的物体识别研究与定位机器人发展现状的文献综述1.1识别定位技术研究现状视觉对人类十分重要,同样对机器人也十分重要。在人,视觉系统为他们提供超过80%的外界获取的信息。在机器人,视觉系统同样充当着机器人“双眼”的职能,机器人通过视觉模块来获取环境信息,同时获取能够理解并适应环境的信息,从而提高工作稳定性。在机器人的视觉系统中,识别与定位技术尤为重要,该技术依靠视觉传感器获取到工作环境图像,在系统中通过一些图像处理算法,使得机器人“理解”环境信息,能够快速定位目标物体并对其进行识别,计算出物体的三维空间位置。在早期对RGB图像与灰度图像的研究中,人们采用手动特征提取的方式对众多图像进行匹配,同时SIFT(Scale-invariantfeaturetransform)算法和ORB(Oriented
FAST
and
Rotated
BRIEF)算法是经典的用来支持图像匹配的算法。虽然手动提取特征的方式取得了一定成效,但它不能充分利用图像数据,识别效率不稳定和精度不稳定的特点促使研究者们去寻求更多更好的算法。为了能在原始图像中获得更多的特征,研究者将一些基于深度学习的无监督算法应用于物体识别领域。同时,人工神经网络的发展也引起了人们对于深度学习的重视。与深度学习直接相关的卷积神经网络(ConvolutionalNeuralNetworks,CNN)既包含深层次结构的深度前馈神经网络,又包含卷积计算功能。它改善了手动提取目标特征分类准确率低、效率低的缺点,能更好地发现样本集中特征规律。卷积神经网络被广泛应用于基于深度学习的识别定位技术,这是深度学习得到发展的标志。自从神经元概念应用到机器模拟人的感知能力的实验以来,这方面的理论研究与实验尝试从未停过,而且发展越来越神速。从上个世纪八十年代“平移不变人工神经网络”开始,到应用于计算机视觉问题的卷积网络的构建,再到各类性能优异的卷积神经网络的开发,卷积神经网络的研究从平缓的发展到快速发展再到爆发。在这个过程中,构建网络的基本运算单元渐趋丰富与复杂,提取到的图像特征也从线性逐渐走向非线性,网络准确率越来越高,训练数据量越来越大,同时,模型训练时间越来越短。可以说,卷积神经网络应用于手写数字识别是从LeNet网络开始的,虽然LeNet网络结构简单,但却具备了现代CNN网络完整的前向和反向传输过程,奠定了各类后续发展的模型的基本特质,即使随着各类模型的改进和创新,网络层数不断变化和功能的不断添加,但网络本质基本没有改变。2000年代初开始,紧随计算机硬件发展的步伐,包含多个隐含的深度置信网络(DBN)的实验成功,各类各型的神经网络模型遍地开花,不管是AlexNet、VGGNet还是GoogleNet、ResNet,可谓各显神通,都取得了不错的成效。其中,AlexNet在2012年的惊艳“出场”可以说是卷积神经网络对计算机视觉界的巨大贡献,也奠定了卷积神经网络计算机视觉领域的地位。作为拥有深层次网络结构的AlexNet,它提高了深度学习产生时的准确度,提高了网络训练速度,从而使训练效率问题得到有效改善。而VGGNet、GoogleNet和ResNet的成功开发,不断增加网络深度,不断探索网络性能,作为识别质量的关键性指标Top5误差率不断变小,意味着对特征学习的能力变得越来越强,运算速度越来越快,尤其是ResNet模型通过残差网络结构很好地解决了因网络层数增多而出现的梯度爆炸或衰减现象,确保准确率的稳定。同时,由于物体识别定位使用场景的增加,仅仅获取到RGB图像已经不能满足很多行业的应用,能够获取到更多位置信息的深度图像进入了人们的视野。RGB-D相机方案、双目视觉方案和单目视觉方案是目前机器视觉检测系统常见的方式,而且是深度距离测量的三种方式。其中RGB-D相机方案就是本研究所使用的包含了彩色图像信息与深度图信息的深度距离测量方式。单目视觉方案是早期最广泛使用的距离测量方式,该方案仅利用一个RGB摄像头获取彩色图像来进行物体测距,测距包括了单帧计算和多帧计算。通过单张图片进行物体间距离的测算需要标注图片内物体的几何尺寸作为参考,并基于针孔相机模型推导出物体的距离。多帧计算则是通过不断改变相机的位置,通过测量前后帧之间测量点的像素偏移来估计物体的距离。单目视觉的优势在于其运算开销较小,但其测算距离精度也比较低,仅仅适用于一些简单场景。相对于单目测量方案,双目视觉方案的应用范围更广、物体深度精度更高,因此在实际应用中使用得更多一些。双目视觉使用了类似于单目相机多帧计算的己算原理,采用两个水平或者上下排列的RGB相机同时拍摄照片,然后计算两张图像所得深度。双目方案形成的点云数据,能应对各种复杂情景,这是因为它对抗外界干扰能力强。图像的匹配运算也意味着计算资源的损耗,虽然双目视觉方案能适应较为复杂的场景,但它的实时性就得不到保证了。深度摄像头和彩色摄像头的特点融入RGB-D相机中,RGB-D相机的主要功能就是既能获取彩色图片,又能获取相对应的深度信息。相较于双目相机,RGB-D相机测量精度更高,计算资源开销少,实时性好,甚至能在较为昏暗的环境中采集到深度信息,但是RGB-D相机也有弊端,它更容易受到红外线的影响。由于RGB-D具有深度信息精度高、实时性强、方便携带等优点,人们往往将他应用于移动机器人行业。随着深度传感器的不断发展,越来越多的国内外研究者关注起了依靠深度相机实现相关的机器人视觉技术。1.2基于机器视觉的机器人发展现状物体的定位与识别是智能机器人领域的重要研究内容,如今,已经有很多智能机器人能通过机器视觉来实现高效率高精度地定位并识别物体。2019优必选公司研发的ATRIS(安巡士)机器人亮相于迪拜国际安防展,吸引的众多观众的目光。ATRIS机器人(如下图所示),它配有两个高清摄像头,一颗用于拍摄50m内的物体,另一个能在夜间进行红外线补光。ATRIS能在运行的过程中同时进行人脸检测,且检测成功率高达99%。ATRIS能全天候巡逻敏感地区,是人无法替代的。这是因为它拥有可见光模块和热成像模块两个模块,所以即使在阴天和夜间,它也能精准识别出视野范围内的人。如今,ATRIS已被用于在北京王府井进行日常巡逻。图1.SEQ图\*ARABIC\s11ATRIS机器人packbot机器人是一款大量应用于战场和救灾的机器人,它由美国iRobot公司研发。Packbot机器人(如下图),装载一个摄像头以及两个可拆卸调节的履带,它能在复杂环境中灵活的运动,获取到复杂环境的信息,在排险和侦察方面有着重要功能。甚至连五角大楼都是packbot的重要客户之一。图1.SEQ图\*ARABIC\s12packbot机器人参考文献[1]巩育江,庞亚军,王汞,白振旭.基于几何特征的点云分割算法研究进展[J/OL].激光技术:1-13[2021-06-14]./kcms/detail/51.1125.TN.20210608.1513.008.html.[2]MaShuhua,GuoPeikai,YouHairong,HePing,LiGuanglin,LiHeng.AnimagematchingoptimizationalgorithmbasedonpixelshiftclusteringRANSAC[J].InformationSciences,2021,562.[3]EbrahimiAli,CzarnuchStephen.AutomaticSuper-SurfaceRemovalinComplex3DIndoorEnvironmentsUsingIterativeRegion-BasedRANSAC.[J].Sensors(Basel,Switzerland),2021,21(11).[4]陈丹,陈兵,冯皓,李军,沈磊,张昊,丁可,杨浩钦.基于改进RANSAC算法的BDS接收机自主完好性监测算法研究[A].中国卫星导航系统管理办公室学术交流中心.第十二届中国卫星导航年会论文集——S03导航信号与信号处理[C].中国卫星导航系统管理办公室学术交流中心:中国卫星导航学术年会组委会,2021:7.[5]杨步一,杜小平,方宇强,李佩阳,王阳.单幅图像刚体目标姿态估计方法综述[J].中国图象图形学报,2021,26(02):334-354.[6]吴宇哲.基于点云的物体姿态估计研究与应用[D].河北农业大学,2020.[7]蒋俊华,蒋叶华,张镭.基于神经网络和深度相机的工件检测与定位系统[J].传感器与微系统,2020,39(08):82-85.[8]李响.基于单像素探测和深度学习的运动物体识别技术[D].暨南大学,2020.[9]袁蒙恩.基于单目视觉估计的机械臂运动规划算法[D].河南大学,2020.[10]周浩源.彩色结构光三维测量拼接与点云目标识别方法研究[D].广东工业大学,2020.[11]崔宁.基于深度相机的物体识别与定位研究[D].中国人民公安大学,2020.[12]温尧乐,李林燕,尚欣茹,胡伏原.一种改进的MaskRCNN特征融合实例分割方法[J].计算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 矿山生态修复项目使用林地可行性报告
- 2025华夏银行芜湖分行社会招聘笔试历年典型考题及考点剖析附带答案详解
- 2025北京汽车集团有限公司信息中心副主任招聘2人笔试历年常考点试题专练附带答案详解
- 2025内蒙古蒙科产业技术创新有限公司第四批招聘6人笔试历年备考题库附带答案详解
- 2025内蒙古威信保安押运服务有限责任公司招聘笔试笔试历年备考题库附带答案详解
- 2025内蒙古伊金霍洛旗矿区农村信用合作联社社会招聘10人笔试历年典型考题及考点剖析附带答案详解
- 2025兴业银行济南分行校园招聘笔试历年典型考题及考点剖析附带答案详解
- 2025兴业银行博士后科研工作站招收笔试历年典型考题及考点剖析附带答案详解2套
- 2025交通银行青岛分行春季校园招聘笔试历年典型考题及考点剖析附带答案详解
- 2025下半年四川南充营山县属国有企业招聘合同制员工及笔试历年备考题库附带答案详解
- DB3207∕T 2013-2023 民用建筑外窗系统技术规程
- IT行业技术研发工作经验证明(8篇)
- 《介入治疗技术在临床应用中的进展》课件
- 苏教版四年级数学下册第三单元三位数乘两位数第5课时《乘数末尾有0的乘法》教学设计
- 2023-2024学年鲁教版九年级化学第七单元《常见的酸和碱》(同步教学设计)
- CNAS-CC153-2018 供应链安全管理体系认证机构要求
- 2024年部编版九年级语文上册电子课本(高清版)
- 县城区航拍影像投标方案(技术方案)
- 山西省晋中市2023-2024学年八年级下学期6月期末考试数学试题
- 排水管道螺旋缠绕内衬法修复工程技术规程
- 铅锌矿选矿过程中的洗选技术与设备
评论
0/150
提交评论