版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章立体视觉7.1立体视觉基础7.2立体成像7.3立体匹配7.4多基线立体成像7.5测距成像7.6物体形状恢复方法7.7主动视觉1computervision7.1立体视觉基础深度图(DepthMap)获取场景中各点的深度信息是计算机视觉系统的一个重要任务。场景中的各点相对于摄像机的距离形成的一个二维图像,此图像中每一个像素值表示场景中某一点与摄像机之间的距离。计算机视觉系统中获取场景深度图的技术可以分为被动测距和主动测距两大类。2computervision7.1立体视觉基础被动测距传感视觉系统接收来自场景中发射或反射的光能量,形成有关场景光能量的分布函数(即灰度图象),然后在这些图像的基础上恢复场景的深度信息。实例:双目视觉系统,三目视觉系统主动测距传感视觉系统首先向场景中发射能量,然后接收场景中对所发射能量的反射能量。实例:雷达测距系统3computervision7.1立体视觉基础主动测距方法主动测距传感系统也称为测距成像系统(RangeFinder)雷达测距系统三角测距系统激光测距系统主动测距传感和被动测距传感的主要区别在于视觉系统是否通过接收自身发射的能量来测距。5computervision7.1立体视觉基础主动视觉与被动视觉主动视觉和主动测距传感是两个概念,主动视觉是一种理论框架。主动视觉主要研究的是通过主动的控制摄像机位置、方向、焦距、缩放、光圈、聚散度等参数;或者说是通过视觉和行为的结合来获得稳定的、实时的感知。6computervision7.2立体成像FigureThesailorshownintheleftpictureis,likemostpeople,abletoperformstereopsisandgainasenseofdepthfortheobjectswithinhiseldofview.Therightphotographisfromthe1953film“TheWaroftheWorlds",anditshowsaclose-upofthefaceofathree-eyedMartianwarrior.Whysuchaconfigurationmayprovebeneficial?7computervision7.2立体成像基本的双目立体视觉的几何关系是:有两个完全相同的摄像机构成;两个摄像机构成的图像平面位于一个平面;两个摄像机的坐标轴相互平行,且x轴重合,摄像机之间在x方向上的间距称为基线距离B;在这个模型中,场景中同一个特征点在两个摄像机图像平面上的成像位置是不同的;将场景中同一点在两个不同图像中的投影点称为共轭对,其中一个投影点是另一个投影点的对应(correspondence)求共轭对就是求解两幅图像中点的对应性问题。9computervision7.2立体成像基本的双目立体视觉的几何关系是:视差(disparity):两幅图像重叠时的共轭对之间的位置之差(共轭对点之间的距离)。视差摄像机A平面摄像机B平面重叠10computervision7.2立体成像基本的双目立体视觉的几何关系是:外极平面(epipolar
plans):通过两个摄像机中心和场景特征点的平面。外极线(epipolarlines):外极平面与图像平面的交线外极点(epipoles):同一个图像平面上的所有外极线交于的同一点。11computervision7.2立体成像依据双目立体视觉几何关系的深度计算假设场景中的P点在左右摄像机图像平面中的投影点分别为Pl和Pr,同时不失一般性假设坐标系原点与左透镜中心重合。比较相似三角形PMCl和PlLCl,可得到:同理,可从相似三角形PNCr和PrRCr中得到:13computervision7.2立体成像BClLPlMN(x,y,z)PPrRzFCrPMCl和PlLClPNCr和PrRCr14computervision7.2立体成像依据双目立体视觉几何关系的深度计算结合以下公式:可以得到:其中F是焦距,B是基线距离,是视差。各种场景中的点的深度就可以通过计算视差来实现。视差一般是整数。对于一组给定的摄像机参数,提高场景点深度计算的精度有效途径是增加基线距离B,即增大场景点对应的视差。15computervision7.2立体成像视差与光轴的交角有关,对于任意一个光轴交角,在空间中总存在一个视差为零的表面;d>0d<0d=0光轴零视差曲面立体基线17computervision7.2立体成像视差与光轴的交角有关,对于任意一个光轴交角,在空间中总存在一个视差为零的表面;比这一表面远的物体,其视差大于零;比这一表面近的物体,其视差小于零;d>0d<0d=0光轴零视差曲面立体基线18computervision7.2立体成像最一般的立体成像是一个运动摄像机连续获取场景中的图像,形成立体图像序列,或间隔一定距离的两个摄像机同时获取场景图像,形成立体成像对。19computervision7.3立体成像从原理上讲根据“立体图象对”抽取深度信息的处理应包括以下四部分:在图象中寻找在两幅图象中都便于区分的特征或用于匹配的基元(primitive)。把左、右两幅图象中的相关特征进行匹配,即解决特征匹配的方法问题。确定摄象机的相对几何位置和有关参数,即摄象机的校准(Calibration),目的是将二维图像坐标空间中的点对应到三维世界坐标空间中。根据视差计算成象物体相对摄象机的距离。21computervision7.3立体匹配立体匹配的匹配规则约束立体匹配:立体成像的深度信息测量的一个重要步骤就是寻找立体成像对中的共轭对,即求解对应问题。问题:实际中求解对应问题是非常困难的,一是计算量大,二是匹配的准确度要求高。解决:为了求解对应,建立了许多约束来减少对应点误匹配,并最终得到正确的匹配特征点的对应。22computervision7.3立体匹配外极线约束对于两幅从不同角度获取的同一场景的图像来说,传统的特征点搜索方法是首先在一幅图像中选择一个特征点,然后在第二幅图像上搜索对应的特征点。这是一个二维搜索问题。因为一幅图像上的特征点一定位于一幅图像上对应的外极线上,因此在匹配的过程中只要求的外极线,则在外极线上而不用在整个二维图像平面上求解对应解,从而转化到一维搜索。如果已知目标与摄像机之间的距离在某一区间内,则搜索范围还可以限制在外极线上的一个小区间内。23computervision7.3立体匹配一致性约束立体视觉通常有两个或两个以上摄像机组成,各摄像机的特性一般是不同的,如果场景中对应点处的光强相差很大时,直接进行相似性匹配,得到的匹配值变化也会很大。一般在进行匹配之前,必须对图像进行规范化处理,设参考摄像机和其他摄像机的图像函数分别为f0(i,j)和fk(i,j),在m×n图像窗内规范化图像函数为:其中μ是图像窗内光强均值,σ是光强分布参数25computervision7.3立体匹配一致性约束在m×n图像窗内规范化图像函数为:其中μ是图像窗内光强均值,σ是光强分布参数相似评价函数为差值绝对值之和(SAD)26computervision7.3立体匹配边缘匹配算法步骤:用四个不同宽度的高斯滤波其对立体图像对中的每一幅图象进行滤波,其中前一次滤波的宽度是下一次滤波宽度的两倍,这一过程可以反复通过对最小的滤波其进行不断的卷积实现。在某一行上计算各边缘的位置。通过比较边缘的方向和强度粗略的进行边缘匹配,显然,水平边缘是无法进行匹配的。通过在精细尺度上进行匹配,可以得到精细的视差估计。29computervision7.3立体匹配区域相关性:虽然边缘特征是图像的基本特征,但是边缘特征往往对应着物体的边界,而物体边界的深度值一般是不确定的;物体边界深度值可以是物体封闭边缘的深度距离和背景点深度距离之间的任意一个值。曲面物体的封闭边缘时物体的轮廓影像边缘,在两幅图像平面中观察到的轮廓影像边缘与真实的物体边缘并不是相对应的。所以就需要寻找另一种特征进行匹配,这里选择立体图像对中识别兴趣点(InterestingPoint),然后使用区域相关法进行匹配。30computervision7.3立体匹配区域相关性:候选匹配点要选择具有很大变化的区域中的点,一般认为图像中有足够多相互分离的区域可以用于候选匹配点的选择。在以某一点为中心的窗函数中,使用窗内所有像素来计算在不同方向上的变化量,是这个中心点在不同方向上显著性的一个好测度。31computervision7.3立体匹配区域相关性:选择上述方向变量的最小值为中心像素点(xc,yc)的兴趣值为了避免将多个相邻点选为同一个特征对应的兴趣点,可以将特征点选在兴趣测度函数具有局部最大值的地方。两幅图像中特征确定后,就可以使用许多不同方法进行特征匹配。常用的匹配搜索方法是在一个小的窗函数内搜索匹配,这个小窗函数是以满足外极线约束的。32computervision7.3立体匹配区域相关性:两幅图像f1和f2,设待匹配的候选特征点对的视差为(dx,dy),则以特征点为中心的区域之间相似性测度可以有相关系数r(dx,dy)定义为:在每一个像素上使用阈值化处理后的具有正负符号的梯度值,而不是图像灰度值,可以改善相关性的计算精度。33computervision7.3立体匹配立体匹配的讨论通过基于特征的立体匹配算法产生的对应于图像特征点的场景稀疏深度图,即只得到的是特征点的深度而不是整幅图像上所有像素点的深度,所以是稀疏的。如果要得到所有像素点的深度,则必须利用表面内插算法或逼近算法在特征点深度值之间计算出特征点之间像素的深度值来。立体重建过程中的难点在于:(1)特征点的选择(2)匹配算法的选择。参见:Marr-Poggio-Grimson算法,Baker-Binford算法
。34computervision7.4多基线立体成像理想情况下,一幅图像上的每一个特征点只能与另一幅图像上的唯一的一个特征点相对应,即特征的唯一性约束。实际情况下,特征点不明显会出现对应的多义性(ambiguity),即一幅图像上的一个特征点对应另一幅图像的若干个对应点,其中只有一个是真正的对应点,其它的是假的对应点。为了消除对应点的多义性,提出了一种基于多基线的立体成像方法。M.Okutami,T.Kanade,Amultiplebaselinesstereo,IEEETransonPatternAnalysisandMachineIntelligence,15(4):353-36335computervision7.4多基线立体成像假定n个摄像机具有相同的焦距F,其位置分别为P0,P1…Pn-1,对应的n-1个基线用B1,B2…Bn-1表示,f0(x)和fi(x)表示在位置P0和Pi处同步获取的图像,组成一个立体图像对。36computervision7.4多基线立体成像已知场景中一点Z的深度值为zr,则f0(x)和fi(x)形成的立体视差dr(i)为:图像亮度函数f0(x)和fi(x)在Z点附近可表示为:其中,f(x)是理想图像,n0(x),ni(x)服从正态分布N(0,σ2n)的噪声。在一定大小窗口W中,立体视差变量d(i),立体图像的方差之和(SSD)为:37computervision7.4多基线立体成像设ζr和ζ分别是真实和候选场景点深度值的倒数,即ζr=1/zr,ζ=1/z,则:替换的SSD为:其中ei(x,ζ)成为匹配平价函数,ei(x,ζ)的数学期望为:38computervision7.4多基线立体成像N个摄像机形n-1个SSD函数,将所有的SSD函数相加形成了一个总的评价函数假设亮度函数f(x)在x和x+a处有相同的模式,即则它们的匹配评价函数期望关系是:在ζr和ζf=ζr+a/(BiF)两个地方得到的评价函数最小,但是假的匹配深度值的倒数ζf随着基线的变化而变化,而真的匹配深度值的倒数ζr与基线无关,经过累加真的匹配深度成为最小值。39computervision7.5从X恢复形状的方法除了立体匹配算方,从灰度图像提取形状信息的其它方法都统称为从X恢复形状方法(ShapefromX)。如果物体上至少有一个点的实际深度是已知的,那么统一目标上的其它点的深度可以通过对局部表面方向求积分得到。从X恢复形状方法是一种间接的深度计算方法。光度立体从明暗灰度形状从纹理恢复形状从运动恢复形状40computervision7.5从X恢复形状的方法光度立体光度立体:是使用不同方向上的三个光源来获取统一场景的三幅图象,通过场景中物
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工艺染织品制作工变更管理能力考核试卷含答案
- 砖瓦干燥工持续改进知识考核试卷含答案
- 数字化解决方案设计师变革管理测试考核试卷含答案
- 海南儿童美术培训教案
- 排污单位自行监测实验室管理技术规范-编制说明
- 酒店员工离职与交接制度
- 超市员工培训及提升制度
- 城市防洪知识培训
- 活动汇报技巧培训
- 2024-2025学年江苏省盐城市五校联盟高一下学期第一次联考历史试题 (解析版)
- 2025年四川医疗卫生事业单位《卫生公共基础知识》考试真题及答案
- 工程建设项目合同最终结算协议书2025年
- 食堂档口承包合同协议书
- 云南公务接待管理办法
- 农行监控录像管理办法
- 急性呼吸衰竭的诊断与治疗
- 职业技能认定考评员培训
- DB11∕T 1448-2024 城市轨道交通工程资料管理规程
- JG/T 163-2013钢筋机械连接用套筒
- 职业技术学院数字媒体技术应用专业人才培养方案(2024级)
- 装修施工奖罚管理制度
评论
0/150
提交评论