单幅图像的三维信息处理毕业设计(共31页)_第1页
单幅图像的三维信息处理毕业设计(共31页)_第2页
单幅图像的三维信息处理毕业设计(共31页)_第3页
单幅图像的三维信息处理毕业设计(共31页)_第4页
单幅图像的三维信息处理毕业设计(共31页)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 PAGE 33独立完成(wn chng)与诚信声明本人郑重声明:所提交的毕业设计是本人在指导教师的指导下,独立工作所取得的成果并撰写完成的,郑重确认(qurn)没有剽窃、抄袭等违反学术道德、学术规范的侵权行为。文中除已经标注引用的内容外,不包含其他人或集体已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确的说明并表示了谢意。本人完全意识到本声明的法律后果由本人承担。毕业设计(b y sh j)作者签名: 指导导师签名: 签字日期: 签字日期:毕业设计版权(bnqun)使用授权书本人完全了解华北水利水电学院有关保管、使用毕业设计的规定。特授权华北水利水电学院可

2、以将毕业设计的全部或部分内容公开和编入有关数据库提供检索,并采用影印、缩印或扫描等复制手段(shudun)复制、保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交毕业设计原件或复印件和电子文档(涉密的成果在解密后应遵守此规定)。毕业设计(b y sh j)作者签名: 导师签名:签字日期: 签字日期: 目录(ml)TOC o 1-3 h u HYPERLINK l _Toc12287 North China University of Water Resources and Electric Power PAGEREF _Toc12287 1 HYPERLINK l _Toc28406

3、摘要(zhiyo) PAGEREF _Toc28406 5 HYPERLINK l _Toc3445 Abstract PAGEREF _Toc3445 6 HYPERLINK l _Toc26942 第一章 绪论(xln) PAGEREF _Toc26942 7 HYPERLINK l _Toc5060 1.1 选题的背景和意义 PAGEREF _Toc5060 7 HYPERLINK l _Toc28543 1.2 三维信息获取的发展前景 PAGEREF _Toc28543 8 HYPERLINK l _Toc19347 1.3 本文的结构 PAGEREF _Toc19347 9 HYPE

4、RLINK l _Toc9723 第二章 摄像机的成像模型 PAGEREF _Toc9723 10 HYPERLINK l _Toc21898 2.1参考坐标系 PAGEREF _Toc21898 10 HYPERLINK l _Toc10872 2.2 摄像机模型 PAGEREF _Toc10872 11 HYPERLINK l _Toc24846 2.3 坐标变换关系 PAGEREF _Toc24846 12 HYPERLINK l _Toc15512 2.4摄像机成像模型的参数 PAGEREF _Toc15512 14 HYPERLINK l _Toc3524 第三章 伪逆算法 PAGE

5、REF _Toc3524 16 HYPERLINK l _Toc2515 3.1 最小二乘法原理 PAGEREF _Toc2515 16 HYPERLINK l _Toc13857 3.2 伪逆矩阵 PAGEREF _Toc13857 18 HYPERLINK l _Toc16954 3.2.1 右伪逆矩阵 PAGEREF _Toc16954 18 HYPERLINK l _Toc21398 3.2.2 左伪逆矩阵 PAGEREF _Toc21398 18 HYPERLINK l _Toc28963 3.3 线性方程组求解 PAGEREF _Toc28963 19 HYPERLINK l _T

6、oc1861 3.4 伪逆算法 PAGEREF _Toc1861 19 HYPERLINK l _Toc13476 第四章 获取图像的三维特征点坐标 PAGEREF _Toc13476 21 HYPERLINK l _Toc30204 4.1图像预处理 PAGEREF _Toc30204 21 HYPERLINK l _Toc8429 4.2利用伪逆法提取图像的特征点坐标 PAGEREF _Toc8429 23 HYPERLINK l _Toc32541 第五章 结果分析 PAGEREF _Toc32541 25 HYPERLINK l _Toc952 第六章 总结与展望 PAGEREF _T

7、oc952 29 HYPERLINK l _Toc9170 6.1 总结 PAGEREF _Toc9170 29 HYPERLINK l _Toc22386 6.2 展望 PAGEREF _Toc22386 29 HYPERLINK l _Toc26556 致谢 PAGEREF _Toc26556 30 HYPERLINK l _Toc16531 参考文献 PAGEREF _Toc16531 31 HYPERLINK l _Toc14174 附录一 PAGEREF _Toc14174 32 HYPERLINK l _Toc13240 程序: PAGEREF _Toc13240 32 HYPER

8、LINK l _Toc11878 附录二 PAGEREF _Toc11878 35 HYPERLINK l _Toc31062 外文翻译 PAGEREF _Toc31062 35 HYPERLINK l _Toc2313 英文原文 PAGEREF _Toc2313 35 HYPERLINK l _Toc24939 中文翻译 PAGEREF _Toc24939 41 HYPERLINK l _Toc30505 附录三 PAGEREF _Toc30505 45 HYPERLINK l _Toc25609 附录四 PAGEREF _Toc25609 49单幅图像的三维信息(xnx)获取摘要(zhiy

9、o) 三维信息获取,是研究快速获取物体表面三维信息,得到物体三维数字化模型的技术。三维信息主要包括目标点的空间位置信息、颜色信息、结构信息等等(dn dn),随着电子技术和计算机技术的迅猛发展,人们经常需要迅速的获得图像的三维信息。 当前三维信息获取技术大多是基于计算机视觉理论,计算机视觉是用视觉传感器获取环境图像并将其转换成数字信号,用计算机实现对视觉信息处理的全过程。 计算机视觉的研究目标是使计算机具有通过二维图像认知三维环境信息的能力,使机器能感知三维环境中物体的几何信息,包括形状,位置,姿态,运动等,并对它们进行描述,存储,识别和理解。本研究的核心算法是首先需要得到摄像机从三维到二维的

10、成像矩阵M3*4,并计算M3*4的伪逆矩阵N,然后利用伪逆矩阵N提取二维单幅图像中的三维信息,即提取特征点的三维坐标。 本文在分析了摄像机成像模型的基础上,提出了空间点获取的方案,得到了世界坐标系与像素坐标系之间的转换关系式,并为获取三维信息提供了一种简单的方法。关键词:三维信息获取;摄像机成像模型;伪逆;特征点Abstract 3D information acquisition is the study of the rapid acquisition of 3D object surface information to get the 3D model technology.Three

11、 dimensional information mainly includes the target space position information, color information, configuration information and so on, along with the electronic technology and the rapid developement of computer technology, people often need to obtain images of three-dimensional information. The cur

12、rent 3D information acquisition methods are mostly based on the theory of computer vision, computer vision is the vision sensor image acquisition environment and converts it into a digital signal, using computer to realize the whole process of visual information processing.The study of the core algo

13、rithm is the first need to get the camera from 3D to 2D image matrix M3* 4, and calculate the M3 *4 pseudo inverse matrix N, and then use the pseudo inverse matrix N extracted from the two-dimensional images of three-dimensional information extraction, namely the3D coordinates of feature points. Bas

14、ed on the analysis of the model imaging camera are put forward, based on the point of the scheme for space, by the world coordinate system and the conversion relation between pixel coordinate system, and for access to the 3 d information provides a simple method. Key words:3D information acquisition

15、;A camera imaging model ; pseudo inverse; feature point第一章 绪论(xln)计算机视觉的研究目标是使计算机具有通过一幅或多幅图像认知周围环境信息的能力(nngl)。这种能力将不仅使计算机能感知环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解。 80年代初Marr首次从信息处理的角度综合了图像处理、心理物理学、神经生理学及临床精神病学的研究成果,提出(t ch)了第一个较为完善的视觉系统框架。在这一理论的指导下,经过众多学者辛勤探索,计算机视觉已发展起一套独立的计算理论与算法,它并不刻意去“仿真

16、”生物视觉系统,从而能用计算机对视觉信息(或者说对图像)进行分析与处理。在理论发展的同时,计算机视觉已应用于遥感图像分析,文字识别,医学图像处理,多媒体技术,工艺检测与军事等方面。我们相信,随着跨学科基础研究的不断深入,随着计算机性能的快速提高,计算机视觉将广泛地应用于更复杂的场合。1.1 选题的背景和意义客观世界在空间上是三维的。在工程技术和其他很多领域,一般要对物体进行三维信息分析,从而得到对研究有用的信息。基于数码图片的三维信息获取是计算机视觉领域中一个重要的研究部分,近年来,三维信息获取的理论和应用也得到了很大的发展。目前,绝大部分图像采集装置所获取的图像信息都是二维的平面信息,尽管其

17、中可以含有三维物体的空间信息。要想从数码图片去认识真实物体,就要从二维世界中的平面图像来恢复其在三维空间中的立体模型,这就需要研究二维空间中的图像中的像素点与客观世界中物体各点之间的对应关系,分析确定物体的大小和空间物体的相互位置关系,得到物体的三维坐标,从而获取三维信息。在美国召开的第10届模式识别会议上,J.Atoimonos(英国马里兰大学)提出了有目的的、定性的主动视觉,他认为以马尔视觉计算理论为代表的理论将视觉规定为由场景的图像精确地获取三维几何机器视觉,这要求太高了,是没有必要的,计算也太过复杂,求解太困难,并且这些定量计算没有必要, 可以用定性视觉来代表定量视觉。立体成像的方式主

18、要由光源、采集器和景物三者的相互位置和运动情况所决定。传统的成像方法几乎是这三者中至少有一者位置不固定,比如双目成像是两个采集器位于两个位置,当然也可以是同一个采集器平移到另一个位置;光移(光度立体)成像是光源运动,另两者固定;主动视觉成像是采集器运动,另两者固定;主动视觉(自运动)成像是仅光源固定,另两者运动等等。尽管图像中包含着丰富的信息, 但是从一幅图像无法直接获得沿着某条投影线上的点的深度。至少需要两幅图像,才可以通过三角测量的方法得到点的深度。传统的三维重建方法很少基于三者都固定的情况。从一幅图像中提取三维信息的原理有很多,如透视缩放、透视缩短和纹理梯度等,因为在一幅图像中,三维信息

19、是隐藏(yncng)在所成像的几何畸变、明暗度、纹理、表面轮廓等因素之中的。值得注意的是,除非景物与像之间的距离测度比例已知,否则由2D图像并不能直接得到摄像机与景物间的绝对距离。简言之,如果没有足够的先验知识,从一幅图像中提取的三维信息只能做定性分析,只能得到相对的位置或方位关系。实际上,三维数据获取是人工智能领域的研究课题,是通常的几何作图或者摄影成像过程的逆过程。1.2 三维信息(xnx)获取的发展前景(qinjng)生活在三维的物理世界中,所有物体都具有三维物理尺寸。然而,迄今为止所有商业化信息器都只能显示二维图像,人们无法从被显示的图像上获得物体的三维信息或感受到物体的物理深度。这种

20、目前仍在使用的二维显示技术剥夺了物体的三维特征,具有极大的局限性。有鉴于此,近年来提出并开展了一系列的三维信息获取技术,并且这些三维信息获取技术在一定程度上解决了城市规划、国土调查、数字电力、数字森林、数字交通、应急减灾、矿产调查、文物数字保护等应用领域的数据需求,有不可替代的商业价值和广阔的应用市场。特别是最近十年来迅速发展起来的激光雷达新型遥感技术和计算机视觉的摄影测量技术为三维信息快速获取注入了新的活力。在巨大的市场需求和技术竞争面前,自主创新与技术集成是迫在眉睫的头等大事。近些年,单幅图像信息获取的研究越来越受到关注,由于一幅图像无法完全重构出对应的三维模型,针对这一点(y din),

21、众多研究者利用图像中已知的几何信息对目标物体进行三维信息获取。在国外,caPrile和Torre首先提出了利用灭点进行摄像机标定的思想。在给出并证明了灭点属性的基础上,根据灭点与摄像机内参数的关系通过单幅图像确定摄像机的内参数,再由根据特定模板计算摄像机的外参数。Guilfou等人提出了一种利用灭点实现单幅图像中三维物体信息获取的方法,假设摄相机在投影面上的投影中心即为图像的中心,而不是利用灭点的属性进行计算,且在对相机内参数的估算时也没有充分利用灭点的属性,因而(yn r)计算过程稍显复杂。Debevec等将目标物体的几何形状作为相应参数,实现结构化场景的交互式建模。ZHANG提出利用一些用

22、户指定的约束,如目标物体表面的位置、轮廓、皱痕等生成满足这些约束的三维表面。在国内,对利用单幅图像进建模工作的研究也很多,张祖勋等通过分析灭点几何,基于单幅图像的三维信息获取的研究建立了摄像机的成像模型,根据伪逆算法,用最小二乘法原理,计算影像的内、外方位元素的方法(fngf),并在三维信息获取的实践中进行了验证。1.3 本文的结构本文一共由六章组成,本文的主要内容如下:绪论介绍了本课题的研究背景和意义,以及获取三维信息技术的发展前景,并列出本课题的具体任务。研究了摄像机的成像模型,知道摄像机的两个内参矩阵,为提取特征点的伪逆算法提供了依据。先介绍最小二乘法原理,然后再了解伪逆算法。对图像进行

23、预处理,然后(rnhu)根据伪逆算法获取图像特征点的三维坐标对实验结果(ji gu)进行分析,并总结伪逆算法提取特征点的优点和缺点。对全文做总结和对未来的研究(ynji)工作进行展望。 第二章 摄像机的成像模型从图像中获取三维信息的几何数据,必须建立物体位置点与其在摄相机中所处的位置点到像点之间的数学关系表达式,即确定摄像机成像几何模型。摄像机成像模型是摄像机标定的基础,确定了成像模型,才能确定摄像机内外参数的个数和求解的方法。在计算机视觉中,利用所拍摄的图像来计算出三维空间中被测物体几何参数。图像是空间物体通过成像系统在像平面上的反映,即空间物体在像平面上的投影。图像上每一个像素点的灰度反映

24、了空间物体表面某点的反射光的强度,而该点在图像上的位置则与空间物体表面对应点的几何位置有关。这些位置的相互关系,由摄像机成像系统的几何投影模型所决定。计算机视觉研究中,三维空间中的物体到像平面的投影关系即为成像模型。2.1参考坐标系摄像机的成像过程如图2-1,共涉及到4个坐标系,这4个坐标系分别为:世界坐标系 根据自己的需要选定的坐标系,坐标原点为,其它的坐标用表示;世界坐标系用来描述场景中摄像机和物体的位置。 (2) 摄像机坐标系 坐标系为Oc-XcYcZc,其中Oc为摄像机的光心,Xc轴和Yc轴与成像平面(pngmin)坐标系的坐标轴平行,Z轴为摄像机的光轴,与成像平面垂直。 (3) 图像

25、(t xin)坐标系 它的坐标原点O在摄像机获得(hud)的图像平面的中心,其点的坐标用(x, y)来表示,它的 X 轴、Y 轴分别平行于摄像机坐标系的两条垂直边;像素坐标系 它的坐标原点在图像平面的左上角,它的两个坐标轴分别用 U、V 表示,且 U 轴、V 轴也平行于摄像机坐标系的两条垂直边,其点的坐标用(u ,v)来表示,由于像素坐标系中的坐标是用像素来表达的,所以该坐标值都是一些离散的整数值。 P(Xw,Yw,Zw)Zc(Xc,Yc,Zc)O0VPOXUYfXc OcYc 2-1 摄相机成像坐标系2.2 摄像机模型(mxng)摄像机采集得到的图像上的每一点的亮度(lingd)反映了空间物

26、体表面某点反射光的强度,而该点在图像中的位置与物体表面点在三维世界中的位置有关。摄像机成像模型将三维空间的点与图像平面上的点对应起来,可以用一个从三维空间到二维空间的映射来表示: (2-1)2.3 坐标变换(binhun)关系 四个参考坐标系的坐标变换一共涉及到三个过程,将空间中点的世界坐标变换为图像的像素坐标。(1)世界坐标系到摄像机坐标系的变换 世界坐标系到摄像机坐标系的变换是一个刚体变换,可以由一个正交变换矩阵R和一个位移向量T表示为: (2-2)用齐次坐标的形式可以表示为: (2-3) 其中(qzhng),是世界(shji)坐标系的坐标(X,Y,Z)是摄像机坐标(zubio)系的坐标,

27、T是世界坐标系原点在摄像机坐标系中的坐标,矩阵R是正交旋转矩阵,矩阵元素满足下式: (2-4) 正交旋转矩阵实际上只有3个独立变量,再加上T的3个变量,一共有6个参数决定了摄像机光轴在世界坐标系中的位置,这6个参数被称为摄像机的外部参数。 (2)摄像机坐标系到成像平面坐标系的变换 摄像机坐标系到成像平面坐标系的变换是一个透视投影变换,由相似三角形关系可以得到下面的关系式: (2-5)用齐次坐标的形式可以表示为: (2-6)其中,(X,Y,Z)是摄像机坐标系的坐标,(x,y)是成像平面坐标系的坐标,f是摄像机的焦距。 (3)成像平面坐标系到图像坐标系的变换 成像平面坐标系到图像坐标系的变换是图像

28、数字化的过程,将像素点的物理坐标变换为图像的像素坐标。设主点在图像坐标系中的坐标为,每一个像素在x轴和y轴方向上的物理尺寸为dx,dy,则图像坐标变换关系可由下式表示: (2-7)用齐次坐标的形式(xngsh)可以表示为: (2-8)其中,(x,y)是成像平面(pngmin)坐标系的坐标(u,v)是图像坐标系的坐标,和为x和y方向的采样频率,即单位长度(chngd)的像素点个数。 将式(2.3)和式(2.6)代入式(2.8)得到图像坐标和世界坐标的变换关系可由下式表示: (2-9) 上面的关系式是在假设图像坐标轴相互垂直的情况下推导出来的,但是通常情况下,两个坐标轴之间并不是严格垂直的,引入倾

29、斜因子s来描述图像坐标轴的倾斜程度。最终得到针孔成像模型的数学表达式如下:(2-10)其中(qzhng),和分别为x和y方向的等效焦距,K称为摄像机的内部(nib)参数矩阵,(R,T)称为摄像机的外部参数矩阵,P称为投影矩阵。2.4摄像机成像模型(mxng)的参数 三维计算机视觉系统从摄像机获得的图像信息出发,计算三维环境物体的位置、形状等几何信息,并由此来识别环境中的物体.图像上每一点的亮度反映了空间物体表面某点反射光的强度,而该点在图像上的位置则与空间物体表面相应点的位置有关.这些位置的相互关系,与摄像机成像的几何模型有关.该几何模型的参数称为摄像机参数.摄像机标定的任务是去求解这些参数.

30、 摄像机参数可以分为内外2种参数.外部参数用来把世界坐标系转换成摄像机坐标系.其最简单的模型是线性模型,由于摄像机可安放在环境中的任何一个位置,可在环境中选择一个基准坐标系来描述摄像机的位置,并用它来描述环境中任何物体的位置,该坐标系称为世界坐标系.摄像机坐标系(x,y,z)与世界坐标系(X,Y,Z)之间的关系可以用旋转矩阵R与平移向量T来描述.矩阵R与向量T被称为摄像机的外部参数.摄像机的内部参数通常包括焦距f,图像中心坐标. 由于图像像素坐标并没有用物理单位表示出该像素在图像中的位置,因此, 需要再建立以物理单位(mm)表示的图像物理坐标系.该坐标系以图像中心坐标为原点,x轴与y轴分别与u

31、,v轴平行。式(2-11)是摄像机成像过程矩阵运算表示方法: (2-11)式中,k表示畸变系数,dx与dy分别(fnbi)表示图像采样时x方向与y方向像素与像素之间的长度,单位为毫米/像素;u0与v0分别表示计算机图像坐标系中图像中心的坐标值;f表示摄像机有效焦距。是旋转(xunzhun)矩阵,是平移(pn y)矩阵。第三章 伪逆算法(sun f) 本实验(shyn)的核心算法就是伪逆算法,通过对三维到二维的成像矩阵,进行伪逆,就可以提取图像的特征点。但进行伪逆,需要应用最小二乘法原理来计算。下面我们将介绍最小二乘法原理。3.1 最小二乘法(chngf)原理最小二乘法是一种数学优化技术,它通过

32、最小化误差的平方和找到一组数据的最佳函数匹配。最小二乘法就是用最简单的方法去求得一些绝对不可知的、真值,从而令误差平方之和为最小。最小二乘法是应用最多的参数估计方法,是从最小二乘法原理出发的其他估计方法的基础,是必须熟练掌握的一种方法。 在已经获得样本观测值(i=1,2,n)的情况下,假设参数估计量已经求得到,为,并且是最合理的参数估计量,那么直线方程 i=1,2,n (3-1)应该能够最好地去拟合样本数据。其中被解释为变量的估计值,它是由参数估计量和解释变量的观测值计算得到的。那么,被解释变量的估计值与观测值应该在总体上最为接近,判断的标准是二者之差的平方和最小。 (3-2)为什么要用平方和

33、?因为二者之差可正可负,简单(jindn)求和可能将很大的误差抵掉,只有平方和才能反映二者在总体上的接近程度。这就是最小二乘原则。那么,就可以从最小二乘原则和样本观测值出发,求得参数估计量。由于(yuy) (3-3)是、的二次函数并且非负,所以其极小值总是存在。根据(gnj)罗彼塔法则,当Q对、的一阶偏导数为0时,Q达到最小。即 (3-4)容易推得特征方程: (3-5)解得: (3-6) 所以(suy)有: (3-7)于是(ysh)得到了符合最小二乘原则的参数估计量。为了减少(jinsho)计算工作量,本实验介绍了采用样本的利差形式的参数估计量的计算公式。由于现在计量经济学计算机软件被普遍采用

34、,计算工作量已经不是什么大问题。但离差形式的计算公式在其他方面也是有应用的,有关公式如下: (3-8)(3-8)的参数估计量可以写成 (3-9)至此,完成了模型估计的第一项任务。下面进行模型估计的第二项任务,即求随机误差项方差的估计量。记为第i个样本观测点的残差,即被解释变量的估计值与观测值之差。则随机误差项方差的估计量为 (3-10)3.2 伪逆矩阵(j zhn)3.2.1 右伪逆矩阵(j zhn) 设A是mn阶矩阵(j zhn),规定:叫右伪逆矩阵。右伪逆矩阵具有逆矩阵的性质: (3-11)3.2.2 左伪逆矩阵 设A是mn阶矩阵,规定:叫左伪逆矩阵。右伪逆矩阵具有逆矩阵的性质: (3-1

35、2)3.3 线性方程组求解 对于n元线性方程组AX=B其解有三种情况;解惟一,有无穷组解,无解.下面应用伪逆矩阵对线性方程组AX=B作进一步的讨论.设方程组有n个变元,A是阶矩阵,B是阶矩阵.(1)有唯一解 当线性方程组AX=B有唯一解时,必有R()()此时方程组的解为;。(2)有无穷组解 当线性方程组AX=B有无穷组解时,必有R(A)=R(AB)n. 一般的,对于线性方程组AX=B,当有无穷组解时,我们要找出最接近(jijn)原点的解,即最小范数解,则他是惟一的。令这个最小范数解为,即满足(mnz)以下条件:AX=B,且对所有满足AX=B的X,有:|X|,这表示(biosh)在X 对应的n维

36、空间中,是所有满足AX=B的解中最靠近远点的。 的构造如下:=。(3)无解 当线性方程组AX=B有无解时,必有R(A)R(AB)。如果方程组无解,我们希望能够找到可以使范数|AX-B|最小化的解。令此解为,即满足以下条件: (3-13) 这里不是传统意义上的解,因为它不满足代数方程组AX=B,因此被称为可使|AX-B|最小化的近似解的构造如下: (3-14)3.4 伪逆算法 在本试验中,图像经已标定的摄像机所得到的成像矩阵为M,它的伪逆矩阵的算法如下: 如果矩阵M是方阵且非奇异,则M的伪逆矩阵(记为)与相等; 如果M不是方阵或M为奇异阵, 则不相等。即有: (3-15) 可以通过最小二乘法得到

37、矩阵的伪逆矩阵,也称之为通过矛盾方程组求解。本文需要求矩阵的伪逆。为了求的伪逆,构造等式: (3-16)式中,表示(biosh)的伪逆,在该式中它是未知数; 表示(biosh)四阶方阵。展开式后,可以得到16个方程, 其中前4个方程如式(3-15)所示, 它是通过的第一行元素(yun s)得到的4个方程: (3-17)为了解这16个方程、12个未知数的方程组,可以通过最小二乘法来求解。首先把这16个方程写成方程矩阵形式,得到: (3-18)式中,是的12个元素写成列向量的行式, 是单位方阵写成列向量的行式, 就是通过上面得到的16个方程的系数矩阵得到的。在式(3-16)左边和右边分别左乘,得到

38、相应的正规方程组,即: (3-19) 再对上述正规方程组进行求解,即可得到的最小二乘伪逆阵。把写成4行、3列形式, 就得到。将上述求解过程合并一下, 就可以得到以下公式: (3-20) 显然式(3-20)满足式(3-15)关于伪逆矩阵的定义,其运算过程也满足矩阵逆的定义。可以证明,这种方法求得的伪逆解,就是最小二乘解。因为对于形如式(3-20)这种AX = b的超定方程组而言,与子空间是正交的,其中为最逼近真解的最近似解,因此可以看成是子空间的法线,所以该解向量到子空间的距离是最短的,即最小二乘原理。 第四章 获取(huq)图像的三维特征点坐标 随着科技不断的发展进步,针对一幅(y f)图片,

39、人们不单单的只去观看了解它的表面,而是想更深入的知道这幅图在真实环境中的立体感觉。一部分科学家正在研究怎样才能更准确,高精度的去获取它的三维信息,让人们更能直观的去认识这幅图片。本实验为大家提供一种比较快速的去获得图像的三维数据的方法。4.1图像(t xin)预处理 在图像的产生、传输和变换过程中,由于多种因素的影响,往往使其与原始景物之间产生某些差异,这种差异称为变劣或退化。图像的退化一般包括对比度较差,边缘模糊、噪声较大等。这些变劣给图像的进一步处理造成了困难和不便。因此,有必要对图像进行恰当的处理,从而改善图像的视觉效果,提高图像成分的清晰度,并且使图像更有利于计算机的处理,便于对图像进

40、行分割,从而提高图像的识别率,这一过程就是图像的预处理。本文利用MATLAB对图像进行预处理,该系统中所用到的算法容易实现,运算量少。 (1)灰度图像的直方图 按照随机过程理论,图像可以看作是一个随机场具有相应的统计特性,其中最重要的特征是灰度密度函数。要精确得到图像的灰度密度函数是比较困难的,实际中用数字图像的直方图来代替。灰度直方图是一个离散函数,它表示数字图像每一灰度级与该灰度级出现频率的对应关系。假设一幅数字图像的象素总数为 N,有L个灰度级,具有第k个灰度级的灰度的像素共有个,则第k个灰度级或者说是出现的频率为: , k=0.1L-1 (4-1) 密度(md)函数p (z)或直方图虽

41、然不能直接反映出图像(t xin)的内容,但对它进行分析可以得出图像的一些有用特征,这些特征能反映出图像的特点。例如,当图像对比度较小时,它的灰度直方图只在灰度轴上较小的一段区间上非零;较暗的图像由于较多的象素灰度值低,因此它的直方图的主体出现在低灰度区间上,其在高灰度区间上的幅度较小或为零;看起来清晰的图像,它的直方图灰度分布较均匀。 (2)直方图均衡化直方图均衡化处理(chl)的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。直方图均衡化就是对灰度图像进行非线性拉伸,重新分配图像的像素值,是一定灰度范围内的像素数量大致相同。直方图均衡化就是把给定

42、图像的直方图分布改变成均匀分布直方图分布。直方图均衡化方法是将一已知灰度概率密度分布图像经过某种变换变成一幅具有均匀灰度概率密度分布的新图像,从而达到增强图像整体对比度的效果,是一种常用的灰度增强的算法。假设一幅图像的像素数为n,共有1个灰度级,代表灰度级为的像素的数目,则第k个灰度级出现的概率可以表示为 (4-2)其中,0,其中k=0,1.,变换函数T(r)为: (4-3) 其中,0,且j=0,1.从上面计算过程可以看出,对原始输入图像直方图的统计值可以算出均衡化各像素的灰度值。采用直方图均衡化后会是灰度分布较密的部分(b fen)被拉伸,灰度分布稀疏的部分被压缩,从而使一幅图像对比度在总体

43、上得到增强。更重要的是,通过图像的直方图,可以确定图像的阈值范围,去除图像以外的像素点,更方便的提取图像的特征点。(3)二值图像(t xin)二值图像是指每个像素不是黑就是白,其灰度值没有中间过渡的图像。二值图像一般用来描述文字或者图形,其优点是占用空间少,缺点是,当表示人物,风景的图像时,二值图像只能描述其轮廓(lnku),不能描述细节。这时候要用更高的灰度级。二值图像是每个像素只有两个可能值的数字图像。人们经常用的黑白、B&W单色图像表示二值图像,但是也可以用来表示每个像素只有一个采样值的任何图像,例如灰度图像等。 二值图像中所有的像素只能从0和1这两个值中取,因此在MATLAB中,二值图

44、像用一个由0和1组成的二维矩阵表示。这两个可取的值分别对应于关闭和打开,关闭表征该像素处于背景,而打开表征该像素处于前景。以这种方式来操作图像可以更容易识别出图像的结构特征。二值图像操作只返回与二值图像的形式或结构有关的信息,如果希望对其他类型的图像进行同样的操作,则首先要将其转换为二进制的图像格式,可以通过调用MATLAB提供的im2bw()来实现。(4)边缘检测 边缘是所要提取目标的分界线,提取出边缘才能将目标和背景区分开来。在图像中,边界表明一个特征区域的终结和另一个特征区域的开始,边界所分开区域的内部特征或属性是一致的,而不同区域内部的特征或属性是不同的。边缘的检测正是利用物体和背景在

45、某种图像特性上的差异来实现的,这些差异包括灰度、颜色或者纹理特征。边缘检测实际上就是检测图像特性发生变化的位置。 由于噪声和模糊的存在,检测到的边界可能会变宽或在某些点出发生间断,因此,边界检测包括两个基本内容:首先抽取出反映灰度变化的边缘点,然后(rnhu)剔除某些边界点或补边界间断点,并将这些边缘连接成完整的线。4.2利用(lyng)伪逆法提取图像的特征点坐标特征提取和选择是对于处理后的数据进行分析、去粗存精的过程。由于原始图像数据量是相当大的,需要把这些数据转换为若干个特征,即为特征提取。为了提高分类处理的速度和精度(jn d),对提取的特征必须选择最有代表性的特征,其信息冗余度最小,而

46、且希望具有比例、旋转、位移不变性。从数学上讲,特征提取相当于把一个物理模式变成一个随机向量,如果抽取和选择了m个特征,则物理模式可用一个m维特征向量描述,表现为m维欧氏空间中的一个点。m维特征向量表示为 近几年来,研究者对特征提取的理论作了较多的探索,力求得出一些针对特定目标的高精度、高效率的特征提取算法与方法。这其中包含PCA方法、Fisher鉴别分析方法,以及以核方法为代表的非线性特征提取方法等。另外,在实际应用中算法的效率也是非常重要的。核方法是新近发展起来的一种非线性特征提取方法,它的理论基础来自于统计学习理论。下面介绍的是以最小二乘法原理为基础,利用伪逆算法来提取图像的特征点坐标的。

47、这一步是式(2-11)的逆过程,可以通过以下公式计算特征点的三维坐标值,该三维坐标值的坐标系取决于前面计算的时用到的R与T,计算公式为: (4-4) 结果(ji gu)分析本次试验的目的是从二维的图像平面感知(gnzh)它的三维立体空间,并提取特征点的三维坐标,得到三维信息。本实验的主要(zhyo)步骤如下:首先要根据摄像机的成像模型, 得到摄像机从三维到二维的成像矩阵。这里要用到摄像机的内参和外参矩阵。其次利用最小二乘原理,计算成像矩阵的伪逆矩阵。然后利用伪逆算法提取图像的特征点。最后获取图像的特征点的三维坐标,获得三维信息。本实验的具体内容如下:首先先输入一幅原图(即灰度图像)如下图1:图

48、 1 原图像(t xin) 图2 原图像的直方图 为了看到图像的分布情况(qngkung),直方图能够反映图像的分布,如上图2,可以从图2中看出该直方图只在灰度轴较小的一段区间上非零,说明该图像的对比度较小;而且其主体出现在低值灰度区间上,说明图像中有较多的象素灰度值低。为了使图像(t xin)清晰,可以对图像进行原图像均化处理,使图像的灰度范围拉开,并且然灰度频率较小的灰度级变大,即让灰度直方图在较大的动态范围内趋于一致,如下图3:图3 原图像均衡化图4 均衡化的直方图从图4可以使图像的细节更加清楚了,而从图像的直方图上也可以看出,在直方图调整之前,低灰度的比例较大,经过直方图调整,各灰度等

49、级的比例更加平衡,从而得到图像的阈值范围。但是由于直方图均衡并没有考虑图像的内容,简单地将图像进行直方图均衡,还需用其它方法对图像进行增强。对图1进行黑白化,白的部分就是就是图像的阈值,如下图5: 图5 二值图像(t xin)对比度增强的图像处理技术是按一定的规则修改输入图像每一个象素灰度,从而改变图像灰度的动态范围。它可以使灰度动态范围扩展(kuzhn),也可以使其压缩,或者对灰度进行分段处理,根据图像特点和要求在某段区间中进行压缩而在另外区间中进行扩展。提取图像的边缘(binyun),如下图6: 图6 边缘提取 图7 边缘检测从上图6可以看出,物体与背景的对比度很强,已能将其边缘提出,提取对比度调整后的图像的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论