《图像检测与处理技术》课件第3章

上传人：1*** IP属地：广东上传时间：2025-09-02 格式：PPT 页数：129 大小：1.82MB 积分：15 举报 版权申诉

已阅读5页，还剩124页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第3章图像检测与处理的数学基础3.1卷积和相关3.2傅里叶变换3.3小波变换3.4灰度级插值与曲线拟合3.5图像间运算3.6图像的空间变换

3.1卷积和相关

卷积又称褶积(运算符为*)，是线性系统的基本运算，表示系统在激励作用下产生的响应。两个一维函数f(x)和g(x)卷积的数学定义为(3.1.1)一维离散序列的卷积定义为(3.1.2)类似地，可以定义二维连续和离散函数的卷积。二维连续函数卷积定义为(3.1.3)二维离散函数卷积定义为(3.1.4)函数卷积满足分配律、结合律及交换律。卷积是一种非常有用的运算，该运算具有线性、平移不变性等重要特性。因为数字图像在图像平面上具有有限的区域，只有当平移量较小时平移不变性才有效，所以卷积常在局部图像中使用。卷积表示线性滤波，线性滤波通常用于局部图像预处理和图像复原。相关(运算符为)表示两函数之间的相互关联程度，两个一维连续函数f(x)和g(x)相关的数学定义为(3.1.5)式中，f*(x)为函数f(x)的共轭函数，当f(x)为实函数时，f*(x)=f(x)。当g(x)=f(x)时，式(3.1.5)为自相关；当g(x)≠f(x)时，式(3.1.5)为互相关。一维离散序列f(n)和g(n)(均为实序列)的相关定义为(3.1.6)类似地，二维离散函数的相关定义为(3.1.7)函数相关满足分配律，但不满足结合律和交换律。

3.2傅里叶变换

3.2.1一维傅里叶变换

傅里叶变换可以将信号从时间域变换到频率域，得到信号的频率分布信息。

一维傅里叶变换的定义为(3.2.1)一维傅里叶反变换(或称逆变换)的定义为(3.2.2)根据尤拉公式exp[－j2πux]=cos(2πux)－jsin(2πux)，傅里叶变换系数可以写成下式的复数和极坐标形式：根据尤拉公式exp[－j2πux]=cos(2πux)－jsin(2πux)，傅里叶变换系数可以写成下式的复数和极坐标形式：(3.2.3)其中，傅里叶谱(幅值函数)为，相角为，能量谱为。3.2.2二维傅里叶变换

通过一维傅里叶变换，可以很容易推广到二维图像信号的傅里叶变换。如果二维信号f(x，y)是连续和可积的，则有

(3.2.4)其逆变换为(3.2.5)式中，u、v为频率分量。二维函数的傅里叶谱:二维函数的傅里叶变换的相角:二维函数的傅里叶变换的能量谱:3.2.3离散傅里叶变换

因为计算机只能处理离散数据，所以连续傅里叶变换在计算机上是无法实现的。为了能够在计算机上实现傅里叶变换，必须把连续函数离散化，同时还要将无限长数据序列进行截断处理。将连续傅里叶变换转化为离散傅里叶变换，即所谓的DFT运算，就是将f(x)和F(u)的有效宽度同样等分为N个小间隔，对连续傅里叶变换进行近似的数值计算，这样得到离散的傅里叶变换(DFT)定义。

一维离散傅里叶正变换定义为(3.2.6)一维离散傅里叶逆变换定义为(3.2.7)对于M×N的图像f(m，n)的二维离散傅里叶变换和逆变换分别定义为(3.2.8)(3.2.9)二维傅里叶变换具有可分离性，除此之外，其它的性质与一维傅里叶变换的性质基本相同。3.2.4快速傅里叶变换

快速傅里叶变换(FFT)是离散傅里叶变换(DFT)的快速算法，原则上，根据式(3.2.6)和式(3.2.7)就可利用数字计算机对一离散系统进行傅里叶分析，然而，情况并非如此。在DFT的有关理论提出后的很长一段时间里，DFT一直未能得到广泛的应用。究其原因，主要是由于DFT的计算量非常庞大，从而限制了DFT的应用。我们知道，计算一个N点的DFT，一般需要N2次复数乘法和N(N-1)次复数加法运算。因此，当N较大或要求对信号进行实时处理时，往往难以实现所需的运算速度。为此，需要研究DFT的快速算法，这就是所谓的快速傅里叶变换(FFT)。令权函数WN=exp[－j2π/N]，很容易将式(3.2.6)和式(3.2.7)改写为(3.2.10)(3.2.11)进行快速傅里叶变换，其实质就是利用权函数WknN的对称性和周期性，把N点DFT进行一系列分解和组合，使整个DFT的计算过程变成一系列迭代运算过程。

3.3小波变换

3.3.1连续小波变换

连续小波变换，也称为积分小波变换，是由Grossman和Morlet引入的。其定义为：若

(R)(L2(R)表示平方可积的实数空间，即能量有限的信号空间)是一个实值函数且它的频谱满足允许条件

(3.3.1)则ψ(t)被称做一个基小波或母小波(MotherWavelet)。将母小波ψ(t)经伸缩和平移后，就可以得到一个小波序列(3.3.2)在小波变换中，由尺度概念来代替原来傅里叶变换中的频率概念，大尺度对应于缩小信号，而小尺度对应于放大信号。对于任意函数f(t)∈L2(R)的连续小波变换定义为

(3.3.3)其重构公式(逆变换)定义为(3.3.4)由于基小波ψ(t)生成的小波序列ψa，b(t)在小波变换中对分析信号起着观测窗的作用,因此还应该满足一般函数的约束条件(3.3.5)故是一个连续函数，这意味着，为了满足完全重构条件式(3.3.1)，在原点必须等于0，即(3.3.6)为了使信号重构的实现在数值上是稳定的，除了完全重构条件外，还要求基小波ψ(t)的傅里叶变换满足下面的稳定性条件(3.3.7)式中0＜A≤B＜∞。3.3.2离散小波变换

在实际应用中，尤其是在计算机上实现时，连续小波必须加以离散化。因此，有必要讨论连续小波ψa，b(t)和连续小波变换Wf(a，b)的离散化。需要强调指出的是，这一离散化都是针对连续尺度参数a和连续平移参数b的，而不是针对时间变量t的。

通常，把连续小波变换中尺度参数a和平移参数b的离散化公式分别取作a=aj0，b=kaj0b0，这里j∈Z，扩展步长a0(a0≠1)是固定值，为方便起见，总是假定a0>1，所对应的离散小波函数ψj，k(t)即可定义为

(3.3.8)而离散化小波变换系数则可表示为(3.3.9)其重构公式定义为(3.3.10)其中C是一个与信号无关的常数。小波变换系数Cj,k同样要求满足条件(3.3.11)为了使小波变换具有可变化的时间和频率的分辨率，适应待分析信号的非平稳性，我们很自然地需要改变a和b的大小，以使小波变换具有“变焦距”的功能。在实际应用中我们采用的是动态的采样网格，最常用的是二进制的动态采样网格，即a0＝2，b0＝1，每个网格点对应的尺度为2j，而平移为2jk。由此得到的小波为(3.3.12)式(3.3.12)被称为二进小波(DyadicWavelet)。二进小波对信号的分析具有变焦距的作用。假定有一放大倍数2－j，它对应为观测到信号的某部分内容。设ψj，k(t)∈L2(R)，如果存在两个常数A、B，且0＜A≤B＜∞使得稳定性条件几乎处处成立，即(3.3.13)则ψj，k(t)为一个二进小波。若A=B，则称为最稳定条件。而函数序列叫做f的二进小波变换，其中(3.3.14)对式(3.3.14)做相应的逆变换为(3.3.15)3.3.3小波多尺度分解与重构

1.理想滤波器组的引入

当信号的采样率满足采样定理要求时，归一化频带必将限制在-π~π之间。此时可分别用理想低通滤波器H0与理想高通滤波器H1将它分解成(对正频率部分而言)频带在0~π/2之间的低频部分和频带在π/2~π之间的高频部分，分别反映信号的概貌与细节，如图3-1所示。处理后两路输出必定正交(因为频带不交叠)，而且由于两种输出的带宽均减半，因此采样率可以减半而不致引起信息的丢失(带通信号的采样率决定于其带宽，而不是决定于其频率上限)。这就是图3-1在滤波后引入“二抽取”环节(图3-1中用符号↓2表示)的理由。所谓二抽取，就是将输入序列每隔一个样本输出一次(例如只取偶数)，组成长度缩短一半的新序列。图3-1频带的理想剖分类似的过程对每次分解后的低频部分可再重复进行下去，如图3-2(a)所示，即每一级分解把该级输入信号分解成一个低频的粗略逼近(概貌)和一个高频的细节部分，而且每级输出采样率都可以再减半，这样就将原始x(n)进行了多分辨率分解。

1)频率空间的剖分

如果把原始x(n)占据的总频带(0~π)定义为空间V0，经第一级分解后V0被剖分成两个子空间：低频的V1(频带0~π/2)和高频的W1(频带π/2~π)。经第二级分解后V1又被剖分成低频的V2(频带0~π/4)和高频的W2(频带π/4~π/2)……，如图3-2(b)所示。这种子空间剖分过程可以记为(3.3.16)其中，Wj是反映Vj－1空间信号细节的高频子空间，Vj是反映Vj－1空间信号概貌的低频子空间。图3-2频带的逐级剖分

2)各带通空间Wj的恒Q性

由图3-2(b)易见，W1空间的中心频率为3π/4，带宽为π/2；W2空间的中心频率为3π/8，带宽为π/4，其中心频率和带宽均较W1减半。可见各Wj的品质因数Q是相同的。

3)各级滤波器的一致性

各级的低通滤波器H0和高通滤波器H1是一样的。这是因为前一级输出被二抽取，而滤波器设计是根据归一频率进行的。例如，第一级H0的真实频带是0~π/(2Ts)(Ts是输入的采样间隔)，其归一频率则是0~π/2(注：归一频率＝真实频率×采样间隔)。第二级H0的真实频带虽是0~π/(4Ts)，但归一频率却仍是0~π/2，因为第二级输入的采样间隔是2Ts。

那么这种树形分解有什么优点?可以分析一下，如果直接按传统滤波器做多频道分解，则各带通滤波器显然不会相同，因而设计和编程的工作量都较大；而树形分解中各级滤波器是一样的，其计算量较小。如果图3-2(a)中第一级的计算量是C0(C0≈2×滤波器阶次×总样本数)，而以后各级由于样本数目减半而计算量也减半，则总计算量为

传统滤波的总计算量约为分辨率级数与C0/2的乘积，其计算量与分辨率级数成正比。更重要的是：树形分解适应“由粗及精”的多分辨率分析过程。不过，树形结构也有缺点：分辨率级数愈多，输出的延迟便愈长。

信号经分解后可以加以传送，然后在接收端进行重建。重建是分解的逆过程。每一支路首先进行“二插值”(即在输入序列每两个相邻样本之间补一个零，使数据长度增加一倍)，从而恢复二抽取前序列的长度。然后进行相应的低通或带通滤波，使补零后的波形平滑，也就是去掉补零后引起的镜像谱。从时域上看，理想滤波就是把各样本值乘以插值函数(sinc函数)后，再移位求和，以恢复原信号。这样，在逐级重建的过程中就实现了对信号由粗及精的观察。

3.4灰度级插值与曲线拟合

几何运算的要求之一是进行灰度值插值。在输入图像f(x，y)中，灰度值仅在整数位置(x，y)处被定义。然而，变换处理所得的新图像g(x，y)的灰度值一般由处在非整数坐标上的f(x，y)的值来决定。因此，如果把几何运算看成是一个从f到g的映射，则f中的一个像素会映射到g中几个像素之间的位置，反之亦然；同时，这种映射变换也存在着新图像的某些像素点与原图像的像素点无对应的情况，即所谓的空穴，对空穴应该进行填充处理。有关空穴的填充问题，可以采用插值的方法来解决，所谓插值方法，是指在判定为空穴的位置上填充一个估计的值。估计值的选择不同，所得到的方法的复杂度以及图像的效果也不同。3.4.1最近邻插值

最简单的插值方法是所谓零阶插值或称为最近邻插值，即令输出像素的灰度值等于离它所映射到的位置最近的输入像素的灰度值。最近邻插值的计算十分简单，在许多情况下，其结果也比较容易接受。但校正后的图像有明显锯齿状，即存在灰度不连续性，也就是说，当图像中包含像素之间灰度级有变化的细微结构时，最近邻插值法会在图像中产生人工的痕迹。如图3-3所示为一个用最近邻插值法旋转图像的例子，从中可看出结果图像带有锯齿形的边。图3-3用最近邻插值法旋转图像在旋转图像时，因为图像的坐标值只能是正整数，而根据旋转公式计算出来的值会出现小数，所以还需要进行后续相关的处理：①对计算得到的坐标值进行取整；②根据取整后的坐标值的范围进行画布扩大；③中间点的像素的周围只有八个像素，它们之间的最小间隔角度为45°，因此，如果旋转角度任意设定，则一定会出现最终实现的旋转角度在像素级别上存在角度偏差；另外，像素点坐标取整之后会出现归并现象，即可能有多个原图像的像素点同时旋转变换到新图像中的同一个像素点的位置上，这样，就出现了在旋转变换后的新图像中有些像素点上有若干个原图像像素点叠加，或者位置排列破坏了原有的相邻关系，而另外有些点则无对应的原图像像素点可填，由此会在旋转变换后的图像中出现空穴，这样就需要将出现的空穴进行填充。例如，对原图像逆时针旋转30°后，得到新图像为(3.4.1)按最近邻插值法，就是将判断为空穴位置上的像素值用其相邻行(或列)的像素值来填充。在新图像G中，空穴像素点为(2，3)，对其用邻近行插值(即以(2，2)点的像素值填充)或邻近列插值(即以(1，3)点的像素值填充)的结果为或显然这种插值方法具有简单的优点，但这种插值方法毕竟只用到了该空穴周围像素中的一个。为了使插值处理后的画面效果更加自然，可以采用下面的均值插值方法。3.4.2均值插值

均值插值法是将空穴像素周围像素均值作为填充值填在该空穴中，例如：对式(3.4.1)做均值插值，由于其空穴像素点(2，3)的周围(上、下、左、右)像素值为f13、f22、f12、f23，所以该点的像素值为g23=(f13+f22+f12+f23)/4，即新图像为这样可使图像画面效果的劣化被大大减弱。3.4.3双线性插值

双线性插值法(或称一阶插值)和最近邻插值法相比可产生更令人满意的效果，只是程序稍复杂一些，运行时间稍长些。

双线性差值法是利用待求像素四个相邻像素的灰度在两个方向上作线性内插，如图3-4所示。由于通过四点确定一个平面是一个过约束问题，因此在一个矩形栅格上进行的一阶插值就需要用到双线性函数。

令f(x，y)为两个变量的函数，其在单位正方形顶点的值已知。假设我们希望通过插值得到正方形内任意点的f(x，y)值，则可由双线性方程

f(x，y)=ax+by+cxy+d

(3.4.2)图3-4双线性插值原理来定义的一个双曲抛物面与四个已知点拟合。

从a到d这四个系数必须由已知的四个顶点的f(x，y)值来选定。有一个简单的算法可产生一个双线性插值函数，并使之与四个顶点的f(x，y)值拟合。

首先，对f(x，0)，由于f(0，0)到f(1，0)的灰度变化为线性关系，因此进行线性插值得

f(x，0)=f(0，0)+x·[f(1，0)－f(0，0)]

(3.4.3)

类似地，对f(x，1)，由线性插值得

f(x，1)=f(0，1)+x·[f(1，1)－f(0，1)]

(3.4.4)

最后，我们做垂直方向的线性插值，以确定

f(x，y)=f(x，0)+y·[f(x，1)－f(x，0)]

(3.4.5)将等式(3.4.3)、(3.4.4)代入式(3.4.5)，展开等式并合并同类项可得(3.4.6)式(3.4.6)在形式上类似于式(3.4.2)，因此是双线性的。通过验证可知，应用式(3.4.6)确实满足已知的单位正方形四个顶点的f(x，y)值。双线性插值可直接通过式(3.4.6)来实现，也可通过式(3.4.3)、(3.4.4)、(3.4.5)这三个线性插值方程联立来完成。因为式(3.4.6)需用到四次乘法、八次加(或减)法运算，而第二种方法只需要三次乘法和六次(减)法，所以几何变换程序一般选择后者。

应当注意的是，当使用双线性等式对相邻的四个像素进行插值时，所得表面在邻域边界处是吻合的，但斜率却不吻合，即一个由分段双线性插值产生的表面是连续的，但其导数在邻域边界处通常是不连续的。

双线性内插法的计算比最近邻插值法复杂些，计算量较大，但克服了灰度不连续性的缺点，结果能令人满意；另外，它具有低通滤波性质，使高频分量受损，图像轮廓有些模糊。3.4.4最小二乘法拟合

用j(x)拟合n对数据(xk，yk)(k=1，2，…，n)，使得误差平方和最小，这种求j(x)的方法称为最小二乘法。

1.直线拟合若y=j(x)=a0+a1x，且a0，a1满足方程组(3.4.7)由此可求出线性方程的拟合系数a0和a1。

2.二次多项式拟合

若y=j(x)=a0+a1x+a2x2，且a0，a1，a2满足方程组(3.4.8)由此可求出线性方程的拟合系数a0、a1和a2。

3.椭圆拟合

在许多类型的图像中，所关注的物体往往是圆形，或至少是椭圆形。因此，根据一组边界点来拟合一个具有任意大小、形状和走向的椭圆是很有价值的。

二次曲线的一般方程为

ax2+bxy+cy2+dx+ey+f=0

(3.4.9)

如果式(3.4.9)满足条件b2－4ac<0，则它可以代表一个椭圆。

一个椭圆由五个参数确定：中心的x，y坐标，长半轴和短半轴的长度，其主轴和水平轴的夹角。通过将五个点的坐标代入方程(3.4.9)中，可以求出五个方程联立的方程组的解，以此来拟合一个椭圆。也可通过计算一系列通过五个点的椭圆并取其参数平均值(或取中值)的方法，获得一个最佳拟合。可以令a＝1来对方程(3.4.9)进行归一化，进而写出均方误差和(3.4.10)如果在式(3.4.10)中分别对系数b，c，d，e和f取偏导，并令其为0，则可得到五个由xi和yi的平方项以及它们的乘积所组成的方程，进而解出这些系数。3.4.5B样条函数

一类分段(片)光滑并且在各段交接处也有一定光滑性的函数，简称样条。样条一词来源于工程绘图人员为了将一些指定点连接成一条光滑曲线所使用的工具，即富有弹性的细木条或薄钢条，由这样的样条形成的曲线在连接点处具有连续的坡度与曲率。

分段低幂次多项式、在分段处具有一定光滑性的函数插值就是模拟以上原理发展起来的，它克服了高次多项式插值可能出现的振荡现象，具有较好的数值稳定性和收敛性，由这种插值过程产生的函数就是多项式样条函数。样条函数的研究始于20世纪中叶，到了20世纪60年代，它与计算机辅助设计相结合，在外形设计方面得到成功的应用。样条理论已成为函数逼近的有力工具，其应用范围也在不断扩大，不仅在数据处理、数值微分、数值积分、微分方程和积分方程数值解等数学领域有广泛的应用，而且与最优控制、变分问题、统计学、计算几何与泛函分析等学科均有密切的联系。

在图形学中，使用分段多项式插值来得到平滑曲线的表示方法是十分普遍的。B样条是分段多项式曲线，其形状与它的控制多边形紧密相关——曲线的控制多边形表示由一个顶点的链给出。三次B样条是最常见的，因为这种样条是包含曲率变化的最低阶次。样条有非常好的表示特性并且容易计算，首先，它们的形状改变要小于其控制多边形，并且它们不会像很多其它表示方法那样在采样点间振荡。此外，对于n次B样条，样条曲线总是位于n+1个顶点的多边形内，见图3-5。其次，插值在特性上是局部的。如果一个控制多边形的顶点改变了它的位置，所引起的样条曲线的变化仅仅在那个顶点的一个小的邻域内发生。最后，把由样条表示的区域边界与图像数据相匹配的方法称做是基于对原始图像数据的直接搜索，这些方法类似于图像分割的方法，样条的方向可以直接从它的参数中得出。图3-5n次样条，(a)~(c)为n次B样条的n+1个顶点的多边形，(d)为3次样条三次样条插值函数用分点a=x0<x1<…<xn=b将区间[a，b]分成n个子区间[xk，xk+1](k=0，1，…，n－1)，构造三次样条函数S(x)，且S(x)满足：①在区间[a，b]上有二阶连续导数；②S(xk)=yk(k=0，1，…，n)；③在子区间[xk，xk+1]上是三次多项式。三次样条插值函数为(3.4.11)其中mk=S″(xk)，hk=xk+1－xk(k=0，1，…，n)，m0，m1，…，mn满足的方程组是(3.4.12)其中

k=1，2，…，n－1

(1)当已知S′(x0)=y0′，S′(xn)=yn″时，式(3.4.12)中，μ0=1，λn=1，

(2)当已知S″(x0)=y0″=m0，S″(xn)=yn″=mn时，式(3.4.12)化为

样条生成的曲线通常是令人满意的。它提供了一个好的曲线近似方法，在图像分析的曲线表示问题中也很容易使用。样条因复杂度的差异而不同，最简单的是将B样条用于曲线建模和从图像数据中抽取曲线。在计算机视觉中的基于模型的分割和复杂的图像理解任务中，可以使用样条来形成必要的精确而灵活的复杂形状的内部模型表示；而另一方面，样条对于尺度的变化非常敏感。

3.5图像间运算

图像间的算术运算也是一类有意义的增强技术，主要包括相加、相减和乘除等运算。在运算之前，图像之间需要配准。

1.加运算

若A(x，y)和B(x，y)为输入图像，则两幅图像的加法运算式定义为

C(x，y)=A(x，y)+B(x，y)

(3.5.1)

C(x，y)为输出图像，它是A(x，y)和B(x，y)两幅图像内容叠加的结果。图像相加的一个重要应用是对所获取的同一场景的多幅图像求平均，常常用来有效地削弱图像的加性随机噪声。def

2.减运算

两图像A(x，y)和B(x，y)相减运算产生的图像C(x，y)定义为

C(x，y)=A(x，y)－B(x，y)+b

(3.5.2)

式中，b的选取应使C(x，y)≥0。

图像的减运算又称为减影技术，是指对同一景物在不同时间拍摄的图像或同一景物在不同波段的图像进行相减。差值图像提供了图像间的差异信息，能用以指导动态监测、运动目标检测和跟踪、图像背景消除及目标识别等工作。def相减运算的目的主要是为了消除无用的且两图像都共有的图像内容。例如在医学上，普通的X光照像是看不到血管的，为了能看到血管的影像，需在血管中注射含碘成分的药水，这种药水能吸收X射线，这时得到的X光片便可看到血管，但由于机体组织的遮挡，不易看清。若在注射药水前后各摄一张X光片，然后两图相减，两图共有的部分——肌体的组织被消掉了，仅留下血管的影像。利用减影技术消除图像背景相当成功地应用在医学上，如在血管造影技术中肾动脉造影术采用减影技术对诊断肾脏疾病就有独特效果。第二个目的是运动检测，若场景中含有运动的物体，对此场景每隔一定时间摄取一幅图像，在所得的图像序列中，相邻两图相减，则静止不动的背景被消掉了，留下的仅是运动的物体。在动态监测时，用差值图像可以发现森林火灾、洪水泛滥及监测灾情变化、估计损失，也能用于监测河口、河岸的泥沙淤积及江河、湖泊、海岸等的污染情况。

在遥感图像处理中，多光谱图像相减的目的是提升它们之间反射率的差异，从而突出这些图像某些部分的差别，因为多光谱图像相减后所得的差值代表了频谱反射率曲线的斜率。

还有一个目的是去掉任何未知但共有的灰度偏置量。

图像作相减运算时必须使两相减图像的相应像素对应于空间同一目标点，否则必须先进行图像空间配准。

3.乘运算

两图像A(x，y)和B(x，y)相乘运算产生的图像C(x，y)定义为

C(x，y)=A(x，y)·B(x，y)

(3.5.3)

在图像上应用算子，可以看做是两图像的一系列相乘运算。

乘运算可用来遮掉图像的某些部分。例如使用一掩模图像(对需要被完整保留下来的区域，掩模图像上的值为1，而对被抑制掉的区域则值为0)与图像相乘，可抹去图像的某些部分，即使该部分值为0。

4.除运算

两图像A(x，y)和B(x，y)相除运算产生的图像C(x，y)定义为

图像的相除又称比值处理,是遥感图像处理中常用的方法。

除运算主要应用于遥感图像处理中，它可以产生的增强效果如下：

①消减照射因素。对于多光谱图像照射因素i(x，y)的分布情况几乎是相同的，当两图像相除时照射分量被消掉。在反射因素中，抑制了由于地形起伏造成的亮度变化，而突出了由地貌地矿等因素引起的反射作用的差异。(3.5.4)②处理后可使不同的地物、地貌、地矿图像区域均值差别加大，而方差变小。

③可以突出某些地物、地貌、地矿，削弱其它的对象。

图像的亮度可理解为照射分量和反射分量的相除。对多光谱图像而言，各波段图像的照射分量几乎相同，对它们做比值处理，就能把它们去掉；而对反映地物细节的反射分量，经比值后能把差异扩大，有利于地物的识别。例如，有些地物在单波段图像内的亮度差异极小，用常规方法难以区分它们，像水和沙滩，在第四波段和第七波段上的亮度非常接近，如表3.1所示，判读容易混淆。但如果把两波段图像相除，其比值的差异变大，就很容易将它们区分开来。比值处理还能用于消除山影、云影及现实隐伏结构。表3.2是4、5波段阴影干扰在影像上的亮度及比值结果。

3.6图像的空间变换

3.6.1位置变换

图像的基本位置变换主要包括图像的平移、镜像及旋转。

1.平移

平移(Translation)变换是几何变换中最简单的一种，就是将图像中的像素点按照要求的量进行垂直、水平移动。一般而言，图像的平移处理，只是改变了原有景物在画面上的位置，而图像的内容不发生变化。如图3-6所示，初始坐标为(x0，y0)的点经过平移(tx，ty)(以向右、向下为正方向)后，坐标变为(x1，y1)，这两点之间的关系是

(3.6.1)以矩阵的形式表示为(3.6.2)其逆变换为(3.6.3)图3-6平移的示意图有时式(3.6.3)尤为重要，这是因为：我们想知道的是平移后图像中每个像素的颜色。例如，新图中左上角点的RGB值是多少？很显然，该点是原图的某点经过平移后得到的，这两点的颜色肯定是一样的，所以只要知道了原图中该点的RGB值即可。那么到底新图中的左上角点对应原图中的哪一点呢？将左上角点的坐标(0，0)代入公式(3.6.3)，得到x0=－tx，y0=－ty，即新图中(0，0)点的颜色和原图中(－tx，－ty)点的颜色是一样的。值得注意的是，一个数字图像(灰度图)是以一个矩阵来描述的，如果新图中有一点(x1，y1)，按照公式(3.6.3)得到的(x0，y0)不在原图中，那么通常把该点的RGB值统一设成(0，0，0)或者(255，255，255)，这时图像不放大，移出的部分被截断。如图3-7(a)所示为原图，图3-7(b)为移动后的图(不放大，移出部分被截断)，这种处理，文件大小不会改变，但存在信息丢失的问题。为解决这一问题，通常采用的做法是：首先根据处理后图像信息不丢失的原则，将存放处理后图像的矩阵扩大，这种处理又称做画布扩大；其次将图像放大，使得能够显示出所有部分，如图3-7(c)所示，经过这种处理后，文件大小会发生改变，设原图的宽和高分别是w1和h1，则新图的宽和高变为w1+|tx|和h1+|ty|，加绝对值符号是因为tx和ty有可能为负。图3-7图像平移变换示例用矩阵可以描述为其中，F为原图像矩阵，G1为移动后的图像(不放大，移出部分被截断)矩阵，G2为移动后的图像(放大，移出部分未被截断)矩阵。

2.镜像

图像的镜像变换分为水平镜像和垂直镜像两种。水平镜像操作是以图像的垂直中轴线为中心交换图像的左右两个部分；而垂直镜像是以图像的水平中轴线为中心交换图像的上下两个部分。图3-8(a)的水平镜像和垂直镜像分别如图3-8(b)和图3-8(c)所示。

镜像的变换矩阵很简单。设原图宽为w，高为h，变换后，图的宽和高不变。

水平镜像的变化矩阵为

(3.6.4)图3-8图像的镜像变换示例垂直镜像的变化矩阵为(3.6.5)图3.8的变换示例可以用下面的矩阵表达式来描述：其中，F为原图像矩阵，M1为水平镜像矩阵，M2为垂直镜像矩阵。

3.图像的旋转

1)直角坐标系中的图像旋转

旋转(Rotation)有一个绕着哪一点转的问题，通常的做法是以图像的中心为圆心来旋转。如图3-9(b)所示的图像为旋转后的图像，原图为图3-9(a)所示的图像，可以看出，旋转后的图像变小了。另一种做法是不让图像变小，旋转后溢出的部分被裁剪掉，如图3-9(c)所示。

这里不考虑裁剪问题，给出旋转变换矩阵。在图3-10中，欲将直角坐标系中的点(x0，y0)顺时针旋转α角后至(x1，y1)。其中，r为该点到原点的距离，在旋转过程中，r保持不变；β为(x0，y0)和圆点的连线与x轴之间的夹角。图3-9图像的旋转变换示例图3-10坐标旋转旋转前旋转α角度后以矩阵的形式表示为

2)极坐标变换方法

极坐标变换，是指将原图像的像素点的坐标在极坐标系中表示并进行旋转变换的方法。这样，就可以将直角坐标系中的旋转处理转换成极坐标系中的平移处理。在极坐标系中进行平移之后，再进行极坐标逆变换就可以得到旋转图像。

直角坐标系到极坐标系的正、逆变换公式如下：正变换：(3.6.7)逆变换：(3.6.8)可以用一个简单的例子来说明这种方法。设原图矩阵为

其行、列坐标分别为若要进行30°的旋转，则按式(3.6.7)进行极坐标变换后得到原图的极坐标表达式：当旋转30°时，相当于θ′=θ+30°，ρ′=ρ，即由式(3.6.8)得旋转后的坐标为这个结果与用直角坐标系进行旋转的结果一致。极坐标变换方法，在图像配准中需要多次探测性旋转以判断图像配准角度的场合下使用非常方便。

3)反变换法

所谓反变换方法，就是从新图像的像素坐标反过来求对应的原图像像素点的坐标，即式(3.6.6)改写为(3.6.9)在反变换法中，需要考虑画布的边长问题，以保证图像在旋转后不丢失信息。3.6.2形状变换

1.图像缩小

图像的缩小从物理意义上来说，是将描述图像的每个像素的物理尺寸缩小相应的倍数就可以完成。但如果像素的物理尺寸不允许改变，从数码技术的角度来看，图像的缩小实际上就是通过减少像素个数来实现的。既然图像的缩小是通过减少像素个数来实现，那么就需要根据所期望缩小的尺寸数据，从原图像中选择合适的像素点，使图像缩小之后可以尽量保持原有图像的概貌特征不丢失。

图像的缩小分为按比例缩小和不按比例缩小两种方式。按比例缩小就是将图像的长和宽按照同样的比例缩小。不按比例缩小则是指当图像缩小时，长和宽的缩小比例不同。如图3-11所示是一个图像缩小的示例。图3-11图像的缩小

1)基于等间隔采样的图像缩小方法

这种图像缩小方法的设计思想是，通过对画面像素的均匀采样来保证所选择到的像素仍旧可以保持图像的概貌特征。该方法的具体实现步骤如下：

①计算采样间隔：设原图大小为M×N，将其缩小为M·k1×N·k2，(k1=k2时为按比例缩小，k1≠k2时为不按比例缩小，k1<1，k2<1)，则采样间隔为(3.6.10)②求出缩小的图像:设原图为F(i，j)(i=1，2，…，M；j=1，2，…，N)，缩小后的图像为G(i,j)(i=1,2,…,k1·M；j=1,2,…,k2·N)，则有

g(i，j)=f(i·Δi，j·Δj)

(3.6.11)

下面从一个简单的例子来说明图像的缩小过程。设原图像矩阵(4×6)为将其进行缩小，缩小的倍数为k1=0.7，k2=0.6，则缩小图像的大小为3×4。

根据式(3.6.10)计算得到Δi=1/0.7=1.4，Δj=1/0.6=1.7，根据式(3.6.11)得到缩小后的图像为

2)基于局部均值的图像缩小方法

从前面的缩小算法可以看到，算法的实现非常简单，但是采用上面的方法对没有被选取到的点的信息就无法反映在缩小后的图像中。为了解决这个问题，可以采用基于局部均值的方法来实现图像的缩小。该方法的具体实现步骤如下：

①计算采样间隔：同上面的方法，用式(3.6.10)得到Δi，Δj。

②求出局部子块：这里的局部子块是指相邻两个采样点之间所包含的原图像的子块，即为

(3.6.12)求出缩小的图像g(i，j)=F(i，j)的均值。同上面的例子，原图像仍为4×6的矩阵F，缩小倍数仍为k1=0.7，k2=0.6，则缩小后的图像大小为3×4。根据式(3.6.10)计算得到Δi=1/0.7=1.4，Δj=1/0.6=1.7。

根据式(3.6.12)，可以将F分块为(3.6.13)再由式(3.6.13)得到缩小的图像为

其中g(i，j)为加上各子块的均值，例如：下面以一个简单的例子来说明这两种图像缩小方法。假设若要将其缩小为3×4的图像，则按照以上两种方法得到缩小的图像分别为

2.图像的放大

图像的放大，从物理含义上来讲是指图像缩小的逆操作。但是从信息处理的角度来看，则含义完全不一样。图像缩小是从大数据量到小数据量的处理过程，因此只需要从多个数据中，以适当的方式选出所需要的信息就可以完成；而图像放大则是从小数据量到大数据量的处理过程，因此需要对许多未知的数据进行估计。

因为图像中相邻像素之间的相关性很强，所以可以利用这个相关性来实现图像的放大。与图像缩小相类似，图像的放大也可分为按比例放大和不按比例放大两种方式，如图3-12所示，按比例放大不会引起图像的畸变，而不按比例放大则会产生图像的畸变。图3-12图像的放大

1)基于像素放大原理的图像放大方法

如图3-13所示是该方法的原理示意图。如果一幅图像要放大k1×k2倍(即行放大k1倍，列放大k2倍，k1>1，k2>1)，则将图像中的每个像素复制到由k1×k2个像素所构成的子块中，这些子块再按照原来像素的排列顺序进行排列，进而可以构成放大后的图像。从图像上看，因为一个像素放大成一个k1×k2的子块，相当于像素放大了k1×k2倍，所以称这种方法为基于像素放大原理的图像放大方法。图3-13基于像素放大原理的图像放大如图3-13所示的是对图像的行和列均放大整数倍时的方法。如果k1和k2不是整数，设原图为F，放大图为G，则可按照式(3.6.14)进行放大。

g(i，j)＝f(c1·i，c2·j)

(3.6.14)

其中，c1=1/k1，c2=1/k2。

下面从一个简单的例子来说明基于像素放大原理的图像放大方法。设原图为若将其放大1.2×2.5倍，则放大后的图像为G=|gij|4×8且

2)基于双线性插值的图像放大方法

双线性插值图像放大，不是将原图像的像素复制到整个子块，而是只填写在子块的某一个像素的位置上。例如，在最上(下)面一行的子块中，将原图像中相应的像素放在放大图像子块的最上(下)面的位置上；在最右(左)边的子块中，将原图像中相应的像素放在放大图像子块的最右(左)边的位置上；在其它子块中，原图像中相应的像素放在放大图像子块中的左上角的位置上，对其进行归一化处理后，子块四个顶点分别设为(0，0)、(0，1)、(1，0)、(1，1)，相应的待处理像素的坐标为(x,y)，且0<x<1，0<y<1，则可由式(3.6.15)得到插值像素f(x,y)

(3.6.15)如果x=1，或者y=1，则进行单线性插值计算，即分别为

(3.6.16)下面以一个简单的例子来说明以上两种方法的不同。设原图为若将其放大1.2×2.5倍，则放大后的图像为G=|gij|4×8，按照式(3.6.14)像素放大方法得到的结果为按照双线性插值法，首先进行定点填充，得之后按照式(3.6.15)进行双线性插值计算，得第三行再进行一次线性插值，得显然，从数据上观察可知，采用双线性插值的方法可以平缓像素块之间的过渡，从而达到使画面效果更加自然的目的。

3.图像的错切

图像的错切变换实际上是平面景物在投影平面上的非垂直投影。错切使图像中的图形产生扭变，这种扭变只在一个方向上产生，即分别称为水平方向上的错切或垂直方向上的错切。

1)沿水平方向的错切

按照上面的错切定义，在水平方向上的错切是指图形在水平方向上发生了扭变。如图3-14所示，当原图3-14(a)发生了水平方向的错切之后，图3-14(b)中矩形的水平方向上的边扭变成斜边，而垂直方向上的边保持不变。

图像在水平方向上错切的数学表达式为

(3.6.17)图3-14水平错切

2)沿垂直方向的错切

图像在垂直方向上的错切，是指图形在垂直方向上的扭变。如图3-15所示，当原图3-15(a)发生了垂直方向的错切之后，图3-15(b)中矩形的水平方向上的边保持不变，而垂直方向上的边扭变成斜边。

图像在垂直方向上错切的数学表达式为(3.6.18)其中，(i,j)为原图像的坐标，(i′,j′)为错切后图像的坐标。根据式(3.6.18)，当错切时图形的行坐标不变，列坐标随原坐标(i,j)和系数d作线性变化，且d=tanθ。当d>0时，图形沿j轴正方向作错切；当d<0时，图形沿j轴负方向作错切。图3-15垂直错切

3)利用错切实现图像的旋转

利用错切还可以实现图像的旋转。

因为

(3.6.19)图像旋转θ角度用矩阵形式表示为(3.6.20)在i方向和j方向上的错切用矩阵形式表示为,所以，图像旋转可以分解成三次图像的错切来实现。3.6.3三维图像的投影变换

1．投影变换

在三维空间中选择一个点，称此点为视点COP(观察点、投影中心)，再定义一个不经过该视点的平面，称此平面为投影面。从视点向投影面引出任意多条射线，称这些射线为投影线。投影线穿过物体与投影面相交，在投影面上形成物体的像，称为三维物体在二维投影面上的投影。像这样将三维空间中的物体变换到二维平面上的过程称为投影变换。在图3-16中，给出了同一条线段AB的两种不同投影，当视点距离投影面为有限距离时的投影称为透视投影；当视点距离投影面为无穷远时的投影称为平行投影。由于直线的平面投影本身是一条直线，因此，对线段AB作投影变换时，只需对线段的两个端点A和B作投影变换，连接投影A′和B′，就可得到整个直线段AB在投影面上的投影A′B′。图3-16平面投影原理图

2．投影种类

1)透视投影

如图3-17所示，设视点在坐标原点处，投影面与z轴垂直，在z＝d的位置上，点P(x，y，z)在投影面上的投影点为P′(xP，yP，d)。由此可知，要想知道点P的像点P′，实际上只要计算xP和yP的值即可。

由图3-17(b)和图3-17(c)，根据相似三角形对应边成比例的关系，则有

(3.6.21)于是(3.6.22)图3-17透视投影将透视投影变换用齐次坐标来表示。设点P在三维空间上的坐标为(x，y，z)，其投影点P′在三维空间上的坐标为(xP，yP，d)，令中间变量为(XP，YP，ZP)，在齐次坐标下的变换为

[XP，YP，ZP，H]=[x，y，z，1]·Tper

(3.6.23)

其中

将式(3.6.23)变形后，有(3.6.24)由式(3.6.22)可以看出，距离d仅仅是作用于xP和yP的比例因子。而与z相除，说明了远处物体的投影比近处物体的投影要小，即物体透视投影的大小与物体到视点的距离成反比，这就是所谓的缩小效应。

不平行于投影平面的平行线，经过透视投影之后交汇(相交)于一点，称该交点为灭点。在三维空间中，平行线只在无穷远点相交，因而，灭点可看做三维空间的无穷远点在投影平面上的投影点。三维空间中存在无数簇平行线，所以灭点也有无数多个。平行于坐标轴的平行线的灭点称为主灭点，主灭点的个数至多有三个，它的个数由与投影平面相交的坐标轴个数来确定。如图3-18所示，例如，如果投影平面为z＝0，它只与z轴相交，因而只产生一个主灭点，如图3-18(a)所示，并且该主灭点落于z轴之上；如果投影平面为x+z＝0，则它与x轴、z轴都相交，产生两个主灭点，如图3-18(b)所示；当投影平面为x+

人人文库> 全部分类> 教育资料 > 作文作品

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《图像检测与处理技术》课件第3章

文档简介

温馨提示

最新文档

评论

《图像检测与处理技术》课件第3章

文档简介

温馨提示

最新文档

评论

相关文档