图像变换(青岛大学)_第1页
图像变换(青岛大学)_第2页
图像变换(青岛大学)_第3页
图像变换(青岛大学)_第4页
图像变换(青岛大学)_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图像变换离散余弦变换

离散沃尔什变换离散K-L变换2离散余弦变换

图像处理中常用的正交变换除了傅里叶变换外,还有其他一些有用的正交变换。其中离散余弦就是一种。离散余弦变换表示为DCT。

3一维离散余弦变换的定义由下式表示(3—74)(3—75)4式中是第个余弦变换系数,是广义频率变量,;是时域N点序列,一维离散余弦反变换由下式表示(3—76)显然,式(3—74)式(3—75)和式(3—76)构成了一维离散余弦变换对。5二维离散余弦变换的定义由下式表示(3—77)6式(3—77)是正变换公式。其中是空间域二维向量之元素。,是变换系数阵列之元素。式中表示的阵列为N×N7二维离散余弦反变换由下式表示(3—78)【例】应用MATLAB实现图像的DCT变换。解:MATLAB程序如下:

A=imread(‘lena.bmp'); %读入图像

I=dct2(A); %对图像作DCT变换

subplot(1,2,1),imshow(A);%显示原图像

subplot(1,2,2),imshow(log(abs(I)),[05]);(3.20)(a)原图(b)DCT变换(c)DFT变换离散余弦变换小结:DCT除了具有一般的正交变换性质外,它的变换阵的基向量能很好地描述人类语音信号和图像信号的相关特征。因此,在对语音信号、图像信号的变换中,DCT变换被认为是一种准最佳变换。近年颁布的一系列视频压缩编码的国际标准建议中,都把DCT作为其中的一个基本处理模块。前面的变换都是余弦型变换,基底函数选用的都是余弦型。图像处理中还有许多变换常常选用方波信号或者它的变形。沃尔什(Walsh)变换。

沃尔什/哈达玛变换一、沃尔什函数沃尔什函数是1923年由美国数学家沃尔什提出的。沃尔什函数系是完备的正交函数系,其值也是只取+1和-1。从排列次序来定义有三种:

第一种是按沃尔什排列或称按列率排列来定义;第二种是按佩利排列定义;(自然序数)第三种是按哈达玛排列来定义。(第三定序法)

1.按沃尔什排列的沃尔什函数按沃尔什排列的沃尔什函数

10t10-1t1110-1t110-1t110-1t110-1t110-1t110-1t12.按佩利排列的沃尔什函数按佩利排列的沃尔什函数1010-11t10-11t10-11t10-11t10-11t10-11t10-11tt3.按哈达玛排列的沃尔什函数

按哈达玛排列的沃尔什函数是从阶哈达玛矩阵得来的。阶哈达玛矩阵每一行的符号变化规律,对应某个沃尔什函数在正交区间内符号变化的规律,也就是说,阶哈达玛矩阵的每一行就对应着一个离散沃尔什函数。

阶哈达玛矩阵有如下形式

哈达玛矩阵

哈达玛矩阵的阶数是按N=2n(n=0,1,2,…)规律排列的,阶数较高的哈达玛矩阵,可以利用矩阵的克罗内克积运算,由低阶哈达玛矩阵递推得到,即

哈达玛矩阵

按哈达玛排列的沃尔什函数10-11t10-11t10-11t10-11t10-11t10-1110-11t10-11tt3.按哈达玛排列的沃尔什函数

一维离散沃尔什变换定义为一维离散沃尔什逆变换定义为式中,Walsh(u,x)为沃尔什函数。一、一维离散沃尔什-哈达玛变换一、一维离散沃尔什-哈达玛变换

由于哈达玛排序的沃尔什函数是由2n(n=0,1,2,…)阶哈达玛矩阵(HadamardMatrix)得到的,而哈达玛矩阵的最大优点在于它具有简单的递推关系,即高阶矩阵可用两个低阶矩阵的克罗内克积求得,因此在此只介绍哈达玛排列定义的沃尔什变换。[HN]为N阶哈达玛矩阵。若将Walsh(u,x)用哈达玛矩阵表示,则可将变换表达式写成矩阵形式:由于哈达玛矩阵由+1-1组成,可知:沃尔什-哈达玛变换的本质上是将离散序列f(x)的各项值的符号按一定规律改变后,进行加减运算,因此,它比采用复数运算的DFT和采用余弦运算的DCT要简单得多。二维WHT的正变换和逆变换分别为式中:x,u=0,1,2,…,M-1;

y,v=0,1,2,…,N-1。二、二维离散沃尔什变换【例】求这两个信号的二维WHT。解:M=N=4,其二维WHT变换核为

从以上例子可看出,二维WHT具有能量集中的特性,而且原始数据中数字越是均匀分布,经变换后的数据越集中于矩阵的边角上。因此,二维WHT可用于压缩图像信息。

【例】一幅数字图像及对其进行二维WHT变换的结果。(a)原图像;(b)二维WHT结果类似于FFT,WHT也有快速算法FWHT,也可将输入序列f(x)按奇偶进行分组,分别进行WHT。

WHT的变换核是可分离和对称的,因此二维WHT也可分为两个一维的WHT分别用FWHT进行变换而得到最终结果,由此便可实现二维的FWHT。三、快速沃尔什变换(FWHT)小结:

WHT是将一个函数变换成取值为+1或-1的基本函数构成的级数,用它来逼近数字脉冲信号时要比FFT有利。

WHT只需要进行实数运算,存储量比FFT要少得多,运算速度也快得多。WHT在图像传输、通信技术和数据压缩中被广泛使用。5.4

沃尔什/哈达玛变换30离散K-L变换又称为霍特林(Hotelling)变换KL(Karhunen-Loeve)或DKT以图像的统计性质为基础的变换核矩阵由图像阵列的协方差矩阵的特征值和特征向量所决定-又称为特征向量变换31当变量之间存在一定的相关关系时,可以通过原始变量的线性组合,构成数目较少的不相关的新变量代替原始变量,而每个新变量都含有尽量多的原始变量的信息。这种处理问题的方法,叫做主成分分析,新变量叫做原始变量的主成分。目的是寻找任意统计分布的数据集合之主要分量的子集。相应的基向量组满足正交性且由它定义的子空间最优地考虑了数据的相关性。将原始数据集合变换到主分量空间使单一数据样本的互相关性(cross-correlation)降低到最低点。32图像协方差矩阵假设对某幅N×N的图像f(x,y),在某个传输通道上传输了M次,因会受到各种因素的随机干扰,接收到是一个图像集合将M次传送的图像集合写成M个N2维向量{X1,X2,…Xi,…XM},生成向量的方法可以采用行堆叠或列堆叠的方法,对第i次获得的图像fi(x,y),可用N2维向量Xi表示:33问题是:如何选取一个合适的正交变换A,使得变换后的图像Y=AX1)是具有M<<N2个分量的向量2)由Y经反变换而恢复的(向量X的估值)和原始图像具有最小的均方误差,即称满足这两个条件的正交变换A为K-L变换。如果能找到这样一个变换,那么就意味着经过一个变换,不仅删除了N2-M个分量,并且由变换结果Y重新恢复的图像是有效的过滤了随机干扰的原图像的最佳逼近。

34X向量的协方差矩阵CX定义为设ei和λi是协方差矩阵CX对应的特征向量和特征值,将特征值按减序排列,即则K-L变换核矩阵A的行用CX的特征值λi所对应的特征向量ei构成:35直接求矩阵

CX的特征值和特征向量很困难。这是因为CX是N2×N2维矩阵,尽管图像的大小N可能不是很大的,但N2却是很大的数据。这样求其特征向量和特征值速度较慢。但如果样本图象个数M不太多,可以先计算出M×M维方阵L=ATA的特征值μk和特征向量vk左乘矩阵A,则有

是矩阵CX的特征向量可以选择P(P≤M)个较大特征值对应的特征向量(主成分),构造新的P维主成分空间Q因为CX是实对称矩阵,总能找到一个标准正交的特征向量集合,使A-1=AT,那么可得K-L反变换为

36K-L变换的性质和特点(1)Y的平均值向量my=0,即为零向量0(2)Y向量的协方差37(3)对角性对角线上的元素是原始图像向量的协方差矩阵CX对应的特征值λi,它也是Y向量的方差。而非对角线上的元素值为0,说明Y向量中各元素之间相关性小,而CX的非对角线上元素不为0,说明原始图像元素之间相关性强,这就是采用K-L变换进行编码,数据压缩比大的原因显然K-L坐标系将矩阵CX对角化了,换句话说,通过K-L变换,消除了原有向量X的各分量之间的相关性,从而可能去掉那些带有较少信息的坐标轴,以达到降低特征空间维数的目的。38X1X2e1e2在原来坐标系中,要用两个分量X1,X2来表示各个样本,而在K-L坐标系中,只要用e1就可以,去掉e2并不会带来很大的误差假设矩阵CX只有少数几个数值大的特征值,而其余的特征值数值很小,K-L坐标系就可以有效的进行信息压缩39K-L变换的最大优点是去相关性好,可用于数据压缩和图像旋转主要困难是由于协方差矩阵CX求特征值λ和特征向量解方程的计算量大,同时K-L变换是非分离的,二维不可分,一般情况下,K-L变换没有快速算法40实例以K-L变换进行自动的人脸识别为例说明我们把一幅数字图像看成一个矩阵或一个数组,用B(i,j)或[bij]表示,一幅N×N大小的人脸图像按列相连构成一个N2维矢量x=(b11b21…bN1b12b22…bN2…b1Nb2N…bNN)它可视为N2维空间中的一个点,假设N=128。由于人脸结构的相似性,当把很多这样的人脸图像归一化之后,这些图像在这一超高维空间中不是随机或散乱分布的,而是存在某种规律,因此可以通过K-L变换用一个低维子空间描述人脸图像,同时又能保存所需要的识别信息41图像的归一化对于一个全自动的人脸识别系统,其首要的工作是人脸图像的分割以及主要器官的定位。另外,由于K-L变换本质上依赖于图像灰度在空间分布上的相关性,因此还需要对人脸图像进行一系列的预处理,以达到位置校准和灰度归一化的目的假设已根据分割及定位算法,得到了人脸正面图像左右两眼中心的位置,并分别记为Er和El,则可通过下述步骤达到图像校准的目的421、进行图像旋转,以使Er和El的连线ErEl保持水平。这保证了人脸方向的一致性,体现了人脸在图像平面内的旋转不变性2、根据图所示的比例关系,进行图像裁剪。图中,O点为ErEl的中点,且d=ErEl。经过裁剪,在2d×2d的图像内,可保证O点固定于(0.5d,d)处。这保证了人脸位置的一致性,体现了人脸在图像平面内的平移不变性3、进行图像缩小和放大变换,得到统一大小的标准图像,规定标准图像的大小为128×128象素点,则缩放倍数为β=2d/128。这使得d=ErEl为定长(64个象素点),即保证了人脸大小的一致性,体现了人脸在图像平面内的尺度不变性43经过校准,不仅在一定程度上获得了人脸表示的几何不变性,而且还基本上消除了头发和背景的干扰。完成了旋转、平移和尺度不变性后,需要对校准的图像做灰度拉伸,以改善图像的对比度,然后采用直方图修正技术使图像具有统一的均值和方差,一部分消除光照强度的影响假设人脸数据库中,由20人,每人10幅人脸图像44K-L变换以归一化后的标准图像做为训练样本集,以该样本集的总体散布矩阵为协方差矩阵,即xi为第i个训练样本的图像向量,μ为训练样本集的平均图像,M为训练样本的总数为了N2×N2维矩阵∑的特征值和正交归一的特征向量,直接计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论