数字图像处理复习精华.docx_第1页
数字图像处理复习精华.docx_第2页
数字图像处理复习精华.docx_第3页
数字图像处理复习精华.docx_第4页
数字图像处理复习精华.docx_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字图像处理复习精华版适用于西南石油大学*图像是对客观存在对象的一种相似性的、生动性的描述或写真。*数字图像处理(Digital Image Processing)利用计算机对数字图像进行(去除噪声、增强、复原、分割、特征提取、识别等)系列操作,从而获得某种预期的结果的技术。(计算机图像处理)*数字图像处理的特点(优势)(1)处理精度高,再现性好。(2)易于控制处理效果。(3)处理的多样性。(4)图像数据量庞大。(5)图像处理技术综合性强。*数字图像处理的目的(1)提高图像的视感质量, 以达到赏心悦目的目的a.去除图像中的噪声;b.改变图像的亮度、颜色;c.增强图像中的某些成份、 抑制某些成份;d.对图像进行几何变换等,达到艺术效果;(2)提取图像中所包含的某些特征或特殊信息。a.模式识别、计算机视觉的预处理(3)对图像数据进行变换、 编码和压缩, 以便于图像的存储和传输。*数字图像处理的主要研究内容(1) 图像的数字化a.如何将一幅光学图像表示成一组数字,既不失真又便于计算机分析处理 b.主要包括的是图像的采样与量化(2*) 图像的增强a.加强图像的有用信息,消弱干扰和噪声(3)图像的恢复a.把退化、模糊了的图像复原。模糊的原因有许多种,最常见的有运动模糊,散焦模糊等(4*)图像的编码a.简化图像的表示,压缩表示图像的数据,以便于存储和传输。(5)图像的重建a.由二维图像重建三维图像(如CT)(6)图像的分析a.对图像中的不同对象进行分割、分类、识别和描述、解释。(7)图像分割与特征提取a.图像分割是指将一幅图像的区域根据分析对象进行分割。b.图像的特征提取包括了形状特征、纹理特征、颜色特征等。(8)图像隐藏a.是指媒体信息的相互隐藏。b.数字水印。c.图像的信息伪装。(9)图像通信 *数字图像处理的应用领域: 通信:图象传输,电视电话等。 宇宙探测:星体图片处理。 遥感:地形、地质、矿藏探查,森林、水利、海洋、农业等资源调查,自然灾害预测,环境污染的监测,气象云图。 生物医学:CT,X射线成象,B超,红外图象,显微图象。 工业生产: 产品质量检测,生产过程控制,CAD,CAM。 军事: 军事目标侦察,制导系统,警戒系统,自动火器控制,反伪装等。 公安: 现场照片,指纹,手迹,印章,人像等处理和鉴别。 档案: 过期的文字、图片档案的修复和处理。 机器人视觉 娱乐: 电影特技,动画,广告,MTV等 *数字图像处理的发展动向 (1)提高精度,提高处理速度(2)加强软件研究,开发新方法(3)加强边缘学科的研究工作(4)加强理论研究(5)图像处理领域的标准化问题 *电磁辐射波: (1)在实际的图像处理应用中,最主要的图像来源于电磁辐射成像。 (2)电磁辐射波包括无线电波(1m-100km)、微波(1mm-1m)、红外线(700nm-1mm)、可见光(400nm-700nm)、紫外线(10nm-400nm)、X射线(1nm-10nm)、射线(0.001nm-1nm)。 (3)电磁辐射波的波谱范围很广,波长最长的是无线电波为3102m,其波长是可见光波长的几十亿倍;波长最短的是射线,波长为310-17m,其波长比可见光小几百万倍。 *电磁波谱与可见光谱相关概念 (1)仅有单一波长成份的光称为单色光,含有两种以上波长成份的光称为复合光,单色光和复合光都是有色彩的光。 (2)没有色彩的光称为消色光。消色光就是观察者看到的黑白电视的光,所以消色指白色、黑色和各种深浅程度不同的灰色。 (3)消色光的属性仅有亮度或强度,通常用灰度级描述这种光的强度。 *简单的图像成像模型 一幅图像可定义成一个二维函数f(x,y)。由于幅值f实质上反映了图像源的辐射能量,所以f(x,y)一定是非零且有限的,也即有: 0f(x,y)A0 图像是由于光照射在景物上,并经其反射或透射作用于人眼的结果。所以:f(x,y)可由两个分量来表征,一是照射到观察景物的光的总量,二是景物反射或透射的光的总量. 设i(x,y)表示照射到观察景物表面(x,y)处的白光强度,r(x,y)表示观察景物表面(x,y)处的平均反射(或透射)系数,则有: f(x,y)=i(x,y)r(x,y)其中: 0 i(x,y) A1 (2.4) 0 r(x,y) 1 对于消色光图像(有些文献称其为单色光图像),f(x,y)表示图像在坐标点(x,y)的灰度值l,且: l=f(x,y) (2.5) 这种只有灰度属性没有彩色属性的图像称为灰度图像。 由式(2.4),显然有: LminlLmxa (2.6) 区间Lmin,Lmax称为灰度的取值范围。 在实际中,一般取Lmin的值为0,这样,灰度的取值范围就可表示成0,Lmax。 *数字图像的表示 当一幅图像的x和y坐标及幅值f都为连续量时,称该图像为连续图像*。为了把连续图像转换成计算机可以接受的数字形式,必须先对连续的图像进行空间和幅值的离散化处理。 (1)图像的采样: 对图像的连续空间坐标x和y的离散化。 (2)图像灰度级的量化: 对图像函数的幅值 f 的离散化。 *均匀采样: 对一幅二维连续图像f(x,y)的连续空间坐标x和y的均匀采样,实质上就是把二维图像平面在x方向和y方向分别进行等间距划分,从而把二维图像平面划分成MN个网格,并使各网格中心点的位置与用一对实整数表示的笛卡尔坐标(I,j)相对应。二维图像平面上所有网格中心点位置对应的有序实整数对的笛卡尔坐标的全体就构成了该幅图像的采样结果。 *均匀量化: 对一幅二维连续图像f(x,y)的幅值f的均匀量化,实质上就是将图像的灰度取值范围0,Lmax划分成L个等级(L为正整数,Lmax=L-1),并将二维图像平面上MN个网格的中心点的灰度值分别量化成与L个等级中最接近的那个等级的值。 *数字图像的表示: 为了描述上的方便,本书仍用f(x,y)表示数字图像。设x0,M-1,y0,N-1,f0,L-1,则数字图像可表示成式(2.7)形式的一个MN的二维数字阵列。 每个(x,y)对应数字图像中的一个基本单元,称其为图像元素(picture element),简称为像素(pixel);且一般取M、N和的灰度级L为2的整次幂,即: M=2m (2.8) N=2n (2.9) L=2k (2.10) 这里,m、n和k为正整数存储一幅MN的数字图像,需要的存储位数为: b = M N k (2.11) 字节数为:B=b/8 *空间分辨率 (1)空间分辨率是图像中可分辨的最小细节,主要由采样间隔值决定。 (2*)一种常用的空间分辨率的定义*是单位距离内可分辨的最少黑白线对数目(单位是每毫米线对数),比如每毫米80线对。另外,当简单地把矩形数字化仪的尺寸看作是“单位距离”时,就可把一幅数字图像的阵列大小MN称为该幅数字图像的空间分辨率。 (3)对于一个同样大小的景物来说,对其进行采样的空间分辨率越高,采样间隔就越小,景物中的细节越能更好地在数字化后的图像中反映出来,也即反应该景物的图像的质量就越高。 (4) 一幅数字图像的阵列大小(简称为图像大小)通常用MN表示。在景物大小不变的情况下,采样的空间分辨率越高,获得的图像阵列MN就越大;反之,采样的空间分辨率越低,获得的图像阵列MN就越小。在空间分辨率不变的情况下,图像阵列MN越大,图像的尺寸就越大;反之,图像阵列MN越小,图像的尺寸就越小。 *采样数(1、2)、空间分辨率(3)变化对图像视觉效果的影响: (1)在图像的空间分辨率不变(这里指线对宽度不变)的情况下,采样越少,图像越小。 (2)在景物大小不变的情况下,图像阵列M*N越小,图像的尺寸越小。 (3)随着空间分辨率的降低,图像中的细节信息在逐渐损失,棋盘格似的粗颗粒像素点变得越来越明显。由此也说明,图像的空间分辨率越低,图像的视觉效果越差。 *灰度分辨率 灰度级分辨率是指在灰度级别中可分辨的最小变化,通常把灰度级级数L称为图像的灰度级分辨率。 *灰度分辨率变化对图像视觉效果的影响: 随着灰度分辨率的降低,图像的细节信息在逐渐损失,伪轮廓信息在逐渐增加。图中由于伪轮廓信息的积累,图像已显现出了木刻画的效果。由此也说明:灰度分辨率越低,图像的视觉效果越差。 *灰度直方图 图像的灰度直方图,是一种表示数字图像中各级灰度值及其出现频数的关系的函数。 设一幅数字图像的灰度级范围为0,L-1,则该图像的灰度直方图可定义为: h(rk)=nk (r=0,1,2,L-1) (2.19) 其中,rk表示第k级灰度值,h(rk)和nk表示图像中灰度值为rk的像素个数*灰度直方图具有如下一些特征: (1)直方图仅能描述图像中每个灰度级具有的像素个数,不能表示图像中每个像素的位置(空间)信息; (2)任一特定的图像都有惟一的直方图,不同的图像可以具有相同的直方图; (3)对于空间分辨率为MN,且灰度级范围为0,L-1的图像,有关系: (L-1)求和符(j=0) = MN (2.20) (4)如果一幅图像由两个不连接的区域组成,则整幅图像的直方图等于两个不连接的区域的直方图之和。 *显示分辨率是指显示屏上能够显示的数字图像的最大像素行数和最大像素列数,取决于显示器上所能够显示的像素点之间的距离。 *图像分辨率反映了数字化图像中可分辨的最小细节,也即图像的空间分辨率。在这里将图像分辨率看成是图像阵列的大小。 同一显示器(或显示分辨率相同的不同显示器)显示的图像大小只与被显示的图像(阵列)的空间分辨率大小有关,与显示器的显示分辨率无关。 换句话说,具有不同空间分辨率的数字图像在同一显示器上的显示分辨率相同。 *常用的图像文件格式有: BMP、GIF、TIFF、PCX、JPEG等。 *BMP文件(Bitmap File)是一种Windows采用的点阵式图像文件格式。 *BMP图像文件的组成: (1)位图文件头(Bitmap File Header)标识名称:(BITMAPFILEHEADER):说明文件的类型和位图数据的起始位置等,共14个字节。 (2)位图信息头(Bitmap Information Header)(BITMAPINFORMATION):说明位图文件的大小、位图的高度和宽度、位图的颜色格式和压缩类型等信息。共40个字节。 (3)位图调色板(Bitmap Palette)(RGBOUAD):由位图的颜色格式字段所确定的调色板数组,数组中的每个元素是一个RGBQUAD结构,占4个字节。 (4)位图数据(Bitmap Data)(BYTE):位图数据,位图的压缩格式确定了该数据阵列是压缩数据或是非压缩数据。 *图像的位图数据表示的图像共有biWidthbiHeight个像素。 *图像的位图数据是按行存储的,每一行的字节数按照4字节边界对齐,也即每一行的字节数是4的倍数,不足的字节用0补齐。 *图像的位图数据是按行从下到上、从左到右排列的。也就是说,从图像的位图数据中最先读到的是图像最下面一行的最左边的像素,最后读到的是图像最上面一行的最右边的一个像素。6 *图像变换是将图像从空域变换到其它域如频域的数学变换。 *图像变换的目的: (1)使图像处理问题简化(2)有利于图像特征提取(3)有助于从概念上增强对图像信息的理解 *一维正交变换 对于一向量f,用上述正交矩阵进行运算:g = Af。若要恢复f,则f=A(-1)g=A(T)g。以上过程称为正交变换。 *傅立叶变换对(傅立叶变换和逆变换)一定存在的条件: 当一个一维信号f(x)满足狄里赫莱条件,即f(x):(1)具有有限个间断点;(2)具有有限个极值点;(3)绝对可积; 则其傅立叶变换对(傅立叶变换和逆变换)一定存在。 *傅立叶(Fourier)变换的好处: (1)可以得出信号在各个频率点上的强度。 (2)可以将卷积运算化为乘积运算。 *Fourier变换后的图像,中间部分为低频部分,越靠外边频率越高。 *傅立叶(Fourier)变换 一维傅立叶变换: f(x)为连续可积函数,其傅立叶变换定义为:F(u)=(正负无穷)积分符号f(x)e(-j2派ux)dx。 一维傅立叶变换其反变换为:f(x)= (正负无穷)积分符号F(u) e(-j2派ux)du. 一维离散傅立叶变换: 正变换公式为:F(u)=(1/N)(上:N-1;下:x=0)求和符号f(x)e(-j2派ux/N),u=0,1,.N-1。 逆变换为:f(x)=(上:N-1;下:u=0)求和符号F(u) e(j2派ux/N),x=0,1,.N-1。 二维傅立叶变换: F(u,v)= (正负无穷)积分符号(正负无穷)积分符号f(x,y)exp-j2派(ux+vy)dxdy。 二维傅立叶变换逆变换: f(x,y)= (正负无穷)积分符号(正负无穷)积分符号F(x,y) expj2派(ux+vy)dudv。 二维离散傅立叶变换: F(u,v)=(1/MN)(上:M-1;下:x=0)求和符号(上:N-1;下:y=0)求和符号f(x,y)e-j2派(ux/M)+(vy/N) 二维离散傅立叶变换逆变换: f(x,y)=(上:M-1;下:u=0)求和符号(上:N-1;下:v=0)求和符号F(u,v)e-j2 派(ux/M)+(vy/N)*二维离散傅立叶变换的性质: (1)线性性质:af1(x,y)+-bf2(x,y)aF1(u,v)+-bF2(u,v) (2)比例性质:f(ax,by)(1/ab)F(u/a,u/b) (3)可分离性: F(u,v)=F小y(F小x(f(x,y)= F小x(F小y(f(x,y) f(x,y)=(F小u)-1(F小v)-1(F(u,v)= (F小v)-1(F小u)-1(F(u,v) (4)空间位移:f(x-x0,y-y0)F(u,v)e-j2派(ux0/M)+(vy0/N) (5)平移性质: 频率位移:f(x,y)ej2派(u0x/M)+(v0y/N)F(u-u0,v-v0) 图像中心化:当u0=M/2和v0=N/2时,f(x,y)(-1)(x+y)F(u-(M/2),v-(N/2) (6)周期性: F(u,v)=F(u+aM,v)=F(u,v+bN)=F(u+aM,v+bN) f(x,y)=f(x+aM,y)=F(x,y+bN)=f(x+aM,y+bN) (7)共轭对称性:F (u,v)=F上角加星号(-u,-v),绝对值(F(u,v))=绝对值(F(-u,-v)) (8)卷积定理: f(x,y)星号h(x,y)F(u,v)点号H(u,v) f(x,y)点号h(x,y)F(u,v)星号H(u,v) *图像增强的应用及其分类 图像处理最基本的目的之一是改善图像,而改善图像最常用的技术就是图像增强 *图像增强有两大类应用 改善图像的视觉效果,提高图像清晰度 突出图像的特征,便于计算机处理。 *图像增强按作用域分为两类,即空域处理和频域处理。 *灰度变换法 *非线性灰度变换 (1)对数变换g(x,y)=a+(ln(f(x,y)+1)/blnc) a,b,c是按需要可以调整的参数。 低灰度区扩展,高灰度区压缩。 (2)指数变换g(x,y)=(b(c(f(x,y)-a)-1 高灰度区扩展,低灰度区压缩。 *直方图(Equalization) 表示数字图象中的每一灰度级与其出现的频率(该灰度级的象素数目)间的统计关系,用横坐标表示灰度级, 纵坐标表示频数(也可用概率表示)8 *灰度直方图 图像的灰度直方图,是一种表示数字图像中各级灰度值及其出现频数的关系的函数。 *直方图均衡化 是将原图象的直方图通过变换函数修正为均匀的直方图,然后按均衡直方图修正原图象。 *图象均衡化处理后,图象的直方图是平直的,即各灰度级具有相同的出现频数,那么由于灰度级具有均匀的概率分布,图象看起来就更清晰了。 *直方图均衡化实质上是减少图象的灰度级以换取对比度的加大。 *在均衡过程中,原来的直方图上频数较小的灰度级被归入很少几个或一个灰度级内,故得不到增强。 *若这些灰度级所构成的图象细节比较重要,则需采用局部区域直方图均衡。 *均衡化表格:(示例中从r0r7) (1)r小k,从r0开始,r0=0,r1=1/7; (2)n小k,题目给出; (3)p(r小k),题目给出; (4)s小(k计算),求出前一列累加; (5)s小(k舍入),计算前一列与(几/7)最接近,写出(几/7); (6)r(小k)箭头到s(小k),根据前一列出现的不同的分数,依次写出几个新灰度级(肯定比原来少)记为s(小k)的值,相同的合并单元格写到一个里面,并用箭头标出s(小k)的值与第一列的对应关系(箭头从第一列的值(几/7,可能是多个)指向s(小k)的值(几/7); (7)p小s(s小k),参考前一列还剩的(“几”/7)决定哪“几”行有值(第一横条算0),有值的那几行根据“几”反看前一列,该值所在的第“几”行(第一横条算0)与上一列的“几”/7对应,再反看箭头左端对应的r小k的值,根据该值反看其对应的概率(即第3列),如果只有一个则直接赋值给最后一列,如果对应有多个则相加后赋值给对后一列。 (8)作图:输入图像的直方图(横坐标:r小k;纵坐标:第3列;原点为00);输出图像的直方图(横坐标:s小k;纵坐标:最后一列;原点00) *中值滤波法 用局部中值代替局部平均值 令f(x,y)-原始图象阵列, g(x,y)-中值滤波后图象阵列, f(x,y) -灰度级, g(x,y) -以f(x,y)为中心的窗口内各象素的灰度中间值。 *中值滤波的特性 (1)对离散阶约信号、斜升信号不产生影响(2)连续个数小于窗口长度一半的离散脉冲将被平滑(3)三角函数的顶部平坦化(4)中值滤波后,信号频率谱基本不变 优点:1、在平滑脉冲噪声方面非常灵敏,同时可以保护图像尖锐的边缘2、不影响阶跃信号、斜坡信号,连续个数小于窗口长度一半的脉冲受到抑制,三角波信号顶部变平。 缺点:1、对于高斯噪声不如均值滤波。2、图像中点、线、尖角等细节较多,则不宜采用中值滤波。 *均值滤波: (1)优点:把每个像素都用周围的8个像素做均值操作,平滑图像速度快、算法简单。 (2)缺点:1、在降低噪声的同时,使图像产生模糊,特别是边缘和细节处,而且模糊尺寸越大,图像模糊程度越大。2、对椒盐噪声的平滑处理效果不理想。 *图像的锐化之微分法 (1)考察正弦函数sin2派ax,它的微分2派a cos 2派ax微分后频率不变,幅度上升2派a倍。(2)空间频率愈高,幅度增加就愈大。(3)这表明微分是可以加强高频成分的,从而使图象轮廓变清晰。 *常用的梯度算子 (1)Roberts(0* -1/1 0),(-1* 0/0 1);各向同性;对噪声敏感;模板尺寸为偶数,中心位置不明显。 (2)Prewitt(-1 0 1/-1 0* 1/-1 0 1),(-1 -1 -1/0 0* 0/1 1 1);引入了平均因素,对噪声有抑制作用;操作简便。 (3)Sobel(-1 0 1/-2 0* 2/-1 0 1),(-1 -2 -1/0 0* 0/1 2 1);引入了平均因素,增强了最近像素的影响,噪声抑制效果比Prewitt好。 (4)Krisch(-3 -3 5/-3 0* 5/-3 -3 5);(-3 -3 -3/-3 0* -3/5 5 5);噪声抑制作用较好;需求出8个方向的响应(这里只给出2个模板) (5)Isotropic Sobel(-1 0 1/-根2 0* 根2/-1 0 1),(-1 根2 -1/0 0* 0/1 根2 1);权值反比于邻点与中心店的距离,检测沿不用方向边缘时梯度幅度一致,即具有各向同性。 *几种滤波对比:(依次为:振铃程度、图像模糊程度、噪声平滑效果) ILPF 理想低通滤波:严重、严重、最好 TLPF 梯形低通滤波:较轻、轻、好 ELPF 指数低通滤波:无、较轻、一般 BLPF 巴特沃斯(Butterworth)低通滤波:无、很轻、一般 *几种滤波对比: (1)理想高通滤波有明显的振铃现象,即图像边缘有抖动现象; (2)Butterworth高通滤波效果较好,但计算复杂,其优点是有少量低频通过,H(u,v)是渐变的,振铃现象不明显; (3)指数高通效果比Butterworth差些,振铃现象也不明显; (4)梯形高通会产生微振铃效果,但计算简单,故经常采用; *图像增强的内容: (1)消除噪声,改善图像的视觉效果(2)突出边缘,有利于识别和处理 *频域增强的一般过程:f(x,y)箭头(箭头上写:DFT)F(u,v)箭头(上:H(u,v),下:滤波)F(u,v)H(u,v)箭头(上:IDFT)g(x,y); 滤波公式:G(u,v)=H(u,v)F(u,v)*频域平滑原理: 噪声主要集中在高频部分,为除去噪声改善图像质量,采用低通滤波器抑制高频部分,然后再进行逆变换获得滤波图像,达到平滑图像的目的. 采用低通滤波 *图像退化(为什么要恢复) (1)图像的退化是指图像在形成、传输和记录过程中,由于成像系统、传输介质和设备的不完善,使图像的质量变坏。 (2)图像复原就是要尽可能恢复退化图像的本来面目,它是沿图像退化的逆过程进行处理。 (3)图像退化的数学模型为:g(x,y)=f(x,y)*h(x,y)+n(x,y) *典型的图像复原定义: 是根据图像退化的先验知识建立一个退化模型,以此模型为基础,采用各种逆退化处理方法进行恢复,得到质量改善的图像。 *图像复原过程如下: 找退化原因建立退化模型反向推演恢复图像 *图像增强与图像复原的联系与区别? (1)二者的目的都是为了改善图像的质量。 (2)图像增强不考虑图像是如何退化的,而是试图采用各种技术来增强图像的视觉效果。因此,图像增强可以不顾增强后的图像是否失真,只要看得舒服就行。 (3)而图像复原就完全不同,需知道图像退化的机制和过程等先验知识,据此找出一种相应的逆处理方法,从而得到复原的图像。 (4)如果图像已退化,应先作复原处理,再作增强处理。 *点源的概念 一幅图像可以看成由无穷多极小的像素所组成,每一个像素都可以看作为一个点源成像,因此,一幅图像也可以看成由无穷多点源形成的。 *逆滤波的病态性的改进方法: 在H(u,v)=0及其附近,人为地仔细设置H-1(u,v)的值,使N(u,v)*H-1(u,v)不会对F(u,v)产生太大影响。 (2)确定各像素的灰度值(灰度内插)。 *几何校正间接法:由于间接法内插灰度容易,所以一般采用间接法进行几何纠正。 (1)设恢复的图像像素在基准坐标系统为等距网格的交叉点,从网格交叉点的坐标f(x,y)出发,若干已知点,解求未知数。 (2)根据几何变换公式推算出各格网点在已知畸变图像上的坐标(x,y)。 (3)由于 (x,y)一般不为整数,不会位于畸变图像像素中心,因而不能直接确定该点的灰度值, (4)只能在畸变图像上,由该像点周围的像素灰度值通过内插,求出该像素的灰度值,作为对应格网点的灰度,据此获得校正图像 *像素灰度内插法:常用的有最近邻元法、双线性内插法和三次内插法三种。 *图像编码与压缩的内容(是什么) (1)图像压缩在信息论中称为信源编码 (2)图像编码和压缩就是对图像数据按照一定的规则进行变换和组合,从而以尽可能少的代码表示尽可能多的信息。 (3)研究内容包括数据压缩的数据的表示、传输、变换和编码方法,目的是减少存储数据所需的空间和传输所用的时间。 *图像编码的基本原理 (1)图像数据压缩是可能的 (2)一般原始图像中存在很大的冗余度。 (3)空间冗余、时间冗余、视觉冗余、信息熵冗余、结构冗余、知识冗余 (4)用户对原始图像的信号不全都感兴趣,可用特征提取和图像识别的方法,丢掉大量无用的信息。提取有用的信息,使必须传输和存储的图像数据大大减少。 从信息论观点看,描述图像信源的数据由有用数据和冗余数据两部分组成。 *冗余数据有:编码冗余、像素间冗余、心理视觉冗余3种。 如果能减少或消除其中的1种或多种冗余,就能取得数据压缩的效果。因此图像信息的压缩是可能的。 但到底能压缩多少,除了和图像本身存在的冗余度大小有关外,很大程度取决于对图像质量的要求。 原始图像越有规则,各象素之间的相关性越强,它可能压缩的数据就越多。 *图像编码压缩分类 (1)根据解压重建后的图像和原始图像之间是否具有误差,图像编码压缩分为无误差(亦称无失真、无损、信息保持)编码和有误差(有失真或有损)编码两大类。【无损编码分为:霍夫曼编码、行程编码、算术编码;有损编码分为:预测编码、变换编码、其它编码。】 (2)根据编码作用域划分,图像编码为空间域编码和变换域编码两大类。 *图像保真度 描述解码图像相对原始图像偏离程度的测度一般称为保真度。 *最常用的客观保真度准则: (1)原图像和解码图像之间的均方根误差(2)原图像和解码图像之间的均方根信噪比 *编码效率定义为:(伊塔(n右边一竖长点)=H(s)/B(上面加一横)=1/(1+r) *高效码: 冗余度接近于0,或编码效率接近于1的编码称为高效码12 *压缩比C定义: 若原始图像的平均比特率为n,编码后的平均比特率为nd,则压缩比C定义为:C=n/(n小d) *霍夫曼编码: (1)这种编码方法根据源数据符号发生的概率进行编码。 (2)在源数据中出现概率越大的符号,相应的码越短;出现概率越小的符号,其码长越长,从而达到用尽可能少的码符号表示源数据。它在变长编码方法中是最佳的。 *霍夫曼编码方法 (1)将信源符号按出现概率从大到小排成一列,然后把最末两个符号的概率相加,合成一个概率。 (2)把这个符号的概率与其余符号的概率按从大到小排列,然后再把最末两个符号的概率加起来,合成一个概率。 (3)重复上述做法,直到最后剩下两个概率为止。 (4)从最后一步剩下的两个概率开始逐步向前进行编码。每步只需对两个分支各赋予一个二进制码,如对概率大的赋予码元0,对概率小的赋予码元1,如果相等,则从中任选一个赋0,另一个赋1。 (5)读出时由符号开始一直走到最后的概率和1,将路线上所遇到的0和1反向排序好就是该符号的霍夫曼编码。 (4)解码(例):字符串“dacab”的编码是0.1101101,对应的十进制数是0.8516。从编码过程来看,只有当第一个字母为“d”时,相应的区间0.8,1.0)才包含编码0.1101101。接着,只有当第二个字母为a时,相应的区间0.8,0.88)才会包含编码0.1101101;以此类推,编码器将唯一地解出字符串“dacab” *正交变换编码: 通过正交变换把图像从空间域转换为能量比较集中的变换域系数,然后对变换系数进行编码,从而达到缩减比特率的目的。 *典型的变换编码系统框图: (写在箭头上:输入图像)-构造子图像-正变换-量化-符号编码-(写在箭头上:压缩图像)-符号编码-反变换-合并子图像-解压图像 *正交变换的性质 (1)正交变换是熵保持的,说明正交变换前后不丢失信息。 (2)正交变换是能量保持的。 (3)正交变换重新分配能量。如傅立叶变换,能量集中于低频区域。可用熵编码中不等长码来分配码长,能量大的系数分配较小的比特,达到压缩的目的。 (4)去除相关性。把空间域中高度相关的像素灰度值变为相关很弱或不相关的频域系数,能去掉存在于相关性中的冗余度。 *K-L正交变换(1)运算量:求Cx及其特征值、特征矢量,矩阵运算要N2次实数加法和N2次实数乘法。 (2)对视频图像实时处理极难做到。 *图像分割:图像分割就是依据图像的灰度、颜色、纹理、边缘等特征,把图像分成各自满足某种相似性准则或具有某种同质特征的连通区域的集合的过程。 *图像分割的依据和方法: (1)图像分割的依据是各区域具有不同的特性,这些特性可以是灰度、颜色、纹理等。而灰度图像分割的依据是基于相邻像素灰度值的不连续性和相似性。也即,子区域内部的像素一般具有灰度相似性,而在区域之间的边界上一般具有灰度不连续性。 (2)灰度图像分割是图像分割研究中最主要的内容,其本质是按照图像中不同区域的特性,将图像划分成不同的区域。 *基于边缘检测的图像分割方法的基本思路是先确定图像中的边缘像素,然后就可把它们连接在一起构成所需的边界。 *图像边缘:图像的边缘是指图像灰度发生空间突变的象素的集合。 *图像中的边缘可以通过对它们求导数来确定,而导数可利用微分算子来计算。对于数字图像来说,通常是利用差分来近似微分。 *图像边缘的两个特征:方向和幅度 (1)沿边缘走向,像素值变化比较平缓; (2)沿垂直于边缘的走向,像素值则变化比较剧烈。 (3)一般常用一阶和二阶导数来描述和检测边缘。 (4)上升阶跃边缘、下降阶跃边缘、脉冲状边缘、屋顶边缘。 * Hogh(哈夫)变换的基本思想: 是将图像空间X-Y变换到参数空间P-Q,利用图像空间X-Y与参数空间P-Q的点线对偶性,通过利用图像空间X-Y中的边缘数据点去计算参数空间P-Q中的参考点的轨迹,从而将不连续的边缘像素点连接起来,或将边缘像素点连接起来组成封闭边界的区域,从而实现对图像中直线段、圆和椭圆的检测。 *图像特征提取 (1)图像特征提取是图像处理研究中的重要内容,而图像特征提取的关键则是图像特征的描述和定义。 (2)图像的人工特征是指人们为了便于对图像进行处理和分析而人为认定的特征,比如图像直方图和图像频谱等。 (3)自然特征是指图像固有的特征,比如图像中的边缘、纹理、形状和颜色等。 *图像分类的概念 物体识别从根本上讲就是为物体标明类别,更通用的说法就是图像分类,是一种将图像中的所有像元或区域按其性质分为若干类别中的一类,或若干专题要素中的一种的技术过程。 *图像分类的技术层次: (1)人工目视解译方法。也即凭借成像机理、光谱规律、地学规律、生物学规律和人的知识和经验,从影像的亮度、色调、位置、时间、纹理、结构等特征推断出图像中景物的类型。 (2)计算机识别分类方法。也即根据图像中地物信息和数据特征的差异和变化,通过计算机对图像的处理和定量分析,实现对图像中地物属性的识别和分类,以便给出图像中地物的识别分类结果。 *一般情况下提到的图像分类概念就是指基于计算机的图像识别分类方法。 *图像的计算机识别分类方法主要分为两种: (1)一种是统计分类方法,也称为决策理论法,是一种定量的物体描述方法。 统计分类方法的基本思路是,通过从被识别的图像中提取一组反映图像中不同模式属性的测量值(特征),并利用统计决策原理对由模式特征定义的特征空间进行划分,进而区分出具有不同特征的模式,达到对图像中不同地物区域分类的目的。 (2)另一种是句法模式分类方法 ,是一种定性的物体描述方法。 句法模式分类方法适用于当特征描述无法表示被描述物体的复杂程度,或当物体可以被表示成由简单部件构成的分级结构时的情况。 *图像分割与图像分类 (1)图像分割是一种依据图像中各区域的灰度、颜色、纹理等特征,将图像划分成不同区域的技术。其目的或是通过分割出的某些区域的形状来识别目标(比如可根据区域的形状判别出某些区域是飞机,或是铁路等),或是进而在分割成的区域中进行特征提取,再根据提取的特征或结构信息进行物体识别。可见,图像分割强调从地物边界和形状信息中进行物体识别。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论