数字图像复习_第1页
数字图像复习_第2页
数字图像复习_第3页
数字图像复习_第4页
数字图像复习_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一、二章 数字图像处理基础1.1图像的概念图像:当光辐射能量照在物体上,经过它的反射或透射,或由发光物体本身发出的光能量,在人的视觉器官中所重现出的物体的视觉信息。“图”是物体投射或反射光的分布,“象”是人的视觉系统对图的接受在大脑中形成的印象或反映,是客观和主观的结合。数字图像:以数字格式存放的图像称之为数字图像图象分类:按亮度等级:二值图像和灰度图像按色调不同:无色调的灰度图像和有色调的彩色图像按内容的变化性质:静态图像和活动图像按所占空间的维数:平面的二维图像和立体的三维图像图像质量的评价方法主观方法:通过人眼观察图像,对图像的优劣作出主观评价客观方法:对图像质量作一个定量的客观描述其

2、它方法:基于感觉的质量评价,基于任务的质量评价等1.2 图像数字化1、概述数字图像处理的一个先决条件就是将连续图像离散化,转换为数字图像。图像的数字化包括采样和量化两个过程。2、采样图像在空间上的离散化称为采样。也就是用空间上部分点的灰度值代表图像,这些点称为采样点。由于图像是一种二维分布的信息,为了对它进行采样操作,需要先将二维信号变为一维信号,再对一维信号完成采样。具体做法是,先沿垂直方向按一定间隔从上到下顺序地沿水平方向直线扫描,取出各水平线上灰度值的一维扫描。而后再对一维扫描线信号按一定间隔采样得到离散信号,即先沿垂直方向采样, 再沿水平方向采样这两个步骤完成采样操作。3、量化模拟图像

3、经过采样后,在时间和空间上离散化为像素。但采样所得的像素值(即灰度值)仍是连续量。把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。若连续灰度值用z来表示,对于满足zizzi+1的z值,都量化为整数qi。qi称为像素的灰度值,z与qi的差称为量化误差。一般,像素值量化后用一个字节8 bit来表示。如图3(b)所示,把由黑灰白的连续变化的灰度值, 量化为0255共256级灰度值,灰度值的范围为0255,表示亮度从深到浅, 对应图像中的颜色为从黑到白。线性量化与非线性量化连续灰度值量化分为等间隔量化和非等间隔量化。等间隔量化就是简单地把采样值的灰度范围等间隔地分割并进行量化。对

4、于像素灰度值在黑白范围较均匀分布的图像,这种量化方法可以得到较小的量化误差。该方法也称为均匀量化或线性量化。非均匀量化是依据一幅图像具体的灰度值分布的概率密度函数,按总的量化误差最小的原则来进行量化。由于图像灰度值的概率分布密度函数因图像不同而异, 所以不可能找到一个适用于各种不同图像的最佳非等间隔量化方案。因此, 实用上一般都采用等间隔量化。 采样与量化参数的选择一幅图像在采样时,行、列的采样点与量化时每个像素量化的级数,既影响数字图像的质量,也影响到该数字图像数据量的大小。假定图像取M×N个样点,每个像素量化后的级数为Q,一般Q总是取为2的整数幂,即Q=2k, 则存储一幅数字图像

5、所需的二进制位数b为 字节数B为 对一幅图像,当量化级数Q一定时,采样点数M×N对图像质量有着显著的影响。采样点数越多,图像质量越好; 当采样点数减少时,图上的块状效应就逐渐明显。同理, 当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。量化级数越多,图像质量越好,当量化级数越少时,图像质量越差,量化级数最小的极端情况就是二值图像, 图像出现假轮廓。4、图像数字化设备将模拟图像数字化成为数字图像,需要某种图像数字化设备。常见的数字化设备有数字相机、扫描仪、数字化仪等。图像数字化设备的组成采样和量化是数字化一幅图像的两个基本过程。即把图像划分为若干图像元素(像素)并给出它们的

6、地址(采样); 度量每一像素的灰度, 并把连续的度量结果量化为整数(量化);最后将这些整数结果写入存储设备。为完成这些功能, 图像数字化设备必须包含以下五个部分:(1) 采样孔(Sampling aperture): 使数字化设备能够单独地观测特定的图像元素而不受图像其他部分的影响。 (2) 图像扫描机构: 使采样孔按照预先确定的方式在图像上移动,从而按顺序观测每一个像素。 (3) 光传感器: 通过采样检测图像的每一像素的亮度, 通常采用CCD阵列(电荷耦合器件)。 (4) 量化器:将传感器输出的连续量转化为整数值。典型的量化器是A/D转换电路,它产生一个与输入电压或电流成比例的数值。 (5)

7、 输出存储装置:将量化器产生的灰度值按适当格式存储起来,以用于计算机后续处理。 图像数字化设备的性能(1)像素大小。采样孔的大小和相邻像素的间距是两个重要的性能指标。(2)图像大小。图像大小即数字化设备所允许的最大输入图像的尺寸。 (3)线性度。对光强进行数字化时,灰度正比于图像亮度的实际精确程度是一个重要的指标。(4)噪声。数字化设备的噪声水平也是一个重要的性能参数。1.3 数字图像处理1、 数字图像处理定义把利用计算机对图像进行去除噪声、 增强、复原、分割、提取特征等的理论、 方法和技术称为数字图像处理。一般, 图像处理是用计算机和实时硬件实现的, 因此也称之为计算机图像处理。2、 数字图

8、像处理的特点数字图像处理是利用计算机的计算,具有如下特点:(1)处理精度高,再现性好。(2)处理的多样性。(3)图像数据量庞大。(4)处理费时。(5)图像处理技术综合性强。3、数字图像处理的目的一般而言, 对图像进行加工和分析主要有如下三方面的目的: (1)提高图像的视感质量, 以达到赏心悦目的目的。(2)提取图像中所包含的某些特征或特殊信息, 以便于计算机分析。(3)对图像数据进行变换、 编码和压缩, 以便于图像的存储和传输。4、 数字图像处理的主要内容(1)图像获取、表示和表现(2)图像复原(3)图像增强(4)图像分割(5)图像分析(6)图像重建(7)图像压缩编码一般来说,图像编码的目的有

9、三个: 减少数据存储量;降低数据率以减少传输带宽; 压缩信息量, 便于特征提取,为后续识别作准备。5 数字图像处理系统分辨率图像分辨率是指每英寸图像含有多少个点或像素, 分辨率的单位为dpi。屏幕分辨率显示器上每单位长度显示的像素或点的数量称为屏幕分辨率。通常以每英寸点数(dpi)来表示。屏幕分辨率取决于显示器的大小及其像素设置。1.4数字图像格式 1、矢量图与位图 静态图像可分为矢量(Vector)图和位图(Bitmap), 位图也称为栅格图像。公式化表示图像使得矢量图具有两个优点:一是它的文件数据量很小。二是图像质量与分辨率无关,这意味着无论将图像放大或缩小了多少次,图像总是以显示设备允许

10、的最大清晰度显示。计算机计算与显示一幅图像时,也往往能看到画图的过程。位图位图是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性。位图又可以分成如下四种: 黑白(LineArt)、灰度图像(GrayScale)、索引颜色图像(Index Color)和真彩色图像(True Color)。2、位图介绍1)黑白图像。黑白图象只有黑白两种颜色。 2)灰度图像。在灰度图像中,像素灰度级用8 bit表示,所以每个像素都是介于黑色和白色之间的256(28=256)种灰度中的一种。3)真彩色图像“真彩色”是RGB颜色的另一种流行的叫法。RGB图像的颜色是非映射的,它可以从系统的“颜色表”里自由获取

11、所需的颜色,这种图像文件里的颜色直接与PC机上的显示颜色相对应。在真彩色图像中,每一个像素由红、绿和蓝三个字节组成, 每个字节为8 bit,表示0到255之间的不同的亮度值,这三个字节组合可以产生1670万种不同的颜色。4)索引图像索引颜色通常也称为映射颜色, 在这种模式下,颜色都是预先定义的,并且可供选用的一组颜色也很有限, 索引颜色的图像最多只能显示256种颜色。一幅索引颜色图像在图像文件里定义,当打开该文件时,构成该图像具体颜色的索引值就被读入程序里,然后根据索引值找到最终的颜色。5)位图的有关术语像素(Pixel)、点(Dot)和样点(Sample)3、BMP格式介绍 每一种图像文件均

12、有一个文件头, 在文件头之后才是图像数据。文件头的内容由制作该图像文件的公司决定,一般包括文件类型、文件制作者、制作时间、版本号、 文件大小等内容。1)什么是BMP文件格式Windows操作系统的标准文件格式虽然大部分BMP文件是不压缩的形式,它本身还是支持图像压缩的,如rlc格式(行程长度编码)和LZW压缩格式等位图文件(Bitmap-File,BMP)格式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式。2)BMP文件结构见实验册。BMP图像文件头见实验册。调色板和图像数据调色板包含的元素与位图所具有的颜色数相同,像素的颜色用RGBQUAD

13、结构来定义。对于24-位真彩色图像就不使用彩色表,因为位图中的RGB值就代表了每个像素的颜色。调色板结构体见实验册第三章 空域图象增强一、 图像增强基本概念图像增强的目的改善图像的视觉效果。突出图像的特征,便于计算机处理。图像增强按作用域分类:空域处理和频域处理。空域处理是直接对图像进行处理。频域处理则是在图像的某个变换域内,对图像的变换系数进行运算,然后通过逆变换获得图像增强效果。二、灰度变换法灰度变换将一个灰度区间映射到另一个灰度区间的变换称为灰度变换。灰度变换的目的灰度变换可使图像动态范围加大,图像对比度扩展,图像清晰,特征明显,是图像增强的重要手段。灰度变换的分类:线性变换、非线性变换

14、1、线性变换原始图像:f (i, j),灰度范围:a, b,变换后图像:f (i, j),灰度范围:a, b, 存在以下关系: 2、 分段线性变换拉伸图像中一些灰度细节,相对抑制不感兴趣的部分。 变换过程: 如果则,扩展第一区间a, c,压缩第二区间c, d,维持第三区间d, b。3、非线性变换原始图像f (i, j)的灰度范围为a, b,可以通过自然对数变换到区间a, b上,从而求得图像f (i, j): 这一变换扩展输入图像中低灰度区的对比度,而压缩高灰度值。此变换常与指数变换并用,如在同态滤波中,对输入图像作对数变换之后,在输出端必须进行指数变换,以求获得整个系统合一的传递函数。三、直方

15、图修正法 1、 直方图的基本概念将图像中像素亮度(灰度级别)看成是一个随机变量,其分布情况反映了图像的统计特性。如果用概率密度函数来描述这种统计特性,表现为灰度直方图。灰度直方图是灰度级的函数,它表示图像中具有某种灰度级的像素的个数,反映了图像中每种灰度出现的频率。灰度直方图的横坐标是灰度级,纵坐标是该灰度级出现的频数,它是图像最基本的统计特征。2、 直方图的性质(1) 直方图只反映该图像中不同灰度值出现的次数(或频数),而未反映某一灰度值像素所在位置。也就是说,它只包含了该图像中某一灰度值的像素出现的概率,而丢失了其所在位置的信息。(2)任一幅图像,都能惟一地确定出一幅与它对应的直方图, 但

16、不同的图像,可能有相同的直方图。也就是说,图像与直方图之间是多对一的映射关系。(3)一幅图像各子区的直方图之和就等于该图像全图的直方图。3、 直方图的计算在离散形式下, 用rk代表离散灰度级,用pr(rk)代表pr(r),有下式成立: 式中:nk为图像中出现rk级灰度的像素数,n是图像像素总数,而nk/n即为频数。在直角坐标系中做出rk与pr(rk)的关系图形,即称为该图像的直方图。4、 直方图的变换与拉伸一幅给定图像的灰度级分布在0r1范围内,可以对0, 1区间内的任一个r值进行如下变换: s=T(r)通过上述变换,每个原始图像的像素灰度值r都对应产生一个s值。变换函数T(r)通常应满足下列

17、条件: (1) 在0r1区间内,T(r)值单调增加。 (2) 对于0r1, 有 0T(r)1。5、直方图均衡化直方图均衡化处理是以累积分布函数(CDF)变换法为基础的直方图修正法。变换函数为式中:是积分变量,是r的累积分布函数。这里,累积分布函数是r的函数,并且单调地从0增加到1, 所以这个变换函数满足关于T(r)在0r1内单值单调增加。在0r1内有0T(r)1的两个条件。6、直方图规定化设原图像的灰度PDF为,规定的变化后的PDF为,一般变化过程为:令则四、领域平均法邻域平均法是一种利用模板对图像进行操作(卷积运算)的图像平滑方法,常用的是Box模板,所谓Box模板是指模板中所有系数都取相同

18、值的模板, 常用的3×3和5×5模板如下: Box模板对当前像素及其相邻的的像素点都一视同仁,统一进行平均处理, 这样就可以滤去图像中的噪声。邻域平均法的数学含义可用下式表示: 式中:x, y = 0, 1, , N-1;S是以(x, y)为中心的邻域的集合,M是S内的点数。邻域平均法的思想是通过一点和邻域内像素点求平均来去除突变的像素点,从而滤掉一定的噪声,其主要优点是算法简单,计算速度快, 但其代价是会造成图像一定程度上的模糊。邻域平均法的平滑效果与所采用邻域的半径(模板大小)有关。半径愈大, 则图像的模糊程度越大, 因此, 减少图像的模糊是图像平滑处理研究的主要问题之

19、一。为解决邻域平均法造成图像模糊的问题,可采用阈值法、K邻点平均法、梯度倒数加权平滑法、 最大均匀性平滑法、小斜面模型平滑法等。邻域的大小、 形状和方向,参加平均的点数以及邻域各点的权重系数对邻域平均法的平滑效果有重要的影响。超限邻域平均法如果某个像素的灰度值大于其邻域像素的平均值,且达到了一定水平,则判断该像素为噪声,继而用邻域像素的均值取代这一像素值, 式中,T为某一阈值。图像中的脉冲噪声模型椒盐噪声: 受噪声干扰的图像像素以50%的相同概率等于图像灰度的最大或最小的可能取值随机值脉冲噪声: 受噪声干扰图像点取值均匀分布于图像灰度的最大与最小可能取值之间 五、中值滤波中值滤波是一种非线性信

20、号处理方法,与其对应的中值滤波器也就是一种非线性滤波器。中值滤波原理中值滤波就是用一个奇数点的移动窗口, 将窗口中心点的值用窗口内各点的中值代替。假设窗口内有五点,其值为80、 90、 200、 110和120, 那么此窗口内各点的中值即为110。二维中值滤波可由下式表示: 式中:A为窗口; fij为二维数据序列。 中值滤波主要特性对某些输入信号中值滤波的不变性对某些特定的输入信号,如在窗口内单调增加或单调减少的序列, 中值滤波输出信号仍保持输入信号不变,即:fi-nfifi+n或fi-nfifi+n,则 yi=fi。中值滤波去噪声性能对于零均值正态分布的噪声输入, 中值滤波输出的噪声方差2m

21、ed近似为式中:2i为输入噪声功率(方差),m为中值滤波窗口长度(点数),为输入噪声均值,为输入噪声密度函数。 而均值滤波的输出噪声方差20为 六、 图像锐化1、图像锐化的目的-加强图像中景物的边缘和轮廓。 -边缘与轮廓一般位于灰度突变的地方,可以用灰度差分提 取。差分运算是有方向性的,由于边缘、轮廓在一幅图像中常常具有任意的方向。2、各种边缘检测算子对任意方向的边缘、轮廓都有相同的检测能力。具有这种性质的锐化算子有梯度、拉普拉斯和其它一些相关算子。 梯度算子F(x, y):图像函数,在点(x, y)上的梯度定义为矢量梯度的幅度为:梯度矢量的幅角为:拉普拉斯算子对于一个连续的二元函数F(x,

22、y),其拉普拉斯算子定义为对于数字图像,拉普拉斯算子可以简化为 Sobel算子Prewitt算子第四章 频域图像增强第五章 图像退化与复原1、图像退化图像的质量变坏叫做退化。无论何种方法获得的图像一般都会有不同程度的退化;退化的形式多种多样。如传感器噪声、摄像机未聚焦、物体与摄像设备之间的相对移动、随机大气湍流、光学系统的相差、成像光源或射线的散射等;典型的图像复原方法是根据图像退化的先验知识建立一个退化模型,以此模型为基础,采用滤波等手段进行处理,使得复原后的图像符合一定的准则,达到改善图像质量的目的。2、图像退化模型(1)连续图像退化模型f(i, j):原始图像g(i, j):降质图像T(

23、·):系统作用,则:,设T是线性的。线性位移不变的图像退化模型则表示为:(2)离散图像退化模型对于图像降质过程进行数学建模f(i, j):原始图像y(i, j):降质图像h(i, j; k, l):系统冲击响应图像为M×N维假设为空间不移变h(i, j; k, l),则:3、 图像的几何校正1)几何畸变与几何校正在不同条件下拍摄的图像,一个物体的图像常会发生几何畸变,出现歪斜变形的现象。以一副图像为基准,去校正另一种方式摄入的图像,以期校正其几何畸变,就叫做图像的几何畸变复原或者几何校正。2)几何校正模型几何基准图像的坐标系统用(x, y)来表示需要校正的图像的坐标系统用(

24、,)表示设两个图像坐标系统之间的关系用解析式表示通常h1(x,y)和h2(x,y)用多项式来表示:通常用线性畸变来近似较小的几何畸变更精确一些可以用二次型来近似若基准图像为f(x,y),畸变图像为g(x,y),对于景物上的同一个点,假定其灰度不变,则3)几何校正过程(1)已知h1(x,y)和h2(x,y)通常用线性畸变来近似较小的几何畸变零级内插:加权内插法:则:其中:第六章 彩色图像处理1、彩色1)可见光: 光学理论告诉我们,光是一种以电磁波形式存在的物质。人眼可以看见的光叫可见光,它是波长范围为380nm到780nm之间的电磁波。2)视觉特性相对视敏曲线有选择地吸收、反射或透射不同波长的光

25、是物体固有的物理特性,它决定了该物体的颜色;而人们感觉到光的亮度和光的颜色却是人的眼睛的生理结构特点所造成的。 人眼的亮度感觉亮度感觉,即包括人眼所能感觉到的最大亮度与最小亮度的差别及在不同环境亮度下对同一亮度所产生的主观亮度感觉。3)彩色三要素对于彩色光通常可由亮度、色调和色饱和度三个物理量来描述,这三个量常被称为彩色三要素。4)三基色(R,B,G) (1)三基色必须是相互独立的,即其中任一种基色都不能由另外两种基色混合而产生。(2)自然界中的大多数颜色,都可以用三基色按一定比例混合得到。 (3)三个基色的混合比例,决定了混合色的色调和饱和度。(4)混合色的亮度等于构成该混合色的各个基色的亮

26、度之和。 5)混色方法6)彩色空间 RGB、 YUV、LUV、 HIS ,各种彩色空间可以进行相互转换. YUV与RGB相互转换的公式如下(RGB取值范围均为0-255):Y = 0.299R + 0.587G + 0.114BU = -0.147R - 0.289G + 0.436BV = 0.615R - 0.515G - 0.100BR = Y + 1.14VG = Y - 0.39U - 0.58VB = Y + 2.03U7)彩色变换 对每个颜色分量进行独立变换,方法类似灰度变换。第八章 图像压缩1、图像中的信息冗余1)空间冗余:一幅图像记录了画面上可见景物的颜色。同一景物表面上各采

27、样点的颜色之间往往存在着空间连贯性,但是基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间连贯性,从而产生了空间冗余。我们可以通过改变物体表面颜色的像素存储方式来利用空间连贯性。达到减少数据量的目的。2)时间冗余序列图像一般位于一时间轴区间内的一组连续画面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,称为时间冗余。3)结构冗余在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等,称为结构冗余,若已知分布模式,可以通

28、过某一过程产生图像4)知识冗余有些图像的理解与某些知识有相当大的相关性。例如,人脸的图像有固定的结构,嘴的上方有鼻子,鼻子的上方是眼睛,鼻子位于正脸图像的中线上。这类规律性的结构可由先验知识和背景知识得到,称为知识冗余。知识冗余是模型编码主要利用的特性。5)视觉冗余人类的视觉系统对图像场的敏感性是非均匀和非线性的。然而,在记录原始的图像数据时,通常假定视觉系统是线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开来编码)更多的数据,称为视觉冗余。2、 图像的信息熵信息论指出,若一个离散,无记忆信源有K个符号a1,a2,a3,ak组成,各个符号

29、出现的概论分别是:p(a1),p(a2),p(a3)p(ak),则符号ak的信息量为(单位bit): 平均信息量为:信息论的创始人Shannon(仙农)利用热力学熵的概念来度量信息的不确定性,将H(U)称为信息源的熵(信源符号的平均信息量). 单位:bit/符号例:一串字母x=aaabbbbbbbbbccaaabbcbb.试求该信源的熵.解:字母表S=a,b,c, 因为有6个a,13个b,3个c,共22个字母,所以他们的概率密度函数分别是: P(a)=6/22=0.27 P(b)=13/6=0.59 P( c)=3/22=0.14信源的熵:熵编码:如果要求编码过程中不丢失信息量,即要求保存信息

30、熵,这种信息保持编码叫熵编码。熵编码包括香农编码、霍夫曼编码和算术编码等,其宗旨在于找到一种编码使得平均码长到达熵极限,基本思想就是对出现概率较大的符号取较短的码长,而对出现概率较小的符号取较大的码长,也就是变长编码(VLC)。3、信源编码理论数据压缩技术的理论基础是信息论中的信源编码理论,其主要解决的问题:(1)数据压缩的理论极限。(2)数据压缩的基本途径。 根据信息论的原理,可以找到最佳数据压缩编码的方法1)有损压缩与无损压缩无损压缩:重构后的数据与原来的数据完全相同一个很常见的例子是磁盘文件压缩。根据目前的技术水平,无损压缩算法一般可把普通文件数据压缩到原来的1/21/4。一些常用的无损

31、压缩算法有:霍夫曼算法和LZW压缩算法,游程编码等。有损压缩:是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不会让人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。2)无失真信源编码定理设离散、无记忆信源的熵为H(U),若用二进制码对其作变字长编码,则一定可以找到一种编码方式,其平均码长满足:左边不等式表明:信源的熵是无失真二进制编码平均码长的下限. 换句话说:若要对一信源进行无失真二进制编码,其平均码长最小是信源的熵.根据Shannon信息论,一个较为理想的编码,其平均码长应与信息熵相匹配。而对于一个独立信源S为a1,a2,an,各

32、符号出现的概率为p(a1),p(a2),p(an)。对其信源符号所实施的变字长编码的平均码长为:其中mi是各符号对应的编码的位数.例: 有一幅40个象素组成的灰度图像,灰度共有5级,分别用符号A、B、C、D和E表示,40个象素中出现灰度A的象素数有15个,出现灰度B的象素数有7个,出现灰度C的象素数有7个等等,如下表所示。如果用3个位表示5个等级的灰度值,也就是每个象素用3位表示,编码这幅图像总共需要120位。符号ABCDE出现次数157765按照香农信息理论,这幅图像的熵为:H(U)=-(15/40)×log2(15 /40)+(7/40)×log2(7/40)+(5/4

33、0)×log2(5/40)=2.196bit/符号若使用这种方法进行编码:出现概率大的符号分以短码,出现概率小的符号分以长码,得到的总位数为91,平均码长为2.275/码字,实际的压缩比约为1.3:1。编码效率: 3)有限失真编码理论 平均互信息量:信源发出信息uk,经过编、译码过程,得到的信息vl与uk 可能不相等,这是由噪声所造成的。我们定义信源编码经过编、译码的平均互信息量为:率失真函数在一定允许的失真D条件下最低的平均互信息量称为率失真函数:R(D)是在平均失真小于允许失真D以内能够得到的编码的码率下界。香农的信源编码定理:一个具有率失真函数R(D)的信源,若有平均失真D,并

34、有两个任意小的正数与,则必存在一种信源编码、译码方法使信息率和平均失真率满足 香农信源编码定理只说明了码率在一个界限以上编码的可能性,并没有给出具体的编码方案。香农的信源编码理论对图像编码起着重要的指导作用。4)图像压缩的性能指标 压缩比 表示压缩前每象素的平均比特数与压缩后每象素的平均比特数之比。平均码字长度 设图像中第k个码字的长度为, 其出现的概率为,则平均码长定义为:编码效率:冗余度:4、哈夫曼编码哈夫曼编码是一种利用信息符号概率分布特性的变字长的编码方法对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码。步骤:1)分配码字长度时,首先将出现概率最小的两个符

35、号的概率相加,合成一个概率;2)第二步把这个合成概率看成是一个新组合符号的概率;3)重复上述做法,直到最后只剩下两个符号的概率为止; 4)完成以上概率相加顺序排列后,再反过来逐步向前进行编码;每一步有二个分支,各赋予一个二进制码;5、算术编码基本思想:算术编码不是将单个信源符号映射成一个码字,而是把信源符号表示为实 数0到1之间的一个区间(interval,也称子区间),其长度等于该消息的概率。消息序列中的每个元素都要用来缩短这个区间。消息序列中元素越多,所得到的区间就越小,就需要更多的数位来表示这个区间。再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。算术编码的特点:算术编

36、码可以是静态的或者自适应的,且无需传送码表。编码方法复杂。实际编码性能较佳。对一些图像的测试结果表明,算术编码比Huffman编码提高了5%左右的效率,因此在JPEG的扩展系统中,用算术编码取代了Huffman。算术编码的基本规则如下:(1) 初始状态: 编码起点 C0=0, 区间宽度A0=1。(2) 新编码点: 式中:Ci-1是原编码点,Ai-1是原区间宽度, Pi为所编符号对应的累积概率。新区间宽度: 式中:pi为所编符号对应的概率。 算术编码举例:假设信源符号为x1,x2,x3,x4,这些符号的概率分别为 0.1,0.4,0.2,0.3 如果消息序列的输入为:x3 x1 x4 x1 x3

37、 x4 x2。试进行算术编码。 解:根据这些概率可把间隔0,1)分成4个子间隔0,0.1), 0.1,0.5), 0.5,0.7), 0.7,1)0.10.50.71具体编码过程:首先输入的符号是x3,找到它的编码范围是0.5,0.7)。由于消息中第二个符号x1的编码范围是0,0.1),因此它的间隔就取 0.5,0.7)第一个十分之一作为新间隔0.5,0.52)。依此类推,编码第3个符号x4时取新间隔为0.514,0.52),编码第4个符号x1时,新间隔为0.514,0.5146),。消息编码输出可以是最后一个间隔中的任意数。6、游程编码-RLE基本思想:游程编码通过将信源中相同符号序列转换成

38、一个计数字段再加上一个重复字符标志实现压缩。对图象进行行扫描时,各象素的灰度级可组成一个整数序列x1, x2, , xN。在游程编码中,我们将这个序列映射成整数对(gk, lk),其中gk表示灰度级, lk表示游程.游程: 数字序列中连续出现相同符号的一段。二元序列的游程:只有“0”和“1”两种符号。连0的个数称为0游程;连1的个数称为1游程.游程变换:二元序列000101110010001 可变换成如下游程序列 30 11 10 31 20 11 30 117、预测编码 1)预测编码的基本原理利用图像信号的空间或时间相关性,用已经传输的像素对当前的像素进行预测,对预测值和真实值之间的差值进行

39、编码。常用的预测编码:差分脉冲编码调制,用DPCM表示,DPCM不直接传送图像样值本身,而是对实际样值Xn与他的一个预测值Xn之间的差值即预测误差(EnXnXn)进行再次量化,编码。2)DPCM工作原理8、变换编码变换编码的一个极其重要的作用是将信号中的能量尽可能集中在少数几个系数上,对这几个变换系数进行量化和传输,这样图像压缩率有明显的提高几乎所有的图像变换编码器都采用基于块的DCT变换研究表明小波变换编码效果比DCT编码效果要好,但DCT仍是当今图像编码的主流,原因是DCT比较容易理解,并且经过多年的改进,DCT的编码效果和速度有明显的提高。在新一代静止图像编码标准中,小波变换可以替代DC

40、T或作为DCT的补充手段。离散余弦变换(DCT)9、图像量化1)量化分类量化可以分为两类: (1) 标量量化:所有采样使用同一个量化器进行量化,每个采样的量化都和其它所有采样无关,因此也称为零记忆量化。 (2) 向量量化:是从称为码本的码字集合中选出最紧密适配于输入信号的一个码字来近似一个输入信号向量,这种方法以输入信号与选出的码字之间失真最小为依据。 向量量化与标量量化相比有更大的数据压缩能力。向量量化经常与其他的编码方法一同构成混合方法使用。最常用的组合是:向量量化与变换编码结合使用,在图像进行变换之后,按一定方式形成多维向量组,然后到码本中寻找最佳码字。2)标量量化标量量化的输入/输出特

41、性可以用阶梯形函数的形式来表示 3)向量量化标量量化考虑的是单独对图像中每个像素值进行量化。向量量化考虑图像中象素值之间的相关性,对图像中一组像素进行量化。标量量化设计的是一维码字,而向量量化中设计的是多维的码字。矢量量化的一个关键问题是码书的设计。码书设计最常用的方法是LBG算法。4)向量量化的一般过程10、图像与视频编码标准1、JPEG标准与静止图像编码1)JPEG编码的总体框架2)编码步骤 分块把原始图象分成8×8像块f(x,y) ,之后进入DCT变换器。DCT变换作DCT变换得系数块F(u,v)。在DCT系数块中,直流系数F(0,0)最大,能量主要集中在左上角低频区,高频系数

42、较小。量化对系数F(u,v)进行量化,F(u,v)Q = F(u,v)/Q(u,v)取整数,Q(u,v)称为量化系数矩阵。JPEG推荐了Q(u,v)量化表。量化后的F(u,v)Q 高频系数已经大部分为零,能量主要集中在低频系数上。之字型扫描由于右下角高频区的大部分系数为0,编码时不对单个0编码,而只对0的游程(连续0的个数)编码,为了制造更长的0游程,对变换系数矩阵采用Z字形扫描读出方式。这样排在后面的大多是一串0系数,因此提高了0游程编码的编码效率。由于直流系数F(0,0)较大,应和前一个块的直流系数进行差值编码。熵编码为了消除编码码字中存在的统计冗余,采用变字长熵编码。分别对非0系数和0系

43、数游程这两个事件合并成一个二维联合事件(一维是0游程的长度,另一维是紧接在此0游程后的非0系数的幅值)出现的概率作统计,设计Huffman码表。3)量化表2、MPEG标准与视频编码 1) 视频结构 视频序列视频序列也称图像序列,它是随机选取节目的一个基本单元。从节目内容看,一个视频序列大致对应于一个镜头。切换一个镜头, 即表示开始一个新的序列。图像组图像组是将一个图像序列中连续的几个图像组成一个小组,简称为GOP。它是对编码后的视频码流进行编辑存取的基本单元。图像图像是一个独立的显示单元,也是图像编码的基本单元,可分为I、 P和B三种编码图像。 I帧(Intra coded picture,帧内编码图像帧):不参

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论