图像压缩技术

上传人：7*** IP属地：湖北上传时间：2022-02-02 格式：DOC 页数：11 大小：37KB 积分：20 举报 版权申诉

已阅读5页，还剩6页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、武汉理工大学硕士研究生课程论文课程：图像处理技术任课教师：学期：2009-2010年度第2学期成绩图像压缩技术综述姓名涂希学号 104972092495 院系信息工程学院专业通信与信息系统班级信研0904 提交时间：2010年06月 26图像压缩技术综述摘要：图像压缩就是把图像文件压缩变小，同时图像的质量不可失真到不能接受的程度，以便在一个给定的储存空间中，保存尽可能多的文件，并加快信息在网络上的传递速度，因此已成为当前的一项极其重要的研究课题，进展极为迅速。本文阐述了它的基本情况和原理，并介绍了传统图像压缩方法基本概念和小波变换实现压缩图像原理。关键词：图像压缩、图

2、像编码、小波变换、压缩比Abstract：Image compression technique can compress the volume of an electronic document without seriously affecting the image quality thus increasing the storage capacity of a given memory space and speeding up the information transmission on the internet, consequently becoming a hot rese

3、arch subject all over the world at the present time. Its research has been advancing very quickly. This paper presents an outline of its advancement and the general working mechanism, and introduces the basic concepts of the traditional method of image compression and wavelet transform image compres

4、sion theory.Keywords：image compression; image coding; wavelet transform; compression ratio 一幅图像的数字表示需要很大的比特数。图像压缩的目的在于降低这个比特数到最小程度并且重现原始图像的忠实样本。图像压缩的早期研究是以信息理论作为指导思想的，并得出许多种压缩方法。在二十年前图像压缩比已达到10:1。这并不意味着由讯源熵给定上限已达到。首先，这一熵值是未知的，主要取决于讯源模型，亦即数字图像的模型。其次，信息论是不能具体说明人的眼睛是观察什么及如何观察的。最近，人视觉的脑机理的研究开拓了图像压缩技术的新

5、纪元。视觉信道的神经元指向性灵敏度与围线和纹理的分别处理会引出一类新的压缩方法。当然，这是图像质量有待研究的重要问题。利用局部算子以适当的方式和利用围线、纹理描述组合其输出，这些方法都应用于同一个原始图片，并比较重现后的图片以确定其质量优劣。1. 引言每一图像获取系统（显像密度计和电视摄像机）由空间抽样和亮度模拟场景的量化产生图像数据。抽样间隔通常选择得足够小以避免内插及领先人视觉系统的积分能力。一幅数字图像是一个N×N维整数矩阵或N2个像素，每个像素的表示为8比特，则总共需要8N2比特的信息量。这一矩阵通常称为数字图片的规范形式。因为这里规范形式的图片需要很大比特数，例如512&

6、#215;512个像矩阵，每像素8比特，则需要2×106比特，这是一个相当大的数字。图像压缩的目标是尽可能大地降低表示和重建原始图像所必须的比特数。这里有两个基本的理由。首先，任何图像数据不是随机的，相邻样本具有相近的灰度值，因而体现出重要的相关性。如果这一相关性以适当的方式加以利用，8N2的比特数就可以被降低。我们把根据这一图像压缩基本观点的方法称作第一代方法。第二个理由是第一个理由的延伸，接下来考虑自然图像的规范形式，如一幅肖像，一个场景，场景中有树木和房子，或一幢建筑物等等。我们可能会问：我们能否找到这一图像某种表示它的规范形式。笛斯卡特著名论断是：一幅图片抵得上一千个字，大

7、约20比特就足以表示它。图像信息压缩不仅是可能的，而且可以压缩几个量级。由于遍历性和平稳性的假设对图像数据而言，通常是不适用的，图像数据源熵是未知的，而且很大地依赖于所用的图像模型。我们把能获得超过饱和压缩比的方法全部称为第二代压缩法。一般图像压缩基本上分两步进行，第一步图像数据转换成信息序列，第二步把字赋于信息序列。人的眼睛是一个图像处理系统，它也绝非是理想的。这样一来，若编码方案与人的视觉系统相匹配并企图仿效其功能，至少对于其已知部分，可以获得很高的压缩比。用这些意图设计的几个方法可使压缩比达到70:1。因此，在运用经典的编码理论获得高压缩比之前，用这种方法预处理图像的规范形式看起来是完全

8、合理的。对于预处理的指导需要什么呢？一幅图像可以借助于几种可能的方式来描述，如规范形式下的像素、小方块中的像素组、线性预测值或其导数。随着视觉模式识别和场景分析的不断进步，可以周围线和纹理来描述一幅图像。围线或等值线称为图像中灰度值的突然变化。按照实变性，如强或弱等值线的加强可以被采用。从另一方面来看，在模式认别中纹理成为一个有意义的中心。显然大多数研究是对纯纹理图像而言的，纹理的明显定义不存在，这主要是因为纹理与人的视觉有关，具有主观成份。最适当的定义依靠移位不变性并表明其中所含的小量的结构信息。从编码含义上说，纹理是图像中围线除外的其余部份。高压缩比获得的一个可能方法是藉助于由围线所包围的

9、纹理区域来表示，用这种表示方法把相应的区域看成是场景的目标。对围线的有效编码是存在的，原因是低的信息成份，使纹理区域同样能有效地编码。2. 传统的图像压缩方法一幅数字化图片可以由一信息序列来刻画。选择信息序列存在着很多方式。唯一的要求是从信息序列重建出原始图片的忠实复本，并且降低其剩余度。选择信息及把码字赋于它们的特殊方法成为专门的压缩算法。例如，信息可以规范数字图片的每一个像素的亮度级，或一组像素的亮度级，或从一组像素计算的函数值。在这里，我们简述第一代图像压缩方式。编码方式最初分成有信息损失法和无信息损失法两类。无信息损失法可以精确地重建出原始图片，而有损失信息法会引起失真，但能使它小到

10、可允许的范围。第二种分类方法是基于图像是在空间域或变换域进行的，在空间域以适当方式组合像素值的方法称为空间域方法。相对而言，利用像素的变换系数的方法称为变换法。如果在空间域及变换域同时进行的压缩方法称为混合法。另一种分类方法是基于使压缩的参量是固定的或是自适应的意义而划分的，而适应法是让参量作为图像数据局部地变化而言的。2.1. 空间法空间域图像压缩可以有六种形式，其中包括脉冲编码调制、预测编码、差分脉冲码调制、Delta 调制、内插编码及比特平面编码这六种方法。空间域图像压缩的主要特点有：（1）脉冲编码调制这种压缩方法可接受的图片质量是由每像素3比特量化值，压缩比C=2.6至C=1.0，

11、颤动法可以用来改进图像的质量，全然没有利用人的视觉特性。（2）预测编码预测法通常不利用人的视觉系统的特性，对于8比特的规范形式运用两维预测所获得的压缩比约为4:1。若预测参量以适当方式与数据自适应，则预测法便为自适应的。例如，一局部性测量可以定义，则预测参量在每一显著的变化时可以被修正。用自适应修正，压缩比可以增加百分之一到二十左右。预测的特例是差分脉冲编码调制。（3）差分脉冲编码调制脉冲编码调制可获得压缩比为2.5:1，自主适应脉冲编码调制可使压缩比达3.5:1。（4） Delta调制用这种方法所获得的压缩比虽然不高，但方法相当简单。（5）内插编码最通用的内插方法是零阶和一阶内

12、插器，它能获得大约4:1的压缩比。高阶多项式或样条函数也能使用，但是其计算复杂性不能证明其结果的有效性，再则是未利用人的视觉系统的性质。（6）比特平面编码用比特平面编码法在未涉及人的视觉系统特性时可以获得平均压缩比约为4:1。2.2. 变换法变换法编码的基本思想是把一组数据或像素变换成另一种数据，然后进行编码，逆变换复原出原始图像。大多数通用的变换是用快速算法实现的，一般是高效算法。主要的线性变换有卡享南勒维变换、傅里叶变换、哈德码变换、哈尔变换、正弦、余弦及斜变换等等。（1）卡亨南勒维变换此变换在得到不相关的变换系数的意义上而言是最佳线性变换。不过，由于其计算的复杂性在实际上未被采用

13、，它给出了去掉数据样本的相关性，计算上更有效的其它正交线性变换的上限。（2）快速变换这里有许多线性变换是傅里叶变换、哈德码变换、哈尔变换、正弦、余弦和斜变换等。这些变换和卡享南勒维变换的一个重要区别是不取决于输入图像的统计特性。（3）编码方法在变换编码中有好几种编码方法。首先，要确定变换的维数。一幅静止的图片既可用二维变换也可用一维变换。变换后的系数再逐行进行编码。下一个固定的参量是变换的点数。一个通用的方法是把N×N的图像矩阵分成若干个M×M的子图像，M还小于N，比如说M=32,N=512，并且单独地变换每一个子图像。这些变换的重要特性是把所有“重要的系数”填满了变换

14、域中的特定区域。重要压缩可以得到有效地依赖于给定区域中的系数的数目，压缩比达10:1。另一种途径是对变换系数的幅度设定一个门限值，并设低于门限值的系数为0。在得到较好质量编码图片的情况下，压缩比达15:1左右。虽然有些证据表明人的视觉系统不是一个线性变换器，其基本的特性也许包括在变换编码的设计中。在编码器的参量与被编码的子图片的统计特性相匹配的情况下使变换编码成为自适应编码。自适应可以在变换级、比特分配级或量化电平级进行。自适应编码同非自适应编码比较，会增加25至30%。最后我们提一下混合编码方法。顾名思义，混合编码是变换编码和预测编码的组合。DPCM和变换编码法具有某些吸引人的特点和某些限制

15、，这种方法获得压缩比约为8 :1，同时具有硬件简明性及稳健性。2.3. 合成高系统合成高系统的产生和发展经过了近三十年的历史，这一方法的重要性是它导致了第二代数据压缩技术的进展。在过去没有很好发展的直接原因是由于其计算量大而又使电脑存储量大，而在上世纪八十年代以来由于电脑速度猛增，使得这一方法的实现和普及得到令人满意的程度。它同现代一些方法相比，它能获得很高的压缩比。同时它为发展第二代图像编码压缩技术提供一条有益，而且十分有效的新途径。国际上许多研究都是基于把一幅图片分解成低频成份和高频成份两部份，它是直接或间接地利用合成高系统分别进行编码压缩，然后进行综合，获得原始图像的很高系统的压缩性能。

16、合成高系统用的信息序列以下述方式来选择。原始图片分成两部份：低通图片没有很锐的围线而给出一般的面积亮度，高通图片含有很锐的边缘信息，根据两维抽样定理，低通图片可由很少的样本表示。这些样本是说明规范形式的低通信息的样本。边缘检测可用梯度算子或拉普拉斯算子来实现。非线性运算取门限是对高通图片执行的，以确定是否边缘点是重要的。于是，这一方法是成为无损信息的。最后，每一个选择的边缘点的位置和幅值被编码。这些变量是说明高通图片的迅息。两维重建滤波，其特性唯一地用于低通图片的低能滤波来确定，同时用于综合从边缘信息来的高频分量。合成高系统精巧地利用了视觉系统的特性。利用横向禁止现象在早期处理级考虑视觉系统

17、的性能。因而，它允许降低较大的剩余度。在合成高系统中，门限的正确利用是十分重要的。这样可以获得很高的压缩比及良好的图像质量。若门限选得太低，虽然图像质量很好，但压缩比很小。反之，若门限选择得太高，图像质量差，但压缩比很大。在压缩比和图像质量之间的折衷方法目前还没有，可以运用经验方法来获得很好的结果。指向性分解法是合成高系统的细化，在那里提取边缘和对边缘编码可以运用指向性滤波器。3. 小波变换压缩方法小波图像压缩编码原理是基于Mallat塔式算法的基础上提出的。Mallat塔式算法的思想是：在选取好小波基的基础上将一幅图像经过小波变换分解为一许多不同尺度、方向、空间域上局部变化的子带图像。按照这

18、种算法思想把一幅图像经过一次小波变换后分解为4个子图像：LL代表原始图像的特征分量，它包含原始图像的基本内容；LH、HL和HH分别表示垂直向下、水平向右和斜对角线的高频特征分量，它们分别包含了图像数据垂直方向、水平方向与斜对角线方向的边缘、纹理和轮廓等。这里需要说明的是LL子带包含了图像的大部分数据，随后的小波变换都是在上一级变换产生的低频子带的基础上再进行小波变换。小波变换实现图像压缩的一般步骤：首先选择一组合适的正交小波基函数，目的是保证多级小波分解时有正交特性，从而有利于图像压缩编码。其次对所要处理的图像进行多级小波分解，把原始图像分解为低频分量和水平向下、垂直向右以及斜对角线的高频分量

19、。第三，根据所得到的不同频率分量分别实施不同的量化和编码操作。通过利用小波变换算法思想就可以把原始图像数据分解为不同频率分量的子带数据，然后分别对不同频率分量的数据实施不同的编码算法，就达到了对原始图像的压缩目的。目前3个比较经典的小波图像编码分别是嵌入式小波零树图像编码(EZW),分层小波树集合分割算法(SPIHT)和优化截断点的嵌入块编码算法(EBCOT)。3.1. EZS编码算法EZW算法中采用的零树结构充分利用了不同尺度间小波系数的相似特性，有效地剔除了对高频小波系数的编码，极大的提高了小波系数的编码效率。EZW 算法以极低的复杂度获得了高效的压缩性能，产生的码流还具有嵌入的特性，支持

20、渐进传输，因此EZW 算法在小波图像编码史上就有里程碑式的意义。零树小波编码基于三个关键的思想：（1）用小波变换去相关；（2）利用小波变换的内在自相似性在各级之间预测重要信息的位置；（3）用自适应算法编码进行无损压缩。3.1.1. 零树结构一个零树的数据结构可以定义如下：一个小波系数x，对于一个给定的阈值T，如果|x|<T,则称小波系数x 是不重要的。如果一个小波系数在一个粗的尺度上对于给定的阈值T 是不重要的，而且在较细的尺度上在同样空间位置处的所有小波系数对于阈值T 也是不重要的，则称这些小波系数形成了一个零树。这时，粗尺度上的小波系数称为父节点，它是树根，在较细尺度上相应位置上的

21、小波系数称为子节点。采用这种零树结构可以使得用于描述重要系数位置的信息大为减少。 EZW 算法使用了四个符号进行编码：零树根、孤立零点、正重要值、负重要值。孤立零点表示当前系数值是不重要的，但它的子孙中至少有一个是重要的。正/负重要值表示当前系数是一个正/负的重要值。通过这四个符号，各子带按图1 所示的顺序对小波系数进行扫描，对小波系数进行判断，并将相应的符号放入一个表中，从而形成了一个符号表。3.1.2. 基于SAQ的嵌入式编码在EZW 编/解码过程中，始终保持着两个列表：主表和副表。主表包括编码中的不重要的集合或系数，其输出信息起到了恢复各重要值的空间位置的作用；而副表包括编码中的有效

22、信息，输出为各重要系数的二进制值。编码分为主通、副通两个过程。在主通过程中，在给定阈值下，主表进行扫描编码，若为重要系数，则将其幅值加入副表，然后将该系数在数组中置为零，这样当阈值减小时，该系数不会影响新零树的出现；在副通过程中，对副表中的重要系数进行细化，细化过程相当于比特平面的编码过程。零树结构和SAQ 相结合构成的编码器的工作过程可以概括如下：首先给出初始化阈值，进行第一次主扫描，若是重要系数，则将其幅值加入副表，然后将该系数在数组中置为零；接下来进行第一次副扫描，细化重要值的表示。更新阈值,进行新一轮主扫描，对已经发现的重要小波系数的位置不再扫描；主扫描结束，进入副扫描，对原已发现的

23、重要值和新发现的重要值进行细化处理。重复上述过程，直到满足要求为止。EZW的编码思想是不断扫描变换后的图像，生成多棵零树来对图像进行编码。由于编码时它形成多棵零树，因而需要多次扫描图像，造成效率很低。而在一颗零树中包含的元素越多，则越有利于数据压缩，在EZW 算法中存在这样的树间冗余。人们通过对小波系数的分析发现，在同一子带中相邻元素间有一定的相关性，尤其在高频子带中存在大量的幅值很低的系数，所以可以通过子带的集合把这种大量的系数组织到一起，达到数据压缩的目的，而EZW 算法并没有充分利用这种相关性。在EZW算法的基础上，许多学者又进行了深入的研究，并提出了一些更为高效的小波图像编码方法，这类

24、编码器被统称为“零树编码器”。3.2. SPIHT编码算法 SPIHT 算法继承了EZW 算法的三个主要思想:（1）把小波系数按照幅值排序编码传输，同时解码器也按同样的算法,以实现从执行中复制编码的排序信息；（2）细化重要系数的位平面传输；（3）利用小波系数不同尺度同一方向的系数间的自相似性。 SPIHT 算法同样利用了树的结构,并且对重要的树集合进行进一步的分割,目的是使更多不重要系数包含在同一个集合里,从而提高压缩效率。在SPIHT 算法中,使用了如下的集合定义：其中Z(i，j)为系数x(i，j)及其所有后代节点的集合，D（i，j）是系数x（i，j)的所有后代节点集合，O（i，j）是系数

25、x（i，j)的直接后代节点的集合,L(i，j)是系数x（i，j）除去直接后代的其它所有后代节点的集合，集合分割策略为： Z(i，j)=x(i，j)+D（i，j）（1） D（i，j）=O（i，j）+L(i，j) （2） L(i，j)=D（i，j），（k，j）（3） SPIHT 算法通过初始化、分类扫描、细化扫描和阈值更新四个子过程来完成图像的编码,过程中使用了三个链表来记录相关信息：不重要系数链表、不重要集合链表以及重要系数链表。初始化就是把整个系数矩阵分成了树头节点x（i，j)（放入不重要系数链表）和剩余集合D（i，j）（放入不重要集合链表）。分类扫描就是从以上的所有x（i，j) 和D

26、（i，j）中找出重要系数并放入重要系数链表中,以供细化处理,在这个过程中就用到了集合分割策略,不断地对重要集合进行分割,直到找出所有的重要系数,并放入重要系数链表中。细化扫描,就是对重要系数链表中的每一项(除了在当前阈值进入重要系数链表的系数) 。在阈值为2n时,输出它的第n个位平面的值。阈值更新，就是将n减1 ，即阈值减半，然后又重复进行分类扫描和细化扫描，直到编码结束，或达到目标码率，停止编码。3.3. SPIHT编码算法 EBCOT算法包括嵌入式块编码和分层装配两个结构。嵌入式块编码是EBCOT 的基础, 其输出的码流不仅包含块信息, 而且也包含附加信息。 EBCOT 将待编码的小波图像

27、分成尺寸相对较小的独立编码子块，对每个子块进行独立编码得到嵌入式码流，进而对块间的码流进行组织以进一步提高压缩性能，它的编码过程如下：（1）将原始图像进行小波变换，得到小波图像以降低图像数据的相关性；（2）把小波图像分成许多较小的编码子块Bj，Bj是独立压缩编码的主体，通过对Bj的独立优化编码，可充分利用块内数据冗余，获取较高的压缩性能；（3）将位平面进一步细分为“分数位平面”以获取更多的可截取点，并对这些截取点进行优化，达到更好的可嵌入性；（4）设置专门的“第二层编码”，组织相互独立的块码流，从而提供功能上的丰富性。在EBCOT 算法中，最小编码单位是编码子块，简称“码块”，用字母Bj表示

28、，码块的分割是在图像经小波变换后得到的子带图像中进行。编码前需把小波图像中各个子带图像tbj分割成码快Bj(j=1,2,q)，分割完成的编码子块应互不交叉，同时编码子块不跨越子带边界，而且除边缘码块外其余的码块形状与大小均需相同。一般，编码子块的形状取正方形，大小为2n×2n像素。量化是有损压缩的基础，通过量化处理可以进一步提高图像压缩倍数，这种压缩倍数的提高是以牺牲重构图像质量为代价。EBCOT 算法中量化产生的编码是嵌入式的，它包含两重含义：（1）分辨层渐进编码，即优先保留低分辨率系数，然后逐步加入高分辨率细节系数；（2）质量层渐进编码，即在同一码块内先保留系数的高位比特。对于每个子带图像，用户根据视觉特性或者编码比特率控制的要求选择合适的量化步长，将子带中的小波系数进行量化，量化过程会产生量化误差。最终的压缩数据由各个编码块的码流组成。每一个编码块都在一个固定的分辨率上，所以这种简单的封包形式具有“分辨率可伸缩性”。同时，因为每一个编码块只影响图像的一个区域，所以此封包形式还具有一定的“空间可伸缩性”, 这样，如果对一个空

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

图像压缩技术

文档简介

温馨提示

最新文档

评论

图像压缩技术

文档简介

温馨提示

最新文档

评论

相关文档