图像压缩技术的综述.doc_第1页
图像压缩技术的综述.doc_第2页
图像压缩技术的综述.doc_第3页
图像压缩技术的综述.doc_第4页
图像压缩技术的综述.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题目:图像压缩技术的综述学生姓名: 徐欢 学号:070110117系别:计算机与信息学院 专业:计算机科学与技术入学年份:2010年 9月导师姓名:陈蕴谷 职称/学位:讲师/硕士研究生导师所在单位:中国科学院合肥物质研究院完成时间:2014年4月1.引言 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 图像数据是用来表示图像信息的,如果不同的方法为表示相同的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然代表了无用的信息,或者是重复的表示了其他数据表示的信息,前者成为数据冗余,后者成为不相干信息。图像压缩编码的主要目的,就是通过删除冗余的或者是不相干的信息,以尽可能地的数码率来存储和传输数字图像数据。 图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。 图像编码基础图像编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。编码技术比较系统的研究始于Shannon信息论,从此理论出发可以得到数据压缩的两种基本途径。一种是联合信源的冗余度也寓于信源间的相关性之中,去除他们之间的相关性,使之成为或基本成为不相干信源,如预测编码,变换域编码,混合编码等,但也都受信息熵的约束。总体上可以概括为熵编码,预测编码,变换编码,也成为三大经典编码方法。另一种是设法改变信源的概率分布,使其尽可能地非均匀,再用最佳编码方法使码长逼近信源熵。使用此途径的压缩方法其效率一般以其熵为上界,压缩比饱和于10:1,如Huffman编码,算术编码,行程编码等。随着人们对传统压缩编码方法的深入研究和应用,逐渐发现了这些传统方法的许多缺点。如高压缩比时回复图像会出现方块效应,人眼视觉系统(HVS)的特性不易被引入到算法中等。为了克服这些缺点,1985年M.Kunl等人提出了第二代图像压缩编码的概念。经过近20年的发展,在这一框架下,人们踢出了鸡枞新的编码方法:分形编码,小波变换编码和基于模型的编码方法等。于是,对数据压缩技术的研究就突破了传统Shannon理论的框架,使得压缩效率得以极大提高。图像编码基本原理数字图像的冗余主要表现为以下几种形式:空间冗余,时间冗余,信息熵冗余,结构冗余和知识冗余。图像数据的这些冗余信息为图像压缩编码提供了依据。图像编码的目的就是充分利用图像中存在的各种冗余信息,特别是空间冗余,时间冗余以及视觉冗余,以尽量少的比特数来表示图像。利用各种冗余信息,压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,它是使数字信号走上实用化的关键技术之一,虽然表示图像需要大量的数据,但是图像数据是高度相关的,或者说存在冗余信息,去掉这些信息后可以有效压缩图像,同时不会损害图像的有效信息。 2.常用的编码方法及其分类 图像压缩分为无损压缩和有损压缩,有损压缩分为预测编码,变换编码,混合编码 ,有损编码分为:JPEG,MPEG,P*64,无损编码分为:Lempd Zew,Huffman编码,行程编码,算数编码。 目前常用的数字图像压缩编码方法可分为两大类:一是冗余压缩发,也称为无损压缩发;另一无损压缩的算法删除的仅仅是冗余的信息,因此可以在解压缩时精确的恢复原图像。有损压缩的算法把不相干的信息也删除了,解压缩时只能对图像进行类似的重构,而不能精确的复原,所i有损压缩算法可以达到更高的压缩比。 对于多数图像来说,为了达到更高的压缩比,保真度的轻微损失是可以接受的;有些图像不允许进行任何修改,只能对他们进行无损压缩。无损压缩利用数据的统计特性进行数据压缩,其压缩率一般为2:1至5:1。有损压缩不能完全恢复数据,而是利用人的视觉特性(人的眼睛好比是一个“积分器”)使解压缩后的图像看起来与原始图像一样。压缩比随编码方法的不同差别较大。 2.1 预测编码 在图像中,相邻像素通常在灰度上存在较大的相关性,因此,图像中某一像素的灰度可以用邻近的若干个像素灰度来估计。只对实际值和预测值的差进行编码和传输。因为预测编码是根据信号的一些已知情况,预测信号可能发生的情况,所以预测时有误差,如果预测比较准确,误差就较小,预测编码就能达到压缩数据的目的。典型预测编码的压缩算法有:DPM(差分脉冲调制)和ADPCM(自适应差分脉冲调制)。 2.2 Huffman编码 无失真编码方法中,Huffman编码是一种较有效的编码方法。Huffman编码是一种长度不均匀的,平均码率可以接近信息熵值的一种编码。他的编码思想是:对于出现概率较大的信息,采用字短的码,对于出现概率低的信息采用字长的码,以达到缩短平均码长,从而实现数据的压缩。Huffman编码小变字长编码方法是最佳的,其码字平均长度很接近信息符号的熵值。Huffman编码的最高压缩效率可达到8:1. 2.3 行程编码 在一个逐行存储的图像中,具有相同灰度值的一些像素组成的序列称为一个行列。在编码时,对于每个行程只存储一个灰度值的码,再紧跟着存储这个行程码的长度。这种按照形成进行的编码被称为行程编码。行程编码是相对简单的一种编码,是指一行扫描的像素中,比较相邻像素的幅度(如:亮度),当幅度有一显著变化时,就说有一行程存在。随终点位置标记方法不同,行程编码可分为“行程终点编码”和“行程长度编码”。行程编码对于仅包含很少几个灰度级的图像,特别像二值图像,比较有效。量化编码器样本选择 2.4 变换编码增值F(u,v)变换f(m,n) F(u,v)f(m,n)迭变解码变换编码的原理框图如图所示,在发送端,原始图像被分成若干个相同大小的子图像,对每个子图像做变换,采用“区域采样”的方法,只取变换系数中幅度较大的元素,即变换结果阵列中的一些主要阵元进行编码,然后进行传输,而把其他幅度较小的大部分变化系数当作零,不予编码。在接收端,解码器将收到的信号进行解码,以零补足所有未被传输的阵元,然后对每个子阵进行相应的反变换,将每个反变换阵列拼起来便得到重建图像。只取变换阵列中的一些主要阵元进行编码和传输,本身就已经达到了一定程度的数据压缩效果,在辅以非线性量化,可以进一步压缩数据率。DCT变换,傅里叶变换和HARR变换等。2.5 矢量量化压缩方法前面说的预测编码,变换编码等都属于标量量化,即先将图像经某种映射变换变成一个数的序列,然后一个数一个数地进行量化编码。矢量量化(简称VQ)在近几年发展很快,它与标量量化方法不同,他把图像数据分成很多组,每组看成为一个矢量,然后逐个矢量进行量化编码。在VQ算法中,图像中的各种相关信息(如:各像素点见,各块之间以及相邻编码地址间等)可通过有效的码书设计得以充分地去除,矢量量化是限失真压缩编码方法,压缩比可达到40:1。2.6 统计编码统计编码是根据消息出现的概率分布特性而进行的压缩编码。其宗旨在于:在消息和编码之间找到明确的一一对应关系,以便在回复是能准确无误地再现出来,使平均码长或码率压低到最低限度。其中常用的有:Huaffman码,ShannonFano码,算数编码等,。行程编码就是其中一种典型的统计编码,他首先计算信源符号出现的行程长度,然后将行程长度转换成代码。这种方法0,1成片出现的数据压缩。2.7 混合编码 混合编码对信源数据同时使用两种或者两种以上的编码方法,能大大提高数据压缩的效率。静态图像压缩标准JPEG就是一种典型的混和编码的压缩标准。2.8 JPEG编码JPEG是联合图像专家组的缩写名称。JPEG致力于研制彩色的和单色的,夺回度连续色调的静态图像的数字图像压缩的通用国际标准。JPEG算法中首先对图像进行分块处理,一般分成互不重叠的 大小的块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后进行哈夫曼编码。JPEG的特点优点:(1)形成了国际标准; (2)具有中端和高端比特率上的良好图像质量。缺点:(1)由于对图像进行分块,在高压缩比时产生严重的方块效应; (2)系数进行量化,是有损压缩; (3)压缩比不高,小于50。 JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其结果不是最优的。 (1)DCT零树编码DCT零树编码把 DCT块中的系数组成log2N个子带,然后用零树编码方案进行编码。在相同压缩比的情况下,其PSNR的值比 EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。 (2)层式DCT零树编码 此算法对图像作的DCT变换,将低频块集中起来,做反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数进行零树编码。JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,因此在今后的研究中,应重点解决 DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合进行压缩。 基于DCT的JPEG标准的压缩是有失真的,DCT变换后系数的量化是引起失真的主要原因。压缩效果与图像内容本身有较大的关系。2.9 JEPG2000压缩 JPEG2000是由ISO/IEC JTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式JPEG2000图像压缩标准的编码算法。 JPEG2000压缩编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。 JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提高10%30%,而且压缩后的图像显得更加细腻平滑。对于目前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在JPEG2000系统中,通过选择参数,能够对图像进行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。由于JPEG2000采用小波技术,可随机获取某些感兴趣的图像区域(ROI)的压缩码流,对压缩的图像数据进行传输、滤波等操作。 3 数据压缩新技术 分形图像编码是在分形几何理论的基础上发展起来的一种编码方法,分形几何是欧氏几何理论的扩展,他描述了自然界物体的自相似性,这种自相似性可以引入迭代函数来刻画,并将其用于图像编码。基于分型的压缩方法分形(fractal)的应用十分广泛,与多媒体领域相关的应用的不规则几何造型,图像处理等方面。小波变换在图像压缩中的应用也取得了很大的进展,小波(wevelet)分解编码本质上是一种变换编码技术。简单地说,小波变换就是将原图像信号分解成不同的频率区域,对不同的频率区域采用不同的压缩编码手段,从而使数据量减少。这种犯法非常适合满足视觉要求的图像压缩编码方法,并且压缩比可以达到100左右。目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。(1)EZW编码器 1993年,Shapiro引入了小波“零树”的概念,通过定义POS、NEG、IZ和ZTR四种符号进行空间小波树递归编码,有效地剔除了对高频系数的编码,极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式,算法复杂度低。EZW算法打破了信息处理领域长期笃信的准则:高效的压缩编码器必须通过高复杂度的算法才能获得,因此EZW编码器在数据压缩史上具有里程碑意义。(2)SPIHT编码器 由Said和Pearlman提出的分层小波树集合分割算法(SPIHT)则利用空间树分层分割方法,有效地减小了比特面上编码符号集的规模。同EZW相比,SPIHT算法构造了两种不同类型的空间零树,更好地利用了小波系数的幅值衰减规律。同EZW编码器一样,SPIHT编码器的算法复杂度低,产生的也是嵌入式比特流,但编码器的性能较EZW有很大的提高。(3)EBCOT编码器 优化截断点的嵌入块编码方法(EBCOT)首先将小波分解的每个子带分成一个个相对独立的码块,然后使用优化的分层截断算法对这些码块进行编码,产生压缩码流,结果图像的压缩码流不仅具有SNR可扩展而且具有分辨率可扩展,还可以支持图像的随机存储。比较而言,EBCOT算法的复杂度较EZW和SPIHT有所提高,其压缩性能比SPIHT略有提高。 小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中,应充分考虑人眼视觉特性,进一步提高压缩比,改善图像质量。并且考虑将小波变换与其他压缩方法相结合。例如与分形图像压缩相结合是当前的一个研究热点。同傅里叶变换相比,小波变换在频率的精度上差一些,在时间的分析能力上好一些,而且对时间和频率可以同时分解,这就是傅里叶变换无法做到的。4、 其它压缩算法 除了以上几种常用的图像压缩方法以外,还有:NNT(数论变换)压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等,在此不作赘述。下面简单介绍近年来任意形状纹理编码的几种算法10 13。 (1)形状自适应DCT(SA-DCT)算法 SA-DCT把一个任意形状可视对象分成 的图像块,对每块进行DCT变换,它实现了一个类似于形状自适应Gilge DCT1011变换的有效变换,但它比Gilge DCT变换的复杂度要低。可是,SA-DCT也有缺点,它把像素推到与矩形边框的一个侧边相平齐,因此一些空域相关性可能丢失,这样再进行列DCT变换,就有较大的失真了111415。 (2)Egger方法 Egger等人1617提出了一个应用于任意形状对象的小波变换方案。在此方案中,首先将可视对象的行像素推到与边界框的右边界相平齐的位置,然后对每行的有用像素进行小波变换,接下来再进行另一方向的小波变换。此方案,充分利用了小波变换的局域特性。然而这一方案也有它的问题,例如可能引起重要的高频部分同边界部分合并,不能保证分布系数彼此之间有正确的相同相位,以及可能引起第二个方向小波分解的不连续等。 (3)形状自适应离散小波变换(SA-DWT) Li等人提出了一种新颖的任意形状对象编码,SA-DWT编码1822。这项技术包括SA-DWT和零树熵编码的扩展(ZTE),以及嵌入式小波编码(EZW)。SA-DWT的特点是:经过SA-DWT之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论