图像的编码与压缩课件_第1页
图像的编码与压缩课件_第2页
图像的编码与压缩课件_第3页
图像的编码与压缩课件_第4页
图像的编码与压缩课件_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七讲

图像的编码与压缩

第七讲

图像的编码与压缩

数据压缩最初是信息论研究中的一个重要课题,在信息论中数据压缩被称为信源编码。但近年来,数据压缩不仅限于编码方法的研究与探讨,己逐步形成较为独立的体系。它主要研究数据的表示、传输、变换和编码方法,目的是减少存储数据所需的空间和传输所用的时间。一、引言数据压缩最初是信息论研究中的一个重要课题,在信息论中为什么要压缩?

图像作为信息的重要表现形式,其具有数据量大、带宽宽等特点。

需要增加信道,但这很有限,因为信道的增加永远赶不上信息的爆炸式增长,况且还要受到环境的限制。

必须减少表示图像的数据量,以达到压缩图像数据的目的。为什么要压缩?

图像数据的特点之一是信息量大。以像幅为23cm×23cm的航摄影像为例,若按采样间隔25um、每象素8bit扫描,其数据量为84.5MB;一颗卫星每半小时发回—次全波段(五个波段)数据,每个波段图像大小为2292×2190字节约4.90MB,每天的数据量高达1.2GB。如此海量数据需要巨大的存储空间。在多媒体中,海量图像数据的存储和处理是难点之一。根据计算,一张600M字节的光盘,能存放20秒左右的640×480像素的图像画面信息,如不进行编码压缩处理,多媒体信息保存有多么困难是可想而知的。

在现代通信中,图像传输已成为重要内容。除要求设备可靠、图像保真度高以外,实时性将是重要技术指标之一。很显然,在信道带宽、通信链路容量一定的前提下,采用编码压缩技术,减少传输数据量,是提高通信速度的重要手段。

没有图像编码压缩技术的发展,大容量图像信息的存储与传输是难以实现的,多媒体、高速信息公路等新技术在实际中的应用会碰到很大困难。图像数据的特点之一是信息量大。在现代通信中,2.为什么能压缩?

一般图像中,存在很大的冗余度。到底能压缩多少,除了和图像本身存在的冗余度多少有关外,很大程度取决于对图像质量的要求。

例如:广播电视要考虑艺术欣赏,对图像质量要求就很高,用目前的编码技术,即使压缩比达到3∶1都是很困难的。而对可视电话,因画面活动部分少,对图像质量要求也低,可采用高效编码技术,使压缩比高达1500∶1以上。

目前高效图像压缩编码技术已能用硬件实现实时处理,在广播电视、工业电视、电视会议、可视电话、传真和互连网、遥感等多方面得到应用。

2.为什么能压缩?

空间冗余:图像内部相邻像素之间存在较强的相关性所造成的冗余。时间冗余:视频图像序列中的不同帧之间的相关性所造成的冗余。视觉冗余:是指人眼不能感知或不敏感的那部分图像信息。数字图像的冗余主要表现为以下几种形式:空间冗余、时间冗余、视觉冗余、信息熵冗余、结构冗余。数字图像的冗余主要表现为以下几种形式:信息熵冗余:也称编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种冗余称为信息熵冗余。结构冗余:是指图像中存在很强的纹理结构或自相似性。信息熵冗余:也称编码冗余,如果图像中平均每个像素使用的比特数图像数据的这些冗余信息为图像压缩编码提供了依据。

例如,利用人眼对蓝光不敏感的视觉特性,在对彩色图像编码时,就可以用较低的精度对蓝色分量进行编码。图像编码的目的就是充分利用图像中存在的各种冗余信息,特别是空间冗余、时间冗余以及视觉冗余,以尽量少的比特数来表示图像。

利用各种冗余信息,压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,它是使数字信号走上实用化的关键技术之一,下表中列出了几种常见应用的码率。

图像数据的这些冗余信息为图像压缩编码提供了依据。图像的编码与压缩课件图像压缩编码的概念图像数据的压缩和编码表示。图像压缩编码系统:图像编码:对图像信息进行压缩和编码,在存储、处理和传输前进行,也称图像压缩;图像解码:对压缩图像进行解压以重建原图像或其近似图像。图像压缩编码的概念图像数据的压缩和编码表示。二、

图像编码评价

随着众多图像压缩算法的出现,如何评价图像压缩算法就成为重要的课题。一般说来,评价图像压缩算法的优劣主要有以下4个参数。

1)算法的编码效率算法的编码效率通常有几种表现形式:平均码字长度(R),图像的压缩比(rate,r),每秒钟所需的传输比特数(bitspersecond,bps),图像熵与平均码长之比(η)。二、图像编码评价

设一幅灰度级为N的图像,图像中第k级灰度出现的概率为Pk,图像大小为Nx×Ny,每个像素用d比特表示,每两帧图像间隔Δt,则按信息论中信息熵的定义,数字图像的熵H由下式定义:

由此可见,图像熵H表示各灰度级比特数的统计平均值。对于一种图像编码方法,设第k级灰度的码字长度为Bk,则该图像的平均码字长度R为设一幅灰度级为N的图像,图像中第k级灰度出现于是,可定义编码效率η为

每秒钟所需的传输比特数bps为压缩比r为

由于同一压缩算法对不同图像的编码效率会有所不同,因此常需定义一些“标准图像”,一般通过测量不同压缩算法对同一组“标准图像”的编码性能来评价各图像压缩算法的编码效率。于是,可定义编码效率η为每秒钟所需的传输比特数bps为

2)编码图像的质量图像质量评价可分为客观质量评价和主观质量评价。最常用的客观质量评价指标是均方误差(MSE)和峰值信噪比(PSNR),其定义如下:

2)编码图像的质量

主观质量评价是指由一批观察者对编码图像进行观察并打分,然后综合所有人的评判结果,给出图像的质量评价。

客观质量评价能够快速有效地评价编码图像的质量,但符合客观质量评价指标的图像不一定具有较好的主观质量。主观质量评价能够与人的视觉效果相匹配,但其评判过程缓慢费时。主观质量评价是指由一批观察者对编码图像进行观察

3)算法的适用范围

特定的图像编码算法具有其相应的适用范围,并不对所有图像都有效。

一般说来,大多数基于图像信息统计特性的压缩算法具有较广的适用范围,而一些特定的编码算法的适用范围较窄,如分形编码主要用于自相似性高的图像。

3)算法的适用范围

4)算法的复杂度

算法的复杂度即指完成图像压缩和解压缩所需的运算量和硬件实现该算法的难易程度。

优秀的压缩算法要求有较高的压缩比,压缩和解压缩快,算法简单,易于硬件实现,还要求解压缩后的图像质量较好。

选用编码方法时一定要考虑图像信源本身的统计特性、多媒体系统(硬件和软件产品)的适应能力、应用环境以及技术标准。4)算法的复杂度三图像压缩方法分类

按压缩前及解压后的信息保持程度和方法的原理来分类

按照压缩前及解压后的信息保持程度分成三类:信息保持(存)型

压缩、解压中无信息损失,主要用于图像存档,其特点是信息无失真,但压缩比有限,也称无失真无损可逆型编码。信息损失型

牺牲部分信息,来获取高压缩比,数字电视、图像传输和多媒体等应用场合常用这类压缩,其特点是通过忽略人的视觉不敏感的次要信息来提高压缩比,也称有损压缩。特征抽取型

仅对于实际需要的(提取)特征信息进行编码,而丢掉其它非特征信息,属于信息损失型。这里的第三类是针对特殊的应用场合,因此,一般就将图像压缩编码分成无损和有损两大类。图像的编码与压缩课件按照图像压缩的方法原理可分成四类像素编码:编码时只对每个像素单独处理。如脉冲编码调制、熵编码、行程编码等。预测编码:通过去除相邻像素之间的相关性和冗余性,只对新的信息进行编码。常用的有差分脉冲编码调制。变换编码:对给定图像采用某种变换,使得大量的信息能用较少的数据来表示。通常采用的变换包括:离散傅立叶变换(DFT(DFT),离散余弦变换),(DCT)(DCT)和离散小波变换(DWT)(DWT)。其它方法:早期的编码,如混合编码、矢量量化、LZWLZW算法。

近些年来也出现了很多新的压缩编码方法,如使用人工神经元网络的压缩编码算法、分形、小波、基于对象的压缩编码算法、基于模型的压缩编码算法等。按照图像压缩的方法原理可分成四类行程编码(RLE)

在一个逐行存储的图像中,具有相同灰度值的一些象素组成的序列称为一个行程。在编码时,对于每个行程只存储一个灰度值的码,再紧跟着存储这个行程的长度。这种按照行程进行的编码被称为行程编码(RunLengthEncoding)。

行程编码对于仅包含很少几个灰度级的图像,特别是二值图像,比较有效。3.1无损编码行程编码(RLE)3.1无损编码1、行程编码基本方法行程编码又称行程长度编码,是一种熵编码,其编码原理相当简单,即将具有相同值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。例如,有一字符串“aabbbcddddd”,则经行程长度编码后,该字符串可以只用“2a3b1c5d”来表示。行程编码分为定长和不定长编码两种。定长编码是指编码的行程长度所用的二进制位数固定,而变长行程编码是指对不同范围的行程长度使用不同位数的二进制位数进行编码。使用变长行程编码需要增加标志位来表明所使用的二进制位数。

1、行程编码基本方法

行程编码比较适合于二值图像的编码,一般用于量化后出现大量零系数连续的场合,用行程来表示连零码。如果图像是由很多块颜色或灰度相同的大面积区域组成的,那么采用行程编码可以达到很高的压缩比。如果图像中的数据非常分散,则行程编码不但不能压缩数据,反而会增加图像文件的大小。

为了达到较好的压缩效果,一般不单独采用行程编码,而是和其他编码方法结合使用。例如,在JPEG中,就综合使用了行程编码、DCT、量化编码以及哈夫曼编码,先对图像作分块处理,再对这些分块图像进行离散余弦变换(DCT),对变换后的频域数据进行量化并作Z字形扫描,接着对扫描结果作行程编码,对行程编码后的结果再作哈夫曼编码。行程编码比较适合于二值图像的编码,一般用于量2、PCX文件中的行程编码

PCX文件分为文件头和图像压缩数据两个部分。如果是256色图像,则还有一个256色调色板存于文件尾部。文件头全长128字节,包含了图像的大小和颜色以及PCX文件的版本标识等信息,图像压缩数据紧跟在文件头之后。如果没有使用调色板,那么图像压缩数据存储的是实际像素值;否则,存储的是调色板的索引值。2、PCX文件中的行程编码

在256色PCX文件中,每个像素占一字节,压缩数据以字节为单位逐行进行编码,每行填充到偶数字节。PCX文件规定编码时的最大行程长度为63,如果行程长度大于63,则必须分多次存储。

对于长度大于1的行程,编码时先存入其行程长度(长度L加上192即0xC0),再存入该行程的代表值,行程长度和行程的代表值分别占一字节。

对于长度为1的行程,即单个像素,如果该像素的值小于或等于0xC0,则编码时直接存入该像素值,而不存储长度信息;否则,先存入0xC1,再存入该像素值,这样做的目的是为了避免该像素值被误认为长度信息。

在256色PCX文件中,每个像素占一字节,例如,连续100个灰度值为0x80的像素,其编码(以十六进制表示)应为FF802580。上面的编码中出现FF的长度信息是由63与0xC0相加所得。对256色PCX文件解码时,首先从压缩数据部分读取一个字节,判断该值是否大于0xC0,如果是,则表明该字节是行程长度信息,取其低六位(相当于减去0xC0)作为行程长度L,读取下一个字节作为像素值并重复L次存入图像数据缓冲区;否则,直接将该字节存入图像数据缓冲区。几乎所有的图像应用软件都支持PCX文件格式,但由于它的压缩比不高,因而现在用得不是很多。

例如,连续100个灰度值为0x80的像素,其编码(以十六进制LZW编码

LZW(Lempel-Ziv&Welch)编码又称字串表编码,属于一种无损编码,是Welch将Lempel和Ziv所提出的无损压缩技术改进后的压缩方法。LZW编码与行程编码类似,也是对字符串进行编码从而实现压缩,但它在编码的同时还生成了特定字符串以及与之对应的索引字符串表。

LZW编码

LZW编码的基本思想是:在编码过程中,将所遇到的字符串建立一个字符串表,表中的每个字符串都对应一个索引,编码时用该字符串在字串表中的索引来代替原始的数据串。

例如,一幅8位的灰度图像,我们可以采用12位来表示每个字符串的索引,前256个索引用于对应可能出现的256种灰度,由此可建立一个初始的字符串表,而剩余的3840个索引就可分配给在压缩过程中出现的新字符串,这样就生成了一个完整的字符串表,压缩数据就可以只保存它在字符串表中的索引,从而达到压缩数据的目的。

字符串表是在压缩过程中动态生成的,不必将它保存在压缩文件里,因为解压缩时字符串表可以由压缩文件中的信息重新生成。LZW编码的基本思想是:在编码过程中,将所遇

GIF(GraphicsInterchangeFormat)最初于1987年开发的一种压缩位图格式。它可支持多达256种的颜色,具有极佳的压缩效率,已成为Internet上一种流行的文件格式。GIF图像文件采用的是一种改良的LZW压缩算法,通常称为GIF-LZW压缩算法。GIF图像文件以块(又称为区域结构)的方式来存储图像相关的信息。设S1、S2为两个存放字符串的临时变量,LZW_CLEAR和LZW_EOI分别为字符表初始化标志和编码结束标志,GIF-LZW的编码步骤如下:

GIF(GraphicsIntercha

(1)根据图像中使用的颜色数初始化一个字串表,字串表中的每个颜色对应一个索引。在初始字串表的末尾再添加两个符号(LZW_CLEAR和LZW_EOI)的索引。设置字符串变量S1、S2并初始化为空。(2)接着输出LZW_CLEAR在字串表中的索引。(3)从图像数据流中第一个字符(假设数据以字符串表示)开始,每次读取一个字符,将其赋给字符串变量S2。(4)判断“S1+S2”是否已存在于字串表中。如果字串表中存在“S1+S2”,则S1=S1+S2;否则,输出S1在字串表中的索引,并在字串表末尾为“S1+S2”添加索引,同时,S1=S2。

(1)根据图像中使用的颜色数初始化一个字串表,字串

(5)重复第3和第4步,直到所有字符读完为止。(6)输出S1中的字符串在字串表中的索引,然后输出结束标志LZW_EOI的索引,编码完毕。

GIF-LZW的解码过程比较复杂,它和编码过程正好相反,即将编码后的码字转换成对应的字符串,重新生成字串表,然后依次输出对应的字符串即可。(5)重复第3和第4步,直到所有字符读完为止。LZW编码实例设有一来源于4色(以a、b、c、d表示)图像的数据流aabcabbbbd,现对其进行LZW编码。编码过程如下:编码前,首先需要初始化一个字符串表。由于图像中只有四种颜色,因而我们可以只用4比特表示字符串表中每个字符串的索引,表中的前4项代表4种颜色,后两项分别表示初始化和图像结束标志,建立的初始化字符串表如表所示。接着把S1和S2初始化为空(即NULL),输出LZW_CLEAR的在字符串表中的索引值4H,接下来是对图像数据的编码。

LZW编码实例初始化字符串表字符串索引a0Hb1Hc2Hd3HLZW_CLEAR4HLZW_EOI5H初始化字符串表字符串索引a0Hb1Hc2H

读取图像数据流的第一个字符“a”,赋给S2,因S1+S2=“a”已存在字串表中,所以S1=S1+S2=“a”。接着读入下一个字符“a”赋给S2,因S1+S2=“aa”不存在于字串表中,所以输出S1=“a”的索引0H,同时在字符串表末尾添加新字符串“aa”的索引6H,并使S1=S2=“a”。依次读取数据流中的每个字符,如果S1+S2没有出现在字符串表中,则输出S1中的字符串的索引,并在字符串表末尾为新字符串S1+S2添加索引,并使S1=S2;否则,不输出任何结果,只是使S1=S1+S2。所有字符处理完毕后,输出S1中的字符串的索引,最后输出结束标志LZW_EOI的索引。至此,编码完毕,完整的编码过程如下表所示,最后的编码结果为“4001271B35”(以十六进制表示)。

读取图像数据流的第一个字符“a”,赋给S2,GIF-LZW编码过程GIF-LZW编码过程Huffman编码Huffman编码是50年代提出的一种基于统计的无损编码方法,它利用变长的码来使冗余量达到最小。

Huffman编码原理:常出现的字符用较短的码代表,不常出现的字符用较长的码代表。静态Huffman编码使用一棵依据字符出现的概率事先生成好的编码树进行编码。而动态Huffman编码需要在编码的过程中建立编码树。由于Huffman编码所得到的平均码字长度可以接近信源的熵,因此在变长编码中是最佳的编码方法,故也称为熵编码。Huffman编码

1、哈夫曼编码的理论基础

根据信息论中信源编码理论,当平均码长R大于等于图像熵H时,总可设计出一种无失真编码。当平均码长等于或很接近于(但不大于)图像熵时,称此编码方法为最佳编码,此时不会引起图像失真;当平均码长大于图像熵时,压缩比较高,但会引起图像失真。

在变长编码中,如果码字长度严格按照对应符号出现的概率大小逆序排列,则其平均码字长度为最小,这就是变长最佳编码定理。变长最佳编码定理是哈夫曼编码的理论基础。设D为编码所使用的数制,则变长最佳编码的平均码字长度R的范围为

1、哈夫曼编码的理论基础

2、哈夫曼编码算法(1)首先统计信源中各符号出现的概率,按符号出现的概率从大到小排序。(2)把最小的两个概率相加合并成新的概率,与剩余的概率组成新的概率集合。(3)对新的概率集合重新排序,再次把其中最小的两个概率相加,组成新的概率集合。如此重复进行,直到最后两个概率的和为1。2、哈夫曼编码算法

(4)分配码字。码字分配从最后一步开始反向进行,对于每次相加的两个概率,给大的赋“0”,小的赋“1”(也可以全部相反,如果两个概率相等,则从中任选一个赋“0”,另一个赋“1”即可),读出时由该符号开始一直走到最后的概率和“1”,将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的哈夫曼编码。

(4)分配码字。码字分配从最后一步开始反向进行

设一幅灰度级为8(分别用S0、S1、S2、S3、S4、S5、S6、S7表示)的图像中,各灰度所对应的概率分别为0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04。现对其进行哈夫曼编码编码过程如图所示,具体步骤如下:

(1)首先对信源概率从大到小排序,选出最小的两个概率(0.04和0.05),相加得0.09,与其他概率组成新的概率集合{0.40,0.18,0.10,0.10,0.07,0.06,0.09}。例设一幅灰度级为8(分别用S0、S1、S(2)对新的概率集合重新排序,选出最小的两个概率(0.06和0.07),相加得0.13,组成新的概率集合{0.40,0.18,0.10,0.10,0.09,0.13}。

(3)对新的概率集合重新排序,选出最小的两个概率(0.10和0.09),相加得0.19,组成新的概率集合{0.40,0.18,0.13,0.10,0.19}。

(4)对新的概率集合重新排序,选出最小的两个概率(0.13和0.10),相加得0.23,组成新的概率集合{0.40,0.19,0.18,0.23}。(2)对新的概率集合重新排序,选出最小的两(5)对新的概率集合重新排序,选出最小的两个概率(0.19和0.18),相加得0.37,组成新的概率集合{0.40,0.23,0.37}。

(6)对新的概率集合重新排序,选出最小的两个概率(0.23和0.37),相加得0.60,组成新的概率集合{0.40,0.60}。

(7)直到最后两个概率(0.60和0.40)相加和为1。(5)对新的概率集合重新排序,选出最小(8)分配码字。从最后一步反向进行,首先给最后相加的两个概率(0.60和0.40)分配码字,由于0.60大于0.40,于是给0.60赋“0”,给0.40赋“1”。如此依次给每次相加的两个概率分配码字。

(9)最后写出每个符号的哈夫曼编码。以符号S1(对应的概率为0.18)为例,在从0.18到1.0的路径上,它所遇到的赋值(“0”或“1”)依次为1、0、0,将其反向排列成“001”,于是就形成了符号S1的哈夫曼码字“001”。(8)分配码字。从最后一步反向进行,首先哈夫曼编码过程哈夫曼编码过程

上述哈夫曼编码方法形成的码字是可识别的,即能够保证一个符号的码字不会与另一个符号的码字的前几位相同。比如说,如果S0的码字为1,S1的码字为001,而S2的码字为011,则当编码序列中出现0011时,就不能判别它是S2的码字还是S1的码字后面跟了一个S0的码字1。下面来看一下哈夫曼编码的编码效率。平均码长R为上述哈夫曼编码方法形成的码字是可识别的,即能够数字图像的熵H为则哈夫曼编码的编码效率η为数字图像的熵H为则哈夫曼编码的编码效率η为

由此可见,哈夫曼编码的编码效率是相当高的,其冗余度只有2.2%。如果采用等长编码,由于有8种灰度级,则每种灰度级别至少需要3比特来表示,对于例中的图像而言,其编码的平均码长为3,编码效率为85%。

对不同概率分布的信源,哈夫曼编码的编码效率有所差别。根据信息论中信源编码理论,对于二进制编码,当信源概率为2的负幂次方时,哈夫曼编码的编码效率可达100%,其平均码字长度也很短,而当信源概率为均匀分布时,其编码效果明显降低。在下表中,显然,第二种情况的概率分布也服从2的负幂次方,故其编码效率η也可以达到100%,但由于它服从均匀分布,其熵最大,平均编码长度很大,因此从其他指标看(如,压缩比r),其编码效率最低。也就是说,在信源概率接近于均匀分布时,一般不使用哈夫曼编码。

由此可见,哈夫曼编码的编码效率是相当高的,其啥夫曼编码在不同概率分布下的编码效果对比啥夫曼编码在不同概率分布下的编码效果对比3.2有损编码

量化将图像用较少的灰度级别来表示是最简单的减小数据量的方法,这种方法就是标量量化方法。更一般的情况是,针对连续量的采样过程,量化是用有限个状态来表示连续值。3.2有损编码量化预测编码

预测编码根据数据在时间和空间上的相关性,根据统计模型利用已有样本对新样本进行预测,将样本的实际值与其预测值相减得到误差值,再对误差值进行编码。由于通常误差值比样本值小得多,因而可以达到数据压缩的效果。模拟量到数字量的转换过程是脉冲编码调制过程PCM,也称PCM编码。对于图像而言,直接以PCM编码,存储量很大。预测编码可以利用相邻象素之间的相关性,用前面已出现的象素值估计当前象素值,对实际值与估计值的差值进行编码。常用的一种线性预测编码方法是差分脉冲编码调制DPCM。预测编码预测就是根据过去时刻的样本序列,运用一种模型,预测当前的样本值。预测就是根据过去时刻的样本序列,运用一种模型,预测当前的样本预测编码通常不直接对信号编码,而是对预测误差编码。当预测比较准确,误差较小时,即可达到编码压缩的目的。这种编码称之为差分脉冲编码调制(DPCM),上图是原理框图。在该系统中,xN为tN时刻的亮度取样值。预测器根据tN时刻之前的样本x1,x2,…,xN-1对xN作预测,得到预测值x'N。xN与x'N之间的误差为预测编码通常不直接对信号编码,而是对预测误差编码。当预测比较量化器对eN进行量化得到e‘N。编码器对e’N

进行编码发送。接收端解码时的预测过程与发送端相同,所用预测器亦相同。接收端恢复的输出信号是xN的近似值,两者的误差是当ΔxN足够小时,输入信号xN

和DPCM系统的输出信号几乎一致。量化器对eN进行量化得到e‘N。编码器对e’N进行编码发送DCT编码

DCT变换是图像压缩标准中常用的变换方法,如JPEG标准中将图像按照8x8分块利用DCT变换编码实现压缩。DCT编码

DCT变换是图像压缩标准中常用的变换方法Lena.bmp(原图)Lena.bmp(原图)Lenna.jpg(压缩率9.2)Lenna.jpg(压缩率9.2)Lenna.jpg(压缩率18.4)Lenna.jpg(压缩率18.4)Lenna.jpg(压缩率51.6)Lenna.jpg(压缩率51.6)其它变换编码

变换方法是实现图像数据压缩的主要手段。其基本原理是:1、通过变换将图像数据投影到另一特征空间,降低数据的相关性,使有效数据集中分布;2、采用量化方法离散化,最后通过Huffman等无损压缩编码进一步压缩数据的存储量。DCT是一种常用的变换域压缩方法,是JPEG,MPEGI-II等图像及视频信号压缩标准的算法基础。在实际采用DCT编码时,需要分块处理,各块单独变换编码,整体图像编码后再解压会出现块状人工效应,特别是当压缩比较大时非常明显,使图像失真。因此,为了获得更高的图像压缩比,人们提出了一些其它方法,如基于小波变换的图像压缩算法和基于分形的图像压缩算法等。其它变换编码

基于小波变换的图像压缩算法首先使用某种小波基函数将图像做小波变换,再根据四个通道的不同情况,分别量化编码。

比如对低频频段(LL)采用较多的量化级别,而对中间频段(LH,RH)采用较少量化级别,对高频频段(HH)采用很少几个量化级别,这样根据重构时对复原信号的重要程度分别对待的方式可以有效地提高压缩比而又不产生明显的失真。

由于小波变换不使用DCT变换方法中的固定大小的块分别编码的处理方法,而是通过整体的多级(通常用3-5个级别)变换方法实现,没有块状效应。小波变换可以获得10-50倍的压缩比而没有明显的失真。小波变换在静态图像

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论