毕业设计(论文)图像压缩方法研究_第1页
毕业设计(论文)图像压缩方法研究_第2页
毕业设计(论文)图像压缩方法研究_第3页
毕业设计(论文)图像压缩方法研究_第4页
毕业设计(论文)图像压缩方法研究_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、图像压缩方法研究图像压缩方法研究the research of image compression method 专 业:电子信息科学与技术学 号:03111252姓 名: 指导教师:目录目录内容摘要.iabstract .ii第一章 绪 论.11.1 课题背景.11.2 图像数据压缩的必要性.11.3 图像数据压缩的可能性.21.4 图像压缩技术研究的起源与发展.3第二章 数字图像压缩的原理.42.1 数字图像的压缩概述.42.2 图像压缩的基本原理.42.2.1 信息论基础.42.2.2 图像的基本压缩方式.52.3 图像压缩系统概述及压缩系统评价.62.3.1 图像压缩系统的组成.62.

2、3.2 图像压缩系统评价.7第三章 数字图像的编码方式.103.1 数字图像编码的分类.103.2 无损数字图像编码方式.103.2.1 游程编码.103.2.2 lzw 编码.103.2.3 霍夫曼编码.113.2.4 算术编码.113.3 有损图像压缩编码方式.123.3.1 失真度理论和有损压缩.133.2.2 变换编码.133.2.3 预测编码.143.2.4 矢量量化编码.153.2.5 dct 变换编码.163.2.6 小波编码.17结束语.19参考文献.20致 谢.21内容摘要内容摘要随着计算机多媒体技术的发展,人们期望更高性能的图像压缩技术的出现。基于对图像存储技术和图像通信的

3、考虑,良好的图像压缩技术不仅能够实现高压缩率和高保真率,还能满足诸如渐进传输、图像渐现等网络应用的需要。因此,为了满足实际应用的需要,有必要对图像数据压缩处理进行深入细致的研究,目前已发展成为专门的研究领域:图像编码。常见的主要编码方法有预测编码、变换编码、矢量量化编码、小波编码、分形编码等等。论文首先对数字图像压缩技术进行了综述,回顾了图像压缩技术的起源与发展,详细阐述了图像压缩的必要性和可能性,分析图像压缩的一般模型,以及复原图像质量的性能评价标准。然后重点介绍图像压缩编码的分类,对图像压缩编码,特别是预测编码、变换编码、矢量量化编码、小波编码的原理和特点进行分析,并阐述图像压缩编码的作用

4、。关键词关键词: 图像压缩,图像编码,小波变换,图像质量abstractwith the ever-growing multimedia technique, people are looking forward to new image compression techniques with better performance. taking the storage and transfer of mass image data into consideration, not only could favorable image compression techniques achieve

5、 high compression ratio and fidelity, they should also meet the demands of web applications. image compression needs further detailed study, thus a specialized research field known as image coding develops. frequently used major coding methods include pedicel code, transform code, vestal quantizatio

6、n, wavelet transform code, and fractal code. the paper firstly summarizes the image compression technology, presents the general conception of image compression technique, and briefly introduces several image compression algorithms. also, it introduces the general model of image compression, as well

7、 as the performance appraising criterion of recovered image quality. then,it expatiates on the classification of image coding and analyzes the images compression coding , especially to pedicel code, transform code, vestal quantization, wavelet transform code, fractal code. at last, the function of i

8、mage compression coding is described. keywords: image coding,image compression,wavelet, image quality第一章第一章 绪绪 论论1.1 课题背景课题背景图像压缩编码技术始于五十年代初的电视信号数字化。当时图像压缩技术主要局限在预测编码、亚采样以及内插复原等技术上。七十年代后出现了变换编码技术,并且由于通信技术的发展,对活动图像压缩技术也有较多的研究,如运动估值和运动补偿。进入八十年代中后期,出现了许多新的图像压缩编码方法,例如小波、分形和神经网络图像压缩方法。这新的图像编码方法从图像压缩机制及处理

9、方法上都有新的突破,获得了更高的图像压缩效率。因而使图像压缩的技术和理论取得了很大的发展。此外,对活动图像压缩编码技术的研究也取得了许多重要研究成果:电视电话/会议电影的 mit h.2b3 建议和静止及活动图像压缩的jpeg, mpeg-1 和 mpeg-2 国际标准。所有这些己成为成熟的技术并获得了厂-泛的应用。1998 年底,针对低比特率的活动图像压缩编码国际标准 mpeg-4 也正式制定,新的静止图像压缩标准 jpeg2000 也已施行。鉴于图像压缩所具有的重要性,己引起世界各国的广泛重视,图像压缩编码技术己成为当今信息技术中最具吸引力的热门研究领域之一。近年来随着基础理论和科学技术的

10、进步,人们一直在寻求更好的压缩编码的方法。在新提出的编码方法中,小波变换方法和分形几何方法被认为是有较大应用潜力的,受到该领域专家们的广泛关注,掀起了研究的热潮。随着现代通信技术的飞速发展和通信业务的不断拓展,图像信息传输已经成为现代通信系统所提供的基本服务。在当前这样一个信息爆炸的社会中,人们在交换图像及声音等媒体信息方面的需求越来越大,对交换的质量要求也越来越高。通常图像经数字化后形成的数据量非常大。例如,一副分辨率为 1024768 的 24bit真彩色静止图像,就有 2.36mb 的数据量。如果进行视频处理,假设每秒 30 帧,则每秒产生近 70mb 的数据,也就是说,一张普通的光盘只

11、能容纳 9s 的图像。但是具有庞大数据量的数字图像难以传输和存储,数字图像通信与通信网容量的矛盾日益突出,极大地制约了图像通信的发展,已经成为图像通信领域中的“瓶颈”问题。为了解决数字图像数据量巨大的问题,必需对图像数据进行有效地压缩。因此,数字图像压缩编码,已经成为现代信息社会中一个研究的热点问题。1.2 图像数据压缩的必要性图像数据压缩的必要性长期以来,人类获取到的信息其 80来源于图像媒体,15来源于语音。所以,人们在自然界感受到的最主要的信息是视觉信息,这说明图像是人们生活中信息交流最为重要的载体也是蕴含信息量最大的媒体。但与此不同,在早期的计算机和通信领域,能够处理和传输的主要是文字

12、和声音,因此,早期的计算机和通信设备的处理能力跟人类的需求有很大的差距。随着通信信道及计算机容量和速度的提高,图像信息已经成为通信和计算机系统的一种重要的处理对象。 与文字信息不同,图像信息需要大的存储容量和宽的传输信道,尤其是在需要实现大规模图像数据库或传输高分辨率实时图像序列的场合。正因为这一点,图像也给人们的信息交流(传输)、信息的保留(存储)带来很大的困难。特别是数字化地球的今天和未来,这一问题尤为突出。但是,由于信息社会的到来人类追求高质量的信息通信,采用数 字化信息是必经之路。这是因为数字化信息具有如下特点: (1)易交换,畅通无阻,无处不达; (2)高容量以惊人的传输速度满足人们

13、的信息需求; (3)高分辨率,信息质量优化; (4)高稳定性。传输途中不易受干扰,能原原本本地还它本来面目等。图像数字化后计算机面临的最大难题之一是海量数据的存储与传送问题。 1.3 图像数据压缩的可能性图像数据压缩的可能性经研究发现,与音频数据一样,图像数据中存在着大量的冗余,原因在于原始图像数据是高度相关的。通过去除那些冗余数据可以节约文件所占的码字从而极大地降低原始图像数据量,解决图像数据量巨大的问题,达到数据压缩的目的。图像之所以能够进行压缩有以下几个方面的原因: (1)原始图像数据是高度相关的,存在很大的数据冗余。如种信源编码,其信源是各种类型的图像信息。图像恢复的过程叫图像内相邻像

14、素之间的空间冗余度、系列图像前后帧之间的时做解码,根据解码后的数据与原始数据是否一致,图像压缩方法间冗余度、多光谱遥感图像各频谱间的频率域冗余度等,它们造成了大量的比特数浪费,消除这些冗余就可以节约码字,大大减少数据量,达到数据压缩的目的。(2)信源符号出现的概率不同,若用相同码长表示不同出现概率的符号,就会造成符号冗余度。如果采用可变长编码技术,对出现概率高的符号用短码字,对出现概率低的符号用长码字表示,就可以消除符号冗余度,从而节约码字。(3)人眼具有视觉冗余,允许图像编码有一定的失真。人类视觉系统是有缺陷的,人眼对于某些失真不敏感难以察觉。在许多场合中,并不要求经压缩及复原以后的图像和原

15、始图像完全相同,可以允许有少量的失真,只要这些失真并不被人眼所察觉即可。这就为压缩比的提高提供了十分有利的条件,这种有失真的编码称为限失真编码。在多数应用中,人眼往往是图像信息的最终接受者,图像编码方法如果能充分利用人眼的视觉特性,就可以在保证复原图像主观质量较好的前提下取得较高的压缩比。(4)还可以利用先验知识来实现图像编码,降低知识冗余度。例如,在可视电话中,编码对象可为人的头和肩等,这时可利用对编码对象的先验知识为编码对象建立模型,通过提取模型参数,对参数进行编码而不对图像直接进行编码,可以达到非常高的压缩比。图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法。因此,

16、进行图像压缩研究的起点是研究图像数据的冗余性。1.4 图像压缩技术研究的起源与发展图像压缩技术研究的起源与发展图像压缩的研究起源于 20 世纪 40 年代。1948 年,oliver 首先提出了电视信号的线性 pcm 理论,开辟了图像压缩理论的先河。随后,1958 年 graham 采用计算机模拟试验的方法,提出了静止图像压缩的前值预测编码法,该方法能获得约4bits/pix 的图像质量。70 年代 a.habibit 进行了帧间预测编码的研究,并在 80 年代初针对运动补偿 (mc)所用的运动估值 (me)进行了研究。这些早期的预测编码方法都是对象素为处理单元,其理论是线性预测理论。这些预测

17、理论的思想至今仍被广泛应用,但由于预测编码的最小方差不能反映人的视觉特性及它的压缩比的限制,导致其在 90 年代开始被编码效率更高的变化编码所取代。1968 年 h.c.andrews 等人提出了变换编码的概念,采用的是二维离散傅立叶变换。此后相继出现了用其它变换方法的变换编码,其理论基础是把图像看成广义平稳随机场,用线性变换去实现相关,如 k-l 变换,dct 变换等。其实现方法均是通过正交变换把图像从相关性很强的空间域变换到相关性很弱的频域,再保留方差较大的变换系数,忽略方差较小的变换系数,从而实现图像压缩。1990 年通过的 itu-t&h.261 建议,是图像编码技术走向实用化的重要一

18、步它是图像编码 40 年研究结果的结晶。90 年代初相继提出的 mpeg-1, mpeg-2,h.263等等都是在 h.261 的基础上发展和改进的。这些国际建议普遍采用的混合编码技术是当今最实用的高效编码方法,得到了广泛的推广应用,已成为当今图像编码方法的主流。但基于线性方法 (预测法和分块 dct 相结合)的 h.261 /mpeg 的核心算法既不能有效的反映图像的固有统计特性,也不能有效的反映人们的视觉特性,这两方面还有待理论上的突破。因此,随后人们针对这两方面的不足进行了深入的分析和研究提出了许多新的理论和方法。 目前已提出和正在进行研究的图像编码方法列举如下: 1小波变换图像编码。

19、2利用人工神经网络的压缩编码。 3利用分形集合的图像编码 (ifs 编码)。4利用数学形态学的图像编码等。第二章第二章 数字图像压缩的原理数字图像压缩的原理2.1 数字图像的压缩概述数字图像的压缩概述图像压缩是数据压缩编码中的一种。所谓数据压缩就是以尽量少的数据表示尽量多的信息,如果经压缩处理后的数据所表示的信息丝毫不发生变化,则称为无损压缩,比如对文字或数字的压缩。无损压缩虽然精确地保存了数据,但压缩效率很低。随着多媒体及网络通信的应用日益广泛,要求计算机能实时传送和播放图像。在这些场合,对压缩算法精确性的要求不是那么苛刻。相反,由于信道及存储资源的限制,压缩效率则成了关键问题。因此必须采用

20、压缩效率高的有损压缩技术对图像进行压缩。由于数字图像像素之间存在着相关性,即存在冗余,这就为图像压缩提供了可能. 所谓压缩,其实就是考虑一种实现方法,能够去除掉整个图像数据中无关的或者是重复的数据 (即冗余量),最终用较少的信息量就可表达出原图像。图像能够进行压缩的依据主要是图像数据中存在冗余,如式 2-1 表示: (2-iddu1)其中 i, d,分别为信息量,数据量与冗余量。du2.2 图像压缩的基本原理图像压缩的基本原理图像压缩编码的主要任务是去掉各种冗余和不相干的信息,保留有用的信息,将一个大的数据文件转换成较小的文件,以尽量少的比特数来表征图像,同时保持复原图像的质量,使它符合预定应

21、用场合的需求。压缩数据量和提高有效性是图像压缩编码的首要目的。通常把图像压缩编码简称为图像编码,它是一种信源编码,其信源是各种类型的图像信息。图像恢复的过程叫做解码,根据解码后的数据与原始数据是否一致,图像压缩方法可以分为无损压缩编码和有损压缩编码。2.2.1 信息论基础1948 年,shannon 发表了通信的数学原理 ,应用概率论对信息作了定量的描述。作为 shannon 信息论的研究对象-信息,被假设为由一系列的随机变量所代表,它们往往用随机出现的符号来表示。我们称输出这些符号集的源为“信源”。由信源输出的随机符号,如果其取值于某一连续区间,就称为连续信源;如果取值于某一离散集合,就叫离

22、散信源。我们研究的是数字化系统,均为离散信源,本文讨论的数字图像为离散空间函数。( , )x x y自信息量和一阶熵:记字符,出现的概率为,那么按概率的公理化定ja()jp a义必须有 ;(j=1,2,3m); (2-01jp1jp 2)则 shannon 信息论把字符出现的自信息量定义为: (2-()logjji ap3)式中的符号可以保证其为正值。在计算机科学系统中,通常对对数的底取 2,单位为比特 (bit), 亦称为自信息函数,其含义是:随机变量 x 取值为 a,时所携()ji a带的信息的度量。我们把信息量的概率平均值,即随机变量的数学期望,叫()ji a做信息熵或者简称熵(entr

23、opy),记为 (2-11()()lognnijiiiih xp i app 4)单位为比特/字符,通常也称为一阶熵,它代表每个字符所给出的平均信息量。于是,h(x)就是离散信源进行无失真编码的基本极限(不经映射变换,只作熵编码)。2.2.2 图像的基本压缩方式图像压缩的基本方法主要有以下两种:概率匹配和条件概率。2.2.2.1 压缩基本方法之一 -概率匹配如果对字符码的编码长度为,则显然,也是一个非负的随机变量,不妨jajl记做: () (2-logjjlq 101,1,2,3,1mjjjqjmq5)那么对信源.编码的平均码长就是ma (2-6)logjjjjip lpq而信息论中已 经证明

24、熵具有极值性,即 (2-11()()lognnjjjjjjh xp i apq 7)其中等号仅在=时成立这就告诉我们,对于离散无记忆源,必须准确得jpjq到字符集率,对各字符的编码长度都达到它的自信息量。在式中,若令=1/m,便jq得到最大离散熵定理,所有概率分布 p;所构成的熵,以等概率时为最大。即: ;在数字化系统中,通常使。若各字符以等概率出现,则()logh xmm 2r,则,此时可以说,r 的二进制码字包含1()22rrjp a()log2()rji ar bit 有 r bit 的自信息量。对 256 级灰度图像,样本数目为256,最大熵为 8bit/字符,m 如果各字符以非等概率

25、出现,就减少。因此,最大值与熵之间的差值,就是信ph源 x 所含有的冗余度(redundancy),即 (2-8)max( )log( )rhxmh m由此可见,离散无记忆信源的冗余度隐含在信源字符的非等概率分布之中。只要信源不是等概率分布的,就存在着数据压缩的可能性。在数据压缩技术中,一般将压缩前每个信源字符的编码位数 ()与压缩后每个字符的编码位数(l)之logm比,定义为数据压缩比(cr:compression ratio) (2-logmcri9)也可以使用 cr 的倒数来衡量压缩效果,称为压缩率。2.2.2.2 压缩基本方法之二- 条件概率若信源 x 的各分量不是相互独立的,就称为有

26、记忆信源,实际上信源大多是这种信源。在遮掩的一个信号序列中,任意字符的出现总是要附带的接触前面的或后面字符的若干不确定性,即各字符是相关的,要用条件概率和条件熵的方法来处理。而且字符间的相关性越强,对前面的字符知道的越多,下一个字符的信息量越小.因此对于离散有记忆信源,可以利用条件概率进行编码,减少信源的极限熵.2.3 图像压缩系统概述及压缩系统评价图像压缩系统概述及压缩系统评价2.3.1 图像压缩系统的组成一个图像压缩系统包括两个不同的结构块:一个编码器和一个解码器。编码器又包括一个信源编码器和一个信道编码器,同样解码器包括了一个信道解码器和一个信源解码器。编码器和解码器都是彼此相关的函数或

27、子块。图 2-1 表示了一个一般的图像压缩系统模型框图。图 2-1 一般图像压缩系统模型2.3.1.1 信源编码器和信源解码器信源编码器的任务是减少或消除输入图像中的冗余。它包含以下三部分 (量化器不是必须的): 图 2-2 表示了信源编码器和信源解码器的模型。图 2-2 (a)信源编码甜和(b)信源解码器(1)转换器:它的作用是将输入数据转换为可以减少输入图像中象素间冗余的格式。这部分操作通常是可逆的。(2)量化器:它的作用是将转换程序的输出精度调到与预设的保真度准则相一致。该操作是不可逆的,如果要进行无损压缩时,必须略去这一步。(3)符号编码器:它生成一个固定的或可变长编码用于表示量化器输

28、出并将输出转化为与编码相一致。它是可逆的操作。信源解码器仅包含两部分:一个符号解码器和一个反向转换器。因为量化过程会导致不可逆的信息损失,故反向量化器不包含在信源解码器模型中。2.3.1.2 信道编码器和解码器信道编码器和解码器通过信源编码数据中插入预置的冗余数据来减少信道噪声的影响。汉明(hamming)编码是一种有效的信道编码技术。2.3.2 图像压缩系统评价图像压缩系统的性能评价分为主、客观评价.2.3.2.1 主观评价采用平均判分 mos(mean option score)或多维计分等方法进行测试,所评价出的图像质量不仅与图像本身特征有关,也与观察者特性以及观察者的环境条件有关。观察

29、者将复原图像与原图像相对比,比较损伤程度,可参照表 1 给评定的图像打上一定的质量等级,最后用平均的方法得到图像的分数。表 1 图像质量主观评价尺度表质量尺度妨碍尺度5.非常好5.丝毫看不出图像质量变坏4.好4.能看出图像质量变坏,但不妨碍观看3.一般3.能清楚的看出图像质量变坏,对观看有妨碍2.差2.对观看有妨碍1.非常差1.非常严重的妨碍观看2.3.2.2 客观评价客观评价的参数有以下几个:的参数有以下几个:(1)编码效率 (2-100%hl10) 其中 h 为信源的熵,, (n 代表信源长度,a 分别为信源中第 k1nkkkll pl个字符的编码长度和出现概率)为平均码长。(2)冗余度冗

30、余度 r 可表示为: 1r (3)压缩比:;其中 n. l 分别为编码前、后每个符号的平均码长,通常ncl为二进制表示的比特数。(4)比特率: (bit/s 或 b/s)sifr式中为取样频率,r 表示对每个取样的幅度值编码的平均码长。己知不sfsf变时,i 就用 r 简单表示,一般对静止图像,指每个像素平均所需的比特数,单位为 bit;对活动图像,指每秒输入或输出的比特数,单位为 mb/s,kb/s 等。(5)复杂度:复杂度是指为实现编码算法所需的硬件设备,典型的可用算法的运算量及需要的存储量来度量。系统的复杂度由数据压缩算法决定,它既包括编码器的复杂度,也包括解码器的复杂度。一般要求的比特

31、率越低,系统的复杂度越高。(6)时延: 时延过大的算法不能用于实时通信。实际允许的单程通信总时延(编码时延加解码时延)可以小到(像没有回波抑制的电话网),也可以大到约 1ms500ms (比如在甚低码率可视通信中,为了能收到较好的图像不得不容忍较大的通信延迟),但一般控制在 200m,以内。(7)信噪比(snr):给定一幅数字化图像和参考图像.它们之间的( , )f x y0( ,)f x y相似性通常用均方误差(mse)和 mse 的各种变形表示。当图像大小为 m*n 时,mse 为: (2-1120000 ( , )(,)mnxyf x yf xymsnmn11)还常使用峰值信噪比 psn

32、r (peak signal to noise ratio)作为质量测度, (2-2max112000010lg1 ( , )(,)mnxyfpsnrf x yf xymn12)其中二为最大灰度值,对于具有 256 个灰度级的黑白图像,常取 255. maxfmaxfpsnr 是衡量编码器性能的一个常用指标,但用它来度量主观感觉并不适合。例如,稍有倾斜的图像在感觉上可以接受,但却会导致很低;而当图像中出现窄而亮maxp的水平拖影时,很高但主观感觉很差。如何改进 psnr 使其在主观感觉上也有maxp一定意义,一直是数据压缩领域研究的一个重要课题。第三章第三章 数字图像的编码方式数字图像的编码方

33、式3.1 数字图像编码的分类数字图像编码的分类目前常用的数字图像压缩编码可分为两类:一类压缩是可逆的,即从压缩后的数据可以完全恢复原来的图像,信息没有损失,即是冗余压缩法,也称为无损压缩编码;另一类压缩是不可逆的,即从压缩后的数据无法完全恢复原来的图像,信息有一定损失, 即熵压缩法,也称为有损压缩编码。如图3-1所示。图 3-1 数字图像编码分类3.2 无损数字图像编码方式无损数字图像编码方式无损图像是利用数据的统计特性,在无损压缩中,压缩后重建图像其数值等于原图像。虽然无损压缩没有信息丢失,达到理想要求,然而只能实现适量压缩。无损压缩的压缩率一般为 2:15:1。典型的无损压缩技术有游程编码

34、、lzw 编码、霍夫曼编码和算术编码等。3.2.1 游程编码游程编码(rlc)是对传真图像的标准压缩方法。它的基本理论是对一组从左到右扫描得到的连续的 0 或 1 游程用它们的长度来编码。这里需要建立确定游程值的协定,常用的方法有:(1)指出每行第一个游程的值;(2)设每行都由白色游程开始。通过用变长码来对游程的长度编码有可能取得更高的压缩比。我们可将黑和白的游程长度分开,并根据它们的统计特性分别用变长码编码例如符号 a,是由某个想象中的黑色游程信源产生出来的概率。用类似的方法就可得到白色游程信源熵的估计 hw。这样图像的游程熵就近似为: (3-bwrlbwhhhll1)其中变量和,分别代表白

35、色和黑色游程长度的平均值。blwl3.2.2 lzw 编码同 rle 类似,它也是对字符编码从而实现压缩。然而与 rle 不同的是,它在对文件进行编码的同时,生成了特定的字符序列的表以及它们对应的代码。例如,一个由 8 位字节组成的文件可以被编成 12 位的代码。在这 4096 个可能的代码中,256 个代码代表可能的单个字符 (8 位),剩下的 3840 个代码分配给在压缩过程中数据里出现的字符串。每当表中没有的字符串头一次出现时,它就被原样存起来,同时将分配给它的代码一起保存。之后当这个其再次出现时,只将它的代码存起来。这样就去掉了文件冗余信息,不但字符表在压缩中动态生成的,而且字符串表也

36、不必存在压缩文件中,因为解压缩算法由信息中文件重构它。3.2.3 霍夫曼编码霍夫曼 (huffman )编码是消除编码冗余最常用的技术,其原理如下:设一个信源的符号是 a,通过把两个概率最小的字符组合起来,就得到一个新的信源.它的符号个数为 a-1.假设这个新信源的编码字是己知的,那么可以证明:新信源中还没有组合起来的符号的编码字等于原来信源中对应符号的编码字;而两个组合符号的编码字,可以通过在新信源中组合符号编码后,为0或1得到,因而霍夫曼编码由只有两个符号0和“1”组成的编码。根据以上原理,可以得到如下构造霍夫曼编码的方法: 1.反复组合两个最小概率的符号,得到一个新的简化信源,直到被简化

37、的信源中只有两个符号,分配这两个符号编码为0或“1” 2. 反复的求出最小概率编码字的两个组合符号编码,通过在上一步中求出编码右侧加上0或者1直到找到原来信源。一旦霍夫曼码获得后,编码或者简码都可以用简单的查表方式实现。这种码有三个特点:(1)它是一种块码,因为各个信源符号都被映射成一组固定次序的码符号;(2)它是一种即时码,因为一串码符号中的每个码字都可以不考虑其后的符号解出来;(3)它是一种唯一可解开的码,因为任何符号串都只能以一种方式解。根据这些特点,任何霍夫曼码都可通过从左到右检查各个符号进行解。然而,霍夫曼编码使用整数个二进制位对符号进行编码,实际上这种方法在许多情况下无法得到最优的

38、压缩效果。假设某个字符的出现概率为 80%,该字符事实上只需要 0.322 位编码,但霍夫曼编码一定会为其分配一位 0 或一位 1 的编码,整个信息的 80%在压缩后都几乎相当于理想长度的 3 倍左右,压缩效果很不理想,而算术编码可克服这个问题。3.2.4 算术编码算术编码的思想最早由香农提出,当时香农将符号依概率排序,用累积概率的二进制表示作为对符号的编码。之后,经 rosanne. pasco 和 langdon 等人的研究,算术编码日臻成熟。1987 年,witten 等人发表了一个实用的算术编码器,即cacm87。自此以后,这一技术引来越来越多人的注意,被认为是基于统计的、无损数据压缩

39、效率最高的方法,几乎总强于霍夫曼编码。算术编码是用0,1)间的一个实数间隔来表示符号序列。符号序列越长,间隔越小,表示它的数据位数就越多,每编码符号序列的一个符号,都依该符号出现的概率进一步缩小间隔,而且出现概率大的符号比出现概率小的符号缩小间隔得较少,因此需要在表示它的数据上加入较少的位数。在符号被编码前,间隔为整个区间0,1。每编码一个符号,以分配给该符号的比例将间隔缩小。算术编码的过程实际上就是依据信源符号的出现概率对区间进行分割的过程。下面以一个例子具体说明该过程。假定信源的符号集为: a, e,i,o,u,!,各符号的出现概率和分配的区间见表 2.1.需要编码的符号序列为:eaii!

40、。当编码第一个符号时,编码器将区间缩小为分配给符号。的区间0.2,0.5).当编码第二个符号 a 时,编码器以分配给 a 的比例(0,0.2),相对于整个区间0,1)将区间0.2,0.5)缩小,得到0.2,0.26).如此进行,直至最后一个符号被编码,我们可得到最终缩小的区间为:0.23354,0.2336),如图 3.2所示。解码是编码的逆过程。如果解码器收到的区间为0.23354,0.2336),因为该区间完全落在信源模型分配给符号。的区间内(表 5-3),解码器立即可以译出第一个符号为。 。然后,解码器将区间缩小为0.2,0.5),因为接受到的区间落在符号 a 的区间0.2,0.26)内

41、,所以可译出第二个符号为 a。以此类推可译出所有的码来。 图 3-2 算术编码流程图显然,无须传输编码区间的两个端点,因为该区间内的任何一个点都能够译出正确的码来。但是,解码时会碰到一个问题:如何判断消息的终点?例如,数据0.0 可以表示 a, aa, aaa中的任何一个。解决这个问题的办法是在消息的末尾加入一个特殊的表示消息结束的符号 eof,如在上例中的符号!,解码器一遇到该符号就立即停止解码。3.3 有损图像压缩编码方式有损图像压缩编码方式有损压缩方案,容许图像的质量有所下降,但与无损压缩相比,它的编码比特率有较大的改善,而且重建图像的质量相对于人眼的视觉特性并没有明显的下降。有损图像压

42、缩可以达到几十倍的压缩比。通常有损图像压缩编码方案有变换编码、预测编码和矢量量化编码(vq)等。3.3.1 失真度理论和有损压缩信息源的编码率性能界限 (即信号源的熵)取决于无损编码的数据。在许多实际情况下,编码后重建图像存在一定程度的失真 (即图像降级)是允许的。在保持某一图像级水平时,对给定的图像信息源编码所需要最小比特率时多大?回答这一问题是信息论中一个分支要解决的问题,即失真度理论所讲的一个基本问题。失真度理论为达到某一高保真度标准的有损压缩建立了一个理论的性能界限。对于广播级的失真度,计量以及信息源的模型,这一理论提供了具有一下性质的失真度方程:()r d1.对于任何级别的失真度 d

43、,可以找到一种编码方案,其比特率可以任意接近,其平均失真度可以任意接近 d;不可能找到一种编码方案,使得编码比特率()r d比低,而失真度是 d 或者更好,可以证明,是一个 u 型的,连续单调()r d()r d下降函数。2.对于具有有限个字符的离散信号源,由图 2.2 可以看出其典型的失真度特性: (1). 当 d=0 时,无失真的值大于或等于信息源的熵。()r d(2)一般来说,比较复杂的编码方案可以较好的刻画信息源的统计特性,因而其性能可以较好的接近 r(d)的界限。图 3-3 失真度界限和典型编码特性3.2.2 变换编码变换编码的基本思想是把空间域的图像信号转换到变换域。若变换是正交变

44、换,则变换域的能量与空域相等并且熵保持不变。但是变换前后信息能量得到了重新分布。空间域中的像素之间存在很强的相关性,而变换域中能量则主要集中在直流和少数低频的变换系数上,这部分占图像信息的 90%。而高频部分的幅值很小或几乎为零。同时变换系数间基本上是统计独立的,相关性较小。因此,可以仅对低频的变换系数进行量化、编码和传输,而对高频部分则不予编码,从而达到图像压缩的目的。实际中一般采用阈值编码法:即事先设定一个闭值,只对大于此阈值的变换系数编码,这样可使图像的某些高频成分得到保留,重建图像时图像品质得到改善。有很多类型的正交变换,如 k-l(离散信号的 hoteiling)变离散余弦变换 (d

45、ct)、沃尔什-哈达玛变换和斜变换等。在这些正交变换中,采用均方误差最小准则的 k-l 变换是最佳变换,但其无快速算法且依赖于信源的统计特性,所以很难进行实时编码。基本变换编码的框图如图 3-4 所示:图 3-4 变化编码流程图3.2.3 预测编码预测编码是数据压缩技术的一个重要分支,其理论基础主要是现代统计学和控制论。图像的相邻像素之间存在着高度的相关性,即原始数据中存在着大量的冗余。去除这些冗余,信号就可以有效的压缩编码。预测技木是最简单和有效的压缩方法。发送者(和接收者)以某个固定的顺序(如由左到右,逐行进行的光栅扫描方式),在己经被传送(接收)的像素的基础上预测当前像素值。假设以表示

46、, p i j当前像素值,以闪滚表示其预测值,预测残差。-需要被传送。 , p i j , p i j , p i j如果预测相当精确,那么预测残差的分布就集中在零值附近,其零阶熵比原始图像的零阶熵大大降低。图像的像元和邻近像元有很大的相关性,因此可以用某一点的相邻像元预测该点的值,预测误差将有较小的熵。预测编码有线性预测和非线性预测两类。它们可以在一幅图像内进行(帧内预测编码),也可以在多幅图像之间进行(帧间预测编码)。预测编码基于图像数据的空间和时间冗余特性,用相邻的已知像素(或图像块)来预测当前像素(或图像块)的取值,然后再对预测误差进行量化和编码。这些相邻像素(或图像块)可以是同行扫描

47、的,也可以是前几行或前几帧的,相应的预测编码分别称为一维、二维和三维预测,其中一维和二维预测是帧内预测,三维预测是帧间预测。预测编码的关键是在于预测算法的选取,这与图像信号的概率分布有很大关系,实际中常根据大量的统计结果采用简化的概率分布形式来设计最佳的预测器,有时还使用自适应预测器以较好的刻画图像信号的局部特性,提高预测效率。线性预测编码又称为差分脉码调制,即dpcm(differential pulse code modulation)。帧内预测编码一般采用像素预测形式的dpcm。图 3-5 为 dpcm 的编码流程图。dpcm 是一种简单易行的预测编码方法,其优点是算法简单,易于硬件实现

48、,缺点是对信道噪声及误码很敏感.会产生误码扩散,使图像质量大大下降。图 3-5 线性预测(dpcm)编码流程图预测器用己经编码的邻近像素来计算的估计与(1), (2)()x nx nx np( )x n估计值的差值=,用于存储和传输。预测器的预测精度越高,预测偏差( )e n( )estx n越低,压缩比越高。3.2.4 矢量量化编码矢量量化的基本思想是根据 shannon 的信息理论,对符号序列在多维空间内进行联合编码,以获得更高的压缩效率。其方法是:将输入图像数据序列分成多个组,每一组有个数据构成一个 m 维空间中的一个矢量。在 m 维空间中,(2)m m 将其划分成个区域,每个区域内所有

49、矢量用此区域内的中心矢量代替。对 x 个量x化矢量分别赋一个索引值,则某个索引区内的所有矢量都可以用索引值来表示。编码时只传输或存储该索引值,解码端采用与编码端相同的空间划分方法,则可由此索引值得到对应的量化矢量,因而能有效地对图像数据进行压缩。上述的空间划分称为矢量码书训练。矢量码书是通过大量样本的训练或学习或自组织特征映射神经网络方法,得到一系列的标准图像模式,每一个图像模式就称为码字或码矢,这些码字或码矢合在一起称为码书,码书实际上就是数据库。输入图像块按照一定的方式形成一个输入矢量。编码时用这个输入矢量与码书中的所有码字计算距离,找到距离最近的码字,即找到最佳匹配图像块。输出其索引(地

50、址)作为编码结果。解码过程与之相反,根据编码结果中的索引从码书中找到索引对应的码字(该码书必须与编码时使用的码书一致),构成解码结果。如图 3-6所示:由于矢量量化有效地利用了矢量中各分量间的四种相关性(线性依赖性、非线性依赖性、概率密度函数的形状和矢量维数)去除冗余度。因此,其结果要好于标量量化。实际上,矢量量化可看成是标量量化的多维扩展。图 3-6 矢量量化编码流程图3.2.5 dct 变换编码dct 变换是变换编码方法中的一种,但由于它是 jpeg建议书中的核心压缩编码方案,在变换用于图像压缩时,我们期望有如下性质: a)减少图像相关:理想变换将完全消除图像块中的数据相关,即把绝大部分能

51、量压缩进最小的系数中去。 b)基本函数与图像无关:由于图像间统计特征变化大,最佳的变换通常依赖于图像的本身,但是要求这种于图像无关是件很费计算时间的任务。如果图像块不是静态的,就必须使用多组,以便高度的减少相关性,而这样的处理不仅费时,而且需要附加信息把组号传送到解码端,从而降低压缩效率,所以一般期望用与图像无关的基本函数变换替换最优性能变换。 c)快速实现:n 点变换需要 d(n2)操作,而一些变换有快速算法,其操作次数可以减少为 o(次,如果是 2 维变换,那么操作次数就从 o()减少到 o(lognn4n).klt 变换是一种能量打包的最优变换,然而 klt 变换函数是图像依赖22log

52、nn的,且不存在快速算法,在对图像信号的变换中,dct 和 klt 相差无几,而且dct 变换有其它变换无法比拟的优点,即:实数变换,确定性变换函数 (变换核)、可分离的变换。二维 dct 变换为: (3-11002(21)(21)( , )( ) ( )( , )coscos22mnxxxuyvf u vc u c vf x ymnmn2) (3-11002(21)(21)( , )( ) ( ) ( , )coscos22mnxxxuyvf x yc u c v f u vmnmn3)可见,二维变换都有相同的变换函数,且是可分离的: (3-2(21)2(21)( , , , )( , )

53、( , )coscos22xuyvg x y u vg x y g u vmmnn4)3.2.6 小波编码小波分析是当前数学中一个迅速发展的新领域,它同时具有理论深刻和应用十分广泛的双重意义.它与 fourier 变换、窗口 fourier 变换(gabor 变换)相比,这是一个时间和频率的局域变换,因而能有效的从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析(multistage analysis),解决了 fourier变换不能解决的许多困难问题,从而小波变化被誉为“数学显微镜”,它是调和分析发展史上里程碑式的进展。与傅立叶分析相似,小波变换(wavelet tra

54、nsform)是一种同时具有一频二维分辨率的变换。其优于傅氏变换之处在于它具有时域和频域“变焦距”特性,十分有利于信号的精细分析。小波变换在时域和频域都具有良好的局部化特性,它能将图像分解成交织在一起的多种尺度成分,并对不同的尺度成分采用对应粗细的时域或空域取样步长,对高频信号采用细处理,对低频信号采用粗处理,因此可以不断聚焦到对象的任意微小细节,这使得小波变换优于傅里叶变换和盖博变换。小波变换的良好特性与mallat 算法的简便易行,使得小波技术成为图像编码领域里的一个主要研究对象。我们称满足容许性条件:2( ) sodss 其中称为的傅里叶变换) 的函数为原( ),( )jwxjwxos

55、ex edx( )x( )x形小波或母小波函数。母小波函数 通过平移和伸缩可以生成一组小波基函数( )x : ,( )a bx,( )a bx1()xaaa其中且a ,b 同为实数。变量a 表示一个特定基函数的宽度,b 表示其沿x 0a 轴的平移位置。式中为依,( )a bx赖于参数a ,b 的小波函数,简称为连续小波或小波。小波离散后可以构成空间的规范正交基,并2( )l r使用它来表示或逼近信号,而且用较少的小波系数就可以得到许多不同图像的精确逼近。mallat 提出了求解小波系数的塔形算法,思想如下:对一幅图像完成一次二维小波变换,需要对图像的行和列分别进行一次mallat 算法处理,也

56、就是水平和垂直滤波,小波变换将原始图像分成四个子带,即1个低频子带(ll)与3个高频子带(lh,hl,hh) 。对低频子带进一步实施小波变换。分解成下一级4个子带。如此反复,图像就被多分辨率分解成不同分辨率级和不同方向的子带。其中ll 子带集中了图像的大部分能量,即大幅值(绝对值较大) 系数大部分集中于此,这样就有利于图像的压缩编码。以后的小波变换都是对前一次变换产生的低频子带进行变换。图3-7是图像进行三级小波变换后的示意图。一般说来,利用小波变换进行图像压缩需要经过以下步骤: 寻找具有紧支集的正交小波及其对应的小波滤波器。输入原始图像点值序列。结出分解层数和图像数据向量长度。对原始图像运用

57、二维mallat 分解算法进行小波变换,得到不同层次、不同图号的子图。根据不同层次、不同子图的特点,对相应小波系数的各个部分进行数据向量的量化编码,对最高层子图需要进行无失真压缩编码。小波应用于图像压缩编码,使得图像的压缩比高,压缩速度快。但由于小波应用于图像编码时间还不长,许多工作还处于探索阶段。今后还有很多需要研究,如:活动图像小波编码,人眼视觉特性的充分利用,多小波变换的应用等。 图3-7 三层小波分解示意图从现在的研究结果可看到,小波技术应用于图像已获得了较好的编码效果,小波技术是现代图像压缩技术研究的热点之一,也是十分有前途的一种方法。小波图像压缩方法是近年来受到广泛重视并己逐步得到应用的变换编码技术。与传统的 dct 变换相比,离散小波变换(dwt)具有良好的时频局部化特性和较好的能量集中特性,同时由于小波变换是对整个图像进行的,因此基于小波的图像压缩方法能够很好地克服方块效应; 如图 3-7。此外,小波变换具有天然的塔式分解数据特征,可应用于图像的多分辨率分解的多分辨率特性提供了利用人眼各种视觉特性的良好机制。正是由于这些原因,众多学者对基于小波的压缩方法进行了研究。结束语结束语随着信息技术的突飞猛进,存储介质的存储量越来越大,通信线路的频带越来越宽,然而,数据量和通信业务的发展又远远超过存储量和带宽的增长速度,这就好比路和车一样,因此数据压缩是数据存储和传

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论