




已阅读5页,还剩67页未读, 继续免费阅读
(信息与通信工程专业论文)静止图像压缩算法的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 未经压缩的多媒体( 图形,音频,视频) 数据要求很大的存储容量和传输带宽。 尽管大容量存储器,处理器速度,和数字通信系统在快速进步,但对数据存储容 量和数据通信的需求仍然超越当前技术。近来兴起的数据密集的基于多媒体的w e b 应用不但需要信号和图像的更有效的编码方式,而且要求对这些信号做基于存储 和通信技术的压缩。 j p e g 是国际上静止彩色图像和灰度图像的第一个国际标准,它不仅适于静止 图像的压缩,电视图像序列的帧内图像的压缩编码也常采用j p e g 压缩标准。近年 来,由于小波变换在时域和频域同时具有良好的局部特性,并且具有描述非平稳 图像信号的能力和适应人眼视觉特性的良好性能,因而成为现代图像编码领域研 究的热点之一,在图像编码领域获得了广泛的应用,其中与此的相关研究己取得 了很大地进展。s h a p i r o 于1 9 9 3 年提出了嵌入零树小波( e m b e d d e dz e r o t r e e w a v e l e t ,e z w ) 算法,这种方法很好地利用了小波系数的特性使碍输出的码流具 有嵌入特性,既实现了高的压缩比,又保证了重建图像的质量。 本文针对静止图像压缩算法进行了较为深入的研究,具体来说包括以下几个方 面: 1 研究了基于d c t 变换的j p e g 基本系统,在此基础上提出一种分级方法, 可产生质量可分级的码流。 2 针对传统的图像压缩采用d c t 变换编码会出现“方块效应”,同时压缩的效 率不高,研究了小波变换及提升方法及基于小波变换的零树编码算法( e z w 、 s p i h t ) 。 3 结合整数小波变换和零树编码算法,可实现图像的无损和有损压缩。并提出 一种改进的s p i h t 算法,通过实验证明,该方法比原始的算法在无损压缩率和 p s n r 上都有一定提高。 关键词:图像压缩,j p e g ,整数小波,e z w ,s p i h t a b s t r a c t 1 1 l em u l t i m e d i a ( i m a g e ,a u d i o ,v e d i o ) d a t aw i t h o u tc o m p r e s s i o n d e m a n d sl a r g e c a p a c i t y f o r s t o r a g ea n dt r a n s m i s s i o nb a n d w i d t h a l t h o u g h t h e t e c h n o l o g i e s o f m e m o r y , p r o c e s s o ra n dd i g i t a lc o m m u n i c a t i o ns y s t e mp r o g r e s sr a p i d l y , t h er e q u l r e m e m f o rs t o r a g ec a p a c i t ya n dd a t ac o m m u n i c a t i o ni sb e y o n dt h et e c h n o l o g i e sc u r r e n t l y t h e d a t a i i l t e n s i v ew e ba p p l i c a t i o nb a s e do nm u l i m e d i aa r i s e sl a t e l y n e e d s am o r e e f f i c t i v ew a yo fc o d i n gs i g n a l sa n di m a g e s ,a sw e l la sc o m p r e s s i o nb a s e do ns t o r a g ea n d c o m m u n i c a t i o nf o rt h o s es i g n a l s j p e gi st h ef i r s ti n t e r n a t i o n a ls t a n d a r da b o u ts t i l lc o l o ri m a g ea n dg r a yi m a g e ,i t 1 s f i tf o rc o m p r e s s i o no fb o t hs t i l li m a g ea n df l a m e so ft vi m a g es e q u e n c e s i nr e c e n t v e a r s w a v e l e tt r a n s f o r mb e c o m e sah o tr e s e a r c ha s p e c to fi m a g ec o d i n ga r e a , f o ri t sg o o d c h a r a c t e d s t i ci i lb o t ht i m ed o m a i na n df r e q u e n c yd o m a i n ,a n di t h a sac a p a b i l i t yt o d e p i c tn o n s t a t i o n a r yi m a g es i g n a l a n dag o o dp e r f o r m a n c et o f i th u m a nv l s u a s p e c i a l t i e s i f i sw i d e l yu e s e di ni m a g ec o d i n ga r e aa n dr e s e a c ho ni t h a sm a d e s i g n i f i c a n tp r o g r e s s s h a p i r op u tf o r w a r de z w ( e m b e d d e d z e r o - t r e ew a v e l e t ) a l g o r i t h m i n 19 9 3 t h i sm e t h o dm a k eu s eo ft h es p e c i a l i t yo fw a v e l e tc o e f f i c e n ts ot h a tt h eo u p u t b i t s t r e a l nh a sae m b e d d e dc h a r a c t e r i s t i c ,i tm a k e sah i g hc o m p r e s s i o nr a t i oa n dg o o d q u a l i t yo fr e c o n s t r u c t e di m a g e i r it 1 1 i st h e s i s ,ac o m p r e h e n s i v er e s e a r c hf o r t h ec o m p r e s s i o nm e t h o do f s t i l li m a g ei s a d d r e s s e d ,w h i c hc a l lb es u m m a r ya sf o l l o w i n ga s p e c t s : 1 j p e gb a s e l i l l eb a s e do nd c tt r a n s f o r mi ss t u d i e d ,a m e t h o df o rr a t i n gt h e b i t s t r e a mi sp r o p o s e dw h i c hc a l la c h i e v eg r a d a b l es t r e a mo f d i f f e r e n tq u a l i t i e s 2 o na c c o u n to ft h eb l o c k e f f e c to ft r a d i t i o n a li m a g ec o m p r e s s i o nm e t h o d b a s e do n d c t 缸a n s f o ma n dt h ec o m p r e s s i o nr a t i oi sn o ti d e a l ,ar e s e a r c ho fw a v e l e tt r a n s f o r m a n dl i f t i n gs c h e m ea n dc o d i n ga l g o r i t h mb yz e r o t r e e ( e g ,e z w , s p i h t ) i sa d d r e s s e d 3 c o m b i n ei n t e g r a lw a v e l e tt r a n s f o r ma n da l g o r i t h mu s i n gz e r o t r e e ,a c h i e v et h e l o s s l e s sa n dl o s s yc o m p r e s s i o no fi m a g e p r o p o s eai m p r o v e da l g o r i t h mo fs p i h t a n d p r o v ei tb e t t e ri nb o t hl o s s l e s sc o m p r e s s i o nr a t i oa n dp s n r k e v w o r d s :i m a g ec o m p r e s s i o n ,i n t e g e r a lw a v e l e tt r a n s f o r m ,j p e g ,e z w ,s p i h t i i 图目录 图目录 图1 1 图像压缩方法分类。1 图2 1 预测器样值分布1 1 图2 2j p e g 基本工作模式编码器和解码器框图1 2 图2 3z 字形扫描顺序1 4 图2 4d c 系数差分编码1 4 图2 5l e n a 原图像1 8 图2 6 解压后的图像18 图2 7z 字形扫描顺序及分级示意一1 9 图2 8 分级方法下不同质量等级压缩图像2 0 图2 - 9 保留级数与压缩比的关系2 1 图2 1 0 保留级数与p s n r 的关系曲线2 2 图3 1 小波变换和傅立叶变换的时间一频率窗2 4 图3 2 单层小波分解与合成示意图2 7 图3 3 提升过程的示意图2 8 图3 - 4 ( 5 ,3 ) 小波提升算法结构图3 0 图4 1 二维小波变换分解的m a l l a t 算法3 3 图4 2 二维小波变换重构的m a ll a t 算法3 4 图4 3 图像小波分解示意图3 4 图4 4 图像小波分解的原图和3 级小波变换图像3 5 图4 5l e n a 图像及其部分子带的统计直方图3 6 图4 6 三层小波分解及树结构示意图3 9 图4 7 子带扫描次序4 2 图4 8 有效值映射流程图4 2 图4 9 定点运算的算术编码器的编码流程图4 5 图4 1 0 定点运算的算术编码器的解码流程图4 6 图4 1 1l e n a 图像压缩结果4 8 图4 1 2h a r r 小波与( 5 ,3 ) 小波压缩性能曲线4 9 图5 1s p i h t 算法中方向树的定义。5 1 图5 2d p c m 样值分布5 4 图5 3d p c m 预测后的图像与还原图像5 4 图5 4 原图与d p c m 图像的直方图5 4 图5 。5 改进的s p i h t 方向树定义5 6 图5 6 改进s p i h t 算法流程5 8 图5 7 实验中使用的图像5 9 v 图目录 图5 8s p i h t 压缩比1 :3 2 的压缩结果6 0 图5 - 9 三种算法压缩性能曲线6 2 v i 表目录 表目录 表1 15 分制图像质量等级评价6 表2 1j p e g 的8 种预测方式。1 1 表2 2 对d i f f 编码的符号1 取值及其表示的范围1 5 表2 3 亮度和色度分量d c t 变换中直流差值的符号1 ( s i z e ) 的h u f f m a n 码表1 6 表2 - 4s i z e 和菲零怒系数取值范围的关系17 表2 5 分级后保留级数与压缩效果的关系2 1 表4 1l e n a 图像小波系数统计分布3 4 表4 2l e n a 图像及小波系数相关性统计3 6 表4 3 小波系数的子带相似性统计3 7 表4 4 整数h a r r 小波结合e z w 压缩结果4 7 表4 5 ( 5 ,3 ) 整数小波结合e z w 压缩结果4 8 表5 1 不同图像s p i h t 算法压缩结果5 9 表5 2 不同算法有损压缩的结果比较5 9 表5 3 算法无损压缩率对比6 0 v i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。 签名:乏曲啦日期:) 。尸年,月弓j 日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文 ( 保密的学位论文在解密后应遵守此规定) 签名:撙导师签名:缉 日期:加f 年夕月;j e t 第一章绪论 1 1静态图像压缩概述 第一章绪论 1 1 1图像压缩编码的必要性和可行性 以计算机和通信技术为主的信息技术飞速发展及信息技术的广泛应用正在改 变着人们的生产生活方式。在未来的信息环境中,大量的信息是以数字化的方式 表示、存储和传输的,而这些数字化信息中图像信息又占了绝大部分。据统计,在 人们由感观所获取的信息中图像信息占了6 5 。数字化的图像所占的空间是非常 大的,例如,对一幅分辩率为1 0 2 4 7 6 8 、颜色2 4 位的图像进行存储,将占2 3 m b 的存储空间,而1 秒钟未经压缩的数字视频图像所占的空间将达上百兆字节,这 对于目前存储空间和传输带宽来说,都是不能承受的。为了能够对图像信息进行 有效地处理,对数字图像信息进行压缩是一种必然选择。因此,数字图像信息压 缩编码成为多媒体信息处理中的关键技术。 从信息论观点来看,图像作为一个信源,描述信源的数据是信息量( 信源熵) 和信息冗余量之和。人们研究发现,图像数据表示中存在大量的冗余,如空间冗 余,时间冗余,结构冗余,知识冗余,视觉冗余等。数据压缩实际上是减少这些 冗余量。冗余量减少减少的是数据量而不是信源的信息量。从数学上来说,图像 可以看作一个多维函数,压缩用来描述这个函数的数据量实质上是减少其相关性。 另外,被编码信号由于概率密度分布的不均匀,还存在着统计冗余。通过相应的 处理,去除原始信号中的冗余信息,就可以达到压缩数据量的目的。此外,利用 人眼的视觉特性,将人眼不能觉察或不易感知的客观信息剔除,也能够进一步提 高压缩效率。另外在一些情况下,允许图像有一定的失真,而并不妨碍图像在实 际应用时需要的主观质量,那么数据量压缩的可能性就更大了。 通过将冗余信息去除,可以使原始图像数据量大大降低,从而可以解决图像数 据量巨大的问题。因此,进行图像压缩研究的起点就是研究如何去除图像数据的 冗余性来减少图像数据量。 1 1 2 图像编码技术的发展 图像压缩编码技术到今天己经有约6 0 年的历史了,可以追溯到1 9 4 8 年提出的 l 电子科技大学硕士学位论文 电视信号数字化。就编码而言,是k u n t 1 】【2 】提出了第一代、第二代数据压缩编码 的概念。他把1 9 4 8 年一1 9 8 8 年四十年中研究的以去除冗余为基础的编码方法称为 第一代编码方法,比如p c m 、d p c m 、亚取样编码法、变换编码中的d f t 、d c t 、 w a l s h h a d a m a r d 变换等方法以及以此为基础的混合编码方法都属于经典的第一代 编码方法。到五六十年代,由于受到电路技术等的制约,图像压缩编码技术还仅 仅停留在预测编码、亚采样等技术的研究,还是非常不成熟。第一个比较实用的 编码方法是由d a h u f f m a n 于1 9 5 2 年发表的论文“最小冗余度代码的构造方法( a m e t h o df o r t h ec o n s t r u c t i o no fm i n i m u mr e d u n d a n c yc o d e s ) 中提出的,后人称之 为h u f f m a n 编码。h u f f m a n 编码运算速度快,效率高且实现方式很灵活,自六十 年代起至今,在数据压缩领域得到了广泛的应用。 p e g 3 】【4 j 是国际上第一个静止彩色或灰度图像压缩的通用标准,它不仅适用于 静止图像的压缩,对电视图像序列的帧内图像的压缩编码也常采用j p e g 压缩标 准。j p e g 采用的是以d c t 变换编码为核心的算法,在世界范围内被广泛接受和 应用。但是,基于d c t 变换的编码也有其明显的缺陷。在实际应用中,为了便于 实现和后处理,图像被划分成8 8 或1 6 1 6 的小块,然后分别对每一个块进行 单独的变换和后处理。这种对图像块的单独处理带来了块效应和压缩效率上的限 制的问题,特别是当码率较低时,主观上的块效应( 类似马赛克效应) 非常明显, 这成为影响d c t 变换编码质量的主要因素,也是其难以克服的一个缺点。 第二代的数据压缩编码方法多是从二十世纪八十年代开始提出的新的编码方 法。由于数学家们对于h u f f m a n 编码中的某些弱点不能满足,就设计出另一种更 为精确更能接近信息论中“熵 极限的编码方法算术编码。在此基础上,又 发展了一些新的编码方法,如金字塔编码法、f r a c t a l 编码、模型基编码。其中, 最具有代表性的有l z 7 7 t 5 】和l z 7 8 6 1 算法,将基于此类思想的编码统称为“字典式” 的编码方法。字典式编码不仅在压缩效果上远远超越h u f f r n a n 编码,而且很好实 现,并且它的压缩和解压缩的速度也异常迅速。1 9 8 4 年,l z 7 8 算法的一个变种一 一l z w 7 1 产生。l z w 算法继承了l z 7 7 和l z 7 8 算法压缩效果好、速度快的优点, 并且对算法的描述方式也更容易被人们所接受。到七十年代末八十年代初时,人 们开始逐渐意识到,对于大不部分的彩色或者灰度图像而言,没有必要完全忠实 地保留其所有信息,在允许有一定的精度损失的情况下,可以实现更为有效的压 缩。到八十年代末,基于这样的思想,已经有许多人在这一领域取得了不小的成 果,并设计出了一些在压缩效果上令人惊叹的图像压缩编码算法。 第三代数据压缩编码技术主要是从九十年代至今发展出来的,图像压缩技术 2 第一章绪论 上的成果主要体现在分形编码、小波编码等,矢量量化编码技术也有较大的发展 捧,j 。由于小波变换理论,分形理论,视觉仿真理论,人工神经网络理论等的建立, 人们开始突破传统的信源编码理论,例如不再假设图像是平稳的随机场。现代编 码技术的特点是:充分考虑人眼的视觉特性,在恰当地考虑对图像信号的分解与 表达时,采用图像的合成与识别方案压缩数据。图像压缩编码技术向着更高的压 缩比和更好的压缩质量的方向前进,进入了一个欣欣向荣的发展时期。 1 0 l 1 1 3图像压缩编码的基本方法 总结经典压缩编码技术的压缩过程以及其中较常使用的编码方法,可以归纳如 下。图1 1 为图像压缩方法分类。 图1 i 图像压缩方法分类 压缩编码方法有许多种,从不同的角度出发有不同的分类方法,比如从信息论 角度出发可大致分为两大类: ( 1 ) 冗余度压缩方法,也称为无损压缩,熵编码或者信息保持编码。具体讲就是 3 电子科技大学硕士学位论文 解码图像和压缩编码前的图像严格相同,没有失真,从数学上来说就是一种可逆 运算。 ( 2 ) 信息量压缩方法,也称为有损压缩,失真编码。也就是解码图像和原始图像 是有差别的,允许有一定的失真。 1 2小波分析在图像压缩编码中的应用 小波分析 1 1 , 1 2 , 1 3 】是傅立叶分析和调和分析发展史上的一个重要的里程碑,它被 誉为“数学显微镜 。作为一种多分辨率分析方法,小波变换具有很好的时频局域 化的特性,非常适合于按照人眼视觉系统的特性来设计图像编码方法,也非常有 利于图像信号的渐进式传输。一维连续小波变换可以看做是用一组不同尺度的小 波带通滤波器对原始信号进行滤波,从而将信号分解到一系列频带上来进行分析 和处理,将其离散化后即为离散小波变换d w t ( d i s c r e t ew a v e l e tt r a n s f o r m ) 。在实 际应用中,基于小波变换的图像编码方法,在压缩比和图像质量方面均优于传统 的基于d c t 变换的编码方法。 基于小波变换的图像压缩编码的核心问题是要对小波分解系数的量化和编码 【1 3 】。图像经小波变换后,能量主要集中在低频分量,而高频系数分量则大多为零 值,这就为高倍率的压缩提供了可能。由于低频系数分量包含了原始图像的绝大 部分能量,即包含了图像的基本信息,它对重建图像的质量有很大影响,在图像 重构算法中起主导作用,因此对于这部分的信号应该尽量进行精确地保留。而高 频分量的系数分布符合广义高斯分布,对其进行粗量化和编码会比较有效。这样 做也是完全符合人眼视觉特性的。因为根据对人眼视觉系统的研究,人眼的视觉 灵敏度是具有明显的低通特性的,且对不同方向上的敏感度也不一样,尤其是对 倾斜方向上的刺激是不太敏感的,例如人眼对于对角线方向的系数误差敏感度较 低,因此,可以对对角线方向的分量系数进行粗量化高压缩。早期的基于小波变 换的图像编码算法主要是利用了小波分解的频率压缩特性。这些年来,人们除了 利用频率压缩特性外,还利用了空间压缩特性和小波系数分布的结构相似性研究 出了一些较为高效的图像编码算法,比较典型的有嵌入式小波零树( e z w ) 算法、 多级树的集划分( s p m t ) 算法和集合分裂嵌入块编码( s p e c k ) 等,这些方法和 以它们为基础的改进方法构成了目前基于小波的图像编码的核心技术。因此,研 究基于小波变换的图像编码方法具有重大的理论和现实意义。 9 0 年代后期,由s w e l d e n s 等提出的基于提升方案的小波被称为第二代小波。 4 第一章绪论 第二代小波变换通过分裂、预测和更新三个步骤将原始信号分解为低频信号和高 频细节信息。第二代小波变换不仅克服了第一代小波局限于无限区域或周期信号 的弱点,同时还保留了多尺度的特性,而且整个变换过程只需要进行移位运算和 加减运算就可以完成,便于在硬件上实现。此外,所有的第一代小波均可通过提 升方案的方法来实现变换。 现阶段,基于小波变换的图像压缩编码方法的研究热点主要有以下几个方面: 第一,小波基的选择。如何选择一个用于图像编码的最优的小波基是个非常棘 手的问题,通过选择合适的小波基,可以避免重建图像中出现的马赛克效应,减 小量化噪声,获得较好的重建图像质量。 第二,小波系数的量化方法。目前,量化方法主要是标量量化和矢量量化两种。 在标量量化方法中,s h a p r i o 提出的嵌入式小波零树( e z w ) 算法是迄今为止比较 有效的一种方法,它很好的利用了小波系数的相关特性,采用了一种逐次逼近量 化的技术并实现了图像的可分级编码。 第三,d w t 的快速算法。自从m a l l e t 提出基于多分辨率分析思想的快速算法 以后,许多快速d w t 的改进算法相继被提出。s w e l d e n s 提出的小波的提升方案, 可以使d w t 的计算复杂度在m a l l e t 算法的基础上再降低一半,成为了目前主流的 d w t 计算方法。 第四,整数小波变换。在图像压缩编码中,由于图像的灰度或各彩色分量的值 都是整数,要实现图像信息的无损表示,就需要对其进行整数到整数的可逆变换, 这是d f t 、d c t 或浮点的传统d w t 都不能做到的。如果变换后的系数是浮点数 就会收到计算机精度等的限制,不能对图像进行无损编码,而且硬件上也不易实 现。 1 3图像压缩编码技术的评价参数 1 3 1主观保真度准则 由于图像压缩系统的信宿是人的眼睛,因此对于图像质量的衡量,直接或间接 都必须依赖于主观评价。目前比较常用的评价参数就是平均意见得分m o s ( m e a n o p i n i o ns c o r e ) ,可由下式计算: m o s = 力fcf k 刀, f ll 5 电子科技大学硕士学位论文 式中,k 为质量等级的总数目;c i 为第i 个质量等级的对应分值:i l i 为被观察 者评为第i 个质量等级的总得票数。表1 1 是一个五分制图像质量等级评价的分值 标准及说明。 从图像压缩编码的角度来说,努力的目标则是在尽量保证所要求的图像主观质 量的前提下,通过利用主观视觉特性和一定的编码策略等,尽量地降低描述图像 信号所需要的比特数。 表1 15 分制图像质量等级评价 等级质量损伤 5 优感觉不到 4 良可以感觉到,但不烦人 3中轻微烦人 2差烦人 1 劣 很烦人 1 3 2客观保真度参数 虽然对图像质量的主观评价还不能由客观测量完全代替,但是在实际工作中仍 然需要一些比较简单的对图像质量或图像损伤程度的定量描写,用来作为对不同 时间、地点和编码系统所待到的图像质量进行相对比较的参考。在图像和视频编 码领域最常用的图像质量的客观度量就是均方误差,其定义为: m s e = 二【s ( f ,) 一s ( f ,) 】2 m n i - i 厶一j = l 7 7 。 式中,m 和n 分别为图像垂直和水平方向的像素数;s ( i j ) 和s ( i j ) 分别为原始 图像和编解码后重建图像在( i ,j ) 点的像素值。 利用均方误差可以定义两种信噪比,分别为: 绷= 1 0 l g 鲁( d b ) q 2 p s n r = l o l g 丑( 招1 m s e m 的荔,吉善驴“) 】2 煳姻黼韵瓣渴抽麟醮髑 在信号处理的文献中使用较为普遍的是s n r ,但是,在图像压缩编码领域用 的更广泛的还是峰值信噪比p s n r 。一般情况下,原始图像被均匀量化为2 5 6 个电 6 第一章绪论 平( 8 b i t ) ,则其峰一峰值s ”为2 5 5 。 采用均方误差作为图像的一个失真测度其优点是计算起来非常简便,但图像的 均方误差或峰值信噪比常常与对图像质量的主观评价不完全统一,也就是说,均 方误差并不是一个对于图像逼真度的非常精确的判据。 1 3 3 其他参数 通常,对于图像压缩编码算法主要使用三种技术指标来进行评判:压缩比,压 缩速度,和图像质量,可以用这三种计算指标来确定在实际应用中一个压缩算法 是否适用。对图像质量的评判我们在前面已经讨论过了,下面介绍其他两种指标: ( 1 ) 压缩比 压缩比的定义如下: 压缩比= 器粼 压缩比通常可以间接地用来表示图像的质量。因为一般情况来说,压缩比越高, 重建图像的质量越差。因此,当对图像进行压缩时,如何把握压缩比和图像质量 之间的平衡是一个很重要的问题。 ( 2 ) 压缩速度 压缩速度取决于压缩所需的时间和解压所需的时间。压缩时间是对一副图像压 缩所需要的时间总量。解压缩时间是对- - n 图像解压缩需要的时间总量。它们的 值依赖于以下几个因素: 压缩算法的复杂度 算法的软件( 或硬件) 实现的效率 所利用的处理器或辅助硬件的速度 1 4本文主要工作和章节安排 本文首先针对图像压缩理论进行了简单总结归纳,介绍了图像编码的的必要性 和可行性以及图像编码方法的评价标准,目前常用的图像压缩方法以及对这些方 法从不同的角度进行分类。对j p e g 算法进行学习和探讨,提出一种对j p e g 顺序 型编码进行分级的方法。另外,对于小波变换及其在图像压缩中的应用进行了研 究,对e z w 和s p i h t 进行了深入的学习和分析,并将这两种算法与整数小波变 换结合,实现了无损压缩。对s p i h t 算法进行了一定的改进,通过实验证明了改 7 电子科技大学硕士学位论文 进的可行性和合理性。最后对j p e g ,e z w 和s p i h t 算法进行了一定分析与比较。 本文的章节安排如下: 第一章:绪论。主要介绍图像编码的必要性和可行性,图像压缩编码效率的评 价,图像压缩编码的基本方法。 第二章:小波分析理论。介绍了小波发展的历史背景,小波变换的基本理论, 小波的多分辨率分析及m a l l a t 算法,小波的提升方案和提升方案的优点及常用的 整数小波变换。 第三章:j p e g 压缩编码算法的研究及实现。介绍了j p e g 算法,对基本模式 进行了主要研究,提出一种分级的j p e g 实现方法。 第四章:嵌入式小波零树算法( e z w ) 。介绍了图像小波变换原理并对小波系 数的特点进行了统计。然后介绍了e z w 算法和算术编码的基本原理,并结合整数 小波和e z w 实现了图像无损和有损压缩。 第五章:分层树的集划分( s p i h t ) 算法。介绍了算法基本原理,对原算法进 行了一定改进,对算法进行了仿真,并通过仿真结果对算法进行比较。最后,对 文中主要介绍的几种算法在压缩率和p s n r 上进行了比较和分析。 第六章:全文总结及展望。对本文的工作进行了总结,并指出不足之处和今后 的研究方向。 8 第二章j p e g 压缩编码算法的研究及实现 第二章j p e g 压缩编码算法的研究及实现 p e g ( j o i n tp i c t u r ee x p e r tg r o u p ) 是国际标准化组织( i s o ) 和c c i t t 联合制 定的静态图象的压缩编码标准,是国际上静止彩色图像和灰度图像的第一个国际 标准。它不仅适于静止图像的压缩,对于电视图像序列的帧内图像的压缩编码也 常采用j p e g 压缩标准。 p e g 作为一个通用的国际标准,其制定满足了几个原则:首先,反映了当时 先进的图像压缩算法的水平;其次,在运算复杂性、软硬件实现的结构有效性、 图像质量以及压缩比等方面做出折中,并且满足通用性原则,不仅能适应各种图 像类型,如建筑、人脸、医学成像及自然景物等,还能适应各种彩色空间、分辨 率和图像维等。p e g 作为标准,还提供了各种的工作模式,可以适应不同的应用 要求,如:顺序工作方式、渐进方式、无失真及多种分辨率方式等【l5 1 。 2 1j p e g 标准的工作模式 为了使用于单色或彩色图像,p e g 对每一个图像分量单独编码。对于单色图 像,它只有一个分量,反映图像的亮度。对于彩色图像p e g 对每个不同的图像分 量可以采用不同的量化参数和熵编码的码表,j p e g 本身并不进行分量间的转换。 对于一个图像分量,p e g 提供4 种工作模式。 顺序编码:p e g 的基本工作模式,对于每个图像分量,扫描次序从左到 右、从上到下,单次扫描完成编码。 渐进编码:图像编码在多次扫描中完成,接受端接收到的图像是经过多次 扫描,由模糊到清晰的渐进过程。当传输信道非常慢时,它提供一个由粗 到精的渐进码流结构。 无失真编码:通过预测编码方式,保证解码后可完全精确地恢复出源图像 数据,提供一个无损的编码模式。 分层编码:图像在多个空间分辨率进行编码,提供多分辨率的码流结构。 以上四种工作模式中,顺序编码和渐进编码是基于d c t 的有损压缩编码,无 失真是基于d p c m 的预测编码,而分层编码既可以采用基于d c t 的有损压缩编码, 也可以采用基于d p c m 的无损编码。目前使用最为广泛的是标准中的基本顺序编 9 电子科技大学硕士学位论文 码模式,将在下一节中具体讨论。 2 1 1 渐进工作方式 在渐进工作方式下,图像分量通过多次扫描,得到一个图像质量由粗到精的码 流表示。在这种操作模式下,首先需要将整个图像按8 x 8 像素块的d c t 变换和量 化后的量化系数进行缓存,然后再进行多次的扫描编码。对每一个块,首先选择 一部分系数或部分精度进行熵编码和传输,解码端得到一个非常粗的重构图像, 每次扫描增加一部分系数或精度,产生使图像质量得以改善的附加码流。这个过 程重复几次,最终可以达到要求的质量。j p e g 提供了两种分批编码方法,即频谱 选择法和逐次逼近法。用户可单独采用其中的一种方法进行编码,也可将两种方 法组合在一起使用。1 1 6 ( 1 ) 频谱选择法 对8 x 8 块进行z i g z a g 扫描构成的一维序列中,左边的a c 系数为低频分量,右 边的a c 系数为高频分量,因而可按从左到右的顺序将a c 系数划分成若干频带, 在熵编码过程中,对特定频带的系数依次编码。在频谱选择法中,d c 系数总是和 a c 系数分开编码,并且总是在分量的第一次扫描中编码。 ( 2 ) 逐次逼近法 这种方法先对d c t 系数的若干高比特位编码,再对次高比特位进行编码,这 样直至编码完所有的比特位,即第一次扫描只对d c t 系数的近似值进行编码,在 以后的扫描中对逐步提高d c t 系数精度的剩余值进行编码。 2 1 2分层工作方式 分层工作方式用于提供图像的多分辨码流结构。在这种工作方式下,通过对原 始图像进行低通和2 :1 下采样( 水平或垂直) 得到在水平和( 或) 垂直方向1 2 大小的图像,将这个过程不断进行下去,就能得到l 层次图像俐,l = 0 ,l ,工1 。 编码时,首先对拖j 伍,) 编码,可以采用j p e g 的基本工作模式,得到码流c l - 1 ;对 c 厶j 解码得到噩j 以的解码图像x l ( i ,歹) ,对x l ( i ,) 在水平和垂直方向进行线性 插值,得到两倍大小的图像z 乙( f ,歹) ,接下来对x 心( f ,) 一x 厶( f ,歹) 进行编码,得 到码流c t , 4 ;这个过程一直进行下去,得到码流组解码图像c l - 2 ,c t , - 1 ,c d 。 如果在传输和显示过程中,只使用c 厶j ,则得到原图象1 2 大小的解码图像;如 果使用c 厶j ,c z , e ,则得到原图像l 2 m 大小的解码图像。一直到使用整个码组, 就可以得到原图像大小的解码图像,由此得到一个多分辨率码流组。l l m 1 0 第二章j p e g 压缩编码算法的研究及实现 2 1 3无失真编码 j p e g 无失真编码方式中,提供了8 种预测方式,通过一个选择器进行选择,8 种模式列于表2 - 1 中。相邻像素的排列如图2 - 1 。 cb a x 图2 1 预测器样值分布 表2 1j p e g 的8 种预测方式 选择器预测 o无预测 1a 2b 3c 4a 十b c 5a + ( ( b c ) 趁) 6b + ( a c ) 2 7 ( a + b ) 2 在无失真编码方式下,输入的图像可以是2 1 6 位精度的像素,可以在预测器 l 7 中选用任意一种,对预测误差采用熵编码。如果熵编码采用的是h u f f m a n 编 码,则对预测误差的编码方式类似于在基本模式下的d c 系数编码。也可以采用算 术编码对预测误差编码。 2 2j p e g 基本工作模式及实现 在j p e g 应用中,最常用的工作模式就是顺序编码的基本工作模式。实际上, 许多硬件j p e g 编码器和商用j p e g 软件,都仅支持这种工作模式。 在j p e g 基本工作模式下,编码器和解码器的方框图如图2 2 所示。 电子科技大学硕士学位论文 码 ( a ) 编码器 图像 ( b ) 解码器 图2 2j p e g 基本工作模式编码器和解码器框图 在基本工作模式下,输入图像限制为8 位。在进行d c t 变换之前,先进行电 平平移,即将取值范围在o 2 p 1 的像素值通过减去2 n 1 变为2 p 1 2 p 1 范围内的 有符号数。这样做的目的是为了降低d c t 运算时的内部精度要求,例如,若p = 8 , 则经平移后,在0 - 2 5 5 之间的无符号样值变成在1 2 8 1 2 7 之间的数据。 2 2 1前向余弦变换( f d c t ) 和反向余弦变换( i d c t ) j p e g 采用的是8 x 8 大小子块的二维离散余弦变换( d c t ) 。在编码器的输入端, 先把原始图像按照从上到下,从左到右的顺序分割成一系列8 x 8 的子块。然后对 这些子块以此进行d c t 编码。d c t 变换和反变换的数学公式为: f 功一 c 嘻争叫) c o s 丁( 2 i + 1 ) u n c o s ( 2 j + 。1 ) v n - m 力一 e e ( v ) 喜喜砌,v ) c 。s 学c o s 骘u 华】 - t - 0 旬 i q1 其中,x ,y ,u ,v = 0 ,1 ,7 c c = 【1 。x 。0l l 。具他 1 2 第二章j p e g 压缩编码算法的研究及实现 2 2 2 量化和反量化 为了达到数据压缩的目的,还需要对d c t 系数作量化处理。量化是一个多到 一的映射过程,它是造成d c t 编码中信息损失的根源。j p e g 采用的是线形均匀 量化器,量化定义为分别对6 4 个d c t 系数除以对应的量化步长,然后四舍五入 取整,即每块需进行6 4 次除法运算,如下表达式所示。 f v 沁v ) = i n t e g e rr o u n d 【f ( u ,v ) q ( u ,v ) 】 式中q 沁v ) 是量化器的步长,它是量化表中的元素,量化表元素根据d c t 系 数的位置和不同彩色分量又不同值。量化器是一个均匀量化器,但每个交换系数 的量化步长是不一致的。量化表的尺寸为8 x 8 ,与每块6 4 个变换系数一一对应。 在j p e g 标准中并没有规定固定的量化步长矩阵,但是给出了一个推荐的量化步长 矩阵,可以作为缺省值。对于个8 x 8 块亮度分量d c t 变换系数推荐的一种量化 1 01 62 44 05 1 6 1 、 1 41 92 65 86 05 5 l 1 62 4 4 05 76 95 6 l 2 22 95 18 78 06 2 l 3 75 66 81 0 91 0 37 7 l 5 5 6 4 8 11 0 41 1 39 2l 7 88 7 1 0 3 1 2 11 2 01 0 1l 9 59 81 1 2 1 0 01 0 39 9 对于色度分量,j p e g 给出的参考矩阵q u v 为: 反量化表达式为( u ,v ) = f q ( u , v ) q ( u ,v ) 。 量化的作用是保证图像质量在一定的主观保真度的前提下,丢弃一些对于视 觉效果影响不大的信息。对一般的图像来说,8 x 8 的d c t 系数矩阵量化后大部分 都被截取为零,如果丢掉这些为零的系数,对于重构图像的画面质量并不会产生 显著影响。因此,利用d c t 和量化进行图像压缩可以节约大量的存储空间。压缩 应该在最合理的近似原图像的情况下使用最少的系数表示,使用系数的多少也决 1 3 l 2 3 7 2 5 4 2n圪b趁弘矾蛇 为6 2 4 4 8 4 9 2 q 厂 阵 一 卿 吣 长步
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广西壮族自治区人力资源和社会保障厅直属事业单位招聘重点领域急需紧缺高层次人才2人笔试模拟试题及答案解析
- 2026华能海南实业有限公司高校毕业生招聘笔试模拟试题及答案解析
- 2025四川乐山市马边古彝文化旅游投资开发有限公司招聘企业员工2人笔试模拟试题及答案解析
- 2025年广西来宾市工业园区公开招聘编外工作人员6人笔试备考试题及答案解析
- 2025年急性感染性疾病预防控制方案模拟考试卷答案及解析
- 2025江苏连云港东海县招聘第三批社区工作者58人笔试备考题库及答案解析
- 2025年胸外科手术操作技能模拟考试答案及解析
- 2026年浙江杭州市西溪·吉鸿中学招聘20余人笔试备考题库及答案解析
- 2025湖北航天科工火箭技术有限公司市场营销部副部长招聘1人笔试备考试题及答案解析
- 2025贵安新区康桥食品有限公司劳务外包人员招聘笔试模拟试题及答案解析
- 跨境运输问题应急预案
- 秋季流行服饰与衣料的准备-生产计划讲义教材
- 七年级上册地理人教版知识清单
- HDPE塑钢缠绕排水管施工方案
- 二十案例示轮回
- 蒋诗萌小品《谁杀死了周日》台词完整版
- 农业综合行政执法大比武试题库(试题及答案)
- (新版)婴幼儿发展引导员(初级)技能鉴定理论试题库(含答案)
- 颅高压危象课件
- 《椎管内肿瘤》课件
- 志愿服务证明(多模板)
评论
0/150
提交评论