




已阅读5页,还剩52页未读, 继续免费阅读
(电机与电器专业论文)基于小波变换的图像压缩编码研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工人学硕十学位论文 a b s t r a c t i nr e c e n td e c a d e s ,t h eu n p r e c e d e n t e dd e v e l o p m e n ta n da p p l i c a t i o no fd i # t m i m a g ec o m p r e s s i o nt e c h n o l o g yh a sb e e np r o m o t e db yt h er a p i dd e v e l o p m e n to f c o m p u t e rt e c h n o l o g y c u r r e n t l y , d i g i t a li m a g ec o m p r e s s i o nt e c h n o l o g yh a sb e e n w i d e l yu s e di ni n d u s t r i a l ,m i l i t a r y , t r a n s p o r t a t i o n ,a g r i c u l t u r ea n do t h e rf i e l d sa n dh a s b e c o m et h eo b j e c to fs t u d yi nv a r i o u sd i s c i p l i n e s h o wt ot r a n s m i tt h el a r g ei m a g e d a t aw i t h i nt h el i m i t e dn e t w o r kb a n d w i d t hb e c o m et h ep e o p l e si n c r e a s i n gd e m a n d , w h i c hm a k e st h ei m a g ec o m p r e s s i o nh a sb e c o m ee s s e n t i a l t h et r a d i t i o n a li m a g e c o m p r e s s i o na n dc o d i n gm e t h o d 啪n o tm e e tt h en e e d so fi m a g ep r o c e s s i n g t h e r e f o r e ,t h i sp a p e ru s e st h ep o p u l a rw a v e l e ti m a g ec o m p r e s s i o na n dc o d i n g m e t h o d st of u r t h e ri m p r o v et h ei m a g ec o m p r e s s i o np e r f o r m a n c e t h i sa r t i c l ef i r s tb r i e f l yo u t l i n e st h en e c e s s i t ya n dh i s t o r yo fi m a g ec o m p r e s s i o n , t h e ni n t r o d u c e st h eb a s i ct h e o r yo fw a v e l e tt r a n s f o r m ,a n dt h e nf o c u s e so nt w o c l a s s i c a lw a v e l e tc o d i n gm e t h o d - z e r o t r e ec o d i n ga n de m b e d d e dz e r o t r e ec o d i n g a n dp r o p o s e sn e w q u a n t i z a t i o na n dc o d i n gs c h e m ea n dt h ec o m b i n a t i o no fh u f f m a n c o d i n go fd p c mp r e d i c t i v ec o d i n gb a s e do ne m b e d d e dz e r ot r e ec o d i n g f i n a l l y , t h e e m b e d d e dz e r o - t r e ed e c o d i n gm e t h o d sa r eb r i e f l yd e s c r i b e d t a k i n ga ne x a m p l eo f t h ei n t e r n a t i o n a ls t a n d a r dt e s ti m a g e , ad e t a i l e dd e s c r i p t i o no ft h er e s e a r c hp r o g r a m h a sb e e np r o p o s e di nt h i sp a p e r t h i sp a p e r , b a s e do nv i s u a lc + + 6 0d e v e l o p m e n tp l a t f o r m p r o g r a m m e sa n d i m p l e m e n t s t h e i m a g ec o m p r e s s i o na n dc o d i n gs y s t e m t h er e s u l t so ft h e i n t e r n a t i o n a ls t a n d a r dt e s ti m a g es h o w e dt h a i :t h ei m p r o v e dc o m p r e s s i o na l g o r i t h m p r o p o s e di nt h i sp a p e rh a st h ec h a r a c t e r i s t i c so fh i g hc o m p r e s s i o ne f f i c i e n c ya n ds h o r t r u n t i m e c o m p a r i n g w i t ht h et r a d i t i o n a l c o m p r e s s i o nm e t h o d ,t h es c h e m ec a n e n h a n c et h ei m a g ec o m p r e s s i o nr a t i oa n da l s oe n s u r et h e q u a l i t yo ft h ei m a g e t h e r e f o r e ,t h eu s eo fw a v e l e tc o m p r e s s i o na n dc o d i n gi ss u i t e df o rt h eo c c a s i o no f h i g h e ri m a g ec o m p r e s s i o nr a t i oa n dq u a l i t yr e q u i r e m e n t s k e yw o r d s :w a v e l e tt r a n s f o r m ,i m a g ec o d i n g ,s u c c e s s i v eq u a n t i z a t i o n ,e z w i i 独创性声明 本人声明,所呈交的论文是我个人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教 育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 研究生签名:宝垒袋 日期地:苎:乙7 关于论文使用授权的说明 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即:学校有 权保留送交论文的复印件,允许论文被查阅和借阅:学校可以公布论文的全部 内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) v 研究生签名:坠唛同期: 导师签名:日期: 武汉理工大学硕十学位论文 1 1 引言 第1 章绪论 随着信息技术的发展和社会的进步,人类对信息的要求越来越丰富,人们 希望无论何时何地都能够方便、快捷、灵活地通过文字、语音、图像以及视频 等多媒体进行通信。在早期的通信领域中,能够处理和传输的主要是文字和声 音,因此,早期的计算机和通信设备的处理能力跟人类的需求有相当大的差距。 随着通信信道及计算机容量和速度的提高,图像信息已经成为通信和计算机系 统的一种处理对象。 图像信息具有直观、形象、易懂和信息量大的特点,是人类最丰富的视觉 来源。“百闻不如一见”说的就是图像的这个特点。但由于图像信号的内容复杂, 数据量非常大,使图像信息交流很困难。如何在保证图像质量的f i 提下用最少 量的数据实现图像信息的存储、记录和传输,达到优质、经济、可靠的要求, 这就是图像压缩的目的。 由于图像数据所占存储空间很大,传输如此大量的数据需要很大的网络带 宽,这为多媒体通信业务的顺利开展带来了巨大障碍。大家可以考虑一下,要 存一秒的电影需要多少字节呢? 假如每秒电影由2 5 帧( p a l 制式) 图像组成,每 幅图像的宽度和高度分别为3 5 2 和2 8 8 ,那么一秒的电影所需要的空问为:3 5 2 x 2 8 8 x 3 2 5 = 7 6 0 3 2 0 0 b 7 2 m b ,一个小时的电影则需要2 6 g b ,需要4 张c d 光盘才能装下,要是通过网速为1 m b p s 的宽带网络下载l 小时的电影需要接近 6 0 个小时的时问【l 】。通过这些数字,大家可以想象,如此巨大的数据量,使得 图像压缩编码成为多媒体通信领域中一个热fj 的研究课题。 与文字信息不同,图像信息需要大的存储容量和宽的传输信道,尤其是在 需要实现大规模图像数据库或传输高分辨率实时图像序列的场合,即使以现在 的技术,仍然难以满足数字图像存储和传输的需要。对图像数据的压缩就成为 了技术进步的迫切需要,正是由于这种需要,使得图像压缩( 编码) 算法和技术成 为近3 0 年来非常活跃的一个研究领域,并在商业上已取得极大的成功。 1 图像压缩的基本概念 武汉理工大学硕十学位论文 我们都知道,图像之所以能够被压缩,是因为图像中存在着冗余的数据。 需要说明的是数据和信息是两个不同的概念,数据是信息的表达方式,是信息 的载体。数据所需要的存储空间要比信息大,数据中与信息无关的部分称为冗 余。所谓图像压缩方法就是研究如何减少或去掉数据中的冗余部分以减小数据 的存储空间。这里所提到的冗余包括以下四种【2 】。 ( 1 ) 空间冗余。空间冗余描述的是图像具有局部自相似这个特性,也就是说 图像中的一点的颜色和周围邻域内的像素点的颜色值相等或相近,单个像素携 带的信息相对较小。 ( 2 ) 时间冗余。时间冗余描述的对象是一段有序的图像,在这个序列中相邻 两帧图像的拍摄间隔仅为4 0 毫秒( p a l 制式) ,在这么短的时间内,相邻两帧图 像之间变化不大,具有较大的相关性。 ( 3 ) 视觉冗余。人观察图像的目的就是获得有用的信息,但人眼并不是对所 有的视觉信息具有相同的敏感度,在实际应用中,人也不是对所有的信息具有 相同的关心度。在特定场合,一些信息相对另外一些信息来说,就不那么重要, 这些相对不重要的信息就是视觉冗余。 ( 4 ) 编码冗余。图像数据存在编码冗余的原因在于各个灰度值在图像中出现 的次数不一样,采用特殊的编码方法柬减少整幅图像的数据量。 2 图像压缩的发展史 图像压缩的基本理论起源于2 0 世纪4 0 年代术香农的信息理论。香农的编 码定理告诉我们,在不产生任何失真的前提下,通过合理的编码,对于每一个 信源符号分配不等长的码字,平均码长可以任意接近于信源的熵。1 9 4 9 年,香 农和费诺提出了体现变长编码思想的香农费诺编码方法,但该编码方法实用性 差。1 9 5 1 年,霍夫曼对香农费诺编码方法进行优化,提出了著名的霍夫曼编码 方法,从此霍夫曼算法及其变形在数据压缩领域得到广泛应用。2 0 世纪7 0 年代 末,霍夫曼编码方法的领先优势被两个算法打破,其一是用一个小数表示一段 信息的算术编码,其二是用数据序列在词典中的条月号代表数据序列的词典编 码。算术编码虽然可以获得最短的编码长度,但其本身的复杂性阻碍了算术编 码的应用,直到在j p e g 2 0 0 0 中才得以j 下式采用。2 0 世纪8 0 年代,数字图像得 以广泛应用,各种压缩标准相继出现。1 9 8 0 年,国际电报电话咨询委员会( c c i t t ) 针对传真类应用,发布了压缩和传递二值图像的c c i t t g r o u p3 标准,在该标准 中采用了去除空间冗余的行程编码和去除编码冗余的霍夫曼压缩方法。采用行 2 武汉理j :人学硕士学位论文 程编码的位图格式( b m p ) ,采用l z w 算法的图像交换格式g i f 以及基于c c i t t g r o u p4 和l z w 算法的标签图像文件格式t i f f 在这一时期也得到广泛应用。2 0 世纪9 0 年代以后,基于去除心理视觉冗余的有损图像压缩算法和基于去除时间 冗余的视频图像压缩算法及其应用得到迅猛发展。随后相继提出的m p e g x 等 混合编码技术在图像压缩技术中得到了最为广泛的应用【3 1 。 目前已提出的图像编码的基本方法包括熵编码、预测编码、变换编码和矢 量编码。这些编码方法都有各自的优点和缺点,也都存在各自使用的场合。在 实际应用中,需要将这些基本方法综合在起,将各个方法的优点尽可能发挥, 这样才能构造出一个实用的编码系统。但是这些基本方法已不能满足当今图像 压缩处理的需要,从而产生了许多新的编码方法,其中包括小波变换图像编码, 利用人工神经网络的压缩编码,分形编码等。 1 2 研究背景 一直以来,信号分析和处理的常用手段是傅罩叶变换( f t ) ,也是图像处理领 域使用最广泛的一种分析工具,但由于傅罩叶变换不能满足时域和频域局部化 的特点,而小波变换具有这两个特点,这两个特点使得不同尺度上描述相同空 间位置的小波变换系数之间具有相似性,这使得小波变换的数据结构非常适合 编码的要求。近几年,利用小波变换进行图像压缩取得了很大的进步,变换中 采用的算法也充分利用了小波系数所具有的统计特性,其中比较经典的算法是 s h a p i r o 提出的嵌入式零树小波( e z w ) 算法,该算法具有编码效率高、嵌入式码 流结构和运算复杂性较低等显著特点,对小波图像压缩的研究起到了显著的推 动作用。随后,围绕着该算法出现了许多改进形式和更一般的表示方法一s p i h t 算法,这两种算法的应用,使得图像的压缩率得到了很大的提高。 小波变换的应用前景可以归纳为下面几个方面: 零树小波编码算法可以极大地提高图像的压缩比,在压缩比提高的同时还 保证了图像压缩后的质量。 图像压缩中利用小波变换可以减小计算量,根据所给图像来选择不同的小 波基。 利用小波本身所具有的特殊数学功能,可以产生多种不同分辨率的图像。 武汉理工火学硕士学位论文 1 3 论文主要内容及其安排 本文首先简要概述了图像压缩理论,介绍图像编码的必要性、可行性和图 像压缩的发展史。目前常用于图像压缩方法有d c t 变换、小波变换、分形等, 但利用这些方法压缩后的图像是有损的,会产尘不同程度的失真。本文研究发 现,在基于小波变换的图像压缩技术中,最典型的是由s h a p i r o 提出的小波零树 编码,虽然是公认的较好的一种小波编码算法,但它还有很多不足之处。文章 在研究已有的图像压缩技术背景下,通过对它们进行一些新的改进、创新和有 机的组合,得到了种新的图像压缩方法。文章最后,结合图像压缩的实际需 要和本文所提出的方法,在v c + + 平台上,对该方法进行仿真,并对其进行了分 析与评价,取得了较好的压缩效果。 本文的安排如下: 第一章:绪论。介绍课题研究的背景、意义以及国内外图像压缩的现状和 小波变换应用于图像压缩的前景。 第二章:图像压缩编码方法相关概述。主要介绍图像压缩的必要性和可行 性,图像压缩编码的基本方法,以及目前图像压缩的国际标准。 第三章:小波理论知识的相关介绍。简要描述了小波变换的基本理论,多 分辨率分析,小波基的构造以及m a l l a t 算法,小波的提升方法。 第四章:小波变换在图像编码中的应用。介绍了小波变换用于图像压缩的 原理,小波变换用于图像压缩的一般步骤。并对经典的零树小波编码方法做了 详细的介绍,然后提出了在此算法基础上改进的方案,在保证图像压缩质量的 基础上,提高了编解码速度,降低了算法运行所需的时间。 第五章:利用v c + + 可视化平台实现小波变换用于图像压缩后的效果。首先 简单介绍了v c h 工具的基本知识,提出了基于v c + + 的小波变换实时图像压缩 方案,并对该方案进行了评价。 第六章:全文总结和对研究工作的展望。指出了文章中存在的不足和今后 的研究方向。 4 武汉理工大学硕十学位论文 第2 章图像编码压缩 2 1 图像编码技术概述 通常在进行数字图像处理的过程中,要产生许多大数据量的图像文件,这 种未经压缩处理的原始图像信息无论是进行有限带宽的网络传输还是进行文件 存储,都存在许多不便,而且大数据量的图像信息会额外占用存储器的存储空 间和宝贵的网络带宽资源。这就需要通过一种可靠、有效的方法来解决大型图 像文件在存储、处理和传输时所带来的一些问题。当前通用的一种解决方法是 对原始图像进行编码压缩,该方法通过去除原始图像中的冗余信息,从而达到 用尽可能少的数据量去表达尽可能完整的图像信息的目的。如果从数学统计的 角度考虑上述过程,也可以将其看作是把存在较强相关性的图像转化为一个尽 可能不相关的数据集的过程。由于任何未经编码压缩处理的图像均存在相关性 信息和冗余信息,因此这种处理方法的使用范围是具有普遍性的。 图像编码并非只单纯研究图像的压缩,从去除了冗余信息的不相关数据集 中将原始图像复原出来同样也是图像编码的研究范畴,只不过通常情况下图像 的解压缩过程往往是图像压缩的逆过程,因此对图像编码的研究重点可以放在 对图像的压缩上。 图像编码的基本过程可以概括为映射变换、量化和熵编码三个步骤【5 】: 映射变换就是将图像变成另一种表示形式,去除图像的空间冗余,减少原 始图像的相关性,将图像信息集中到少数系数上,以便有利于压缩。典型的映 射变换包括线性预测变换、离散余弦变换、小波变换和分形变换等。线性预测 变换是将图像的差异信息映射到误差信号上,而离散余弦变换、小波变换和分 形变换是将图像映射到少数几个系数上。需要 兑明的是,映射变换并没有将图 像的数据量减少,而是将图像的信息减少,根据香农第一定理,若变换后的信 息熵变小的话,那么图像的压缩率就能提高。映射变换不同,变换后的信息熵 就不同,理想的压缩界限也变了,因此在这一步中,对变换的要求是变换后信 息熵越小越好。而对于视频图像,映射变换还担负着去除时间冗余的作用。 量化器的目的是去除心理视觉冗余和视频图像的时间冗余。由于人眼在亮 5 武汉理。1 :人学硕士学位论文 度、颜色、空间分辨率、空间频率、时间频率和运动感知等方面都存在着上限 和下限,因此量化器就是利用人眼的这种特性,将图像中相对不重要的细节去 掉,达到减少数据量,而不影响人眼视觉感受。 熵编码的目的是消除符号编码冗余,一般不会给恢复带来信息损失。 2 2 图像编码方法的分类 图像编码压缩算法根据其在压缩过程中是否存在信息丢失可以分为两大 类:有损编码压缩算法和无损编码压缩算法【6 】。这两类图像压缩算法在不同的场 合均有着广泛的应用:无损压缩算法主要针对图像中的像素间冗余量进行压缩, 虽然所能达到的压缩率不高,但是压缩数据中所含信息量与原始图像的信息量 是相等的,即可以从压缩数据中将原始图像完整地恢复出来。由于这一类编码 压缩算法在进行图像压缩、解压缩的过程中没有信息的损耗,因此多用于对图 像的存档;有损编码压缩算法不仅考虑了图像像素间固有的冗余量,而且更多 地考虑了人眼的视觉生理特点和人对图像的视觉心理等因素,通过对图像中的 心理视觉冗余量的压缩而获得更高的压缩率。有损编码压缩算法的高压缩率是 以图像原始信息的损耗为代价的,压缩过的数据中不能完整地恢复出原始图像, 但是由于这类算法充分考虑了人眼对图像的感知特点,在对图像进行编码压缩 时只是将图像中那些在视感觉过程中贡献非常微小的信息予以丢弃,因此这些 去除了视觉不敏感信息的压缩图像在画质上与原始图像相比并没有明显的下 降。如果信息的损耗限定在人眼的分辨能力以内,那么存在信息损耗的压缩图 像与原始图像的主观评价是一样的。这类算法多应用在对图像的压缩率要求高, 而对图像画质在一定程度上的下降可以容许的场合。 图像编码压缩算法在具体的处理技术上还可以分为简单编码压缩方法和基 本编码压缩算法两大类,而后者根据对应域的不同,还可以进一步细分为对应 于空域的预测编码压缩方法和对应于频域的变换编码方法。 简单编码压缩算法主要针对图像中存在的编码冗余和像素间冗余进行压缩 处理,这类编码压缩算法采用的编码方式主要有熵编码( e n t r o p ye n c o d i n g ) 、位平 面编码( b i tp l a n ee n c o d i n g ) 和行程编码( r u n l e n g t he n c o d i n g ) 等。 除了上述几种图像编码压缩算法外,近几年随着对图像处理,尤其是对图 6 武汉理【人学硕士学位论文 像编码的深入研究,还出现了许多新的算法,其中许多算法大量吸取了其他一 些先进的图像处理方法和思想,比较有代表性的有基于小波( w a v e l e t ) 的编码压缩 算法、使用人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k ,a n n ) 的编码压缩算法以及 基于分形( f r a c t a l ) 的编码压缩算法等。 2 2 1 常用图像编码方法 早期的图像编码方法的特点是基于数据统计特性,在早期的图像处理中得 到了广泛应用。下面对一些基本的图像编码方法作简单的介绍。 1 ) 预测编码 预测编码是根据离散信号之间存在着一定相关性的特点,利用前面一个或 多个信号预测当前信号,然后对实际值和预测值的差( 预测误差) 进行编码。如果 预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的 比特进行编码,达到压缩数据的目的。在图像压缩中,预测编码是建立在去除 图像空间冗余和时间冗余的基础上,利用邻近像素间或相邻帧之间图像的高度 相关性,在编码时,只对新的信息( 预测误差信息) 进行编码,从而提高压缩率。 预测编码系统由预测器、量化器和编码器三个部分组成【丌。预测器的目的是 由过去的信息预测当前的信息,在这一步并没有减少数据量。在图像编码中, 预测器分为帧问预测和帧内预测。帧间预测是利用过去的帧来预测当前帧,目 的是去除时自j 冗余;帧内预测是利用若干个像素点的值来预测当前像素点的灰 度值,目的是去除空间冗余。量化器是如何看待误差的问题的,由于人眼存在 心理视觉冗余,在图像压缩时,可以忽略较少的误差,减少数据量而不影响图 像视觉效果,但这种损失不可恢复,因此将带有量化器的预测编码称为有损预 测编码,而不带有量化器的预测编码称为无损预测编码。编码器的目的在于对 量化后的误差进行压缩,减少数据量。 代表性的预测编码压缩算法有德而塔调s o ( d e l t am o d u l a t i o n ,d m ) 算法和差 值脉冲码调s t j ( d i f f e r e n t i a lp u l s ec o d em o d u l a t i o n ,d p c m ) 算法等。这两种预测编 码算法均为有损编码压缩算法。 2 ) 变换编码 变换编码是将信号数据由空域经数学转换后映射到另一个值域后再进行编 码处理的压缩方法。预测编码算法假设冗余度是数据固有的,通过对信源建模 7 武汉理:t = 大学硕士学位论文 来尽可能精确地预测源数据,去除图像的空间和时间冗余度。变换编码压缩算 法主要是在变换域中对图像进行编码处理,因此在实现上相当于频域方法。变 换编码以可逆的线性变换把图像映射成一组变换系数,然后通过对得到的系数 进行量化、编码,而达到用少量数据表达大数据量图像信息的目的,最终完成 对图像的编码压缩。这类编码压缩算法多借助正交变换算法来进行编码处理, 常用的有离散傅里叶变换( d f t ) 编码方法、离散余弦变换( d c t ) 编码方法以及离 散沃尔什一哈达玛( d w h t ) 编码方法等。由于变换编码算法在对系数进行量化时 会引入很小、不会明显降低图像画质的失真,使压缩后的数据不能完整保持原 有图像的信息,因此变换编码算法也是一种有损的图像编码压缩算法。 图像变换编码的基本过程一般为下面几个步骤【8 】:首先图像f 经图像变换由 空域转到频域f 上,去除空间冗余,将信息集中到少数几个系数上;由于频域 系数承载的信息不同,需要对系数进行选择和量化,保留重要信息,忽略次要 信息,去除心理视觉冗余;已经量化的数据f7 进入熵编码器去除编码冗余,进 一步压缩数据,形成组w 传输出去。 3 ) 分形编码 分形图像压缩编码技术是由m f b a r n s l e y 在1 9 8 7 年提出的。这种方法完全 不同于传统的各种编码方法,它充分利用了一幅图像中各区域之间的相似性或 放射性,通过一组放射变换系数就可以描述一幅图像。这个方法由于能取得极 高的压缩比,引起了世界各国研究人员的兴趣,是一个很有发展前途的研究领 域。 4 ) 小波变换编码 基于小波变换具有空频局域性、多分辨率结构等特点,描述相同空间位置 的小波系数,在同方向低频子带和相邻高频子带之问存在四叉树关系,这种树 形结构可以有效地描述小波变换域的空频局域性特性,因此利用树形结构,可 以构成小波变换编码器。小波变换编码的研究起源于2 0 世纪8 0 年代中期的子 带图像编码,到9 0 年代初期,受小波变换的多分辨率结构的启发,发表了e z w 算法,这是小波变换编码的一个里程碑。其后的s p i h t ,e b c o t 等都或多或少 受到e z w 算法的影响,它们构成了高效的d w t 变换编码器。随着新一代图像 编码标准的出现,小波变换编码方法在运用中受到了一些限制,因此在图像压 缩编码中存在着一定的局限性。 5 ) 子带编码 武汉理:【大学硕十学位论文 子带编码的基本思想是,将原始信号通过一组滤波器后并抽取,被分成若 干个包含有限频宽的子带,然后对每一个子带根据其不同的频率分布特性采取 不同的编码方案,如标量量化或者矢量量化等等。 子带编码的优点在于:( 1 ) 由于每个子带都独立处理,因此其编码和解码的 误差不会扩散到其他的子带;( 2 ) 通过改变不同子带内的比特分配,整体的编码 误差以视觉最优的方式分布在各个子带中。产生子带的过程本身并没有压缩信 号,各个子带里的采样点数之和仍然等于原始信号中的采样点数,但是原始信 号的能量在各个子带得到重新分配,使得独立对子带系数进行编码比直接对原 始信号编码更为有效。 6 ) 熵编码 熵编码的基本思想是为出现次数多的信源符号分配较短的码字,出现次数 较少的信源符号分配较长的码字,从而使平均码长最短。熵编码主要包括霍夫 曼编码、算术编码、行程编码和词典编码。霍夫曼编码根据出现的概率为每个 信源符号分配码字,该编码方法简单有效,其压缩率接近于信息熵,因此得到 广泛地应用。算术编码是将整个信号用一个浮点数表示,使码字的长度可以是 小数,并使压缩率充分接近于信息熵,成为压缩率最高的算法。行程编码从信 源之问的相关性出发,用行程记载连续相同点的个数,由于行程是一个变化的 数值,各种长度的行程出现的频率不同,因此在许多场合下,对行程采用霍夫 曼编码进一步压缩,以进一步去除相关性,提高压缩比,j p e g 标准就采用了这 种策略。词典编码将图像中相邻区域形成一个个短语存到动态构造的词典中, 传输时,只需传输每个区域在词典中的标号即可,大大提高了压缩率【9 】。 本文中将预测编码和霍夫曼编码两种编码方法结合使用,图2 1 是本文中采 用的二维d p c m 预测编码框图。 图2 1二维d p c m 预测编码框图 上图中的二维预测器有4 种方式,可以根据不同的图像进行选择。 设当前预测像素为f ( x ,j ,) ,图像大小x xy ,预测器系数为口、b 、c 、d 。 9 武汉理工大学硕十学位论文 则二维预测器可由式( 2 - 1 ) 表示,本文中采用了4 组不同的二维预测器,其系数 分别为t 1 ) a = 0 5 ,b = 0 0 ,c = 0 2 5 ,d = 0 2 5 2 ) a = o 5 ,b = o 2 5 ,c = o 2 5 ,d = 0 0 3 ) a = 0 5 ,b = 0 1 2 5 ,c = 0 。2 5 ,d = 0 1 2 5 4 ) a = 1 0 ,b = - 0 5 ,c = 0 5 ,d = 0 0 f f ( x ,y ) = a f ( x , y 1 ) + b f ( x - 1 ,y - 1 ) + c f ( x - l ,少) + c t f ( 工一l ,y 1 ) x l ,y y l if ( x ,y ) = f ( x ,y 1 ) x = l ,y 1 lf ( x ,y ) = ( 口+ c ) f ( x l ,少) + ( 6 + d ) f ( x 一1 ,y + 1 ) 工 l ,y = l i f ( x ,y ) = a f ( x ,y - 1 ) + b f ( x - 1 ,y 1 ) + ( c + d ) f ( x l ,y )x l ,y = y ( 2 1 ) 按照从上到下、从左到右的顺序进行预测,对于左上角的第一个值不预测, 让其直接参与编码,其余的只对其预测差值d 进行霍夫曼编码。因为霍夫曼编 码对出现概率大的符号采用短码字,对出现概率小的符号采用长码字,这样的 编码结构可使最终的平均码字长度最短,效率较高,具有广泛的应用范围,然 而当被编码的符号范围变大时,其编码表也变大,查表效率降低,编解码时间 变长,所以要对其改进。 2 3 图像编码方法质量评价 随着众多图像压缩算法的出现, 通常情况下,衡量一个算法的性能, 算法复杂度四个方面考虑【0 1 。 2 3 1 压缩比 如何评价图像压缩算法就成为重要的课题。 主要从压缩比、视频码率、图像保真度、 压缩比c r ( c o m p r e s s i o nr a t i o ) 是衡量数据压缩方法压缩程度的一个重要指 标,反映了数据的压缩效率。通常将c r 定义为压缩前后每个像素平均码长之比。 e 值越大,压缩效率越高。 l o 武汉理i j 大学硕十学位论文 y , z r 。o ,) _ e = 昔岩一= 垒 似) 扛1 刮 ( 2 - 2 ) 其中图像的尺寸为m n ,r b 为源图像像素使用的码长,为压缩后的图像 像素使用的码长。吃为源图像像素使用的平均码长,乞为压缩后图像像素使用 的平均码长。 压缩率也可以定义为压缩前后数据量之比: e :堕 n 2 ( 2 - 3 ) 其中n 。和分别为压缩前后的数据量。 2 3 2 视频码率 视频码率是指视频文件在单位时间内使用的数据流量,单位是位每秒( b i t s ) , 它是视频编码中画面质量控制的最重要的部分。在同样分辨率情况下,视频文 件的码率越大,压缩比就越小,画面质量就越高。视频码率与视频文件大小( 数 据量) 之间的关系是:编码后的视频文件数据量= 视频码率x 时间。 2 3 3 图像保真度 在图像压缩中,通常利用心理视觉冗余放弃图像中一些不重要的细节,进 行有损压缩,但在解码端,恢复出来的图像和原始图像不可能完全一样,这就 需要定义一些信息损失测度来描述解码图像与原始图像的偏离程度,这些测度 称为图像的保真度准则。常用的准则分为两大类:客观保真度准则和主观评价 准则【。 1 客观保真度准则 客观保真度准则是对解码后图像与原始图像的误差进行定量计算,客观保 真度准则可用函数形式描述。客观保真度准则有时也称为客观失真度准则。常 用的客观保真度准则包括: 均方根误差: 武汉理r 大学硕士学位论文 e r m s2 其r p f ( x ,y ) 和( x ,y ) 分别表示原始图像和解码后的图像, 垂直方向的宽度分别为m 和。 ( 2 4 ) 图像水平方向和 由上式可知,均方根误差越小,图像保真度越强,反之则越弱。 峰值信噪比p s n r : ,2 p s n r = 1 0 1 0 9 l o 鱼l 一 ( 厂( x ,y ) - f ( x ,y ) ) 2 兰三! 羔三! m n ( 2 5 ) 其中丘表示源图像和解码图像中可能的最大像素值,对于8 位灰度, 厶;= 2 5 5 。 两幅图像的均方根误差越小,p s n r 就越大,图像失真度就越小。当两幅图 像完全一样时,峰值信噪比无穷大。若是解码后图像是个全黑的图( 信息全损失 了) ,峰值信噪比不为0 ,则说明峰值信噪比失效了;若源图像和解码图像中一 个是全白另一个是全黑的时候,则峰值信噪比为0 。 p s n r 是目前最普遍和最广泛使用的图像质量客观测度,不过许多试验结果 都显示,p s n r 无法和人眼看到的视觉质量完全一致,有可能p s n r 较高者看起 来反而比p s n r 较低者差。这是因为人眼的视觉对于误差的敏感度并不是绝对 的,其感知效果会受到许多因素的影响,因此研究与主观感觉一致的图像客观 保真度准则一直是热点。 2 主观评价准则 主观评价是指观察者依据自己的感觉对图像质量进行评价。尽管客观保真 度准则提供了一种简单、方便的评估信息损失的方法,但很多解压图最终是供 人观看的。事实上,具有相同客观保真度的不同图像,在人的视觉中可能产生 不同的视觉效果。这是因为客观保真度是一种统计平均意义下的度量准则,对 于图像中的细节无法反映出来,而人的视觉系统具有独特的特性,能够觉察出 来。在这种情况下,用主观的方法来测量图像的质量更为合适。 图像质量的主观评价通常按i t u r 5 0 0 号标准进行。常用的方法是向一组( 人 1 2 武汉理1 :人学硕+ 学位论文 数通常超过2 0 人) 精心挑选的观察者展示图像,并将他们对该图的评价综合平均 起来得到一个统计的质量评价结果。表2 1 和表2 2 分别给出一种对图像质量进 行绝对评价的尺度,可据此表进行判断打分。 表2 1 视频图像质量主观评价等级 图像等级主观评价干扰和杂波可见度 5优感觉不到 4 良能看出图像质量的变化,但不妨碍观看 3 中能明显看出图像质量变坏,对观看稍有妨碍 2 差对观看有妨碍 1 劣非常严重地妨碍观看 表2 2 电视图像质量主观评分标准 评分评价说明 1优秀图像质量非常好,如同人能想象出的最好质量 2 良好图像质量高,观看舒服,有干扰f u 不影响观看 3 可用图像质量可接受,有干扰但不太影响观看 4刚可看 图像质量差,干扰有些妨碍观看 5 差图像质量很差,干扰始终存在,几乎无法观看 6 不能用图像质量极差,不能使用 图像主观质量的评价结果用一定数量的观察者的平均分数来表不,这个平 均分数又称为平均感觉分m o s ( m e a no p i n i o ns c o r e ) : 门j e m o s = z n , 武汉理_ 大学硕士学位论文 其中g 表示每个等级得分,吩评定该等级的人数,k 为等级数。 2 3 4 算法复杂度 衡量一个压缩算法的好坏,不但要看它的压缩率和保真度,还希望算法简 单。算法简单意味着我们希望算法运行快并且存储空问消耗少。通常把衡量算 法运行快慢的测度称为时间复杂度;衡量空间占用多少的测度称为空间复杂度。 对于一个图像压缩算法,其压缩率和图像保真度、时间复杂度和空间复杂 度往往是相互影响、相互制约的【- 2 】。当追求一个较高的压缩率和较好的时间复 杂度时,可能会使图像保真度和空间保真度的性能变差,即可能导致图像信息 损失较多和占用较多的存储空间;反之,当追求一个较好的图像保真度和空间 复杂度时,可能会使图像的压缩率和时间复杂度的性能变差。因此,在设计一 个图像压缩算法时,要综合考虑这些因素,这样才能设计出比较可行的算法。 2 4 图像压缩编码国际标准 近2 0 年来,国际电信联盟远程通信标准化组织( i t u u ) 和国际标准化组织国 际电工委员会( i s o i e c ) 先后颁布了一些有关静止图像和活动图像编码的国际标 准,这些标准集成了图像编码4 0 多年的研究成果,综合考虑了压缩效率、实现 复杂度以及应用便捷性等因素,提出了相对最优的方案,代表了目前图像编码 的发展水平,对图像与多媒体通信的研究、发展和产业化起到了巨大的推动作 用。 2 4 1 图像压缩国际标准发展史 静止图像标准由国际标准组织( i s o ) 所属从事静态图像压缩标准制定的委员 会一联合摄影专家组( j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ) 负责制定【j 3 j 。1 9 9 2 年,它 制定出了第一套国际静态图像压缩标准:i s o1 0 9 1 8 一l ,这就是静态图像压缩的 经典之作j p e g 。由于j p e g 优良的品质,使得它在短短几年之内就获得极大的 成功。随着计算机网络和多媒体技术的飞速发展,桌面视频会议系统、可视电 话、高清晰度数字电视、视频点播、数字存储媒体等领域的发展,人们迫切需 1 4 武汉理工大学硕十学位论文 要将庞大的视频数据进行压缩,以减少磁盘空间和提高视频在网络上的传输速 度。因此在近2 0 年里,视频压缩编码技术得到了飞速发展。相关的视频编码标 准应运而生,包括m p e g x 和h 2 6 x 两大系列。下面分别予以介绍。 2 4 2 静止图像编码标准 目前静止图像编码采用的是j p e g 标准,它是由国际标准化组织i s o 、国际 电报电话咨询委员会( c c i t ,现在的i t u t ) 和国际电工委员会i e c 联合组成的图 像专家小组共同制定的。j p e g 的目的是给出一个适用于各种连续色调图像的压 缩方法,其中源图像类型可以不受图像尺寸、内容、统计特性、像素形状以及 颜色空间等的限制,压缩性能可达到目前技术所能实现的最好效果。 为了适应图像质量较宽的等级范围和满足各种应用的需求,j p e g 提供了两 种基本的压缩编码技术,即基于差分预测编码( d p c m ) 的无损压缩编码技术和基 于离散余弦变换( d c t ) 的有损编码技术。 j p e g2 0 0 0 与j p e g 相比,它是具备更高压缩率以及更多新功能的新一代静 态影像压缩技术。它把j p e g 的四种模式集成在一个标准之中,在编码端以最高 的压缩质量和最大的图像分辨率压缩图像,在解码端可以从码流中以任意的图 像质量和分辨率解压图像,解码后的图像质量最好可达到编码时的图像质量和 分辨率。j p e g2 0 0 0 具有的特征主要有【1 4 】:1 ) 高压缩率,j p e g2 0 0 0 将小波变换 作为编码方式,并且压缩后的图像显得更加细腻平滑。2 ) 按像素精度和分辨率渐 进传输,可以改善解码图像的质量,提高解码图像的分辨率或尺寸。3 ) 感兴趣区 域,在处理的图像中选定感兴趣区域,对非感兴趣的区域可以提高压缩比。4 ) 连续色调和二值压缩,j p e g2 0 0 0 将彩色静态画面采用的j p e g 编码方式与二值 图像采用的j b i g 编码方式统一起来,成为对应各种图像的通用编码方式。5 ) 无 损压缩和有损压缩,j p e g2 0 0 0 可以实现某些领域要求的无损压缩,并且因其提 供的是嵌入式码流,可实现从有损到无损的渐进解压。 2 4 3 视频图像编码标准 视频图像数据有极强的相关性,存在大量的空问冗余、时间冗余和心理视 觉冗余信息。视频编码技术就是去除数据中的冗余和数据问的相关性。在视频 1 5 武汉理。i :人学硕士学位论文 编码中采用离散余弦变换、小波变换编码技术或预测编码技术去掉空间冗余信 息;采用基于运动补偿的帧间编码技术去除时间冗余:采用量化技术和色度抽 样技术去除心理视觉冗余;采用熵编码技术去除编码冗余。目前视频编码标准 包括国际电信联盟远程通信标准化组( i t u t ) 制定的h 2 6 x 系列标准和国际标准 化组织国际电工委员会( i s o i e c ) 铝t j 定的m p e g x 系列标准。 m p e g 1 标准把图像编码分成i 帧、p 帧、b 帧和d 帧4 种类型,其中d 帧 为直流编码帧,只包含每个块的直流分量。 m p e g 2 标准是在m p e g 1 标准基础上的进一步扩展和改进,采用的核心技 术仍然是分块d c t 和帧间运动补偿预测技术【i5 1 。m p e g 2 标准对分块d c t 和帧 间运动补偿预测技术作了一些改进。除此之外,m p e g 2 视频压缩编码还进行了 多方面的扩展。 m p e g 4 是为极低码率的音频视频编码标准开发的,极低码率( 即小于 6 4 k b p s ) 是视频编码标准的最后一个比特率范围。该标准主要应用于视频电话、 视频电子邮件和电子新闻等,其传输速率要求较低。m p e g 4 利用很窄的带宽, 通过帧重建技术,压缩和传输数据,以求得最少的数据获得最佳的图像质量。 m p e g - 4 的视频质量分辨率比较高,而数据速率相对较低。主要原冈在于, m p e g 4 采用高级译码技术,该技术是一套首次适用于m p e g 4 的编码运算规 则。它与m p e g 2 相比,可节省9 0 的存储空间,并且还可以在声频j j 视频流 中广泛
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年广州市中考英语试卷真题及答案详解
- 老年人知识培训小结课件
- 老年人眼病防治课件
- 《中国古典文学鉴赏》课程简介与教学大纲
- 《英国文学史及选读》课程介绍与教学大纲
- 醛酮亲核加成反应课件
- 专题五 列表(课件)-《Python程序设计》职教高考备考讲练测
- 实验仪器与操作-2025年新初三化学暑假专项提升(人教)原卷版
- 老年人安全知识培训简报课件
- 老年人安全常识课件
- 2025年公共基础知识真题库和答案
- 社群运营积分活动方案
- ISO37301:2021合规管理体系程序文件一整套
- 2025年福建省创新创业投资管理有限公司招聘笔试参考题库附带答案详解
- 2025至2030中国半导体晶圆清洗设备(SWCE)市场现状调查及未来前景展望报告
- 2025混凝土结构施工清包工合同
- 社区公共卫生护理与干预措施试题及答案
- 起重吊装专项应急预案
- 消杀知识考试题及答案
- 医学资料 Picc导管皮肤相关性皮炎案例与分析学习课件
- 重症血液净化血管通路的建立与应用中国专家共识解读2025
评论
0/150
提交评论