




已阅读5页,还剩56页未读, 继续免费阅读
(机械电子工程专业论文)speck图像编码算法的研究与改进.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着互联网的日益广泛应用和无线视频传输的需要,图像数据的处理量和传 输量急剧增长,而现有的图像处理技术和传输的硬件设施又很难跟上其发展,给 通信带宽和存储介质带来了巨大的负担。因此,对图像数据采用编码压缩技术处 理,减少传输的信息量成为图像快速传输的必然选择。从某种程度上说,图像的 压缩编码已成为当前一个非常紧迫的研究课题。而嵌入式编码以其特有的优点如: 支持渐进式传输,可以在任意点停止编码,能严格满足目标码率和目标失真度要 求等,被越来越多的用于图像的渐进传输、图像浏览和英特网上的图像传输。 在众多的嵌入式图像编码算法中,最具有代表性的就是e z w 、s p 珊t 、s p e c k 三种编码算法。其中的e z w 编码算法可以说是小波编码技术上的一次重大的飞跃。 它通过引入零树的数据结构,实现了对小波系数的有效组织。s p i h t 编码算法通过 对e z w 算法的数据结构进行了一些改进,使总体性能达到了一个更优的状态。而 本文重点讨论的s p e c k 算法,因为充分利用了小波系数的能量集中和能量随尺度 的增加而衰减的特点,将四叉树分裂和比特平面编码方法相结合,获得了较好的 压缩性能,并得到了人们的更多重视。虽然它具有块间可以独立编码、编码速度快 等优点,但是就其实现速度、复杂度等方面来说,还是存在着可以改进的地方。 本文就具体到集合编码顺序、重要性测试等几个方面进行了改进。改进的s p e c k 算法不仅保留了原算法的各种优点,而且具有较高的编码效率。仿真结果表明改 进算法在实现速度、编码效率方面确实存在着优势。 关键词:图像编码嵌入式编码s p e c k 算法 a b s t r a c t w i t l lm ew i d e 印p l i c a t i o no f n e t w o r k sa n dt h en e e do f 、v i r e l e s sv i d e o 仃a n s m i s s i o n , t h ep r o c e s s i n gc a p a c 蚵a l l d 慨s m i s s i o nc 印a c 毋o ft l l e 曲a g ed a t ai n c r e a s es l l a r p l y h o w e v e r ,廿l ee x i s 血gh a r d w a r ef a c i l i t i e sf o rt h ei m a g ep r o c e s s i n ga 1 1 dt m l l s m i s s i o na r c 1 1 a r dt ok e 印p a c ew i t l li t sd e v e l o p m e m ,w h i c hb r i n g sag r e a tb u r d e no nc o i n m l l l l i c a t i o n b a i l d 谢拙趾ds t o r a g em e d i u m nb e c o m e sa ni n e v i t a b l ec h o i c ef o f 也ei m a g ed a _ t at o a d a p tc o d i n gc o i n p r e s s i o nt e c b l l o l o g yf o rp m c e s s i n gt or c d u c e 妇n s i i l i s s i o ni n f o r i l l a t i o n t os o m ed e g r e e ,t l l ei m a g ec o m p r e s s i o nc o d i n gh a sb e c o m ea i l 1 1 r g e ms u b j e c t e m b e d d e dc o d i n gi sg e m n gm o r ea i l dm o r cp o p u l a ri i li m a g ei l l c r e 船i n gt m s m i s s i o i l , 硒a g e 咖w na n d i n l a g e 劬n s n l i s s i o n j l ln e 船n r k s ,d u e t o i t ss p e c 瑚珊叩e n i e ss u c b 船 t h ea v a i l a b i l i 哆t oi l l c r e a s i r l g 打鲫【鲥【l i s s i o n ,t l l ea b i l i t yt oc e a s ee n c o d i n g 砒a n yp o i n ta n d t h er i g i ds a t i s f h c t i o nt ot a r g e tc o d e 硎oo rt a r g e td i s t o n i o n a m o n gs om a n ye m b e d d e di m a g ec o d i l l ga l g o r i t l l i l l s ,t h ee z w ,s p i h t 觚d s p e c ka r em eb e s tr e p r e s e n t a t i v c s t h ee z w a l g o 甜i i l l i sr e g a r d e da sag r c a t l e a p ,i t u a “z e r o 仃e e ”d a t as t n l 咖r et or e a l i z et l l ee 丘b c t i v eo r g a i l i z a t i o no ft h ew a v e l e t c o e m c i e n t s 1 ks p i h ta l g o 删1 l nc a u s e sab e t t e rp e r f o m a n c eb yi m p r o v i i l g 1 c e z w sd a t as n u c t u r e t h es p e c ka l g o r i m mm a k c sf u ul l s eo fn l ec h a r a c t e r i s t i c so f w a v e l c tc o e 瓶c i e n t si n v o l v i n gt l l ee n e r g yc l u s t e r i n ga n dt h ee 1 1 e r g ) ,d c c r e a s i n ga l o n g 诵t 】t 1 1 ei 1 1 c r c a s eo fs c a l a b i l j t ) ,f u m l e l l l l o r e ,b yc o m b i l l i i 培t 1 1 eq u a d n e 删t i o n 谢t 1 1 t h eb i t - p l a n ee n c o d i n g ,i tg a i l l sag o o dc o m p r e s s 协gp e r f b m a l l c ea n dm o r ea t t e n 廿o n h o w e v c r ,t h e r es t i ue x i s t ss o m e 呻r o v e m e mt ob ed o n e 硒f o rt 1 1 ea c l l i e v i n gs p e e dm d c o m p l e x i t y ,i ns p i i eo fi 乜c o 曲培i i l d 印e n d e m l y ,f 缸tc o d i l l gs p e e da n ds oo n a n i m p r o v e ds p e c ka l g o r i t l l i i li l lt h cs e q u e n c eo fp r o c e s sa i l dt 1 1 ei i i l p o r t a n c et e s t 锄de t c i sp r e s e n t e di 1 1t 1 1 i sd i s s e r t a t i o n b e s i d e sm eh i 曲c o d i n ge m c i e n c y ,t h ei i i l p m v e d a l g o r i t h mp r c s e n ,e sm ep r o p e n i e so ft h es p e c k t h ee x p e r i m e n t a lr e s u l t ss h o w 也a t t l l ec o d i n ge 筋c i e n c yc a nb e 知曲e ri m p r o v e da l l dt l l ec o m p u t a t i o i l a lc o m p l e x i t yc a n b e l o w e r e db yt l l ei m p m v e ds p e c k a l g o r i t a tp r e s e n t ,t 1 1 ei m a g ec o m p r e s s i o nt e c l l l l 0 1 0 9 yb a s e do nw a v e j e t 仃a 1 :略f 0 1 1 1 1j s 蛳h i l lc o n s t a l l td e v e l o p m e n t al o to fq u e s t i 0 1 1 sa r el o o k e df o n v a r dt of m e rr c s e a r c ha i l d p e r f e c t i o i l ,w h i c hw i l lb ec o n d u c t e di no u rf 1 1 t u r ew o r k k e y w o r d s :i m a g ec o d i n g e m b e d d e dc o d i n gs p e c k a j g o r i t h m 西安电子科技大学 学位论文独创性( 或创新性) 声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果:也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说 明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名:甾纽落日期星益:1 4 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。 ( 保密的论文在解密后遵守此规定) 本学位论文属于保密,在一年解密后适用本授权书。 本人签名 导师签名 日期垒呸:2 2 晕 日期苎2 墨厶丝, 第一章绪论 第一章绪论 1 1 课题的提出 在网络和多媒体技术蓬勃发展的今天,数字信息越来越多的被人们所关注。 与模拟信息相比,数字信息更易于存储和远距离传输,而且没有累计失真,数字 化存储的信息还可以被高品质的还原。因此信息的数字化与数字通信是必然的。 但是被数字化了的图像的数据量之大是非常1 惊人的,需要更多的比特数去存储和 传输,如果不经过一定的处理就直接进行存储或者在网络上进行传输,必将给存 储器的存储容量,通信干线信道的带宽,以及计算机的处理速度带来巨大的负担, 进而限制数字图象在众多领域中的应用。如果单纯靠增加存储器容量,提高信道 带宽及计算机的处理速度等方法来解决这个问题是很不现实的。由此可见,在信 道宽度、通信链路容量一定的前提下,采用编码压缩技术,减少传输的数据量, 才能保持和改进数字化传输和存储的优势。因为一般图像中存在着很大的冗余度, 因此图像信息的压缩是可以实现的。而“压缩”的任务就是消除这些冗余,用尽 可能少的比特数来表示源信号,并且能保障将其有效还原。所以,研究数字图像 的压缩编码技术,对于缓解通信带宽资源的缺乏和节省大量的存储空间具有相当 重要的意义。 1 2 图像编码技术的发展 图像编码的发展至今己走过了半个多世纪的历程。在2 0 世纪4 0 年代末脉冲编 码调制技术( p c m ) 出现后不久,人们就开始了对电视信号的数字化研究。经典的图 像编码方法基于香农( s h 锄o n ) 信息论,其中最基本的霍夫曼( h u 衢n a l l ) 编码、预测 编码和变换编码理论就产生、发展于2 0 世纪的五六十年代,至今仍然被普遍应用 于图像压缩编码的国际标准中,随着编码及相关技术的不断成熟,人们不断在探 索新的高效的编码方法,并取得了很好的进展。由于人们对视觉特性的认识更加 深入,出现了许多结合人的视觉系统特性( h v s :h 啪a n s u a ls y s t e m ) 和多种编码 算法的综合算法,编码效率不断提高。 2 0 世纪8 0 年代以后,许多新型的图像编码方法相继提出,如子带编码、分形 编码、基于模型的编码等。传统编码方法以信息论和数字信号处理技术为理论基 础,出发点是消除图像中的统计冗余信息,而这些新型编码方法则不局限于香农 信息论的框架,要求充分利用人眼视觉系统的生理和心理特性以及信源的各种性 质以期获得高压缩比”。它们侧重于图像数据的视觉冗余、结构冗余和知识冗余, s p e c k 图像编码算法的研究与改进 忽略了图像数据的统计冗余信息。另外,在实验条件下,这些编码方法可以取得 非常出色的编码性能,但如果考虑实用化,它们还受许多限制,其中最主要的一 点就是处理的复杂度。另外,在对一般的自然图像进行处理时,获得的编码增益 也没有理论上预期的好。 1 9 8 9 年m a l l a t 和d a u b e c h i e s 将小波分析理论应用于图像编码o “”1 ,另一种新型 的编码方法一小波变换编码就此产生,它在去除统计冗余和视觉冗余两个方面都 取得了很好的效果。它既保留了传统编码方法的优点,能够消除图像数据的统计 冗余,同时又很好地利用了人眼视觉特性从而获得高的压缩比。因此,小波变换 编码自2 0 世纪9 0 年代以来日益受到人们的重视,特别是j m s h a p i r o 提出的嵌入式零 树小波变换编码算法( e z w :e m b e d d e dc o d i n gu s i n gz e r o 仃e e so fw 打e l e t c o e 伍c i e n t ) ,向人们展示了它优异的压缩性能,更提供了天然的多尺度、多分辨率 的图像描述方法。在此之后,a s a i d 等人在e z w 算法的基础上提出了改进的分等级 树的集分割算法,在算法复杂度显著降低的同时,获得了与e z w 算法相当或更好 的压缩率。由此确立了小波变换在图像编码标准中的重要地位。 自2 0 世纪8 0 年代以来,无论是从技术的发展还是从社会的需求来看,图像编 码技术已经逐步进入了较大范围的应用阶段。但是由于没有统一的压缩算法和码 流格式,在图像信息交流中遇到了很多困难。为了解决这一问题,国际标准化组 织i s o 和国际电报电话咨询委员会c c i t t ( 现国际电联的电信委员会i t u 。t ) 的图像 专家组于1 9 8 6 年开始进行标准的规定,其主要目的包括两个方面:1 、提供高效的 压缩编码算法;2 、提供统一的压缩数据流格式。通过对多个方案进行大量严格的 实验测试,从算法压缩性能到实现的复杂度等综合因素的考虑比较后,最终形成 了两个著名的里程碑式的国际标准,这就是人们熟知的用于连续色调静止图像压 缩编码的j p e g 标准和码率为p 6 4 k b s 的数字视频压缩编码标准h 2 6 1 建议。这两个 标准的制定和颁布,极大地推动了图像通信的大规模普及与使用,同时这种大规 模的应用又对图像编码技术提出了新的、更高的要求。例如更高的压缩性能、使 用更加灵活、表现能力更加丰富等。此外,随着网络和无线通信的发展普及,还 要考虑更好的抗误码性能等,由此促进了标准化工作的进一步进展。迄今为止, 国际标准化组织和国际电联已经制定了适用于不同类型图像的压缩编码标准,从 而满足了不同类型数字图像传输的应用要求。 第一章绪论 3 1 3 图像编码的主要方法 1 3 1 经典图像编码方法“川 1 、熵编码 熵编码是纯粹基于信号统计特性的编码技术,是一种无损编码方法,解码后 能无失真地恢复出原始图像。熵编码的基本原理是给出现概率较大的符号一个短 码字,而给出现概率较小的符号一个长码字,这样使得最终的平均码长很小。一 个精心设计的熵编码器,其输出的平均码长接近信源的信息熵,即码长的下限。 熵编码把待压缩的数据流看作是简单的数字序列,它并不关心这些数据的具体语 义。 常用的熵编码方法有游程编码,霍夫曼编码和算术编码三种。 游程编码技术是在给定的图像数据中寻找连续重复的数值,然后用两个字符 值取代这些连续值。这种方法在处理包含大量重复信息的数据时可以获得很好的 压缩效率。但是如果连续重复的数据很少,则很难获得较好的压缩比,而且甚至 可能会导致压缩后的编码字节数大于处理前的图像字节数。所以游程编码的压缩 效率与图像数据的分布情况密切相关。 霍夫曼编码是一种不等长最佳编码方法,这里的“最佳”是指它的平均码长 对相同概率分布的信源是所有有效编码方法中最短的。霍夫曼编码根据源数据各 信号发生的概率进行编码。在源数据中出现概率越大的信号,分配的码字越短; 出现概率越小的信号,其码字越长,从而达到用尽可能少的码表示源数据。这样 以来,它必须预先知道信源的概率分布,而这一般是很难做到的。 算术编码是2 0 世纪8 0 年代发展起来的一种熵编码方法,已逐渐受到人们的注 意。它的基本原理是任何一个数据序列均可表示成0 和1 之间的一个间隔,该间隔 的位置与输入数据的概率分布有关。可以根据信源的统计特性来设计具体的编码 器,也可以针对未知概率的信源来设计能够自适应地适配其分布的算术编码器, 并且这两种形式的编码器可以用硬件实现。 应该强调指出的是,熵编码方法是通过无损压缩来消除信源的冗余信息,以 实现对数据的压缩,如果需要进一步压缩图像,就必须考虑人眼的视觉缺陷。通 常,信源编码方法把初始数据分成相关信息和不相关信息两种,然后再执行消除 不相关数据的处理步骤。与熵编码方法相反,一般的信源编码方法是允许失真的。 2 、预测编码 预测编码和变换编码是当前图像编码器中最常用的技术。其中预测和变换的 主要目的是降低图像原始空间域表示中存在的强相关性。使得预测或变换后的数 4s p e c k 图像编码算法的研究与改进 据矩阵变成弱相关性( 理想情况是无相关性) 矩阵,这样可以用量化和熵编码来进 行有效的压缩。 预测编码( p r e d i c t i v ec o d i n g ) 有线性预测和非线性预测两种,它既可以在一幅图 内进行( 帧内预测编码) ,也可以在多幅图像之间进行( 帧间预测编码) 。预测编码 基于图像数据的空间和时间冗余特性,用相邻的已知像素( 或图像块) 来预测当前 像素( 或图像块) 的取值,然后再对预测误差进行量化和编码。这些相邻像素( 或图 像块) 可以是同行扫描的,也可以是前几行或前几帧的。相应的预测编码分别被称 为一维、二维和三维预测,其中一维和二维预测是帧内预测,三维预测是帧间预 测。 预测编码的关键在于预测算法的选取,这与图像信号的概率分布密切相关。 实际中根据大量的统计结果采用简化的概率分布形式来设计最佳的预测器,有时 还使用自适应预测器,以便较好地刻画图像信号的局部特性,提高预测效率。 线性预测编码又称为差分脉冲编码调制( d p c m :d i 腑r e n t i a lp u l s ec o d c m o d u k m o n ) 。帧内预测编码( i n 仃ap r e d i c t i v ec o d i n 蓟一般采用像素预测形式的 d p c m ,其优点是算法简单,易于硬件实现。缺点是对信道噪声及误码很敏感,会 产生误码扩散,使图像质量大大下降。同时,帧内d p c m 的编码压缩比很低,因此 现在已很少独立使用,一般使用时都要结合其它编码方法。 3 、变换编码 与预测编码技术相比,消除图像数据空间相关性的一种更有效的方法是进行 信号变换,通过变换编码( 缸s f o 彻c o d i n g ) 使图像数据在变换域上最大限度地不相 关。尽管图像变换本身并不带来数据压缩,但由于变换后系数之间的相关性明显 的降低,图像的大部分能量只集中到少数几个变换系数上,采用适当的量化和熵 编码后可以有效地压缩图像的数据量。而且图像经某些变换后,系数的空间分布 和频率特性有可能与人眼视觉特性相匹配,因此可以利用人眼视觉系统的生理和 心理特点来设计需要的编码系统。变换编码首先将一幅n n 大小的图像分割成 ( n n ) 2 个子图像。然后对予图像进行变换操作,解除子图像像素间的相关性,达到 用少量的变换系数包含尽可能多的图像信息的目的。接下来的量化步骤是有选择 地消除或粗量化带有很少量信息的变换系数,因为他们对重建图像的质量影响很 小。最后是编码,一般用变长码对量化后系数进行编码。解码是编码的逆操作。 由于量化是不可逆的,所以在解码中没有对应的模块。其实压缩并不是在变换步 骤中取得的,而是在量化变换系数和编码时取得的。 变换编码并不是一次对整幅图像进行编码和解码,而是将图像分成n n ( 常用 的n 为8 或1 6 ) 个子图像后分别处理。这是因为: 1 、小块图像的变换计算容易。 2 、距离糖沅的像素方间的相关件比距离较讶的像素之间的相关件小。 第一章绪论 5 但是子图像的尺寸大小也是不能随便取的,这是因为: 1 、如果子图像的尺寸取得太小,那么就会产生虽然计算速度快,实现简单, 但压缩能力有限的缺点。 2 、如果子图像的尺寸取得太大,虽然去相关效果好,但由于图像本身的相关 性很小,反而使其压缩效果不明显,而且增加了计算的复杂性。 4 、矢量量化编码( v q c ) 香农率失真理论指出,即使对无记忆信源,矢量编码也总是优于标量编码。 基于矢量量化的图像压缩方法是利用相邻图像数据之间的高度相关性,将输入的 图像数据序列分组,每一组m 个数据被描述成为一个有m 个元素的矢量。 实际的矢量量化图像系统中编码器和解码器内置有相同的码本( c o d e b o o k ) ,码 本由所有可能矢量值集合的有序子集组成,矢量量化的码本是根据训练矢量集合 来设计的,常用的是l b g ( l i n d e ,b u z o ,o m y ) 算法,编码器根据特定的距离准则( 或 称代价函数) 在码本中对输入图像进行矢量匹配,然后对匹配的码本序号进行编 码,从而实现了一个从矢量所需要的比特数到一个码子序号所需比特数的压缩。 显然,矢量量化是一种信息有损的压缩方法,它可以获得较高的压缩比。其 解码方法比较简单,只是根据接收到的序号,从与编码端一致的码本中找出该序 号对应的码字,实现对原数据的近似重现,但编码端计算量颇大。为了减少失真, 码本的体积自然增大,必然使得矢量匹配的搜索运算时间增长。另外,由于对原 数据分块,在高压缩比时,与d c t 方法一样,会出现方块效应和边缘突起。矢量 量化的关键技术是最佳矢量量化码本的设计和快速的搜索算法。 矢量量化编码一般用在低比特率的场合,分为随机型矢量量化和格型矢量量 化两种。随机型矢量量化是一种很有效的数据压缩技术,可以大大降低比特率, 广泛用于语言和图像压缩编码中。人们结合图像信源的特点,提出了多种矢量量 化方案。随机型矢量量化的主要缺点是编码复杂、码本的适用性差。这是因为实 际图像压缩复杂,图像信源不平稳,从而在一定程度上降低了矢量量化的性能。 与随机型矢量量化相比,格型矢量量化具有许多优点,它无需存储庞大的码本, 编码复杂度低,具有快速算法,失真小,而且码本具有较好的鲁棒性( r o b u s n l c s s ) 。 因此,格型矢量量化是当前比较重要的一个研究方向,但它的压缩比不如随机型 矢量量化。 1 3 2 现代图像编码方法 2 0 世纪8 0 年代后期和9 0 年代初,人们结合人类的视觉生理和心理特性、模式 识别、计算机视觉、神经网络、小波分析和分形几何学等理论,开始探索图像压 缩编码的新途径,称为第二代图像编码技术。第二代编码方法并不局限于s h a r u l o n 6 s p e c k 图像编码算法的研究与改进 信息论框架,而是充分利用视觉的生理和心理特性以及信源的各种性质以获得更 高压缩比。 l 、子带编码( s b c ) ”1 子带编码( s b c ) 是第一代编码方法和第二代编码方法的过渡。它的基本思想是 把图像信号通过一组带通滤波器分解成不同频带内的分量,然后在每个独立的子 带中,对信号进行降速采样和单独编码。 子带编码技术中,首先将图像进行滤波而产生一个图像集合,其中每个都占 据一个空间频率的限制范围,这些图像就称为子带,由于子带与原来满频带图像 相比,均占有一个小的带宽,这就可以对它们进行降速采样,这种滤波处理和亚 抽样称为图像的分解阶段或分解级。然后利用一个或多个编码器对子带进行编码, 各子带可利用不同的比特率甚至是不同的编码技术。因此就可以利用子带性质所 体现的优点将编码误差分散到几个子带。对子带编码序列的译码,则要使用升速 取样以及适当滤波而获得重建的子带图像,然后将各子带相加,最后得到完整的 重建图像,这一功能的实现环节称为合成阶段或合成级。我们应当理解到,构成 子带并不带来任何压缩效果,这是因为全部子带所需的样本数与图像所需的样本 数相同。子带编码方式的积极意义在于,这些子带可以较原图像有更高的编码效 率,即子带编码的收效不在于形成子带本身,而在于各子带的高效编码。 s b c 系统中的关键因素为: l 、各设分解与合成滤波器组,以处理边带。 2 、对各子带采用适当编码技术。 子带编码的优点就是由于量化在各子带内单独进行,因此量化噪声便被限制在 各子带内,从而可以防止能量较小的频带内信号受其它频带内量化噪声的干扰和 影响。 2 、小波变换编码 小波变换编码是随着小波变换理论的研究而提出的一种编码方法。小波变换 的本质是多分辨率或多尺度地分析信号,非常适合视觉系统对频率感知的频率特 性,因此它很适合于图像信号的处理。小波对图像的多分辨率分解实际上是子带 分解的特例,利用小波变换对图像进行压缩的原理与子带编码方法十分相似,也 是将原始图像信号分解成不同的频率区域,后续的编码方法则根据人的视觉特性 及原图像的统计特性,对不同的频率区域采用不同的压缩编码手段,从而达到减 少数据量的目的。小波变换编码一方面具有传统编码方法的一些优点,能够很好 的消除图像数据中的统计冗余,另一方面它的多分辨率特性提供了利用人眼视觉 特性的很好机制,而且小波变换后的图像数据能够保持原图像在各种分辨率下的 精细结构,为进一步去除图像中其它形式的冗余信息提供了便利。 小波图像编码的主要工作是选取一个固定的小波基,对图像做小波分解,存 第一章绪论 7 小波域内研究合理的量化方案、扫描方式、 小波变换域的特性,提出有效的处理方案。 图1 1 所示的统一框架结构: 原始 重构 熵编码方式。关键的问题是怎样结合 一般而言,小波变换的编、解码具有 图1 1 小波变换i 訇像编码系统框图 小波变换采用二维小波变换快速算法。就是以原始图像为初始值,不断将上 一级图像分解为四个子带的过程。每次分解得到的四个子带图像,分别代表频率 平面上不同的区域,他们分别含有上一级图像中的低频信息和垂直、水平及对角 线方向的边缘信息。其中h l j 表示了水平方向的高频、垂直方向的低频成分,l 巧 表示的是水平方向的低频、垂直方向的高频成分,而 玎蜀子带则表示了水平和垂直 方向的高频成分。从多分辨率分析出发,一般每次只对上一级的低频子带进行再 分解。 图像经过小波变换后,并没有实现压缩,只是对整幅图像的能量进行了重新 分配。事实上,变换后的图像数据具有更宽的范围,但宽范围的大量数据被集中 在一个小的区域内,而在很大的区域中数据的动态范围很小。小波变换编码正是 利用小波变换的这些特性,采用适当的方法对变换后的小波系数进行组织,以实 现图像的高效编码,总体而言,小波变换编码有如下特点: 1 、小波图像的各个频带不仅分别对应了原始图像在不同尺度和不同分辨率下 的细节,而且每个频带都是一个由小波分解级数决定的最小尺度、最小分辨率下 对原始图像的最佳逼近。分辨率越低的子带中有用信息的比例越高。从多分辨率 分析的角度考虑小波图像的各个频带时,这些频带之间并不是纯粹无关的,特别 是对于各个高频带。由于它们是对图像同一边缘、轮廓、纹理信息在不同方向、 不同尺度和不同分辨率下由粗到细的描述,因而它们之间必然存在着一定的关系, 其中很显然的就是这些频带中对应边缘、轮廓的相对位置都应是相同的。此外, 低频子带的边缘与同尺度下高频子带中所包含的边缘之间也有对应关系。 2 、各高频子带具有方向选择性。因为不同方向的信息对人眼有不同的作用, 因此可以根据这一特性分别设计量化器,得到更好的编码效果。 3 、在小波变换编码中,图像是作为一个整体被传送的,而不像基于分块的图 像编码方法( 如d c t 变换) 把图像分成像素块来传送,因此不会出现方块效应。在 8s p e c k 图像编码算法的研究与改进 高压缩比条件下,小波变换编码器的性能下降也很缓慢。 4 、天然的塔式数据结构。图像经多级小波分解后,各系数之间存在着天然的 塔式数据结构。 3 、分形编码 分形编码( 疗a c t a lc o d i n g ) 是在m a n d e l b r o t 分形几何理论的基础上发展起来的一 种编码方法。分形理论是欧式几何相关理论的扩展,是研究不规则图像和混沌系 统的一门新科学,它描述了自然晃物体的自相似性,这种自相似性是可以确定的, 也可以是统计意义上的。b 锄s l e y 引入了迭代函数系统来刻画这种自相似性,并将 其用于图像编码,对某些特定图像获得了1 00 0 0 :1 的压缩比。b a m s l e y 的方法需 要在人工干预下进行,为此他的学生j a c q u i i l 提出了基于迭代压缩变换( i c t :n e m t e d c o m p r e s s i o nt 瑚【i l s f o 珊) 的自动分形图像编码方法m 1 ,将分形在图像编码上的应用 推进了一大步。 图像数据的自相似性可以理解为,它的所有部分都可以用在图像中的其它部 分,并通过w 运算近似求得,而w 运算仅仅是比例、旋转、镜像和移位。数学上的 描述即是一种迭代运算: x = 形( 即对于给定的信号x ,如能找到迭代运算算子w ,而w 能重建x ,那么,只传 输w ,便可在接收端恢复x ,从而达到压缩的目的。 分形图像编码的关键在于寻找图像的i f s 码,也即迭代运算算子w 。目前已有 一些专利算法,对某些图像可得到3 0 7 0 倍的压缩比。然而,分形图像编码的理论 基础决定了它只有对具备明显自相似性或统计自相似性( 例如:海岸线、云彩、大 树等) 的图像才有较高的编码效率,一般图像并不都具有这一特性,因此编码效率 不是很高。应该指出的是分形图像编码方法实质上是通过消除图像的几何冗余度 来压缩数据的,根本没有考虑人眼视觉特性的作用。另一方面,编码器建立图像i f s 码的算法十分复杂。对于静止图像和视频序列数据来说,分形编码更适于前者, 这是由于目前分形编码尚难以实现与帧间编码方法的良好结合。 4 、基于模型的编码“ 基于模型的编码( m o d e l - b 船e dc o d i n g ) 技术是近几年发展起来的一种很有前途 的低比特率编码方法,它利用了计算机视觉和计算机图形学中的方法和理论,其 基本出发点是在编、解码器两端建立相同的模型。基于模型的编码器并不压缩实 际的量化数据,而是采用一个表示景物( 例如人脸等) 的模型,传送的信息是告诉 接收方如何改变模型以匹配输入景物( 如眨眼、扭头等) 。基于模型的解码器也有 个与对应编码器相同的模型,解码器利用收到的数据调整其模型,然后生成用 第一章绪论 9 于显示的图像。 模型编码根据输入的图像提取模型参数,并根据模型参数重建图像。显然, 模型编码方法的核心是建模和提取模型参数,其中模型的选取、描述和建立是决 定模型编码质量的关键因素。 基于模型的图像编码方法利用先验模型来抽取图像中的主要信息,并以模型 参数的形式表示它们,因此可以获得很高的压缩比。模型编码实质上是通过消除 图像数据的知识冗余来实现数据压缩的,是一种基于知识的编码方法。 基于模型的编码,也称为模型基编码,又叫做分析一综合编码,它是一种侦 间编码方法。在常用的运动估计预测+ 变换编码方法中,当比特率较低时,出现令 人讨厌的方块效应是不可避免的。这是因为这种方法是基于简单的图像分块平移 模型,这种简单模型无法描述图像中运动部分的边缘信息,而基于模型的编码, 则是基于更实际的结构运动模型,从对图像中运动物体更精确的描述出发进行运 动估计的,因此被建议用于极低比特率活动图像编码。主要应用包括可视电话和 会议电视等。在这些应用中,景物中的物体相对简单,主要是讲话者的头肩像。 基于模型的编码包括以下主要步骤: 1 、图像分析 利用已编码的图像帧的有关知识,将当前帧分割为独立的运动物体,每个物 体用一系列形状和运动参数进行表述。 2 、图像综合 以所估计的形状和运动参数以及已编码帧的知识为基础,对当前帧进行综合, 实际帧和综合帧的误差大小标志着模型的适用性,误差大于某个阈值的区域要标 记为模型失败区域。 3 、编码 对上述形状和运动参数以及模型失败区域的像素值分别进行熵编码并传输到 信道上。 上述步骤中,通常大量采用诸如三维运动,结构估计,轮廓描述,纹理映射等 复杂的计算机视觉和图形工具,基于模型的编码通常包括基于物体的( 物体基) , 基于知识的( 知识基) 和基于语义的( 语义基) 。 1 4 静止图像编码的国际标准。3 1 标准化是产业化的前提,国际标准化组织( i n t e m a t i o n a ls t a l l d a r d i z a t i o n 0 r g a i l i z a t i o n ,i s 0 ) 和国际电信联盟( i m e m a t i o n a lt e l e c o m m u n i c a t i o nu n i o n ,i t 功从 2 0 世纪8 0 年代起制定了一系列针对不同应用场合、不同传输码率、不同图像、适 合不同图像质量要求的图像编码国际标准,其中包括关于静止图像的j p e g 和 1 0 s p e c k 图像编码算法的研究与改进 j p e g 2 0 0 0 ,以及关于运动图像编码的h 2 6 1 、 l 2 6 3 、m p e g l 、m p e g 2 、m p e g 4 、 m p e g 7 等国际标准。其中的 l 2 6 l 、h 2 6 3 等标准是由i t u - t f i t u t e l e c o m m i u l i c a t i o n s t a n d a r d i z a t i os e c t o r ) 制定的,其余的是由i s o 制定的。 1 4 1j p e g 标准 j p e g 是“联合i 虱片专家组”( j o i n t p h o t o 孕a p h i c e x p e r t s g r o u p ) 的简称。这是i s o 和c c r r r 于1 9 8 6 年联合成立的一个标准起草小组,该小组于1 9 9 1 年提出的i s o c d l 0 9 1 8 标准建议草案,1 9 9 2 年成为国际标准i s o i e ci s1 0 9 1 8 ,后来通常将该标 准称为j p e g 。 j p e g 标准主要涉及连续色调( 灰度和彩色) 静止图像的压缩编码。并提出了四 种工作模式,包括顺序型模式,即按照通常的从左到右,从上到下的顺序对图像 进行编码,称为基本系统;分层模式,按分辨率由低到高进行编码;渐进模式; 无失真模式。由于j p e g 基本系统是该标准的核心,它提供了一种适合大多数应用 场合的简单高效的图像编码方案。对于彩色图像,j p e g 将其分解为一个亮度分量 和两个色度分量,然后按照对灰度图像的编码方法对每个分量分别编码。所以, 以下只讨论对灰度图像的编码情况。 j p e g 基本系统的编码器和解码器如图1 2 所示,j p e g 是以8 8 的图像块为基本 单位进行编码的,所以,在编码器中,待编码图像首先被分割为8 8 的方块,而在 解码器中,输出端也要将8 8 的方块拼接成完整的图像。 ( a ) 编码器 ( b ) 解码器 图1 2j p e g 基本系统框图 第一章绪论 1 4 2j p e g 2 0 0 0 标准 j p e g 2 0 0 0 就是i s 0 和c c i t t 于1 9 9 9 年1 2 月形成的i s 0 i e c c d l 5 4 4 4 1 号草案, 于2 0 0 0 年8 月制定了最终的国际标准化草案,并于2 0 0 1 年正式成为国际标准。 j p e g 2 0 0 0 主要是规定了一系列对连续色调、二值、灰度或彩色数字静止图像的无 失真或有失真编码方法。其主要特点包括: 1 、分量( 例如灰度) 和多分量( 例如彩色) 数据的有失真或无失真压缩。 2 、特定区域( r e 西0 no fi n t e r e s t ) 编码( 图像中的不同部分可以用不同的逼真度 编码) 。 3 、按照逼真度或分辨率的分层图像恢复。 4 、图像中特定区域的随机访问。 5 、优异的压缩性能,特别是在高压缩比时。 6 、良好的误差恢复特性。 和j p e g 相比,其性能的最大不同就在于它允许更大的灵活性,特别是通过对 原始数据和压缩比特流的组织,实现直接从压缩比特流中提取并恢复低分辨率或 高比特率图像或特定图像区域,而不必对全部比特流解码。 在j p e g 2 0 0 0 中,基本编码过程如下: 1 、把原图像分解成各个成分( 亮度信号和色度信号) ; 2 、把图像和它的各个成分分解成矩形图像片。图像片是原始图像和重建图像 的基本处理单元; 3 、对每个图像片实施小波变换; 4 、对分解后的小波系数进行量化并组成矩形的编码块( c o d c - b l o c k ) ; 5 、对在编码块中的系数“位平面”进行熵编码; 6 、为使码流具有容错性,在码流中添加相应的标识符( m a k e r ) ; 7 、用可选的文件格式来描述图像和它的各个成分的意义。 至此,图像全部分解和编码完毕,对图像片的编、解码过程可简单表示为图 1 3 所示的框图。 输入 ( a ) 编码过程 s p e c k 图像编码算法的研究与改进 输入 ( b ) 解码过程 图1 3j p e g 2 0 0 0 编、解码过程 图中,直流平移部分在编码时将图像片中的直流成分去掉,在解码时再将其 恢复,以便变换系数的取正值和取负值的概率相等。系数排序和重排部分则分别 将小波系数组织成子带或将子带组织成小波系数。 在j p e g 2 0 0 0 中,基本的编码引擎是基于e b c o t ( e m b e d d e db l o c kc o d i n gw i t l l o p t i i i l i z e d t m n c a t i o n o f t h ee m b e d e d b i ts 仃e 锄s ) 的,e b c 0 t 算法与早期的嵌入式图 像压缩算法关系非常紧密,这些算法包括s h a p i m 的e z w ( e m d e d d e dz e r o 仃e e w a v e l e tc o m p r e s s i o n ) 算法、s a i d 和p e a d m a i l 的s p m t ( s e tp a r t i t i o i l i n gi nh i e r a r c l l i c a l r i r e e s ) 算法、t a u b m a i l 和z a k b o r 的l z c ( l a y e r e dz e r oc o d i n g ) 算法。与这些算法相似, 髓c o t 算法也是用小波变换进行子带采样,然后对小波系数进行量化和编码。与 e z w 和s p m t 算法不同的是,e b c o t 算法并没有使用零数结构而是使用编码块 ( c o d e b l o c k ) ,同时提出了一种称为“压缩后率失真优化”口c r d o p t : p o s c o m p r e s s i o nr a t e d i s t o n i o no p t 呦i o n ) 的算法,基于这种思想使产生的码流 具有分辨率可伸缩性、信噪比可伸缩性、随机访问和处理等非常好的特性。 1 5 本文的安排 本文首先主要介绍了一些最为经典的图像压缩编码算法;然后就小波变换的 基本理论及基于小波变换的图像压缩编码算法进行了研究与分析;最后,对集合 分裂嵌入块编码( s p e c k ) 算法,这种目前嵌入式编码算法中表现较好的基于小波变 换的图像压缩编码算法进行了改进,并取得了良好的压缩效果。 第一章简要的阐明了课题的由来及发展现状,介绍了数字图像压缩编码的一 些算法,并对当前静止图像编码的国际标准做了简单的介绍。 第二章介绍了小波变换的基本理论及图像的小波变换编码。 第三章介绍了小波提升框架理论及其小波的构造,并对整数小波变换作了简 单介绍。 第四章对基于小波变换的嵌入式图像编码进行了分析,并对其中具有代表性 的嵌入式零树小波编码( e z w ) 、多级树集合分裂剪法( s p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 移动端健康医疗应用开发
- 职教数学复习 第7章简单几何体与立体几何 第34讲简单几何体的三视图 课件
- 甲状腺次全切除术课件
- 天津市河东区2024-2025学年高二下学期7月期末物理试题(含答案)
- 用电安全知识培训课件开场白
- 新解读《GB-T 36041-2018压水堆核电厂安全重要变量监测准则》
- 生药学课件-大黄
- 2024垃圾清理协议合同
- 2024建设用地使用权出租合同(8篇)
- 2025年考研英语(一)阅读理解模拟试卷 真题解析与训练
- 高端数控机床智能化控制系统研发项目可行性研究报告
- 2025年河南郑州航空港发展投资集团有限公司招聘笔试参考题库含答案解析
- 钢结构车棚建设服务方案投标文件(技术方案)
- 中国极地海洋装备的发展探索与技术需求
- GB 9706.283-2022医用电气设备第2-83部分:家用光治疗设备的基本安全和基本性能专用要求
- 2025市政排水管道非开挖修复工程计价定额
- UML2面向对象分析与设计(第2版)谭火彬全套教案课件
- 《血液肿瘤免疫及靶向药物治疗相关性感染预防及诊治中国专家共识(2025年版)》解读
- 药品不良反应培训课件
- 苏豪控股集团招聘笔试题库2025
- 2025年干部休养所服务项目合作计划书
评论
0/150
提交评论