(模式识别与智能系统专业论文)基于纹理合成的低比特率静态图象压缩.pdf_第1页
(模式识别与智能系统专业论文)基于纹理合成的低比特率静态图象压缩.pdf_第2页
(模式识别与智能系统专业论文)基于纹理合成的低比特率静态图象压缩.pdf_第3页
(模式识别与智能系统专业论文)基于纹理合成的低比特率静态图象压缩.pdf_第4页
(模式识别与智能系统专业论文)基于纹理合成的低比特率静态图象压缩.pdf_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 基于分割的压缩算法由于符合人类视觉规律和信息论,而成为图像压缩的重 要发展方向之一。遵循这一思路,本文采用基于分割和纹理合成的算法对现有的 压缩框架进行改进和补充。其中需要重点解决的问题如下:图像的分割、纹理合 成以及形状自适应小波编码。 其中图像分割包括区域分割以及不同纹理之间的分割。对于前者,已经存在 大量的方法,但没有任何一种具有广泛的适用性,所以本文对区域分割中许多经 典的算法加以综合,充分利用不同算法的优势,形成一个有效的区域分割算法。 对于纹理的分割,则提出一种小波基元,然后采用密度统计并引入矢量场的方法 逐步进行精确分割。 纹理合成也包括两个方面,一个是纹理样本的选择,对此本文首先定义了一 种彩色结构作为纹理的统计特征,然后采用聚类算法对结构的种类进行简化,最 终利用直方图匹配算法选择样本。另一个方面是纹理的合成,本文从绘画的角度 出发,采用e m d 提取纹理的结构,然后用m r f 和分片采样算法合成纹理。 对于形状自适应小波编码,由于在m p e g 4 中已经存在标准的算法,所以不 再详述,只是借鉴已有的研究成果,对平滑区域的形状自适应小波编码进行了改 进。 本文算法与当前的压缩标准完全兼容。但与标准压缩算法相比,对于那些存 在着大片纹理的图像,基于分割和纹理合成的算法具有更高压缩比,同时还可以 灵活地对图像不同区域的码流进行分配,以尽量保证重点区域的压缩质量。 关键词:小波,图像压缩,图像分割,纹理分割,纹理合成。 l o wb i t - r a t es t i l li m a g e c o m p r e s s i o n b a s e do n t e x t u r e s y n t h e s i s z h a n gp e n g ( p a t t e r nr e c o g n i t i o na n di n t e l l i g e n ts y s t e m s ) i n s t i t u t eo f a u t o m a t i o n ,c h i n e s e a c a d e m y o f s c i e n c e s d i r e c t e db yp e n g s i l o n g a b s t r a c t c o m p r e s s i o na l g o r i t h mb a s e do ns e g m e n t a t i o ni s o n eo ft h em o s tp e r s p e c t i v e d i r e c t i o n si n i m a g ec o m p r e s s i o n ,s i n c e i tc o n f o r m st oh u m a nv i s u a l s y s t e ma n d i n f o r m a t i o nt h e o r y i nt h i st h e s i s i m a g es e g m e n t a t i o na n dt e x t u r es y n t h e s i s a r c a d o p t e dt oi m p r o v ea n dc o m p l e m e n tc u r r e n tc o m p r e s s i o ns t a n d a r d s ,t h er e s e a r c h f i e l d si n v o l v e di na r ei m a g e s e g m e n t a t i o n ,t e x t u r es y n t h e s i sa n dw a v e l e tc o d i n gb a s e d o n a d a p t i v es h a p e i m a g es e g m e n t a t i o ni n c l u d e st w oa s p e c t si nt h i st h e s i s ,i e r e g i o ns e g m e n t a t i o n a n dt e x t u r es e g m e n t a t i o n t h e r ea r em a n ye x i s t i n gm e t h o d sa b o u tt h ef o r m e r , b u tn o o n ec a nd e a lw i t hc o m p r e h e n s i v es e g m e n t a t i o nb yi t s e l f c o n s e q u e n t l y , o n ei n t e g r a t e d a l g o r i t h mi sa d o p t e d w h i c hm a k e su s eo fs t r o n g p o i n to fd i f f e r e n tm e t h o d s w a v e l e t t e x t o n sa r ed e s c r i b e di nt e x t u r es e g m e n t a t i o n a n dt h e n ,s t a t i s t i c sa n dv c c t o rf i e l da r e a p p l i e dr e s p e c t i v e l yi no r d e r t os e g m e n tt e x t u r ei m a g e sf r o mc o a r s et of r e e t h e r ea r et o wp r o b l e m sa b o u tt e x t u r es y n t h e s i s o n ei sh o wt os e l e c ts a m p l e s f r o ma1 a r g et e x t u r e ac o l o rs t r u c t u r ei sd e f i n e da sf e a t u r e so fe a c hp i x e la tf i r s t s u b s e q u e n t l y , f u z z yc l u s t e r i n g i s a p p l i e d t o s i m p l i f yt y p e s o fc o l o rs t r u c t u r e s h i s t o g r a mm a t c h i n ga l g o r i t h mi sp r e s e n t e di n o r d e rt oc h o o s es u i t a b l es a m p l e so f t e x t u r e s t h eo t h e rp r o b l e mi st e x t u r es y n t h e s i s e m da l g o r i t h mi si n t m d u c e df o r e x t r a c t i n gt e x t u r es t r u c t u r eo fs a m p l e s a n dt h e n ,w es y n t h e s i z e dt e x t u r es t r u c t u r e w i t hp a t c h - b a s e ds a m p l i n ga n d m w 打e l e tc o d i n gb a s e do na d a p t i v es h a p ei sp r e s e n t e di nm p e g 4 w ec l a s s i f y i m a g e st os m o o t h i n gr e g i o na n dt e x t u r er e g i o n s n l ea l g o r i t h ms i m i l a rt o s t a n d a r d m e t h o di nm p e g 4 i sa p p l i e df o rt e x t u r er e g i o n s t or e d u c eg i b b se f f e c t ,w ec o d e s m o o t h i n gr e g i o n sw i 也a n e wm e t h o db a s e do nd i f f u s i o ne q u a t i o n c o m p r e s s i o na l g o r i t h m b a s e do n s e g m e n t a t i o n i s c o m p a t i b l e t oc u r r e n t c o m p r e s s i o ns t a n d a r d s c o m p a r e d t oe x i s t i n ga l g o r i t h m ,t h ea l g o r i t h mh e r ei ss u i t a b l e t oi m a g e sc o n t a i n i n gl a r g et e x t u r er e g i o n sa n dh a sh i g h e rc o m p r e s s i o nr a t i o a tm e s a m et i m e ,c o d es t r e a mc a nb ed i s t r i b u t e do p t i o n a l l ys ot h a ti m a g eq u a l i t yc a nb e g u a r a n t e e di ni m p o r t a n tr e g i o n s k e y w o r d s :i m a g ec o m p r e s s i o n ,i m a g es e g m e n t a t i o n ,t e x t u r e s e g m e n t a t i o n , t e x t u r es y n t h e s i s i i 独创性声明 本人声明所成交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知, 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确地说明并表示了谢意。 签名:至孟盔日期 关于论文使用授权的说明 2p ,酝 酿2 2 , 本人完全了解中国科学院自动化研究所有关保留、使用学位论文的规定,即:中国科学院自 动化研究所有权保留送交论文的复印件,允许论文被查阅和借阅;可以公布论文的全部或部分内 容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名:至丞垒导师签名:趑日期:世 引言 1 r 研究的意义和目的 第一章引言 在现代社会中,信息传递起着至关重要的作用,它深入到各行各业,贯穿于 生活的方方面面。可以说人们的一举一动都离不开信息的交流。在所有形式的 信息中,图像作为视觉信息的载体,其重要地位日益突显出来。从电视画 面到网络图片,从可视电话到卫星图像,无一不对我们现代的生产生活起到巨 大的推动作用。 图像具有信息量大、直观等特点,正因为如此,使图像的存储和传输变成一 件困难的事情。图像处理对大容量存储器和高带宽的要求常常超出现有的工业 技术水平。所以,图像压缩作为解决这一问题的手段就应运而生了。 图像压缩技术经过几十年的发展,已经有了长足的进步,并且在实际应用中 日渐成熟,比如j p e g 2 0 0 0 ,m p e g - 4 等压缩标准已经将现有的压缩算法和数学 工具进行了最佳的组合与优化,并成为实际的工业标准。然而,面对呈几何级 数增长的图像数据,这些算法在压缩率增加方面依然难以满足应用要求。其直 接原因是没有将h v s ( h u m a nv i s i o ns y s t e m ) 的最新研究成果集成到新的标准 当中。而且,在数学界没有提出新的分解工具之前,还难以在计算机视觉描述 框架方面取得新的进展。所以,我们将在现有的图像压缩框架之内,将h v s 思 想融入算法中,发展出一种基于分割合成的图像压缩算法。 在当今的图像压缩算法中,小波分解作为一种图像变换工具被广泛采用。不 过,以嵌入式零树小波等小波编码方法进行图像有损压缩,存在一个重要缺陷, 那就是对纹理区域的压缩效果并不理想。而在所有的图像数据中,纹理又是数 据密度较大的区域,纹理区域的压缩对于整幅图像压缩数据量的减少起着至关 重要的作用。所以,我们考虑将纹理区域从图像中分割出来,采用其它算法单 独处理,以便在保留图像信息的情况下最大限度地压缩数据。 基于纹理合成的低比特率静态图像压缩 1 2 研究的出发点 我们之所以将纹理区域单独提取出来处理,是因为从h v s 的角度来看,纹理 已经成为压缩的重点和难点。为了对h v s 有所了解,我们简单介绍一下三个h v s 的重要结论。这些结论是一些视觉心理、生理学家通过一系列心理学一视觉实 验得到的: ( 1 ) h v s 对于不同的频率模式具有不同的敏感性。比如,对于亮度 分量,h v s 对空间频率的中频段具有最高的敏感性,对高低频 段则下降。利用这一特性可以显著提高图像的压缩质量。这一 现象可以通过所谓的对比敏感函数c s f ( c o n t r a s ts e n s i t i v i t y f u n c t i o n ) 来刻画。 ( 2 )在图像局部对比度的不同的区域,h v s 对于压缩图像失真的敏 感性随之而变化。因此,图像的失真在对比度强或局部能量集 中的区域,如纹理区域,可以得到掩蔽。这一现象称为视觉掩 蔽效应【l 】。 ( 3 ) h v s 对由于降晰造成的图像纹理信息的丢失十分敏感,因为压 缩引起的降析效应使图像看起来很不自然。 从以上三个结论中我们不难看出,视觉试验的重点都与纹理有关。其中的第 二点表明,在图像中如果纹理区域与原图像存在较大的变化,人类视觉是对其 是不敏感的。 结合这两点h v s 结论,我们针对大片的纹理区域提出了一种新的压缩方法。 如果在图像中存在大片纹理区域,我们将只保留其中- - 4 块具有代表性的纹理 样本并对其进行低压缩率的压缩,而对其余平滑区域采用正常压缩。当需要对 图像解压缩时,我们对平滑区域进行正常的解压运算,对于纹理区域采用合成 的方法进行还原。由于人类视觉对于纹理区域的变化不敏感,并且图像中的主 要描述内容通常在非纹理区,所以这并不会造成图像理解上的错误。同时,也 避免了由于纹理模糊而导致的压缩图像效果较差的现象。可以说,这完全符合 h v s 的最新研究成果。不仅如此,这种方法在增加压缩比的前提下,最大程度 地减少了纹理区域的视觉“失真”。 2 引言 从信息论的角度来看,图像一般为非平稳的信源,但可以认为是多个局部平 稳信源的组合,特别是对于平滑区域来说,可以认为是完全平稳的信源。将图 像分割为多个统计特性一致的区域再进行压缩,获得的熵是复合信息熵:而通 常的压缩算法是将整幅图像作为一个平稳信源处理,这样无形之中就引入了冗 余信息,获得的熵是混合信息熵。对同一幅图像来说,其复合信息熵小于混合 信息熵。所以,针对图像中不同区域的特点,分别进行压缩完全符合信息压缩 的规律,是压缩方法发展的必然。 从发展趋势来看,对纹理区域采用分割合成的算法,完全可以融入现有的压 缩框架之内。不仅如此,其对不同区域分别处理的思想也是标准压缩算法发展 的重要思路之一。比如j p e g 2 0 0 0 中就规定可以对感兴趣区域进行特殊压缩处 理,在m p e g - 4 中甚至允许可以对任意形状的区域单独处理。 从应用角度来看,压缩算法经过几十年的发展,已经形成了成熟的理论框架, 任何将来的算法都必须与现有的标准算法兼容。象j p e g 2 0 0 0 ,m p e g 一4 等标准 算法已经成为事实上的工业标准,任何与其不符合的技术在实际应用中都是无 法生存的。另外,如果不对已有的研究工作进行继承,也是巨太浪费。而我们 的算法,对平滑区域完全采用标准算法进行压缩,只对大片纹理进行合成处理。 完全可以融入j p e g 2 0 0 0 或m p e g - 4 框架内,可以说既有继承也有发展。 当然,本文的压缩算法并不适用于所有图像,因为不同类型的图像有着不同 的压缩要求。比如医学图像和航拍图像就必须使用无损压缩,大部分生活照片 可以使用不同程度的有损压缩,而一些网络传输图像、游戏图像或对纹理区域 要求不高的图像则可以采用我们的方法,因为这并不影响对图像主要内容理解。 实际上,在m p e g 4 中就已经考虑到了不同层次的应用需求,并且为适应不同 的图像压缩要求,提供了一个开放的框架。在这个框架中,除了标准的核,g , - 1 - 具算法和码流解析外,还可以对数据源采用未知的工具和算法进行处理。 1 3 研究方法 早在八十年代,m k u n t 等人针对于预测、变换等偏重于波形信号的处理方法, 提出了所谓“第二代”图像编码技术,并且给出两类新算法:一类是基于图像 分割的,在提取出闭合的轮廓和灰度起伏相对平滑的区域后,分别编码;另一 基于纹理合成的低比特率静态图像压缩 类基于边缘的方向分解,用一组方向滤波器对图像滤波以便检测出低频部分和 不同方向的边缘,然后分别编码。这类技术表达的思想是先进的,而且符合视 觉的心理、生理依据。但受到图像的分割和边缘检测技术的限制,压缩效果尚 不及j p e g 标准。而且,其独特的处理方式与当时的工业标准不兼容,在实际应 用中受到了限制。所以,这只能是一种探索性的研究。 本文继承了将图像分割后分别压缩的思想,针对图像中的纹理区域采用合成 的方法进行压缩。当图像中存在大片纹理区域时,如果全部采用标准的压缩方 法,不仅效果较差,而且在压缩率上难有很大的提高。由于重要的图像描述信 息通常不在大片的纹理区域内,我们可以将图像中的大片纹理区域分割出来, 从中选出具有代表性的纹理样本进行压缩。因为样本面积与原纹理区域相比很 小,所以可以极大地减少压缩数据,而对其它区域将根据需求进行任意比率的 压缩。当需要对图像解压缩时,我们对大部分区域进行正常的解压运算,对于 纹理区域采用样本合成的方法生成新的清晰纹理来代替原图像中的大片纹理区 域。这样,既可以提高压缩比,也可以保证视觉上的准确性。本文研究的主要 内容包括: 1 采用阈值分割、边缘提取、v o r o n o i 图和形态学变换等多种串并行分割 算法,将原始图像分割为色彩一致的区域; 2 定义了一种小数范数,将其应用于边缘图像,以此判断区域内是否存 在大片纹理: 3 采用小波基元对不同的纹理区域进行分割; 4 定义一个矢量场对不同纹理区域之间进行精确分割; 5 将e m d 算法应用于纹理样本以便提取纹理的结构; 6 定义一种彩色结构进行纹理样本的选取; 7 从绘画的角度出发,采用分片采样和颜色填充的方法进行纹理合成。 需要指出的是,本文的研究工作并非像j p e g 2 0 0 0 和m p e g - 4 那样是通用的 图像压缩算法框架。只是与其兼容的一种特定压缩算法,主要针对于那些存在 大量纹理区域需要压缩,同时又对纹理描述的精确性要求不高的图像。 引言 1 4 论文安排 第二章对已有的各种图像压缩算法的进行了综述。首先简单介绍了已有的 各种图像压缩标准。然后,描述了基于统计的压缩方法和基于图像变换的压缩 方法,其中对小波压缩算法做了详细的总结,并与子带压缩相比较。随后,对 现有的最新压缩标准j p e g 2 0 0 0 与m p e g - 4 进行了说明。最后,对压缩算法的发 展趋势进行了展望。 第三章首先重点介绍了图像分割算法,然后分别采用直方图分割、边缘提 取、v o r o n o i 图聚类和数学形态学等多种分割算法进行灰度一致性区域的分割, 并定义一种范数对包含纹理的区域进行判断。最后,将这种方法扩展到彩色图 像中去。 第四章首先对已有的纹理分割算法进行综述,并以此为基础提出了一种基 于小波纹理基元的分割算法。随后应用矢量场,对密度统计的分割结果进行精 确的修正。最后将此算法扩展到彩色纹理的分割。 在第五章中,对于怎样合理的选择纹理样本进行了研究,其中定义一种彩 色纹理结构,将其与模糊聚类算法相结合来实现纹理样本与原图像颜色直方图 的匹配。针对压缩算法速度较慢的缺点,找到一种基于小波分解的快速算法。 第六章我们首先简单介绍了近期的纹理合成算法。然后,应用e m d 算法 提取了纹理样本的结构,并应用分片采样算法进行了纹理结构的合成,最后根 据m r f 对空白区域进行颜色的填充。我们首先将这种算法用于彩色纹理的合成, 然后将其简化用于灰度纹理的合成中。 第七章从压缩率、图像质量等方面与j p e g 2 0 0 0 压缩标准进行全面的对比, 通过实验表明,本文算法对于具有大片纹理的图像具有更大的优势。 最后,对全篇论文的工作进行了总结并提出一些未来需要考虑的问题。 压缩算法综述 第二章图像压缩算法综述 2 1 图像压缩的主要方法 图像是定义在二维平面上的正定函数。图像函数中每点的值表明了图像在 该点的灰度或颜色。数字图像是由图像函数经过数字化采样得到,其函数只在 离散点处取值,这些点就称为像素。每一个像素点的灰度值由一定精度的整数 表示。因此数字图像通常表示为一个二维矩阵。 图像压缩是指以较少的比特率有损或无损地表示原来像素矩阵的技术,也称 图像编码。在压缩率相同的情况下,一个优秀的编码器可以使解压缩后的图像 质量尽可能的高。 对于图像压缩,国际上已经产生了一些很成熟的技术,如h u f f m a n 编码、算 术编码、d c t ( d i s c r e t ec o s i n et r a n s f o r m ) 、小波变换、运动补偿等。这些压缩 算法都可以归结为三类算法,即基于统计的、基于变换的和基于预测的。在此, 我们主要介绍一下前两类算法,并对现行的主要压缩标准j p e g 2 0 0 0 和m p e g 一4 进行了较为详细的介绍。 在以上算法的基础上,i s o ( i n t e m a f i o n a l s t a n d a r d s o r g a n i z a t i o n ) i e c ( i n t e r n a t i o n a le l e c t r o t e c h n i c a lc o m m i s s i o n ) 与i t u t ( i n t e r n a t i o n a l t e l e c o m m u n i c a t i o nu n i o n - - t e l e c o m m u n i c a t i o ns t a n d a r d i z a t i o ns e c t o r ) 带t j 定了一系 列国际标准,如二值图像编码标准j b i g 、连续色调静态图像压缩标准j p e g 和 j p e g 2 0 0 0 、面向1 5 m b p s 比特率运动图像的m p e g 1 、面向数字电视图像压缩 的m p e g - 2 、面向电视会议的h 2 6 1 、面向可视电话的h 2 6 3 以及面向甚低码率 多媒体通信的m p e g - 4 等。这些标准在表2 1 中详细列出。 基于纹理合成的低比特率静态图像压缩 标准号简称实用信源典型应用 i t u tt 8 2 i s o i e c11 5 4 4j b i g 1二值图像、图形g 4 传真机、计算机图形 i s c p i e c1 4 4 9 2j b i g 。二值图像、图形传真、w w w 图形库,p d a 等 图像库、传真、彩色印刷、数码相 i t u - t t 8 1li s o i e c1 0 9 1 8j p e g连续色调静止图像 机等 医学、遥感图像资料的无损近似无 i t u t 1 8 7li s o i e c1 4 4 9 5j p e g l s连续色调静止图像 损压缩 i s 0 ,c1 5 4 4 4j p e g 2 0 0 0连续色调静止图像各种图形、图像( 含计算机生成的) r r u tg 7 2 3 、g 7 2 8 和g 7 2 9语音数字通信和电话录音等 i t u t h 2 6 1 建议 p 6 4活动图像 i s d n 上的会议电视、可视电话 i t u t h 2 6 3 建议活动图像p s t n 上的会议电视、可视电话 v c d 、d a b 、多媒体、v o d 、m p 3 i s 0 ,c1 1 1 7 2啪g 1活动图像及伴音 等 s v c d d v d 、v o d m o d 、多媒体 i t u th 2 6 2 1 i s o i e c1 3 8 1 8 - 2 m p e g - 2 视频高质量活动图像 视频游戏、d v b 、d t v h d t v 等 d a t 、d c c 、d a b 等及数字视频 i s o ,i e c1 3 8 1 8 - 3m p e g - 2 音频高质量多声道声音 伴音 i s 0 九e c1 4 4 9 6m p e g - 4多媒体音像数据w w w 上的视频、音频扩展 表2 - 1i s o 和i n j _ t 的压缩标准 2 2 基于统计的压缩方法 图像压缩是数据压缩的一个重要分支。作为数据压缩的理论基础,由香农等 人提出的信源编码理论【2 4 】对图像压缩无疑具有重要的理论指导作用。信源编 码理论就是研究如何更有效率的表达信源数据。对于图像压缩来说,就是通过 减少图像数据之间的冗余信息来达到这一目的。信源编码理论的两个重要概念 是无失真信源编码理论和限失真信源编码理论。其中无失真信源编码又称为熵 编码,限失真编码又称为熵压缩。 无失真信源编码理论主要讨论了信息复杂度的定量描述以及其无失真表达 压缩算法综述 时所需要的最小平均码率。熵和无失真编码器的有效构造是这一理论的两个中 心概念。在这一理论指导下产生的比较常用的数据压缩技术有h u f f m a n 编码器、 算术编码器以及z i v l e m p e l 编码器等 5 7 】。 2 2 1 h u f f m a n 编码 在无失真信源编码方法中,排列编码 8 】和熵编码是比较有代表性的两种方 法。排列编码使用固定的码长,但由于码字可能较长,会产生编解码延时。为 解决这一问题,熵编码采用变长编码,对高概率信源符号用较短的码字编码, 反之则采用较长的码字编码。所以h u f f m a s z 编码【4 】 7 】是一种变长编码。h u f f i n a n 编码具有简单,高效的优点,因此被广泛采用。但h u f f m a n 编码也存在一些较 明显的缺点。比如,其码长为整数,只有在信源符号的边缘概率是2 的整数次 幂时,才能实现最优编码,而实际情况往往并非如此。另外,当h u f f i n a n 编码 表固定时,编码器无法对信源进行自适应的编码。针对这一问题,研究人员先 后提出了两种解决方案,一种是对信源迸行两遍扫描,先获得信源的统计特性 来生成h u f f i n a n 编码表,然后对信源进行编码【4 】【7 】 9 】,但这需要传输编码表。 另一种是采用自适应h u f f m a n 编码【4 】 7 】【9 ,即在编码过程中,根据获得的信源 符号动态调整h u t h a n 编码表,但这将增加编解码的复杂度。 2 2 2 算术编码 算术编码的基本概念最初由e l i a s 在六十年代提出,但直到1 9 7 6 年才由 r i s s a n e n 和p a s c o 1 0 1 1 找到可以真正实现的方法。当前用得比较广泛的自适应 算术编码器是由w i t t e n 在1 9 8 7 年提出的 7 】 1 2 】。与h u f f m a n 编码不同,算术编 码对信源的整个符号序列进行编码。算术编码的码字由一系列位于 0 ,1 上的 区间段组成。在编码过程中,每一个信源符号对应到当前区间的一个子区间上, 高概率信源符号对应较大的子区间,然后输出一个足够将当前信源的对应子区 间与其他子区间区分开的二进制串,这个串的长度约等于一l o g ( 口f ) ) ,其中a ,是 当前编码的信源符号。随着编码的进行,当前区间被不断更新,二进制串也不 断的被输出。 9 基于纹理合成的低比特率静态图像压缩 算术编码的主要优点是其平均码长可以逼近信源的熵,并且可以将信号的建 模过程与编码过程分离 1 3 1 4 。建模过程与编码过程的分离意味着我们可以对 信源建立任意复杂的模型而不需要改变编码器 1 5 】,这样我们就可以通过对信源 进行精确的统计来建模,以便提高编码的效率。统计模型分为固定模型和动态 模型,后者可以对信源进行局部的自适应编码。 固定模型的建立可以通过对数据集进行训练得到,也可以通过对信源的数据 进行两遍扫描得到。动态模型随着编码的进行不断调整模型的参数。与算术编 码相比,对h u f f a n a n 编码采用复杂的信源建模会遇到一些困难,比如速度的大 幅下降等1 1 0 1 。 当前对算术编码的研究主要集中在信源的有效建模 6 】和编码的快速实现 1 7 1 8 两个方面。算术编码通常应用在图像压缩的熵编码阶段。比如在j e p g 和j p e g 2 0 0 0 标准中都应用了m m 公司发明的二进算术编码器,即q m 编码器 1 9 。对于图像压缩,算术编码和h u f f m a n 编码比基于字典压缩的l z 7 7 和 l z 7 8 1 7 9 使用得更为广泛。 2 3基于图像变换的压缩方法 由于图像是二维联合信源,不同方向的信源之间具有相关性,信息的冗余度 就隐藏在相关性之中。通常不宜于对各个相关分量直接压缩。所以,需要通过 变换去除各个分量之间的相关性,然后再分别独立压缩编码。 2 3 1 离散余弦变换( d c t ) 1 9 7 4 年,n a h m e d 等人提出了d c t ,因为其变换矩阵的基向量很接近于 t o e p l i t z 矩阵的特征向量,而t o e p l i t z 矩阵又体现了人类语言及图像信号的相关 性。因此,d c t 常常被认为是语言和图像信号的准最佳变换,其性能接近k l 变换。进一步的研究表明,对于常用的马尔可夫过程模型,k l 变换就退化为经 典的d c t 。因此,对于大多数相关性很强的图像数据,d c t 是k l 变换的最佳 替代者。 不过,基于d c t 2 0 】的图像编码系统 2 l 】在低比特率的情况下,由于d c t 1 0 压缩算法综述 的分块效应,压缩质量通常会有严重的下降。最近几年,基于小波变换的图像 压缩系统因其在高压缩比情况下的良好性能,使其成为图像压缩领域的一个重 要数学工具。各种性能卓越、设计精巧的小波编码器的出现,充分展示了小波 变换在图像压缩应用中的作用与潜力。 2 3 2 子带编码 所谓子带编码就是利用m 个带通滤波器把信号频带分解成若干子带,通过 频移将各子带信号转移至基带上,然后按奈奎斯特频率重新采样,将各子带的 采样值进行数字编码并复合成一个统一的传输码流。接收端首先将总码流分解 成相应的子带码流,然后解码并将信号从基带重新“搬移”回原来的子带频率 位置,再将所有子带的滤波输出相加后就可合成接近于原始信号的重建信号。 1 9 8 5 年,s d ,o n e i l 将语音的予带编码s b c 推广用于图像编码。在典型的数 字音频压缩实用方法中,s b c 己成为标准的主体技术框架。 子带编码系统是一个多速率数字信号处理【2 2 】【2 3 】系统,它由滤波器组( f b ) 、 采样器以及插值器组成。对一维信号的子带编码系统如图2 一i 所示。采样器将原 始信号滤波后的信号的采样率降低到原来的,对于m 对个采样数据,只保 ,h 留其中的一个,而将其他采样值丢弃。插值器通过在两个相邻采样数据之间补 m 一1 个零来提高数据的采样率。 咂h 竺卜屯三怔压 - 咂h 圈圆 多多 岖司还拇 路 制 路 复 一 分 : j 用配 : : : : l1:i: ii i 水h 可闻岖司咂憎 图2 一l 子带压缩示意图 基于纹理合成的低比特率静态图像压缩 在图2 1 中,左边的m 个滤波器日。,且,日。组成分析滤波器组,右边的 m 个滤波器g 。,g 1 ,g 。组成综合滤波器组。在定条件下,原始信号可以在 接收端得到精确重建。这就是多速率滤波器组的理想重建条件 2 2 2 3 1 。图2 1 所示的结构可以很方便的推广到二维的图像编码情形。只需先对图像的各行 ( 列) 进行上述变换,然后得到的中间结果的各列( 行) 作同样的变换。 子带编码具有许多优点,比如,图像的客观质量高,主观效果好;算法复杂 度低;以及便于渐进编码等。其中便于渐进编码具有极大的应用价值,因为它 可以先传输并重建低频子带图像,再逐步添加高频子带,使恢复图像逐渐清晰。 这样就可以让用户按照自己的要求去选择传输图像的质量。 以上所述的子带变换均可归类于“均匀”变换,因为变换后所有的子带具有 相同的带宽,但以上变换结构可以在变换后的某些子带上叠代进行,从而实现 一种树结构的子带“非均匀”变换,从而大大提高了信号分解和表示的灵活性。 2 3 3 小波变换编码 在形式上,小波变换表现为一种非均匀子带变换,但其本质与子带变换不同。 它具有更为深刻和独特的内涵。小波变换是2 0 世纪8 0 年代后期发展起来的应 用数学分支。虽然在此之前已有一些学者做过一些零散的工作,但是理论上构 成较系统的构架则主要是y m e y e r , j m o r l e t 和a g r o s s m a n 的贡献。而把这一 理论引入工程应用,特别是信号处理领域,i d a 曲e t h i c s 和s m a l l a t 则起了极 为重要的作用。 小波变换的含义是:把某一被称为基本小波的函数y ( f ) 作位移f 后,在不同 尺度a 下与待分析信号厂0 ) 作内积: 啊= 去e 代旷( 争比删 ( 2 1 ) 小波理论的基本出发点是将信号分解成不同尺度( 或分辨率) 下的分量组合。 这种分解可以对信号在不同尺度下的分量加以分离以便单独进行研究。信号的 压缩算法综述 全局特征可以在较粗的尺度下观察,而信号的局部特征可以在较细的尺度下进 行分析。 规范正交小波基可以在连续时间域构造,也可以从离散时间域的滤波器出发 来构造。d a u b e c h i e s 首先发现,在一定的正规性条件下,经过叠代运算后,离散 滤波器或q m f ( q u a d r a t u r em i r r o rf i l t e r b a n k s ) 将收敛于连续的小波函数 2 4 1 , 这是一个非常实用的小波分解策略,因为我们可以通过f i r ( f i n i t ei m p u l s e r e s p o n s e ) 滤波器来实现它。d a u b e c h i e s 同时揭示了使用f m 滤波器实现正交规 范小波基与理想重建的子带编码策略之间的等价性。此后,c o h e n 、d a u b e c h i e s 和f e a u v e a u ( c d f ) 给出了构造有限支撑域的双正交小波的系统方法 2 4 】。s m a l l a t 和ym e r y e r 合作提出的多分辨率分析框架给出了小波构造的一般方法。 2 3 4 小波分析的特点 应用小波分析的目的,在于从小波系数推测信号的局部频率、或者利用系数 的稀疏性来压缩信号,而这种推测精度的高低以及被推测信号的实用范围,在 本质上依赖于小波的性质。衡量小波的指标,通俗地说包括以下三点: ( 1 ) 越光滑越好,即要磨平“棱角”,体现了正则性; ( 2 ) 振动越多越好,即为“波”,体现了高消失矩; ( 3 1 衰减性越快越好,即“波”要“小”,体现了空间域上的局部性。 对于具体的图像压缩,我们更关心的是小波函数的光滑性、小波逼近的精确 性以及小波函数的支持域这三方面的性质。 一般情况下,压缩的自然图像都可以看作局部平滑。因此重建函数的平滑性 对于重建图像质量的影响非常大。如果重建信号的小波或尺度函数含有较多的 不连续点或较强的奇异点,则分解小波系数的量化误差将会使这种不连续性或 奇异性出现在重构后的图像中。这种效应在图像的光滑区域显得特别明显 2 5 1 1 2 6 。在一定条件下,尺度函数的光滑性与子带编码中的频率选择性相比, 显得更为重要 2 7 1 。 小波函数逼近的精确性是在小波设计时需要考虑的第二个因素。我们可以构 造出光滑、紧支撑的小波基函数,用来精确重建从零到一定阶次的多项式信号。 基于纹理合成的低比特率静态图像压缩 如果一个信号f ( t ) 在局部为一多项式,则我们只需少量的小波系数就可以非常 精确的重建出这部分信号。这种性质可以用小波函数的消失矩来刻画。如果小 波扩p ) 具有阶消失矩,则 i x 2 妒( x ) 出= 0 ,k = 0 , 1 ,n 一1 ( 2 2 ) 那么,具有阶消失矩的紧支撑小波基函数妒( f ) 可以在局部重建0 到一1 阶的多项式信号。当尺度变小时,小波的消失矩数目也决定了逼近信号,( t ) 收 敛于f ( t ) 的速度 2 5 1 。 小波基函数支撑域的大小是在进行小波设计时需要考虑的另一个重要的因 素。( f ) 的支撑域越小,意味着可以使越多的小波系数接近于零。因为当y ( f ) 在 跨越图像的边缘时,将产生大的小波系数。妒( f ) 的支撑域越大,意味着y ( f ) 跨 越图像边缘的次数越多。因而,我们总是希望小波函数的支撑域控制在一定的 范围之内。 小波函数的支撑域与它的正则性( 光滑性) 及消失矩是相互矛盾的。支撑域 越短,则正则性和消失矩越差。反之,则可以提高其正则性和消失矩。限制小 波支持域的大小,这意味着分析滤波器应该尽量的短。在子带编码中,限制滤 波器的长度也是比较重要的,因为长的滤波器将会在边缘附近产生振铃效应。 小波变换的主要特点有如下五个方面,它们对于图像压缩具有重要的指导意 义。 ( 1 ) 局部性:由于小波函数的时频局部性,小波变换的系数可以在较大尺度 范围内刻画信号的时频局部特性: ( 2 ) 多分辨率:小波变换在一系列的尺度上对信号进行分析,因而可以对持 续时间长短不同的信号结构进行分析; ( 3 ) 压缩:信号的小波表示是稀疏的,对自然界的信号或图像,其小波系数 的分布具有非高斯特性,一般服从拉普拉斯分布或广义高斯分布。 1 4 压缩算法综述 ( 4 ) 聚类:如果一个系数的幅值较大,则与其相邻的小波系数的幅值较大的 概率较大,反之亦然。 ( 5 ) 尺度相关性:小波系数的幅值在尺度之间具有传递性。 2 3 5 小波变换与子带变换的区别 小波变换虽然是子带变换的特例,但小波变换的数学机理却与子带变换的数 学机理大不相同。小波变换在本质上是分析连续信号,而子带变换更多的用于 分析离散信号;小波变换更多的是从空间域来分析信号的时频特性,而子带变 换更多的是从频域来分析信号的特性。 当我们应用小波变换时,我们接收的输入实际上是更小尺度的尺度函数的系 数,而不是某个函数的采样值。与子带变换的框架不同,小波框架隐含地指定 了一个连续信号,而我们的初始输入正是这一连续信号与更小尺度的尺度函数 的卷积系数。连续函数的引入使得我们可以使用强大的数学分析工具来分析信 号或指导滤波器的设计过程。在连续函数的框架内,我们可以刻画出那些用少 量小波系数就可戳精确表示的函数类型,也可以解决象基函数光滑性的刻画这 一类问题。通过对这些问题的考虑,我们可以得到小波滤波器以及子带滤波器 的设计准则。 小波变换区别于子带变换的另一特点是它能同时描述信号的时域和频域特 性,而子带变换描述的只是信号的频域特性。小波变换系数反映了信号在某一 时刻或某一位置的时频特性。在一些基于小波变换的图像压缩系统中,这一时 频局部特性被证明是非常有价值的。 通过小波变换将信号分解为不同的子带有几种方法。其中包括均匀子带分 解、倍频程分解、自适应小波分解以及小波包分解 2 8 】。其中倍频程分解使用的 最为广泛。 2 4基于小波变换的压缩算法 由于小波变换的时一频局部表示优于单纯的频域表示,小波系数恰好反映了 信号的边缘特征,按倍频程方式的频带划分又与h v s ( h u m a n v i s i o ns y s t e m ) 基于纹理台成的低比特率静态图像压缩 特性相吻合,因而受到了广泛的重视。 从多分辨率分析的观点看,小波变换图像分解产生的各级子图像分别对应于 原始图像中不同尺度下的边缘信息,原始图像中的突变信号在小波变换域中没 有扩散。小波变换不仅具有频率域能量紧缩特性,而且同时具有空间域能量紧 缩特性。这些特性一方面表现为大部分的能量总是集中在最低频的子图像中, 并从低频到高频呈递减分布趋势;另一方面,各子带图像对应相同空间位置的 像素之间也存在着较强的空间相关性,并且相应的系数从低频到高频呈很好的 尺度级顺序递减。这一独特的数据特性导致了一种新型的数据结构“零树” 的产生。 为了利用小波变换对图像进行压缩,我们首先需要分析在小波分解以后的压 缩过程中需要保持图像的哪些信息,才能使重建图像的质量更好,以及可以采 取一些什么样的方法对这些信息进行尽可能紧凑的表示。 从小波系数矩阵可以看出,小波变换所谓的良好的空问频率局部化特性具 体表现在如下几个方面: ( 1 ) 频率压缩特性,即从频率分解上看,原始图像的能量大部分集中到低频 子带; 但) 空间压缩特性,即从系数的空间分布看,高频子带的能量大部分集中在 原始图像的边缘、轮廓等对应的位置; ( 3 ) 系数分布相关性,即同方向上各级高频子带

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论