(通信与信息系统专业论文)基于小波变换的视频编码器研究.pdf_第1页
(通信与信息系统专业论文)基于小波变换的视频编码器研究.pdf_第2页
(通信与信息系统专业论文)基于小波变换的视频编码器研究.pdf_第3页
(通信与信息系统专业论文)基于小波变换的视频编码器研究.pdf_第4页
(通信与信息系统专业论文)基于小波变换的视频编码器研究.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(通信与信息系统专业论文)基于小波变换的视频编码器研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于小波变换的视频编码器研究 摘要 ( 随着网络通信技术的发展,视频图像编码的地位越来越重要。经典 的视频处理标准包括m p e g 1 2 和h 2 6 1 i - i 2 6 3 等,它们利用帧间预测运 动矢量、d c t 变换、h u f f m a n 编码等方法来实现视频数据的高效压缩。 与此同时,小波分析这门新兴学科也渐渐在视频图像编码处理应用中崭 6 一 露头角,并日益体现出它对图像压缩处理所具有的强大能力j 本文在对 目前流行的小波零树图像压缩方法进行研究的基础上,实现并改进了一 种三维小波视频图像编解码器。该视频编解码器具有较低计算复杂度、 非递归结构、多分辨率视频显示特性以及提供嵌入式码流的优越性能。 本文实现的三维小波视频图像编解码器主要包括三维小波变换和变 换系数编码两大模块。 , ( 三维小波变换的实现是通过时间、空间水平和空间垂直三个方向的 、 一维可分离小波变换完成的。而且,由于采用了一维的可分离小波变换, 矿 使得三维的变换次序可以任意改变,相当灵活。) 本文先研究实现了基本 , 的三维对称小波变抿阳口时间、空间水平和空间垂直的一维变换依次轮 、 流进行囊尔后,在研究发现其没有充分利用帧问相关性的基础上,提出 , 了时间去耦小波变换的方法。f 即在完成所有的帧内二维变换的基础上再 进行时间维的变换,从而使得变换域的能量集中效果要远好于对称小波 v 7 。 变换。) 考虑到三维小波变换的实现要占用相当大的存储量和时间,为了 加快运算速度、节省存储量,本文实现中采用了提升方案。 ( s h a p i r o 提出的嵌入式零树编码方法是一种基于不同尺度之间的系数 自相似性的编码方案。它提出的零树结构可以实现高效的系数重要性图 编码。而在s a i d 和p e a r l m a n 提出的s p i h t 算法中,该树结构编码方法充 、_ ,一7 分体现出它在图像编码中的优越性能。所以j 本文选用s p i h t 算法作为 对变换系数编码的基础。首先,在把图像s p i h t 编码扩展到3 ds p i h t 编码的基础上实现了对三维小波变换系数的编码。尔后,针对时间去耦 小波变换的特点,本文又提出了利用时空分叉等级树结构代替时空方向 树结构,并取得了良好的效果。 本文用c 语言仿真实现了基本的3 ds p i h t 视频编解码器并在此基 础上完成了改进。( 相对于h 2 6 3 编解码器,3 ds p i h t 视频编码器具有较 低的计算复杂度、非递归结构、多分辨率视频显示特性以及提供嵌入式 码流的特点。在低码率下,改进后的编解码器在性能上可以逼近h 2 6 3 的结果。而且,本文所提供的程序可以作为后续研究的基本平台,特别 、 是其中的小波变换模块具有相当大的灵活性。卜、 关键词:视频编码器,小波变换,零树,时空方向树,时空分叉等级树 s t u d yo fv i d e oc o d e cb a s e do nw a v e l e t a b s t r a c t w i t ht h e d e v e l o p m e n t o fn e t w o r kt e c h n o l o g y , e f f i c i e n tv i d e o i m a g e c o d i n gt e c h n i q u e s a r em o r ea n dm o r e i m p o r t a n t t h ec o n v e n t i o n a l v i d e o c o m p r e s s i o ns t a n d a r d s ,i n c l u d i n gm p e g - 1 2a n dh 2 6 1 h 2 6 3 ,m a k eu s eo f m o t i o nv e c t o r sb e t w e e nf r a m e s ,d c ta n dh u f f m a ne n c o d i n gm e t h o dt o a c h i e v e h i g hc o d i n ge f f i c i e n c y m e a n w h i l e ,an e ws u b j e c tc a l l e dw a v e l e t a n a l y s i sh a sb e e n i n t r o d u c e dt oi m a g ec o m p r e s s i o nf i e l da n di th a ss h o w ni t s p o w e r f u lp o t e n t i a lo ni m a g ep r o c e s s i n g i nt h i st h e s i s ,w er e a l i z eak i n do f3 d w a v e l e tv i d e oc o d e c b a s e do nt h e s t u d y o f p o p u l a r z e r o t r e e i m a g e c o m p r e s s i o na l g o r i t h m sa n d t h e nm a k es o m ei m p r o v e m e n t s t h ea d v a n t a g e s o ft h i sv i d e oc o d e ca r et h el o w e rc o m p u t a t i o n a lc o m p l e x i t y , n o n e - r e c u r s i v e s t r u c t u r e ,m u l t i - r e s o l u t i o n p r o p e r t y f o r p o s s i b l e v i d e o s c a l a b i l i t y a n d e m b e d d e dc o d e db i t s t r e a m t h ev i d e oc o d e cw eh a v ei m p l e m e n t e d m a i n l yc o n s i s t so f t w o p a r t s :3 d w a v e l e tt r a n s f o r ma n dc o e f f i c i e n t se n c o d i n g 3 dw a v e l e tt r a n s f o r mi sr e a l i z e d t h r o u g ht e m p o r a l ,s p a t i a l - h o r i z o n t a l a n ds p a t i a l v e r t i c a ls e p a r a t e1 dw a v e l e tt r a n s f o r m b e c a u s eo ft h eu s a g eo f s e p a r a t e1d w a v e l e tt r a n s f o r m ,o n ec a n e a s i l yc h a n g et h eo r d e ro f 3 dw a v e l e t t r a n s f o r m f i r s t l y ,w es t u a yb a s i c3 ds y m m e t r i cw a v e l e tt r a n s f o r m ,w h i c h u s e st h es e p a r a t e1 d w a v e l e tt r a n s f o r mi nt u r n b u tt h r o u g he x p e r i m e n t s w e f i n dt h a t3 ds y m m e t r i cw a v e l e tt r a n s f o r md o e s n o tt a k ef u l lu s eo ft e m p o r a l c o r r e l a t i o na m o n gp i x e l si ns u c c e s s i v ef r a m e s s o w er e c o m m e n d e d3 d t i m e 。 d e c o u p l e d w a v e l e tt r a n s f o r m t ot a k e p l a c e o f3 d s y m m e t r i c w a v 。l e t t r a n s f o 珊t h eo r d e ro f 3 d t i m e d e c o u p l e dw a v e l e tt r a n s f o r m i st of i n i s h2 d w a v e l e tt r a n s f b m l o ff r a m e si ne a c hg r o u pa n dt h e n t o a c c o m p l i s h 也e t e m d o r a lw a v e l e tt r a n s f o r m t h i sk i n do f 3 dw a v e l e tt r a n s f o r mc a np r o v i d e b e t t e re n e r g yc o m p a c t i o ni nt e m p o r a l o r i e n t a t i o n i no r d e rt o r e d u c et h e c o m p u t a t i o n a lc o m p l e x i t y a n ds t o r a g em e m o u n e e d e di nw a v e l e tt r a n s f o r i l l , w eh s el i f t i n gs c h e m e i ni m p l e m e n t a t i o n e m b e d d e dz e r o t r e ec o d i n g ( e z w ) b ys h a p i r o i sac o d i n gs c h e m e ,w h i c h e x p l o i t s i n t e r - s u b b a n ds i m i l a r i t i e s i t u s e s s e l f - s i m i l a r i t y t o e f f i c i e n t l y t r a n s m i tt h es i g n i f i c a n c em a p w i t hat r e es t r u c t u r ec a l l e daz e r o t r e e l a t e r , s e t p a r t i t i o n i n gi nh i e r a r c h i c a lt r e e s ( s p i h t ) b ys a i da n d p e a r l m a nf u l l ys h o w s t h ee x c e l l e n tr e s u l t so f z e r o t r e eb a s e dc o d i n gf o ri m a g ec o m p r e s s i o n s oi n t h i st h e s i s ,w eu s es p i h t a sab a s i ca l g o r i t h m a tf i r s t ,w ee x p a n d 2 ds p i h t t o3 ds p i h ta n d r e a l i z ec o e f f i c i e n t sc o d i n g t h e n ,a c c o r d i n g t om e c h a r a c t e r i s t i co f3 dt i m e d e c o u p l e dw a v e l e tt r a n s f o r m ,w ei n t r o d u c es e p a r a t e t e m p o r a l s p a t i a l h i e r a r c h i c a l t r e es t r u c t u r e t o r e p l a c e t e m p o r a l 。s p a t i a l o r i e n t a t i o nt r e ea n dg e tb e t t e rp e r f o r m a n c e s i nt h i st h e s i s ,w eu s ecl a n g u a g e t oi m p l e m e n tt h eb a s i c3 d s p i h tv i d e o c o d e ca n d i t s i m p r o v e m e n t s c o m p a r i n g t oh 2 6 3v i d e oc o d e c ,t h e c h a r a c t e r i s t i c s o f3 ds p i h tv i d e o c o d e ca r et h el o w e rc o m p u t a t i o n a l c o m p l e x i t y , n o n e r e c u r s i v e s t r u c t u r e ,m u l t i r e s o l u t i o np r o p e r t y f o rp o s s i b l e v i d e os c a l a b i l i t ya n de m b e d d e dc o d e d b i t s t r e a m u n d e rl o wb i t r a t ec o n d i t i o n , t h ei m p r o v e d3 ds p i h t v i d e oc o d e cc a ng e tg o o dp e r f o r m a n c e sr e l a t i v et o t h a to fh 2 6 3v i d e oc o d e c b e s i d e s ,p r o g r a m sw eh a v ep r o v i d e dc a nb eu s e d a sab a s i cp l a t f o r mf o rl a t e rr e s e a r c h e s p e c i a l l y , t h ew a v e l e tt r a n s f o r m m o d u l ei sv e r yf l e x i b l e k e yw o r d s :v i d e oc o d e c ,w a v e l e tt r a n s f o r m ,z e r o t r e e ,t e m p o r a l s p a t i a l o r i e n t a t i o n t r e e ,s e p a r a t et e m p o r a l s p e c i a lh i e r a r c h i c a lt r e e v 第一章绪论 1 1课题研究背景及国内外发展状况 近年来,随着网络与通信技术,尤其是a t m 和b i s d n 的飞速发展,通信应用 领域不断拓广,新的多媒体通信业务不断发展,如可视电话、电视会议及点播电视等。 这些综合业务包括数据、话音和视频,而其中的视频业务又尤其重要。正因为现实生 活中的业务需求量不断增长,而网络带宽是有限的,所以这给多媒体数据压缩编码提 出了更高的要求。而要实现低码率视频通信的主要技术问题是视频压缩编码技术,即 用来实现在满足足够图象质量和硬件成本的条件下降低所需要的码率。目前,应用最 为广泛的视频压缩编码标准包括m p e g - 1 2 ,h 2 6 1 1 - 2 6 3 等。在这些编码标准中,主 要是消除图象数据中的统计冗余度。由于没有充分利用人眼的视觉特性,当用高压缩 比系统时,重构的图象会出现块效应等令人讨厌的现象。因此,人们越来越希望能够 利用人眼的视觉特性来减少帧内和帧间的冗余信息。对于视觉系统来说,未来的图象 模式所要考虑的重要的东西就是不连续的信息和边界信息。为了解决这些问题,研究 者们不断探索,而小波变换的应用则引起了研究者的注意。 1 9 8 1 年,法国地质物理学家m o r l e t 在分析地质数据时基于群论首先提出了小波 分析( w a v e l e ta n a l y s i s ) 这一概念。m o f l e t 最初提出的是形状不变的小波( w a v e l e t o f c o n s t a n ts h a p e ) ,因为在分析函数( 信号) 时,加窗f o u r i e r 变换并不具有形状不变性 1 1 。m o r l e t 方法所取得的数值分析的成功不仅激发m o r l e t 本人对小波分析进行深入研 究,而且也大大鼓舞了法国理论物理学家g r o s s m a r m 。于是他们携手共同研究小波理 论。1 9 8 5 年,法国大数学家m e y e r 首次提出光滑的小波正交基,后来被称为m e y e r 基。1 9 8 6 年,m e y e r 及其学生l e m a r i e 提出了多尺度分析的思想。1 9 8 8 年,年轻的 女数学家d a u b e c h i e s 提出了具有紧支集的光滑正交小波基_ d a u b e c l l i e s 基l ”,为小 波应用研究增添了催化剂,她也因此扬名世界。后来,信号分析专家m a l l a t 提出了多 分辨分析( m u l t i r e s o l u t i o n a n a l y s i s ) 的概念,给出了构造正交小波基的一般方法。而 且,多分辨分析概念也成为了小波理论最基本的概念之一。最常用的多分辨分析有两 大类。一类是时间有限的多分辨分析,另一类是样条多分辨分析。多分辨分析原理与 人类的视觉和听觉方式十分接近。例如,我们站在月球上看地球,只能看到地球上大 概轮廓和地球上突出的建筑物( 如中国的万里长城) ,这就是高频边缘提取:当我们 上海交通大学硕士学位论文 第一章绪论 站在地球上看地球时,一草一木清晰可辨,这就是低频分析。之后,m a l l a t 受到金字 塔算法的启发【3 i ,以多分辨分析为基础提出了著名的快速小波算法m a l l a t 算法 ( f w t ) 1 5 1 ,这是小波理论突破性的成果,其作用和地位相当于f o u r i e r 分析中的f f t 。 m a l l a t 算法的提出宣告小波从理论研究走向宽广的应用研究。 随着小波分析学科的不断发展,它在图像压缩方面的潜力也不断体现。由于小波 变换的思想来源于伸缩和平移,能够将时间域、空间域和频率域有机结合起来,因此 在对图象信源进行处理时,它克服了传统的f f t 的一些弱点,能对图象进行时频局 部化,对图象的平滑部分进行粗处理,对细节部分进行精细处理。同时,它也能将图 象分解到多个尺度上,进行多分辨分析。这样,就可根据各尺度上的子图象的特性不 同而进行不同的处理。用此方法所重建的图象更符合人眼的主观特性,彻底消除了块 效应,图象的编码效率也得到了很大提高。因此,小波编码倍受众多研究者的青睐。 说到小波编码就需要提一下子带编码。1 9 8 6 年,w o o d s 等人第一次将子带编码方 法用于图像压缩【4 6 1 。随后,在1 9 8 7 年,a d e l s o n 等就根据子带编码的思想提出了著名 的图像金字塔概念| 4 7 1 ( 正是m a l l a t 小波算法的基础) 。通过子带分割进行编码的根本 思想在于将信号在频域进行分割,而后通过下采样的方式来平滑各个子带内的信号, 从而使得可以用更加精确的参数来描述各个予带内的统计信息。事实上,研究表明, 子带编码的编码增益主要正比于不同子带内能量分布的算术平均和几何平均。其实, 根据小波理论的滤波器组理论( 参见第二章相关内容) ,小波变换从根本上说可以认 为是一种子带分解技术。 有了小波变换作为基础之后,对基于小波变换的图像编码算法的研究也不断发 展。其中,最著名的就是j m s h a p i r o 提出的嵌入式零树小波编码算法( e z w ) m 1 以 及a s a i d 和w a p e a r l m a n 在e z w 基础上提出的改进的分区等级树编码算法( s p i h t ) m 】。这两种算法以其简单、高效的特点而著称。它们的一个最基本的思想是充分发掘 图像数据经过小波变换得到的系数在不同尺度之间的自相似性从而达到压缩图像数 据的效果。这两种算法的特点包括:快速的编解码、嵌入式编码码流( 参见第三章相 关部分) 、精确的码率控制和简单的实现方法。正是这两种算法自身所具有的特点以 及在图像压缩应用中表现出的非凡性能,使得基于零树的小波编解码算法也不断发 展。 由于小波变换子带编码和e z w s p i h t 算法在静止图像处理中表现出的高性能, 因此也激励研究者们将它扩展应用到三维活动图像序列编码中,从而使得基于小波, 子带编码的图像序列编码也得到了不断发展。 b h u t a n i 等人首先提出了一种二维子带编码结合运动补偿及零树编码的方案| 4 ”。 该方案先是在每一帧中进行予带分解,然后对每个子带进行运动估计得到运动矢量, 最后再利用零树编码对于运动补偿得到的残差信号进行编码。由t a u b m a n 等人提出 的方法则是结合三维子带变换和镜头运动补偿的渐进传输技术【4 9 】。p o d i l c h u k 等人也 提出了一种方法。它结合使用了三维子带分解、一种自适应差分脉冲编码方法以及自 适应比特分配方案【5 ”。 总的来说,受到e z w s p i h t 算法影响而发展起来的基于零树结构的视频压缩方 法可以分为两种。一种是先运用传统的基于运动补偿的预测算法来去除时间冗余度, 然后再利用二维小波变换编码对每帧的残差信号进行二维压缩处理。而另一种方法就 是直接使用三维的离散小波变换来去除时间和空间方向上的冗余度,将能量压缩到时 空方向的低频子带内,从而建立起三维的等级树结构进行编码。这种三维子带小波编 码方法是直接从二维的图像子带小波编码方法扩展得到的,它主要是在二维图像的基 础上加入了时间轴这第三维方向,将图象序列看成三维信号。通过在水平、垂直及时 间方向分别进行小波变换,将原始图象序列分解到不同的时频子带中。由于小波变换 系数是相互独立的,这样就可以消除三个方向上的线性冗余,从而充分发掘时间轴方 向的帧间相关性,并且实现高度的能量集中。相比较于前一种混合编码器结构,三维 予带小波编码的优势在于较低的计算复杂度、非递归结构( 可以限制误差在一定的视 频块内,防止误差扩散) 以及多分辨率视频显示特性。实验研究也表明,这种方法相 对于前一种方法更为有效。因此,它也成为研究的一个热点。 总之,由于小波变换的多尺度分辨特性以及基于小波变换编码在图像处理中所表 现出的性能,它的前途不可限量。目前国际组织正在制定的h 2 6 l 标准就是针对小波 变换提出的视频编码标准;而m p e g 4 中的视频分级编码也是以小波子带分解作为 基础的。因此,在这方面的研究很有意义。 1 2本文内容 本文实现了一个基于小波变换零树编码的视频压缩编码系统。该系统包含了所有 基于小波变换零树编码的特点,包括:嵌入式编码码流、精确的码率控制和简单的实 现方法 本论文内容安排如下:第二章先简单介绍图像压缩编码的基本相关内容,然后比 较详细地介绍基本小波理论:第三章介绍本系统编码算法的基础算法,嵌入式零树小 波编码和分区等级树算法:第四章中则对编解码系统的组成、构造过程给出了详细介 绍;第五章中给出了整个编解码系统的实现过程及实验结果;最后对本文内容作了总 上海交通大学硕士学位丝皇 第一章绪论 结,并指出进一步的研究方向。 本论文的主要成果包括: 1 实现了一维的小波变换,并且可以用其构成任意维数的可分离小波变换。 2 实现了基本的三维小波编解码器系统,并且对其进行了改进,提高了性能。 3 所实现的小波编解码器为后续的研究工作提供了一个基本平台,简单扩展就可以 实现新的改进( 比如可以方便地将基于人眼视觉特性的量化方案加入变换过程) 。 上海交通大学硕士遂鱼途塞 第二章基本理论 第二章基本理论 要进行静止图象或视频活动图象序列的压缩编码,就必须对图象压缩的基本原理 有所了解。而要想利用小波变换,就必须对小波变换的基本原理有所了解。因此,本 章将分别对这两部分的基本原理加以介绍,作为后续讨论的基础。 本章中的第一小节主要介绍图象压缩编码的基本原理,涉及到基本图象压缩编码 系统、常用的压缩编码方法及图象质量评价标准等内容。第- - d , 节则主要介绍小波变 换的基本原理,主要讲述小波变换的三大理论框架理论、多分辨分析理论和滤波 器组理论。 2 1 图象压缩编码的基本原理 2 1 1 基本图象压缩编码系统 图象数据压缩之所以可以实现,主要是因为原始图象中存在很大的冗余度,这些 冗余度包括有空间冗余度、时间冗余度、符号冗余度和视觉冗余度。例如,一幅图象 内邻近像素点之间往往存在很大的相关性,这就是空间冗余度;电视图象前后帧之间 的也存在很大相关性,这就是时间相关性;人眼的视觉特性对高频信息不太敏感,因 此部分的高频信息对于人眼系统就构成了视觉冗余度。另外,许多应用领域通常允许 图象存有一定的失真,因此也就为高压缩比提供了有利的条件。 基本的图象压缩编码系统如g l ( 2 1 ) 所示。 璧攀r 丙五i 面忑石:可一对m 川l + b i t s t r e a m i m a g e l jl _ j le n c o d e rl 图2 - 1 基本的图像压缩编码系统【4 1 f i g 2 - ib a s i ci m a g e c o m p r e s s i o ns y s t e m 图( 2 1 ) 中,变换器实现对输入图象数据进行一对一的变换,其输出是比原始图象 数据更适合高效压缩的图象表示形式。典型的变换包线性预测,将像点亮度映射为预 测误差;酉变换,如d c t ,将图象的能量集中到少量系数上;多分辨率变换,如子 带分解等。 量化器产生用以表示被压缩图象的有限数量的符号,这是种不可逆的多对一的 映射,可以由标量量化器或矢量量化器实现。标量量化器对数据进行逐个的量化,而 上海交通大学硕士学位论文 第二章基本理论 矢量量化器则每次对个数据块同时进行量化。 符号编码器为量化器输出端的每个符号分配一个码字或二进制比特流,编码器可 以采用等长码或变长码。变长编码又称为熵编码,其码字的分配原则是使所有符号的 二进制表示的平均长度为最小。 不同的图象编码系统可能采用上述框图中的不同组合。 2 1 2 基本的图象编码方法 2 1 2 1预测编码 预测编码又称为差分脉冲编码调制( d p c m ) 。预测编码中,编码器对当前的样 本值和预测值之间的差值信号进行p c m 编码并传输;解码器将收到的码字解码并与 预测值相加,得到重建样本值。预测编码之所以能够达到压缩数据的目的,主要因为 预测信号的标准差要远小于原始图象数据的标准差。因此,对误差信号进行可变长编 码便可以达到压缩数据的目的。对单幅图象而言,对一样本值的预测根据前面若干个 像素值进行,称为帧内预测。对视频信号而言,待编码的是一个图象序列,预测时可 以利用前后帧之间在时间上的相关性进行,称为帧间预测。 2 1 2 2变换编码 变换编码通常是指将原始的图象数据分割为一定大小的子图象块,然后对每个子 图象块进行某种酉变换或者是正交变换,再对变换域系数进行量化及熵编码。 之所以要将图象映射到变换域后再进行编码,主要可以从两个方面加以考虑。首 先,常用的酉变换或正交变换,如d c t ,都是线性变换,而线性变换具有坐标旋转 的作用,这可以用于去除或减小图象在空间域中的相关性,相关性的去除或减小将导 致图象在变换中的能量分布更为集中,更有利于对系数的量化和熵编码,从而保证在 一定图象质量的条件下使压缩比得到提高。其次,常用的d c t 等正交变换,其变换 域通常就是某种频率域,因此在变换域中可以方便地按照图象的频率特性或人类视觉 系统( h v s ) 特性对系数进行量化。例如,通常的图象在频率域中表现出低通特性, 而人眼的视觉频率响应特性也是低通的,于是在确定变换系数的量化方案时,就可以 对较低的频率分量采用较小的量化步长,而对较高的频率分量采用较大的量化步长, 这样引起的平均量化误差不会太大,并且由于量化误差主要集中于高频部分,大部分 是不可见的。 变换编码是目前已有的多种国际图象压缩编码标准中普遍采用的一种编码方法, 例如国际静止图象压缩编码标准j p e g ,国际活动图象压缩编码标准m p e g ,国际会 议电视图象压缩标准h 2 6 1 和极低比特率活动图象压缩编码标准h 2 6 3 ,以及已知的 6 各国高清晰度电视的图象编码方案,都以变换编码作为其中的主要技术。 在变换编码中,由于编码是在图象方块的基础上进行的,这导致变换编码的一个 固有缺点方块效应。方块效应指的是,当压缩比提高到一定程度后,在相邻图象 块的边界处,会出现可见的不连续性,这会给观察者以非常不舒服的感觉。因此,方 块效应是变换编码面临的最大问题。 2 1 2 3熵编码 熵编码,又称无失真编码。目前主要有三种典型的熵编码方法:h u f f m a n 编码、 算术编码和游程编码。前两者利用了信源概率分布的不均匀性,后一个则利用信源自 身的相关性。 h u f f m a n 编码属于变长编码。它对出现概率大的符号用较短的码字进行表示,而 对于出现概率小的符号则分配给较长的码字。如果码字长度严格按照符号概率的大小 以相反顺序排列,则平均码字长度一定小于任何其它符号顺序排列方式得到的码字长 度。 算术编码由r i s s a n e n 提出,其方法是将被编码的信息表示成实数0 和1 之间的 个间隔,信息越长,编码表示它的间隔就越小,表示这一间隔所需要的二进制位就 越多。算术编码的优点是,其自适应模式可以不必预先定义概率模型,从而适用于无 法进行概率统计的场合。 游程编码是一种相对简单的编码方法,它通过统计相同符号段长度( 称为一个游 程) ,结合该符号值来表征该符号段。这一方法充分利用了符号自身的相关性来达到 数据压缩的目的。在后面的讨论中将会看到,如果能够根据量化结果或着是系数分布 特点定义出一种游程扫描顺序,可以加大游程长度,那么也就会相应地提高压缩比。 2 1 3 图象的质量评价 对图象质量的评价是评价图象处理、编码和传输等的方法和技术及应用系统性能 好坏的重要依据之一。通常,图象质量的评价方法,可以分为主观方法与客观方法。 所谓主观方法,就是由观察者根据一些事先规定的评价尺度或自己的经验,对测试图 象按照视觉效果给出质量分数。应该说,与后面所要说的客观方法比较,主观方法是 最可靠的,这是因为图象最终的接受者通常是人的视觉,而不是别的。当然,这种评 价方法对参与评价的观察者的要求是很高的。 所谓客观方法,就是定义一个数学公式,然后对待评价的图象进行运算,得到一 个唯一的数字量作为测量结果,这种方法最常用于对图象的相似性的评价。最常用的 客观方法计算公式包括均方误差( m s e ) 和峰值信噪比( p s n r ) 。它们都是用重建图 象偏离原始图象的误差来衡量恢复图象的质量。m s e 的表达式为: m s e = 志善善( f i j - 咿 2 m 其中,f 1 j l j 分别表示原始图象和重建图象,m 、n 分别表示图象的高与宽a p s n r 本质上与m s e 是相同的,其表达式为: p s n r = l o l 。g l 。面2 5 5 。2 5 5 ( 2 2 ) 由于客观方法应用比较简单,所以本文后面都将采用客观方法对图像质量加以评 价。 2 2 小波变换基本原理 2 2 1 小波变换的背景及物理意义 传统的非平稳过程的线性时频分析,主要包括短时f o u r i e r 变换和g a b o r 变换。 短时f o u r i e r 变换以固定的滑动窗口对信号进行分析,从而可以表征信号的局域频率 特性。而时域的滑动窗口处理( 即卷积运算) 等效于频域以滤波器组将信号分段滤波, 各个滤波器的频率特性形状相同( 由窗函数确定) ,只是各中心频率沿分析的频带等 间隔分布。也就是说,短时f o u r i e r 变换是以等宽的滤波器组对非平稳信号进行分析, 并从各路滤波器输出的时间变化得知不同时间的频率分量的分布情况。 很明显,这种时域等宽的分析方法并不是对所有信号都合适的。法国地球物理学 家m o r l e t 于8 0 年代初在分析人工地震勘探信号时发现这类信号有一个明显的特点, 即在信号的低频端应该具有很高的频率分辨率,而在高频端的频率分辨率可以较低。 从时频不确定性原理的角度看,这类信号的高频分量应具有高的时间分辨率,而低频 分量的时间分辨率可以较低。根据人工地震勘探信号的这一特点,m o r l e t 提出了小波 变换。小波变换在时频平面不同位置具有不同的分辨率,是一种多分辨( 率) 分析方 法。小波分析的目的是“既要看到森林( 信号的概貌) ,又要看到树木( 信号的细节) ”, 因此,它也被称为数学显微镜【6 j 。 实际上,不仅是人工地震勘探信号,许多自然信号( 如语音、图象等) 也都具有 类似的特性。因此,小波变换很快成为研究信号分析与处理的一大热点。通过十余年 的发展,小波变换现已广泛用于信号处理、计算机视觉、图象处理、语音分析与合成 等诸多领域,在分形和混沌理论里也有很多应用。 从物理概念讲,小波就是“- - , j , 段波”。为此,无论在何种情况和场合,都要求 它满足下面的“容许条件”: 8 上海交通大学硕士芝垡缝文 第二章基本理论 e w ( t ) d t = o ( 2 - 3 ) 这一约束将使v ( t ) 的图形符合“一小段波”的特征。 鉴于v ( t ) 本身波形就是小波,它生成的函数系v 。( t ) = 岳v 三l 的波形也属于小 i a il4 波,所以通常将v ( t ) 称为基( 本) 小波或者是母小波,而将v 。( t ) 统称为小波。其中 包括了两个参数:尺度参数a 和平移参数b 。不难看出,如果尺度参数a l ,则相当 于将窗函数拉伸,使窗口的时宽增大,同时在频域中,将窗函数的频率特性压缩,频 率带宽变小。而当a 0 。 性质4 ( 自相似性) :对应于不同尺度参数a 和不同平移参数b 的连续小波变换 之间是自相似的。 性质5 ( 冗余性) :连续小波变换中存在信息表述的冗余度。 象任何一种线性变换用作信号重构时都应满足完全重构的要求一样,对小波变换 也要求能够使任何一个函数f l 2 ( r ) 从其小波变换w t f ( a ,b ) q b 完全恢复或重构。 经过推导同,可以得到,当l l ,( t ) 满足下面的约束条件时 卟哗 可以实现信号的完全重构,有 ( 2 6 ) 协c 1 1 h ( t ) 帆( a , b ) d b 。l ( 2 7 ) 式中:审( ( 0 ) 是、| ,( t ) 的f o u r i e r 变换。因此,式( 2 6 ) 也被称为完全重构条件。 2 2 2 2 连续小波变换的离散化 在使用小波变换重构信号的应用中,常采用离散化处理。需要特别指出的一点是, 这里所谓的离散化处理是对尺度参数a 和平移参数b 进行离散化处理,而不是针对时 间参数t 的,这与传统概念上的离散化有所区别。 通常,对尺度参数a 和平移参数b 所作的离散化处理为a = 耐和b = k a o j b o 。这样, 对应的离散化小波、| ,( t ) 就可以写作 、i ,j , k ( t ) = a - j “v ( a t k b o ) ( 2 - 8 ) 而离散化小波变换系数可表示为 c j , k = f ( t ) 、i ,撕) d t = ( f ,、l ,拈) ( 2 9 ) 将以上两式代入到式( 2 - 7 ) ,立即得到实际数值计算时候使用的重构公式: f ( t ) = c c j , k 、l ,仙( t ) ( 2 1 0 ) j = k - 。 式中:c 是一个与信号无关的常数。 在实际应用中,用得最多的离散化小波变换就是二进小波,就是通过将离散化参 数取作a o = 2 和b 。= 1 所得到的离散化小波 v ik ( t ) = 2 1 ”v ( 2 1 t k ) ,j ,k z ( 2 1 1 ) 2 2 3 框架理论 对于有限大的正常数a 和b ,如果有 州骆妻妻阳仆2 - b l l f l l :( 2 - 1 2 ) j k = 那么该基函数v 称为小波框架 、i j i 。) 的生成元。其中,a 和b 分别称为框架的下边界和 上边界 6 1 。 特别地,如果b a 一- - 1 ,则称 批k ) 为紧凑小波框架( s n u g w a v e l e t f r a m e ) ;当b a = i , 即a = b 时,则称其为紧致小波框架( t i g h tw a v e l e tf l a m e ) 。 又由于小波框架f 、l ,) 与小波系数c j 。之间存在有式( 2 9 ) 所示的关系,所以容 上海交通大学硕士堂鱼堡塞 第二章基本理论 易得到只有在小波v 对应的小波系数c j k 满足下式( 2 1 3 ) 所示的条件时,, b n n v j 。) 才是一框架。 训睁妻艺川2 - c b l l f l l : ( 2 1 3 ) d a u b e c h i e s 业已证明i ”,框架边界受下列的不等式约束: a 矗蠹1 y i 1 i q ( y ) 2 d y b ( 2 - 上述的不等式对任何小波框架 v j 。) 均成立。而又可以注意到的一点就是,只有 在满足前面所提到过的完全重构条件的基础上,小波族才可以构成一框架。否则,必 然导致上边界b 发散,从而不能够构成框架。至此,已经从信号重构与框架理论两个 角度得到了小波的完全重构条件。 需要特别指出的一点,小波框架一般是冗余的。换言之,由框架理论产生的小波 一般是非正交小波。 2 2 4 多分辨分析理论 从前面已经看到,小波框架是冗余的。的确,在很多应用中这种冗余是有用的, 但是在更多的应用中,却希望其冗余度越低越好。特别在极端情况下,小波族最好能 够是一个正交基。为了解决构造频率高度局域化的正交小波基的问题,就提出了小波 的多分辨分析理论,从而提供了解决这一问题的最有效的方法。 令m ( t ) 是一个平方可积分的连续函数,并且 十 k ( t ) = 2 - j 2 十( 2 - j t k ) ( 2 1 5 ) 是由十( t ) 生成的二维离散序列。另一方面,令参考子空间v 。由十l 2 ( r ) 生成: v o = c l o s e d p o k :k z j ( 2 - 1 6 a ) 并且其它所有的子空间v 。也由+ 生成: v j = c l o s e d p 土k :k z j z ( j 0 ) ( 2 - 1 6 b ) 它表示v i 是十( 2 0 t ) j l 匝过平移形成的所有子空间的闭集,即v j 代表与分辨率2 0 对应的 多分辨分析子空间。 从多分辨分析的物理意义出发,子空间列 v :j z ) 至少应该具有以下的性质: 单调性:由于较低的分辨率与较粗的信号内容对应( 从而对应更大的子空间) , 较高的分辨率与较细的信号内容对应( 从而对应更小的子空间) ,并且由于分辨率2 0 比2 0 1 高,所以v ,子空间应该被v i _ l 所包容,即有v j v j - 1 ,对任意的j z 。 逼近性:所有多分辨分析子空间的并集应该代表平方可积分函数f ( t ) 的整个空间, 即l 2 ( r ) 空间。而且,根据单调性,所有子空间的交集应该是零空间。 伸缩性:由于小波的尺度加大意味着小波被展宽,其时间分辨率减小,所以要求 子空间v 。也具有类似的伸缩性,即十( t ) v j 2 ”( 3 - 1 3 ) 。 【0 , o t h e r w i s e 式( 3 1 3 ) 用来表示一个集合对于n 的重要性。为了简化记号如果该集合只包 括一个点c ( i ,j ) ,那么就简记为s 。( i ,j ) 。 通常,图像的绝大部分能量都可以集中到低频部分。而且,观察发现,在不同子 带之间系数存在有空间自相似性。所以,如果沿着相同的空间方向进行幅值排序的话, 可能能够得到比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论