(计算机应用技术专业论文)分层矢量量化dct图象压缩算法设计与实现.pdf_第1页
(计算机应用技术专业论文)分层矢量量化dct图象压缩算法设计与实现.pdf_第2页
(计算机应用技术专业论文)分层矢量量化dct图象压缩算法设计与实现.pdf_第3页
(计算机应用技术专业论文)分层矢量量化dct图象压缩算法设计与实现.pdf_第4页
(计算机应用技术专业论文)分层矢量量化dct图象压缩算法设计与实现.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(计算机应用技术专业论文)分层矢量量化dct图象压缩算法设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

p uj 1 1 人学埘! i 学位论义 分层矢量量化d c t 图像压缩算法设计与实现 计算机应用技术专业 研究生吴桂军指导教师张建州 通讯与信息技术的发展突飞猛进,数字信息呈爆炸式增长。在这个过程中, 数据压缩技术在人们的工作与科研中扮演着必不可少的重要角色。在众多数据 压缩技术中,矢量量化技术( ) 作为数据压缩领域的一个重要分支,以它压缩 比高、编码速度快、算法简单清晰等良好的特性,在语音和图像压缩等领域已 成为有力的手段和方法。而在图像压缩方面,分层矢量量化方法( h v q ) 又有非常 好的应用前景。本文对分层矢量量化方法在图像编码中的应用进行了研究和探 索。全文的主要工作如下: 系统综述了数字图像压缩编码的目的、分类和理论以及目前的研究现状。简 要地介绍了一维和二维f d c t 变换技术原理。较为详细地介绍了目阿的种成熟 的图像压缩标准j p e g 标准,包括;目标、三个层次、四种工作模式、基本 系统的构成以及效果评价方式。 介绍了矢量量化技术的基本原理、矢量量化过程,较为详细的描述了矢量量 化的三个关键技术码书的生成、码字搜索和索引分配对一些基本技术做 了简单回顾。对本文所采用的分层矢量量化技术及其基本量化器的设计过程做 了详细的描述。 研究了分层矢量量化技术在j p e g 中应用的设计与实现。提出了一种新的分 层矢量量化方法和一种新的f d c t 变换方式,对基本i p e g 系统做了改进。把) - p e g 基本系统中的映射变换改进为分层矢量量化方法和分层f d c t 的结合。在分层矢 量量化中,根据图像象素具有相关性这一原理,应用了一种新的动态生成精简 码书的方法,和自适应的码字搜索算法:莳者采用了基于矢量的分割和分段插 值技术,后者在评判标准上采用了峰值信噪比p s n r 和均方差m s e 等客观标准。 详细介绍了精简码书的生成过程和相应码字搜索的原理。研究了f d c t 的优化算 四川大学硕士学位论文 法,把传统的f d c t 变换改进为分层低维度f d c t 变换的组合。对整个改进的部 分合理地安排了流程和优化了算法。改进的系统在压缩率和减少运算量方面都 有一定的提高。对实现的改进系统与标准j p e g 系统做了实验对比。分别对标准 l e n a 图像和典型图像以及批量图像做了分组实验。实验数据表明,在保证重构 图像质量与传统j p e g 系统一致的前提下,压缩率和运算速度都有明显的提高, 同时也具有一定的应用兼容性。 本文所实现的分层矢量量化图像压缩编码系统,虽然在图像压缩方面有了一 定的提高,但还是有许多问题需要进一步研究。本文最后指出了进一步研究的 一些方向,展望了矢量量化技术将来的发展。 关键词:数据压缩图像编码分层矢量量化f d c tj p e g 峰值信噪比均 方差 四川大学硕士学位论文 d e s i g na n di m p l e m e n t o f i m a g ec o m p r e s s i o n a l g o r i t h m b a s e do nd c t u s i n gh i e r a r c h i c a l v e c t o r q u a n t i z a t i o n m a i o r :c o m p u t e ra p p l i c a t i o n g r a d u a t e :w ug u i j u n a d v i s o r :z h a n gj i a n g z h o u w i t ht h e g r e a td e v e l o p m e n to fm o d e ms c i e n c e a n dt e c h n o l o g i e s ,d a t a c o m p r e s s i o nm e t h o d sh a v eb e e nw i d e l ya p p l i e di nv a r i o u sf i e l d si n c l u d i n gs c i e n t i f i c r e s e a r c h ,d a i l yl i f ea n de n t e r t a i n m e n t a sam a i nb r a n c ho f d a t ac o m p r e s s i o n ,v e c t o r q u a n t i z a t i o n ( v q ) i sr e g a r d e d 弱o n eo f t h e e f f e c t i v ea n de f f i c i e n tm e t h o d sa d o p t e di n t h e o r e t i c a la n a l y s i sa n da p p l i c a f i o n s a l li t sa c h i e v e m e n t sc a nb ea s c r i b e dt ot h et h r e e o u t s t a n d i n gf e a t u r e s ,w h i c ha l et h eh i e ) e n c o d i n gs p e e d ,t h eh i g hc o m p r e s s i o nr a t e , a n dt h es t r a i g h t f o r w a r de x p r e s s i o nf r a m e w o r k i ni m a g ef i e l d ,t h em e t h o do f h i e r a r c h i c a lv e c t o rq u a n t i z a t i o n ( h v q ) e s p e c i a l l yk e e p si t s e l fi nt h ef o r e g r o u n d i n t h i s d i s s e r t a t i o n ,s e v e r a lk e yp r o b l e m so fh v qu s e di ni m a g ec o m p r e s s i o na r e d i s c u s s e d a tt h ev e r yb e g i n n i n g ,w es y s t e m a t i c a l l ys u m m a r i z et h eg o a l s ,c a t e g o r i z e s , t h e o r yo fi m a g ec o m p r e s s i o nc o d i n g 懿w e l la si t sc u r r e n td e v e l o p m e n t b r i e f l y d e s c r i b e dt h ep r i n c i p l eo fo n ed i m e n s i o na n d t w od i m e n s i o n sf d c t aw e l la p p l i e d i m a g ec o m p r e s s i o ns t a n d a r d - - j p e gi si n t r o d u c e di nd e t a i l ,i n c l u d i n gi t sg o a l s ,t h r e e l e v e l s ,f o u rw o r kp a t t e r n s ,b a s i cs t r u c t u r ea n de f f e c te v a l u a t em e t h o d s w ei n 仃o d u c e dt h eb a s i cp r i n c i p l e sa n dq u a n t i z a t i o np r o c e s s e so fv q v e c t o r q u a n t i z a t i o nc a nb ed i v i d e di n t ot h r e em a i np a r t s :c o d e b o o kd e s i g n ,c o d e w o r ds e a r c h 四川大学硕士学位论文 a n dc o d e b o o ki n d e xa s s i g n m e n t t h ed e s c r i p t i o n so ft h r e ep a r t sa r eg i v e n t h e t e c h n o l o g y o fh v qa d o p t e db yt h i sd i s s e r t a t i o na n dt h ed e s i g np r o c e s so fi t s q u a n t i z e ra r ed e s c r i b e dd e t a i l e d l y t h ed e s i g na n di m p l e m e n to f h v qu s e di nj p e gi st a k e ni n t of u l lc o n s i d e r a t i o n w e p u tf o r w a r dan e wm e t h o do f b o t hh v qa n df d c t , a n di m p r o v e dt h eo r i g i n a l j p e gs y s t e m t h ep a r to fm a p p i n gi no r i g i n a lj p e gh a sb e e nm o d i f i e da sa c o m b i n a t i o no fh v qa n dh i e r a r c h i c a lf d c t an e wm e t h o do fd y n a m i cp r o d u c i n g s i m p l ec o d e b o o ka n daa d a p t i v ea l g o r i t h mo fc o d e w o r d s e a r c ha r ea p p l i e da c c o r d i n g t h a tp i x e l sh a v er e l a t i v i t yb e t w e e ne a c ho t h e r t h ef o r m e rb a s e do nt h et e c h n o l o g yo f v e c t o rs e g m e n t a t i o na n di n t e r p o l a t i o n ,t h el a t t e rt a k ep s n ra n dm s e a se v a l u a t i n g i n d i c a t o r t h em o d i f i e dp a r th a ss c i e n t i f i cp r o c e s sa n do p t i m i z e da l g o r i t h m t h e c o m p r e s s i o n r a t ea n dt h ec o m p u t a t i o nl e s s e no f n e ws y s t e ma r ei m p r o v e do b v i o u s l y t h ee x p e r i m e n t so fc o m p a r i n gm o d i f i e ds y s t e ma n ds t a n d a r dj p e gs y s t e mh a v e c o n d u c t e d as t a n d a r dl e n ap i c t u r e ,at y p i c a lp i c t u r ea n dab a t c ho fn o r m a lp i c t u r e s a l ei n v o l v e d t h ed a t ao fe x p e r i m e n t si n d i c a t e dt h a tt h ec o m p r e s s i o nr a t ea n dt h e s p e e do fc o m p u t a t i o na r ee n h a n c e di nt h ec o n d i t i o no fk e e p i n gt h e r e c o n s t r u c t i m a g e sq u a l i t y a st h eo r i g i n a l f u r t h e r m o r e ,t h em o d i f i e ds y s t e mh a sa g o o d c o m p a t i b i l i t y h v q i sn o wah o tr e s e a r c hf i e l d ,a l t h o u g hh a saq u i e tp r o g r e s s ,b u ta saw h o l e i t sd e v e l o p m e n ti sn o tm a t u r e t h e r ea r em a n yp r o b l e m sb en e e d e dm o r ec o n t r i b u t i o n a sac o n c l u s i o no ft h i sd i s s e r t a t i o n ,w ea p p o i n tt h en e x tr e s e a r c hw o r ki nt h i sf i e l d a n dv i e wt h ef u t u r ed e v e l o p m e n td i r e c t i o no f h v qi m a g ec o m p r e s s i o n k e y w o r d s :d a t ac o m p r e s s i o n , i m a g ec o d i n g , h i e r a r c h i c a lv e c t o rq u a n t i z a t i o n , f d c t , j p e gp s n r , m s e i 、l 四川大学硕士学位论文 1 引言 随着计算机技术和通信技术的发展,世界已经进入了信息的数字化时代。 信息的数字化时代是指通常的数值、文字、语言、声音、图形、动画、电视、 视频图像等多媒体信息都转换成数字形式存储在计算机中或在计算机网络中传 输”。由于人对视觉的依赖性较强,因此在数字化的信息中数字图像信息占了 绝大部分,因此数字图像信息的传输和存储在目前的数字化潮流中就具有了很 重要的意义。 1 1 数字图像压缩编码 1 1 1 图像压缩的目的 数字化大潮中,数字图像传输的应用日趋广泛。数字图像通信有数字通信的 一系列优点,如:可以中继传输和多次复制,不会造成噪声和非线性失真的累 积:便于进行加密;便于用v l s i 芯片实现,制作方便、成本低、可靠性高:便 于和计算机联网等。但是在大规模的推广应用上却存在一定的障碍。这主要是 因为数字图像的数据量非常巨大,若不经压缩,数字图像传输所需的高传输率 和数字图像存贮所需的巨大容量将会让推广应用数字图像通信付出惊人的成 本。以指纹库为例 2 1 ,若以( 5 1 2 x 5 1 2 ) x 8 b i t 的灰度图像来存贮一个手指的 指纹,一个4 0 万人的指纹库,每人十指,则共需1 0 0 0 g b 的存贮量。尽管随着 技术的发展存储器件和信道的容量在逐渐增加,成本在逐渐降低,对存储容量 和传输容量的压力有所缓解,但是真正使制约因素不再成为瓶颈的还是图像压 缩编码技术的应用。图像压缩编码技术推动了各类图像通信系统的推广应用。 它是各类图像信息传输、存贮产品的一项核心技术。 图像数据可以进行压缩有几方面的原因。首先,原始图像数据是高度相关的, 存在很大的冗余度。数据冗余造成比特数浪费,消除这些冗余可以节约码字, 也就达到了压缩的目的。大多数图像内相邻象素之间有较大的相关性,这称为 空间冗余度。序列图像前后帧之间有较大的相关性,这称为时间冗余度。多光 四川大学硕士学位论文 谱遥感图像各谱间有相关性,这称为频率域冗余度。其次,若用相同码长表示 不同出现频率的符号也会造成比特数的浪费,这种浪费称为符号冗余度。如果 采用可变长编码技术,对出现概率较高的符号用短码字表示,对出现概率低的 符号用长码字就可以消除符号冗余度,从而节约码字。 允许图像编码有一定的失真也是图像可以压缩的一个重要原因。在许多应用 场合,并不要求经压缩及复原以后的图像和原图完全相同,而允许有少量失真。 只要这些失真并不被人所察觉,在许多情况下是完全可以接受的。这就给压缩 比的提高提供了十分有利的条件。例如,人眼不能觉察亮度的细小变化。即存 在视觉阈值,而且此阈值随着图像内容的变化而变化。在平坦区,阈值低,对 失真敏感。在边缘和纹理区,对失真不敏感,这就是视觉掩盖效应。这种特性 被广泛用来提高压缩比。 此外,还可以利用先验知识实现图像编码。在某些特定的应用场合,编码对 象的某些特性可预先知道。例如,在可视电话中,编码对象为人的头肩像。这 时,可以利用对编码对象的先验知识为编码对象建立模型。通过提取模型参数, 对参数进行编码而不对图像直接进行编码,可以达到非常高的压缩比。这里利 用了知识冗余度。 信息论的观点认为信源总是或多或少的含有这些自然冗余,这些冗余既来自 信源本身的相关性,又来自信源概率分布的不均匀性。图像作为信源,冗余大 部分来自图像数据自身,小部分来自外界环境和主观因素。对于这些冗余,根 据它对图像生成的影响程度来分,信息熵冗余和图像区域的相同性冗余是造成 图像信息量大于其要表达的信息量的主要原因。 图像压缩编码是在对数字图像进行大量统计分析,掌握和了解图像信息和统 计特性的基础上,充分利用图像本身的相关性强的特点,寻求消除或减少相关 性或改变图像信源概率分布不均匀性的方法,实现数据的压缩。换句话说就是 以尽量少的比特数表征图像,同时保持复原图像的质量,使它符合预定应用场 合的要求。压缩数据量,提高比特有效性是图像压缩编码的首要目的。图像编 码是一种信源编码,其信源是各种类型的图像信息。 信息论发展中期,剀斯特( k s e r s e r n ) 通过实验方法,来估计自然图像的熵 和冗余。他使用了8 幅不同的图像,每幅图像都是1 2 8 x1 2 8 个象素,每个象素 为4 b i t ( 即1 6 级灰度) 。通过不断添加图像的重要信息部分,记录图像的失真 四川大学硕士学位论文 程度,得出: 冗余度= l - q - 笔铲 r l 为编码效率:q 2 睾等,其中h ( x ) 为原始图像的熵;r o ) 为实际编码的 平均码长。 熵就是每个符号的平均信息量。独立信源又叫无记忆信源,其特点是某个位 置出现某符号的概率与其它位置上出现的符号概率无关。设信源的符号表为 一,x 2 ,x 。) ,各符号出现的概率为f p ( x 。) ,p ( x ,) ,p ( x 。) ) ,则此独 立信源的熵为 日( x ) = 一p ( x ,) l o g p ( x ,) 对图像压缩编码的研究属于信息论中信源编码范畴,其主要宗旨是利用图像 信号的统计特性及人类视觉的生理及心理学特性对图像信号进行高效编码,并 研究数据压缩技术,以解决数据量大的问题。一般来说,图像压缩编码的目的 为: 1 、减少数据存储量。 2 、降低数据率以减少传输带宽。 3 、压缩信息量,便于特征抽取,为识别做准备。 1 1 2 图像压缩编码的分类 图像编码应用广泛,有许多编码方法。基于不同的角度,有许多分类方法。 如:按待压缩图像的性质分类,按复原图像是否与原图一致分类,按所采用方 法原理分类等等。 1 按复原图像是否与原图一致分类 可将编码方法分两大类:无失真编码和限失真编码。无失真编码又称无损编 码( 1 0 s s l e s s 编码) 或可逆编码。限失真编码又称有损编码( l o s s y 编码) 或 四川大学硕士学位论文 不可逆编码。编码会造成失真,不过这些失真可以被控制在一定的限度内,不 致影响使用效果。在无损编码中不可使用量化,因为总会带来不可恢复的失真。 无失真编码的压缩比低,可达到的最高压缩比取决于信源熵。在限失真压缩中 允许的失真愈大,可达到的压缩比愈高,即与量化的粗细有很大关系。在限失 真编码中允许把失真控制在视觉阈值以下或控制在可容忍的程度是有效地提高 压缩比的关键。 2 按待压缩图像的不同属性分类 有不同的分类方法。如:以图像光学特征分,有单色、彩色、多光谱的压缩 编码;以灰度等级分,有二值图、多值图与灰度图像编码;若以动静来分,有 静止图像与序列图像编码。在静止图像编码中,只能进行帧内编码,而且人眼 对静止图像的失真较运动图像更为敏感,压缩比没有运动编码高。在诸如视频 监控之类的应用系统中,序列运动图像编码对实时性的要求很高,实现难度较 大。因此,对不同要求( 无失真、小失真、较大失真) ,不同性质的图像用适当 的编码方法和编码参数( 如量化级大小) 进行压缩编码是达到预期目标的关键。 3 按所用方法的原理分类 可将图像编码方法分为基于图像统计特性,基于人眼视觉特性,基于图特征 提取等方法。在实际编码中,常常要同时用到图像的统计特性和人眼的视觉特 性才能进行有效的编码。而有些编码方法的类别还可以进一步细分,如基于统 计特性的编码方法还可分为帧内预测、帧间预测、变换编码等。许多新的国际 图像编码标准使用了混合编码方法,即同时用到了帧内、帧间预测和d c t 编码。 以映射变换的性质为依据进行分类,也可直接把图像编码方法分为四大类: 波形编码、变换编码、模型编码和拟合编码。属于拟合编码的方法有:方块截 尾编码( b t c ) ,三角形逼近法和迭代函数系统法( i f s ) 等。 4 从m d l 的观点看图像编码方法的分类 最短描述长度准则( m d l ) 是r a s s a n e n 于1 9 7 8 年提出的,它可用于寻找数 据的内在相关性,其中包括图像数据的相关性。若用z 表示原始图像数据,用村 表示模型,此模型反映了j 的内在规律性。可以把图像编码过程看成用模型 i 对原始图像数据j 的描述。若把原始数据的直接描述( 即不用模型) 记作口( 舯, 其长度记作i d ( 肋i 。用了模型后,对j 的描述可记作d ( z 肋,其长度为i d ( z 肋l 。若ld ( 以肋l i 口( 肋i ,则我们说用模型对图像j 进行了 四川大学硕士学位论文 压缩编码。我们有: 口( 卫肋= 口( + d ( 州肋( 卜1 ) l 口( 仍| + l d ( x l 肋l = 口( z 肋 i 口( 舯l( 卜2 ) 式( 卜2 ) 的含义是对j 的描述( 编码) 可转化为对模型的描述口( 肋及利 用模型对原数据的描述d ( 卅肋。在使用参数模型的情况下,d ( 肋就是对模型 参数0 的编码。d ( 卅胁就是对原始数据j 与模型崩的误差删,的编码。可以 用m d l 观点将图1 1 改成图1 2 的形式。把映射变换看成建模表达。不论实际 的映射变换是什么,是预测也好,变换也好还是真的对景物建立模型,在这里 均把它看成一个广义模型来表示图像。图中画出采用参数模型的情况。即映射 后数据由模型参数0 和模型对原图的描述误差肝彤两部分构成。对于模型编码, 图1 2 的表达方式是最直观的。此图同样也适于其它编码方法。例如对帧内预 测编码,模型参数就是预测系数,由于它己事先设定,不必对它进行编码传输, 故l 刀( 肋l = o ,而只需对描述误差川,进行量化编码。在帧间预测编码时,模 型参数就是运动矢量,若运动估计得较准确,则d ( 州肋可以较小,但总的码 流长度中包括了运动矢量码的长度 口( 肋l 。 图1 2 从m d l 观点看图像编码的三个步骤 下面总结了用m d l 准则对几种典型的图像编码算法的分类情况。 表1 1 用m d l 准则对图像编码算法的分类 编码方法类别模型类型模型参数 帧内预测预测图像本身( 空问邻域)预测系数 帧间预测预测前帧图像运动矢量 变换编码变换基图像变换系数 方块截尾编码拟合分段常数分段定义及各段灰度值 三角形副近编码拟合三角形面片顶点坐标 分形编码拟合图像本身i f s 代码 模型编码模型景物几何模型几何量和亮度、色度 四川大学硕士学位论文 1 1 3 图像压缩编码的原理 图像编码的过程可以概括为图1 1 所示的三个步骤3 1 ,原始图像经映射变换 后的数据再经量化器和熵编码器成为码流输出。 景器匦堕骘匹叵尸型砸受丑 6 贺鲁咂堕m 蔫薅( 亘团 譬籍回皂。 i 信道i 现对编码框图作下列说明: 1 映射变换 其目的是通过映射变换改变图像数据的特性,使之有利于压缩编码。简单的 方法可以是以左邻象素灰度值作为当前象素灰度值的预测值,以预测差作为映 射后的数据,并对其进行量化编码。由这种方法改进可以有由图像空间相邻四 象素点来预测当前象素值( 帧内d p c m ) ,或用前一帧的象素值预测当前值( 帧问 d p c m ) ,可望得到更好的预测值,从而进一步提高压缩比。在实际应用中,映射 变换的方法种类繁多,有的还可能理论复杂。如:在交换编码中,先将图像分 成若干个n r l 大小的子块,然后进行映射变换。在这种情况下的映射变换是对 各予块进行某种正交变换。而量化和编码是对变换后所得系数进行的。事实上, 映射变换是图像编码的个核心部分,它决定了量化和编码的对象类型。所以 可以据此对编码方法进行分类。帧内d p c m 和帧间d p c m 都属于波形编码,因为 是直接在空间域中对图像灰度值或其简单运算后的结果进行量化编码的。而变 换编码则是对经映射后得到的变换域中的数据进行量化编码的。在模型编码中, 量化编码的对象是模型参数,它的映射变换实际上是一个复杂的建模和模型参 数估值的过程,它把原始图像映射成数据量极小的模型参数,从而实现了极高 的压缩比。一个好的映射变换通过与合适的量化器相配合,应能充分消除图像 信源的各种冗余。 四川大学硕士学位论文 2 量化器 在限失真编码中要对映射后的数据进行量化。若量化是对映射后的数据逐个 地进行的,则称标量量化。若量化是成组地进行的,则称矢量量化。量化总会 造成某些信息的丢失,形成失真,即量化失真或量化噪声。为使失真小,就量 化精细,但压缩比就很难提高。这是一对矛盾。应选用恰当的量化级数和量化 曲线形状来缓解这对矛盾。量化器的引入是图像编码产生失真的根源。在要求 复原图像与原图完全一致的无失真编码器中必须不用量化器,但这样一来,压 缩比难以提高。在多数应用中,只要把失真的程度和性质控制在允许范围内, 存在少量失真并不可怕。也就是把复原图像的主观质量控制在允许的程度内, 就可以在满足要求的前提下提高压缩比。 3 熵编码器 这一步是用来消除符号编码冗余。它般不产生失真。理想的情况是使编出 的码流的平均码长等于量化后数据的信息熵。常用的编码方法有许多种,例如 分组码:行程码( r l c ) 和变长码( v l c ) :不分组码:算术码( a r i t h m a t i cc o d i n g ) 行程码传输的是数据行程长度而不是数据本身。变长码中最常用的是霍夫曼 ( h u f f m a n ) 码。基本原则是对出现概率大的数值用短码来编,对出现概率小的 数值用长码来编,从而使平均码长减小,降低码率。在实际编码器中常把r l c 和h u f f m a n 码结合起来,称为霍夫曼行程码。在h 2 6 1 ,j p e g ,m p e g 等国际标准 中就用到它。而算术编码则用于j p e g ,h 2 6 3 ,j b i g 等国际标准中。 上述三个步骤之间是相互制约的。对有些编码方法,如预测编码或变换编码, 映射后变换数据量并没有减少,甚至因动态范围的加大而使数据量略有增加。 但它为后两步作了准备,使它们能有效发挥作用。而在模型编码中,经映射变 换后得到的模型参数,其数据量已大大小于原始图像,即第一步已实现了很大 的压缩。后面的量化编码则是作进一步的压缩。其情况和波形编码、变换编码 有很大的不同。我们可以这样看各部分之间的相互影响:如果第二步使用了不 均匀量化器,它可使每层量化值的出现概率接近相等,那么后面再用变长码, 这第三步的压缩效果就会大打折扣。或者反过来说,若后面用了变长码,前面 的量化器可以不妨采用线性量化器,总的效果仍然很好,量化器实现起来也要 方便得多。 此外,如果码流在信道中传输产生误码,就会造成复原图像质量下降。有时 四川大学硕士学位论文 一个比特的误码会造成一大片复原图像的错误,这种现象称误码扩散现象。如 果编码端对左邻象素的差值进行量化编码,则在解码端,若因误码造成了某个 象素复原值有误码,则从该象素起,以后复原的右面所有象素都有误,按信息 论的观点,压缩得越多、冗余度越小的码流越难抵抗误码的影响。在实用的图 像算法中必须对误码扩散提出有效制约对策。值得注意的是,误码可能导致流 结构的变化,从而不能正确解码。一个好的熵编码器应该有自同步能力,能够 在受到误码影响后经过一定的码以后仍能自动回到正确解码路径上来,而不会 一直错下去。 1 1 4 图像压缩编码理论研究的现状 目前已成熟的压缩算法所达到的有效压缩比约为2 6 倍,如果这个数字还能 再提高三至四倍,则可以把电视信号经亚抽样及压缩挤入电话信道,其意义将 十分巨大。然而这三至四倍的压缩比的提高( 当然是在复原图像质量满足要求 的前提下) 难以用现有的技术框架实现,需要新的技术突破。 目前己提出和正在进行研究的图像编码方法列举如下: 多分辨率编码。最早提出的是金字塔编码,后来是子带编码( s u b b a l l d c o d i n g ) ,现在是用小波变换进行图像编码。 基于表面描述的编码方法( 三角形逼近法) 。 模型编码。它可分为物体模型未知的物体基编码和物体模型已知的语义 编码。 利用人n - t , 经网络的压缩编码1 4 1 。 利用分形几何的图像编码( i f s ) 。 利用数学形态学的图像编码等等。 1 2 矢量量化技术 在图像编码中,量化是一个十分重要的问题。矢量量化( v e c t o r q u a n t i z a t i o n ,v q ) 是一种高效率的压缩编码技术f 5 1 ,具有很大的潜力。近年来 _ 8 四川大学硕士学位论文 备受关注和重视,并取得了一些令人鼓舞的新进展【6 】。矢量量化的许多结构模 型和设计方法都是标量量化的自然推广【7 1 从一维到多维的跳跃促使大量的新 思想、新概念、新技术出现。 矢量量化在量化时用输出组集合( 码书) 中匹配的一组输出值( 码字) 来代 替一组输入采样值( 输入矢量) ,理论基础是香农的速率失真理论,其基本原理 是用码书中与输入矢量最匹配的码字的索引代替输入矢量进行传输,而解码时 只需简单的查表操作。矢量量化作为一种有效的有损压缩技术,其突出特点是 压缩比大且解码算法简单。矢量量化压缩技术的应用领域非常广阔,如军事部 门和气象部门的卫星( 或航天飞机) 遥感照片的压缩编码和实时传输、雷达图 像和军用地图的存储与传输、数字电视和d v d 视频压缩、医学图像的压缩与存 储、网络化测试数据的压缩和传输、语音编码、图像识别和语音识别等等。 矢量量化技术涉及多种学科领域的理论和技术,如信息论、编码理论、通信 原理、保密技术、信号处理、优化理论、模糊集合论、矩阵分析、神经网络、 小波变换、视觉模型、拓扑学、随机概率理论、预测技术和模式识别等等。 矢量可用来表达各类数据,如一小段语音波形或一小块图像( 只需从连续语 音上截取或对图像进行分块) 。矢量还可以表达语音编码参数,包括线性编码 ( l p c ) 系数、倒谱系数和增益参数等。它同样可表达图像变换系数,例如离散 余弦变换( d c t ) 系数或w a l s h h a n d a m a r d 变换系数。标量量化主要用于模数 转换;而矢量量化则主要用于数字信号压缩。矢量量化还可用于模式识别,其 输入模式可用预先设计的标准模式集合中的某种模式所近似。换句话说,输入 模式可用某种已存储的模板或码字进行匹配。矢量量化也可用于复杂信号处理 过程中,包括分类和线性变换。在这类应用中,矢量量化可看成一种降低复 杂度技术,因为比特数的减少可简化紧跟其后的计算,且有时还可用简单查表 操作代替复杂的数字信号处理过程。因此,矢量量化不只是标量量化的简单推 广,近几年来它已成为语音识别、语音编码和图像编码压缩的重要技术,其重 要性和应用正在逐步增长和扩大。 四川大学硕士学位论文 1 3 矢量量化技术在图像压缩处理中的应用 矢量量化优于标量量化的观点早已有人提出,信息论中也早已有定理证明了 这一点,但由于矢量量化编码器需要在码书中搜索,找出最优匹配位置,运算 量比标量量化大得多。因此,直到8 0 年代矢量量化才开始用于图像编码。也正 因为其实现的困难性,目前未找到它与视觉匹配的好办法,矢量量化最终未被 选入国际标准。尽管如此,矢量量化技术一直在发展,并有不少鼓舞的成果出 驯”。有不少系统仍然采用了矢量量化( 单独矢量量化及d c t 和矢量量化的复 合) 。另外矢量量化的专用芯片也已出现。所以,矢量量化虽然不是一种最常用 的方法,但由于它的优越性,仍然得到了许多实际的应用。 矢量量化在图像编码中的应用,目前得到较广泛研究应用的有:空间域矢量 量化、预测矢量量化、变换矢量量化、混合矢量量化,以及子带矢量量化、神 经网络矢量量化等技术。 空间域矢量量化主要包括: 1 均值波形矢量量化。该方法对矢量的均值采用标量量化,对矢量与均值 的差值矢量进行矢量量化。由于差值矢量比原矢量更好也满足平稳性假设,均 值波形矢量量化提高了编码效率。 2 分类矢量量化。该方法将待编码矢量分成若干类( 如平坦、边缘等) ,然 后对每一类分别进行矢量量化。它通过增加边缘类矢量码书的码字数量来减小 图像在边缘处的失真,以提高图像的主观质量。同时,经过分类,各类矢量更 加平稳,有利于提高压缩比。 3 自适应矢量量化。有多种自适应矢量量化方法。一种方法是自适应地改 变矢量的维数,对图像中边缘或高细节部分采用维数较小的矢量,而对平坦区 域则增加矢量维数。另一种方法是白适应改变码书,当失真大于某一门限时, 用这时的输入矢量取代码书中相应的码字,并将其误差矢量传输给解码器,以 恢复和改变解码器的码书 8 1 。 4 多级矢量量化。其基本原理是按二叉树结构将图像分成大小为2 2 , 4 4 ,8 x 8 或1 6 1 6 的块,较大的块矢量用于细节较少的图像部分,较小的块 用于细节丰富的部分,其码书是二叉树结构,以缩短搜索时间和提高编码效率。 在矢量量化方法中引入d p c m 方法,用矢量量化代替标量量化,可构成一个 四川大学硕士学位论文 预测矢量量化系统。编码器由一个矢量预测器和一个预测误差码书进行编码。 利用矢量量化还能对运动补偿帧间差进行编码,对传统混合编码方法得到的误 差进行编码。 变换矢量量化在频率域中进行矢量量化。由于通过变换能将块( 矢量) 中的 大部分能量压缩在一些低频系数中,因此如果用低频系数作为训练集,通过l 1 3 g 等算法设计出一个矢量量化器,就可以达到降低比特率的目的。因为变换系数 较图像象素有较易确定的分布,因此在变换域中设计的码书比在空间域中更为 理想,并能利用样本间的相关性。传统的标量量化需要为每个变换系数分配一 定的比特数目,而矢量量化可以对多个系数同时进行比特分配。s a i t o 设计了一 个变换矢量量化器,他首先把图像分成1 6 1 6 的象素块,每块用二维d c t 进行 变换,直流系数用一个2 5 6 级的标量量化器进行量化,交流系数用“之”字形 方式将系数组成不同的区域,用相应的码书分别进行矢量量化。如果对舍去的 高频系数也用矢量量化进行编码,传输这些高频系数只使比特率稍稍增大一些, 但重建图像的边缘附近的质量则可以明显提高。此外还能利用帧内、帧块之间 的相关性进行变换矢量量化。 由于矢量量化中普遍采用了比较均方差m s e 等准则【9 】,故较难结合人的视觉 特性。针对矢量量化并未体现出编码理论所预期的优势这一现象,近年来提出 了基于矢量变换的另一种信号处理思想。这种方法指出,矢量量化之所以没有 体现出所预期的效果是因为位于矢量量化以前的处理环节均是基于标量。为了 发挥矢量量化的优势,这些环节也必须是基于矢量的。基于这种思想的矢量小 波变换编码已取得了一些较好的结果。 1 4 选题意义及论文完成的工作 矢量量化在图像压缩领域的应用中,分层矢量量化是一个重要的应用方法。 国内外已有不少研究成果。p c c h a n g 、j m a y 和r g r a y 在1 9 8 5 年提出了很 好的理论框架1 们,1 9 9 9 年a a i y c r 和r m g r a y 又进一步提出了分层矢量量化 器的优化算法 i i l 。2 0 0 2 年r i c a r d ol d eq u e i r o z 实现了一个实用的多复杂度分 层矢量量化图像压缩编码系统【1 2 l ,并在实践中取得了很好的应用效果。q u e i r o z 四川i 大学硕士学位论文 的系统中采用传统的分层矢量量化器,在量化过程中仍然难以避免大量的运算。 本文的算法思想受到q u e i r o z 压缩编码系统方法的启发,对提高压缩率和减少运 算量两方面做了一定的研究工作。 本文基于j p e g 基本系统的压缩算法及其内部的f d c t 变换算法的分析,以及 对分层矢量量化方法的研究,对j p e g 的压缩算法做了改进。提出了一种分层矢 量量化方法,无论在码书形成还是在码字搜索方面都有自己的特点。这种分层 矢量量化方法属于空间域的矢量量化,充分体现了分类矢量量化和自适应矢量 量化方法的思想。与这种方法相适应,对传统的f d c t 变换也进行了改进,变单 一f d c t 变换为分层f d c t 变换。改进之后的压缩编码系统与传统的j p e g 压缩系 统相比,在图像重构质量相同的情况下,提高了压缩比,降低了运算量;同时 改进的压缩编码系统有很好的兼容性。 四川大学硕士学位论文 2d c t 变换技术和j p e g 标准 在图1 1 的编码框图中,若用某种形式的正交变换来实现此框图中的映射变 换,则这种编码方式就称为变换编码。图像信号一般具有较强的相关性,如果 选用的正交矢量空间的基矢量与图像本身的主要特征很接近,那么在这种正交 矢量空间中描述这一图像信号将会更简单些。从本质上说,图像经过正交变换 后之所以能够实现数据压缩,是因为经过多维坐标系适当的旋转变换后,把散 布在各个原坐标轴上的原始图像数据集中到新的坐标系中的少数坐标轴上了, 从而为后继的量化和编码提供了高效数据压缩的可能性。在众多变换编码方法 中离散余弦变换( d c t ) 得到了广泛的应用。 2 1 o c t 变换技术原理 在理论上,k l 变换是最优的正交变换,它能完全消除子像块内象素间的线 性相关性。经k l 变换后各变换系数在统计上不相关,其协方差矩阵为对角阵。 因而大大减少了原数据的冗余度。如果丢弃特征值较小的一些变换系数,那么, 所造成的均方差是所有正交变换中最小的。由于k - l 变换是取原图各子块协方 差阵的特征向量作为变换后的基向量,因此k l 变换的变换基是不固定的,且 与编码对象的统计特性有关,这种不确定性使得k l 变换使用起来非常不方便。 所以尽管k - l 变换具有上述这些优点,一般只将它作为理论上的比较标准,实 际上用得最多的还是离散余弦变换( d c t ) ,它的性能最接近k l 变换,离散傅 氏变换( d f t ) 和沃尔什变换( w h t ) 要差一些。从概念上讲,由于d f t 要对n 点象素( 对一维来讲) 做周期延拓,故一般在周期间的接点处会引入一个突跳, 这意味着将导致较大的高频系数,即能量不能充分集中于低频部分。而d c t 相 当于做知点的d f t ,它先将原n 点象素做偶对称扩展后再做周期延拓,因此边 界处没有突跳,能量可更集中。由于d c t 有固定基,性能最接近k l 变换,因 而它是变换法的主流,现在的很多国际编码标准都选中了d c t 。 四川大学硕士学位论文 2 1 1 一维离散余弦变换 设 x ( 玎) 是n 个有限值的一维实数信号序列集合,玎= 0 ,1 ,- l 。余弦变换 的完备正交函数系是 ,叩,加嘉 l 毗力= 面2 警m ( 0 i 临,z , y o y l : y n 对这些函数在( o ,t ) 内取n 个样值,即得离散余弦变换矩阵的元为 0 ,t ) 盘苟 离散余弦 2 骊 1 4 - ; 嘉伽鼍笋圳 z ,m ,删 z ,川 z 3 r e 。0 8 2 n c o s 2 n 坐二!造3(n-1)7rcosc o s - :- - - - - - - - - - - - - - : 2 2 其矢量形式为 1 2 c o s ( 2 n - 1 ) t o 2 ( 2 n 一1 ) ( 一1 ) e r c o s 。:。:。- - - - - - - - - - 一 2 弘t x 其中 ,= 去陋c o s 笋b 护忍 以求和形式表示的一维d c t 为为: 1 4 x 0 z x 一 嘶 妇 口 口 厂(、l 为 赋上压 cd 警上压 四川大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论