已阅读5页,还剩52页未读, 继续免费阅读
(电路与系统专业论文)小波域内的分形图像编码.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ab s t r a c t wi t h t h e d e v e l o p m e n t o f c o m p u t e rs c i e n c e , i ma g e c o mp r e s s i o nb e c o me s mo r e a n d m o r e im p o r t a n t in t h e c o m m u n i c a t io n s y s t e m a n d m u lt i m e d i a s y s t e m , a n d it; a ff e c t s o u r l i v e s , p r o d u c t i o n a n d n a t i o n a l d e f e n s e g r e a t l y . t h e r e f o r e , p e o p l e h a v e s h o w n g r e a t c o n c e rn o f i m a g e c o m p r e s s i o n . t h e i n t e rn a t i o n a l c o m p r e s s i o n s t a n d a r d , h a v i n g d c t a s t h e c o r e h a s f o r m e d . t h e s e y e a r s , a f r a c t a l i m a g e c o d i n g b ase d o n w a v e l e t t r a n s f o r m i s s h o w i n g i t s a d v a n t a g e , i n w h i c h a w a v e l e t t r a n s f o r m h as h e e n a d o p t e d b y j p e g - 2 0 0 0 . s o t h i s i m a g e c o d i n g h as t h e t e n d e n c y o f r e p l a c i n g t h e i m a g e c o d i n g o f h a v i n g d c t as t h e c o r e . t h e a u t h o r i n t h i s p a p e r s h a v e d o n e s o m e re s e a r c h o f i m a g e c o m p re s s i o n , i t c o n t a i n s t h r e e p a r t s . f ir s t l y , h a v i n g a w h o l e c o 卿t i o n o f i m a g e c o m p r e s s i o n c o d i n g , t h e t h e s i s a n a l y s e s t h e a d v a n t a g e s o f t h e a d o p t i o n o f d c t b y m a n y i n t e rn a t i o n a l s t a n d a r d . i n t h e s e c o n d p a r t : t h e e m p h as i s o f t h i s p a r t l i e s i n d i s c u s s i n g s u b b a n d c o d i n g , w a v e l e t t r a n s f o r m c o d i n g a n d f r a c t a l c o d i n g , w h o s e c o d i n g f u n c t i o n s a r e b e tt e r t h a n t h e c o d i n g o f h a v i n g d c t as t h e c o r e . e s p e c i a l l y t h e l a tt e r t w o c o d i n g , s i n c e 1 9 9 0 h a v e a t t r a c t e d p e o p l e s a tt e n t i o n w i d e l y . d o i n g t h e r e s e a r c h o f t h e i n t e rna l s y s t e m o f t h e s e t w o c o d i n g s a n d f i n d i n g t h e b e s t c o n n e c t i o n b e t w e e n t h e m w i l l p l a y g r e a t r o l e i n t h e d e v e l o p m e n t o f i m a g e c o m p r e s s i o n . i n th e t h i r d p a r t s : b as e d o n d a v i s s e l f - q u a n t i z a t i o n o f s u b t r e e s , t h e fr a c t a l c o d i n g i n t h e w a v e l e t d o m a i n p u t f o r w a r d o r i e n t a i t o n w a v e l e t - s u b t r e e f r a c t a l c o d i n g , t h i s c o d i n g e n c o d e s i n d i v i d u a l l y t o w a r d s w a v e l e t - s u b t r e e , a t t h e s a m e t i m e , d a v i s p u t f o r w a r d t h e i m a g e c o d i n g c o n c e rn i n g t h e d i s a d v a n t a g e e x i s t i n g i n r i n a l d o a n d c a l v a g n o s fr a c t a l p r e d i c t i v e c a s e . t h e y a d o p t e d d i ff e re n t w a y s t o w a r d s w a v e l e t c o e ff i c i e n t s i n g l y a n d c o u l d n o t m a k e u s e o f s p a t i a l p a r t i a l in d i v i d u a l l y f e a t u r e s s u c h as c ro s s - s c a l e fr i n g e e x i s t e d w i d e l y . a h t h o u g h d a v i s 硕士学位论文 m a s t e r s t h e si s s q s i m a g e c o d in g h as a c h i e v e d h i g h e r c o d i n g e f f i c i e n c y , b u t h e h as n t t h o u g h t a b o u t t h e d i ff e re n c e s b e t w e e n r e l a t i v i ty d e g r e e a n d f e a t u r e o f t h e w a v e l e t s u b t r e e s i n d i ff e r e n t d i re c t i o n s , a c c o r d i n g t o t h e d i ff e r e n c e s o f t h e r e l a t i v ity a m o n g t h e m , d i ff e r e n t s c a n m e t h o d s h a v e b e e n a d o p t e d i n c o d i n g . mo r e o v e r , b e c a u s e o f t h e w e a k n e s s o f t a k i n g t o o m u c h t i m e i n f r a c t a l c o d in g , z e r o t r e e w a v e l e t h as b e e n fl e x i b l y i n t h e p r o c e s s o f c o d i n g , w h i c h d e l e t i n g a l o t o f u s e d a n d u n i m p o r t a n t c o e f f i c i e n t , a t t h e c o d i n g t i m e h as b e e n s h o rt e n e d s a m e t i m e m a k in g t h e m e q u a l t o z e r o , t h u s t h e . i n a w o r d , t h e m e t h o d m a k e s t h e s p e e d f as t e r , i m p r o v e s p s n r a n d c o m p re s s i o n s o i t i s a n e ff e c t i v e i m a g e c o d i n g . p u t t o w a r d i n t h i s p a p e r r a t i o n i n a c e rt a in d e g r e e k e y w o r d s : i m a g e c o d i n g t r a n s f o r m f r a c t a l c o d i n g q r i e n t a t i o n w a r e l e t - s u b t r e e ”l ,、 冬彝 硕士学位论文 v a s t e r s t h e si s 一一一-一.一 - - - - 一一-一 - 一 一一一 一一一二了 一_ = 第一章绪论 1 . 1引言 随着现代信息社会对通信业务要求的不断增长,图像通信与通信网容量 的矛盾日 益突出, 特别是具有庞大数据量的数字图像通信, 更难以 传输与存储。 极大地制约了图像通信的发展,已成为图像通信发展中的 “ 瓶颈”问题。因而 对数字图像进行压缩就成了一个必须解决的问题。 图像压缩编码的目 的就是要 以尽量少的比特数表征图像, 同时保持恢复图像的质量, 使它符合特定应用场 合的要求。 到目 前为止,图像压缩的研究已 经产生了一些成熟的技术, 如离散余弦变 换, 运动估计与补偿, 霍夫曼编码等. 并且以这些编码为基础己 形成了一系列 的国际标准, 如b i g , j p e g , j p e g - 2 0 0 0 , h . 2 6 1 , h . 2 6 3 , m p e g - 1 , m p e g - 2, m p e g - , m p e g - 7 等。 小波变换编码和分形编码是近些年来出现的几种新型编码方案中,较为 突出的两种。 它们各自 都有许多潜在的优势,正在不断地被利用和完善。 本文 通过对这两种编码方案的详细分析, 寻找二者最优的接合点, 从而提出了基于 方向 性小波树的分形图 像编码, 取得了 较好的 压缩效果, 同时也缩短了编码时 间。 1 . 2图像压缩编码的研究与发展。 - 2 1 1 . 2 . 1图像压缩编码的必要性 图像是指当光辐射能量照在物体上, 经过反射或透射, 或由发光物体本身 发出光能量, 在人的视觉器官中所重现出的物体的视觉信息。 研究表明,人类 所接收到的全部信息中,有7 0 016 以上是通过视觉得到的。和语音、文字等信息 相比,图像包含的信息量更大、 更直观、 更确切,因而具有更高的使用效率和 更广泛的适应性,可见,图像信息对于人们的生活和工作是非常重要的。 t 硕士学位论文 % i a s t f r s r u e s i i 通常,图像在空间和亮度上都是连续取值的, 称为 连续图 像或模拟图 像, 如果对连续图像在空间和亮度上进行离散化, 就成为数字图像。 一幅数字图像 所占的总数据量,由其总像素的灰度所需的二进制位数 ( 即比 特数) 决定, 例 如, 一幅 ( 2 5 6 x 2 5 6 ) 点的数字图像, 如果具有2 5 6 个灰度级,即每个像素用 8 6 i t( 一个字节) 表示, 那么其总数据量就是6 4 k 个字节。 对于如此庞大的数 据量, 若不经压缩, 数字图 像传输所需的高传输速率和数字图像存储所需的巨 大容量将给存储器容量, 传输线的 传输率 ( 带宽) 以 及计算机的处理速度等增 加巨 大的压力。 为了 实现数字图 像通信, 就必须采用有效的压缩编码技术压缩 数字图像的数据量。 1 . 2 . 2图像压缩编码的可能性q 图像压缩编码得以实现的两个主要依据是人类视觉系统的特性和图像的 统计特性。 一、人类视觉系统的 特性 ( v h s ) 我们可以 将人类视觉系统看做一个通常意义下的输入输出系统, 而其输入 和输出之间的关系,就是视觉特性。人类视觉系统主要表现出以下几种特性: 1 .对比灵敏度: 在数字图像中,图像的亮度表示为一系列的离散值,即 灰度级, 那么, 图像系统能够提供或处理多少个灰度级就能满足人眼的视觉需 求呢?实验表明 人类视觉系统能够适应的亮度范围是非常大的, 从最暗到最亮 可达1 0 0 的数量级. 但这并不是说图像系统也必须要工作在这样大的亮度范围 内。 这是因为大量的实验表明, 视觉系统很难正确判断亮度的绝对大小。 然而 当 判断两亮度中何者较大时, 视觉系统则有较好的能力, 这就是说, 人眼有较 好的对比灵敏度, 利用此特性, 只要保证图像压缩处理后的亮度信息与原图像 有比较一致的对比 度即可,而不要求有很大的亮度范围。 2 .空间分辨力:空间分辨力指人眼区分相邻的两个发光发点的能力。 通 常用能够分辨的两个发光点之间的最小视角表示, 该视角一般为1 . 这说明 人 眼的空间分辨力是有限的, 视角小于某个值时, 人眼将无法分辨相邻的像点, 也就是, 当图像沿空间上任一方向变化太快时, 将超出人眼的接受范围。 因此, 一氦 硕士学位论文 m a s t e r s t h e si s 一一 - 一一 一一-一,一州. - 一-一 波变换编码。 2 . 基于表面描述的编码方法。 3 . 模型编码:包括物体基编码和语义基编码。 4 . 利用人工神经网的压缩编码。 5 . 利用分形几何的图像编码。 6 . 利用数学形态学的图像编码等. 其中小波变换编码和分形编码不仅是现在研究的热点, 而且这两方面的编码己 取得了 不少成功。 能否突 破目 前国际标准所实现的压缩比, 是图 像压缩编码领 域正在研究和关注的问题。 1 . 3图像压缩方法的评价1- l 正确评价一种图像压缩方法, 对衡量该方法的优劣来讲是至关重要的. 通 常用主观和客观两种方法来评价某种图像压缩编码的优劣. 1 . 3 . 1 主观方法 主观方法就是由观察者依靠自己的感觉对经过压缩处理之后的恢复图像 进行质量评价。 在具体做法上, 有时可由一组观察者分别对所评价的同一恢复 图像进行打分, 然后按照一定规则得出一个总的评价结果。 尽管这种方法使用 起来不够方便, 对观察者的知识水平有一定的要求, 有时不同的观察者会得出 不同的评价结论, 但主观方法仍是最可靠的, 这是因为图像最终的接受者通常 是人的视觉,而不是别的. 1 . 3 . 2 客观方法 客观方法, 就是定义一个数学公式, 然后对待评估的图 像进行运算, 得到 一个唯一的数学量作为测度结果. 一般用下面的指标参数来客观评价一种图 像 压缩方法的优劣。 1 .归一化均方误差 愁蓦 1 硕士学位论文 m a s t e r s t h e s i s e y- f ( x , y ) 一 f ,( x , y ) i 2 ,5 2 = m 一毛二 乙 乞 f ( x , y ) i ( 1 . 3 - 1 ) 其中, f ( x , y ) 是大小为m x n 的原始图像,f ,( x , y ) 是大小为m x n 的恢复图 像。 2 .峰值信噪比 ( p e a k s i n g a ln o i s e r a t i o ) 尸 s n r= 1 0 1 g 艺艺u (x ,y ) 一 f ,( x ,y )i 2 ( d b ) ( 1 . 3 -2 ) 式中f m . 为图 像的 最 大 灰 度 值, 例如, 对于 具 有2 5 6 个 灰 度级的 黑白 图 像刁袖 通常为2 5 5 0 3 .压缩比 ( c o m p r e s s r a t i o ) c= 另 ( 1 . 3 -3 ) 其中,n 为原始图像的总数据量,n 为压缩编码后的总数据量。 比 特率:传输或存储一个像素平均所需的比 特数。 另外还有处理时间, 实现的难易程度等。 一个好的压缩方法可能不是以上 指标都优于其它压缩方法,但它应该是各个指标的一个较优的折中。 1 . 4 本文的主要工作 本文共分五章,具体安排如下: 第一章: 主要介绍了图像以及研究图像压缩编码的意义,同时介绍了评价 图像编码方法性能的几个主要指标和图像压缩编码研究的历史与现状。 第二章: 探讨了 压缩编码的基本原理以及发展已相当成熟并且被多种国际 压缩编码标准所采用的离散余弦变换技术。 第三章: 重点讨论了近些年发展起来的子带编码、小波变换编码和分形编 码等几种新的图像压缩编码技术。 第四章: 在分析了以d a v i s 的s q s 算法为代表的现有小波域内的分形图像 一颤 硕士学位论文 m a s t e r s t h e si s 编码的不足之后, 本文提出了方向性小波树的分形图像编码方法, 这种方法在 一定程度上能够加快编辑解码速度, 在保证一定图 像质量的基础, 压缩比也 有 所提高。 第五章:总结与展望。 第二章图像压缩编码的基本原理和方法 图像压缩编码技术应用面十分广泛, 一直受到普遍重视,已 研究出许多种 压缩编码方法, 各自 基于不同的思想和技术途径, 适合于不同的应用场合,内 容十分丰富。 本章在介绍了图 像压缩编码的基本过程后, 将重点讨论几种传统 的、技术已比较成熟的,在图像压缩中被广泛采用的编码方法及其基本原理。 2 . 1 图像压缩编码系 统的基本构成q 图像压缩编码的过程可以 概括如下图所示的三个步骤: 原始图像经映射处 理后的数据再经量化器和嫡编码器成为码流输出。 原 始 图 输 入 笼画回净巨困气巫画巨 码 流 图2 . 1 图 像压缩编码系统的基本构成 图中, 映射处理的目 的是改 变原始数据的特性, 使映射后的 数据有利于压 缩编码。 量化器产生用以 表示被压缩图像的有限数据量的符号, 量化是一种不可逆 的处理过程, 可以由 标量量化器或矢量量化器实现。 标量量化器对数据进行逐 个的量化,而矢量量化器则每次对一个数据块进行量化。 嫡编码器为量化器输出 端的每个符号分配一个码字或二进制比 特流。 理想 情况是嫡编码器编出的码流的平均码长等于量化后数据的信息嫡。这样的话, 7 肇 硕士学位论文 a s f e r s r h e si s 嫡编码器的压缩比 就实现了最高。 嫡编码的具体实现方法多种多样。 在图像数 据压缩中常用的有霍夫曼行程码、算术码等。 另外还需说明的一点是上述三个步骤之间是相互联系、 相互制约, 共同实 现数据量的压缩这一目的的。 对有些编码方式, 映射处理后数据量可能并没有 减少, 甚至因动态范围的加大而使总数据量略有增加, 但映射处理为后两步作 了 准备, 它改 变了 原始数据的 特征, 使后两步发挥作用, 实现整个过程的高压 缩功能。 还有一些编码方式, 经映射处理后得到的 数据量已 大大小于原始图像 的数据量,即第一步已实现了 很大的压缩, 后面两步则是作进一步的压缩。 总 之,在图像压缩编码的过程中要把这三者联系起来共同去实现数据的最终压 缩,而不是分别地,孤立地去考虑它们。 2 . 2图像的无失真编码和限失真编码 如果将经过图像压缩编码后形成的码流, 再进行一个逆变换后得到的恢复 图像是否与原始图像一致为标准, 图像压缩编码的形式就有且只有无失真编码 和限失真编码两种。 2 . 2 . 1 无失真编码u u 无失真编码又称无损压缩编码或信息保持编码, 这是一种在不引入任何失 真的条件下使比 特率为最小的压缩方法。 该方法要求在解码后得到的恢复图像 与原始图像严格相同, 没有任何失真。 如果图2 . 1 中不引入量化器和反量化器, 信息在传输过程中没有误码, 映射和反映射的精度足够高, 舍尾误差可以忽略 不计, 则可以做到恢复图像和原图像完全相同, 均方误差此时为零. 我们可以 看出此种编码方法由于没有利用人眼的视觉特性, 其一般情况下, 压缩比较低。 无失真编码比特率的最低限可由山农的无干扰编码定理得出, 即无失真编码的 最 大 压 缩比 c = 另 = 外(: ) 。 其中n 为 原 始图 像的 平 均比 特 率 ,h ( x ) 为 原 始 图像的嫡。 2 . 2 . 2限失真编码 i 限失真编码又称有损压缩方法或非信息保持编码, 这是一种在一定比特率 e ;摹 硕士学位论文 m a s t e r s t h e s i s 下获得最佳的保真度, 或在给定的保真度下获得最小的比 特率的压缩方法。 通 过该方法处理之后, 恢复的图 像较之原始图像存在一定的 误差, 但视觉效果必 须是可以接受的。 限失真压缩编码理论上能够达到的比 特率的最低限, 由 率失 真函数给出, 率失真函 数曲 线如图2 . 2 所示。图中d 表示失真度, r ( d ) 表示 奎 r ( f x ( s )y 刀d 图2 .2率失真函 数 率失真函数,即编码比 特率。当d 为0 时, 对应无失真编码的情况, 所以, 这 时r ( d ) 的值等于信源的嫡h ( s ) , d m a x 是失真度的最大值。 率失真函数的意 义是:对于任意给定的失真度d ,可能找到一个编码方案,其编码比特率任意 接近 r ( d ) ,而失真度任意接近d .如果知道了图 像信源的率失真函数, 那么 实际 编码器能够实 现的 编 码比 特率r 一定 不低于r ( d ) , 极限 时等于r ( d ) . 由此看来, 率失真函数对于评价实际编码器是非常有用的, 但要得到图像信源 的率失真函数,却并非易事。 这主要因为,一方面, 通常图像的统计模型比较 复杂, 不能简单表示为独立信源, 另一方面, 人眼的视觉系统所能接受的失真 度,是每个像素及其周围像素的一个很难用数学语言描述的复杂函数。 2 . 3预测编码【1 4 1 i7) 在图2 . 1 图像压缩编码的一般框图中, 若映射变换所做的工作是对待编码 图 像进行预测, 并将预测差输出, 供量化编码, 而在接收端将预测差的码字解 码后再与预测值相加以 恢复原图,则这种编码方法被称为预测编码。 预测编码不直接对信号编码, 而是对预测误差编码。 当 预测比 较准确, 误 差较小时, 即可达到编码压缩的目 的。 这种编码往往被称之为差分脉冲编码调 ;氮 硕士学位论文 1 1 4 s t e r s t h e s i s 制( d p c m ) 。 如图2 . 3 所示的 原 理 方 框图 。 在该 系 统中 , x 、 为t 二 时 刻的 亮 度取 样值。 预 测 器 根 据t 二 时 刻之前的 样 本 值xx z , . . . x n - : 对x , 作 预 测, 得 到 预测 x n 输入 图2 . 3 d p c m 原理框图 值x , , o x , , 与x * 之间 的 误差为 e n = x 、 一 x 公( 2 . 3 -1 ) 量 化 器 对e 、 进 行 量 化 得到e, 编 码 器 对e , 进 行 编 码 发 送。 收 端 解 码 时 预 测 过 程与 发 端 相同, 所 用预 测器亦 相同 。 收 端恢 复的 输出 信号x , , 是x , 的 近 似值, 两者的误差是 a x , = x 、 一 x 二 = x 、 一 ( x , , + e ) = e 、 一 e ;, ( 2 . 3 -2 ) 当 预 测 误 差 足 够 小 时, ( t = 1 ,2 , . . . , n 一 1 ) 中 , 据x x z , . . . , x n - i n x , 作 预 测 , 令x , 的 预 测 估 值 为芍, 假如芍是xx z , . . , x n - : 的 线 性 组 合, 则 称 对x 、 的 预 测 为线性预测。 假定二维图像x ( t ) 是一个均值为零、方差为s = 的平稳随机过程,x ( t ) 在 硕士学位论文 m a s t e r s t h e si s t i, t z , , m y 时刻抽样值集合为: i x =x 1 i x 3 , -i x x - , ( 2 . 3 -3 ) 由上式可得到 t v 时刻抽样值的预测值 x na ; x ; =a , x , + a z x z +a n - , x n - , ( 2 . 3 - 4 ) 洞艺间 一一 式中a 为 预 测 系 数。 根 据 线 性 预 测 定 义,玲必 须 十 分 逼 近x , , , 这 就 要 求“ , , a 2 , . . . , a n - 。 为 最 佳 系 数。 采用 均方 误 差 最小 的 准则, 可 得 到 最 佳的a , e 设x 、 的 均方 误 差为 : t e n 2 卜 : t x 、 一 x n 12 ) 一 : t x 、 一 ( a ,x , + a z x z + -.+ a , 一。x n - ,) 2 j ( 2 . 3 - 5 ) 为 使 : t e n 2 最 小 , 在( 2 . 3 - 5 ) 式 中 对 。 求 微 分 , 得 a _ _ , 、 七l e . i - t = a a ;, 一 , 一 ( a ,x , + a 2 x 2 + .+ a n - ,x , - , 2 j 一 ( a , x , + a z x z + . . . + a n - ,x n - , ) x , i =1 , 2 , . . . , n一 1 根据极值定义, 得到( n一 1 ) 个方程组成的方程组: e 卜、 一 ( a ,x , + a 2 x 2 + . . . + a n - ,x m _ , e 在 x 、 一 ( a ,x , + a 2 x 2 + e j x , 一 ( a , x , + a 2 x 2 + 二+a n - , x n - ,( 2 . 3 - 6 ) 二+a , - , x , - , 、氰 硕士学位论文 m a s t e r s t h e s i s -一一-一. - 一目一,_一一 简 记 为 e 4 x 、 一 ( a , x , + a , x , + - - - + a , ,- ,x 、 一 , ) x , 卜0 i = 1 , 2 , . . . , n一 1 ( 2 . 3 - 7 ) 令x ; 和 x , 的 协 方 差记 为凡= e xx , ) i , 1 = 1 ,2 , . . . , n 一 1 则( 2 . 3 - 7 ) 式 可 表 示 成 r, = a , i t + a 2 r z , + . . . + a n - , r ( x - 1) i =1 , 2 , . . . , n一 1 ( 2 . 3 -8 ) 若所有的 协 方差几已 知, 则预 测系数a , ( i = 1 , 2 , . . . , n一 1 ) 可解得。 在 线性 预 测中, 若只 采 用x n - , 对x , 进 行预 测, 称为 前值 预 测。 若 采 用同 一 行中x 、 前的 若干抽 样值来对x , 预则, 称为一 维 预测。 若采用几行内 的 抽样值 来 预 测x n , 称为 二 维预 测。 在 线 性 预 测中, 我 们可以 看出 对 预 测 系 数a 的 计 算 机是 十 分 繁 琐的 。 因 此, 在实 际工作中, 针对不同 情况, 通常采用相对固 定的a 系数来进行线性预测。 2 . 3 . 2 非线性预测编码f7 ) 线性预测编码的基础是假设图 像全域为平稳的随机过程, 自 相关系数与像 素在域中的位置无关。实际上,图像的起伏是始终存在的, 被描述像素和周围 像素 之间, 含 有多 种多 样的 关 系。 线 性 预 测系 数a , 忽 略了 像 素间 的 这 种多 样性 关系。 非线性预测充分考虑了图像的统计特性和个别变化, 尽量使预测系数与图 像所处的局部特性相匹配,从而获得更高的压缩比。 设图像信号为 m阶马尔可夫序列,如图 2 . 4当前像素s o 的邻近像素 s , ( i = 1 , z , . . . , n ) 按其与s o 之间的 距离 排列. 因 此, 像素s o 的 预测 值s o 可用其邻 硕士学位论文 m a s t e r s t h e si s 近像 素s , 的 联 合 概 率密 度 来表 示: s o 二 p ( s i , s 2 , . . . s o a x . ) 一 j ( s o 一 s o ) 2 p (s . i s o ,s . . . s )d s . ( 2 . 3 - 9 ) ( 2 . 3 一1 0 ) - - 止 一一 上 i 一- 上 一 一 以一 ss s 9 s io s 1 1 s 1 2 - 二一 一 一 一 匕一 一 j 一 一 . 一- - - 卜 s e s i s o 图2 . 4 s 。 及其邻近像素 p ( s o / s i , s 2 , . . . , s) 为s o 在( s o i s i , s 2 , . . . , s) 状 态下 发生的 条 件 概 率 密 度, 则全 帧图 像非 线 性预 测 误差 ( s o - s o ) 的 均 为 差为 : e j 2 卜开 二 介 (x o )p (s o , s 1,. s ) d s o d s , . d s ( 2 . 3 一1 1 ) *a f ( s o ) 少 穿,-弋佗甲一 = v 苗 . 则s o 一 j s a p (s o / s i .s 2 ,一 s )d s , ( 2 . 3 - 1 2 ) 这里,s o 是p ( s a / s i , s 2 , . . . , s) 条 件 概率下s 。 的 均值。 ( 2 . 3 - 1 2 ) 式也可 记为: s o = i ( s ; 十 d , ).1 , ( 2 . 3 - 1 3 ) 式中d , = s , - s , ; 入为 权重 ( 预测) 系 数。 从该式中 可以 看出,试 越小, 预测 系数a , 取值就越大。 反之亦然。 可见, 非线性预测体现了 相邻像素的制约作用, 氰 硕士学位论文 ma s te r s th e si s 因为试凡, 都是s , , s z , . 性达到了很好的匹配, 二 , s 。 的 函 数。 由 此可 见, 非 线 性 预 测 使 得图 像的 局 部 特 较之线性预测是一种更合理,更准确的图像编码技术. 2 . 4变 换编码, :。, 在图2 . 1 图像压缩编码的一般框图中, 若将图 像时域 ( 空间) 信号变换到 系数空间 ( 频域) 上之后, 对频域上的数据再进行量化编码. 则这种编码方法 被称为变换编码。 之所以要将图像映射到变换域中进行编码。 可以从以下两个 方面加以解释。 首先是因为常用的变换都是线性变换, 而线性变换具有坐标旋转的作用, 这可用于去除或减小图 像在空间 域中的相关性, 相关性的去除或减小将导致图 像在变换域中的能量分布更为集中, 更有利于对系数的量化和嫡编码, 从而在 保证一定图像质量的条件下使压缩比得到提高。下面考虑对一个 1 x 2的子图 像( 厂 , 儿 ) r 的 线 性 变 换问 题, 在f 和./ 1 为 坐 标 的 两 维 空 间 中 , 每 个 具 体的 子图 像都是该空间中的一个点,当把通常的数字图 像中 所有 1 x2的子图像表示在 该空间中时, 就得到如图2 . 5 ( a ) 所示的分布。由于图像中相邻像素间具有很 强的 相 似性, 所以 , 正 如图 中 所表 示的, 大多 数 点 分 布于f = 儿 线附 近, 如 果 对 每 个子图 像 进 行 从( f , f ) 到 ( f f z ) 的 线 性 变 换, 且这 种 变换的 结 果 是 使 坐标 旋转4 5 。 角, 那么, 在 变 换 域阴, 凡夕 中 , 名 和凡之间 的 相关 性就 大 大 地减少了, 从图2 . 5 ( b ) 中 可以 看出, 这时 大多 数 点 分 布于f , 轴上。 如果 从能 量 分布的 角 度看, 变 换前 从图2 . 5 ( a ) 求得的 子图 像 在不 和儿方向 上的 方差 大 致 相 等 , 即 弓二 暇, 而 变 换 后 从 图2 . 5 ( b ) 中 求 得 的 子 图 像 在 f , 和 f z 之 间 平 均分布,而变换后能量大部分集中于 f , 上。 :辱 硕士学位 论文 wa s t e r s t h e s i s 一- 一- -一一 -一- 一一- 一一二 = = f ( 0 . 1 ) f ( 1 . 1 ) f ( 0 . 7 ) f ( 1 . 7 ) ( 2 . 4 -2 3 ) 0)0) .0 ) f ( 7 .0 ) f ( 7 .7 ) f(0f(1f(7 f 对图像方块进行变换以 后, 得到其变换系数, 接下来就要对这些系数进行 量化和嫡编码。常用的方法有区域编码和门限编码等。 1 .区域编码 区域编码就是只保留系数方块中一个特定区域中的系数, 而将所有其它系 数置零。 由于大多数图 像的频谱具有低通特性, 所以, 通常是保留 低频部分的 系数, 而丢弃高频部分的系数。 每个保留下来的系数经过量化后用等长的码字 进行编码。 量化时可以用同样的量化器对所有系数进行量化, 也可以用不同的 量化器对各组系数进行量化。 在这种情况下,由于待编码系数的区域和所使用 的量化器都是预先规定的,所以,解码时不需要另外的说明信息。 在区域编码中, 通常为了实现更高的压缩化, 还可以 在编码系数区域中采 用更细致的比特分配方法。 因为每个保留系数的动态范围往往不同, 用以表示 每个系数的比特数应当正比于其动态范围,以 进一步减小量化误差。 一个具体 的编码区域划分和比 特分配方案如图2 . 8 所示。 图中数字表示所在位置保留系 数分配的比特数,其它为 舍弃的系数。 同 76 43 7654 654 44 3 口 图2 . 8 编码区域与比特分配 2 . 门限编码 ;氮 硕士学位论文 u sp e r s t h e si s 在大多数图像中, 不同的方块具有不一样的频率和统计特性, 因此, 不同 方块中保留系数的位置及总比特数最好是可变的。门限编码就是这样一种方 法, 在这种方法中, 只保留每个方块中那些幅度超过一定门限的系数。 在实际 应用中,可以将门限和量化过程通过一个量化矩阵结合在一起。 v)-v) f ( u , v ) = i n t 1 0 . 5 ( 2 . 4 - 2 4 ) 式 中 f ( u , v ) 是 变 换 系 数 ; 户 ( u , v ) 是 经 过 量 化 和 取 门 限 后 的 结 果 ; s ( u , v ) 是 量 化 矩阵 中 的 相 应 元 素 。 等 式 右 边 实 际 上 表 示 一 个四 舍 五 入 取 整 的 过 程, 若户 ( u , v ) 不等于零, 则 保留 系数f ( u , v ) , 量 化矩阵的 每 个元素通常是一个8 b i t 的 整数。 通常, 考虑到人眼的视觉频率响应特性, 对于较高频率的系数, 取较大的t化 步长,而对于较低频率的系数,取较小的量化步长。 和区域编码相比,门限编码中保留系数的位置是可变的,因此,需要对这 些系数的位置信息和幅度信息一起编码和传输, 所以门限编码比区域编码将更 为复杂。 d c t 编码的 特点 1 . 抗干扰性强: 由于变换域中某个系数在传输中所引入的误差只影响其所 在的子像块而不会扩散到其它子像块, 且这个误差不是集中在某个像素而是散 布在该子像块的各个像素中。所以说它的抗干扰性强. 2 . d c t 编码最大的缺点是当比特率很低时, 在子像块交界处会出现方块效 应。 因此,为了克服d c t的方块效应,而出现了其它新的编码方法, 如我们后 面要讨论到的小波变换编码和分形编码等。 一氰 硕士学位论文 m a s t e r s t h e s i s 第三章图像编码方法的新进展 近2 0 年来, 在前面讨论的 预测编码, 变换编码和其它传统方法的基础上, 图像编码理论、 方法和技术的研究, 又取得了较大的进展, 这主要体现在本章 将要讨论的几种具有较大应用前景的新方法的提出及其不断完善上。 3 . 1 子带编码 3 . 1 . 1子带编码的 基本编码原理m 13 d 1 在子带编码中, 首先对原始图像按不同的空间频率进行滤波, 形成一组图 像, 其中的每一幅图 像都占 有一个独立的频带, 所以 将每幅图像称为原始图像 的一个子带。由于每个子带的带宽都小于原图像的带宽, 所以可对其进行亚取 样,即以 低于n y q u i s t 取样频率的频率取样。 对图 像进行滤波和亚取样之后, 对每个子带分别进行编码, 各个子带采用相同的或不同的编码器, 也可采用不 同的比 特率甚至不同的 方法进行编码, 以充分利用各个子带的不同特性, 以 最 佳的方式将编码失真分配给各个子带。 解码时, 则以 合适的滤波器分别取出各个子带并采取过取样, 最后将各个 子带叠加到一起, 得到恢复图 像。 在输入信号是一维的 情况下, 上述整个过程 可用图3 . 1 概括。图中,2 : 1 和1 : 2 分别表示1 / 2 亚取样和2 / 1 过取样。 图3 . 1 信号的子带分解与恢复方框图 3 . 1 . 2 分析与综合滤波器组 2 3 硕士学 位论文 t i a s f f r s t h e s i s 为了将图像分解为子带, 要求所用的滤波器 ( 分析滤波器) 组中的低通和 带通滤器的频率响应特性应互不重叠, 且不存在间隔。 然而, 我们知道这样理 想的滤波器是无法实现的, 因此就要采用互有重叠的滤波器, 但这必然又会在 亚取样时引入混叠效应。 为此, 分析和综合滤波器 ( 将各个子带叠加到一起的 滤波器) 通常采用正交镜像滤波器,以在无编码误差的情况下实现图像的无混 叠恢复。 假设我们将归一化取样频率为1 的一维低通信号( 频带为0 -1 / 2 ) 分解为 带宽相等的两个子带, 可采用具有图3 . 2 所示频率响应特性的低通和带通正交 镜像滤波器对, 之所以称这种滤波器对为正交镜像滤波器对, 是因为其频率响 应呈现出 对于1 / 4( 角频率: 二 / 2 ) 的镜像对称性。 这时, 允许在分析滤波器组 中存在重叠区域,即存在混叠效应, 而在恢复信号时, 通过合理地设计综合滤 波器,使混叠效应完全消除。 t h(d)厂h .(d) 甲!1占碑 图3 . 2 一维理想正交镜像滤波器对 下面对上述正交镜像滤波器组应满足的条件加以推导,由图3 . 1 得: y , ( n ) = x , ( 2 n ) y . ( n ) = x ( 2 n ) ( 3 . 1 - 1 ) 令z = e , 则x ( n ) 的傅里叶变换为 一 月。 x ( e ) = x ( z ) = 艺x ( n ) ( e )= 艺x ( n ) ( z ) 一 ( 3 . 1 - 2 ) 硕士学位论文 m a s t e r s t h e s i s 一 一-份,- -一-,二 二二, 二 尸 吧 吧 二 二 吧 二 , 二 于 二 二 二 : 二 : , 二 二 , 吧 二 , 叮 -叮吮 甲二咒 ,-,_一_ _ _ _ _ _ _ _ 由( 3 . 1 - 1 ) , 则 y
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑装饰设计师及团队绩效考核表
- 消防安全幼儿教案
- 保险顾问客户服务与业务拓展能力绩效考核表
- 民族风格室内设计要素解析
- 星球室内设计
- 服务项目拓展承诺函5篇
- 幼儿音乐创编
- 2025年及未来5年市场数据中国微型电动汽车行业发展监测及投资战略规划研究报告
- 项目进度报告编写格式框架
- 生产车间现场管理标准作业流程工具
- 2025-2030中国铷/铯及其化合物行业市场现状分析及竞争格局与投资发展研究报告
- 2024-2025学年新教材高考数学 第2章 平面解析几何 7.1 抛物线的标准方程教学实录 新人教B版选择性必修第一册
- 铁路建设中的施工与居民协调措施
- 托利多GPro-500-气体分析
- 车辆矿石运输合同范本
- 浙江省杭州市城区杭州天地实验小学2025届数学三上期末学业质量监测试题含解析
- 《建筑节能工程施工质量验收规程》(DGJ08-113-2017)
- 卫生院职工五年来的工作总结范文
- 司法鉴定概论-课后练习参考答案
- 《移动通信》任务12 5G基站故障排查
- 【MOOC】美术鉴赏-河南理工大学 中国大学慕课MOOC答案
评论
0/150
提交评论