




已阅读5页,还剩90页未读, 继续免费阅读
(信号与信息处理专业论文)网格编码量化及其在图像压缩中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电 子科 技大 学博士论 文 a b s t r a c t t h i s d i s s e r t a t i o n i s u n f o l d e d f u l l y a l o n g t h e t h r e a d o f t h e i d e a o f t c q . g u i d e d b y t h e i d e a , t h e s t u d y a b o u t i m a g e - c o m p r e s s i o n i s d e v e l o p e d f r o m a f e w a n g l e s o f i n f o r m a t i o n f u s i o n . a t t h e s a m e t i m e , t h e a p p l i c a t i o n o f t h e d i s c u s s e d m e t h o d s i n s t i l l i m a g e i s a l s o g i v e n . c h a p t e r 2 f i r s t r e v i e w s a l l s i d e s o f b a s i c t h e o r y c o n c e r n e d t c q , w h i c h i n c l u d e s s q a l g o r i t h m , t c m a n d v i t e r b i d e c o d e a l g o r i t h m a n d s o o n . t h e n i t f o c u s o n t h e t h e o r y o f t c q a n d i t s p e r f o r m a n c e a n a l y s i s , f i n a l l y t h e a l g o r i t h m o f t c q a n d i t s a p p l i c a t i o n a r e g i v e n . c h a p t e r 3 i s t h e d i r e c t e x t e n s i o n o f c h a p t e r 2 , n a m e l y m a p s s q f i e l d t o v q f i e l d . t h i s c h a p t e r f i r s t r e v i e w s t h e b a s i c c o n c e p t i o n o f v q , l b g a l g o r i t h m a n d f r e q u e n t l y u s e d m e t h o d s o f v q , t h e n i n t r o d u c e s t h e t h e o r y o f t c v q . b a s e d o n a b o v e t h e o r y , t h e t c v q a l g o r i t h m a n d i t s a p p l i c a t i o n i n s t i l l i m a g e c o m p r e s s i o n a r e g i v e n f i n a l l y . t h e f o r m e r t w o c h a p t e r s d e s c r i b e t c q a n d t c v q o n l y i n s p a c e f i e l d . f r o m c h a p t e r 4 o n , o t h e r m e t h o d s a r e b e i n g t r i e d t o i m p r o v e q u a n t i z a t i o n g a i n s b a s e d o n t c q a n d t c v q s p a c e f i e l d . c h a p t e r 4 d i s c u s s e s a n e w m e t h o d b a s e d o n w h i c h a p p l i e s t h e c o r r e l a t i o n i n t r a n s f o r m f i e l d i n c o m p r e s s i o n o f i m a g e s . t h i s c h a p t e r i s s e p a r a t e d i n t o t w o p a r t s . f i r s t p a r t i n t r o d u c e s t h e e n c o d e a n d d e c o d e s c h e m e w h i c h a p p l i e s t h e t c q i n d c t f i e l d , t h e n c o r r e s p o n d i n g i m p l e m e n t a l g o r i t h m a n d i t s s i m u l a t i o n a r e g i v e n . t h e l a t t e r p a r t e x c l u d e s t h e o p e r a t i o n t h a t q u a n t i z e s o n l y o n e p i x e l e v e r y t i m e , a n d a d o p t s t h e v q m e t h o d , t h e n b r i n g s f o r w a r d t h e t c v q a l g o r i t h m i n d c t f i e l d . f i n a l l y c o r r e s p o n d i n g i m p l e m e n t a t i o n a l g o r i t h m s a l o n g w i t h i t s s i m u l a t i o n r e s u l t s a r e g i v e n . f r o m t h e v i e w p o i n t o f e n t r o p y c o d i n g , t h e s c h e m e b a s e d o n t c q a n d t c v q , w h i c h a p p l i e s b l o c k - c o d i n g m e t h o d t o c o m p r e s s i m a g e s , i s d i s c u s s e d i n t h e f i f t h c h a p t e r . t h i s c h a p t e r f i r s t r e v i e w s t h e t h e o r y o f b l o c k - n 电 子科 独 味学 博士 论文 .,. c o d i n g , t h e n t h e 2 - d i m e n s i o n t c q a n d 2 - d i m e n s i o n t c v q a r e g i v e n r e s p e c t i v e l y b a s e d o n t c q a n d t c v q . a t t h e e n d o f t h e c h a p t e r , e x p e r i m e n t r e s u l t a n d i t s a n a l y s i s a r e p r o v i d e d . c h a p t e r 6 i n t r o d u c e s t h e i d e a o f u n e q u a l e r r o r p r o t e c t i o n t o c o m p r e s s i m a g e s , w h i c h a p p l i e s u n e q u a l i m p o r t a n t q u a n t i z a t i o n m e t h o d s t o u n e q u a l : 叩o r t a n t c o e f f i c i e n t s t h r o u 如 3 s t e p s . f i r s t r e o r d e r t h e c o e f f i c i e n t s i n d c t f i e l d a c c o r d i n g t o t h e u n e q u a l i m p o r t a n c e , t h e n d e a l t h e i m p o r t a n t c o e f f i c i e n t w i t h a c c u r a t e q u a n t i z a t i o n , w h i l e d e a l t h e r e l a t i v e l y n o n - i m p o r t a n t c o e f f i c i e n t w i t h c o a r s e q u a n t i z a t i o n . b a s e d o n a b o v e i d e a m o d i f i e d t c v q a l g o r i t h m i n d c t f i e l d i s p r o p o s e d , t h e n c o r r e s p o n d i n g s i m u l a t i o n a n d e x p e r i m e n t r e s u l t a r e g i v e n . k e y w o r d s : t c m , v i t e r b i a l g o r i t h m c o d i n g , u n e q u a l e r r o r t c q , t c v q , d c t t r a n s f o r m a t i o n , b l o c k p r o t e c t i o n m 电 子 科技大 学博士 论文 一旦旦旦旦纽已巴毕三里,旦, 第一章 绪论 计算机工业的飞速发展、通信技术的日 益成熟和宽带网建设的空前活跃, 带动了多媒体通信的蓬勃发展,同时也极大地推动了图象视频压缩技术的研 究。 伴随着这些硬件条件和通信技术的 成熟, 数字电视, 会议电视和虚拟现实 等宽带应用已经扑面而来,然而这些应用都需要海量的图象数据,并远远超出 实际可用的带宽和存储容量。因 此,图勿数字视频通信系统 8 2 1 需要高效的压 缩算法。图像/ 视频清晰度越高,表示它们需要的数据量就越多,需要的压缩 比 也就越大。 但图 象数据是高度相关的, 一幅图象内 部以 及视频序列中相邻帧 / 场图象之间存在着大量的冗余信息。图象序列的相邻帧之间的差别很小,我 们称这种时间相关为时间冗余。同时, 每一帧图象内部某些区域是均匀着色或 内 部物体显示出规则的 模式,我们称这种空间相关为空间冗余。 视频压缩就在 于尽量去除空间冗余和时间冗余,以达到压缩数据量的目 的。静止图象压缩的 一个目 标是在保持重建图象的质量可以被接受的同时,尽量去除空间冗余信 息。 除以上提到的两种冗余外,在一般的图象数据中,还存在着以下的几种冗 余信息: 结构冗余: 在有些图象的部分区域内存在着非常强的纹理结构,或是图 象的 各个部分之间 存在有某种关系,例如自 相似性等,这些都是结构冗余的表 现 。 知识冗余: 在有些图象中包含的信息与某些先验的基础知识有关,例如 在一般的人脸图象中,头,眼,鼻和嘴的相互位置等信息就是一些常识。这种 冗余我们称为知识冗余。 视觉冗余: 在多数情况下,重建图象的最终接受者是人的眼睛。为了达 到较高的压缩比,可以利用人类视觉系统的特点。比 如人眼对不同颜色的分辨 能力不同,对不同方向的敏感度也不同等等。因此,如果编码方案利用人类视 觉系统的一些特点, 可以进一步提高压缩比。 图象编码就是要尽可能的去除上述各种形式的 冗余信息,以降低表示图 象所需的比 特数。对于图像序列,几乎所有的视频压缩方案都采用了基于块的 运动补偿技术,然后编码经过运动补偿形成的残差图象。因此,高效的图象 ( i m a g e ) 压 缩 算法是 视频编 码的 一 个关 键。 本 论文主 要 讨论 静止图 象 编 码方 法,但是所提出的算法完全可以用于视频压缩。 电 子科技大 学博士 论文 里生,巴,.曰魏,里,民经里. 1 . 1 . 常 规压 缩算法回 顾 传 统 的 图 象 编 码 技 术 有 脉 码 调 制( p c m : p u l s e - c o d e m o d u l a ti o n ) ,嫡 编 码 ( e n tr o p y c o d in g ) ,预 测 编 码 ( p r e d i c ti v e c o d in g ) ,变 换 编 码( t r a n s f o r m c o d in g ) , 矢 量 量 化( v q : v e c t o r q u a n ti z a t io n ) 以 及 子 带 编 码( s b c s u b b a n d c o d in g ) . 这 几 类 编 码 技 术 是以 信 息 论 和 数 字 信 号 处 理 技 术 为 理 论 基 础 , 主 要 消 除 图 象 数 据 的 线 性 相 关 性 等 统 计 冗 余 信 息, 这 类 方 法 的 压 缩比 为1 0 - 2 0 倍 情 况 下 , 有 较 好的恢复质量。 脉 码 调 制 方 法只 是 对 原 始 模 拟 信 号的 一 种 数 字 表 示, 它 对 输 人 的 连 续 视 频 信 号 通 常 以n y q u i s t 速 率 采 样, 然 后 均 匀 量 化 。 由 于 脉 码 调 制 忽 略 了 像 素 之 间 的 空 间 和 时 间 相 关 性、 没 有 利 用 人 眼 的 视 觉 特 性, 同 时 它 又 对 所 有 幅 度 的 信 号电 平进行同 样的 处理, 因 而该方法的编 码效率不高。 嫡 编 码纯 粹 从信 号 统 计 特 性的 角 度 进 行 编 码, 是 一 种 无损的 编 码 方 法。 嫡 编 码的 基 本 原 理 是 给 出 现 概 率 较 大的 符 号 一 个 短 码 字, 而 给出 现 概 率 较 小 的 符 号 一 个 长 码 字, 这 样 就 会 使 最 终 的 平 均 码 长 很 小。 一 个 精 心 设 计的 嫡编 码 器 4 5 ,4 6 ) , 其 输 出 的 平 均 码 长 接 近 信 源 的 信 息 嫡, 即 码 长 的 下 限 。 常 用 的 嫡 编 码 方 法 有 游 程 编 码( r u n - le n 妙 c o d i n g ) , 哈 夫 曼 编 码( h u f f m a n c o d in g ) 和 算 术 编 码( a r ith m e t ic a l c o d in g ) 三 种。 常 见 的 应 用中 , 一 般 用 游 程 编 码 + 哈 夫 曼 编 码或游程编码+ 算术编码的组合形式对变换、 预测编 码后的图像系 数进行进一 步的编码。 预测编码有线性预 测和 非线性预 测两 类, 它 们可以 在一幅图 像内 进行 ( 帧 内 预测编 码) , 也可以 在多幅图 像之间 进行 ( 帧间 预 测编 码) 。 预测编 码基于图 像数据的空间和时间 冗余特性, 用相邻的已知 像素 ( 或图像块) 来预测当 前像 素 ( 或图 像块)的取值, 然后对预测误差进行量化、 编码。 线性预测编码又称 为差分脉冲编码调制 ( d p c m: d i f f e re n t i a l p u l s e c o d e m o d u l a t i o n ) .帧内预测 编码一般采用像素预测形式的 d p c m,其优点是算法简单,易于硬件实现; 其缺点是对信道噪声及误码很敏感,会产生误码扩散;同时帧内d p c m 编码 压缩比 很低。因此帧内 d p c m很少独立使用, 往往与其它方法结合使用。 帧 间预测编码利用了活动图像相邻帧之间的相关性,即利用图像数据的时间冗 余,因而可以获得比帧内预测编码高得多的压缩比。帧间预测编码一般是针对 图像块的预测编码,其采用的技术有帧重复法、阀值法、帧内插法、运动补偿 法和自 适应交替帧内 j 帧间编码法。 其中运动补偿预测编码法已被多种视频图 像编码标准采用。然而在实际的应用中,为了降低预测算法的运算复杂性和提 高预测精度, 一般要对图像进行分块后再预测,这会导致分块边缘不连续;此 电 子科技大学 博士 论文 ,.里.,纽曰奥已廷,.旦绝组里 外 , 预 测 编 码 对 图 像 序 列 的 不 同 区 域 的 编 码 效 果 不 一 样 , 特 别 是 对 快 速 运 动 区 , 其预测效果很差。 预 测 编 码 主 要 是 利 用 图 像 空 域 内 的 时 间、 空 间 相 关 性 来 进 行 压 缩, 而 实 践 表明 在 变 换域内 对图 像 进行 编 码, 使图 像数 据 在 变 换 域内 最 大限 度 地不 相 关, 是 一 种 更 加 有 效的 编 码 方 法。 尽 管 图 像 变 换 本 身 并 不 带 来 数 据 压 缩, 但 由 于 图 像 变 换 后 系 数 之间 的 相 关 性明 显 降 低, 图 像的 大 部 分 能 量 只 集中 到 少 数 几 个 变 换系 数上, 保留 上 述少数 几个重 要系 数 就能 够很 好 地 恢复出 图 像, 同 时 人 眼 几 乎 觉 察不出 那 些损 失的 系 数; 此 时 采 用 适当 的 量 化 和 嫡编 码 可以 有 效地 压 缩图像的数据量。 一种实用的变换编码方法是离散余弦变换 ( d c t : d i s c r e t e c o s i n e t r a n s f o r m ) 编码。经 d c t变 换后, 幅值较大的图像系数大多数集中在图像块 变换域的左上角,与其它系数相比, 这些系数具有的能量最大, 包括了图像的 大部分内 容。与此同时,图像块右下角的高频系数具有的较小的幅度, 只占 原 图像很小比例的能量。根据上述分布规律, 一般采用设定阀值的方法,置小于 阀值的变换系数为零,从而可大大提高编码效率。传统的变换编码方法,一般 就是采用设定阀值或粗量化来丢弃高频系数,从而提高压缩比。 然而高频系数 代表了图像数据的精细结构,丢弃过多的高频系数会导致图像的边缘轮廓模 糊。另一方面,传统的变换编码大多采用分块变换技术来降低运算的复杂度及 提高编码效率。图像块越大, 相关性越高, 压缩比相应就越高。但是分块的尺 寸太大又会丢失数据的平稳性, 包括丢失高频细节、引人沿物体边界的噪声 ( r i n g e f f e c t ) 和可见的d c t 图像边界 ( b l o c k e f f e c t ) ,总而言之,就是会导致 块效应。 矢量量化主要是利用图像数据的空间相关性来压缩数据的一种方法。矢 量量化是标量量化的推广,它把标量量化的分别量化单个采样值推广到把多个 采样值当成一个整体来量化。香农 ( s h a n n o n )曾经指出这样做的好处,即: 当码率给定时,如果维数任意大,矢量量化可以任意接近率失真下界。这一诱 人的结论使人们早在 8 0年代初就大量研究矢量量化在数据压缩中的应用。现 在它已经在语音,图象,视频压缩中广泛应用。由于矢量量化时我们只存储或 传输最佳匹配码字在码书中的索引号, 因而可以达到图像压缩的目的。归纳起 来矢量量化有以下四 个重要的特点: .它是一种可以渐近率失真界的方法。 2 .解码器简单。 电子 科技大 学博士论文 能够实现给矢量的 分量分配分数比 特。 它能够利用相邻的数据的统计相关性。 矢量量化器设计的一个重要方面是码书的 设计【 5 9 1 , 它直接影响量化器的 性能, 编码的 效率以 及实现的 复杂度。 l i n d e , b u z o . 和 g r a y 2 5 1 首先 创造性的 提出了 一 种码书的设计方法( 现在广泛 称之为l b g 算法) , 它 实际上是l l o y d 2 2 的最优标量量化器设计方法的 推广。 它首先给定一初始码书, 然后使用给定的 训练序列反复的迭代, 直到收敛;如果初始码书选择恰当 这样产生的码书就可 能是全局最优的码书。 但这样产生的码书 形状不规则, 码字的分布和训练序列 矢量的概率分布一致, 大部分情况下是非均匀分布。 采用矢量量化进行编码时, 最佳的匹配码字可以通过输人矢量和所有的码字比较,从而找到距离最小的码 字。 矢量量化器设计的 另一个 重要方面 是快速 搜索 算法的 设计 6 0 ,6 2 1 。 因 为寻 找最佳匹配码字的 计算世随矢量维数和码书尺寸指数增长, 这导致全搜索l b g 算法的实时实现很困难。 图像的子带编码是从语音的子带编码移植过来的。首先,它将图像信号 通过若干个带通滤波器, 从而将原始图像的频谱分成几个频段; 然后, 对不同 的频段采用不同的后续编码方法, 从而实现对不同频段不同失真度的压缩。因 为人类的视觉系统对噪声的敏感程度在不同的频段是不同的,因而可以 利用这 种生理现象对不同频段进行不同失真度的压缩。子带编码一般用一组滤波器将 图像数据分成各个频谱分量。其中低频段分量含有图像数据的大部分能量,可 以视为原始图像缩小的拷贝。 其余的频带依次升高的频谱分童包含了足以恢复 原图像清晰度所必需的边缘信息。由 于子带编码是对整幅图 像进行的,因而不 存在方 块效应。 此外, 可根据各子带的统计特性及其对人眼视觉的不同重要程 度,进行适当的比 特分配,从而选择最优的编码方案。子带编码的另一个好处 是,各子带可并行处理,因而误差不会在子带间扩散。 上面 讨论的编码方法是以信息论和数字信号处理技术为理论基础的,一 般把创门 称为第一代图象编码方法。 第二代图象编码方法不局限于信息论的框 架, 要求充分利用人类视觉系统的生理和心理特性以 及基于对图象内 容的理解 上获得高压缩比, 这类方法一般要对图 像进行预处理, 将图 像数据根据视觉敏 感性 进 行 分割。 分形编 码 ( f r a c t a l c o d i n g ) 、 模型 编 码 ( m o d e l - b a s e d c o d i n g ) , 小波编 码 ( w a v e l e t c o d i n g ) 可归人这 一类。 分形理论是欧氏几何相关理论的扩展,它描述了自 然界物体的自 相似性。 这 种自 相 似性数学上可以 用迭 代函 数系 统( i f s : i t e r a t e d f u n c t i o n s y s t e m ) 来 描述。分形图像编码的关键就在于寻找图像的i f s 码。在某些特定的应用中, 电子 科技大 学博士 论文 旦三里照巴,旦里里,亘互,里里 分 形 编 码 可 获 得 高 达1 0 0 0 0 倍 的 压 缩 比 , 而 对 某 些 图 像 1 它 可 获 得3 07 0 倍 的 压 缩 比 。 然 而 分 形 图 像 编 码 的 理 论 基 础 决 定 了 它 只 有 对 具 备 明 显自 相 似 性 或 统 计自 相 似 性 的 图 像( 如 海 岸 线、 云 彩 、 大 树 等 ) 才 有 较 高 的 编 码 效 率 , 一 般 图 像 并 不 具 有 这 一 特 性。 另 外, 分 形 图 像 编 码 的 编 码 算 法 十 分 复 杂, 这 也 限 制 了它的应用。 模型编码的基本出发点是在编、解码两端分别建立起相同的模型。基于 模型的编码器并不压缩实际的量化数据,而是采用一个表示景物 ( 如人、 人脸 等) 的模型, 传送的信息是告诉接收方如何改变模型以匹配输入景物 ( 如眨眼、 扭头等) 。基于模型的解码器也有一个与对应编码器相同的模型, 解码器利用 接收的数据调整其模型,然后生成供显示的图像。显然,模型编码方法的核心 是建立模型和提取模型参数,其中模型的选取、描述和建立是决定模型编码质 量的关键因素。基于模型的图像编码方法利用先验模型来抽取图像中的主要信 息,并以模型参数的形式表示它们,因而可以获得很高的压缩比。然而由于在 模型编码方法的研究中还存在着许多问题,因此该方法的实用化过程还有很长 一段时间。 小波的图像分解实际上是属于子带分解的一个特例,因此利用小波对图 像进行压缩的原理与子带编码方法是十分相似的。图像的小波分解首先将原图 像分解成不同的频率区域 ( 需指出的是,在对原图像进行多次分解时,总的数 据量与原数据量一样,不增不减) ;然后,后续的压缩编码方法根据人的视觉 特性以 及图像的统计特性,对不同的频率区域采取不同的压缩编码方法,从而 使数据量减少。由于变换的本质是多分辨率或多尺度的信号分析,它非常适合 视频系统对频率感知的对数特性,因此小波编码具有比子带编码更好的效率。 此外, 小波图像编码方法拥有传统编码方法的一些优点,它能够消除图像数据 中的统计冗余;同时小波变换后的图像数据能够保持原图像在各种分辨率下的 精细结构,这为进一步去除图像中其它形式的冗余信息提供了便利。正是由于 这些原因, 小波图像编码在较高压缩比图像编码领域非常被看好4 0 , 6 0 ,6 1 1 0 从去除图像冗余信息的角度可以看出,第一代图像编码方法主要侧重于 去除图 像数据的时间冗余和空间冗余,第二代图 像编码方法则侧重于去除图像 数据的视觉冗余、结构冗余和知识冗余。应该强调指出的是在一幅图像中, 各种冗余信息是并存的, 不能片面强调某种冗余形式在图像编码中的作用。因 此上述各种编码方法并不是彼此孤立的, 常常联 合使用, 比 如j p e g ( j o i n t p i c t u r e e x p e r ts g r o u p ) 标准 1 1 就 是d c t变 换 + 标量 量 化 + h u ff m a n 编 码 + 游 程 编码的 一 种混合编码方案。 h .2 6 x 2 ,3 1 和m p e g系 列标准 4 ,5 ,7 8 , 7 9 ! 是变换编 码+ 变长 编 电 子科 技大学博 士论文 一,里口口.绝丝,.,里里里旦里 码 + 运 动 补 偿 的 混 合 方 案 上 述 列 举 的 标 准 是 这 样 , 众 多 的 其 它 压 缩 方 法 也 如 此 , 比 如 文 献 6 7 是 小 波 变 换 与 矢 量 量 化 的 融 合, 文 献 6 5 是 子 带 编 码 与 有 限 状态矢量量化的融合等 除了 上文所提 及的 冗余, 还可以 从图 像之外的 设 备或规律的 冗 余来匹配 图 像 数 据的 时 间 冗 余, 从 而 达 到 压 缩图 像 数 据 的目 的。 本 文 就 是 讨 论在 卷 积 编 码的 情况下, 运用卷即 编 码对图 像数 据造成的 约束来压缩数据: 同 时结合其它 冗 余去除 方法如空域冗 余、 变换域冗余等来进一步 压缩数据。 基于 此, 本文主 要 讨论网 格编码量化、 网 格编码矢量量化及其在空 域、 变换域内 压缩静止图 像 的算法和应用。 1 . 2 论文的 组织 结 构 论文自 始至终贯穿着网格编码量化的思想,在此思想的指导下,分别从 信息融合的不同角度展开对图像压缩方法的研究。全文组织如下: 第二章是本文的一个重点,详细介绍了网格编码量化方法所涉及的基本 理论和网格编码量化在静止图像量化中的应用。 第一节从传统的标量量化方法 人 手, 简 要 地介绍了 后 面 要用到的l l o d y - m a x 算 法。 第二节系 统介 绍了网 格 编码调制 ( t c m ) 。由 于网格编码量化 ( t c q ) 是网格编码调制的 对偶 , 因此, 较好地掌握网格编码调制的思想有助于更好地理解网格编码量化。第三 节针对t c m和t c q都要用到的维特比 解码, 作了 详细的 介绍。 维特比 算法 是t c m和t c q提高 编码增益的关键。 在前面三节的 基础上, 第四 节 重点介 绍了网 格编码量化原理, 并对 t c q的 性能进行了分析, 第五节设计了网 格编 码量化的 算法, 第六节给出t c q在静止图像量化中的应用实例。 第三章是第二章介绍的t c q方法由 标量空间向矢量空间的直接拓展。 前 面三节分别就矢量量化的基本概念、 l b g算法、常用矢量量化方法作了一般 的回 顾。 在此基础上, 第四 节介绍了网 格编码矢量量化 ( t c v q ) 的 原理, 第 五 节 详细介绍了t c v q算法, 第六节则给出了t c v q在图 像量化中的 应用实 例。 前面两 章只 讨论了 空域应用t c q和t c v q的 情况。 从第四 章开始, 探 讨 在 空 域的 基础上, 运用 其它方法 来提高量化增益的 尝试。 第四 章讨论了在t c q 和t c v q基础上, 应用变换域内相关性进一步压缩量化数据的 新方法。 第一 节详 细介绍了 运用d c t 域t c q方法 进行编码、 解码的 方案, 并就此提出 其实 现 算法, 第二节应用上述算法进行了 仿真计算, 第三节在d c t 域t c q基础上, 电 子科技大学博 士论文 摈弃在d c t 域单个量化的做法, 而是应用矢量量化的 方法, 把d c t 域作为一 个矢量 进行 量化。 根据上述思路, 本节详细 讨论了d c t 域t c v q的 实现算法。 第四节则给出第三节算法进行量化的仿真结果。 第五 章 从 嫡编码的角度, 在t c q和t c v q基础上分别运用块编码的 方法 进行量化的 方案,即 二维t c q和 二维t c v q 。 其中 第一节阐 述了 块编 码理论, 第二节 到 第四 节论述了 二维 t c q的 原理、 算法和仿真结果。 第五节到 第七 节 则论述了二维t c v q的原理、算法和仿真结果。 第六章引人不等误差保护的思想,对不等重要性的图像系数进行不等重 要性的量化。 图像数据在 d c t变换后大部分能量集中 在低频系数,高 频系数 所对应的能量则较小。 具体表现为,直流力量很大,而高频系数则较小。因为 直流分量所占的比 重很大,对其量化所引起的误差将对恢复图像产生比较直接 的影响, 因 此有必要对此直流分量进行精细的 量化, 而对高频分量进行粗量化。 本章第一节阐述了算法的基本思想,第二节描述了算法具体的实现,第三节则 该出了 仿真结果,最后第四节是本章小节。 1 . 3 本文的 研究工作和 论文的贡 献 本文研究使用网格编码调制的方法来量化图像的新方法。在此思想的指 导下,从信息融合的角度,融合标量量化、矢量量化、d c t变换,不等误差 编码等方法,以实现对量化图像的最大压缩。论文的主要内容包括: i .在详细分析网格编码量化的原理的基础上,提出用网格编码量化方法 压缩静止图 像的算法 ( 见“ 网格编码量化及其在静止图像量化中的应用” 一文, 将发表于电子科学学刊) 2 .充分利用 d c t变换后图像频谱的分布规律,提出 d c t域网格编码量 化算法 ( 见“ d c t域网格编码量化及其 在静止图 像量化中 的应用” 一文, 将 发表于信号处理) 。 3 . 在d c t变换后标量量化的基础上,更进一步从矢量量化的角度, 提出 d c t 域网 格编码矢量量化算法 ( 见“ d c t 域网 格编码矢量量化”一文, 将发表 于信号处理) 。 4 ,从嫡编码的角度, 应用块编码的方法, 提出二维网 格编码量化算法 ( 见 “ 二维网 格编码量化在静止图像量化中的应用” 一文,将发表于电子科学学 刊) 。 电子 科技大学博士 论文 ,巴,巴里巴巴旦里巴巴纽悠口, 5 . 从 嫡 编 码和 矢 量 量 化的 角 度, 应用 块编 码的 方法, 提出 二 维网 格 编 码 矢量量化算法 ( 见“ 二维网 格编码矢量量化在静止图像量化中的应用” 一文, 将发表于信号处理) 。 6 .提出用网格编码矢量量化方法压缩静止图像的算法 ( 见 “ 网格编码矢 量量化及其在静止图像量化中的应用” 一文,已投电子科学学刊) 7 .从不等量化误差保护和去除空间冗余的角度,提出改进的d c t域网格 编码矢量量化算法,( 见 “ 改进的 d c t域网格编码矢量量化” 一文,己投电子 学报) 电子 科技大 学博士论文 第二章 网格编码量化 在信源 编码和调制理论中 存在许多并行和相似之处。比 如, 它们都用到信 号空间的概念、都用到网格编码理论、也都不约而同地用欧氏距离和均方误差 评 价 性 能的 好 坏。 与 此 同 时, 在网 格 编 码 调 制 17 ,8 ) ( t r e ll i s c o d e d m o d u l a t i o n , 简称 t c m) 能有效提高编码增益,以及用联合编码提高整体性能的启发下, 一种利用扩展信号空间增大欧氏 距离的网格编码量化1 1 5 , 1 6 ) ( t r e l l i s c o d e d q u a n t i z a t i o n , 简称t c q ) 方法被开发出 来, 并 被用于静止图 像的 量化。 网 格编 码 量 化是 标量 量 化 ( s c a l a r q u a n ti t y , 简 称s q ) 的 一种, 它是 利用 网格编码调制的方法来实现量化的一种方法。具体地讲,它是用维特比 ( v i t e r b i ) 解码 2 2 的 方法, 在扩展的量化空间中,以 块量化的 思路搜索总体 失真最小的量化序列来作为输人量化块的量化值。 2 1 标量量 化 众所周知, 模拟图像经过抽样处理后, 只是在空间上形成离散的像素阵列, 而每一个 像素的亮度值任然是个连 续量, 必须把它转化为有限个离散值, 并对 这有限个离散值用不同的 码字来代替才能成为真正的数字图像。 我们称上述对 单个像素进行数字化的过程叫标量量化( s q ) o 最简单的标量量化方法是均匀量化。在均匀量化时,将每一个像素的幅度 与一组判决电 平作比 较, 如果该幅度值落在两个判决电平之间, 那么就将该幅 度用某一固定电平来表示。 通常将这一固 定电 平取为该幅度所在区间的两端判 决电 平的中间 值。只 要输人图像的 幅度f 落在两个判决电 平d * 和d _之间, 其 量化值就是某一固 定值人。 显然, 如果事先固 定判决电平和 量化器输出电平, 则对不同的图 像输人信号, 其量化误差了 一 几 是不同的。因 此, 人们研究是量 化误差最小的量化方法,称为最佳量化。 d o d , d , d k d k + i d , - i d , 少 一 i i - + -i f f 一i 1 - it t l”甲一一甲俐 图2 . 1量化的分层示意图 常用的 最佳量化器的 设计方法是一种客观的 计算方法, 它 根据量化误差均 电子 科技大学博士 论文 方值最小的设计原则, 计算出判决电平和量化器的输出电平值。 该方法最早由 l lo d y _ m a x 提出 , 因 而 又 称 为m a x 量 化 方法 。 设f 和f 分 别为 输 人图 像的 亮 度和对该亮度的 量化值,p ( f ) 为 输人图 像亮度的概率密度函 数, 其中f 的 取值 范围 在。 : 一 a , 之间,于 是有 厂 p (f )df “ ( 2 - 1 ) 再 设量 化总 层数 为j , 判 决电 平 为d , (k = 0 ,1 , . ., j ) , 如图2 . 1 所 示, 则当 d , 5 f 5 d。 时, 量 化 值为大, 量 化误 差为f 一 f t 。 按均 方 误差 最小的 设 计 原 则, 就是要使 : 一 e (f 一 f ) = 厂 (f 一 f ) n (f )df = 其 f (f 一 、 ) p (f )df ( 2 - 2) 最小, 其中e ( ) 表示对括号内的随机量取数学期望。一般情况下,量化分层数 j 较大, 此时 ( 2 - 2 ) 式中的p ( f ) 在各量化分层内 可视为常数。 根据求极值方 法, 分 别对d 。 和大 求导,即 可求 得: d , = 合 (大 十 大 +:)k = 0 ,1,一 ( 2 - 3) .1 f p ( f ) d f : 二 一f dd* ( 2 - 4) 户p (f )df 由 式( 2 - 3 ) , ( 2 - 4 ) 可以 看出, 第k 点的 判决电 平d , 等于两相邻判决电 平的“ 重 心” 。当a f ) 和f 的限 定范围。 : 一 。 , 给 定后, 可以 用递归方法 求解方程 ( 2 - 3 ) , ( 2 - 4 ) , 从而 求出d * 和大。 静 止图 像的 最 佳 标 量量化 就是 利用 上 述 l l o d y - m a x算 法, 根 据 量化 码书 尺 寸大小,即量化层数对整幅图像进行训练,从而可训练得到不同码书尺寸下的 量化码 字几 和 量化区 间 值d , 。 根 据所得 量化码字几 和 量 化区 间 值d , , 原始图 象就可以表示成用量化码字表示的量化序列。 2 . 2网 格编 码调制 网格编码量化是在网格编码调制的基础上发展起来的一种量化方法,因 此,深刻了解网格编码调制的思想有助于更好地理解网格编码量化。通常所说 的差错控制编码和解码是与发送端调制和接收端解调分开完成的。然而,早在 电 子科技大学博士论文 1 9 7 4 年 梅 西 ( m a s s e y ) 就 根 据 香 农 信 息 论, 第 一次 证明 了 将 编 码与 调 制 作为 一个整体考虑时的最佳设计,可以大大改善系统的性能。后来,昂格尔博克 ( u n g e r b o e c k ) 、 今井秀树等 在7 0 年代后期也进行了 这方面的 研究, 并与1 9 8 2 年提出了利用码率为i ii / in + 1 的格状码 3 8 1( 卷积码),将每一码段映射为具 有2 个调制信号集中的一个信号。同时,在接收端,信号解调后经反映射, 变换为卷积码的码序列,并送人维特比 解码器进行解码。 这种编码与调制相结 合的方法,就叫网格编码调制。这种方法在不增加带宽和相同的信息速率下可 获得3 一 6 d b的编码增益。 由纠错码理论可知, 汉明距离通常被用来描述分组码或卷积码的抗干扰性 能。而 在t c m 中,系统的 误码率取决于信号序列之间的欧几里德距离 ( 简称欧 氏距离),因而编码的作用就是要增加这个距离,从而才能改善系统的误码率 性能。 然而,当编码与调制作为一个整体考虑时,对于具有最大汉明距离的卷 积码, 已 调信号不 一定具 有最大的 欧氏 距离。 考虑输人2 位、 输出3 位、 约束 长度为m的卷积编码器( 3 , 2 , m ) 的 翰出 码组与8 p s k 信号空间中 信号点的 对应关 系 , 参见 图2 . 2 , 可 以 看出 不 同 信 号 点 之 间 的 欧氏 距 离 有4 种 : a , e 2 和 3 , 而3 个 码元 组 成的8 个 码组 之间的 汉明 距 离只 有3 种;d a = l , d , = 2 , d 3 = 3 。 因 此, 无论采用什么映射规则, 总会出 现这样一种情况: 两个汉明距 离较大的码组所对应的信号点之间的欧氏距离,比两个汉明距离较小的码组所 对应的 信号点之间的欧氏 距离还要小。图2 . 2 中( 0 0 0 ) 和 0 1 1 ) 之间的汉明 距离 比( 0 0 0 ) 和( 0 1 0 ) 之间的汉明距离大,然而两者之间的欧氏距离却分别是 o a f ,a 2 = 2 + t, 即 前 者 比 后 者 小 。 从 而 可 以 得 出 , 即 使 不 是 汉 明 意 义上的最佳卷积码, 也能使已调信号之间的最小欧氏距离最大。因此,寻找具 有最大自由 欧氏 距离的 卷积码, 使映射信号之间的最小欧氏距离最大的方法, 就成为实现t c m 的关键之所在。 图2 . 2 ( 3 ,2 , m ) 码的 码组与8 p s k 信号空间中 信号点的 对 应 关系 电子 科技大学博士 论文 一为 了 解 决 上 述 问 题 , 必 须 将 编 码 器 和 调 制 器 当 作 一 个 统 一 的 整 体 进 行 综 合 设计, 使编码器和调制器级联后产生的编码信号具有最大的欧氏 距离。 从信号 空间的角度来看, 这种最佳编码调制器的设计,实际上是一种对信号空间的 最 佳分割。通常, t c m 最优码是按照编码信号的网格图来确定。当一个t c m 最优 码确定后,若要实现该t c m 码的编码调制器,可以采用两种方法:一种方法是 先确定编码器结构, 再根据网 格图确定编码符号到调制信号的映射函 数; 另一 种方法先确定从编码符号到调制信号的映射函 数, 再根据网格图设计出 相应的 纠错编码器这两种方法的关键都是要确定映射规则。对于多电平/ 多相位的 二维信号空间, 采用集合划分映射3 9 是合适的。 b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 为奥运助力活动方案策划
- 北京大数据营销方案策划
- 医院单位团建活动策划方案
- 农村电影活动服务方案策划
- 新都建筑维修方案设计团队
- 药厂能源管理课件
- 季节班幼儿活动方案策划
- 老鸭粉丝汤创业计划书
- 心理咨询预算方案
- 寺庙建筑配色方案设计意图
- 海运订舱基础知识培训课件
- 公安机关人民警察执法资格(高级)考前点题卷一
- 人力资源管理SOP标准化流程手册
- 2025-2026学年人教鄂教版(2024)小学科学三年级上册(全册)教学设计(附目录P137)
- 2025-2030中国家政服务业社区化发展与本地化服务模式探讨
- 2025年翼状胬肉试题及答案
- 2025年Q2起重机司机模拟考试题库(附答案)
- 道路绿化监理规划方案(3篇)
- 沥青混凝土供货方案及保障措施
- (高清版)T∕CES 243-2023 《构网型储能系统并网技术规范》
- 注册城乡规划师之城乡规划原理题库及答案(押题版)
评论
0/150
提交评论