(计算机软件与理论专业论文)嵌入式零树小波编码算法的改进与应用研究.pdf_第1页
(计算机软件与理论专业论文)嵌入式零树小波编码算法的改进与应用研究.pdf_第2页
(计算机软件与理论专业论文)嵌入式零树小波编码算法的改进与应用研究.pdf_第3页
(计算机软件与理论专业论文)嵌入式零树小波编码算法的改进与应用研究.pdf_第4页
(计算机软件与理论专业论文)嵌入式零树小波编码算法的改进与应用研究.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(计算机软件与理论专业论文)嵌入式零树小波编码算法的改进与应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 视觉在人类感知中起着极为重要的作用,而视觉感知的结果和表现形式 图像,是人类认识世界的重要信息来源,因此图像已成为多媒体技术中最为重要 的数据类型。图像的处理与分析技术发展迅速,已发展成为现代信号处理技术中 的专门分支学科,因此有必要对其进行专门的技术研究。近年来,随着小波理论 的发展和应用,将它用于图像处理上面比起以前的方法取得了很大的进步。因此, 将小波变换用于图像处理,特别是用于图像压缩,是人们一直很感兴趣的问题, 这也是本文要对其研究和讨论的原因。 本文以图像压缩算法为主要研究对象,在小波变换理论的基础上,对基于小 波变换的嵌入式零树编码算法进行了深入的研究和讨论。主要内容为: 1 介绍和讨论了数字图像压缩编码所涉及的基本理论和方法,包括了图像压 缩编码的研究现状、基本原理以及一些常见的压缩方法、算法及其发展趋势,并 讨论了一些经典压缩编码方法的国际标准。 2 在小波变换理论的基础上,详细讨论了小波图像压缩技术。其中重点介绍 和讨论了基于小波变换的嵌入式零树编码( e z w :e m b e d d e dz e r o t r e e sw a v e l e t ) 算法。根据对小波系数特点的分析指出了e z w 算法的缺点和不足,并在此基础上 对e z w 算法进行了改进。提出了两种改进方案:第一种方案从e z w 算法的扫描 方法入手,通过“剔除”重要系数使得改进后的算法提高了原算法的编、解码时 间和压缩比;第二种方案在第一种方案的基础上深入,从小波分解后的最低频子 带入手,通过对其单独编码和设置标志矩阵使得改进后的算法很好地提高了图像 质量和编码效率。两种改进方案均通过实验得到了验证。 3 针对e z w 算法的不足引入了人眼视觉系统模型( h v s ) ,提出了一种基于 人眼视觉特性的小波变换压缩编码算法,并通过实验验证了该算法即能保持原有 零树算法良好的压缩品质,又能很好地改善图像的视觉质量。 关键词:图像压缩算法,小波变换,e z w 算法,人眼视觉特性 a b s t r a c t a b s t r a c t i m a g ei so n eo ft h em o s ti m p o r t a n td a t ai nm u l t i m e d i at e c h n o l o g y t h ei m a g e p r o c e s s i n ga n da n a l y s i sh a v ed e v e l o p e dt ob et h es p e c i a l i z e db r a n c ho ft h em o d e r n s i g n a lp r o c e s s i n gt e c h n o l o g yw i 廿li t sr a p i dd e v e l o p m e n t s oi ti sn e c e s s a r yt or e s e a r c h t h es p e c i a l i z e dt e c h n o l o g y i nr e c e n ty e a r s ,w i t ht h ed e v e l o p m e n to fw a v e l e tt h e o r ya n d a p p l i c a t i o n , t h ew a v e l e ti m a g ep r o c e s s i n gh a sm a d eg r e a tp r o g r e s si nc o m p a r i n gw i t h t h ef o r m e ri m a g ep r o c e s s i n gm e t h o d s t h e r e f o r e ,p e o p l eh a v ea l w a y sb e e nv e r y i n t e r e s t e di nt h ei s s u et h a tw a v e l e tt r a n s f o r mi su s e di ni m a g ep r o c e s s i n g , p a r t i c u l a r l yi n i m a g ec o m p r e s s i o n t h i si sa l s ot h er e a s o nw h y t h ep a p e ri sg o i n gt or e s e a r c ha n d d i s c u s st h i s i nt h i st h e s i s ,i m a g ec o m p r e s s i o na l g o r i t h mi st h em a i nr e s e a r c ho b j e c t t h eb a s i c w a v e l e tt r a n s f o r mt h e o r yh a sb e e na n a l y z e d t h e ne z w i m a g ec o m p r e s s i o na l g o r i t h m b a s e do nw a v e l e tt r a n s f o r i l li sr e s e a r c h e da n dd i s c u s s e d t h em a i nr e s u l t sa r ea sf o l l o w s : 1 p r e s e n ta n dd i s c u s st h ed i g i t a li m a g ec o m p r e s s i o nm e t h o d ,t h er e s e a r c h b a c k g r o u n da n dt h ei n t e r n a t i o n a ls t a n d a r d so fs o m ec l a s s i cc o d i n gm e t h o d s 2 d i s c u s st h ew a v e l e tt r a n s f o r mc o d i n gb a s e do nw a v e l e tt r a n s f o r mt h e o r ya n d t h ee z w a l g o r i t h mi st h eh i g h l i g h t r e g a r d i n gt oi t ss h o r t c o m i n g sa n dd e f i c i e n c i e s ,t w o i m p r o v e da l g o r i t h m sb a s e do ne z wa l g o r i t h mi sp r e s e n t e d t h en e wt w oa l g o r i t h m s i m p r o v e t h ec o d i n ga n dd e c o d i n gt i m ea n dt h ee x p e r i m e n th a sv e r i f i e di t 3 a ni m p r o v e dw a v e l e tt r a n s f o r mc o d i n gb a s e do ne z wa l g o r i t h mi sp r e s e n t e d a f t e rt h eh u m a nv i s u a ls y s t e m ( h v s ) i si n t r o d u c e d t h ee x p e r i m e n tr e s u l th a sv e r i f i e d t h ee f f e c t i v e n e s so ft h en e wi m p r o v e da l g o r i t h m t h ei m p r o v e da l g o r i t h mn o to n l y b e a r st h ee f f e c t i v ec o m p r e s s i o np e r f o r m a n c eo ft h eo r i g i n a le z wa l g o r i t h m ,b u ta l s o i m p r o v e st h ev i s u a lq u a l i t yo fi m a g ev e r y w e l l k e y w o r d s :i m a g ec o m p r e s s i o na l g o r i t h m ,w a v e l e tt r a n s f o r m , e z wa l g o r i t h m ,h u m a n v i s u a lc h a r a c t e r i s t i c s 主要术语表 主要术语表 v 表索引 表索引 表3 1 三种变换的特征比较2 1 表4 1e z w 算法和改进算法的效果比较4 0 表4 2e z w 算法和改进算法的性能比较4 4 表5 - i 小波变换系数的视觉加权值5 0 表5 2 三种方式的性能比较5 2 表5 3 主观评分标准5 2 表5 - 4 主观评价分数表5 3 v 图索引 图索引 图i - i 编码方法的分类2 图2 - 1 亚采样数据压缩例子6 图2 - 2 图像压缩系统模型7 图2 - 3d p c m 编解码原理方框图1 0 图2 - 4j p e g 编解码框图1 4 图3 - 1 数字图像两级小波分解流程图2 7 图3 2 小波图像压缩方法基本框图2 8 图3 3 原始图像、一级小波分解图的直方图2 8 图3 - 4 一级和二级子带的数据直方图2 9 图4 1 小波树状结构3 2 图4 - 2 子带及小波系数的扫描顺序3 3 图4 3e z w 算法中小波系数编码流程图3 4 图4 - 4e z w 算法效果比较图3 6 图4 - 53 级小波分解系数图3 8 图4 - 6 剔除1 次重要系数图3 9 图4 - 7 剔除2 次重要系数图3 9 图4 - 8 利用标志矩阵扫描流程图4 2 图4 - 9 利用标志矩阵扫描流程图4 3 图4 - 1 0 实验结果比较图4 5 图5 - 1 原始图像和重构图像效果比较图4 6 图5 - 2 人眼视觉系统图4 7 图5 - 3 人眼结构示意图4 7 图5 - 4d p c m 预测4 9 图5 - 5 编码系统框图5 1 图5 - 6 重构图像效果对比图5 3 v l 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 日期:2 l c 刃多年乡月2 孑日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:导师签名: 日期:7 0 0 第一章绪论 1 1 研究的背景和意义 第一章绪论 视觉在人类感知中起着极为重要的作用,而视觉感知的结果和表现形式 图像,能给人们以直观而具体的物体形象,是人类认识世界的重要信息来源,因 此,图像已成为多媒体技术中最为重要的数据类型。图像的处理与分析技术已发 展成为现代信号处理技术中的专门分支学科。由于图像信息丰富、数据量大,因 此,为满足实际应用需要,有必要对图像数据进行压缩处理,特别是在网络高速 发展的今天。如今,每天都有大量的信息在网上进行传送,而其中大量的信息是 以图像形式存储的,所以研究数据图像的压缩比研究数据的传输和存储具有更为 突出的实用价值和商业意义。 小波变换是一种新的分析方法,它是继傅立叶变换之后基础数学和应用数学 完美结合的又一光辉典范。自从1 9 8 9 年s m a l l a t 首次将小波变换引入图像处理以 来,小波变换以其优异的时频局部能力及良好的去相关能力在图像压缩编码领域 得到了广泛应用,并取得了良好的效果。因此,图像压缩是小波分析应用的一个 重要方面,它的特点是压缩比高,压缩速度快,压缩后图像的性能好等【1 1 。正因为 这些对图像压缩有重要决定作用的优点,小波图像压缩技术现在越来越多的被讨 论和研究。 1 2 图像压缩的发展和研究现状 图像压缩所解决的问题是尽量减少表示数字图像时需要的数据量,减少数据 量的基本原理就是除去其中多余的数据。从数学的观点来看,这一过程实际上就 是将二维像素阵列变换为一个在统计上无关联的数据集合【2 】。人们对图像压缩开始 感兴趣可以追溯到上世纪四十年代。最初在这一领域研究的焦点集中在建立一种 模拟的方法以便减少视频传输所需要的带宽。这一过程称为带宽压缩。数字式计 算机的出现和后来先进的集成电路的发展,导致了这方面研究的重点从模拟方式 转移到数字压缩方法上来。 从1 9 4 8 年o l i v e r 提出p c m 编码理论开始,迄今已有半个多世纪的历史,人 电子科技大学颐士学位论文 们已研究并提出各种各样的压缩方法。荔,统计,压缩编码方法多达3 0 - - 4 0 种。按 压缩技术所依据和使用的数学理论和计算方法进行分类,可分为统计编码 ( s t a t i s t i c a lc o d i n g ) 、预测编码( p r e d i c t i v ec o d i n g ) 和变换编码( t r a n s f o r n lc o d i n g ) 三大类;按压缩过程的可逆性分为有损压缩( 熵压缩e n t r o p yc o m p r e s s i o n ) 和无 损压缩( 冗余度压缩r e d u n d a n c yr e d u c t i o n ) 两类。按照时间的顺序以及从理论的 角度来看,编码方法可如图卜1 所示进j 二二分类:其中“第一代 ( 经典) 编码方法 是以信息论和数字信号处理技术为理论基础;“第二代编码方法是利用人的视觉 生理、心理和图像信源的各种特征进行编码;过渡编码技术原理上仍属于线性处 理,属于“波形 编码,可归入经典编码方法,但它们又充分利用了人类视觉系 统的特性,因此可以被看作是“第一代 编码技术向“第二代 编码技术过渡 的桥梁。 “第一代 编码方法 一僻纛编码 “第二代 编码方法 图卜1 编码方法的分类 就本文所涉及的小波变换编码而言,主要进展如下。 小波变换压缩编码自从s h a p i r o 的e z w ( 嵌入零树小波) 算法【3 j 提出之后得到 了广泛的关注与研究,并取得了很多成果。s a i d 和p e a r l m a n 的s p i h t 算法【4 】利 用位平面分层划分的方法,间接实现了空间小波树的比特平面排序,有效地减少 位平面的编码符号集的规模,提高了压缩比。不同于前者,基于形态学聚类编码 2 码 码 码 编 编 编 测 换 计 预 变 统 厂j、l 码 码 编 编 码 码 的 的 编 编 割 络 的 的 分 网 形 型 域 经 分 模 区 神 于 于 于 于 基 基 基 基 ,c、l 第一章绪论 重要图有s l c c a 压缩算法【5 j 和m r w d 算澍6 1 。基于率失真意义下的优化方法有 x i o n g 等人提出向一空频量化( s f q ) 算、法【7 】,和e z w 、s p i h t 相比,尽管p s n r 有 了明显的提高,但图像的主观质量相差不大。t a u b m a n 使用了优化截断点的嵌入 块编码方法( e b c o t ) 【8 】对图像进行编码,e b c o t 是先将每个子带分成相对独立 的码块,然后使用优化的分层截断算法对这些码块进行编码。图像的压缩码流不 仅具有p s n r 可分级性,而且具有分辨率的可分级性。相比较,e b c o t 的复杂度 比e z w 和s p i h t 高,但性能有所提高。所以e b c o t 算法的基本思想已经应用于 j p e g 2 0 0 0 方案中。需要说明的是,分层嵌入压缩中每个系数要处理很多次,因而 时间复杂性很大。现在已有新的算法针对e b c o t 算法的缺点进行了改进。 由于e z w 算法充分利用了小波变换图像的良好性质,因此引起了图像数据压 缩领域的广泛关注。但是,e z w 算法也存在着很大的缺陷,主要包括:编码效率 低、编码时存在重复编码、重构图像的视觉质量差等。针对e z w 的这些缺陷,现 阶段已经提出了不少改进算法。具体来讲,改进策略主要在以下几个方面:( 1 ) 关于量化或逐次量化策略的改进;( 2 ) 关于零树的生成和扫描方法的调整;( 3 ) 和人眼视觉特性相结合的小波变换压缩编码;( 4 ) 高频和低频变换数据处理的改 进;( 5 ) 和其它压缩编码方法结合:与分形结合,与游程编码结合,与塔形编码 和矢量量化的结合等。 s h a p i r o 的e z w 算法已被认为是二维静态图像变换编码领域最好的算法之一。 因此现阶段很多新的小波压缩编码算法都是建立在e z w 算法基础上并加以改进 的,这点从上文的论述可以看出。但是,这些新提出的改进算法在改善e z w 算法 某些缺陷的同时,自身也存在着其它方面较大的缺陷。比如为了追求编码效率而 牺牲了图像质量,或者只是单纯地从理论方面进行改进,不适合具体的工程应用。 总之,随着小波理论的不断完善和图像压缩算法的不断发展,应用小波变换 进行图像压缩已经成为图像编码领域的研究热点。人眼视觉系统等新技术的引入 更加扩展了这一领域的研究内容,具有很大的发展空间。在对嵌入式零树小波编 码算法进行相关改进这一领域中有很多有价值的工作可以展开。本文在对这一研 究课题回顾和总结的基础上对一些新的研究内容进行了探讨,目的是研究对e z w 算法的改进方案不仅在现阶段具有良好的性能,同时还具有能应用的现实意义。 1 3 论文研究工作概要 由于小波变换图像压缩算法的重要意义和作用,本文的主要工作都围绕着小 电子科技大学硕士学位论文 波理论及其在图像压缩上的应用展开。在整个硕士论文期间,重点放在图像压缩 编码中的e z w 算法及其相关的改进上面。本文的主要工作以及创新如下: ( 1 ) 根据近些年发表的文章,系统整理了数字图像压缩编码的基本理论和方 法,并讨论了一些经典压缩编码方法的国际标准。 ( 2 ) 在小波变换理论的基础上,讨论了小波变换压缩编码,其中重点研究了 基于小波变换的嵌入式零树编码( e z w :e m b e d d e dz e r o t r e e sw a v e l e t ) 算法。接 着分析了e z w 算法的缺点和不足,并在此基础上对e z w 算法进行了改进。提出 了两种改进方案,一种方案提高了e z w 算法的编、解码时间和压缩比,另一种方 案很好地提高了图像质量和编码效率。两种方案均通过实验得到了验证。 ( 3 ) 在引入了人眼视觉系统模型( h v s ) 之后,提出了一种基于人眼视觉特 性的小波变换压缩编码算法,并通过实验验证了该算法即能保持原有零树算法良 好的压缩品质,又能改善图像的视觉质量。 1 4 本论文的章节安排 全文共分六章。 第一章是绪论,介绍本文所涉及课题的研究背景和意义、国内外研究现状、 作者的主要工作以及整个论文的章节安排。 第二章介绍图像压缩编码所涉及的基本理论和方法,包括图像压缩编码的基 本原理以及一些常见的压缩方法和算法及其发展趋势,并讨论了一些经典压缩编 码方法的国际标准。 第三章首先介绍y d , 波理论的基础知识。接着重点讨论i d , 波图像压缩技术, 包括图像压缩中使用小波变换的优越性以及基于小波变换的图像压缩编码算法 等。 第四章和第五章是本文的核心部分。第四章首先详细阐述了嵌入式零树小波 压缩编码( e z w ) 算法。接着分析了e z w 算法的缺点和不足,并在此基础上对 e z w 算法进行了改进。最后通过实验对改进算法进行了验证。 第五章首先介绍了人眼视觉系统模型( h v s ) ,包括人眼的构成,成像原理以 及人眼视觉特性等。在此基础上,将重点讨论本文作者所提出的一种基于视觉特 性的小波变换压缩编码方案及其实验效果。 第六章是总结部分,对全文进行总结并对进一步的研究工作做了分析,包括 未来的发展方向以及自己的一些思考。 4 第二章数字图像压缩编码基础 第二章数字图像压缩编码基础 2 1 数字图像压缩的必要性和可能性 在人类接受的信息中,视觉信息占7 0 9 6 以上【9 】,一幅图胜过千言万语。然而, 数字图像文件的数据量十分巨大,如在中分辩率( 6 4 0 4 8 0 ) 下,播放1 秒钟的全屏 幕显示、真彩色( 2 4 位) 、全动作( 2 5 3 0 帧秒) 视频画面的数据量为: 6 4 0 x 4 8 0 3 3 0 = - 2 7 6 4 8 0 0 0 字节即2 6 3 7 m b 。 即使降低彩色性逼真要求,量化为8 位灰度,每秒显示2 5 帧,数据量也达7 3 3 m b 。如此庞大的数据量,给图像的读 取、存贮、传输、分类、检索等造成了难以克服的困难。然而图像压缩技术为解 决这些困难提供了可能。面对数据量巨大的数字化图像的传输、存储、处理和交 换等问题,图像压缩编码成为当今通信和信号处理领域的一个重要研究课题。 数字图像压缩的目的是减少表示图像所需的比特数,更有效地表示图像,以 便于图像的处理、存储和传输。通过时间域的压缩,较快地传输各种信源;通过 频率域的压缩,在现有的通信线路上传输更多的并行业务,如电视、传真、电话、 电报、可视图文等;通过能量域的压缩,降低发射机功率;通过空间域的压缩, 节省存储空间等。 由于在图像数据内部存在着大量的冗余,所以数据压缩又是可能的。 下面拿一张风景画进行具体分析。首先注意到画的上方是蓝色的天空( 规则 的并且均匀着色) ,这里就含有空间冗余,即一幅图像内部的相邻像素之间的大量 高度相关的信息。压缩空间冗余的另一个例子是行程编码方法。例如,一个文本, 压缩前:a b c c c c c c c c d e f g g g ,压缩后:a b c18 d e f g g g ,字符长度由1 6 压缩为1 l 。又如,对于黑白图像,把每一行像素分为:白段,黑段,白段,黑段, 然后,每一段像素使用其长度值来表示:计数1 ,计数2 ,计数3 ,计数4 ,。 其次注意到画中的天空上是朵朵白云,这里就含有结构冗余。结构冗余是指图像 的部分区域内存在着非常强的纹理结构,或是图像的各个部分之间存在有某种关 系,例如自相似性等,而云就具有自相似性。另外,注意到画中有天空、大地、 树木、花草,其相对位置是固定的,这便是知识冗余。知识冗余是指图像中包含 某些与先验的基础知识有关的信息。除了这些以外,一般图像中还包括信息熵冗 余和视觉冗余。 5 电子科技大学颐十学位论文 信息熵冗余,我们由信息论的有关屠:理可知,为表示图像数据的一个像素点, 只要按其信息熵的大小分配相应的比特数即可。然而对于实际图像数据的每个像 素,很难得到它的信息熵,因此在数据化一幅图像时,对每个像素是用相同的比 特数表示,这样必然存在冗余。信息熵冗余和空间、时间冗余统称为统计冗余, 因为它们都决定于图像数据的统计特性。 视觉冗余,我们知道在大多数情况下,重建图像的最终接收者是人的眼睛。 虽然我们的视觉系统是目前为止世界上最好的图像处理系统,但它远远不是完美 的。人类的视觉系统对于图像的注意是非均匀和非线性的,特别是人类的视觉系 统并不是对于图像中的任何变化都能感知,在一定范围内的图像失真是不能被人 眼所察觉的。可以利用人的某些视觉不敏感性或者容忍性进行有损压缩,例如图 像压采样( s u b s a m p l i n g ) 【l0 1 ,一组像素用一个像素来表示,降低图像的分辨率, 达到压缩的目的,如图2 一l 所示。 1 11 21 51 4 1 21 31 55 2 1 25 25 l5 1 5 65 65 55 4 1 11 5 1 25 1 图2 - i 亚采样数据压缩例子 另外,对于视频序列而言,还存在着时间冗余,即视频序列中的各帧图像之 间存在的大量高度相关的信息。例如工业监视图像,各帧间的差别是很小的。 综上所述,在图像压缩中存在:空间冗余、时间冗余、信息熵冗余、视觉冗 余和结构冗余等。这些形式的冗余是编码压缩图像的出发点,使得我们压缩图像 不仅是必要的,而且是可能的。 2 2 图像压缩模型和评价准则 2 2 1 图像压缩模型 如图2 2 所示,一个图像压缩系统包括两个不同的结构块:一个编码器和一个 解码器。图像f 【x ,y ) 输入到编码器中。这个编码器可以根据输入数据生成一组符号。 6 第二章数字图像压缩编码基础 在通过信道进行传输之后,将经过编码的表达符号送入解码器,经过重构后,就 生成了输出图像 f 【x ,y ) 。一般来讲, f c x ,y ) 可能是也可能不是原图像f 【x ,y ) 的准确 复制品。如果输出图像是输入的准确复制,系统就是无误差的或具有信息保持编 码的系统;如果不是,则在重建图像中就会呈现某种程度的失真。 编码器解码器 图2 - 2 图像压缩系统模型 图2 - 2 显示的编码器和解码器都包含两个彼此相关的函数或子块。编码器由 一个消除输入冗余的信源编码器和一个用于增强信源编码器输出的噪声抗扰性的 信道编码器构成。如预想的那样,一个解码器包含一个信道解码器,它后面跟着 一个信源解码器。如果编码器和解码器之间的信道是无噪声的( 趋向于无误差) , 则信道编码器和信道解码器可以略去,而一般的编码器和解码器分别是信源编码 器和信源解码器。 信源编码器的任务是减少或消除输入图像中的编码冗余、像素间冗余或心理 视觉冗余。特定的应用和与之相联系的保真度要求规定了在给定情况下使用的最 佳编码方法。通常,这种方法可以通过一系列三种独立的操作建立模型。在信源 编码处理的第一阶段,转换器将输入数据转换为可以减少输入图像中像素间冗余 的格式( 通常不可见) 。这步操作通常是可逆的并且有可能直接减少表示图像的数 据量。在第二阶段中,将转换程序的输出精度调整到与预设的保真度准则相一致, 这一步减少了输入图像的心理视觉冗余。在第三阶段,即信源编码处理的最后阶 段,符号编码器生成一个固定的或可变长编码用于表示量化器输出并将输出转换 为与编码相一致。这一步减少了输入图像的编码冗余。 当信道带有噪声或易于出现错误时,信道编码器和解码器就在整个编码解码 处理中扮演着重要的角色。信道编码器和解码器通过向信源编码数据中插入预制 的冗余数据来减少信道噪声的影响。由于信源编码器几乎不包含冗余,所以如果 没有附加这种“预制的冗余 ,它对噪声传送会有很高的敏感性。 7 电子科技大学项士学位论文 2 2 2 图像压缩的评价准则 图像的压缩编码,其实质是在一定质量条件下,以最少比特数来表示( 传送) 一幅图像【1 i 】。为了比较各种压缩编码效率,需要定义表示其压缩效率的压缩比, 通用的压缩比可定义为: nn 。:学 ( 2 - ) r c ( i ,_ ,) i = l j = l 其中:而为原图像每像素使用的比特数;r c 为压缩后平均每像素使用的比特数, 该定义给出了原信息率和压缩后信息率之间的关系。 通常以8 b i t 像素为基础来规定压缩比,即在没有进行数据压缩的p c m 量化比 特数n = 8 经过压缩编码后,平均每个像素的平均比特数为旭,则编码的压缩比为: c p = 一o ( 2 - 2 ) 图像质量的评价是对图像压缩与处理系统优劣的检验。虽然图像质量评价与 人的视觉心理有关,但是找一个合理的图像质量评价方法还是很有必要的。 一般地,允许图像压缩后再恢复的图像具有一定误差,因此需要某种准则来 评价压缩后图像的质量。保真度准则就是这样一种压缩后图像质量评价的标准。 保真度准则有两种:客观保真度准则和主观保真度准则。前者是以压缩前后图像 的误差来度量的,后者则取决于人的主观感觉。 1 客观保真度准则 客观保真度准则指原图像和压缩后图像之间的均方误差或压缩后恢复图像的 信噪比或峰值信噪比。 对于灰度图像,设原图像为g ( x ,y ) ,压缩后恢复图像为f ( x ,y ) ,且图像尺寸 为mxn ,a 为f ( x ,y ) 中的最大值。则均方误差为: m s e = 二 g ( j c ,y ) 一厂( z ,y ) 】2 ( 2 3 ) m n 篇- y = 0 一。 归一化均方误差定义为: n m s e = m s e 一1m - 1n - 1 g ( x ,卅 (24mn 台y 厶= 0 ”一。 信噪比定义为: 第二章数字图像压缩编码基础 s n r ( d b ) = 10 l g 仃d 上式中:为原始图像的方差;刃为失真图像的方差。 失真图像定义为原始图像和恢复图像的差。 e ( x ,y ) = f ( x ,y ) 一g ( x ,y ) 22 面刍i v - i z 乞m - | g ( z ,y ) 】2 刃2 丽刍t v - t1 乞1 , 1 - z 厂( 工,y ) 一g ( 石,y ) 】2 峰值信噪比p s n r 定义为: ( 2 - 5 ) ( 2 - 6 ) ( 2 - 7 ) p s n r = loxl g _ f 百二一 ( 2 8 ) ( 而1 ) g ( 工,y ) 一厂( 工,硝 4 1 “t ly = o 2 主观保真度准则 如果被处理的图像最终是为了让人进行观察,如电视图像,那么用人的视觉 来评价图像的质量就更加有意义。事实上,具有相同客观保真度的不同图像,在 人的视觉中可能引起不同的视觉效果。这是因为客观保真度准则是一种统计平均 意义下的度量准则,对于图像中的细枝末节它是无法反映出来的。而且人的视觉 系统还有许多特殊的性质,例如对光强敏感的对数特性,使得图像暗区的误差比 其亮区误差影响更为重要【1 2 1 。又如人的视觉系统对灰度突变的特别敏感性,使得 发生于图像边缘轮廓附近的误差,比发生于一般背景上的误差对图像质量有着更 坏的影响等等。所有这些可能引起视觉明显差异的因素,用客观保真度准则往往 是无法表示出来的,因此,根据人的主观感觉来评价图像就十分重要了。 主观评价的任务就是要把人对图像质量的主观感觉与客观参数和性能联系起 来,只要主观评价正确,就可以用相应的客观参数作为评价图像质量的依据。主 观测试结果可以是一个单一数值,如平均判分m o s ( m e a no p i n i o ns c o r e ) ,也可 以是同时反映判断差值的一组数据,比如多值计分( m d s ) 测试。 2 3 图像压缩编码方法 2 3 1 图像压缩编码的经典方法 1 9 4 8 年,o l i v e r 提出了第一个编码理论:脉冲编码调制( p u l s ec o d i n g 9 电子科技大学硕士学位论文 m o d u l a f i o n ,简称p c m ) ;同年,s h a n n o n 的经典论文“通信的数学原理 首 次提出并建立了信息率失真函数概念;l t t 5 9 年,s h a n n o n 进一步确立了码率失真 理论,以上工作奠定了信息编码的理论基础。主要编码方法有预测编码、变换编 码和统计编码,也称为三大经典编码方法。 1 预测编码 1 9 5 2 年贝尔( b e l l ) 实验室的b m o l i v e r 等人开始了线性预测编码理论的研 究,同年该室的c c c u t l e r 取得了差分( 或查置) 脉冲编码调制( d p c m :d i f f e r e n t i a l p u l s ec o d em o d u l a t o n ) 系统的专利,奠定了真正使用的预测编码系统的基础。 预测编码是利用相邻像素的相关性进行预测。预测编码通常不直接对信号编 码,而是对预测误差编码。当预测比较准确,误差较小时,即可达到编码压缩的 目的。这种编码称之为差分脉冲编码调制( d p c m ) ,图2 3 是d p c m 编解码的原 理方框图。在该系统中,当前值x ( m ,n ) 是一帧图像中m 行n 列的像素值,预测 值= a x a + b x b + c x c ,当前值与误差值的差值经过量化器后输出量化误差值,编码 器对量化误差值进行编码发送。收端解码时的预测过程与发端相同,所采用的预 测器也相同。收端恢复的输出信号是输入当前值的近似值,当两者的误差足够小 时,输入的当前值和d p c m 系统恢复的输出信号几乎一致。 ( a ) d p c m 编码 ( b ) d p c m 解码 图2 - 3d p c m 编解码原理方框图 1 0 第二章数字图像压缩编码基础 2 变换编码 信源序列往往具有较强的相关性。通过预测编码,可以去除一些相关性,从 而达到压缩的目的。但预测编码的压缩能力是有限的,以d p c m 为例,一般只能 压缩到每样值2 b i t 到4 b i t ,而变换编码具有更高的压缩效率。 变换编码的基本思想是:由于数字图像的像素之间存在高度相关性,因此可 以进行某种变换来消除这种相关性。在空间上具有强相关的信号,反映在频域上 是某些特定的区域内能量常常被集中在一起,或者是系数矩阵的分布具有某些规 律。我们可以利用这些规律在频域上减少量化比特数,达到压缩的目的。由于正 交变换的变换矩阵是可逆的且逆矩阵与转置矩阵相等,这就使解码运算是有解的 且运算方便,因此运算矩阵总是选用正交变换来做。对图像信号进行正交变换的 效果是将原图像信号从空间域映射到变换域,变换域中的信号能量与原空间域中 的信号能量相等,但一般说来变换域中的能量分布比空间域中的能量分布更为集 中,这是因为变换域代表空间频率,高频细节所占的能量较小。利用这种能量集 中现象,在变换编码时可以丢弃一些小能量的代表高频部分的变换系数,经过反 变换后仍然能得到和原图像近似的解码图像,而数据则可以得到明显的压缩。 常用的变换编码有k l 变换编码和d c t 编码。k l 变换编码在压缩比上优 于d c t 编码,但其运算量大且没有快速算法,因而不是一种实用的变换方法,通 常只作理论研究,称为一个可以让其他线性变换用来比较的基准。实际应用中广 泛采用d c t 编码,目前国际上已经制订了基于离散余弦变换的静止图像压缩标准 j p e g 和运动图像压缩标准m p e g 等一系列标准。 3 统计编码 统计编码是通过减少数据中本身存在的统计冗余而达到压缩数据目的的编码 方法,主要利用输入符号序列出现概率的分布特性,注重寻找概率与码字长度之 间的最优匹配,是一种不可逆的无失真编码,即熵编码。尽管对于诸如语言、图 像及其它物理过程的量化采样值,允许以一定的失真来换取更高的压缩比,因此 一般不单独采用统计编码,但几乎所有的编码方法的最后步骤,常常又归结到采 用统计编码。 常用的统计编码主要有:游程编码、h u f f m a n 编码和算术编码等。 以上列举出的一些经典编码技术可以称为“第一代 图像编码技术。这些编 码技术都是非常优秀的纹理编码方案,它们能够在中等压缩率的情况下,提供非 常好的图像质量,但在非常低的位率情况下,无法为一般的序列提供令人满意的 质量。八十年代初期,“第代 编码技术已经达到了顶峰,这类技术去除客观和 电子科技大学顶士学位论文 视觉冗余信息的能力已接近极限。究其原因是由于这些技术都没有利用图像的结 构特点,因此它们也就只能以像素或块作为编码的对象,另外,这些技术在设计 编码器时也没有考虑人类视觉系统的特性。 2 3 2 图像压缩编码的现代方法 1 9 8 8 年在图像压缩编码的发展历史中是极为重要的一年。4 0 年研究成果的集 中表现在确定了h 2 6 1 和j p e g 两个建议的原理框架。图像编码技术不局限于信息 论的框架,而要充分利用人的视觉生理、心理和图像信源的各种特征,实现从“波 形”编码到“模型编码的转变,以便获得更高压缩比【l3 1 。有人称1 9 4 8 年至1 9 8 8 年主要研究的图像编码方法为经典方法,同时把有重要发展前景的图像编码方法 称为现代方法。现代的方法主要有小波变换编码、分形编码、模型基编码、神经 网络编码等。 1 小波变换编码 基于小波变换的编码技术具有特别重要的意义。它不仅为多分辨分析、时一频 分析和子带编码建立了统一的分析方法,提供了更合理的表示框架,而且它体现 着小波分析这一新型分析方法的优越性。可以说,小波变换法处于图像编码当前 首选方法的位置。一方面,它有快速算法,实现起来简单方便、速度快;另一方 面,它有着先进的分析方法,可有效提高现有标准的水平,实现突破性进展。 小波变换用于图像压缩的基本思想是,将图像进行水平方向和垂直方向上的 多次滤波,分解成高频子图像和低频子图像。高频子图像有水平、垂直和对角线 三个方向,而低频子图像可以进行进一步的分解。由此,原图像被分解成不同空 间、不同频率上的子图像,即进行多分辨分解,然后再对各个子图像进行量化编 码。由于变换后的不同子图像反映了原始图像的不同信息,包括对图像重建的重 要性影响,以及对人眼视觉特性的影响。可以认为,小波变换用于图像压缩最佳 地反映了图像特征。 2 分形编码 分形图像编码是在m a n d e b r o t 分形几何理论的基础上发展起来的一种编码方 法,是一种不对称的编码技术,适于自相似性较强的自然景物图像。分形压缩利 用了分形几何中自相似性的原理。首先对图像进行分块,然后再去寻找各块之间 的相似性,这里自相似性的描述主要是依靠仿射变换来确定的,一旦找到了每块 的仿射变换,于是就保存下这个仿射变换的系数,由于每块的数据量远大于仿射 第二章数字图像压缩编码基础 变换的系数,因而图像得以大幅度的压缩。例如:海岸线、云彩、大树等。 分形的最显著的特点是自相似性( s e l f - s i m i l a r i t y ) ,与经典方法相比,它不但 去除了数据之间局部的相关性,而且去除了整体与局部之间的相关性,所以有望 达到经典编码方法所达不到的压缩比。但对于工业图像来说,在工业图像中缺少 分形编码所需要的那种自相似形,更多的是机械形状和机械运动,因此分形编码 对于工业运动图像来说并不是很适合。 3 模型基编码 模型基方法的基本思想:构造一个用二维图像编码序列,表述三维被视景物 的模型,用该模型去分析合成图像。这种编码是建立在对图像信息的理解之上的, 其编码过程是对图像的分析过程,而其解码过程是对图像信息的合成过程。模型 基编码中有三个关键环节: ( 1 ) 建模,也就是构造三维被视景物的模型; ( 2 ) 基于三维景物模型的图像分析: ( 3 ) 图像合成。 4 神经网络编码 神经网络法是模仿人脑处理问题的方法,通过各种人工神经元网络模型对数 据进行非线性压缩。人工神经网络是一个非线性动态网络,工作过程一般分训练 和工作两个阶段。训练阶段就是使用一些训练图像和训练算法,调整网络的权重, 使重建图像的误差最小。目前直接用于图像压缩编码的神经网络主要有反向误差 传播型和自组织映射型。 2 4 图像压缩编码方法的国际标准 2 4 1 四e g 和j p e g 2 0 0 0 1 j p e ( j j p e g 全称为j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ( 联合摄影专家组) ,它是一个在 国际标准组织( i s o ) 下从事静态图像压缩标准制定的委员会。它制定出了第一套 国际静态图像压缩标准i s 0 1 0 9 18 1 ,该标准就是我们熟悉的j p e g 。由于j p e g 的优良品质,使得它在短短的几年内就获得极大的成功,被广泛应用到了很多领 域。 j p e g 标准有四种工作模式:无失真工作模式,基于d c t 的顺序工作模式, 电子科技大学硕士学位论文 累进工作模式和分层工作模式。其中最崔j 用的是基于d c t 变换的顺序工作模型, 又称为基本压缩模式( b a s e l i n e ) ,以下的讨论都是针对这种格式进行的。图2 4 显 示了灰度图像的编解码过程,彩色图像自j 压缩可以看成是多通道的灰度图像处理。 8 8 的码块 d c t 量化器熵编码器 tt e _ l ,、_ ll 尿厢困1 豕 量化表 编码表 压 后 图 数 p e g 编码器 压缩 后的 图像 数据 8 8 的码块 j p e g 解码器 图2 - 4j p e g 编解码框图 j p e g 基本压缩模式中,首先将图像数据分成8 8 的图像块,被分成8 8 的 图像块再经过d c t 变换,使其低频分量集中在左上角,高频分量分布在右下角 ( d c t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论