(轮机工程专业论文)基于小波零树的静态图像压缩算法的研究.pdf_第1页
(轮机工程专业论文)基于小波零树的静态图像压缩算法的研究.pdf_第2页
(轮机工程专业论文)基于小波零树的静态图像压缩算法的研究.pdf_第3页
(轮机工程专业论文)基于小波零树的静态图像压缩算法的研究.pdf_第4页
(轮机工程专业论文)基于小波零树的静态图像压缩算法的研究.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(轮机工程专业论文)基于小波零树的静态图像压缩算法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 在多媒体技术日益广泛的今天,图像的通信和存储占有重要的位置,数字图 像包含信息量巨大的特殊性使得压缩技术成为其关键,因而探索高效图像压缩编 码算法无疑将成为国际公认的热点之一。小波理论是近年发展起来的新的数学分 支,因其良好的空间一频率局部特性和与人眼视觉特性相符的变换机制,成为当 前图像压缩编码的主要研究方向之一,该方法是继傅立叶变换和离散余弦变换后 一种新的图像压缩算法,将图像分解成与人类视觉特性相匹配的不同分辨率、不 同方向特性的子带,并将能量集中于某些子带,利于编码,且对整幅图进行变换, 比传统余弦变换编码有很大提高。 本文首先介绍了图像压缩编码的基本理论和j p e g 静态图像压缩标准,为本 文的研究方向确定了依据。 接着通过实验比较了j p e g 和j p e g 2 0 0 0 两种静态图像压缩标准。并详细研 究了j p e g 2 0 0 0 其中用到的一些核心技术,如e b c o t 算法和感兴趣区域编码技 术等。 其次描述了小波变换的图像压缩编码,引入了小波交换图像压缩理论基础。 分析讨论了小波变换编码在图像压缩领域的优势,探讨了在图像压缩方面对小波 基的评价标准,结合实际应用,选择合适的小波基进行图像编码。 然后研究了小波零树压缩编码,对零树编码思想进行了研究,结合目前比较 成功的零树编码e z w 和s p i h t ,提出其存在的优点和不足,尝试提出改进的小 波零树编码算法。该算法结合了d p c m 和零树编码,并结合视觉特性对阈值进 行了更正,减少视觉冗余。设计开发出小波零树图像压缩编码的软件系统,对实 验结果进行分析研究,主要从客观信噪比和主观信噪比方面,从而论证所提出的 改进的零树编码算法的性能优势,具有实际的应用价值。 关键词:图像压缩;j p e g 2 0 0 0 :小波;e z w ;s p i h t 英文摘要 s t i l li m a g ec o m p r e s s i o n a l g o r i t h m b a s e do rw a v e l e tz e r o t r e e a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fm u l t i m e d i at e c h n o l o g yi nr e c e n ty e a r s ,t h ed i g i t a l i m a g et r a n s m i s s i o np l a y sav e r yi m p o r t a n tr o l e i nc o m m u n i c a t i o nf i e l d s d i g i t a l i m a g e sg e n e r a l l yi n c l u d eag r e a td e a lo fi n f o r m a t i o n ,s ot h ec o m p r e s s i o nt e c h n o l o g y b e c o m e st h ek e yo ft h er e s e a r c h o nt h i so c c a s i o n ,i ti n e v i t a b l yb e c o m e so n eo ft h e m a i nt a s k st os e e ka f t e rt h ee f f e c t i v ei m a g ec o d i n ga l g o r i t h m t h et h e o r yo fw a v e l e t t r a n s f o r mi san e wm a t hb r a n c hd e v e l o p e di nr e c e n ty e a r s b e c a u s eo fi t ss p e c i a l c h a r a c t e r i s t i 稍i ns p a c e f r e q u e n c y , i th a sb e c o m eo n eo ft h em a i nr e s e a r c hd i r e c t i o n s i ni m a g ec o m p r e s s i o nc o d i n g t h i sa l g o r i t h mi san e wi m a g ec o d i n ga l g o r i t h ma f t e r t h ef o u r i e rt r a n s f o r ma n dt h ed c tt r a n s f o r m i td i v i d e st h ei m a g ei n t os e v e r a l s u b b a n d si nd i f f e r e n tr e s o l u t i o na n dd i f f e r e n td i r e c t i o n ,w h i c ha r ec o m p a t i b l ew i t h h u m a nv i s u a lc h a r a c t e r s b e s i d e s ,i tc a ns p l i ti m a g ee n e r g yi n t os o m es u b b a n d ss oa s t oc o d e 。a n dm a k et r a n s f o r mt ot h ew h o l ei m a g e ,w h i c hi sb e t t e rt h a nt h ed c t t r a n s f o r m f i m t l y i ti n t r o d u c e st h eb a s i cp r i n c i p l eo ft h ei m a g ec o m p r e s s i o nc o d i n ga n dt h e s t a n d a r do fj e p gs t i l li m a g ec o m p r e s s i o n a n dm a k es u r et h eg i s to fs t u d yd i r e c t i o n t h e n , b ye x p e r i m e n tw ec o m p a r et h eb a s i cp r i n c i p l eo fj p e gc o m p r e s s i o n s t a n d a r dw i t ht h a to fj p e g 2 0 0 0s t i l li m a g ei n t e r n a t i o n a lc o m p r e s s i o ns t a n d a r d a n d s o m ec o r et e c h n i q u e so fj e p g 2 0 0 0s t a n d a r da r ee l a b o r a t e dp a r t i c u l a rs u c ha se b c o t a l g o r i t h ma n dr o ic o d i n g t h i r d l y , i ti n t r o d u c e se l e m e n t a r yw a v e l e tt h e o r y , t h er e s o u r c e so fi t a n dt h e f o r m u l af o rt r a n s f o r m t h e nd i s c u s si t sa d v a n t a g e si nt h ef i e l do fi m a g ec o d i n g , i t s a p p r a i s es t a n d a r do fw a v e l e to ni m a g ec o m p r e s s i o n ,c o m b i n et h ef a c ea p p l y , a n d c h o o s et h ep r o p r i e t yw a v e l e t n e x t , t h et e c h n o l o g yo fw a v e l e tz e r o t r e ei si n t r o d u c e d ,a n a l y z et w ok i n d so f c l a s s i c a li m a g ec o d i n ga l g o r i t h mb a s e do nw a v e l e tz e r o t r e ei d e a e z wa n ds p i h t o nt h eb a s i so ft h e m ,a l li m p r o v e da l g o r i t h mi sp r o p o s e d t h ea l g o r i t h mc o m b i n e st h e 薹奎塑矍 d p c ma n dw a v e l e tc o d i n g ,a n dm a k e , s o m ec o r r e c t i o n sa n dr e d u c er e d u n d a n c y t h e r e s u ho fe x p e r i m e n t ss h o w st h a tt h ei m p r o v e da l g o d t l u ng e t sab e t t e rr e s u l tb o t hi n s u b j e c t i v ea n do b j e c t i v eq u a l i t y , w h i c hp r o v e s i ti se f f e c t i v e k e y w o r d s :i m a g ec o m p r e s s i o n ;j p e g 2 0 0 0 ;w a v e l e t ;e z w ;s p i h t 大连海事大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果, 撰写成硕士学位论文:基王丑! 遮雯挝曲赴盔图堡压绫簋法盟班窒:。除论文中 已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中 以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公开 发表或未公开发表的成果。 本声明的法律责任由本人承担。 论文作者签名:轩谫翻致口7 年j 月2 多日 学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连海事大学研究生学位论文提交、版 权使用管理办法”,同意大连海事大学保留并向国家有关部门或机构送交学位论文 的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本学 位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描 等复制手段保存和汇编学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于:保密口 不保密口( 请在以上方框内打“v ”) 论文作者签名:轩唠莲l 导师签名: 日期: o ) 年;月 基于小波零树的静态图像压缩算法的研究 第一章绪论 1 1 图像压缩的意义 随着多媒体技术和通讯技术的日益发展,加速了全球高速信息的建设,基于 网络的多媒体数据传输正改变着人类的生活方式。多媒体娱乐、多媒体通信、数 字音频广播和高清晰度电视等各类实际的应用对信息数据的存储和传输的要求不 断提高。一幅图胜过千言万语,图像信息是人类认识世界及人类自身的重要源泉。 数字图像从表面上看可以表达丰富的多彩的内容,但实质上可以看作在视觉 空间灵敏度范围内对图像进行空间采样的一个个像素组成。由于图像数据量非常 大,例如,一幅单色数字卫星遥感图像由1 0 ,0 0 0 x1 0 ,0 0 0 个像素( p i x e l ) 组成, 如果每个像素的灰度用1 2 b i t 表示,那么这幅图像就要用1 2 g b 表示。直接存储 和传输如此庞大的数据,不仅要消耗巨大的磁盘空间和网络带宽,而且还会极大 地增加处理器地负担,所以应用图像压缩技术已成为迫切需型1 】【2 j 。 近年来,应用小波变换于静止图像编码的研究众多,而这些算法仍然存在一 些缺陷,因而,在总结前人的基础上研究实现一种新的图像压缩算法势在必行。 1 2 小波变换的国内外研究现状 国外研究小波的时间较早,8 0 年代就有相关文章和著作发表,m a l l a t 算法是 小波理论突破性的成果,其作用相当于傅里叶分析的f f t ,该算法的提出使小波 从理论研究走向宽广的应用领域。1 9 8 9 年,m e y e r 出版的小波与算子是目前 较权威较系统的小波理论著作。美国t e x a sa & m 大学数学与电气工程教授崔锦泰 ( c h u ic k ) 著的 a ni n t r o d u c t i o nt ow a v e l e t s ”是美国科学出版社出版的一部小波分 析的入门书。崔教授主编的长达7 0 0 余页的会议论文集使得小波研究向深广方向 发展。d a u b e c h i e sl 的“t e nl e c t u r e so nw a v e l e t s ”总结了她的研究成果,为向世界科 技工作者普及小波理论做出了积极的贡献。 我国对小波的研究起步相对较晚,1 9 9 4 年形成国内的小波研究高潮,并在信 号的去噪和图像的压缩、机械故障检测等方面取得了较大的进展。我国目前发表 的小波学术论文以在各种领域的应用性文章居多,如小波在图像处理和压缩中的 应用,小波在模式识别与特征提取中的应用,小波在故障诊断和去噪中的应用, 第一章绪论 小波在地球物理勘探中的应用等等。 小波基础理论方面的研究主要有小波算法的研究,量化方法的研究。从公开 发表的应用性文章的内容看,主要可分为两大部分,一部分是利用小波分析对信 号进行消噪处理,以提高解释方法的分辨率,这一部分包括小波变换用于信噪分 离、弱信号的提取以及信号奇异点与奇异度的测定和多尺度边缘检测与重构;另 一部分是利用小波分析做图像或数据压缩。一个图像经小波分解后,图像轮廓主 要体现在小波系数的低频部分,而细节部分主要体现在高频部分,因此可以采用 不同的量化方法对不同层次的低频系数和高频系数进行量化处理,对量化后的小 波系数进行重构,以达到图像或数据压缩的目的。 利用小波分析对信号或图像进行去噪或压缩处理,目前主要采用嵌入式零树 小波e z w ( e m b e d d e dz e r o t r e ew a v e l e t s ) 编码、多级树集合分裂编码s p i h t ( s e t p a r t i t i o n i n g i n h i e r a r c h i c a l ) 、集合分裂嵌入块编码s p e c k ( s e tp a r t i t i o n e d e m b e d d e d b l o c kc o d e r ) 以及可逆嵌入小波压缩算c r e w ( c o m p r e s s i o nw i t h r e v e r s i b l ee m b e d d e d w a v e l e t s ) 。北京大学、清华大学、武汉大学、中科院数学研 究所等院所先后开展了有关的研究工作。现在我国有一批年轻的博士和硕士正在 努力攻关,期待取得小波及其应用研究的突破性进展。 1 3 数据图像压缩的目的 虽然表示图像需要大量的数据,但这些数据往往是高度相关的,传统的图像 压缩技术中。人们通过去除现实世界中出现的统计冗余来达到数据压缩的目的。 其次,大部分图像视频信号的最终接收者都是人眼,人眼对图像中的不同部分的 敏感程度是不同的,如果去除图像中对人眼不敏感或意义不大的部分,对图像的 主观质量是不会有很大影响的,即去除不那么敏感的非冗余信息也是行之有效的。 图像压缩在技术上的可行性,主要由于图像中存在冗余和不相干的信息。在 图像数据中,根据采用矩阵方式描述图像的特点,一般存在三种冗余1 3 j : ( 1 ) 编码冗余:如果一个图像的灰度级编码,使用了多于实际需要的编码符 号,就称该图像包含了编码冗余。编码冗余通常是为了以某个标准格式( 例如,固 定大小的最大灰度级定义) 进行图像描述时产生的。 ( 2 ) 像素冗余:图像信号相对与其他信号有个非常明显的特点,就是像素间 基于小波零树的静态图像压缩算法的研究 存在非常大的相关性,由于存在相关性,因此任何给定的像素值,都可以通过它 的邻接像素预测得到。换句话说,单个像素所携带的信息相对是小的。这样,对 一副图像,如果描述每个像素的数据量是相等的,并且是相对独立的,则由于像 素相关性使得该数据量对视觉的贡献一定存在一定的冗余,称这种像素之间的内 在相关性所导致的冗余为像素冗余。 ( 3 ) 视觉心理冗余:人类的视觉系统( h v s ) 对于图像的感知是非均匀和非线性 的,特别是人类的视觉系统并不是对于图像中的任何变化都能察觉得到。人的视 觉对颜色的感知就存在着冗余,“异谱同色”就是指数据取值不同的颜色,在视觉 上被认为是对相同的颜色的观察。另外,当人在观察- - j i j 图像时,一些信息在一 般视觉处理中比其他信息的相对重要程度要小,因此这部分信息往往被忽视。经 这种对视觉感知影响较小的信息称为视觉心理冗余。 数字图像压缩技术就是通过有效地消除图像的各种冗余,特别是通过消除空 间冗余、时间冗余以及利用人类视觉特性,达到用尽量少得数据表示和重建原始 图像的目的。 1 4 论文的主要研究内容 本文首先从图像压缩的原理出发,对图像压缩理论和基本算法进行了研究。 接着通过实验比较了j p e g 和j p e g 2 0 0 0 两种静态图像压缩标准1 4 1 。实验结果 表明j p e g 压缩标准存在一定的局限性:高压缩比时重建图像的方块效应。但是当 把离散余弦变换改为小波变换就可以克服现有的局限性并且还可以实现许多新的 功能,如渐进编解码、从有损压缩到无损压缩以及感兴趣区域编码等。并对 j p e g 2 0 0 0 标准中的一些核心技术进行了详细研究,如e b c o t 算法和感兴趣区域 编码技术等。 其次,引入了小波图像压缩技术的基本理论,介绍了小波变换的来源及具体 变换公式,说明了小波变换编码的编码流程及关键技术,讨论了其在图像压缩编 码方面的优势【5 】:免除采用分块正交变换编码所固有的“方块效应”;比经典 的变换( d c t ) 更符合人的视觉特性:具有时间一频域定位能力,并可实现图像 中平稳成分与非平稳成分的分离。 第一章绪论 然后介绍了小波零树编码压缩技术,研究了目前两种成功的零树编码算法一 一嵌入式零树编码算法e z w 和多层次零树编码算法s p i h i t 。在传统的零树图像 编码算法的基础上,提出了改进的图像压缩编码算法【6 】。主要包括三点改进:一、 在最低频的部分集中了绝大部分能量,所以低频部分采用跟高频不同的压缩方法 d p c m 方法,充分利用低频的相关性,提高压缩比。二、对于变换后的小波系数 的高频部分,根据其分布特性和人眼的视觉特性,对零树量化过程的阈值进行修 正,有效地去除视觉冗余。三、选择合适的小波基进行小波变换。 最后,运用c + + 开发设计了算法的演示系统,介绍了系统流程及部分代码, 对实验结果进行了分析,结果表明该改进算法无论从客观信噪比还是从主观质量 都取得了很好的效果,从而证明改进方案是有实际意义的。 基于小波零树的静态图像压缩算法的研究 第2 章图像压缩编码理论概述 视觉在人类感知中起着极为重要的作用,而视觉感知的结果表现形式图 像由于能给人们以直观而具体的物体形象,是声音、语言和文字所不能比拟的, 故此图像成为多媒体数据中最为重要的数据类型,对图像的处理和分析技术发展 成为专门的学科,它涉及到数学、信息论、计算机、人工智能和模式识别等多方 面的知识,并己广泛应用到诸如电影电视、地理数据处理、医学数据处理、计算 机视觉、遥感等社会生活和工程实践的各个方面,图像虽然信息丰富但是数据量 庞大,因而为了实际需要,要对图像数据作压缩处理,并逐渐发展成为专门的研 究领域图像编码。 2 1 图像压缩的可能性 2 1 1 信息量的定义 在自然科学中有两个重要的概念,就是能量与信息。能量这个概念在科学中 所起的支配作用是人们所熟知的,而和能量的存在具有同样悠久历史的信息的概 念,在科学上取得应有的地位却是近五十年多年的事。1 9 4 9 年信息论的奠基人香 农所发表的经典著作标志着信息科学发展的起点1 6 】。同一对期,维纳也创立了控制 论1 7 。维纳与香农一起建立了通信与控制时代的科学理论基础。通信与控制的共同 特点在于都包含有一个信息的变换过程。信息在时间上的分布是可测事件的离散 或连续的时间序列,它带有某种随机性质,也就是说,信息的本质是统计的。 图像的统计特性是指其亮度值或亮度抽样值的随机统计特性【9 】。图像这方面的 特性是各类图像压缩编码方法的基本依据,因为,假若某类图像的统计特性已知, 那么根据信息论的原理,对于这类特殊的图像而言,总可以找到最佳的或者接近 最佳的压缩编码方法。它们将以图像的信息熵为其编码率的下限。 维纳的工作着重研究干扰作用下信号的最佳接收问题,而香农的工作着重于 研究信源和信道的统计特性及编码方法,以提高信息传输的有效性和可靠性【1 0 】。 通信系统的简单物理模型见图2 - 1 。 第2 章图像压缩编码理论 图2 1 数字通信系统模型 f i g 2 1d i g i t a lc o m m u n i c a t i o ns y s t e mm o d e l 香农信息论对图像压缩编码算法的研究具有指导意义。关于信源,信息论研 究信源包含的平均信息量( 熵) 和单位时间内信源发出的平均信息量1 1 1 1 关于信道, 信息论研究消息在无干扰信道和有干扰信道上传输的信息传输速率,以及信道传 输信息量的能力( 信道容量) 。关于信源编码,信息论指出:把出现概率大的消息 用较短的代码组表示,而把出现概率小的消息用较长的代码组表示,就能提高信 道传输消息的效率。无失真信源编码定理( 香农第一定理) 指出【1 2 1 :当代码组的长 度增大时,符号序列消息中的每个符号所对应的平均代码组长度以信源熵为下界。 至于信道编码,有扰离散信道编码定理( 香农第二定理) 指出:当信息传输速率小 于信道容量时,通过增大代码组的长度,可以以很小的误码率来传输消息,也就 是在误码率任意小的条件下,信息传输速率的上界为信道容量。这实际上是增加 传输信号的冗余度来提高它的抗干扰能力。由于所增加的冗余度是根据信道干扰 的性质所设计的,所以它的抗信道干扰能力远大于信源消息固有冗余度的抗干扰 能力。因此才有可能通过信源编码和信道编码来提高信道传输消息的有效性和可 靠性。 信息有各式各样的定义,比较一致的定义为”】【1 4 】:信息是认识主体( 人、生物、 机器) 所感受的或所表达的事物运动的状态和运动状态变化的方式。信息的特征 为: 接收者在收到信息之前,对它的内容是不知道的,所以信息是新知识、新 内容: 信息是能使认识主体对某一事物的未知性或不确定性减少的有用知识; 基于小波零树的静态图像压缩算法的研究 信息可以产生,也可以消失,同时信息可以被携带、储存及处理: 信息是可以度量的,信息量有多少的差别。 信源是发出消息的源。信源输出的是以符号形式出现的具体消息,这些消息 承载着信息信源按一定的概率分布发出的符号是指文字、数字、语言等,单个 符号可以构成具体消息,符号的序列也可以构成具体消息。 信源输出的单符号集,可用随机变量x 描述: x 爿一( 4 ,6 ) x 取值于连续区间( 日,功内, 概率密度( 简称概率) p ( x ) , 概率场p 扛x 工+ 出 - p o ) 出,称为连续信源。 如果x 彳- 4 l ,a 2 ,a 。 , h ,p ) 】- ( :p a 2 :, ,:) ,砉层- 1 称为离散信源 信息量是不确定性的度量,与事件发生的概率成反比,表示意外的程度。也 可以这样理解:信息量是指从n 个相等可能事件中选出一个事件所需要的决断次 数。对前述离散信源定义为; i ( a 。) - - l o g p ( a j ) ( 2 1 ) 也称为自信息量。当接收者没有收到a r 之前,究竟会收到那个符号是不确定 的,而在接受到符号a j 之后,便消除了刚才那种不确定性。这就是接收者收到符 号a r 的信息量。信息量只有当信源输出符号而接收者收到后才有意义,它是给与 信宿的信息的度量。 无记忆信息源x 发出符号4 f 的信息量i ( a 1 ) 本身也是随机变量。如果求信源x 发出的符号集a 中各符号的自信息量的统计平均( 也即求数学期望) ,便得出符号 集a 中每个符号的平均信息量: h ) 。善p 鼢砸,) ( 2 2 ) h ( a ) j e - t 个数值在信息论中称为信息源x 的熵,单位为:比特符号。现在把信 息论中熵值的概念,应用到图像信息源【1 5 1 1 1 6 1 ,图像信息源x 的重要统计特性是指 第2 章图像压缩编码理论 其熵值; 日( x ) 一善只1 0 9 2 只 ( 2 3 ) 由于任何现实图像中的各个像素之间存在统计上的相关而不是相互独立的, 因此式( 2 - 3 ) 不是用单个像素作为一个符号,而使用现实世界中可能构成的整幅图 像作为图像信息源x 可能发出的一个符号。雄值极大,对2 5 6 2 5 6 像素、每像素 8 比特编码,则共有n - - ( 2 8 严。2 5 6 个可能的图像。p j 是其中第i 幅从信源x 中发出 的概率,h ( 均的单位是;比特每幅图像。如果熵值已知,根据信息论原理【用,总 有办法找到一种图像信息源的压缩编码算法,使所需的编码率尽量接近熵值。 实际中测量如此大露的概率p i 是不现实的,一般解决的途径有两州1 8 1 ;一是 对图像信息源的概率分布p i 提出数学模型,然后计算其熵值:二是将图像分割成 统计独立的子像块,使子像块总数n 不是很大,以便可以测量信息源一个概率p j 。 图像信源属于一种有记忆的信源( 以像素为基本符号) 。在有记忆信源中,如 果相继的n 个符号之间相关,共有g 种符号,那么可以把这样的n 个符号序列作 为一个子集,并当作一个新的符号s 一,信息源发出的符号概率用p ( s i 0 、0 ) 表示 对于这种信息源,每个符号序列的平均信息量( 熵值) 为h ,符号序列的总数m = q , 每个符号的平均信息量为h n : 日一一p ( s i ) l o g p ( s f v o ) ( 2 4 ) 田 h ,- 一n 艺p ( s i ) l o g p ( s l 舯) ( 2 5 ) 2 1 2 图像压缩的可能性 图像压缩编码是指用尽可能少的数据表示信源发出的图像信号,以减少容纳 给定消息集合的信号空间1 1 9 1 ,信号空间通常有三方面的含义; 物理空间,指内存、磁盘、磁带等数据存储介质; 时间空间,指传输给定消息集合所需的时间: 电磁频谱空间,指传输给定消息所需的频带等。 那么图像压缩的目的,就是减少数据占用的存储空间、传输时间和频率带宽。 基于小波零树的静态图像压缩算法的研究 虽然表示图像需要需求量的数据,但图像数据是高度相关的i 冽。一幅图像内 部及视频序列中相邻图像之间有大量的冗余信息,主要表现为以下几种形式: 信息熵冗余:也称为编码冗余,指图像编码的单位数据量大于信息熵。由信 息论的有关原理可知,作为图像数据的一个像素点,只要按其信息熵的大小分配 相应比特数即可,然而对于实际图像数据的每个像素,很难得到它的信息熵,采 用p c m 方式数字化一幅图像时,对每个像素点是用相同的比特数表示,这样必然 存在冗余。也就是说这种冗余度寓于信源符号的非等概率分布,编码时设法改变 信源的概率分布使其尽可能的不均匀达到数据压缩的目的。 空间冗余:在同一幅图像中,规则物体或规则背景的表面物理特性具有相关 性。这些相关性在相应的数字图像数据中表现为数据冗余,例如一幅图像的某一 区域中的所有点( 像素) 有着相同的光强度,色彩以及饱和度,该区域的图像数据 具有很大的冗余。相邻像素之间、行与行之间、条带之间都存在空间冗余。 结构冗余:在有些图像的部分区域内存在着非常强的纹理结构,或是图像的 各个部分之间存在着某种关系,如自相似性等。例如草席、纺织物的图案。 时间冗余t 连续的视频序列,在1 2 5 秒或1 3 0 秒的帧间间隔内,景物运动部 分在画面上的位移量或当场景交替时整幅景物切换的概率极小。大多数像素点的 亮度及色度信号帧间变化很小或基本不变。前后两帧之间的相似性较大,尤其对 监控摄像所得的视频,各帧间的差别极小。 知识冗余:有些图像中包含的信息与某些先验的基础知识有关,例如对于人 脸图像,头、眼和嘴的相互位置等信息就是一些常识。 视觉冗余:在多数情况下,重建图像的最终接收者是人的眼睛,虽然人类的 视觉系统到目前为止是世界上最好的图像处理系统,但它却非完美。为了达到较 高的压缩比,可以利用人类视觉系统的特点。 上述各种形式的冗余,是图像压缩编码基础。图像编码方法都是基于各种冗 余信息和人类的视觉特性,而以尽量少的比特数表示和重建原始图像的。 2 2 图像压缩编码的基本算法 从技术上看,图像压缩的途径有两种,一是通过减少图像中各象素相关产生 的冗余来减少待传输或存储的数据总量,例如利用离散余弦变换减少数据间的相 第2 章图像压缩编码理论 关性,然后保留其中的主要分量,从而减少数据量。二是根据数据动态范围及其 出现的频繁程度,确定适当的编码方案,通过适当安排不同数据所占编码比特数, 来减少所需总比特数达到压缩的目的。 数据压缩技术有多种不同的分类方法t 2 0 l 。一种是按照压缩过程的可逆性进行 分类,可分为熵压缩和冗余度压缩两种。熵压缩是所谓的不可逆压缩。即在压缩 过程中,会失掉部分信息,因此熵压缩又称为有损压缩,它是以丢掉部分信息 为代价而获得相应的压缩效果的。当然,为确保还原后的数据能基本保持原数据 的特征,这种丢弃部分信息造成的失真,应限制在某个规定的范围之内;从另一 角度讲,这种把失真限制在某一允许限度内,可使图像编码达到更高压缩比的压 缩编码,又称为率失真编码或限失真编码。熵压缩技术主要用于图像和语音数据 压缩。冗余度压缩是可逆压缩,冗余度压缩的机理是完全或尽量除去原数据中冗 余的部分,而保证不丢失其中的任何信息,从而被压缩了的数据还原后与压缩前 的数据完全一致。因此,可逆压缩又称为无失真压缩,这种压缩编码方法主要用 于文本、程序文件等不允许出现任何数据失真的场合。 另一种是按压缩技术所依据和使用的数学理论和计算方法进行分类,可以将 压缩技术分为统计编码、预测编码和变换编码三大类。另外还可以从图像的光谱 特征出发,将压缩编码分为单色图像编码、彩色图像编码和多光谱图像编码;从 图像的灰度层次上,可分为多灰度编码和二值图像编码;从处理对象的维数出发, 可分为行内编码、帧内编码和帧间编码等等。 如上所述,按图像压缩技术所依据和使用的数学理论和计算方法进行分类, 可以将图像压缩分为统计编码、预测编码和变换编码三大类。本节简单介绍各类 编码方法的基本思想,新兴编码方法中常常综合某几类的编码方法,本文将这些 编码方法归入“混合编码”一类,也作简单介绍。 2 2 1 统计编码 统计编码是指一类建立在图像统计特性基础之上的压缩编码方法,常见的统 计编码方法有霍夫曼编码、算术编码、方块编码等。其中霍夫曼编码是于1 9 5 2 年 提出的一种编码方法,它完全依据信源字符出现的概率来构造平均码字长度最短 的异字头码字,有时称之为最佳编码。方块编码是把图像划分成一些大小为n x n 基于小波零树的静态图像压缩算法的研究 的子像块,在每个子像块里找出两个代表性的亮度来近似地代表该子像块内各象 素的亮度,然后指明该块内每个象素属于哪个代表亮度,据此进行编码。 2 2 2 预测编码 预测编码是图像压缩技术的一个重要分支,其基本思想是,在一般的二维图 像中相邻象素问存在着相关性,利用这种相关性,每个象素的值可以根据其临近 的前几个象素的值进行预测。将象素点的实际取值和预测值相减得到一个误差值, 尽管预测误差的数据量与原始图像数掘量相同,但其均方根较原始图像大大减 小,也就是说对于每一个误差数据,只要用较少的码字即可以表示出来,对该误 差值进行编码即得到预测编码结果。显然,在恢复图像的时候,需要有一个相应 的预测器。 2 2 3 变换编码 变换编码的基本概念是将空间域的图像经过某种变换,达到去相关的目的, 再经过适当的方式量化编码,从而压缩图像的编码比特率。常用的变换有离散傅 立叶变换、离散余弦变换、卡骆变换、离散沃尔什哈达码变换以及用途广泛的小 波变换等等。变换编码有两个最明显的特点:一是可以得到高的压缩比;二是比 预测编码等其它方法的计算复杂度高。变换编码之所以能压缩信息的比特数,是 因为在经过变换得到的系数矩阵中,数值较大的方差总是集中在少数系数中。多 数图像的统计特性表明,大幅度的系数往往集中在低频率区内,这样可以给那些 较小的系数分配较少的比特数,甚至可以不予传送,从而压缩了整个传送数据的 比特数。因此,变换本身只是把分布在变换域中的信息变得集中起来,为合理地 少分配给某些数据比特数提供可能。由于变换编码有许多特点,它有广泛的应用。 2 2 4 混合编码 ( 1 ) 子带编码:子带编码的基本思想是,在发送端利用数字线性滤波器将信号 分离成高频和低频两个不同的频率部分,再利用与各子带信号统计特性相适配的 编码器进行编码;在接收端,经解码、内插和线性合成滤波器得到信号的恢复值。 ( 2 ) 分形编码:分形通俗地说就是组成物体的部分与整体有某种自相似性,这 些自相似性有些是确定的,但大量的却是统计自相似或随机自相似。由于自然界 中普遍存在分形物体,它们在表面上具有非常复杂的统计特性和视觉结构,但本 第2 章图像压缩编码理论 质上却只有很少的特定信息含量,可以用几条简单的确定性规则迭代出来,这就 是分形编码的思想基础。 ( 3 ) 模型基图像编码:模型基图像编码首先由瑞典的f o r c h h e i m e r 等人于1 9 8 3 年提出,现已有许多技术方案,大致可分为两类:是基于限定的景物模型基图 像编码,常称为语义基图像编码,它可以有效地利用景物中已知物体的知识,实 现非常高的压缩比,但只能处理已知物体,并需要较复杂的图像识别、分析技术; 二是物体基图像编码,它可以处理更为一般的对象,包括己知的和未知的,而无 需模式识别和先验知识。 2 3 图像质量评价 在实际图像通信过程中,包括了编码、解码、传输等许多环节,其性能的优 劣对最终在接收端恢复的图像质量都有很大影响。人们一方面希望接收恢复图像 有足够高的图像观赏质量,同时又希望传输码率尽量低。因此,对图像质量的评 价是一个不可忽视的问题,尤其对图像编码具有指导意义。图像质量的含义包括 两个方面t 图像逼真度和图像的可懂度。所谓图像的逼真度就是被评价图像与标 准图像的偏离程度。图像的可懂度是指由图像能向人或机器提供的能力( 例如传送 的整幅文字图像中,人可以读出来的文字在整篇文字中的比重) 。人们一直希望能 够得出图像逼真度和可懂度的定量描述,但是由于目前对人类的视觉系统的性能 还没有充分掌握,因此目前所进行的相关研究工作只能采用主观评价和客观评价 结合的方式。 客观上的表示就是在图像灰度的变化、亮度和对比度的下降以及几何特性的 变化;反映到人类的主观表示就是人类的视觉系统会明显觉察到畸变过大图像的 质量下降等。 2 3 1 客观图像质量评价 所谓客观方法,就是定义一个数学公式,然后对待评价的图像进行运算,得 到一个唯一的数字量作为测度结果,这种方法最常用于对图像的逼真度评价。给 定一幅数字化的待评价图像舷圳和参考图像f o ( x , y ) ,它们之间的相似性通常用其 均方误差或均方误差的各种变形表示。例如,当图像大小为m x n 时,归一化的均 方误差为 基于小波零树的静态图像压缩算法的研究 ( 2 6 ) 为使图像相似性具有灰度缩放和平移不变性,则可采用以下公式 p 擘黧 ( 2 7 ) ( ,一,) 1 ( f o f o ) 。 式( 2 - 7 ) 中采用的是待评价图像雕) 和参考图像,旗) 的矢量形式,加上划线 表示其均值。 在图像压缩和编码的研究中,还常用以下定义的峰值信噪比( p e a ks i g n a lt o n o i s er a t i o ) 作为质量测度。 一以呱票1 - 耐 - x 蕊 q 8 丽岛岛v 、,) ,) 一,o o ,y ) 】2 式( 2 8 ) 中正。为图像的最大灰度值,例如,对于具有2 5 6 个灰度级的黑白图 像,五。通常取为2 5 5 。客观图像质量通常用图像的逼真度来评价,常用信噪比 s n r ( s i g n a l t o n o i s e r a t i o ) 和峰值信噪比p s n r 度量。由于图像质量测度的客观客 观方法易于使用,一致性好,所以是最常用的方法,但是,在有些情况下评价结 果可能和主观方法不一致。 2 3 2 主观图像质量评价 图像的主观评价就是以人作为图像的观察者,按照一定规则并根据自己的经 验对图像的优劣作质量判断。国际电联无线电组在标准c c i r s 0 0 中规定了在严格 的观测条件( 图像尺寸、对比度、亮度、观察距离、照明等) 下,对一组标准图像 压缩前后的质量进行对比的主观评定标准。具体的作法是,由若干人( 分专业人员 组和普通人员组) 对所观测的重建图像的质量( 很好、好、尚可、不好、坏) 或对重 建图像中的噪声的明显程度( 不可见、可见、明显、令人烦恼、无法看) 按五级分 评定,然后按下式计算平均分数m o s ( m e a no p i n i o ns c o r e ) : 竺坩 聚 第2 章图像压缩编码理论 ( 2 9 ) 式中七一类别数,即有几个分数等级; c 广为分数; 栉广一该类别的人数; 可以将m o s 看成是一个随机变量的均值。对于音频数据压缩算法的质量的评 价也与此类似,可以用信躁比、各种形式的加权信躁比、以及主观评定的m o s 等 来度量。 2 4 本章小结 从信息量的定义出发,探讨了图像压缩编码的基本理论。指出了图像压缩的 可能性,并分别对各种编码方法进行了阐述。图像压缩的优劣要通过图像质量评 价来判定,给出了主观和客观两种方法。 垃扣 - 傩m 基于小波零树的静态图像压缩算法的研究 第3 章j p e g 标准概述 j p e g 全名为j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ( 联合摄影专家组) ,它是一个在 国际标准组织( i s o ) 下从事静态图像压缩标准制定的委员会。它制定出了第一套国 标静态图像压缩标准:i s o1 0 9 1 8 1 就是我们所说的j p e g 了。j p e g 压缩算法可以 用失真的压缩方式来处理图像,但在压缩比不是很高时失真的程度却是肉眼所无 法辨认的,而且该算法既可用于灰度图像又可用于彩色图像。由于j p e g 优良的品 质,使得它在短短的几年内就获得极大的成功,目前网站上大部分的图像都是采 用j p e g 的压缩标准。下面主要介绍j p e g 基本压缩算法【2 3 i i 川。 3 1j p e g 算法概要 j p e g 专家组开发了两种基本的压缩算法,一种是采用以离散余弦变换为基础 的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。使用有损压 缩算法时,在压缩比为2 5 :1 的情况下,压缩后还原得到的图像与原始图像相比较, 非图像专家难于找出它们之间的区别,因此得到了广泛的应用。 j p e g 压缩是有损压缩,它利用了人的视觉系统的特性,使用量化和无损 压缩编码相结合来去掉视觉的冗余信息和数据本身的冗余信息。j p e g 算法框 图如图3 - 1 所示,压缩编码大致分成三个步骤: 1 使用正向离散余弦变换f d c t ( f o r w a r dd i s c r e t ec o s i n et r a n s f o r m ) 把空间域 表示的图变换成频率域表示的图。 2 使用加权函数对d c t 系数进行量化,这个加权函数对于人的视觉系统是 最佳的。 3 使用霍夫曼可变字长编码器对量化系数进行编码。 译码或者叫做解压缩的过程与压缩编码过程正好相反。 j p e g 算法与彩色空间无关,因此“r g b 到y l v 变换”和“w v 到r g b 变 换”不包含在j p e g 算法中。j p e g 算法处理的彩色图像是单独的彩色分量图像, 因此它可以压缩来自不同彩色空间的数据,如r g b ,y c b c r 和c m y k 。 第3 章j e p g 标准概述 s 蚺图象块d c t 墨编码器 dd r 基压缩端杩步曩 d c t 基解鸡器 b ) d c t 基解压缩步骤 图3 1j p e g 压缩编码一译码算法框图 f i g 3 1t h eb l o c kd i a g r a mo fa l g o r i t h mo nj p e gc o m p r e s s i o nc o d i n g 3 2j p e g 标准的主要实现步骤 j p e g 压缩编码算法的主要计算步骤如下: ( 1 ) 正向离散余弦变换:下面对正向离散余弦变换变换作些说明: 对每个单独的彩色图像分量,把整个分量图像分成8 8 的图像块,如图3 - 2 所示,并作为两维离散余弦变换d c t 的输入。通过d c t 变换,把能量集中在少 数几个系数上。 俐垂四删 d c t 变换式用下式计算。 图3 2 图像的d c t 变换 f i g 3 2d c t o ni m a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论