(信号与信息处理专业论文)多光谱遥感图像无损压缩算法研究.pdf_第1页
(信号与信息处理专业论文)多光谱遥感图像无损压缩算法研究.pdf_第2页
(信号与信息处理专业论文)多光谱遥感图像无损压缩算法研究.pdf_第3页
(信号与信息处理专业论文)多光谱遥感图像无损压缩算法研究.pdf_第4页
(信号与信息处理专业论文)多光谱遥感图像无损压缩算法研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(信号与信息处理专业论文)多光谱遥感图像无损压缩算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 多光谱遥感图像的无损压缩算法研究 作者:贾应彪 导师:冯燕副教授 学科:信号与信息处理 摘要 随着多光谱遥感技术的发展,多光谱图像的压缩受到越来越多的关注。由 于遥感图像数据对地物的分析和识别有非常重要的作用,因此大多数情况下希 望在遥感图像压缩中不损失信息,即进行无损压缩。基于以上考虑,本文在对 一些目前已有的多光谱图像压缩方法进行深入研究的基础上,提出了一些改 进,得到了较好的实验结果。 本文首先从信息论的角度对信息编码理论进行了总结,回顾了目前常用 的各种编码方法,并详细讨论了算术编码的原理及程序实现。然后简要介绍了 无损压缩技术原理及压缩步骤,分析了无损压缩技术中的预测模型的选取;在 综合考虑多光谱遥感图像特点的前提下,充分的探讨了专用于遥感图像无损压 缩的预测树压缩技术并指出其不足之处,在此基础上结合预测树和线性预测两 类压缩方法提出了基于误差补偿的预测树算法,该算法利用多光谱图像谱间的 统计冗余性对预测树方法产生的误差进行补偿,因此同时去除了谱间的结构冗 余和统计冗余,从而进一步减少了多光谱图像的数据量;经过实验比较可知该 算法能比现有的预测树方法获得更高的压缩比,但是计算量较大,因此引入了 局部平稳性判断来对算法进行简化,在同等压缩比情况下较大的降低了算法的 计算复杂度。最后介绍了小波原理和整型小波的构造方法,在此基础上分析讨 论了整型小波用于图像压缩的编码方法和编码过程中的相关问题及解决方法: 并将整型小波方法用于去除多光谱遥感图像中的谱内冗余,在谱间则先进行图 像的相关性判断,再做预测来去除冗余:实验结果表明该算法得到的压缩效果 与改进后的预测树方法基本相当,且计算复杂度有所降低。 关键字:多光谱图像无损压缩预测树误差补偿整型小波变换相关性判断 耍j ! 三些查堂堡主堡苎 查垄堂堡些里堡垂塑垦笪苎垫堑窒 r e s e a r c ho nl o s s l e s sc o m p r e s s i o no fm u l t i s p e c t r a lr e m o t e s e n s i n gi m a g e s a u t h o r :j i ay i n g b i a o s u p e r v i s o r :a s s o c i a t e p r o f e s s o r f e n g y a n s u b j e c t :s i g n a la n d i n f o r m a t i o np r o c e s s i n g a b s t r a c t w i t ht h e d e v e l o p m e n t o f m u l t i s p e c t r a lr e m o t e s e n s i n gt e c h n o l o g y , c o m p r e s s i o n o fm u l t i s p e c t r a l i m a g e s i so fm o r ea n dm o r ei m p o r t a n c e a st h e o r i g i n a ld a t ai sn e e d e ds o m e t i m e s ,t h el o s s l e s sc o m p r e s s i o no fm u l t i s p e c t r a li m a g e r y i s n e c e s s a r y i n t h i s p a p e r ,s o m e t h e o r i e sa n dm e t h o d so f c o m p r e s s i o n o f m u l t i s p e c t r a li m a g e r ya r er e v i e w e da n ds o m ei m p r o v e m e n ta l g o r i t h m sh a v eb e e n p u tf o r w a r d a n dt h er e s u l t sp r o v eb e t t e r a tf i r s t ,t h e o r i e sa n dm e t h o d sa b o u tc o d i n ga r es y s t e m a t i c a l l yr e v i e w e df r o m t h ev i e w p o i n to fi n f o r m a t i o nt h e o r ya n dt h ep r o g r a mi m p l e m e n t a t i o no fa r i t h m e t i c c o d i n gi s d i s c u s s e di n d e t a i l s e c o n d l y a n e x i s t i n ga l g o r i t h mu s e d f o rl o s s l e s s c o m p r e s s i o no fm u l t i s p e c t r a li m a g e r yb yp r e d i c t i o nt r e ei sr e v i e w e d ,b a s e do nt h e a n a l y s i so fm u l t i s p e c t r a li m a g e r yc h a r a c t e r s ,a n da ne r r o rc o m p e n s a t e dp r e d i c t i o n t r e em e t h o du s e df o rl o s s l e s sc o m p r e s s i o no f m u l t i s p e c t r a li m a g e r y i sp r o p o s e d n e e x p e r i m e n tr e s u l t sf r o mp r a c t i c a lm u l t i s p e c t r a li m a g e sh a v es h o w nt h a tt h i sm e t h o d i sb e t t e rt h a nt h e o r i g i n a lp r e d i c t i o n t r e eo n e i no r d e rt os a v et i m e ,s o m e i m p r o v e m e n t i sg i v e na n dab e t t e re x p e r i m e n tr e s u l ti sg a i n e d i nt h ee n d ,r e v e r s i b l e i n t e g e r - t o - i n t e g e rw a v e l e tt r a n s f o r mf o ri m a g ec o m p r e s s i o ni sd i s c u s s e d ,b a s e do n r e v i e w i n g t h ew a v e l e tt r a n s f o r mt h e o r i e s ,a n dan e wm e t h o do f l o s s l e s s c o m p r e s s i o n o fm u l t i s p e c t r a li m a g e r yi sg i v e n ,w h i c hc o m b i n e si n t e g e rw a v e l e tt r a n s f o r ma n d l i n e a rp r e d i c t i o nt e c h n i q u e s t h e s p a t i a lr e d u n d a n c yi nt h ei m a g e si sr e m o v e db yt h e i n t e g e r t o - i n t e g e rw a v e l e tt r a n s f o r ma n dt h ei n t e r - b a n dr e d u n d a n c yi sr e m o v e db y t h el i n e a r p r e d i c t i o na c c o r d i n g t ot h ec o r r e l a t i o nb e t w e e nt w ob a n d s t h e e x p e r i m e n tr e s u l t sf r o mp r a c t i c a lm u l t i s p e e t r a li m a g e sh a v es h o w nt h a tt h i sm e t h o d c a ng e tt h es a m ec o m p r e s s i o nr a t i oa st h ei m p r o v e dp r e d i c t i o nt r e eo n ew i t hl o w c o m p l e x i t y k e y w o r d s :m u l t i s p e c t r a li m a g e s ,l o s s l e s sc o m p r e s s i o n ,p r e d i c t i o nt r e e ,e l t o r c o m p e n s a t e d ,i n t e g e rw a v e l e tt r a n s f o r m ,c o r e l a t i o nd e t e r m i n e v 西北j :、大学硕士论文 多光谱遥感图像无损压缩算法研究 1 。1 图像压缩的意义 第一章概论 人类社会己进入信息化、数字化时代,数字图像技术作为数字技术的重要 组成部分,将人们带入了崭新的多媒体世界。但与数字图像技术伴随而生的是 只能以海量形容的数字图像数据。如遥感卫星拍摄下来的遥感照片,尺寸通常 很巨大,假设一幅数字化的单色甲星遥感图像由1 0 0 0 0 1 0 0 0 0 个像素组成, 每个像素灰度由1 2 比特表示,那么保存这幅图像就要用1 2 亿比特。如此巨大 的数据量,使得存储成本极为昂贵,根本不可能为大多数人服务。另外,在有 限带宽的信道上,实时传送如此海量的数据也极为困难。由于许多数据经常需 要在不同的用户和系统之间互相交换,这就需要一种有效的方法来存储和传输 大型数据文件。为了减轻海量数据给存储和压缩环节带来的压力,数字图像的 压缩技术应运而生。 图像压缩技术通过去除数字图像数据的各种冗余信息,以最大幅度降低表 示图像所需的数据量,同时尽可能的保持原始图像的信息。数字图像压缩技术 的发展,使数字图像的r 泛应用成为可能。随着图像压缩技术的应用,数字影 像产品迅速普及,已走进了干家万户,涉及到了我们生活的方方面面。近年 来,由于计算速度不断提高、存储器容量迅速增加,使得各种复杂编码方法都 能预先在计算机上进行模拟和性能比较。编码技术取得了很大进展。雨v l s i 的发展,又使得各种高效压缩算法的硬件实时实现成为可能。目前,高效图像 压缩编码技术已取得了多方面的成功应用。 1 2 图像压缩技术介绍伫3 2 4 】 1 2 1 图像数据压缩编码技术分类 图像压缩编码技术的分类方法众多,至今尚无统一标准。一个重要原因是 数据压缩领域方兴未艾,新的技术和方法不断涌现。多数学者比较认同的是将 压缩分为无损压缩和有损压缩两类。 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 1 1 无损压缩 无损压缩通常称为信息保持编码或熵编码。无损压缩算法在图像信息编码 和解码过程中没有信息损失,从而可以完全重建原图像。这类算法能达到的压 缩比不高,一般不超过3 :1 ,常用于医学、遥感图像等敏感性的应用中。 2 ) 有损压缩 有损压缩是一类有失真的编码方法,在信息论中叫做熵压缩。由于信息熵 被压缩,能达到的压缩比较高。有损压缩技术多应用于数字电视技术和静止图 像通信、工业、贸易和娱乐等方面。 1 2 2 图像中的冗余信息 图像压缩通过去除数字图像数据的各种冗余,来达到压缩的目的。图像数 据中的冗余信息主要包括信息熵冗余、像素间冗余和视觉冗余。 1 ) 信息熵冗余 信息熵冗余是指对图像中出现概率相差很大的像素都用相同的比特数进行 编码。由信息论的有关理论可知,为表示图像数据的一个像素点,只需要按其 信息熵的大小分配相应比特数即可。然而实际图像中的每个像素一般都用相同 的比特数表示,这样必然存在冗余。 2 ) 像素间冗余 像素冗余包括多种。图像内相邻像素之间存在空间冗余。运动图像中相邻 两帧图像间存在时间冗余。在多光谱图像中,谱间相邻的像素间存在谱间冗 余。有些图像的部分区域内存在着非常强的纹理结构,或是图像的各个部分之 间存在着自相似性,则形成了像素间的结构冗余。 3 ) 视觉冗余 多数情况下,重建图像的最终接收者是人的眼睛。由于人眼的分辨力有 限,一些图像信息的损失对人眼的影响微乎其微,因此可以允许压缩后的复原 图像有一定失真,只要这种失真难以察觉即可。这就是视觉信息的冗余。 1 2 3 常用的压缩编码方法 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 图像中的各种形式的冗余,是编码压缩图像数据的出发点。常用的压缩编 码方法有如下一些: 1 ) 预测编码 由于图像中相邻像素间都存在着较强的相关性,因此可利用某一像素的邻 近像素来预测它的值。由于预测误差馓远小于像素的原始灰度值,只要对误 差进行量化编码,就可以降低编码率,这就是预测编码。 2 1 变换编码 消除图像数据空间相关性的较有效的方法是进行信号变换,使图像数据在 变换域上最大限度的不相关,常用的变换方法有k l 变换、d c t 变换等。图 像变换本身并不能带来压缩,但由于变换系数一般具有良好的性质,只要采用 适当的量化和熵编码就可以有效的对图像进行压缩。 3 ) 其它编码 除了以上,传统的编码方法还有基于字典的技术,基于统计的方法和量化 编码等。近年来又出现了许多新的编码方法,例如子带编码、分形变码、模型 编码和小波编码等。这些方法主要是结合人类视觉生理、心理特性设计编码系 统,被称为第二代图像编码技术,它们都得到了较好的压缩效果,但一般都是 有损压缩。 当今的数据压缩技术多采用的是几种编码方法的混合编码方法,以尽量去 除数据图像中的各类冗余。论文中提出的几种对多光谱遥感图像的压缩算法也 都是基于多种方法的混合编码。 1 2 4 图像压缩技术性能衡量的三个关键参数 1 ) 压缩比:在所要求的恢复图像质量的条件下,人们追求高压缩比。如果 压缩比用输入数据量与输出数据量之比来衡量,则必须明确输入和输出的格 式。一种衡量压缩比的更科学的方法是确定压缩前后每个像素所需的位数( 比 特数) 即b p p 。 2 ) 图像质量:主要针对有损压缩而言,不同应用目的,不同压缩类型对图 像质量的要求有很大的差异。图像质量的评价对图像编码具有重大的指导意 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 义。图像质量包括两个方面:一个是图像逼真度,即被压缩处理的待评价图像 与原始图像之间的偏离程度;第二个是可懂度,它是指图像向人或机器提供信 息的能力。虽然可用若干客观质量标准来衡量图像质量,但用得最多最为可靠 最具权威的评价方法,主要还是主观评价方法。 3 1 压缩解压的简易性:包括压缩解压速度,软件和硬件的开销或占用的 资源。 以上三个关键参数或指标,往往彼此是矛盾的。可针对不同的应用,进行 必要的优化和折衷。 1 3 多光谱遥感图像压缩技术介绍 1 3 1 多光谱遥感图像压缩的意义 随着遥感技术的发展,新型航天遥感器( 成像光谱仪和合成孑l 径雷达等) 及未来的地球资源探测平台所获取的数据量越来越大,如高分辨率成像光谱仪 h i r e s 要获取3 0 米地面分辨率的1 9 2 个谱段数据,其数据传输达到 2 8 0 m b p s ! 不但给星上数据存储和传输信道带来过重的负担,也使地面的数据 接受难以应付。另一方面,遥感图像数据本身却存在着相当大的冗余度,显而 易见,压缩是极其必要的。 遥测传感器要求以有限的信道容量尽可能多地传送遥感信息。主要使用无 损压缩,但当信息量大到无损压缩无法满足信道要求时,也考虑失真较小的有 损压缩。若只对某些特殊区域感兴趣,可采用分类压缩,以减轻通信和存储的 负担。 1 3 2 遥感图像压缩技术分类 多光谱遥感图像的压缩技术分类方法很多,也无统一标准,下面是目前比 较认同的一种分类方法: 1 ) 星( 机) 上无损压缩 星上数据压缩目前以无损压缩为主。无损压缩方法主要包括两个内容:其 一,去除图像数据的相关性,如用d p c m ,正交变化等,以减小图像数据的 4 西北工业大学硕士论文 多光醋遥感图像无损压缩算法研究 熵值。对于多波段遥感图像既要去除谱问相关又要去除空间相关。其二,对于 相关结果进行编码,常采用h u f f m a n 编码,r i c e 编码和算术编码等,用以实 现由熵值的减少所带来的数据压缩潜力。该方向也是本论文的研究方向。 2 ) 星( 机) 上有损数据压缩 未来星载多光谱遥感器对数据传输的需求将远超过信道容量,无损压缩已 不足以解决问题,必须考虑有损方式。 3 ) 地面遥感数据压缩 地面处理比在星上处理的限制少,可以采用较复杂的性能更好的压缩方 案。硬件复杂度和功耗都可以高一些;一般不要求实时性,纯软件方案也可以 考虑。 1 3 3 国际上遥感图像压缩现状 前期遥感图像压缩研究主要集中于编码,目前编码己可接近图像的信息熵 7 】,而去相关技术仍有足够的研究余地。应用最广的去相关技术是预测技 术。目前的研究重点有两个,一是在保证固定的失真上尽量提高压缩比,另一 个是在保证压缩效果的前提下达到实时编码。 对于多光谱图像的无损压缩算法,目前比较好的方法基本上都是基于预测 的方法,如预测树压缩方法。一般来说都是先去除多光谱图像之间的各种冗 余,再进行熵编码。现在人们开始把整型小波用到了无损压缩上,也就是把变 换用到了无损压缩里的去冗余上。 对于多光谱图像的有损压缩算法,由于遥感图像的敏感性,信息失真不能 过大,所以目前一般都是基于一种所谓的近无损编码或是分类编码研究,分类 编码研究是按地表信息选取感兴趣区域进行无损压缩,而对其它不重要区域可 以采用有损压缩。进行这方面研究的人比较多,方法也较多,如小波编码,模 型编码等等。 1 4 论文的主要内容 本文的第一章是概论部分,主要讲述了图像压缩的意义,对现有的图像压 缩编码方法进行了概括,并对多光谱遥感图像的压缩技术作了简要的介绍: 西北工业大学硕士论文多光谱遥感图像无损压缩算法研究 第二章讲述了信息论的基础,介缁了信息论的一些基本概念和多种编码方 法,并详细介绍了论文中用到的算术编码算法及其程序实现; 第三章对遥感图像的预测树编码方法进行了详细研究,并结合遥感图像的 特点提出了误差补偿预测树方法; 第四章研究了整型小波编码技术用于图像压缩的技术,并针对多光谱遥感 图像的特点提出了基于整型小波进行多光谱图像压缩的算法; 第五章是全文的总结,并对未来可能的研究方向进行了展望。 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 第二章熵编码理论 弟一旱炯缃缯瑾磁 2 1 熵编码的基本原型1 6 】 美国科学家香农于1 9 4 8 年发表了著名的论文通信的数学理论,为信 息论奠定了理论基础。信息论的核心内容之一是信源编码理论,并由此衍生出 了信息论的一个重要分支数据压缩理论l j 技术。其中熵编码部分的理论基 础是香农第一定理,即无失真信源编码定理,这一定理给出了无失真熵编码可 以达到的理论极限。 2 1 1 信息论的基本概念 香农认为信息是事物运动状态或存在方式的不确定性的一种描述,即信息 量与不确定性的消除程度有关。 定义2 1 某一事件a 发生所含有的信息量称之为n 的自信息量,它是该事 件发生的先验概率的函数,即 ,( q ) = 一l o g p ( a ,) ( 2 1 ) 如果取以2 为底,则所得到的信息量单位为比特。对于信源x 未) = 意i ) 之:) i 赢r ) ;| ;p = , c z 其平均自信息量定义为自信息的数学期望,即 日( x ) = e - l o g p ( a ,= 一圭j p 0 ,) l o g p ( a ,) ( 2 3 ) 这也就是我们平常所说的信息熵。 定义2 2 信源编码是把信源输出的随机序列 x = ( x l ,x 2 ,x ,x ) 其中x i a i , 口2 ,4 f 一,a 。 变换成码序列 西北工业犬学硕士论文 多光谱遥感图像无损压缩算法研究 y = ( r ,兄,k ,k ) 其中k b ,b 2 , b 3 i 一,b j ,九 其中a 为信源输出的符号;x ,为符号的集合,也即信源字母表;6 ,为码字; e 为代码,简称码; 编码的过程就是建立x ,与k 的对应关系。信源编码中,只有这种对应关 系是顺序的一一对应关系的时候,才能实现无损编码。 下面是一些常用的码定义: 1 ) 二元码,多元码 若码符号集为x = 0 ,1 ,所得码字都是一些二元序列,则称为二元码。若 码字为多元序列,则称为多元码。 2 ) 等长码,变长码 一组码中的所有码字长度都相同为等k 码,若码字长度有不同则为变长 码。 3 ) 非奇异码,奇异码 若一组码中所有码字都不相同,即所有信源符号映射到不同的码符号序列 s ,s jj 彬s 。,s j s 嘭,c 则称码c 为非奇异码a j g - - s h 6 - q e f 有相同的码字则称为奇异码。 4 ) 同价码 若码符号集x :“,x 2 c x , 中每个码符号所占的传输时间都相同则为同 价码。 5 ) 码的n 次扩展码 假定某码c ,它把信源s 中的符号s ,一一变换成码c 中的码字彬,则码c 的次扩展码是所有个码字组成的码字序列的集合。 6 ) 惟一可译码 若码的任意一串有限长的码符号序列只能被惟一地译成所对应的信源符号 序列,则称此码为惟一可译码,或单一可译码。惟可译码,不但要求编 码时不同的信源符号变换成不同的码字,而且还必须要求任意有限长的信 源序列所对应的码符号序列各不相同,即要求码的任意有限长n 次扩展码 都是非奇异码。 西北工业大学硕士论文多光谱遥感图像无损压缩算法研究 7 1 紧致码 对于某一信源或某一码符号集来说,若有一惟一可译码,其平均长度云小 于所有其他惟一可译码的平均长度,则该码称为紧致码,或称最佳码。 2 1 2 信源编码定理 无失真信源编码的基本编码问题就是要找紧致码,紧致码的平均码长r 所 能达到的理论极限可由如下定理得到: 定理2 1 若一个离散无记忆信源s 具有熵为h ( s ) ,并有,个码元的码符号 x = “,x :,x , ,则总可以找到一种无失真编码方法,构成惟一可译码,使 其平均码长满足 掣云 号日脚 ( 2 6 ) 当斗o 。时,贝i 得。l i 。ml 罨, v = 以( 印式中瓦= 善p ( 口,) 丑,其中丑是q 所对应 的码字长度,因此,瓦是无记忆扩展信源s ”中每个符号珥的平均码长,可见 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 豆n 仍是信源s 中每一单个信源符号所需的平均码长。这里要注意导和r 的 区别。它们两者都是每个信源符号所需的码符号的平均数,但是,吾的含义 是,为了得到这个平均值,不是对单个信源符号s 进行编码,而是对n 个信 源符号的序列d 进行编码。 定理2 2 指出,要做到无失真的信源编码,变换每个信源符号平均所需最 少的,元码元数就是信源的熵值f 以r 进制信息量单位测度) 。若编码的平均 码长小于信源的熵值,则惟一可译码不存在,在译码或反变换时必然要带来失 真或差错。同时定理还指出,通过对扩展信源进行变长编码,当_ m 时。 了 平均码长r ( 这时它等于之誓) 可达到这个极限。可见,信源的信息熵是无失 真信源压缩的极限值。也可以认为,信源的信息熵( 日( s ) ) 是描述信源每个 符号平均所需的最少的比特数。 9 2 常见的编码方法【1 6 2 4 】 2 2 1 霍夫曼码 霍夫曼码是霍夫曼于1 9 5 2 年提出的一种构造晟佳码的方法,这是一种最 佳的逐个符号的编码方法。 二元霍夫曼码的编码步骤如下: 1 )将q 个信源符号按概率分布p ( s ,) 的大小,以递减次序排列起 来,设p l p 2 p 3 p 。 2 )用0 和1 码符号分别代表概率最小的两个信源符号,并将这两个 概率最小的信源符号合并成一个符号,从而得到一个只包含q 一1 个符 号的新信源,称为s 信源的缩减信源舅。 3 )把缩减信源s 的符号仍按概率大小以递减次序排列,再将其最 后二个概率最小的符号合并成一个符号,并分别用0 和1 码符号表 示,这样又形成了g 一2 个符号的缩减信源s ,。 1 0 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 4 )依次继续下去,直至信源最后只剩下两个符号为止。将这最后两 个信源符号分别用0 和1 码符号表示。然后从最后一级缩减信源开 始,向前返回,就得出各信源符号所对应的码符号序列,即得对应的 码字。 表2 1 是一个具体的霍夫曼编码的例子。其中离散无记忆信源 s = 【s ,s :,s 3 ,s 。,s 5 ,各符号的概率分布为 0 4 ,o 2 ,o 2 ,o 1 ,o 1 表2 1 一种霍夫曼编码 信源符号码字长度码字概率缩减信源 s i , 形 p ( s j ) s ls 2 s 3 y 6 卫 s lll z 10 4l0 4llo 4 s 220 l 。一。 0 1 0 2 0 1 o 4 旦 l 1 0 0 0o 2 生 n 掣 11 1 1 卜o 2 _ r 屯 30 0 0 , q q l q r + 0 2 t _ j 0 0 l s 4 40 0 1 0 s s4o o l l0 0 l l 霍夫曼编码方法得到的码并非是惟一的。首先因为,每次对缩减信源最后 两个概率最小的符号,用0 和l 码是可以任意的,可以得到不同的码。但它们 只是码字具体形式不同,而其码长,。不变,平均码长r 也不变,所以没有本质 差别。其次,当缩减信源中缩减合并后的符号的概率与其它信源符号概率相同 时,从编码方法上来说,它们的概率次序的排列哪个放在上面,哪个放在下面 是没有区别的,但得到的码是不同的。对这二种不同的码,它们的码长,各不 同,然而平均码长云是相同的。 在霍夫曼编码过程中,当缩减信源的概率分布重新排列时,应使合并得来 的概率和尽量处于最高的位置,这样可使合并的元素重复编码次数减少,使短 码得到充分利用。 霍夫曼编码具有以下三个特点: 1 ) 霍夫曼码的编码方法保证了概率大的符号对应于短码,概率小的符号 对应于长码,即n p 。有,而且短码得到充分利用。 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 2 ) 每次缩减信源的最后两个码字总是最后一位码元不同,前面各位码元 相同。 3 1 每次缩减信源的最长两个码字有相同的码长。 2 2 2 费诺码 费诺编码不是最佳的编码方法,但有时也可得到最佳码的性能。 费诺码的编码过程如下:首先,将信源符号以概率递减的次序排列起来, 将排列好的信源符号划分成两大组,使每组的概率和近于相同,并各赋予一个 二元码符号“0 ”和“1 ”:然后,将每一大组的信源符号再分成两组,使同一 组的两个小组的概率和近于相同,并又分别赋予一个二元码符号;依次下去, 直至每个小组只剩一个信源符号为止。这样,信源符号所对应的码符号序列则 为编得的码字。 费诺码的编码方法实际上是构造码树的一种方法,所以费诺码是即时码。 它也考虑了信源的统计特性,使经常山现的信源符号能对应码长短的码字。显 然,这种码虽好,但不一定能使短码得到充分利用。尤其是当信源符号较多, 并有一些符号概率分布很接近时,分两大组的组合方法就会很多。可能某种分 大组的结果,会出现后面小组的“概率和”相差较远,因而使平均码长增加, 所以费诺码不一定是最佳码。 费诺码方法同样适合于r 元编码,只需每次分成,组即可。 2 2 3 香农一费诺l 埃利斯码 该编码方法是采用信源符号的累计分布函数来分配码字。 设信源符号集彳= 慨,口:,a 。 ,并设所有的p 0 ) 0 ,口彳。定义累计分 布函数: ,( s ) = p o ) 口爿 ( 2 7 ) 口s s 又定义修正的累计分布函数: 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 f ( s ) = f ( 吼) = p ( a i ) + 圭p ( a t , )a k ) 口,a ( 2 8 ) 可见,所有的概率都是正数,所以当a b 时f ( a ) f ( b ) 。故若知道了 f ( a 。) ,就能确定处在累计分布函数中的哪个区间,就能确定信源符号 s = a 。因此可以采用f ( a 。) 的数值作为符号a 。的码字。 一般f ( a 。) 为一实数,若用一二进制表示,其一般为无限位数。我们取小数 后,( 口。) 位,即截去后面的位数,得f ( 吼) 的近似值扩( 吼) 上。,并用这,( n 。) 位 二进制作为a 。的码字。其b j ,表示取,位使小于等于x 的数。根据二进小数截 去位数的影响,得 f ( 吼) 一扩( 吼) l 而1 ( 2 9 ) 若选取“a t ) 2 i1 0 8 南+ l ( 2 1 0 ) 得嘉 掣坷- f ( ( 2 1 1 ) 那么可见,p ( a 。) 与它的近似值之差小于该台级的一半。也就是说,每个码字 对应的区间完全处于累计分布函数中该信源符号对应的台级宽度内,即不同码 字对应的区域是不同的,没有重叠。这样得到的码一定满足前缀条件,一定是 即时码。 香农一费诺一埃利斯码的平局码长为: ( s ) + 1 云 ( s ) + 2 ( 2 1 2 ) 可见,此码比霍夫曼码的平均码长要增加一位二元码元。 2 3 算术编码 算术编码是从全序列出发考虑符号之间的依赖关系来进行编码的,具有很 高的编码效率。本论文后面的算法在实现编码的部分采用的都是自适应算术编 码,因此这里对该编码方法加以详细介绍。 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 2 3 1 算术编码原理【5 】 算术编码和香农一费诺一埃利斯码编码的基本思想相同。把一个信号用0 到1 之间的一个实数小区间来表示,随着信号变长,用来表示它的小区间就越 短,用来表示该小区间的字节数就越多。信号里的连续符号按照模型给出的符 号概率来降低区间大小。概率大的符号缩小区间的程度不如概率小的符号。 在信号转换以前,信号的范围是整个区间0 ,1 ) ,表示为半开半闭区间 0 x = c u m _ f r e q i : c u m _ f r e q o 】 = m a x _ f r e q u e n c y : ( m a x _ 舶q u e n c y 为允许的最大累计频率计数) 上面的算法只有在对整个的信息编码完后才能进行结果传送,而且在解码 时只有接受到全部的信息后才能开始解码。因此在大多应用场合都不这样做, 一般采用递增的操作模式。 先规定区i 盲q 1 0 w ,h i g h 】的最大范围是 0 ,t o p _ v a l u e ,并且做出一下定义: f i r s t q t r 定义为t o p _ v a l u e 4 + l ,h a l f 定义为2f i r s t _ q t r ,t h i r d _ q t r 定义为3 + f i r s t _ q t r 。 随着编码范围的缩小,l o w 和h i g h 的高字节变得相同。相同的高字节已经 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 不影响未来的概率子区间的变换。对于编码来说,可以采用如下方式输出: f o r ( ;) i f ( h i g h = h a l 0 输出“1 ”; l o w = 2 + ( 1 0 w h a l f ) : h i g h = 2 + ( h i g h - h a l t ) + l : ) 下面是对一些可能影响编码准确性的问题讨论: 下溢:当l o w 和h i 曲十分接近时,由于算术编码对每个输入的字符依据模 型给定的累计概率按比例对_ 直至1 1 0 w ,h i 曲 区间,可能有一些不同的字符会按 比例对应至l j 1 0 w ,h i g h l y 间内的同一个整数。如果出现这种情况,编码就不能 继续下去。因此,编码器必须保证区i n q 1 0 w ,h i g h x 足够大到可以防止这种情 况。能做到这点的最简单的方式是保证区间至少和m a x f r e q u e n c y 一样大。 按照上面的算法,只要l o w ,h i g h 前面的字节相同,就把它输出,所以出 现下溢时,l o w 和h i g h 肯定分布于h a l f 的两侧。假定它们的距离近到: f i r s t _ q t r - l o w h a l f = h i g h t h i r d _ q t r 这时后两个输出字节必定不同,即输出必为”o l ”或”1 0 ”。如果下个输出 为0 ,区间范围将在h a l f 之上。故后面将输出”1 ”。同理输出为”l ”时后面输 出为0 。因此这样区间能够立即被安全的扩展。 但是如果进行完该操作后,仍然是f i r s l - q t r = l o w h a l f = h i g h t h i r d _ q t r 该 怎么办? 下图是一种扩展情况,区间被扩展了两次。 1 6 堕! ! 三些查堂堡主笙茎 圭堂堂望壁里堡垂塑垦笪簦i ! ! ! 塑 图2 2 防止f 溢的区间扩展 此时,如果下一个输出为0 ,后面将输出两个1 。同理,如果扩展不够 还可以继续扩展。使用这种技术,编码器能够保证在扩展操作后:l o wc f i r s tq t r h a l f = h i g h 或l o w h a l f t h i r d _ q t r = h i g h 。 因此,只要由累计频率扩展出的整型区域跨度在c o d e _ v a l u e 的1 4 ,下溢 现象就不会发生。也即: m a x f r e q u e n c y ,则转到4 ,其中为多光谱图像的总波段数;否痢执行以 下各步: 3 1 对第力波段图像中的各像素按逐行扫描方式执行以下各步: i 若像素位于图像的边界上,即位于图像的头两行、头两列和最后一 列,由于其不具有如图3 3 所示的所有8 个邻近像素,所以只根据 前一波段图像的最优预测树进行常规预测,不进行误差补偿。 一若像素不在图像的边界上,但在第三行或第三列中,则根据前一波 段图像的最优预测树在公式( 3 5 ) 中选用相应的预测器进行误差 补偿预测。 - 若像素不符合上述两种情况,则对公式( 3 6 ) 进行判定: 多光谆譬遥感图像无损压缩算法研究 若平均误差幅度小于阈值,则根据前一波段图像的最优预测树在 公式( 3 5 ) 中选用相应的预测器进行误差补偿预测,系数口取为 预测器中所用到的邻域像素的系数值。 若甲均误差幅度大了i 闽值,则根据前一波段图像的最优预测树在 公式( 3 5 ) 中选用相应的坝测器进行误差补偿预测,系数口由公 式( 3 2 ) 计算。j 。j a 小j 二闽俩,不做误差补偿。 3 2 建立第波段图像的最优侧叫邻域预测树,一”+ 1 ,转到3 。 4 对各波段预测误差图像进行算术编码。 5 编码结束。 解码算法是上述算法的逆过程,此处不再赘述。在解码过程中,对每个像 素灰度值进行预测时所用到的其余像素的灰度值都己在先期解码过程中恢复, 因此压缩数据中不必有任何的附加信息。 3 3 3 仿真实验结果 本文使用的实验数据是由国家8 6 3 计划3 0 8 办公室和中国科学院上海技术 物理所提供的于1 9 9 9 年5 j 稚 常州附近? 采集的6 4 波段多光谱数据,空间 分辨率为l o m ,谱问分辨率为1 0 h m ,图像大小为5 1 2 2 0 4 0 。为了检验本文 算法对不同成像内容、不同波段范围多光谱图像的压缩能力,我们从中截取了 三组不同区域、不同波段范围的图像,图像大小为2 5 6 2 5 6 ,每组图像都是 由原始6 4 波段中的连续1 6 个波段图像组成,波段范围在表3 3 中注明。图 t a ) i 蚓像s u b o ( 第9 波段) ( b ) i 冬 像s u b l ( 2 i ;1 9 波段) ( c ) 图像s u b 2 ( 第2 9 波段) 劁3 5 组多光谱劁像 西北工业大学硕士论文多光谱遥感图像无损压缩算法研究 3 5 是这三组数据中的代表图像。 图3 6 中分别绘出了第一组图像s u b o 中各波段图像的原始熵、使用侧四邻 域预测树方法【2 5 】后各波段预测误差图像的熵以及使用误差补偿预测树方法后 各波段预测误差图像的熵,由图3 6 可以看出误差补偿预测树方法能够更好的 去除图像的谱间灰度冗余。我们通过计算相邻波段图像间的相关系数来进一步 分析误差补偿预测树方法的性能。对两幅大小为m x n 的图像x 、y ,其相关 系数为 v ( x ,y ) =( 3 7 ) 计算得到的s u b o 中相邻波段图像间的相关系数如图3 7 所绘,从中可以看到 各波段图像间的相关性存在着差异。 裁 谣 牛k 罂 - - e - 原始图像熵 凸r 采用侧四邻域预 测树方法后预测 误差图像熵 串采用误差补偿预 测树方法后预测 皇莹圆傍瞄 波段 图3 6 原始图像熵和预测误差图 蚓3 7 相邻波段图像的相关 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 通过图3 6 和图3 ,7 的比较可以看山,当两相邻图像的相关性较大时,利 用误差补偿方法可得到较好的压缩效果;当两相邻图像的相关性较小时,误差 补偿方法并没有明显的改进作用,因此误差补偿算法主要去除的是多光谱图像 的谱阃统计冗余。 表3 ,3 列出了对三组图像分别采用侧四邻域预测树方法和误差补偿预测树 方法进行压缩后获得的压缩比。由表3 3 可以看出,误差补偿预测树方法对于 各组图像的压缩结果均优于侧四邻域预测树方法。在图3 5 和表3 3 中,侧四 邻域预测树方法在传输预测树时采用了后向自适应方法,误差补偿预测树方法 则未采用简化算法,即相当于t = 0 。 表33 三组刚像分别利用侧网邻域预测树方法和误差补 偿预测树方法压缩后得到的压缩比 s u b o ( i 1 6 波段)s u b l ( 1 1 2 6 波段)s u b 2 ( 2 i 3 6 波段) i 侧四邻域预测树 2 7 91 9 91 7 8 1 f 误差补偿预测树 3 0 12 3 32 0 5 表3 4 中给出了当r 取不同值时,简化算法得到的压缩效果。从表3 4 中 可以看出,当阈值变大时,虽然不必重新计算预测器系数的像素个数大幅增 加,但同时压缩比也在降低。权衡考虑二者之间的关系后,将闽值取为6 是较 合适的选择。 表3 4 一组阁像分别利j | ji 炅差补偿预测树简化 算法压缩后得到的压缩效果 s u b 0 ( 1 1 6 波段)s u b l ( 1 1 2 6 波段)s u b 2 ( 2 1 3 6 波段) 不必重新计算不必重新计算不必重新计 系数的像索所系数的像素所算系数的像 压缩比压缩比压缩比 占的比例o 的比例素所占的比 ( )( )例( ) t = 43 0 0 4 5 8 2 3 22 9 3 2 0 51 5 0 t = 62 9 67 2 5 2 3 05 1 0 2 0 33 3 6 t = 82 9 38 4 2 2 ,2 66 3 2 2 0 04 7 2 3 4 算法分析 本章中提出的这种多光谱图像的误差补偿预测树压缩方案,结合了预测树 和线性预测两类压缩方法,即利用多光谱图像谱间的统计冗余性对预测树方法 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 产生的误差进行补偿,从而同时去除了谱间的结构冗余和统计冗余,取得了良 好的压缩效果。从实验结果中可以看出,当图像相关性较强时,误差补偿预测 树方法与传统预测树方法相比有明显的改进,同时简化算法可以使计算复杂度 大幅降低,因此本算法可以推,。到谱间分辨率更高的高光谱或超光谱图像使 用。在对该算法进行进一步深入研究时,应考虑对于相关性较弱的图像要如何 改进算法,以得到更好的压缩结果。 西北工业大学硕士论文 多光谱遥感图像无损压缩算法研究 第四章基于小波变换的多光谱图像压缩 4 1 小波分析思想 1 9 8 0 年,法国地球物理学家m o r l e t 在分析人工地震勘探信号时发现这类 信号的长期变化趋势是稳定的,但在局部存在突变点或不连续点。在对这类非 平稳信号进行分析时,人们不仅希望能够确定信号中的突变点或不连续点,也 希望能够很好的判断出信号的长期变化趋势。于是m o r l e t 提出了小波变换, 这种变换通过采用不同的尺度或分辨率对信号进行分析以达到上述的目的:当 对信号进行一种粗略近似或低分辨率分析时,可以把信号看成是平稳的;但是 对信号进行一种精细近似或高分辨率分析时,信号的不连续性或非平稳性就显 而易见。这种信号分析的多分辨率或多尺度的观点正是小波变换的实质,因此 小波分析的目的可以形象的描述为“既看到森林( 信号的概貌) ,也看到树木

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论