




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西北工业凡学倾 论殳:多光m 遥感蚓像觚缩技术研究 多光谱遥感图像压缩技术研究 作者:郝秀兰 导师:冯燕副教授 学科:信号与信息处理 摘要 随着多光谱遥感技术的发展,多光谱图像的压缩受到越来越多的关注。 由于遥感图像数据对地物分析和识别有非常重要的作用,因此大多数情况下 希望在遥感图像压缩中尽量减少信息损失。即进行无损近无损压缩。本文 在对一些目前已有的多光谱图像压缩方法进行深入研究的基础上,分别利用 k l 变换和神经网络的方法实现了遥感图像的压缩。 本文首先讲述了图像压缩的意义,对现有的图像压缩编码方法进行了概 括,并对多光谱遥感图像的压缩技术作了简要的介绍。然后从信息论的角度 对信息编码理论进行了总结,回顾了目前常用的各种编码方法,并对算术编 码进行了详细的讨论。接着详细研究了k l 变换原理和整型小波的构造方 法,编程实现了结合k ,l 变换和整数小波变换的多光谱图像压缩算法,该算 法将k l 变换用于去除多光谱遥感图像的谱间冗余,在谱内则使用整型小波 方法去除空间冗余。实验结果表明,对机载6 4 波段多光谱遥感图像进行k l 变换和整数小波变换后,选用五个本征子图像重建原图像压缩比可以达到 l l 以上,峰值信噪比则超过4 5 d b ,取得了其它方法无法获得的效果。该方 法主要的优点是可以通过控制选取保留的本征值个数来调整误差,使得舍入 误差控制在要求的范围内。最后讨论了基于神经网络的主分量分析( p c a ) 方法,该方法通过迭代来提取主分量,克服了k l 变换计算复杂且需要大量 存贮空间的缺点。实验结果表明,该方法完全可以达到与k 。l 变换相当的压 缩效果。 关键字:多光谱图像图像压缩k l 变换整型小波变换神经网络主分量 分析( p c a ) 两北1 :业火学坝i 论文:多光卅遥感到像胝缩拙术研究 r e s e a r c ho nc o m p r e s s i o n a l g o r i t h mo fm u l t i s p e c t r a l r e m o t e - s e n s i n gi m a g e s a u t h o r :h a ox i t l l a l l s u p e r v i s o r :a s s o c i a t ep r o f f e n gy a n s u b j e c t :s i g n a la n di n f o r m a t i o np r o c e s s i n g a b s t r a c t w i t ht h e d e v e l o p m e n t o f m u l t i s p e c t r a l r e m o t e - s e n s i n gt e c h n o l o g y , c o m p r e s s i o no fm u l t i s p e c t r a li m a g e si so fm o r ea n dm o r ei m p o r t a n c e a st h e o r i g i n a l d a t ai sn e e d e ds o m e t i m e s ,t h el o s s l e s s n e a r l o s s l e s s c o m p r e s s i o n o f m u l t i s p e c t r a li m a g e si sn e c e s s a r y i nt h i sp a p e r ,s o m et h e o r i e sa n dm e t h o d so f c o m p r e s s i o n o f m u l t i s p e c t r a li m a g e s a r er e v i e w e da n d r e s e a r c h e so n m u l t i s p e c t r a l r e m o t e s e n s i n gi m a g ec o m p r e s s i o nb y k a r h u n e n l o e v e t r a n s f o r m a t i o n ( k l t ) a n dn e u r a ln e t w o r ka r ed i s c u s s e d a tf i r s t ,t h e o r i e sa n dm e t h o d sa b o u tc o d i n ga r es y s t e m a t i c a l l yr e v i e w e d f r o mt h ev i e w p o i n to fi n f o r m a t i o nt h e o r ya n dt h ea r i t h m e t i cc o d i n gi sd i s c u s s e d ind e t a i l s e c o n d l yk l ta n dr e v e r s i b l ei n t e g e r t o i n t e g e rw a v e l e tt r a n s f o r mf o r i m a g ec o m p r e s s i o na r ed i s c u s s e d ,a n dam e t h o do fn e a r l o s s l e s sc o m p r e s s i o no f m u l t i s p e c t r a li m a g e s i s g i v e n ,w h i c hc o m b i n e sk l ta n d i n t e g e r w a v e l e t t r a n s f o r mt o g e t h e rt h e s p a t i a lr e d u n d a n c yi nt h ei m a g e si sr e m o v e db yk l ta n d t h ei n t e r b a n d r e d u n d a n c y i sr e m o v e d b y t h e i n t e g e r - t o i n t e g e r w a v e l e t t r a n s f o r m t h e e x p e r i m e n t r e s u l t sf r o m p r a c t i c a lm u l t i s p e e t r a li m a g e sh a v e s h o w nt h a tt h i s a l g o r i t h mi se f f i c i e n t i ft h eo r i g i n a li m a g ei sr e c o n s t r u c t e db y f i v ee i g e ns u b i m a g e s ,t h en e a r l o s s l e s sc o m p r e s s i o nr a t i oi sa b o v e1lf o rt h ed a t a u s e di nt h i s p a p e ra n dt h ep s n ri s m o r et h a n4 5 d b t h i sm e t h o di s e a s yi n c o n t r o l l i n gm s eb yc h o o s i n gt h en u m b e ro fr e s e r v a t i o ne i g e nv a l u e s i nt h ee n d , t h ep c a a l g o r i t h mb a s e do nn e u r a ln e t w o r ki sp r o p o s e d t h ee x p e r i m e n tr e s u l t s s h o wt h a tt h i sp c a a l g o r i t h mc a l lg e tt h es a m ec o m p r e s s i o nr a t i oa st h ek l t a l g o r i t h mw i t hl o wc o m p l e x i t y k e y w o r d s :m u l t i s p e c t r a li m a g e s ,i m a g ec o m p r e s s i o n ,k l t ,i n t e g e rw a v e l e t t r a n s f o r m ,n e u r a ln e t w o r k ,p r i n c i p a lc o m p o n e n t a n a l y s i s ( p c a ) 西北工业人学f ! i | l 论义:多光种遥感幽像胜缩技术研究 第一章概论 1 1 数据压缩的必要性 1 1 1 什么是数据压缩 数据压缩,就是以最少的数码表示信源所发的信号,减少容纳给定消息 集合或数据采集集合的信号空间。从信息论的角度看,信源编码的一个最主 要的目的,就是要解决数据的压缩问题,它构成了数据压缩的理论基础。 1 1 2 数据压缩的必要性 2 0 世纪后半叶,人类社会进入了信息化、数字化时代。数字图像技术 作为数字技术的重要组成部分,将人们带入了崭新的多媒体世界。但与数字 图像技术伴随而生的是只能以海量形容的数字图像数据。例如海洋地球物理 勘探遥测数据,是用6 0 路传感器,每路信号按1 k h z 频率采样、1 6 位模一 数转换器( a d ) 量化而得,每航测l k m 就需记录一盘o 5 英寸的计算机磁 带而仅仅一条测量船每年就可勘测1 5 0 0 0 k m ! 如此巨大的数据量,使得存 储成本极为昂贵。另外,在有限带宽的信道上,实时传送如此海量的数据也 极为困难。而且由于许多数据经常需要在不同的用户和系统之间互相交换, 这就更需要一种有效的方法来存储和传输大型的数据文件。为了减轻海量数 据给存储和压缩环节带来的压力,数字图像的压缩技术应运而生。 近年来,随着计算机与数字通信技术的迅速发展,特别是网络和多媒体 技术的兴起,图像编码与压缩技术已受到人们越来越多的关注。图像压缩技 术通过去除数字图像数据的各种冗余信息,以最大幅度降低表示图像所需的 数据量,同时尽可能的保持原始图像的信息。目前静止图像的压缩比在3 0 : l 时已可得到良好的视觉效果:运动图像在信噪比损失很低的情况下,可以 达到3 0 0 :l 左右的压缩比。 数字图像压缩技术的发展,使数字图像的广泛应用成为可能,需要压缩 的应用也越来越多。如各种高分辨率和高清晰度电视视频图像数据、医学 c t 和n m r 图像数据、微波遥感图像数据等,都需要进行压缩传输和存储。 近年来,由于计算速度不断提高、存储器容量迅速增加,使得各种复杂编码 方法都能预先在计算机上进行模拟和性能比较编码技术取得了很大进展。 两北工业人学坝l 论义:多光卅遥感幽像k 缩技术研究 2 而v l s i 的发展,又使得各种高效压缩算法的硬件实时实现成为可能。目前 高效图像压缩编码技术己取得了多方面的成功应用。 1 2 图像压缩编码理论基础n ”盯 压缩的理论基础是信息论。从信息沦的角度来看,压缩就是去掉信息中 的冗余,即保留不确定的信息,去掉确定的信息( 可推知的) ,也就是用一 种更接近信息本质的描述来代替原有冗余的描述。这个本质的东西就是信息 量( 即不确定因素) 。 1 2 1 图像中的冗余信息 图像压缩通过去除数字图像数据的各种冗余,来达到压缩的目的。图像 数据中的冗余信息主要包括编码冗余、像素相关冗余和心理视觉冗余。如果 能减少或者消除其中的一种或多种冗余,就能取得数据压缩的效果。 1 ) 编码冗余 为表达图像数据需要使用一系列的符号,图像编码需要用这些符号根据 一定的规则来表达图像。这里对每个信息或事件所赋的符号序列称为码字, 而每个码字里的符号个数称为码字的长度。 编码所用符号构成的集合称为码本。在实际图像中,每个信息或者事件 出现的几率不一样,如果它们对应的码字的长度都一样的话,就不能使编码 产生的符号序列达到最小,从而产生编码冗余。 2 ) 像素相关冗余 像素冗余包括多种。图像内相邻像素之间存在空间冗余。运动图像中相 邻两帧图像间存在时间冗余。在多光谱图像中,谱间相邻的像素间存在谱间 冗余。有些图像的部分区域内存在着非常强的纹理结构,或是图像的各个部 分之间存在着自相似性,则形成了像素间的结构冗余。 3 ) 心理视觉冗余 多数情况下,重建图像的最终接收者是人的眼睛。由于人眼的分辨力有 限,一些图像信息的损失对人眼的影响微乎其微,而且在具体应用中,人也 不是对所有视觉信息有相同的关心程度。一般来说,有些信息( 在特定的场 合或时间) 与另外一些信息相比来说不那么重要,这些信息可认为是心理视 西北 二业人学f 坝l 一论文:多光卅遥感蚓像胝缩技术州究 觉冗余的,去除这些信息并不会明显地降低所感受的图像质量或所期望的图 像作用。心理视觉冗余从本质上随与前面的两种冗余不同,它是与实在的视 觉信息联系着的。因为去除心理视觉冗余数据可能导致定量信息的损失。 1 2 2 图像压缩编码技术分类 图像压缩编码技术的分类方法众多,至今尚无统一标准。一个重要原因 是数据压缩领域方兴未艾,新的技术和方法不断涌现。多数学者比较认同的 是根据解码图像对原始被压缩图像的保真程度,将图像压缩的方法分为两大 类:无损压缩和有损压缩。 1 ) 无损压缩 无损压缩过程是可逆的,通常称为信息保持编码或熵编码。无损压缩算 法在压缩和解压缩过程中没有信息损失,从压缩后的图像可以完全恢复出原 来的图像。这类算法能达到的压缩比不高,一般不超过3 :1 ,常用于医学、 遥感图像等敏感性的应用中。 2 ) 有损压缩 有损压缩是一类有失真的编码方法,是不可逆的,在信息论中叫做熵压 缩。有损压缩信息有一定的损失,无法完全恢复出原图像。但由于信息熵被 压缩,能达到的压缩比较高。有损压缩技术多应用于数字电视技术和静止图 像通信、工业、贸易和娱乐等方面。 选择哪一类压缩,要折中考虑,在不损失有效信息的前提下获得尽可能 高的压缩比。 1 2 3 图像压缩编码方法概述 图像中的各种形式的冗余,是编码压缩图像数据的出发点。常用的压缩 编码方法根据压缩方法的原理进行分类,有如下一些: 1 ) 基于字典的技术 基于字典的技术的生成的文件包含的定长码,每个码代表原文件中数据 的一个特定序列,这类方法的代表有l z 码( l z 7 7 和l z 7 8 两种算法) 和l z w 编码。 2 ) 基于统计的方法 两北t 业人学坝i 。论文:多光晰遥感1 型像h 缩技术 i j f 究4 基f 统计的方法用较短代码代表频繁出现的字符,用较长代码代表不常 址l 现的字符,从而实现数据的压缩,常用的方法包括哈夫曼编码和算术编码。 这些方法去除了图像数据的信息熵冗余,属。j :无损压缩。在未知信源概率分 布的大部分情况下,算术编码要优于哈夫曼编码。 3 ) 量化法 最化是一种最直观的数据压缩方法分为标量量化和矢量量化。标量量 化是把原图像的灰度值量化成较少的级别。矢量量化是把图像分块,将每个 像素块看作矢量进行量化。这两种量化过程都要建立量化查找表,对每输 入数据在表中查找和它最相近的量化值作为输出。标量量化主要是去除视觉 冗余,矢量量化还利用了图像中不同区域的自相似性,它们都属于有损压缩。 4 ) 预测编码 由于图像中相邻像素间都存在较强的相关性,因此可以利用某一像素的 邻近像素来预测它的值。由于预测误差一般远小于像素的原始灰度值只要 对误差进行量化编码,就可以降低编码率,这就是预测编码。预测编码不仅 去除了图像信号的信息熵冗余,也去除了视觉冗余。根据预测后量化编码器 设计的不同,预测编码可以是无损的,也可以是有损的。 5 ) 变换编码 消除图像数据空间相关性的更有效的方法是进行信号变换,使图像数据 在变换域上最大限度的不相关,常用的变换方法有k l 变换、d c t 变换等。 图像变换本身并不能带来压缩,但由于变换系数一般具有良好的性质,只要 采用适当的量化和熵编码就可以有效的对图像进行压缩。变换编码是一种能 得到较高压缩比的有损压缩方法。 除了以上传统的编码方法,近年来又出现了许多新的编码方法,例如子 带编码、分形编码、模型编码和小波编码等。这些方法主要是结含人类视觉 生理、心理特性设计编码系统,被称为第二代图像编码技术。它们都得到了 较好的压缩效果,但一般都是有损压缩。 当今的数据压缩技术多采用的是几种编码方法的混合编码方法,队尽量 去除数据图像中的各类冗余。论文中提出的几种对多光谱遥感图像的压缩算 法也都是基于多种方法的混合编码。 1 2 4 图像压缩系统的性能评价 两j 坚些盔兰鲤卜论文:多光许遥感崮壤堕塑垫查研究三 压缩解压后需要对重建图像的质鼓进行评价,其实也就是对于波形逼真 度的测量,一般常用的有两种方法:客观评价和主观评价。客观评价需要建 立一个可以衡量图像质量的数值量,通过定量计算判断重建图像的效果。实 际中经常用到的是峰值信噪比( p s n r ) 。例如,对一幅大小为m x n ,采用8 比特量化的灰度图像有 p s n r :1 0 1 堡船 。m s e 其中m s e 是图像的均方误差, m s e = 丽1 m 磊- i 刍n - i ( 伽,n ) 一于( 剐) r ( 1 2 2 ) f ( m ,n ) 年l f ( m ,1 ) 分别是原图像中第,n ) 个像素的灰度值和重建图像中 相应像素的灰度值。 上面所用的p s n r 是在均方误差基础上得到的定量计算的结果,它不能 反映人眼的真实感觉。主观评价法是由观察者直接观察图像的效果,因而可 以充分反映人的真实感觉。实际中,为减少人的主观因素的影响,通常由多 个观察者分别对图像进行打分,然后求取平均分值作为对图像的最后评价。 除此之外,还要对图像压缩技术和系统的性能进行比较和评价,最简单 实用的是压缩比。即编码前后数据量的比值,另外还要考虑到压缩解压速 度。 1 3 多光谱遥感图像压缩技术介绍 1 3 1 多光谱遥感图像压缩的意义 随着遥感技术的不断发展和完善,获得大量遥感数据的遥感器不断涌 现,并且向高分辨率多光谱的方向发展。由此产生了一个问题:如何从空间 平台上传输这样大量的数据到地面。例如,将来设计的先进系统,能传输 4 2 8 g b p s 的数据,如何利用卫星有限的下行链路传输这样大量的数据是遥感 压缩系统设计专家必须考虑的问题。未来遥感卫星系统将很有可能受限于卫 星下行链路的带宽,所以必须对遥感图像进行数据压缩。 西北t 业大学坝1 论爻:多光带遥感幽像胜缩投术研究 6 遥测传感器要求以有限的信道容最尽可能多地传送遥感信息。主要使用 无损压缩,但当信息量大到无损压缩无法满足信道要求时,也考虑失真较小 的有损压缩。若只对某些特殊区域感兴趣,可采用分类压缩,以减轻通信和 存储的负担。 1 - 3 。2 遥感图像压缩技术分类 多光谱遥感图像的压缩技术分类方法很多,也无统一标准,下面是目前 比较认同的一种分类方法旧j : 1 ) 星( 机) 上无损压缩 星上数据压缩目前以无损压缩为主。无损压缩方法主要包括两个内容: 其一,去除图像数据的相关性,如用d p c m ,正交变化等,以减小图像数据 的熵值。对于多波段遥感图像既要去除谱间相关又要去除空间相关。其二, 对于相关结果进行编码,常采用h u f f m a n 编码,r i c e 编码和算术编码等,用 以实现由熵值的减少所带来的数据压缩潜力。 2 ) 星( 机) 上有损数据压缩 未来星载多光谱遥感器对数据传输的需求将远超过信道容量,无损压缩 已不足以解决问题,必须考虑高保真情况下的有损方式。该方向也是本论文 的研究方向。 3 ) 地面遥感数据压缩 地面处理比在星上处理的限制少,可以采用较复杂的性能更好的压缩方 案。硬件复杂度和功耗都可以高一些;一般不要求实时性,纯软件方案也可 以考虑。 1 3 3 常用的遥感图像压缩技术 前期遥感图像压缩研究主要集中于编码,目前编码已可接近图像的信息 熵而去相关技术仍有足够的研究余地。应用最广的去相关技术是预测和变 换技术。目前的研究重点有两个,一是在保证固定的失真上尽量提高压缩比, 另一个是在保证压缩效果的前提下达到实时编码。 对于多光谱图像的无损压缩算法,目前比较好的方法基本上都是基于预 测的方法,如d p c m 预测方法和预测树压缩方法。一般来说都是先去除多 光谱图像之间的各种冗余再进行熵编码。现在人们开始把整型小波用到了 西北_ _ = _ 业人学坝i 一论文:多光黹遥感i 划像爪缩投术研究 7 无损压缩上,也就是把变换用到了无损压缩里的去冗余上。 对于多光谱图像的有损压缩算法,由j :遥感图像的敏感性,信息失真不 能过大,所以目前一般都是基于近无损编码或是分类编码研究,分类编码研 究是将地表信息分为感兴趣区域和不重要区域,选取感兴趣区域进行无损压 缩,而对其它不重要区域可以采用有损压缩。进行这方面研究的人比较多 方法也较多,如k l t ,小波编码,模型编码等等。 1 4 论文的主要内容 本文的第一章是概论部分主要讲述了图像压缩的意义,对现有的图像 压缩编码方法进行了概括,并对多光谱遥感图像的压缩技术作了简要的介 绍: 第二章讲述了信息论的基础,介绍了信息论的一些基本概念和多种编码 方法,并详细介绍了论文中用到的算术编码算法; 第三章研究了k l 变换和整型小波编码用于遥感图像压缩的技术,编程 实现了结合k l 变换和整数小波变换的多光谱图像压缩算法,该算法将k l 变换用于去除多光谱遥感图像的谱间冗余在谱内则使用整型小波方法去除 空间冗余,取得了其它方法无法获得的效果; 第四章阐述了基于人工神经网络的主分量分析算法,并对使用神经网络 进行图像压缩的特性作了总结,在此基础上将基于人工神经网络的主分量分 析算法应用于多光谱遥感图像的压缩中; 第五章是全文的总结,并对未来可能的研究方向进行了展望。 两- i l t , & 人学坝i 硷义:多光计遥感幽像惟缩技术研究 2 1 统计编码 第二章信息编码理论 作为香农信息论研究的对象一一信息,被假设为由一系列的随机变量所 代表,它们往往用随机出现的符号来表示。我们称输出这些符号集的源为“信 源”。研究中,不考虑这个信源的内部结构及发生符号的机理,只研究这些 符号集的属性。 2 1 1 自信息量和一阶熵”“】 香农认为信息是事物运动状态或存在方式的不确定性的一种描述,即信 息量与不确定性的消除程度有关。 莱一事件a 。发生所含有的信息量称之为n ,的自信息量,它是该事件发生 的先验概率的函数,即 ,( q ) = 一l o g p ( a ,) ( 2 1 1 ) 式( 2 1 1 ) 将随对数所用“底”不同而取不同值。因而其单位也不同。 考虑到一般物理器件的二态特性,通常取以2 为底。,相应的信息量单位为比 特( b i t ) 。 l ( a ) 亦称自信息函数,其含义实际是:随机变量x 取值为 d 时所携带 信息的度量。 对于信源x 未) = 未,未2 ) i 唯t q r 勺喜嘶扣- cz t z , 其平均自信息量定义为自信息的数学期望,即 ( x ) = e - l o g ? ( 。) 】= 一p ( a ) l o g p ( a 。) ( 2 1 3 ) 这也就是我们平常所说的信息熵,简称熵( e n t r o p y ) ,单位为b i t 字 符。通常也称式( 2 1 3 ) 所定义的熵为一阶熵,它表示集合a 。中某字符出 西北工业人学坝士论立:多光i 午遥感豳像j 最缩技术研究 9 现的平均不确定性。即为了确定集合a 。中某一字符出现所需的平均信息量 ( 观察之前) ;或反过来,它代表每出现一个字符所给出的平均信息量( 观 察之后) 。 2 1 2 统计编码的基础 如果对字符a 。的编码长度为l i ,则也是一个非负的随机变量,记作: l i = - l o g q 。( o 冬q 。1 ,i = 1 , 2 ,m ,q f = 1 ) ( 2 1 4 ) 卢1 那么对信源a 。编码的平均码长就是 t = p 。一l i p 。l o g q 。 ( 2 1 5 ) i = 1i = 1 而信息论中已经证明熵具有极值性,即 日( x ) = 一p ;l o g p ,蔓一p ;l o g q i ( 2 1 6 ) i = lf 。j 其中等号仅在 q 。 = p 。 时成立。 由此我们得到:对于离散无记忆平稳信源,必须:准确得到字符概率 p ) ;对各字符的编码长度都达到它的自信息量。 在式( 2 1 6 ) 中令q ;= 1 m ,便得到重要的最大离散熵定理: 定理2 1 ( 最大离散熵) 所有概率分布p ,所构成的熵,以等概率时为最 大,即 h ,( p l ,p 2 ,p 。) l o g m ( 2 1 7 ) 离散无记忆信源的冗余度隐含在信源符号的非等概率分布之中。只要信 源不是等概率分布,就存在着数据压缩的可能。这就是统计编码的基础。 在数据压缩技术中,一般将压缩前每个信源符号的编码位数( 1 0 9 m ) 与压缩后平均每符号的编码位数( z ) 之比,定义为数据压缩比( c r : c o m p r e s s i o nr a t i o ) 。它是一个无量纲数即 c r :l o g m( 2 1 8 ) 两北丁业人学坝卜论义:多光日f 遥感幽像服缩技术研究 而 根据前面的介绍,其上界显然是 c r 。= 丽l o g 而m 印:掣( ) ( 2 1 9 ) 则用来表示编码效率。 2 1 3 常见的统计编码方法1 6 1 7 】 统计编码是指一类建立在图像的统计特性基础之上的压缩编码方法,根 据香农的观点,信源冗余度来自信源本身的相关性和信源内事件概率分布的 不均匀性。只要找到去除相关性和改变概率分布不均匀的方法,也就找到了 信源统计编码方法( 也称熵编码) 。首先介绍几个定义: 1 ) 唯一可译编码:有些情况下,为了减少表示图像的平均码字长度, 往往对码字之间不加同步码。但是,这样就要求所编码字序列能被唯一地译 出来。满足这个条件的编码称其为唯一可译编码。也称单义可译码,单义可 译码往往是采用非续长代码。 2 ) 非续长代码:若代码中任何一个码字都不是另一个码字的续长,也 就是不能在某一个码字后面添加一些码元而构成另一个码字,称其为非续k 代码。反之,称其为续长代码。如二进制代码( 0 ,l o ,“ 即为非续长代码, 而 o ,o l ,n j 则为续长代码。因为码字集合中的“o l ”可由同一集合中的 码字“o ”后加上一个码元“1 ”构成。 3 ) 单义代码:任何有限长的码字序列,只能被唯一地分割成一个个码 字,则这样的码字序列称为单义代码。单义代码的充要条件是满足克劳夫特 ( k r a f t ) 不等式: d 1 1 式中d 为代码中码元种类的进制数,对二进制情况,d = 2 。一n 为代码中 码字个数,f 为代码中第i 个码字的长度( 即码元个数) 。可以证明,非续 氏代码一定是单义码,而单义码不一定是非续长代码。 两北t 业大学 ! ;l1 啦义:多光种遥感剀像压缩技术研究 1 1 常见的统计编码方法有以下几种 1 )霍夫曼码 霍夫曼码是霍夫曼于1 9 5 2 年提f 1 1 的一种构造最佳码的方法,这是一种 最佳的逐个符号的编码方法。其理论基于如下的定理: 定理2 2 在变长编码中,若各码字的长度严格按照所对应符号出现概率 的大小逆序排列,则其平均长度为最小。 二元霍夫曼码的编码步骤如下: 将q 个信源符号按概率分布e ( s ,) 的大小,以递减次序排列起来,设 p 1 p 2 p j p 。a 0 和1 码符号分别代表概率最小的两个信源符号,并将这两个概率 最小的信源符号合并成一个符号,从而得到一个只包含q 一1 个符号的新信 源,称为s 信源的缩减信源s 。 把缩减信源s 的符号仍按概率大小以递减次序排列,再将其最后二 个概率最小的符号合并成一个符号,并分别用0 和l 码符号表示,这样又形 成了q 一2 个符号的缩减信源s :。 依次继续下去,直至信源最后只剩一f 两个符号为止。将这最后两个 信源符号分别用0 和1 码符号表示。然后从最后一级缩减信源开始,向前返 回,就得出各信源符号所对应的码符号序列,即得对应的码字。 霍夫曼编码方法得到的码并非是惟一的。首先因为,每次对缩减信源最 后两个概率最小的符号,用0 和1 码是可以任意的,可以得到不同的码。但 它们只是码字具体形式不同,而其码长z 不变,平均码长云也不变,所以没 有本质差别。其次,当缩减信源中缩减合并后的符号的概率与其它信源符号 概率相同时,从编码方法上来说,它们的概率次序的排列哪个放在上面,哪 个放在下面是没有区别的,但得到的码是不同的。对这二种不同的码,它们 的码睦f 各不同,然而平均码长l 是相同的。 在霍夫曼编码过程中,当缩减信源的概率分布重新排列时,应使合并得 来的概率和尽量处于最高的位置,这样可使合并的元素重复编码次数减少, 使短码得到充分利用。霍夫曼码不仅适用于压缩文本文件,经过符号合并后 也可用于二进制文件。但在实际应用中,还存在以下不足:输入符号数受 限于可实现的霍夫曼码表尺寸;译码复杂度大;需要知道输入符号集的 两北丁业人学坝卜论文多光晰遥感幽像胜缩技术研究 1 2 频率分布。 2 ) 香农( s h a hr l o h ) 编码 1 基本原理 设可变氏度编码所用码元进制为d ,被编码的信息符号总数为n ,第i 个 符号出现的概率为p :,与其对应的码字氏度为t ,则编码结果平均码字长度 r 落在下列区间: l sr s 旦+ l l o g dl o g d 式中h 是编码符号的一阶信源熵。由此可以引导出对某一个信息符号( 码字) 的长度存在如下关系式 对二进制码进一步简化成 一鳖s f 。s 一燮+ l l o g d 1 0 9 d l 0 9 2 只r 。 一l 0 9 2 只- i - 1 可见,码字的长度是根据信息符号出现的概率来决定的。香农编码的码 字长度正是根据式( 2 1 1 4 ) 来确定的。 2 香农编码步骤 首先,将输入图像的灰度级( 信息符号) 按出现的概率由大到小顺序排 列( 相等者可以任意颠倒排列位置) : 其次,按式( 2 1 1 3 ) 或( 2 1 1 4 ) 计算各概率对应的码字长度t : 再次,计算各概率对应的累加概率; 最后,把各个累加概率由十进制小数转换成二进制小数,保留最高的t , 位,去掉小数点即获得各个与累加概率先对应的信息符号的码字。 香农编码的效率比哈夫曼编码效率略低一些。 :j ) 算术编码 从理论上讲,采用哈夫曼方法对信源数据进行编码可以获得最佳编码效 两北t 业人学坝卜论义:多光种遥感幽像h 缩技术| _ 】 究 果,但是在实际上,由于计算机中存储和处理的最小数据单位是“比特”, 因此在某种情况下,实际的压缩编码效果往往达不到理论的压缩比。为了解 决计算机中必须以整数位进行编码的问题,人们提出了算术编码方法。算术 编码是从全序列出发考虑符号之间的依赖关系来进行编码的,具有很高的编 码效率。 1 算术编码的特点 算术编码是2 0 世纪6 0 年代初期e l i a s 提出,由r i s s a n e n 和p a s c o 首次 介绍了它的实用技术。算术编码是信息保持型编码,无需为一个符号设定一 个码字。算术编码有固定方法的编码,也有自适应方式的编码。选择不同的 编码方式,将直接影响编码效率。自适应算术编码方式无需先定义概率模型, 对无法进行概率统计的信源比较合适,这点上优于哈夫曼编码;同时,在信 源符号概率比较接近时,算术编码比哈夫曼编码效率要高。 2 编码过程 算术编码的方法是将被编码的信源消息表示成实数轴上0 1 之间的一 个间隔( 也称为子区间) ,消息越长,编码表示它的间隔就越小,表示这一 问隔所需的二进制位数就越多,码字越长。反之,编码所需的二进制位数就 00 0 0 10 0 l l0 1 1 1l ( a )单位区间上的码点 ( b ) 符号序列“a a b ”算数码的子分过程 幽2 1 算术编码的子分过程 少,码字就短。信源中连续符号根据某一模式生成概率的大小来缩小间隔 两北工业人学坝l 论义:多光谱遥感幽像雕缩救术究 1 4 可能出现的符号要比不太可能出现的符号缩小范围少,只增加了较少的比 特。 下面我们从一个算术编码的实例来说明算术编码的原理。如图2 1 所示。 算术编码将待编码的图像数据看作是由多个符号组成的序列,对该序列 递规的进行算术运算后,成为一个二进制分数。在接收端,解码过程也是算 术运算,由二进制分数重建图像符号序列。设图像信源编码可用a 、b 、c 、d 这4 个符号来表示,如果符号a 、b 、c 、d 出现的概率分别是1 2 、1 4 、1 8 和1 8 ,则信源编码符号集的所有符号的概率之和组成了一个完整的概率空 间,可用单位长度的矩形来表示它( 如图2 1 所示) 。在此长度为1 的单位 矩形中,各个符号依次排列,所占宽度和它的概率大小成正比。各个符号的 左边的分界线称为“码点”,每个码点有其相应的码点值。每个码点值是它 前面所出现符号的概率之和。第一个码点的值为0 ,因为在它之前没有码字: 由于d 出现的概率是1 8 ,故第二码点值为o o o l ;由于b 出现的概率为1 4 , 再加上d 出现的概率为1 8 ,所以第三个码点值为两者之和,故为o 0 1 1 ,依 次类推。这样就形成了最初的码字空间分割。 算术编码的过程实质上是对此单位区间的“子分”( s u b d i v i s i o n ) 的过程。 可以设想有一个编码“指针”,随着所编码字的进行,指针就不停的在对区 间进行划分。例如假设欲对“a a b c ”进行算术编码,如图2 1 ( b ) 所示, 其过程如下: 编码前,指针指向码点“0 ”,指针活动宽度为“1 ”,即从o 到l 。 编码“a ”,指针指向新码点:o + 1 o o l l ( 前面的码点+ 前面的宽 度“a ”的码点) ;指针有效活动宽度为:1 0 1 = 0 1 ( 前面的单位长度 “a ”的概率) 。 编码“a ”,指针指向新码点:0 0 1 1 + 0 1 0 0 1 1 = 0 1 0 0 1 ( 前面的码 点+ 前面的宽度“a ”的码点) ;指针有效活动宽度为:o 1 0 1 = o 0 1 ( 前 面的单位长度“a ”的概率) 。 编码b ,指针指向新码点:o 1 0 0 l + 0 0 l 0 0 0 l = 0 1 0 0 1 l ( 前面的 码点+ 前面的宽度“b ”的码点) :指针有效活动宽度为:0 0 1 o 0 l = 0 0 0 0 1 ( 前面的单位长度b 的概率) 。 编码“c ”,指针指向新码点:0 0 1 0 0 1 1 + 0 0 0 0 1 0 1 1 1 = 0 1 0 1 0 0 1 l ( 前面的码点+ 前面的宽度c 的码点) :指针有效活动宽度为:0 0 0 0 1 塑! ! ! 、业查兰 ! 1 堡兰:兰垄堕堡垦型堡生堑
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中枢神经系统脱髓鞘疾病的临床护理
- 现代通信及应用概述
- 府奖学金申请书
- 简易委托支付协议
- 2025年幼儿教育教学工作总结模版
- 策划部部门工作总结模版
- 物流管理集装箱体系优化
- 重症疾病护理核心要点解析
- 服装搭配系统化培训指南
- 流动人口清查总结
- 四川省护理质量管理评价标准
- 2024年中高考必背文言文74篇
- T-CSUS 69-2024 智慧水务技术标准
- 金匮要略知到智慧树章节测试课后答案2024年秋浙江中医药大学
- 电力运维平台需求说明书
- 北京师范大学《文学概论》2022-2023学年第一学期期末试卷
- 2024年度餐饮业会员管理服务合同:顾客权益与会员服务的具体规定3篇
- 2023年高考真题-历史(辽宁卷) 含解析
- 消防安全应急照明设计方案
- 学校校园装修改造工程施工组织设计方案
- 论持久战全文(完整)
评论
0/150
提交评论