(信号与信息处理专业论文)图像与视频标准用于sar数据压缩的研究.pdf_第1页
(信号与信息处理专业论文)图像与视频标准用于sar数据压缩的研究.pdf_第2页
(信号与信息处理专业论文)图像与视频标准用于sar数据压缩的研究.pdf_第3页
(信号与信息处理专业论文)图像与视频标准用于sar数据压缩的研究.pdf_第4页
(信号与信息处理专业论文)图像与视频标准用于sar数据压缩的研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(信号与信息处理专业论文)图像与视频标准用于sar数据压缩的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 图像与视频标准用于s a r 数据压缩的研究 硕士研究生叶纪华导师吴乐南 东南大学无线电工程系 合成孔径雷达( s a r :s y n t h e t i ca p e r t u r er a d a r ) 是种通过信号处理技术对地面进行高 分辨率成像的新体制雷达,是当前雷达发展的前沿技术之一,在军事侦察和民用遥感等多方 面都有着重要价值。对于无人机载和星载合成孔径雷达,其观测结果需要传至地面,由地面 人员进行处理。此时由于高分辨率图像造成大数据量,就会对下传链路的带宽和发射机功率 都提出很高的要求。因此在不降低系统性能的情况下,在空中或空间对合成孔径雷达原始 数据及成像后的数据进行压缩就显得十分必要。本文结合真实机载合成孔径雷达的原始数据 及成像后的数据,研究了采用基于最新静态图像压缩标准j p e g 2 0 0 0 的压缩方法并对其进行 处理,另外还对最新的视频压缩标准h2 6 4 进行了研究并尝试用其帧内编码器对合成孔径雷 达成像后的数据进行压缩。 本文首先介绍了研究合成孔径雷达成像数据压缩算法的目的和意义及其发展现状,并介 绍了本文的主要工作。 第2 章介绍了数据压缩理论及静态图像压缩和视频压缩的发展概况。 第3 章介绍了静态图像压缩的最新标准j p e g 2 0 0 0 ,对其进行改进,并应用于合成孔径 雷达成像的成像数据及原始数据的压缩。 第4 章介绍了新一代视频压缩标准h 2 6 4 ,并用其帧内编码器对合成孔径雷达的成像数 据进行压缩。 最后的结束语对全文工作进行了总结,提出了进一步研究的方向与设想。 关键字:台成孔径雷达;数据压缩;图像编码:j p e g 2 0 0 0 ;h 2 6 4 a b s 仃a c t a b s t r a c t t h er e s e a r c ho fs a r i m a g ed a t ac o m p r e s s i o nb a s e do ns t i l l i m a g ed a t aa n dv i d e od a t ap r o c e s s i o nm e t h o d s c a n d i d a t e :y ej i h u a ,s u p e r v i s o r :w ul e n a n d e p a r t m e n to fr a d i oe n g i n e e r i n g ,s o u t h e a s tu n i v e r s i t y , c h i n a s y n t h e t i ca p e r t u r er a d a r ( s a r ) i so n eo ft h em o s ta d v a n c e dm o d e mr a d a r t e c h n i q u e s ,w h i c hc a no b t a i nh i g hr e s o l u t i o ni m a g ed i g i t a ls i g n a lp r o c e s s i n g t e c h n o l o g y i ti sw i d e l yu s e di nt h em i l i t a r yr e c o n n a i s s a n c e ,c i v i lr e m o t es e n s i n g f i e l d s ,e t c t h es a ri m a g ed a t at a k e nf r o mu a vo rf r o mt h es e c o n d a r yp l a n e tn e e dt ob e t r a n s f e r r e dt ot h eg r o u n d ,a n dt h e h i g hr e s o l u t i o ni m a g ea l s or e q u i eh i g h t r a n s m i t t i n g - r a t e s oe f f i c i e n ta l g o r i t h mf o rt h es a rd a t ac o m p r e s s i o nw i l lp l a ya n i m p o r t a n tr o l e i nt h i st h e s i s ,b a s e do nt h et r u ea i r b o r n es a rd a t a , w er e s e a r c ho n i m p l e m e n t i n gt h en e w e s ts t i l li m a g ec o m p r e s s i o ns t a n d a r d ,t h ej p e g 2 0 0 0 ,o nt h e p r o c e s s i n go ft h es a rd a t a f u r t h e r m o r e ,w ei n t r o d u c et h en e wv i d e oc o m p r e s s i o n s t a n d a r dd r a 行h 2 6 4a n du s ei t si n t r ae n c o d e rt oc o m p r e s st h es a r d a t a i nt h ef i r s tp a r to ft h i st h e s i s ,t h eb a s i ci d e aa n dt h ed e v e l o p m e n to fs a rd a t a c o m p r e s s i o na l g o r i t l u n sa r ei n t r o d u c e db r i e f l y a n dt h em a i nw o r ko ft h ep a p e ri s d e s c r i b e d c h a p t e r2i n t r o d u c e st h ed e v e l o p m e n to fs t i l li m a g ec o m p r e s s i o na n dv i d e o c o m p r e s s i o n i n c h a p t e r3 ,w cp r e s e n tt h en e w e s t c o m p r e s s i o na n dt h em o d i f i c a t i o no ni tf o r c o m p r e s s i o n s t a n d a r d ,j p e g 2 0 0 0 ,f o rs t i l li m a g e s a rd a t ac o m p r e s s i o na n dr a wd a t a i nc h a p t e r4 ,t h en e wg e n e r a t i o no fv i d e oc o m p r e s s i o ns t a n d a r d ,h 2 6 4 ,i s p r e s e n t e da n dw eu s ei t si n t r ae n c o d e rf o rs a rd a t ac o m p r e s s i o n f i n a l l y , w ed r a ws o m ec o n c l u s i o n so ft h ew o r ko ft h i sp a p e ra n dp u tf o r w a r dt h e p o s s i b l ef u t u r ew o r k k e yw o r d s :s a r ;d a t ac o m p r e s s i o n ;i m a g ec o d i n g ;j p e g 2 0 0 0 ;h 2 6 4 l i i y 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 研究生签名: 毕鱼军一日 期:型生! 加 东南大学学位论文使用授权声明 东南大学、中同科学技术信息研究所、国家图书馆有权保留本人所送交学位 论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人 电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论 文被查阅和借阅可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包 括刊登) 授权东南大学研究生院办理。 繇半卜聊虢幽埘互加 第1 章绪论 第1 章绪论 1 1 合成孔径雷达数据压缩的意义及发展现状 合成孔径雷达【1 】【2 】( s a r :s y n t h e t i c a p e r t u r er a d a r ) 是一种有源微波成像传感器, 它采用脉冲压缩技术获得距离向的高分辨率,采用合成孔径技术获得方位向的高分辨率。它 是通过信号处理技术对地面进行高分辨率成像的一种新体制雷达,是现代雷达发展的前沿技 术。合成孔径雷达广泛应用于地形测绘、洪涝灾害监测、海洋污染监测、矿产森林资源和农 作物普查、军事侦察等国民经济和国防领域。相对于可见光和红外等光学传感器,s a r 遥 感不受天气因素干扰,能够穿透云层对地面成像。此外,波长较长的电磁波还对地物有一定 的穿透能力,可以对地表以f 进行进一步观测。因此,s a r 已经逐渐成为军事侦察和对地 遥感的主要手段之一。 根据安装平台的不同,合成孔径雷达可以分为星载和机载两种,其中机载合成孔径雷达 又可以分为有人机载和无人机载。无人机载和星载合成孔释雷达的观测结果需要传至地面, 由地面人员进行处理。一般来说,合成孔径雷达的观测结果可以有两种方式下传: 1 ) 实时成像后,下传图像; 2 ) 下传合成孔径雷达原始数据,在地面进行实时成像或非实时成像。 对于高分辨率成像米说,不管是以哪种方式下传,数据率都是非常高的。过高的数据率, 对下传链路的带宽利发射机功率都提出了很高的要求。然而,机载或星载雷达在体积、重量、 输出功率方面的限制,使得上述要求很难实现。 因此,在不降低系统性能的情况下,在空中( 或空间) 对合成孔径雷达的原始数据及成 像后的数据预先进行压缩就显得十分必要。 对于s a r 成像的原始数据的压缩,目前丁程上已经有很多可行的算法,但究其根本来 说仍然只有块自适应量化算法( b a q ) 。主要是因为其它一些算法如矢量星化、小波变换编 码实现起来比较复杂,运算量大,对硬件设备要求较高,而预测编码又容易造成误码扩散, 这就限制了这些算法在工程上的应用。 随着国内外对乐缩算法研究的深入以及信号处理硬件性能的提高,使得复杂算法在t 程 中的应用成为可能。如随着数字信号处理器( d s p ) ,大容量存储芯片及专用集成电路( a s i c ) 技术的发展,使得小波变换应用于星载或机载合成孔径雷达数据压缩也成为可能。 另外,对于在卫星或飞机上实时成像后的数据进行压缩,还需要专门研究更有针对性的 方法。 1 2 论文的主要内容 本文的土要工作是研究对机载合成孔径雷达的成像数据及原始数据的压缩方法,为机载 东南大学硕士论文 s a r 系统的设计和s a r 数据的一r 传提供有益的参考。具体研究、采用了最新的静态图像编 码国际标准, i - p e g 2 0 0 ,对其进行了改进:还对新一代视频压缩标准h 2 6 4 的帧内编码器用于 s a r 成像数据压缩的可行性进行了尝试。 全文安排如下: 第l 章为绪论: 第2 章介绍了数据压缩理论及静态图像压缩和视频压缩的发展概况; 第3 章介绍了静态图像压缩的最新标准j p e g 2 0 0 0 ,对其进行了改进,并应用于合成孔 径雷达的成像数据及原始数据的压缩; 第4 章介绍了新一代视频压缩标准h2 6 4 ,并用其帧内编码器对合成孔径雷达的成像数 据进行压缩: 最后为结束语。 2 第2 章静态图像压缩及视频压缩的发展概况 第2 章静态图像及视频压缩的发展概况 2 1 数据压缩理论【3 】 2 1 1 数据压缩的定义及必要性 数据压缩就是以最少的数码表示信源所发的信号,减少容纳给定消息集合或数据采样集 合的信号空间。 采用数字技术具有很多优越性,但也使数据量大增。数字信号的数据率或比特率为i , 单位为b i t s 或b p s ,即; 1 = 厂rx 尺( 2 - 1 ) 式( 2 - 1 ) 中,f 为采样频率,r 为每个采样幅度值的二进制编码长度( r 比特) ,i 即信号 在通信线路上每秒钟应传送的比特数,或者保存一秒钟信号样值所需占用的存储量。当信号 带宽给定而f 为已知且不变时,传输速率就简单地由每样值的比特数r 来确定。 一幅5 1 2 5 1 2 像素、8b i t p e l 的黑白图像占2 5 6 k b :一幅5 1 2 x 5 1 2 像素、每分量8b i 卸e l 的彩色图像占3 2 5 6 k b = 7 6 8 k b ;一幅2 2 9 1 2 1 9 0 8b i t 的气象卫星红外云图占4 9 0 m b , 而颗卫星每半小时即可发回一次全波段数据( 5 个波段) ,每天的数据量高达1 2 g b 。 对一部x 波段、6 0 m h z 带宽的机载合成孔径雷达,当工作在条带成像方式时,其视频 采样后的原始数据的数据率约为3 m b s 。 由此可见,信息时代带来了“信息爆炸”。数据压缩的作用及其社会效益、经济效益越 米越明显。数据压缩的好处在于: 1 较快地传输各种信源( 降低信道占用费用) 时间域的压缩; 2 在现有的通信干线上开通更多的并行业务频率域的压缩; 3 降低发射机功率能量域的压缩 4 紧缩数据存储容量( 降低存储费用) 空间域的压缩。 2 1 2 数据压缩的分类 数据压缩一般可以分为可逆压缩和不可逆压缩。 可逆压缩也叫无失真编码或无噪声编码( n o i s e l e s sc o d i n g ) 、冗余度压减( r e d u n d a n c y r e d u c t i o n ) 、熵编码( e n t r o p yc o d j n g ) 、信息保持编码( l o s s e s s ,b 卜p r e s e r vj n g ) 。可 逆压缩可以根据压缩后的数据恢复原来的数据,不造成信息丢失。 3 东南大学硕士论文 不可逆压缩就是有失真( l o s s y ) 编码,信息论中叫熵压缩( e n t r o p yc o m p r e s s i o n ) 。 与可逆压缩相比,不可逆压缩不能从压缩后的数据完全恢复原始数据。虽然不可逆压缩造成 了信息的丢失,但是根据对信息敏感程度的不同,不可逆压缩往往能达到较大的压缩比,图 2 - 1 为数据压缩技术的分类。 数据压缩 调预性应补量网截 制执须 预偿 化络尾 测测预 测 图2 - 1 数据压缩技术的分类 2 1 3 数据压缩的基本框图 tt t tt ta 交 r 变 换 一般地,数据无损或近似无损压缩可以分为三个模块:去相关,统计模型,熵编码,如 图2 - 2 所示。 图2 - 2 无损或近似无损压缩系统框图 而有损压缩也可以分为三个模块:变换,量化,熵编码。如图2 - 3 所示。 圈2 - 3 有损压缩系统框图 第2 章静态图像压缩及视频压缩的发展概况 2 2 静止图像压缩技术发展概况 数字图像处理过程中经常要产生很多包含图像数据的大型文件,需要在不同的用户和系 统之间互相交换,这就要有一种有效的方法来存储和传递这些数字图像文件。数字图像的数 据量通常都很大,图像压缩是指通过删除冗余的或者是不需要的信息来减少数据量的技术。 数据压缩技术利用了数据固有的冗余性和不相干性,将一个大的图像文件转换成较小的 图像文件。由压缩后的图像文件可以在以后需要的时候以精确的或近似的方式将原图像恢复 出来。两个图像文件的大小之比( 压缩比) 确定了压缩的程度。 静止图像数据压缩可以分为有损压缩和无损压缩两大类。无损压缩算法大概可以分为基 于统计的压缩和基于字典的压缩。 基丁二字典压缩算法的研究从j z i v 和a l e m p e l 在1 9 9 7 年和1 9 9 8 年发表的两篇文章【4 。5 】 开始,算法分别被称做l z 7 7 和l z 7 8 ,这一类算法实现简单,速度快。已经在文本数据压 缩领域被广泛使用。 1 8 4 3 年出现的莫尔斯( m o r s e ) 电报码是早期行之有效的基于统计的无损数据压缩技术 的例子。e l 前这一类算法主要有霍夫曼( h u f f m a n ) 码、s h a n n o n f a n o 码和算术编码。 有损图像压缩认为人类的视觉系统是数字图像系统的终端,即图像信息的信宿,而人类 视觉系统有多方面的限制,因而以压缩产生的误差能不能被视觉接受作为衡量压缩结果能不 能被接受的最终标准,使用峰值信噪比作为对压缩质量的定量的描述。高信噪比一般情况下 可以保证视觉难以辨、认压缩产生的误差。 和无损压缩相比,有损压缩可利用的工具要丰富得多。1 9 9 1 年,i s o i e cj t c l s c 2 9 t w g i 集以前的数据压缩技术之火成,制定了第一个连续色调静止图像压缩的国际标准j p e g 【6 】, 大人推动了图像压缩的应用和研究。 1 9 8 0 年代和1 9 9 0 年代初,出现了予带编码【7 8 】、小波变换【9 。l o l 等算法,这儿类 方法采_ j 的工具不同,压缩策略大致相同,即将图像逐步分解到不同的频带上,带宽按一倍 频程递减,同时各频带可以在空域具有定的尺度性质和方向特征,图像的能量主要集中在 变换得到的低频部分,认为这种分解过程很好地符合了人眼的视觉处理过程,可以利用人眼 在不同频带视觉敏感程度不同的特征,以及各个频带内系数的统计规律,分别使用不同精度 的标量量化或向量量化,希望产生的误差不被察觉,而能得到最好的压缩比。 1 9 9 2 年,m a l l a t 提出了小波变换的极人模算法【1 1 1 4 】。 1 9 9 3 年,j s h a p i r o 发表了基丁零树的嵌入式小波压缩算法e z w ( e m b e d d e dz e r o t r e e w a v e l e tc o d i n g ) 【1 5 】。在这以后,零树算法引起越米越多的重视,涌现出一批基于零树的 改进算法,成为基于小波的静r 图像压缩的一个有意义的突破。 2 0 0 0 年底,j p e g 组织又山台了新代的静态图像压缩标准i s o i e c15 4 4 4 ,即 j p e g 2 0 0 0 。它即将成为静态图像压缩的主流算法【1 6 1 。 东南大学硕士论文 2 3 视频压缩编码技术的基本原理 数字视频信息可以压缩,首先是因为视频序列本身在时间、空间上是高度冗余的,去除 相同信息的重复表示,可以大大减少信息的发送量,从而实现数据压缩。通常,视频数据本 身存在以下几种冗余: 空间上的冗余:视频图像同一帧内相邻像素之间存在着很大的相关性,研究表明,图像 帧内的行、列相邻点之间的相关性可以达到0 9 以上; 时间上的冗余:视频序列前后帧之间存在着较大的相关性,研究表明。活动图像相邻帧 同一位置上前后样值的相关性( 帧问相关性) 也达到0 9 以上。有人统计了1 m b p s 的可视电 话,发现前后相邻帧平均只有4 的像素发生变化; 符号表示上的冗余:根据信息论,使用相同的码长来表示不同概率山现的符号会造成比 特数的浪费和平均码长的增加。 对数字视频信息进行压缩,还可以利用人眼的视觉特性。在许多情况下,人眼往往是图 像信息的最终接收者,而人的视觉系统( h v s ) 对于某些失真并不敏感。那么,即使处理后 的图像产生了一定程度的失真,只要人眼对于这些失真并不敏感,那么,这些失真就是可以 接受的。因此,可以利用这些特点对图像进行压缩比更高的有限失真编码。 例如,人眼对颜色的空间分辨率低于对亮度的空间分辨率,就可以利用这一点把输入色 度信号的空间分辨率减半,而不会影响人眼观察到的图像质量;再比如,人眼对于静止图像 的分辨率高于活动图像,利用这一特点,在进行帧间编码时,量化因子可以适当加大,以增 加压缩比,对丁- 由此引起的细微尊别,人眼不易察觉。 此外,还可以利用先验知识进行编码,即模型编码,实际上利用的是知识的冗余度。利 用对象的先验知识对编码对象建立模型,通过提取模型参数,对参数进行编码而不对图像直 接进行编码,可以得到非常高的压缩比。在一些语音编码技术中已经采用了模型编码,然而, 由于图像对象i 剖有的复杂性,图像编码技术要发展到模型编码这一步,还有很多需要研究。 一般来说,图像编码的过程就是充分利用视频序列本身的冗余度和人眼的视觉特性进行 数据压缩的过程,可以概括为三个步骤:即映射变换、量化和熵编码。 映射变换的目的在于利用图像数据时间、空间上的冗余度,通过变换改变图像数据的相 关特性,使之有利于压缩编码。例如图像数据相邻像素之间有很大的相关性,相邻像素的灰 度差总是分布在零值附近,灰度差值的标准差比原始图像的标准差要小得多。因而,可以通 过预测把对灰度值的编码转换为列灰度差值进行编码,这样所需要的比特数比较少。 量化是利用人眼的视觉特性,综合考虑视觉需求和数码率的限制,对映射变换后的数据 进行再压缩。量化分为两种,一种是标量量化,就是对映射后的数据逐个进行最化,另一种 是矢量量化,是对映射后的数据成组进行量化。量化会造成某些信息的丢失,量化器的引入 是图像编码产生失真的根源,进行量化过程以后的编码是有损编码。失真和压缩比是进行图 像压缩的一对矛盾。在人多数情况下,人是图像信息的最终接受者,如果把量化以后的失真 6 第2 章静态图像压缩及视频压缩的发展概况 控制在主观质量允许的范围以内,那么,这样的量化是可以接受的。 熵编码的作用在于消除最后符号表示时的符号冗余度,它一般不产生失真,理想情况是 使输出码流的平均码长等于量化后数据的信息熵。 以上三个过程是互相联系互相制约的,数据压缩就在于灵活运用三种编码技术,在保证 一定主观图像质量的前提下,得到尽可能大的数据压缩比。 2 4 低码率视频编码标准的发展与现状 当前制定视频压缩编码标准主要有两个国际标准化组织,一个是国际电信联盟( i t u : i n t e r n a t i o n a lt e l e c o m m u n i c a t i o nu n i o n ) ,它主要制定与通信相关的低码率视频压缩标准, 如h 2 6 1 、h 2 6 3 、h 2 6 4 等:另一个是国际标准化组织( i s o :i n t e l n a t i o n a lo r g a n i z a t i o nf o r s t a n d a r d i z a t i o n ) ,它主要进行多媒体信息的存储与播放标准的制定,其中既包括对于视频 信息的压缩与播放,也包括对于音频信息的存储与传输,如m p e g l 、m p e g 一2 、m p e g 一4 。 2 4 1i t u th 2 6 1 建议 h2 6 1 【3 】主要针对会议电视和可视电话,全称是“d 6 4 k b p s 视听业务的视频编解码 器”,其中,p = l 3 0 ,也就是说可以实时传输码率从6 4 k b p s 到1 9 2 m b p s 的视频信号。 h 2 61 支持两种y u v 格式( 把图像信号用一个亮度分量和两个色度分量进行表示) 的输 入图像,分别是c i f 和q c i f 格式( 如表2 - 1 ) 。 c i fq c i f 每行像素亮度分量 3 5 21 7 6 色度分量j7 8 8 8 亮度分量2 8 81 4 4 每l 喷行数 色度分量 1 4 47 2 帧率3 0 ,1 5 ,l o ,753 0 ,1 5 ,1 0 7 5 宽高比 4 :34 :3 表2 - 1h ,2 6 1 支持的视频编码图像格式 h 2 6 1 建议可以视为图像编码发展过程中的一个里程碑,但是它的压缩效果不如m p e g l 和m p e g - 2 的视频标准,特别不如1 4 2 6 3 ,现在已完全被h 2 6 3 所取代。 2 4 2i t u th 2 6 3 建议 h 2 6 3 【17 - 8 】是在h ,2 6 1 基础上改进而形成的,可用丁甚低码率( 小于6 4 k b p s ) 的 信道。其编码算法以h 2 6 l 为基础,以混合编码为核心,原始数据和码流组织也类似,但支 持更多的原始图像分辨率并吸收了m p e g 等标准中有效合理的内容,性能明显优于h 2 6 1 。 相对于h 2 6 1 ,h 2 6 3 主要做了如r 改进和扩充: 7 东南大学硕士论文 1 解码器具有运动补偿功能,运动补偿采用半精度像素,而h 2 6 l 采用了全像素精度 2 h 2 6 1 仅支持q c i f ,c i f 格式,而h 2 6 3 支持更多的图像格式,包括s u b c i f ,q c i f e l f ,4 c i f 和1 6 c i f 五种图像格式,这使得 2 6 3 的应用范围更加广阔,见表2 - 2 。 s u b c i fq c i fc i f4 c i f 7 0 4 5 7 6 1 6 c i f 像素行i 1 2 81 7 63 5 21 4 0 8 行数9 61 4 42 8 81 1 5 2 表2 - 2i l2 6 3 支持的图像格式 3 h2 6 3 除了基本模式外,还可以有选择地使用4 种高级模式( p b 帧模式,重叠块运 动补偿模式,大运动矢量模式,基于语法的算术编码模式) ,选用后可以进一步提高压缩效 率、改善图像质量。见表2 - 3 。 可选模式 主要内容作用 在h 2 8 3 基本模式下,运动矢量对应的参考块必须定义在参考帧内;而在 提高压 此模式中,运动矢量可以指到图像边界阻外,当参考块的像素落在参考帧 缩效率 大运动矢量边界之外时,就采用参考帧边界上的像素值替代。同时,太运动矢量模式 增强容 也增加了运动矢量的表达范围:基本模式下运动矢量的表示范倒是( 一1 6 错能力 1 5 5 ) ,而启用此高级模式后,其表示范围扩大到( - 3 1 5 3 1 5 ) 。 又称为先进预测模式,基本模式下,h 2 6 3 和h2 6 1 一样,仅用一个运动 矢量来表示一个1 6 i 6 宏块的运动。考虑到利用h 2 6 3 处理s u bq c i f 、 重叠块q c l f 图像时,由于图像较小在1 6 1 6 数据块内往往出现边界,此时, 提高压 运动补偿由于块内运动不一致,使得运动补偿效率下降。而在此模式下把一个1 6缩敛率 1 6 宏块划分为四个8 x 8 块,使用4 个运动矢量分别表示宏块中4 个8 8 块的运动,从而提高了运动朴偿的效率,使帧间预测更加精确。 h2 6 3 中p b 帧模式源于m p e g 标准,但与之相比,做,大量的简化。在此 模式下,使用b 帧对前面和后面的参考帧分别进行比较粗糙的前向和后向提高压 p b 帧 预测。可以杠只增加少量比特数的情况下,将帧率提高一倍,也就是时间缩效率 分辨率增加一倍,但与h 2 6 3 基本模式相比,运算的复杂度增加了不少。 基于语法的 在h2 6 1 中,符号编码采用h u f f m a n 编码,也就是每个符号采用整比特数 提高压 编码。而采用算术编码,可以减少符号表示的冗余有助于降低比特率, 算术编码 缩效率 一般情况下,可以降低比特率约5 。 表2 - 3h 2 6 3 的可选模式【1 7 1 8 】 由于采取了上述改进,h 2 6 3 与h 2 6 l 相比,在性能上有较大提高。在码率小于6 4 k b p s 时,h 2 6 3 的p s n r ( 峰值信噪比) 比h 2 6 1 要提高3 4 d b 。换句话说,在相同的质量下, 所用比特数与h 2 6 1 相比减少5 0 以上。 2 4 3i t u 。th 2 6 3 + 和h 2 6 3 + + 为了进一步改善h 2 8 3 的性能,i t u t 的视频编码专家组( v c e g ) 提出了近期和远期 两个目标。近期目标是通过增加一些可选的操作模式,对h 2 6 3 进行局部改进。 1 9 9 8 年】月,i t u t 公布了h 2 6 3 视频编码标准第二版( 又称为h 2 6 3 + ) ,其两大目标 是:扩展应用范同和提高压缩效率。h2 6 3 + 与h 2 6 3 相比,改进了一个可选模式( 人运动矢 量模式) ,另外又新增了1 2 个可选的参考模式【1 9 l : 1 先进的帧内编码模式 2 去方块效应滤波器模式 8 第2 章静态图像压缩及视频压缩的发展概况 3 子图模式 4 补充的增强消息模式 5 增强的p b 帧模式 6 参考帧可选模式 7 空间、时间、信噪比可分级模式 8 参考帧重建模式 9 降低分辨率更新模式 1 0 段独立解码模式 儿帧间v l c 选择模式 1 2 修正量化模式 这些模式可使 l2 6 3 原型编码器在压缩码率、容错能力和可扩展性方面获得更佳性能。 在2 0 0 0 年1 1 月,i t u - t 又公布了 l2 6 3 视频编码标准的第三版( 又称为h2 6 3 + + ) ,与 h 2 6 3 + 相比,又新增了3 种可选的高级模式( 分别为增强参考帧可选模式、数据分割模式、 附加的增强信息模式) ,以进一步改善性能。 2 4 4i t u tt t 2 6 4 建议i2 0 z 21 1 9 9 5 年,v c e g 完成h 2 6 3 的制定后开始致力于两个方向的研究,一项短期工作是继 续为h 2 6 3 添加新的性能,这方面的努力产生了h 2 6 3 + 1 1h 2 6 3 + + ;而另一项长期工作则 是发展一项新的视频压缩标准以用于低码率视频通信,称之为h 2 6 l ,其中l 即为长期之意。 1 9 9 8 年1 月,v c e g 提出了h 2 6 l 建议,开始广泛征求意见;1 9 9 9 年1 月,v c e g 给 山了h 2 6 l 的第一个测试模型t m l 1 ,公开进行测试和改进;2 0 0 0 年6 月,给出了h 2 6 l 新的测试模型t m l 8 。 到了2 0 0 1 年,i s o 和i e c ( 国际电丁委员会) 的m p e g 组织开始意识到h 2 6 l 的优越 性,并同v c e g 的专家成员一起组成了j v t ( j o i n tv i d e ot e a m ) 小组,目的是将h 2 6 l 草 案模型发展成一项完整的国际标准,其最终将成形为两份相互一致的标准:i s o i e cm p e g 一4 p a r t l 0 和i t u th 2 6 4 ,而对这一标准的一个新称呼为a v c ( a d v a n c e dv i d e oc o d i n g ) 。在 本文的以下部分,我”j 以h 2 6 4 米称呼这种新的编码标准。 作为即将成为新一代视频压缩标准的h 2 6 4 ,其性能不仅要大大超越之前的h2 6 3 ,也 要超过目前最为流行的m p e g 一4 ,它具有这样几个优点: 1 低比特率,实时: 2 复杂度低,可用软件实现; 3容错能力强,可用于误码率较高的移动网络环境; 4 白适应的码率控制机制; 5 信息源格式可变,适应范围更广。 为了达到上述目标,v c e g 对h2 6 3 的编码框架进行了一系列改进,一方面,把h 2 6 3 + 、 o 东南大学硕士论文 h2 6 3 + + 中些已经证明行之有效的可选模式作为h 2 6 4 中的基本模式固定下来,如先进帧 内预测、基于句法的算术编码等:另一方面,h 2 6 4 又加入了一些新的研究成果,例如可选 的1 4 ( 1 8 ) 像素的运动估计、多模式的运动矢量估计、4 x 4 的d c t 整型运算等,从而使 h 2 6 4 在压缩性能上更佳。与h 2 6 3 的基本框架相比,h 2 6 4 的主要改进如下: 1 先进的帧内预测 帧内预测可以减少需要编码的数据量,从而达到降低数码率的作用。在h 2 6 4 中,先通 过其上边和左边宏块来预测当前宏块值,再用d c t 来编码预测宏块与当前宏块的差值。由 于差值一般比当前宏块的实际值小,d c t 后会出现更多的全零块,从而可以降低需要编码 的数据量,减少码率。对于帧内编码用得较多的图像序列,帧内预测对降低码率十分有效。 对于亮度分量,预测可以以4 4 子块或1 6 1 6 宏块为单位来进行,对于4 x 4 亮度块一共有9 种可选预测模式,1 6 x 1 6 亮度块有4 种可选预测模式,而4 x 4 色度块也有4 种预测模式。 2 ,1 4 ( 1 8 ) 像素精度的运动估计 h 2 6 3 和m p e g 1 2 视频编码标准都采用1 ,2 像素精度的运动估计,而h 2 6 4 可以采用 1 4 ( 1 8 ) 像素精度的运动估计,这就使得运动估计和运动补偿更为准确。或者说在要求精度 相近的情况下,h 2 6 4 采用i 4 或1 8 像素的块匹配可以满足对于匹配精度的要求,而h 2 6 3 采用1 2 像素精度的运动估计可能就达不到要求,只能做帧内编码。而帧内编码常需要比运 动估计编码更多的码字,因而,更精确的运动匹配意味着i - i 2 6 4 在帧间编码中所需码率更小。 3 d c t 的整型运算 在视频压缩编码中,运动估计和d c t 的计算量最大。h2 6 3 采用基于8 x 8 块的d c t 浮 点运算,不仅运算量相当大,而且不利于移植到定点d s p 中。而h ,2 6 4 采用的基于4 4 块 的d c t 整型运算,避免了浮点,减少了运算量和复杂度,从而有利于实时实现和移植到定 点d s p 上。d c t 的整型化当然会引入些误差,但其量化过程中也有误差,与之相比,整 型化的影响并不人。h 2 6 4 对丁4 x 4 块的i d c t 也同样进行了整型化,过程与d c t 类似。 4 7 种不同尺寸块的运动矢量估计 运动估计块匹配锋法还需要考虑匹配块的大小,而综合考虑数码率的开销以及运动估计 的准确性,一般采用1 6 x 1 6 宏块和8 x 8 数据块作为运动估计块匹配的基本单元。在h 2 6 1 和m p e g 1 视频标准中,采用1 6 x 1 6 宏块作为基本的匹配单元,而住h 2 6 3 、m p e g 2 和 m p e g 一4 中,既可以采用1 6 x 1 6 数据块作为块匹配的基本单元,也可以采用8 x 8 数据块作为 基本的匹配单元。而i - i 2 6 4 采用7 种不同大小的数据块作为运动估计块匹配的基本单元。当 视频图像变化简单时,可以和h 2 6 1 、h 2 6 3 一样,采用基于1 6 x 1 6 或8 8 数据块的运动估 计就可以了,而对于运动较复杂以及运动细部较多的视频序列,可以采用基y - 8 4 或4 4 数据块作为块匹配的基本单元,从而更好地实现运动补偿,减少数码率。 5 重建滤波 为了减少块效应,对丁:每个解码宏块需要进行滤波,该过程在反变换之后进行。采用去 块效应滤波有两个好处: 第2 章静态剖像胜缩及视频雎缩的篮腴概批 1 )光滑块边缘,从而改善幽像效果( 尤其枉低码率情况f ) 。 2 )川_ i _ j i 问顶测的赴滤波后的数据,较蚶设计的滤波器可咀减小预测著仇。 6 捧_ 丁山弈的l = i 适f 趣变k 编码( c a v l c ) 基丁内容的n 适应变k 编码也是h 2 6 3 中可选模式之,而许i i2 6 4 中,它作为旗本的 编码模式得到成 j ,它可以在运动估训年【fd c t 的基础上进步压缩码率。般情况f ,基 于上r 文的算术编码可以挺高压缩效率5 ,但计算量会网此增加。 刘1 + h2 6 4 的卜述犄点,我们将往筛4 章给予更详细的说明。 第3 章基于j p e g 2 0 0 0 的s a r 数据压缩 第3 章基于j p e g 2 0 0 0 的s a r 数据压缩 3 1j p e g 2 0 0 0 概述【16 ,2 3 - 2 4 j p e g 具有优良的品质,目前网站上8 0 的图像都是采用j p e g 压缩,但是随着信息技 术的发展,传统的j p e g 压缩技术已无法满足人们的要求,因此,产生了更高压缩率及具有 更多功能的新一代静态图像压缩技术j p e g 2 0 0 0 。j p e g 2 0 0 0 仍由i s o ,i e cj t c is c 2 9 负责制 定,而s c 2 9 又分为w g l ,w g l i ,w g l 2 三个小组,其中w g i 负责j b i g 和j p e g 标准制 定,它制定了第一套国际静态图像压缩标准i s 0 1 0 9 1 8 - l ,俗称j p e g ,而j b i g ( j o i n tb i n a r y i m a g e g r o u p ) 则是二值图像的压缩标准;w g l l 负责m p e g ( m o v e p i c t u r e e x p e r t g r o u p 活 动图像专家组) 标准的制定;w g l 2 负责m h e g ( m u l t i m e d i ah y p e r t e x te x p e r tg r o u p 多媒体 超文本专家组) 的制定。自1 9 9 7 年3 月开始,j p e g 组织开始向全世界各人专院校、公司及 研究单位公开征求下一代j p e g 标准的意见,不久即收到各大研究团体提出的2 2 份提案, 同年11 月,针对2 2 份提案进行了比较及测试,选择其中最好者开始建立所谓的验证模型 ( v e r i f i c a t i o nm o d e l ) 。j 9 9 9 年6 月,j p e g 2 0 0 0 进入工作草案( w o r k i n gd r a f t ) 撰写阶段, 1 9 9 9 年1 1 月,j p e g 2 0 0 0 委员会草案( c o m m i t t e ed r a f t ) 完成,2 0 0 0 年3 月,东京会议确定 了j p e g 2 0 0 0 的编码算法,2 0 0 0 年底出台了基本编码系统的最终协议草案,j p e g 2 0 0 0 的正 式名称是1 s o 1 e c1 5 4 4 4 ,它即将成为静态图像压缩的土流算法。 j p e g 2 0 0 0 标准可分为如f 部分: 1 j p e g 2 0 0 0 图像编码系统,是j p e g 2 0 0 0 标准的核心部分; 2 应用扩展,在核心上扩展更多特性: 3 活动j p e g 2 0 0 0 ,针对运动图像提山的解决方案: 4 兼容性( 包容性和继承性) ; 5 参考软件( 目前主要为j a v a 和c 程序) ; 6 复合图像文件格式,主要针对印刷和传真应用; 7 技术报告,目前已经放弃; 8j p s e c ( s e c u r i t ya s p e c t s ) : 9 j p i p ( i n t e r a c t i v ep r o t o c o l sa n da p l ) ; 1 0 j p 3 d ( v o l u m e t r i ci m a g i n g ) ; 1 i j p w l ( w i r e l e s sa p p l i c a t i o n ) 。 其中第1 部分已经作为国际标准山版2 - 6 部分已经基本完成,4 个新的部分8 - 1 1 正在 开发过程中。本论文主要涉及第1 部分 东南大学硕士论文 3 1 1j p e g 2 0 0 0 图像编解码系统 j p e g 2 0 0 0 标准的主要内容如图3 1 ,其详细的编解码框图如图3 - 2 所示。我们详细介绍 图像编码过程。需要注意的是图像在压缩之前,要划分成片( t i l e ) 矩形单元,如图3 3 所 示。片的具体尺寸可以由用户根据应用需要来决定,片包括所有的图像分量,例如,假设图 像有3 个分量( y u v ) 且分成4 个片,实际上是指对应的4 个y 片,4 个u 片和4 个v 片, 即每片由3 个分量片组成。各个分量片独立编解码,所以可以从码流中单独提取某个或某些 片,解码后重建图像。把图像划分成片,对每个片进行操作,可以减少压缩图像所需的存储 量并且有利于抽取感兴趣的图像区域。 图象源 - - - - - - - - _ _ 数据 正 向 d c t 变 换 正 向 分 量 变 换 正 向 小 波 变 换 剽茬剽霾 ( a ) 编码器 速率 控制 分1 分层 层卜一 组i 位流餐黑 反 反 反 向向 向 d 小+分 c 波 量 t 变变 变 换换 换 ( b ) 解码器 图3 - 2j p e g 2 0 0 0 编解码器框图 源图像 图3 - 3 划分为t i t l e 示意图 1 4 第3 章基于p e g 2 0 0 0 的s a r 数据压缩 刖一漏s :悉赫旧 p , 量 = i 童一:兹0 一,。1 :4 0 。2 一。 耋 c ,- 。, 东南大学硕士论文 信号进行多级小波分解,可得到不同空间分辨率的图像逼近,使得压缩码流具有空问分辨率 可分级的特性。这一特点允许压缩码流在不同的分辨率上解码显示。 对一个原始图像或分量片进行3 级小波分解的例子如图3 - 4 所示,每一级分解都把图像 分解为4 个不同空间、不同频带的子图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论