(计算机应用技术专业论文)基于jpeg2000标准的感兴趣区域编码的研究.pdf_第1页
(计算机应用技术专业论文)基于jpeg2000标准的感兴趣区域编码的研究.pdf_第2页
(计算机应用技术专业论文)基于jpeg2000标准的感兴趣区域编码的研究.pdf_第3页
(计算机应用技术专业论文)基于jpeg2000标准的感兴趣区域编码的研究.pdf_第4页
(计算机应用技术专业论文)基于jpeg2000标准的感兴趣区域编码的研究.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(计算机应用技术专业论文)基于jpeg2000标准的感兴趣区域编码的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 作为新一代静态图像压缩标准的j p e g 2 0 0 0 ,如今已被认为是互 联网和无线接入应用的理想图像编码解决方案,其在各方面都明显优 于传统的静止图像压缩算法。在许多的图像应用中,基于感兴趣区域 ( r o i ) 图像编码技术占有重要地位。感兴趣区域图像编码处理是 j p e g 2 0 0 0 静态图像标准中提供的一种新特性。该编码处理方法可以 将用户感兴趣的图像区域( r o i ) 与背景区域( b g ) 区别开来,并实 现对前者优先、优质的编码操作。因此,这种技术能很好地解决图像 质量和压缩比之间的矛盾。 本文主要研究基于j p e g 2 0 0 0 图像标准的感兴趣区域图像编码算 法,具体工作如下: 首先,根据图像压缩的基本原理和j p e g 2 0 0 0 静态图像压缩标准, 按照j p e g 2 0 0 0 图像标准的正向编码处理顺序,系统研究了j p e g 2 0 0 0 编码器的各个编码模块。 其次,根据感兴趣区域编码的思想,对j p e g 2 0 0 0 中基于位平面 提升的两种实现方法和基于位平面提升的感兴趣区域编码的研究现 况进行了研究分析。 最后,研究了优化截取内嵌块编码( e b c o t ) 算法的特点,并改 进实现了一种隐式感兴趣区域编码算法。该算法与比特位平面提升算 法不同,不需要对小波系数进行提升,重构图像时也不需要逆提升, 而是在码流组织时通过对感兴趣区域对应的失真一长度斜率进行提升 实现;当系统对感兴趣区域要求改变时,不需要象比特位平面提升那 样重新进行比特位平面编码,而只需重新调整失真一长度斜率并重新 组织码流,从而简化了系统的复杂度。同时提升范围灵活,适合交互 式图像编码。本文最后结合k a k a d u 软件,对m a x s h i f t 方法和本文的 隐式r o i 编码进行了对比测试。 关键词j p e g 2 0 0 0 ,小波变换,感兴趣区域,失真一长度斜率提升, 压缩后率失真优化 a b s t r a c t n o wj p e g 2 0 0 0a sas t a n d a r do fn e ws t a t i ci m a g ec o m p r e s s i o n i s d e e m e dt oa p e r f e c ts o l u t i o no fi m a g ec o d i n gw h i c hi sa p p l i e di ni n t e r n e t a n dw h e l e s sc o n n e c t , a n di to b v i o u s l yp r e c e d e st r a d i t i o n a ls t a t i ci m a g e c o m p r e s s i o na r i t h m e t i c a tv a r i o u sa s p e c t s i nm a n ya p p l i c a t i o n so ft h e i m a g e ,t h ec o d i n gt e c h n o l o g yb a s e do nr e g i o no fi n t e r e s t ( r o i ) i sv e r y i m p o r t a n t r o ii m a g ec o d i n gi san e wf e a t u r ei nt h en e w l yp u b l i s h e d j p e g 2 0 0 0s t a n d a r d , w h i c ha l l o w sr o i st ob ec o d e dw i t hb e t t e rq u a l i t y t h a nr e s to fa l li m a g e , i e ,b a c k g r o u n d s ot h et e c h n o l o g ys o l v e st h e c o n f l i c tb e t w e e nt h ei m a g eq u a l i t ya n dt h ec o m p r e s s i o nr a t e t h i sp a p e rf o c u s e so nr o ii m a g ec o d i n gm e t h o d si nt h ej p e g 2 0 0 0 s t a n d a r d 1 1 1 em a i nw o r kc a nb es u m m a r i z e da sf o l l o w s : f i r s t l y , b a s e do nt h ef u n d a m e n t a lp r i n c i p l eo fi m a g ec o m p r e s s i o na n d t h ej p e g 2 0 0 0s t a n d a r d ,e a c hp a r to ft h ej p e g 2 0 0 0c o d e ri sd i s c u s s e di n d e t a i la c c o r d i n gt ot h ej p e g 2 0 0 0e n c o d i n go r d e r s e c o n d l y , b a s e d0 1 1t h er o ii m a g ec o d i n gt h e o r y , t h et w om e t h o d s b a s e do nb i t - p l a n el i f t i n gi nj p e g 2 0 0 0a n dt h e i rr e s e a r c hs t a t u sa r e s t u d i e d f i n a l l y , e b c o t ( e m b e d d e db l o c kc o d i n gw i mo p t i m i z e dt r u n c a t i o n ) i ss t u d i e d ,a n dam e t h o do fi m p l i c i tr o i e n c o d i n gb a s e d o nt h ea t t r i b u t e s o f e b c o ti sr e s e a r c h e da n di m p l e m e n t e d i ti sd i f f e r e n tf r o mt h em e t h o d o fb i t - p l a n el i f f i n g i td o e s n tl i f tt h ec o e f f i c i e n t sw h e ne n c o d i n ga n d d o e s n tl i f tt h e mr e v e r s e l yw h e nd e c o d i n g t h i sm e t h o di sb a s e do n d i s t o r t i o n - l e n g t hs l o p el i f t i n gt oi m p l e m e n tr o ic o d i n g i ft h er e q u i r eo f r o ii sc h a n g e d , i tn e e d n te n c o d et h ec o e f f i c i e n t sa g a i na st h eb i t - p l a n e l i f t i n gd o e s i to n l yn e e d st oa d j u s tt h ed i s t o r t i o n - l e n g t hs l o p ea n d o r g a n i z e st h ec o d es t r e a m , s ot h es y s t e mc o m p l e x i t yi sd e c r e a s e d , a n d - t h e r a n g eo fl i f t i n gi sl a r g e ,i ti ss u i t a b l ef o ri n t e r a c t i v ea p p l i c a t i o n s a tt h e e n do ft h i sp a p e r , t h ec o n t r a s tt e s tu s i n gt h ek a k a d us o f t w a r eb e t w e e n m a x s h i f ta n dt h em e t h o do f i m p l i c i tr o i e n c o d i n gi sa d m i n i s t e r e d k e yw o r d sj p e g 2 0 0 0 ,w a v e l e tt r a n s f o r m ,r o i ,d i s t o r t i o n l e n g t h s l o p el i f t i n g ,p o s t - c o m p r e s s i o nr a t e - d i s t o r t i o no p t i m i z a t i o n l i ”l l 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得中南大学或其它单位的学位或证书而使用过的材料。与我 共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名:退查煎 关于学位论文使用授权说明 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位 论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论 文;学校可根据国家或湖南省有关部门规定送交学位论文。 作者签名:塑丛导师签名壹攫搿日期:趔年主月笪日 硕士学位论文 第一章绪论 第一章绪论 人类获取的信息主要来自于图像、语音和数据三种形式,其中大部分来源于图 像媒体。这说明图像是人们日常生活中信息交流最为重要的媒体之一,也是蕴含信 息量最大的媒体。然而日常生活中海量的图像数据、受限的网络带宽以及不同的客 户需求都会给信息的存储和传输带来巨大的困难。 随着计算机技术、现代通信技术、微电子技术、网络技术和信息处理技术的飞 速发展,人类社会进入信息化时代,图像信息的处理、存储和传输在社会生活中的 作用越来越重要。j p e g 作为静态图像压缩标准,在数字图像领域中得到了广泛而成 功的应用但是,随着人们对图像压缩性能、处理灵活性、功能性等多方面有进一 步要求,联合图像专家组( j o i n tp h o t o g r a p h i ce x p e r t sg r o u p ) 于2 0 0 0 年开发出 j p e g 2 0 0 0 ,以作为j p e g 的后继者“ 在人们不断追求的高压缩比和尽可能小的图像信息失真之间的矛盾日益突出 时,感兴趣区域( r o i ) 编码处理方法为解决这一矛盾提供了一种有效的途径,成为 近年来图像处理领域的研究热点之一。在制定j p e g 2 0 0 0 图像压缩标准的过程中,联 合图像专家组把灵活有效支持r o i 编码处理作为一个新的重要的指标,为实现r o i 编码提供一个良好的平台,从而推动了r o i 编码研究的不断丰富、完善,应用更加 深入、广泛。 1 1 图像压缩概述 多媒体一般涉及的数据有文字、语音、静止图像、动画、视频等。由于这类数 据量一般都比较大,因此,如何处理,组织这些数据,提高处理和存储效率,去除 冗余信息是信息技术要解决的一个重要问题。在这些数据中,图像数据量十分巨大, 同时由于受到通信带宽的限制,图像压缩在数字电视、网络多媒体通信、视频会议、 遥感图像传输、图像数据库、指纹数据存储等应用中都起到至关重要的作用,其压 缩技术一直是多媒体信息处理技术研究中最活跃的领域。 硕七学位论文 第一章绪论 1 1 i 图像压缩的目的和可能性 图像压缩的主要目的是以尽量少的比特数表征图像,同时保持复原图像的质量, 使它符合预定应用场合的要求。压缩数据量和提高有效性是图像压缩编码的首要目 的。图像压缩机制通常可以分为两种:有损压缩和无损压缩。任何一种压缩机制的 根本思想都是除去数据中存在的相关性。就图像而言,所谓相关性,就是能根据给 出的一部分图像数据来判断和推断出与其相关的其它数据脚。 数字图像之所以能够进行压缩有几个方面的原因。首先,原始图像数据是高度 相关的,存在很大的冗余度,例如:图像内相邻像素之间的空间冗余的:序列图像 前后帧之间的时间冗余度;多光谱遥感图像各谱间的频率域冗余度。数据冗余造成 比特数浪费,消除这些冗余就可以节约码字,达到数据压缩的目的。其次,若用相 同码长表示不同出现概率的符号也会造成符号冗余度,如果可以采用可变长编码技 术,对出现概率高的符号用短码字,对出现概率低的符号用长码字表示,就可以消 除符号冗余度,从而节约码字。 允许图像编码有一定的失真也是图像可以压缩的一个重要原因。在许多场合中, 经压缩及复原后的图像和原始图像并不完全相同,允许有少量的失真,只要这些失 真并不被人眼所察觉,这就给压缩比的提高提供了十分有利的条件。在多数应用中, 人眼往往是图像信息的最终接受者。如果能充分利用人眼的视觉系统( h v s ) 的特性, 就可以在保证所要求的图像主观质量的前提下实现较高的压缩比,这就是利用了视 觉的冗余度。 此外,可以利用先验知识实现图像编码,降低知识冗余度。例如,在可视电话 中,编码对象为人的头、肩像,这是可以利用对编码对象的先验知识为编码对象建 立模型,通过提取模型参数,对参数进行编码而不对图像直接进行编码,可以达到 非常高的压缩比。 1 1 2 现有的编码技术简介 经典的图像编码算法是通过减少或者删除信源中所存在冗余信息量而实现压缩 目的,其理论研究始于s h a n n o n 的信息论。长期以来,人们都在此基础上进行图像 压缩编码的研究,即任何一组随机分布的数据信息是由其熵来表征,无失真编码的 压缩效率以此熵为界,失真编码的压缩效率受此熵约束。 从s h a n n o n 的信息论理论出发很容易得到数据压缩的两种基本途径:其一,设 法改变信源的概率分布,使其尽可能地均匀,再用最佳编码方法使平均码长逼近信 2 硕士学位论文第一章绪论 源熵;其二,联合信源的冗余度也存在于信源间的相关性之中。去除它们之间的性 关性,使之成为或近似成为不相关信源。从1 9 4 8 年o l i v e r 提出p c m 编码理论开始, 迄今半个多世纪以来,人们研究并提出了各种各样的压缩技术: ( 1 ) 行程长度编码( r l e ) 行程长度编码( r u n - l e n g t he n c o d i n g ) 是压缩图像最简单的方法,该方法特别 适用于计算机屏幕这类像素值连续相同的图像。它把一系列的重复值用一个单独的 值加上一个行程长度值来代替。有不少位图文件格式都用行程长度编码,例如t i f f , p c x 。g e m 等。 ( 2 ) 哈夫曼编码 哈夫曼编码( h u f f m a ne n c o d i n g ) 是最常用的编码方法之一,它通过用更有效 的代码代替原始数据来实现。它的基本思想是出现频率越高的值,其对应的编码长 度越短。 ( 3 ) 预测及内插编码 一般在图像中局部区域的像素是高度相关的,因此可以用先前的像素的有关灰 度知识来对当前像素的灰度进行预测而所谓内插就是根据先前的和后来像素的灰 度知识来推断当前像素的灰度情况,如果预测的内插是正确的,则不必对每一个像 素的灰度都进行压缩,而是把预测值与实际像素之间的差值经过熵编码后发送到接 收端。在接收端通过预测值加差值信号来重建原像素。 预测编码是数据压缩技术的一个重要分支,它主要是以现代统计和控制理论为 基础,因此可以方便地实现彩色图像的色空间压缩。预测编码可获得较高的压缩质 量,并且实现起来比较简单,因此被广泛地应用于图像压缩编码系统中。 ( 4 ) 矢量量化编码 矢量量化编码利用相邻图像数据间高度相关性,将输入图像数据系列分组,每 一组m 个数据构成一个m 维矢量,一起进行编码,即一次量化多个点。根据香农失 真理论,对于无记忆信源,矢量量化编码总是优于标量量化编码。 矢量量化编码是有损编码目前使用较多的矢量量化编码方案主要是随机型矢 量量化,包括变换域矢量量化,有限状态矢量量化,地址矢量量化,波形增益矢量 量化,分类矢量量化及预测矢量量化等。 ( 5 ) 变换编码 变换编码就是将图像光强矩阵( 时域信号) 变换到系数空间( 频域信号) 上进 行处理的方法。在空问上具有强相关性的信号,反映在频域上是某些特定的区域内 能量常常被集中在一起,或者是系数矩阵的分布具有某些规律。我们利用这些规律 3 硕士学位论文 第一章绪论 在频域上减少量化比特数,达到压缩的目的,由于正交变换的变换矩阵是可逆的且 逆矩阵与转置矩阵相等,使得解码运算是有解的且运算方便;更重要的是正交变换 在变换结果上可使能量向低频成分方向集中,边缘信息和高频信息在高频成分上得 到反映,从而图像比特率被压缩;编码方面,将对低频成分分配较多的比特数,对 高频成分分配较少的比特数。 变换总是选用正交变换。常用的变换有k _ l 变换、d c t 变换和小波变换等 ( 6 ) 分形变换 分形( f r a c t a l ) 是m a n d e l b r o l 在1 9 7 7 年提出的几何学新概念。分形压缩的基 本原理是利用分形几何中的自相似原理进行图像压缩。由于彩色图像的各色分量是 处于同一景模型,因此更为明显地体现了各分形自相似性的特点,在各分量图像间 引用分形编码方法,可以实现色空间的压缩。 与d c t 不同,分形编码利用的“自相似性”不是临近样本的相关性,而是大范 围的相似性,即图像块的相似性。对相似性的描述是通过仿射变换来确定的,而编 码的对象就是仿射变换的系数。由于仿射变换的系数的数量小于图像块的数据量, 因此可以实现压缩的目的。 ( 7 ) 混合编码 运用以上两种或两种以上的方法对图像进行编码称为混合编码,j p e 6 和e a e 6 都属于混合编码。 静态图像压缩就是充分利用数字图像的空间冗余、时间冗余、视觉冗余、结构 冗余等,达到压缩冗余信息的目的。针对不同的冗余,可以采用许多不同的编码。 比如位平面编码、脉冲编码调制( d p c m ) 、熵编码、方块编码( b l o c kt r u n c a t i o n c o d i n g ) 、矢量量化编码v q ( v e c t o ro u a n t i z a t i o n ) 、分层编码( h i e r a c h i c a l c o d i n g ) 、子带编码( s u b b a n d c o d i n g ) 和变换编码( t r a n s f o r m c o d i n g ) 等等。近年来, 人们又提出了神经网络法、几何模型化、分形和小波变换等编码技术,通常认为, j b i g 、j p e g 、j p e g 2 0 0 0 、m e p g - i 、m p e g - 2 、m p e g - 4 以及酝酿中m p e g - 7 图像压缩 的国际标准是针对不同应用的最佳压缩算法之一。在这些标准之中成功地采用了以 上的一种或多种混合压缩技术。 一般说来,d p c m 对于保持物体在景像中的位置是最佳的,能提供良好的灰度性 能,保存背景信息,实现简单。但边缘清晰度临界,压缩率有限;同时,由于误差会 传播,所以抗信道误码传输的能力较弱。j b i g 是针对二值图像的压缩标准。j p e g 则是处理彩色或单色静止图像的压缩标准。j p e g 基于d c r 变换,量化索引进一步被 h u f f m a n 或是自适应的算术编码器编码。利用它可以获得较高的压缩比,并保持较 4 硕士学位论文 第一章绪论 高的信噪比,从而大大节省图像存储空间,降低通信带宽。但是编码过程会使物体 在图像中的位置略有移动( 即发生几何畸变) 另外,在高压缩比场合下,j p e g 的重 建图像在水平和垂直方向可能有晕圈、幻影,产生“方块”效应。j p e g 2 0 0 0 基于离 散小波变换编码与基于优化截断的嵌入式块编码( e b c o t ) 算法,具有非常好的编码特 性。m p e 6 是针对运动图像压缩的国际标准,它能达到比j p e g 更高的压缩比。 1 2j p e g 2 0 0 0 图像标准概述 j p e g 2 0 0 0 是由联合图像专家组( j p e g ) 负责制定的,作为j p e g 标准的一个后继 者它的目标是在一个统一的集成系统中,可以使用不同的成像模型( 客户机服务 器、实时传送、图像图书馆检索、有限缓存和宽带资源等) ,对不同类型( - - 值图 像、灰度图像、彩色图像、多分量图像等) 、不同性质( 自然图像、计算机图像、 医学图像、遥感图像、复合文本等) 的静止图像进行压缩,并进一步改进目前压缩 算法的性能,以适应低带宽、高噪声的环境。j p e g 2 0 0 0 图像编码采用了多种编码技 术,是近十年来的优秀编码思想的综合。j p e g 2 0 0 0 与传统j p e g 最大的不同,在于 它放弃了j p e g 所采用的离散余弦变换( d i s c r e t ec o s i n et r a n s f o r m ) 为主的区块 编码方式,而采用以小波变换( w a v e l e tt r a n s f o r m ) 为主的多解析编码方式。同时 j p e g 2 0 0 0 还拥有5 种层次的编码形式( l r c p ,r l c p ,r p c l ,p c r l 和c p r l ,其中l 表示层,r 表示分辨率,c 表示分量,p 表示位置) ,彩色静止图像采用j p e g ,二值 图像采用j b i g ,高压缩率采用j p e g l s ,而j p e g 2 0 0 0 则将上述方式统一起来,成为 对应各种图像的通用编码方式。 相对j p e g 来说,j p e g 2 0 0 0 标准提供了一套新的特征,这些特征对于一些新产品 ( 如数码相机) 和应用( 如互联网) 是非常重要的。它把j p e g 的顺序模式、渐进模 式、无损模式、和分层模式集中在一个标准之中,并在编码端以最大的压缩质量( 包 括无失真压缩) 和最大的图像分辨率压缩图像,在解码端可以从码流中以任意的图 像质量和分辨率解压图像,最大可达到编码时的图像质量和分辨率。j p e g 2 0 0 0 应用 的领域包括互联网、彩色传真、打印、扫描、数字摄像、遥感、移动通信、医疗图 像和电子商务等等。 j p e g 2 0 0 0 编码仍属于经典的变换编码范畴,即遵循变换、量化、熵编码的流程, 采用了小波变换、e b c o t ( e m b e d d e db l o c kc o d i n gw i t h0 p t i m i z e dt r u n c a t i o n ) 和自适应算术编码器相结合的全新方案,从而彻底消除了j p e g 标准中的分块效应, 得到了更好的效果j p e g 2 0 0 0 标准的核心为小波变换压缩技术。 硕士学位论文 第一章绪论 到目前为止,j p e g 2 0 0 0 标准共分为9 个部分,其中第一部分( p a r t l ) 已于2 0 0 1 年初形成国际标准( i si n t e r n a t i o n a ls t a n d a r d ) ,p a r t 2 - p a r t 6 已制定出最终决 议草案( f c df i n a lc o m i t t e ed r a f t ) 2 0 0 1 年1 2 月份又相继提出p a r t 8 一p a r t l o ( p a r t 7 的提议被否决) m 州。 1 3r o i 编码思想 j p e g 2 0 0 0 的一个重要特色就是感兴趣区域( r e g i o no fi n t e r e s t ,r o i ) 的编码。 在某些应用中,当图像被编码时,可确定一个具有特殊兴趣的图像区域,该区域在 编码过程中可被赋予更高的优先权,然后在压缩时对这些区域指定压缩质量,或在 恢复时指定某些区域的解压缩要求。目的就是使感兴趣区域可以获得比背景图像高 得多的图像压缩质量。实现r o i 的主要思想是:在图像d w t 变换后的系数矩阵中定 位出与r o i 有关联的系数,然后对这些系数进行编码时,给予高的保真度”“。 r o i 编码处理思想不仅能够满足人们在低比特率条件下对重要的图像信息实现 高质量,甚至无损压缩的要求,还可以通过与图像压缩算法相结合来很好的解决通 信过程中的带宽瓶颈、存储空间等问题。这些突出的优点使得r o i 编码处理方法成 为了近年来图像处理领域的研究热点之一。 1 4 国内外研究概况 基于感兴趣区域的图像编码技术在网络传输、无线通讯和医疗等领域发挥着越 来越大的作用。新一代静止图像国际压缩标准j p e g 2 0 0 0 正式将r o i 编码技术纳入其 中,并规定了两种标准算法:一种是基于偏移的一般方法( g e n e r a ls c a l i n gb a s e d m e t h o d ) ;另一种是最大偏移方法( m a x s h i f t ) “1 2 - t 4 o 它们均是通过按比例缩小b g 系数实现的。同时,j p e g 2 0 0 0 第一部分在编码时间中为感兴趣区域赋予较高优先级 提供了一种“隐式”r o i 编码机制,它是通过调节驱动构造质量层的代价函数来构 造的,在码流中没有明确的信息表示编码器已经对图像的任何区域区别对待。 由于两种标准方法在定义r o i 形状的复杂性和编码灵活性等方面存在的局限性, 一些学者先后提出了改进的r o i 编码方法。w a n gz h o u 等人提出一种逐个位平面偏 移方法( b b b s h i f t ,b i t p l a n e b y - b i t p l a n es h i f tm e t h o d ) 。后来,w a n gz h o u 等人 又对b b b s h i f t 方法进行了推广,提出通用的逐个位平面偏移方法( g b b b s h i f t , 7 矿口日z z 日孵, 6 硕士学位论文 第一章绪论 g e n e r a l i z e db i t p l a n e b y b i t p l a n es h i f tm e t h o d ) 。l i ul i j i e 等人摒弃了 m a x s h i f t 方法的思路,开发出一种称为部分重要位平面偏移方法( p s b s h i f t , p a r t i a ls i g n i f i c a n tb i t p l a n e ss h i f tm e t h o d s ) 。上述3 种方法均可在不传输任 何形状信息的前提下,实现对任意形状的r o i 编码,而且能够比m a x s h i f t 方法更灵 活地控制r o i 和b g 的相对质量。但前两种方法与j p e g 2 0 0 0 的r o i 编码定义不兼容, 并且无法按不同优先级对多个r o i 进行编码;而p s b s h i f t 方法支持多个r o i 编码, 但在控制r o i 和b g 相对质量的灵活性方面,不如前两种方法。后来,l i a n gy a h 等 人又提出了一种通用的部分位平面偏移方法( g p b s h i f t ,g e n e r a l i z e dp a r t i a l b i t p l a n e ss h i f tm e t h o d ) 。该方法结合了两种标准算法的优点,并能以不同优先级 有效编码多个r o i 。且能随意调整r o i 和b g 的相对质量,其编码原理涵盖了 m a x s h i f t 、g b b b s h i f t 和p s b s h i f t 三种方法”“嘲。 1 5 本文研究内容及组织结构 本文针对基于j p e g 2 0 0 0 静态图像压缩标准的r o i 编码实现问题,深入研究了 j p e g 2 0 0 0 图像标准的编码处理方法,简要分析了现有的各种r o i 编码方法的特点, 并研究和改进实现了一种有效的隐式r o i 编码实现方法。实验测试结果表明,本文 提出的方案在能实现r o i 压缩编码的同时克服了比特位平面提升r o i 编码方法的一 些不足。 全文具体内容安排如下: 第二章首先介绍了j p e g 2 0 0 0 静态图像压缩标准的制定过程,主要特点和应用范 围等基本情况。然后按照j p e g 2 0 0 0 图像标准的正向编码处理顺序,深入分析了 j p e 6 2 0 0 0 标准的预处理,离散小波变换,量化和算术熵编码等编码模块 第三章首先介绍了r o i 编码思想,然后分析了j p e g 2 0 0 0 标准中的位平面提升方 法。最后给出目前出现的基于位平面提升方法的一些高效的静态r o i 算法。 第四章系统地介绍了失真一长度斜率提升感兴趣区域编码算法该算法是在码流 组织时通过对感兴趣区域对应的失真长度斜率进行提升实现,而不是提升位平面, 当系统对感兴趣区域要求改变时,只需重新调整失真一长度斜率并重新组织码流,从 而简化了系统的复杂度。本章给出了失真一长度斜率提升感兴趣区域编码算法的基本 算法、实现与实验结果。 第五章是对全文工作进行了总结,并对r o i 编码方法的进一步研究思路进行了 展望。 7 硕士学位论文 第二章j p e g 2 0 0 0 静态图像压缩标准简介 第二章j p e g 2 0 0 0 静态图像压缩标准简介 本章从j p e g 2 0 0 0 标准的形成过程、主要特点、适用范围的角度系统地介绍了 j p e g 2 0 0 0 这一静态图像压缩国际新标准。并按照编码器的处理流程,详尽讨论了各 个编码模块的功能。 2 1 j p e g 2 0 0 0 标准的形成历程 从上个世纪8 0 年代以来,国际电信联盟( i t u ) 和国际标准组织( i s o ) 就开 始合作,致力于制定灰度和彩色静止图像压缩算法的国际标准,成立了联合图像专 家组( j p e g ) 。经过多年的不懈努力,联合图像专家组于1 9 9 2 年成功推出了基于离 散余弦变换( d c t ) 的j p e g 静态图像压缩标准( i s o1 0 9 2 8 ) 。j p e g 因其优越压缩 性能,在数字图像领域中得到了广泛而成功的应用。 但随着多媒体技术和网络通讯技术的迅速发展,人们对图像压缩性能、处理灵 活性、功能性等多方面有进一步要求,人们迫切需要一种具有更好的压缩效果,支 持更多图像格式,并能够提供更多新特征( 如r 0 1 编码,码流率控制,图像渐进恢 复,码流随机访问等) 的新的静态图像压缩标准来更好的为人们服务。针对这些不 足,1 9 9 6 年的瑞士日内瓦会议上提出制定新一代的j p e g 格式标准m e g 2 0 0 0 。 它的目标是在一个统一的集成系统中,可以使用不同的成像模型,对不同类型、不 同性质的静止图像进行压缩。该压缩编码系统在保证失真率和主观图像质量优于现 有标准的条件下,能够提供对图像的低码率压缩。因此,更高压缩率以及更多新功 能的新一代静态图像压缩技术j p e g 2 0 0 0 就诞生了。j p e g 2 0 0 0 正式名称为:i s o 1 5 4 4 4 ,同样是由联合图像专家组负责制定。于1 9 9 7 年开始征集提案,把它作为j p e g 标准的一个更新换代标准。 到目前为止,j p e g 2 0 0 0 标准共分为9 个部分,其中第一部分( p a r t i ) 已于2 0 0 0 年1 2 月成为国际标准( i si n t e r n a t i o n a ls t a n d a r d ) ,它的目标是提供一个最小化无知 识产权问题的j p e g 2 0 0 0 系统,p a r t 2 p a r t 6 已制定出最终决议草案( f c df i n a l c o m m i t t e ed r a f t ) 。2 0 0 1 年1 2 月份又相继提出了p a r t 8 p a r t l o ( p a r t 7 的提议被否决) 。 第二部分由可选的“补充值”扩展组成,它们能够增强压缩性能并且( 或者) 可以 8 硕士学位论文 第二章j p e g 2 0 0 0 静态圈像压缩标准简介 压缩不常用数据类型,但是它所采用的解码器不能解码采用第一部分技术得到的码 流。其余部分的标准也在制定中,重点将是移动图像,标准的高质量实施,参考软 件实施方案的提供,针对扫描传真等应用的图像格式、安全性、互动性以及传输协 议、三维编码等问题上【l ,67 1 3 ,1 4 1 。 2 2j p e g 2 0 0 0 标准的主要特点 作为静态图像压缩新标准,j p e g 2 0 0 0 较, p e g 有很大的发展。其编解码器采用 了如下的很多新技术: 1 ) 用离散二维小波变换( d w t ) 取代离散余弦变换( d c t ) ; 2 ) 在应用离散小波变换时,分别引入对数据整型到整型( i n t e g e r t oi n t e g e r ) 的可 逆( r e v e r s i b l e ) 变换和实型到实型( r e a lt or e a l ) 的不可逆( i r r e v e r s i b l e ) 变换,从而实现对图像的无损( l o s s l e s s ) 压缩和有损( l o s s y ) 压缩两种不同 的编码处理; 3 ) 采用了较以往各种零树编码更优越的编码算法e b c o t 算法( 基于优先截断 的嵌入块编码算法) ; 4 ) 对量化后的小波变换系数采用基于位平面的多通道编码技术; 5 ) 采用基于上下文( c o n t e x t - b a s e d ) 的自适应二进制算术编码器( m qc o d e r ) 实 现高效的算术熵编码; 6 ) 采用两级原语表示编码后的图像,分别为码流和文件格式原语。 以上多种技术的采用,不仅使得j p e g 2 0 0 0 图像标准的压缩效果较j p e g 有了很 大的提高,同时还为 p e g 2 0 0 0 图像压缩标准提供了许多 p e g 所不具备的新特征 主要特点如下: 高效压缩;在较低的码流比特率条件下,j p e g 2 0 0 0 图像标准仍然能够实现较高 质量的图像数据的传输。采用j - p e g 2 0 0 0 图像标准后,图像的压缩较j p e g 标准 显得细腻、平滑因此,j p e g 2 0 0 0 静态图像压缩标准在网络和遥感等图像传输 领域具有很大的应用潜力。 无损压缩和有损压缩:j p e g 2 0 0 0 图像标准可以在同一编码框架内同时实现无 损和有损两种压缩方式,以满足人们不同的实际需求。同时,j p e g 2 0 0 0 编码器 9 硕士学位论文 第二章p e g 2 0 0 0 静态图像压缩标准简介 最终生成的嵌入式码流,还能够灵活地实现图像数据从有损到无损的渐进恢复 过程。 图像渐进传输:j p e g 图像是按“块”传输的,因而只能实现图像从上到下的 逐行显示。而j p e g 2 0 0 0 图像标准支持对图像数据的渐进传输( p r o g r e s s i v e t r a n s m i s s i o n ) ,可以实现图像数据按照信噪比( 孙浓) 或分辨率( r e s o l u t i o n ) 的渐进传输。 r o i 编码: r o i 编码,即感兴趣区域编码。j p e g 2 0 0 0 允许用户在图像上自定义 r o i 图像区域,并对这些区域的图像数据实现优先、优质的编码处理。 图像数据可随机访问:j p e g 2 0 0 0 图像标准允许特定图像区域的随机访问,而 无需将整个码流解码,从而实现用户对压缩码流的各种灵活操作。 优越的容错性:j p e g 2 0 0 0 图像标准具有优越的容错能力( e r r o rr e s i l i e n c e ) , 在干扰较强的信道中传输图像数据时,容错性对限制误码率有很大帮助。 开放式结构: j p e g 2 0 0 0 图像标准只是定义了编码器的核心算法和码流文件的 结构。这种开放式结构允许用户根据各种不同的实际需要来灵活地嵌入不同的 工具模块,从而不断拓展j p e g 2 0 0 0 图像标准的功能。 基于内容的描述:对图像信息的检索和分类,是图像处理的一个重要研究领域。 j p e g 2 0 0 0 文件格式灵活,支持用户对其感兴趣的各种数据信息进行快速、有效 的检索”。 2 3j p e g 2 0 0 0 标准的适用范围 j p e g 2 0 0 0 图像标准具有许多j f e g 所不具备的优越性能和特点,其适用范围也 十分广泛,且向下兼容,取代传统的j p e g 指日可待。j p e g 2 0 0 0 可广泛应用于通信、 图像处理、信号处理、信息理论和多媒体等领域中,具体而言如因特网、移动电话 或p d a 、监控及安全系统、医学成像、数码相机、打印机、扫描仪、卫星图像、文 档及图像存储和电子商务等方面。 2 4j p e g 2 0 0 0 标准的编码流程 j p e g 2 0 0 0 编解码器( c o d c c ) 结构如图2 1 所示,上方为编码器结构,下方为解 码器结构,其中n e r l 编码部分和n e r 一2 编码部分为熵编码部分。编码器的核心部 1 0 硕士学位论文第二章j p e g 2 0 0 0 静态图像压缩标准简介 分是预处理,离散小波变换,量化和熵编码四个模块。由于解码仅为编码的逆过程, 本章将按照j p e g 2 0 0 0 的编码流程来详细分析各编码模块的功能。 原始图 数据 恢复图 数据 2 4 1 囱像预处理 图2 1j p e g 2 0 0 0 编解码器结构框图 图像 传输 存储 过程 j p e g 2 0 0 0 m 像标准能够灵活地支持多种图像格式。色成分( c o l o r c o m p o n e n t ) 的采样值可以为有符号数和无符号数两种形式。在对原始的图像数据进行编码处理 之前,j p e g 2 0 0 0 编码器要对其进行先期的预处理。即按照j p e g 2 0 0 0 标准的要求对 原图像进行色成分分解,分块( t i l i n g ) ,直流分量滤除( d cl e v e ls h i n i n g ) ,彩色 成分变换等操作( 如图2 - 2 所示) 。 + + + +十 直流分蠡 滤除 + + 十+ + 多个色成分的块分解多个色成分的小波变换 图2 - 2j p e g 2 0 0 0 编码预处理 具体内容分别如下: 色成分分解: 按所含色成分的数量,图像可以分为灰度图像( 只有单一色成分) 和彩色图像 硕士学位论文第二章j p e g 2 0 0 0 静态图像压缩标准简介 ( 有两种以上的色成分) 两类。由于离散二维小波变换每次只能针对某个特定的色 成分数据进行处理,所以有必要对彩色图像进行先期的色成分分解操作。 块分解: 根据j p e g 2 0 0 0 标准的要求,编码器按照一定的大小对原始图像的各个色成分数 据进行分割,得到多个彼此相互独立的“块( 啊l e ) ”。然后把每个块作为一个独立 的单元,并对其进行后续的离散小波变换。分块处理不仅可以简化编码流程,还能 够很好地降低编解码器对硬件复杂度的要求。 直流分量滤除: j p e g 2 0 0 0 编码器要求对块中的图像采样值进行直流分量滤除处理,从而使输入 编码器的图像数据关于0 呈对称分布。假设某色成分块中的采样值位长为p ,如果采 样值是无符号数,就需要将输入的采样值减去2 ,使其动态范m y g - 2 p - i ,矿1 1 】; 如果该采样值为有符号数,则无需做此处理。 直流分量滤除有利于后期算术熵编码操作,但对提高编码效率没有明显的作用。 在后期的解码过程中,会有相应的逆处理过程。 色成分变换: 许多图像是由多个色成分分量组成的,分量之间存在一定的相关性,通过色成 分变换,将图像变换到合适的色空间,可以减少图像各分量之间由于相关性引起的 冗余,提高压缩效率。 j p e g 2 0 0 0 标准支持两种不同的分量变换,一种是不可逆的分量变换i c t ( i r r e v e r s i b l e c o l o r t r a n s f o r m ) ,为实型到实型的不可逆变换,只能用于有损编码; 一种是可逆彩色变换r c t ( r e v e r s i b l ec o l o rt r a n s f o r m ) ,为整型到整型的可逆变换, 既可用于无损编码,也可用于有损编码。 在色空间变换完成之后,所得到的每个新的色成分都被独立调用,进行后续的 编码操作。相应地,在解码过程中,j p e g 2 0 0 0 会采用相应的色成分空间逆变换来实 现图像数据的恢复。 2 4 2 离散小波变换 小波变换思想来源于伸缩和平移方法。1 9 8 7 年,m a l l a t 将多尺度分析思想引入小 波分析中,提出了多分辨率分析的概念。从此以后,小波变换作为信号处理的一种 手段,逐渐应用在许多领域。由于它既能考虑局部时域过程的频域特征,又能考虑 局部频域过程的时域特征,在图像处理与图像分析领域得到了更广泛的应用。小波 变换的时频局域化特性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论