




已阅读5页,还剩60页未读, 继续免费阅读
(电路与系统专业论文)jpeg2000静态图像压缩标准roi技术的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
硕士学位论文 摘要 随着计算机越来越多的用来处理图像及多媒体信息,为达到节省资源的目 的,如何对图像进行有效的压缩成为一个当前研究的热点。针对图像压缩国际上 提出了很多的标准,其中j p e g 2 0 0 0 是最新的静态图像压缩标准。j p e g 2 0 0 0 是 i s o 于2 0 0 0 年底制定的新一代静态图像压缩编码标准。j p e g 2 0 0 0 与传统j p e g 最大的不同,在于它采用以小波变换为主的编码方式。 感兴趣区域编码是j p e g 2 0 0 0 支持的新功能之一,也就是在进行图像压缩时 同时要保证图像的质量也成为一个难题。针对人的主观应用目的,往往只对图像 中的某部分区域感兴趣,对其它部分的质量要求不高,这就是感兴趣区域编码的 思想。利用这种思想进行编码可在图像的压缩和质量间取得平衡,在保证图像质 量的前提下可取得较好的压缩效果。 本文主要是对j p e g 2 0 0 0 标准的感兴趣区域( r o i ) 编码进行了探讨,并根据 实际情况提出了能减少编码复杂度的感兴趣区域编码方法。本文从一般性出发分 析了j p e g 2 0 0 0 标准,对j p e g 2 0 0 0 的r o i 编码进行了描述,同时对j p e g 2 0 0 0 采用 的离散小波变换算法的理论基础进行了介绍,分析了基于小波变换的图像感兴趣 区域编码方法。最后特别对j p e g 2 0 0 0 标准的e b c o t 算法和多兴趣区域编码方法 进行了详细的研究,对编码的各个环节进行了分析,提出了基于e b c o t 的感兴 趣区域编码算法及实现多兴趣区域多质量的压缩的编码方法。该方法从实际应用 的特点出发,对多个r o i 进行优先级别的排列,对r o i # b 的背景区域进行高频分量 滤除,从而减少了j p e g 2 0 0 0 编码的运算量,减少了生成码流的编码时间。同时, 该方法对解码端没有任何要求,利用了j p e g 2 0 0 0 的核心编码算法,更有利于实现 和保持兼容性。 关键词:j p e 6 2 0 0 0 ,小波变换,感兴趣区域,优化截断的嵌入式块编码,多区域 多质量编码 a b s t r a c t c o m p u t e ri s m o r ea n dm o r ea p p l i e dt op r o c e s si m a g ea n do t h e rm u l t i m e d i a , h o wt oc o m p r e s si m a g ee f f e c t i v e l yf o rs a v i n gr e s o u r c eb e c o m e sar e s e a r c hh o t s p o ta t p r e s e n t m a n y i n t e r n a t i o n a ls t a n d a r d sa r e d e s i g n e d f o r i m a g ec o m p r e s s i o n , j p e g 2 0 0 0i st h en e w e s ts t a n d a r do fs t a t i ci m a g ec o m p r e s s i o n i p e g 2 0 0 0 ,t h en e w i s o i t u ts t a n d a r df o rs t i l li m a g ec o d i n g ,h a db e e nf i n i s h e da tt h ee n do f2 0 0 0 t h e d i f f e r e n c eb e t w e e nj p e ga n dj p e g 2 0 0 0i st h a tj p e g 2 0 0 0u s ed i s c r e t ew a v e l e t t r a n s f o r m ( d w t ) a st h em a i nc o d i n gm e t h o d r e g i o no fi n t e r e s tc o d i n gi so n eo ff e a t u r eo fj p e g 2 0 0 0 ,t om a i n t a i nt h ei m a g e q u a l i t yd u r i n gt h ei m a g ec o m p r e s s i o n i sa l s oad i f f i c u l tp r o b l e m p e o p l eo f t e n i n t e r e s ti ns o m ep a r to ft h ei m a g ea n dn e g l e c to t h e rp a r to fi t ,w h i c hi st h e i n t e r e s t i n gr e g i o nc o d i n gt h o u g h t w i t ht h i st h o u g h tw ec a no b t a i nt h eb a l a n c e b e t w e e nt h ei m a g ec o m p r e s s i o na n di m a g eq u a l i t y ,r e a c h i n ge x c e l l e n tc o m p r e s s i o n e f f e c to nt h eb a s i so fk e e p i n gt h ei m a g eq u a l i t y t h ep a p e rf o c u s e so i lt h ej p e g 2 0 0 0s t a n d a r dd i s c u s s i o na n di n t e r e s t i n gr e g i o n c o d i n gt h o u g h t ,a n da c c o r d i n gt o t h ea c t u a ls i t u a t i o np r o p o s e so n em e t h o dw h i c h c a nr e d u c et h ec o m p l e x i t yo fe n c o d i n ga n dr e a c hi n t e r e s t i n gr e g i o nc o d i n ge f f e c t t h ep a p e ra n a l y s i st h ei m a g ec o m p r e s s i o ns t a n d a r do fj p e g 2 0 0 0f o rt h eg e n e r a l i t y , d e s c r i b et h er o ic o d i n go fj p e g 2 0 0 0 ,i nt h es a m et i m e ,t h ea u t h o rb r i e f l yi n t r o d u c e w a v e l e tt h e o r yw h i c hi st h eb a s i so ft h ed i s c r e t ew a v e l e ta l g o r i t h ma d o p t e db y j p e g 2 0 0 0 ,a n a l y s i s t h e a l g o r i t h m o fr o ib a s e d 。o nd i s c r e t ew a v e l e t t r a n s f o r m f i n a l l yt h ea u t h o rc a r r yo nt h ed e t a i l e da n a l y s i st oe b c o ta l g o r i t h ma n d t ot h em u l t i p l er o i sm e t h o d ,a n a l y s i se v e r yb l o c ko fe n c o d i n g ,p r o p o s e so n ec o d i n g a l g o r i t h mo fr o ib a s e do ne b c o ta n dp r o p o s e so n em e t h o dc a nr e a l i z ei m a g e m u l t i p l er o ia n dm u l t i p l eq u a l i t yc o m p r e s s i o n t h i sm e t h o de m b a r k e df r o mt h e p r a c t i c a la p p l i c a t i o nc h a r a c t e r i s t i c ,c a r r i e do nf i r s tt h er a n ka r r a n g e m e n tt om u l t i p l e r o i ,a n df i l t e r e dt h eh i g hf r e q u e n c yc o m p o n e n tt h a tt h eb a c k g r o u n dr e g i o no u t s i d e t h er o it h u sr e d u c e dt h ej p e g 2 0 0 0c o d eo p e r a n d ,r e d u c e dt h ep r o d u c t i o ns y m b o l s t r e a mc o d et i m e a tt h es a m et i m e ,t h i sm e t h o dh a dn o ta n yr e q u e s tt od e c o d e s ,h a d u s e dt h ej p e g 2 0 0 0c o r ec o d ea l g o r i t h m ,h a sm o r ea d v a n t a g e o u st ot h er e a l i z a t i o n a n dt h em a i n t e n a n c ec o m p a t i b i l i t y k e yw o r d s :j p e g 2 0 0 0 ,w a v e l e tt r a n s f o r m ,r o i ,e b c o t ,m r m q n 湖南大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 作者签名: 舌b 荛磷 日期:沙口阵夸月1 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇 编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密团。 ( 请在以上相应方框内打“4 ”) 作者签名:节日荒谨日期:2 年月f 日 导师签名:影印- l , 日期:b 。年月j 日 硕士学位论文 第1 章绪论 1 1 课题研究背景及意义 图像压缩可分为有损压缩和无损压缩,它是实现图像数据传输和存储的核心 技术。目前在图像压缩这一领域中的研究一直是以满足容量更小,传输速度更快, 图像质量更高为目的的。但是由于压缩比和重建图像质量的相互制约,想要一幅 图像同时在这两方面都获得最佳效果是无法实现的,在图像的实际应用上,人们 往往只对一幅图像中的某一特殊的部分感兴趣。在许多数字图像应用的领域中, 需要的并不是整个清晰的图像,而只是需要图像中某一( 或某几个) 特定位置处 于无损压缩的状态。例如,在图像通信中,通信双方对人物头区域感兴趣;对拍 摄的军事侦察图像,指挥官只对其上的打击目标感兴趣,而对大地背景信息并不 感兴趣,大地背景信息属于背景区域,是可以对其进行有损压缩的;对于医学图 像,医生只对病变部位区域感兴趣;而一个网上购物者则仅仅只对网页中商品物 有兴趣,等等这些都是感兴趣区域编码应用的范围。如果能在整幅图片中指定一 块感兴趣区域,然后在压缩时,对该区域采用低压缩比的压缩,甚至是无损压缩 以获取较好的图像压缩效果,而其他区域采用高压缩比的有损压缩,这样既能满 足人们对图像的要求,又能降低传输时间,节省存储空间。也就是说,在一幅图 像内实现多种质量的压缩。这就是我们所说的感兴趣区域( r e g i o no fi n t e r e s t r o i ) 编码技术。 随着多媒体和网络技术的发展,人们对数字图像在质量、大小和应用上提出 了更高的要求,希望能够用有限的空间和带宽资源存储与传输大幅图像,并根据 实际需要,获得不同分辨率或质量的重构图像。在早期的j p e g 标准中不能灵活 的实现图像压缩的实时需要,为了弥补j p e g 标准的不足,适应现代图像压缩的 需要,i s o 于2 0 0 0 年底制定了新一代静态图像压缩标准- - j p e g 2 0 0 0 。与j p e g 不同,j p e g 2 0 0 0 基于小波变换,采用当前最新的嵌入式算术编码技术,在获得 优于目前j p e g 标准压缩效果的同时,生成的压缩码流具有强大灵活性,可应用 于i n t e r n e t 、移动通信、打印、扫描、数字摄影、遥感、传真、医疗、数字图书 馆以及电子商务等多方面的图像压缩。j p e g 2 0 0 0 采用多种技术来实现其特点, 其中的关键技术之一就是r o i 区域处理1 2j 。 基于上述原因,本文把j p e g 2 0 0 0 标准的关键技术之一r o i 区域处理作为研 究课题,研究了大多数j p e g 2 0 0 0 分析资料中很少提及的r o i 功能。同时研究了 多区域多质量的图像压缩算法,期望通过研究与实现,来跟踪当代先进的图像压 缩编码技术,为今后的图像压缩技术的进一步研究做准备。 :。:望墼塑些堑查垦堡墅壅墼! 壑垄墼堑蜜皇塞坠: 图像编码的一系列国际建议的提出标志着图像编码技术已经成熟,开始由大 学的实验室走向产业化,其中包含着巨大的商业利益。图像编码技术的突破对i t 技术的各个方面有巨大的影响,可以促使现有信息产业的结构发生巨变。由于图 像编码体系应用在于i t 技术的各个方面,具有很大的经济价值,成为各方面争夺 的焦点,谁掌握了它就拥有了具大的利益。可以想象到掌握核心的知识产权带来 多大的收益,目前我们应该多开发此类的核心技术,才能在将来的科技、经济竞 赛处于有利位置感兴趣区域编码技术作为j p e g 2 0 0 0 的核心技术之一 2 1 可以解 决图像交互处理、远程医疗、远程教育、远程测量,空间探索中出现的许多与图 像处理有关的问题,这种技术可以推广应用到很多场合,从i n t e r n e t 应用到军事 目标侦察;可以将感兴趣区域与加密技术结合,限制图像某些区域的可见性;可 以与版权信息结合,利用感兴趣区域在多次压缩传输中信息不会损失,从而对版 权加以保护。在车牌识别系统中,由于现有的车牌识别率不是很高,因此一般要 结合整个汽车的图像来进行识别,而整个汽车图像的数据量非常大,必须压缩存 储和传输。如果采用r o i 编码,对车牌号进行高精度的编码,而对整个汽车的图 像进行高压缩率低精度的编码,则可以实现在较小数据量情况下实现高精度的车 牌识别。在视频会议系统中,一般感兴趣的只是参与开会的人的图像,而对其背 景部分并不是很感兴趣,因此我们就可以把参加会议的人的图像设为是感兴趣区 域,其余为背景,采用感兴趣区域图像编码技术对其进行相应处理。该方法可以 大大降低带宽的需求,推动视频会议的发展。这将是我们今后随着研究的进一步 深入而逐步应用到具体实践中的,在互联网迅速发展的今天,有着实际的研究意 义和价值。也就是说,感兴趣区域编码有着非常广阔的应用空间和发展前景。 1 2j p e g 2 0 0 0 标准提出 j p e g 2 0 0 0 0 是静态图像压缩的最新国际标准。j p e g 全名为j o i n t p h o t o g r a p h i ce x p e r t sg r o u p ,它是一个在国际标准组织( i s o ) 下从事静态图像 压缩标准制定的委员会即联合图片专家组。它制定出了第一套国标静态图像压缩 标准:即j p e g 。由于j p e g 优良的品质,使得它在短短的几年内就获得极大的成功, 目前在因特网上有百分之七十多的图像都是采用j p e g 的压缩标准。然而,随着多 媒体应用领域的不断发展,传统的j p e g 压缩技术己无法满足人们的需求。因此, 新一代静态图像压缩技术j p e g 2 0 0 0 就诞生了,它拥有更高压缩率以及更多的新功 能。j p e g 2 0 0 0 的制定始于1 9 9 7 年3 月,直到2 0 0 0 年3 月,规定基本编码系统的最终 协议草案才出台。“高压缩、低比特速率”是j p e g 2 0 0 0 的目标。在压缩率相同的 情况下,j p e g 2 0 0 0 的信噪比将比j p e g 提高3 0 i 右。j p e g 2 0 0 0 拥有5 种层次的编码 形式:彩色静态画面采用的7 p e g 编码、2 值图像采用的j b i g 、低压缩率图像采用 硕士学位论文 j p e g l s 等,成为应对各种图像的通用编码方式。在编码算法上,j p e g 2 0 0 0 采用离 散小波变换( d w t ) 和比特平面算术编码( m oc o d e r ) 。此外,j p e g 2 0 0 0 码流还支 持空间随机访问。 j p e g 2 0 0 0 编解码器的方框图”1 如图1 1 ( a ) 所示。首先对源图像数据进行变 换,再对变换的系数进行量化,然后在形成代码流( c o d es t r e a m ) 或者叫做位流 ( b i ts t r e a m ) 之前进行熵( e n t r o p y ) 编码。解码器与编码器正好相反,如图1 1 ( b ) 所示。首先对码流进行熵解码,然后进行逆量化和逆向变换,最后进行图 像的重构。 图1 1j p e g 2 0 0 0 的基本结构 j p e g 2 0 0 0 标准是以图像块作为单元进行处理的。这就意味着图像数据在进入 编码器之前要对它进行分块。 分块汨嘲)青散小波变袭( a _ t r ) 十 牛午 十 生 牛 址也 童漉电平 交换牛 址也纨 ( d e k _ 时岫) 牛牛+ 图1 2 图像分块直流电平变换和图像分块 如图1 2 所示,左图表示对图像进行分块,右图表示对每一个图像块进行处理, 中间的方框表示在对每个图像块进行正向变换之前,图像块分量的所有样本都减 去一个相同的量,这叫做卣流电平( d c ) 变换。图像分块处理时,对图像块的大小 没有限制,图像的变换、量化和熵编码等所有的处理都是以图像块为单元。这样 做有两个明晟的好处,一是可以降低对存储器的要求,二是便于拙出一幅图像中 的部分图像。其缺点是图像质量有所下降,但不明显。 图1 2 图像分块、直流电平变换和图像块变换图像变换使用离散小波变换。 j p e g 2 0 0 0 标准使用子带分解,把样本信号分解成低通样本和高通样本。离散小 波变换可以是不可逆的小波变换,也可以是可逆的小波变换。标准中采用了两种 小波变换滤波器j p e g 2 0 0 0 :有损变换滤波器( o a u b e c h i e s9 7 ) 和无损变换滤波 器( l e g a l l5 3 ) 。 j p e g2 0 0 0 与传统5 p e g 最大的不同,在于它放弃了j p e g 所采用的以离散余 弦变换( d is c r e t ec o s i n et r a n s f o r m ) 为主的编码方式,而采用以小波变换 ( w a v e le tt r a n s f o r m ) 为主的编码方式,小波变换的主要目的是要将图像的频率 成分抽取出来。离散小波变换算法是现代谱分析工具,在包括压缩在内的图像处 理与图像分析领域f 得到越来越广泛的应用。此外j p e g 2 0 0 0 还将彩色静态画面 采用的j p e g 编码方式与2 值图像采用的j b i g 编码方式统一起来,成为对应各种 图像的通用编码方式。j p e g 2 0 0 0 作为j p e g 的升级版,具有以下特点“”“7 “: 高压缩率 j p e g 的压缩效率不高,由于j p e g 2 0 0 0 采用了离散子波变换算法,j p e g 2 0 0 0 压 缩性能比j p e g 提高了1 0 5 0 ,也就是说,在同样的图像质量下,j p e g 2 0 0 0 可 以使图像文件的大小比j p e g 图像文件小1 0 5 0 。而且压缩后的图像显得更加 细腻平滑。特别是在低码率下,使用j p e g 2 0 0 0 的系统稳定性好,运行平稳,抗 干扰性好,易于操作。这一特征在互联网和远程医疗等图像传输领域有着广泛的 应用。 同时支持有损和无损压缩 j p e g 只支持有损压缩,而j p e g 2 0 0 0 提供有损和无损两种压缩方式。在实际应用 中,无损压缩是非常必要的,诸如红外遥感图像、医学图像、网络商品照片等重 要的图像都非常适合于采用j p e g 2 0 0 0 压缩。这样,我们以后需要保存一些非常 重要或需要保留详细细节的图像时如医疗图片时,就不需要再将图像转换成其他 格式了,非常方便。同时j p e g 2 0 0 0 提供的是嵌入式码流,允许从有损到无损的 渐进传输。 实现了渐进传输 这是j p e g 2 0 0 0 一个极其重要的特征,它可以先传输图像的轮廓,然后逐步传输 数据,不断提高图像质量,让图像由朦胧到清晰显示,而不必像现在的j p e g 那 样,由上到下慢慢显示,这在网络传输中有重大意义。现在网络上的j p e g 图像 下载时是按“块”传输的( j p e g 扩展版本也有渐近模式) ,因此只能一行一行地 显示,而采用j p e g 2 0 0 0 格式的图像支持渐进传输。所谓的渐进传输就是先传输 图像轮廓数据,然后再逐步传输其他数据来不断提高图像质量( 也就是不断地向 图像中插入像素以不断提高图像的分辨率) 。这样你就不需要像以前那样等图像 硕士学位论文 全部下载后才决定是否需要,有助于你快速地浏览和选择大量图片,从而提高了 上网效率。 支持“感兴趣区域” j p e g 2 0 0 0 另一个极其重要的优点就是r o i ( r e g i o no fi n t e r e s t ,即感兴趣区 域) “1 。有些情况下,图像中只有一小块区域对用户是有用的,对这些区域,采 用低压缩比,而感兴趣区域之外采用高压缩比。制作者可以指定图片上感兴趣区 域,然后在压缩时对这些区域指定压缩质量,以保证感兴趣区域的质量较高。这 样在保证对用户有用的信息不丢失,又能有效地压缩数据量,这就是基于感兴趣 区域的编码方案所采取的压缩策略。用户可以任意指定图像上感兴趣区域的压缩 质量,还可以选择指定的部分先解压缩,从而使重点突出。这种方法的优点在于 它结合了接收方对压缩的主观需求,实现了交互式压缩。 容错性:在码流提供容错性有时是必要的,例如在无线等传输误码很高的通信 信道中传输图像时,没有容错性是不能让人接受的。 1 3j p e g 2 0 0 0 的r o i 编码描述 e b c o t ( e m b e d d e db 1 0 c kc o d i n gw i t ho p t i m iz e dt r u n c a t i o n ) 算法是 j p e g 2 0 0 0 图像编码系统中的核心算法之一”1 。它能够实现图像的有效压缩,同 时产生的码流具有信噪比可伸缩性、随机访问等非常好的性能。e b c o t 算法与早 期的嵌入式图像压缩算法关系非常紧密,这些算法包括e z w ( e m b e d d e dz e r o t r e ew a v e l e tc o m p r e s s i o n ) 算法,s p i h t ( s e tp a r t i t i o n i n gi nh i e r a r c h ic a l t r e e s ) 算法和l z c ( l a y e r e dz e r oc o d i n g ) 算法等。与这些算法相似,e b c o t 算法也 是用小波变换进行子带采样,然后对小波系数进行量化和编码。与e z w 和s p i h t 算 法不同的是,e b c o t 算法并没有使用零树结构而是使用编码块,同时提出了一种称 为压缩后率失真优化p c r d ( p o s t c o m p r e s s i o nr a t e d i s t o r t i o no p t i m i z a t i o n ) 的算法,基于这种算法产生的数据位元流具有完全的嵌入特性。 1 3 1 编码块 在e b c o t 算法中,将每个频带分割为许多不重叠的相对较小的子块,同时,每 个子块都将独立的进行熵编码的流程,故每个子块又称为编码块( c o d eb l o c k ) , 如图1 3 n 示。 群。 图13 封包流 通常编码块为6 4 6 4 ( 或3 2 3 2 ) 的子块。在每个编码块中,都有许多的位元 平面( b i tp l a n ec o d e ) ,熵编码先从高位元平面( 即重要位平面) 开始编码,然后在 进行下一个不重要的位元平面,同时,每个位元平面都会进行三个p a s s 来编码,此 三个p a s s 是三个不同的编码规则,即重要性传播过程( s i g n i f i c a n e e p r o p a g a t i o np a s s ) 、幅度精练过程( m a g n i r u d er e f i n e m e n tp a s s ) 和清理过程 ( c 1 e a n u pp a s s ) ,且配合着算术编码一起来编码。所以,每个p a s s 都会送出一串编 码后的位元流c ,然后,每个p a s s 所产生的位元流,再依照每个p a s s 编码的前后 顺序来排序,即最先编码的位元流排在最前面。之后,将编码完的位元流再进行嵌 入式块编码算法( e m b e d d e db l o c kc o d i n ga l g o r it h m ) 。嵌入式块编码算法在处 理位元流时,每一个编码块中的切断点( t r u n c a t i o np o i n t s ) 可以自由选择,并且 对应的失真率为科“,另外,在每个编码中允许切断点的个数是z i + 1 ,长度是华 必满足下式:0 = 工,问l ”s 骂。如果最终压缩数据位元流的长度限制在l 眦。, 那么所有自由选择切断点的长度之和应满足下式:叠2 1 k 。a 同时,如果用每 i 一个编码块的失真率之和来表示重建图像的失真率,则重建图像的失真率 为:d = y d l 2 ”。由于截断点的选择可以在每一个编码块压缩完成后进行,因而这 种优化截断方案被称为后压缩率失真优化p c r d 算法。 1 3 2 质量层和封包流 对每个编码块的位元流而言,嵌入式块编码算法在每个p a s s 所产生的位元流 后面,假想成有一个切断点,故此编码块又很多切断点,然后再由p c r d 算法来决 定这些切断点中,哪些是有效的切断点,如果被确定为有效切断点,则此切断点将 会有一个贡献程度( c o n t r i b u t i o ns l o p e ) 。每个编码块经过p c r d 算法处理之后, 嵌入式块编码算法将全部编码块的位元流包装成若干个封包流( p a c k s t r e a m ) 输出层( l a y e r ) 送出。每个输出层将分别从每个编码块中取一小部分位元流,故此 输出层将会从全部编码区块中,各取其编码块中一小部份的位元流。在此输出层 中,每个一小部份的位元流称为贡献( c o n t r i b u t i o n ) ,而此一小部份位元流的长 度称为贡献长度。比如说,假设全部有7 个编码块,则此输出层将从7 个编码块中各 取其中的一小部分位元流,此输出层共就有7 个一小部分位元流,也就共有7 个贡 献。最简单的封包流形式如图1 4 所示。 图1 3 所示的每一个编码块都在一个固定的分辨率上,所以这种简单的封包 形式具有分辨率可伸缩性( r e s 0 1u t io ns c a l a b le ) ;同时,因为每一个编码块只影 响图像的一个区域,所以此封包形式还具有一定的空间可伸缩性( s p a t i a l 硕士学位论文 s c a l a b l e ) 。这样,如果对给定的一个空间域感兴趣,就可以把其对应的编码块识 别出来,然后进行相应的处理。 图1 4 所示的封包格式中每一个编码块都是嵌入式表示的,但它并不支持失 真率可伸缩性( d is t o r t i o rs c a l a b l e ) 。 霎q 层 q 。 0 蘸j e 硭罐拦铲2 6 ) ;“”开日争“” 挲撵:翠鑫警曲 麟:戤澍酽“ 码 图1 4j p e g 2 0 0 0 中的质量层提取结构 为了解决这个问题,e b c o t 算法中引入了质量层提取( q u a l i t yl a y e r a b s t r a c t i o n ) 的概念,如图1 4 所示。第一个质量层q 0 由不同编码块的一小部分 位元流组成,长度是e 2 。j ,对应的最小失真率是:d 。d ,总长度受限于: 叫2 7 r 一:之后的很多封包层q 。,同样由不同编码块的一小部分位元流组 f 成,但这部分位元流的贡献程度已不同,其长度是:4 2 ,对应的最小失真率 是:d = d 1 ,长度受限于:墨一r sp 一。需要强调的是,一些编码块在某一 i r 层中可以为空,例如在q 0 中,b 5 就没有位流包含在其中,这样,由质量层结构构成 的位元流形式具有失真率可伸缩性,所以编码后的压缩数据就具有渐进传输的性 质。 1 3 3j p e g 2 0 0 0 中的r o l 编码 基于感兴趣区域的图像编码是j p e g 2 0 0 0 静止图像压缩标准所采用的技术 “。j p e g 2 0 0 0 标准引入了小波变换,用小波变换将一幅图像分解为高频和低频 子带。在小波分解以后每个子带又被分解为长方形图像块,包含一个图像块中某 一频带的所有编码系数的集合称为图像编码区域。每个区域被划分为更小的块, 这个块称为代码块。在一个图像编码区域中所有在空问上相互连系的代码块集合 图像元素 ll 写于丁习三三= = = = = = = 编码数据流 j一、 + i 图像编二区域口吕三 号三;三三三刍包 代码块 口七二代码块 尺寸大小为m n 的区域与置一1 级分解中位于 2 i ,2 j l 尺寸大小为2 m x 加的区域相 互关联。当一幅图像通过图像编码区域之间的关系进行压缩的时候,那些包含图 3 和第4 层中。这样位于前面两个图层就放在了编码数据流的前面,感兴趣区域 图层 图层 目圉目圈 亘圉国网 图层l 图层2 图层3 图层4 空豳空一 空一空圈 亘空目空 目空亘空 ( a )( b ) 图1 6j p e g 2 0 0 0 的r o i 编码包处理方法 硕士学位论文 1 3 4 一般位移法( g s b m ) 和最大位移法( m a x s h l f t ) j p e g 2 0 0 0 标准定义了两种r o i 技术:最大位移法和一般位移法【l 儿”。其中, 一般位移法被j p e g 2 0 0 0 第二部分所采纳,此方法是将背景的比特面移位至不重 要的比特面位置,这样编码时先对感兴趣区域编码,然后再编码背景区域,只要 在背景编码前停止那么背景就被去掉,从而实现r o i 的无损压缩。最大位移法 被j p e g 2 0 0 0 第一部分所采纳,它是一般位移法的特殊情况,即在背景跟感兴趣 区域没有重叠的时候,只要选择合适的缩放比例s 就可以将r o i 与背景全部分 离。两种方法对r o i 与背景系数处理方法如图1 7 所示: 滁b ( a ) 铷鞋朔多法 r o t 圈m 匿s 毯颡圈田匪旺珏丑丑l 丑s b ( b ) 最大位移法 图1 7r o i 移位操作其中s 为移位尺度值 r o i 系数 背景系数 使用r o i 后,j p e g 2 0 0 0 的主要编码过程改变为: 1 ) 对数字图像进行离散小波变换; 2 ) 选择感兴趣区域( r o i ) ,创建r o i 掩膜,确定属于r o i 范围内的小波系数, 并确保使用这些小波系数可以良好的重构感兴趣的区域; 3 ) 量化小波系数; 4 ) 根据r o i 范围值,缩减该范围以外的小波系数,从而达到压缩的目的; 5 ) 对剩下的小波系数进行熵编码。 在最大位移法中必须选择合适的尺度值s 使得背景区域和感兴趣的比特面没 有一点重叠。假如我们选定一个尺度值s 。,那么对于任何s ,s 。也是最大位移法 的一个合适的尺度值,s 的选择要足够大。为了保证能这样实现,假设m 。是一幅 图像经过小波变换后每个子带s 中最大的比特平面幅度值,那么我们定义一个 合适的尺度值s 如下: s = m a x ( m ,) 在这里这个s 值不决定于被选择的r o i ,而只与每个小波变换子带的原始图 像的比特面幅值和量化器的量化步长有关系。 一般位移法和最大位移法都要用到r o i 掩膜,r o i 掩膜是一个比特面用于确 定一幅图像中的感兴趣区域小波系数。其定义如下: m ( x ,y ) = 1 表示小波系数是r o i 系数,比较重要: m ( x ,y ) = 0 表示小波系数是背景系数,相对不重要,可以牺牲此处的精度。 对于一般的感兴趣区域比如长方形、正方形、圆形等规则的感兴趣区域的掩 膜生成方法在很多研究文献中都已经有很多介绍,本文将提出一种任意形状r o i 掩膜的生成方法。在此,我们使用回溯法来生成r o i 掩膜。回溯法是和小波变换 具体过程相联系的。对编码器来说是知道r o i 所在的位置的,然而要找到变换后 的r o i 系数就必须考虑解码器是如何工作的。在小波逆变换的最后一步是将两个 子带合成一个,回溯这个过程,就能找到这两个子带中哪些系数和感兴趣区域像 素有关。回溯上一步,是把四个子带合并成两个子带的过程,就可以找到这四个子 带中的重要系数。如此回溯所有的步骤,就可以得到掩膜。以w o m a n 图像为例, 选择感兴趣区域为其脸部,变换为3 次,其掩膜生成步骤如图1 8 所示: 图18w o m a n 回溯法掩膜生成步骤 1 4r o l 编码方法的研究现状 在幅图像中实现感兴趣区域比背景区域更高质量的编码是j p e g 2 0 0 0 标准 的新特性之一“。重建图像的一个特定区域在背景之前是非常有用的,这种方法 已经被用到了很多方面,比如图像数据库、远程医疗及网页浏览等等。现在也有 很多有关这些方面的技术已经被用到基于感兴趣区域图像编码。j p e g 2 0 0 0 目前 支持两种用于感兴趣区域编码的方法即一般的基于尺度的方法( g s b m ) 和最大位 移法( m a x s h i f t ) “。 一般的基于尺度的方法( g s b m ) 是将那些与一个感兴趣区域( r o i ) 有关的 系数全部都提升使这些系数的比特面位于更高的比特平面。考虑到j p e g 2 0 0 0 编 码数据流的阶梯性结构,我们将那些上移后的比特面放在那些与背景有关的比特 面最后的比特数据流的前面。根据所选择的尺度值,一些r o i 系数的比特流可能 和背景系数一起编码。在解码器端,感兴趣区域先于图像的其它部分而被先解码, 因此,如果图像在解码过程中或在编码处理过程中被截断,那么r o i 将比背景区 域有更高的质量。但是在编码开始之前,必需产生一个掩膜。这种方法最大的缺 点是需要编码和传输图像感兴趣区域的形状信息。这样不仅增加了计算复杂度同 时增加了比特率。 最大位移法( m a x s h i f t ) “”能很好的按比例增加与感兴趣区域有关的系数, 使这些系数的比特面很好的高于背景区域系数比特面,这样在编码器端就不需要 生成掩膜信息。在最夫位移法( m a x s h i f t ) 中,根据选择的尺度值s 在解码器端 将非零的r o i 和背景系数区别开来,对于系数幅度值小于5 比特面的均属于背景 0 硕士学位论文 区域。因此,不需要精确的传输r o i 的形状信息。这种方法的缺点是不可能区分 r o i 和背景系数的重要性关系,这样在每个子带中,只要有一个r o i 产生,背景 系数就不能被收到直到r o i 被完全编码。另外,这种方法对于多个感兴趣区域不 能有不同尺度值的,这样就不能定义这些不同的r o i 的优先级别。 针对如上方法的缺点,于是人们提出了一种更灵活的方法来定义r o i 。这种 方法称做为逐个比特面位移法( b b b s m f t ) 阻3 ,它能够支持任意形状的r o i 编码。 而且可以对不同的r o i 提供多的尺度值,这样就克服了最大位移法中对所有的 r o i 都使用同一个尺度值一次进行位移。但是这种方法也有个缺点,就是它不能 完全兼容当前j p e g 2 0 0 0 的r o i 编码定义。为了能够用到b b b s h i f t 方法,一种新 的编码模型必需被添加到j p e g 2 0 0 0 标准中。但在现在这还不是很实际,于是一 种类似的方法被提出来,称为部分重要比特面位移法( p s b s hj f t ) “。这种方 法结合了j p e g 2 0 0 0 中两种方法的优点,可以支持任意形状的r o i 编码而且不需 要编码形状信息,并且这种方法能够在r o i 和背景编码过程中弹性的调整他们的 压缩质量。虽然p s b s h i f t 有很多优点,然而还是不能完全与j p e g 2 0 0 0 标准兼容。 1 5 论文的主要工作及安排 本文根据国内外在感兴趣区域图像编码技术方面的研究现状,把结合 j p e g 2 0 0 0 本身编码特点的感兴趣区域编码方法和实现图像多个感兴趣区域编码 的多质量多区域的编码方法作为主要研究内容,是对研究生阶段研究课题成果的 总结,整个论文的主要工作及安排如下,共包括五章: 第1 章绪论。介绍了选题的背景、意义、j p e g 2 0 0 0 标准的概况、感兴趣区 域( r o i ) 编码的研究现状及论文主要的工作和安排。 第2 章小波变换及其在图像编码中的应用。介绍了j p e g 2 0 0 0 采用的小波 变换的基础理论及小波变换在图像编码中的应用。 第3 章小波感兴趣区域编码。介绍了两种基于小波变换的感兴趣区域编码 方法,同时对这两种方法进行了仿真,给出了仿真实验结果及结论。 第4 章r o i 及e b c o t 编码思想。介绍了j p e g 2 0 0 0 的核心算法e b c o t 的 算法思想,结合e b c o t 给出了基于e b c o t 算法的感兴趣区域编码方法。最后 进行了仿真实验并给出了结果和结论。 第5 章实现多兴趣区域多质量编码的算法。介绍了以往人们提出的实现多 个感兴趣区域编码的算法即混合比特面移位法和比特面分类移位法,针对这些算 法的不足结合j p e g 2 0 0 0 的编码特点提出了基于优先级的多个感兴趣区域无损压 缩方法。最后给出了仿真实验结果及结论。 最后,对本文的研究工作进行了总结和展望。 第2 章小波变换及其在图像编码中的应用 2 1 小波变换 j p e g 2 0 0 0 采用的是基于小波变换的比特面编码方法”】,小波变换是在傅立 叶分析的基础上发展起来的,它优于傅立叶分析的地方是它在空域和时域都是局 部化的,其局部化的格式随频率自动变换,作为能随频率的变化自动调整分析窗 大小的分析工具,小波变换已成功地应用在通信与语音处理中的信号处理、计算 机视觉、图像处理、模式识别、语音分析与合成等众多的领域1 6 】。 2 1 1 连续小波变换 连续小波变换是在短时傅立叶变换的基础上发展起来的,并且它克服了短时 傅立叶变换的信号分辨率问题,连续小波变换与短时傅立叶变换非常相似:连续 小波变换是利用信号与小波函数的卷积来实现,而短时傅立叶变换是利用与窗函 数的卷积来实现。另外,连续小波变换是由时域信号的不同段分别计算得到的。 连续小波变换的定义为:v ,o ) r 啦) ,o ) 的连续小波变换( 有时也称为积分小 波变换) 定义为: w t :( a ,扫) = l 口i 。1 “,o 砂( 等p ,口o ( z 1 ) 或用内积形式: w t :( a ,6 ) = ( ,础) ( 2 2 式中。n l “2 ( 等) 要使逆变换存在,p ( f ) 要满足允许性条件: c ,:学 ( 2 s ) 式中矿0 ) 是( t ) 的傅里叶变换。 这时,逆变换为 ,o ) 1e 从一o n ( 啪寄 4 ) c 。这个常数限制了能作为“基小波( 或母小波) ”的属于l z ( r ) 的函数y 的 类,尤其是若还要求 f ,是一个窝函数,那么妒还必须属于_ ( 尺) ,即y ( f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高级保育员技能证书考试笔试试题附答案
- 2025年爆破的试题及答案
- 2025年安全生产月试题题库(含参考答案)
- 大学生个人职业生涯规划书
- 在线授课经验分享与教学质量反思
- 1.1细胞中的元素和无机化合物课件-高一上学期生物苏教版必修1
- 受邀安全培训课件
- 晋中安全员b证考试及答案
- 宜昌安全员c证考试及答案
- 乡土文化课程教学设计及实施方案
- 2025年烟草专卖局公开遴选面试高分策略及模拟题答案
- 乳制品行业智能化奶源管理与追溯方案
- 医务人员职业道德准则(2025年版)全文培训课件
- 恒瑞医药2023ESG社会责任报告:关注员工成长共建美好家园
- 医院网络信息安全培训
- 《构成设计基础》全套教学课件
- 项目初步验收汇报
- 2025年山东省济宁市电工等级低压电工作业(应急管理厅)真题(含答案)
- otc药品管理办法
- 康复医学科病历书写规范与质量控制
- 商用厨房设计汇报
评论
0/150
提交评论