任务书及评语-李立峰.doc

DZ197JPEG2000感兴趣区域算法的研究

收藏

压缩包内文档预览:
预览图 预览图 预览图
编号:512179    类型:共享资源    大小:428.23KB    格式:RAR    上传时间:2015-11-11 上传人:QQ28****1120 IP属地:辽宁
6
积分
关 键 词:
毕业设计
资源描述:
DZ197JPEG2000感兴趣区域算法的研究,毕业设计
内容简介:
中北大学分校学位论文(设计) I 摘 要 JPEG2000 是联合图像专家组于 2000 年底制定的新一代静态图像压缩编码标准。传统的 JPE6 标准相比, JPEGZ000 标准采用了离散小波变换、内嵌编码等技术,从而具有了渐进传输、感兴趣区域压缩、抗误码等新特性。 论文介绍了 JPEGZ000 标准。给出了 JPEG2000 标准的理论基础,按功能模块分析了其编码解码系统,并进行了仿真实验,与 JPEG 标准的压缩性能进行了比较。重点研究了 JPEGZ000 标准的感兴趣区域特性,该编码处理方法可以将用户感兴趣的图像区域7 与背景区域区别开来,并实现对前者优先、 优质的编码操作。详细讨论了标准第一部分采纳的最大平移法的编码原理,进行了仿真实验,对实验结果进行了比较和分析。针对最大平移法不能控制感兴趣区域和背景区域重建图像相对质量的不足,又进一步设计并实现了两种改进算法 :最重要平移法和逐个平移法。实验结果证明,这两种改进算法具有最大平移法的优点,即不需要对感兴趣区域的形状信息进行编码和传输,同时又克服了最大平移法的缺点,实现了对感兴趣区域和背景区域压缩质量的灵活调整。 关键词: 图像压缩; JPEG2000;感兴趣区域;小波变换 ntsJPEG2000 感兴趣区域算法的研究 II The Format Criterion of Masters Degree Paper of DUT Abstract JPEG2000, the new ISO/ITU.T standard for still image encoding, had been finished at the end for 2000.Compared with the JPEG standard adopts some different compress technique, such as Discrete Wavelet Transform, Embedded Coding and so on. So it has better compress performances, including progressive Display, Region of interest (ROI) encoding. Firstly, JPEG2000 standard is introduced, including the basic theory and every module in its encoding/decoding system. The programming results are analyzed and compared with those of the JPEG standard. Then, the research of ROI is mainly involved, which allows the ROI to be coded with better quality than the background of an image. The MAXShift method in adopted in JPEG200 part I. For MAXShift method does not have the flexibility to select a scaling value to define the relative importance of the RIO and the background wavelet coefficients, two new methods are realized; Most Significant Bit place shift method and Bitplane.by.Bitplane shift method. The programming results prove that the two improved methods support both arbitrary ROI shape and arbitrary scaling without shape encoding. Key Words: Image Compression; JPEG2000; ROI; Wavelet Transformation nts中北大学分校学位论文(设计) III 目 录 摘 要 . I Abstract . II 1 绪论 . I 1.1 研究的背景 . 1 1.2 研究的目的和意义 . 1 1.2.1 研究的目的 . 1 1.2.2 研究的意义 . 3 1.3 国内外研究现状 . 3 1.3.1 国内研究现状 . 3 1.3.2 国外研究现状 . 4 2 用 JPEG 开发的优点和存在的问题 . 6 2.1 JPEG2000 的优点 . 6 2.3 JPEG 的主要特点 . 7 2.4 JPEG 的发展 . 8 3 JPEG2000 核心部分技术的研究 . 10 3.1 预处理 . 10 3.1.1 图像片 . 10 3.1.2 DC 移位 . 10 3.2 图象压缩的性能评价 . 11 3.2.1 图象压缩的基本概念 . 11 3.2.2 图象压缩的类型 . 12 3.3 图象质 量的判断标准 . 14 3.3.1 压缩比 . 15 3.3.2 解码图象质量 . 15 3.4 核心处理 . 18 3.4.1 小波变换 . 18 3.4.2 量化 . 18 3.4.3 熵编码 . 19 4 JPEG2000 感兴趣的区域经典算法及改进 . 21 4.1 JPEG 感兴趣区域算法存在的问题 . 21 ntsJPEG2000 感兴趣区域算法的研究 IV 4.2 一般位移法和量化位移法 . 23 4.2.1 一般移位法 . 23 4.2.2 最大移位法 . 23 4.3 结果仿真及分析 . 25 结 论 . 29 参 考 文 献 . 30 附录 A 相关程序 . 32 nts中北大学分校学位论文(设计) 1 1 绪论 1.1 研究的背景 JPEG是 20世纪 80 年代末由 ISO/IEC制定的静止图像压缩标准 ,现在随着多媒体和网络的发展,图像压缩技术的应用范围越来越广,人们对图像质量和图像功能的要求越来越高,这些变化要求压缩编码算法具有高效率性、灵活性和互换性。 图像压缩可分为有损压缩和无损压缩,它是实现图像数据传输和存储的核心技术。目前在图像压缩这一领域中的研究一直是以满足容量更小,传输速度更快,图像质量更高为目的的。但是由于压缩比和重建图像质量的相互制约,想要一幅图像同时在这两方面都获得最佳效果是无法实现的,在图像的实际应用上,人们往往只对一幅图像中的某一特殊的部分感兴趣。在许多数字图像应用的领域中,需要的 并不是整个清晰的图像,而只是需要图像中某一(或某几个)特定位置处于无损压缩的状态。例如,在图像通信中,通信双方对人物头区域感兴趣 ;对拍摄的军事侦察图像,指挥官只对其上的打击目标感兴趣,而对大地背景信息并不感兴趣,大地背景信息属于背景区域,是可以对其进行有损压缩的;对于医学图像,医生只对病变部位区域感兴趣;而一个网上购物者则仅仅只对网页中商品物有兴趣,等等这些都是感兴趣区域编码应用的范围。如果能在整幅图片中指定一块感兴趣区域,然后在压缩时,对该区域采用低压缩比的压缩,甚至是无损压缩以获取较好的图像压缩效果,而 其他区域采用高压缩比的有损压缩,这样既能满 足人们对图像的要求,又能降低传输时间,节省存储空间。也就是说,在一幅图像内实现多种质量的压缩。这就是我们所说的感兴趣区域 (Region of Interest ROI)编码技术。 1.2 研究的目的和意义 1.2.1 研究的目的 JPEG2000是新一代的静止图像标准,和 JPEG 相兼容,但不是用来代替它。 JPEG2000与 JPEG 最大的不同就是,放弃了 JPEG 所采用的以离散余弦变换 DCT(Discrete Cosine Transform)为主的区块编码方式, 而改用以离散小波变换 DWT(Discrete Wavelet Transform)算法为主的多解析编码方式,采用当前最新的嵌入式编码技术,在获得优于目前 JPEG标准压缩效果的同时生成的码流具有较强的可截断功能,以期望在至少 10年的时间内占据标准压缩领域的领先地位。以其在高端应用和成像设备上表现出的优异性能,开拓图像压缩尚未涉足的市场。其主要优势有以下几个方面: ntsJPEG2000 感兴趣区域算法的研究 2 低码率下的高压缩性能传统的 JPEG标准在中、高比特率下提供了比较好的率失真 (Rate.Distortion)性能,但是在低码率条件下(比如对于细节丰 富的灰度图像使用低于 0.25bit/s 的码率),它提供的主观图像质量往往令人无法接受,存在显著的方块效应。 JPEG2000将提供低码率下的超级性能,并且在码率下降的同时率失真性能仍能保持最优,这对于有限的带宽资源来说是很有现实的应用价值。同时支持有损压缩和无损压缩 JPEG2000在图像压缩时,使用 LeGall(5,3)小波滤波器和 Daubechies(9,7)小波滤波器。 LeGall(5,3)小波滤波器为从整数到整数的变换实现无损压缩,这对于那些需要精确保存原始图像的细节信息的图像(例如医疗图像和建筑图像) 是比不可少的;另外JPEG2000也支持使用 Daubechies(9,7)小波滤波器,为实数到实数的变换,实现有损压缩,适合于那些不需要高精度的保存原始图像细节信息的图像(例如印刷、扫描等的图像)。而且,在一个 JPEG2000 码流中,可以同时存在有损压缩和高性能的无损压缩数据,并且对图像的无损恢复可以利用层进式解码自然得到。 渐进传输 传统的图像在网络中传输显示时是逐行显示,而 JPEG2000 压缩的图像文件在网络中传输时,是首先传输图像的轮廓,然后逐步显示图像的细节信息,即图像的显示是一个有不清楚到清楚,逐 渐清晰的过程。这对于客户在浏览互联网上的图像时,带来很大的便利,但从图像的轮廓发现不感兴趣时,客户就可以终止图像的传输,从而节约带宽,节省等待时间。 感兴趣区域 ROI( Region Of Interest)的支持 JPEG2000容许用户在浏览图像时,定义自己感兴趣的区域,对该区域进行优先传输和高精度显示。用户不仅可以使用比图像其它部分小的多的失真对该区域进行压缩,而且可以在压缩情况下对该区域进行翻转、缩放等几何操作,提供图像内容的描述 JPEG2000 在对图像的码流传输时,提供格外的关于图像内容的描述信息,通 过这个特性,就可以方便地建立关于图像的内容的数据库检索,从而使得图像检索在互联网搜索中成为可能。另一方面,这一特性对于一个很大容量的图像数据库的维护和检索来说,也是必不可少的。图像安全保护 JPEG2000容许通过水印、标签、冲压、指纹、加密和干扰等方式对数字图像进行保护。水印和指纹都是在图像内部设置的不可见标记,这对于现在互联网中普遍存在的盗版现象具有显示的应用价值;标签已经在 SPIFF 中实现,但必须易于和 JPEG2000 的图像文件一起传输;冲压时显示在图像上的标记,只能通过特殊方式清除;加密和干扰可以对全 部图像文件或者其中一部分进行,以避免对图像的未授权。 nts中北大学分校学位论文(设计) 3 1.2.2 研究的意义 本文把 JPEG2000标准的关键技术之一 ROI 区域处理作为研究课题,研究了大多数JPEG2000分析资料中很少提及的 ROI功能。同时研究了多区域多质量的图像压缩算法,期望通过研究与实现,来跟踪当代先进的图像压缩编码技术,为今后的图像压缩技术的进一步研究做准备。图像编码的一系列国际建议的提出标志着图像编码技术已经成熟,开始由大学的实验室走向产业化,其中包含着巨大的商业利益。图像编码技术的突破对IT技术的各个方面有巨大的影响,可以促 使现有信息产业的结构发生巨变。由于图像编码体系应用在于 IT技术的各个方面,具有很大的经济价值,成为各方面争夺的焦点,谁掌握了它就拥有了具大的利益。可以想象到掌握核心的知识产权带来多大的收益,目前我们应该多开发此类的核心技术,才能在将来的科技、经济竞赛处于有利位置 .感兴趣区域编码技术作为 JPEG2000 的核心技术之一可以解决图像交互处理、远程医疗、远程教育、远程测量,空间探索中出现的许多与图像处理有关的问题,这种技术可以推广应用到很多场合,从 Internet 应用到军事目标侦察;可以将感兴趣区域与加密技术结合, 限制图像某些区域的可见性;可以与版权信息结合,利用感兴趣区域在多次压缩传输中信息不会损失,从而对版权加以保护。在车牌识别系统中,由于现有的车牌识别率不是很高,因此一般要结合整个汽车的图像来进行识别,而整个汽车图像的数据量非常大,必须压缩存储和传输。如果采用 ROI编码,对车牌号进行高精度的编码,而对整个汽车的图像进行高压缩率低精度的编码,则可以实现在较小数据量情况下实现高精度的车牌识别。在视频会议系统中,一般感兴趣的只是参与开会的人的图像,而对其背景部分并不是很感兴趣,因此我们就可以把参加会议的人的图像设为是 感兴趣区域,其余为背景,采用感兴趣区域图像编码技术对其进行相应处理。该方法可以大大降低带宽的需求,推动视频会议的发展。这将是我们今后随着研究的进一步深入而逐步应用到具体实践中的,在互联网迅速发展的今天,有着实际的研究意义和价值。也就是说,感兴趣区域编码有着非常广阔的应用空间和发展前景。 1.3 国内外研究现状 1.3.1 国内研究现状 目前,对 JPEG2000 压缩算法的并行算法研究,国内外从软件方面考虑主要集中以下几个方面:在针对如何在一个单时钟周期内实现两个位编码的 EBCOT(Embedded Block Coding With Optimized Truncation)体系的并行化研究,其研究的重点主要集中在JPEG2000 中最复杂的部分 EBCOT 的 Tier.1 编码,因为 Tier.1 编码包含了大量的计算负ntsJPEG2000 感兴趣区域算法的研究 4 载,所以针对 EBCOT 国内外提出了许多种体系结构,并且大部分也已经在实际的应用中被采用,所有的这些方法采用的是 JPEG2000 的缺省模式,或者称之为串行模式与并行模式的并存模式,除此之外,还有基于图像压缩过程中如何提高内存利用率的并行,这主要是通过使用 RESTART、 RESET 和 CAUSAL 三个模式选择, 从而得到减少JPEG2000 编码器的内存利用,特别是减少子带数据占用的内存。另外还有基于如何把位平面和双通过程并行化 BPDP( Bit.plane and Pass Dual Parallel)的系数位模式(Coefficient Bit Modeling)并行,这主要是利用并行的思想通过在一次扫描之内完成小数位平面 FBP( Fractional Bit.plane)编码而实现。此外在硬件方面,国内外还有利用并行的思想,使用超大规模集成电路( Very Large Scale Integration)实现 EBCOT 编码器。一种新的 VLSI 体系采用一种叫做动态内存控制( Dynamic Memory Control)策略来加速编码过程。针对位平面编码器提出了一种管道 VLSI 体系,在每一个通道 (Pass)过程中同时处理一列。然而,单纯地从图像压缩的时间长短的角度考虑,以图像压缩时间最少进行并行化的文章却比较少,本文正是基于这个角度出发,通过分析 JPEG2000 图像压缩算法的串行代码实现,从中要找出 JPEG2000 图像压缩技术中各个阶段中运算费时最长、计算量最大的部分来并行化,从而得到节约计算时间,满足图像压缩应用中实时性的要求。据悉,清华大学微电子研究所正在与美国 WIS 技术公司合作开发在 FPGA 中使用的运算器,该运算器将用于 JPEG2000 设备核心的画质无损 /有损过滤器。国内的一些相机制造商也在积极开发 JPEG2000 数码相机。上海海鸥相机公司现在已经达到年产60 万部普通百万像素解像 JPEG 标准数码相机的能力,该公司正在和一些世界顶级的JPEG2000 技术芯片供应商争取合作关系。凤凰光学仪器公司与北京大学遥感所合作,建立了一个数码相机压缩控制芯片及 CMOS 成像器的开发项目。围绕 这个课题内容,本文作者在毕业论文阶段主要作了以下工作: 对 JPEG2000 标准的串行算法进行讨论和分析; 设计实现基于小波变换系数块的并行算法; 对实现其它并行算法的实现进行讨论和分析。 1.3.2 国外研究现状 JPEG20000是静态图像压缩的最新国际标准。 JPEG全名为 Joint Photographic Experts Group,它是一个在国际标准组织 (ISO)下从事静态图像压缩标准制定的委员会即联合图片专家组。它制定出了第一套国标静态图像压缩标准:即 JPEG。由于 JPEG 优良的 品质,使得它在短短的几年内就获得极大的成功,目前在因特网上有百分之七十多的图像nts中北大学分校学位论文(设计) 5 都是采用 JPEG 的压缩标准。然而,随着多媒体应用领域的不断发展,传统的 JPEG 压缩技术已无法满足人们的需求。因此,新一代静态图像压缩技术 JPEG2000 就诞生了,它拥有更高压缩率以及更多的新功能。 JPEG2000 的制定始于 1997 年 3 月,直到 2000年 3 月,规定基本编码系统的最终协议草案才出台。“高压缩、低比特速率”是 JPEG2000的目标。在压缩率相同的情况下, JPEG2000的信噪比将比 JPEG提高 30%左右。 JPEG2000拥有 5 种层次的编码形式:彩色静态画面采用的 JPEG 编码、 2 值图像采用的 JBIG、低压缩率图像采用 JPEGLS 等,成为应对各种图像的通用编码方式。在编码算法上,JPEG2000 采用离散小波变换( DWT)和比特平面算术编码( MQ coder)。此外, JPEG2000码流还支持空间随机访问。随着 JPEG2000 标准的出台,参与开发的企业除了软件供应商越来越多以外,还有很多制造图像设备的硬件供应商,以及整个 IT 业界都看好JPEG2000。 ntsJPEG2000 感兴趣区域算法的研究 6 2 用 JPEG 开发的优点和存在的问题 2.1 JPEG2000 的优点 1992 年联合图像专家组 (JPEG, Joint Photographic Expert Group)推出了基于离散余弦变换 (DCT)的 JPEG 静态图像压缩标准 (ISO 10928)。该压缩标准一经推出就因为其优越的压缩性能而得到了各方面的认可,成为迄今为止应用最为广泛的图像标准之一。但随着多媒体技术和网络通讯技术的迅猛发展,人们对图像的压缩性能、处理灵活性、功能性等各方面也有了进一步要求。现有的 JPEG 图像压缩标准己经不能完全满足用户的需求。人们迫切需要一种压缩效果更加优越,支持更多图像格式,并能够提俱更多 新特性的静止图像压缩格式。于是联合图像专家组于 ZOQ。年 12 月推出了 JPEG2000 静态图像压缩标准。 JPEGZ000 与之前的 JPEG 相比具有以下优点 : (1)更高的压缩比 ; (2)同时支持有损和无损压缩 ; (3)支持多分辨率表示 ; (4)嵌入式码流 (逐渐显示解码和 SNR 可分级 ); (5)叠置 (TiLing); (6)感兴趣区域编码 (RQI, Rerest); (7)抗误码 ; (8)码流的随机存取和处理; (9)对多重压缩、解压缩循环的性能改造; (10)更灵活的文件格式。 为了达到以 上性能, JPEG2000 标准采用了许多新的压缩编码技术 .首先,不同于JEPG 标准中基于子块的离散余弦变换 (DCT), JPEG2000 标准采用了基于离散二维小波变换 (DWT).由于 DWT 自身具有多分辨率图像表示性能、而且可以在大范围内去除图像的相关性将图像能童分布更好地集中,一因此压缩效率得到了提高 ;其次,由于使用整数DWT 滤波器,在单一码流中可以同时实现有损和无损压缩 ;第三,通过使用均匀量化器实现嵌入式编码。对于量化系数各比特面进行基于上下文的自适应算术编码,这些由比特面提供的嵌入式码流同时又提供了 5NR 的 可分级性。进一步,每个子带的比特面被限制在独立的矩形块中,通过三次扫描完成编码,由此得到最佳的嵌入式码流、改进的抗误码能力和部分空间随机存取能力。 nts中北大学分校学位论文(设计) 7 JPEG2000 和 JPEG 相比优势明显且向下兼容,可广泛应用于网络通讯、无线通讯、医疗成像、遥感、打印、扫描、传真、数码相机等领域,取代传统的 JPEG 己经是指日可待。 JPEG2000 是一个基于小波变换的编码系统,它主要采用嵌入式方块编码方式。JPEG2000 的一大特色就是支持对感兴趣区域的编码,感兴趣区域可以获得比背景图像高得多的图像压缩质量。在 JPEG2000 的第一部分文献里,定义了 JPEG2000 感兴趣区域方法。它采用了一种叫做最大上移( MAXSHIFT)的算法。利用该算法,可以对任意形状的感兴趣区域进行编码,而不必保存感兴趣区域的形状信息,在解码时,也不必对感兴趣区域的形状解码。 JPEG2000 支持的感兴趣区域编码算法是基于对小波系数的放大( scale)。该算法的原则就是按比例增大( scale up)或上移( shift up)与感兴趣区域有关的小波系数 5,使它们能够位于较高的比特平面上。在接下来进行的嵌入式编码的编码比特流里,这些被上移的系数被放在非 感兴趣区域的小波变换系数前面。这样,感兴趣区域就会先于非感兴趣区域进行编码和细化。即使编码比特流被截断了,或者在对整幅图像完全编码之前终止了编码过程,感兴趣区域也会拥有比图像的其它区域高的逼真度。 在 JPEG2000 中,基于小波系数的按比例放大的方法主要有以下执行步骤 5.6: ( 1)计算小波变换; ( 2)若已经选定了感兴趣区域,则产生感兴趣区域掩模,来指明需要进行无损感兴趣区域重建的系数集合; ( 3)量化小波系数; ( 4)按一定比例缩小感兴趣区域掩模以外的小波系数值; ( 5)渐进熵编码,最重要的比特平面 优先编码。 2.2 JPEG 的主要特点 2.2.1 JPEG 的主要特点 ( 1)压缩比高,压缩的质量比较好,图像主观质量损伤难以察觉; ( 2)有多个参数,用户能得到所需要的压缩比和图像质量; ( 3)无论连续色调图像的维数、彩色空间、像素宽高比或其他特性如何,都能得到良好的压缩效果。 ( 4)处理的速度快,且有成熟的价格低廉的硬件电路的支持。 ntsJPEG2000 感兴趣区域算法的研究 8 2.3 JPEG 的发展 前面章节所介绍的 JPEG2000的标准只适用与静止的图像,随着 JPEG 标准的发展,制定出了许多的适应于不同动态图像的标准。例如: MPEG.1、 MPEG.2、 MPEG.4。 MJPEG 是指 Motion JPEG,即动态 JPEG,按照 25帧 /秒速度使用 JPEG 算法压缩视频信号,完成动态视频的压缩。是由 JPEG 专家组制订的,其图像格式是对每一帧进行压缩,通常可达到 6: 1 的压缩率,但这个比率相对来说仍然不足 。 就像每一帧都是独立的图像一样。 MJPEG图 像 流的单元就是一帧一帧的 JPEG画片。因为每帧都可任意存取,所以 MJPEG 常被用于视频编辑系统。动态 JPEG 能产生高质量、全屏、全运动的视频,但是,它需要依赖附加的硬件。而且,由于 MJPEG 不是一个标 准化的格式,各厂家都有自己版本的 MJPEG,双方的文件无法互相识别。 MJPEG的优点是画质还比较清晰,缺点是压缩率低,占用带宽很大。一般单路占用带宽 2M左右。 2.3.2 JPEG 的标准 (1)MPEG.1标准 MPEG.1是 ISO 开发的第一个视频压缩算法。可以提供最高达 1.5Mbps 的数字视频,只支持逐行扫描 。 主要应用是数字媒体上动态图像与音频的存储与检索,如速率为 1.15Mbps、采用 SIF 分辨率( 352(240 . 29.97fps 或者 352(288 . 25 fps)的 VCD。 ( 2) MPEG.2 标准 MPEG.2专门针对数字电视而开发,很快成为了迄今最成功的视频压缩标准。 MPEG.2 既能够满足标准逐行视频的需求(其中视频序列由一系列按一定时间间隔采集的帧构成),又能够满足电视领域常用的隔行视频的需求。隔行视频交替采集及显示图像中两组交替的像素(每组称为一个场)。这种方式尤其适合电视显示器的物理特性。 MPEG2 支持标准的电视分辨率,其中包括:针对美国和日本采用的 NTSC 制 式隔行 720(480 分辨率,每秒 60 场,以及欧洲和其他国家采用的 PAL 制式的 720(576 分辨率,每秒 50 场。 MPEG.2 建立在 MPEG.1 基础之上,并具备扩展功能,能支持隔行视频及更宽的运动补偿范围。由于高分辨率视频是非常重要的应用,因此 MPEG.2 支持的搜索范围远远大于 MPEG.1。与之前的标准相比,它显著提高了运动估计的性能要求,并充分利用更宽搜索范围与更高分辨率优势的编码器需要比 H.261 和 MPEG.1 高得多的处理能力。MPEG2 中的隔行编码工具包含优化运 动补偿的能力,同时支持基于场和基于帧的预测,而且同时支持基于场和基于帧的 DCT/IDCT。 MPEG.2 在 30:1 左右的压缩比时运行良nts中北大学分校学位论文(设计) 9 好。 MPEG.2 在 4.8Mbps 时达到的质量适合消费类视频应用,因此它很快在许多应用中得到普及,如:数字卫星电视、数字有线电视、 DVD 以及后来的高清电视等。 ( 4) MPEG.4 支持逐行扫描和隔行扫描,是基于视频对象的编码标准,通过对象识别提供了空间的可伸缩性; MPEG.4由 ISO提出,以延续 MPEG.2 的成功。一些早期的目标包括:提高容错能力以支持无线网、 对低比特率应用进行更好的支持、实现各种新工具以支持图形对象及视频之间的融合。大部分图形功能并未在产品中受到重视,相关实施主要集中在改善低比特率压缩及提高容错性上 ntsJPEG2000 感兴趣区域算法的研究 10 3 JPEG2000 核心部分技术的研究 3.1 预处理 3.1.1 图像片 在编码前,首先对源图像进行分割,分割成大小相等、相互不重叠的矩形块 tile(位于图像边缘的 tile 大小可以不同 ),这种分割有两种作用 :(1)以 tile 为基本单位独立编码,可以处理较大的图像,且可节省存储空间。 (2)可在图像特定位置截取出具有特定宽高比的重构子图。接 下来,将每个 tile 看成是小的源图像,分别进行图 3.2 所示的单独编码。 熵编码 预处理 图 3.1 JPEG 2000解码器 图 3.2 JPEG 2000解码器 3.1.2 DC 移位 在对每一图像片进行正向离散小波变换之前,都要进行直流电平位移。目的是在解码时,能够从有符号的数值中正确恢复重构的无符号样本值。直流电平位移是对仅有无符号数组成的图像片的像素进行的。如果无符号图像用 P 位二进制数表示,则对这些无符号分量样本值减去 Z 的 P.2 次方,电平位移并不影响图像的质量。在解码端,在离散小波反变换之后,对重构的图像进行反向直流电平位移。 前向 DC 电平位移 前向分量变换 前向小 波变换 量化 码率控制 分层组织嵌入 式码块位流 嵌入式码块编码 熵解码 反向 量化 反向小 波变换 反向分 量变换 反向 DC 电 平 位移 nts中北大学分校学位论文(设计) 11 3.2 图象压缩的性能评价 3.2.1 图象压缩的基本概念 在多媒体信息系统中,为了达到令人满意的图像、视频画面质量和听觉效果,必须解决视频、图像和音频信号数据的大容量存储和实时传输的问题。数字化的视频、音频信号的数据量是很大的,如果不进行处理,计算机几乎无法对它进行存取和交换。而,另一方面,视频、图像和声音这些媒体确实具有很大的压缩潜力,数据的冗余很大。因此,在允许一定的失真的前提下,能够对图像进行很大程度的压缩。 图像压缩编码的目的是以尽量少的比特数表征图像 ,同时保持复原图像的质量,使它符合预定应用场合的要求。通常把图像压缩的过程叫做编码,图 像恢复的过程叫做解码。 图像可以进行压缩主要是因为图像数据往往存在各种数据冗余。数据冗余是指图像信息本身所固有的冗余。它不是一个抽象的概念,而是一个在数学上可以进行量化的实体。信息论的鼻祖 C.E.shannon早在 1948年创立信息论的奠基性论文“通信的数学原理”中就提出了可以把数据看作是信息量和冗余度的组合这个基本原理。用 I表示信息量, D表示数据量, Rd表示冗余量,则它们的关系可山下式给出 :I=D.Rd,冗余的消除或减少是数据压缩的一个基本依据和理论基础。具体说来,图像信息本身存在以下一些冗余 ( 1)空间 冗余 这是静态图像中存在的一种最主要的数据冗余。一幅图像记录了画面上可见景物的灰度值,而同一景物表面上各采样点的灰度值之间往往存在着空间连贯性,即相邻象素间的关联会产生空间冗余。 ( 2)时间冗余 这是序列图像中经常包含的数据冗余。对于视频图像来说,相邻帧之间的时间间隔很小。在 1/25秒或 1/30秒的帧间间隔内,运动部分的景物在画面上的位移量很小或当场景交替时整幅景物切换的概率极小。大多数象素点的亮度及色度信号帧间变化很小或基本上不变。图像序列中前后两帧图像之间的时间相关性很大,这就产生了大量的数据冗余,称为 时间冗余。 ( 3)视觉冗余 人类视觉系统 (Human Vision system, HVS)是由人眼和大脑皮层的一部分组成的。它实际上是一个高度复杂的图像处理系统。由于人眼是图像信息的最终接收者,因此进行图像压缩时我们应该而且必须考虑人眼的特性。通常人们总是假定视觉系统是线性的和均匀的,对于人眼视觉敏感和不敏感部分都同等对待,这必然会有许多冗余信息。事ntsJPEG2000 感兴趣区域算法的研究 12 实上人类视觉的一般分辨能力为 26灰度等级,而一般图像的量化采用的是 28灰度等级,即存在视觉冗余。有效利用 HVS特性可以得到很高的图像压缩比和较好的图像质量。W.E.Glenn经过分析认为充分利用 HVS特性能够得到 40.100倍静止图像压缩比,对运动图像则会更高,这是一个非常诱人的目标。 ( 4)信息熵冗余 信息熵是信源的平均信息量。当信源以等概率分布时,熵取最大值。熵最大值与非等概率分布时熵值之间的差值就是信源含有的冗余度,我们称之为信息熵冗余。这种冗余度寓于信源符号的非等概率分布之中的特性是数据压缩的基本途径和重要方法之一。设法改变信源的概率分布使其尽可能的不均匀以达到数据压缩之目的,这是统计压缩编码的理论基础。 ( 5)结构冗余 有些图像在较大的区域存在很强的纹理 结构,如草席、纺织物的图案等。如果已知这些纹理的分布模式,就可以通过某一过程生成图像。 ( 6)知识冗余 对许多图像的理解、分析、综合与一些基础知识相关。对于某些图像内容确定的特定场合,可由先验知识、背景知识一类规律化的结构,建立图像景物模型。这类冗余称为知识冗余。例如模型基编码 (Model.based decoding)用计算机视觉、计算机图形学的知识,按照可视电话中图像和景物的先验知识,建立一定的模型,用图像分析的方法,提取景物的参数,通过图像综合。将参数和模型结合,获得重建图像。 3.2.2 图象压缩 的类型 对图像信息中不同冗余的利用,产生了不同的图像压缩方法。根据解码后数据与原始数据是否完全一致进行分类,图像压缩编码方法大体上可分为两类 :无失真压缩编码和有失真压缩编码。 无失真压缩编码 无失真压缩编码又叫熵编码。是指使用压缩后的数据进行解码,解码后的数据与原来的数据完全相同,无失真压缩编码算法删除的仅仅是冗余信息,它用于重构信号与原始信号完全一致的场合。例如为了传送文本,在传送之前采用 Winzip等软件进行压缩,这就是无损压缩编码。它将输入图像中表达象素点灰阶的值的每个符号,用规定的码字符号按一定的 方式编排而成。由于规定的码字符比原图像的符号短,从而可以用较少的比特数表达原图像的符号,达到图像压缩的目的。在恢复图像时,只要把码字符与象素点的灰阶符号对应起来,就可无失真地恢复图像。例如一个静态图像 A,由 512x5I2 个nts中北大学分校学位论文(设计) 13 象素组成,象素上的灰阶用 8比特字符表示,即有 256 种可能的符号。如果我们分析每个符号出现的概率,把概率出现大的符号用比 8比特短的码字符表示 (如 2比特 )。而概率出现少的符号用较长的码字符表示 (如 10比特 ),这样,平均每个码字符长度 (比特数 )就比 8比特小。但由于无失真压缩技术在原理上大多采 用概率统计编码。因而一般对在内容上重复较多的数据压缩倍数较大,而对没有重复或重复较小的数据,压缩倍数就较低。由于受到信源本身熵的限制 (编码输出码字的平均码长,只能大于等于信源熵 ),无失真压缩编码不可能取得高的压缩比,一般平均压缩比在 2:1一 5: 1之间。常见的无失真编码方法有 :行程编码、哈夫曼编码、算术编码等。其中行程编码技术相当的直观和经济,运算也相当简单。它的基本的原理是:用一个符号值或串长代替具有相同值的连续符号,使符号的长度少于原始数据的长度。它经常用于二值图像,可以得到良好的压缩比。 有失真压缩编 码 为了进一步提高图像编码的压缩比,通常采用有失真编码方法。有失真编码方法是指使用压缩后的数据进行解码,解码后的数据与原始数据有所不同,把不相干的信息也删除了,但不影响人对原始资料表达信息的理解。因为人类视觉系统的特殊性,它接受信息的能力是有限的,对图像中存在的许多“错误”并不敏感。例如人眼不能分辨太高的灰度级和空间分辨率,对图像中的某些信息损失并不能觉察。即使是记录或显示设备,也往往受本身特性限制,只能接受某种程度的信息量,而并不能全部接受,如电脑监示器的灰度特性、空间分辨率都是有限的。此外,数字图像是二 维亮度函数通过采样和量化而得到的,因
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
提示  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:DZ197JPEG2000感兴趣区域算法的研究
链接地址:https://www.renrendoc.com/p-512179.html

官方联系方式

2:不支持迅雷下载,请使用浏览器下载   
3:不支持QQ浏览器下载,请用其他浏览器   
4:下载后的文档和图纸-无水印   
5:文档经过压缩,下载后原文更清晰   
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

网站客服QQ:2881952447     

copyright@ 2020-2025  renrendoc.com 人人文库版权所有   联系电话:400-852-1180

备案号:蜀ICP备2022000484号-2       经营许可证: 川B2-20220663       公网安备川公网安备: 51019002004831号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!