（信号与信息处理专业论文）jpeg2000码率控制算法研究.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-14 格式：PDF 页数：81 大小：393.48KB 积分：0 举报 版权申诉

已阅读5页，还剩76页未读，继续免费阅读

（信号与信息处理专业论文）jpeg2000码率控制算法研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

上海交通大学硕士学位论文摘要 i jpeg2000 jpeg2000 码率控制算法研究码率控制算法研究摘要摘要 jpeg2000静止图像压缩标准和motion-jpeg2000运动图像压缩标准具有压缩效率高、抗误码能力强、码流渐进传输等优异的压缩特性，将得到越来越广泛的应用。码率控制是jpeg2000和motion-jpeg 2000编码的重要过程，其算法的优劣直接决定着整个编码效率的高低和压缩图像质量的好坏。因此，研究并提出更为高效的jpeg 2000码率控制算法，以减少编码计算冗余、提高编码速度和减少内存资源消耗，对于图像和视频的jpeg2000编码软硬件实现都具有重要的现实意义。对于jpeg2000编码，本文首先详细叙述了jpeg2000压缩标准的主要编码过程，以及图像编码码率控制的基本理论。这部分是进一步讨论jpeg2000的码率控制问题的背景知识和相关理论基础。然后，本文较为全面地介绍了jpeg 2000码率控制的两种机制，以及标准推荐的压缩后率失真优化算法，并分析了该算法存在的编码效率低、计算冗余大的缺点。最后，在充分分析目前学者提出的一种较有效的码率控制算法的基础上，针对其存在着编码图像质量下降的不足，本文提出了一种更为高效的算法：改进的联合熵编码和率控制算法virec (variable number-of-passes integrated rate-control and entropy-coding), 上海交通大学硕士学位论文摘要 ii 该算法根据各个码块所在子带的能量权重系数的大小，选择不同的每次熵编码编码通道数，在熵编码的同时进行码率控制，可在保证压缩图像质量的同时提高一定的编码效率。对于motion-jpeg2000，本文主要研究了恒定码率编码（cbr）和可变码率编码（vbr）两种方式下的码率控制算法问题。本文首先较为详细地叙述了几种典型的cbr算法和vbr漏桶算法，并且具体实现和验证了motion-jpeg2000的两次扫描vbr编码。为提高motion- jpeg2000的编码效率，本文提出了两种较为有效的码率控制算法： seuca （slope estimation using correlation algorithm）和lasd （leak- bucket algorithm with scene-change detection）。seuca算法利用帧间相关性，使用前一个已编码帧的率失真斜率值估计当前帧的率失真情况，并结合使用irec ( integrated rate-control and entropy-coding )和 eirec算法 ( enhanced integrated rate-control and entropy-coding )进行编码，可以有效地提高cbr编码的编码效率，降低编码计算冗余。 lasd算法通过场景切换检测将视频序列合理地划分为若干个场景图像组，先为每个场景图像组分配对应的平均码率，然后再进一步为图像组中的每帧图像分配各自的编码码率。此时缓冲区里的样本帧编码情况可以表征更加广泛的图像帧，因而各帧的码率分配更加合理，可以取得图像质量更为恒定的vbr码流。为验证上述的几种码率控制算法的性能，论文将其与其它比较典型的算法进行了多方面的分析和比较，理论分析和仿真实验的结果均表明本文所提出的算法编码效率更高，编码性能更好，比较有利于图上海交通大学硕士学位论文摘要 iii 像和视频编码的实际应用。另外，seuca 算法中利用帧间相关性来提高编码效率，lasd 算法中两级码率分配和使用双缓冲区分别进行码率控制的思路对于其它标准的视频压缩也具有一定的参考意义。关键词：关键词：jpeg2000，motion-jpeg2000，码率控制，率失真优化上海交通大学硕士学位论文 abstract iv research of rate control algorithms for jpeg2000 abstract jpeg2000 and motion-jpeg2000 have a very large potential application fields due to their excellent compression performance and many attractive features. rate control is a very important part in jpeg2000 encoding. the more efficient a kind of rate control algorithm is， the higher coding efficiency, and the better image quality. therefore, it is significant for jpeg2000 codings software and hardware solution using more efficient rate-control algorithms. in terms of jpeg2000 coding, jpeg2000 standards major coding step and classic rate-distortion theory are firstly described in the dissertation, and this is the background knowledge of jpeg2000 rate-control. then, two rate-control mechanisms and the rate control technical recommended by the jpeg2000 standard which is named post-coding rate distortion optimization are introduced in detail. the algorithm, however, has the disadvantage of high computation redundancy. in order to improve the coding efficiency, a more efficient rate control technical is proposed which is named with virec (variable number-of-passes integrated 上海交通大学硕士学位论文 abstract v rate-control and entropy-coding). the proposed algorithm chooses the number of coding-passes per entropy-coding according to the codeblocks energy-weight-factor, and performs entropy coding in conjunction with rate control. some simulations are carried out and the results show that the proposed algorithm can improve coding efficiency while maintains the compression image quality indeed. in terms of motion-jpeg2000, some rate control algorithms under constant bit-rate traffic and variable bit-rate traffic are introduced in detail in the dissertation. in order to improve the coding efficiency of motion-jpeg2000, two novel rate control algorithms are proposed: seuca（slope estimation using correlation algorithm） and lasd （leak-bucket algorithm with scene-change detection）. based on the correlation among the video frames, seuca algorithm can achieve efficient rate-control for constant bit rate traffic of motion jpeg2000. the proposed method enables significant savings in computation time, greatly increases the video encoding speed and consumes less resource. as for lasd algorithm, the video sequence must be divided into some scene groups-of- pictures at first, and then the bit-rate of every group is allocated. the bit-rate of every picture in some group is then allocated respectively. due to its optimum rate-allocation, lasd algorithm can achieve smoother quality for vbr codestream. both theory analyses and experiments demonstrate that the proposed 上海交通大学硕士学位论文 abstract vi algorithms could achieve higher coding efficiency compared with other typical ones. in addition, the idea that seuca makes use of the interframe correlation to improve the coding efficiency, and the idea that lasd divides the total rate allocation process into two stages and utilizes two buffers to control the allocation respectively can also benefit for other video compression standards. keywords: jpeg2000, motion-jpeg2000, rate control, rate-distortion optimization 上海交通大学硕士学位论文缩略语 72 缩略语缩略语 jpeg： irec： eirec： pcrd： ebcot： seuca： tcrc： sbrc： dbrc： r-d： dct： dwt： roi： ict： rct： msb： lsb： rdo： mse： ggd： psnr： psra： bpp： mpeg： cbr： vbr： gop： joint photographic experts group integrated rate-control and entropy-coding enhanced irec post compression rate-distortion optimization embedded block coding with optimal truncation slope estimation using correlation algorithm） terminal correlation rate control single buffer rate controller double buffer rate controller rate-distortion discrete cosine transform discrete wavelet transform region of interest irreversible component transform reversible component transform most significant bit-plane least significant bit-plane rate-distortion optimization mean squared error generalized-gaussian density peak-signal-to-noise ratio priority scanning rate allocation bit per pixel motion picture experts group constant bit rate variable bit rate group of pictures 联合图像专家组联合率控制和熵编码改进的 irec 算法压缩后率失真优化带优化截断的嵌入式块编码帧间斜率估计率控制算法间隔相关性码率控制算法单缓冲区码率控制算法双缓冲区码率控制算法率失真离散余弦变换离散小波变换感兴趣区域可逆分量变换不可逆分量变换最高有效位平面最低有效位平面率失真优化均方误差广义高斯密度分布峰值信噪比优先级扫描率分配算法比特/像素运动图像专家组恒定比特率可变比特率图像组上海交通大学上海交通大学学位论文原创性声明学位论文原创性声明本人郑重声明：所呈交的学位论文，是本人在导师的指导下，独立进行研究工作所取得的成果。除文中已经注明引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名：日期：年月日上海交通大学上海交通大学学位论文版权使用授权书学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定，同意学校保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密保密，在年解密后适用本授权书。本学位论文属于不保密不保密。（请在以上方框内打“” ）学位论文作者签名：指导教师签名：日期：年月日日期：年月日上海交通大学硕士学位论文第一章绪论 1 第一章第一章绪论绪论 1.1 引言 1.1 引言随着计算机和多媒体技术的飞速发展，人们获取的信息越来越广泛，需求的信息量越来越大。图像作为信息含量最丰富的载体之一是构成信息环境必不可少的要素，它在现代通信技术中所承担的作用已远远超过其它媒体。但图像的数据量非常大，为了有效地传输和存储图像必须对图像数据进行有效的压缩。 jpeg(joint photographic experts group)是20世纪80年代末由国际电话电报咨询委员会（ccitt）和国际标准化组织（iso）共同组成的联合图像专家小组制定的图像压缩标准。经过 jpeg 压缩的图像，不仅能达到很不错的压缩比，而且还可保持不错的图像质量，因此 jpeg 得到迅速的发展，并被广泛地应用于互联网、数码相机等领域。然而，随着人们对图像压缩性能、处理灵活性、功能性等多方面有进一步的要求，jpeg 标准因其固有的许多技术局限，越来越难以得到满意的效果。联合图像专家组于2000年制定出jpeg2000图像压缩标准1，以作为jpeg的后继者。jpeg2000采用小波变换和嵌入式熵编码，可以获得当今最先进的图像压缩性能。jpeg2000编码系统能够提供低码率条件下比当前jpeg标准更佳的率失真性能和主观图像质量，同时不牺牲其它方面性能。 jpeg2000不仅在压缩性能方面明显优于jpeg，它还具有很多jpeg无法提供或无法有效提供的新功能。比如，可以同时支持有损和无损压缩、大幅图像的压缩、码流的渐进传输、感兴趣区域编码、良好的抗误码性、码流的随机访问等。jpeg2000具有的各种出色特性，使得它的应用领域非常广泛，尤其在internet传输、无线通信、医疗图像等领域将具有诱人的应用前景。motion-jpeg20002运动图像压缩标准是jpeg2000标准的第三部分，其对视频序列的每一帧都采用jpeg2000标准进行压缩，然后将码流打包成mj2格式的文件。因为同样具有jpeg 2000码流的各种优异性能，motion-jpeg2000已经越来越广泛地应用于专业影视、网络视频和数码相机等领域。码率控制是jpeg2000和motion-jpeg 2000编码的重要过程，其算法的优劣直接决定着整个编码效率的高低和压缩图像质量的好坏。因此，本文将针对jpeg2000静止图像编码和 motion-jpeg2000的恒定码率及可变码率编码等几种情况的码率控制算法进行研究。上海交通大学硕士学位论文第一章绪论 2 1.2 选题背景与意义 1.2 选题背景与意义虽然jpeg2000标准具有许多优异的压缩特性，但其采用的核心算法小波变换和算术编码都具有很高的计算复杂度。并且，其推荐采用的码率控制算法pcrd1是一种压缩后率失真优化算法，存在着计算冗余和内存资源消耗较大的缺陷，难以适应实时性要求高和资源有限等图像和视频编码应用。事实上，如果采用pcrd码率控制算法对同一幅图像进行jpeg 2000压缩，无论比特率是多少(例如1bpp或0.125bpp) ,整个编码的复杂度和所需时间几乎相差不大，很大一部分计算量和存储量对于最终码流来说都是冗余的。针对该问题，如何减少编码计算冗余，提高编码速度，并降低资源消耗等已经成为jpeg 2000编码应用中的重要研究课题。因为jpeg2000码流是嵌入式码流（embedded codestream），具有良好的可伸缩性，码率的控制和调整可以容易地通过截断和选择已编码码流来实现，即在一定码率限定下，为使得图像失真最小，必须先输出对图像质量贡献更大的码段（code segment），而丢弃那些对图像质量贡献小的码段。在pcrd算法中，丢弃的码段虽然不包含在最后的输出码流，但由于同样经过了计算复杂度很高的算术编码，这就存在着一定的编码冗余，浪费了编码时间。并且，被丢弃的码段在截断前需要占用一定的存储空间，消耗了存储资源。为提高编码效率、减少编码冗余，应当尽量少编码产生将被丢弃的码段。该问题属于jpeg2000的码率控制算法的研究范畴，即研究在某个码率下，如何选择编码码段，以使图像失真最小、图像质量最好的问题。对于视频序列的motion-jpeg2000编码，每一帧图像均采用jpeg2000标准进行压缩，因而同样具有jpeg2000码流良好的可伸缩性，可以方便地通过码流的截断来实现精确的码率控制。同样，可以采用jpeg2000标准所推荐的pcrd码率控制算法对每帧图像进行jpeg2000 压缩，但由于pcrd存在着较大的计算冗余，需要消耗了大量的编码时间和存储资源。对于一些视频编码的实时或准实时应用，或者在存储空间有一定限制的场合，pcrd显然难以满足实际应用的要求。为减少motion-jpeg2000编码的计算冗余，提高编码速度，并降低存储资源的占用，进行motion-jpeg2000码率控制算法的研究十分必要。对于可变码率（vbr）编码，研究如何充分利用输出缓冲区资源、取得图像质量更加恒定的motion-jpeg2000码流，有利于减少压缩视频传输延迟并提高一定的平均图像质量。总的来说，研究并提出更加高效的jpeg2000码率控制算法，以减少编码计算冗余、提高编码速度和减少内存占用等资源消耗，对于图像和视频的jpeg2000编码及其软硬件实现都具有重要现实意义。上海交通大学硕士学位论文第一章绪论 3 1.3 论文的研究工作及创新点 1.3 论文的研究工作及创新点论文主要对 jpeg2000 和 motion-jpeg2000 的码率控制算法进行了研究，具体内容如下： 1) 详细介绍了 jpeg2000 和 motion-jpeg2000 的编码过程、主要特性等，并分析总结了图像和视频编码码率控制的相关技术以及目前比较典型的码率控制算法。 2) 详细分析了jpeg2000图像压缩的压缩后率失真优化算法pcrd以及编码效率较高的联合熵编码和率控制算法 irec，然后通过分析 irec 算法所存在的缺陷提出了改进的联合熵编码和率控制算法 virec（variable number-of-passes integrated rate-control and entropy-coding），根据码块所在子带的能量权重系数为每个码块来选择不同的每次编码通道数，可以更好地保证编码图像质量，并提高一定的编码效率。 3) 研究了 motion-jpeg2000 编码的码率控制算法问题，分别分析总结了在恒定码率和可变码率两种情况下现有的一些算法的情况。对于恒定码率编码，提出了一种利用帧间相关性的算法 seuca（slope estimation using correlation algorithm），并通过仿真实验证明了该算法的有效性；对于可变码率编码，通过分析漏桶算法样本帧的分布情况对码流图像质量恒定效果的影响情况，提出了一种带场景切换检测的 motion-jpeg2000 的 vbr 编码码率控制算法 lasd（leak-bucket algorithm with scene-change detection），并进行了相应的理论分析和仿真实验。论文的创新点主要有： 1) 通过分析得出联合熵编码和码率控制时每次编码通道数关系到减少编码时间和提高编码图像质量之间的权衡选择，提出了根据各个码块所在子带的能量权重系数为各个码块选择不同的每次编码通道数，并在熵编码的同时进行码率控制，可在保证编码图像质量的同时提高一定的编码效率。 2) 基于视频序列前后帧之间存在的帧间相关性，提出了一种 motion-jpeg2000 的 cbr 编码码率控制算法 seuca。该算法利用帧间相关性，使用前一编码帧的率失真斜率值估计当前帧的率失真情况，并结合使用 irec 和 eirec 算法进行编码，可以比较有效地提高 cbr 编码的编码效率，降低编码计算冗余。 3) 采用带场景切换检测的双缓冲区漏桶算法来实现 motion-jpeg2000 的 vbr 编码，进一步提高码流的图像质量恒定效果。通过场景切换检测，可以比较有效地降低缓冲区里各帧的相关性，并表征更多的图像帧编码的率失真情况，因而各帧码率分配更加合理，得到的码流质量更加恒定。上海交通大学硕士学位论文第一章绪论 4 1.4 论文安排 1.4 论文安排本论文共分为五部分，各部分具体内容安排如下：第一章为绪论，简略介绍了 jpeg2000 的产生背景和应用前景，并指出研究 jpeg2000 码率控制算法的意义。第二章详细介绍了 jpeg2000 静止图像压缩标准的发展过程、主要特性和 jpeg2000 编码的主要过程以及 motion-jpeg2000 的主要特点，并详细阐述了图像和视频码率控制技术的基本理论和典型算法，以此构成整个课题研究的理论基础。第三章着重研究了 jpeg2000 的码率控制算法问题。首先介绍了 jpeg2000 码率控制算法的研究情况，并分析了各种算法目前所存在的不足；然后具体介绍了一种比较高效的算法即联合码率控制和熵编码算法，并分析了该算法所存在的压缩图像质量可能有所下降的缺点；针对该缺点，本文提出了一种改进的码率控制算法 virec，并通过仿真实验验证了改进算法的有效性。第四章具体研究了 motion-jpeg2000 的码率控制算法，提出了利用帧间相关性的恒定码率控制算法 seuca，采用两次扫描编码法实现了 motion-jpeg2000 的 vbr 编码，最后提出了带场景切换检测的漏桶算法 lasd，并对上述算法进行了理论分析和仿真实验。第五章对论文所做的工作进行了全面的总结，并对于 jpeg2000 码率控制算法方面的进一步研究提出了建议和方向。上海交通大学硕士学位论文第二章 jpeg2000 标准及码率控制技术 6 第二章第二章 jpeg2000 标准及码率控制技术标准及码率控制技术 2.12.1 jpeg2000 的发展过程的发展过程 jpeg 标准于20世纪80年代中期开始由itu和iso展开讨论， 1992年成为国际标准。 jpeg 的核心技术是以离散余弦变换（dct）为基础，熵编码采用游程长度编码和霍夫曼编码，算术编码是可选项。jpeg逐步发展并得到广泛的应用，是一个非常成功的标准。但jpeg最明显的缺陷在于低比特编码时块失真显著，这是由于将图像信号从空间域向频率域变换时所采用的离散余弦变换，将图像划分成88的方块，各方块的编码失真在块边缘处不连续所导致的。对于对图像质量要求较高的应用，例如高清照片、数字图书馆、卫星云图、医学图像等， jpeg的表现都难以令人满意。于是，20 世纪90年代早期，jpeg 委员会又增加了一个新计划，目的是弥补jpeg对连续色调静止图像的无损压缩和近无损压缩效率不高的缺陷，从而制定了iso/iec 14495标准，即jpeg- ls。在给jpeg-ls提交的众多技术方案中，由ricoh所提议的一种基于小波技术的 crew(可逆嵌入式小波压缩)可以在单一压缩比特流同时实现无损和有损压缩，引起了广泛的关注。虽然crew最终没有被jpeg-ls采纳，但是委员会意识到crew 算法提供了丰富的特征集，值得形成一个新标准，于是在1996年初开始了jpeg2000工程。1997年3月开始征集提案，并在1997年11月悉尼召开的wg1会议上对所提交的24种算法进行了评估，并将其中wtco(小波格子编码量化)算法选定为jpeg2000参考算法。2000年12月，终于正式发布了 jpeg2000标准的第1部分，其正式名称为：jpeg2000图像编码系统part1核心编码系统18。 jpeg2000图像压缩标准的正交变换采用小波变换(wavelet transform)，熵编码采用算术编码，并通过嵌入式位平面编码、码流分层组织等技术，获得各种优异的压缩性能。 jpeg2000 还将彩色静止图像所采用的jpeg编码方式和二值图像所采用的jbig (joint binary image group)编码方式统一起来, 成为对应彩色、灰度和二值等多种图像格式的通用编码方式。目前为止， jpeg2000标准的制定主要分第部分至第部分和第部分至第11部分19。至2004年，其中的前6个部分都已公布为国际标准。part 1为核心编码系统（core coding system），定义了最小功能编解码器，且明确了其在标准的其它部分中的使用，还规定了一上海交通大学硕士学位论文第二章 jpeg2000 标准及码率控制技术 7 种简单的文件格式jp2；part 2为扩展部分（extensions），扩展了第1部分解码部分的高级特征，包括扩展的文件格式支持和采用更复杂的算法来实现扩展的功能；part 3为motion-jpeg 2000部分，定义了运动图像压缩标准motion-jpeg2000，它对视频序列的每一帧均采用 jpeg2000标准进行压缩，并将输出码流打包成特定的mj2格式的文件。 2.22.2 jpeg2000 的主要特性的主要特性 jpeg2000标准采用了许多先进的图像压缩技术，压缩性能比jpeg有很大的改进和提高。例如，用离散二维小波变换(dwt) 取代了离散余弦变换(dct)，并且在应用离散小波变换时, 分别引入对数据整型到整型的可逆变换和实型到实型的不可逆变换，从而实现对图像的无损压缩和有损压缩两种不同的编码处理；采用带优化截断的嵌入式块编码算法ebcot （embedded block coding with optimal truncation），可以获得高度可伸缩的码流；采用基于上下文关系的自适应二进制算术编码器实现，可以获得很高的编码效率。正因为集合了众多先进的图像压缩技术，jpeg2000比许多其它图像压缩标准具有更好的压缩性能。jpeg2000的主要特征有3,4： 1) 具有高压缩性能在有损压缩时，jpeg2000的平均压缩效率比jpeg提高了约20%30%。并且，传统的jpeg在低比特率编码时会产生dct变换固有的块失真，而jpeg2000因为采用小波变换，只会出现人眼感知不太敏感的散状噪声，所以压缩后的图像显得更加细腻平滑，主观图像质量更好。 2) 可同时实现无损压缩和有损压缩 jpeg2000可以在同一编码框架内同时实现无损和有损两种压缩方式, 以满足人们不同的实际需求。无损压缩主要是分量变换时采用整数变换矩阵，小波变换采用整数系数的5/3小波滤波器，并且不进行量化（即量化步长为1）。同时，jpeg2000提供的是嵌入式码流，允许从有损到无损的渐进解压，即先解出有损图像，码流完全解码即得到无损图像。 3) 具有多种渐进传输方式所谓渐进传输就是逐步地传输图像数据,接受端可以逐渐解码并显示。jpeg2000可以实现按图像精度、分辨率、空间位置和图像分量等四种渐进传输方式。图像精度的渐进传输就是先传输图像的轮廓数据，再传输图像的细节数据以逐步细化图像质量，使上海交通大学硕士学位论文第二章 jpeg2000 标准及码率控制技术 8 图像由朦胧到清晰。该功能的实现主要归功于jpeg2000码流的分层打包和灵活的码流组织方式。 4) 可实现感兴趣区域编码 roi（region of interest）编码, 即感兴趣区域编码。jpeg2000允许用户在图像上自定义roi图像区域, 并对这些区域的图像数据进行优先、优质的编码处理。对roi区域图像的子带系数作位平面展开时，用称为maxshift的方法进行平滑处理，使得roi区域的位平面高于背景区域的位平面，因而可以优先进行编码。 5) 支持码流的随机访问和处理这一特征允许用户对任意指定图像区域随机访问,并允许在压缩域对部分图像区域进行旋转、移动等处理，而无需将整个码流解码。jpeg2000码流的灵活组织方式有利于实现该功能。 6) 具有优越的容错性能 jpeg2000采用具有再同步标记的分组结构，分成较小的编码单位（码块）和各编码处理单元的算术编码终结，以及各码块内的差错检测和隐蔽机制等使得jpeg2000码流具有优越的容错能力。 7) 具有开放的框架结构提供一个开放的框架结构，便于对不同的图像类型和不同的应用场合优化编码系统，是很吸引人的特性。在开放的结构中, 解码器只需实现核心的工具集和对码流的解析。如果必要, 解码器可能需要某种未知的工具，该工具应由数据源提供。 8) 支持基于内容的描述对图像信息的检索和分类，是图像处理的重要研究领域之一。jpeg2000文件格式灵活，支持用户对其感兴趣的各种数据信息进行快速、有效的检索。 2.32.3 jpeg2000 的编码过程的编码过程 jpeg2000 编解码器结构如图 2-1 所示，其中（a）为编码器框图，（b）为解码器框图。可以看出，jpeg2000 编解码器主要包括前向/反向直流电平位移、前向/反向分量变换、小波变换/小波反变换、量化/反量化、tier-1（第一阶段）编码/解码、tier-2（第二阶段）编码 /解码，和码率控制等部分组成。除了码率控制部分，编码器和解码器各部分均一一对应，解码是编码的逆过程。上海交通大学硕士学位论文第二章 jpeg2000 标准及码率控制技术 9 前向分量变换前向直流电平位移前向小波变换量化 tier-1 编码 tier-2 编码原始图像编码码流码率控制（a) tier-1 解码 tier-2 解码反量化小波反变换反向分量变换反向直流电平位移编码码流重建图像（b) 图 2-1 jpeg2000 编解码器框图(a)编码器框图和(b)解码器框图5 figure 2-1 jpeg2000 codec structure. the structure of the (a) encoder and (b) decoder 5 对编码器来说，首先对原始图像进行预处理，包括图像区域的填充块（tile）分割、直流电平的位移和颜色分量变换；然后对各个填充块分量（tile component）进行离散小波变换，并对子带小波系数进行量化；tier-1 编码将量化小波系数划分为小的码块（code block）并对各个码块进行位平面展开，每个位平面进行三次编码扫描，各次扫描得到的符号流进行基于上下文的算术编码，输出各个编码码段比特流；tier-2 编码对得到的比特流分层和打包，并按一定的渐进顺序组织为输出码流。码率控制部分是通过调整量化步长和截断编码码流来实现各种期望的码率。以下各节将具体介绍 jpeg2000 的编码过程。 2.3.1 预处理预处理 2.3.1.12.3.1.1 填充块填充块(tile)分割分割 jpeg2000的编解码处理基本单元不是整幅图像，而是把图像分成若干互不重叠的矩形块，即填充块（tile），对每一个填充块进行独立的编解码操作。填充块分割的主要作用有：当编码系统可用的存储资源不足以处理整幅图像时，将图像进行填充块分割，每个填充块分别进行独立的编码操作，可以更有效地利用内存资源。对于文字和自然图像的混合图像进行压缩，按其内容进行填充块分割，可以对于不同的填充块分别采用对应最佳的编码方法以提高编码效率。填充块分割还有利于感兴趣区域编码（roi）的实现。虽然填充块分割具有许多优点，但解码后的图像容易出现各填充块之间的边线，类似于 jpeg的dct块失真。因而，jpeg2000的某些高清晰度的应用（比如数字电影）规定填充块上海交通大学硕士学位论文第二章 jpeg2000 标准及码率控制技术 10 数目为1，即不允许进行填充块分割。 2.3.1.22.3.1.2 直流电平位移直流电平位移图像的编解码器通常希望输入图像像素的动态范围大约以 0 为中心，有利于编解码的处理。假设某一图像分量各采样值用b比特表示，如果采样值( , )i x y为有符号数，则其对应动态范围是 11 2( , )2 bb i x y ，大约以 0 为中心，不需要进行直流电平位移；如果各采样值( , )i x y是无符号数，则其动态范围是0( , )2bi x y，需要进行直流电平位移，将各采样值调整为动态范围以 0 为中心的( , )i x y。通常采用的直流电平位移公式为： 1 ( , )( , )2bi x yi x y =， 11 0( , )2 , 2( , )2 bbb i x yi x y (2-9) ()r d代表在误差不超过d时，传输一个像素平均使用的比特数的最小值。如果信源不是正态分布的，则()r d的数值应该更小7。典型的率失真函数曲线rd如图 2-6 所示。在区间 max (0,)d内，率失真函数()r d是连续、单调递减的凸函数。当0d=时，编码对应于无损压缩，输入码率应大于或等于信源熵( )h x；若 max d为最大容许失真，则相应码率下限为 max ()r d。 * d 图 2-6 典型的率失真曲线12 figure 2-6 typical rate-distortion curve12 率失真理论指出了在一定的图像失真下，可能达到的编码码率的下限，如果确定了失真的度量标准和信源的统计特性，便可以得到率失真函数。但因为信源特性往往难以表征，直接计算率失真函数需要大量的运算，在许多场合都难以应用。为解决该问题，可以采用率失真模型的方法。视频编码器的率失真模型提供了一种在一定编码比特范围内对图像质量的度量，对于给定的码率，测量解码序列的最小失真，获得率失真曲线，并得到率失真模型，最 d ()r d ( )h x * ()r d max d * d0 上海交通大学硕士学位论文第二章 jpeg2000 标准及码率控制技术 21 终根据率失真模型来确定码率控制方法。根据信源的统计特性，可分为高斯信源统计模型、拉普拉斯模型、指数模型和低比特率模型等。 2.5.2 图像编码的码率控制2.5.2 图像编码的码率控制随着多媒体和网络技术的蓬勃发展，通信的信息量急剧膨胀，有限的传输带宽越来越成为宝贵的资源。如何充分有效地利用有限的带宽，已成为视频和图像通信领域的主要研究课题之一。一般来说，码率控制是指根据一定的策略来控制和调整码流的比特率，使其在满足传输带宽和通信延时等方面的需要的前提下保证重建的图像质量最好。对于图像压缩而言，变换编码对图像样本进行变换以获得变换系数，该系数被组合成频带或子带。每个频带都要进行量化和编码，码率控制（率分配）就是一个把量化步长和编码率 b r分配给不同频带的过程18。对于视频编码而言，码率控制问题更加复杂，需要对不同的编码单元分配不同的码率。最简单的就是根据编码复杂度等因素调整各个单元的量化级，另外，调整帧率、帧类型或空间分辨率等都可以控制输出码率。图像压缩系统的两个重要的性能指标是编码比特率（码率）和重建图像质量。码率通常用每像素的比特数r表示，重建图像质量可用图像的失真（或者称编码误差）d表示，图像失真的指标通常选择重构图像( , )g x y和原始图像( , )f x y的均方误差，即： 2 ( , )( , ) def x yg x y= （2-10）一般来说，图像的码率r越大，则重建图像质量越好，失真d越小。反之，图像码率r越小，则重建图像质量越差，失真d越大。可以看出，码率r和失真d成反比关系。如何权衡和选择码率和失真的关系问题，即为率失真问题。根据这两个性能指标，图像压缩的码率控制策略可分为两种：一种是在一定的总体码率限制条件（小于某个最大码率 max r）下，使得图像失真最小，即 min d max . .st rr （2-11）另一种码率控制策略是在一定图像失真限制条件（小于某最大图像失真 max d）下，使得压缩图像的总码率最小，即 min r max . .st dd （2-12）图像和视频编码的率失真性能主要受如下因素影响l1: 上海交通大学硕士学位论文第二章 jpeg2000 标准及码率控制技术 22 1) 图像/视频序列的内容； 2) 编码参数(静止图像编码包括量化步长；视频序列编码包括量化步长、运动矢量搜索范围、宏块帧内/帧间编码模式和帧率等)； 3) 编码算法(dct/dwt、运动估计算法、整像素/半像素精度运动补偿等)；为了使编码的率失真性能更加优化，对编码参数进行调整的过程称为率失真优化 (rate-distortion optimization)。对于视频的码率控制而言，则不仅需要保证获得较好质量的重建图像，并且需要考虑系统的延时和缓冲区的上溢或下溢。 2.5.32.5.3 视频码率控制基本原理视频码率控制基本原理在多媒体通信中，压缩视频流需要在带宽需求不一致且变化的网络上传输，为了充分利用提供的网络资源，并保证用户获得最优的感觉质量，在视频编码通信系统中，需要引入某种流量控制机制。视频编码器的输出码率过大会导致不可想象的业务拥塞，并会导致网络阻塞；另一方面，视频编码器输出码率无控制的减少，会导致不必要的质量降级及对现存带宽资源的低效利用。通常需采用流量控制技术即码率控制来调整并控制视频源的输出码率，以获得在质量和带宽利用上的最佳均衡21。传输过程中的码率控制一般通过引入缓冲区与

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（信号与信息处理专业论文）jpeg2000码率控制算法研究.pdf

文档简介

温馨提示

最新文档

评论

（信号与信息处理专业论文）jpeg2000码率控制算法研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档