第8讲多媒体数据压缩

上传人：q*** IP属地：湖北上传时间：2022-06-25 格式：PPTX 页数：67 大小：553.40KB 积分：28 举报 版权申诉

已阅读5页，还剩62页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、8.1 多媒体数据压缩概述8.2 多媒体数据压缩方法8.3 多媒体数据压缩编码的标准多媒体数据量很大，需要进行压缩处理，而多媒体数据本身存在很大的冗余度，使其可以被压缩。8.1.1 多媒体数据压缩的必要性8.1.2 多媒体数据压缩的可能性8.1.3 多媒体数据压缩的相关问题多媒体应用中涉及到的媒体有文字、图形、图像、音频、动画、视频等。其中文字的数据量较小，一本书的文本文件大概只要几百字节；图形文件的数据量和其表达内容以及文件格式等相关，数据量通常大于文字媒体；计算机制作的动画通常是基于两种格式，一种是基于矢量格式的，一种是基于点阵格式，基于矢量格式的动画的数据量小于基于点阵格式的动画；绝大部

2、分的媒体如图像、音频及视频的数据量都非常大，表8-1列举了一些多媒体数据的数据量。以多媒体视频为例，如果图像的分辨率为640像素 480像素，每个像素使用三个字节（即24位）来存储，采用PAL制传输，即帧频为25帧/秒，那么一秒的数据量大约是176MB，普通的容量为650MB左右的CD-ROM光盘，只能存储不到30秒的数据，而且传输速率为176Mbit/s，普通网络的带宽很难承受。由此可见，多媒体应用中面对着存储和传输两个问题，对于这两个问题，可以从硬件和软件两个方面来解决。在硬件方面，随着计算机技术的发展，存储介质的容量、传输速率以及系统和网络的传输速度都在不断提高，但硬件在发展，多媒体应用

3、的需求也在发展，现在硬件发展的速度和程度仍然不能和当前多媒体应用的需求相匹配。所以，面对数字化了的音频、视频信号巨大的数据量，单靠硬件技术的提高是不够的，对媒体数据的压缩才是最终的解决方案。所谓压缩就是把媒体的数据量变小，然后再进行存储和传输，当应用时再从数据量小的文件中恢复回原来的媒体表达。多媒体数据必须进行压缩才可以解决多媒体数据的存储和传输问题，才可以有效地利用有限资源，节省存储空间，提高传输效率。多媒体数据之所以能够被压缩，主要基于两个原因，一是由于人的视觉和听觉的生理局限性；二是由于音频、图像、视频等数据的冗余度很大，具有很大的压缩潜力。下面分别讨论。1感官的生理局限性2多媒体数据的

4、冗余人类的听觉和视觉等感觉器官受人体机能的限制，具有一定的局限性。（1）听觉局限性：主要表现在三个方面，一是人的听觉具有掩蔽效应，强弱不同的声音同时存在时，强声会使弱声难以被听见；二是人耳对不同频段的声音敏感程度不同，通常对低频信号更敏感些；三是人耳对语音信号相位变化不敏感。（2）视觉局限性：主要表现在两个方面，一是人类视觉的掩盖效应，对图像场的某些变化感觉不灵敏；二是视觉系统的色彩分辨能力有限，一般只有6位灰度级，一个真彩系统可以表达16777216种不同颜色，而一个专家能识别的颜色也就只有几百种，通常说来人类对图像色彩的感知能力远不如对亮度的感知能力。音频、图像、视频这些多媒体数据最终是

5、要由人类的感觉器官来感知的，因此对多媒体数据的记录和存储要充分利用听觉系统和视觉系统的特点，对于人的感官感觉不到的信息或不敏感的信息可以进行必要的舍弃，避免做无用功。除了人的感官方面的局限性之外，实际上图像、音频和视频数据本身也具有很大的冗余性。（1）空间冗余（2）时间冗余（3）统计冗余（4）结构冗余（5）知识冗余（1）空间冗余：一幅静态图像中，物体和背景的表面颜色常常具有空间连贯性，如一堵白墙的图像，尽管上面可能挂着其他东西需要存储，但是整个墙的背景颜色都是白色，如果存储每一个白点，就会造成极大的浪费。即使像素块不是由同一种颜色构成的，但一个点的颜色值和周围点的平均值离得较远的概率比靠得较近

6、的概率小得多。这些相关性在数字化图像中就表现为空间冗余。空间冗余是静态图像存在的最主要的数据冗余形式。（2）时间冗余：音频和视频数据是一连续的渐变过程，而不是一个完全在时间上独立的过程，因而存在时间冗余。音频相邻采样点数据的幅度值很相近，视频图像序列中的两幅相邻的图像中，后一幅图像与前一幅图像之间往往有较大的相关性，动画中的相邻两帧有时几乎相同，这都是一种时间冗余。（3）统计冗余：数据中进行编码中各种符号的出现频率不同，如果给每一种符号相同的存储位数，这样也会产生冗余，叫统计冗余。（4）结构冗余：有些图像中一些区域的“条纹”较密，没有“通常”的空间冗余，但从大的区域上看存在着非常强的纹理结构，

7、例如布纹图像和草席图像等。（5）知识冗余：有许多图像的理解与某些基础知识有相当大的相关性。例如，人脸的图像有固定的结构，嘴的上方有鼻子，鼻子的上方有眼睛，鼻子位于正面图像的中线上等。这类规律性的结构可由先验知识和背景知识得到，此类冗余被称为知识冗余。1压缩的本质2压缩和解压缩3压缩的衡量标准通过对多媒体数据压缩的必要性和可能性的讨论可知，数字多媒体信息对数据传输和数据存储构成了巨大的压力，因此必须进行压缩，而由于多媒体数据本身具有冗余的数据，因此多媒体数据有可能被压缩。数据压缩就是按照某种方法从给定的数字信号（如音频、图像、视频）中推出简化的数据表述，从而降低数据量的过程，这个过程也被称为数据

8、编码。多媒体数据压缩的目的是为了最有效地利用有限的存储器资源、信道资源和计算资源等。数据压缩的本质就是去掉数字信号数据中的冗余数据，减小数据量。当然，这种数据的压缩并不是无限度地减小数据量，因为压缩文件在应用时还要恢复原始数据，所以必须保证压缩的文件能被恢复。在多媒体技术中，不需要把信号完全无损地恢复，但要能保存原来数据的关键信息。因此，多媒体技术中压缩的任务是保持源信号在一个可以接受的前提下把需要的比特数减到最少程度，即用尽可能少的比特数来表示源信号并能将其还原。数据压缩就是去掉信号数据的冗余性，也称为数据编码。与此对应，数据压缩的逆过程称为数据解压缩，简称为数据解码。压缩的多媒体数据需要解

9、压缩才能使用，图8-1表达了多媒体数据压缩和解压缩的过程。按压缩和解压缩算法耗费代价的不同，可以把多媒体应用分为对称应用和非对称应用。在对称应用中编码和解码代价应基本相同，如视频会议系统，数据在各个终端被压缩和解压缩，此时要求压缩和解压缩所耗费的时间和资源基本相当；在非对称应用中，解码过程比编码过程耗费的代价要小，例如网络视频系统，它的数据压缩的过程仅一次，采样的时间不限，而解压缩经常用到并需要迅速完成，因此实时解码成为基本要求，而编码所需的时间则不限。衡量一个压缩技术的好坏，有如下四个标准。（1）压缩比要大，即压缩前后所需的信息存储量之比要大，使数据尽可能地被压缩。（2）恢复效果要好。要尽

10、可能地恢复原始数据。（3）压缩、解压速度快，即实现压缩的算法要简单，尽可能地做到实时压缩、解压。在不对称应用中，解压速度的提高显得更为重要。（4）压缩及解压的成本尽可能小，即实现压缩和解压缩的软硬件开销要尽可能小。事实上，一种压缩算法或压缩标准，不可能同时达到以上四个要求，因此常常根据应用的不同选择尽可能适用的压缩方法，即在压缩能力、实现复杂性与成本等方面进行平衡与折中。8.2.1 压缩方法分类8.2.2 RLE编码8.2.3 统计编码8.2.4 预测编码8.2.5 变换编码多媒体数据压缩方法根据不同的标准有多种分类方法，例如从压缩算法的原理上可以分为统计压缩编码、变换压缩编码、预测压缩

11、编码、模型压缩编码等；从压缩面向的对象上可以分为针对音频的压缩编码（如波形编码、参数编码）和针对视频的压缩编码（如帧内压缩编码技术、帧间压缩编码技术）等，根据算法是否自适应分为自适应压缩编码和非适应性压缩编码等；根据数据质量有无损失分为有损压缩编码和无损压缩编码。在实际应用中往往是采用多种不同方法对原始数据进行综合压缩编码，反复压缩，以取得较高的压缩率，这种综合压缩编码方式统称为混合编码。根据质量有无损失分类方式涵盖了所有的多媒体压缩方法，即所有的压缩方法必然可以归入这两种类型中的一种。从信息论的观点看，描述信源的数据是信息量和信息冗余量之和。在压缩过程中，去掉冗余数据，减少数据量但并不减少信

12、息量，解压缩时仍可原样恢复数据，这样的压缩就是无损压缩，也被称为冗余压缩法。因为无损压缩是可逆的，因此也被称为可逆压缩法。如果在压缩过程中不但减少了数据量，同时数据的信息量也减少了，此时解压缩后数据则不能完全恢复，只能近似地恢复，这种压缩方法被称为有损压缩或不可逆压缩法。在信息论中，平均信息量定义为熵，因此无损压缩方法也被称为熵编码法，而有损压缩方法也被称为熵压缩法。无损的压缩常用于原始数据的存档、应用软件压缩以及专业数据的精密处理，例如医疗图像读取和解析、卫星数据判读等。而有损压缩通常用于普通音频和视频的压缩，人类的视觉和听觉器官对音频和视频中某些信息不大敏感，有损压缩以牺牲这部分信息为代价

13、，换取了较高的压缩比。实验证明，一般情况下损失的部分信息对理解原图像或声音基本没有影响，即有损压缩丢失的信息对用户来说并不重要，用户感觉不到，因此这部分信息可以忽略。常用的无损压缩方法有RLE编码、统计编码（如Huffman编码、算术编码）和LZW编码等。常用的有损压缩方法有PCM（脉冲编码调制）、预测编码、变换编码、矢量量化和子带编码等。RLE（Run Length Encoding）编码也被称为行程编码。RLE压缩编码主要适用于图像，对减少图像文件的存储空间非常有效，在图像中具有相同颜色并且是连续的像素数目被称为行程长度。一幅图像中往往具有许多颜色相同的图块。在这些图块中，许多行上都具有相

14、同的颜色，或者在一行上有许多连续的像素都具有相同的颜色值。RLE编码在这种情况下存储的不是每一个像素的颜色值，而仅仅存储一个像素的颜色值以及具有相同颜色的像素数目就可以，或者存储一个像素的颜色值以及具有相同颜色值的行数。RLE编码解码时按照与编码时采用的相同规则进行，还原后得到的数据与压缩前的数据完全相同。因此，RLE编码属于无损压缩技术。RLE编码的优点在于技术直观算法简单。然而，RLE对颜色丰富的自然图像不太适用，颜色丰富的自然图像在同一行上具有相同颜色的连续像素往往很少，而连续几行都具有相同颜色值的连续行数就更少，此时如果仍然使用RLE编码方法，不仅不能压缩图像数据，反而可能使原来的图像

15、数据变得更大。RLE所能获得的压缩比有多大，这主要是取决于图像本身的特点。如果图像中具有相同颜色的图像块越大，图像块数目越少，获得的压缩比就越高，反之，压缩比就越小。通常RLE编码和其他的压缩编码技术联合应用。统计编码是根据信源符号出现概率的分布特性而进行的压缩编码，使用一种变长码，将出现次数较多的符号用较短的码字表示，以便使平均码长或码率尽量小。哈夫曼编码是由Huffman在1952年提出的一种典型的统计编码，它的基本原理是按信源符号出现的概率大小进行排序，出现概率大的分配短码，出现概率小的则分配长码。下面来看一个实际的例子。假设有一个系统只对7段文字进行编码，这7段文字内容分别为“i am

16、 a baby”、“i am a boy”、“i am a girl”、“i am a man”、“i am a woman”、“i am an old man”、“i am an old woman”，7段文字总长度为86，共涉及到了13种不同字符，一个系统用二进制表达13种字符，如果采用定长码，则每个字符至少需要4位，每一段文字需要的编码长度见表8-2。但这13种字符出现的频率不同（如表8-3所示），对每一种字符都用同样的码长有些浪费，所以希望让出现频繁的字符码长短一些，较少出现的字符码长长一些。哈夫曼编码就是针对信源符号出现的概率不同的情况进行的编码。哈夫曼编码过程如下：（1）首先把待编

17、码的每一个符号看成一个节点，所有待编码字符看做原始节点序列。（2）从节点序列中选择概率最小的两个节点。（3）构造一个新节点，新节点的概率等于刚才两个节点概率之和，新节点的两个分支分别是刚才的两个节点。（4）将第（2）步选择的两个节点从节点序列中删除，将第（3）步构造的新节点加入到节点序列中。（5）重复第（2）步到第（4）步，直到节点序列只有一个节点为止。（6）这样得到一棵编码树，对编码树的每一下分支赋值为1，上分支赋值为0，从编码树的根开始回溯到原始的符号，记录经过分支的值，即得到哈夫曼编码。针对前面的系统，采用哈夫曼编码对系统中的13个字符进行编码，编码过程如图8-2所示。该例中用字符出现

18、的次数代替出现的概率，最后根节点的值为86，恰好是整个系统涉及的字符的个数。单个字符的编码如表8-3所示，系统中每段文字编码如表8-2所示。从表8-2可知，采用哈夫曼编码，平均每个字符的码长为3.08，大大少于定长码编码。从哈夫曼编码的过程可知，哈夫曼编码并不唯一，当几个节点的概率值相同时，选择方式的不同和构造新节点的两个子节点位置关系不同都可以导致不同的编码，但不同的编码方案平均码长基本一致。预测编码（Predictive Coding）是根据离散信号之间存在着一定关联性的特点，利用前面一个或多个信号预测下一个信号进行，然后对实际值和预测值的差（预测误差）进行编码。1预测编码的原理2预测编码

19、算法原始的编码系统通常被称作脉冲编码调制（Pulse Code Modulation），简称为PCM编码，实际上它就是通过采样和量化，将模拟量变换得到二进制编码的过程。注意：量化的方法有多种，量化时采用的量化方法和量化位数不同，量化后的数据量也就不同。因此，可以说量化也是一种压缩数据的方法。直接采用PCM编码获得的音频数据和视频数据的数据量很大，如高保真声音和BMP格式的真彩色图像，因此需要对数据进行压缩，此时一般首先要使用预测编码。预测编码的原理是利用相邻数据的相关性，如果频数据中相邻的样本差别很小，图像的相邻像素间差别也较小，所以当前样本或当前像素的值可以通过前一个样本和前一个像素值进行

20、预测，然后对预测值和实际值求差，如果预测比较准确，误差就会很小。误差信号的幅度一般远远小于原始信号，量化这个差值所需的比特数就能比量化原始信号所需的比特数少，从而实现数据的压缩。预测编码的步骤如下：（1）建立一个供预测用的数学模型。（2）利用以往的样本数据对新样本值进行预测。（3）将预测值与实际值相减，对其差值进行编码。预测编码主要是减少了数据时间和空间上的相关性，即针对时间冗余和空间冗余。尤其对于时间序列数据有着广泛的应用价值。预测编码的优点是直观、简捷、易于实现，特别是用于硬件实现，但压缩能力非常有限，例如DPCM只能压缩到24bit/像素。常见的预测编码方法根据使用的预测模型不同分为线性

21、预测编码方法和非线性预测编码方法。线性预测编码方法中主要有差分脉冲编码调制（Differential Pulse Code Modulation，DPCM）和自适应差分脉冲编码调制（Adaptive Differential Pulse Code Modulation，ADPCM）。面向的压缩对象不同，预测编码的技术也不尽相同，其中比较典型的有针对运动图像编码的帧间编码技术。下面主要以DPCM编码为例介绍预测编码算法。DPCM在编码器和解码器中各设置一个使用相同数学模型的预测器对信号进行预测，编码时对预测值与信号实际值的差进行编码，解码时将码值加上预测值，然后进行恢复从而得到原始数据。DPCM

22、系统原理框图如图8-3所示。对于一些复杂的图像而言，空间相关性并不十分明显，这时采用RLE编码和预测编码得到的压缩效果不是很好。如果采用某种数学变换，能使图像数据在变换域中变得简单或具有更好的统计特性，然后在变换域中使用RLE编码或预测编码，可以使数据压缩比率变大。解压缩时，需要根据最后采用的压缩规则，将变换域的数据恢复，然后再用所使用变换的反变换，将数据恢复回空间域。这种使用一种符合源数据本身内在特性的数学变换将空间域中的复杂图像变换，使数据在变换域呈现更好的特性，以便于进行压缩编码的方法被称为变换编码。变换编码是先对信号进行某种函数变换，从一种域信号变换到另一种域信号，然后再对信号进行编码

23、。变换编码压缩数据要经过变换、变换域采样和量化或压缩三个步骤，如图8-4所示。变换本身并不进行数据压缩，它只把信号映射到另一个域，使信号在变换域里容易进行压缩，变换后的样值更独立和有序。变换编码基于两个原因，一是声音、图像大部分信号都是低频信号，在频域中信号的能量较集中，重新进行采样、编码，可以获得比原来的数据比特数少的压缩数据；二是对于一些复杂的、空间相关性并不明显的图像，却在频率域中表现了很强的相关性，而且这种相关性又与图像的复杂程度无关，因此可以利用这样的特点，设计出各种不同的压缩算法，以求得从不同角度（域中）获得较彻底的去除图像信号相关性的方法。变换编码比较经常使用的有离散余弦变换、小

24、波变换等，著名的图像压缩算法JPEG即使用了变换编码。为了使多媒体信息具有互操作性，并且确保未来的兼容性，各国际技术组织的一个重要任务是综合各种编码技术，制定统一的国际或区域的标准。8.3.1 数字音频压缩标准8.3.2 数字图像压缩标准8.3.3 数字视频压缩标准在多媒体音频数据的存储和传输中，数据压缩是必需的。通常数据的压缩造成音频质量的下降、计算量的增加，因此在数字音频的压缩标准制定时需要考虑质量、数据量、计算复杂度三个方面。音频信号的压缩方法有多种，其中包括基于音频数据的统计特性进行的编码，例如波形编码和熵编码；基于音频的声学参数进行的编码，如参数编码和感知编码；基于人的听觉特性进行的

25、编码；还有集中了不同方法的优点的混合编码。按照带宽，音频信号可分为电话质量级的信号、调幅广播质量级的信号和高保真立体声信号。国际电报电话咨询委员会（CCITT目前已被ITU取代）和国际标准化组织（ISO）针对不同类型的音频信号先后提出了一系列音频编码的建议。（1）电话质量级和调幅广播级音频信号的国际标准（2）高保真立体声音频压缩标准（1）电话质量级和调幅广播级音频信号的国际标准电话质量级的音频信号的频率范围为200Hz3.4kHz，调幅广播质量音频信号的频率范围为50Hz7kHz，它们的压缩编码国际标准主要为G系列标准。G.711标准：1972年制定，面向电话质量级语音信号。采用PCM编码，采

26、样频率为8kHz，每个样本采用8位二进制编码，非线性量化。数据传输速率为64kbit/s。G.721标准：1984年制定，面向电话质量级语音信号。采用自适应差分编码调制ADPCM算法，数据传输速率32kbit/s。ADPCM是一种对中等介质音频信号进行高效编码的有效方法。G.722标准：1984年制定，既适用于电话质量级语音信号又适用于调幅广播级音频信号。该标准宽带音频压缩仍采用波形编码技术，采用高低两个子带内的ADPCM方案，高低子带的划分以4kHz为界，然后再对每个子带内采用类似G.721标准的ADPCM编码。G.728标准：1992年制定，面向电话质量级语音信号。采用基于短延时码本激励预

27、测编码LD-CELP算法，数据传输速率为16kbit/s，信号质量与32kbit/s的G.721相当。（2）高保真立体声音频压缩标准高保真立体声音频信号的频率范围为20Hz20 kHz，数据量很大。国际标准化组织国际电工委员会为音频压缩制定了MPEG标准。其中ISO /IEC11172-3作为MPEG音频标准，成为国际上公认的高保真立体声音频压缩标准，一般称为“MPEG-1音频”。MPEG音频压缩技术的数据速率为每声道32448kbit/s，适合于CD-DA光盘应用。MPEG音频根据算法不同分为三层。第一层次和第二层次编码是将输入音频信号进行采样频率为48kHz、44.1kHz、32kHz的采

28、样，经滤波器组将其分为32个子带，同时利用人耳屏蔽效应，根据音频信号的性质计算各频率分量的人耳屏蔽门限，选择各子带的量化参数，获得高的压缩比。MPEG第三层次是在上述处理后再引入辅助子带、非均匀量化和熵编码技术，再进一步提高压缩比。MPEG-1音频编码标准包括三部分，分别对应第1、2和3层（Layer 1/2/3）。层次越高，其性能和复杂度也越高。用户可在复杂性和声音质量之间权衡对层次作出选择。层1包括将数字音频变成32个子带的基本映射，将数据格式化成块的固定分段，决定自适应位分配的心理声学模型，层1标准理论上解码的最小延时为19ms；层2提供了位分配、缩放因子和抽样的附加编码，使用了不同的帧

29、格式，层2理论上解码的最小延时为35ms；层3采用混合带通滤波器来提高频率分辨率，它增加了差值量化、自适应分段和量化值的熵编码，层3理论上解码的最小延时为59ms。MPEG音频标准中编码的算法并没有标准化，可以使用多种算法，只要编码器输出的数据能符合本标准的解码器解出适用的音频流。MPEG-1音频有四种不同的编码模式，分别是单声道模式、双声道模式、立体声模式和联合立体声模式。MPEG音频解码时对位数据流进行解码，恢复被量化的子带样本值以重建声音信号。由于解码时无需心理声学模型，只需拆包、重构子带样本和把它们变换回声音信号，因此解码器的构造相应比编码器简单。在多媒体应用中，图像媒体占了很大的比

30、重，通常说来图像信息存在着大量的冗余，因而在多媒体技术中，图像压缩技术非常重要。图像压缩方法有多种，属于无损压缩的有RLE游程编码、统计编码等，属于有损压缩的有预测编码、交换编码、模型编码等，这些方法并不是单独使用，而是联合起来共同实现图像的压缩。1JPEG概述2JPEG的压缩流程JPEG标准是国际上通用的静态图像压缩标准。JPEG（Joint Photographic Experts Group）是一个由ISO和IEC两个组织机构联合组成的一个专家组，专门负责制定静态的数字图像数据压缩编码标准，该组织在1991年首次提出了JPEG算法。JPEG标准适用于静态灰度图像、静态彩色图像和动态图像的

31、帧内压缩。JPEG标准定义了两种相互独立的基本压缩算法，一种是以预测技术（即DPCM）为基础的无损压缩算法；另一种是以离散余弦变换（Discrete Cosine Transform，DCT）为基础的有损压缩算法。后一种算法的压缩比远远大于第一种算法，但压缩后的图像的效果仍然很好。使用有损压缩算法时，在压缩比为25:1的情况下，压缩后还原得到的图像与原始图像相比较，非图像专家难于找出它们之间的区别，因此基于DCT技术的有损压缩JPEG算法得到了广泛的应用。基于DCT技术的JPEG有损压缩算法又有三种工作模式，分别是顺序（Sequential DCT-based）模式、累进（Progressiv

32、e DCT-based）模式和分层（Hierarchical）模式。（1）基于DCT的顺序模式：从左到右，从上到下扫描信号，为每个图像编码，编码过程在一次扫描中完成。（2）基于DCT的累进模式：图像编码在多次扫描中完成。第一次扫描只进行一次粗糙的压缩，压缩后的数据量很小，重建后得到的是质量较低的图像。接着再次对图像进行比上次细致的扫描，重建后得到的图像好于上一次。这样不断重复下去，直到满意为止。累进模式编码传输时间长，接收端收到的图像是多次扫描由粗糙到清晰的累进过程。（3）基于DCT的分层模式：这个模式下首先将图像变换为一系列低分辨率的图像，如一幅1024像素 1024像素的图像可以被变换成5

33、12像素 512像素的图像，这个过程要继续进行直到图像分辨率不能再降低。然后进行下面的工作。第1步：压缩最低分辨率的图像。第2步：对前一步的结果解码，然后内插生成下一幅较高分辨率的图像。第3步：用第2步的结果作为这一分辨率的实际图像的预测，并且生成一个误差矩阵。压缩该矩阵。第4步：重复第2步和第3步，直到全部分辨率图像已经被编码。该模式下图像在多个空间分辨率进行编码。如果在信道传送速率慢，接收端显示器分辨率也不高的情况下，只需做低分辨率图像解码即可。在JPEG标准的基础上，2000年3月JPEG专家组提出了JPEG 2000标准，JPEG 2000是一种使用离散小波变换（Digital Wa

34、velet Transform， DWT）的分辨率编码技术，和以前的JPEG相比，在大致相同的图像质量下，JPEG 2000的压缩比提高了20%40%。JPEG 2000除了提高了压缩比外，还有以下几个优点。（1）将无损压缩的成熟方法集成到标准中，扩大了JPEG文件的应用领域。（2）加强了对渐进传输的支持，JPEG 2000在传输图像时可以先传输图像的轮廓数据，然后再传输其他数据。（3）提出了感兴趣区域概念，在压缩时允许指定图像上感兴趣的区域的压缩质量，还允许选择指定的部分先解压缩。JPEG标准和JPEG 2000标准对图像的压缩都需要四步，分别是图像数据预处理、数据变换、对变换系数进行量化，最后进行熵编码，如图8-5所示。（1）数据预处理：标准中规定了对图像预处理的方式，JPEG标准将源图像分成8 8的数据块，而JPEG 2000支持把图像分成多种成分，首先图像被分解成分量（components），然后图像和图像分量又被分解成矩形片（tiles）。片分量（tile-component）是JPEG 2000原始或重建图像的基本单位。（2）数据变换：JPEG标准使用DCT变换，JPEG 2

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第8讲多媒体数据压缩

文档简介

温馨提示

最新文档

评论

第8讲多媒体数据压缩

文档简介

温馨提示

最新文档

评论

相关文档