




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数字媒体技术导论数字媒体技术导论 第八章第八章 数字媒体压缩技术数字媒体压缩技术 教学目标:教学目标: (1 1)了解数字媒体数据压缩的原因。)了解数字媒体数据压缩的原因。 (2 2)理解数字媒体数据压缩技术的不同分类。)理解数字媒体数据压缩技术的不同分类。 (3 3)掌握通用的数据压缩编码算法。)掌握通用的数据压缩编码算法。 (4 4)了解各种数字媒体数据压缩的标准。)了解各种数字媒体数据压缩的标准。 学习内容:学习内容: 8.1 8.1 数据压缩及分类数据压缩及分类 8.2 8.2 通用的数据压缩技术通用的数据压缩技术 8.3 8.3 数字媒体压缩标准数字媒体压缩标准 8.1.1 8.1.
2、1 压缩的可能性与信息冗余压缩的可能性与信息冗余 经过数字化处理后的图形、图像、视频和音频经过数字化处理后的图形、图像、视频和音频 等媒体信息的数据量非常大,如果不进行数据压缩,等媒体信息的数据量非常大,如果不进行数据压缩, 计算机系统就无法对它进行存储、交换和传输。计算机系统就无法对它进行存储、交换和传输。 1 1)数字图像)数字图像 2 2)数字视频)数字视频 3 3)数字音频)数字音频 (数据量的计算)(数据量的计算) 8.1 8.1 数据压缩及分类数据压缩及分类 8.1.1 8.1.1 压缩的可能性与信息冗余压缩的可能性与信息冗余 数据能够被压缩的主要原因在于媒体数据中存数据能够被压缩
3、的主要原因在于媒体数据中存 在数据的信息冗余。信息量包含在数据之中,一在数据的信息冗余。信息量包含在数据之中,一 般的数据冗余主要体现在:般的数据冗余主要体现在: 1 1)空间冗余)空间冗余 2 2)结构冗余)结构冗余 3 3)时间冗余)时间冗余 4 4)视觉冗余)视觉冗余 5 5)知识冗余)知识冗余 6 6)信息熵冗余)信息熵冗余 8.1 8.1 数据压缩及分类数据压缩及分类 8.1.2 8.1.2 数据压缩分类数据压缩分类 数据数据压缩分类压缩分类 数据压缩方法分类数据压缩方法分类 数字媒体压缩标准分类数字媒体压缩标准分类 统计编码统计编码 预测编码预测编码 变换编码变换编码 分析分析合成
4、编码合成编码 图像压缩图像压缩 视音频压缩视音频压缩 JPEG等等 运动图像运动图像 MPEH.26x 系列系列 声音声音 AVS MP3 按信息压缩前后比较是否有损失进行划分:按信息压缩前后比较是否有损失进行划分: 无损压缩无损压缩指使用压缩后的数据进行重构(还原指使用压缩后的数据进行重构(还原 或解压缩),重构后的数据与原来的数据完全或解压缩),重构后的数据与原来的数据完全 相同。常用的无损压缩算法有霍夫曼相同。常用的无损压缩算法有霍夫曼(Huffman)(Huffman) 算法和算法和LZWLZW算法算法 。也称为可逆编码。也称为可逆编码。 有损压缩有损压缩指使用压缩后的数据进行重构,重
5、构指使用压缩后的数据进行重构,重构 后的数据与原来的数据有所不同,但不影响人后的数据与原来的数据有所不同,但不影响人 对原始资料表达的信息造成误解。也称为不可对原始资料表达的信息造成误解。也称为不可 逆编码。逆编码。 按数据压缩编码的原理和方法进行划分:按数据压缩编码的原理和方法进行划分: 统计编码统计编码:主要针对:主要针对无记忆信源无记忆信源,根据信息码,根据信息码 字出现概率的分布特征而进行压缩编码,寻找字出现概率的分布特征而进行压缩编码,寻找 概率与码字长度间的最优匹配。概率与码字长度间的最优匹配。 预测编码预测编码:是利用空间中相邻数据的相关性来:是利用空间中相邻数据的相关性来 进行
6、压缩数据的。进行压缩数据的。 变换编码变换编码:是将图像时域信号转换为频域信号:是将图像时域信号转换为频域信号 进行处理。进行处理。 分析分析 合成编码合成编码:是指通过对源数据的分析,:是指通过对源数据的分析, 将其分解成一系列更适合于表示的将其分解成一系列更适合于表示的“基元基元”或或 从中提取若干更为本质意义的参数,编码仅对从中提取若干更为本质意义的参数,编码仅对 这些基本单元或特征参数进行。这些基本单元或特征参数进行。 无记忆信源无记忆信源 【无记忆信源无记忆信源】(1 1)存在一个或多个基本符号集;()存在一个或多个基本符号集;(2 2)将多)将多 个基本符号集做笛卡儿积,形成一定长
7、度的联合概率空间;个基本符号集做笛卡儿积,形成一定长度的联合概率空间; (3 3)运用外力的功(电动势)将单个符号或一定长度的符号)运用外力的功(电动势)将单个符号或一定长度的符号 序列从随机事件转化成必然事件,或者说,将一个随机系统序列从随机事件转化成必然事件,或者说,将一个随机系统 转化成一个必然系统;并且转化成一个必然系统;并且回退到原始空间中来,该原始空回退到原始空间中来,该原始空 间的概率分布不因为事件的发生而改变间的概率分布不因为事件的发生而改变。 【有记忆信源有记忆信源】(1 1)存在一个或多个基本符号集;()存在一个或多个基本符号集;(2 2)将多)将多 个基本符号集做笛卡儿积
8、,形成一定长度的联合概率空间;个基本符号集做笛卡儿积,形成一定长度的联合概率空间; (3 3)运用外力的功(电动势)将单个符号或一定长度的符号)运用外力的功(电动势)将单个符号或一定长度的符号 序列从随机事件转化成必然事件,或者说,将一个随机系统序列从随机事件转化成必然事件,或者说,将一个随机系统 转化成一个必然系统;转化成一个必然系统;不能回退到原始空间中来,即原始空不能回退到原始空间中来,即原始空 间的概率分布因为事件的发生而改变间的概率分布因为事件的发生而改变。 按照媒体的类型进行压缩划分:按照媒体的类型进行压缩划分: 图像压缩标准:图像压缩标准:JPEGJPEG等等 声音压缩标准:声音
9、压缩标准:MP3MP3 运动图像压缩标准:运动图像压缩标准:MPEGMPEG、H.26xH.26x系列、系列、AVSAVS 目录目录 8.2 8.2 通用的数据压缩技术通用的数据压缩技术 行程编码行程编码 字典编码字典编码 熵编码等熵编码等 PCMPCM DMDM DPCMDPCM 通用的压缩方法具有压缩比低、通用的压缩方法具有压缩比低、 通用性强等特点通用性强等特点 无损压缩技术无损压缩技术 有损压缩技术有损压缩技术 目录目录 8.2.1 8.2.1 编码的理论基础编码的理论基础 数据压缩技术的理论基础是信息论。数据压缩技术的理论基础是信息论。 根据信息论的原理,可以找到最佳数据压缩编根据信
10、息论的原理,可以找到最佳数据压缩编 码方法,数据压缩的理论极限是信息熵。码方法,数据压缩的理论极限是信息熵。 熵是信息量的度量方法,它表示某一事件出现熵是信息量的度量方法,它表示某一事件出现 的消息越多,事件发生的可能性就越小,数学的消息越多,事件发生的可能性就越小,数学 上就是概率越小。上就是概率越小。 信息与信息量信息与信息量 信息量是指信源中某种事件的信息度量或含量。信息量是指信源中某种事件的信息度量或含量。 一个事件出现的可能性愈小,其信息量愈多,一个事件出现的可能性愈小,其信息量愈多, 反之亦然。反之亦然。 若若p pi i为第为第i i个事件的概率为个事件的概率为0 0 p pi
11、i 1 1,则该事,则该事 件的信息量为件的信息量为 一个信源包括的所有数据叫数据量,而数据量一个信源包括的所有数据叫数据量,而数据量 中包含有冗余信息。中包含有冗余信息。 信息量信息量 = = 数据量数据量- -冗余量冗余量 信息熵信息熵 信息熵就是将信源所有可能事件的信息量的平均。信息熵就是将信源所有可能事件的信息量的平均。 设从设从N N个数中选定任一个数个数中选定任一个数x xj j的概率为的概率为p p( (x xj j) ),假定选定,假定选定 任意一个数的概率都相等,即任意一个数的概率都相等,即p p( (x xj j) ) 1/1/N N,则,则 I I( (x xj j) )
12、loglog2 2N N-log-log2 2 1/ 1/N N -log-log2 2p p( (x xj j)=)=I I p p( (x xj j) 上式中,上式中,p p( (x xj j) )是信源是信源X X发出发出x xj j的概率。的概率。I I( (x xj j) )的含义是信的含义是信 源源X X发出发出x xj j这个消息(随机事件)后,接收端收到信息这个消息(随机事件)后,接收端收到信息 量的量度。量的量度。 信息熵信息熵( (续续) ) 信源信源X X 发出的发出的x xj j( (j j=1,2,=1,2, ,n n) )共共n n 个随机事件个随机事件 的信息量的
13、统计平均,即的信息量的统计平均,即 H(H(X X )=E)=EI I( (x xj j )= )= H( H(X X ) )称为信源称为信源X X 的的“熵熵”,即信源,即信源X X发出任发出任 意一个随机变量的平均信息量。意一个随机变量的平均信息量。 其中,等概率事件的熵最大,假设有其中,等概率事件的熵最大,假设有N N个事件,个事件, 此时熵为:此时熵为: H(H(X X ) ) n j jjxPxP 1 2 )(log)( NN N j 1 log 1 2 1 N 2log 信息熵信息熵( (续续) ) 当当P(x1)1时,时,P(x2)P(x3)P(xj)0 0,此,此 时熵为时熵为
14、 H(X) P(x1) 0 0 由上可得熵的范围为:由上可得熵的范围为: 0 0 H(X) )(log12xP N2log 信息熵信息熵( (续续) ) 在编码中用熵值来衡量是否为最佳编码。若以在编码中用熵值来衡量是否为最佳编码。若以 L Lc c表示编码器输出码字的平均码长,其计算公表示编码器输出码字的平均码长,其计算公 式为:式为: L Lc c (j j=1,2,=1,2, ,n n) 其中:其中:P P( (x xj j ) ) 是信源是信源X X发出发出x xj j 的概率, 的概率,L L( (x xj j) )为为 x xj j的编码长。的编码长。 n j jjxLxP 1 )(
15、)( 信息熵信息熵( (续续) ) 平均码长与信息熵之间的关系为:平均码长与信息熵之间的关系为: L Lc cH(H(X X) ) 有冗余,不是最佳。有冗余,不是最佳。 L Lc c H(H(X X ) )不可能。不可能。 L Lc c H(H(X X ) )最佳编码(最佳编码( L Lc c稍大于稍大于H(H(X X ) ) ) 熵值为平均码长熵值为平均码长L Lc c的下限。的下限。 8.2.2 8.2.2 霍夫曼编码霍夫曼编码 霍夫曼编码(霍夫曼编码(HuffmanHuffman)是运用信息熵原理的)是运用信息熵原理的 一种无损编码方法,这种编码方法根据源数据一种无损编码方法,这种编码方
16、法根据源数据 各信号发生的概率进行编码。各信号发生的概率进行编码。 在源数据中出现概率大的信号,分配的码字越在源数据中出现概率大的信号,分配的码字越 短;出现概率越小的信号,其码字越长,从而短;出现概率越小的信号,其码字越长,从而 达到用尽可能少的码表示源数据。达到用尽可能少的码表示源数据。 霍夫曼编码的算法:霍夫曼编码的算法: 1.1. 初始化,根据符号概率的大小顺序对符号进行排初始化,根据符号概率的大小顺序对符号进行排 序。序。 2.2. 把概率最小的两个符号组成一个新符号把概率最小的两个符号组成一个新符号( (节点节点) ), 即新符号的概率等于这两个符号概率之和。即新符号的概率等于这两
17、个符号概率之和。 3.3. 重复第重复第2 2步,直到形成一个符号为止(树),其概步,直到形成一个符号为止(树),其概 率和等于率和等于1 1。 4.4. 分配码字。码字分配从最后一步开始反向进行,分配码字。码字分配从最后一步开始反向进行, 即从最后两个概率开始逐渐向前进行编码,对于即从最后两个概率开始逐渐向前进行编码,对于 每次相加的两个概率,给概率大的赋每次相加的两个概率,给概率大的赋“0 0”,概率,概率 小的赋小的赋“1 1”(也可以全部相反,如果两个概率相(也可以全部相反,如果两个概率相 等,则从中任选一个赋等,则从中任选一个赋“0 0”,另一个赋,另一个赋“1 1”)。)。 霍夫曼
18、编码构造出来的编码值不是唯一的。霍夫曼编码构造出来的编码值不是唯一的。 对不同信号源的编码效率不同。对不同信号源的编码效率不同。 由于编码长度可变,因此译码时间较长;编由于编码长度可变,因此译码时间较长;编 码长度的不统一,也使得硬件实现有难度。码长度的不统一,也使得硬件实现有难度。 霍夫曼编码的特点:霍夫曼编码的特点: 8.2.3 8.2.3 行程编码行程编码 行程编码又称行程长度编码(行程编码又称行程长度编码(Run Length EncodingRun Length Encoding, RLERLE),是一种熵编码。这种编码方法广泛地应用于各),是一种熵编码。这种编码方法广泛地应用于各
19、种图像格式的数据压缩处理中。种图像格式的数据压缩处理中。 行程编码的原理是在给定的图像数据中寻找连续重复的行程编码的原理是在给定的图像数据中寻找连续重复的 数值,然后用两个字符取代这些连续值。即将具有相同数值,然后用两个字符取代这些连续值。即将具有相同 值的连续串用其串长和一个代表值来代替,该连续串就值的连续串用其串长和一个代表值来代替,该连续串就 称为行程,串长称为行程长度。称为行程,串长称为行程长度。 8.2.3 8.2.3 行程编码行程编码 假定一幅灰度图像,第假定一幅灰度图像,第n n行的像素值为:行的像素值为: 用用RLERLE编码方法得到的代码为:编码方法得到的代码为:4 4160
20、6084 4114140。 代码斜黑体表示的数字是行程长度,黑体字后代码斜黑体表示的数字是行程长度,黑体字后 面的数字代表像素的颜色值。面的数字代表像素的颜色值。 1111 888 888 1111 00000000000000 4 个个 1 60 个个 8 4 个个 1 14 个个 0 行程编码分类:行程编码分类: 定长编码定长编码 定长编码是指编码的行程长度所用的二进制定长编码是指编码的行程长度所用的二进制 位数固定位数固定 不定长编码不定长编码 变长行程编码是指对不同范围的行程长度使变长行程编码是指对不同范围的行程长度使 用不同位数的二进制位数进行编码。使用变用不同位数的二进制位数进行编
21、码。使用变 长行程编码需要增加标志位来表明所使用的长行程编码需要增加标志位来表明所使用的 二进制位数。二进制位数。 8.2.4 8.2.4 词典编码词典编码 词典编码(词典编码(dictionary encodingdictionary encoding)技术)技术 属于无损压缩技术,主要是利用数据本身包含属于无损压缩技术,主要是利用数据本身包含 许多重复的字符串的特性。可以用一些简单的许多重复的字符串的特性。可以用一些简单的 代号代替这些字符串,就可以实现压缩,实际代号代替这些字符串,就可以实现压缩,实际 上就是利用了信源符号之间的相关性。字符串上就是利用了信源符号之间的相关性。字符串 与代
22、号的对应表就是词典。与代号的对应表就是词典。 词典编码的种类:词典编码的种类: 第一种方法的思想是查第一种方法的思想是查 找目前正在压缩的字符找目前正在压缩的字符 序列在以前输入的数据序列在以前输入的数据 中是否出现过,然后用中是否出现过,然后用 出现过的字符串代替重出现过的字符串代替重 复的部分,它的输出仅复的部分,它的输出仅 仅是指向早期出现过的仅是指向早期出现过的 字符串字符串“指针指针”。 这里所指的词典是指用这里所指的词典是指用 以前处理过的数据表示以前处理过的数据表示 编码过程中遇到的重复编码过程中遇到的重复 部分。这类编码的所有部分。这类编码的所有 算法都是以算法都是以LZ77L
23、Z77算法为算法为 基础的。基础的。 输入数据输入数据 A A B B C C D D X X 输出数据输出数据 A B C M M P . . . . . . . . 词典编码的种类:词典编码的种类: 第二种算法的思想是第二种算法的思想是 从输入的数据中创建从输入的数据中创建 一个一个“短语词典短语词典”, 这类短语不一定有具这类短语不一定有具 体的含义,可以是任体的含义,可以是任 意字符的组合。在编意字符的组合。在编 码过程中遇到在码过程中遇到在“短短 语词典语词典”中出现的短中出现的短 语是,编码器就输出语是,编码器就输出 这个词典中的短语这个词典中的短语 “索引号索引号”,而不是,而不
24、是 短语本身。短语本身。 输输入入数数据据 输输出出数数据据 A 4 B 1 C C X X A D Y 编编码码词词典典 1. A B 2. A X 4. A X X 3. A E 5. B X D A A D Y . . 8.2.4.1 LZ778.2.4.1 LZ77算法算法 LZ77LZ77是以以色列计算机专家是以以色列计算机专家Abraham LempelAbraham Lempel和和 Jakob ZivJakob Ziv在在19771977年开发和发表的。年开发和发表的。 此算法的一个改进算法是由此算法的一个改进算法是由StorerStorer和和SzymanskiSzymans
25、ki在在 19821982年开发的,称为年开发的,称为LZSSLZSS算法。算法。 LZ77 LZ77 算法在某种意义上又可以称为算法在某种意义上又可以称为“滑动窗口压滑动窗口压 缩缩”,该算法将一个虚拟的、可以跟随压缩进程,该算法将一个虚拟的、可以跟随压缩进程 滑动的窗口作为词典,要压缩的字符串如果在该滑动的窗口作为词典,要压缩的字符串如果在该 窗口中出现,则输出其出现位置和长度。窗口中出现,则输出其出现位置和长度。 LZ77LZ77算法中涉及的概念算法中涉及的概念 1.1. 输入字符流输入字符流(input stream)(input stream):要被压缩的字符序:要被压缩的字符序 列
26、。列。 2.2. 字符字符(character)(character):输入数据流中的基本单元。:输入数据流中的基本单元。 3.3. 编码位置编码位置(coding position)(coding position):输入数据流中当:输入数据流中当 前要编码的字符位置,指前向缓冲存储器中的开前要编码的字符位置,指前向缓冲存储器中的开 始字符。始字符。 4.4. 前向缓冲存储器前向缓冲存储器(Lookahead buffer)(Lookahead buffer):存放从编:存放从编 码位置到输入数据流结束的字符序列的存储器。码位置到输入数据流结束的字符序列的存储器。 5.5. 窗口窗口(win
27、dow)(window):指包含:指包含W W个字符的窗口,字符是个字符的窗口,字符是 从编码位置开始向后数也就是最后处理的字符数。从编码位置开始向后数也就是最后处理的字符数。 6.6. 指针指针(pointer)(pointer):指向窗口中的匹配串且含长度:指向窗口中的匹配串且含长度 的指针。的指针。 LZ77LZ77算法具体步骤算法具体步骤 (1 1)把编码位置设置到输入数据流的开始位置。)把编码位置设置到输入数据流的开始位置。 (2 2)找窗口中最长的匹配串)找窗口中最长的匹配串 (3 3)以)以“(Pointer, Length) Characters(Pointer, Length
28、) Characters”的格式的格式 输出,其中输出,其中PointerPointer是指向窗口中匹配串的指针,是指向窗口中匹配串的指针, LengthLength表示匹配字符的长度,表示匹配字符的长度,CharactersCharacters是前向是前向 缓冲存储器中的不匹配的第缓冲存储器中的不匹配的第1 1个符。个符。 (4 4)如果前向缓冲存储器不是空的,则把编码位置)如果前向缓冲存储器不是空的,则把编码位置 和窗口向前移和窗口向前移(Length+1)(Length+1)个字符,然后返回到步个字符,然后返回到步 骤(骤(2 2)。)。 8.2.4.2 LZW8.2.4.2 LZW算法
29、算法 LZWLZW压缩算法是一种新颖的压缩方法,它采用了一压缩算法是一种新颖的压缩方法,它采用了一 种先进的串表压缩,将每个第一次出现的串放在种先进的串表压缩,将每个第一次出现的串放在 一个串表中,用一个数字来表示串,压缩文件只一个串表中,用一个数字来表示串,压缩文件只 存贮数字,则不存贮串,从而使图像文件的压缩存贮数字,则不存贮串,从而使图像文件的压缩 效率得到较大的提高。效率得到较大的提高。 LZWLZW编码是围绕称为词典的转换表来完成的。编码是围绕称为词典的转换表来完成的。 LZWLZW算法中的术语和符号算法中的术语和符号 1.1.前缀前缀(Prefix)(Prefix): 在一个字符之
30、前的字符序列。在一个字符之前的字符序列。 2.2.缀缀- -符串符串(String)(String):前缀字符。:前缀字符。 3.3.码字码字(Code word)(Code word): 4.4.码字流码字流(Codestream)(Codestream): 5.5.词典词典(Dictionary)(Dictionary): 缀缀- -符串表。符串表。 6.6.当前前缀当前前缀(Current prefix)(Current prefix): 7.7.当前字符当前字符(Current character)(Current character): 8.8.当前码字当前码字(Current co
31、de word)(Current code word): LZWLZW编码算法执行步骤编码算法执行步骤 1.1. 开始时的词典包含所有可能的根开始时的词典包含所有可能的根(Root)(Root),而当前,而当前 前缀前缀P P是空的;是空的; 2.2. 当前字符当前字符(C) (C) := =字符流中的下一个字符;字符流中的下一个字符; 3.3. 判断缀判断缀- -符串符串P+CP+C是否在词典中是否在词典中 1 1)如果)如果“是是”:P P := P+C / (= P+C / (用用C C扩展扩展P) P) ; 2 2)如果)如果“否否”: 把代表当前前缀把代表当前前缀P P的码字输的码字
32、输 出到码字流;出到码字流; 把缀把缀- -符串符串P+CP+C添加到词典;添加到词典; 令令P P := C /(= C /(现在的现在的P P仅包含一个字符仅包含一个字符C)C); 判断字符流中是否还有字符要编码判断字符流中是否还有字符要编码 1 1)如果)如果“是是”,就返回到步骤,就返回到步骤2 2; 2 2)如果)如果“否否”: 把代表当前前缀把代表当前前缀P P的码字输的码字输 出到码字流;出到码字流; 结束。结束。 8.2.5 8.2.5 脉冲编码调制脉冲编码调制 脉冲编码调制脉冲编码调制 (PCM)(PCM)就是将模拟调制信号的采样值变换就是将模拟调制信号的采样值变换 为脉冲码
33、组。为脉冲码组。 PCMPCM编码包括如下三个过程:编码包括如下三个过程: 采样,将模拟信号转换为时间离散的样本脉冲序列。采样,将模拟信号转换为时间离散的样本脉冲序列。 量化,将离散时间连续幅度的抽样信号转换成为离散量化,将离散时间连续幅度的抽样信号转换成为离散 时间离散幅度的数字信号。时间离散幅度的数字信号。 编码,用一定位数的脉冲码组表示量化采样值。编码,用一定位数的脉冲码组表示量化采样值。 PCMPCM系统原理图系统原理图 模模拟拟信信号号 滤滤波波 采采样样 量量 化化 编编 码码 数数字字化化(A/D) 传传输输 模模拟拟信信号号 D/A 转转换换 逆逆量量 化化 解解 码码 模模拟
34、拟化化(D/A) PCMPCM编码的优点编码的优点 有很强的抗干扰性有很强的抗干扰性 能方便的利用计算机编程,实现各种能方便的利用计算机编程,实现各种 智能化设计。智能化设计。 8.2.6 8.2.6 增量调制(增量调制(DMDM) 增量调制也称调制增量调制也称调制(DM)(DM),它是一种预测编码技,它是一种预测编码技 术,是术,是PCMPCM编码的一种变形。编码的一种变形。 DMDM是对实际的采样信号与预测的采样信号之差的是对实际的采样信号与预测的采样信号之差的 极性进行编码,将极性变成极性进行编码,将极性变成“0 0”和和“1 1”这两种可这两种可 能的取值之一。如果实际的采样信号与预测
35、的采能的取值之一。如果实际的采样信号与预测的采 样信号之差的极性为样信号之差的极性为“正正”,则用,则用“1 1”表示;相表示;相 反则用反则用“0 0”表示,或者相反。表示,或者相反。 DMDM波形编码的原理波形编码的原理 在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化,在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化, 这种现象就称为增量调制器的这种现象就称为增量调制器的“斜率过载斜率过载” 。 在输入信号缓慢变化部分,即输入信号与预测信号的差值接近零在输入信号缓慢变化部分,即输入信号与预测信号的差值接近零 的区域,增量调制器的输出出现随机交变的的区域,增量调制器的输出出
36、现随机交变的“0 0”和和“1 1”。这种现。这种现 象称为增量调制器的粒状噪声。象称为增量调制器的粒状噪声。 8.2.7 8.2.7 差分脉冲编码调制差分脉冲编码调制 差分脉冲编码调制(差分脉冲编码调制(DPCMDPCM)是利用样本与样本)是利用样本与样本 之间存在的信息冗余度来进行编码的一种数据之间存在的信息冗余度来进行编码的一种数据 压缩技术。压缩技术。 差值脉冲编码调制是利用信号的相关性找出可差值脉冲编码调制是利用信号的相关性找出可 以反映信号变化特征的一个差值量进行编码。以反映信号变化特征的一个差值量进行编码。 DPCMDPCM的基本工作原理的基本工作原理 根据过去的样本去估算(根据
37、过去的样本去估算(estimateestimate)下一个样本)下一个样本 信号的幅度大小,这个值称为预测值,然后对实信号的幅度大小,这个值称为预测值,然后对实 际信号值与预测值之差进行量化编码,从而就减际信号值与预测值之差进行量化编码,从而就减 少了表示每个样本信号的位数。少了表示每个样本信号的位数。 它与脉冲编码调制(它与脉冲编码调制(PCMPCM)不同处在于,)不同处在于,PCMPCM是直是直 接对采样信号进行量化编码,而接对采样信号进行量化编码,而DPCMDPCM是对实际信是对实际信 号值与预测值之差进行量化编码。号值与预测值之差进行量化编码。 DPCMDPCM的原理图的原理图 量化器
38、量化器 S(k) + 逆量化器逆量化器 预测器预测器 d(k) I(k) Se(k-1) 8比特比特 PCM 样本样本k PCM 样本样本k-1 Se(k-1) dq(k) Sr(k) + + - 目录目录 8.3 8.3 数字媒体压缩标准数字媒体压缩标准 8.3.1 8.3.1 声音压缩标准声音压缩标准 MP3MP3是是MPEG-1MPEG-1的标准草案中音频编码的的标准草案中音频编码的Layer 3Layer 3。 MP3 MP3 最大特点是能以较小的比特率、较大压缩比最大特点是能以较小的比特率、较大压缩比 达到近乎完美的达到近乎完美的CDCD音质,制作简单,交流方便。音质,制作简单,交流
39、方便。 MP3MP3压缩编码是一个国际性全开放的编码方案压缩编码是一个国际性全开放的编码方案, ,其其 编码算法流程大致分为时频映射、心理声学模型、编码算法流程大致分为时频映射、心理声学模型、 量化编码三大功能模块,这三个功能模块是实现量化编码三大功能模块,这三个功能模块是实现 MP3 MP3 编码的关键。编码的关键。 MP3MP3编码框图编码框图 MP4MP4 MP4MP4是是MPEG-2 AAC(ISO/IEC 13818-7)MPEG-2 AAC(ISO/IEC 13818-7)技术技术 (Advanced Audio Coding)(Advanced Audio Coding)。 MP
40、4MP4的特点是音质更加完美而压缩比更大。它增加的特点是音质更加完美而压缩比更大。它增加 了诸如对立体声的完美再现、比特流效果音扫描、了诸如对立体声的完美再现、比特流效果音扫描、 多媒体控制、降噪等多媒体控制、降噪等MP3MP3没有的特性,使得在音频没有的特性,使得在音频 压缩后仍能完美的再现压缩后仍能完美的再现CDCD的音质。的音质。 8.3.2 8.3.2 图像压缩标准图像压缩标准 JPEGJPEG是国际标准组织是国际标准组织(ISO)(ISO)和国际电工委员会和国际电工委员会 (IECIEC)制定出的第一套国际静态图像压缩标准:)制定出的第一套国际静态图像压缩标准: ISO/IEC 10
41、918ISO/IEC 109181 1号标准号标准 “多灰度连续色调静态多灰度连续色调静态 图像压缩编码图像压缩编码”俗称为俗称为JPEGJPEG,以其优异的性能,以其优异的性能, 该标准一直到当前仍被因特网、数码相机等很多该标准一直到当前仍被因特网、数码相机等很多 领域广泛应用。领域广泛应用。 JPEGJPEG包含两种基本的压缩算法:无损压缩算法包含两种基本的压缩算法:无损压缩算法 (基于差分脉冲调制(基于差分脉冲调制 )和有损压缩算法(基于离)和有损压缩算法(基于离 散余弦变换散余弦变换 )。)。 可达到可达到15201520的压缩比。的压缩比。 JPEGJPEG算法框图算法框图 JPEG
42、JPEG算法压缩编码步骤算法压缩编码步骤 (1 1)使用正向离散余弦变换()使用正向离散余弦变换(FDCTFDCT)把信息从空间域变换)把信息从空间域变换 成频率域的数据,并利用数据的频率特性进行处理;成频率域的数据,并利用数据的频率特性进行处理; (2 2)使用加权函数对)使用加权函数对DCTDCT系数进行量化,这个加权函数对系数进行量化,这个加权函数对 于人的视觉系统是最佳的;于人的视觉系统是最佳的; (3 3)使用霍夫曼可变字长熵编码器对量化系数进行编码。)使用霍夫曼可变字长熵编码器对量化系数进行编码。 JPEGJPEG压缩编码算法的主要计算步骤压缩编码算法的主要计算步骤 (1 1)正向
43、离散余弦变换)正向离散余弦变换(FDCT)(FDCT)。 (2 2)量化)量化(quantization)(quantization)。 (3 3)Z Z字形编码字形编码(zigzag scan)(zigzag scan)。 (4 4)使用差分脉冲编码调制()使用差分脉冲编码调制(DPCMDPCM)对直流系数)对直流系数 (DCDC)进行编码。)进行编码。 (5 5)使用行程长度编码()使用行程长度编码(RLERLE)对交流系数)对交流系数(AC)(AC)进进 行编码。行编码。 (6 6)熵编码)熵编码(entropy coding)(entropy coding)。 JPEG 2000 JP
44、EG 2000 JPEG 2000 JPEG 2000 弥补了传统弥补了传统JPEGJPEG压缩技术缺陷,压缩技术缺陷, 有以下优点:有以下优点: 高压缩率高压缩率 支持无损压缩和有损压缩支持无损压缩和有损压缩 渐进传输渐进传输 对感兴趣区域压缩对感兴趣区域压缩 8.3.3 8.3.3 运动图像压缩标准运动图像压缩标准 1 1、MPEGMPEG标准标准 运动图像专家组运动图像专家组MPEGMPEG是由国际标准化组织是由国际标准化组织ISOISO 和国际电工委员会和国际电工委员会IECIEC联合成立的,负责开发电视联合成立的,负责开发电视 图像数据和声音数据的编码、解码和它们的同步图像数据和声音
45、数据的编码、解码和它们的同步 标准。这个专家组开发的标准称为标准。这个专家组开发的标准称为MPEGMPEG标准。标准。 MPEG-1 MPEG-1 标准标准 MPEG-1 MPEG-1 标准于标准于19931993年公布,用于传输年公布,用于传输1.5Mbps1.5Mbps数据传数据传 输率的数字存储媒体运动图像及其伴音的编码。输率的数字存储媒体运动图像及其伴音的编码。 该标准包括五个部分,分别为:系统、电视图像、音该标准包括五个部分,分别为:系统、电视图像、音 频、一致性测试和软件模拟。频、一致性测试和软件模拟。 MPEG-1MPEG-1的数据流包含:图像流、伴音流和系统流三种的数据流包含:
46、图像流、伴音流和系统流三种 成分。成分。 MPEG-1 MPEG-1 译码器方框图译码器方框图 图像流包含画面信息,伴音流包含声音信息,系统图像流包含画面信息,伴音流包含声音信息,系统 流实现图像和伴音的同步,所有播放流实现图像和伴音的同步,所有播放MPEGMPEG图像和伴图像和伴 音数据所需的时钟信息都包含在系统流中。音数据所需的时钟信息都包含在系统流中。 MPEG-2 MPEG-2 标准标准 MPEG-2MPEG-2标准包括了系统、电视图像、音频、一致性标准包括了系统、电视图像、音频、一致性 测试、软件模拟、数字存储媒体命令和控制扩展协测试、软件模拟、数字存储媒体命令和控制扩展协 议、先进
47、声音编码、编码器实时接口扩展标准、议、先进声音编码、编码器实时接口扩展标准、 DSM-CCDSM-CC一致性扩展测试等。一致性扩展测试等。 MPEG-2MPEG-2的主要特点是:的主要特点是: 1 1)MPEG-2MPEG-2解码器兼容解码器兼容MPEG-1MPEG-1和和MPEG-2MPEG-2标准。标准。 2 2)其视频数据速率为)其视频数据速率为3 Mb/s3 Mb/s15Mb/s15Mb/s,基本分辨率,基本分辨率 为为720720576576像素,每秒可播放像素,每秒可播放3030帧画面。帧画面。 3 3)可以)可以301301或更低的压缩比提供具有广播级质量或更低的压缩比提供具有广
48、播级质量 的视频图像。的视频图像。 4 4)允许在画面质量、存储容量和带宽之间选择,在)允许在画面质量、存储容量和带宽之间选择,在 一定范围内改变压缩比。一定范围内改变压缩比。 MPEG-2MPEG-2的系统模型的系统模型 MPEG-4 MPEG-4 标准标准 MPEG-4MPEG-4标准于标准于19981998年年1111月公布,是各种音频月公布,是各种音频/ /视频视频 对象的编码,包括了系统、电视图像、音频、一对象的编码,包括了系统、电视图像、音频、一 致性测试和参考软件、传输多媒体集成框架等。致性测试和参考软件、传输多媒体集成框架等。 MPEG-4MPEG-4为多媒体数据压缩编码提供的
49、是一种格式、为多媒体数据压缩编码提供的是一种格式、 一种框架,而不是具体算法,以建立一种更自由一种框架,而不是具体算法,以建立一种更自由 的通信与开发环境。的通信与开发环境。 MPEG-4MPEG-4的目标是支持多种多媒体的应用,特别是的目标是支持多种多媒体的应用,特别是 多媒体信息基于内容的检索和访问,可以根据不多媒体信息基于内容的检索和访问,可以根据不 同的应用需求现场配置解码器。其编码系统也是同的应用需求现场配置解码器。其编码系统也是 开放的,可以随时加入新的有效的算法模块。开放的,可以随时加入新的有效的算法模块。 MPEG-4 MPEG-4 系统示意图系统示意图 MPEG-7 MPEG
50、-7 标准标准 MPEG-7MPEG-7标准于标准于20012001年公布,称为多媒体内容描述接口,年公布,称为多媒体内容描述接口, 包括系统、描述定义语言、电视图像、音频、多媒体包括系统、描述定义语言、电视图像、音频、多媒体 描述框架、参考软件以及一致性测试七个部分。描述框架、参考软件以及一致性测试七个部分。 MPEG-7MPEG-7标准的目的是产生一个描述多媒体内容的标准,标准的目的是产生一个描述多媒体内容的标准, 支持对多媒体信息在不同程度层面上的解释和理解,支持对多媒体信息在不同程度层面上的解释和理解, 从而使其可以根据用户的需要进行传递和存取。从而使其可以根据用户的需要进行传递和存取。 MPEG-7MPEG-7注重的是提供视听信息内容的描述方案,并不注重的是提供视听信息内容的描述方案,并不 包括针对不同应用的特征提取方法和搜索引擎。包括针对不同应用的特征提取方法和搜索引擎。 MPEG-21
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 烘焙行业考试题及答案
- 技术需求调研及系统解决方案框架
- 飞机租赁考试题及答案
- 流程化项目监控工具
- (正式版)DB15∕T 3388-2024 《柠条饲料加工与调制技术规程》
- 吊车等级考试题及答案
- 电工实测考试题及答案
- 工业自动化生产线升级合作协议
- 财务管理标准化报告撰写指导手册
- (正式版)DB15∕T 3237-2023 《沙葱常规种生产技术规程》
- 部编版六年级语文上册重点难点解析
- 电力监理劳务合同范本
- 2025河北工勤人员技师考试消毒员训练题及答案
- 2025年供水管网改造工程可行性研究报告
- 肖婷民法总则教学课件
- 特产专卖店创业经营计划书
- 砂石料物资供应服务保障方案
- 顺丰转正考试题库及答案
- 2025至2030玉米糖浆行业产业运行态势及投资规划深度研究报告
- 2025年秋招:邮储银行笔试真题及答案(可下载)
- 走访礼品管理办法
评论
0/150
提交评论