第三章多媒体数据压缩技术_第1页
第三章多媒体数据压缩技术_第2页
第三章多媒体数据压缩技术_第3页
第三章多媒体数据压缩技术_第4页
第三章多媒体数据压缩技术_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第三三章章 多媒体数据压缩技术多媒体数据压缩技术n第一节第一节 多媒体数据压缩技术概述多媒体数据压缩技术概述n第二节第二节 静态图像压缩编码国际标准静态图像压缩编码国际标准JPEGJPEGn第三节第三节 运动图像压缩编码国际标准运动图像压缩编码国际标准MPEGMPEGn一、多媒体数据压缩编码的必要性一、多媒体数据压缩编码的必要性n二、多媒体数据压缩的可能性二、多媒体数据压缩的可能性 n三、数据压缩技术的分类三、数据压缩技术的分类n四、数据压缩技术的性能指标四、数据压缩技术的性能指标第一节第一节 多媒体数据压缩技术概述多媒体数据压缩技术概述 信息时代的重要特征是信息的数字化信息时代的重要特征是

2、信息的数字化。 早期的计算机系统采用模拟方式表示信息早期的计算机系统采用模拟方式表示信息,但存在着明显的缺点:但存在着明显的缺点:u 经常会产生噪音和信号丢失,并且在复经常会产生噪音和信号丢失,并且在复制过程中逐步积累噪音和误差制过程中逐步积累噪音和误差。u 模拟信号不适合数字计算机加工处理模拟信号不适合数字计算机加工处理。一、多媒体数据压缩编码的必要性一、多媒体数据压缩编码的必要性n 数字化后未经压缩的视频和音频等媒数字化后未经压缩的视频和音频等媒体信息的数据量是非常大的体信息的数据量是非常大的。 1. 1.图像数据量的大小可用下面的公式来计图像数据量的大小可用下面的公式来计算:算: 图像数

3、据量图像的总像素色彩深度图像数据量图像的总像素色彩深度 8 8 ( 单 位 为( 单 位 为 B y t eB y t e , 简 写 为简 写 为 B B ) 例如,一幅例如,一幅640640480480、2424位(位(bitbit)真彩真彩色 的 图 像 , 其 文 件 大 小 为 :色 的 图 像 , 其 文 件 大 小 为 :6406404804802424 8 8 921.6921.6KBKB一、多媒体数据压缩编码的必要性一、多媒体数据压缩编码的必要性n 2. 2. 双通道立体声激光唱盘,采用脉冲双通道立体声激光唱盘,采用脉冲码调制采样,采样频率为码调制采样,采样频率为44.144

4、.1KHzKHz,采样采样精度精度1616位,其一秒钟时间内的采样数据位,其一秒钟时间内的采样数据量为:量为: 44.144.11000100016162 28 8176.4176.4KBKB 一个一个650650MBMB的的CDCDROMROM,大约可存大约可存1 1小时小时的音乐。的音乐。一、多媒体数据压缩编码的必要性一、多媒体数据压缩编码的必要性n 3 3. . 对动态图形和视频图像。例如对动态图形和视频图像。例如对于对于彩色电视信号,设代表光强彩色电视信号,设代表光强Y Y的带宽为的带宽为4.24.2MHzMHz、色彩色彩I I为为1.51.5MHzMHz和色饱和度和色饱和度Q Q为为

5、0.50.5MHzMHz,采样频率采样频率2 2倍原始信号频率,倍原始信号频率,各分量均被数字量化为各分量均被数字量化为8 8位,从而位,从而1 1秒钟秒钟电视信号的数据量为:电视信号的数据量为: (4.24.21.51.50.50.5)2 28 8100000010000008 812.3 12.3 MBMB一、多媒体数据压缩编码的必要性一、多媒体数据压缩编码的必要性u 容量为容量为650650MBMB的的CDCDROMROM仅能存仅能存1 1分钟分钟的原始电视数据。若为高清晰度电视的原始电视数据。若为高清晰度电视(HDTVHDTV)其其1 1秒钟数据量约为秒钟数据量约为150150MB M

6、B (1.2Gbps1.2Gbps8 8),),一张一张CDCDROMROM还存不下还存不下5 5秒钟的秒钟的HDTVHDTV图像。图像。n 巨大数字化信息的数据量对计算机存储巨大数字化信息的数据量对计算机存储资源和网络带宽有很高的要求资源和网络带宽有很高的要求,解决的办解决的办法就是要对视、音频的数据进行大量的压法就是要对视、音频的数据进行大量的压缩。播放时,传输少量被压缩的数据,接缩。播放时,传输少量被压缩的数据,接收后再对数据进行解压缩并复原收后再对数据进行解压缩并复原。u 1. 1. 空间冗余空间冗余 一幅图像中一般都有连续的有规则物体和规一幅图像中一般都有连续的有规则物体和规则背景的

7、颜色分布,使图像数据在空间上表现则背景的颜色分布,使图像数据在空间上表现出相关性,我们可以通过改变物体表面颜色的出相关性,我们可以通过改变物体表面颜色的像素存储方式来利用空间相关性,达到减少数像素存储方式来利用空间相关性,达到减少数据量的目的。据量的目的。例: 图象中的“A”是一个规则物体。光的亮 度、饱和度及颜色都一样,因此,数据A有很大的冗余。 二、多媒体数据压缩的可能性二、多媒体数据压缩的可能性u 2. 2. 时间冗余时间冗余 图像序列中的相邻帧图像往往包含相同的图像序列中的相邻帧图像往往包含相同的背景和移动物体,只不过移动物体所在的空间背景和移动物体,只不过移动物体所在的空间位置略有不

8、同。我们把一帧图像中的某物体或位置略有不同。我们把一帧图像中的某物体或场景可以由其他帧图像中的物体或场景进行处场景可以由其他帧图像中的物体或场景进行处理后重构出来,可以大大减少时间冗余。理后重构出来,可以大大减少时间冗余。u3 3. . 结构冗余结构冗余 有些图像从大体上看存在着非常强的纹理结有些图像从大体上看存在着非常强的纹理结构,这些纹理具有较强的相似性称此为结构冗构,这些纹理具有较强的相似性称此为结构冗余。余。 如草席图结构上存在冗余。二、多媒体数据压缩的可能性二、多媒体数据压缩的可能性u4. 4. 知识冗余知识冗余 有许多图像的理解与某些基础知识有相当大的有许多图像的理解与某些基础知识

9、有相当大的相关性。这类规律性的结构可由先验知识和背景知相关性。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。识得到,我们称此类冗余为知识冗余。 例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上 u 5. 5. 视觉冗余视觉冗余 人类视觉系统对图像场的敏感性是非均匀和非人类视觉系统对图像场的敏感性是非均匀和非线性的,人眼并不能察觉图像场的所有变化,人类线性的,人眼并不能察觉图像场的所有变化,人类视觉系统的分辨能力约为视觉系统的分辨能力约为6464灰度等级,而一般图像灰度等级,而一般图像量化采用量化采用256256灰度等级,这类冗余称视觉冗余灰度等级

10、,这类冗余称视觉冗余。二、多媒体数据压缩的可能性二、多媒体数据压缩的可能性u6. 6. 听觉冗余听觉冗余u 人耳对不同频率的声音的敏感性是不同的,人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。特别关注,因此存在听觉冗余。 二、多媒体数据压缩的可能性二、多媒体数据压缩的可能性n 根据多媒体数据冗余类型的不同,解码后数据根据多媒体数据冗余类型的不同,解码后数据与原始数据是否完全一致、质量有无损失来进行与原始数据是否完全一致、质量有无损失来进行分类,压缩方法可被分为有失真编码和无失真编分类,压缩方法可

11、被分为有失真编码和无失真编码两大类。码两大类。u 无失真压缩法也称无损压缩,一般是利用数无失真压缩法也称无损压缩,一般是利用数据的统计特性来进行数据压缩,对数据流中出据的统计特性来进行数据压缩,对数据流中出现的各种数据进行现的各种数据进行概率统计编码概率统计编码,使得数据流,使得数据流经压缩后形成的代码流经压缩后形成的代码流总位数大大减少总位数大大减少。u无失真压缩的特点是压缩比较小,大约在无失真压缩的特点是压缩比较小,大约在2l2l至至5l5l之间,主要用于之间,主要用于文本数据、程序代码文本数据、程序代码和和某些要求严格不丢失信息的环境中,常用的无某些要求严格不丢失信息的环境中,常用的无失

12、真压缩编码有如哈夫曼编码等。失真压缩编码有如哈夫曼编码等。三、数据压缩技术的分类三、数据压缩技术的分类三、数据压缩技术的分类三、数据压缩技术的分类u 有失真压缩法也称有损压缩,允许一定程有失真压缩法也称有损压缩,允许一定程度的失真,会丢失一些人眼和人耳所不敏感度的失真,会丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢的图像或音频信息,而且丢失的信息不可恢复,即解压缩后并不能完全恢复成原来的数复,即解压缩后并不能完全恢复成原来的数据,但是根据人的视觉和听觉的主观评价是据,但是根据人的视觉和听觉的主观评价是可以接受的,有失真压缩法的冗余压缩取决可以接受的,有失真压缩法的冗余压缩取

13、决于于初始信号的类型初始信号的类型、前后的相关性前后的相关性、信号的信号的语义内容语义内容等,压缩比可以从几到几百倍。等,压缩比可以从几到几百倍。u常用的有失真压缩编码技术有预测编码、变常用的有失真压缩编码技术有预测编码、变换编码、模型编码、混合编码方法等。换编码、模型编码、混合编码方法等。u主要用于压缩主要用于压缩图像、声音图像、声音等信息。等信息。n 常用的图像和视频压缩方法如图常用的图像和视频压缩方法如图2-12-1所示:所示:哈夫曼编码哈夫曼编码行程编码行程编码算术编码算术编码LZW编码编码图像和视频压缩方法图像和视频压缩方法DCT编码编码小波变换小波变换子带编码子带编码无失真压缩无失

14、真压缩有失真压缩有失真压缩预测编码预测编码变换编码变换编码模型编码模型编码运动补偿运动补偿混合编码混合编码分形编码分形编码JPEGMPEGH. 261三、数据压缩技术的分类三、数据压缩技术的分类四、数据压缩技术的性能指标四、数据压缩技术的性能指标 节省图象或视频的存储容量,增加访问速节省图象或视频的存储容量,增加访问速度,使数字视频能在度,使数字视频能在PCPC机上实现,需要进行视机上实现,需要进行视频和图象的压缩。频和图象的压缩。 有三个关键参数评价一个压缩系统有三个关键参数评价一个压缩系统u压缩比压缩比u图象质量图象质量u压缩和解压的速度压缩和解压的速度u 另外也必须考虑每个压缩算法所需的

15、另外也必须考虑每个压缩算法所需的硬硬件和软件。件和软件。 1压缩比压缩比n压缩性能常常用压缩比定义(输入数据压缩性能常常用压缩比定义(输入数据和输出数据比)和输出数据比)n例:例:512512480480, 24bit/pixel(bpp)24bit/pixel(bpp)u输出输出15000byte 15000byte u输入输入737280byte 737280byte u压缩比压缩比7372801500049492图象质量图象质量n压缩方法:压缩方法: u无损压缩无损压缩 (图象质量不变)(图象质量不变)u有损压缩有损压缩u有损压缩:失真情况很难量化,只能对测有损

16、压缩:失真情况很难量化,只能对测试的图象进行估计。试的图象进行估计。 模拟图象质量的指标:信噪比、分辨率 必须观察实际图象以后估计。3压缩解压速度压缩解压速度n在许多应用中,压缩和解压可能不同时用,在在许多应用中,压缩和解压可能不同时用,在不同的位置不同的系统中。所以,压缩、解压不同的位置不同的系统中。所以,压缩、解压速度分别估计。速度分别估计。n静态图象中,压缩速度没有解压速度严格;动静态图象中,压缩速度没有解压速度严格;动态图象中,压缩、解压速度都有要求,因为需态图象中,压缩、解压速度都有要求,因为需实时地从摄像机或实时地从摄像机或VCRVCR中抓取动态视频。中抓取动态视频。4硬软件系统硬

17、软件系统n有些压缩解压工作可用软件实现。设计系统时有些压缩解压工作可用软件实现。设计系统时必须充分考虑:必须充分考虑:u算法复杂算法复杂 压缩解压过程长压缩解压过程长u算法简单算法简单 压缩效果差压缩效果差 目前有些特殊硬件可用于加速压缩目前有些特殊硬件可用于加速压缩/ /解压。解压。 硬接线系统速度快,但各种选择在初始设计时硬接线系统速度快,但各种选择在初始设计时已确定,一般不能更改。因此在设计硬接线压已确定,一般不能更改。因此在设计硬接线压缩缩/ /解压系统时必须先将算法标准化。解压系统时必须先将算法标准化。2.2 静态图像压缩国际标准静态图像压缩国际标准-JPEGn 2.2.1 2.2.

18、1静态图像压缩编码静态图像压缩编码JPEGJPEG概况概况n 2.2.2 JPEG2.2.2 JPEG压缩编码的基本系统压缩编码的基本系统u(1 1) 数据块准备数据块准备u(2 2) 离散余弦正变换离散余弦正变换DCTDCTu(3 3) 量化量化u(4 4) DCTDCT系数系数Z Z形扫描形扫描u(5 5) DCDC系数编码系数编码u(6 6) ACAC系数编码系数编码n2.2.3 JPEG JPEG压缩编码的扩展系统压缩编码的扩展系统2.2.1静态图像压缩编码JPEG概况 JPEG(Joint Photographic Experts JPEG(Joint Photographic Ex

19、perts Group) Group) 是一个由是一个由 ISOISO和和IECIEC两个组织机构两个组织机构联合组成的一个专家组,负责制定联合组成的一个专家组,负责制定静态的静态的数字图象数据压缩编码标准数字图象数据压缩编码标准,因此又称为,因此又称为JPEGJPEG标准。标准。JPEGJPEG是一个适用范围很广的静是一个适用范围很广的静态图象数据压缩标准,适应于彩色和单色态图象数据压缩标准,适应于彩色和单色多灰度或连续色调静止数字图像的压缩标多灰度或连续色调静止数字图像的压缩标准。准。 n JPEGJPEG是国际上彩色、灰度、静止图像的第是国际上彩色、灰度、静止图像的第一个国际标准。用来在

20、低分辨率到高分辨率一个国际标准。用来在低分辨率到高分辨率的较宽范围内支持较高的图像分辨率。它不的较宽范围内支持较高的图像分辨率。它不仅适用于黑白、彩色照片和印刷图片(仅适用于黑白、彩色照片和印刷图片(高高分分辨率)等静止图像的压缩,而且适用于传送辨率)等静止图像的压缩,而且适用于传送彩色传真、电话会议、新闻图片(彩色传真、电话会议、新闻图片(低低分辨率)分辨率)的静止图像的压缩,以及电视图像序列的帧的静止图像的压缩,以及电视图像序列的帧内图像的压缩编码也常采用内图像的压缩编码也常采用JPEGJPEG压缩标准。压缩标准。2.2.1静态图像压缩编码JPEG概况2.2.1静态图像压缩编码JPEG概况

21、n它满足以下要求:n(1)达到或接近当前压缩比图像保真度的技术水平,能覆盖一个较宽的图像质量等级范围,能得到“很好”到“极好”的评估,与原始图像相比,人的视觉难以区分。n(2)能适用于任何种类的连续色调的图像,且长宽比都不受限制,同时也不受限于景物内容、图像的复杂程度和统计特性等。n(3)计算机的复杂性是可控制的,其软件可在各种CPU上完成,算法也可用硬件实现。n(4)JPEG算法具有4种操作方式。n第一,为顺序编码,每个图像分量按从左到右,从上到下扫描,一次扫描完成编码;n第二,累进编码,图像编码在多次扫描中完成,接收端收到图像是一个由粗糙到清晰的过程;n第三,无失真编码;n第四,分层编码,

22、对图像按多个分辨率编码,接收端按其显示分辨率有选择地解码。n 变换编码的基本思路:变换编码的基本思路:u 1 1编码时略去某些能量很小的高频分量以降低码编码时略去某些能量很小的高频分量以降低码率。率。u 2 2变换编码还可以根据人眼对不同频率分量的敏变换编码还可以根据人眼对不同频率分量的敏感程度而对不同系数采用不同的感程度而对不同系数采用不同的量化量化台阶,以进一台阶,以进一步提高压缩比。步提高压缩比。n JPEGJPEG开发的压缩编码算法有三种工作方式:开发的压缩编码算法有三种工作方式:u 1 1基本系统(单次扫描)。基本系统(单次扫描)。u 2 2扩展系统(常采用累进编码或分层编码方式)。

23、扩展系统(常采用累进编码或分层编码方式)。u 3 3无损压缩编码。无损压缩编码。2.2.1静态图像压缩编码JPEG概况2.2.2 JPEG 压缩编码的基本系统压缩编码的基本系统n 下面是一个基于离散余弦正变换下面是一个基于离散余弦正变换DCTDCT的有失的有失真真JPEGJPEG编码的工作原理,图编码的工作原理,图2-112-11是基于是基于DCTDCT的的JPEGJPEG编码的过程框图。编码的过程框图。 2.2.2 JPEG 压缩编码的基本系统压缩编码的基本系统n 顺序编码运行方式顺序编码运行方式 2.2.3 JPEG 压缩编码的扩展系统压缩编码的扩展系统n 1. 1. 基于基于DCTDCT

24、的累进编码运行方式的累进编码运行方式累进编码方式要扫描多次累进编码方式要扫描多次2.2.3 JPEG 压缩编码的扩展系统压缩编码的扩展系统n2. 2. 分层编码运行方分层编码运行方式式u 水平方向和垂直方水平方向和垂直方向分辨率以向分辨率以2 2的倍数的倍数因子下降(降低原始因子下降(降低原始图像的空间分辨率),图像的空间分辨率),导出若干低分辨率的导出若干低分辨率的原图像,分层后再采原图像,分层后再采用用JPEGJPEG的压缩编码方的压缩编码方法进行编码,随后以法进行编码,随后以上重复步骤,直到图上重复步骤,直到图像达到完整的分辨率像达到完整的分辨率编码为止。编码为止。2.2.3 JPEG

25、压缩编码的扩展系统压缩编码的扩展系统n 3. 3. 无损压缩预测编码运行方式无损压缩预测编码运行方式源图像源图像数据数据表说明表说明预测器预测器熵编码器熵编码器压缩后压缩后图像数据图像数据无损压缩预测编码无损压缩预测编码运行方式运行方式Pxabcx选选择择值值预预测测选选择择值值预预测测0不不预预测测4abc1a5a(bc)/22b6b(ac)/23c7(ab)/22.3 运动图像压缩编码运动图像压缩编码的国际标准的国际标准MPEGn 2.3.1 2.3.1运动图像压缩编码运动图像压缩编码MPEGMPEG概况概况n 2.3.2 MPEG 2.3.2 MPEG 标准简介标准简介n 2.3.3 M

26、PEG 2.3.3 MPEG 标准化算法标准化算法u帧间编码技术帧间编码技术u运动补偿技术运动补偿技术n 2.3.4 2.3.4 MPEGMPEG视频压缩视频压缩数据流结构数据流结构n 2.3.5 MPEG2.3.5 MPEG音频简述音频简述nMPEGMPEG本是本是Moving Pictures Experts Group,Moving Pictures Experts Group,动态图动态图象专家组的英文缩写,这个专家组始建于象专家组的英文缩写,这个专家组始建于19881988年,年,专门负责为专门负责为CDCD建立视频和音频标准,其成员均为视建立视频和音频标准,其成员均为视频、音频及系

27、统领域的技术专家。频、音频及系统领域的技术专家。 n对于今天我们所范指的对于今天我们所范指的MPEG-XMPEG-X版本,是指一组由版本,是指一组由ITU(International Telecommunications Union)ITU(International Telecommunications Union)和和ISO(International Standards Organization)ISO(International Standards Organization)制定发布的制定发布的视频视频、音频音频、数据的压缩标准。、数据的压缩标准。 2.3.1运动图像压缩编码MPEG概

28、况2.3.1运动图像压缩编码MPEG概况nMPEGMPEG的缔造者们原先打算开发四个版本:的缔造者们原先打算开发四个版本:MPEG1-MPEG4MPEG1-MPEG4,以适用于不同带宽和数字影像质量的要求。后由于以适用于不同带宽和数字影像质量的要求。后由于MPEG3MPEG3被放弃,所以现存只有三个版本的被放弃,所以现存只有三个版本的MPEGMPEG:MPEG-1MPEG-1,MPEG-2MPEG-2,MPEG-4MPEG-4。n总体来说,总体来说,MPEGMPEG在三方面优于其他压缩在三方面优于其他压缩/ /解压缩方案。解压缩方案。u首先,它做为一个国际化的标准,首先,它做为一个国际化的标准

29、,MPEGMPEG具有很好的具有很好的兼容性兼容性。u其次,其次,MPEGMPEG能够比其他算法提供更好的能够比其他算法提供更好的压缩比压缩比,最,最高可达高可达200:1200:1。u再次,再次,MPEGMPEG在提供高压缩比的同时,对数据的在提供高压缩比的同时,对数据的损失损失很小很小。2.3.1运动图像压缩编码MPEG概况n MPEGMPEG专家组专家组工作将整个过程分为三步:工作将整个过程分为三步:u 要求要求u 提出要求有双重的目的:目标提出要求有双重的目的:目标, , 竞争的原则竞争的原则。u 竟争竟争u 提出了提出了1414个不同的方案个不同的方案。u 集中集中u 测试和评价,并

30、综合出一个最佳方案。测试和评价,并综合出一个最佳方案。2.3.2 MPEG 标准简介标准简介MPEGMPEG标准有:标准有: uMPEG-1MPEG-1:19921992年正式发布的数字电视标年正式发布的数字电视标准准; ; uMPEG-2MPEG-2:数字电视标准:数字电视标准; ; uMPEG-3MPEG-3:于:于19921992年合并到高清晰度电视年合并到高清晰度电视(HDTVHDTV)工作组)工作组; ; uMPEG-4MPEG-4:19991999年发布的多媒体应用标准年发布的多媒体应用标准; ; uMPEG-7MPEG-7:多媒体内容描述接口标准,:多媒体内容描述接口标准, n活

31、动图像专家组在活动图像专家组在9191年年1111月提出了月提出了“用于数据用于数据速率大约高达速率大约高达1.5MB/s1.5MB/s的数字存储媒体的电视图的数字存储媒体的电视图像和伴音编码像和伴音编码”,作为,作为ISO11172ISO11172号建议,于号建议,于9292年通过,习惯上通称年通过,习惯上通称MPEG-1MPEG-1标准。标准。n此标准主要是针对当时具有这种数据舆率的此标准主要是针对当时具有这种数据舆率的CD-CD-ROMROM开发的,用于在开发的,用于在CD-ROMCD-ROM上存储数字影视和上上存储数字影视和上传输数字影。传输数字影。uPALPAL制为制为3523522

32、88pixel/frame288pixel/frame25frame/s25frame/suNTSCNTSC制为制为352352240pixel/frame240pixel/frame30frame/s 30frame/s 。1. MPEG1. MPEG1 1标准标准nMPEG-1MPEG-1主要用于活动图像的数字存储,它包括主要用于活动图像的数字存储,它包括MPEG-1MPEG-1系统、系统、MPEG-1MPEG-1视频、视频、MPEG-1MPEG-1音频三音频三个部分个部分nMPEG-1 MPEG-1 系统系统:将视频信号及其伴音以可接收的重建质:将视频信号及其伴音以可接收的重建质量压缩到

33、约量压缩到约1.5MB/s1.5MB/s的码率,并复合成一个单一的的码率,并复合成一个单一的MPEGMPEG位流,同时保证视频和音频的同步。位流,同时保证视频和音频的同步。nMPEG-1MPEG-1视频视频:用于满足日益增长的多媒体存储与表现:用于满足日益增长的多媒体存储与表现的需要,即以一种通用格式在不同的数字存储介质如的需要,即以一种通用格式在不同的数字存储介质如VCDVCD、CDCD、DATDAT、硬盘和光盘中表示压缩的视频。该压、硬盘和光盘中表示压缩的视频。该压缩算法采用三个基本技术:运动补偿预测编码、缩算法采用三个基本技术:运动补偿预测编码、DCTDCT技技术和变字长编码技术。术和变

34、字长编码技术。nMPEG-1MPEG-1音频音频:规定声音数据的编码和解码。:规定声音数据的编码和解码。1. MPEG1. MPEG1 1标准标准1. MPEG1 标准标准n 设计目标是把每秒传送设计目标是把每秒传送3030帧、分辨率为帧、分辨率为360360240240的亮度信号,分辨率为的亮度信号,分辨率为180180120120的色度信号的电视图像压缩成数据率为的色度信号的电视图像压缩成数据率为1.2Mbps1.2Mbps的编码图像。的编码图像。n MPEGMPEG1 1电视图像的压缩算法采用两种基电视图像的压缩算法采用两种基本压缩技术:本压缩技术:u 为减少时间冗余度,采用为减少时间冗

35、余度,采用16161616个像素个像素组成的图像块的运动补偿技术。组成的图像块的运动补偿技术。u 为了减少空间冗余度,采用为了减少空间冗余度,采用8 88 8图像化图像化的的DCTDCT变换技术。变换技术。1. MPEG1 标准标准n 声音压缩编码技术支持高压缩的音频数据流,声音压缩编码技术支持高压缩的音频数据流,其采样率为其采样率为4848,44.l44.l或或22KHz22KHz,量化精度为,量化精度为1616位的位的声音压缩声音压缩( (如如CD-DACD-DA音频音频1.41.4MbpsMbps压缩为压缩为0.1920.192Mbps) Mbps) 。n 支持两个声道,可设置成单声道(

36、支持两个声道,可设置成单声道(monomono)、双)、双声道(声道(dualdual)或立体声()或立体声(stereostereo)。例如采用)。例如采用MPEGMPEG1 1算法可以把位速率降到算法可以把位速率降到 0.192 Mbps0.192 Mbps。n MPEGMPEG1 1系统采用多路复合技术,把数字电视图系统采用多路复合技术,把数字电视图像和声音复合成单一数据位流,像和声音复合成单一数据位流,MPEGMPEG1 1的数据位的数据位流分成内外两层,外层为系统层,内层为压缩层。流分成内外两层,外层为系统层,内层为压缩层。2. MPEG2 标准标准nMPEG-2MPEG-2的标准号

37、为的标准号为ISO/IEC13818ISO/IEC13818,标准名称为,标准名称为“信息技术信息技术电视图像和伴音信息通用编码电视图像和伴音信息通用编码”。它是声音和图像信号数字化的基础标准,将广它是声音和图像信号数字化的基础标准,将广泛用于泛用于数字电视(包括数字电视(包括HDTVHDTV)及数字声音广播、)及数字声音广播、数字图像与声音信号的传输,多媒体数字图像与声音信号的传输,多媒体等领域。等领域。nMPEG-2MPEG-2标准是一个直接与数字电视广播有关的标准是一个直接与数字电视广播有关的高质量图像和声音编码标准,高质量图像和声音编码标准,MPEG-2MPEG-2视频利用视频利用网络

38、提供的更高的宽带来支持具有更高分辨率网络提供的更高的宽带来支持具有更高分辨率图像的压缩和更高的图像质量。图像的压缩和更高的图像质量。 2. MPEG2 标准标准n 设计目标是把以设计目标是把以166Mbps166Mbps速度传送每秒速度传送每秒3030帧、帧分辨率为帧、帧分辨率为720720572572高分辨率的广高分辨率的广播级视频图像,压缩后的传送数据率约为播级视频图像,压缩后的传送数据率约为3Mbps3Mbps。n MPEGMPEG2 2标准是标准是HDTVHDTV、DVDDVD以及新型数字以及新型数字式交互有线网所采用的数字视频压缩标准。式交互有线网所采用的数字视频压缩标准。n MPE

39、GMPEG2 2标准是标准是MPEGMPEG1 1标准的扩充、丰标准的扩充、丰富和完善,并与富和完善,并与MPEGMPEG1 1标准相兼容。标准相兼容。2. MPEG2 标准标准 MPEGMPEG2 2标准主要分为四部分:标准主要分为四部分:u 第一部分:系统。第一部分:系统。 第二部分:视频。第二部分:视频。u 第三部分:音频。第三部分:音频。 第四部分:一致性测试。第四部分:一致性测试。u MPEGMPEG2 2标准使计算机处理全彩色、全屏幕、标准使计算机处理全彩色、全屏幕、全动态的视频图像,同时也能使有线、无线、全动态的视频图像,同时也能使有线、无线、CDCDROMROM等传输和存储介质

40、有效地传送视频等传输和存储介质有效地传送视频图像,并且具有图像,并且具有CDCD的音质,使多媒体技术与的音质,使多媒体技术与通信和广播等技术结合起来。通信和广播等技术结合起来。2. MPEG2 标准标准nMPEG-2MPEG-2系统:规定电视图像数据、声音数据及其他相关数据的同系统:规定电视图像数据、声音数据及其他相关数据的同步性。步性。nMPEG-2MPEG-2视频:定义了不同的功能档次,每个档次又分为几个等级,视频:定义了不同的功能档次,每个档次又分为几个等级,来适应不同应用的要求,并保证数据的可交换性。目前共有来适应不同应用的要求,并保证数据的可交换性。目前共有5 5个个档次,依功能增强

41、逐次为:简单型、基本型、信噪比可调型、空档次,依功能增强逐次为:简单型、基本型、信噪比可调型、空间可调型、增强型。间可调型、增强型。4 4个等级为:个等级为:u (1 1)低级()低级(35235228828829.7929.79,面向,面向VCRVCR并与并与MPEG-1MPEG-1兼容)。兼容)。u (2 2)基本级()基本级( 72072046046029.7929.79或或72072057657625 25 ,面向,面向NTSCNTSC制式的视频广播信号)。制式的视频广播信号)。u (3 3)高)高14401440级(级( 14001400108010803030或或140014001

42、152115225 25 ,面向,面向HDTVHDTV)。)。u (4 4)高级()高级( 19201920108010803030或或192019201152115225 25 ,面向,面向HDTVHDTV)nMPEG-2MPEG-2音频:音频:MPEG-2MPEG-2音频的基本特性之一是与音频的基本特性之一是与MPEG-1MPEG-1音频向后兼音频向后兼容,并且支持容,并且支持5.15.1或或7.17.1通道的环绕立体声。通道的环绕立体声。3. MPEG4 标准标准n 用来支持用来支持低比特率低比特率下的多媒体通信(公下的多媒体通信(公用电信网用电信网14.414.419.2Kbps19.

43、2Kbps),还支持用于),还支持用于通信、访问和数字视听数据处理的新方法。通信、访问和数字视听数据处理的新方法。注重多媒体系统的交互性和灵活性,以最注重多媒体系统的交互性和灵活性,以最少量的数据、极低的音频少量的数据、极低的音频/ /视频压缩码率来视频压缩码率来显示建立精确的画面,达到具有高效编码、显示建立精确的画面,达到具有高效编码、高效存储与传播以及可交互操作的特性。高效存储与传播以及可交互操作的特性。3. MPEG4 标准标准n它是为视听数据的编码和交互播放开发算法和它是为视听数据的编码和交互播放开发算法和工具,是一个数据速率很低的多媒体通信标准。工具,是一个数据速率很低的多媒体通信标

44、准。其目标是要在异构网络环境下能够高度可靠地其目标是要在异构网络环境下能够高度可靠地工作,并且具有很强的交互功能。工作,并且具有很强的交互功能。n为此它引入了对象基表达的要领,用来表达视为此它引入了对象基表达的要领,用来表达视听对象(听对象(AVOAVO),并扩充了编码的数据类型,),并扩充了编码的数据类型,由自然数据对象扩展到计算机生成的合成数据由自然数据对象扩展到计算机生成的合成数据对象,采用合成对象、自然对象混合编码算法。对象,采用合成对象、自然对象混合编码算法。在实现交互功能和重用对象中引入了组合,合在实现交互功能和重用对象中引入了组合,合成和编排等重要要领成和编排等重要要领 4. M

45、PEG7 标准标准n 正式名称为多媒体内容描述接口。正式名称为多媒体内容描述接口。n MPEGMPEG7 7标准只规定信息内容描述格标准只规定信息内容描述格式,而不规定如何从原始的多媒体资料式,而不规定如何从原始的多媒体资料中抽取内容描述和查询、检索方法。中抽取内容描述和查询、检索方法。MPEGMPEG7 7标准不针对特定的应用领域,而标准不针对特定的应用领域,而是尽可能支持广泛的应用领域。是尽可能支持广泛的应用领域。n下图表示了下图表示了MPEG-7MPEG-7的处理链(的处理链(Processing Processing ChainChain), ,这是高度抽象的方框图。这是高度抽象的方框

46、图。nMPEG-7MPEG-7的应用领域很广,包括:的应用领域很广,包括:u数字图书馆。例如,图像目录、音乐词数字图书馆。例如,图像目录、音乐词典等。典等。u多媒体目录服务。例如,黄页等。多媒体目录服务。例如,黄页等。u广播式媒体的选择。例如,无线电频道、广播式媒体的选择。例如,无线电频道、TVTV频道等。频道等。u个人电子新闻服务、多媒体创作等。个人电子新闻服务、多媒体创作等。u教育、娱乐、新闻、旅游、医疗和电子教育、娱乐、新闻、旅游、医疗和电子商务等。商务等。n视频压缩算法用到了三项基本技术:视频压缩算法用到了三项基本技术:u 帧间编码帧间编码技术和技术和基于块的基于块的运动补偿运动补偿技

47、术技术。u 空间压缩(也称为帧内压缩)空间压缩(也称为帧内压缩)JPEGJPEG技术技术。u 熵编码,使用熵编码,使用HuffmanHuffman编码技术。编码技术。nMPEGMPEG标准所用的编码模型与标准所用的编码模型与JPEGJPEG的编码模型的编码模型类似,分为类似,分为5 5个阶段:个阶段:u 帧间编码和帧间编码和运动补偿、变换编码、量化、运动补偿、变换编码、量化、直流分量直流分量DCDC及交流分量及交流分量ACAC的编码和熵编码。的编码和熵编码。2.3.3 MPEG 2.3.3 MPEG 标准化算法标准化算法1. 帧间编码技术帧间编码技术n 利用的时间相关性可进一步消除视频其相邻帧

48、之利用的时间相关性可进一步消除视频其相邻帧之间具有冗余信息,提高压缩比。间具有冗余信息,提高压缩比。n 将图像分成三种类型:将图像分成三种类型:u 1. 1. 参考帧(参考帧(I I) (JPEGJPEG编码编码) 以自身图像的相关性进行压缩处理,必须要传送。以自身图像的相关性进行压缩处理,必须要传送。u 2. 2. 预测帧(预测帧(P P) 用前面的参考帧或预测帧作为用前面的参考帧或预测帧作为参照图像参照图像信息进行信息进行预测编码,预测编码,并可作为下一个预测并可作为下一个预测帧帧(B帧帧图像或图像或P帧帧图像)的参照图像图像)的参照图像信息信息。但因此可能引起。但因此可能引起预测预测误误

49、差。差。1. 帧间编码技术帧间编码技术u 3. 3. 双向预测帧双向预测帧(B B)u 又称插补帧,又称插补帧,在预测时,既可以使用在预测时,既可以使用前面或前面或后面的视频帧(后面的视频帧(I参考帧,参考帧,P预测帧)进行双向预测帧)进行双向预测,预测,也可以同时使用前后两个也可以同时使用前后两个视频帧进行预视频帧进行预测编码,但本身不测编码,但本身不能作为下一个能作为下一个预测帧的预测帧的参照参照图像图像信息信息。(200 1) 在编码时,先对在编码时,先对参考帧进行变换编码参考帧进行变换编码,然后,然后对对预测帧进行编码预测帧进行编码,再对两者之间的,再对两者之间的双向预测帧双向预测帧进

50、行编码进行编码,这个过程对随后的下一个预测帧和双,这个过程对随后的下一个预测帧和双向预测帧重复,直到完成所有帧的编码为止。向预测帧重复,直到完成所有帧的编码为止。1. 帧间编码技术帧间编码技术n 采用下述四种预测技术:采用下述四种预测技术:n 帧内编码帧内编码 前向预测前向预测n 后向预测后向预测 双向预测双向预测 u 图图3-3-2020显示一个典型的视频显示一个典型的视频图像序列次序图像序列次序。 I B B P B B P B B P B B P B B I B B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 I I帧和帧和P P帧间有两个帧

51、间有两个B B帧帧每十五帧有一幅每十五帧有一幅I I帧图像(帧图像(0.50.5秒)秒)1. 帧间编码技术帧间编码技术n 编码器的输出编码器的输出视频视频图像序列排列顺序。图像序列排列顺序。1 4 2 3 7 5 6 10 81 4 2 3 7 5 6 10 8I P B B P B B P BI P B B P B B P B9 13 11 12 16 14 159 13 11 12 16 14 15 B P B B I B BB P B B I B Bn 发送端编码器的输出到接收端解码器发送端编码器的输出到接收端解码器的输入端,经解码器的输出,又恢复为的输入端,经解码器的输出,又恢复为图图

52、3-123-12编码器输入顺序显示。编码器输入顺序显示。2. 运动补偿技术运动补偿技术(块块)n 运动矢量选择二维运动矢量选择二维16161616像素块作为一个像素块作为一个的运动矢量处理。的运动矢量处理。n 运动矢量又称为宏块,它有不同的类型:运动矢量又称为宏块,它有不同的类型: 可以是可以是I I帧内型,帧内型,F F前向预测型、前向预测型、B B后向预测后向预测型和型和A A平均值平均值( (双向预测)型。双向预测)型。n 概念:概念: 当前图像可看作是前一帧图像位移后的结果,当前图像可看作是前一帧图像位移后的结果,其位移的内容包括运动方向和运动幅度。运动补其位移的内容包括运动方向和运动

53、幅度。运动补偿方法是跟踪画面内的运动情况并对其加以补偿偿方法是跟踪画面内的运动情况并对其加以补偿后,与当前的图像宏块值相减得到预测误差,再后,与当前的图像宏块值相减得到预测误差,再进行编码、传送。进行编码、传送。2. 运动补偿技术运动补偿技术(块块)n 讨论预测器计算表达式,讨论预测器计算表达式,设前一参照帧为设前一参照帧为I I0 0,后后一参照帧为一参照帧为I I2 2,当前帧为当前帧为I I1 1的的示意图示意图,求,求预测值。预测值。n F F前向前向 B B后向后向01mv21mv2. 运动补偿技术运动补偿技术(块块)n 表表3-133-13给出了给出了I I帧内帧内块块、F F前向

54、预测前向预测块、块、B B后后向预测向预测块和块和A A平均值平均值块的预测器的块的预测器的计算表达式。计算表达式。n 为为当前帧当前帧I I1 1的的值,预测误差值,预测误差IFBA 2.3.4 MPEG视频压缩视频压缩数据流结构数据流结构 图像序列头图像序列头 图像组图像组图像组图像组序列尾序列尾 图像组图像组图像图像组头组头图象图象I、P、B图象图象I、P、B图像头图像头宏块片宏块片宏块片宏块片 宏块宏块片头片头宏块宏块宏块宏块18828838848858868888视频序列层视频序列层图像组层图像组层宏块片层宏块片层宏块层宏块层YCb Cr图像层图像层块层块层帧间编码帧间编码运动补偿运动补偿JPEGMPEG2 视频数据流的六层结构图视频数据流的六层结构图视频数据流

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论