多媒体第四讲第2章.ppt

上传人：x*** IP属地：四川上传时间：2020-08-02 格式：PPT 页数：71 大小：454.56KB 积分：15 举报 版权申诉

已阅读5页，还剩66页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、2.4运动图像压缩标准MPEG，2 . 2 . 4 . 1 MPEG标准简介，MPEG标准是运动图像压缩的一系列标准。最初，MPEG专家组在3个工作项目上对图像进行编码，分别命名为MPEG-1、MPEG-2和MPEG-3:1.5 Mbps、10Mbps和40Mbps波特率。MPEG-3后取消。为了满足各种应用程序要求，MPEG将陆续添加另一个标准MPEG-4、MPEG-7和MPEG-21。3，MPEG算法编码过程和解码过程是非镜像对称算法(不对称)，解码过程比编码过程相对简单。MPEG-1和MPEG-2只规定了解码程序，侧重于解码算法的标准化。因此，在实施MPEG算法时，首先实现MPEG解码器

2、(例如C-Cube Corporation CL450解码器系列)。近年来，随着MPC性能的提高，软件解压缩功能也逐渐受到支持。4，2.4.2 MPEG-1系统，“数字存储媒体运动图像及其半音率为1.5Mbps的压缩编码(MPEG-1)”，1992年作为ISO/IEC 1172号提案通过。主要用于在CD-ROM上存储运动视频图像，标准分辨率(NTSC为352240；PAL压缩352288)的图像，以每秒30帧的屏幕提供CD音质。它还用于数字电话网络视频传输，例如非对称数字用户线(ADSL)、按需视频、教育网络等。使用MPEG-1压缩算法时，一台120分钟长的电影可以压缩到约1.2GB。因此，它

3、被广泛用于VCD制作。5，MPEG-1分为5个部分，(1)MPEG系统(11172-1)定义音频、视频和相关数据的同步。(2)MPEG视频(11172-2)、视频数据的编码和图像重建所需的解码过程定义、亮度信号分辨率360240、色度信号分辨率180120；(3)MPEG音频(11172-3)、音频数据的编码和解码定义(4)一致性测试(11172-4)；(5)软件模拟(11172-5)。仅规定MPEG标准功能和性能要求及指标，不指定特定编码器/解码器体系结构或特定实现。可供参考的普通编码器/解码器原型。6，7，MPEG-1编解码器原型：假定多路复用的代码流以特定于介质的格式存储在数字存储介质(

4、DSM)或网络(标准)中。()不指定特定于媒体的格式。系统解码器从输入多路复用复合流中提取计时信息，分离输入流，并将两个基本流分别输出到视频和音频解码器。视频和音频解码器分别解码输出视频和声音信号。8、系统、视频、音频和4个媒体解码器之间的时序信息同步。多个复合流由系统和压缩层两层组成。系统解码输入是系统层。视频、音频解码器输入是压缩层。9，系统解码器执行两种茄子类型的操作。一种是在整个多通道复合流(称为复合流操作)中工作的操作。一个茄子类是作用于单个基本流(称为特定流任务)的任务。系统层分为两个子层。子图层称为包(pack)，是复合流操作数。一个子图层称为群组(packet)，用于特定的流动

5、操作。10、MPEG音频标准特性：音频信号采样率可以是32kHz、44.1kHz或48kHz。压缩的比特流可以支持单声道或双声道，这是为单音频通道提供的单声道模式的四种茄子模式之一。为两个独立的单音频通道提供的双单声道模式立体声通道提供的立体声模式；利用联合立体声模式、立体声通道间的连接或通道间相位差的独立性或两者。11、和MPEG音频标准(MPEG音频)提供三种茄子压缩级别，用户可以在复杂性和压缩质量之间进行选择。第1层最简单，使用比特率384kbps，主要为DCC用于。第2层的复杂性使用比特率192kbps左右，主要应用于数字广播的音频编码、CD-ROM的音频信号、CD-I和VCD。第3层

6、最复杂，适用于比特率64kbps，尤其是ISDN的音频传输，压缩丢失，但音质保持真实。利用MP3音乐MPEG Audio Layer 3的技术，声音的压缩率为1: 10或1: 12。，12，压缩位流具有预定义比特率之一。MPEG音频标准还支持用户使用预定义比特率以外的比特率。编码的比特流支持循环冗余校验(CRC)。MPEG音频标准还支持将附加信息装入比特流。13，2.4.3 MPEG-1视频数据流的结构，图2.16 MPEG-1数据体系结构，14，MPEG-1数据流的结构：运动图像序列图像组图像组由一系列图像组成，这些图像可以将运动序列中的随机存取图像信号分成三部分，如图所示，黑色点表示颜色U

7、，V位置，亮度Y位置表示为白色圆圈。、16、块：块是包含88的亮度信息或颜色信息的宏块图2.18宏块的构成图像切片：由一个或多个连续的宏块组成。17，2 . 4 . 4 . 4 MPEG-1视频编码技术，主要问题：无法实现高压缩比，而使用单个停止帧内编码方法，可以最好地满足随机存取要求。解决方案：折衷了牙齿的两个茄子方面。这意味着基于块的运动补偿技术以减少时间上的冗馀，以及基于DCT转换以减少空间冗馀的ADCT技术。18，MPEG将图像分为三种茄子类型。I图像使用图像本身的相关压缩在数据流中提供随机存取压缩点。P图像是使用最近的前一个I图像(或P图像)预测编码(向前预测)编码的。B图像B图像可

8、以在预测时使用上一个图像作为参考，使用下一个图像作为参考，或者使用前后两个图像作为参考图像(双向预测)。19，图2.19帧之间的预测，通常2次/秒。解码后，典型的I，图像顺序为(秒):21，传输顺序，MPEG编码器需要重新排列这些图像，以便解码器有效地工作。因为参考图像P需要在恢复B图像之前恢复。上述17帧图像重排后，图像组顺序为、4，2，1，3，7，5，6、I、P、B、B、P、B、B、22。在MPEG方案中，运动补偿技术在宏块级别工作。23、MPEG的运动补偿(巨集区块)、巨集区块分为4种茄子类型。帧中的宏块，即I块；向前预测宏块(称为f块)。逆预测宏块、缩写b块；平均宏块，简称为A块。b图

9、像宏块有四种茄子类型。对于p图像，宏块只有I块和f块。无论、24、B图像和P图像如何，I块处理技术都与ADCT技术(用于I图像的技术)相匹配。对于f块、b块和a块，MPEG都使用基于块的运动补偿技术。在f块预测中，当该引用是上一个I图像或P图像B块预测时，该引用是下一个I图像或P图像A块预测时，该引用是前后两个I图像或P图像、25、基于块的运动补偿技术、基于块的运动补偿技术，即，在参考帧中，找到满足特定条件的当前预测块的最佳匹配块。找到匹配的块后，有两种茄子处理方法。一种是在恢复预测的块时用匹配的块替换。第二，使用预测误差的ADCT技术代码恢复预测块时，将预测误差添加到匹配块。，26，表2.8

10、宏块预测方法，编码器可考虑成本、速度和屏幕质量，自由选择。其中，DCT-离散余弦逆变换、Q-量化、VLC-可变长度代码编码、MUX-多路复用、28、图2.22基本视频解码器框、解码过程没有运动补偿等计算，因此解码要比编码简单得多。标准定义解码过程，但未指定解码体系结构，因此可以自由选择。其中：MUX-1-多路复用、VLD-可变长度代码解码、Q-1-反向量化、DCT-1-离散余弦逆转换、29，2.4.5 MPEG-2标准、提供mm网络3100 mbppegMPEG-2支持重叠图像序列，支持可曹征编码、多种运动估计方法，并提供不同范围的更改压缩率以满足不同的屏幕质量、存储容量和带宽要求。基于与MP

11、EG-1的兼容性，启用低比特率和多通道扩展。MPEG-2可以将一台120分钟长的电影压缩到48GB(DVD质量)，音频编码提供左右两个环绕通道、一个加权低音通道和最多七个音频通道。除了、30、DVD的指定标准外，还可以使用MPEG-2为广播、有线电视网络、有线网络等提供广播级数字视频等。但是，对于最终用户来说，由于当前电视机分辨率的限制，MPEG-2提供的高清晰度屏幕质量(如DVD屏幕)牙齿电视机上不引人注目，但是音频特性(如低音增加、多声音通道等)牙齿被广泛使用。MPEG-2 Video定义了不同的功能等级，每个等级分为多个等级，n等级解码器可以解码该等级的数字流。31，5等级、简单(Mai

12、n)信噪比(SNR Scalable)空间调节(high)、32视频广播信号的基本级别适用于HDTV的高级1920108030或1920115225。33，11茄子规格，进阶原生MPHL进阶增强型HPHL高度-1440层级原生MPH1440高度-1440层级空间可曹征SSPH1440高度-1440层级增强型HPH1440基础层级增强型hph 1440基础层级简易SPML基础层级原生层级MPML基础层级信噪比可曹征SNPML基础层级增强型HPML低层级原生m可能是5.1或7.1通道的环绕立体声。5.1也称为“3/2-立体声加LFE”，表示广播现场前面有三个喇叭通道(左、中、右)牙齿，后面有两个环

13、绕喇叭通道。LFE是低频音频的强化通道。7.1通道环绕立体声类似于5.1，有两个喇叭通道，中间为左，中间为右。35、MPEG-2编码方法、MPEG-2编码方法和MPEG-1的区别主要在于隔行扫描系统上的DCT转换是在场内进行，还是在帧内由用户自行选择或适应性选择。通常，细节多、移动部件少的图像在帧内执行DCT，细节少、运动部件多的图像在场内执行DCT。36，图2.23 MPEG-2亮度宏块结构，帧内DCT亮度宏块结构，字段DCT亮度宏块结构，亮度宏块，亮度宏块，37，MPEG-2同时使用可曹征和非协调编码结构。也可以使用一个默认层次和多个增强的多层编码结构。牙齿结构可由用户根据质量和压缩比要求

14、进行选择。38，2.4.6 MPEG-4标准，国际标准MPEG-4“超低速度视听编码”于1998年十一月公布。为了低速度视频、音频编码，更多地关注多媒体系统的交互性和灵活性。MPEG-4引入了AV对象(AVO)，从而实现了更多的交互。“AV对象”可以是孤立的人、该人的声音或背景音乐等。MPEG-4主要使用AV对象来表示听觉、视觉或视听组合内容。合并现有AV对象以生成合成AV对象，并生成AV场景。AV对象的数据可以灵活地进行多路复用和同步，以便选择相应的网络来传输这些AV对象数据。允许收件人用户在AV场景中与AV对象交互等。与、39、MPEG-1和2相比，更适合交互式AV服务和远程监控。MPEG-4旨在提供更大的适应性和可扩展性。MPEG-4传输速率为4.8-64kbps，使用非常窄的带宽，可以通过帧重新配置技术压缩和传输。这适用于数码电视、动态图像、网络、实时多媒体监视、移动多媒体通信、网络/intranet中的视频流和视频游戏、DVD中的交互多媒体等。使用MPEG-4压缩算法ASF，MPEG-4可以压缩到约300MB的视频流(电影为120分钟)。使用MPEG-4压缩算法DIVX编码技术，可以压缩约600MB的电影120分钟，或将DVD电影压缩到2张CD-ROM上。40，MPEG-4是高成本有损压缩算法之一，与DVD上的MPEG-2相比，图像质量不高。毕竟，D

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

多媒体第四讲第2章.ppt

文档简介

温馨提示

最新文档

评论

多媒体第四讲第2章.ppt

文档简介

温馨提示

最新文档

评论

相关文档