版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据压缩数据压缩MPEG-4标准标准一一.MPEG介绍介绍1.1.MPEG是什么MPEG是Moving Picture Experts Group(动态图像专家组)的简称。1.2.MPEG标准包括: MPEG-1:数字电视标准,1992年正式发布。 MPEG-2:数字电视标准。 MPEG-3:已于1992年7月合并到高清晰度电视(High-Definition TV,HDTV)工作组。 MPEG-4:多媒体应用标准(1999年发布)。 MPEG-5:直至1998年9月还没有见到定义。 MPEG-6:直至1998年9月还没有见到定义。 MPEG-7:多媒体内容描述接口标准 MPEG-21:多媒体
2、集成框架二二.MPEG-4编码技术编码技术1.MPEG-4的基本结构 标准号 说明 ISO/IEC 14496 - 1 MPEG-4的系统模块 ISO/IEC 14496 - 2 MPEG-4的视频模块 ISO/IEC 14496 - 3 MPEG-4的音频模块音频模块 ISO/IEC 14496 - 4 MPEG-4的一致性模块,定义了比特流和设备。ISO/IEC 14496 - 5 MPEG-4的参考软件模块ISO/IEC 14496 - 6 MPEG-4的多媒体传输集成框架模块 2.MPEG-4的核心思想 MPEG-4代表了基于模型模型/对象对象的第二代视频编码技术,充分利用人眼的视频特
3、性,抓住了图像信息的本质,从形状,纹理,运形状,纹理,运动动出发,支持基于视频内容的交互功能交互功能。基于对象的定位基于内容的交互 2.1.深入理解基于对象的定位 2.1.1什么是VOVO1(文本)VO2(天线)VO3(手机)VO4(背景)这些对象被标记为视频对象(VO,Video Object)一个MPEG-4视频序列(VS)可能由一个或者几个VO组成。 2.1.2.什么是VOP 某一特定时间点的视频对象就是视频对象平面(VOP,Video Object Plane)。采用的基于内容的方法实现了对场景中时间对象的灵活解码,表示和操作 每个VOP是一个单独的视频帧,而一系列的视频帧就构成了一个
4、VO。矩形VOP与VO任意形状VOP与VO 2.2深入理解基于内容的交互 MPEG-4标准中提供了一种“对象层”码流来支持对原始场景进行控制的功能。这个码流被称作视频对象层(VOL,Video Object Layer)。 视觉对象序列(VS,Visual Object):完整的MPEG-4场景,包含2D或3D的自然对象和计算生产的对象。即视频片段。 VS(Visual Object),VO(Video Object),VOL,(Video Object Layer),VOP(Video Object Plane)的关系。MPEG-4视频对象描述场景分层视频对象描述场景分层VS1VSn视频序列
5、VO1VOnVOL1VOLnGOV1GOVnVOP1VOPnVOP2VOPn视频对象视频对象层视频对象平面层组视频对象平面 一个完整的视频序列通常由几个视频段(Video Session,VS)构成,每个VS由一个或多个VO组成,每个VO又由一个或多个视频对象层(Video Object Layer, VOL)构成,每个VOL代表一个层次,即基本层或增强层,每个层表示某一种分辨率某一种分辨率。在每个层中,都有时间上连续的一系列VOP。原始解码视频场景根据用户偏好解码的视频场景3.MPEG-4的主要特点(1).对不同的对象可采用不同的编码算法,从而可能进一步提高压缩效率。(2).各个对象相对独立
6、,提高了多媒体数据的可重用性。(3).允许用户对单个的对象进行操作,提供了前所未有的交互性。(4).允许在不同的对象之间灵活分配码率.(5).可以很方便地集成自然的与合成的视频音频对象. 4.MPEG-4终端体系结构模型终端体系结构模型压缩层同步层传输层基本流接口ESIDMIF接口DAIISO/IEC 1449 -61SystemISO/IEC 1449-62ISO/IEC 1449-63Visual&AudioISO/IEC 1449-66 DMIF产生基本码流(ES)并划分访问单元AU。封装媒体数据,控制数据的ES流定义传输接口,信道建立和断开信号压缩层产生基本码流ES同步层SL打
7、包流被分组打包 5.MPEG-4关键技术关键技术 5.1.视频对象提取技术 5.2.VOP视频编码技术视频编码技术 5.3.视频编码可分级技术 5.4.Sprite视频编码技术 5.1视频对象提取技术 三种VOP分割形式 a).基于纹理的分割:主要是应用模式识别的技术来聚类 b).基于运动的分割: 将具有同一运动参数模型的区域聚类 c).纹理和运动结合的分割:在运行一致性表现得非常明显的区域用运动分割,在一些细节或运动复杂区域仍采用纹理分割。分水岭算法分水岭算法VOP分割 5.2.VOP视频编码技术(1).MPEG-4以VO的概念来实现基于内容的表示。(2).MPEG-4的编码和解码都是针对V
8、OP进行的。(3).每个VO由三类信息来描述:运动信息,形状信息,纹理信息运动信息,形状信息,纹理信息。纹理归根结底是色彩(4).视频编码器包括形状编码(对于任意形状)、运动信息编码和纹理编码。DCTQ纹理编码视频复合器位流输出IQIDCTFB预测2预测3预测开关运动估计形状编码预测1VOP输入+-方式1预测是指标准8x8 或 16x16 块的运动估计方式2预测是指全局运动补偿;方式3预测是指基于动态sprites的全局运动补偿。传送的顺序依次为形状信息、运动信息和纹理信息传送的顺序依次为形状信息、运动信息和纹理信息MPEG-4中VOP简化编码框图 5.2.2.VOP编码运动编码 (1).运动
9、估计的方法前向和后向的运动估计二维对数搜索法三步搜索法 运动矢量空间预测方式块尺寸相同的当前块和邻近块块尺寸不同的当前块和邻近块 运动矢量在时间域的预测方式 (a)前帧对应块运动矢量预测什么是时域相关性? (b)时间域的邻近参考帧运动矢量预测(2).MPEG-4采用运动预测和运动补偿技术来去除图像信息中的时间冗余成分。(3).VOP的编码有3种模式,即帧内编码模式(I-VOP)、帧间预 测编码模式(P-VOP)、帧间双向预测编码模式(B-VOP)。 I帧是预测基准的独立帧,与其他VOP分开编码P帧可以基于前一个解码后的I帧进行预测(利用运动补偿)B帧可以用过去和未来的VOP进行预测,B-VOP
10、只能基于I-VOP,P-VOP进行插值只有对只有对P-VOP和和B-VOP编码时才需要运动估计编码时才需要运动估计 (4).VOP序列的运动和纹理编码都是基于块进行的。(5).典型的块定义是一个8x8像素的矩形阵列。(6).6个8x8像素块(4Y2C)组成一个宏块(MB,Macro Block)。(7).宏块作为一个独立的编码单元。 (5).运动预测编码总结 a)时间冗余度的压缩&差分编码 b)运动预测编码 时间冗余度表现在视频画面中相继各帧对应像素点的值往往相近或相同,具有时间相关性。在知道了一个像素点的值后,利用此像素点的值以及其与后一像素点的差值就可求出后一像素点的值 对于当前帧
11、中的一块图像,在一个参考帧中搜索与本块图像数据最接近的块,计算出两个块位置差值,即运动矢量运动矢量,然后将这两个块的像素数据差值像素数据差值与运动矢量运动矢量传送给接收端。接收端根据运动矢量及差值恢复出原图像。 5.2.3.VOP编码纹理编码 (1).纹理信息有两种:内部编码的I-VOP的像素值; 帧间编码的P-VOP、B-VOP的运动估计残差值。 (2).仍然采用基于分块的纹理编码。VOP边框仍被分成16X16的宏块。 (3).纹理编码的三种情况: a),VOP外、边框内的块,不编码; b),VOP内的块,采用经典的DCT方法; c),部分在VOP内,部分在VOP外的块采用图像填充技术来获取
12、VOP外的像素值,之后进行DCT编码。块的判定 DCT量化系数扫描系数预测VLCVOP纹理编码过程对当前帧的DC系数进行预测和编码时,以前一帧的DC值为参考把图像由像素域转换到频率域Zig-Zag方式扫描 5.2.4.VOP编码形状编码(1).对VOP编码就是针对某一时刻该帧画面VO的形状、运动、纹理等信息进行编码。(2).VOP形状编码有两类:二值形状信息灰度形状信息 二值形状编码 1).二进制alpha平面用于定义在给定时刻哪些像素属于VO,VOP的形状信息通常与一个与VOP相同尺寸的矩阵来表示。 2).在编码之前,二进制alpha平面被分割成若干个16x16像素大小的二进制alpha块(
13、BAB)。基于上下文的算术编码1).二值化。2).选择上下文模型3).算术编码 灰度级形状编码 灰度级形状编码中与每个像素对应的数值,可以是0到255之间的任意整数,分别代表不同的透明度(0表示完全透明,而255表示完全不透明)。灰度级信息的编码由两部分组成,对具体的数值采用和纹理信息相似的编码过程,同时结合二值形状编码表示VO的形状。 5.3视频编码可分级技术 (1).可分级性: 指编码器的输出数据流中包含一个基本层以及一个或多个增强层,可同时满足各种不同的应用要求。基本层:提供视频序列的基本信息,提供最低的图像质量。增强层:提供了视频序列更高的分辨率和细节。 (2).分级技术:时域分级;空
14、域分级每一种分级编码都至少有两层VOL,低层称为基本层,高层称为增强层。基本层可以单独传输和解码,增强层必须与基本层一起传输和解码。空间时间分辨率金字塔结构单一增强层的空间可扩展编码器基本层VOL同时采用帧内和帧间编码,增强层只采用预测编码 5.4.Sprite视频编码技术介绍 (1). 一个sprite是由一个视频序列中属于同一个视频对象的所有像素所有像素构成的,是由各部分经拼接而成的一幅图像,它是MPEG-4提出的重要的概念之一.一个Sprite实例 (2).实现Sprite编码必须的前提条件 a).前景对象和背景对象要很好的分割开; b).能够无痕迹的从一段视频或图像中拼接出Sprite图像。三三.MPEG-4解码技术解码技术 (1).MPEG-4压缩视频的码流结构码流头按帧组织的数据流帧头按宏块组织的帧数据宏块头按块形式组织的帧数据 码流头是一个在码流中其它地方不会出现的一个比较长的特殊序列,又叫起始码字 (2).MPEG-4解码基本流程定义解码器的各种数据结构,设置相应的各种默认参数。如何读出编码类型? (3).MPEG-4码流格式简单分析 F5 09 00 00 01 20 08 86 84 00 3F 18 58 21 20 A3 1F 00 00 01 B2 58 76 69 44 30 30 36 32 00 00 01 B000 00 01 B600 00 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 试验委托协议书
- 工地合作合同范本
- 广告宣传协议书
- 工作框架协议书
- 诊所招人协议书
- 小学旷课协议书
- 幽默减肥协议书
- 延期质保协议书
- 装修赔款协议书
- 英语陪跑协议书
- 《学前教育学》课程教学大纲
- 2024年广东省深圳市罗湖区高一上学期期末化学试题及答案
- DB11∕T 1678-2019 城市轨道交通广告设施设置规范
- 2024新版(北京版)三年级英语上册单词带音标
- 松下-GF2-相机说明书
- 工程维保及售后服务方案
- 医院科室主任的工作总结
- 附表:医疗美容主诊医师申请表
- 毕节市织金县化起镇污水处理工程环评报告
- 黑布林英语阅读初一年级16《柳林风声》译文和答案
- 河流动力学-同济大学中国大学mooc课后章节答案期末考试题库2023年
评论
0/150
提交评论