版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
H.264视频编码标准的关键技术概述目录TOC\o"1-3"\h\u812H.264视频编码标准的关键技术概述 1140731.1H.264视频编码标准的发展 1290751.2H.264的分层模型 115931.1.1H.264的视频编码层 2265241.1.2H.264的网络抽象层NAL 2244161.3H.264编码技术 2303291.3.1帧内编码 2326281.3.2帧间编码 3239061.3.3变换编码与量化 4281341.3.4熵编码 4160311.3.5环路滤波器 55341.3.6H.264编解码流程 51.1H.264视频编码标准的发展如前面绪论介绍,随着图像压缩的不断发展和深入研究,ISO和ITU-T制定了一些压缩标准。如制定的MPEG(如MPEG-2、MPEG-4等系列)主要拥有图像的存储,电视广播等。H.264最开始源于ITU-T制定的H.26L标准。MPEG标准不断被ISO/IEC完善,最终MPEG-4第10部分(Part10)被命名如今的H.264或又叫做MPEG-4AVC[8]。实验表明,H.264的压缩比是MPEG-2的一倍,且具有良好的网络鲁棒性。1.2H.264的分层模型H.264通过采用分层[9]的策略来实现更好的兼容性。主要包含视频编码层(VCL,VideoCodingLayer)、数据控制层、数据分区层和网络抽象层(NAL,NetworkAbstractionLayer),其中VCL层主要负责视频的编码功能,数据分区层用于不同数据的分区处理和保存,数据控制层专门用于时间控制操作,网络抽象层主要负责网络传输底层协议等。H.264编码器分层结构如图2-1所示。图2-1H.264分层编码示例图1.1.1H.264的视频编码层VCL层主要负责视频的编码功能,是编码算法的核心部分,该层包含的技术功能算法有:帧内预测编码技术、帧间预测编码技术、运动补偿技术、和DCT变换以及CABAC技术和环路滤波技术等。1.1.2H.264的网络抽象层NAL为了使H.264能应用于各类系统中,H.264对网络功能单独进行了抽象分离,形成独立的网络抽象层,改层为H.264提高了更好的网络鲁棒性。H.264把经过视频编码层编码处理后的数据流通过网络抽象层NAL发送出去,从而实现视频编码数据的远程传输。它支持各种网络协议,如TCP/IP协议、RBSP(RawByteSequencePayloads)协议、RTP协议等。1.3H.264编码技术H.264在原来传统的基于变换、预测编码以及分块的基础上又引入了新的编码技术改进:主要包含帧内预测编码技术、帧间预测编码技术、DCT变换于DCT逆变换、量化于反量化、熵编码以及环路滤波等新技术。从而使得H.264相对于其他传统编码标准在整体编码效率上有了大幅提升。1.3.1帧内编码帧内编码指的是只在一帧(称为I帧或关键帧)图像内进行编码,主要是利用图像帧内空间上的数据冗余实现编码。其原理是首先计算一帧图像每个像素值,然后按照像素值把图像分组4x4,8x8,8x16,16x16等宏块,利用相邻宏块之间空间中的像素值相似性冗余来进行预测编码。比如:找一个宏块,首先可留用它上下左右的宏块来进行预测,然后对预测值求差值,这样把采用最接近原始宏块的预测模式保留下来做差值,就得到预测补偿值,只要保存一帧关键帧I帧和预测补偿数据,解码端就可以根据I帧和预测补偿数据还原原始图像了。具体预测流程如图2-2所示。图2-2H.264帧内编码预测流程1.3.2帧间编码与帧内预测编码相对于,帧间编码是利用多个连续帧之间的空间相关性,去除空间上的数据冗余来进行压缩的。帧间编码包含P帧和B帧,把多个连续帧图像内运动的物体信息通过宏块像素值计算出来就形成了运动补偿数据,该动作被称作运动估计。帧间编码时,只需要保留相应的I,P和B帧少量数据,然后解码端通过I,P和B帧加上运动补偿数据便可恢复原始图像。运动估计分块策略从16x16到4x4共7种块模式,如图2-3所示。图2-3运动补偿宏块模型1.3.3变换编码与量化在压缩编码中,使用了DCT变换,该变换需要大量浮点运算,增加了处理器开发和量化精度。为降低浮点运算,H.264通过16位运算实现,从而减少了运算次数。H.264变换有三种:运动预测残差变换,亮度DC变换,色度DC变换。整数变换的优势有:使用整数保证运算精度;不进行乘除法运算;运算与量化器同时进行,减少运算乘法数;量化核心是分级量化,H.264有52个量化步长Qstep(QuantizerStep)和量化系数(QP,QuantizationParameter)。它们关系如表2-1所示:表2-1QP和Qstep的关系QP0124610Qstep0.6250.68750.81251.001.251.00QP111218304251Qstep1.251.552080224由上表可示,QP每次增1,Qstep大约增加13%,而QP每次增6,Qstep增加一倍。1.3.4熵编码通用变长编码(UVLC,UniversalVariableLengthCoding)[11]是H.264的基本熵编码方式,采用指数哥伦布(Exp-Gobomb)编码算法,可以对变换系数之外的所有数据进行编码。UVLC不管具体类型,采用统一编码表,从而避免存储多个变长码表,这样Exp-Gobomb编码算法便可实时编码不需要多余的空间存储映射码表,而且根据信源函数灵活调整阶数k,达到很高的编码效率。H.264算法对扫描变换系数进行亮度和色度残差编码时,使用更灵活的上下文的变长编码(CAVLC,Context-basedadaptivevariablelengthcoding)。其核心思想是游程编码(run-length),与常规游程编码概率分布统计码表不同,H.264定义多个根据数据上下文统计而设计的变长码表(VLCTable)。CAVLC编码时,根据图像上下文内容(如周围块非零系数和系数绝对值大小),可以通过VLC自动选择当前数据概率模型相匹配的码字。CAVLC的压缩效率比传统编码明显高。H.264还提供性能更高的算术编码方式CABAC(上下文自适应二进制的算术编码),编码性能优于CAVLC,但增加了运算复杂度。由文献[12]的实验可看出CABAC算法比CAVLC算法少7%~10%的数据量。1.3.5环路滤波器环路滤波器主要用于降低图像分块编码变换中因量化步长和虚假边界产生的块效应。在H.264每次编码数据逆变换后,会对宏块进行所有顺序滤波,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026辽宁省市场监管事务服务中心赴高校招聘4人备考题库完整答案详解
- 2026云南昆明嵩明县嵩阳卫生院招聘专业技术人员5人备考题库完整答案详解
- 2026江西省中赣投设计本部(第二批次)招聘8人备考题库及完整答案详解一套
- 2026东风汽车集团股份有限公司人事共享服务中心招聘备考题库附答案详解
- 2026学年甘肃省玉门市五年级数学期末自测重点黑金模拟题详细参考解析详细答案和解析
- 2026福建厦门广播电视集团人员招聘备考题库及一套完整答案详解
- 2026贵州两山文旅集团有限公司就业见习人员招聘7人备考题库及参考答案详解一套
- 2026安徽合肥市长丰县部分单位招聘编制外人员7人备考题库及参考答案详解1套
- 2026年代理合同纠纷调解及佣金追偿专业服务合同
- 振动冲击夯压实检测方案
- 工程机械设备租赁服务方案投标文件(技术方案)
- DB34∕T 4676-2024 数字茶园建设指南
- 国家开放大学宠物饲养形成性考核册1-4答案实习报告调查报告答案
- 南通大学面试真题及答案
- TCNAS49-2025成人泌尿造口护理
- 川省2025年度初级注册安全工程师职业资格考试其他安全练习题及答案
- 【医学指南】临床指南麻醉前访视和评估专家共识(2025版)
- 上海杉达学院《大学物理A》2025 - 2026学年第一学期期末试卷(A卷)
- 手磨机安全培训课件
- 索尼相机DSC-H50说明书
- 【MOOC答案】《人力资源管理》(南京邮电大学)章节作业慕课答案
评论
0/150
提交评论