H265标准现状和发展趋势.docx_第1页
H265标准现状和发展趋势.docx_第2页
H265标准现状和发展趋势.docx_第3页
H265标准现状和发展趋势.docx_第4页
H265标准现状和发展趋势.docx_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

视频编码新方法HEVC研究报告摘要新一代视频压缩标准(High Efficient Video Coding,HEVC)是视频压缩领域继H.264/AVC之后的又一重大突破,主要面向高清电视(HDTV)以及视频编解码系统,提供从QVGA至1 080p以至超高清电视(7 6804 320)不同级别的视频应用。首先从HEVC基本结构出发,较全面地介绍了HEVC在预测估计、DCT变换、滤波补偿以及熵编码方面采用的关键技术,最后介绍了HEVC当前的研究热点及其最新发展方向。关键词:视频编码,HEVC,四叉树编码,变换结构,环路滤波ABSTRACTAs the successor to H.264/AVC, the latest video compression standard under development(High Efficiency VideoCoding, HEVC) targets at next-generation HDTV displays and video compression systems which provide flexible, high efficientapplications with resolutions from QVGA (320240) up to 1 080p and Ultra HDTV (7 6804 320). The encode architecturesand some of the key technologies used in the new model are introduced in this paper. Those key technologies involve withprediction, transformation, in-loop filter and entropy. Besides that, the paper also reviews the latest improving issues and thefuture of HEVC.Key words:video coding, HEVC, quadtree coding and transforming structure, in-loop filter目录前言11 HEVC背景与发展21.1 采用H.264编码的局限性21.2 HEVC的产生31.3 HEVC的技术亮点42 HEVC编码框架62.1 基于四叉树结构的编码分割62.2 HEVC的变换结构63 HEVC预测编码技术83.1 多角度帧内预测83.2 帧间预测技术83.2.1 广义B预测技术83.2.2 运动融合技术和自适应运动矢量预测技术94 环路滤波与熵编码104.1 自适应样点补偿104.2 自适应环路滤波104.3 熵编码115 HEVC下一步的研究设想125.1 进一步降低复杂度125.2 视觉特性和并行处理135.3 进一步减少码率和提高压缩比135.4 面向对象的算法145.5 降低解码延时146 总结156.1 HEVC的主要特征156.2 HEVC的应用前景展望156.3 心得体会17参考文献:18前言目前世界上的视频编解码标准主要来源于国际电联ITU-T和国际标准化组织ISO,ITU的H26x系列视频压缩标准经过了H.261,H.263,H.263+这样一个演进过程,而ISO的视频压缩标准是MPEG系列从MPEG1MPEG2到MPEG4,之后两个标准化组织走向合作,成立了JVT,推出了在当前最有效的视频压缩标准,H264AVC,从H.264标准发布到如今已经五年时间,在这五年中H.264的应用范围不断扩展成熟度不断提高,而ITU-T在H.264取得初步成功的时候,ITU-T的视频编码特别小组VCEG于2005年就对视频编码技术提出了更长远的设想并规划在技术成熟时推出新一代的视频编码标准H.265,时至今日,ITU-T VCEG 已接近对这一设想为期三年第一阶段研究的尾声,按照VCEG讨论组的计划在这一阶段要形成H.265标准的完整需求定义和具体算法设计,此刻,人们不禁会问H.265会在什么时候推出又会采用哪些技术,以下将结合VCEG现阶段的主要建议和成果对H.265的发展现状加以介绍并对其未来发展趋势加以展望。H.265提出的主要目标提出H.265标准是为了给音视频服务提供更好的视频编码方法。音视频服务包括会话式和非会话式音视频服务。其中会话式音视频服务包括视频会议和可视电话,非会话式音视频服务包括流媒体、广播、文档下载、媒体存储播放和数字摄像机。H.265标准围绕着现有的视频编码标准保留原来的某些技术,同时对一些相关的技术加以改进。新技术使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系,达到最优化设置。视频编码标准的发展会更加适应各种类型的网络,比如,inte r1et、LAN、Mobile、ISDN、GSTN、H2220、NGN等网络。1 HEVC背景与发展H.264(AVC)从2003年5月草稿发布以来,凭借其相对于以往的视频压缩标准在压缩效率以及网络适应性方面的明显优势,逐步成为视频应用领域的主流标准。根据MeFeedia的数据,由于iPad以及其它新兴设备大多支持H.264 硬件加速,至2011年底,80%的视频使用H.264编码,并且随着支持H.264解码的设备不断增多,这一占有率还将进一步增长。但是,随着数字视频应用产业链的快速发展,视频应用向以下几个方向发展的趋势愈加明显:高清晰度(Higher Definition):数字视频的应用格式从720 P向1080 P全面升级,在一些视频应用领域甚至出现了4K x 2K、8K x 4K的数字视频格式;高帧率(Higher frame rate ):数字视频帧率从30 fps向60fps、120fps甚至240fps的应用场景升级;高压缩率(Higher Compression rate ):传输带宽和存储空间一直是视频应用中最为关键的资源,因此,在有限的空间和管道中获得最佳的视频体验一直是用户的不懈追求。1.1 采用H.264编码的局限性宏块个数的爆发式增长,会导致用于编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级参数信息所占用的码字过多,用于编码残差部分的码字明显减少。由于分辨率的大大增加,单个宏块所表示的图像内容的信息大大减少,这将导致相邻的4 x 4或8 x 8块变换后的低频系数相似程度也大大提高,导致出现大量的冗余。由于分辨率的大大增加,表示同一个运动的运动矢量的幅值将大大增加,H.264中采用一个运动矢量预测值,对运动矢量差编码使用的是哥伦布指数编码,该编码方式的特点是数值越小使用的比特数越少。因此,随着运动矢量幅值的大幅增加,H.264中用来对运动矢量进行预测以及编码的方法压缩率将逐渐降低。H.264的一些关键算法例如采用CAVLC和CABAC两种基于上下文的熵编码方法、deblock滤波等都要求串行编码,并行度比较低。针对GPU/DSP/FPGA/ASIC等并行化程度非常高的CPU,H.264的这种串行化处理越来越成为制约运算性能的瓶颈。1.2 HEVC的产生为了面对以上发展趋势,2010年1月,ITU-T VCEG(Video Coding Experts Group) 和ISO/IEC MPEG(Moving Picture Experts Group)联合成立JCT-VC(Joint Collaborative Team on Video Coding)了联合组织,统一制定下一代编码标准:HEVC(High Efficiency Video Coding)。HEVC协议标准计划于2013年2月份正式在业界发布,目前整个框架结构已基本确定。截至2012年4月份,JCT-VC联合工作组已经召开了第八次会议,并于2012年2月17日发布了第一版内部草稿High efficiency video coding (HEVC) text specification draft 6,计划2012年7月发布第一版公开版草稿,在H.264标准24倍的复杂度基础上,将压缩效率提升一倍以上。H.265 是 ITU-T VCEG 正在规划中的视频编码标准,其目标是给音视频服务提供更好的视频编码方法。音视频服务包括会话式和非会话式音视频服务。其中会话式音视频服务包括视频会议和可视电话,非会话式音视频服务包括流媒体、广播、文档下载、媒体存储/播放和数字摄像机。 H.265 标准围绕着现有的视频编码标准 H.264,保留原来的某些技术,同时对一些相关的技术加以改进。新技术使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系,达到最优化设置。视频编码标准的发展会更加适应各种类型的网络,比如,internet、LAN、Mobile、ISDN、GSTN、H.222.0、NGN 等网络。具体的研究内容包括:提高压缩效率、提高鲁棒性和错误恢复能力、减少实时的时延、减少信道获取时间和随机接入时延、降低复杂度等。H.263 可以 1.31.8Mbps 的传输速度实现标准清晰度广播级数字电视(符合 CCIR601、 CCIR656 标准要求的 720*576)而 H.264 由于算法优化;可以低于 1Mbps 的速度实现标清数字图像传送;H.265 相比 h.264 进步更为明显,可以实现利用 12Mbps 的传输速度传送 720P(分辨率 1280*720)普通高清音视频传送。H.264视频编码标准使得视频压缩效率提高到了一个新的水平。自该标准发布以来,H.264以其高效的压缩效率,良好的网络亲和性以及优越的稳健性等优点迅速得到了广大用户的认同。然而,随着终端处理能力以及人们对多媒体体验要求的不断提高,高清、3D、无线移动已经成为视频应用的主流趋势。而现有的H.264编码标准的压缩效率仍然不足以应对高清、超高清视频应用,需要更为高效的编码压缩方案。与此同时,近年许多新型有效的技术在不断涌现,使得新标准的定制成为可能。为此国际电联组织(ITU-T)和移动视频专家组(MPEG)成立了视频编码联合小组(Joint CollaborativeTeam on Video Coding,JCT-VC)1,将新标准的定制正式提上日程。1.3 HEVC的技术亮点作为新一代视频编码标准,HEVC(H.265)仍然属于预测加变换的混合编码框架。然而,相对于H.264,H.265 在很多方面有了革命性的变化化。HEVC(H.265)的技术亮点有:灵活的编码结构在H.265中,将宏块的大小从H.264的16x16扩展到了64x64,以便于高分辨率视频的压缩。同时,采用了更加灵活的编码结构来提高编码效率,包括编码单元(Coding Unit)、预测单元(Predict Unit)和变换单元(Transform Unit)。其中编码单元类似于H.264/AVC中的宏块的概念,用于编码的过程,预测单元是进行预测的基本单元,变换单元是进行变换和量化的基本单元。这三个单元的分离,使得变换、预测和编码各个处理环节更加灵活,也有利于各环节的划分更加符合视频图像的纹理特征,有利于各个单元更优化的完成各自的功能。灵活的块结构-RQT(Residual Quad-tree Transform)RQT是一种自适应的变换技术,这种思想是对H.264/AVC中ABT(Adaptive Block-size Transform)技术的延伸和扩展。对于帧间编码来说,它允许变换块的大小根据运动补偿块的大小进行自适应的调整;对于帧内编码来说,它允许变换块的大小根据帧内预测残差的特性进行自适应的调整。采样点自适应偏移(Sample Adaptive Offset)SAO在编解码环路内,位于Deblock之后,通过对重建图像的分类,对每一类图像像素值加减一个偏移,达到减少失真的目的,从而提高压缩率,减少码流。采用SAO后,平均可以减少2%6%的码流,而编码器和解码器的性能消耗仅仅增加了约2%。自适应环路滤波(Adaptive Loop Filter)ALF在编解码环路内,位于Deblock和SAO之后,用于恢复重建图像以达到重建图像与原始图像之间的均方差(MSE)最小。ALF的系数是在帧级计算和传输的,可以整帧应用ALF,也可以对于基于块或基于量化树(quadtree)的部分区域进行ALF,如果是基于部分区域的ALF,还必须传递指示区域信息的附加信息。2 HEVC编码框架HEVC依然沿用自H.263就开始采用的混合编码框架,如帧内预测和基于运动补偿的帧间预测,残差的二维变换、环路滤波、熵编码等。在此混合编码框架下,HEVC进行了大量的技术创新,其中具有代表性的技术方案有:基于大尺寸四叉树块的分割结构和残差编码结构,多角度帧内预测技术,运动估计融合技术,高精度运动补偿技术,自适应环路滤波技术以及基于语义的熵编码技术。下文将对这个技术方案进行介绍。2.1 基于四叉树结构的编码分割为了提高高清、超高清视频的压缩编码效率,HEVC提出了超大尺寸四叉树编码结构,使用编码单元(Coding Unit,CU),预测单元(Prediction Unit,PU)和变换单元(Transform unit,TU)3个概念描述整个编码过程。其中CU类似于H.264/AVC中的宏块或子宏块,每个CU均为2N2N的像素块(N为2的幂次方),是HEVC编码的基本单元,目前可变范围为6464至88。图像首先以最大编码单元(LCU,如6464块)为单位进行编码,在LCU内部按照四叉树结构进行子块划分,直至成为最小编码单元(SCU,如88块)为止。一种新的不对称运动分割预测(AsymmetricMotion Partition,AMP)方案也已经被JCT所接受,这也是HEVC与H.264在分块预测技术中最为不同之处。所谓AMP,即将编码单元分为两个尺寸大小不一致的预测块,其中一个PU单元的宽/长为CU单元的1/4,另一个PU对应的宽/长为CU单元的3/4,如图3所示。这种预测方式考虑了大尺寸可能的纹理分布,可以有效提高大尺寸块的预测效率。2.2 HEVC的变换结构HEVC突破了原有的变换尺寸限制,可支持44至3232的编码变换,以变换单元(TU)为基本单元进行变换和量化。为提高大尺寸编码单元的编码效率,DCT变换同样采用四叉树型的变换结构。尽管TU的模板发生了变化,但其变换核并没有发生实质性的变化。现有的关于不对称变换所使用的变换核是由方形变换核剪裁得到的。通常,nm的变换系数矩阵的计算公式为Cnm= Tm Bnm TnT式中:Bnm为nm的像素块,Tm,Tn分别为mm,nn的变换核,Cnm为Bnm的变换系数。测试结果表明,非正方形四叉树更适合矩形PU和AMP变换,可节省大约0.3%的比特,同时增加2%左右的编码复杂度,对解码几乎没有影响7。采用大尺寸树形编码结构有利于支持大尺寸图像编码。当感兴趣区域一致时,一个大的CU可以用较少的标识代表整个区域,这比用几个小的块分别标识更合理。其次,任意LUC尺寸可以使编解码器对不同的内容、应用和设备达到最优化。对于目标应用,通过选择合适的LCU尺寸和最大分级深度,使编解码器具有更好的适应能力。LCU和SCU尺寸范围可被定义到档次和级别部分以匹配需求。3 HEVC预测编码技术HEVC的帧间、帧内预测的基本框架与H.264基本相同:采用相邻块重构像素对当前块进行帧内预测,从相邻块的运动矢量中选择预测运动矢量,支持多参考帧预测等。同时,HEVC采用了如多角度预测,高精度运动补偿等多种技术,使得预测精度大大提高。3.1 多角度帧内预测HEVC的帧内预测将原有的8种预测方向扩展至33种,增加了帧内预测的精细度。另外,帧内预测模式保留了DC预测,并对Planar预测方法进行了改进。目前HM模型中共包含了35种预测模式。但由于受到编码复杂度限制,编码模型对44和6464尺寸的PU所能使用的预测模式进行了限制。原有的HM模型中色度分量帧内预测采用了5种预测模式,分别为水平、垂直、DC预测、亮度模式以及对角模式。JCT-VC第五次会议后增加了以基于亮度的色度帧内预测8,以取代对角预测模式。在该预测模式下,色度分量使用亮度分量的值进行线性预测,相关系数根据重构图像特性进行计算。该方案在色度分量上取得了8%左右的性能增益,而编码复杂度基本不变。然而,尽管现有的帧内预测技术已对PU预测方向有所限制,但编码的复杂度仍然很高。不少研究人员提出了快速帧内预测算法,以进一步降低编码的复杂度。3.2 帧间预测技术3.2.1 广义B预测技术在高效预测模式下,HEVC仍然采用H.264中的等级B预测方式,同时还增加了广义B(Generalized P and Bpicture,GPB)预测方式取代低时延应用场景中的P预测方式。GPB预测结构10是指对传统P帧采取类似于B帧的双向预测方式进行预测。在这种预测方式下,前向和后向参考列表中的参考图像都必须为当前图像之前的图像,且两者为同一图像。对P帧采取B帧的运动预测方式增加了运动估计的准确度,提高了编码效率,同时也有利于编码流程的统一。3.2.2运动融合技术和自适应运动矢量预测技术运动融合技术(Merge)将以往的跳过预测模式(Skip Mode)和直接预测模式(Direct Mode)的概念进行了整合。采用融合模式时,当前PU块的运动信息(包括运动矢量、参考索引、预测模式)都可以通过相邻PU的运动信息推导得到。编码时当前PU块只需要传送融合标记(Merge Flag)以及融合索引(Merge Index),无需传送其运动信息。值得一提的是,无论是运动融合技术还是自适应运动矢量预测技术,两者在候选运动矢量列表的设计上都进行了精心考量,以保证运动估计的高效性以及解码的稳健性。在早期的HM模型中,两种预测方式所使用的候选运动矢量列表是相互独立的;在JCT第6次会议结束后,新的HM模型中将两者的参考列表构造进行了统一,Merge将采用与AMVP相同的方式构造候选运动矢量列表,进行运动信息的推导。4 环路滤波与熵编码一个完整的HEVC的环路滤波过程包括3个环节:去块滤波,自适应样点补偿(Sample Adaptive Offset,SAO),自适应环路滤波(Adaptive Loop Filter,ALF)。去块滤波在H.264的去块滤波技术基础上发展而来,但为了降低复杂度,目前的HM模型取消了对44块的去块滤波。自适应样点补偿和自适应环路滤波均为HEVC的采用的新技术。4.1 自适应样点补偿自适应样点补偿是一个自适应选择过程,在去块滤波后进行。若使用SAO技术,重构图像将按照递归的方式分裂成4个子区域15,每个子区域将根据其图像像素特征选择一种像素补偿方式,以减少源图像与重构图像之间的失真。目前自适应样点补偿方式分为带状补偿(Band Offset,BO)和边缘补偿(Edge Offset,EO)两大类。带状补偿将像素值强度等级划分为若干个条带,每个条带内的像素拥有相同的补偿值。进行补偿时根据重构像素点所处的条带,选择相应的带状补偿值进行补偿。现有的HM模型将像素值强度从0到最大值划分为32个等级,如图7所示16。同时这32个等级条带还分为两类,第一类是位于中间的16 个条带,剩余的16 个条带是第二类。编码时只将一类条带的补偿信息写入片头;另一类条带信息则不传送。这样的方式编码将具有较小补偿值的一类条带忽略不计,从而节省了编码比特数。4.2 自适应环路滤波自适应环路滤波(ALF)在SAO或者去块滤波后进行,目的是为了进一步减少重构图像与源图像之间的失真。ALF采用二维维纳滤波器,滤波系数根据局部特性进行自适应计算17。对于亮度分量,采用CU为单位的四叉树ALF结构18。滤波使用55,77和99三种大小的二维钻石型模板。滤波器计算每个44块的Laplacian系数值,并根据该值将所有44块分成16类,分别对应16种滤波器19,每种滤波器的滤波系数通过自适应维纳滤波器进行计算。除上述基于像素的ALF分类外,提案20还提出了基于区域的ALF分类。此时,每帧将被划分为16个区域,每个区域可以包含多个LCU。每个区域使用同一种滤波器,滤波器系数同样可以自适应训练得到。4.3 熵编码CABAC是H.264的两种熵编码方案之一。现有的CABAC编码器采用串行处理的方式,解码端需要足够高频率的计算能力方能实时地对高码率的码流进行解码,直接导致解码功耗和实现复杂度的增加。为了解决CABAC的吞吐能力问题,JCT提出了熵编码模型并行化的要求。所收集的提案大致从3个角度提出了并行化CABAC解决方案:基于比特的并行的CABAC1,基于语法元素的并行6CABAC和基于片的并行CABAC。最后,基于语法元素的并行CABAC编码方案(即SBAC)被HM模型所采纳。目前,HM可支持上下文自适应变长编码(CAVLC)和基于语法元素的上下文自适应二进制算术编码SBAC),分别用于低复杂度的编码场合和高效的编码场合。SBAC的目的在于为具有不同统计模型的句法元素提供高效的编码方式。在SBAC中5,句法元素被分成N个类别,每个类别并行地维护着自己的上下文概率模型及其更新状态,每个类别的句法元素可对应一个或者多个概率表。因此,当各个类别所处理的比特量较均衡时,与原有串行编码器相比,并行编码器的吞吐量将提高N倍。然而实际运用中,各个类别的句法元素比特数不可能均衡,因此编码器吞吐量的提升将小于N 倍。目前,HM中每一个句法元素都对应着一个或者多个概率模型,不同句法元素间的初始概率模型可能相同,并且可为每一个语法元素的每一位设计其选择概率模型的规则,以便为编码器提供最准确的概率估计。总体来说,SBAC的编码过程与原有的CABAC编码过程大致相同,都包括语法元素值二进制化、上下文概率模型选择、概率估计与上下文概率模型更新、二进制算术编码4个部分。具体SBAC的句法元素分类办法原则及其概率模型选择办法。5 HEVC下一步的研究设想H.265标准是在H.264标准的基础上发展起来的,结合H.264在视频应用领域的主流地位可以预见H.265协议在未来广大的发展前景。世界的一些主流电视组织以及媒体运营商已经选择H.264作为媒体格式标准,一些主要的编解码设备厂商也一直积极参与到H.265标准的研究当中。随着芯片处理能力越来越强,算法复杂性对应用的影响因素越来越小。相反,在算法实时通讯应用以及IPTV应用中,业务的不断扩展和需求的增加使得有限的带宽资源逐渐成为瓶颈,高压缩率的编码是解决这一难题的有效技术手段,这也为H.265在基于IP进行流媒体服务领域的应用奠定了坚实的基础。目前很多电信运营商使用H.264标准作为其媒体格式,也有很多厂商推出了基于H.264标准的机顶盒以及基于H.264标准的视频会议解决方案。随着技术的不断革新和社会的不断前进,HEVC压缩标准有着巨大的社会商业价值,有广泛的应用前景。作为一种新兴的强有力的视频压缩标准,会不断得到研究与改进。结合老师的讲解和自己的认识以及从网上查找的资料,有理由相信HEVC会在以下方面得到进一步的研究。5.1 进一步降低复杂度H264标准的编码器与原有的MPEG一2标准的芯片相比,芯片上的门数是其3倍以上,解码端也存在类似的情况,这对当前的多媒体处理芯片的性能提出了很大的挑战尤其是对于移动便携式的应用场合,意味着成本的提升和电池使用寿命的缩短,所以降低编码的算法复杂度是在H265中所要解决的主要问题之一。在已有的VCEG建议和讨论中已经有提案涉及到相关算法复杂度的衡量,提出的指标包括内存使用率计算所占用的机器周期并行处理能力等并计划形成一个统一的复杂度评价标准。另外算法复杂度的一个可能的演变方向是将算法复杂度在编解码端合理分配,将部分由编码端完成的工作由解码端完成。5.2 视觉特性和并行处理在提升编解码压缩率的处理上,利用人眼视觉特性和并行处理也是一个发展方向。如在对于具有较强纹理特征的视频序列处理时往往会产生较高的比特率,而人眼对纹理的辨别力不是非常敏锐,所以结合人眼的感知特性来减少视频表示所需要的码率也是提高压缩比的一个可选方案在现有的编码器部分加入纹理分析算法处理选择出可以刻画出视频纹理特征的必要信息,将这部分信息编码后发送到解码端,解码端提取出这部分信息后通过纹理合成算法将视频图象恢复。5.3 进一步减少码率和提高压缩比此外将图像通过不同的方向来做并行分析和编码,再从中选取码率最小的部分也是一种可能减少码率的方法。进一步提高编码压缩比的可能突破口是充分利用视频数据的统计信息及实际的信号特性来实现长时间的参数设置变化。压缩的视频在传输过程中对信道误码比较敏感,即使是单个的突发性错误也可能严重干扰接收端的正常解码造成恢复视频质量的急剧下降。如何确保视频数据对误码和时延的良好容忍性而保证视频的质量是另一个H26 5中要处理的问题。对于网络适应性的问题一般可以通过定义额外的传输语法来实现对各种错误情况的处理类似于已有的rtprtcP协议,可以通过添加和定义新的层次来在底层实现压缩视频的纠错特性,但如何在压缩视频自身中增加冗余信息提高抗错性能似乎是和视频压缩本身的需求相矛盾的,所以H265在网络适应性方面应该仍然会保持在H264中提出的编码和传输相对分离的机制即VCL层完成视频编解码NAL层完成适配,这也是符合分组数据网络分层模式设计原则的解决办法。此外,通过增加运动补偿变换编码和插值的可选配置项加强编解码器的适应性,结合当前H264扩展特性可扩展编码SVC,H.265编码将具有更强的选择和适应性,以满足不同分辨率显示设备,不同速率链路的需要。5.4 面向对象的算法在运动预测方面,下一代算法可能不再沿袭“宏块”的画面分割方法,而可能采用面向对象的方法,直接辨别画面中的运动主体。在变换方面,下一代算法可能不再沿袭基于付立叶变换的算法族,有很多文章在讨论,其中提请大家注意所谓的“超完备变换”,主要特点是:其MxN的变换矩阵中,M 大于 N,甚至远大于 N,变换后得到的向量虽然比较大,但其中的 0 元素很多,经过后面的熵编码压缩后,就能得到压缩率较高的信息流。关于运算量,H.26?的压缩效率比 MPEG-2 提高了 1 倍多,其代价是计算量提高了至少 4 倍,导致高清编码需要 100GOPS 的峰值计算能力。尽管如此,仍有可能使用目前的主流 IC 工艺和普通设计技术,设计出达到上述能力的专用硬件电路,且使其批量生产成本维持在原有水平。5 年(或许更久)以后,新的技术被接受为标准,其压缩效率应该比 H.26?至少提高 1 倍,估计对于计算量的需求仍然会增加 4 倍以上。随着半导体技术的快速进步,相信届时实现新技术的专用芯片的批量生产成本应该不会有显著提高。因此,500GOPS或许是新一代技术对于计算能力的需求上限。视频压缩的目的是在保证质量的情况下,用更少的数据去存储,传播视频。视频压缩的一般方法中,少不了离散余弦变换、量化、熵编码,这是因为视频的压缩更多的是处理时间冗余。很重要的思想是预测,向前预测,向后预测,还有就是相关性,也就是让跟周围的关系联系起来,让自己复原的更彻底。视频可以看成是一幅幅图像以某个速度进行传播,而在压缩中跟多的是可看成把一部分看成一个图像的演化过程,然后下一部分又是一个新的演化。5.5 降低解码延时三维自由多视角视频的应用和发展更需要使用更高压缩效率的视频编码方法,由于三维视频信息与一般视频信息相比具有通道多数据量大等特点,要达到时延和质量相同的效果则需要依靠更高的压缩效果和更少的编解码时延而这正是H265要达到的目标和所要解决的问题6总结H.265标准的发布和成熟都还有待所采用的编码技术和当前网络技术的发展伴随着其他应用领域的发展需求和硬件技术的发展H.265的推出只是时间问题目前估计这一新标准的推出时间将在2012年之后。H.265标准的发展和成熟应类似于H.264,也将是多种编码方法和工具的混合使用,实现编码效率,编码复杂度,图象质量等方面的平衡,它的发展也必将把视频编码理论技术和应用推向一个新的时期。6.1 HEVC的主要特征HEVC新视频编码方案依然沿用MPEGX和H.26X系列采用的混合编码框架。帧间和帧内预测编码:消除时间域和空间域的相关性。变换编码:对残差进行变换编码以消除空间相关性。熵编码:消除统计上的冗余度。 HEVC将在混合编码框架内,着力研究新的编码工具或技术,提高视频压缩效率,相较于以往的视频编码技术,将会有更多的优越性:(1)压缩效率更高(2)视频质量更高(3)健壮性更好(4)对IP网络的友好性好6.2 HEVC的应用前景展望虽然H265尚处于研究阶段,但伴随着通信网络向着宽带移动多媒体IP化的方向发展,以及日益丰富的视频媒体内容的产生,H2 6 5的产生和成熟定能在诸多领域得到广泛的应用。由于H265相关的实际产品并未推出,但结合H264所得到的广泛应用可以预见到H265的潜在市场。世界一些电视组织及媒体运营商已经选择H264作为媒体格式标准其中包括欧洲的DVB数字电视广播系统美国的ATSC,韩国的DMB及日本的ISDBT。主要的编解码设备厂商也一直积极参与到H26 5标准的开发过程当中,诸如Tandberg,汤姆逊等在推出H264的编解器后也都在致力于新的编解码器的研制。IPTV业务的不断扩展和需求的增加也使得带宽资源成为瓶颈高压缩率的编码是解决这一难题的有效技术手段,这也为H265在基于IP进行流媒体服务领域的应用奠定了坚实的基础。目前已有很多的电信运营商使用H264标准作为其媒体格式,也有很多的厂家已经推出了H264标准的机顶盒尤其在欧洲的IPTV领域,诸如法国电信,比利时电信运营商belgacom荷兰皇家KPN 电信集团等都将其作为提供标清IPTV业务的编解码技术这都说明H265在实现和成熟将进一步提升IPTV 的质量和效果。伴随着WCDMA TDSCDMA等3G无线通信系统在全球范围内的普及和商用,流媒体业务也将作为一个主要的无线业务得到推广和普及,通过无线网络来传输数据的可用带宽远低于固定网络,这也进一步要求高的压缩率。此外,无线移动信道容易受到天气移动速度,周围环境的影响对编码的抗干扰能力也提出了更高的要求。3GPP组织在3GPP第6发布版本中将H264作为其备选的编解码器,欧洲的数字多媒体广播系统也将其列为必选的编解码标准。高分辨率的视频图像更是H.265的理想目标应用目前H.264是高清电视卫星直播业务的编解码标准主要的卫星直播运营商,DirectTVEcho Star都使用了这一标准来压缩视频,同时它也是欧洲高清电视业务唯一的必选编解码器标准。目前世界上的视频编解码标准主要来源于国际电联ITU-T和国际标准化组织ISO。ITU-T的H.26x系列视频压缩标准经过了H.261、H.262、H.263H.263+这样一个演进过程,而ISO的视频压缩标准是MPEG系列从MPEG1、MPEG2到MPEG4之后两个标准化组织走向合作,成立了JVT推出了在当前最有效的视频压缩标准H.264/AVCH.264标准发布到如今已经五年时间。在这五年中H.264的应用范围不断扩展成熟度不断提高,而ITU-T在H.264取得初步成功的时候,ITU-T的视频编码特别小组VCEG于2005年就对视频编码技术提出了更长远的设想,并规划在技术成熟时推出新一代的视频编码标准H.265。2010年1月ITU-T和ISO下的动态图像专家组组织联合成立JCT-VC组织,统一制定下一代编码标准。2012年初,JCT-VC组织公布了新的视频压缩标准设计,设计名定为H.265。据悉,该设计同时包含了高性能视频编码HEVC和MPEG-H Part 2。通过名字我们大致可以判断,新技术将在只占H.264标准一半带宽的情况下为用户提供同等质量的视频服务,而且它还支持iOS和OS X平台。6.3 心得体会目前,HEVC的基本编码框架已经确定,但许多技术细节仍在不断地研究中。由于其在压缩效率、并行处理能力以及网络适应性方面的极大改进,它的发展和应用必将把视频编解码理论和应用推向一个新的高度。专家组的主要力量集中在进一步提高HEVC编码效率以及降低其复杂度上。但除了提高HEVC编码效率以及降低编码复杂度的提案以外,许多研究人员已经开始研究HEVC的可伸缩编码和多视点编码方案,相关研究工作正在有计划地展开。与H.264High Profile 的编码性能相比,目前HEVC 已经取得了40%左右的压缩性能提升,而编码复杂度也达到150%左右,不同测试场景的编码复杂度和性能提升程度有较大的差异。降低编码复杂度仍然是HEVC发展的一项重要议题。2011年7月22日,第6届JCT会议结束,本次会议总共提出了700多项提案,这些丰富的研究成果正极大地推动着HEVC前进的脚步。而HEVC的发展与完善必将极大地推动高清、超高清视频的应用步伐,为人类献上更丰富的视觉盛宴。数字视频的压缩与传输这门课程已经结束,我在其中收获了很多,不但了解到很多关于现有多媒体技术在现代社会的众多应用,还了解到这一领域的前沿领域。这为我们以后的工作和发展奠定了基础。通过学习下一代视频编码标准H.265/HEVC,我了解了多媒体视频编码技术的最前沿科技,也简单了解了H.265相对于H.264标准能改进的技术要点。对视频编码技术有了更深的了解。我感到责任重大即使是一个点,也还有很多方面值得拓展和探索,作为在职研究生,结合实际工作的应用研究是我们主要的目标。想要取得满意的结果和优异的成绩,我们所要做的就是倍加努力,汲取现有的知识,在前沿的领域开拓新的研究道路,积极探索,永不止步。知识的海洋是无穷无尽的,也许将来我们也可以不要那么浮夸,将利益看得那么重,而是潜心做一些研究。在这样大好的形势下,说不定真的能有所建树,推出利国利民新技术。参考文献:1ITU-TSG 16. Joint collaborative team on videocodingEB/OL.2011-07-20.http://en/ITU-T/studygroups/com16/video/Pages/jctvc.aspx.2 SULLIVAN G,OHM J. Meeting report of the first meeting of the jointcollaborative team on video coding,JCTVC-A200R.S.l.:JCT-VC,2010.3 WIEGAND T,OHM J,SULLIVAN G,et al. Special section on thejoint call for proposals on high efficiency video coding(HEVC)standardizationJ.IE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论