AVS视频编码技术_第1页
AVS视频编码技术_第2页
AVS视频编码技术_第3页
AVS视频编码技术_第4页
AVS视频编码技术_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、摘 要AVS是中国自主制定的音视频编码技术标准。AVS工作组成立于2002年6月,当年8月开始了第一次的工作会议。经过7次AVS正式工作会议和3次视频组附加会议,经历一年半的时间,审议了182个提案,先后采纳了41项提案,2003年12月19日AVS视频部分终于定稿。当前,AVS视频主要面向高清晰度电视、高密度光存储媒体等应用中的视频压缩。AVS-视频当中具有特征性的核心技术包括:8×8整数变换、量化、帧内预测、去块效应环内滤波等、变块大小运动补偿、多参考帧预测、二维熵编码、1/4精度像素插值等。关键词: AVS 视音频编码 技术 目 录摘 要I绪论1一、概述1(一)、制定AVS的必

2、要性1(二)、AVS的优势2(三)、AVS的产业应用3二、AVS核心技术3(一)、8×8整数变换与量化3(二)、帧内预测5(三)、环路滤波5(四)、变块大小运动补偿6(五)、多参考帧预测6(六)、B帧宏块编码模式6(七)、二维熵编码6(八)、1/ 4精度像素插值6三、AVS与MPEG-4 AVC/H.264复杂性比较6四、结论6参考文献10绪论音视频编解码技术的进步和标准的更新换代为我国后来居上提供了历史性发展机遇,AVS正是在这样的国家大背景下应运而生的。AVS标准的完成,使得全球范围内可选的第二代标准变成三足鼎立的局面:国际标准MPEG-4/,中国牵头的制定的AVS,还有一些公司

3、提出的标准。国际标准MPEG-4/虽然开放,但背后的专利授权问题难以负担;公司标准受到公司控制,难以得到业界广泛接受。我国牵头制定的AVS,性能达到国际标准同样水平,而且方案简洁,知识产权政策明晰,应是国际范围内第二代标准的上选。一、概述(一)、制定AVS的必要性众所周知,数字化视频的原始数据量是十分庞大的,例如,标准清晰度的数字视频每秒的数据量超过200M比特,高清晰度数字电视每秒的的数据量超过1G比特。数字音视频要在消费电子产品中得到应用,必须采用先进的压缩编码算法进行大幅度压缩。而反映压缩效率的压缩比也就成为数字电视乃至数字音视频产业的“基本指数”。国际上音视频编解码标准主要有两大系列:

4、国际标准化组织和国际电工委员会第一联合技术组(ISO/IEC JTC1)制定的MPEG系列标准,数字电视采用的是MPEG系列标准;ITU针对多媒体通信制定的系列视频编码标准和G.7系列音频编码标准。其中,只有MPEG-1没有专利授权问题。MPEG-2有国际工业界可接受的专心授权政策。MPEG-2最初的收费对象为解码设备和编码设备,每台专利授权费4美元。从2002年开始,降为2.5美元。由于当时MPEG-2是数字音视频领域唯一可用的技术标准,而且相对合理,因此MPEG-2的产业化取得了巨大成功。2002年1月31日,MPEG-LA发表了有关MPEG-4 Visual(Simple Profile

5、和Core Profile)的技术使用授权程序。其中有些条款令人难以接受。例如消费者使用解码设备,除购买设备时需要缴纳的一次性专利费外,还将按使用时间进行收费,通常这个费用是通过提供视频服务的节目发行商(如音像出版公司)或运营商(如电视台、视频点播服务提供者等)收取的,其总的收费额度每年高达数百万美元。此收费政策一出,美国在线-时代华纳代表媒体运营商率先反对。MPEG-4因为收费问题,成了一个主流应用运营商不支持的技术标准。MPEG-4被变本加利的专利费所扼杀,现在,这个问题又降临到MPEG-4AVC/H.264头上。从2001年开始,ISO和ITU开始组建了联合视频工作组(JVT,Joint

6、 Video Team, ISO/IEC MPEG和ITU-TVCGE联合视频工作组),在MPEG-4的基础上开发新的视频编码标准,目标定位制定一套兼顾广播和电信、覆盖从低码率通信到高清晰电视的广域标准。在ISO/IEC中,该标准的正式名称即为现在流行的MPEG-4 AVC(ITU又称H.264)。,MPEG-4 AVC也吸取了MPEG-2及MPEG-4的经验和教训,推出了较之前标准更低和操作性更强的许可政策。例如,AVC许可政策每台产品0.20美元的收费,与MPEG-2每个终端收费4-6美元(2002年前)和2.5美元(2002年之后)相比,降价幅度超过一个数量级。而其相比于MPEG4 pa

7、rt2,除了取消了按编解码时间收费(2美分/小时)以外,也降低了对于内容的收费,从而受到了更多机构、企业和运营商的欢迎。尽管,MPEG-4AVC/H.264不仅在技术上更加先进,有效节约了带宽,而且比MPEG-4更加优惠的专利许可政策也为运营商节省了支出,但对于中国的广播电视系统来说,近2000家电视台和大大小小的有线电视网需要缴纳的专利费总额依然十分庞大。中国数字电视运营产业MPEG国际标准,将面临巨大经济负担。如果继续采用MPEG技术作为数字电视标准,假设今后10年中国销售的数字电视、机顶盒和播放设备有4亿台,那么中国需要向MPEGLA缴纳10亿美元的专利费用,还要付出几千亿的芯片费用。更

8、重要的是,通过2002年的DVD专利收费事件表明,部分日本和欧美厂商将通过专利收费手段遏制中国家电产业的发展。如此沉重的负担如果可以通过自主技术的研发而得以解脱,中国产业界是不会放弃这种机会的。因此,制定一个属于我国自己的压缩编码技术势在必行。(二)、AVS的优势AVS是一套适应面十分广阔的技术标准,优势主要表现在以下几个方面:1) 基于我国创新技术和部分公开技术的自主标准:编码效率第一代标准(MPEG-2)高23倍,而且技术方案简洁,芯片实现复杂度比MPEG-4 AVC/标准约纸30%,达到了第二代标准的最高水平,可节省一半以上的无线频谱和有线信道资源;2) 第二代音视频编解码标准的上选:A

9、VS通过简洁的一站式许可政策,解决了被MPEG-4AVC/H.264专利许可问题缠身、难以产业化的死结,与一些公司提出的标准相比,AVS是开放式制订的国家、国际标准,易于推广; 3) 音视频产业提供系统化的信源标准体系:MPEG-4AVC/是一个视频编码标准,而AVS是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,为中国日渐强大的音视频产业提供了完整的信源编码技术方案,正在通过国际标准化组织合作,进入国际市场。4) 随着国家数字电视自主创新政策扶持力度的加大,越来越多的数字电视运营商开始认真考虑采用AVS。(三)、AVS的产业应用AVS的产业应用包括(高清晰度)数字电视、网络电视、

10、多媒体通信等,将来还可能扩展至移动电视(包括手机电视),数字游戏、激光视盘等广阔的应用领域。其产品形态有芯片、软件、整机和系统。以6亿台电视来计算。如果采用AVS标准,将高清和标清统一考虑,按照每个AVS机顶盒与解码器平均300元人民币计算,直接的产业规模就是1800亿元。如果考虑把移动视频、IPTV等领域的产业也加进去,应该在3000亿元以上。目前芯片企业、系统企业、运营商、内容提供商等均已经推出自己AVS相关的方案与产品,工作组、产业联盟、专利委员会也正法国密切协作。二、AVS核心技术AVS视频标准采用经典的混合编码框架,如图1所示。此框架与以往视频标准相同,但由于不同标准制订时出于对不同

11、应用的考虑,在技术取舍上对复杂度-性能的衡量指标各不相同,因而在复杂性、编码效率上的表现也各不相同。比如,一般认为H.264的编码器大概比MPEG-2复杂9倍,而AVS视频标准则由于编码模块中的各项技术复杂度都有所降低,其编码器复杂度大致为MPEG-2的6倍,但编码高清序列AVS视频标准具有与H.264相近的编码效率。在图1所示框架下,视频编码的基本流程为:将视频序列的每一帧划分为固定大小的宏块,通常为16×16像素的亮度分量及2个8×8像素的色度分量(对于4:2:0格式视频),之后以宏块为单位进行编码。对视频序列的第一帧及场景切换帧或者随机读取帧采用I帧编码方式,I帧编码

12、只利用当前帧内的像素作空间预测,类似于JPEG图像编码方式。其大致过程为,利用帧内先前已经编码块中的像素对当前块内的像素值作出预测(对应图1中的帧内预测模块),将预测值与原始视频信号作差运算得到预测残差,再对预测残差进行变换、量化及熵编码形成编码码流。对其余帧采用帧间编码方式,包括前向预测P帧和双向预测B帧,帧间编码是对当前帧内的块在先前已编码帧中寻找最相似块(运动估计)作为当前块的预测值(运动补偿),之后如I帧的编码过程对预测残差进行编码。编码器中还内含一个解码器,如图1中青绿色部分所示。内嵌解码器模拟解码过程,以获得解码重构图像,作为编码下一帧或下一块的预测参考。解码步骤包括对变换量化后的

13、系数进行反量化、反变换,得到预测残差,之后预测残差与预测值相加,经滤波去除块效应后得到解码重构图像。以上编码框架包含如下核心技术:8×8整数变换、量化、帧内预测、1/4精度像素插值、变块大小运动补偿、多参考帧预测、二维熵编码、去块效应环内滤波等。(一)、8×8整数变换与量化AVS视频标准采用整数变换代替了传统的浮点离散余弦变换(DCT)。整数变换具有复杂度低、完全匹配等优点。由于AVS中最小块预测是基于8×8块大小的,因此采用了8×8整数DCT变换矩阵。8×8变换比4×4变换的去相关性能强,在变换模块,AVS标准编码效率相比H.264

14、提高2%(约0.1 dB)。同时与H.264中的变换相比,AVS标准中的变换有自身的优点,即由于变换矩阵每行的模比较接近,可以将变换矩阵的归一化在编码端完成,从而节省解码反变换所需的缩放表,降低了解码器的复杂度。AVS对残差矩阵X的二维整数正变换定义为:式中:T8为变换矩阵,如图2所示。AVS整数变换的变换系数存在对称性,仅用加法和移位就可实现,消除了逆变换的不匹配,容易使用基8蝶形算法快速实现。图3所示为水平变换XT8的一维8点快速蝶形算法。量化是编码过程中唯一带来损失的模块。以前典型的量化机制有两种,一种是H.263中的量化方法,一种是MPEG-2中的加权矩阵量化形式。与以前的量化方法相比

15、,AVS标准中的量化与变换归一化相结合,同时可以通过乘法和移位来实现,对于量化步长的设计,量化参数每增加8,相应的量化步长扩大1倍。由于AVS标准中变换矩阵每行的模比较接近,变换矩阵的归一化可以在编码端完成,从而解码端反量化表不再与变换系数位置相关。(二)、帧内预测AVS视频标准采用空域内的多方向帧内预测技术。以往的编码标准都是在频域内进行帧内预测,如MPEG-2的直流系数(DC)差分预测、MPEG-4的DC及高频系数(AC)预测。基于空域多方向的帧内预测提高了预测精度,从而提高了编码效率。AVC/H.264标准也采用了这一技术,其预测块大小为4×4及16×16,其中4&#

16、215;4帧内预测时有9种模式,16×16帧内预测时有4种模式。如表1和图4所示,AVS视频标准的帧内预测基于8×8块大小,亮度分量只有5种预测模式,大大降低了帧内预测模式决策的计算复杂度,但性能与AVC/H.264十分接近。除了预测块尺寸及模式种类的不同外,AVS视频的帧内预测还对相邻像素进行了滤波处理来去除噪声。(三)、环路滤波起源于H.263+的环路滤波技术的特点在于把去块效应滤波放在编码的闭环内,而此前去块效应滤波都是作为后处理来进行的,如在MPEG-4中。在AVS视频标准中,由于最小预测块和变换都是基于8×8的,环路滤波也只在8×8块边缘进行,

17、与H.264对4×4块进行滤波相比,其滤波边数变为H.264的1/4。同时由于AVS视频滤波点数、滤波强度分类数都比H.264中的少,大大减少了判断、计算的次数。环路滤波在解码端占有很大的计算量,因此降低环路滤波的计算复杂度十分重要。(四)、变块大小运动补偿变块大小运动补偿是提高运动预测精确度的重要手段之一,对提高编码效率起重要作用。在以前的编码标准MPEG-1、MPEG-2中,运动预测都是基于16×16的宏块进行的(MPEG-2隔行编码支持16×8划分),在MPEG-4中添加了8×8块划分模式,而在H.264中则进一步添加了16×8、8

18、15;16、8×4、4×8、4×4等划分模式。但实验数据表明小于8×8块的划分模式对低分辨率编码效率影响较大,而对于高分辨率编码则影响甚微,如图5所示。在高清序列上的大量实验数据表明,去掉8×8以下大小块的运动预测模式,整体性能降低2%4%,但其编码复杂度则可降低30%40%。因此在AVS1-P2中将最小宏块划分限制为8×8,这一限制大大降低了编解码器的复杂度。(五)、多参考帧预测多参考帧预(如图6所示)测使得当前块可以从前面几帧图像中寻找更好的匹配,因此能够提高编码效率。但一般来讲23个参考帧基本上能达到最高的性能,更多的参考图像对

19、性能提升影响甚微(如图7所示),复杂度却会成倍增加。H.264最多可采用16个参考帧,并且为了支持灵活的参考图像引用,采用了复杂的参考图像缓冲区管理机制,实现较繁琐。而AVS视频标准限定最多采用两个参考帧,其优点在于:在没有增大缓冲区的条件下提高了编码效率,因为B帧本身也需要两个参考图像的缓冲区。(六)、B帧宏块编码模式在AVC/H.264标准中,时域直接模式与空域直接模式是相互独立的。而AVS视频标准采用了更加高效的空域/时域相结合的直接模式,并在此基础上使用了运动矢量舍入控制技术, AVS标准B帧的性能比H.264中B帧性能有所提高。此外,AVS标准还提出了对称模式,即只编码前向运动矢量,

20、后向运动矢量通过前向运动矢量导出,从而实现双向预测。此方案与编码双向运动矢量效率相当。(七)、二维熵编码熵编码是视频编码器的重要组成部分,用于去除数据的统计冗余。AVS视频标准采用基于上下文的自适应变长编码器。对变换量化后预测残差进行编码。其具体策略为,系数经过“之”字形扫描后,形成多个(Run,Level)数对,其中Run表示非零系数前连续值为零的系数个数,Level表示一个非零系数;之后采用多个变长码表对这些数对进行编码,编码过程中进行码表的自适应切换来匹配数对的局部概率分布,从而提高编码效率。编码顺序为逆向扫描顺序,这样易于局部概率分布变化的识别。变长码采用指数哥伦布码,这样可降低多码表

21、的存储空间。此方法与H.264用于编码4×4变换系数的基于上下文的自适应变长编码器(CAVLC)具有相当的编码效率。相比于H.264的算术编码方案,AVS的熵编码方法编码效率低0.5 dB,但算术编码器计算复杂,硬件实现代价很高。指数哥伦布码的比特串分为“前缀”和“后缀”两部分。如表1所示,前缀由leadingZeroBits个连续的0和一个1构成。后缀由leadingZeroBits+k个比特构成,即表1中的xi串,xi的值为0或1。 如:阶数为2,该系数在AVS码流中指数哥伦布码的比特串为“0010101”,则解码出来的系数值应为22+2-22+5=17。(八)、1/ 4精度像素

22、插值MPEG-2标准采用1/2像素精度运动补偿,相比于整像素精度提高约1.5 dB编码效率;H.264采用1/4像素精度补偿,比1/2精度提高约0.6 dB的编码效率,因此运动矢量的精度是提高预测准确度的重要手段之一。影响高精度运动补偿性能的一个核心技术是插值滤波器的选择。AVC/H.264亚像素插值半像素位置采用6拍滤波,这个方案对低分辨率图像效果显著。由于高清视频的特性,AVS视频标准对1/2像素位置插值采用4拍滤波器,其效果与6拍滤波器相同,优点是大大降低了访问存取带宽,是一个对硬件实现非常有价值的特性。四分之一像素的值是由其周围的点经线性插值后生成的,利用水平、垂直或对角方向的两个整像

23、素或半像素进行插值。参考帧的整像素之间插入其它像素通常称为半像素。半像素是由周围的整像素插值生成的,如图8所示,像素b、h、 m、s是由权重因子为1/32、5/32、 5/8、 5/8、5/32、1/32的FIR函数对相应的整像素位置滤波后生成的。例如图,半像素点b是由其周围水平方向的六个整像素E、 F、 G、H、I 和 J,经下面的公式计算生成的: 如图9中, a、c、i、k和d、f、n、q是由水平方向和垂直方向相邻的整像素和半像素点插值后生成的,e、g、p 和r是由对角线方向的半像素点线性插值后生成的。 例如四分之一像素a是由整像素G和半像素b经线性滤波后生成的: 三、AVS与MPEG-4 AVC/H.264复杂性比较MPEG-4AVC/是代表最新技术水平的一项国际标准,但正如它的名字复杂到让人难以理解一样,其技术方案也过于复杂。首先,这项标准覆盖的应用范围过宽,从低码率通信到高清晰度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论