




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精品论文推荐一种 h.263 比特率转码速率控制的新算法黄晓瑜 ,庄伯金1 北京邮电大学 电信工程学院,北京(100876)e-mail:摘 要:速率控制是视频比特率转码中的一项核心技术。用域线形模型在视频编码中进行 速率控制已经取得很好的效果。然而,该模型并没有考虑在视频转码中对输入流已有信息的 复用。本文研究基于像素域级联框架的 h.263 比特率转码,针对输入码流信息对域线形模 型的影响,提出了一种改进的域转码速率控制算法。实验结果表明利用该算法得到的转码 图像主客观质量与基于 tmn8 速率控制算法的全解全编方法得到的视频图像相当。 关键词:视频压缩,视频转码,速率控制中图分类号:tn911.211. 引 言近年来,随着 internet 和多媒体通信业务的发展,视频的应用越来越广泛,越来越多元 化。不同网络的信道特征不同,各种多媒体终端的视频的处理能力不同,为了在不同的网络 条件下向不同的终端用户提供视频服务,要求视频必须能够根据用户环境动态的调整,视频 转码就是完成此类任务的关键技术之一。所谓视频转码,一般来讲就是指将视频数据从一种 格式转换为另一种格式,此处的格式包括编码标准、码率、帧率以及空间分辨率等1。比特率转码是视频转码最主要的应用之一,它的主要功能是对已压缩编码的视频流进行 转换,使其能适应实际的信道带宽2。例如:由于演播室需要,将一路电视节目进行高码率的压缩以保持高的图像质量,但是后来在传输的时候由于信道的限制,就需要将原来的高 码率的视频转换为低码率的视频来适应信道。码率控制算法一般分为两类:一类是联系量化参数 qp 与编码模式的 r-q 非线性模型;另一类则是 r-nz 线性模型,即编码量化后的 dct 系数所需比特率 r 与量化后的零系数个 数的比例 存在着线性关系3。本文针对 h.263 的比特率转码,采用像素域级联转码框架, 速率控制算法则是在编码速率控制 域线性模型基础上,根据转码自身的特性做相应的改 进,并且通过实验证明改进的算法与全解全编得到的视频图像在码率控制和图像质量上相 当。在本文的第 2 节详细介绍了视频编码中的 域速率控制方法;在第 3 节详细介绍了 域速率控制方法应用到转码中应做的改进;最后在第 4 节通过实验数据说明改进后的算法得 到了不错的效果。2.视频编码中的域速率控制算法视频编码中的熵编码部分通常采用的是霍夫曼码表,这些码表是直接与变换后的 dct 系数相关的。而之所以能对视频图像进行高比率的压缩,就是由于大量零系数的存在,于是 很多学者就零系数比例与压缩后比特率的关系做了大量的研究工作。根据他们的研究发现,编码一帧图像得到的比特数与变换后零系数的个数可以近似为一个线形模型 (r, )(r 表示编码一帧图像后得到的比特数, 表示一帧图像中零系数的比例)。视频编码速率控制中最关键的问题是:如何找到最合适的量化参数 qp 对 dct 系数进 行量化,以达到目标比特。根据已知的结果,qp 与 之间存在一种单调递增关系,所以我 们可以根据 得到唯一的 qp 值与其对应。当确定了 r- 和 qp- 两个函数后,就可以通过- 8 - 得到合适的量化参数 qp 以达到目标比特。 域速率控制算法在实际视频编码时主要分三步完成4,如图 1 所示。首先对新的一帧 做预分析,估计当前帧的比特率并建立速率模型;然后是帧级速率控制,为当前帧分配目标 比特,然后根据速率模型得到帧级的 qp;最后是宏块级速率控制,即每编码完一个宏块对 速率模型进行更新。当编码完最后一个宏块,要对缓冲区进行更新再决定是否需要跳帧。新的一帧估计速率预分析计算qp-映射建立速率模型计算当前帧目标比特数帧级速率控制选择帧级qp更新速率模型宏块级速率控制更新qp-映射选择宏块级qp是否是最后一个宏块更新缓冲区并判定是否跳帧2.1 预分析图 1 域速率控制算法在对新的一帧图像编码前,要先对该帧进行一个预分析,目的是要建立 r- 速率模型。 因为 r- 是近似线性关系,所以只要得到直线上的两个点就可以确定这条直线。现假设直线上的两点分别为 (r1 , 1 ) 和 (r2 , 2 ) ,则 r- 关系为:r( ) = ( r1 r2 ) + ( 1 r2 2 r1 )(1)1 21 2那如何才能得到 (r1 , 1 ) 和 (r2 , 2 ) 呢?在论文4中,(r1 , 1 ) 是通过假设 qp=1 的情况下, 根据虚拟的可变长码表计算得到的,而 (r2 , 2 ) 则是从前一帧已编码帧得到。论文4中还提出了两种方法 (r1 , 1 ) 的方法,但基本原理是一致的:对变换后的 dct系数用 qp=1 进行量化,再对量化后的系数进行扫描得到零系数的比例 ,最后从简化了的vlc 码表中计算出实际需要的比特数。两种方法的不同之处在于 vlc 表的简化程度不同而 已。具体计算公式如下: (qp) =n1m 384 d0 ( x) +n|x|2qp1m 384 d1 ( x)|x| z m(8)w z m ,otherwise上式中,w表示缓冲的充满程度,wprev表示在前一帧编码前缓冲的充满程度,bprev编码 前一帧实际所用的比特数,rc表示信道传输速率,f表示帧率,btarget表示当前帧的目标比特 数,提供w的反馈,以使btarget接近常数,m表示缓冲的大小,z一般取 0.1。在得到当前帧的目标比特数后,当前帧的目标速率rtarget=btarget/np,再根据预分析得到 的速率模型得到target,最后查找qp-映射表得到帧级qp。2.3 宏块级速率控制仅根据帧级 qp 进行量化编码会带来很大的误差,该误差主要来自于取整过程中的近似, 于是需要引入宏块级的速率控制。宏块级的速率控制主要由三部分组成:速率模型的更新、 qp- 映射表的更新以及宏块级 qp 的选择。速率模型的更新过程如下:ri =bi,16 16i =zi16 16 + 8 8 + 8 8n1nr ( ) = a + b n(9) rk k n ( rk )( k )kbk= k =1 k =1 k =1 11nn= nn2arkb knn 2 1 ( )k =1k =1k =1n k =1上式中,ri 是编第 i 个宏块时实际使用的比特数;zi 是第 i 个宏中零系数的个数;n=i+2。n 中的 2 表示预分析中用于建模的两个点。qp- 映射表的更新公式如下:i +1, n m(qp) =1 d0i +1, n m( x) +1di +1, n m1,i( x)384 ( n m i)|x|2qp|x| 2.5qp1,i(10)d=1 01, n m( x) +d11, n m( x) d 0 ( x) d1 ( x)384 ( n m i)|x|2qp|x|2.5qp|x|2qp|x| 7901ii =1r( ) = (rate |qp =32 rcur ) ( (32) rcur cur rate |qp =32 )(13) (32) curn3.2 帧级速率控制的改进 (1) cur由于在转码中引入了运动矢量再利用,在进行帧级比特分配时,不能完全按照 tmn8 中提出的跳帧策略,如当遇到第一个 i 帧,由于 i 帧编码所用比特数较大,在 tmn8 的控制 下可能引起连续的跳帧,但是在转码的时候,如果也继续跳帧就会使后面的图象的参考图象 丢失,如果用再前面的帧替代丢失的帧作为参考的话又会导致运动矢量不正确,为了避免这 两个问题,在转码时不支持跳帧策略,当遇到 i 帧占用比特数过大时,只能通过持续降低多 个 p 帧的码率来控制总码率。3.3 宏块级速率控制的改进在实际 h.263 编码时,宏块层的 qp 选择除了需要满足原算法中给出的两个条件外,还 必须满足相邻宏块 qp 相差不能超过 2 的要求,在具体实现变化为:当qpoldqpframe时,qpmb=clip(qpmb, qpold-2, qpold+2); 当qpold=qpframe-1 时,qpmb=clip(qpmb, qpframe-2, qpframe+1); 此外,qpmb=clip(qpmb, qpframe-2, qpframe)。clip(x, a, b)表示将 x 剪切到a, b之间。3.4 头信息比特分配控制上面提到的速率控制的算法仅仅是对 dct 系数所用比特数的精确控制,而实际上编码 所用的比特数其中一部分是各种头信息的开销,对于这部分的比特分配我们采用启发式的方 式,初始化为解码得到的头信息所有比特数,在每次编码完一个宏块后进行更新,具体实现 如下:hhhhhri = ri 1 + bi ,hhr0 = rdechr = min(n p ri/ i,r0 )4.实验结果分析为了对改进后的算法进行实验分析,将该算法运用到像素域基联转码框架中,该框架引 入了运动补偿,但没有运动再估计,即再编码做运动补偿时仍使用解码得到的运动矢量。为 了与我们的速率控制技术作比较,将完全解码后的视频再完全编码,这里的完全编码是指在 编码时还加入了运动再估计技术,在全解全编码的情况下采用 tmn8 速率控制技术,然后 两者进行码率控制与图像质量的比较。这里采用 cif 格式的 paris 和 silent 作为实验测试序 列(帧率为 10 帧/秒),我们用的转码策略简写为 cpdt,而全解全编的转码简写为 qjqb。原始 paris 序列为 200kbs/s,目标码率是 100kbs/s。如图 2 所示,从码率控制结果来看, cpdt 转码中的 域速率控制算法开始缓缓上升,这是由于第一个 i 帧所占比特数太多,而 在转码中没有引入跳帧机制。从 30 帧左右开始进行平稳状态,且一直维持在目标比特数附近。qjqb 转码 tmn8 控制下的码流,除前几帧由于跳帧而引起较大的波动外,从 10 帧以 后几乎都稳定在目标比特数附近,但是从图上可以看出,在 tmn8 控制下,实际产生比特 数间歇性较大偏移与目标比特数,不如 qjqb 的稳定。再从 psnr 值上来看转码后的图象质量比较,下图中 deltapsnr 值表示的是级联转码得到的视频图像 psnr 与全解全编后得到 的视频图像 psrn 值的差,可以看出来仍然是全解全编的图象质量更高一些,而前面十几帧的质量相差较大,这是由于没有引入跳帧,前几帧的码率压的太低引起的,但进入稳定期后, 图像质量也相对稳定,从图上可以看出,与全解全编的图像相比,平均低 0.20.3db 之间。原始 silent 序列为 200kbs/s,目标码率是 100kbs/s。如图 3 所示,我们设计的速率控制算法与 paris 的基本一致,也是开始慢慢上升,随后稳定与目标比特数,在对于 silent 序列, tmn8 控制的效果比我们设计的算法更稳定。在从图像质量上说,也与 paris 序列相似,前 几帧由于码率压的过低导致图像质量下降比较严重,但也都在 0.6db 以内,随着稳定达到目 标比特数后,图像质量逐步提高并相对稳定,甚至在后面的图像中我们算法下的图象质量比 全解全编的质量更好。14001200pari0.4000.200paris1000bit 8006004000.000-0.200feltapsnr-0.4002000024681012framenpcd qjq-1.000framenodeltapsnr图 2 paris 序列的码率控制和 psnr 差值图silentsilent12000020406080100.400bits80006000deltapsnr400020000.2000.1000.000-0.1000-0.200-0.3000020406080100120frameno-0.500-0.600framenopcdt qjqb图 3 silent 序列的码率控制和 psnr 差值图deltapsnr5.结论本文给出了一种 h.263 比特率转码速率控制的新算法,该算法是在对 域视频编码速率 控制算法的基础上改进设计得到的。并且通过实验证明,当该算法用于像素域级联转码器得 到的结果与全解全编的转码得到的结果已经相接近,但无论从转码器的复杂度还是速率控制 算法的复杂度来看,我们设计的算法和转码的效率都远比全解全编的高。目前在我们的算法中仍存在着一些不足,比较突出的问题是由于没有引入跳帧机制,对 于 i 帧之后的连续 p 帧的图像质量下降较大,在未来的工作中,会在像素域级联转码框架中 加入一定的运动再估计,以保证当发生跳帧时,即参考帧发生改变时能有更准确的运动估计 和预测,从而进一步提高转码的性能。参考文献1 vetro a, christopoulos c, sun h f. video transcoding architectures and techniques: an overview j.ieee signal processing magazine, 2003, 20(2): 18-29.2 xin j, lin c w, sun m t. digital video transcoding j. proceedings of the ieee, 2005, 93(1): 84-97. 3 杜耀刚, 蔡安妮. dct 域视频转码技术综述 j. 电子学报, 2005, 33(9): 1644-1649.4 lee j y, park h w. a rate control algorithm for dct-based video coding using simple rate estimation and linear source model j. ieee transactions on circuits and systems for video technology, 2005, 15(9):1077-1085.a new rate-control algorithm for h.263 bitrate transcodinghuang xiaoyu , zhuang bojin1. school of telecommunication engineering, beijing university of posts andtelecommunications, beijing (100876)abstractrate control is one key technology in video bitr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年度计算机四级题库检测试题打印含完整答案详解【网校专用】
- 个人歌唱活动策划与执行要点
- 物料能量衡算精要
- 酒店微笑问好服务培训纲要
- 2026届山东省曲阜市石门山镇中学九年级化学第一学期期中学业水平测试模拟试题含解析
- 2026届山东省德州市六校化学九上期末统考模拟试题含解析
- 2026届山东滨州阳信县九年级英语第一学期期末教学质量检测模拟试题含解析
- 2026届河南省驻马店九上化学期中预测试题含解析
- 河南省南阳市宛城区等2地2025-2026学年高二上学期开学英语试题(含答案)
- 2025年腔镜技能大赛试题及答案
- 部编版新教材道德与法治二年级上册《5. 这是我们班》教案
- 滴滴认证考试题库及答案
- 社会教育情感教案
- 法律律师委托协议书模板
- Unit4PlantsaroundusPartBHowcanwehelpplants(教学设计)-人教PEP版英语三年级上册
- 2025年公共基础知识综合考试练习题及解析答案
- 2025年小学英语教材培训心得体会范文
- 2025年广西继续教育公需科目考试试题和答案
- 众筹方案文案(3篇)
- 系统性风险压力测试框架-洞察阐释
- 子宫动脉栓塞术后护理常规
评论
0/150
提交评论