(通信与信息系统专业论文)分层b帧码率控制技术.pdf_第1页
(通信与信息系统专业论文)分层b帧码率控制技术.pdf_第2页
(通信与信息系统专业论文)分层b帧码率控制技术.pdf_第3页
(通信与信息系统专业论文)分层b帧码率控制技术.pdf_第4页
(通信与信息系统专业论文)分层b帧码率控制技术.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 码率控制技术是视频编码、视频传输和视频存储应用中的一项关键技术,其 宗旨是在网络带宽及编解码器缓冲区受限情况下最大化输出视频编码质量。目前 针对h 2 6 4 a v c 标准的传统编码结构i p p p i b b p 已有相应的码率控制技术,但对 时间可分级的预测结构,即分层b 帧,还缺乏有效的码率控制算法。论文对此进 行了研究。 为实现对分层b 帧结构有效地码率控制,本文在已有的码率控制框架下进行 了以下改进: 1 根据可用信道带宽、帧率、图像分辨率和序列的内容自适应地确定序列第 一帧图像的量化参数( q u a n t i z a t i o n p a r a m e t e r ,q p ) ; 2 根据信道速率、帧率、c o p ( g r o u po f p i c t u r e s ,c r o p ) 大小和编码器缓冲 区的状态计算c r o p 层的目标比特数; 3 利用前面已编解码图像的特性和率失真模型确定编码图像的q p 。 实验结果表明:在采用h 2 6 4 a v c 中的分层b 帧预测结构进行编码时,相对 于传统的码率控制技术,研究的码率控制技术能使实际编码比特速率与目标比特 速率更好的匹配,且率失真性能有o 1 卸3 3 d b 的提高。 关键词:h 2 6 4 a v c 分级b 帧时间可分级码率控制技术 a b s t r a c t r a t ec o n t r o li sa l le s s e n t i a lt e c h n i q u ei nv i d e oc o d i n ga p p l i c a t i o n s ,w h o s eu l t i m e t a o b j e c t i v ei st oo p t i m i z a t et h ev i d e oc o o i n gq u a l i t yu n d e rc 宅r t a i nr e s t r a i n t so fn e t w o r k c o n d i t i o n , c h a n n e lb a n d w i d t ha n db u f f e rc a p a c i t y a tp r e s e n t , c o n v e n t i o n a lr a t ec o n t r o l a l g o d t h r a sa r es t u d i e da n dd e s i g n e df o rt h et r a d i t i o n a ls t r u c t u r e s ( e g i p p po ri b b p ) , a n ds e l d o mi n v e s t i g a t i o n so nr a t ec o n t r o lf o rt h en e wt e m p o r a ls c a l a b l es t r i c t u r e ,i e , h i e r a r c h i c a lb f r a l n e s t h e r e f o r e ,t h i sp a p e ri sd e v o t e dt ot h i sf i e l da n dh a si n v e s t i g a t e d o n an e wf l a m el a y e rr a t ec o n t r o la l g o r i t h mf o r t h eh i e r a r c h i c a lbf t a m e ss t r u c t u r e s t h ea d v a n c e m e n t so f t h ei n v e s t i g a t e da l g o r i t h ma r ea sf o l l o w s 1 t h eq u a n t i z a t i o np a r a m e t e r ( q p ) o ft h ef i r s tif r a m eo ft h es e q u e n c ei s a d a p t i v e l yd e t e r m i n e db a s e do nt h ea v a i l a b l ec h a n n e lb a n d w i d t h , f 1 出1 1 er a t e ,p i c t u r e s i z ea n dt h ec h a r a c t e r i s t i c so ft h em p u tv i d e o 2 t h et a r g e tb i t so fe a c hg r o u po fp i c t u r e si sc a l c u l a t e db a s e do nt a r g e tb i t - r a t e a n df u l l n e s so fb u f f e r 3 t h eq pf o rt h ec u r r e n tp i c t u r ei sd e t e r m i n e da c c o r d i n gt ot h ec h a r a c t e r i s t i c so f c o d e d p i c t u r e sa n dq u a d r a t i cr a t ed i s t o r t i o nm o d e l e x p e r i m e n t a lr e s u l t sd e m o n s t r a t et h a tw h e nt h ei n v e s t i g a t e dr a t ec o n t r o ls c h e m ei s a p p l i e dt ot h ec o d i n gs t r u c t u r ew i mh i e r a r c h i c a lbf r a m e su s i n gh 2 6 4 a v ce n c o d e r , t h ea c t u a l c o d i n g b i tr a t e sm a t c ht h e t a r g e tb i t r a t e sm u c hm o r ew e l lt h a nt h e c o n v e n t i o n a lo n e s ,a n dt h er a t ed i s t o r t i o np e r f o r m a n c ei sa l s oi m p r o v e db y0 1 0 3 3 d b k e y w o r d s :h 2 6 4 a v c t e m p o r a ls c a l a b l e h i e r a r c h i c a lbf r a m e s r a t ec o n t r o l 西安电子科技大学 学位论文创新性声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说 明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名: 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。 ( 保密的论文在解密后遵守此规定) 本学位论文属于保密,在一年解密后适用本授权书。 本人签名:薹喻植 翩签名:堂蔓拯 第一章绪论 第一章绪论 1 1 研究背景和意义 数字视频技术在通信和广播领域获得了日益广泛的应用,特别是九十年代以 来,随着i n t e m e t 和移动通信的迅猛发展,视频信息和多媒体信息在i n t e m e t 网络 和移动网络中的处理和传输【l j 成为了信息化中的热点技术。 众所周知,视频信息具有直观性、确切性、高效性、广泛性等一系列优点。 由于视频数据量太大,使得视频应用受限,进一步提高视频压缩率和编码质量成 为急需解决的问题。由于压缩必然会影响到视频的质量,因此需要在压缩比和视 频质量之间权衡。而视频编码中的码率控制技术就是在网络带宽及缓冲受限情况 下有效改善视频压缩编码质量及视频传输质量的一项关键技术,因此其显得尤为 重要,越来越成为视频编码研究中的热点和重点。一般来讲,码率控制技术并没 有被规定为视频编码标准中的一部分,其作为十分灵活的,开放性的一个机制为 视频编码服务,让视频信息满足各种不同场合的应用。 自从第一个视频编码标准制定以来,人们就致力于研究出更好的方法来平衡 上面视频压缩与视频质量之间的矛盾。随着科技的发展,生活品质的提高,人们 对i n t e m e t 通信、无线通信、移动通信和视频信息的运用提出了越来越高的要求, 为满足人们对视频信息在多方面的需求,比如媒体存储、视频点播、数字电视广 播、网络流媒体和视频会议等,科研工作者不断追求卓越,不断寻找新的方法, 力求提供更好的服务,因此码率控制技术也应运而生并取得了巨大成就。 1 2 码率控制技术的展望 现存的码率控制方法基本上都是假定信源特性是稳定的,分布具有一定的特 征,比如符合高斯分布或拉普拉斯分布,然后在此基础上根据率失真理论提出r - d ( r a t e d i s t o r t i o n ,r - d ) 模型,实施码率控制【2 】( 在传输速率受限的情况下,控制 不让编解码缓冲区溢出并最大化输出视频编码质量) 。 尽管码率控制技术已经取得了不小的成绩,但是仍需在以下几方面加以研究: ( 1 ) 确定更加精准的率失真模型 码率控制技术的关键问题就是估计或模型化视频编码器的率失真模型,而已有 模型都是在假定信源服从一定分布的前提条件下提出的,不仅灵活性受到牵制, 适用范围受到限制,而且当实际视频源不满足假设条件时,不再适用。所以需要 提出对视频源没有约束的更加精准的率失真模型,进一步真实地反映实际视频序 列的率失真特性。 2 分层b 帧码率控制关键技术研究 ( 2 ) 对缓冲器更加合理的控制策略 为防止缓冲区上溢或下溢,m p e g - 4 和h 2 6 4 a v c 6 j 标准规定了缓冲区的最大 容量值。当缓冲区满度达到一定程度时,实行跳帧策略防止上溢;如果缓冲区为 空,信道同样空闲,则采取比特填充策略防止缓冲区下溢。然而这种控制方法是 对i 、p 和b 帧都采用同一个机制。显然i p 帧编码比特要比b 帧编码比特多得多, 因此这种方式是不合理的。 ( 3 ) 对场景切换的处理 运动剧烈或者场景实时切换的视频序列,一直是人们研究的重点和难点。在这 方面也提出了一些很有效的方法,比如动态调整g o p 大小,检测场景变换,插入 s i s p 片等方法,但是这些方法通常都不够准确,并且计算十分复杂,不是十分行 之有效的方法。能够提出更加精准的检测场景切换和处理场景切换的技术将是既 艰巨又有伟大意义的工作。 ( 4 ) 基于小波视频编码器的码率控制算法 基于小波视频编码器的码率控制算法要比基于d c t 视频编码器的码率控制算 法相对简单一些,更便于控制。因为小波编码器具有一系列优秀特点:乱提供更 好的r d 折衷;b 提供更令人满意的主观图像质量;c 具有嵌入式特性,可以在 任意一点截断比特流而没有明显失真;d 不用考虑调整量化参数,只需对各帧合 理的分配比特数即可。但是国内外针对小波视频编码器的码率控制技术研究数量 还非常少,这方面的工作将成为一个研究热点【4 】。 ( 5 ) 基于视频对象的码率控制技术 自从m p e g - 4 视频编码标准提出基于对象的视频编码以来,人们就对基于对象 的码率控制技术展开了不少研究。由于一幅图像一般都不止一个对象,而一个对 象又包含形状信息、纹理信息和运动向量信息等,要做到合理而精准地对一幅图 像基于对象的码率控制是很复杂并具有挑战性的工作,这方面需要很大的人力物 力的投入。 ( 6 ) 精细粒度可分级视频编码的码率控制技术 随着视频信息运用越来越广泛,视频编码的目的除了追求最初的目标( 在给定 码率下达到最优的解码质量) 外,越来越重视视频编码的可伸缩性。目前已存在 许多有效的视频精细粒度可分级编码方案。而如何设计适合各种精细粒度可分级 编码方案的码率控制技术,如何在基本层与增强层间划分比特数,如何在增加层 合理地分配比特数,使其既能达到可分级的要求又能获得令人满意的视频效果是 有待解决的重要研究课题。 ( 7 ) 低比特率下的实际通信应用的码率控制技术 随着视频会议和视频点播等网路视频信息应用的推广,将对具有低时延及低复 杂度的码率控制技术提出更多更高的要求。如何在通信网上设计出人性化的多媒 第一章绪论 体应用和传输最小的多媒体流给用户,如何简化拉格朗日最优化算法,都将具有 很高的理论和商业价值。 1 3 论文组织结构 本文的内容一共分为四章,具体组织如下: 第一章:绪论,简介了研究码率控制技术的背景和重大意义,并展望了码率控 制技术发展方向; 第二章:视频编码中的码率控制技术,介绍了码率控制的基本概念,包括率失 真理论、控制模型和缓冲区的控制;详细分析了码率控制的实现过程,重点介绍 了提案j v t - h 0 1 7 中的码率控制:总结了现有标准中的码率控制技术,从h 2 6 1 到 h 2 每l a v c 。 第三章:编码结构研究,研究了传统编码结构( i p p p i b p i b b p ) ,s v c 中的分 级b 帧预测结构( 典型金字塔结构) ,分析对于不采用b 帧编码时,采用b 帧和分 级b 帧其p s n r 有较大性能提高。 第四章:基于h 2 6 4 a v c 的帧层码率控制技术,重点研究了分级b 帧的帧层 码率控制技术。研究的方案对起始q p 的确定提出了新的经验关系式,实验表明新 的经验关系式能更准确地确定起始q p ;研究了分级b 帧的码率控制技术,包括新 的分级b 帧层的目标比特分配算法和根据不同时间等级层采用不同的q p 确定算 法,实验表明研究的方案能很好地匹配目标比特速率,同样编码质量有很大提高。 其中4 4 小节分析了实验结果,测试平台j m l 0 2 ,c i f 格式序列,帧率为3 0 f p s , 插入b 帧数分别为7 和1 5 。比较了研究( 标记为:“s t u d i e d ) 方案和固定( 标记 为:“f i x e dq p ) 方案的编码性能,实验结果表明“s t u d i e d 方案能很好的起到码 率控制的目的,能很好的匹配目标比特率,同样编码性能有很大提高。 论文在结束语中对码率控制技术进行了总结并展望了其广阔的发展前景。 第二章视频编码中的码率控制技术 5 2 1 1 率失真 第二章视频编码中的码率控制技术 2 1 码率控制的基本概念 ( 1 ) 率失真理论:研究在限定失真条件下为了恢复失真符号所必须的最小信 息率。信源发出的符号传到信宿后,一般会失真。要避免这种失真几乎是不可能, 而且也无必要,因为信宿灵敏度总是有限的,不可能觉察无穷微小的失真。若在 处理信源符号时允许一定限度的失真,可减小所必需的信息率,有利于传输和存 储。率失真理论就是用以计算不同类型的信源在各种失真限度下所需的最小信息 率【3 3 1 。 ( 2 ) 率失真函数 3 7 1 :计算率失真函数是率失真理论的核心问题。要定义率失 真函数,必须先定量地表达失真的程度,因此需要规定失真函数d ( u v ) 。u 是信源 符号u 的样点,u a ,a 是信源集,可以是连续的实数区间,也可以是离散的有 限集如a = ( q ,a 2 ,) 。v 是信宿得到的符号v 的样,v b ,b 可以等于a 也可 以不同。因此失真函数d 是一个二元函数。当用v 代替u 不引起失真时,可使 d 仳v ) = o ,若引起失真,就按失真程度规定d ( k v ) 为正实数集内的一个数。由于u 和 v 都是随机量,d ( u ,v ) 也将是随机变量,因此还须定义平均失真d 作为失真的度量, 即d = e d ( u , v ) ,式中e 表示取数学期望。 而率失真函数为: r ( d ) = m i n p ( 饥牖,( u ,矿) ( 2 1 ) 式( 2 1 ) 中,最表示能使平均失真d d 的所有转移概率的集合,它是关于 从u 变换到v 的互信息的极值问题,r ( d ) 是在失真限于d 以及p ( v u ) i 了知的条件 下的互信息的极小值,i ( u ,为接收端获得的平均信息量,它的最小值仅与d 有关。 可以看出,率失真函数给出了在满足限失真准则的条件下,信源必须传输的 信息率r 的下限值。当每个信源符号的比特数低于r ( d ) 时,不存在能使失真小于 d 的编码方法;而给定允许的最大失真d 时,也没有一种编码方法可以是每个信 源符号的比特数低于r ( d ) 。一般情况,r ( d ) 是很难计算的,只有在一些特殊情况 下可以得到i ) 函数表达式。另外,根据不同的应用,其最大允许失真度是不同 的。失真度越小,编码比特数越大,反之,编码比特率越小。 ( 3 ) 率失真曲线 6 分层b 帧码率控制关键技术研究 图2 1 率失真曲线 如果定义最大允许的失真度为d ,则其对应的编码比特率的下限值是d 。的单 调递减函数。图2 1 率失真曲线表明:一个具有率失真函数r ( d 。) 的信源,倘若 r r ( d 。) ,则不存在任何一种编码会使失真度小于d 。或者说,没有任何一种编 码方法可以使平均编码比特率小于r ( ) ,而又使失真度小于d 的。所以,率失 真函数提供了一把衡量实际采用的编码方法效率是高或低的尺子,由此可见,率 失真理论给我们提供了达到最佳效果的编码原则。 ( 4 ) 拉格朗日乘子法【3 8 】 拉格朗日乘子法将率失真函数转化为一个无约束的求极小值问题,即: m i l l 肘 d ( u ,m ) r ( u ,m ) 心 ( 2 2 ) 式( 2 - 2 ) 中,d ( u ,m ) 与r ( u ,m ) 分别表示输出比特率的失真度和码流。其 中,比特率由采用编码模式m 对样本u 进行编码量化后输出。 在实际应用中,通常采用式( 2 3 ) 来选取编码模式: m = a r g m d n j ( u ,m i i )( 2 3 ) 其中: j ( v ,m ,九) = d ( u ,m ) + 九r ( u ,吖) ( 2 - 4 ) 式( 2 - 4 ) 中的a 是l a g r a n g e 参数。对于样本u 及其选定的编码模式m ,当其 编码后得到的比特率和失真度的线性组合j ,m i t ) ( l a g r a n g i a n 代价函数) 最小 时,此时的编码模式是最优的。 在l a g r a n g e 参数。与量化参数q 确定以后,h 2 6 4 的编码器通过最小化代 价函数来实现对每一个宏块( m a c r o b l o c k ,m b ) 的编码模式的抉择。宏块u i 的代 价函数如式( 2 5 ) - ,( 配,mj q ,f ) = ( 阢,m1 9 + k ,如( ,ml q ) ( 2 5 ) 其中,m 为相应宏块的编码模式。 在不同的编码模式下,编码后比特流的比特率r 与失真度d 的计算方法不完 一一k口p“叠一芸旃簧 第二章视频编码中的码率控制技术 7 全相同。在帧内模式下,r 为熵编码后比特流的比特率,失真度d 则由原始像素 和重建像素决定,且有如下两种计算方式: s s d = l u ( 五y ,f ) 一u ( z ,y ,) 1 2 ( 2 - 6 ) ( x y ) e c s a d = l u ( x , y ,t ) - u ( x 川y ) l ( 2 7 ) ( x ,y ) e 其中,c 为当前宏块。 对于s k i p 模式,由于无需残差信号,因此比特率r 和失真度d 与量化参数q 无关。其中,失真度d 由宏块的原始像素值和预测像素值决定,而比特率r 则在 h 2 6 4 中被近似认为是1 b m 。 在帧间模式下,由于采用了基于块的运动估计,l a g r a n g i a n 代价函数的计算与 帧内模式或s k i p 模式相比要复杂很多。对于采用帧间编码模式的块,在给定 l a g r a n g e 参数九棚和参考图像u 的情况下,通过最小化l a g r a n g i a n 代价函数来实 现块m 的运动估计,如式( 2 8 ) : m = a t g r a i n 。e , 。( u ,册) + 丸嘲k ( ,聊) ( 2 - 8 ) 其中,m 为可能的编码模式的集合,r 为传输运动矢量( ,历,) 所需的比 特数,失真度d 由下面两种方法计算: s s d = i u ( x , y ,t ) - u o 一他,y 一,一啊) 1 2 ( 2 9 ) ( x , y ) g c s a d = l u ( x , y ,t ) - u ( x 一他,y - m , ,t - m , ) l ( 2 - 1 0 ) ( ,【 y ) e 在进行运动估计时,水平与垂直方向的搜索范围是3 2 个像素,并采用一帧 或多帧参考图像。 在h 2 6 4 视频编码控制模型中,。由量化参数确定: a 删。= 0 8 5 * 2 o - 1 2 门 ( 2 - 1 1 ) 另一个l a g r a n g e 参数k 嘲与气o d 。有关,由式( 2 1 2 ) 、( 2 - 1 3 ) 分别确定: 九棚= 九o d 。 ( 2 1 2 ) 一a 行鲫= h o d f u 。 式( 2 1 2 ) 对应于s s d 的计算方法。 k 咖= 、。 ( 2 - 1 3 ) 式( 2 1 3 ) 对应于s a d 的计算方法。 3 分层b 帧码率控制关键技术研究 2 1 2 码率控制模型 ( 1 ) 原有的二次模型【3 j 如果假设信源符合拉普拉斯分布: 户( x ) = i f i tp - a h ( 2 1 4 ) 其中,哪 x + 0 0 。 并且计算失真度的方法为: d ( x ,_ ) 爿x ij(2-15) 则提出一种对数模型: r ( d ) = h 嗑) ( 2 - 1 6 ) 3a 其中,d a :0 , d m :三,0 i 。 d z 就是说p 帧之间有且不只一个b 帧。则量化参数为: 蠛= 缎+ a + - n a ) 【 幽祥,2 x ( f - 1 ) ) 2 ( f _ 1 ) ( 2 - 4 4 ) 3 q 罡一q 暑2 三一3 2 q 最一q 嵋_ 2 三一2 1 q 芝一q p , s - 2 一l ( 2 - 4 5 ) 0 q 罡一q e , _ 2 三 1 鹎一蝴_ 2 l + i 2其他 其中口是第一个b 帧的量化参数与的缎的差。 其中,除去岱2 的情况,其他情况只有在视频序列从一个g o p 切换到另一个 g o p 的那一瞬间才会出现。 最后鲣还要满足如下约束: q a , = r a i n m a x 硷置,1 ,51(2-46) b p 帧的量化参数 第一步:为每一个p 帧确定目标比特数。第一步又分为以下两部分 i 宏观控制 宏观控制为每一个p 帧确定目标缓冲区大小。由于第一个p 帧的量化参数在 g o p 层就已经确定好了,于是只需计算c r o p 中其他p 帧的目标缓冲区大小。在对 第i 个g o p 中的第一个p 帧进行编码后,将目标缓冲大小调整为: t b l ( n _ i 。2 ) = 豌( 吩。2 ) ( 2 - 4 7 ) 其中,b 。( 靴) 是对第i 个g o p 中的第一个p 帧进行编码后缓冲区的实际大小。 则后续的p 帧的缓冲区的目标大小为: t b l 魄一划,一警+ 茄筹器一掣, 其中,元仉。,) 是p 帧的平均复杂度加权系数,元( 刀u ) 是b 帧的平均复杂度 加权系数,用式( 2 - 4 9 ) 计算: 第二章视频编码中的码率控制技术 1 5 户掣+ 型掣 嘶。:掣+ 塑掣 ( 2 4 9 ) ( 刀u ) = 6 ( 刀u ) q 巴( 挖u ) 啉- ) = 盟篙掣 其中,q p , 和线是相应的量化参数,b ( n i j ) 是编码相应帧产生的比特数。 如果p 帧之间没有b 帧,则式( 2 - 4 9 ) 可简化为: t b ( ) :r o l ( n ,j ) 一三皇坚掣( 2 - 5 0 ) 1 , 1 可看出t b ( n , ,卵) 的值大约是忍8 。如果实际的缓冲区占用率等于目标缓冲区 大小,则每一个g o p 均使用自己的预算。由于实际的率失真优化和煳预测不 够精确,实际的缓冲区占用率与目标缓冲区大小之间存在差异。因此需为每一帧 计算目标比特,以减小实际的缓冲区占用率与目标缓冲区大小之间差值。可通过 微观控制来实现【1 3 】。 i i 微观控制 微观控制的目的是计算每帧的目标比特数。 第i 个g o p 中第j 帧的目标比特数为: 八咿警吖( t b 吲删 其中,y 是一个常数,没有b 帧的情况下,其典型值为0 7 5 , 如果产生的实际比特数在目标比特数附近,可以得到式( 2 5 2 ) : 玩( 吩,p 1 ) 一t b l ( n f ,一1 ) ( 1 一y ) ( 统( 力f ,j ) 一t b l ( n , ) ) ( 2 - 5 1 ) 否则为o 2 5 。 通过选择一个大的y 可得到较规则的缓冲区变化。 在计算目标比特的同时,还需计算剩余比特数: = 丽丽等器糍瓯而 最后每一帧的目标比特数( 啊,- ,) 是于( j ) 和厂( ,:f ) 的一个加权和。 f ( n ,) = 3 f ( 刀,。) + ( 1 一f 1 ) x f ( n u ) ( 2 - 5 2 ) ( 2 5 3 ) ( 2 5 4 ) 其中d 是一个常数,没有b 帧的情况下,其典型值为0 7 5 ,否则为0 9 。 但以c b r 信道情况为例,如果实际编码产生的比特数与目标比特数接近, 将公式( 2 2 4 ) 和( 2 5 1 ) 代入公式( 2 5 2 ) 中不等式左边部分,可得: 1 6 分层b 帧码率控制关键技术研究 ( 吩) 一t b l ( n , ,j + 1 ) ( 1 一y ) ( ( 协) 一t a t ( n , ”+ ( 2 5 5 ) 其中,:t b l ( n i , , , ) - - b s 8 ,可见是一个不可忽视的值。 a p 一1 因此,将( 吩,) 修正为: 低) = 掣吖( t o m ) ) _ 警 实验结果表明,使用修正公式可以更好的进行缓冲区控制。 第二步:计算量化参数,进行率失真优化 已知先前p 帧的实际m a d ,使用线性模型预测当前p 帧的m a d 。使用( 2 1 9 ) 的二次率失真模型,计算当前帧的量化参数。其中,厨是用于编码非纹理信息所 用得比特数。为了获得平稳的视觉质量,对量化参数进行如式( 2 5 7 ) 的调整: 9 0 = r a i n q , , + 2 ,m a x q 一2 ,q 0 ) ( 2 - 5 7 ) 其中,q 卯是先前p 帧的量化参数。 最终量化参数为: q 肛= m i n q 品+ d q u a n t ,m a x q 彤一d q u a n t ,q 肛,1 ,5 1 ( 2 5 8 ) ( 2 ) 编码后处理 这一阶段的主要任务有三个:使用线性回归方法更新m a d 预测模型参数和更 新二次率失真模型参数以及确定需要跳过的帧数。 在更新模型参数时,需要去除不正确的数据点。从统计意义出发定义不正确 的数据点为:如果某个数据点的实际比特率与预测目标比特率之间的标准偏差超 过某- - f - j 限k ,则认为此数据点为不正确的。在更新模型参数时,对滑窗内的数据 进行筛选,剔除不正确的数据点,即不使用预测比特率与实际比特率差别较大的 数据点做模型参数预测。通过这一步骤可进一步校准率失真模型参数。 但当样本点个数较少( 如n :5 ) 即滑窗较小时,经过去除不正确的数据点后 往往出现只有1 2 个可用数据点,则二次模型退化为一次模型或者误差非常大。 在实验中发现,对于源图像质量比较平稳的序列,使用这样的滑窗机制和码 率控制,则原算法往往出现上述模型退化。模型精确度突然下降,从而引发码率 控制的突发误差和缓冲区剧烈波动。本论文中采用的是设计一个较小的门限值, 如果标准误差绝对值还小于门限值,则采用最大的滑窗数目。 2 2 2 3 基本单元层码率控制 若码率控制的基本单位小于一帧则需要执行基本单元层码率控制。i 帧、p 帧和 第二章视频编码中的码率控制技术 1 7 b 帧内所有基本单元使用同个量化参数。该量化参数的计算方法与帧层码率控制 中的方法相同。以下介绍p 帧的基本单元层码率控制方法。 类似于帧层码率控制,首先为p 帧分配目标比特数,然后将可用的比特数平均 分配给每一个基本单元。基本单元层的码率控制分为以下五步1 9 : ( 1 ) 计算当前基本单元纹理比特数 氖计算当前基本单元的目标比特数足, 设心和厶( 。,) 分别为当前帧所有未编码基本单元的个数和这些单元的目标 比特数。其初始值分别为和厂( 吩,) 。当前基本单元的目标比特数为厶心。 b 计算所有已编码基本单元产生的非纹理比特数 而胁,:m 舭。( 1 - 了1 ) 4 竿 , , ( 2 - 5 9 ) , 、- 一, 娟忐棚慨l ( 1 一志 其中,而腑是当前帧内第1 个基本单元实际产生的非纹理比特数,所腩。是用前 一帧所有基本单元的实际信息得到的预测值。 c 计算纹理比特数 厂 r t = 鼓一( 2 - 6 0 ) ( 2 ) 使用前一帧对应位置基本单元实际m a d 和线性模型预测当前基本单元 的m a d 。 ( 3 ) 利用二次率失真模型计算当前基本单元的量化参数,分三种情况。 乱当前帧第一个基本单元的量化参数为前一帧所有基本单元量化参数的平 均值,即: 既= ( 2 6 1 ) b 岛 8 时, d q u a n t = l ,否n d q u a n t _ 2 。 为了保持视频质量的平滑性,最终对量化参数作以下限定: q o = m a x 1 ,q 0 一a , m i n s l ,q 0 + ,q c 6 ( 2 - 6 3 ) 其中,_ 3 ,如果基本单元所包含的宏块数小于图像一行中的宏块数;否则 a = 6 。 1 5 分层b 帧码率控制关键技术研究 c 其他情况下利用率失真模型计算,并作类似于第二种情况的限定。 ( 4 ) 对当前基本单元内的所有宏块进行率失真优化。 ( 5 ) 更新当前帧剩余比特数和未编码的基本单元数。 2 3 1h 2 6 1 2 3 现有的码率控制技术 h 2 6 1 视频编码标准是基于块的混合编解码器,它主要是运用预测d c t 变换编码、运动补偿技术为i s d n 视频会议服务。因为视频会议的特征是关 注人物的头和肩的运动,而图像中的其他部分具有相对较平缓的运动以及几 乎静止的背景,这些不是视频会议运用关注的重点。所以h 2 6 1 所采纳的码 率控制方案就是:既简单又容易的通过监控缓冲区的状态来调整量化步长的 大小,达到控制的目的i l j 。 量化步长是缓存状态的线性函数,可以表达如下: 卿l i 赤j + 2 ( 2 - 6 4 , 其中,p 是用来说明比特率的一个乘子,它可以表示

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论