




已阅读5页,还剩60页未读, 继续免费阅读
(通信与信息系统专业论文)h26x系列的算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学硕寸 _ 论文 摘要 随着计算技术和网络通信的飞速发展, 网络视频会议、 视频电话、网络监控 等得到了越来越广泛的 应用, 而其中应用最广泛的视频压缩标准就是工 t u - t制定 的 h .2 6 x系列标准。视频会议系统或监控系统的很重要的特征就是实时性,而 h .2 6 x 系列特别是h .2 6 4 的计算复杂度很高,为了提高系统的效率就必须提高算 法的效率。本文从码率控制、整像素运动估计、1 / 4像素运动估计三个方面来分 析算法的计算复杂度, 对已有的算法进行分析和比较, 在前人研究的基础上分别 提出了新的算法。 码率控制算法可以保持视频流在网络中顺利传输并充分利用带宽。 传统的码 率控制算法为 r - d模型,要么具有很高的计算复杂度,要么算法不够精确。本 文在 p域线性率失真模型的基础上提出了一种新的码率控制算法,在保持高精 度的基础上大大减少了算法的复杂度。 在整像素运动估计算法方面,由于全搜索算法的复杂度太高, 不适合实际应 用,由此一系列快速算法发展起来, 经典的有三步搜索法、四步搜索法、 梯度 降 搜索法、 菱形搜索法、 六边形搜索法等等。 在前人研究的基础上, 本文提出了 基于多分辨塔模式和小菱形模式的小菱形分层快速搜索算法, 在计算量上相对于 其它算法有很大的提高。 传统的1 / 4 像素搜索算法需要搜索1 6 个点,而在实际中,1 / 2 像素搜索与 整 像素搜索结果有很大的相关性,而1 1 4 像素搜索又与 1 / 2 像素搜索结果有很大的 相关性, 根据这些相关性, 本文提出了 一种新的搜索方法, 大大提高了 搜索的效 率。 关键字:视频压缩,视频编码,码率控制, 运动估计,搜索算法 浙江大学硕士论文 ab s t r a c t wit h t h e d e v e l o p m e n t o f c o m p u t e r a n d c o m m u n i c a t i o n t e c h n o l o g y , n e t w o r k v i d e o c o n f e r e n c e , v i d e o t e l e p h o n e a n d n e t w o r k m o n i t o r e t c . h a v e g o t m o r e a n d m o r e a p p l i c a t i o n s . i n a l l o f t h e s e a p p l i c a t io n s , t h e m o s t w i d e l y u s e d v i d e o c o m p r e s s i o n s t a n d a r d s a r e t h e 1 t u - t h . 2 6 x s t a n d a r d s . o n e v i t a l r e q u i r e m e n t o f v i d e o c o n f e r e n c e s y s t e m a n d m o n i t o r s y s t e m i s r e a l - t i m e . b u t , b e c a u s e o f t h e h i g h c o m p u t a t i o n c o m p l e x i t y o f h . 2 6 x , e s p e c i a l l y h 2 6 4 , w e m u s t i m p r o v e a l g o r i t h m s p r o c e s s in g s p e e d i n o r d e r t o i m p r o v e s y s t e ms e ff i c i e n c y . t h i s t h e s i s a n a ly s i s t h e c o m p u t a t io n c o m p l e x i t y t h r o u g h t h r e e a s p e c t s o f r a t e c o n t r o l , i n t e g e r - p i x e l m o t i o n e s t i m a t io n a n d q u a rt e r - p i x e l m o t i o n e s t im a t i o n , t h e n i t c o m p a r e s t h e e x i s t i n g a l g o r i t h m s a n d b r i n g s a b o u t n e w a l g o r i t h ms . r a t e c o n t r o l a l g o r i t h m s c a n k e e p v i d e o s t r e a m t o t r a n s f o r m s m o o t h l y a n d t o u t i l i z e t h e b a n d w i d t h e f fi c i e n t l y . t h e t r a d it i o n a l r a t e c o n t r o l a l g o r it h m i s t h e r - d m o d e l . t h e s e a l g o r i th m s e i t h e r h a v e h i g h c o m p l e x i t y o r l a c k p r e c i s i o n . t h i s t h e s i s p r o p o s e s a n e w r a t e c o n t r o l a l g o r i t h m b a s e d o n p - d o m a i n l i n e a r s o u r c e m o d e l . t h e n e w a l g o r it h m r e d u c e s t h e c o m p u t a t io n c o m p l e x ity w i t h o u t l o s s o f p r e c i s i o n i n t h e a r e a o f i n t e g e r - p i x e l m o t i o n e s t i m a t i o n , t h e g r o s s s e a r c h i n g a l g o r i t h m i s t o o c o m p l i c a t e d t o p u t i n t o p r a c t i c a l u s e . a s e r i e s o f f a s t a l g o r i t lu n s h a v e b e e n d e v e l o p e d s u c h a s t h e c l a s s i c a l 3 - s t e p s e a r c h i n g , 4 - s t e p s e a r c h i n g , g r a d i e n t d e c e n t s e a r c h i n g , d i a m o n d s e a r c h i n g a n d h e x a g o n s e a r c h i n g . t h i s t h e s i s p r o p o s e d a m u l t i p l e l e v e l d i a m o n d s e a r c h i n g a l g o r i t h m b a s e d o n th e m u lt i - r e s o l u t i o n m o d e l a n d d i a m o n d s e a r i n g m o d e l . t h e c o m p u t a t i o n c o m p l e x i t y o f t h e n e w s e a r c h i n g a l g o r i t h m i s m u c h l e s s t h a n t h e p r e v i o u s a l g o r i t h m s . t h e t r a d i t i o n a l q u a r t e r - p i x e l m o t i o n p i x e l s . b u t i n t e g e r - p i x e l i n p r a c t i c e , t h e h a l f - p ix e l e s t i m a t i o n s e a r c h i n g n e e d s t o s e a r c h 1 6 s e a r c h i n g h a s g r e a t c o r r e l a t i o n w i t h t h e s e a r c h i n g , a n d t h e q u a rt e r - p i x e l s e a r c h i n g h a s g r e a t c o r r e l a t i o n w i t h t h e h a l f- p ix e l s e a r c h i n g . t h i s t h e s i s p r o p o s e s a n e w s e a r c h i n g m e t h o d b a s e d o n t h e s e c o r r e l a t i o n s t o e n h a n c e t h e s e a r c h e f f i c i e n c y . k e y w o r d s : a l g o r i t h m v i d e o c o m p r e s s i o n , v i d e o c o d i n g , r a t e c o n t r o l , m o t i o n e s t i m a t i o n , s e a r c h 浙江大学硕士论文 第一章 绪论 随着 工 n t e r n e t 带宽的不断增长,在 i n t e r n e t卜 传输视频的相关技术也成 为 工 n t e r n e t 研究和开发的热点。 网络视频会议系统, 作为多媒体网络通信领域 的最新成果,集计算机技术、通信技术和视频技术于一身,能向用户提供 “ 面 对面”的可视化多点会议服务,可广泛应用于行政会议、商务、远程教育、远 程医疗、抗灾抢险、军事指挥、金融证券等领域,在当今的信息化社会里,存 在着巨大的市场需求。下 是基于此,国际电信联盟 ( 工 t i力开发h . 2 6 x 系列视频 压缩编解码标准,包括h . 2 6 1 1 , h . 2 6 2 , h . 2 6 3 2 以及h . 2 6 4 3 1 。目 前视频 流传输中最重要的编解码标准是 1 1 . 2 6 1 和h . 2 6 3 , 这两种标准由于推出时间早, 比较成熟,形成的商用产品也比较多。h . 2 6 4是 i t u - t最近才推出的新标准, 因其更高的压缩比、 更好的i p 和无线网 络信道的适应性, 现在越来越受到关注, 很多厂商正在开发h . 2 6 4 的商用产品。 下面对h . 2 6 1 , h . 2 6 3 和h . 2 6 4 做一下简 单的介绍。 1 . 1 h . 2 6 1 介绍 h .2 6 1 又称为p * 6 4 ,其中p为6 4 k b / s 的取值范围,是 1 到3 0 的可变参数, 它最初是针对在 i s d n上实现电信会议应用特别是面对面的可视电话和视频会 议而设计的。实际的编码算法类似于 m p e g算法,但不能与后者兼容。 h .2 6 1 在实时编码时比mp e g所占用的c p u运算量少得多,此算法为了优化带宽占 用量,引进了在图像质量与运动幅度之间的平衡折中机制,也就是说,剧烈运 动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量 编码而非恒定质量可变码流编码。 h .2 6 1 定义了视频编码算法, 如帧内图像、 帧间误差预测、 运动补偿、 d c t , 变长编码等技术都是在h .2 6 1 中使用了的, 它为后来的诸如mp e g - , m p e g - 2 及 h .2 6 3 等视频压缩标准提供了基础,图 1 - 1 为 h .2 6 1 编解码器的方框图。在 此之外, h . 2 6 1 还提供了两个重要的特性: 1 . 指定了最大编码延迟为 1 5 0 m s ,因为主要针对双向视频通信应用,超过 1 5 0 m s的延迟会给用户带来视频失真的印象。 浙江大学硕士论文 2 . 能够用廉价的v 1 5 1( 超人规模集成电路)实现,以便实现视频会议和可 视电话设备的商业化。 c o d卜g c . l t m i v 1ld e os lg l a l 1 . 2 h . 2 6 3介绍 v b e o m r i n p l e x coder t旧 l a m 1 0 5 1 01 drt l t 门一 i tra i一 a ) $a d e o c o d e r c o ile d east 企 翻m vi de o m e i t p l e x d e m de r r e c e l u eg dl t h ! 日 e c 二 i i 9 d e c a d e e 6功d e o d e c o d e r t , 曰 2. j昏日 口勺口1 图i 一 1 h . 2 6 1 视频编解码器框图 h .2 6 3 是i t u - t提出的作为h .3 2 4 终端使用的视频编解码建议, 它是基于运 动补偿的 d p c m 的混合编码,在运动搜索的基础上进行运动补偿,然后运用 d c t变换和 “ 之”字形扫描游程编码,从而得到输出码流。h .2 6 3 在h .2 6 1 建 议的基础上,将运动矢量的搜索增加为半象素点搜索;同时又增加了无限制运 动矢量、基于语法的算术编码、高级预测技术和 p b帧编码等四个高级选项; 从而达到了进一步降低速率和提高编码质量的目的。 h .2 6 3视频编码标准是专为中高质量运动图像压缩所设计的低码率图像压 缩标准。与h .2 6 1 的p x 6 4 k的传输码率相比, h .2 6 3 的码率更低, 单位码率 可以小于6 4 k , 且支持的原始图像格式更多, 包括了 在视频和电 视信号中常见的 q c i f , c i f , e d t v , i t u - r 6 0 1 , i t u - r 7 0 9 等 等。 h .2 6 3 采用 运动视频编码中 常见的编码方法,将编码过程分为帧内编码和帧间编码两个部分。在帧内采用 改进的d c t变换并量化, 在帧间采用 1 / 2 象素运动矢量预测补偿技术, 使运动 补偿更加精确, 量化后适用改进的 变长编码表( v l c ) 地量化数据进行嫡编码, 得到最终的编码系数。 h .2 6 3的编码速度快,其设计编码延时不超过 1 5 0 m s ; 码 浙江大学硕士论文 率低, 在5 1 2 k乃至3 8 4 k带宽 仍可得到相当满意的图像效果 十分适用于需 要双向编解码并传输的场合( 如:可视电话) 和网络条件不是很好的场合( 如: 远 程监控) 。图1 - 2 为h 2 6 3 的视频编解码图,图1 - 3 为h .2 6 3 的信源编码器。 外部控 _ _ _ _ _ _ _ _ _ _ _ 1 _ 编码控制 一川日| 信源 编码器 多 路 视 频 编码器 编 码 ! 比 特流 频口亏 视信 图1 - 2 h .2 6 3 视频编解码器的方框图 碧 d e o tr a n s f o r m qu a n t i z e r p ic t u r e m e m o ry w it h m o t i o n c o mp e n s a t e d v a r ia b le d e la y top c c c o d i n g c o n t r o l f l a g f o r i n t r a i in t e r 日 a g f o r t r a n s m it t e d o r n o t qu a n t i z e r i n d i c a t i o n q u a n t iz in g in d e x f o r t r a n s f o r m c o e f f ic i e n t s mo ti o n v e c t o r z 价t丹叨口v 图 1 - 3信源编码器 为了达到这些目标,h . 2 6 3 采用如下方法:1 ) 信源编码器基于通用中间格 浙江大学硕士论文 式 ( c i f ) ,使其可以同时应用于6 2 5 线和5 2 5 线两种电视标准。视频编码器对 图像的取样次数为视频信号场线的整数倍,取样时钟和数宁网之间的关系是异 步关系, 提供可以和其它各种设备信号相结合的独立的数字比特流。 2 ) 采用可 减少时间冗余的帧间预测和可减少空间冗余的残留信号编码方法。解码器具有 运动补偿的能力,并允许可选择地在编码器中增加这种技术。h .2 6 3运动补偿 采用的是半象素精度,而不是 h .2 6 1 建议中的全象素精度和循环滤波器。而对 待 传送的 符号 采用了 游程编码。 3 ) 允许 采用 无限 制 运动矢量 模式, 在该 模式中, 运动矢量被允许指到图片的外部,可使用更大的运动矢量。允许采用基于句法 的算术编码模式代替游程编码,可将最终的比特数显著降低。允许采用高级预 测模式,对 p帧的亮度部分采用了块重叠运动补偿。对图片中的某些宏块采 4 个 8 x 8 矢量来代替原来的 1 个 1 6 x 1 6 矢量。编码器必须决定使用哪一种矢量。 允许采用 p b帧模式,这种模式可以在比特率增加幅度很小的情况下大幅度增 加 帧频。 4 ) 信源编码器的主要原理是预测、 块变换和量化。 1 9 9 8 年t u t - t推出的h .2 6 3 +是h .2 6 3 建议的第2 版, 它提供了1 2 个新的 可协商模式和其他特征,进一步提高了 压缩编码性能。如h .2 6 3 只有5 种视频 源格式, h .2 6 3 +允许使用更多的源格式, 图像时钟频率也有多种选择, 拓宽应 用范围;另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率, 增强了视频信息在易误码、易丢包异构网络环境下的传输。另外,h . 2 6 3 +对 h .2 6 3 中的不受限运动矢量模式进行了改进,加上1 2 个新增的可选模式,不仅 提高了编码性能,而且增强了 应用的灵活性。 1 . 3 h . 2 6 4 介绍 h .2 6 4 标准是i t u - t的v c e g( 视频编码专家组) 和i s o i i e c的mp e g( 活 动图像专家组)的联合视频组 ( j v t , j o i n t v i d e o t e a m)开发的标准, 也称为 mp e g - 4 p a r t 1 0 , “ 高级视频编码” 。在相同的重建图像质量下,h . 2 6 4比h . 2 6 3 节约 5 0 %左右的码率。因其更高的压缩比、更好的 i p和无线网络信道的适应 性, 在数字视频通信和存储领域得到越来越广泛的应用。 同时也要注意, 1 1 .2 6 4 获得优越性能的代价是计算复杂度增加,据估计,编码的计算复杂度大约相当 于 h .2 6 3 的3 倍,解码复杂度大约相当于h .2 6 3的2 倍h .2 6 4 编码基本结构 浙江大学硕士论文 与h .2 6 1 , h .2 6 3 是类似的,图 1 - 4 , 1 - 5 是h .2 6 4 的编解码器的框图。 + i - 耀 一|妙电 c hooseirnrspre dim ioo - mc_ .l , inirr 蕊 - inks 1衬es一哟叫习|叫 广1巨摆厂.帅1 图1 - 4 h . 2 6 4 编码器 图 1 - 5 但h .2 6 4 在很多环节做了改进: h . 2 6 4 解码器 1 ) 高精度估计。 在h .2 6 3 中 采用了 半像素估计, 在h .2 6 4 中则进一步采用 1 / 4 像素甚至 1 / 8 像素的运动估计。即真正的运动矢量的位移可能是以1 / 4 甚至 1 / 8 像素为基本单位的。 在h .2 6 4 中采用了6 阶f i r滤波器的内插获得 1 / 2 像素 位置的值。当 1 / 2像素值获得后, 1 / 4像素值可通过线性内插获得。理论上, 如果将运动补偿的精度增加一倍 ( 例如从整像素精度提高到1 / 2 像素精度) , 可 有0 .5 b i t / s a m p l e 的编码增益, 但实际验证发现在运动矢量精度超过1 / 8 像素后, 系统基本上就没有明显增益了,因此,在h .2 6 4中,只采用了 1 / 4像素精度的 运动矢量模式,而不是采用 1 / 8 像素的精度。 2 ) 树型构造的运动补偿. a v c编码支持从1 6 x 1 6 到4 x 4 范围尺寸的运动补 浙江大学硕士论文 偿块,在这个范围中亮度样本可有多个选择。每个图像宏模块亮度组件可以按 4 种方式分刀 ( :1 6 x 1 6 , 1 6 x 8 . 8 x 1 6和 s x s 。每一个被分的子区是宏模块的 一部分 如果选择了8 x 8 的模式, 每一个 s x s 模块被按4 种模式分成多个子块: 8 x 8 . 8 x 4 . 4 x 8和 4 * 4 ( 被称作宏模块了 区) 。 这种模块区和模块子区 在侮个 宏 模块产生大量的组合。这种划分宏模块为各种尺寸的动态子模块的方法被称作 树型运动补偿。 3 ) 多参数帧估计。 在11 .2 6 4 中, 可采用多个参数帧的运动估计, 即 在编码 器的缓存中存有多个刚刚编码好的参数帧,编码器从其中选择一个给出更好的 编码效果的作为参数帧,并指出是哪个帧被用于预测,这样就可获得比只用上 一个刚编码好的帧作为预测帧的更好的编码效果。 4 )小 尺寸4 x 4 的整数变换。 11 .2 6 4 与先前的标准相似, 对残差采用基于块 的变换编码, 但变换是整数操作而不是实数运算, 其过程和d c t基本相似。 这 种方法的优点在于:在编码器中和解码器中允许精度相同的变换和反变换,便 于使用简单的定点运算方式。 变换的单位是4 x 4 块, 而不是以 往常用的8 x 8 块。 由于用于变换块的尺寸缩小,运动物体的划分更精确,这样,不但变换计算量 比较小,而且在运动物体边缘处的衔接误差也大为减小。 5 ) 更 精确的帧内 预测。 在11 .2 6 4中, 侮个4 x 4 块中的每个像素都可用1 7 个最接近先前已编码的像素的不同加权和来进行帧内预测。 1 . 4 本文内容安排 视频会议系统或监控系统的一个重要的特征就是实时性,而且在保证实时 ft 的基础上尽量减少对系统资源的耗费,这就需要提高系统的运行效率。在视 频会议系统或监控系统中最耗费资源的部分就是视频编解码,其中又以视频编 码为最。提高视频编码效率的方法主要有二种:一是进行算法级优化,这是提 高效率的最重要部分;二是进行代码级优化,合理安排代码,使其运行速度最 优化;只是汇编级优化,利用i n t e l 的mmx , s s e和 s s e 2 指令,对可以并行 处理的代码进行处理。本文主要针对算法级优化,包括码率控制算法、整像素 运动估计算法和 1 1 4 像素运动估计算法,因为在h .2 6 x 系列编码中, 码率控制 算法和运动估计算法是最重要的一部分。本文共分为五章。 浙江大学硕士论文 第一章为总体介绍部分,对 i t u - f 的三种视频编码标准进行简单的介绍: 发展过程及每种标准的主要特点。 第二章为码率控制算法。码率控制算法可以保持视频流在网络中顺利传输 并充分利用带宽。传统的码率控制算法为r - d模型,要么具有很高的计算复杂 度, 要么算法不够精确。 本文在 p域线性率失真模型的基础 匕 提出了一种新的 码率控制算法,在保持高精度的基础上大大减少了算法的复杂度。 第三章为整像素运动估计算法。由于全搜索算法的复杂度太高,不适合实 际应用,由此一系列快速算法发展起来,经典的有三步搜索法、四步搜索法、 梯度下降搜索法、菱形搜索法、六边形搜索法等等。在前人研究的基础上,本 文提出了一种新的快速搜索算法,在计算量上相对于其它算法有很大的提高。 第四章为 1 / 4 像素运动估计算法。传统的 1 / 4 像素搜索算法需要搜索 1 6 个 点,而在实际中,1 / 2 像素搜索与整像素搜索结果有很大的相关性,而1 / 4 像素 搜索又与 1 / 2像素搜索结果有很大的相关性,根据这些相关性,本文提出了一 种新的搜索方法,大大提高了搜索的效率。 第五章为全文的总结,并对未来进行了展望。 浙i 1大学硕士论文 第二章 码率控制算法 对于在网络 匕 传输的视频通信而言,由于带宽的限制,需要对视频编码码 率进行控制,既保证编码码流的顺利传送,又使信道带宽得到充分利用。在实 时的视频通信中,终端到终端的视频数据延迟必须相当小,特别在如视频电话 或视频会议的两路交互应用中。如果编码视频通过个固定速率的信道传输, 编码比特会放在一个小缓冲器中并且每隔一个帧的时间就会有b ( b 是信道速率 除以帧率)个比 特通过信道发送出去。如果一个或几个帧编码后的比特数大于 b , 那么多出的比特就会在缓冲器中累积下来而增加缓冲器延时。 当缓冲器的比 特数太多的时候,编码器通常会通过跳帧的方式来减少缓冲器延时并防止缓冲 器溢出。在低比 特率编码系统中,如h . 2 6 1 1 1 , h . 2 6 3 2 及h . 2 6 4 3 等,主要 是通过调节 d c t ( 离散余弦变换) 的量化步长来达到调节码率的目的。由于标准 仅详细定义了解码器,所以编码器必须选择某种码率控制策略来分配可利用的 比特数,而且编码视频的质量非常依赖码率控制算法的效率。 2 . 1 己有的码率控制算法介绍 目 前应用最广泛的码率控制是从传统的码流一 失真 ( r - d )公式发展来的, 其中最典型的代表算法就是 t m n 8 4 和 v m 7 5 这些算法要么具有很高的计算 复杂度,要么算法不够精确。而且这些算法都试图找出编码码率r 和量化步长 q 之间的表达式,也就是说这些算法模型是基于q 域的。 2 . 1 . 1 t mn 8码率控制算法 4 在 4 1 中,根据码率( 以b i t s / p i x e l 为单位) 和标准差之间的 特性提出了 一种新的 码率模型:。 一 , ( k 6 , + c ) g ( 2 - 1 ) 其中尽 是 分 配 给 第i 个 宏 块 的 比 特 数 , a为 宏 块的 像 素 数 ( 如a = 1 6 - 1 6 ) ,讨为 第i 个宏 块的 方差 q , 是第i 个宏 块的 量化步lk , k . c 是常 量。 以及失真模型:d二 1 小_ z q z _ 7“ 一 n 忿 产1 2 ( 2 - 2 ) 浙江大学硕士论文 其中n为 帧的宏块数,。是第i 个宏块的失真权重。 根据这两个模型提出了最优量化步长的表达式: a k 6 , ( b一a n c ) a ( 2 - 3 ) n 一一 其中q,是 第i 个 宏 块的 量 化 参 数, b 为 分 配 给 当 前 帧 的b it 数 , 。的 表 达 式 为 : 一 j) + (t , 些a- m ot h e r wi s e . 了1,、.1 一- 一 r一f 是从w反馈的一个小值,如果w比m的1 0 %耍大,帧的目 标比特数b就会轻 微的下降,否则b就会轻微的上升。 2 .宏块层码率控制 第一步,初始化: 设6 k 为 第k个宏块的 方差; i = 1 j = o ; s , _ . 当 前 帧剩 余 宏 块的日 标比 特数 ; 浙江大学硕士论文 n , = n,当前 帧 剩余的 宏 块 数; k = k , 二 k p r c v-, c = c !二 c 。 初始 化两 个模型的 参数: 第二 步,计算第 i 个宏块的最优量化值并编码: 根据2 - 3 式 计算 第i 个 宏 块的 量 化步 长q再计 算量化参数q p , 在11 .2 6 3 中 q p = ro u n d ( q *, , 2 ) , d q u a n t = q p -q p _ p r e v ,如 果 d q u a n t 2 ,d q u a n t = 2 , 如果d q u a n t- 2 , d q u a n t = - 2 , 那么q p = q p _ p r e v + d q u a n t : 根据计 算的 q p 对宏块进行编码。 第三步, 更新计数器: 设b ; 为 第i 个宏 块编 码后的比 特数, 那么 b i. 、 二 b , 一 b , s i+ , = s ; 一 a , v , ,以 及n i. , = n 、 一 1 第四步,更新模型参数k和c : 首先测算第 i 个宏块的参数:k二 b l c j ( 2 q p ) 2 1 6 2 讨 b : 一 b ; , ; c = 1 6 其中b l c , 为 编码第i 个宏块的 亮 度 和色 度所用的比 特数 然后,再计算当前帧中己 编码过的 宏块的平均又 和己: i f ( k0 (i/ n ) + k i ( n 一 i) /n , c 一 c ; ( i/n ) + c , ( n 一 i)/n 2 .1 . 2 线性源模型码率控制算法 6 在视频编码中零值有着十分重要的 地位,设p 为经过量化变换后系数中零 值的百分比,很明显量化步长q 是 p的单调增函 数,表明它们之间存在着一 对一的映射关系。 y o n g k w a n k i m 等人经研究发现, 对于像h . 2 6 3 , m e p g - 4 7 等低比 特率编码系统来说, 码率函 数r ( p ) 是一个相当简单的线性函 数, 通过这 个线性函数,他们建立了一个计算复杂度低简单而且精确的码率控制模型 6 1 0 1 .p域线性率失真模型 浙江大学硕 上 论文 y o n g k w a n k i 二 等人通过对不同的变换系数分布模型进行理论分析,得 出了如下的线性模31 : r ( p ) = 0 ( 1 一 p ) ( 2 - 5 ) 其中0 为常数, r 是以b i t s / p i x e l 为单位的码率。 由于 h . 2 6 x系列、 m p e g 4的编码器的总体结构基本相同,都是分为帧内/ 帧 间预测、变换量化和墒编码 3 部分,在变换量化后,变换系数中零值所占比例 是决定码率大小的重要因素,所以此模型适合于h 2 6 x及 m p e g 4编码。下面以 h . 2 6 4 编码来验证此模型, 钡 试序列选取m o b i l e , b u s 和w a t e r f a l l , c i f 格式, 分别出一帧 工 帧、一帧p 帧进行测试,测试结果如图2 - 1 所示。 1 0 0 0 * 8 0 0 i6 0 1) 二a m l, 、 仁 , v v 口. . 之_f, 、 5 2 w r” 、. 忿二减吧 吃一 0 .20 . 8 1 . 0 ( a ) b u s 序列中1 祯和p 帧中p 与r 0 .4 0 . 6 p 的关系 渭会留 0 . 2 0 .4 0 .6 0 . 8 1 . 0 800姗姗2000 m o b i l e 序列中i 祯和p 顿中p 与r p 的关系 . 、 _ 、. 、 (b)一/ 悯咖柳绷溯 1一力目、峨 0 0 0 . 2a 40 .6商 户 0 - 2 0 .4 0 . 6 0 . 8 1 . 0 黔料吸 组闺 11以1.0 图2 - 1 编码码率r和 p之间的线性关系 从图2 - 1 中可以看出r和 p之间确实存在着非常强的线性关系, 结果和( 2 - 5 ) 式的结果比较吻合,特别在 性模型对于低比特率编码系统总是成立的 p 0 . 2的情况下。实验表明 而且实验 ,这个线 2 . 量化步长q 和 p的映射以及码率控制算法 浙江大学硕士论文 q 和 u的映射关系可以 通过计算d c f 系数的分布得出, 以h . 2 6 3 为例来说 明。设为量化步长的门限值 ( d e a d 等于 u , 对于 丁 n t e r宏块等于 l . 2 5 q z e r o t h r e s h o l d)那么r 寸i n t r a 设 d o ( x ) 不 i i d i ( x ) 分别是 i n t r a 宏块 宏块和 工 n t e r 宏块的d c t 系数分布,那么 p和 q 的关系为: p (9) = 击 y d o (x) +ixi r m = r . + r , , n . = n m + 1 。如 果 n n , ? 1 0,根 据 式 。 _ 一r m 更 新e 值 。 同 时 , 从 d o ( x ) 或 d i ( x ) 中 减 去 当 前 宏 块 的 。 c t 系 3 8 4 .n , 一 p m 数的频率。 2 . 2适合于低比特率视频编码的 p域码率控制算法 本文算法是基于2 . 1 .2的线性源模型提出的。在此,再重写一下这个模型: r ( p ) 二 b ( 1 一 p ) ( 2 - 8 ) 其中b 为常数, r 是以b i t s / p i x e l 为单位的码率。通过研究发现,在码率控 制精度没有明 显下 降的 情况下, 可以 进一步 减少计 算复杂度, 本文提出了 p - 9 浙江大学硕士论文 的 特性分布模型, 并提出了 改进的p 域码流控制算法, 相对于丁 m n 8 来说计 算量 仅为其0 . 2 5 c 2 . 2 . 1 p -q 的特性分布模型 由 前述可知p 和n 之间 存在着 一 对一的映射关系, 但在h . 2 6 x 系列中并 不直 接 对9 编 码, 而 是用一 个量 化参数o p 来代替 量 化步 长9 , 具体在h . 2 6 1 和h . 2 6 3 中q p 和9 的关系为q = 2 * q p而在f 1 . 2 6 4 中 则存在着一个索引 表, t一 个q p 值都 对应一个特定的9 值。 用h . 2 6 1 编码得出的p 一 q p的 特性分布如图2 - 2 所 不 。 1 . 0 “ 一二 . 二 w万百落. 舀 . 万- - - - 一甲 - - - - - - - - - - - - - 一 0 . 0 白 0. 7 0.6 . 0. 5 8121 6 24 28 1 0卜1 2cl ( a ) f o r e ma n p 】 俨 冲一 幽 . 石 . i - 下 、 - f一 一 勺 . , 少 二 二 0 g o r o了 o 6 o 5 l _ 哥日 1 2 i f ; 2“ z4 泛r l、 专 访 1 3 浙江大学硕士论文 ( b ) c o a s t g u a r d . c i f p 1“ h 一一一.-一心一 奋- . - 二 . 二 云 一 备 , 、 r . .一 二 u. 9 u日 u 7 u. 6 24 u. 5 4 8 16 2日 7r 注1 q ( c ) s t e f a n .c i f 卜一 _._._ . . . 二 二 二 0 . 9 0 日 0 7 0. 6 0. 5 4仑l 2 】 右 2 o 2 42 8 11 q ( d ) m o b i l e . c i f 图2 - 2 p 和9 的 映射图形 由图1 可以 看出,p ( q p ) 即p ( 9 ) 是一个以i 为 渐近线的函 数, 近似于函 数 y二 一 1kx ( 2 - 9 ) 的分布图形, 其中k 为常数。 假设仄的的特性分布符合( 2 ) , 现在来验证其正 1 4 浙江人学硕士论义 确性。 coastgua . x r d一ci上 2 0 4 0 f + o fl 0 1 0 0 1 2 0 i 4 o i a 0巾 贞塑 女 st e fa n . c if 2 0 4 0 6 0 9 0 1 0 0 1 2 0 1 4 0 1 6 0巾 五胡 女 图2 - 3 用h . 2 6 1 编码的序列k 值范围 图2 - 3 是用h . 2 6 1 编码测出的c o a s t g u a r d 和s t e f a n 序列中每一帧的k 值, 从图中可以看出 c o a s t g u a r d的k 值变化范围基本上在 1 . 0 - 1 . 3之间,均值为 1 . 1 7 2 0 ;而s t e f a n 的k 值变化范围基本上在 0 . 8 5 - 1 . 1 5 之间,均值为0 . 9 5 7 3 . 对 于 。 o a s t g u a r d 序 列 取 、 = 工 . 1 7 2 0 , 假 设 、 = 卜 孺 为 。 o a s t g u a r d 的 9一 p - g 的特性分布函数;对于 s t e f a n序列取k = 0 . 9 5 7 3假设p = 1 - 8 0 .9 5 7 3 s t e f a n 的p - g 的 特性分布函 数。 由 此可以 绘出 两 个 序列的p - g 的 特性 分 布图 , 如图2 - 4 中实线所示, 虚线为 序列实际的p - g 的 特性分布,即图2 - 2 中 ( b ) . ( c ) 分布。 浙江大学硕士论文 1 . 习 0. 9 s t e f a n . c i f - - - 一 母 碑 . . - - 一 一 - 一 如 - - 一 , - 一 卜 心 奋 . 心 - . 一 有 . 一 一 1 二 二 二 二 二 任 卫 界 三 , , 由 . - . - - 二 一 - 一 - 一 0 . 8 0 - 7 0 . 6 0 * 5 叶一 4 一 8一 1 2 一 1 6 一 2 0 一 2 4 一 2 8 3 1 一一 图2 - 4 序列的假设分布和实际分布的比较 由图 2 - 4 可以看出,假设的 a 一q的特性分布函数在误差范围内基本上和 实际分布重合。通过对一系列不同的视频序列进行测试,发现假设的特性分布 函数总是成立的,所以我们得出的 a -q 特性分布函数模型为: p = ( 2 - 1 0 ) 土矿 一 式中k 为常数。 2 . 2 . 2 p域码率控制算法 根据以上两个模型, 本文提出了一种新的 第一步是帧率控制 于帧层和宏块层的 , 第二步是帧层码率控制。 p域码率控制算法, 共分为两步, 而 6 1 中提出的码率控制算法是基 , 其中宏块层的计算量占了整个码率控制计算量的绝大部分 浙江大学硕士论文 由于本文提出的码率控制算法只在帧层控制,所以计算复杂度大大降低,计算 量仅为t m n 8 计算量的0 . 2 5 % , 同时又保留了较高的码率控制精度。 1 编码帧率控制 在视频编码系统中视频源的输入视频帧率一般为3 0 帧 / 秒,在码率控制 中可以通过调节编码帧率来达到一定的调节码率的目的。视频的视觉质量主要 受空间保真度和时间保真度两方面影响。 经过对h . 2 6 1 和h . 2 6 3 编码系统研究 发现, 当量化参数 q p 值在 1 一5 之间编码图像质量从视觉上看基本上没有什么 变化,所以这时可以通过牺牲一些空间保真度 ( 即增大量化步长)来提高时间 保真度( 即提高帧率, 前提是提高后的帧率不大于30 帧/ 秒) 的方法来达到更 好的视频质量; 当量化参数q p 值大于 1 6 时运动图像编码就会出现较严重的块 效应,所以这时可以通过牺牲一些时间保真度 ( 即减少帧率)来提高空间保真 度 ( 即减小量化步长)的方法达到提高视频质量的效果。在码率控制算法中, 可以根据这两条准则 来动态选择合适的编码帧率,扩展码率控制范围。 2帧层码率控制 帧层码率控制主要是通过调节量化步长9 的值来达到调节码率的目 的。 根据 编码帧率计算编码一帧时所需的比特数, 根据 ( 2 - 8 ) 式的线性率失真函数模型 计 算变换系数量化后的零 值百 分比p , 再 根 据( 2 - 1 0 ) 式的p - q 的 特性分 布函 数 确定量化参数q 。具体步骤如下: 第一步:初始化。 在对第一 帧图 像 编码之前设置 量 化参数q p 为q p a 编 码 的 第一 帧为i 帧, 用q p 进行编 码; 第二 帧同 样也 用q p 进行 编码, 然后 根据 编 码结果用 ( 2 - 1 4 )式计算出初始的0 值,再根据 ( 2 - 1 5 )式计算出初始的k 值。 第二步: 计算待编码帧的目 标比 特数。设r 为目 标码率 ( b p s ), 即一秒时 间 内 的目 标码流是r 比 特; r 、为当 前一 秒内已 编 码的 帧 所 产生的比 特数; n , 为 当 前 一 秒 内 剩 余 的 待 编 码 的 尸 帧 总 数 ;r ,、 是 根 据 前 一 编 码 帧 用 于 图 像
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 10254:2025 EN Air cargo and ground equipment - Vocabulary
- 公司沙龙diy蛋糕活动方案
- 公司组团户外活动方案
- 公司法律宣传月活动方案
- 公司游泳池活动方案
- 公司登高运动策划方案
- 公司约客活动策划方案
- 公司更名征集活动方案
- 公司春节福利活动方案
- 公司消保活动策划方案
- 2024年深圳市中考语文试卷真题(含答案解析)
- “扣子”智能体在高中生物学教学中的应用
- 电信通信设备的应急维修
- 新能源汽车充电站建设合作协议
- 出院病人终末消毒流程
- 山西焦煤招聘2025笔试题库
- star法则培训课件
- 手术室护士自我简介
- 地下管线保护和加固措施
- 广告公司分支机构合同
- 2024年新课标培训2022年小学英语新课标学习培训课件
评论
0/150
提交评论