（信号与信息处理专业论文）h264视频编码的复杂度、码率控制与质量评价.pdf

上传人：伐*** IP属地：宁夏上传时间：2019-12-20 格式：PDF 页数：59 大小：1.93MB 积分：0 举报 版权申诉

（信号与信息处理专业论文）h264视频编码的复杂度、码率控制与质量评价.pdf_第2页

（信号与信息处理专业论文）h264视频编码的复杂度、码率控制与质量评价.pdf_第3页

（信号与信息处理专业论文）h264视频编码的复杂度、码率控制与质量评价.pdf_第4页

（信号与信息处理专业论文）h264视频编码的复杂度、码率控制与质量评价.pdf_第5页

已阅读5页，还剩54页未读，继续免费阅读

（信号与信息处理专业论文）h264视频编码的复杂度、码率控制与质量评价.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

浙江大学硕士学位论文摘要 2 0 0 3 年3 月，联合视频工作组j v t ( j o i n t v i d e o t e a m) 正式提出了新一代视频压缩标准h . 2 6 4 / a v c ，该标准是i t u - t 与i s o / i e c两个国际标准化组织继mp e g - 2 / h . 2 6 2 标准之后，再一次共同提出的视频编码标准。 h .2 6 4 / a v c标准支持从低带宽、高误码率的无线移动视频通信到高码率、低延迟的视频广播及在线流媒体等多种应用，因此，日益受到业界的关注。本文从 h .2 6 4 / a v c视频应用的角度，针对编码复杂度、码率控制和质量评价进行了研究与分析。首先，为了实现更高的编码效率， h .2 6 4 / a v c 标准采用了很多新的编码技术，如多参考帧预测、多尺寸编码块模式、1 / 4 像素精度运动矢量、整数变换量化、基于内容的嫡编码、新型帧内预测、去除方块效应的滤波器等。在相同解码图像质量下， h .2 6 4 / a v c比m p e g - 2 和h .2 6 3 的编码性能至少提高一倍以上。同时， h . 2 6 4 / a v c编解码器的计算复杂度与其它视频压缩标准相比，高出了几倍甚至十几倍。着重分析了每个编码技术和编码参数对编码器性能的影响以及它们之间的关联性，并给出了在保证性能的情形下通过合理设置编码参数，有效的降低编码复杂度的方法。其次，本文论述了码率控制的原理和信源模型，针对h .2 6 4 的码流特点，提出了一种的采用对数模型的分层码率控制算法。它在g o p 层、帧层和基本单元层三个层次上分别进行控制，解码图像的p s n r较高，同时，它的各宏块的q p 值更为平滑，因此得到的解码图像的主观质量更好; 而且控制得到的实际码率更接近目标码率。另外，由于采用了流体传输模型，可以及时根据信道带宽变化而更新码率，本文提出的码率控制算法不仅适合c b r情形，也可以应用于v b r场合。最后，文章从视频的空域信息、时域信息出发，以及由之产生的三个度量参数，提出了一种基于人眼视觉特性的客观视频质量的评价方法，它包含了对空域信息和时域信息的度量，较好的反映了人眼视觉系统，与主观度量的结果基本一致。关键词:h . 2 6 4 ，编码复杂度，编码参数，对数模型，码率控制，质量评价浙江大学硕士学位论文 ab s t r a c t h .2 6 4 / a v c v i d e o c o d i n g s t a n d a r d i s p r o v i d e d f o r m a l l y b y j v t ( j o i n t v i d e o t e a m ) i n ma r c h 2 0 0 3 , a n d i t w i l l b e t h e s e c o n d s u c c e s s f u l v i d e o c o m p r e s s i o n s t a n d a r d a ft e r t h e mp e g - 2 / h .2 6 2 i n f u t u r e . t h e s t a n d a r d i s d e s i g n e d t o g i v e a n e w t e c h n i c a l s o l u t i o n t o a b r o a d r a n g e o f a p p l i c a t i o n s , s u c h a s v e ry l o w b i t r a t e c o n v e r s a t i o n a l s e r v i c e s a n d e n t e r t a i n m e n t q u a l i t y b r o a d c a s t , i n t e r a c t i v e v i d e o - o n - d e ma n d s e r v i c e s e t c . s o t h i s s t a n d a r d o b t a i n s mu c h a tt e n t i o n f r o m a c a d e mi c a n d i n d u s t r i a l f i e l d s . s e v e r a l i m p o r t a n t i s s u e s f o r r e a l - t i m e v i d e o c o d i n g h a v e b e e n a d d r e s s e d i n t h i s p a p e r . t h e y a r e t h e a n a l y s i s a n d r e g u l a t i o n o f t h e c o d i n g c o m p l e x i t y , a p p l i c a b l e r a t e c o n t r o l a n d v i d e o q u a l i t y a s s e s s m e n t . f i r s t l y , h .2 6 4 s t a n d a r d a d o p t s m a n y n e w t o o l s t o e n h a n c e t h e c o d i n g e f fi c i e n c i e s , w h i c h a r e m u l t i p l e r e f e r e n c e p i c t u r e s , v a r i a b l e b l o c k - s i z e w i t h s e v e n b l o c k s i z e s i n m o t i o n p r e d i c t i o n , q u a r t e r - p i x e l a c c u r a c y f o r m o t i o n v e c t o r , s h o rt w o r d - l e n g t h i n t e g e r t r a n s f o r m , c o n t e x t - a d a p t i v e e n t r o p y c o d i n g a n d l o o p f i l t e r f o r d e b l o c k i n g . t h i s p a p e r a n a l y z e s t h e i m p a c t o f e v e ry c o d i n g t o o l a n d p a r a m e t e r t o t h e e n c o d e r i n d e t a i l a n d t h e d e p e n d e n c y w i th i n t h e s e t o o l s . t h e n a m e t h o d o f e f f i c i e n t l y a n d r e a s o n a b l y s e tt i n g e n c o d i n g p a r a m e t e r s i s b r o u g h t f o r w a r d a t t h e b a l a n c e o f c o m p l e x i t y a n d p e r f o r m a n c e . s e c o n d l y , t h e m e c h a n i s m a n d i n f o r m a t i o n s o u r c e m o d e l i s d e s c r i b e d . c o s i d e r i n g t h e c h a r a c t e r o f h .2 6 4 b i t s t r e a m , w e a d o p t a l o g - m o d e l a n d p r e s e n t a l a y e re d r a t e c o n t r o l a l g o r i t h m . i t i n c l u d e s t h e r a t e c o n t r o l o f g o p l a y e r , fr a m e l a y e r a n d b a s i c u n it l a y e r . p s n r a n d s u b j e c t i v e q u a l i t y o f t h e -d e c o d e d p i c t u r e s i s i m p r o v e d a n d t h e a c t u a l b i t r a t e i s m o r e c l o s e t o t h e t a r g e t b i t r a t e . a l s o t h i s m e t h o d c a n b e a p p l i e d t o c b r a n d v b r c o n d i t i o n s b e c a u s e o f u s i n g fl u i d fl o w m o d e l . l a s t l y , w e d i s c u s s s p a t i a l , t e m p o r a l i n f o r m a t i o n a n d t h r e e d e r i v a t i v e m e a s u r e m e n t s b a s e d o n h u m a n v i s u a l s y s t e m . t h e n w e p r e s e n t a n o b j e c t i v e v i d e o q u a l i t y a s s e s s m e n t a l g o r i t h m . c o m p a r e d w i th s u b j e c t i v e q u a l i t y m e a s u r e m e n t , i t h a s a d v a n t a g e s o f l o w e r c o s t a n d b e i n g m o r e t im e s a v i n g , a n d i s m o r e fl e x i b l e t o b e u s e d i n v a r i o u s t e s t e n v i ro n m e n t s ; i t o v e r p a s s e s t h e t r a d i t i o n a l o b j e c t i v e q u a l i t y andrate r e s u l t s s h o we d q u a l i t y , w h i c h c o mp r e s s ing . i n it s h i g h c o r r e l a t i o n w i t h h u m a n p e r c e p t i o n s y s t e m . e x p e r i m e n t t h i s p r o p o s e d me t h o d c o u l d e ff e c t i v e l y e v a l u a t e t h e o b j e c t i v e v i d e o c o u l d b e a u s e f u l t o o l i n t h e d o m a i n o f v i d e o s i g n a lp r o c e s s i n g k e y w o r d s : h .2 6 4 / a v c , c o d in g c o m p l e x i t y , e n c o d in g p a r a m e t e r , l o g - m o d e l , c o n tr o l , v i d e o q u a l i t y a s s e s s m e n t 1 1 浙江大学硕士学位论文第一章绪论本章简要回顾了数字视频编码的发展历史、原理和标准，对h . 2 6 4 / a v c视频编码标准进行了简要的介绍，系统总结关于复杂度、码率控制和质量评价的已有成果，最后给出全文结构安排。 1 . 1引言 2 1世纪是一个数字信息时代，数字信息化几乎涉及到世界的各个角落，改变了人类的生活和工作方式。以多媒体和网络为依托的信息技术己成为拓展人类能力的创造性工具。信息化的一个主要特征就是多媒体技术的广泛应用，随着多媒体业务的不断拓展，多媒体技术已成为工业界和学术界的一个研究热点。同时，超大规模集成电路技术、数字信号处理技术、双通道v r a m和网络技术的飞速发展钟， 2 0 0 0 ，有效的促进了数字视频压缩算法和视频处理器结构的改进，使得多媒体技术的实际应用成为可能。多媒体内容丰富，包括文字、声音、图象、图形和视频等数据，信息容量大，表达能力强，它代替单一的语音通信模式己是不可阻挡的趋势。其中视频又是多媒体信息中最重要的成分，它具有直观、形象、准确、高效和应用广泛等特点，但视频信息的庞大数据量对通信系统中有限的带宽和存储空间提出了严竣的挑战。例如，对于d v d ，输入视频格式为d 1 , 帧率为3 0 f p s ，色差格式为4 :2 :2 ，则视频数据码率为7 2 0 x 4 8 0 x 1 6 x 3 0 = 1 6 5 .9 m b p s , d v d 容量为4 . 7 g b ，仅能存储4 , 7 x 8 / 1 6 5 . 9 = 2 2 6 .4秒长度的节目。因此，视频数据的高效压缩意义重大，是降低存储成本，缓解网络带宽，突破存储空间和处理器主频限制的关键技术。 1 . 2视频压缩原理未经压缩的数字视频图像含有大量的数据兀余，研究表明冗余主要分为三类: 图像在时域和空域上具有很强的相关性we e , 1 9 9 8 ，形成统计冗余; 人眼视觉系统h v s ( h u m a n v is u a l s y s t e m ) 对亮度和色度的不同心理反应t e k a lp , 1 9 9 5 ，形成心理视觉冗余; 平均编码长度和信源墒之间的偏差l 樊， 1 9 9 5 ，造成嫡冗余。此外，对于某些特殊类型图像而言，可能还存在结构冗余和知识冗余等其它形式的数据冗余。研究视频信号中冗余消除方法、实现信息传输、存储和处理的有效性和可靠性是视频编码的主要关心问题【 t e k a l p , 1 9 9 5 . 按照压缩后的数据是否能够完全还原成原始数据划分，信源编码可以分为无损编码和有损编码。无损压缩可以精确地恢复原始数据。 s h a n n o n 第一定理指出了无损编码中平均码长和信源之间的关系，同时也给出了编码平均码长的极限周， 1 9 9 3 。无损ff 缩的常用方法有h u f f m a n 编码、游程编码r l c ( r u n - l e n g th c o d in g ) 等，但无损编码的压缩比通常比较低，约在2 : 1 左右g ib s o n , 1 9 9 9 ，这远远不能达到视频应用对压缩比的要求。不同于无损编码，有损编码采用折衷的方法，以损失保真度换取压缩比的增加。有损编码主要采用了空间采样、时空预测、变换、量化和嫡编码等技术以有效地消除各种数浙江大学硕士学位论文据冗余陈，2 0 0 3 。目前的视频压缩标准主要都采用了如图 mc - d p c m / d c t视频编码器框图。 d p c m 的基本原理是基于图象相邻象素之间具有较强的相关性。 1 . 1所示的基于混合每个象素可以根据以 c c :编码控制 t :变换q :量化 m u x :复合器 p : 控制参数9 :量化因子 me :运动估值 b :缓冲区 c : d c t 系数v :运动矢量图1 . 1基于mc - d p c m/ t视频编码器前已知的象素值预测。因此，在编码中传输的不是象素取样值本身，而是取样值的预测值和实际值之间的偏差。 d p c m可以提供一个中等程度的压缩 t e k a lp , 1 9 9 5 ，它的实现相对简单，己被各种视频编码标准采纳用来消除视频信号的时域相关性i s o , 1 9 9 1 ; i t u , 1 9 9 3 ; i s o , 1 9 9 5 ; i t u , 1 9 9 6 ; i s o , 1 9 9 8 ; i t u , 2 0 0 1 o 变换编码，已有三十多年的研究历史，已被证明是一种高效的图象压缩方法，是迄今为止所有有损编码国际标准的基础，它可以有效地消除图象数据之间的空间相关性。基本的变换编码是把图象分割成块，逐块进行二维正交变换、量化，最后对量化后的系数进行编码。常见的变换有， d f t ( d i s c re t e f o u r i e r t r a n s f o r m) 、 d c t , h a d e m a r d 和h a r r 变换，其中d c t 在相邻象素间的相关系数逼近 1 时有类似于 k l t ( k a r h u n e n - l o v e v t r a n s f o r m ) 的特性章， 1 9 9 9 。除了14 .2 6 4 采用整数变换外，其它所有视频编码标准都是采用d c t i s o , 1 9 9 1 ; i t u , 1 9 9 3 ; i s o , 1 9 9 5 ; i t u , 1 9 9 6 ; i s o , 1 9 9 8 ; i t u , 2 0 0 1 , d c t能够很容易地提供2 5 : 1 的压缩比而视觉效果没有明显降低 t e k a l p , 1 9 9 习。 1 . 3数字视频编码标准二十五年前，图像和视频编码成为一个广泛研究的课题。现在它的应用遍及各行各业，已经从纯学术研究转变为高度的商业行为。不断增长的商业需求进一步推动着标准的形成，各种国际视频编码标准的推出，使不同来源的图象和视频可以在不同的硬件平台上处理，在浙江大学硕士学位论文不同的存储设备上存储，不同通信网络上传输。目前从事视频压缩标准制定的国际组织主要有国际电信联盟it u 一的视频编码专家组v c e g ( v id e o c o d i n g e x p e rt g r o u p ) 和国际标准化组织i s o i i e c的运动图像专家组m p e g ( m o t io n p i c t u r e e x p e rt g r o u p ) . 两个标准化组织基于不同的应用需求，采用近似的压缩编码技术，分别制定了h . 2 6 x 和m p e g - x 系列视频压缩标准。其中i t u 一下针对可视会议等应用分别制定了日 . 2 6 1 , 日 . 2 6 2 , 日 . 2 6 3 , 日 . 2 6 3 十、 h . 2 6 3 + + , h . 2 6 l h . 2 6 4 / a v c ; i s o / i e c相继制定了 m p e g - 1 , m p e g - 2 , m p e g -4。以上国际压缩标准尽管应用领域不同，但是均采用了预测编码结合变换量化的混合编码模式。其中两大视频标准化组织于1 9 9 2 年联合提出的m p e g - 2 / h . 2 6 2 是现有最成功的国际视频压缩标准，目前又再次联手提出了h . 2 6 4 / a v c / a v c ,即m p e g 一第1 0 部分。图1 . 2 给出了各个标准出现的时间及其关系。】刀少丁 h . 2 6 x 系列 h. 2 6 1h. 2 6 3 1 h2 6 3 + 11. 2 6 3 十卜工日门刀 5 0 /e( 联合标准 1 2 6 4 图1 .2视频压缩标准的关系 1 . 3 . 1 h . 2 6 1 i t u, 1 9 9 3 1 日 . 2 6 1 是最早出现的视频编码标准，是it u 一的前身c c i 丁下针对可视电话、会议电视和窄带 i s d n等要求实时编解码和低延时应用提出的一个编码标准。它的输出码率是 p x 6 4 k b iu s ，其中p为0 到3 1 的整数，当p小于6 时，只能传输清晰度不太高的图像，可应用于电视电话;当尸大于6时，可以传输清晰度较好的图像，适用于电视会议等。日 .2 6 1 采用的算法主要是帧间预测和二维d c 丁变换的混合编码方法，该标准同时支持帧间编码和帧内编码，当帧间预测效率较低的时候，则直接采用d c t 变换。 1 . 3 . 2 m p e g - 1 i s o, 1 9 9 1 m p e g - 1 标准制定的目标码率是1 . 2 m比特渺，对于c i f ( 3 5 2 x 2 8 8 ) 格式图像可以达到实时播放，是为只读c d - r o m光盘的视频存储和播放所制定的。类似于h . 2 6 1 标准， m p e g - 1 也采用运动补偿和二维d c t 变换，量化后的d c 丁系数进行变长编码，同时每个数据块的直流分量 d c进行预测差分编码。在 m p e g - ，标准中，图像预测类型可以分为四种情况:帧内预测、前向帧间预测、双向帧间预测和直接预测。浙江大学硕士学位论文 1 . 3 . 3 mp e g - 2 1 h . 2 6 2 i s o, 1 9 9 5 m p e g - 2 的视频编码部分就是h .2 6 2 ，该标准主要针对数字视频广播d v b ( d ig it a l v id e o b r o a d c a s t ) 、高清晰度电视h d tv ( h i g h d i g it a l t e le v is io n ) 和数字光盘d v d ( d ig it a l v id e o d is c a r d ) 等4 -9 m比特渺运动图像的编码。 m p e g - 2 作为一个得到广泛应用的国际标准，成功之处在于提出了通用的压缩编码方法，定义了不同的 “ 档次” ( p r o f ile ) 和“ 等级” ( le v e l ) , 可满足不同图像分辨率及相应的存储成本和处理速度的需要。m p e g - 2标准根据不同的档次形成了各个不同的子集，每个 “ 档次”的 “ 等级”则是对编码参数所做出的进一步限制。这样以不同“ 档次” 和 “ 等级” 设计的解码器能够对相同或者较低档次的数据解码。其中一个主要的档次和等级组合是m p m l ( m a in p r o f ile t a m h a n k a r , 2 0 0 3 ; l u t h r a , 2 0 0 3 ; s c h a f e r , 2 0 0 3 ; r i c h a r d s o n , 2 0 0 3 . 1 . 3 . 6 . 3 h . 2 6 4 1 a v c应用 h .2 6 4 / a v c标准针对不同的应用，给出了三种档次和1 -5 .2 个不同的水平，每种档次和水平侧重于不同的应用场合，各自的编码工具也不相同，如图1 . 3 所示。 .基本档次 ( b a s e l i n e p rof i l e ) 基本档次的h . 2 6 4 / a v c标准是为视频会议和视频电话等实时视频通讯应用设计的，它实现了任意片断 ( s l i c e ) 排序和冗余片断处理等错误恢复功能。 .主要档次 ( m a i n p r o f i l e ) 为广播应用而开发的什2 6 4 / a v c主要档次使用与基本档次无关的视频工具，例如在预测模式中支持双向预测的日帧图像、加权预测以及自适应帧场编码和c a b a c嫡编码算法。 .扩展层档次 ( e x t e n d e d p r o f i l e ) 该协议类主要面向无线视频流服务和移动流媒体，在这些应用中，由于无线信道带宽有限，存在多径干涉和各种干扰，错误发生的机率比传统有线传输数据丢包率高很多。扩展层档次将把为基本档次设计的错误恢复功能提高到一个新的水平，提供更完善、更有针对性的浙江大学硕士学位论文错误隐藏方法。、、、一石二 :飞，了图1 .3基本档次、主档次、扩展档次之间的关系 r ic h a r d s o n , 2 0 0 3 1 . 3 . 6 . 4 h . 2 6 4 1 a v c性能改进实际上，新的k2 6 4 1 a v c标准与已有的其它标准相比，在单个模块上并没有取得明显的提高，而是在每个编码过程的每个步骤上均取得了一定的进步，表现为整体压缩性能的较大提高 wie g a n d , 2 0 0 3 r ic h a r d s o n , 2 0 0 3 。在保证相同图像质量的情况下， h .2 6 4 /a v c 比h .2 6 3 . m p e g - 4 , m p e g - 2 的压缩效率至少高一倍，图， .4 给出了四种标准的率失真对比结果。 a 皿. 甲.妞 . 心听白.尹曰口 .曰. 目 1.息丘n叨d 图1 .4各种编码标准比特率失真对比结果r ic h a rd s o n , 2 0 0 3 浙江大学硕士学位论文 1 .4现有研究成果视频编码的目的是保证视频传输和存储的有效性和可靠性，这就要求编码能够尽可能压缩视频数据量满足带宽和存储空间的约束。实际上，视频编码除了受带宽和存储空间等条件的限制外，还受到其它因素的影响，如编码延时、失真度( 质量) 、编码复杂度和容错性能等。其中对视频编码系统影响较大的两个因素是码率和复杂度。图1 .5 列出了影响视频编码系统的儿个关键因素。延时真刀贡量编码复容错性能图1 . 5影响视频编码系统的几个关键因素许多文献从简化编码模式、优化主要编码模块以及实现方面对降低编码复杂度问题进行了有益的探讨。对于复杂度，目前已有一些研究工作分析了h . 2 6 4 标准的编码效率。薛针对 h .2 6 4 提出了一种中途停止的多层逐次消元运动估计算法薛， 2 0 0 4 e j . n .z h a n g z h a n g , 2 0 0 3 1 等人则从编码器计算复杂度与质量折中的角度对运动估计中采用的搜索模式和判别准则进行了较深入的讨论。 m a lv a r 对4 x 4 像素大小的块上进行残差的整数变换编码进行了深入分析 m a lv a r , 2 0 0 1 ; m a lv a r , 2 0 0 3 o m a r p e 分析了基于内容的自适应编码方法的性能 m a r p e , 2 0 0 1 o h a l la p u r o 对低比特率应用的h .2 6 4 编码器进行7 性能分析h a l l a p u r o , 2 0 0 1 , l a p p a l a in e n 将h .2 6 4编码器进行了优化，并与h .2 6 3 / h .2 6 3 + 进行了性能比较l a p p a l a in e n , 2 0 0 1 。虽然这些工作涵盖了所有的编码方法，但通常或者是独立测试某一种新技术，将基本配置的性能与此配置加上要测试的技术后的性能进行比较; 或者是总体对所有技术的性能进行分析，对于技术之间的依赖性以及编码增益和复杂度之间的折中没有进行很好的研究。本文对编码参数之间的关联性进行了分析并指出了如何合理设置编码参数。码率控制大多通过缓冲机制的平滑作用完成。受解码缓冲区大小和延时影响，编码时除了在控制码率外，还要防止缓冲区溢出带来的视频质量下降。许多学者和机构在码率控制方面做了大量的研究工作。 t m5 i s o , 1 9 9 3 1 将码率控制分为三个步骤:目标比特分配、基于缓冲区饱和度的码率控制和自适应量化。但t m 5 算法是建立在视频源信号为平稳随机过程的基础上，它存在场景切换适应性和缓冲区一致性问题。 t m n s c o r b e r a , 1 9 9 9 则将码率控制分别建立码率一量化曲线为二阶抛物线模型和对数模型的基础上。 z . h e h e , 2 0 0 1 通过量化后d c t系数的非零值比例和码率之间的统计关系建立p 一域码率失真模型。对于v b r码率浙江大学硕士学位论文控制， l . t e i x e ir a t e i x e i r a , 1 9 9 7 和p h . w e s t e r i n k w e s t e r i n k , 1 9 9 9 , s e t h u r a m a n s e t h u r a m a n , 2 0 0 1 提出了基于r - q 模型的多通道码率控制算法。本文将从h .2 6 4 码流的特点出发，提出一种基于对数模型的分层次的实时码率控制算法。图像质量也是一个关键指标，因此必须对图像的质量进行有效的度量。由于人眼是很多数字视频系统的终端，因此采用人眼直接观察视频质量的主观度量是最为直观的方法。但常用的主观度量方法 c c i r , 1 9 8 6 的主要缺点是需要在非常严格控制的环境下，由一定数量的视频专家在专门的实验室里对视频进行评估，准备工作量大，灵活性差，花费代价高且达不到实时要求。因此客观评价算法应运而生，峰值信噪比 p s n r ) 和均方误差 ( m s e )方法简单，较早和广泛的应用起来。随后很多学者提出了各种更加成熟的算法 w o lf , 2 0 0 2 ; f e n g , 2 0 0 0 ; w e b s t e r , 1 9 9 3 ; v a n , 1 9 9 6 1 。以上算法有些过于复杂，不利于实时实现; 有些与主观度量方法相关度太差，评价效果不佳。本文将从信号的时域和空域特性出发，提出一种基于人眼视觉感知的视频质量度量系统。 1 . 5全文结构安排本文从h . 2 6 4 / a v c视频应用的角度，针对编码过程中的复杂度、码率控制和质量评价等问题进行了研究与分析，分别提出了相应的算法。全文共分为五章。第一章为绪论。简要回顾了视频编码发展历史和背景，介绍了h .2 6 4 / a v c视频压缩标准的形成、特点和应用领域等基本问题，系统总结了前人对复杂度、码率控制和质量评价领域的研究成果和方法，并给出了本文的研究内容。第二章为视频编码复杂度分析。本章对 h .2 6 4 / a v c的主要功能模块及其中包含的新技术进行了详细论述，着重对于各编码参数对编码器性能的影响以及它们之间的关联性进行了讨论，并给出了在保证性能的情形下通过合理设置编码参数，有效的降低编码复杂度的方法。第三章为码率控制。本章首先论述了码率控制的原理和率失真理论，然后分析了h .2 6 4 的码流特点，基于此提出了一种针对 h .2 6 4 / a v c视频压缩标准的采用对数模型的分层码率控制算法。第四章为质量评价。本章讨论了视频的空域信息、时域信息以及由之产生的三个度量参数，提出了一种基于人眼视觉特性的客观视频质量的评价方法，它包含了对空域信息和时域信息的度量，较好的反映了人眼视觉系统，与主观度量的结果基本一致。第五章总结全文，并展望了进一步研v.工作。浙江大学硕士学位论文第二章视频编码复杂度本章详细论述了h . 2 6 4 / a v c 的主要功能模块，分析了每一种编码技术引起的增益和复杂度，着重对于各编码参数对编码器性能的影响以及它们之间的关联性进行了讨论; 考虑编码增益和复杂度之间的折中，从统计意义上提出了合理配置编码参数的方案 2 . ，引言 h .2 6 4 视频编码标准和以前的标准一样，仍然采用预测一变换结合的混合编码框架，但对每一个功能模块中都引入了新的技术，使各功能模块的实现细节都发生了重要的改变。引入了诸如变化的块尺寸、多参考帧、 1 / 4 像素精度的运动矢量、整数变换和哈达马( h a d a m a r d ) 变换、基于内容的变长编码c a v l c ( c o n t e x t - a d a p t iv e v a r ia b le l e n g th c o d i n g ) 、帧内空域预测、环内去块滤波器等一系列新的编码方法。虽然这些编码技术提高了编码效率和性能，但编码复杂度也大幅度提高了，而且这些新技术引进的增益取决于采用的编码器配置，这些不同技术带来的增益并不是加性的 s a p o n a r a , 2 0 0 3 。目前已有一些研究工作 h al l a p u r o , 2 0 0 1 ; j o c h , 2 0 0 2 ; l a p p al a in e n , 2 0 0 1 ; m a r p e , 2 0 0 1 ; s c h w a r z , 2 0 0 2 分析了h .2 6 4 标准的编码效率，虽然这些工作涵盖了所有的编码方法，但新技术通常都是独立测试的，即将基本配置的性能与此配置加上要测试的技术后的性能进行比较; 或者是总体对所有技术的性能进行分析。这样，对于技术之间的依赖性以及编码增益和复杂度之间的折中没有进行很好的研究。实际上，在基本配置 ( 其它新技术未应用) 时加上要测试的技术，得到的编码增益比较大，这是因为此时的视频数据具有较大的相关性; 而当其它技术也采用时，剩下的数据相关性降低，因此进一步可得的增益必然减小。本章先分析了每一种编码技术引起的增益和复杂度，然后着重对于各编码参数对编码器性能的影响以及它们之间的关联性进行了讨论，最后考虑编码增益和复杂度之间的折中，从统计意义上提出了合理配置编码参数的方案。 2 . 2 h . 2 6 4 关键技术 2 . 2 . 1分层设计 h . 2 6 4 / a v c 视频编码在概念上可以分为两层，分别是视频编码层 v c l ( v i d e o c o d in g l a y e r ) 和网络4t象层 n a l ( n e t w o r k a b s tr a c t io n l a y e r ) w e n g e r , 2 0 0 3 ; s t o c k h a m m e r , 2 0 0 3 0 图2 . 1 为相应的方框图。其中v c l 层主要负责高效率的视频数据压缩，采用了基于块的混合编码方案，引入了许多新的编码方法。 n a l层负责根据传输网络的特点，以恰当的方式对数据进行打包和分发，主要包括编码头信息、段结构信息和视频编码层实际编码数据，以及逻辑信道信令、定时信息和序列结束信号网络传输标志。在v c l 和n a l 浙江大学硕士学位论文两个层次之间定义了一个基于分组方式的接口，这样，高效压缩的视频流就可以在各种有线或无线网络中进行视频传输. n a l的产生不但使h . 2 6 4 / a n 对目前现存的各种不同网络有很强的网络友好性，而且使它对未来的网络同样具有很强的适应性。 f l 2 6 4 / a v c椒港层一 _聆蕊 1.q曰_ vlc- - - _座叫匣昼画但多种块尺寸的引入增加了运动矢量的开销，同时也增加了编码器的复杂度，因为要对每一种块尺寸进行运动估计以选择最佳的模式。 0 1 0 1 01 1 2 i 3 ( a ) 模式1 1 个1 6 x 1 6 块 1 个运动向量 ( b ) 模式2 2 个1 6 x 8 块 2 个运动向量 ( c ) 模式3 2 个8 x 1 6 块 2 个运动向量 ( d ) 模式4 4 个8 x 8 块 4 个运动向量 01 23 45 67 01 23 456 7 ( e ) 模式5 8 个8 x 4 块 8 个运动向量 ( f ) 模式6 8 个4 x 8 块 8 个运动向量 ( 9 ) 模式7 1 6 个4 x 4 块 1 6 个运动向量图2 . 5多种块模式定义根据块模式的特点，选择了如表2 .2 所示的三种组合方案，测试结果如表2 .3 所示。值得注意的是对于s t e f a n 序列，采用方案3 获得的p s n r增益与方案2 相当，而且比特率略有上升，原因是s t e f a n 序列运动剧烈，较多的采用小的块尺寸，反而增加了运动矢量的开销。表 2 .2块模式的组合方案方案模式组合块尺寸 1 模式 11 6x 1 6 2 模式1 到41 6 x1 6 , 1 6 x8 , 8 x1 6 , 8 x8 3 模式1 到7 1 6 x1 6 , 1 6 x8 , 8 x1 6 , 8 x8 , 8 x4 , 4x8 , 4x4 浙江大学硕士学位论文表2 . 3多种块尺寸的测试结果测试序列组合方案z , p s nr比特率下降 (%)编码时间之比 a k i y o 2 v s . l0 . 0 64 . 81 . 4 4 3 v s . l0 . 0 65 . 11 . 8 9 f o r e ma n 2 v s . 10 . 1 19 . 61 .4 2 3 v s . l0 . 1 41 1 . 3 1 . 8 6 s t e f a n 2 v s . l0 . 0 58 . 7 1 . 3 8 3 v s . 10 . 0 46 . 81 . 7 8 2 . 3 . 2多参考帧 h .2 6 4 / a v c允许编码器使用多于一帧的参考帧进行运动估计，这就是所谓的多参考帧技术。多参考帧示意图如下所示: 图2 .6多参考帧示意图 f l i e r l ,2 0 0 3 编码器利用己经编码结束的参考帧对当前编码块分别进行预测，并从中选择预测最好的帧作为参考帧，可以有效消除不可补偿区域造成的预测误差。在一些特定的情况卜，主要是快速的周期运动、快速的场景相互切换、物体存在遮蔽现象等，多参考帧的使用会有非常好的效果。同时由于采用多参考帧进行预测，计算复杂度增大，而且需要额外的缓冲区来存储这些参考帧。表2 . 4多参考帧的测试结果测试序列参考帧个数l , p s nr比特率下降( %) 编码时间之比 a k i y o 3 v s . 10 . 0 3 0 . 62 . 1 7 5 v s . 10 . 0 42 . 3 3 . 2 5 f o r e ma n 3 v s . l0 . 1 02 . 9 2 . 1 5 5 v s . 10 . 1 0 5 . 13 . 2 2 s t e f a n 3 v s . 10 刀18 . 0 2 . 0 7 5 v s . 10 . 0 28 . 0 3 . 0 5 在测试中，分别选取了1 , 3 , 5 个参考帧进行比较，结果如表2 .4 所示。可以看出，在基本配置f ，每增加2 个参考帧，编码约增加1 倍，但得到的p s n r增益和比特率的下降较浙江大学硕十学位论文少，而且参考帧个数由3 个增加到5 个时获得的增益要远小于由1 个增加到3 个时获得的增益，因此增益与参考帧个数的关系并不是线性的，在考虑复杂度以及实时应用的情形下，应该避免使用过多的参考帧。 2 . 3 . 3哈达马 ( h a d a m a r d )变换经过整数变换后，空间域的数据映射到变化域，能量大部分集中在低频系数，尤其是 d c系数。同时由于一般情况下，视频中亮度和色度的变化趋势缓慢，所以相邻区域的数据存在较大的相关性。在变化域的残差编码中，哈达马变换可以用于提高传统的误差函数 ( 如绝对差之和 s a d)的性能。在 h.2 6 4视额标准中采用的哈认马亦换知阵为 ( 2 . 1 ) 十月 1-l1-1 1-l-l1 ，.，1

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（信号与信息处理专业论文）h264视频编码的复杂度、码率控制与质量评价.pdf

文档简介

温馨提示

最新文档

评论

（信号与信息处理专业论文）h264视频编码的复杂度、码率控制与质量评价.pdf

文档简介

温馨提示

最新文档

评论

相关文档