（通信与信息系统专业论文）基于h264avc运动估计算法研究.pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-10 格式：PDF 页数：55 大小：3.62MB 积分：0 举报 版权申诉

已阅读1页，还剩54页未读，继续免费阅读

（通信与信息系统专业论文）基于h264avc运动估计算法研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要摘要随着多媒体技术和网络技术的飞速发展，以视频压缩编码为基础的数字视频的应用也越来越广泛。视频序列图像在时间上有很强的相关性，利用运动估计和运动补偿技术可以比较有效地去除图像帧间高度冗余度，实现高码率压缩比，块匹配运动估计算法具有计算复杂度低和易于软硬件实现的特点，被广泛应用于 m p e g l 2 4 和h 2 6 x 等视频编码标准中。最简单而且最可靠的块匹配算法是全搜索，然而它的计算量大，不适合实时应用。因此，研究快速有效的运动估计算法一直是视频压缩编码领域的热点问题之一。在h 2 6 4 视频编码标准中，运动估计占用了编码器极大的计算量。为了提高运动估计算法的精度，减少搜索时间，本文分析了预测运动矢量和最优运动矢量的关系，进行了大量的统计试验和仿真，得出结论：预测运动矢量s a d 值越大，最优运动矢量分布越广；反之，分布越集中。在此基础上，设计了新的快速运动估计搜索算法：根据预测运动矢量s a d 值设置不同的阈值和搜索模板，预测s a d 值越小，搜索范围越小，反之越大。算法中还采用了基于梯度下降的精细搜索技术，提高了算法的精度。实验结果证明，该算法与目前被广泛使用的u m h e x a g o n s 算法相比，p s n r 提高了0 0 0 1 6 d b o 0 2 6 5 d b ，搜索时间m e t i m e 减少了3 2 2 9 q 5 3 2 。关键词：视频编码运动估计块匹配搜索算法 a b s t r a c t a b s t r a c t n o w a d a y s ，w i t ht h er a p i dd e v e l o p m e n to fi n t e r n e ta n dm u l t i m e d i at e c h n o l o g y ， d i g i t a lv i d e ob a s e do i lv i d e o - - - - c o d i n gh a sb e c o m em o r ep o p u l a r t h e r ee x i s t ss t r o n g t e m p o r a lc o r r e l a t i o nb e t w e e na d j a c e n tf l a m e si nav i d e os e q u e n c e a sa ne f f i c i e n tt o o l f o rv i d e oc o m p r e s s i o n ，m o t i o ne s t i m a t i o n ( m e ) a n dc o m p e n s a t i o n ( m c ) c a ne l i m i n a t e t h e h i g hr e d u n d a n c yb e t w e e n f la m e s a n da c h i e v ea h i g hc o m p r e s s i o nr a t i o b l o c k 。m a t c h i n ga l g o r i t h mi ss i m p l ya n de a s i l yc a r r i e do u tb ys o f t w a r ea n dh a r d w a r e ， a n di sw i d e l yu s e di nm p e g 1 2 4a n d h 2 6 x t h es i m p l e s ta n dm o s tr e l i a b l e w a yi sf u l ls e a r c h t h e r e f o r e ，h o wt of i n da n e f f e c t i v ea l g o r i t h mo fm o t i o ne s t i m a t i o ni so n eo ft h em o s tp o p u l a rt o p i c si n v i d e o - c o d i n ga r e a m o t i o ne s t i m a t i o nt a k e st o om u c ht i m ei nv i d e o c o d i n g i no r d e rt or e d u c et h e c o m p u t a t i o n a lc o m p l e x i t ya n di m p r o v et h ea c c u r a c yo fm o t i o ne s t i m a t i o n , t h i sp a p e r a n a l y z e st h er e l a t i o n s h i pb e t w e e np r e d i c t i o nm o t i o nv e c t o ra n dt h eo p t i m a lm o t i o n v e c t o r ，a n dc a r r yo u tal a r g en u m b e ro fs t a t i s t i c a lt e s t sa n ds i m u l a t i o n c o n c l u d e dt h a t t h el a r g e rs a dv a l u eo fp r e d i c t i o nm o t i o nv e c t o ri s ，t h em o r eo p t i m a lm o t i o nv e c t o r d i s t r i b u t e dw i d e l y ；o nt h ec o n t r a r y ，t h eh i g h e rt h ec o n c e n t r a t i o nd i s t r i b u t i o n o nt h i s b a s i s ，w ep r e s e n tan e wb l o c k m a t c h i n ga l g o r i t h mi nt h i sp a p e r ：a c c o r d i n gt ot h e p r e d i c t i o nm o t i o nv e c t o rs a dv a l u ew es e td i f f e r e n tt h r e s h o l d sa n ds e a r c ht e m p l a t e s t h es m a l l e rp r e d i c t e ds a dv a l u ei s ，t h es m a l l e rt h es e a r c hr a n g ei s o nt h ec o n t r a r y t h e w i l d e rt h es e a r c hr a n g ei s a l g o r i t h ma l s o u s e st h eg r a d i e n t b a s e dd e s c e n ts e a r c h t e c h n o l o g yt oi m p r o v et h ea c c u r a c yo ft h ea l g o r i t h m e x p e r i m e n t a lr e s u l t ss h o wt h a tt h e a l g o r i t h mi si m p r o v e db y0 0 016 d b - - 0 0 2 6 5 d bi np s n ra n dd e c r e a s e db y3 2 2 9 4 5 3 2 i nm e t i m et h a nu m h e x a g o n sa l g o r i t h m k e y w o r d s ：v i d e oc o d i n g m o t i o ne s t i m a t i o n b l o c k - m a t c h i n ga l g o r i t h m s e a r c ha l g o r i t h m 西安电子科技大学学位论文创新性声明秉承学校严谨的学风和优良的科学道德，本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除了文中特另t l d l 以标注和致谢中所罗列的内容以外，论文中不包含其他人已经发表或撰写过的研究成果；也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处，本人签名：涟望刍本人承担一切的法律责任。日期b o 3 。一日期鱼生：兰! 生西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定，即：研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件，允许查阅和借阅论文；学校可以公布论文的全部或部分内容，可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证，毕业后结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。 ( 保密的论文在解密后遵守此规定) 本人签名：导师签名：日期五垒：! ! 里 e t 期丛皇! 茎o 第一章绪论第一章绪论弟一早三百下匕 1 1 课题背景视频编码技术是通过有损或无损的方式实现数据量的有效压缩，它是视频处理技术中的重要组成部分。现实中，图像和视频中包含了大量的数据，如果直接对原始视频数据进行传输，将导致无法进行连续的视频信息实时传输。因此，视频数据只有进行有效的压缩才能具有实用价值。在视频图像序列中，通过减少相邻帧与帧之间的时间相关性可以大幅的提高编码效率。基于块匹配的运动估计( b l o c km a t c h i n gm o t i o ne s t i m a t i o n ，b m m e ) 技术是视频压缩过程中的一项核心技术，它可以有效去除时间冗余，已经被许多的视频编码标准采纳。 h 2 6 4 几w c 是由i t u t 视频编码专家组( v c e g ) 和i s o i e c 动态图像专家组 ( m p e g ) 联合组成的联合视频组( t ，j o i n tv i d e ot e a m ) 提出的高度压缩数字视频编解码器标准。与当前的各类视频压缩标准相比，它采用了相同的基于块的运动补偿技术，但同时它又采用了更加灵活的宏块分割策略、高精度的运动补偿技术、多帧预测以及去块滤波技术。在同样的视频质量条件下，它比h 2 6 3 节约了5 0 的码率，但是这些特性又极大的增加了它的计算复杂度，因此设计高效简单的运动搜索策略是非常重要的。随着人们对运动估计技术研究的不断深入，众多经典的运动估计算法被提出，相继有全搜索算法( f u l ls e a r c ha l g o r i t h m ，f s a ) 也称穷尽搜索法，三步搜索法( t h r e e s t e ps e a r c h ，t s s ) ! ，新三步搜索法( n o v e lt h r e es t e ps e a r c h ，n t s s ) t 2 1 ，四步搜索法 ( f o u rs t e ps e a r c h ，f s s ) t 引，基于块的梯度下降搜索算法( b l o c k b a s eg r a d i e n td e s c e n t s e a r c h ，b b g d s ) e 4 1 ，菱形搜索法( d i a m o n ds e a r c h ，d s ) 【5 1 ，六边形搜索法 ( h e x a g o n b a s es e a r c h ，h e x b s ) l 6 1 ，u m h e x a g o n s 算法【_ 7 。实际上，当前运动搜索算法的计算量仍然占h 2 6 4 整个编码过程的4 0 左右。 1 2i s o i e c 编码标准自2 0 世纪8 0 年代中后期至今，视频压缩编码技术获得了飞速的发展。国际标准化组织( i s o i e c ) 和国际电信联盟( i t u t ) 带l j 定了先后一系列国际视频编码标准。 2基于h 2 6 4 a v c 运动估计算法研究 1 2 1i s o h e c 编码标准 ( 1 ) m p e g 1 标准【8 】 m p e g 1 标准制定于1 9 9 2 年，标准编号i s o i e c l 11 7 2 ，它主要针对1 5 m b p s 以下数据传输率的数字运动图像及其伴音编码的国际标准，它在c d - r o m 上存储同步和彩色运动视频信号码率为1 5 m b s 。该标准包括三部分：m p e g 1 视频、音频和系统。 ( 2 ) m p e g 2 标准【9 j m p e g 2 标准第一版草案制定于1 9 9 2 年，1 9 9 4 年正式颁布为国际标准，标准编号i s o i e c l 3 8 1 8 。该标准是在兼容m p e g 1 的基础上实现了低码率和多声道扩展，是针对标准数字电视和高清度电视在各种应用下的压缩方案和系统层的详细规定，同时也是国际主流的s d t v 和h d t v 的编码标准。 ( 3 ) m p e g 一4 标准l 1 0 1 m p e g 4 标准第一版草案子1 9 9 9 年2 月公布，2 0 0 0 年初正式成为国际标准，标准编号i s o i e c l 4 4 9 6 。作为一款开放的标准，新内容和新算法也不断加入其中。由于具有基于内容的编码方法和灵活的组合结构，并同时采用了工具箱的方法，因此，m p e g 一4 能支持各种各样的新功能，应用前景广阔。 m p e g 一4 的最初目的是针对视频会议、视频电话的超低比特率编码，但在调查过程中m p e g 感受了两大变化，并据此立即修改了方案，制定现在意义上的m p e g 一 4 。这两个变化是： 1 ) 、硬件基础的变化：高性能通用芯片性价比的提高。 2 ) 、需求的变化：对多媒体信息，特别是视频流的应用要求由播放型转向基于内容的访问，操作性。为了支持对动态视频的基于内容访问，m p e g 4 中引入了对象( o b j e c t ) 的概念，事实上就是基于对象方法得到分层区域，因此，基于对象的方法是基于内容压缩编码中的一种主要算法。 m p e g 4 视频标准提供了在多媒体环境下视频数据有效存储、传输和操作方面的核心技术。同时为了达到宽广而不限于某一狭窄的应用，m p e g 一4 考虑了应用集的功能。因此m p e g 4 中视频部分以工具和算法的形式提供了对各种功能的支持，如有效的压缩、对象的可扩展性、空域和时域的可扩展性、纠错等功能。要达到 m p e g 4 的目标，主要由基于内容的视频数据表示方法来决定。一个场景可看作又一系列具有各自特性的视频对象组成，其性质包括形状、运动、纹理。这种基于对象的表示方法是在多媒体应用中实现对象交互的关键，在这样应用中，用户可以访问任意形状的对象并对其进行操作。因为m p e g 4 标准的编码是基于对象的，因此这样就便于操作和控制对象，而第一章绪论 3 传统压缩方法是基于帧的，这显然无法操作对象。由于传输宽带的限制，必须对压缩比特率进行控制，这样直接影响图像的质量。过去在比特率低的时候，整帧图像的质量都受到影响，不具有灵活性；而m p e g 4 对比特率的控制可以基于对象，即使在低比特率时，也可以利用码率分配方法，对于用户感兴趣的对象可以多分配一些比特率，而对于用户不感兴趣的对象可以分配少一些比特率，这样就保证了图像的主观质量。 m p e g 4 中的对象操作可以使用户在用户端直接将不同对象进行拼接，得到用户集合成的图。这在传统方法中是无法直接实现的。同时，m p e g 4 在扩展上具有很好的灵活性，可以进行时域和空域扩展。这在m p e g 2 中也有一些体现，但它并不突出。而在m p e g 4 中，可根据现场带宽和误码率，在时域空域进行扩展。时域扩展是在带宽允许时在基本层之上的增强层中增加帧率，在带宽窄时在基本层中减少帧率，以达到充分利用带宽，使图像质量更好的目的。空域扩展是指对基本层中的图像进行采样插值，以增加或减少空间分辨率。、 1 2 2i t u t 编码标准 ( 1 ) 、h 2 6 1 标准【1 1 1 h 2 6 1 标准是由i t u t 于1 9 9 0 年公布的，又称“p 6 4 k b s 视听业务的视频编码器 ( 1 - - - 3 0 ) ”，它具有覆盖整个i s d n ( 综合业务数字网) 基群信道的功能，也适用于会话业务的活动图像编码，被广泛应用于会议电视和可视电话。 ( 2 ) 、h 2 6 3 ，h 2 6 3 + ，h 2 6 3 + + 标准1 1 2 1 i t u t 又于1 9 9 5 年7 月推出了低码率视频压缩编码的h 2 6 3 建议，其技术核心仍为混合编码方法，但借鉴了m p e g 2 中的半像素运动估计和运动补偿技术及双向预测技术，可实现l l h 2 6 1 更高的压缩比，从而用于实现低于6 4 k b s 的视频压缩编码。 i t u t 在1 9 9 8 年推出的h 2 6 3 + 是h 2 6 3 视频编码标准的第二版，它提供了1 2 个新的可选择模式，进一步提高了压缩编码性能。i t u t 又在2 0 0 0 年推出了h 2 6 3 + + ，对 h 2 6 3 又做了一些新的扩展，增加了一些新的可选技术，从而更加适应于各种网络环境，增强了差错恢复的能力。 ( 3 ) 、h 2 6 4 标准【1 3 】 h 2 6 4 标准是由i t u t 的v c e g ( v i d e oc o d i n ge x p e a sg r o u p ) 和i s o i e c 的 m p e g ( m o t i o np i c t u r ee x p e l sg r o u p ) 联合成立的“联合视频组”，j v t ( j o i n tv i d e o t e a m ) 共同制定的新一代视频编码新标准，2 0 0 3 年3 月，公布标准的最终草案，称作h 2 6 4 a v c 或m p e g 4v i s u a lp a r t l 0 。h 2 6 4 能提供比m p e g 4 和h 2 6 3 标准更高的压缩性能，使图像的数据量减少5 0 ；对网络传输具有更好的支持，引入了面向数据包的编码技术，这有利于将数据打包在网络中传输；它具有较强的抗误码特性， 4基于h 2 6 4 a v c 运动估计算法研究以适应在噪声干扰大、丢包率高的无线信道中传输数据；对不同应用的时延要求，它具有灵活的适应性；同时，它的编码和解码复杂度具有可扩展性。除了上述国际标准之外，中国也制定了具有自主知识产权的音视频编码标准。2 0 0 3 年1 1 月底，中国国家信息产业部“数字音视频编解码标准组”正式发布了a v s ( a u d i ov i d e o c o d i n gs t a n d a r dw o r k i n gg r o u po fc h i n a ) 标准草案。标准草案的视频部分编码效率可以达到m p e g 2 的2 到3 倍，编码实现复杂度明显降低。 1 3 研究目标研究目的是通过研究现有的各类块匹配运动估计算法，分析预测运动矢量和最优运动矢量的关系，在此基础上以提高视频质量和减少运动搜索时间为目标，针对h 2 6 4 编码过程，提出新的高效的运动搜索策略和算法，并且通过j m 8 6 软件平台验证算法的优越性。 1 4 本论文的组织结构针对以上的研究目标，本文的研究工作和内容组织如下：第一章介绍了本文的研究目的和课题的背景，另外介绍了基于块的运动估计算法研究现状以及本文的组织结构；第二章研究了视频编码的基本原理以及研究现状，分析了h 2 6 4 的编码过程和关键技术；第三章研究了最优运动矢量和s a d 的分布规律，并分析了现有的各类运动估计算法以及各自的优缺点；第四章针对现有算法的不足，本文对预测运动矢量和最优运动矢量的关系进行了大量的统计分析实验和仿真，并得出统计结论，在此基础上提出了一种针对 h 2 6 4 的基于阈值的多边形白适应快速搜索算法( t h r e s h o l d b a s e ds e l f - a d a p t i n g p o l y g o nf a s ts e a r c h ，t a p f s ) ；第五章对本算法进行了试验和仿真，在运动估计的搜索质量和速度两个方面证明了该算法的优越性。 1 5 本章小结本章主要介绍了本文的研究背景、视频压缩标准、基于块匹配的运动估计的研究现状，另外还列出了本文的研究目的和组织结构。第二章基于h 2 6 4 a v c 的视频编码原理 5 第二章基于h 2 6 4 a v c 的视频编码原理 2 1 引言 h 2 6 4 a v c 是一种优秀的视频压缩标准，在当前视频编码领域占有重要的地位。它是由国际电信联盟( i t u t ) 视频编码专家组和国际标准化组织国际电工委员会( i s o i e c ) 运动图像专家组在h 2 6 l 的基础上联合开发的具有高质量、低比特率的标准，主要应用在数字电视广播与存储、互联网视频流信息服务和视频移动传输等领域。 2 2h 2 6 4 标准概述 2 2 1h 2 6 4 标准的特性 h 2 6 4 视频编码标准的基本构成延续了原有一些标准的基本特性，同时为了提高编码性能它又引入了很多新的特性，主要包括： 1 ) 、更高的编码效率：同h 2 6 3 + 或m p e g 4 相比，在获得相同图像质量情况下，它可平均节省约5 0 的码率【l 钔。 2 ) 、高质量的图像：可在所有码率( 含低码率) 条件下提供较高质量的视频图像。 3 ) 、自适应的延时特性：可工作于低延时模式下，用于实时的通信应用( 例如：视频会议) ，也能用于无延时限制的应用，如视频存储，视频流服务器等。 4 1 、容错功能：h 2 6 4 提供了解决了网络传输丢丢失问题的工具，适用于高误码传输的无线网络中视频数据传输。 2 2 2h 2 6 4 标准的档次 h 2 6 4 标准分为三种档次，分别为基本档次( b a s e l i n ep r o f i l e ) 、主要档次( m a i n p r o f i l e ) 和扩展档次( e x t e n dp r o f i l e ) ，不同的档次支持一组特定的编码功能，同时支持一类特定的应用。 1 ) 、基本档次主要包含低复杂、低延时的技术特征，主要针对交互式的应用，考虑到恶劣环境下的容错性，它的内容都被其它更高级别的p r o f i l e 所包含，只对i s l i c e 及ps l i c e 进行操作，主要用于可视电话、会议电视、无线通信等实时视频通信领域【8 】【1 5 】。 6基于h 2 6 4 a v c 运动估计算法研究 2 ) 、主要档次是针对更高编码效率的应用，它不支持f m o ( f l e x i b l em a c r o b l o c k o r d e r i n g ) ，a s o ( a r b i t r a r ys l i c eo r d e m g ) ) 和r s 等技术，只支持对i ，p ，bs l i c e 处理操作，主要用于数字广播电视与数字视频存储。 3 ) 、扩展档次的设计主要是针对流媒体的应用，它包括了所有容错技术、对比特流的灵活访问和切换技术。 2 3h 2 6 4 a v l 编码原理概述从信息论角度看，图像可作为一个信源，描述信源的数据是信息量( 信源熵) 和信息冗余量之和。信息冗余量有许多种，如空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余等，数据压缩的实质就是减少这些冗余量。因此，减少冗余量实际上是减少数据量而不减少信源的信息量。从数学的角度讲，图像又可以看作一个多维函数，压缩的实质就是减少函数之间的相关性。根据图像信息的组成元素，h 2 6 4 采用了帧内预测、帧间预测、运动估值和运动补偿、整数变换等技术，以提高图像的压缩率。其中帧内预测是h 2 6 4 根据图像中相邻像素的相似性，利用相邻像素的相关性，采用了新的帧内预测模式，通过当前像素块的左边、上边和右上的像素( 已编码重建的像素) 进行预测，只对实际值和预测值的差值进行编码，从而用较少的比特数来表达帧内编码的像素块信息；而帧间预测通过多帧参考等方法对下一帧进行精确预测，从而减少传输的数据量，实现降低图像的时域相关性。h 2 6 4 把运动估值和帧内预测的残差结果从时域变换到频域，采用t 4 x 4 离散余弦变换( d c t ) 的整数变换，而不是像m p e g 一2 和m p e g - 4 那样采用的8 8d c t 浮点数变换。以整数为基础的空间变换具备效果好、计算快( 只需加法与移位运算) ，反变换过程中不会出现适配问题等优点，并且结合量化过程，保证了在1 6 位计算系统中，计算结果有最大精度且不会溢出。因此，4 x 4 的变换块比8 8 更能减少块效应和震铃效应。 l t 厂、 + 量化 l 扫描4熵编码当前帧门蹙烈篁厌 m 厂订舡， l 参考帧i 7 l ：二i l j i，j 翟困咂丑觚 l_ j 去块滤波l 乇一反变换l 一反量化l i 运动估计f 器 l 、l l 一第二章基于h 2 6 4 a v c 的视频编码原理 7 图2 1 视频编解码框图与之前的各类标准相比，h 2 6 4 采用了相同的运动补偿加变换编码的混合结构，即m c d c t 结构。其编码器结构主要由前向支路和重构支路构成，如图2 1 所示： h 2 6 4 编解码器基本功能简述如下： ( 1 ) 编码器编码过程中，原始视频数据进入编码器后，当采用帧内编码时，首先选择相应的帧内预测模式进行帧内预测；随后对实际值和预测值之间的差值进行变换、量化和熵编码，同时编码后的码流经过反量化和反变换之后重构预测残差图像，在与预测值相加得出重构帧，得出的结果经过去滤波器平滑后送入帧存储器。采用帧间编码时，输入的图像块首先在参考帧中进行估计，得到运动矢量。运动估计后的残差图像经过整数变换、量化和熵编码后与运动矢量一起送入信道传输。同时另一路码流以相同的方式重构后经过去块滤波后送入帧存储器作为下一帧编码的参考帧。 ( 2 ) 解码器当压缩码流送入解码器时，首先进行判断：如为帧内编码，则直接进行反量化、反变化加以重构；如果是帧间编码，所得到的是重构的残差图像，此时需要根据帧存储器中的参考图像进行运动补偿后与残差图像进行叠加，得出最终的重构帧。 2 4h 2 6 4 的关键技术 2 4 1 帧内预测编码模式对每个宏块编码时，有i n t r a 或i n t e r 两种模式。在i n t r a 模式中是直接对宏块进行d c t 变换，对变换系数进行熵编码。这样在一定程度上消除了帧内空间冗余度，但是d c t 只是利用了宏块内部像素之间的相关性，而没有考虑相邻宏块间的相关性。因此，h 2 6 4 引入了i n t r a 预测的方法，利用相邻宏块之间的相关性对待 8基于h 2 6 4 a v c 运动估计算法研究编码的宏块进行预测，再对预测残差进行变换编码，以消除空间冗余。与之前的标准在变换域中进行预测不同的是，h 2 6 4 是直接在空间域中进行预测。帧内预测技术是提高视频压缩比的关键，该技术不仅可以提高i 帧的压缩效果，而且在帧间预测找不到匹配块时，用帧内预测可以达到好的预测效果。当一个块或一个宏块采用帧内预测的时候，预测块将由相邻的并且经过编码、解码和重建的像素来产生，因为这些像素与当前块的像素有一定的相关性。然后当前块与预测块相减，对差值进行编码。h 2 6 4 标准中包括9 种4 4 亮度块的预测、4 种 1 6 1 6 亮度块的预测和4 种色度块的预测。 i 、4 4 亮度块预测： mabcde fg h i j k 三口bcd p g 勿 z 3 后， m刀d p 图2 24 4 的亮度块及预测所用到的相邻像素如图2 2 所示，4 4 的亮度块与相邻的像素a m ，这些分布在上面和左面的像素都是经过编码和解码重建的，预测块是通过对相邻像索a m 的计算获得的。图2 3 表示了不同预测模式的预测方向，通过预测来去除像素在这个方向上的相关性。心彦：衫 f4 图2 34 4 亮度块帧内预测的方向在完成预测块的计算之后，编码器要从9 种预测模式中选择一种最好的模式。第二章基于h 2 6 4 a v c 的视频编码原理 9 因为相邻块的帧内预测模式是高度相关的，如图2 5 所示，块a 和b 都是已经编码的4 x 4 块，分别位于当前块c 的上面和左面，那么c 的预测模式和a 、b 的预测模式是相关的，可从a 、b 的预测模式中得出c 最可能的预测模式 m o s t p r o b a b l e m o d e 。 m彳口cdefgh i 3 k 1 r1 r1r 1 r 3、p l a n e ) m彳口cde fgh j j k m口 cde， g l j 、 k 工 4 ( d i g o n a ld o w n - r i g h t ) m爿占cdfgh l 添 j k 三 m4bcdefgh i 缈 j k m彳ibcd fg目i l j m e a n k 上 5 ( v e r t i c a 一r i g h t ) m爿口cdefgh l 淤 j k l m彳占cde，gh l i 彩 j k 图2 44 x 4 亮度块帧内预测示意图选择当前块c 的最佳预测模式b e s t m o d e 的具体准则是按下面的公式计算，最佳预测模式的c o s t 最小。 c o s t = s a d + ，l a m d a ( q p ) 式( 2 1 ) 其中s a d 表示当前块与预测块的绝对差的和，o p 表示量化参数，l a m d a ( q p ) 为率失真因子，r 的取值与m o s t p r o b a b l e m o d e 有关，当最佳模式等于 m o s t p r o b a b l e m o d e ，则r 为o ，否则为l 。么 bc 图2 5 当前4 x 4 亮度块与相邻块 1 0基于h 2 6 4 a v c 运动估计算法研究 i i 、1 6 x 1 6 亮度块的预测与4 4 亮度块一样，1 6 x 1 6 亮度块也是由相邻的重建像素产生预测块，图2 6 表示了预测的方向，与4 x 4 块一样，通过预测来去除像素在这个方向的相关性。 1 6 x 1 6 的预测对图像平坦的区域比较有效。 0 ( v e r l l c a n 日矿 1 r1r 1 | i ： y 图2 61 6 x 1 6 亮度块帧内预测的方向 i i i 、色度块的预测色度块也有4 种预测模式，与1 6 x 1 6 的亮度块基本一样。 2 4 2 帧间预测编码模式 h 2 6 4 的运动估计采了许多新技术，包括可变块大小预测、多帧运动估计、亚像素精度的运动估计以及去块效应滤波等。 ( 1 ) 、去块效应滤波它是用来消除解码图像中的块效应。块效应产生的原因是在对各个宏块分别进行量化，这样导致在相邻宏块的交界处，因量化步长不同而导致原本很接近的像素值重构后产生了较大的差异，形成明显的块边界。去块效应滤波就是在4 x 4 的块边界上滤波，使块边界趋于平滑。 ( 2 ) 、可变块大小技术块的大小对运动估计效果有重要影响。将宏块分割成不同尺寸的运动补偿子块称作树状结构运动补偿。分割方式分为宏块和子宏块两种，每种又分为4 种不同的分割( 如图2 7 所示) ，小的分块可以使运动估计更加精确，从而产生较小的运动残差，降低码率。在h 2 6 4 建议的不同大小的块选择中，一个宏块最多可以携带1 6 个不同的运动矢量。配合多帧运动估计，同一宏块中的不同块又可以使用不同的参考帧来进行预测。第二章基于h 2 6 4 1 a v c 的视频编码原理图2 7 运动补偿的宏块分割 ( 3 ) 、多帧运动估计与以前视频压缩标准中使用单帧运动估计技术不同的是，h 2 6 4 使用了多帧运动估计技术，该技术具有更高的效率，更强的差错稳健性。多帧运动估计是指使用一个或多个参考帧对运动矢量进行估计，这可以防止因某个帧出现差错而影响到后面帧的运动估计估计效果。不足之处是，这种多帧估计需要更大的内存和更高的运算复杂度。 ( 4 ) q l ；像素精度的运动估计 h 2 6 3 采用了半像素精度运动估计，而h 2 6 4 中将运动估计精度提高到1 4 像素，并且把1 8 像素作为可选项。与半像素精度的运动估计一样，亚像素精度的运动估计使用内插的方法得到半像素和1 4 像素位置的点。 2 4 3 整数d c t 变换 h 2 6 4 标准中对残差宏块的基本变换使用了4 4 的整数d c t 变换技术，这种变换的对象是经过运动补偿预测或者帧内预测后的包含残差数据的4 4 像素块。这种变换是基于d c t 变换，但又与之不同。由于d c t 变换是实数，量化时需对系数进行四舍五入，这就影响了运算的精度。同时，传统的d c t 存在不匹配问题，产生参考帧的偏移现象，直接影响到重建图像的质量。h 2 6 4 标准中整数d c t 变换的所有操作都使用了整数算法，变换的核心部分主要是加法和移位。在整个变换和量化的过程中，只执行1 6 b i t 的整数算法和一次乘法操作。h 2 6 4 整数变换的公式为： y = ( c x c 7 ) 圆e = 1 2基于h 2 6 4 a v c 运动估计算法研究卅 j ，口2 嘭 a b 6 2 ，。_ 己，4 a 2 嘭 a b ，。_ z -b ，2 凸| ：式( 2 2 ) 其中，x 为输入，c 为变换矩阵，y 为输出，a = 1 2 ，6 = 历，表示相应位置的系数之间的乘积。因此可以把矩阵e 中的系数放入量化之中。相应的反变化公式如下t x = c ( 】，圆瓯，) c 7 = 11 1 1 必一1 1 ，厶 1 一必一1 1 厶 1 1 1 一幢 4 x 4 亮度的d c 系数变换 1 一一1 l 1 一式( 2 - 3 ) 此变换仅用于1 6 x 1 6 的帧内编码块的亮度信号，每个4 x 4 的块首先进行整数变换，反变换公式为： x q d = x d 晌如l o 2 0 x d 3 0 y q d 0 0 y q d i o y q d 2 0 y q d 3 0 x d 娆 x d 1 2 2 2 3 2 0 3 1 3 x d 驺 x 0 3 3胪矿矿 l 1 一一 l2 o 之l，_ll 如如k 如如k 墨五墨。，。，。l1j 之o ，io o 2o 之。忽o o 。见 6 2 6 2 口6 口6 2 6 2 6 口口口口 6 2 6 2 口6 口6 书萨 3 3 3 3m 耽儿 2 2 2 2耽耽乃m 耽儿 1 1 一 i 1 一一 1 ll 1 1 一一叭 n 孔孔如如 1 1 一 i l 一一 1ll 1 1 一一 4 5 2 2 式il式 l l 一 l - 1 一一 1ll 1 1 一一 ” ” 胗胗胗胗场物物场竹 h n 胗胗胗胗 1 1 一 _ l 1 一一 11i 1 l 一一第二章基于h2 6 4 i a v c 的视颠编码原理经过反变换后的d c 系数分别插进各自的4 4 的块中，再进行4 x 4 的整数反变换。在帧内块中，大部分能量集中在d e 系数中，这部分变换的作片j 是用于去除 4 x 4 亮度d c 系数之间的相关性，进而提高压缩效率。 2 x 2 色度d c 系数变换每个宏块中都有两个8 8 的色度块，每个色度块又分为4 个4 x 4 的块。色度块经过变换之后，分离出两个2 x 2 的d c 系数块，和亮度一样再进行一次变换，讯变换表达式为： = 隐跏1 式( 2 6 ) 反变换的表达式为： = 隰跏i 柳，经过反变换后的d c 系数分别插入各自的4 x 4 的块中，在进行4 x 4 的整数反变换。与亮度的d c 系数变换一样，有效的去除相关，提高压缩效率。 h2 6 4 中的宏块大小为1 6 x 1 6 ，对其中每个4 x 4 大小的块进行上述4 x 4 的d c t 变换后，得到1 6 个4 x 4 的变换矩阵。为了进一步提高压缩效率，该建议允许把每个4 x 4 的变换矩阵中的直流分量d c ，单独取出组成一新的4 x 4 矩阵，对此矩阵进行h a r d a m a r d 变换。宏块的数据传送顺序如图28 所示。 i - 5 】61 7 一、一、心、 - r ti r t - r 1 3 q 1 8 1 9 y 2 i 2 2 h 、、l、i 一一r - 1 r _ 1 5 2 0 【2 l 2 32 4 “l?r 幽28 亮度和色度块的排序宏块内数掘的传送顺序如图28 所示。如果宏块采用1 6 x 1 6 帧内模式进行编码，标记i 1 的块最先传送，该块包含宏块的亮度块的d c 系数( 4 x 4 ) 。然后将0 到1 5 块的d c 系数设为零，再按顺序进行转换。块1 6 ，1 7 分别包含2 x 2 太小的亮度信弓g 和c r 的d c 系数。最后是亮度块的残差系数1 8 到2 5 ，其中块d c 系数置零。 i。_ p 二- 1 4基于h 2 6 4 a v c 运动估计算法研究 2 4 4 熵编码 h 2 6 4 建议的两种熵编码模式有两种：基于上下文的二进制算术编码c a b a c 和可变长编码v l c 。v l c 编码又包括基于上下文的自适应可变长编码c a v l c 。 c a b a c 方式利用了算术编码的方法，一个符号可以用少于l b i t 来表示。根据无误码假设条件下的试验所得的数据可知，在所有码率下，c a b a c 的性能都强于 c a v l c 。但是c a v l c 的抗误码性要强于c a b a c ，且运算的复杂度也远远低于 c a b a c 。因此，h 2 6 4 规定在b a s e l i n ep r o f i l e 中采用c a v l c ，而在m a i np r o f i l e 中则采用了c a b a c 进行熵编码。 h 2 6 4 还包含了很多新的设计思想，旨在增强算法的鲁棒性和灵活性，以可适应不同的网络环境【1 6 1 。 1 、参数集合结构：参数集合的设计为关键信息的鲁棒性和高效安全性提供了保障。在之前的标准中如果关键信息丢失了几个比特( 比如序列的头或图像的头信息) 可能严重影响解码过程，在h 2 6 4 中对这些关键信息用更为灵活的方法单独处理。 2 、n a l 单元语法结构：h 2 6 4 的每个语法结构都按逻辑数据打包，称为n a l 单元。与以前的视频标准强制系统使用特定的比特流接口不同，h 2 6 4 的n a l 单元语法结构允许根据特定的网络自定义合适的方法来传送视频内容。 3 、灵活的s l i c e 大小：与m p e g 2 中定义的固定的s l i c e 结构不同，h 2 6 4 中的s l i c e 大小与早些的m p e g 1 一样是非常灵活的。 4 、灵活的宏块顺序( f m o ) ：提出了一种将图像划分成被称为s l i c e 组的新方法， s l i c e 组中的每一个s l i c e 都可以作为一个单独的解码单位。有效利用了这一点，灵活的宏块顺序就可以显著增强数据丢失的鲁棒性。 5 、任意的s l i c e 顺序( a s o ) ：因为编码图像的每一个s l i c e 基本都可以与图像中的其他s l i c e 独立地进行解码，所以在h 2 6 4 的设计中，可以以任意顺序发送和接收图像中的s l i c e 。这种能力可以改善实时应用中端到端的延时，尤其是使用乱序发送的网络。 6 、冗余图像：为了增强抗数据丢失的鲁棒性，h 2 6 4 的设计中允许编码器发送图像某些区域的冗余表示，这样当基本表现部分在传输过程中丢失时，仍可以表现图像的某些区域。 7 、数据分割：在表现视频内容时，某些编码信息比别的信息更为重要或更有价值( 如运动矢量或其它预测信息) ，因此，h 2 6 4 允许每个s l i c e 的语法可以按语法元素的范畴被分为三个不同的部分进行传输。 8 、s p s i 同步图像转换：s p s i 帧是h 2 6 4 设计的两种新的图像类型，通过使用s p s i 帧就可以在解码端做到与其他解码器正在产生的视频流精确同步，而无需第二章基于h 2 6 4 a v c

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）基于h264avc运动估计算法研究.pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）基于h264avc运动估计算法研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档