（微电子学与固体电子学专业论文）基于h264的码率控制与错误隐藏算法研究.pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-12 格式：PDF 页数：124 大小：4.18MB 积分：0 举报 版权申诉

（微电子学与固体电子学专业论文）基于h264的码率控制与错误隐藏算法研究.pdf_第2页

（微电子学与固体电子学专业论文）基于h264的码率控制与错误隐藏算法研究.pdf_第3页

（微电子学与固体电子学专业论文）基于h264的码率控制与错误隐藏算法研究.pdf_第4页

（微电子学与固体电子学专业论文）基于h264的码率控制与错误隐藏算法研究.pdf_第5页

已阅读5页，还剩119页未读，继续免费阅读

（微电子学与固体电子学专业论文）基于h264的码率控制与错误隐藏算法研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要基于h 2 6 4 的码率控制与错误隐藏算法研究摘要随着视频压缩编码技术的发展和一系列国际标准的相继出台，数字视频在各领域得到广泛应用。特别是h 2 6 4 国际标准的提出，可以实现数字视频的更高压缩比、更好的图像质量和良好的网络适应性，使得数字视频从影像存储、数字电视等扩展到网络、无线视频应用。网络视频应用对视频传输、码率控制、差错控制与错误隐藏等技术提出了更高的要求。h 2 6 4 的许多新特点，如多宏块多参考帧运动估计、 r d o 优化等，为码率控制和错误隐藏带来新的挑战，同时高度的计算复杂性，使之难以实现实时应用要求。本论文基于h 2 6 4 标准，对其中的几个关键技术进行了深入研究，主要包括h 2 6 4 快速预测算法、码率控制、错误隐藏和算法优化以及d s p 实现。一、研究了h 2 6 4 的快速预测算法。针对h 2 6 4 的帧内预测特点，提出了一种基于纹理方向估计的快速帧内模式选择算法。针对h 2 6 4 的多模式帧间预测特点，提出了一种快速帧间模式选择算法。并进行了大量实验研究，能实现快速的帧内与帧间预测编码，为h 2 6 4 的实时应用提供了有力保证。二、研究了h 2 6 4 码率控制算法。针对t - g o l 2 码率控制算法的不足，提出一种基于图像直方图的改进算法。详细分析了影响码率的主要因素和h 2 6 4 的特点，提出了一种新的率失真模型，并基于此模型研究了一种更为精确、简单的码率控制算法，有效地提高了h 2 6 4 码率控制的性能。北京邮电大学博士学位论文三、研究了h 2 6 4 的错误隐藏算法。结合h 2 6 4 帧内编码特点，提出了一种用于帧内预测解码的基于边缘分析的错误隐藏算法。从像素域恢复预测残差的角度出发，研究了一种用于帧间预测解码的基于残差恢复的错误隐藏算法，实现更为准确的错误隐藏，有效地提高了图像的主客观质量。四、研究了基于p c 的算法优化技术和基于d s p 平台的嵌入式 h 2 6 4 编码器实现。基于p c 桌面系统，研究了基于i n t e ls s e 技术的 h 2 6 4 算法优化，使编码速度得到有效提高。基于t m s 3 2 0d m 6 4 2 处理器，通过详细的系统设计和算法优化，成功地实现了嵌入式h _ 2 6 4 视频编码器，以及基于c d m a 的无线网络传输，将有力地推动h 2 6 4 标准的应用与发展。关键词：视频编码，h 2 6 4 标准，码率控制，错误隐藏，d s p 实现 r e s e a r c ho nr a t ec o n t r o la n de r r o r c o n c e a l m e n ta l g o i u t h m s b a s e do nh 2 6 4 d e oc o d i n g s t a n d a r d a b s t r a c t 、i t hm ed e v e l o p m e mo fv i d e oc o d i n gt e c h n 0 1 0 9 ya n d l er e l e a s eo fa s e r i e so fi n t e m a t i o n a ls t a n d a r d s ，d i g i t a lv i d e oh a sb e e nf o u n daw i d er a n g o fa p p l i c a t i o n si nm a n y 矗e l d s e s p e c i a l l yw i t ht h ei n t e m a t i o n a ls t a n d a r d h 2 6 4 ，t 1 1 eb e t t e rp e r f o r m a n c ei nc o m p r e s s i o ne f ! f l c i e n c y ，i m a g eq u a l i t ya n d n e t w o r ka d 印t a b i l i t yc a j lb er e a l i z e d ，w h i c hm a k e sv i d e oe x t e n dt on e t w o r k a n dw i r e l e s s 协a n s m i s s i o n m o r er e q u i r e m e n t si nc o m p r e s s i o ne m c i e n c y r a t ec o n t r o l ，e rc o n t r o la i l dc o n c e a l m e n ta r ep r o p o s e df o rn e t w o r k a p p l i c a t i o n s m a l l yf e a t u r e si n c l u d e di nh 2 6 4 ，s u c ha sm u l t i m a c r o b l o c k a n dm u l t i r e f b r e n c e - f r a m em o t i o ne s t i m a t i o n ，e m p l o y i n gr a t e d i s t o r t i o n o p t i m u mt e c h n i q u ea n ds oo n ，h a v eb r i n gu pc h a l l e n g e sf o rr a t ec o n t r o l a n de r r o rc o n c e a l m e n t t h ec o m p u t a t i o n a lc o m p l e x i t yo f t h eh 2 6 4 e n c o d e rm a k e si td i 伍c u l tf o rp r a c t i c a l 印p l i c a t i o n ss u c ha sr e a lt i m ev i d e o c o m m u n i c a t i o n b a s e do nh 2 6 4 ， s e v e r a l k e yt e c h n 0 1 0 9 i e s d e c r i b e d h e r e i n a a e r ，a r ea 1 1 a l y z e d f i r s t l y ，f a s tp r e d i c t i o na l g o r i t h m sf o rh 2 6 4 a r ei n v e s t i g a t e d af a s t i n t r am o d ed e c i s i o n a l g o r i t h m b a s e do ne s t i m a t i o n i m a g e t e x t u r ei s p r o p o s e df o ri n t r ap r e d i c t i o n ，w h i l ea f a s ti n t e rm o d ed e c i s i o na l g o r i 她i s d e v e l o p e df o ri n t e rc o d i n g t 1 1 ee x p e r i m e n t a t i o n sh a v es h o w e dt h a tm e p r o p o s e da l g o r i t h m sc a nh n p r o v ei n t r aa n di n t e rp r e d i c t i o nc o d i n gs p e e d c o n s i d e r a b l y ，w h i c he n s u r ei t sp r a c t i c a l r e a l - t i m ei m p l e m e n t a t i o n i 北京邮电大学博士学位论文 s e c o n d l y ， a n i m p r o v e da l g o m 吼f o rj 乙g o l 2 r a t ec o n 们1i s p r o p o s e dw i t hi m a g eh i s t o g r 锄t h ef 犯t o r sm a ta f f e c tb i tr a t ea n dm e c h a r a c t e r i s t i co fh 2 6 4a r ea n a l y z e d 证d e t a i l an e wr a t ed i s t o r t i o nm o d e l i ss t u d i e d b a s e do nt h ea b o v em o d e l ，a na c c u r a t ea n ds i m p l er a t ec o n t r o l “g o r i t h m ，w h i c hc a ni m p r o v eh 1 2 6 4 ra _ t ec o r 虹o l p e r f o n n a n c e ， i s p r e s e n t e d t h i r d l y ，e r r o rc o n c e a l m e n ta 1 9 0 r i t h i n sa r es t u d i e d c o n s i d e r i n gi n 讹 c o d i n gf e a t u r e ，a ni n t r ae r r o rc o n c e a l m e n ta l g o r i t h mi sp r o p o s e d t b o b t a i nb e t t e rp e r f o n n a n c eo fe r r o rc o n c e a l m e n t ，w eh a v ei n v e s t i g a t e da i m e rc o n c e a l m e n tb a s e do nr e s i d u a le s t i m a t i o n 仔o mp i x e l d o m a i n ，廿l u s h 2 6 4e r r o rr e s i l i e n c ya n di m a g eq u a l i 哆a r ei m p r o v e dg r e a t l y f i n a l i y ，t h ep r a c t i c a lr e a l - t i m ei m p l e m e n t a t i o no fh 2 6 4e n c o d e ri s d i s c u s s e d f o rt h ed e s k t o pa p p l i c a t i o nb a s e do np c ，c o d ei so p t i m i z e db y i n t e ls s ei n s t m c t i o n sa n da c c o r d i n g l ym ep e r f o h n a l l c eo fe n c o d e ri s i m p r o v e d c o n s i d e r a b l y f o rt h e e m b e d d e ds y s t e mb a s e do n 锄m s 3 2 0 d m 6 4 2 ，t h es y s t e mo fh 1 2 6 4v i d e oe n c o d e ri sd e s i 鳃e da n dt 1 1 ec o d ei s o p t i m i z e db yd s pi n s t m c t i o n si nd e 诅i 1 i nt h ee n d ，a nh 2 6 4e n c o d e ri s r e a l - t i m e i n l p l e m e n t e d a l l d a p p l i e d i nc d m aw i r e l e s sn e t w o r k s t r a n s m i s s i o ns u c c e s s m l l y ，w h i c hc o n s e q u e n t l yw i l lh a s t e nh 2 6 4s 协n d a r d p o p u l a r i z a t i o n k e yw o r d s ：v i d e o c o d i n g ， h 2 6 4s t a l l d a r d ， r a t e c o n t r o l ， e r r o r c o n c e a l m e n t ，d s pb a s e di m p l e m e n t a t i o n 独创性( 或创新性) 声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除了文中特别加以标注和致谢中所罗列的内容以外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的浇明并表示了谢意。申请学位论文与资料若有不实之处本人签名：垃壶本人签名：燧应本人承担一切相关责任。日期：巡z 生鱼关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定，即：研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘，允许学位论文被查阅和借阅：学校可以公布学位论文的全部或部分内容，可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释：本学位论文属于保密在年解密后适用本授权书。非保密论文注释：本学位论文不属于保密范围，适用本授权书。本人签名导师签名日期：坦至2 垒! 生日期：趔z 盘塑第一章绪论 1 1引言第一章绪论视觉是人们获取信息的最为重要的途径，据统计，人们通过视觉获取的信息约占总信息量的7 0 【”。视频图像作为视觉信息的主要载体，与语音和文字信息相比，具有信息量大、直观生动和确切等特点，因而具有更为广泛的实用性和更高的使用效率，深刻地影响着人们的生活和工作方式。但是视频图像的数据量可以用海量来形容，对存储和传输都极为不利，已成为阻碍人们有效获取和使用视频信息的瓶颈之一。因此，解决数据压缩编码问题成为视频图像应用的关键闭。经过半个世纪的不懈努力，特别是自八十年代后期以来，视频图像压缩编码技术取得了令人瞩目的进展，已经逐步从过去学术研究的领域走上了标准化、产业化的道路，其应用已渗透到通信、多媒体、数字电视、视频监控等各个领域，并在这些领域中引起巨大的变化。近年来，随着多媒体、网络技术和微电子技术的飞速发展，视频、图像、计算机视觉和计算机网络技术日益融合，遍及国民经济和社会生活的各个方面。研究开发以视频图像为主的业务已成为当前信息领域的前沿领域和热门课题p j 。同时，视频，图像编码技术在各个领域应用的不断深化，以及互联网与多媒体技术的不断发展又反过来扩大了人们的应用需求，无线多媒体通信、多媒体电子邮件、交互式多媒体、远程医疗、电子商务等应用成为了人们关注的下一轮焦点。从技术角度看，低码率视频压缩是实现这些应用的关键，而这些应用又对视频传输、差错控制、码率控制、错误隐藏、功耗以及基于内容的互操作性等方面的研究提出了更高的要求【4 j 。同时，为了解决视频传输时所出现的问题，低码率编码、多描述编码、容错性编码和可扩展编码等也成为了近来视频编码的研究热点。本论文基于视频编码国际标准h 2 6 4 ，研究了视频编码中的几个关键问题，主要包括h 2 6 4 快速算法、码率控制、错误隐藏、算法优化与d s p 实现，从而有力地促进了h ，2 6 4 的应用与推广。北京邮电大学博士学位论文 1 2视频编码的研究背景视频压缩编码是解决视频图像海量数据最为重要的关键技术，经过五十多年的深入研究与应用，已经形成了一套比较系统、成熟的视频编码技术，并相继推出了一系列国际标准【5 o 本节简要回顾视频编码技术的发展和研究，详细综述国际视频编码标准的发展，并简单地介绍h 2 6 4 标准及其特点。 1 2 1视频编码技术的发展视频图像信息虽然具有巨大的数据量，但这些数据间存在高度的相关性，如一幅图像内邻近像素之间的相关性( 空间相关性) ，电视图像前后帧之间的相关性 ( 时间相关性) 等。视频压缩编码本质上就是要尽量剔除原始信号中的各种冗余信息。总结起来，视频信号中存在的冗余包括空间冗余、时间冗余和信息熵冗余。因为信息熵冗余和空间、时间冗余都取决于视频数据的统计特性，所以都被统称为统计冗余【”。除此之外，视频图像中还包括如下几种冗余信息：结构冗余和视觉冗余，它包括人眼特性及纹理结构等性质带来的冗余，人眼能允许一定的失真：知识冗余，指图像中包含的信息与某些先验的知识有关，比如包含有人脸的视频图像中，头、眼、鼻和嘴等之间的相互位景信息就是一些常识；视觉冗余：很多业务中，由于重建视频信号的最终接收者是人眼，充分利用人眼视觉特性，可以达到提高压缩比的目的，这是因为人类视觉系统( h v s ：h u m a l lv i s u a ls y s t e m ) 并非完美无缺。编码方案可以恰当利用人类视觉系统的一些缺点，得到更高的压缩比。视频信息中存在的数据冗余正是视频编码的物理基础 “，视频图像压缩编码就是充分利用本身固有的统计特性和人的视觉系统特性来减少信息的冗余度并获得满意的主观质量。自从1 9 4 8 年s h a l l n o n 提出了率失真理论【7 j 和o l i v e r 等提出了波形信号的脉冲编码调制( p c m ：p u l s ec o d em o d u l a t i o n ) 理谢g j 以来，相继建立了比较成熟的预测编码 9 】、熵编码【1 0 川和变换编码理论【1 2 邯】，为后来的混合编码框架建立奠定了基础【l “。这些经典理论对视频编码有着极其重要的指导意义，一方面给出了视频编码的理论极限，另一方面指明了视频编码实现的技术途径 i 弘1 6 1 。到2 0 世纪8 0 年代中期，人们提出了集成预测编码、变换编码和熵编码几种技术于一体的视频图形混合编码系统”j 。文献 1 9 】和文献 2 0 对这一时期的视频图像编码研究作了较详细的综述，主要总结了变换编码、预测编码、量化器设计和运动估计等研究的进展。到8 0 年后期，基于经典信息论的视频图像编码理论已第一章绪论经基本完善，真正意义上的混合编码系统已初步建立起来。图1 1 给出了混合编码系统的基本组成。在编码器中，首先用信源模型的参数描述数字化的视频序列，通过分析过程完成视频信号的预测、变换编码；接着变换参数被量化成有限的符号集，其中量化参数取决于比特率与失真间所期望的折中；最后用无损熵编码技术把参数映射成二进制码字，进一步利用量化参数的统计特性压缩码字。产生的比特流在信道上传输。解码器反向进行编码器的二进制熵编码和量化过程，重新得到信源模型的量化参数，然后经反变换、预测合成算法重构解码的视频帧【3 】。；i 丢二一磊磊一一三i i 一一j ! 竺一一图1 1 视频编码系统以上编码技术都是以s h 锄o n 经典率失真理论为基础，从信号处理理论出发，利用信号处理和信息论作为工具的编码技术，人们称之为波形编码，也叫第一代编码技术。 2 0 世纪8 0 年代中后期，人们提出利用知识模型、空间结构模型以及人眼视觉特性的模型编码思想，也称之为第二代视频图像编码【2 。它不再局限于信息论基础，而是充分利用人眼的生理和心理特性以及信源的各种性质，获得高压缩比，主要包括子带编码、模型基编码、小波编码和分形编码 2 2 - 26 1 。此外，人们还提出基于内容的编码，如文献 27 提出了基于物体的编码方法，文献f 2 8 】通过研究大量低比特编码技术，发现通过建立物体模型的方法能够更好的适应视频内容。此类编码还在继续发展中，尚未形成完善的编码体系，离实用化还需要段时间，但它代表了未来视频压缩编码的发展方向【6 】。北京邮电大学博士学位论文 1 2 2 视频编码标准的发展视频，图像编码的方法多种多样，其应用涉及方方面面，为了使不同厂商生产的终端能互相交换信息，或从一个公共的信号源接收信息，2 0 世纪8 0 年代末期，一些国际组织开始致力于视频图像编码的标准化工作。同时，各太厂商对此产生浓厚的兴趣，并直接推动了视频图像编码标准化的研究进程。最终于1 9 8 8 年国际电话与电报顾问委员会( c c i t t ，i n t e m a t i o n a lt e l e p h o n ea i l dt e l e g r 印hc o n s l l l t a t i v e c o m m i t t e e ，于19 9 2 年更名为i t u t ，i n t c m a t i o n a lt e l e c o m m u i l i c a t i o nu n i o n t c l e c o m m u n i c a t i o ns t a l l d a r d i z a t i o ns e c t o r ) 制定第一个视频编码标准_ h 2 6 1 ，从而成为视频编码史上的里程碑。随后i s om p e g ( m o v i n gp i c t u r ee x p e r t sg r o u p ) 和i t u tv c e g ( d e oc o d i n ge x p e r t sg m u p ) 根据不同应用环境和需求进行整合，以h 2 6 l 为基础和核心，相继制定了一系列视频编码标准。i t u t 专注于实时视频通信应用领域，发布了h 2 6 x 系列标准( 如h 2 6 1 、h 2 6 2 、h 2 6 3 和h 2 6 4 等) ， i s 0m p e g 则主要面向视频存储媒体、电视广播和多媒体通信应用，制定了m p e g x 系列标准( 如m p e g 1 、m p e g 2 和m p e g 4 等) 。图1 2 所示为视频编码标准的发展历程【2 9 】，下面简要介绍国际视频编码标准的发展过程。臣竺ll ：i 匕：l 竺型 m p e g 7 im p e g 标准 m p e g 1 i m p e g - 4p a r t 2m p e g 2 i l 州4i y s 5i ，坭i y ，bz u i j t iz 小h 图1 2 国际标准发展历程 1 9 8 5 年c c i t t 组织了第1 5 专家组，进一步研究会议电视的标准化，并于1 9 8 8 年制定了针对6 4 k b i 佻电视电话会议应用的h 2 6 1 标准【3 0 】。在h 2 6 1 标准中定义了帧内( i 帧，i n 仃a 劬m e ) 编码和帧间( p 帧，p r e d i c t i v e 疔跏e ) 编码，并采用帧间预测、d c t 变换、h 仰陆a 1 1 编码等技术。为了增强灵活性，h 2 6 1 仅对与兼容性有关的码流语法、码流复用、解码过程等作了严格的限制性规定，而对诸如量化级的自适应控制、运动估计、码率控制等对重构图像质量指标有重要影响但不影响兼容性的部分不作限制性规定，给开发者、厂商和用户提供了很大的活动空间。 h - 2 6 1 标准的成功推出，各大厂商、国际标准组织和科研院所等受到极大鼓舞，掀起了视频压缩编码的研究和应用高潮。 1 9 9 1 年i s om p e g 开始制定m p e g l 标准p ”，主要目标是要建立一个适用于第一章绪论数字存储、媒体存储和检索的活动图像，相关声音及其组合编码的标准，并于1 9 9 3 年1 1 月成为国际标准。m p e o 1 标准以h 2 6 1 为基本框架，引入了双向预测帧( b 帧，b i d i r e c t i o n a l 口r e d i c t i o n 舳m e ) 、半像素精度运动估计，以及图像组( g o p ， g r o u do f p i c t u r e ) 的概念，实行了随机读取、快速进退搜索和反阿重放等功能。随后i s om p e 0 联合i t u tv c e g 启动了m p e g 2 草案的制定【3 2 ( 在i t u t 标准系列中又称为h 2 6 2 例) ，并于1 9 9 4 年确定成为标准。m p e g 2 以m p e g 1 为基础，作了重要扩展。针对隔行扫描的常规电视图像专门设置了“按帧编码”和“按场编码”方法；创立了二元码流结构：节目流( p r o g r a ms t r e 锄) 和传送流( t r a n s p o r t s t r e a m ) ，传送流的运行环境有可能出现严重的差错，而节目流的运行环境则很少出现差错；按照编码技术的复杂度，首次引入了档次( p r o f i l e ) 和级别( l e v e i ) 的概念，巧妙地解决了比特流的可交换性和国际性。此外，还增加了可分级性( s c a l a b i l i t y ) 概念，允许从一个编码数据流中得到不同质量等级或不同时空分辨率的视频信号，可分级性包括空间域、信噪比、时间域等。m p e g 2 是一个非常成功的标准，已经广泛融入到了人们的生活和工作中。随着网络技术的发展和普及，网络带宽日益成为阻碍人们应用视频图像的一个瓶颈。为了缓解这个问题，i t u t v c e g 于1 9 9 5 年提出针对低码率应用的h 2 6 3 编码标准p 。它以 l 2 6 l 为基础，并吸引了m p e g i 2 等建议中有效合理的技术，同时提供了四种可选的编码算法，即无约束运动矢量算法、基于语法的算法编码、高级预测法和p b 帧算法，进一步提高编码效率。此外，h 2 6 3 扩展了图像格式，支持包括q c i f 、s u b q c i f 、c i f 、4 c i f 和1 6 c i f 等多种格式的图像。此外，标准中没有限定每秒中帧数，因此可以通过减少每秒帧数来限制最大速率。在h 2 6 3 标准的基础上，i t u tv c e g 提出了两个工作计划：一个是所谓短期( s h o nt e m ) 计划，即在h 2 6 3 基础上添加一些新的功能选项，进一步提高压缩效率和扩展一些功能，同时开始一个所谓的长期( l o n gt e n n ) 计划以发展一个适应于低码率视频通信的新国际标准。在短期计划中，相继推出h 2 6 3 + 和h 2 6 3 - i 斗【3 6 】新版本。长期计划预计生成的标准称之为h 2 6 3 l 但在19 9 8 年改名为h f 2 6 l 【3 7 l 。 1 9 9 8 年i s om p e g 又提出了m p e g - 4 标准p “，它综合了数字电视、交互式图形学和i n t e m e t 等领域的技术和功能，在h 2 6 3 、m p e g 1 和m p e g 2 基础上进一步进行扩展和补充。m p e g - 4 的编码码率揽括了从低至5 k b i 洮到高于2 m b i 以的一个很大的范围，提出了与以往图像编码标准完全不同的编码概念，它吸取了基于对象的编码方法的思想，它的编码方案建立在任意形状的对象模型之上，在对图像的描述上，比传统编码标准增加了形状信息。m p e g 4 不再是一个标准化的固定算法，而是建立一个可扩展的编码工具集，由工具集构造各种算法。在不作解码的情况下，它支持基于内容的处理和码流的编辑，支持人工图像声音与自然图像北京邮电大学博士学位论文声音的合成，支持基于内容的随机存取等等，同时在不同应用环境下都具有较好的鲁棒性，支持基于内容的可分级编码【3 9 】。与此同时，i s om p e g 还制定了 m p e g 7 和m p e g 2 l 【4 1 1 等标准，为各类多媒体信息提供一种标准化的描述，以及一种高效、透明和可互操作的媒体框架。为了进一步提高视频编码效率，2 0 0 1 年1 2 月i s o 与i t u t 正式成立联合视频小组( j o i n tv i d e ot e 蛐，j v t ) ，开始致力于 l 2 6 4 m 口e g 4p a nl o ( a v c ， a d v a i l c e dv i d e oc o d i i l g ) 的标准化( 本论文中统一简称为h 2 6 4 ) ，于2 0 0 3 年5 月正式确定为国际标准【4 2 。它以h 2 6 l 为基础，扩展了从低码率到高码率的应用。 h 2 6 4 除继承以往标准的优点外，还引入了许多新技术，从而使得在相同解码质量条件下，编码效率比 l 2 6 3 和m p e g 一4 高近5 0 【4 3 】。在本章的后面及论文第二章将详细介绍h 2 6 4 标准及其核心技术，同时本论文将基于此标准，对其中的几个关键技术进行研究。此外，值得关注的是我国信息产业部于2 0 0 2 年6 月开始制定拥有自主知识产权的音视频编码标准( 简称a v s ，a u d i o v i d e oc o d i n gs t a l l ( h r d ) i 州。a v s 的目标是制订数字音视频的编解码、处理和表示等共性技术标准，为数字音视频设备与系统提供高效经济的编解码技术，主要针对h d t v 、h d d v d 、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用。 1 2 3h 2 6 4 标准简介与以往视频编码标准相同，h 2 6 4 系统也采用m c - d c t 结构，即运动补偿加变换编码的混合( h y b r i d ) 结构，其编码技术框架如图1 - 3 所示。h 2 6 4 编码主要由帧内预测、帧间预测( 运动估计与补偿) 、整数变换、量化和熵编码等构成【4 3 1 。图1 3h 2 6 4 编码框架第一章绪论 h 2 6 4 采用帧内( i n t r a ) 和帧间( i n t e r ) 两种编码模式。支持的视频源格式包括( y u v ) 4 ：2 ：0 、4 ：2 ：2 和4 ：4 ：4 ，同时支持逐行扫描和隔行扫描的视频序列，对于隔行扫描的视频帧，h 2 6 4 支持将奇偶场独立编码，也支持将奇偶场一起编码的方式。对于i ( 帧内编码帧) 帧图像，采用帧内模式编码；对于p 帧( 前向预测帧) 和b 帧( 双向预测帧) 图像，则采用帧间模式编码，但在宏块层，也可以选择帧内模式编码。编码以互不重叠的宏块( m b ，m a c r o b 1 0 c k ) 为单位进行，宏块一般定义为1 6 1 6 个像素块。对于i 帧图像，首先进行帧内预测，然后对预测残差信号( 原始值与预测值之差) 进行整数变换和量化，再对量化系数进行变长编码或算术编码，生成压缩码流，同时经反变换、反量化等过程重构图像。以用作后续帧编码时的参考。对于p 帧图像，首先进行多模式多参考帧的高精度运动估计和帧内预测，并根据率失真优化( f o ，r a t e d i s t o r t i o no p t i m i z a t i o n ) 选择帧间、帧内编码模式和相应的分块模式，然后对残差信号进行变换、量化和熵编码，生成压缩码流同时经反变换、反量化重构图像。对于b 帧图像，与p 帧图像相似，首先采用双向预测技术进行多模式多参考帧的运动估计和帧内预测后对残差信号进行变换、量化和熵编码 s i 、s p 帧。并根据率失优化选择最佳编码模式，然生成压缩码流。此外，h 2 6 4 还定义了为了提高编码的网络适应能力，h 2 6 4 采用视频编码层( v c l ，v i d e oc o d i n g l a y e r ) 与网络抽象层( n a l ，n e 柳o r ka b s 锄c t i o nl a y e r ) 相分离的编码结构，如图 1 4 所示，v c l 完成对视频图像的高效压缩，n a l 负责以网络所要求的恰当的方式对数据进行打包和传送。 j 网络抽象层( n a l ) j l h 3 2 0 l m p 4 f f i m p e g - 2 i h 3 2 3 i p l 其他 l 图1 4h 2 6 4 分层设计 h - 2 6 4 实现了视频的更高压缩比、更好的图像质量和良好的网络适应性，因此， h 2 6 4 的应用场合相当广泛，包括可视电话( 固定或移动) 、实时视频会议系统、视频监控系统、因特网视频传输以及多媒体信息存储等。为了符合广泛应用的特点，h 2 6 4 只对比特流、语法元素和解码过程作了规定，没有对编码器做限制，使北京邮电大学博士学位论文得h 2 6 4 编码器的实现非常灵活。所以，h 2 6 4 能广泛应用于以下几个方面1 4 2 】： ( 1 ) 娱乐视频业务。主要是通过有线、卫星、d s l 和c a b l em o d e m 等媒介的数字广播，以及光、磁设备的数字存储节目等，具有高带宽( 1 8 m b 口s ) 和长延时等特点。 ( 2 ) 对话型业务。通过i s d n 、e t l e m e t 、l a n 、d s l 、无线和移动网络，以及上述混合网络上传输的对话型业务，如通过h 3 2 0 、h 3 2 3 、3 g p p 等的电路交换和包交换应用，具有低带宽( 5( 2 2 )

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（微电子学与固体电子学专业论文）基于h264的码率控制与错误隐藏算法研究.pdf

文档简介

温馨提示

最新文档

评论

（微电子学与固体电子学专业论文）基于h264的码率控制与错误隐藏算法研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档