(信号与信息处理专业论文)视频通信中错误检测和码率控制算法的研究.pdf_第1页
(信号与信息处理专业论文)视频通信中错误检测和码率控制算法的研究.pdf_第2页
(信号与信息处理专业论文)视频通信中错误检测和码率控制算法的研究.pdf_第3页
(信号与信息处理专业论文)视频通信中错误检测和码率控制算法的研究.pdf_第4页
(信号与信息处理专业论文)视频通信中错误检测和码率控制算法的研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(信号与信息处理专业论文)视频通信中错误检测和码率控制算法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 视频通信中错误检测和码率控制 算法的研究 作者简介:李汶隆,男,1 9 8 1 年9 月9 日出生,现为成都理工大学信息工程学 院硕士研究生,研究方向为信号与图像非线性处理。 摘要 在现代化的音像交流过程中,视频编码压缩方法及技术是提高音像信息传输 速度和保证音像信息传输质量的关键问题。本文在分析研究视频编码的基本理论 和国际上两大系列压缩标准的基础上,剖析了我国的音视频压缩标准a v s 的关键 技术和a v s 与国际视频压缩标准的差异,重点研究了视频压缩标准中错误检测和 码率控制技术,并针对传统的错误码流检测方法和码率控制技术中的不足,提出 了一种基于奇偶校验位的错误码流检测方法、一种改进的线形预测模型码率控制 算法和一种宏块层码率控制算法。它们的思想分别为: 1 基于奇偶校验位的错误码流检测方法。该方案首先在编码端对经过 ( z i a - z i a ) 扫描后的d c t 系数的最低有效位嵌入数字水印,然后在解码端,对这 些位置的交流系数进行检查,如果相应位置上的数不符合编码端嵌入规定,则可 判定该宏块在传输中出错。 通过在测试模型上验证,该方法能以牺牲较低p s n r 值为代价的情况下使错误 检测性能得到大幅度的提高,并且传输比特流中不会增加额外的开销而影响到传 输效率。 2 改进的线形预测模型。该方法综合考虑了前一帧相同位置基本单元、当前 帧前一基本单元与当前编码基本单元之间时间和空间相关性,对原线形预测模型 对基本单元复杂度( m a d ) 的预测精度进行了矫正。实验表明,矫正后的预测姒d 比原预测m a d 更加接近实际m a d ,能够有效的提高提高图像质量和减少码率偏移。 3 宏块层的码率控制算法。我们利用了现有的m a d 值表示出当前编码宏块的 复杂度,以自适应的调节量化参数。对复杂度高的宏块采用较小的q p 值,对复杂 度低的采用较大的q p 值,该算法弥补a v s 中码率控制算法在宏块层没有码率控制 策略的不足。 关键词:视频压缩;a v s ;错误检测;码率控制 成都理t :大学硕士学位论文 t h er e s e a r c ho fe r r o rd e t e c t i o na n dr a t ec o n t r o li n v i d e oc o m m u n i c a t i o n a u t h o rb r i e fi n t r o d u c t i o n :l iw e n l o n g , m a l e ,b o mo n9 ms e p1 9 8 1w h oi sag r a d u a t e d s t u d e n ti ni n f o r m a t i o ne n g i n e e r i n gc o l l e g eo fc h e n g d uu n i v e r s i t yo ft e c h n o l o g ya n d w h o s em a j o ri ss i g n a la n di m a g en o n l i n e a rp r o c e s s i n g a b s t r a c t i nm o d e ma u d i oa n dv i d e oe x c h a n g ep r o c e s s i n g , t h ek e yq u e s t i o no fe n h a n c i n g t h er a t eo ft r a n s m i t t i n gt h ea u d i oa n dv i d e oi n f o r m a t i o na n dg u a r a n t e e i n gt h e t r a n s m i s s i o nq u a l i t yo fa u d i oa n dv i d e ot r a n s m i s s i o nq u a l i t yi st h ec o m p r e s s i o n m e t h o d sa n dt h e t e c h n o l o g i e sw i t hw h i c ha u d i oa n dv i d e oa r ee n c o d e d a f t e r i n t r o d u c i n gt h eb a s i ct h e o r y o fv i d e oc o d i n g , t h ed e v e l o p m e n ta n dt e c h n i c a l c h a r a c t e r i s t i c so ft w os e r i e so fi n t e r n a t i o n a lv i d e oc o d i n g , w em a i n l yi n t r o d u c e c h i n a sf i r s ta u d i oa n dv i d e oc o d i n gs t a n d a r d ( a v s ) ,i t sk e yt e c h n o l o g i e sa n dt h e d i f f e r e n c e so fi n t e r n a la n di n t e r n a t i o n a lv i d e os t a n d a r d t h e nw ed i s c u s st h ee r r o r d e t e c t i o na n dt h er a t ec o n t r 0 1 a i m i n ga tt h ed e f e c to ft h et r a d i t i o n a le r r o rd e t e c t i o n a n dt h er a t ec o n t r o l ,w ep r o p o s e da l le v e n o d dc h e c ke r r o rd e t e c t i o nm e t h o d 、a w e i g h t e dm o d e lf o rl i n e a rr e g r e s s i o nt os u b s t i t u t et h es t a n d a r dl i n e a rm o d e lo nb a s i c u n i tl a y e ra n dar a t ec o n t r o la l g o r i t h mo nm a c r o b l o c kl a y e r t h ee s s e n c eo ft h o s e p r o p o s e da l g o r i t h m si si n t r o d u c e da sf o l l o w s o n e a ne v e n o d dc h e c ke r r o rd e t e c t i o nm e t h o d :t h i sm e t h o df i r s tt oe m b e d w a t e r m a r ki nt h el e a s ts i g n i f i c a n tb i to ft h es c a n n e dd c tc o e f f i c i e n ti nt h ee n c o d e r t h e n , w ec h e c kt h i se x c h a n g e dc o e f f i c i e n to ft h i sp o s i t i o ni nt h ed e c o d e r i ft h e n u m b e ro ft h i sp o s i t i o nd o e sn o tc o n f o r mt ot h ee m b e d d i n gr u l e ,t h e nw ec a nj u d g e t h a tt h i sm a c k o b l o c ki st r a n s m i t t e dw r o n g l y t h r o u g hc o n f i r m e do nt h et e s tm o d e l ,t h i sm e t h o dc a ne n h a n c et h e e r r o r d e t e c t i o np e r f o r m a n c eg r e a t l ya st a k i n gt h es a c r i f i c eo ft h el o w e rp n s r ,a n dt h e t r a n s m i s s i o ne f f i c i e n c yw i l ln o tb ea f f e c t e de v e ni fw ei n c r e a s et h ee x t r ae x p e n s e si n t h et r a n s m i t t e db i t s t r e a m 1 1 摘要 t w o a ni m p r o v e dl i n e a rf o r e c a s tm o d e l :t h i sm e t h o dh a sc o n s i d e r e dt h et i m e a n dt h es p a t i a lr e l e v a n c eo ft h eb a s i cu n i ti nt h es a m ep o s i t i o no ft h ep r e c e d i n gf r a m e , t h ep r e c e d i n gb a s i cu n i ti nt h ec u r r e n tf r a m ea n dt h ec u r r e n tb e i n gc o d e db a s i cu n i t t h ee x p e r i m e n ti n d i c a t e dt h a tt h er e c t i f i e dm a di sm o r ec l o s et ot h ea c t u a lm a d c o m p a r e dt ot h eo r i g i n a lm e t h o da n dt h i sp r o p o s e da l g o r i t h mc o u l di m p r o v et h e q u a l i t ya n dd e d u c et h er a t es h i f t t h r e e a nr a t ec o n t r o la l g o r i t h mo nm a c r o b l o c kl a y e r :w ee x p l o i tm a dt o m e a s u r et h ec o m p l e x i t yo fc u r r e n tm a c r o b l o c ka n dt h i sc o u l da u t o - a d a p t a t i v e l ya d j u s t t h eo po ft h ec u r r e n tm a c r o b l o c k w eu s et h es m a l l e rq pt 0q u a n t i f yt h em o r e c o m p l i c a t e dm a c r o b l o c ka n du s et h eb i g g e rq pt oq u a n t i f yt h el e s sc o m p l i c a t e d m a c r o b l o c k t h ep r o p o s e da l g o r i t h mc a ni m p r o v et h ea v ss t a n d a r da l g o r i t h mb ya r a t ec o n t r o la l g o r i t h mo nm a c r o b l o c kl a y e r k e y w o r d s :v i d e oc o m p r e s s i n g ;a v s ;e l l - o rd e t e c t i o n ;r a t ec o n t r o l 1 1 1 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得盛都堡王太堂或其他教 育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者导师签名: 学位论文作者签名: 各媾 矽7 年纳3 石日 学位论文版权使用授权书 本学位论文作者完全了解盛都理王盍堂有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授权盛都理王盔堂可以将学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名。毋 2 7 年妇 “日 第1 章绪论 第1 章绪论 近年来,随着因特网在全球范围的日益普及,移动通信的迅猛发展,网络传 输以及各种新兴多媒体业务的出现,如视频会议、可视电话、高清晰度电视、视 频点播、数字图书馆、远程医疗以及视频监控等,都向图像视频编码技术提出 了许多新的要求。而在当前的网络中,无论是传输清晰流畅的语音,还是播放细 致连贯的图像,都需要大量的网络带宽资源和稳定无差错的传输信道。由于成本 和技术的限制,仅靠互联网技术的发展已经不能适应这些网络通信业务对网络服 务质量日益增长的要求。因此,在不断开发新一代互联网技术的同时,人们不断 研究视频编码压缩技术,提出了一系列通行的压缩编码标准,以期在目前的互联 网环境上满足各种各样的新业务的网络要求。 1 1 视频压缩编码技术的综述 1 9 4 8 年,信息论之父香农第一次给出计算信息熵的数学表达式,人们在此 基础上对各种视频压缩编码技术进行了广泛的研究。近6 0 年的研究和发展,出 现了各种各样的视频压缩技术和方法。视频编码方法与所采用的信源模型有关, 如果采用“一幅图像由许多像素构成”的信源模型,其参数就是每个像素的亮 度和色度的幅度值,对这些参数进行编码的技术称为基于波形的编码;如果采 用一个分量有几个物体构成的信源模型,其参数为各个物体的形状、纹理和运 动,对这些参数进行压缩编码的技术称为基于内容的编码。 由此可见,根据采用的信源模型,视频编码可以分为两大类:基于波形的编 码和基于内容的编码。它们利用不同的压缩编码方法,得到相应的量化前的参数, 再对这些参数进行量化,用二进制码表示其星化值,最后,进行无损熵编码进一 步压缩码率,解码则为编码的逆过程。 1 1 1 基于波形的编码 如上所述,利用像素间的空间相关性和帧间的时间相关性,采用预测编码 和变换编码技术可大大减少视频信号的相关性,从而显著降低视频序列的码率, 实现压缩编码的目标。 为了减少编码的复杂性,使视频编码操作易于执行,采用混合编码方法时, 首先把一幅图像分成固定大小的块,例如块8 x 8 ( 即每块8 行,每行8 个像素) 、 块1 6 x1 6 ( 每块1 6 行,每行1 6 个像素) 等等,然后对块进行压缩编码处理。 成都理工大学硕十学位论文 1 1 2 基于内容的编码 而基于内容的编码先将视频帧分成对应于不同物体的区域,然后分别对其 进行编码。具体说来,即对不同物体的形状、运动和纹理进行编码。在最简单 情况,利用二维轮廓描述物体的形状;利用运动矢量描述其运动状态;而纹理 则用颜色的波形进行描述。当视频序列中的物体种类已知时,可采用基于知识 或者基于模型的编码。例如,对人的脸部,已开发了一些预定义的线框对脸的 特征进行编码,这种编码效率很高,只需少数比特就能描述其特征。当已知物 体的可能类型和行为( 如人脸诸如高兴、生气、悲伤等之类的表情) 时,可采 用语义编码。在这种情况下,只需要对描述物体行为的少量参数进行编码即可。 而且,由于物体本身可能的行为数目非常小,因而可获得非常高的编码效率。 基于内容的编码方法侧重于图像数据的视觉冗余、结构冗余和知识冗余, 可获得很高的压缩比。但是,由于技术的高复杂性而往往难于实际应用。基于 波形的编码方法虽然压缩比受到一定的限制,但在消除图像统计冗余信息方面 的性能很好,同时,更重要的是方法简单,易于实际应用。因此,目前基于块 的混合编码方法得到了更为广泛的应用。 1 2 视频压缩标准发展历程 1 9 8 4 年c c i t t 第1 5 研究组发布了数字基群电视会议编码标难h 1 2 0 建议,1 9 8 8 年c c i t t 通过了“p 6 4 k b i t ( p = l ,2 ,3 ,3 0 ) ”视像编码标准h 2 6 1 建议,被称为 视频压缩编码的一个里程碑。从此,i t u - t 、i s o 等公布的基于波形的一系列视频 编码标准的编码方法都是基于h 2 6 1 的混合编码方法。 1 9 8 6 年,i s o 和c c i t t 成立了联合图像专家组( j p e g ) ,研究连续色调静止图像 压缩算法国际标准,1 9 9 2 年7 月通过了j p e g 压缩标准。 1 9 8 8 年i s o i e c 信息技术联合委员会成立了活动图像专家组( m p e g ) ,并于 1 9 9 1 年公布了m p e g - 1 视频编码标准,码率为1 5 m b i t s ,主要应用于家用v c d 的视 频压缩;1 9 9 4 年1 1 月公布了i p e g 一2 标准,用于数字视频广播( d v b ) 、家用d v d 的视 频压缩及高清晰度电视( h d t v ) 。码率从4 m b i t s 、1 5 m b i t s 直至l o o m b i t s 分别 用于不同档次和不同级别的视频压缩应用,图卜1 为视频标准发展历程。 2 第1 章绪论 图卜1 视频标准发展历程 1 2 1i t u - th 2 6 x 系列标准技术特点 ( 1 ) h 2 6 1 h 2 6 1 是最早出现的视频压缩标准,是第一个获得广泛应用的视频编码标 准。它的全称为“v i d e oc o d e sf o ra u d i o v i s u a ls e r v i c e sa tp 6 4 k b i t s ”。 目标是在i s d n ( i n t e g r a t e ds e r v i c e sd i g i t a ln e t w o r k ) 上以p x 6 4 k b p s = l 的 速率开展视频会议和视频电话业务,其中p 为0 到3 0 的整数。当p 小于6 时, 只能传输清晰度不太高的图像,可应用于电视电话;当p 大于6 时,可以传输 清晰度较好的图像,适用于电视会议等。 h 2 6 1 定义了一个完整的视频编码算法,采用了帧内图像编码、帧间误差 预测、运动补偿、x 、变长编码等技术,建立了取得巨大成功的基于块的混合 编码框架,为后来的肝e g 一1 、m p e g - 2 等视频压缩标准提供了基础。 ( 2 ) h 2 6 3 h 2 6 3 是国际电联i t u _ t 的一个标准草案,是为低码率通信而设计的,目 的是为了支持小于6 4 k b p s 而设计的,但实际上这个标准可用在很宽的码率范 围,而非只用于低码率应用,在h 2 6 1 的建议的基础上,h 2 6 3 进行了重要的 改进,以提高性能和纠错能力。比如采用了半像素精度的运动矢量搜索,增加 了非限制运动矢量,提出了基于语法的算术编码、先进预测模式和p b 帧编码 等多个高级选项,从而达到了进一步降低码率和提高编码的视频质量。因此它 在许多应用中可以认为被用于取代h 2 6 1 、h 2 6 3 + 和h 2 6 3 + + 扩充了h 2 6 3 编码 的可选项,适用的范围更大了。它同时支持s q c i f 等多种图像格式。h 2 6 3 在 增加编码效率的同时提高了抗误码豹差错隐藏功能,将信道传输性能问题在信 源编码中加以综合考虑。 3 成都理i :大学硕士学位论文 ( 3 ) h 2 6 4 a v c ( h 2 6 4 m p e g 一4p a r t1 0a v c ) h 2 6 4 a v c 是i t u t 和i s o i e c 共同成立的联合视频组j v t ( j o i n tv i d e o t e a m ) 共同制定的新标准。j v t 于1 9 9 8 年2 月正式开始征集协议提案,1 9 9 9 年 8 月完成了第一版草案和相应的测试模型,2 0 0 1 年1 2 月在j v t 的第一次会议上 形成了h 2 6 4 a v c 标准的第二版标准草案( w o r kd r a f tt w o ) ,并推出了相应的 测试模型j m 一1 ( j u s t i f i e dm o d e ln u m b e r1 ) ,2 0 0 2 年7 月的j v t 第四次会议 推出了h 2 6 4 a v c 的会员草案版本( c o m m i t t e ed r a f t ) ,并推出了相应的测试 模型j m - 4 ,在2 0 0 3 年3 月召开的最后一次全体会议上,给出了最后的草案和 测试模型,并且在国际上正式颁布。 在整个框架上,h 2 6 4 和以前的标准并没有什么差别,都包含预测、变换、 量化和熵编码等功能模块,只不过在功能单元模块的处理细节上,h 2 6 4 做了 重要的改变。在运动估计的时候可以采用大小不同的块( 1 6 x 1 6 、1 6 x 8 ,8 x 1 6 、 8 x 8 、8 x 4 、4 8 、4 x 4 ) :采用了四分之一、八分之一的像素精度的运动估计; 多块模式的帧间预测;o c t 变换采用整数d c t 变换;熵编码采用基于上下文自 适应的可变长编码( c a v l c ) 或者基于上下文的自适应二进制算术熵编码 ( c a b a c ) 。 h 2 6 4 着重于解决压缩的高效率和传输的高可靠性,因而其应用面什么广 泛,具体来说,它可以支持三个不同档次的应用:基本档次( b a s e l i n ep r o f i l e ) 、 扩展档次( e x t e n d e dp r o f i l e ) 、主要档次( m a i np r o f i l e ) 。每种档次侧重于不 同的应用场合,各自的编码方式也不一样。在保证相同的质量前提下,h 2 6 4 的压缩效率至少比h 2 6 1 、h 2 6 3 、m p e g 系列标准高一倍。 1 2 2u p e g 系列标准技术特点 ( 1 ) m p e g l m p e g - 1 标准是在1 9 9 1 年1 1 月由运动图像专家组( m p e g ) 制定的,视频编 码部分的基本算法与h 2 6 1 与h 2 6 3 相似,也采用运动补偿的帧问预测、二维 o c t 、v l c 游程编码等措施。此外,还引入了帧内帧、预测帧、双向预测帧和直 流帧等概念,这些改进进一步提高了编码效率,同时定义了编码算法中个工具 层的语法结构,使视频的可操作性很灵活。m p e g l 的目的是为了提供与普通家 用录像带相同质量的视频内容,提供与家用录像机相似功能的消费视频v c d 的 编码标准。它主要分三个部分m p e g 一1 视频、m p e g 一1 音频和m p e g 一1 系统。视频 采用了检验块的运动补偿、d c t 变换和量化编码的混合方法,达到大约在 1 2 m b i t s 的视频压缩率。 ( 2 ) m p e g 一2 4 第1 章绪论 i s o i e c 和i t u - t 两大视频标准化组织于1 9 9 2 年联合提出的m p e g - 2 ,是现 有的最成功的国际视频压缩标准。m p e g - 2 标准包括系统、视频、音频及符合性 ( 检验和测试视音频及系统码流) 4 个文件,主要针对数字视频广播d v b ( d i g i t a lv i d e ob r o a d c a s t ) 、高清电视h d t v ( h i g hd i g i t a lt e l e v i s i o n ) 和数字光盘d v d ( d i g i t a lv i d e od i s c a r d ) 等4 m - 9 m 比特每秒运动图像的编码。 它是在m p e g - i 标准基础上进一步扩展和改进,要求与m p e g - 1 系统向下兼容, 采用的核心技术还是分块的d c t 变换和帧间运动补偿技术。m p e g 一2 可用于逐行 扫描或者隔行扫描图像,并相应的对运动补偿和d c t 方法进行扩展,从而显著 的提高了压缩率。它还定义了不同的“档次”( p r o f i l e ) 和“级别”( 1 e v e l ) , 可满足不同图像分辨率及相应的存储成本和处理速度的需要。 ( 3 ) m p e g - 4 m p e g 一4 于1 9 9 9 年初正式成为国际标准,与m p e g 一1 2 相比,m p e g 一4 更注重 多媒体系统的交互性和灵活性,主要应用于可视电话、视频会议等,主要包括 音视频对象编码工具集和编码对象句法语言两个部分,。接收者可以下载用于表 示音视频信息的语法描述,并被v l s i 技术支持。 与其他标准相比,m p e g 一4 引入了视听对象a v o ( a u d i ov i s u a lo b j e c t ) 的 概念,这种编码模式能有效提高视频通信的交互能力和编码效率。m p e g 一4 还采 用了诸如形状编码和自适应d c t 技术以支持任意形状视频对象的编码,以及基 于内容的可分级性操作。其自然视频编码的基本框架和h 2 6 3 标准是接近的, 但是于“基于对象的编码”尚有技术障碍,在技术专利保护问题上迟迟难以找 到有效的收费方式,因此该标准目前仍然没有得到普遍应用。 1 3 我国的音视频压缩标准( a v s ) 上个世纪8 0 年代以来,i s o i e c 和i t u t 分别制定了m p e g , h 2 6 x 两大系 列视频编码国际标准,这些视频编码标准追求的共同目标是在尽可能低的码率 下获得尽可能好的图像质量。 除了上述国际标准之外,中国也开始制定具有自主知识产权的音视频编码 标准。进入新世纪,以数字电视为龙头的数字音视频、通信和计算机产业一起, 构成了我国第一大产业一信息产业。在巨大的市场商机面前,数字电视设备生产 商,节目提供商等都期望在我国国民经济最大的发展机遇面前占得先机。新世 纪头1 0 年我国国民经济最大的发展机遇面前占得先机。然而他们又都面临着同 样棘手的问题:标准化是产业活动成功的前提,二十世纪9 0 年代以来,i t u t 和i s o 制定了一系列多媒体编码的标准和建议( m p e g 系列,h 2 6 x 系列等) ,这 些标准和建议的制定,极大地推动了多媒体技术的实用化和产业化,从而迎来 5 成都理i i 大学硕十学位论文 了多媒体通信和应用的黄金时期。我国从事多媒体产品开发和生产的企业感到 受制于入,d v d 专利费事件就是这方面的典型案例。可以说,在标准方面的欠 缺已经成为我国信息产业的一块“心病”。中国采用m p e g 一2 作为数字电视等技 术标准的后果可归结为: ( 1 )按照今后1 0 年国内销售4 亿台( 含数字电视、机顶盒、激光视盘) 设备计算,中国需向m p e g l a 缴纳l o 亿美元的专利费。 ( 2 )按照同等质量m p e g 一2 比我们a v s 占用带宽( 或存储量) 多1 4 倍计算,使用m p e g - 2 将浪费5 8 的信道和存储资源。 ( 3 )发展自己的芯片产业较难。 ( 4 )部分日本和欧美厂商将通过专利收费遏制中国的a v 产业发展,如 2 0 0 2 年的d v d 收费事件。 因为有d v d 专利费风波的前车之鉴,音视频编解码设备厂商都在呼唤具有 我国自主知识产权的音视频编解码技术标准。在此背景下,由信息产业部牵头 制定的我国自主开发的音视频编解码技术标准a v s 便应运而生。2 0 0 3 年11 月 底,中国国家信息产业部数字音视频编解码标准组正式发布a v s 标准草案。a v s 是一套适应面十分广阔的技术标准,目前a v s 已经可以实现的目标有:标清电 视( 3 m b p s ) 、高清电视( 8 m b p s ) 、高清d v d 。 和m p e g 一2 相比,a v s 也采用了帧自j 编码、帧内编码、量化、熵编码、视频 流格式、编码控制等技术,但与m p e g 一2 不同的是a v s 在帧间编码中采用了可变 块大小的运动补偿预测技术,在帧内编码中采用了多方向的空间预测技术,改 进的运动矢量预测编码,8 8 的整数变换及相应的策略,更加高效的熵编码器 和基于率失真的编码优化技术。 1 4 论文研究的主要内容 本文首先简要分析了视频压缩国际标准的发展历程,介绍了我国的音视频 压缩标准a v s ,并对其关键技术进行了介绍。然后研究了码流的错误检测方案, 并在传统的检测方案的基础上提出了一种奇偶校验位错误码流的检测方案。最 后对经典的码率控制方案进行了探讨,并深入分析了a v s 所采用的码率控制方 案,根据其在基本单元层“”复杂度预测上存在的不足和在宏块层没有实现码率 控制的缺点,提出了改进的线形预测模型和宏块层码率控制方案,并在其测试 模型r m 5 2 i 平台下加以实现。实验表明,提出方案比原始算法得出的重建图像 质量要好,码率偏移较小。 6 第1 章绪论 1 5 论文章节安排 第一章介绍了视频编码的基本方法、国际上两大系列视频压缩标准,介绍 了我国音视频压缩标准a v s 的发展历程。 第二章重点阐述了a v s 的编解码器结构和编码原理,对其关键技术进行了 介绍,并和国际标准进行了全方位的分析和比较。 第三章介绍了传统的错误检测方案,并根据码流特点提出了一种基于奇偶 校验位错误码流的检测方案,并进行了实验仿真。 第四章介绍了视频标准中码率控制的基本原理,并对经典的码率控制算法 进行了介绍,重点介绍了a v s 中的码率控制算法,在此基础上,提出了改进的 线形预测模型的加权算法和基于宏块复杂度的宏块层控制算法,并进行了实验 仿真。 7 成都理丁大学硕十学位论文 2 1 概述 第2 章视频编码标准a v s 本章主要介绍视频编码标准a v s ,首先介绍了a v s 的发展,然后介绍了实 现a v s 的关键技术,最后和m p e g 标准从主观和客观两个方面进行了对比。 2 2a v s 视频编码标准 a v s 视频压缩标准啪1 制定的目标是为了适应数字电视广播、数字存储媒体、 因特网流媒体、多媒体通信等应用中对运动图像压缩技术的需要而制定的。该 标准适用的范围包括但不限于下述领域:数字地面电视广播( d i g i t a l t e r r e s t r i a lt e l e v i s i o nb r o a d c a s t i n g ,d t t b ) 、有线电视( c a b l et v ,c a t v ) 、 交互存储媒体、直播卫星视频业务( d i r e c tb r o a d c a s ts a t e l l i r ev i d e o s e r v i c e s ,d b s ) 、宽带视频业务、多媒体邮件、分组网络的多媒体业务 ( m u l t i m e d i as e r v i c e so np a c k e tn e t w o r k s ,m s p n ) 、实时通信业务( 视频会 议,可视电话等) ,远程视频监控。 它的编码基本框架如图2 - 1 所示,解码框架如图2 2 所示,主要模块为运 动估计、运动补偿、变换、量化、反量化、反变换、熵编码。编码器分为前向 和重建两个过程。前向的过程经过预测、变换、量化、熵编码将视频信息处理 成压缩后的码流,得到的码流可以进行存储也可以用于传输。重建过程的目的 是从量化后的信息经反量化、反变换,生成前一帧或前几帧的重构图像,作为 前向过程中运动补偿的参考帧。也就是说编码器中包括了一个模拟解码器,它 包括的解码器中除了熵解码外大部分模块。当一帧的所有宏块重构之后,用环 路滤波模块去除当前解码图像的块效应,此时得到的图像将与解码端解出的图 像完全一致。 a v s 视频目前定义了一个档次( p r o f i l e ) 即基准档次。该基准档次又分为 6 个级别( 1 e v e l ) ,分别对应高清晰度、标准清晰度与c i f ( 1 4 标清,相当于v h s 或v c d 质量) 应用。与h 2 6 4 的b a s e l i n ep r o f i l e 相比,a v s 视频增加了b 帧、 i n t e r l a c e 等技术,因此其压缩效率明显提高,而与m p e g 一4a r c h 2 6 4 的m a i n p r o f i l e 相比,又减少了c a b a c 等实现难度大的技术,从而增强了可实现性。 第2 章视频编码标准a v s 图2 - 1a v $ 编码器框架 2 3a v s 的关键技术 2 3 1 变换、量化 图2 - 2a v s 解码器框架 a v s 的8 x 8 变换与量化可以在1 6 位处理器上无失真地实现,从而克服了 h 2 6 4 之前所有视频压缩编码国际标准中采用的8 8d c t 变换存在失真的固有 问题。而h 2 6 4 所采用的4 4 整数变换在高分辨率的视频图像上的去相关性能 不及8 x 8 的变换有效。a v s 采用了6 4 级量化,可以完全适应不同的应用和业 务对码率和质量的要求。在解决了1 6 位实现的问题后,目前a v s 所采用的8 8 变换与量化方案,既适合于1 6 位d s p 或其他软件方式的快速实现,也适合于 a s i c 的优化实现。 9 成都理1 :大学硕十学位论文 2 3 2 帧内预测 a v s 的帧内预测技术沿袭了h 2 6 4 帧内预测的思路,用相邻块的像素预测当 前块,采用代表空间域纹理方向的多种预测模式。但a v s 亮度和色度帧内预测 都是以8 x 8 块为单位的。亮度块采用5 种预测模式如图2 3 所示,具体的实现 5 种方式如表2 - 1 所示,色度块采用4 种预测模式,而这4 种模式中又有3 种 和亮度块的预测模式相同,具体的实现5 种方式如表2 2 所示。在编码质量相 当的前提下,a v s 采用较少的预测模式,使方案更加简洁、实现的复杂度大为 降低。 r _ 图2 - 38 x 8 亮度块帧内预测模式 表2 _ 18 x 8 亮度块帧内预测模式 帧内预测模式 名称 0垂直8 x 8 颅测 1 水f 8 x 8 预测 2 d c 预测 3 左下对角颅铡 4右下对角预测 第2 章视频编码标准a y $ 表2 - 28 8 亮度块帧内预测模式 色度块预测模式 名称 0d c 顶测 l水甲预测 2垂直预测 3平面预测 2 3 3 多模式帧间预测 一般地,运动的视频图像中相邻两帧之问具有很强的相关性,采用运动 估计技术进行帧间编码,用来去除帧间图像时问上的冗余度以提高视频编码压 缩性能。帧问运动补偿编码是混合编码技术框架中最重要的部分之一。如图2 - 4 所示,a v s 标准采用了1 6 1 6 、1 6 8 、8 1 6 和8 8 的块模式进行运动补偿, 而去除了h 2 6 4 标准中的8 4 、4 8 、4 4 的块模式,目的是能更好地刻画物 体运动,提高运动搜索的准确性。实验表明,对于高分辨率视频,a v s 选用的 块模式已经能足够精细地表达物体的运动。较少的块模式,能降低运动矢量和 块模式传输的开销,从而提高压缩效率、降低编解码实现的复杂度。 1 6 x 1 6 1 6 x 88 x 1 6s x 8 口日田田 图2 - 4 v s 中宏块的划分 a v s 的b 帧的双向预测使用了直接模式( d i r e c tm o d e ) 、对称模式( s y m m e t r i c m o d e ) 和跳过模式( s k i pm o d e ) 。使用对称模式时,码流只需要传送前向运动矢 量,后向运动矢量可由前向运动矢量导出,从而节省后向运动矢量的编码开销。 对于直接模式,当前块的前、后向运动矢量都是由后向参考图像相应位置块的 运动矢量导出,无需传输运动矢量,因此也可以节省运动矢量的编码开销。跳 过模式的运动矢量的导出方法和直接模式的相同,跳过模式编码的块其运动补 偿的残差也均为零,即该模式下宏块只需要传输模式信号,而不需要传输运动 矢量、补偿残差等附加信息。 2 3 4 分数像素运动补偿 a v s 和h 2 6 4 都采用了1 4 像素精度的运动补偿技术。h 2 6 4 采用6 抽头滤 波器进行半像素插值并采用双线性滤波器进行i 4 像素插值。而a v s 采用了不 同的4 抽头滤波器进行半像素插值和1 4 像素插值,图2 5 和图2 - 6 分别给出 成都理t 大学硕七学位论文 了参考图像亮度块和色度块的整数样本、二分之一样本和四分之一样本的位置。 在图2 5 中用大写字母标记的为整数样本位置,用小写字母标记的为二分之一 和四分之一样本位置。1 4 像素的获得分为两步:第一步是由多个整数点像素 采样值经过线性滤波器输出得到部分1 2 像素精度的差值,再用已得到的1 2 像素继续通过相同的线性滤波器得到余下的1 2 像素值;第二步是用1 2 像素 值进行双线性差值得到1 4 像素值。在不降低性能的情况下减少插值所需要的 参考像素点,减小了数据存取带宽需求,这在高分辨率视频压缩应用中是非常 有意义的。 o 2 3 5 参考帧 图2 - 5 整数样本、二分之一样本和四分之一样本的位置 图2 - 6 八分之一色度插值 在传统的视频编码标准( m p e g - x 系列与h 2 6 x 系列) 中,双向预测帧b 帧 第2 章视频编码标准a v s 都只有一个前向参考帧与一个后向参考帧,而前向预测帧p 帧则只有一个前向 参考帧。而新近的h 2 6 4 充分地利用图片之间的时域相关性,允许p 帧和b 帧 有多个参考帧,最多可以有3 1 个参考帧。多帧参考技术在提高压缩效率的同时 也将极大地增加存储空间与数据存取的开销。a v s 中p 帧可以利用至多2 帧的 前向参考帧,而b 帧采用前后各一个参考帧,p 帧与b 帧( 包括后向参考帧) 的参考帧数相同,其参考帧存储空间与数据存取的开销并不比传统视频编码的 标准大,而恰恰充分利用了必须预留的资源。 2 3 6 熵编码 a v s 熵编码采用自适应变长编码技术,在a v s 熵编码过程中,所有的语法 元素和残差数据都是以指数哥伦布码的形式映射成二进制比特流。采用指数哥 伦布码的优势在于:一方面,它的硬件复杂度比较低,可以根据闭合公式解析 码字,无需查表;另一方面,它可以根据编码元素的概率分布灵活地确定以k 阶指数哥伦布码编码,如果k 选得恰当,则编码效率可以逼近信息熵。 预测残差块的变换系数经扫描形成( 1 e v e l 、r u n ) 对串,l e v e l 、r u n 不是 独立事件,而存在着很强的相关性,在a v s 中l e v e l 、r u n 采用二维联合编码, 并根据当前l e v e l 、r t l n 的不同概率分布趋势,自适应改变指数哥伦布码的阶数。 2 3 7 环路滤波 环路滤波是用于消除预测引起的方块效应的。对于宏块,滤波器用来消除 相邻宏块之间由于预测类型不同引起的边界噪声。对于块,滤波器被用来消除 相邻块之间由于变换和量化以及运动矢量差别引起的边界噪声。环路滤波器用 一个非线性的滤波器对边界两旁的像素进行修改,当边界有块失真的可能性较 大时,滤波的参数也相应的增强。滤波时根据两个相邻块的类型判断是否存在 块效应,确定滤波器参数,进行滤波,如果相邻块用的是同一参考帧,同样的 运动矢量,则认为无明显的块失真。环路滤波器在编码时用在宏块的重建和存 储之前,反变换之后,在解码时用在重建之后,其主要用处有两个:一是平滑 块边界,提高解码后图像的视觉效果;二是滤波后的宏块可用于编码中后续图 像的运动补偿。a v s 采用的滤波算法和h 2 6 4 比起来计算简单,但是由于完全 没考虑块的块与块之自j 模式、残差之问的差异,所以滤波效果不及h 2 6 4 。图 2 7 为标清图像z y _ 7 2 0 x 5 7 6 的第1 8 2 个宏块滤波前后数据对比图,可以看出, 滤波后8 x 8 块的边界得到了平滑。 1 8 1 :o 2 3 2 3 成都理i :人学硕十学位论文 2 32 2 2 3z 3 2 32 4 2 42 3 1 8 1 :l 2 52 4 2 5z 5 z 5z 6z 42 3 2 3z 32 5 2 52 52 72 52 4 1 8 1 :2 1 8 1 :0 1 8 1 :l 2 3 2 3 2 3 2 3 2 4z 3 2 42 3 z 4z 4 2 42 4 2 42 4 2 42 3 2 4 z 5 2 4 2 52 42 5 2 s 2 s 2 6z 4 2 3 2 32 3z 5z 52 5 2 72 s2 4 1 8 1 :2 2 92 92 7 2 82 8 2 92 92 82 82 82 82 8 2 7 2 7 2 72 8 1 8 l :3 2 62 62

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论