（通信与信息系统专业论文）avs视频编码中整数变换与运动估计研究.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-10 格式：PDF 页数：66 大小：10.49MB 积分：0 举报 版权申诉

（通信与信息系统专业论文）avs视频编码中整数变换与运动估计研究.pdf_第2页

（通信与信息系统专业论文）avs视频编码中整数变换与运动估计研究.pdf_第3页

（通信与信息系统专业论文）avs视频编码中整数变换与运动估计研究.pdf_第4页

（通信与信息系统专业论文）avs视频编码中整数变换与运动估计研究.pdf_第5页

已阅读5页，还剩61页未读，继续免费阅读

（通信与信息系统专业论文）avs视频编码中整数变换与运动估计研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

江苏大学硕士研究生毕业论文摘要 2 0 0 6 年2 月底，a v s ( a u d i ov i d e oc o d i n gs t a n d a r d ) 视频正式被批准为国家标准，该标准的建立对我国数字音视频产业的发展具有重要意义。尽管a v s 的产业化步伐在标准制订过程中已经开始，但是目前还正处在大规模产业化的启动期，真正的产业化还没有到来，对a v s 标准中关键技术的研究对a v s 产业化的发展具有重要的理论价值和现实意义。论文围绕a v s 视频编码标准，在深入分析a v s 视频编码原理和核心技术的基础上，重点研究了其中的整数变换全零块检测技术和运动估计技术。这两项技术对提高视频压缩的编解码效率都具有举足轻重的作用。论文主要做了以下三方面工作： ( 1 ) 介绍了视频标准的发展，分析了a v s 视频编码标准的关键技术，并指出研究a v s 标准对我国音视频产业发展的重要意义； ( 2 ) 推导出了一种适合于a v s 标准的新全零块判别准则。尽管h 2 6 4 标准的全零系数块检测技术目前己经得到了深入的讨论，但是由于a v s 整数变换中使用了8x8 块和新的指数阶量化步长的量化器，以往适合于h 2 6 4 的全零块判别准则并不能直接应用于a v s ，本文根据a v s 整数变换的特点，推导出了一种适合于a v s 标准的新全零块判别准则。该准则在保证图像质量的同时尽量防止了漏判。 ( 3 ) 在剖析了现有运动估计典型算法的基础上，提出了一种可预测搜索起点的自适应的基于连续消除的正方形一菱形搜索算法似p r e d i c t i v ea d a p t i v e s q u a r e - d i a m o n ds e a r c ha l g o r i t h mu s i n gs u c c e s s i v ee l i m i n a t i o n ，p a - s e a - s d s ) 。根据序列图像中运动矢量的交叉中心偏置分布特性和矢量间的时空相关性，采用了正方形菱j 侈( s d s ) 搜索模版，设计了一种基于连续消除的正方形一菱形 ( s e a - s d s ) 搜索策略，并融合搜索起点预测和自适应搜索模式等技术，使得该算法在保证搜索精度的同时，大幅度减少了搜索的点数，提高了运动估计的速度。关键词：视频编码，a v s ，整数变换，全零块检测，运动估计江苏大学硕士研究生毕业论文 a b s t r a c t i nt h ee n do ff e b r u a r y2 0 0 6 ，a v s ( a u d i ov i d e oc o d i n gs t a n d a r d ) w a so f f i c i a l l ya p p r o v e d 弱an a t i o n a ls t a n d a r d ，w h i c hi so fg r e a t s i g n i f i c a n c ef o rc h i n a sd i g i t a la u d i oa n dv i d e oi n d u s t r yd e v e l o p m e n t a l t h o u g ht h ep a c eo fa v s i n d u s t r i a l i z a t i o nh a sa l r e a d yb e g u ns i n c et h e e n a c t i n g - s t a n d a r d ，s o f a ri t i si n s t a r t - u pp e r i o d o ft h e l a r g e - s c a l e i n d u s t r i a l i z a t i o n , t h er e a li n d u s t r i a l i z a t i o nh a v en o tc o m ey e t ，t h er e s e a r c h o nt h ek e yt e c h n i q u e so fa v ss t a n d a r dh a si m p o r t a n tt h e o r e t i c a lv a l u e a n dp r a c t i c a ls i g n i f i c a n c ef o rt h ed e v e l o p m e n to fa v si n d u s t r i a l i z a t i o n i nt h i sp a p e r ，a r o u n da v sv i d e oc o d i n gs t a n d a r d ，o nt h eb a s eo f i n - d e p t ha n a l y s i so fa v s v i d e oe n c o d i n gp r i n c i p l ea n dk e yt e c h n i q u e s ， t h e i n t e g r a lt r a n s f o r ma l l z e r ob l o c k sd e t e c t i o nt e c h n i q u ea n dm o t i o n e s t i m a t i o n t e c h n i q u e h a v e b e e nr e s e a r c h e di nd e t a i l t h e s et w o t e c h n i q u e sp l a yad e c i s i v er o l ef o ri m p r o v i n gv i d e oc o m p r e s s i o nc o d i n g e f f i c i e n c y t h em a i nc o n t e n t si nt h i sp a p e rc a nb es u m m a r i z e da st h ef o l l o w i n g ( 1 ) t h ed e v e l o p m e n to fv i d e os t a n d a r di si n t r o d u c e d ，t h e nt h ek e y t e c h n i q u e so fa v sv i d e oe n c o d i n gs t a n d a r da r ea n a l y z e d ，a n di t i s p o i n t e do u tt h a tt h er e s e a r c ho fa v ss t a n d a r di so fg r e a ts i g n i f i c a n c ef o r t h ed e v e l o p m e n to fc h i n a sa u d i oa n dv i d e oi n d u s t r i a l i z a t i o n 。江苏大学硕士研究生毕业论文 ( 2 ) an e w a l l - z e r ob l o c k sc r i t e r i aw h i c hi ss u i t a b l ef o ra v ss t a n d a r d i sd e d u c e d t h ea l l z e r ob l o c k sd e t e c t i o nt e c h n o l o g yi nh 2 6 4s t a n d a r d h a sb e e nd i s c u s s e di nd e p t h ，b u tt h eu s eo f8 x 8b l o c ki na v s i n t e g e r t r a n s f o r ma n dt h eu s eo fq u a n t i z e rw h i c ha d o p t e dt h en e we x p o n e n tr a n k q u a n t i t i z a t i o ns t e p ，t h ep a s ta l l - z e r ob l o c k sc r i t e r i as u i t a b l et oh 2 6 4c a n n o tb ed i r e c t l ya p p l i e dt oa v s a c c o r d i n gt ot h ef e a t u r e so fa v s i n t e g e r t r a n s f 0 1 t 1 1 。an e wa l l z e r ob l o c k sc r i t e r i as u i t a b l ef o rt h e 斟sh a sb e e n d e d u c e d i th a sab e t t e ri m a g eq u a l i t y ，a n d p r e v e n t e sm i s s - j u d g m e n t l a r g e l y ( 3 ) o n t h eb a s i so ft h ea n a l y s i so fe x i s t i n gt y p i c a lm o t i o ne s t i m a t i o n a l g o r i t h m s ，ap r e d i c t i v ea d a p t i v es q u a r e d i a m o n ds e a r c ha l g o r i t h mu s i n g s u c c e s s i v e e l i m i n a t i o n ( p a s e a s d s ) i sp r o p o s e d b a s e d o nt h e c r o s s - c e n t e r - b i a s e dm o t i o nv e c t o rd i s t r i b u t i o nc h a r a c t e r i s t i co ft h ei m a g e s e q u e n c e sa n dh i g hs p a c e - t i m ec o r r e l a t i o no fa d j a c e n tb l o c k s m o t i o n v e c t o r s ，s q u a r e - d i a m o n ds e a r c h ( s d s ) p a t t e r ni sa d o p t e da n di t i s d e s i g n e dt h a ts q u a r e d i a m o n ds e a r c hs t r a t e g yb a s e do ns u c c e s s i v e e l i m i n a t i o n , w i t hs u c he f f e c t i v et e c h n i q u e sa sp r e d i c t i o no fi n i t i a ls e a r c h p o i n ta n da d a p t i v es e a r c hm o d e s e x p e r i m e n t ss h o wt h a tt h i sa l g o r i t h m h a sab e t t e rs e a r c hp r e c i s i o n ，a n d l a r g e l yr e d u c e ss e a r c hp o i n t sa n d i m p r o v e st h es p e e do fm o t i o ne s t i m a t i o n k e yw o r d s ：v i d e o e n c o d i n g ，a v s ，i n t e g e rt r a n s f o r m ，a l l - z e r ob l o c k s d e t e c t i o n ，m o t i o ne s t i m a t i o n i i i 学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规二同意学校保留并向国家有关部门或机构送交论文的复印件和电子片允许论文被查阅和借阅。本人授权江苏大学可以将本学位论文的兰内容或部分内容编入有关数据库进行检索，可以采用影印、缩印至描等复制手段保存和汇编本学位论文。本学位论文属于保密口，在年解密后适用本授权书。不保密d 。学位论文作者签名：售、莲蓬 2 d 四年脏月艮日指导教师签名：i 之台妖吐 1 年月1 ；日独创性声明本人郑重声明：所呈交的学位论文，是本人在导师的指导下，独立进行研究工作所取得的成果。除文中已注明引用的内容以外，本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体，均己在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名：焦蓬董日期：厶习年p 月j 队日江苏大学硕士研究生毕业论文第一章绪论视频传输的数据量非常大，单纯用扩大存储器容量、增加通信干线的传输速率的办法是不现实的，数据压缩技术是个行之有效的解决办法。其原理就是采用一系列的变换减少视频中的冗余信息，在一定的需求和应用条件下，用最少量的数据来获得最好质量的视频图像。为了拥有自主的知识产权，2 0 0 2 年6 月，信息产业部批准成立“数字音视频编解码技术标准工作组( a v s 工作组 ) ，并于 2 0 0 6 年3 月公布了a v s 视频部分标准【l 】。对a v s 视频标准中关键技术的研究具有重要的理论价值和广泛的应用前景。 1 1 论文研究背景与意义视频图像数据通常都具有两个特征 2 1 ：数据量庞大、数据中存在大量的冗余信息，前一个特征决定了在当前带宽资源有限的情况下，存储、传输之前进行压缩的必要性，后一个特征表明视频数据压缩的可行性。为了规范各种压缩编码方法、增强不同厂家设备间的互通，进入9 0 年代以后，国际标准化组织( i s o ) 和国际电信联盟( r r t o 先后制定了多个视频编码的标准，如用于静止图像的压缩编码标准的j p e g 和j p e g 2 0 0 0 ，用于视频会议和可视电话的h 2 6 1 、h 2 6 3 、h 2 6 4 ，用于视频存储和传输的m p e g 1 、m p e g 2 、 m p e g - 4 标准等。然而，这些标准的核心技术几乎都掌握在国外某些大公司手中，其背后高昂的专利授权费是国内音视频相关产业滞后的一个重要原因。音视频编解码技术标准的落后导致的更为严重的后果是我们的数字产业的发展要受制于人。虽然我国在1 9 9 6 年就开始参与m p e g 标准的制定，但起步较晚。因此为了扭转专利受制于人的不利局面，也为了满足我国快速发展的数字视频相关产业的发展需求，制定拥有自主知识产权的视频编解码标准，是我国经济发展的大势所趋。在这种情况下，a v s ( a u d i ov i d e oc o d i n gs t a n d a r d ) 视频标准应运而生。2 0 0 2 年6 月，信息产业部批准成立数字音视频编解码技术标准工作组( a v s 工作组) ”， 2 0 0 4 年1 2 月2 9 日，全国信息技术标准化技术委员会组织评审并通过了a v s 标准视频草案。2 0 0 5 年3 月3 0 日，信产部初审认可，标准草案视频部分进入公示江苏大学硕士研究生毕业论文期。2 0 0 6 年2 月底，a v s 视频正式被批准为国家标准，并于2 0 0 6 年3 月1 日起正式实施。 a v s 标准的推出是我国数字音视频领域发展史上的一个里程碑。据预测，数字音视频产业将在2 0 0 8 年超过通信产业，在2 0 1 0 年成为国民经济第一大产业。 a v s 作为数字音视频产业“牵一发动全身”的基础性标准，为我国构建“技术一专利一标准一芯片与软件一整机与系统制造一数字媒体运营与文化产业的产业链条提供了难得机遇。自2 0 0 2 年至今，虽然对a v s 的研究取得了一定的成果，但真正的产业化还没有到来，对a v s 标准中关键技术的研究还很值得我们去做。本文结合国内外研究的现状，重点研究了整数变换全零块判别技术和块运动估计技术。众所周知，h 2 6 4 标准的全零系数块判别技术目前己经得到了深入的讨论，可以参看文献 3 h 5 1 。尽管a v s 变换量化与h 7 6 4 变换量化在原理上相同，但是，a v s 整数变换中使用了8 x 8 整数变换和新的指数阶量化步长的量化器，以往适合于 h 2 6 4 的全零块判别准则并不能直接应用于a v s 标准。本文根据a v s 标准的特点，推导了一种新的适用于a v s 标准的全零块检测技术。第三章对此进行了深入讨论。运动估计算法在整个视频压缩中的比重是最大的，如在h 2 6 1 中采用三步法的情况下，运动估计占到了整个视频编码过程6 3 的计算量 6 1 ；而在h 2 6 3 编码器中，运动估计也占了4 2 的计算型7 1 。同样，运动估计模块在a v s 视频编码器中的地位也举足轻重，对运动估计算法的研究是多年来视频压缩编码的研究重点和热点。为此，人们提出了多种估计运动矢量的方法，在这些算法中，由于块匹配运动估计在计算处理和硬件实现上比较容易，因此引起人们极大的关注，并被许多视频压缩编码标准所采用。菱形搜索d s ( d i a m o n ds e a r c h ) 算法是目前块匹配算法中性能最优异的算法之一。1 9 9 9 年1 0 月，菱形法( d s ) 被m p e g - 4 国际标准采纳并收入验证模型。但是d s 算法仍然存在以下缺点【8 】，其一，对于运动大的序列，菱形法在搜索最佳点所在的区越时，广度搜索和梯度下降搜索同时进行，即同等地对待搜索区域的各部分，这造成较大的搜索冗余，影响了算法的搜索速度；其二，对于保持静止的图像序列，即运动矢量为零的情况，菱形法要经历由大模板( l d s p ) 至u d , 模板( s d s p ) 的变化过程，要对1 3 个搜索点进行搜索，而理想情况是只须搜索5 个点。因此，对d s 算法的改进也是层出不穷。其中正方形一菱形搜索算法s d s ( s q u a r c d i a m o n ds e a r c ha l g o r i t h m ) 法就是在d s 算法的基础上提出的一种新算法 9 1 。该算法对于视频序列能够很大程度上的减少计算的复杂度，并且得到的视频编码流和用全搜索得到的视频编码流在质量上没有太大降江苏大擘硕士研究生毕业论文低。但是，该算法对于有明显的全局运动和场景变更的非中心偏移视频序列进行运动估值时会产生很大的误差。本文根据序列图像中运动矢量的分布特性和时空相关性，采用了正方形一菱形( s d s ) 搜索模版，设计了一种基于连续消除的正方形菱形( s e a - s d s ) 搜索策略，并融合搜索起点预测和自适应搜索模式等技术，提出了一种可预测搜索起点的自适应的基于连续消除的正方形菱形搜索算法 ( ap r e d i c t i v ea d a p t i v es q u a r e - d i a m o n d s e a r c h a l g o r i t h mu s i n g s u c c e s s i v e e l i m i n a t i o n p a - s e a s d s ) 。实验表明该算法较f s 、t s s 、d s 、s d s 等经典算法进一步减少了运动搜索次数，并且图像质量接近f s 算法。论文第四章对现有典型运动估计算法进行了深入剖析，第五章对新算法进行了详细论述。 1 2 视频编码标准现状当前的视频领域有两大国际标准组织：一个是国际标准组织( i s o ) 和国际电子技术委员会( c ) 旗下的运动图像专家组口e 回，另一个组织是国际电信联盟的电信标准# 部0 t o d 的视频编码专家组v c e g 。两个标准组织制定的一系列视频标准的时间表1 0 1 可以参见图1 1 。i s o i e c 主要制定了m p e g 系列标准【1 1 1 ，包括m p e g 1 ，m p e g 2 ，m p e g - 4 等。n - u t 的视频压缩标准【1 2 】有h 2 6 1 、h 2 6 2 、 h 2 6 3 等。h 2 6 4 标准是r i u t 的v c e g ( 视频编码专家组、和i s o i e c 的 m p e g ( 运_ 动图像编码专家组) 的联合视频组开发的标准。i s o i e c 制定的 m p e g 系列标准，主要应用于视频存储( d v d ) 、广播电视、因特网或无线网上的流媒体等；r r u t 制定的h 2 6 l 系列标准主要应用于实时视频通信领域，如会议电视等。目前的主流标准是m p e g - 4 和h 2 6 4 。我国于2 0 0 6 年3 月推出了具有自主知识产权的a v s 视频标准。本节简要介绍了各系列标准的特点。蜃司丑圈三 ! 燮土型蔓；墨k 匿，互 j 丑。图1 1 国际标准和中国国家标准a v s 的制定时间进程表1 0 l 江苏大学硕士研究生毕业论文 1 2 1m p e g 系列标准 ( 1 ) m p e g - 1 【1 3 】 m p e g 1 是i s o c 开发的第一个视频压缩标准，它被广泛地应用于v c d 制作和一些视频片段的下载。其目标码率1 5 m b i t s ，支持c i f 格式的视频图像，不支持场图像，帧率在2 4 到3 0 h z 。m p e g 1 中按照图像组的机制( g o p ) 组织编码图像序列，方便随机读取。它定义了四种图像类型，i ，p ，b 和d 图像。对i 帧，m p e g 1 采用帧内编码模式，8 8 d c t 变换，对不同频率的变换系数可以依据人眼视觉特性设定不同的量化权重，提供默认的8 x 8 权重矩阵；对于p 帧，编码时要利用过去的i 帧或p 帧进行运动补偿预测，采用基于运动补偿的预测技术( d p c m ) ，采用半象素精度的运动补偿，双线性插值；对b 帧，编码时用过去或将来的i 帧或p 帧进行运动补偿预测；d 图像即直流图像，是仅由d c 直流分量构造的图像，可在低比特率的时候做浏览用，实际编码中很少使用。 ( 2 ) m p e g 2 、 m p e g 2 是1 9 9 4 年被推出的压缩标准，以实现栅音频服务与应用互操作的可能性。m p e g 2 标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定，编码码率从每秒3 兆比特到1 0 0 兆比特。和以前标准不同的是，m p e g 2 提供对隔行视频( 广泛的用于广播电视) 的支持，使得在广播电视领域有广阔的应用前景，被认定为s d t v 和h d t v 的编码标准。m p e g 2 中的隔行编码工具包含优化运动补偿的能力，即同时支持基于场和基于帧的预测，并且同时支持基于场和基于帧的d c t 和i o c r ( 反d c t 变换1 ，并且规定了几种与逐行扫描视频不同的预测模式。另外，m p e g 2 增加了分级视频编码工具，以支持多层视频编码，包括：时域分级、空域分级、信噪比分级以及数据分割。 m p e g 2 的编码图像被分为三类，分别是i 帧，p 帧和b 帧。其中p 帧和b 帧编码时充分利用了时空相关性。为了改进图像质量，m p e g 2 扩展了量化和编码方法。码流结构也采用分层次的数据结构，把码流分为图像序列、图像组、图像、片、宏块和块六层。 ( 3 ) m p e g - 4 1 5 1 m p e g - 4 标准是一个适合多种多媒体应用的视听对象编码标准，它定义了一种框架而不是具体的算法，使视频产品具备更大的灵活性和可扩展性。m p e g - 4 标准采用基于视频对象o ) 的编码理念，即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象，分别编码后，再经过复用传输到接收端， 4 江苏大学硕士研究生毕业论文然后再对不同的对象分别解码，从而组合成所需要的视频和音频。对各个视频对象独立地编码，使得以基于内容的交互成为可能，用户可以访问( 检索和浏览) 和操作( 剪贴、移动_ ) 一个场景中的各个视频对象。这是区别于以基于块的混合编码技术为构架的编码标准的重要特征。m p e g - 4 中同样存在i 帧，b 帧和p 帧三种帧格式，运动估计与补偿采用了半象素搜索技术和重叠运动补偿技术。为了使运动估计和补偿算法能适应任意形状的视频对象面( v o p ) ，m p e g - 4 引入了图像填充技术和多边形匹配技术。图像填充技术主要利用v o p 内的象素值来外推 v o p 外象素值，以此获得运动预测的参考值；多边形匹配技术则是将v o p 的边缘宏块的活动部分包含在多边形之内，以此增强运动估值的有效性。m p e g - 4 还采用了诸如形状编码和自适应d c t 技术以支持任意形状视频对象的编码，以及基于内容的可分级性操作。 1 2 2h 2 6 l 系列标准 ( 1 ) h 2 6 1 【1 6 】 h 2 6 1 标准发布于1 9 9 0 年，是最早出现的视频编码标准，目的是规范综合业务数字网i s d n ( i n t e g r a t e x ls e r v i c ed i g i t a ln e t w o r k ) 上的会议电视和可视电话应用中的视频编码技术。它是第一个成功用于实际的数字视频标准。h 2 6 1 支持 c i f ( 3 5 2 2 8 8 ) 及q c i f ( 1 7 6 x1 4 4 ) 分辨率，7 5 到3 0 h z 的帧率，图像采样格式为 4 ：2 ：0 。它采用整数精度的运动补偿，运动矢量的范围在1 6 到1 6 之间，对水平和垂直块边缘采用 1 4 ，1 2 ，1 4 1 拘自适应滤波器。由于可视电话需要同步且实时地进行编解码，因此h 2 6 1 的算法复杂度设计得较低。它采用结合了可减少时间冗余的帧间运动补偿预测和能减少空间冗余的d c t 变换的混合编码模式，成为后来各种视频编码标准的基础。由于主要用于对延迟比较敏感的双向视频传输，因此h 2 6 1 仅允许采用帧内预测图像( i 帧) 与前向预测图像( p 帧) ，而不允许使用双向预测图像( b 帧) 。h 2 6 1 在实时编码时比m p e g 所占用的c p u 运算量少得多，但与m p e g 不兼容。 ( 2 ) h 2 6 3 1 刀 h 2 6 3 是于1 9 9 6 年制定的应用在模拟用户电话线上传输可视电话的国际标准。h 2 6 3 标准也是基于h 2 6 1 编码框架的，其信源编码器仍然采用可减少时间冗余的帧间运动补偿预测和能减少空间冗余的d c t 变换的混合编码模式。除去支持c i f 、q c 格式图像，还增加了另外三种：s u b q c ，4 c i f ，1 6 c i f ，从 5 江苏大学硕士研究生毕业论文而使h 2 6 3 有更广的应用范围。帧率通常低于1 0 h z ，p s t n 上的典型应用是 2 0 k b p s 。h 2 6 3 支持双向预测模式，并使运动估计的搜索精度提高到半象素，半象素通过双线性内插计算得到；其次利用邻近三个宏块的中值运动向量作为对当前宏块的运动矢量的预测，能够减少块效应，提高主观质量。它采用3 d 变长编码( v a r i a b l el e n g t hc o d e ，v l c ) 技术来提高d c t 系数编码的效率将块结束指示符与每个行程一幅值对结合在一起，主要用于低比特率编码。 ( 3 ) h 2 6 4 1 硼 h 2 6 4 是由i s o i e c 与兀- u t 组成的联合视频组m 制定的新一代视频压缩编码标准。h 2 6 4 的应用场合相当广泛，包括可视电视( 固定或移动) 、实时视频会议系统、视频监控系统以及因特网视频传输，多媒体信息存储等，但是侧重应用于矩形视频的高效编码和传输。h 2 6 4 的主要优点如下：在相同的重建图像质量下，h 2 6 4 比h 2 6 3 + 和m p e g 4 减小5 0 码率。在技术上，h 2 6 4 标准中有多个闪光之处，如统一的v l c 符号编码，1 4 精度、多模式的位移估计，基于4 x 4 块的整数变换、分层的编码语法等，这些措施使得h 2 6 4 算法具有很高的编码效率。h 2 6 4 舱v c 标准中采用面向网络传输的结构和语法，增强了标准的网络适应能力，能够很好地适应口和无线网络的应用。并且提供了较强的抗误码特性，适用于丢包率高、干扰严重的无线信道视频传输。在编解码器中采用复杂度可分级设计，在图像质量和编码处理之间可分级，以适应不同复杂度的应用。 h 2 6 4 能工作在低延时模式以适应实时通信的应用，同时又能很好地工作在没有延时限制的应用场合。除了利用量化步长的改变来适应信道码率外，在h 2 6 4 中，还常利用数据分割的方法来应对信道码率的变化。 1 2 3 a v s a v s 是由我国自主制定的音视频编码技术标准，主要面向高清晰度电视、因特网流媒体、多媒体通信等应用中对运动图像压缩技术的需要而制定的【1 9 】。 a v s 标准以当前国际上最先进的h 2 6 4 a v c 框架为基础，强调自主知识产权，同时充分考虑了硬件实现上的复杂度。其编码效率比m p e g 2 高近一倍，在相同质量的前提下码率大约只有m p e g 一2 的1 3 到1 2 。该标准采用了一系列技术来达到高效率的视频编码，包括帧内预测、帧间预测、变换和量化、1 4 精度象素插值、熵编码和环路滤波等。亮度和色度帧内预测都是以8 x 8 块为单位，亮度块采用5 种预测模式，色度块采用4 种预测模式，且这4 种模式中又有3 种 6 江苏大学硕士研究生毕业论文和亮度块的预测模式相同。在编码质量相当的前提下，a v s 采用较少的预测模式，使方案更加简洁、实现的复杂度大为降低。在插值方面，a v s 采用了不同于h 2 6 4 的4 抽头滤波器进行半象素插值和1 4 象素插值，在不降低性能的情况下减少了插值所需要的参考象素点。a v s 还采用了1 6 x 1 6 ，1 6 8 ，8 1 6 和8 8 块模式进行运动补偿和基于8 8 块的整数变换与6 4 级量化，此外p 帧可以利用最多2 帧的前向参考帧，而b 帧采用前后各一个参考帧。 1 3 研究内容和主要创新点本文针对a v s 视频编码标准，在分析其关键技术的基础上，重点研究了整数变换全零块预先判决技术和运动估计技术。论文主要研究创新点包括以下几个方面： 1 、介绍了a v s 视频编码框架，分析了a v s 视频编码标准中的6 项核心技术，指出研究a v s 视频编码标准对我国音视频产业发展的重要意义； 2 、推导出了一种适合a v s 视频编码标准的新全零块预先判决算法。该算法在是在深入研究a v s 视频编码标准中整数变换、量化的原理基础上，针对a v s 视频编码标准与h 2 6 4 标准中整数变换、量化上的不同，推导出了一种适合a v s 视频编码标准的全零块预先判决算法。 3 、深入分析了现有运动估计典型算法，在此基础上，提出了一种可预测搜索起点的自适应的基于连续消除的正方形一菱形搜索算法( ap r e d i c t i v ea d a p t i v e s q u a r e - d i a m o n ds e a r c ha l g o r i t h mu s i n gs u c c e s s i v ee l i m i n a t i o n ，p a - s e a - s d s ) 。实验表明，该算法在保证搜索精度的同时，大幅度减少了搜索的点数，提高了运动估计的速度。 1 4 论文的结构本论文分为六章，具体安排如下：第一章介绍了课题的背景、研究意义；介绍了m p e g 、h 2 6 l 、a v s 三大视频标准体系的主要技术特点；介绍了本文的研究内容与主要创新点。第二章针对a v s 标准视频技术的基本编码框架，深入分析了包括帧内预测、帧间预测、整数变换和量化、熵编码、环路滤波等在内的a v s 关键技术，并比较这些技术和最新国际标准h 2 6 4 的异同，以突出a v s 的技术特点。 7 江苏大学硕士研究生毕业论文第三章在详细介绍8 8 d c t 整数变换原理的基础上，推导出了一种适合 a v s 视频编码标准整数变换零块预先判别算法。第四章介绍了运动估计的原理，运动估计的技术，同时对典型运动估计算法进行了较详细的分析。为第五章运动估计算法改进提供了理论基础。第五章根据序列图像中运动矢量的分布特性和时空相关性，采用了正方形一菱形( s d s ) 搜索模版，设计了一种基于连续消除的正方形一菱形( s e a - s d s ) 搜索策略，并融合搜索起点预测和自适应搜索模式等技术，提出了一种可预测搜索起点的自适应的基于连续消除的正方形一菱形搜索算法( p a - s e a - s d s ) 。并给出了算法实验结果与实验分析。第六章总结全文，根据自己的研究成果和体会，分析研究中还存在的不足，展望下一步工作的重点。 8 江苏大学硕士研究生毕业论文第二章a v s 视频编码标准 a v s 一共有9 个部分，包括系统、视频、音频、数字版权保护，另外包括文件的格式，标准的一致性，参考软件等等。本章针对a v s 视频编码标准，首先介绍了a v s 的编码框架，接着介绍了a v s 的关键技术，最后比较了a v s 与h 2 6 4 的性能。 2 1a v s 视频编码框架 a v s 视频与m p e g 标准都采用混合编码框架，包括变换、量化、熵编码、帧内预测、帧间预测、环路滤波等技术模块，这是当前主流的技术路线。其视频编码器结构口0 1 如图2 1 所示。图2 1a v s 视频编码器框图视频序列由序列头开始，后面跟着一个或多个编码图像，每帧图像之前应有图像头。序列头可在比特流中重复出现，称为重复序列头。使用重复序列头的主要目的是支持对视频序列的随机访问。序列头后的第一个编码图像应是i 帧。一幅图像是一帧，其编码数据由图像起始码开始，到序列起始码、序列结束码或下一个图像起始码结束【2 1 1 。 a v s 视频标准定义了i 帧、p 帧和b 帧三种不同类型的图像，i 帧中的宏块只进行帧内预测，p 帧和b 帧的宏块则需要进行帧内预测或帧间预测，图中s o 是预测模式选择开关。预测残差进行8 8 整数变换( i c r ) 和量化，然后对量化系数进行 z i g - z a g 扫描( 隔行编码块使用另一种扫描方式) ，得到一维排列的量化系数，最后对量化系数进行熵编码。 9 江苏大学硕士研究生毕业论文 2 2 a v s 关键技术 2 2 1 帧内预测帧内预测可以去除帧内块的空间冗余。a v s 视频标准采用空域内的多方向帧内预测技术。以往的编码标准多数是在频域内进行帧内预测，例如m p e g 2 。基于空域多方向的帧内预测提高了预测精度，从而提高了编码效率。a v s 的亮度和色度帧内预测都是以8 x 8 块为单位的。亮度块采用5 种预测模式，色度块采用 4 种预测模式，而这4 种模式中又有3 种和亮度块的预测模式相同，如表2 1 所示。在编码质量相当的前提下，a v s 采用较少的预测模式，使方案更加简洁、实现的复杂度大为降低，但性能与h 2 6 4 a v c 十分接近【2 2 】。除了预测块尺寸及模式种类的不同外，a v s 视频的帧内预测还对相邻象素进行了滤波处理来去除噪声。表2 1 帧内预测模式亮度块色度块模式名称模式名称 0i n t r a8 x 8v e r t i c a l0i n t r ac h r o m ad c 1i n t r a8 x 8h o r i z o n t a l1i n t r ac h r o m ah o r i z o n t a l 2i n t r a8 x 8d c2i n t r ac h r o m av e r t i c a l 3i n t r a8 x 8d o w nl e f t3i n t r ac h r o m ap l a n e 4 i n t r a 一8 x 8 一d o w n g h t 2 2 2 帧间预测 a v s 的运动估计包括1 6 1 6 ，1 6 8 ，8 1 6 和8 8 等4 种块模式，与 h 2 6 4 a v c 相比，舍去了8 4 ，4 x 8 和4 x 4 等子块模式。亮度和色度的运动矢量精度分别为1 4 和1 8 ，因此要得到非整象素预测值，需要进行插值运算。对于亮度样本，a v s 定义了2 个4 抽头f i r 滤波器f 1 ( - 1 ，5 ，5 ，1 ) 和f 2 ( 1 ，7 ，7 ，1 ) ， a v s 首先通过更简单的4 抽头滤波器( 1 ，5 ，5 ，1 ) 得到半象素点；再通过4 抽头滤波器( 1 ，7 ，7 ，1 ) 和均值滤波器得到1 4 象素点，图2 2 为a v s 标准的帧间预测参考帧的亮度图像1 2 、1 4 象素插值示意副2 3 1 。对于色度样本，采用双线性插值直接得到1 8 精度象素点。这样，滤波器的复杂度减小。在不降低性能的情况下也 1 0 江苏大学硕士研究生毕业论文减少插值所需要的参考象素点和数据存取带宽需求，这在高分辨率视频压缩应用中是非常有意义的。图固曰圈口圈囤圈田回国国圈曰圈固四圈口图2 2a v s l 2 、1 4 亮度差值 a v s 对预测得到的运动矢量采用差分编码，充分利用相邻块的运动相关性，通过上方和左边相邻块的运动矢量预测当前块的运动矢量，只编码传送预测值与实际值的差值。a v s 支持p 帧和b 帧两种帧间预测模式，p 帧至多采用2 个前向参考帧：b 帧可采用前后各一个参考帧。在b 帧的双向预测使用了直接模式 ( d i r e c tm o d e ) 、对称模式( s y m m e t r i cm o d e ) 和跳过模式( s k i pm o d e ) 。帧间预测当前编码块与其相邻8 8 块的位置关系如图2 3 所示，e 的大小可以是1 6 x 1 6 ，1 6 8 ，8 x 1 6 或者8 8 。a ，b ，d 都是与e 的左上角样本紧邻的块，c 是与e 的右上角样本紧邻的块。 2 2 3 变换和量化蚓。+ 肆嬲# 2 嚣簪搿；然l 然嚣麓籀瓣l 瓣z 鞫嬲鬻鞲绻；鹭鬻i鬻i 蒺滋戮霪i 婺蹇j 壤黪鎏粼鬻黼鬻糍荔慧- - - 荔茹瓢糍i 磁瑟罄黧麓髯象缓糍绛, 甥繁戮溪鬻爹簿镂i 鍪滋麓蕤蓥蓑二# 1 i ；毋强。矾图2 3 亮度块e 和相邻亮度块的空间位置关系整数变换具有复杂度低、完全匹配等优点，所以a v s 视频标准采用整数变换代替了传统的浮点d c t 变换。由于8 x 8 整数变换的去相关性更强，因此a v s 采用了8 x 8 整数变换取代了h 2 6 4 中的4 x 4 整数变换阱】。与其他标准的变换江苏大学硕士研究生毕业论文比较，a v s 标准中变换有其自身的优点，即由于变换矩阵每行的模比较接近，可以将变换矩阵的归一化在编码端完成，从而节省了解码反变换所需的缩放表，降低了解码器的复杂度。 a v s 标准中的量化与变换归一化相结合，同时可以通过乘法和移位来实现，量化参数每增加8 ，相应的量化步长扩大一倍，解码端反量化表不再与变换系数位置相关，有利于提高硬件实现的并行度。a v s 在做量化的时候亮度量化参数和色度量化参数的取值范围是0 到6 3 。量化系数的取值范围是2 到2 1 1 1 ，其量化表的设计同样使得量化能够满足大范围内精细的码率控制的要求。 2 2 4 熵编码在a v s 熵编码过程中，a v s 的所有语法元素的码字基于k 阶指数哥伦布码或定长码而构造。定长码用来编码具有均匀分布的语法元素，指数哥伦布码用来编码可变概率分布的语法元素。采用指数哥伦布码的优势在于1 2 5 】：一方面，它的硬件复杂度比较低，可以根据公式解析码字，无需查表；另一方面，它可以根据编码元素的概率分布灵活地确定以k 阶指数哥伦布码编码，如果k 选得恰当，则编码效率可以逼近信息嫡。a v s 采用基于上下文的2 dv l c 来编码8x8 块变换系数。基于上下文的意思是用己编码的系数来确定v l c 码表的切换。2 dv l c 的意思是将( r u n ，l e v e l ) 对视为一个事件联合编码。a v s 充分利用上下文信息，在不同的统计情况下编码变换块用到多张不同的2 dv l c 表。编码当前( r u n ，l e v e l ) 的码表由最近编码的l e v e l 值来决定。这种编码方法总共用到1 9 张2 dv l c 表。这些表需要约1 k 字节的存储空问。另外，a v s 视频标准还定义了新的e s c a p e 编码方法，能够

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）avs视频编码中整数变换与运动估计研究.pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）avs视频编码中整数变换与运动估计研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档