已阅读1页,还剩53页未读, 继续免费阅读
(通信与信息系统专业论文)分布式视频编码中边信息的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着视频应用的发展,许多视频系统要求终端不仅可以实现低复杂度解码, 还需具有实时编码和传输等功能,比如移动可视电话、无线视频监视系统等。受 制于设备成本及电池容量等因素,该类系统终端的计算和存储能力都十分有限, 因此难以执行复杂的视频压缩算法。 分布式视频编码( d i s t r i b u t e dv i d e oc o d i n g ,d v c ) 正是解决上述资源受限问题的 有效途径。它采用帧内编码加帧间解码,将计算复杂度从编码端转移到了解码端。 并且从理论上而言,这种转移并不以牺牲压缩性能为代价,较好地满足了视频编 码与通信的需求。分布式视频编码又是以信道编码为基础的,在本质上具有抗传 输错误的能力,这为实现视频信号的鲁棒传输提供了新思路。 本文首先阐述了视频编码的基本原理及其发展历程;然后分析了分布式视频 编解码技术的基本思路和关键技术,说明了边信息在分布式视频编码中的重要性: 紧接着着重研究了分布式视频编码中边信息的产生方法,并提出一种改进的方案, 该方案在只增加解码端复杂度的条件下大为提高了系统的性能。它通过在解码端 对初始解码帧进行反馈译码、对可疑运动矢量进行平滑滤波并利用最后得到的运 动矢量和初始解码帧进行加权交叠运动补偿的方法来产生和优化边信息;最后, 本文在所提边信息产生方案的基础上实现了一种分布式视频编解码系统,说明了 其工作原理和流程,并进行了m a t l a b 系统仿真。通过与典型的边信息产生方案 进行比较,验证了所提出的边信息生成方法的性能优越性。并且和传统的h 2 6 3 + 标准的帧内编码及h 2 6 3 + 标准的帧间编码进行了比较,证明了该系统的有效性和 可行性。 关键词:分布式视频编码,w y n e r - z i v 编码,边信息 a b s t r a c t a b s t r a c t a sv i d e oa p p l i c a t i o np r o g r e s s e s ,m a n yv i d e os y s t e m sr e q u i r et h et e r m i n a lc a n r e a l i z en o to n l yl o wc o m p l e x i t yd e c o d i n g , b u ta l s or e a l - t i m ec o d i n ga n dt r a n s m i s s i o n , s u c h 弱m o b i l ev i s u a lt e l e p h o n e , w i r e l e s ss u r v e i l l a n e es y s t e m w i t ht h er e s t r i c t i o no f e q u i p m e n tc o s t , c e l lc a p a c i t ya n ds oo n ,t h et e r m i n a l sa b i l i t yo fc a l c u l a t i o na n ds t o r a g e i sl i m i t e d , w h i c hm a k e si tc a n td oc o m p l i c a t e dv i d e oc o m p r e s s i o n d i s t r i b u t e dv i d e oc o d i n g ( d v c ) i sa ne f f i c i e n tp a t ht os o l v et h ep r o b l e mo f r c $ o u l e el i m i t a t i o n i ta d o p t si n t r a - f r a m ec o d i n ga n di n t e r - f r a m ec o d i n g , w h i c hs h i f t s t h ec o m p u t a t i o n a lb u r d e nf r o mt h ee n c o d e rt ot h ed e c o d e r a st h es h i f td o e s n ts a c r i f i c e c o m p r e s s i o np e r f o r m a n c et h e o r e t i c a l l y , i ts a t i s f i e st h ed e m a n do fv i d e oc o d i n ga n d c o m m u n i c a t i o n d v ci sb a s e do nc h a n n e lc o d i n g , w h i c hh a st h ef e a t u r e a g a i n s t t r a n s m i s s i o ne r r o r s ,i to f f e r san e wt h r e a dt ot r a n s m i tv i d e os i g n a lr o b u s t l y f i r s t l y , t h i s t h e s i sp r e s e n t sb a s i cp r i n c i p l ea n dt h eh i s t o r yo fv i d e oc o d i n g s e c o n d l y , a n a l y s e st h ef u n d a m e n t a li m p l e m e n t a t i o na n dt h ep i v o t a lt e c h n o l o g i e so f d v c ,d e s c r i b e st h ei m p o r t a n c eo fs i d ei n f o r m a t i o nt od v c t h i r d l y , f o c u s e so nt h e t h e o r yo fs i d ei n f o r m a t i o ng e n e r a t i o n ,a n dp u t sf o r w a r da ni m p r o v e ds c h e m ew h i c h i m p r o v e ss y s t e m sp e r f o r m a n c ew i t ho n l yd e c o d i n gc o m p l e x i t yi n c r e a s e s t h es c h e m e g e n e r a t e sa n do p t i m i z e ss i d ei n f o r m a t i o nt h r o u g hf e e d b a c kd e c o d i n g , s u s p e c tm o t i o n v e c t o rs m o o t hf i l t e r i n ga n do v e r l a p p e db l o c km o t i o nc o m p e n s a t i o nw i t hi n i t i a ld e c o d e d f r a m e sa tt h ed e c o d e r l a s t l y , ad v cs y s t e mi si m p l e m e n t e db a s e do nt h es c h e m e ,i t s p r i n c i p l eo fw o r ki sp r e s e n t e d am a t l a bs y s t e ms i m u l a t i o nh a sb e e nd o n et ot h ed v c s y s t e m ,b yc o m p a r i n gw i t ht y p i c a ls i d ei n f o r m a t i o ng e n e r a t i o nm e t h o d ,v e r i f i e st h e p e r f o r m a n c eo ft h ep r o p o s e ds i d ei n f o r m a t i o ng e n e r a t i o ns c h e m e a n dac o m p a r i s o nh a s b e e nd o n ew i t ht h ep r o p o s e dd v cs y s t e ma n dt h ei n t r a - f r a m ec o d i n go fh 2 6 3 + s t a n d a r da n dt h ei n t e r - f l a m ec o d i n go fh 2 6 3 + s t a n d a r d ,p r o v e st h e v a l i d i t ya n d f e a s i b i l i t yo f t h ep r o p o s e dd v c s y s t e m k e y w o r d s :d i s t r i b u t e dv i d e oc o d i n g , w y n e r - z i vc o d i n g , s i d ei n f o r m a t i o n i i 图目录 图目录 图1 1h 2 6 l 编码器框架图4 图1 2h 2 6 l 解码器框架图4 图2 1统计相关信源联合编码、联合解码7 图2 2 统计相关信源独立编码、联合解码8 图2 3s l e p i a n w o l f 编码的码率范围8 图2 _ 4w y n e r - z i v 有损编码9 图2 5 实际应用的w y n e r - z i v 编解码系统9 图2 - 6 像素域w y n e r - z i v 视频编码系统1 l 图2 7 变换域w y n e r - z i v 视频编码系统1 2 图2 8p r i s m 分布式视频编码系统13 图2 - 9 无线视频通信16 图2 1 0 基于w y n e r - z i v 的鲁棒视频传输系统1 7 图3 1前向运动估计2 0 图3 2 运动补偿外插插值法2 1 图3 3 基于h a s h 码的边信息重建。2 l 图3 4h a s h 码的取值2 2 图3 5 边信息优化重建策略2 3 图3 - 6 运动补偿时域插值框架2 3 图3 7 对称双向运动估计2 4 图3 8 加权交叠运动补偿的块扩展2 7 图3 - 9 加权交叠运动补偿中的加权系数2 8 v i 图目录 图4 _ 1提出的分布式视频编码系统3 0 图4 _ 2t u r b o 编码器3 1 图4 3 菱形搜索模板3 3 图4 41 r u 【r b o 解码器。3 4 图4 5 系统解码流程图3 6 图4 - 6c a r p h o n e 序列w z 帧p s n r 性能图。3 8 图4 7m o b i l e 序列w z 帧p s n r 性能图3 9 图禾8c a r p h o n e 序列偶数帧r d 性能图4 0 图4 _ 9m o b i l e 序列偶数帧r d 性能图4 1 表目录 表1 1i t u t 和i s o i e c 制定的视频压缩编码标准3 i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 虢盅毕 日期:叫年肋日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:蝉导师签名:卫俎 吼1 ,年彩月加日 第一章引言 第一章引言 多媒体通信技术的发展正逐渐改变着人们的生活,信息的呈现方式从过去的 文本和图片形式逐渐演变到现在的文本、图像、音频和视频信号集成的多媒体形 式。而视频图像在数字化后的数据量非常大,这就给传输和存储造成了很大的困 难。因此,在保证解压缩视频图像质量的前提下,对视频图像数据进行有效的压 缩,以最少的码字表示信息,一直是众多学者研究的目标。通过他们的努力,在 过去3 0 多年的时间里,国际和国内的多个相关标准化组织陆续推出了一系列的视 频图像编码标准。这些标准针对不同的应用场合,采用了当时各种性能优良的编 解码算法,体现了当时视频编码技术的发展水平。下面就对相关概念和视频编码 技术的发展进行简要的介绍。 视频压缩编码技术的发展 1 1 1 数据压缩的概念 数据压缩就是以最少的码字表示信源所发的信号,减少容纳给定消息集合或 数据采样集合所需的信号空间。所谓信号空间是指某信号所占有的空域、时域和 频域空间。信号空间的这几种形式是相互关联的:存储空间的减少也意味着传输 效率的提高与占用带宽的节省。 数据压缩的可能性在于信息中存在的冗余,信息论之父s h a n n o n 在1 9 4 8 年发 表的论文“am a t h e m a t i c a lt h e o r yo f c o m m u n i e a f i o n 中指出,任何信息都存在冗 余,其大小与信息中各符号出现的概率有关。s h a n n o n 借鉴热力学的概念,将信息 中去除冗余后得到的平均信息量称为“信息熵 ,并给出了计算表达式,解决了对 信息的量化度量问题。信息熵概念和公式的提出,为数据压缩算法的发展奠定了 理论基础。 1 1 2 视频压缩编码技术 视频图像信息可以压缩的依据有两个方面,首先在于视频图像中存在许多冗 余,而且在编码时将这些冗余压缩删除后,解码时还可无失真的恢复;其次在于 电子科技大学硕士学位论文 人的视觉特性,即对视频信息中的高频部分不敏感。我们可以利用该特性,在不 影响主观视觉感受的条件下,通过减小所表示的信息的精度,以较小的失真来实 现压缩的目的。 视频图像有结构和统计两个方面的冗余。结构上的冗余表现在具有很强的空 间和时间相关性,空间上的相关性来自于视频帧内,时间上的相关性来自于视频 帧之间。故采用适当的处理技术,减小甚至消除这种由相关性产生的冗余,就能 达到压缩视频图像的目的。统计上的冗余来自于视频信号在概率密度分布上的不 均匀性,这种概率密度分布不均匀的特点对采用变字长编码进行码率压缩极为有 利。通过采用统计编码,即熵编码,可以将概率高的信号编为短码,将概率低的 信号编为长码,从而总的平均编码长度会比采用长度固定的码字进行编码短很多。 基于上述视频图像特性的分析,可以采用预测编码、变换编码、统计编码、 子带编码和基于模型的编码等算法对视频图像进行压缩。预测编码利用视频图像 在空间和时间的相关性,以已传送的相邻像素值为参考来预测当前的像素值,常 用的算法为差分脉冲编码调制。与运动估计和运动补偿结合使用的帧间预测编码 是目前解除视频图像时间冗余最常用的算法。变换编码通过某种正交变换将一组 像素值转换成一组变换系数,然后对这些变换系数进行不同精度的量化,再进行 编码。正交变换的采用解除了帧内像素的空间相关性,从而减小了冗余度。常用 的正交变换是d c t 变换,它是一种次最优变换方法,目前在视频编码中已被广泛 使用。统计编码( 或称熵编码) 根据信息熵原理对信号进行变字长编码,它是信 息保持型编码,常用的有h u f f z n a n 编码和算术编码。子带编码将视频图像在频率 域进行分裂,得到若干子带,然后对这些子带采用和它们各自统计特性相适应的 编码器和比特分配方案,从而达到压缩的目的。基于模型的编码则先根据掌握的 视频图像的先验知识建立一个景物的模型,然后根据该模型对待编码的视频图像 进行分析,得到形状、运动、纹理等相应参数。而对这些参数进行编码所需要的 比特数很少,因此达到了大比例压缩的效果。 上述编码方法中的变换编码、预测编码和统计编码具有重要的地位,由这三 种编码算法结合而成的“混合编码( h y b r i dc o d i n g ) 已被大多数视频编码标准所 采用。 1 1 3 视频编码的标准化 在上个世纪8 0 年代以前,视频编码的应用并不普遍,其原因除技术条件限制 2 第一章引言 外,还有一个重要的因素是没有通用的视频编码标准。为此,删t 和i s o i e c 等 相关标准化组织在上个世纪8 0 年代后期开始,联合相关领域的权威,先后推出了 一系列的视频编码国际标准,并致力于研究面向未来应用的标准。 r r u t 于1 9 9 0 年颁布的h 2 6 1 标准是第一个视频压缩编码的国际标准,它体 现了当时近4 0 年视频编码方面的研究成果,并奠定了近代视频编码系统的框架模 型。随后,i t u t 针对不同的应用场合,采用当时最为先进的技术,先后制定了多 个视频编码标准,包括h 2 6 1 、h 2 6 3 、h 2 6 3 + 、h 2 6 3 + + 和h 2 6 4 。同时,i s o i e c 下的m p e g 组织也先后推出了多个音视频压缩编码标准,其中包括m p e g 1 、 m p e g 2 和m p e g - 4 等。 现将视频编码标准的发展进程总结如下表: 表1 1i t u - t 和i s o i e c 制定的视频压缩编码标准 标准名称发布机构发布时间适用场合 h 2 6 1 i t u t 1 9 9 0 年综合业务数字网、i s d n 中的视频会议 m p e g 1i s o i e c1 9 9 3 年光盘存储、消费视频、视频记录等 数字电视、d v d 、高清晰度电视、视 m 口e g 2i s o i e c1 9 9 5 年 频点播等 h 2 6 3i t u t1 9 9 6 年可视电话、移动视频通信等 h 2 6 3 + 兀u - t1 9 9 8 年可视电话、移动视频通信等 m p e g 4i s o i e c2 0 0 0 年i n t e m e t 、交互视频、视频内容管理等 h 2 6 3 + +i t u t2 0 0 2 年可视电话、移动视频通信等 h 2 6 4 a v ci s o i e c & i t u t2 0 0 3 年网络视频、移动视频通信等 1 2传统视频编码标准的实现框架 经过2 0 余年的发展,视频编码的压缩效率提高了许多,但其编码框架几乎没 有变化,编码性能的提高主要来自于内部模块技术细节的改进。下面就以h 2 6 l 标准【i 】为例,对这一类传统视频标准的实现架构进行介绍。 h 2 6 l 标准采用基于图像块的混合编码模式,将预测编码、变换编码和熵编码 有机地融合在一起,以实现消除输入视频序列中存在的各种冗余,从而达到压缩 数据的目的。系统包括运动估计和运动补偿、变换编码、量化、熵编码等几个环 节。 3 - 电子科技大学硕士学位论文 h 2 6 l 编码器框架如图1 1 所示。视频序列在输入编码器后,被分为帧内编码 图像和帧间编码图像。帧内编码图像完全依赖自身的图像信息,它只经过变换和 量化就进行熵编码,形成压缩码流。帧内编码主要利用人眼的视觉特征,通过变 换和量化消除视频图像在空域和频域的冗余。帧内编码一般应用于视频序列的第 一帧和刷新帧,具有较高的重建质量。帧间编码图像用已编码帧经反量化和反变 换后得到的重建帧作为参考,采用运动估计和运动补偿得到它的运动矢量和帧间 差值信息,用这些信息代替原始视频帧,从而消除视频序列在时域上的冗余。帧 间编码具有较高的压缩性能,但也存在对参考帧的依赖和误差向下扩散的问题。 x 图l - lh 2 6 l 编码器框架图 h 2 6 l 解码器框架如图1 2 所示,其过程与编码过程相对应。对于帧内编码图 像,压缩码流先进行熵解码,形成变换量化系数码流,然后经反量化和反变换得 到相应的视频帧。对于帧间编码图像,对应码流经熵解码、反量化和反变换后得 到帧差信息,然后利用已解码的参考帧和运动矢量信息进行运动补偿,重建后得 到相应视频帧。 x 图1 - 2h 2 6 l 解码器框架图 4 第一章引言 1 3分布式视频编码的研究背景 由上节所述可以看到,这些传统视频编码标准的编码器包括有变换、量化、 熵编码以及运动估计和运动补偿等大量运算。尤其是运动估计和运动补偿,它们 的运算量占整个系统运算量的一半以上,造成编码器的复杂度远高于解码器,其 计算量达到解码器计算量的5 至1 0 倍。该编码方式在广播电视或流媒体点播等系 统中较为适用,因为在此类应用场合,视频信号编码只进行一次,而解码则需进 行多次。 然而在某些应用场合,比如视频监控和移动视频通信等,它们需要低复杂度 的编码器,而在解码端则可进行较高复杂度的运算。显然,传统的视频编码技术 已无法满足该类应用场合的要求,必须找到新的视频压缩方法。 正是基于上述原因,近年来,一种全新的视频编码框架分布式视频编码 ( d i s t r i b u t e dv i d e oc o d i n g ,d v c ) 得到了众多研究者的关注。该视频编码方法将运动 估计和运动补偿移到了解码端,从而实现了编码器简单化的要求。而且该方案能 够实现高效的压缩,重建后的视频图像也有较高的质量。 1 4 本文研究内容及结构安排 本文主要研究分布式视频编码中解码端边信息的产生及优化问题,针对获取 边信息所采用的不同方式进行比较,并提出优化方法以获得较好的边信息,进而 提高分布式视频编码的整体性能。 本文各章内容的安排如下: 第一章:引言。阐述了视频编码的原理及进展,并介绍本文的研究背景、内 容和结构安排。 第二章:分布式视频编码技术。简要阐述了分布式视频编码的理论基础: s l e p i a n w o l f 定理和w y n e r - z i v 定理,随后给出了几种典型的编码方案,并揭示分 布式视频编码的关键技术。最后简要介绍了分布式视频编码的典型应用。 第三章:边信息的产生。研究了基于运动补偿插值和外推以及基于哈希码的 边信息估计方法。然后重点提出了一种边信息的产生和优化策略,通过迭代译码、 对运动矢量进行平滑滤波并采用加权交叠运动补偿的方法来产生和优化边信息。 5 - 电子科技大学硕士学位论文 第四章:系统实现及性能验证。通过在像素域分布式视频编码方案基础上运 用上一章提出的边信息产生和优化策略,实现了一种优化的方案。然后采用标准 视频序列,仿真验证了该优化策略产生的边信息的性能。并通过将该优化方案同 其它编码方案进行比较,验证了所提方案的可行性和有效性。 第五章:总结与展望。总结本文工作,并提出了需要进一步研究的问题。 6 第二章分布式视频编码技术 第二章分布式视频编码技术 分布式视频编码是以分布式信源编码( d i s t r i b u t e ds o u r c ec o d i n g , d s c ) 为理 论基础的一种全新的视频编码方式。分布式信源编码是指对两个及以上独立但相 关的随机序列分别采用独立的编码器进行编码,各编码器发送的比特流经过信道 传送到统一的解码器中,该解码器利用序列间的统计相关性对所有输入的比特流 进行联合解码。分布式信源编码理论包括s 1 e p i a n - w b l f 无损分布式编码理论怛j 和使 用解码端边信息( s i d ei n f o r m a t i o n , s i ) 的w y n e r - z i v 有损分布式编码理论【3 j 。 2 1分布式视频编码的基本原理 2 1 1 s i m i a n w o l f 无损分布式编码理论 由信息论可知,两个统计相关的独立同分布随机序列x 和y ,在独立编码、 独立解码时,要保证解码后无差错,各自码率需满足b h ( x ) f f c i r y h ( 】,) ,其 中h ( x ) 和h m 分别是序列x 和y 的信息熵。这两个序列进行联合编码、联合解 码时,如图2 1 所示,当传输码率r 满足尺胃( x ,n ,解码端可无失真地恢复x 和y ,其中h 区为联合信息熵。 x ,y联合编码器联合解码器 r 7x ,y 图2 1 统计相关信源联合编码、联合解码 现在考虑对上述x 和y 进行独立编码、联合解码,如图2 2 所示,要保证解 码器无失真地恢复x 和y ,此时的传输码率需多大呢? s l e p i a n 和w o l f 这两位学者 在上世纪7 0 年代对此作了研究,他们证明进行独立编码、联合解码的效果可以和 联合编码、联合编码情况下的一样好,该理论被称为s l e p i a n w o l f 定理。s l e p i a n - w o l f 定理可以简单的描述如下:当两个统计相关的独立同分布随机序列x 和y 进行独 立编码、联合解码时,若允许存在一个任意小( 但不为零) 的解码差错概率,其码 率可达到与联合编码、联合解码相同的码率。其信息传输率符合如下公式: 7 电子科技大学硕士学位论文 r h ( x i y ) b h ( y i x ) 足悔h ( x ,y ) ( 2 1 ) ( 2 - 2 ) ( 2 - 3 ) 其中,r x 为x 编码后的码率,r y 为y 编码后的码率,h ( x i d 是y 已知的情 况下x 的条件熵,h ( y i x ) 是x 已知情况下y 的条件熵。式( 2 - 3 ) 表明,尽管x 和y 采用独立的编码器,但其总的码率如+ 母与联合编码时相同。因此,分布式 视频编码方案下的独立编码和传统视频编码方案的联合编码比较,理论上没有任 何压缩效率上的损失。 x y x ,v 图2 - 2 统计相关信源独立编码、联合解码 s l e p i a n w o l f 编码所能取得的码率可用图2 3 来描述。只要r x 和r y 的取值区 间位于图中的阴影区域,则解码器可以任意小的差错概率对上述序列进行解码。 j o i n t a n d l ;。r x + 玛= h ( x ,的 h ( x i h ( x ) 图2 3s l e p i a n - w o l f 编码的码率范围 8 第二章分布式视频编码技术 2 1 2 w y n e r - z i v 有损分布式编码理论 在s l e p i a n w o l f 无损编码理论的基础上,w y n e r 和z i v 建立了在解码端使用边 信息的有损分布式编码理论。w y n e r - z i v 理论证明,在一定条件下进行有损压缩时, 只在解码端可以得到边信息和在编解码端都能得到边信息相比,其编码效率并没 有下降,即能获得相同的率失真性能。 设x 和y 是两个相关的独立同分布随机序列。如果信源x 在编解码时都可获 取边信息y ,并且信源x 的解码值为x ,则率失真函数为尺( d ) ,其中d 是解 码失真度,表示为d = e d ( x ,x 、) 】。若编码时无法获知边信息y 而解码时可以, 如图2 4 所示,此时率失真函数表示为尺嚣( d ) 。w y n e r - z i v 理论证明尺舢) 和 蹄( d ) 的关系为r 嚣( d ) 心l y ( d ) ,并且在x 和y 是高斯无记忆信源和均方误差失 真的条件下有r 鬈( d ) = r x l ,p ) 。后来的研究证明,如果y 是x 和独立高斯噪声之 和, r f 椰t z ( d ) = r x 。r p ) 同样成立。 x y 图2 - 4w y n e r - z i v 有损编码 实际应用的w y n e r - z i v 编解码系统如图2 5 所示,w y n e r - z i v 编码可以看作是 对信源的量化和s l e p i a n w o l f 编码相结合的过程。 x w y n e r - z i v 编码器 i w y n e r - z i v 解码器 图2 5 实际应用的w y n e r - z i v 编解码系统 图中的量化和重建模块可以看作是信源编码的内容。在量化部分,输入x 被 量化成特定的码字。解码端则根据边信息y 对s l e p i a n w o l f 解码器解码得到的码 - 9 - 电子科技大学硕士学位论文 字进行重建,得到输出x 、。而s l e p i a l l w o l f 编码器则可看作是信道编码部分。设 x 量化后得到q ,因为x 和y 是相关的,因此q 和y 也是相关的。q 和y 之间 可想象存在一条转移概率为p ( 】,iq ) 的虚拟信道,q 是信道的输入,y 是信道的输 出,即y 是q 混入信道噪声后的结果。信道引入的“噪声”是和两序列之间的相 关性相联系的,因此可利用信道编码的纠错特性恢复信源。 2 2 分布式视频编码方案 随着视频应用的发展,传统视频编码标准的局限性逐渐暴露出来,而分布式 信源编码理论则为这些问题的解决奠定了理论基础,众多的研究者也在此基础上 陆续提出了相应的分布式视频编码方案。 p r a d h a n 最早开始了这方面的研究【4 】,对符合高斯分布的统计相关信源使用标 量和t r e l l i s 集来研究边信息的信源编码。在2 0 0 1 年左右,b s j e s y 、f r i a s 、a a r o n 等 相继提出了使用t u r b o 码进行分布式信源编码的方法【5 卅。基于l d p c 的分布式信 源编码【8 9 】随后由l i v e r i s 和yy a n g 等人于2 0 0 2 年提出。在量化设计方面,z x i o n g 利用一个嵌套格子量化器紧跟一个s l e p i a n w o l f 编码器来实现w y n e r - z i v 编码器 【1 0 1 。m o n e d e r o 等人实现了固定码率下局部最优的w y n e r - z i v 矢量量化器的设训1 1 】。 在分布式视频编码中运用运动补偿最早的是p r i s m 方案 1 2 , 1 3 】。a a r o n 等提出了基 于像素域的编码方案【1 4 1 ,随后又提出了基于d c t 变换的方法0 s , 1 6 1 。a a r o n 等人还 提出基于h a s h 码的方法【i 7 1 ,将d c t 变换量化系数变换为h a s h 码,解码器基于该 h a s h 码对己解码帧进行运动补偿获得边信息。 这些方案的实现方法虽各不相同,但大都采用在解码端进行运动补偿来产生 边信息,下面就对一些典型的分布式视频编码方案进行介绍。 2 2 1 像素域w y n e r - z i v 视频编码方案 像素域w y n e r - z i v 编码方案【7 ,1 4 】由a a r o n 等提出,其原理框图如图2 - 6 所示。 首先将原始视频序列有规律地分为两组,其中一组做为关键帧,另一组作为 w y n e r - z i v 帧。关键帧的编解码采用传统的帧内编解码方式;w y n e r - z i v 帧则在编 码时采用帧内编码方式,而解码时采用帧间解码方式。 1 0 - 第二章分布式视频编码技术 w 图2 - 6 像素域w y n e r - z i v 视频编码系统 w z 帧在编码端首先进行量化,然后将量化系数进行位平面分解,再由高到低 依次送入码率可调节的t u r b o 编码器进行编码。 在解码端,通过对相邻已解码的关键帧k 、或已解码的w z 帧进行内插或外推 来产生边信息。边信息实际相当于是原始帧通过一个符合拉普拉斯分布的虚拟噪 声信道传输后的输出,t u r b o 编码器即用来实现对这个虚拟信道的纠错。解码时, 首先利用边信息及所估计的虚拟信道计算各个比特面信息位的信道似然值,再利 用接收到的部份校验位计算校验位信道似然值,最终输入到t u r b o 解码器中迭代解 码,如果不能正确解码,则向编码端请求更多的校验位来进行解码,否则利用成 功解码后的比特面数据及边信息采用最大后验估计联合重建出w z 解码帧。t u r b o 编解码器由两个成员编解码器经交织器并串行联接组成,其中成员解码器主要采 用m a p 译码算法进行解码。在解码过程中正确解码所需要的t u r b o 编码器输出的 校验码的数量越少,系统的压缩率就越高。 像素域w y n e r - z i v 视频编码中的编码仅有传统帧内编码和基于t u r b o 码的 w y n e r - z i v 编码,其编码复杂度不高;但它解码较为复杂,要将帧内解码、t u r b o 解码、运动估计和运动补偿等技术联合使用才能得到较好的输出结果。 2 2 2 变换域w y n e r - z i v 视频编码方案 在像素域w y n e r - z i v 编码方案中,对视频信号的空间相关性没有进行特别处 理。为提高压缩效率,a a r o n 等又提出了变换域w y n e r - z i v 视频编码方案【1 5 , 1 6 ,其 电子科技大学硕士学位论文 系统框图如图2 7 所示。 w y n e r - z i v 争9 霉j w y n e r - z 1 v 解码器 图2 - 7 变换域w y n e r - z i v 视频编码系统 变换域w y n e r - z i v 视频编码和像素域w y n e r - z i v 视频编码类似,不同之处在于 对w z 帧的编码方式不同。变换域w y n e r - z i v 视频编码原理如下:先对w z 帧进 行4 x 4 的d c t 变换得到x ,根据x 在每个块中的位置将其划分为1 6 个频段x k 。 然后对每个频段中的系数进行2 m 个间隔的均匀量化,再将量化系数按照重要程度 进行位平面分解,形成m 组位平面。这些位平面再依次送入s l e p i a n w o l f 编码器 中处理,产生的奇偶校验码暂时存在缓冲器中并根据需求传送到解码器。 解码时,首先利用相邻已解码的k 帧或w z 帧,通过运动补偿插值、4 x 4 的 d c t 变换并进行频段划分得到包含1 6 个频段的边信息s ,t u r b o 解码器通过s 和 接收到的校验码依次对各个位平面进行解码得到q k 、。如果不能正确解码,t u r b o 解码器会通过反馈通道请求更多的校验码来解码,否则解码器中的重建模块根据 边信息s 和q k 、重建得到重构频段x k 。得到所有重构频段后,通过反d c t 变换即 可得到解码后的w z 帧。 和像素域w y n e r - z i v 视频编码相比,变换域w y n e r - z i v 视频编码由于采用了离 散余弦变换,其效果更好,但编码复杂度相对也高,所需的存储单元也有一定的 增加。 2 2 3 d i s c u s 视频编码方案 p r a d h a n 和r a m c h a n d r a n 提出的d i s c u s ( d i s t r i b u t e ds o u r c ec o d i n gu s i n g 1 2 第二章分布式视频编码技术 s y n d r o m e ) 方案【4 ,1 8 】将信道编码的研究成果应用到分布式信源编码中。 d i s c u s 方案对信源使用进行t r e l l i s 编码调制的信道码来分割,使得所得各陪 集内信号之间的距离尽可能远,并把信源编码为其所在陪集的伴随式,以取得压 缩的效果。 码字的陪集分割是一个关键问题,分割后各陪集内的码字之间的距离要尽可 能远,这样解码器才能通过在陪集中找到距参考信息y 最近的码字作为解码结果。 若编为( n k ) 信道码,则每个陪集内的信道码是码长为n 的码字序列中距离尽可能 大的2 k 个序列。因为陪集内的信道码是所有码长为n 的码字序列中的2 k 个序列, 而码长为n 的码字序列共有2 n 个,因此这2 n 个码序列中可有2 n - k 组性能相同的信 道码,这2 n - k 组信道码就组成了码长为1 1 的码序列的陪集。定义信道码的伴随式为 s = h c r ,h 为校验矩阵,则每个陪集对应一个s 值,该伴随式就作为陪集的索引。 故编码时只需找出待编码码字所在的陪集,再传输该陪集的索引即可。而陪 集的索引就是该组信道码的伴随式,因此可利用公式s = h c r 来求取伴随式,然后 把s 传输到解码端,这样传输的码长由n 减为n k ,节省了k 个比特。解码就是在 s 所指的陪集中找到与y 距离最近的码字,然后估计得到解码码字。即把参考信 息y 看成是信源x 经过信道污染后的信号,利用信道解码的方法来恢复被编码的 码字。 2 2 。4p r i s m 视频编码方案 p r i s m ( p o w e re f f i c i e n tr o b u s th i g h - c o m p r e s s i o ns y n d r o m e - b a s e dm u l t i m e d i a ) 视频编码n 复3 - 1 。1 由p u f f 等在2 0 0 2 年左右提出,其框架如图2 8 所示。 编码端;解码端 叫b 鹊e 量化卜 s y n d r o m e叫嚣h 蹴卜s y n d r o m e+ i b a 反量化卜+ 编码解码 d c t ; t i d c t 高频部分; i 运动补偿l +量化_ 熵编码 熵解码反量化 图2 - 8p r i s m 分布式视频编码系统 系统编码步骤如下:( 1 ) 首先进行8 8 或1 6 x 1 6 大小的二维d c t 变换:( 2 ) 1 3 电子科技大学硕士学位论文 根据宏块在空域和时域的特性,对变换系数进行分类;( 3 ) d c t 系数的低频部分 依次进行步长较大的初量化( b a s eq u a n t i z a t i o n ) 、基于分集的符号组( s y n d r o m e ) 编码和步长较小的精细量化( r e f i n e m e n tq u a n t i z a t i o n ) ,进行精细量化的目的是为 了减少出现解码差错的概率;而d c t 系数高频部分只进行传统视频编码中的量化 和熵编码。 在解码端,首先对低频系数编码码流进行反精细量化,然后联合运动补偿得 到的边信息进行s y n d r o m e 解码,再进行反量化,最后联合高频系数解码码流进行 反d c t 变换。 p r i s m 编码方案有三个主要特点:一是计算复杂度可根据编码端和解码端的 情况进行合理分配;二是具有较好的鲁棒性;三是通过对编码宏块的分类,可达 到码率控制的目的。 2 3关键技术 分布式视频编码是视频压缩领域的一个新课题,涉及到很多技术领域,其中 边信息的产生和码流控制等这项全新的编码技术发展和创新的关键。 2 3 1 边信息的产生 分布式视频编码中,边信息的产生实际上是在解码端对当前编码的w z 帧进 行预测,它要求在w z 帧未知的情况下,利用视频序列的帧间相关性对w z 帧做 出准确的估计。而在传统的视频编码标准中,在编码端进行的帧间预测补偿都是 在本帧信息己知的前提下到参考帧中搜索最佳匹配块。解码端边信息的预测精度 很大程度上决定着分布式视频编码的率失真性能。边信息对w z 帧的预测越准确, 则解码器正确解码所需的校验比特越少,系统的率失真性能就越好。因此,如何 准确地生成边信息是分布式视频编码的关键所在。生成边信息的方法将在下一章 做重点介绍。 2 3 2码率控制 在分布式视频编码中,有三个因素会影响系统的码率。首先是k 帧与w z 帧 的比例。由于k 帧采用传统的帧内编码,故k 帧比例大会导致码率较高。再就是 k 帧的码率,这取决于k 帧的量化步长。最后是w z 帧的码率,它取决于w y n e r - z i v 1 4 第二章分布式视频编码技术 编码器中的量化器的量化步长和传输的校验位数量。量化步长会影响t u r b o 编码器 产生的校验码总数和解码端重建的视频的质量。量化步长确定后,校验码总数也 随之确定,此时,传输的校验码数量将取决于w z 帧和解码端边信息之间的统计 相关性。 上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026学年上海市普陀区九年级(下)月考物理试卷(4月份)(含答案)
- 2026五年级数学下册 折线统计图易错纠正
- 行政审批项目办理制度
- 行政费用审批管理制度
- 2026年安徽省《保密知识竞赛必刷100题》考试题库及答案详解(典优)
- 2025年县乡教师选调考试《教育学》综合提升练习题及参考答案详解一套
- 2025年注册岩土工程师之《岩土基础知识》每日一练试卷含答案详解(轻巧夺冠)
- 2026一年级下新课标口语交际能力提升
- 国际环境法中预防原则操作化标准研究-基于科学不确定性与决策程序规则分析
- 陕旅版五年级下册Unit 2 Spring Is Coming!教案
- 2024-2025学年江苏省泰州市兴化市四校高二下学期4月期中联考数学试题(解析版)
- 2025年江西省从“五方面人员”中选拔乡镇领导班子成员考试历年参考题库含答案详解(5套)
- 2025年11月济南轨道交通集团运营有限公司社会招聘笔试参考题库附带答案详解(10套)
- 2025年杭州银行笔试题库及答案
- 2025年北京市中考数学真题试卷及答案
- 120急救站工作汇报
- 义警规章管理制度
- 广东省高州市全域土地综合整治项目(一期)可行性研究报告
- 教育事业十五五发展规划
- CJ/T 409-2012玻璃钢化粪池技术要求
- T/CNPPA 3017-2021塑料和橡胶类药包材自身稳定性研究指南
评论
0/150
提交评论