




已阅读5页,还剩54页未读, 继续免费阅读
(通信与信息系统专业论文)基于达芬奇(davinci)技术的h264视频编码器实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
重庆邮电大学硕士论文 摘要 摘要 h 2 6 4 视频编解码标准是2 0 0 3 年5 月获得批准的新一代视频编解码国际标准。 同以往标准相比,它采用了许多新技术,例如1 4 ,1 8 精度的子像素运动估计,多 参考帧技术,去块滤波,加强的熵编码,小块的整数变换等来提高编码效果,使 得h 2 6 4 具有优异的编解码性能,对于市场极具诱惑力;同时,这些技术也增加 了h 2 6 4 编码器的复杂度,限制了h 2 6 4 在很多领域尤其是实时领域的应用,故 研究h 2 6 4 编解码的快速算法及其实现是h 2 6 4 走向市场的前提和保证,因此对 h 2 6 4 视频编解码算法迸 亍优化具有十分重要的理论意义和实用价值。 本章首先对h ,2 6 4 标准进行了深入分析,了解h 2 6 4 语法流的结构,从总体 上把握了h ,2 6 4 编码框架,并对其中的关键技术进行分析,确定了影响h 2 6 4 编 码计算复杂度的关键模块。其次,对几种主流的运动搜索算法进行了介绍和分析, 在此基础上提出快速运动搜索算法,该搜索模式只需要搜索1 1 个整数像素点数, 即可完成整像素搜索,大大减少了运算量,提高了搜索速度。再次,文章分析了 传统的块匹配的算法,提出基于时间域和空间域的运动矢量预测方法,并将其与 改进的运动搜索的算法结合起来,提高了预测的准确性,降低了算法的复杂度, 并且克服了传统方法的搜索点过多,且容易陷入局部最优点等明显缺点,取得了 较好的效果。文章对德州仪器公司( t 1 ) 的达芬奇( d a v i n e i ) 技术及其产品 t m s 3 2 0 d m 6 4 4 6 进行了介绍,并且研究了基于达芬奇( d a v i n e i ) 软件架构的h 2 6 4 视频编码器的实现,讨论了内存分配等优化策略。最后对课题进行了总结和展望。 关键词:视频压缩,运动估计,运动矢量,达芬奇技术 重庆邮电大学硕士论文 摘要 a b s t r a c t h 2 6 4v i d e oc o d i n gs t a n d a r dw a st h en e w l yr a t i f i e di n t e r n a t i o n a ls t a n d a r di nm a y , 2 0 0 3 c o m p a r e dw i t hf o r m 盯s t a n d a r d s ,i ta d o p t sm a n yn e wt e c h n o l o g i e s ,s u c ha s p r e c i s i o ne v a l u a t i o no fl ,4 1 8s u b - p i x e lm o t i o ne s t i m a t i o n i no r d e rt oi m p r o v et h e e f f e c to fc o d i n g , i tr e f e r st of r a m et e c h n o l o g y ,d e b l o c k i n gf i l t e r , s t r e n g t h e n e de n t r o p y c o d i n ga n ds m a l lb l o c ki n t e g e rt r a n s f o r m h o w e v e r , t h e s et e c h n o l o g i e s a d dt h e c o m p l e x i t yo fh 2 6 4c o d e ra n dl i m i ti t sp r a c t i c a lu s ei nm a n ya r e a s , p a r t i c u l a ri n r e a l - t i m es y s t e m t h es u p e rc o d i n ga n dd e c o d i n gc h a r a c t e r i s t i c so fh 2 6 4i sa t t r a c t i v et ot h em a r k e t , a n dt h er e s e a r c ho ff a s ta l g o r i t h ma n dr e a l i z a t i o ni st h ep r e m i s ea n dg u a r a n t e et o w a r d s t h em a r k e t s ot h e r ei st h e o r e t i c a lm e a n i n ga n dp r a c t i c a lv a l u et oo p t i m i z ev i d e oc o d i n g a l g o r i t h m t h ep a p e rf i r s t l ym a k e sat h o r o u g ha n a l y s i so fr 2 6 4s t a n d a r da n dl e a r n sa b o u ti t s s y n t a xs t r u c t u r e ,a n a l y s e st h ek e yt e c h n o l o g yb a s e do i lc o d i n gf r a m e w o r ko fh 2 6 4 a l s oc o n f i r m st h ek e ym o d u l et h a ta f f e c t st h ea r i t h m e t i cc o m p l e x i t y s e c o n d l y , t h ep a p e ra n a l y s e s a n di n t r o d u c e ss e v e r a lm a i nc u r r e o t so fs e a r c h a l g o r i t h m s m e a n w h i l e ,t h ep a p e rb r i n g sf o r w a r dap r o v e df a s tm o t i o ns e a r c hs t r a t e g y , b yw h i c ht h eo p e r a n dc o u l db er e d u c e da n dt h es e a r c h i n gs p e e db ei m p r o v e d t h i r d l y , i to p t i m i z e st h em a c r o b l o c ke n c o d i n ga l g o r i t h mt h r o u g ha d d i n gt h e p r o c e s so fm o t i o nv e c t o rp r e d i c t i o nt ot h eb l o c km a r c hp r o c e s s ,a n db r i n g sf o r w a r dt w o m o t i o nv e c t o rp r e d i c t i o nm e t h o d s a l lo ft h e mi m p r o v et h eq u a l i t yo fp i c t u r ea n d r e d u c et h eo p e r a n d t h e n , t h ep a p e ri n t r o d u c e st h ed a v i n c i t m a n dt m s 3 2 0 d m 6 4 4 6 ,an e wd s pb a s e d s o l u t i o no fv i d e oc o d i n g a n di ts t u d i e sh o w t od e s i g na n do p t i m i z et h eh 2 6 4v i d e o e n c o d e rt h r o u g hd e v e l o p i n gd a v i n c is o r w a r ea n da l l o c a t i n gt h em e m o r i z i n gr e s o u r c e r e a s o n a b l y k e yw o r d s :v i d e oc o m p r e s s i o n , m o t i o ne s t i m a t i o n , m o t i o nv e c t o r ,d a v i n c i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研 究成果据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得重奁整虫盔堂或其他教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均己在论文中作了明确的说明并表示谢意。 学位论文作者签名:胡琴7 如签字日期:z 口呵年占月1 日 学位论文版权使用授权书 本学位论文作者完全了解重鏖邮电太堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查 阅和借阅本人授权重废整虫太堂可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论 文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:胡匆舾 导师签名。于p 签字日期:2 叫年6 月f 日 签字日期。“7 年 日跫 重庆邮电大学硕士论文第一章绪论 1 1 研究背景 第一章绪论 多媒体通信是未来通信的发展方向,人们渴望享受到丰富多彩的多媒体信 息,越来越多的多媒体信息可通过网络进行传输与发布,一大批方便实用的多媒 体应用( w w w 浏览、音视频多媒体会议、远程教学、电子商务等) 异军突起,成了 网络应用的主力军。 多媒体信息主要包括文字、声音,图像、图形和视频等内容,其中视频又是 多媒体信息中最重要的组成部分据统计人类接受的信息大约7 0 来自视爿”,较 之其他信息,视频信息极易被人类接受,具有直观、形象、准确、高效和应用广 泛等特点。同时,视频的信息容量大,与音频、数据相比,视频具有无与伦比的 信息容量,使得未经压缩的数字视频几乎没有实用价值。 多媒体信息的庞大数据量对通信系统中有限的带宽和存储空间提出了严峻的 挑战举例说明:对于数字电视,若不采取任何压缩措施,总的数据码率为 2 1 6 m b p s ( 每采样点8 比特量化) :一路可视电话或会议电视信号,由于其活动内容较 少,所需带宽较窄,但要达到良好质量,压缩后尚需3 8 4 k b i t s ;一路高清晰度电 视信号( 阳) t v ) ,由于其信息量巨大,不压缩需1 g b i t s ,利用m p e g - - 2 压缩后, 尚需2 0 m b i t s 【2 j 。由于信道容量或实际媒体的限制,这些未经过压缩的视频图像是 无法进行传输和存储的,因此数字视频都必须经过极大的压缩才能具有实际意义, 在低速信道上实现动态视频压缩编码的研究是业界的一个研究热点。经过多年的 研究,人们朝着更高的压缩比、更小的失真度、更快的编码速度、更小的花费, 更实用的播放效果的方向不断努力,如何在标准规定的约束下不断提高软件编解 码的性能,将是以后的一个研究方向 h 2 6 4 a v c 是i s o 和m p e g 这两大标准组织联合开发的新一代视频编码标准, 其具有压缩率高,网络适应性好的特点,故实现h 2 6 4 编码有着非常大的实际意 义。然而h 2 6 4 带来高的压缩比和网络友好性的同时,它有着极高的实现复杂度, 限制了h 2 6 4 在很多领域尤其是实时领域的应用,故研究h 2 6 4 编解码的快速算 法及其实现是h 2 6 4 走向市场的前提和保证,因此对h 2 6 4 视频编解码算法进行 优化具有十分重要的理论意义和实用价值。 重庆邮电大学硕士论文 第一章绪论 1 2 论文工作 本文以新的视频编码标准h 2 6 4 a v c 为研究对象,阐述了h 2 6 4 语法流的结 构和编码框架,并对其中的关键技术进行分析,提出快速运动搜索算法和基于时 间域和空间域的运动矢量预测方法,对其参考软件编解码器进行了优化,在用软 件实现h 2 6 4 编解码器的前提下,研究h 2 6 4 编解码从p c 机移植到 t m s 3 2 0 d m 6 6 4 4 6 上的转换,并针对d s p 硬件特点进行优化研究,以提高h 2 6 4 编码器的实现效率。 1 3 论文结构 文章第二章,简要描述了h 2 6 4 视频编码标准以及实现视频编码的关键技术, 第三章对几种主流的运动攫索算法进行了介绍和分析,在此基础上提出快速运动 搜索算法;并且分析了传统的块匹配的算法,提出基于时间域和空间域的运动矢 量预测方法,并将其与改进的运动搜索的算法结合起来进行整体优化。第四章介 绍了达芬奇( d a v i n c i ) 技术以及其产品t m s 3 2 0 d m 6 4 4 6 芯片,在此基础上,文 章讨论了基于达芬奇( d a v i n c i ) 技术的h 2 6 4 视频编码器实现以及优化,第五章 是对文章和作者工作的总结以及下一步工作的展望。 2 重庆邮电大学硕士论文第二章h 2 6 4 视频标准 2 1 视频编码简介 第二章h 2 6 4 视频标准 虽然数字化的视频图像数据是非常大的,但视频图像数据是高度相关的1 3 1 一 幅图像内部或者图形序列中相邻图像之间有大量的冗余信息,消除冗余是视频编 码压缩的出发点,视频压缩目的就是要在保证一定视频图像质量的前提下,尽可 能地消除这些冗余信息,用较少的比特数来表示视频内容,从而实现对视频的压 缩。视频序列中的数据冗余有以下几种类型: 一 空间冗余:空间冗余是指在同一帧画面中,相邻的像素间存在的相关性, 特别是当这些相邻像素位于同一个视频对象中时,相关性极强。 时间冗余:这是序列图像( 电视图像、运动图像) 数据中所经常包含的冗余。 图像序列中两幅相邻的图像,后一幅图像与前一幅图像之间有较大的相 关,这反映为时间冗余。 信息熵冗余1 4 1 ( 编码冗余) :信息嫡是指一组数据所携带的信息量。信息熵 一般被定义为: e = 一只x l o g z 只 式( 2 1 ) 其中,k 为数据码元的个数:。p i 为y i 的发生概率 对于编码符号,其平均码长高于所表示信息的信息熵,这个差值就形成了 编码冗余。编码冗余、空间冗余和时间冗余都依赖于图像数据的统计特性, 可以统称为统计冗余。 结构冗余:有些图像从大域上看存在着非常强的纹理结构,例如草席图像, 我们称之为它在结构上存在冗余。 知识冗余:有许多图像的理解与某些基础知识有相当大的相关性。例如: 人脸的图像有固定的结构。这些规律性的结构可由先验知识和背景知识得 到,我们称此类冗余为知识冗余。 视觉冗余:由于人眼视觉的非均匀性,使得人眼视觉对某些空间频率感觉 迟钝。因此视频中不同频率成分的内容对于人眼系统而言其重要性是不同 的。也就是说存在频域冗余。我们对于图像的编码和解码处理时尽管由于 压缩或量化截断引入了噪声而使图像发生了一些变化,但这些变化如果是 重庆邮电大学硕士论文第二章h 2 6 4 视频标准 不能被视觉所查觉的话,我们仍认为图像是完好或足够好的。像这样的冗 余,我们称之为视觉冗余。 常用的视频压缩方法有以下几种: 预测图像编码 预测法是最简单和实用的视频压缩编码方法,经过压缩编码后传输的并不是 像素本身的取样值,而是该取样的预测值和实际值之差。可分为帧内预测和帧间 预测。帧内预测基于同一幅视频图像中相邻图像采样值之间的很强的相关性这一 原理来实现压缩。 图2 1 邻近像素预测 以同帧一内邻近像素为例,图中假设一个像素x 是被编码的像素点,那么用点 a b 和c 组合来得到对于x 的预测,从x 中减掉这个预测,然后编码残差值。解码 器形成相同的预测,然后把解码的残差值加进去来重建像素值: 1 ) 编码器预测:p ( ) ( ) ; 2 ) 残差:d ( 均= x - p 被编码并传输; 3 ) 解码器解码d ( 均并组成同样的预测:p ( 淘; 4 ) 重建像素x = d l ( 殉+ p ( 均; 5 ) 编码器使用解码的像素值a b ,c 来构成重建x 。 帧间预测编码基于视频或动画的连续前后两帧具有很大的相关性这一原理实 现压缩。主要方法有帧重复法、帧内插法和运动补偿法等其中运动补偿法在视 频编码中使用的最为广泛。运动补偿预测通常可以采用单向预测( 一个参考帧) ,双 向预测( 两个参考帧) 和插值预测( 取两个参考帧预测值的平均) 来实现。由于运动补 偿预测可以有效的减少视频序列的时域冗余,因此成为构成当前主要视频编码标 准最基本的技术之一 变换编码 变换编码是通过信号变换来消除图像数据空间相关性的一种有效方法。尽管 图像变换本身不能对数据进行压缩,但由于变换后系数之间的相关性明显降低, 图像大部分能量只集中到少数几个变换系数上,采用适当的量化和熵编码可以有 效地压缩图像的数据量。而且图像经某些变换后,系数的空间分布和频率特性能 4 重庆邮电大学硕士论文第二章h 2 6 4 视频标准 与人眼的视觉特性相匹配,因此可以利用人类视觉系统的生理和心理特点来得到 较好的编码系统。变换的选择依赖于以下几个特点【5 】: 1 ) 在转换域中的数据是去相关性的( 转换域中的数据的大多数能量都会聚集 至0 很j 、的值中1 转换应该是可逆的。 。 3 ) 转换的计算过程应该是易于处理的。 由于正交变换的变换矩阵是可逆的,且逆短阵与转置矩阵相等,能够保证解 码运算有解且运算方便,所以变换编码总是选用正交变换来实现。正交变换的种 类有多种,例如傅氏变换、沃尔什一哈达玛变换、哈尔变换、余弦变换、正弦变 换、k a r h u n e n - - - l o e v e 变换( 简称l h ,变换) 和小波变换等。其中k _ i ,变换后的 各系数相关性小,能量集中,舍弃低值系数所造成的误差最小,但它存在着计算 复杂,速度慢等缺点,因此一般只将它作为理论上的比较标准,即作为一种参照 物,用来对一些新方法、新结果进行分析和比较。 由于离散余弦变换与k _ i ,变换性质最为接近,并且计算复杂度适中,具有快 速算法等特点,因此在图像数据压缩编码中广为采用小波编码是近年来随着小 波分析的研究而提出的一种具有很好发展前景的视频编码方法。作为一种多分辨 率分析方法,由于小波变换具有很好的时频或空频局部特性,特别适合按照人眼 视觉系统特性设计图像视频编码方案,也非常有利于图像视频信号的分层传输。 对图像和视频压缩以及很多的变换都建议使用以下两类方式:基于块的变换 和基于图像的变换。基于块的变换的例子比如k a r h u n e n - l o e v e 变换( k l t ) 嘲,单值 分解( s v d ) 和余弦变换( d c t ) 。每一种变换都是对于n * n 的图像块或剩余样本 来说的,这样图像就被用块的单元来处理。块交换有很低的内存需求而且很适于 基于块的运动补偿剩余帧的压缩,但是受边界区域的影响比较严重基于图像的 变换对于整个图像或帧来进行操作( 或一个图像的一大段进行操作) 最常用的 图像变换是离散小波变换p w r 或直接说小波变换) 。像d w t 这样的变换对于表 态图像的压缩来说已经被证明是很有效的了,但是它们对内存的消耗都比较大( 因 为整个图像或段都以单个单元来进行处理) 而且不适用于基于块的运动补偿方法。 d c t 和d w t 在m p e g 4 视频部分中都得到了应用( 而且一个d c t 的变种在h 2 6 4 中被使用) 熵编码 常用的熵编码有流程编码r l c 、霍夫曼编码( h u f f m a nc o o i n g ) 与算术编码 ( a r i t h m e t i cc o d i n g ) 三类。 当已被采样的图像视频数据拥有相同字节序列时,可以采用更紧密的序列 来代替这些相同字节序列,从而实现压缩。这就是流程编码。最常见的一种情形 重庆邮电大学硕士论文第二章h 2 6 4 视频标准 是,当采样量化后出现大量零系数的情形,利用流程编码来表示连零码,从而降 低表示零码所用的数据量。 霍夫曼编码是一种不等长最佳编码方法,这里的最佳是指对相同概率分布的 信源来说,它的平均码长比其他任何一种有效编码方法都短。最短的编码赋给那 些最频繁出现的字符,而概率小的字符则分配较长的码字,可以使用二叉树来说 明霍夫曼编码的过程。需要编码的字符用树的叶节点表示,每个节点都用p 值来 标识,p 指的是具体字符在相应子树中出现的概率。依次选择概率最小的两节点来 构成中间节点,直到形成根节点,这棵树的构造就完成了。显然,最终树的根节 点的概率为1 。在完成树的构造后,所有树枝都被赋上1 或0 ,则各输入字符的霍 夫曼编码就是从根到叶节点路径上的数字标志序列。霍夫曼编码必须知道信源的 概率分布,这一般是无法做到的,通常采用对大量数据进行统计后得到的近似分 布来代替。但是不同的图像类型其系数分布有差异,这导致实际应用时无法达到 最佳性能,改进的霍夫曼运算复杂不适合硬件实现。 算术编码方法是将被编码的一则消息或符号串( 序列) 表示成0 和l 之间的 一个间隔,即对一串符号直接编码成( o ,1 ) 区间上的一个浮点小数。符号序列越长, 编码表示它的间隔越小,表示这一间隔所需的位数就越多。信源中的符号序列仍 然要根据某种模式生成概率的大小来减少间隔。算术编码的过程,实际上就是依 据信源符号的发生概率对码区间分割的过程。 2 2 视频编码标准的发展史 近年来,图像编码技术得到了迅速发展和广泛应用,并且日臻成熟,其标志 就是几个关于图像编码的国标标准的制定,即国际标准化组织i s o 和国际电工委 员会i e c 关于静止图像的编码标准j p e g 、国际电信联盟1 1 u - t 关于可视电话,会 议电视的视频编码标准h 2 6 1 、h 2 6 3 、h 2 6 4 和i s o ,m c 关于活动图像的编码标准 m p e g - i 、m p e g 2 和础p e g 4 等。这些标准图像编码算法融合了各种性能优良的 图像编码方法,代表了目前图像编码的发展水平 h 2 6 1 视频编码标准1 7 】 h 2 6 1 是删t 为在综合业务数字n ( i s d n ) 上开展双向声像业务( 可视电话、 视频会议) 而制定的,速率为6 4 k b s 的整数倍。h 2 6 1 只对c i f 和q c i f 两种图像 格式进行处理,每帧图像分成图像层、宏块组( g o b ) 层、宏块( m b ) 层、块0 3 l o c k ) 层来处理。 6 重庆邮电大学硕士论文 第二章h 2 6 4 视频标准 h 2 6 1 是最早的运动图像压缩标准,它详细制定了视频编码的各个部分,包括 运动补偿的帧间预测、d c t 变换、量化、熵编码,以及与固定速率的信道相适配 的速率控制等部分。 h 2 6 1 在实时编码时比m p e g 所占用的c p u 运算量少得多,此算法为了优化 带宽占用量,引进了在图像质量与运动幅度之间的平衡折衷机制,也就是说,剧 烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质 量编码而非恒定质量可变码流编码。 h 2 6 3t s j h 2 6 3 版本2 t g j i - i 2 6 3 + + 【1 0 】 h 2 6 3 是删t 为低于6 4 k b s 的窄带通信信道制定的视频编码标准。它是在 h 2 6 1 基础上发展起来的,其标准输入图像格式可以是s - q c i f 、q c i f 、c i f 、4 c i f 或者1 6 c i f 的彩色4 :2 :0 亚取样图像。h ,2 6 3 与h 2 6 l 相比采用了半象素的运动 补偿,并增加了4 种有效的压缩编码模式,采用了无限制的运动矢量模式,熵编 码采用算术编码代替了霍夫曼编码,预测模式可将一个宏块划分为4 个8 8 亮度 块,采用p b 帧模式等技术。 r 兀r 1 在h 2 6 3 发布后又修订发布了h 2 6 3 标准的版本2 ,非正式地命名为 h 2 6 3 + 标准。它在保证原h 2 6 3 标准核心句法和语义不变的基础上,增加了若干 选项以提高压缩效率或改善某方面的功能。例如h 2 6 3 + 标准允许更大范围的图像 输入格式,自定义图像的尺寸等。 为提高压缩效率,h 2 6 3 + 采用先进的帧内编码模式;增强的p b 帧模式改进了 h 2 6 3 的不足,增强了帧间预测的效果;去块效应滤波器不仅提高了压缩效率,而 且提供重建图像的主观质量。 为适应网络传输,h 2 6 3 + 增加了时间分级、信噪比和空间分级,对在噪声信 道和存在大量包丢失的网络中传送视频信号很有意义;另外,片结构模式、参考 帧选择模式增强了视频传输的抗误码能力。 h 2 6 3 + + 在h 2 6 3 + 基础上增加了3 个选项,主要是为了增强码流在恶劣信道上 的抗误码性能,同时为了提高增强编码效率。这3 个选项为: 选项i j 一称为增强型参考帧选择,它能够提供增强的编码效率和信道错误 再生能力( 特别是在包丢失的情形下) ,需要设计多缓冲区用于存贮多参考帧图像。 选项v - 一称为数据分片,它能够提供增强型的抗误码能力( 特别是在传输过 程中本地数据被破坏的情况下) ,通过分离视频码流中d c t 的系数头和运动矢量数 据,采用可逆编码方式保护运动矢量。 选项w 在h 2 6 3 + 的码流中增加补充信息,保证增强型的反向兼容性,附 加信息包括:指示采用的定点i d c t 、图像信息和信息类型、任意的二进制数据、 文本、重复的图像头、交替的场指示、稀疏的参考帧识别。 7 重庆邮电大学硕士论文第二章h 2 6 4 视频标准 砌p e g 1 视频压缩标准 m p e ( 3 - 1 指定于1 9 9 2 年,可适用于不同带宽的设备,如c d - r o m 、v i d e o c d 他的且的是把2 2 1 m b p s 的n t s c 图像压缩到1 2 m b p s ,压缩率为2 0 0 :1 。传 输速率为1 s m b p s ,编码速率最高可达4 - - 5 m b p s ,但随着速率的提高,其解码后 的图像质量有所降低。m p e g - 1 主要是针对数字存储媒体,但它也被用于数字电话 网络上的视频传输,如非对称数字用户线路( a d s l ) ,视频点播和教育网等。 m p e g - 2 视频压缩标准 m p e g - - 2 指定于1 9 9 4 年,设计目标是高级工业标准的图象质量以及更高的 传输率。它所提供的传输速率在3 m - 1 0 m b p s 。m p e g - 2 技术就是实现d v d 的标准 技术,现在d v d 播放器已经在家庭中普及起来了,除了用于d v d 外,还可以为 广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频。 m p e g - 4 视频压缩标准 。 m p e g - 4 旨在将众多的多媒体应用集于2 个完整的框架内,为不同性质的视 频、音频数据制定通用的编码方案,提出基于内容( c o n t e n t - b a s e d ) 的视频对象 ( v i d e oo b j e c t ) 的编码标准。它不仅针对一定比特率下( 4 8 0 0 - - 6 4 0 0 b p s ) 的视频、 音频编码,更加注重于多媒体系统的交互性和灵活性。为了达到这个目标,m p e g - 4 引入了对象基表达( o b j e c t - b a s e dr e p r e s e n t a t i o n ) 的概念,用来表达视听对象 ( a u d i o v i s u a lo b i t s ,a v o ) ;m p e g - 4 扩充了编码的数据类型,由自然数据对象扩 展到计算机生成的合成数据对象,采用合成对象,自然对象混合编码 ( s y n t h e t i c n a t u r a lh y b r i dc o d i n g ,s n h c ) 算法;基于内容的压缩编码是m p e g 研 究的热点。m p e g - 4 的编码系统是开放的,为各种多媒体应用提供一个灵活的框架 和一套开放的编码工具,不同的应用可选取不同的算法。 m p e ( 3 - 7 视频压缩标准 m p e g - 7 的工作于1 9 9 6 年启动,名称叫做多媒体内容描述接d ( m u l t i m e d i a c o n t e n td e s c r i p t i o ni n t e r f a c e ) ,目的是制定一套描述符标准,用来描述各种类型 的多媒体信息及它们之间的关系,以便更快更有效地检索信息。这些媒体材料可 包括静态图像、图形、3 d 模型、声音、话音、电视以及在多媒体演示中它们之间 的组合关系。m p e g - 7 的应用领域包括:数字图书馆( d i g i t a ll i b r a r y ) ,例如图像目 录、音乐词典等;广播媒体的选择,例如无线电频道,t v 频道等:多媒体编辑, 例如个人电子新闻服务,多媒体创作等等。 m p e g - 2 1 视频压缩标准 m p e g - 2 1 的正式名称是多媒体框架( m u l t i m e d i af r a m e w o r k ) ,又称数字视听框 架。它提出了“将标准集成起来相互支持和相互协调以管理多媒体商务”的口号。它 是一个在交互通信中的多媒体框架、综合应用标准。 b 重庆邮电大学硕士论文第二章h 2 6 4 视频标准 m p e g - - 2 1 的主要研究目标是:讨论是否需要和如何将协议、标准、技术等 不同的组件有机地结合起来,讨论是否需要新的规范,以及讨论在具备上述两个 条件的前提下如何将不同的标准集成在一起,需要什么样的新标准以及完成这些 标准需结合做些什么工作。m p e g - 2 1 可以描述残一些关键技术的集成,这些技术 可以通过访问全球网络和设备,实现对多媒体资源的使用。 表2 1 视频标准 标准码率应用制定时间 口e g 11 5 m b i t s家用v c d1 9 9 1 焦 数字视频广播 ( d v b ) 、家用 口e g 2 4 l o o m b i t s 1 9 9 4 生 d v d 、高清晰度电 i s o 也c 标准 视( h d t v ) m m e gm p e g 一4 1 2 8 k b p s - - 3 8 4 m b 。 交互多媒体 1 9 9 9 矩 p s 多媒体内容描述接 m e ( 卜71 9 9 8 矩 口 前期开发 田e g 2 1多媒体框架 阶段 电视会议、可视电 h ,2 6 1 6 4 k b p s - - 1 9 2 m b p s 1 9 9 0 焦 话 i t u t h 系列h 2 6 3 6 4 k b p s视频会议系统 1 9 9 6 盆 h 2 6 3 + 6 4 k b p s视频会议系统 1 9 9 8 焦 h 2 6 3 + + t o 时,g ( 口,夕) = h 当l 口一夕l 瓦时,g ( g ,) = 0 - 上述各种匹配代价函数各有特点,适用于不同的应用场合,其中,均方误差 m s e 和绝对值误差和s a d 使用的最多,m s e 糖度最高,但是运算量最大。一般 在运动估计的理论分析中,常使用m s e 作为分析的工具,实际应用中由于s a d 计算简单,易于流水实现,更多的为运动估计算法采用为匹配代价函数 寻找最佳匹配块是帧间图像编码的关键,而最佳匹配块是靠运动搜索来获得 的运动搜索就是在搜索算法指定的路径中寻找最佳匹配块及最匹配的运动矢量, 各种搜索算法的主要区别就在于如何选择指定搜索窗口内的搜索路径和匹配准 重庆邮电大学硕士论文第三章h 2 6 4 帧间编码及快速实现 则。在匹配准则己确定的情况下,搜索算法的准确度、及搜索算法的运算量是衡 量搜索算法好坏的标准, 在h 2 6 4 中,最简单和最可靠的计算运动估计的方法是全搜索法( f s ,f u l l s e a r c h ) 它首先进行运动向量预测,获得初始运动向量以后,把这个向量作为 搜索中心进行块匹配搜索,划定搜索中心周围的一个范围,对该范围内的矩形区 域内的所有的点,按照选定的匹配准则,计算一次匹配值,并从中选出最优点作 为这次搜索的结果。全搜索算法的优点是可以找到限定范围内的全局最优点,运 动估计精度比较高,其不足在于计算量太大,算法复杂度高。 - 一2 d 1 + 酿- 纠 3 2 快速搜索算法 图3 2 全搜索法示意 运动估计快速搜索算法主要包括:分层的和多分辨率的快速块匹配方法;基 于连续消除的快速块匹配方法;基于象素子抽样的快速块匹配方法:固定搜索模 式的快速块匹配方法 分层的和多分辨率的快速块匹配方法 在较粗糙的分辨率下预测一个接近的大尺寸的运动矢量,然后在较高的分辨 率下进一步修正。其缺点在于:计算过程复杂,内存需求较大。 连续消除法。 其算法思想如下: 重庆邮电大学硕士论文第三章h 2 6 4 帧间编码及快速实现 假设沏,一) 表示第k 帧坐标为( i n n ) 的灰度值, 则有: f k ( m ,刀) 一丘一。( 肌+ f ,刀+ j ) 撩释系统懿成的驱动 诈i | jr 外没,功融等的傀化鞔辨 馊娜棚搬l c d 硬髓、列鼎的 毓 。输出流 4 2 2t m s 3 2 0 d m 6 4 4 6 数字 媒体 a p l 僚号箍理崖( s 盹) l c o o l c p l j 1 。一 c 耐e c s :储蟹处j 嚯算法 e o 血ce n g i n e :抽象,软件器予使耀 拍; j 于系统与处艘器鹈结 鸯特荭的 j c 亿软件 瞒p 培l o 彭 絮h t 撵侔系! 宽 一图4 3d a v i n c i 软件结构 达芬奇( d a v i n c i ) 技术的产品包括t m s 3 2 0 d m 6 4 4 6 1 2 0 ! 、t m s 3 2 0 d m 6 4 4 3 、 t m s 3 2 0 d m 6 4 3 7 、t m s 3 2 伽) m 6 4 3 5 、t m s 3 2 0 d m 6 4 3 3 、玎v
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美术表情创意课件
- 2025年电商内容营销策略优化:种草经济下的品牌战略研究报告
- 2025年事业单位工勤技能-湖北-湖北广播电视天线工五级(初级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-海南-海南铸造工四级(中级工)历年参考题库含答案解析
- 2025年零售门店数字化智能化门店导购系统技术应用与用户体验优化案例研究报告
- 2025年事业单位工勤技能-河南-河南计量检定工二级(技师)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-江苏-江苏工程测量员四级(中级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-广西-广西政务服务办事员一级(高级技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-广东-广东防疫员四级(中级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东机械冷加工三级(高级工)历年参考题库典型考点含答案解析
- 2025年度运输业安全生产知识竞赛试题(附答案)
- 光伏居间的合同8篇
- GB/T 45418-2025配电网通用技术导则
- 医疗风险防控培训课件
- 机械设计部绩效考核制度
- 诊疗规范培训课件
- 《KANO模型培训》课件
- 复苏室患者的交接流程
- DB21-T 2523-2015矿山地质环境恢复治理规程
- 新能源集控中心建设方案
- 《中国老年糖尿病诊疗指南(2024版)》解读课件
评论
0/150
提交评论