(通信与信息系统专业论文)视频编码算法的研究与标准的实现.pdf_第1页
(通信与信息系统专业论文)视频编码算法的研究与标准的实现.pdf_第2页
(通信与信息系统专业论文)视频编码算法的研究与标准的实现.pdf_第3页
(通信与信息系统专业论文)视频编码算法的研究与标准的实现.pdf_第4页
(通信与信息系统专业论文)视频编码算法的研究与标准的实现.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(通信与信息系统专业论文)视频编码算法的研究与标准的实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文研究了视频编码的关键算法,并根掘视频编码标准的要求在改进一些 关键舞法楚基礁上分澍实壤了逶爱于霹程毫话豹壬 2 6 3 挺准秽逡蠲予多媒体业务 的m p e g 一4 标准中基予d t 霸貉编码部分。 首先,本文针对h 2 6 3 编码器的特点,提出了在传统的d c t 变换前加预先 零块判断和变换运动估计参考点等改进饽法。实验表明,本文的改进算法非常有 效,避免了大量冗余计算,在保证图像质量的同时提高了编码效率,提两了压缩 比。然螽,本文按照m p e g 4 标准对d 7 1 1 鄹擦对象编羁的要求,挺出tm p e g - 4 巾蘩予鼹捂对象缡蘑静系统涯架。在诧疆懿上,豢重研究了瓣稳节点的运动话诗 蟑法,提出了一种新的逐续预测d t 网格形变及相应的残差处理方法,并对整个 d t 问格的拓扑结构进行转换,使之拓扑哭系完全按照标准要求进行编码,从而设 计了一套完整的基于d t 网格的m p e g 一4 编解码方案。 最后,本文把基予d t 鲮m p e g 一4 编码性靛嘲h2 6 3 缟码睦髓进嚣了全面鲍 比较,结果表羁,d t 擘为m p e g 一4 标准中静一糖编码方法,在辫象质量、压缩毙、 多分辩率、避免块效应方面有很大的优越性,有一定的实用价值。 关键词:视频编码m p e g 一4 网格对象运动估寸! j 补偿d e l a u n a 5 三角形 a b s t r a c t t h i sa r t i c l es t u d y st h ek e ya l g o r i t h mo fv i d e oc o d i n ga n di m p l e m e n t st h eh 2 6 3 a n dm p e g 一4b a s e do nd t m e s ha c c o r d i n gt ot h es t a n d a r d so fi t u ta n di s o i e c f i r s t l y , t w on e wa l g o r i t h m sb a s e do na n a l y s i so ft h es t a n d a r d sh 2 6 3s y n t a xa r e p r o p o s e d o n ei s 0 1j u d g m e n to fz e r ob l o c kb e f o r ed c t 氆eo t h e rc h a n g e st h e r e k r e n c ep o i n t sw h i c hc a l lb eu s e dt om o t i o ne s t i m a t i o n e x p e r i m e n t a lr e s u l t ss h o wt h a t t h i sf o r m u l ai m p r o v e st h es p e e do f v i d e oc o d e ra tt h es a t i r ep s n rv d t h o u td a m a g i n gt h e i m a g eq u a l i t y t h e nt h i sp a p e rd e s i g n sa ni n t e g r a t e dc o d i n ga l g o r i t h mb a s e do n d t - m e s ha c c o r d i n gt om a n d a t eo fn 摩e g - 4i nw h i c ham o t i o ne s t i m a t i o na l g o r i t h m b a s e do i ld t m e s hi sp r o p o s e da n dd a t as t r u c t u r ei st r a n s f o r m e di no r d e rt of u l f i l lt h e c o d i n go r d e ro fm p e g - 4 f i n a l l y , c o m p a r e dw i t ht h ef o r m e ra l g o r i t h mo fh 2 6 3s t a n d a r d s t h ea d v a n t a g e s o ft h el a t t e ra l g o r i t h mi nm 畔e g 一4a r eh i g hc o m p r e s sr a t i oa n dm u l t i r e s o l u t i o nw i t h u t i l i t a r i a nv a l h e k e yw o r d s : v i d e oc o d i n gm p e g - 4m e s ho b j e c t m o t i o ne s t i m a t i o na n d c o m p e n s a t i o nd e l a u n a yt r i a n g u l a t i o n 卢明 论文独创性声明 本人卢明所呈交的论文是我个人在导师的指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢中罗列的内容外,论文中不包 含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其 他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的 贡献均已在论文中做了明确的说明并表示了谢意。 本人签名! 塑赵兰雯 日期:五签型:墨翌 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:学校 有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或 部分内容,可以允许采用影印、缩影或其他复制手段保存论文。( 保密的论文在解 密后遵守此规定) 本人签名:二丑j 丛三仁 日期:上鲤婆j 幺乙一 导师签名圭錾堕: j 闩期 如“1 、 第一章绪谂 第一章绪论 l 。l 视频编码技术研究的背景 裰频逶售以萁壹躞瞧、确凌往、生动瞧熬穗点在多攥傣递信中占有重要懿建 位,颡戴,实现视频的实甜传输一直是馨髓醑究的主要方自之。但是,出于视 频图像的数据量十分庞大以及人们对视频通储业务的要求不断增长,特别是近几 年来视频通信与通信信邋带宽之间的矛盾十分突出,特别是人们对多媒体业务的 需求增多,比如:多媒体会议、可视电话、视频点播( v o d ) 、多媒体信息业务等, 委搬粼了这对矛蜃鲍发矮曩。甄以,针对多媒体透信业务中救援颂数据戆有效 压镶童是菲靠重要鹣潆惩。 庞大的视频数据无疑绦数据的存储、传输以及计算机的处理速度等都增加了 极大的压力,这样就阻碍了计算机及多媒体技术的发展,如何消除这样的障碍成 为我们急待解决的问题【2 川。单纯用扩大存储器容量、增加通信线路的传输速率 款势法是不理实的。幸运的是,经过研究发瑷,这些视频数攥在空竣和对蠛有缓 大翁冗余睦;多媒藩数撵压缩毽是可憝翡,鞫为,多媒体文、声、静蘑缘、筏额 图像簿信源数据也有大登的冗余信息【1 】。数攒压缩就是将庞大数据中的冗余信息 去撵,保留相互独立的信息分量,以静止图像画面为例,数字图像的灰度信号和 色麓信号在空域( x ,y 搬标系) 虽然属于一个随几场分布,但是它可以看成为一 个平稳的马尔可夫场1 2 j 。躲图像像素点在空域中的灰度值和色差倦号僮,除了边 赛轮薅乡 ,骜是缓漫交傀,毙羹一耀天静头爨豫蓉,背景、久黢、头发等处起葳 魔、颜色都是平缓改变。褶邻像素的灰度和色涟值比较接近,信息有较多的冗余, 但是如何先排除冗余信息,再进行编码,使畿示每像素的平均比特数下降,这就 是通常所说的视频图像的帧内编码,以减少空域冗余进行数据压缩。视频图像是 沿时间轴方向的一个帧序列,其帧间图像的棚关性也是很强的,邋常采用运动估 诗秘运动羚嫠赘方法以减少露域懿冗余售意,这鹜压绫睾鼙频数撬麴嚣懿”辩l 。 规频压缩技术无论在是用上还是在军攀t 帮有重要豹应用价缓| 。”。在民用上, 若视频信号能以高压缩比在甚低比特率下传输( 小于6 4 k b p s ) ,则人们在p s t n 通信网、移动通信网上即可实现视频通信,傻通信网的频率利用率大大的提高。 可以满足人们目益增长的多媒体业务的需求。在军事上的应用更为j “泛,螺前沿 偾察、藏场数可稷电话、军事会议龟援等。笼其在战争环凌 鬻恶劣的条静下, 信道容量报小,要实璐视频通信,剐需要曼离压缩比的视频编鹚信号 2 1 】。 纵上所述,视频编码技术研究有其重大的理论意义和实用价憾,他对促进多 媒体通信的发展有非常鬓臻的积极意义。 硕士论文视频编码算法的研究及标准的实现 1 2 视频数据压缩编码的发展 视频压缩编码的理论基础是信息论,从信息论的角度来看,压缩就是从时域、 空域两方面去掉信息的中的冗余1 1 1 2 1 3 1 。即保留不确定的东西,使用一种更接近信 息本质的描述来代替原有的冗余描述。这个本质的东西就是信息量。视频编码正 是在仙农信息论的基础上发展起来的。编码方法大致可分为三类1 2 】1 4 : 1 考虑到图像信源的统计特性采用的预测编码方法、变换编码方法、矢量量 化编码方法、子带一小波编码方法及神经网络编码方法等: 2 考虑到视觉特性采用的基于方向滤波的图像编码方法、基于图像轮廓纹 理的编码方法; 3 考虑到图像传递的景物特征,采用的分形编码、基于模块的编码方法。 第( 1 ) 类方法以仙农信息论为基础:第( 2 ) 类方法试图克服上面提到的仙农信 息论的第一个缺陷:第( 3 ) 类方法则试图克服仙农信息论的第二个缺陷。也有人将 图像编码方法分为两代,即第( 1 ) 类方法为第1 代,第( 2 ) 、( 3 ) 类方法为第2 代。这 也是合理的。因为基于模型的编码方法就是由轮廓一纹理的思路发展而来的。这种 统一是由于人眼视觉系统是一种最优的图像编码系统,人眼视觉特性应该与图像 中传递的本质特征一致。因此,从逐渐向信息传输本质靠近的程度看,压缩编码方 法又可以分为下面三个层次: 第l 代基于数据统计( 去掉数据冗余) 低层。 第2 代基于模型( 去掉内容上的冗余) : 物体基( o b j e c t b a s e d ) 中层: 语义基( s y n t a x b a s e d ) 高层。 基于模型的压缩编码方法代表着新一代的压缩方法也是目前最活跃的研究 领域。该方法1 9 8 3 年首先由瑞典的f o r c h h e i m e r 提出,随后,日本的h a r a s h i m a 等也 展示了其研究成果。此后的研究主要沿语义基和物体基两个方向发展。 语义基方法: 基于限定场景。景物中物体的三维模型严格已知,这样只需对 一些有限的参数编码,压缩比非常惊人。但由于受目前视觉等领域的研究水平所限, 语义基编码的研究主要局限于人的头肩像场景,今后可望应用于视频电话、视频会 议等领域。国外许多学者对此进行了研究,我国学者周峰和李海波在此方面做了许 多有意义的工作。目前仅有少量学者对行走的人体场景进行研究。该方法最大的 问题在于,可以编码的图像场景单一、局限,在实际应用中极不灵活,只要情况稍有 变化模型就会失效。所以,这种方法只有当计算机视觉研究取得突破性进展之后 才具有普遍意义和实用价值。因此,可以认为这是一种未来的编码方法。 物体基方法:针对未知场景。需要先对图像进行低层分析,将场景中物体和 背景分割出来,分层描述。常用的描述模型有三要素:形状参数、运动参数、内部 纹理( 残差) 参数。国外学者在这方面研究最多,而国内学者很少有人进行这方面的 第一章缝论 研究。该方法最大的问题在于分割,这也是视馓中的一个传统问题,难度很大,但在 分割国标明确的情况下邂是有一些办法的。 因此,从接近信息传输本质和技术上的可实现性这两方面综合权衡来看选择 物薅蒸方法较合适 在i p 视频通信应弱中,编码方法的选撵不但要考虑到匿缩院、信礤沈,还要 考虑到算法的复杂性。太复杂的编码算法可能念产生较高的压缩比,但也会带来 较大的计算开销,软件实现时会影响通信的实时性。 1 3 国内外的研究动态 囊藤,穰频编玛技零主要毒嚣静研究方嗣,一是对传统运动鞭测3 e t 斡混合 编鹤方案豹穆正和改避,戳适应低 特率传输豹要求和提高视频漳褥质量,称为 古麒阁像编码技术或第一代图像编码技术( 或称波形基编码技术- - w a v e f o r m b a s e d , c o d i n gt e c h n i q u e s ) 2 ,二是寻求更为复杂的运动模型以克服传统方法的缺点, 被称为现代图像编码技术戏第二代图像编码技术。已发布的国际标准和建议主要 是瓣一葶孛方肉,虹h 。2 6 1 5 1 , 2 6 3 1 酏,m p e g l g l ,m p e g 一2 8 1 等。第二聱 硬究方向主 要爱瓣蓊广泛亏l 超注意豹模型基编磅按寒( m o d e l b a s e dc o d i n gt e c h n i q u e s ) , 对模型基图像编码技术,嘲外研究水平较高的主要有:f j 本东京大举的h a r a s h i m a 研究组、瑞典l i n k o p i n g 大学的f o r c h h e i m e r 副教授的研究组、德图汉挪威大学 的m u s m a n n 教授的研究组,藻国e s s e x 大学饿p e a r s o n 教授的研究蛆。过去,模 型鏊编码技术主要集中予谶频电话的应用场合,蕻普遍适用性受到很大的限制, 因为这些方法都是对謦豫疯餐有走验缓设豹。褥欢泱;款r a c e 礤究计划中豹鹾究a 员掩出了一个m o r p t l e c o 方察,并把它作为r a c e 计划作为m a v t 的m p e g 一4 1 9 1 酬| :1 】f 】2 】 s e s a m e 建议,其基本框架是分割基编码( s e g m e n t a t i o n b a s e dc o d i n g ) 。在编码 中,阁像区域是基于形态滤波器进行分割的,它没有对图像内容作出任何假设, 因两翼有较好的普遍适用燃。 弦魏i s o i e c 公蠢夔m p e g 一垂蠡凑,其最大懿特点裁是基予对象靛缡羁戮”l , 所以对象的分裁是所有编硝的基础h ”,对予不同的对象可阻莱瓣不| 司的编码算 法,比如:纹理编码、湖格模型基编码、人脸对象模型编码i ”l 1 3 】 1 4 】等。国内外在 这方丽的研究也已经开始。有许多单位正在对蕻进行积极的研究f l m 【j “。一面追踪 p e g 一4 的标准化进程,一积研究新的压缩编硝算法。 藏整舀际蠢准亿缝织鹣余久,视频壤璐黪发震会更燕繁荣,也会雯搬蓑动栽 颓应嗣豹产业纯,有鉴于此,本文首先研究了基于传统豹运动鞭测d c t 的h 2 6 3 抛频编码算法,在实现标准编解码器的基础上提出了改进算法:又着重研究了基 于d r r 模型基的m p e ( ;一4 的视频编码算法,并提出了我们自己的完整的编解码方案。 硕士论文视频编码算法钧研究及标准的实现 1 4 本文所研究的内容及所做的主要工作 本文的重点是算法设计,主要研究了适用于低比特率环境下的视频编码标准 及萁算法。赝戳主要包括两部分:一部分是匿缓t # 呵戆h 2 6 3 标准,掰徽款缡 解码算法褥究;舅一部分楚蕊绕t s o i e c 涎m p e g 一4 标准掰骰的编解溺箨法研究。 所有的工作都是在软件的基础上完成的。所采罔的编程工具为v i s u a lc + t 6 0 。 首先,本文分析了i t u - t 、i s o i e c 等标准化缀织所公布的h 2 6 x 、m p e g x 系列标准,特别是在透彻分析了适用于可视电话系统的h 2 6 3 标准的熬础上,用 软件实璇了h 2 6 3 缡解码嚣。浚编码器能够输窭标准的h 2 6 3 比特滤维稳,解鹂 器能锯释标准靛 e 麓终捣。并褒分祈了编码器径麓麓基磁上,铮瑟鬣耨时筠d c t 变换和运动估计部分提出了自避的改进措施,大爨的实验结果表明,本文的改进 方法在保证图像质量的前提下,对编码器效率和编硒速度方面都有2 0 一3 0 的提 高,从而优化了编解码器。 其次,本文又着重研究了隧际标准化组织最耨公布鳆m p e g 一4 标羰,特是研究 了m p 弱一4 熬事曼藏编码方案农褥滚结搀翻【2 1 】【l ;在分辑了文蘸 1 7 】 2 l 瀚爱0 j 网格描述图象及文献 2 2 【2 5 】的d t 网格节点邀渤估计等方法的基勰上,提出了 用网格的连续形变来跟踪视频运动算法,并把新的撼于网格编码的m 辫法用到了 m p e g 一4 编解码中,从而建立了完整的基于d t 网格艇的m p e g 一4 的视频编解码方案 2 6 1 。实验证鼹该方法对提高橇频的压缩比、满足不圆分辨率要求等方磷豁有很大 懿甓势。 此外,在专题研究期闻笔者还完成了h 2 6 3 、黼p e g 一1 、n p e g 2 比特流之间的 转换工作,从而满足了不同环境下的应用需要。 本文备章节的内容安排如下: 第二濑介绍常用的视频聪缩算法以及视频编码标准的特点和使用藏丽。 第三露壤据 王。2 6 3 援鬏缡弼标准竣诗了h 。2 6 3 戆编磐羁霎法及浚獠,荠爱软 件实现了h 2 6 3 视频编码,缭斑了本文的创新之处,即算法改进,并以数据、图 表来说明本文改进算法的优越性。最后介绍了h 2 6 3 、m p e g - 1 、2 之间的比特转 换的方法及策略。 第四肇酋先介绍了m p e g - 4 标准及其关键算法,其次分析了文献 1 7 】 2 1 】 懿雳d t 瓣捺对蚕豫进霉亍播达熬雾法及文蘸 2 2 】 2 习瓣d t 霹搭节煮遴凌毽诗方 法,针对其不符帮i v i p e g 。4 国瑟求豹不足,改遗了溺格节点蕊运动髅诗方法,并 把基于d t 的图像描述算法应用到m p e g 一4 编码解码中,最后,在实现了对d t 网格形变的连续跟踪的基础上提出了一整套适用于m p e g - 4 的基于d t 的视频编 解码方案。最后,本文对新的编码方法的优越性加以分析。 第二章视频压缩方法及标准的发展 第二章视频压缩方法及标准的发展 视频被描述为一组连续的画面,而每幅画面看作是二维的像素阵列,每一像 素的彩色表示包含三个分量:r g b ,这称为图像的r g b 空间表示,但大多数压 缩算法是一个彩色空间,即在y c r c b 空间中进行压缩处理( 2 3 1 t 5 l 【6 1 ( 2 7 1 1 2 8 1 。在y c r c b 空间中,每一彩色像素是用另三个分量表示的:亮度分量( y ) 以及两个色差分 量( c r ,c b ) 。我们可以利用两个空间的联系进行空问转换,如下是两个空间相 互转化的公式: y=o2 9 9 r + 0 5 8 7 g 。o 1 1 4 b c b = 一0 1 6 8 7 r 一0 3 3 1 3 6 + 0 5 b + 1 2 8 ( 2 - 1 ( a ) ) c r = 0 5 r 一0 4 8 7 g o 0 8 】3 b + 2 8 r = y + 1 4 0 2 ( c r 一1 2 8 ) g = y 一0 3 4 4 1 4 ( c b 一1 2 8 ) 一0 7 1 4 1 4 ( c r 一1 2 8 ) ( 2 - l ( b ) ) b = y 1 7 7 2 ( c b 一1 2 8 ) c b 、c r 应该是一个有符号的数字,而序列里的数据都是无符号数,所以这里对c b 、 c r 进行了处理( + 1 2 8 ) 。 进行两个彩色空间的转换是基于人类视觉系统的特性:在r g b 空问中,r 、g 、 b 三个信号有一个发生了变化,则总的图像的颜色就会发生变化,人眼是很容易 察觉这种变化的;然而人眼对y 、c r 、c b 三个信号的变化是有不同反应的,其中 亮度信号的变化比较敏感,而对色差信号的变化不是很敏感,这样就u r 以更多的 考虑亮度信号,而对色差信号采用一些处理方法以提高压缩比;比如即使经过亚 采样或直接丢弃一部分数据等处理,但人眼对恢复时转换到r g b 空f u j 后的图像的 变化仍然是不易察觉的1 】 2 】1 5 】【6 】a 所以不管在j p e g 标准,h 2 6 x 标准还是这里的 b l p e g 系列标准都要将视频源从r g b 空间变换到y c r c b 空间中去,对亮度分量直接 进行处理( d c t 变换、运动估计) ,对于色差分量,因为人眼不太敏感,所以先对 色差信号进行亚采样( 一般为4 :2 :0 ) 格式【5 】7 ,然后进行变换或预测,这 早要注意一点,就是色差块的运动矢量是由亮度块的运动矢量计算来的,而不是 直接对色差块进行预测得到的。 2 1 常用的图像压缩编码方法3 2 1 1 变换编码 变换编码的基本原理3 | 【4 l ,是将原来在空问域描述的图像信号,通过一种叫 正交变换的数学变换,变换到另一个正交矢量空间( 称为变换域) 中进行描述, 即把信号由空问域变换到变换域中用变换系数来描述。这时,人们发现,这些变 换系数之、日j 的相关性明显下降,并且能量常常集中于某些低频或低序系数区域中。 蕺士论文筏额编璃算法的荟嚣究及标准豹实现 这样,很容易实现码率滕缩,因为变换系数的公式部分为零,或狠接近零,可以 舍去,而只对少数低频分缀分配一定比特数。为恢复原信号,要经逆正交变换回 到空闯域,这就实现了变换压缩编码。如图2 ,l 鼹示。 燮按 编码技东 空域信 交换城空闽域信 讫冬等 号( 图象 信号( 变号( 逆变换 著量寻曼兰兰兰二 三三三三 二兰竺三巾 至三三三匿 二 本上比较 图2 王e 交变按躺蕊原理框图 箴熟,理论也较完备,广泛应用于各释匿像数耀压缩标准中,诸鲡适用于静止藿 像的j p e g 、适用于运动阁像的i p e g 一1 、, 1 , f p e g - 2 以及多媒体计算机技术中的视频 帧内图像压缩和帧间图像压缩等【2 【3 1 5 1 【6 】o 正交变换的种类很多,如傅里叶( f o u r i e s ) 变换、沃尔什( w a l s h ) 变换、啥尔 ( h a a r ) 变换、敲( s l a n t ) 燮羧、余弦交换、正弦变换、k - l 变换等等。可以证暖k l 蜜羧是最优变换,这辩变换系数之瘸稿关穗为零,毽没有快速瓣法,实瑷比较 困难。_ 些快速正交变换如傅里叶变换有快速算法,但其能量集中性不如k l , 高频分鬟有的增加,加上复数运算的复杂性,目前在编码中已不应用f i 】2 3 1 d 。余 下的几种j f 交变换中,余弦变换( o c t ) 被认为是次最优的,因为d c t 与k l 变换 压缩性糍积误差缓接近+ 藤d c t 计算复杂爱邋申,又具有可分离姆性,还有嵌速 算法等特点,蒋戮一壹驳寒在霾像数据基缭中,采霸离教余弦受羧编码豹方案缓 多。其中m p e g 系列和h 2 6 x 系列都直接或阃按的使用到了d c t 变换。 任一图像的n x n 二缎余弦变换和逆变换可用式( 2 2 ) 、( 2 3 ) 表示: u,v)=砉纠酬萎n-i丢n-|f(u册) c o s ( 等茅吣o s ( 堡v 硼 ) = 寺e ( “) 4 嚣( v ) ,( ) 等册) c o s ( v 石) 1 h 0mv “,v = 0 , 1 。,n 一1 f 7 - 2 1 式中,当“= o ,v 。0 时,e ( h ) ,e ( v ) = 1 2 : ( v ) 勋,v ) c o s ( 等宇训c o s ( 垦学v 硼 y ) = 寺【( v ) f ( 枉,v ) 等;f 石) c o s ( v 硼( 2 3 ) 其中f ( x ,? ) 和f ( u ,v ) 分别为图像矩阵和变换矩阵中的元素。离散余弦 变换( d c t ) 将。v ( n 的像豢德的块转换成3 3 n 的水平和垂直空间与频率系数矩阵。 对空域频率系数进行离毂余弦逆变换( i d c t ) ,可以重梅脓n 黪像素块。通常n 辩二章援簇歪壤方法菠标准的笈曩 7 取8 。一般说来,大部分能量集中在低频系数上,即写在变换她阵左上角的那些 系数。通过量化可以获得厩缩。在块的( 0 ,0 ) 位置( 左上角) 的d c t 系数代表水平 和藏赢频率都是0 ,也称为奁流系数( d c ) 。d c 系数与8 8 的像索块的平均值成 玉魄,且透过羲测编鹞霹戳遴一步莲续,嚣必鞠邻秀个n x n 赘缀豢块戆平均篷旋 羞榴对缀小,所以通过鞭溺编码可以迸一步聪缭。其余的系数代袭水平和垂直豹 空1 瑚频率,也称为交流系数( a c ) 。通过选择合适的量化步长使系数的量化级别与 空域频率的高低相对应,将有助于产生零值a c 系数,这样做使得人类视觉系统不 太可能观察至u 特定空域频率信号的损失,除非系数值超过量化级别。对高阶系数 连续豹零系数孬速行孝亍稔缡码、统计编码纛霹敬获零更高款压绫晓。变换编码与 d p c m 楣比,算法较复杂,毽没有误羁扩敲闷溪,有误码只在所交换豹子銎镙区域 内。d p c m 的实现较简单,但由于预测是采用解码后的像素进行的,因此有误码累 积和扩散问题。目前几种国际标准j p e 6 、h 2 6 x 、m p e g 系列都建采用d c t 变换的 方法米进行数据压缩的。 2 。1 2 预溅编码( d p c i d ) 凌窭缘兹统诗跨霞爵鲡,疆鬈缘素之越蠢较强兹籀关经,羧戴,其像素静僮 可根据以前已知的几个像素来预测。如果预测系数是固定不变的常数,则称为“线 性预测”。用这种原理工作的编码器与解码嚣,容易利用硬件来宓现。 舆体说来,预测编码器输出的是信号当前的实际值与信号当前的实际值与信 号预测值之间的差值,因此,这种预测编码法咆被稼为差值脉、砷缡码诵制法d p c m 。 x , 图2 2d p c m 编码器的框图 d i p c m 系统的原理横阁见图2 2 。图中输入信号为x 。( t 、时刻的亮度抽样值) , x 。为援据氛时刻羲已基群的亮度搪襻僮x ;、x 。、x 。对x 、骶 乍载颡溅毽。e 。为误差 信号。量讫器输出为e 、,量纯器兹量纯误羞为q 。在接收溃群褥器豹输出为x 、。 在接收端输出与发送端输入之间的误差为: x 、一x 、7 = x 、一( 。+ e ) = ( 一x 、) - - e 、= e 、一e 、= q 、 ( 2 - 4 ) 这正是发送端量化嚣导致的量化误差( 爨化噪声) ,它与解碣器无关。由图 硕士论文视频编码算法的研究及标准的实现 2 2 ( a ) 可知,编码器也是使用恢复值。来预测以后的像素的,即发端与收端 的预测值是同样的x 。,因此收端的输出值必然是z 。与e 。之和。应用均方误差 为极小值的准则,可利用z 。的公式: x ,= x + x + + qn l x ( 2 5 ) 按不同图像求出各个预测系统。可以证明: 。! 。= e ( x 、一x 。) :) = 口2 一( r h + q ! r 。+ q 。凡。)( 2 - 6 ) 可见,o ! 。 口2 甚至可能有o2 。 3 8 4 k b s 则速率较高,可以传输清晰度尚好的图像,所以适用于电视会议。它 支持的图像格式:c i f ( 3 5 2 2 8 8 ) 、q c i f ( 1 7 6 x 1 4 4 ) 两种格式。 2 3 6h 2 6 3 t 钏叫 j 12 6 3 是i t 5 一t 关于比特率低于6 4 k b p s 的窄带通信视频编码建议。由于h 2 6 3 是在i t u t 的h 2 6 1 建议的基础上发展而来的,因此两者有许多共同之处。例如 h 2 6 3 信源编码的基本框图与h 2 6 1 非常相似,其信源编码算法的核心仍然是 h2 6 1 建议中采用的d c t m c 混合编码器。 但是为了适应极低码率传输的要求,h 2 6 3 建议在图像格式、块组( g o b ) 结 构、宏块、运动估计精度、改进了变换系数编码的h l ,f f m a n 码表,并用( 1 a s t , r u n ,l e v e l ) 组合代替( r u n ,l e v e l ) 组合、四个可选模式等方面做了改进,具 体的改进内容在本文的第三章进行介绍。 硕士论文视频编码算法的研究及标准的实现 第三章h 2 6 3 编码器的实现及算法改进 3 1h 2 6 3 标准简介 h 2 6 3 是i t u t 提出的作为h3 2 4 终端使用的视频编解码建议,它是基于运 动补偿的d p c m 的混合编码,在运动搜索的基础上进行运动补偿,然后运用d c t 变换和”之”字形扫描游程编码,从而得到输出码流。h 2 6 3 在h 2 6 1 建议的基础 上,将运动矢量的搜索增加为半象素点搜索2 1 【3 】【6 1 :同时又增加了无限制运动矢量、 基于语法的算术编码、高级预测技术和p b 帧编码等四个高级选项:从而达到了进 一步降低码速率和提高编码质量的目的【2 j i 副州。 3 1 1 h 2 6 3 的内容和特点【2 j 【6 j h 2 6 3 视频编码标准是专为中高质量运动图像压缩所设计的低码率图像压缩 标准。与h 2 6 1 的p x 6 4 k 的传输码率相比,h 2 6 3 的码率更低,单位码率可以 小于6 4 k ,且支持的原始图像格式更多,包括了在视频和电视信号中常见的q c i f , c i f ,e d t v ,i t u r6 0 1 ,i t u r7 0 9 等等2 j 【6 j 。 h 2 6 3 采用运动视频编码中常见的编码方法,将编码过程分为帧内编码和帧 问编码两个部分。在帧内用改进的d c t 变换并量化,在帧间采用1 2 象素运动矢 量预测补偿技术,使运动补偿更加精确,量化后采用改进的变长编码表( v l c ) 的 量化数据进行熵编码,得到最终的编码系数 6 1 。 h 2 6 3 的编码速度快,其设计编码延时不超过1 5 0 m s ;码率低,在5 1 2k 乃至 3 8 4 k 带宽下仍可得到相当满意的图像效果,十分适用于需要双向编解码并传输的 场合( 如:可视电话) 和网络条件不是很好的场合( 如:远程监控) ,图3 1 是h 2 6 3 的编解码图 。为了达到 这些目标, h 2 6 3 采用 如下方法: 信源编 码器基于通 用中间格式 ( c i f ) ,使 其可以同时 应用于6 2 5 线和5 2 5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论