(电路与系统专业论文)基于h263码率控制算法的研究.pdf_第1页
(电路与系统专业论文)基于h263码率控制算法的研究.pdf_第2页
(电路与系统专业论文)基于h263码率控制算法的研究.pdf_第3页
(电路与系统专业论文)基于h263码率控制算法的研究.pdf_第4页
(电路与系统专业论文)基于h263码率控制算法的研究.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

型鉴塑竖坐墨 塑鐾 摘要 在视频通信中,由于压缩视频流需要在带宽需求不一致并且变化的网络上传 输。为了充分利用提供的网络资源,并保证用户能够获得最优的感觉质量,就需 要在视频通信系统中,引入码率控制技术。视频编码器的过速率输出不仅会导致 业务拥塞,而且会导致网络拥赛。反之,如果视频编码器输出比特率无控制的减 少,会导致不必要的质量降级以及对现存带宽资源的低效利用。这就需要采用码 率控制技术来调整并控制视频源的输出比特率,以获得在质量和带宽利用间的最 佳均衡。 在低速率实时视频通信中,通常采用码率控制技术来调整量化参数( q p ) 以 适应信道速率,可达到较好的图像质量和较低的缓存时延。码率控制一般分为帧 层码率控制和宏块层码率控制两部分完成。然而,帧层码率控制往往不能完成对 比特流的细微调整。在诸如视频电话和视频会议等低时延应用中,需要精确的缓 存调节和较低的累积时延,这时就必须进行宏块层的码率控制。 本文在以一f j l 个方面进行了研究: ( 1 ) 介绍了几种传统的码率控制方法:s m 3 码率控制算法、r m 8 码率控制算法、 t m 5 码率控制算法、t m n 8 码率控制算法。并且分析了以上几种码率控制算法 的优点和不足。其中i t u t h 2 6 3t m n 8 码率控制算法是比较优秀的码率控制算 法之。本文重点分析了该算法的理论基础和实现流程。 ( 2 ) 在i t u t t m n 8 码率控制算法的基础上,将一帧场景分成剧烈区和平坦区。 对于运动剧烈的区域采用较小的量化步长,对于运动平坦的区域则采用固定的、 较大的量化步长,并给图像复杂区分配较多的比特。 ( 3 ) 分析了i t u t h 2 6 3t m n 8 宏块层码率控制算法,采用了优化的量化编码 顺序:按照复杂度把宏块重新排序并按照该顺序进行编码。该算法能有效地避免 传统编码方法带来的质量下降问题,计算复杂度也有所降低。仿真结果表明:该 方法能减少跳帧数,同时平均峰值信噪比也有所提高。 关键词:视频编码:码率控制;宏块层;编码顺序:量化步长 安徽大学顾。i :学位论文基于h2 6 3 码牢控制算法的研究 a b s t r a c t i nv i d e oc o m m u n i c a t i o n s ,c o m p r e s s e dv i d e os t r e a m sn e e dt ob et r a n s m i t t e do v e r n e t w o r k st h a th a v ei n c o n s i s t e n ta n dt i m e v a r y i n gb a n d w i d t hr e q u i r e m e n t s t om a k e t h eb e s tu s eo fa v a i l a b l en e t w o r kr e s o u r c e sa ta n yt i m ea n dg u a r a n t e eam a x i m u m l e v e lo f p e r c e p t u a lv i d e oq u a l i t yf r o mt h ee n d u s e r sp e r s p e c t i v e ,ac e r t a i nr a t ec o n t r o l m e c h a n i s mm u s tb ei n t r o d u c e di n t ot h ev i d e oc o m m u n i c a t i o ns y s t e m o v e r r a t i n gt h e o u t p u to f av i d e oc o m m u n i c a t i o nc a u s ea nu n d e s i r a b l et r a f f i ce x p l o s i o na n dl e a dt o c o n g e s t e dn e t w o r k s o nt h eo t h e rh a n d ,u n c o n t r o l l e dr e d u c t i o no f t h eo u t p u tb i tr a t e o f av i d e oc o d e rl e a d st ou n n e c e s s a r yq u a l i t yd e g r a d a t i o na n di n e f f i c i e n tu s eo f a v a i l a b l eb a n d w i d t hr e s o u r c e s r a t ec o n t r o lt e c h n i q u e sm u s tt h e nb ee m p l o y e dt o r e g u l a t ea n dc o n t r o lt h eo u t p u tb i tr a t e so fv i d e os o u r c e si nt h en e t w o r kt oa c h i e v et h e b e s tt r a d e - o f l b e t w e e nq u a l i t ya n db a n d w i d t hu t i l i z a t i o n i nt h el o w - d e l a yr e a l - t i m ev i d e oc o m m u n i c a t i o n s ,r a t ec o n t r o lm e c h a n i s mc a n u s et oa d j u s tq u a n t i z a t i o np a r a m e t e r ( q p ) t om e e tt h ec h a n n e lr a t e ,w h i l ek e e p i n g b e t t e rp i c t u r eq u a l i t ya n dl o w e rb u f f e rd e l a y r a t ec o n t r o li so f t e nd o n ea tt w ol a y e r s f r a m el a y e ra n dm a c r o b l o c k ( m b ) l a y e r s o m e t i m e sf r a m el a y e rr a t ec o n t r o lc a n t a c h i e v et h ef i n er e g u l a t i o no f b i t s t r e a m s o m el o w - d e l a ya p p l i c a t i o n ss u c ha sv i d e o t e l e p h o n ea n dv i d e oc o n f e r e n c en e e df i n eb u f f e ra d j u s t m e n ta n dl o w e ra c c u m u l a t e d d e l a y n o wm a c r o b l o c kl a y e rr a t ec o n t r o lm u s tb ed o n e t h ew o r kw eh a v er e s e a r c h e di n c l u d es e v e r a la s p e c t sa sf o l l o w s : ( 1 ) s e v e r a lc o n v e n t i o n a lr a t ec o n t r o lt e c h n i q u e sa r ei n t r o d u c e d ,s u c ha s :s m 3r a t e c o n t r o ls t r a t e g y , r m 8r a t ec o n t r o ls t r a t e g y , t m 5g a t ec o n t r o ls t r a t e g ya n dt m n 8 r a t ec o n t r o ls t r a t e g y t h ea d v a n t a g ea n dd i s a d v a n t a g eo ft h o s er a t ec o n t r o l s t r a t e g ya r ea n a l y z e d i nt h o s et e c h n i q u e s ,i t u th 2 6 3t m n 8 r a t ec o n t r o l s t r a t e g yi so n eo f t h eb e s tt e c h n i q u e s i nt h i sp a p e r ,t h et h e o r yo f l t u - th 2 6 3 t m n 8r a t ec o n t r o ls t r a t e g ya n dh o wt op e r f o r ma r ea n a l y z e d 2 安徽大学硕士学位论义a b s t r a c t ( 2 ) o nt h eb a s i so fi t u - th 2 6 3t m n 8r a t ec o n t r o ls t r a t e g y , af l a m es c e n ec a l lb e d i v i d e di n t oi n t e n s i v em o t i o na r e aa n df l a ta r e a t h eq u a n t i z a t i o ns t e ps i z e so f t h e i n t e n s i v em o t i o na r e aa r es m a l l ,a n dt h eq u a n t i z a t i o ns t e ps i z e so f t h ef l a ta r e aa r e f i x e da n db i g s ot h a tt h es c h e m ed i s t r i b u t e sm o r eb i t st ot h em o t i o nm a c r o b l o c k s ( 3 ) t h ei t u th 2 6 3t m n 8 m a c r o b l o c kl a y e rr a t ec o n t r o ls t r a t e g ya r ea n a l y z e d ,a n d a no p t i m i z e do r d e ro fq u a n t i z a t i o nw e r ep u tf o r w a r dt o o :t h eo p t i m i z e do r d e ro f q u a n t i z a t i o na r ed e t e r m i n e db yt h em o t i o na c t i v i t yo ft h em a c r o b l o c k s ,t h e m a c r o b l o c k sa r ec o d i n ga c c o r d i n gt ot h eo p t i m i z e do r d e lt h eo p t i m i z e do r d e ro f q u a n t i z a t i o nc a l le f f i c i e n t l ya v o i dt h eq u e s t i o nt h a tt h eq u a l i t yd e c r e a s e dc a u s e d b yt h ec o n v e n t i o n a lc o d i n go r d e r t h es i m u l a t i o nr e s u l t ss h o wt h a tt h ep r o p o s e d r a t ec o n t r o lm e t h o dc a l ld e c r e a s en u m b e ro ff r a m e ss k i p p e da n da v e r a g ep s n ri s a l s oi m p r o v e d k e y w o r d s :v i d e oc o d i n g ;r a t ec o n t r o l ;m a c r o b l o c kl a y e r ;c o d i n go r d e r ; q u a n t i z a t i o ns t e ps i z e 3 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得富徽太孽或其他教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示谢意。 学位论文作者签名芦,乩 签字日期拗6 年f 月b 日 学位论文版权使用授权书 本学位论文作者完全了解有关保留、使用学位论文的规定 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授权可以将学位论文的全部或部分内容编入有关数据库进行 检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 学位论文作者签名:侉,丸导师签名:哥秘审 签字日期:秒口6 年f 月w 日 签字日期: 矽l ,61 年f 月劢日 学位论文作者毕业去向:奇馏太菩 工作单位:雅七孚 电话: 3 n 妒如p f 7 1 通讯地址:岛傲大学咆弓针彦s 赫邮编:乙弓汐矿台7 谤p 参 1 安徽大学硕士学位论文第一章绪论 1 1 研究背景 第一章绪论 多媒体通信是指在一次呼叫过程中能同时提供多种媒体信息声音、图 像、图形、数据、文本等的新型通信方式。它是通信技术和计算机技术相结合的 j “物,它突破了计算机、通信、电视等传统产业间相对独立发展的界限,是计算 机、通信和电视领域的一次革命。随着多媒体通信技术的迅速发展,图像、视频 等多媒体数据己逐渐成为信息处理领域中主要的信息媒体形式,是当今科技发展 的重要领域之一1 1 3 j 。 随着信息技术和计算机互联网飞速发展,人们己不仅仅满足于语音、电报、 电子邮件等通信方式,对视讯业务的需求呈迅猛发展的趋势。在此背景下,多媒 体信息己成为人类获取信息的最主要载体,同时也成为电子信息领域技术开发和 研究的热点。多媒体系统中需要对多媒体信息进行捕获、存储、传输和播放等处 理工作,视频信息是多媒体信息中最重要的成分。视频信息经数字化处理后具有 易于加密、抗干扰能力强、可再生中继等优点,但同时也伴随海量数据的产生。 例如,对于d v d ,输入视频格式为d i ,帧率为3 0 f p s ,色差格式为4 :2 :2 。视频 数据码率则为7 2 0 4 8 0 1 6 3 0 = 1 6 5 9 m b p s ,d v d 容量为4 7 g b ,仅能存储 4 7 8 1 6 5 9 = 2 2 6 4 秒长的节目。这对信息存储设备及通信网络均提出了很高要 求,从而成为阻碍人们有效获取和使用信息的重大瓶颈。 如何在通信系统带宽和存储空间有限的情况下进行视频信息的传输是多媒 体通信系统中的关键技术。由于视频数据可存储在c d 、d v d 等存储器件中,也 可在通信网络上传输,在多媒体技术中数字视频数据量的大小就成为非常重要的 问题。因为原始模拟信号需要很大的带宽,如果视频帧不经压缩就进行传输,无 论何种网络平台,视频应用都会使通信媒体的带宽资源紧张。 因此,数字视频数据在传输前必须经过压缩。研究高效的视频压缩编码方法, 以压缩形式存储和传输数字化的视频信息具有重要意义。作为多媒体技术的核心 及关键,多媒体数据压缩编码近年来在技术及应用方面都取得了长足进展,先进 的数据压缩技术尤其是视频压缩技术可实现较低的时延和高的压缩比,达到较好 的图像质量。 安徽大学硕:i :学位论文基于h2 6 3 码率控制算法的研究 在多媒体通信中,由于压缩视频流需要在带宽需求不一致并且变化的网络上 传输。为了充分利用提供的网络资源,并保证用户能够获得最优的感觉质量,在 视频通信系统中,就需要引入码率控南4 技术。视频编码器的过速率输出会导致业 务拥塞,而且会导致网络拥赛。反之,如果视频编码器输出比特率无控制的减少, 会导致不必要的质量降级以及对现存带宽资源的低效利用。这就需要采用码率控 制技术来调整并控制视频源的输出比特率,以获得在质量和带宽利用间的最佳均 衡5 1 。 1 2 国内外研究现状 伴随着视频编码相关学科及新兴学科的迅速发展,新的数据压缩技术不断诞 生并日益成熟,与此同时,视频编码相关标准的制定也日臻完善。视频编码标准 主要由i t u t 和i s o i e c 开发。i t u t 发- 靠的视频标准有 h 2 6 1 1 6 1 、h 2 6 2 1 、h 2 6 3 1 8 1 、h 2 6 3 + 、h 2 6 3 + + ,h 2 6 4 1 9 1 。h 2 6 1 主要应用于可 视电话会议电视,h 2 6 3 主要用于模拟电话线上的可视电话电视会议,而与 h 2 6 1 3 同系列的h 2 6 2 与m p e g 共同作为i s o i e c l 3 8 1 8 标准草案。该标准草 案主要用于数字存储、视频广播和通信。存储媒介既可直接连至解码器,也可通 过总线、局域网( l a n ) 或电信链路等通信手段相连接。作为薪一代多媒体编码技 术的h 2 6 4 ,是m p e g 4 h 2 6 3 的后继者。h 2 6 4 是i t u t 的v c e g ( 视频编码专 家组) 和i s o i e c 的m p e g ( 活动图像编码专家组) 的联合视频组( j v y :j o i n t v i d e o t e a m ) 开发的一个新的数字视频编码标准,它既是i t u t 的h 2 6 4 ,又是i s o i e c 的m p e g 4 的第1 0 部分。1 9 9 8 年1 月份开始草案征集,1 9 9 9 年9 月完成第一 个草案,2 0 0 1 年5 月制定了其测试模式t m l 8 ,2 0 0 2 年6 月的j v t 第5 次会议 嗵过了h 2 6 4 的f c d 板,2 0 0 3 年3 月正式定稿。 m p e g1 1 0 1 “j 的任务是开发运动图像及其声音的数字编码标准,专家组最初 的任务有三个:实现1 5 m b s 、1 0 m b s 、4 0 m b s 的压缩编码标准,即m p e g 1 i 7 j 、 m p e g :2 ”、m p e g 3 。因为m p e g 2 的功能已使m p e g - 3 为多余,所以m p e g - 3 于1 9 9 2 年撤消。m p e g 一4 1 8 颂目是1 9 9 1 年5 月建议并于1 9 9 3 年7 月确认。到现 在为止,m p e g 公布的标准有:1 m p e g 1 标准:1 9 9 3 年8 月公布。用于传输 1 5 m b s 数据传输率的数字存储媒体运动图像及其伴音的编码;2 m p e g 2 标准: 2 安徽人学颂1 学位论文第一章绪论 1 9 9 4 年1 1 月公布。其全称为:“运动图像及其伴音的编码”,主要针对高清晰度 电视( h d t v ) 所需要的视频及伴音信号,传输速率为1 0 m b p s ,与m p e g 1 兼 容,适用于15 m b p s 6 0 m b p s 甚至更高的编码范围:3 m p e g - 4 标准:2 0 0 2 年 1 0 月公布。该标准的目标为:支持多种多媒体应用( 主要侧重于多媒体信息内 容的访问) ,可根据应用的不同要求现场配置解码器。目前,m p e g 将研究重点 转向了交互性更:f j u 高级的形式,在未来的几年里,技术的发展将使这种高级形式 成为可能。 在上文介绍的所有的视频编码标准算法中,码率控制技术是必不可少的组成 部分。因为熵编码产生的是变长码,而且视频信号的统计特性是不平稳的,每帧 图像经压缩后所产生的数据量不同,因此熵编码输出的比特流速率是变化的。为 了在恒定比特率的信道上传输,需要在进入信道之前加一个缓存器,用以对输出 码流的速率进行控制。当码流的速率高于信道的传输速率时,缓存器会越来越满; 而码率低于信道速率时,缓存器则越来越空。为了防止缓存器溢出或变空,需要 对压缩码流的速率进行控制。这通常是通过反馈支路、改变量化器的量化步长的 大小来实现的,量化步长加大,码率下降,但图像质量也会因此而下降。码率控 制问题就是在尽可能地保证图像质量稳定的条件下,使压缩码流的速率适应恒定 速率信道的要求【制。 下面是视频通信中的一些码率控制算法: 调整编码参数的码率控制主要用于块变换编码器中。在编码过程中通过编码 参数的调整来控制视频编码器的输出比特率,参数的调整通常根据视频源周期获 取的信道状念报告实现。此种类型的码率控制系统有效地防止了网络出现拥塞现 象,又称作预防性技术。 可变量化步长的码率控制,可由网络状态指示本地缓存器的占用量根据其占 川量以及图像的活动性来调整下一帧、g o b 或宏块的量化步长,以使控制的比 特率接近目标比特率1 3 1 1 1 “。 r o i 编码的码率控制,在某些类型的视频序列中,可通过对视景的r o i 区 域( 感兴趣区域) 进行比其余内容更精确的编码,充分利用视景内容的先验知识 来提高编码效率【1 5 】【1 6 l 。 以及分优先级信息丢弃的码率控制【1 7 l 、使用内部反馈环的码率控制【i g 】、降 安徽大学硕:i :学位论文 基于h2 6 3 码率控制算法的研究 低分辨率的码率控制1 1 9 1 、多层编码的码率控制等等【2 0 1 。 其中m p e g 一1s m 3 2 l 】码率控制算法、m p e g 2t m n 5 f 1 4 】码率控制算法、h 2 6 3 t m n 8 码率控制算法、是比较有代表意义的三种码率控制方法。 s m 3 码率控制算法是一个比较简单的码率控制算法。它分为两个步骤实现: ( 1 ) 目标比特分配;( 2 ) 码率调整。也就是根据图像序列编码产生的码流应该 与信道速率相匹配的原则,对每帧图像进行目标比特分配:然后在每一帧的编码 过程中,通过量化步长的调整使得该帧实际产生的比特数接近其预分配值,即进 行码率调整。s m 3 码率控制算法能够满足使得编码器输出码流的速率与信道速 率相匹配的要求,但是s m 3 码率控制算法不及t m n 5 码率控制算法的比特分配 策略合理,码率调整也不够精细。 t m n 5 码率控制算法分三个步骤实现:( 1 ) 目标比特分配:( 2 ) 码率调整: ( 3 ) 自适应量化。t m n 5 码率控制方法能够满足使编码器输出码流的速率与信 道速率相匹配的要求,但由于t m n 5 中的比特分配策略合理,码率调整精细, 并且考虑了人的视觉特征。因此,它能够在限定的速率下使重建图像具有更稳定 和更高的主观评价质量。但是,t m n 5 也存在着不足之处,它不能够很好的处理 场景变换问题。 t m n 8 码率控制算法分为帧层码率控制和宏块层码率控制两部分来实现。首 先使用帧层码率控制为当前的编码帧选择一个目标比特数,然后使用宏块层码率 控制为该帧内的所有宏块选择量化步长。然而,t m n 8 算法没能较好的控制宏块 之间量化参数的较大波动,所采用的模型估计的准确度依靠对前面已编码宏块的 信息。在场景转换情况下,易导致准确度降低。 随着视频压缩编码技术和网络通信技术的发展,新的挑战和机遇也不断涌 现。因此,虽然对于视频压缩通信中的码率控制研究已经成为近年来多媒体通信 研究领域的一个热点问题,但仍然需要不断深入发展对码率控制技术的研究。 1 3 本文主要工作 本文主要研究了视频压缩标准中的码率控制问题。详细分析了现有的经典码 率控制方法,并提出一种优化的基于h 2 6 3 的宏块层码率控制方法。仿真结果表 明改进后的码率控制方法是一种较优的码率控制方法。本文具体内容安排如下: 4 蜜徽大学硕:l :学位论文第一章绪论 第二章介绍了视频压缩编码技术,详细介绍了视频压缩技术、视频压缩编码 的国际标准及其应用,以及一些具有代表意义的码率控制方法,并对这些码率控 制方法进行了分析。 第三章介绍了视频压缩编码国际标准i t u th ,2 6 3 。分析了 t u th 2 6 3 的 特点、主要改进和创新点,以及i t u th 2 6 3 视频编码器的实现。 第四章阐述了码率控制技术的原理、具有代表意义的码率控制算法。详细分 析了i t u th 2 6 3 的t m n 8 码率控制算法。t m n 8 码率控制算法分为帧层码率控 制算法和宏块层码率控制算法两个部分,它是较优秀的码率控制算法之一。但是, r 1 1 m n 8 算法,”的宏块层码率控制部分的也存在着不足之处,需要对其进行改进。 第五章提出了基于i t u th 2 6 3t m n 8 的码率控制算法。对于传统的i t u t h 2 6 3t m n 8 的码率控制算法进行了改进,根据宏块的复杂度划分成为运动剧烈 区和运动平坦区,按照复杂度把宏块重新排序并按照该顺序进行编码,并且根据 宏块运动剧烈程度,分配不同的量化步长。该算法有效地避免了传统编码顺序造 成的质量下降问题。仿真结果表明该方法能减少跳帧数,同时平均峰值信噪比也 有所提高,是一种相对较好的宏块层码率控制算法。 安徽大学硕士学位论义基于h 2 6 3 码率控制算法的研究 2 1 引言 2 1 1 概述 第二章视频压缩编码 众所周知,人类通过视觉获取的信息量约占总信息量的7 0 ,而且视频信 息具有直观性、可信性等一系列优点。所以,视讯技术中的关键技术就是视频技 术。 目前,视频技术的应用范围很广,如网上可视会议、网上可视电子商务、网 上政务、网上购物、网上学校、远程医疗、网上研讨会、网上展示厅、个人网上 聊天、可视咨询等业务。 但是,以上所有的应用都必须进行压缩。传输的数据量之大,单纯用扩大存 储器容量、增加通信干线的传输速率的办法是不现实的,数据压缩技术是个行之 有效的解决办法。通过数据压缩,可以把信息数据量减少,以压缩形式存储、传 输,既节约了存储空间,又提高了通信干线的传输效率。同时也可使计算机实时 处理音频、视频信息,以保证播放出高质量的视频、音频节目。可见,多媒体数 据压缩是非常必要的。由于多媒体信源数据有极强的相关性,也就是说有大量的 冗余信息。而数据压缩可以将庞大数据中的冗余信息去掉( 去除数据之间的相关 性) ,保留相互独立的信息分量。因此,多媒体数据压缩是完全可以实现的。 2 1 2 视频压缩编码的可行性 视频压缩的目标是在尽可能保证视觉效果的前提下减少视频数据率。视频压 缩比一般指压缩后的数据量与压缩前的数据量之比。由于静态视频是连续的静态 图像,因此其压缩编码算法与静态图像的压缩编码算法有某些共同之处,但是, 运动的视频还有其自身的特性,因此在压缩时还应考虑其运动特性才能达到高压 缩的目标1 2 2 j 。 视频压缩编码的理论基础是信息论。压缩就是从时域、空域两方面去除冗余 信息。传统的压缩编码是建立在香农( s h a n n o n ) 信息论【2 3 】基础上的,它以经典 、 6 安徽大学硕:i 二学位论文第二章视频压缩编码 的集合论为基础,用统计概率模型来描述信源,但它未考虑信息接受者的主观特 性及事件本身的具体含义、重要程度和引起的后果。因此,压缩编码的发展历程 实际上是以香农信息论为出发点,一个不断完善的过程。 从信息论观点来看,图像作为一个信源,描述信源的数据是信息量( 信源熵) 和信息冗余量之和。信息冗余量有许多种,如空间冗余,时问冗余,结构冗余, 知识冗余,视觉冗余等,数据压缩实质上是减少这些冗余量。可见冗余量减少可 以减少数据量而不减少信源的信息量。从数学上讲,图像可以看作一个多维函数, 门i 缩描述这个函数的数据量实质是减少其相关性。另外在一些情况下,允许图像 有一定的失真,而并不妨碍图像的实际应用,那么数据量压缩的可能性就更大了 f 2 4 l 。 由此可见,数字视频的数据压缩不仅是必要的也是可行的。传统压缩编码建 立在香农信息论基础之上的,其压缩思想基于数据统计,因此只能去除数据冗余, 属于低层压缩编码的范畴。 伴随着视频编码相关学科及新兴学科的迅速发展,新一代数据压缩技术不断 诞生并日益成熟,其编码思想由基于像素和像素块转变为基于内 容( c o n t e n t b a s e d ) 。它突破了香农信息论框架的束缚,充分考虑了人眼视觉特 性及信源特性,通过去除内容冗余来实现数据压缩,可分为基于对象 ( o b j e c t b a s e d ) 和基于语义( s e m a n t i c s b a s e d ) 两种,前者属于中层压缩编码, 后者属于高层压缩编码。 与此同时,视频编码相关标准的制定也日臻完善。 2 2 视频压缩的国际标准及应用 数字视频技术广泛应用于通信、计算机、广播电视等领域,带来了会议电视、 可视电话及数字电视、媒体存储等一系列应用,促使了许多视频编码标准的产生。 1 9 8 0 年以来,国际标准化组织0 s o ) 、国际电工委员会( i e c ) 和国际电信联i i 曼( i t u ) 下属的国际电报电话咨询委员会( c c i t t ) 陆续完成了各种数据压缩与通信的标准 和建议。其中i t u t 和i s o 1 e cj t c l 是目前国际上制定视频编码标准的正式组 织,i t u - t 的标准称之为建议,并命名为h 2 6 x 系列。比如h 2 6 1 、h 2 6 3 、h 2 6 4 等,主要应用于实时视频通信领域,比如视频会议、可视电话等;i s o 1 e c 的标 安徽大学硕:i :学位论文 基于h2 6 3 码率控制算法的研究 准称为m p e g x ,比如m p e g l 、m p e g 2 、m p e g 4 等。m p e g 系列标准主要 用于视频存储( d v d ) 、视频广播和视频流媒体( 如基于i n t e m e t 、d s l 的视频, 无线视频等等) 。两个组织也共同制定了一些标准,h 2 6 2 标准等同于m p e g - 2 的视频编码标准,而最新的h 2 6 4 标准则被纳入m p e g 4 的第l o 部分。除了联 合丌发的标准外,大多数情况下,这两个组织独立制定相关标准。下面就对这些 标准做简单的介绍: 2 2 1h 2 6 x 系列标准 ( 1 ) 视听会议压缩编码标准h 2 6 1 q h 2 6 1 颁布于1 9 9 0 年,主要用于双向视频通信,h 2 6 1 是i t u t 为在窄带 综合业务数字网( n i s d n ) 上开展速率为p 。6 4 k b s 的双向声像业务( 可视电话、视 频会议) 而制定的,速率为6 4 k b s 的整数倍,其中p = 1 3 0 。因此,h 2 6 1 也称为 p x 6 4 标准。例如,6 4 k b p s ( p = 1 ) 用于低端的可视电话业务,其中视频信号传输 占用4 8k b p s 的带宽,剩下的1 6k b p s 用于音频信号;3 8 4k b p s ( p = 6 ) 或更高的 速率用于高端的视频会议业务。在i s d n 信道上最高传输率为1 9 2 m b p s ( p = 3 0 ) , 足以传送v h s 质量的视频信号。h 2 6 1 ( 结合可以携带r t p 的任意底层协议) 通过实时传输协议( r t p ) 传输视频流。 h 2 6 l 允许的最大编码延迟为1 5 0 m s 。h 2 6 1 只对c i f ( c o m m o ni n t e r m e d i a t e f o r m a o 和q c i f ( q u a r t e rc w ) 两种图像格式进行处理。q c i f ( 1 4 公共交换格式) , 其像素为1 4 4 x1 7 6 ;c i f ( 公共交换格式) ,其像素为2 8 8 3 5 2 。 h 2 6 1 是最早的运动图像压缩标准,它详细制定了视频编码的各个部分,包 括运动补偿的帧间预测、d c t 变换、量化、熵编码,以及与固定速率的信道相 适配的码率控制等部分。h 2 6 1 的编码方案是基于d c t 和d p c m 的预测编码算 法,运动每帧图像分成8 8 的子块,再组成宏块、块组,宏块由4 个8 8 的亮 度块和2 个8 x 8 的色度块组成,每个块组由3 1 1 个宏块组成。每幅q c i f 图像 有3 个块组,每幅c i f 图像有1 2 个块组,形成一个多层次的块结构。即每帧图 像分成图像层、宏块组( g o b ) 层、宏块( m b ) 层、块( b l o c k ) 层来处理。 图像层:与视频图像( 帧) 相符i 组块:与1 1 2o f c i f 图像或1 3o f q c i f 相符: 安徽大学硕士学位论文 第二章视频压缩编码 宏块:与亮度的1 6 x1 6 像素和两个相应空间色度的8 8 像素成份相符; 块:与8 8 像素相符。 ( 2 ) 低比特率视听会议压缩编码标准h 2 6 3 1 8 】 h 2 6 3 是最早用于低码率视频编码的i t u t 标准,随后出现的第二版( h 2 6 3 + ) 及h 2 6 3 + + 增加了许多选项,使其具有更广泛的适用性。 h 2 6 3 足1 t u t 为低于6 4 k b s 的窄带通信信道制定的视频编码标准,是为 低码流通信而设计的。但实际上这个标准可用在很宽的码流范围,并非只用于低 码流应用。h 2 6 3 的编码算法与h 2 6 1 一样,但进行了一些改善和改变,以提高 性能和纠错能力。它是在h 2 6 1 基础上发展起来的,在许多应用中可以认为被 用于取代h 2 6 1 。其标准输入图像格式可以是s - q c i f 、q c i f 、c i f 、4 c i f 或者 1 6 c i f 的彩色4 :2 :0 亚取样图像。 h 2 6 3 标准在低码率下能够提供比h 2 6 1 更好的图像效果,两者的区别有: ( 1 ) h 2 6 3 的运动补偿使用半像素精度,而h 2 6 1 则用全像素精度和循环滤波;( 2 ) 数据流层次结构的某些部分在h 2 6 3 中是可选的,使得编解码可以配置成更低的 数据率或更好的纠错能力;( 3 ) h 2 6 3 包含四个可协商的选项以改善性能:( 4 ) h2 6 3 采用无限制的运动矢量以及基于语法的算术编码;( 5 ) 采用事先预测和同 m p e g 中的p b 帧一样的帧预测方法;( 6 ) h 2 6 3 支持5 种分辨率,即除了支持 h 2 6 1 中所支持的q c i f 和c i f 外,还支持s q c i f 、4 c i f 和1 6 c i f ,s q c i f 相当 于q c i f 一半的分辨率,而4 c i f 和1 6 c i f 分别为c i f 的4 倍和1 6 倍。 1 9 9 8 年i u t - t 推出的h 2 6 3 + 是h 2 6 3 建议的第2 版,它提供了1 2 个新的 可仂、商模式和其他特征,进一步提高了压缩编码性能。如h 2 6 3 只有5 种视频源 格式,h 2 6 3 + 允许使用更多的源格式,图像时钟频率也有多种选择,拓宽了应 用范围;另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率,增 强了视频信息在易误码、易丢包异构网络环境下的传输。另外,h 2 6 3 + 对h 2 6 3 中的不受限运动矢量模式进行了改进,加上1 2 个新增的可选模式,不仅提高了 编码性能,而且增强了应用的灵活性。h 2 6 3 已经基本上取代了h 2 6 1 。 h 2 6 3 + + 在h 2 6 3 + 基础上增加了3 个选项,主要是为了增强码流在恶劣信道 上的抗误码性能,同时为了提高增强编码效率。这3 个选项为: :( 徽大学硕:i :学位论文 基于h2 6 3 码率控制算法的研究 选项u 称为增强型参考帧选择,它能够提供增强的编码效率和信道错 误再生能力( 特别足在包丢失的情形下) ,需要设计多缓冲区用于存贮多参考帧图 像。 选项v 称为数据分片,它能够提供增强型的抗误码能力( 特别是在传输 过程中本地数据被破坏的情况下) ,通过分离视频码流中d c t 的系数头和运动矢 量数据,采用可逆编码方式保护运动矢量。 选项w 在h 2 6 3 + 的码流中增加补充信息,保证增强型的反向兼容性, 附加信息包括:指示采用的定点i d c t 、图像信息和信息类型、任意的二进制数 据、文本、重复的图像头、交替的场指示、稀疏的参考帧识别。 ( 3 ) h 2 6 4 视频编码标准f 9 】 l 2 6 4 a v c 标准是由i t u t 和i s o i e c 联合开发的,定位于覆盖整个视频应 用领域。包括:低码率的无线应用、标准清晰度和高清晰度的电视广播应用、 i n t e r n e t 上的视频流应用,传输高清晰度的d v d 视频以及应用于数码相机的高质 量视频应用等等。 i t u t 给这个标准命名为h 2 6 4 ( 以前叫做h 2 6 l ) ,而i s o i e c 称它为 m p e g 4 高级视频编码( a d v a n c e dv i d e oc o d i n g ,a v c ) ,并且它将成为m p e g 4 标准的第l o 部分,它将主要应用在具有高压缩率和分层次质量需求的方向。 h 2 6 4 的主要优点如下:在相同的重建图像质量下,h 2 6 4 比h 2 6 3 + 和 m p e g 一4 减少5 0 码率。对信道时延的适应性较强,既可工作于低时延模式以 满足实时业务,如会议电视等:又可工作于无时延限制的场合,如视频存储等。 提高网络适应性,采用“网络友好”的结构和语法,加强对误码和丢包的处理,提 高解码器的差错恢复能力。在编解码器中采用复杂度可分级设计,在图像质量 和编码处理之间可分级,以适应不同复杂度的应用。 相对于先期的视频压缩标准,h 2 6 4 引入了很多先进的技术,包括4 x 4 整数 变换、空域内的帧内预测、1 4 象素精度的运动估计、多参考帧与多种大小块的 帧问预测技术等。新技术带来了较高的压缩比,同时大大提高了算法的复杂度。 2 2 2m p e g 系列标准 m p e g 的任务是开发运动图像及其声音的数字编码标准,专家组最初的任务 安徽大学硕一l ? 学位论文 第二章视频压缩编码 有三个:实现1 5 m b s 、1 0 m b s 、4 0 m b s 的压缩编码标准,即m p e g 1 、m p e g 2 、 m p e g - 3 。因为m p e g 一2 的功能已使m p e g 3 为多余,所以m p e g 3 于1 9 9 2 年 撤消。m p e g 4 项目是1 9 9 1 年5 月建议并于1 9 9 3 年7 月确认。到现在为止, m p e g 公斫j 的标准有: ( 1 ) 数字声像存储压缩编码标准m p e g 1 m p e g - 1 标准:1 9 9 3 年8 月公布。用于传输1 5 m b s 数据传输率的数字存储 媒体运动图像及其伴音的编码。m p e g 1 标准用于数字存储体上活动图像及其伴 音的编码,其数码率为1 5 m b p s 。m p e g 1 在h 2 6 1 基础上做了重大改进,以满 足随机存取和高压缩比的要求,其图像扫描格式为s i f ( s o u r c ei n p u tf o r m a t ) 格式, 并作为了v c d 光盘的标准。 该标准包括五个部分:第一部分说明了如何根据第二部分( 视频) 以及第三部 分( 音频) 的规定,对音频和视频进行复合编码。第四部分说明了检验解码器或编 码器的输出比特流符合前三部分规定的过程。第五部分是一个用完整的c 语言 实现的编码和解码器。 该标准从颁布的那一刻起,m p e g 1 取得连串的成功,如v c d 和m p 3 的 大量使用,w i n d o w s 9 5 以后的版本都带有一个m p e g 1 软件解码器,可携式 m p e g 1 摄像机等等。 ( 2 ) 通用视频图像压缩编码标准m p e g 2 ( h 2 6 2 ) i 7 l m p e g 2 标准:1 9 9 4 年1 1 月公布。其全称为:“运动图像及其伴音的编码”, 主要针对高清晰度电视( h d t v ) 所需要的视频及伴音信号,传输速率为1 0 m b p s , 与m p e g 1 兼容,适用于1 5 m b p s 6 0 m b p s 甚至更高的编码范围。m p e g 一2 是 1 9 9 3 年通过的视频压缩标准,用于高清晰度视频和音频的编码,也包含用于可 视电话中的超低码率( 8 - 3 2 k b p s ) 的压缩编码。m p e g 一2 是m p e g 1 的兼容扩展, 广泛应用于各种速率( 2 2 0 m b p s ) 和各种分辨率情况下的场合。 m p e g 一2 不仅接受逐行扫描视频,也可以接受隔行扫描视频,高清晰度视频, 提供可伸缩调节的位流,提供改进的量化和编码选项。 m p e g 2 标准是针对标准数字电视和高清晰度电视在各种应用下

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论