（信号与信息处理专业论文）h264avc标准中cabac熵编码和率失真优化技术的研究与优化.pdf

上传人：活*** IP属地：宁夏上传时间：2020-01-09 格式：PDF 页数：61 大小：4.24MB 积分：0 举报 版权申诉

（信号与信息处理专业论文）h264avc标准中cabac熵编码和率失真优化技术的研究与优化.pdf_第2页

（信号与信息处理专业论文）h264avc标准中cabac熵编码和率失真优化技术的研究与优化.pdf_第3页

（信号与信息处理专业论文）h264avc标准中cabac熵编码和率失真优化技术的研究与优化.pdf_第4页

（信号与信息处理专业论文）h264avc标准中cabac熵编码和率失真优化技术的研究与优化.pdf_第5页

已阅读5页，还剩56页未读，继续免费阅读

（信号与信息处理专业论文）h264avc标准中cabac熵编码和率失真优化技术的研究与优化.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

山东大学硕士学位论文符号说明 c a b a c c o n t e x t b a s e d a d a p t i v eb i n a r y a r i t h m e t i cc o d i n g 基于上下文的自适应二进制算术编码 r d o r a t e d i s t o r t i o no p t i m i z a t i o n 率失真优化 m v m o t i o nv e c t o r 运动矢量 m v d m o t i o nv e c t o rd i f f e r e n c e 运动矢量残差 m v d xm o t i o nv e c t o rd i f f e r e n c eh o r i z o n t a lc o m p o n e n t 运动矢量残差水平分量 m v d y m o t i o nv e c t o rd i f f e r e n c ev e r t i c a lc o m p o n e n t 运动矢量残差竖直分量 m v pp r e d i c t e dm o t i o nv e c t o r 运动矢量预测 h v sh u m a nv i s u a ls y s t e m 人类视觉系统 m a d m e a na b s o l v ed i f f e r e n c e 平均绝对差 p s n rp e a ks i n g a l n o i s er a t i o 峰值信噪比 i s oi n t e r n a t i o n a lo r g a n i z a t i o nf o rs t a n d a r d i z a t i o n 国际标准化组织 i t ui n t e r n a t i o n a lt e l e c o m m u n i c a t i o nu n i o n 国际电信联盟 i e ci n t e r n a t i o n a le l e c t r o t e c hn i c a lc o r n m u s s i o n 国际电工委员会 c c i t tc o n s u l t a t i v ec o m m i t t e eo fi n t e r n a t i o n a lt e l e g r a p ha n dt e l e p h o n e 国际电报电话咨询委员会 j p e gj o i n tp h o t o g r a h i ce x p e r t sg r o u p 静止图像专家组 m p e g m o v i n gp i c t u r ee x p e r t sg r o u p 动态图像专家组 v c lv i d e o c o d i n gl a y e r 视频编码层 n a ln e t w o r ka b s t r a c t i o nl a y e r 网络抽象层 c a v l cc o n t e x t b a s e da d a p t i v ev a r i a b l el e n g t hc o d i n g 基于上下文的自适应变长编码 m bm i c r o b l o c k 宏块 m e m o t i o ne s t i m a t i o n 运动估计 u u n a r yb i n a r i z a t i o n 一元码 5 t u u e g k f l m 咿s l p s r d r d q p s a t d d 6 t r u n c a t e du n a r yb i n a r i z a t i o n 截断一元码 k t ho r d e re x p g o l o m bb i n a r i z a t i o n k 阶指数哥伦布码 f i x e d l e n g t hb i n a r i z a t i o n 定长码 m o s tp r o b a b i l i t ys y m b o l 大概率符号 l e a s tp r o b a b i l i t ys y m b o l 小概率符号 r a t e 码率 d i s t o r t i o n 失真度 r a t e d i s t o r t i o n 率失真 q u a n t i z a t i o np a r a m e t e r 量化参数 s u mo f a b s o l u t et r a n s f o r m e dd i f f e r e n c e 绝对变换差值和 j u s tn o t i c e a b l ed i s t o r t i o n 最小可觉差原创性声明本人郑重声明所呈交的学位论文是本人在导师的指导下独立进行研究所取得的成果除文中已经注明引用的内容外本论文不包含任何其他个人或集体已经发表或撰写过的科研成果对本文的研究作出重要贡献的个人和集体均已在文中以明确方式标明本声明的法律责任由本人承担论文作者签名叠扬日期丝垒金堕关于学位论文使用授权的声明本人完全了解山东大学有关保留使用学位论文的规定同意学校保留或向国家有关部门或机构送交论文的复印件和电子版允许论文被查阅和借阅本人授权山东大学可以将本学位论文的全部或部分内容编入有关数据库进行检索可以采用影印缩印或其他复制手段保存论文和汇编本学位论文保密论文在解密后应遵守此规定一一论文作者签名丕坠卫五一导师签名趔日期丝些 i 砂山东大学硕士学位论文摘要 h 2 6 4 a v c 是新的视频编码标准它比以往的任何视频标准的编码效率都高很多这是因为h 2 6 4 a v c 标准采用了许多新技术如自适应二进制算术编码 c a b a c 技术和率失真优化 r d o 技术等这篇论文旨在改进和优化c a b a c 和r d o 算法进一步提高熵编码效率以及主观视频质量 c a b a c 是应用在h 2 6 4 a v c 编码器主要档次的高效熵编码方法它比应用在基本档次的熵编码方法节省将近2 0 的码率它之所以可以达到很高的压缩率一个根本的原因就是它可以利用数字符号的统计特性来消除符号间的冗余在 c a b a c 中对运动矢量 m 的编码占据了很大一部分比特然而对运动矢量残差 m v d 准确的上下文建模可以节省码率并获得编码效率的提高为了达到这一目的这篇论文提出了一个更有效的运动矢量c a b a c 上下文建模算法在对 m v d 竖直分量的c a b a c 编码过程中为了给它选择更为合适的概率模型本文既考虑当前块m v d 水平分量与竖直分量之间的相关性也考虑了相邻编码块的 m v d 竖直分量之间的相关性另外本文针对不同的待编码块大小合理地采取不同的编码方案对于较小的块来说本文只考虑相邻块的m v d 竖直分量间的相关性而对于较大的分割块除了利用相邻块m v d 竖直分量间的相关性同时也利用当前块两个m v d 分量间的相关性来优化字符的概率估计这种方法可以在运动矢量熵编码过程中实现更准确的概率估计和上下文模型选择从而能够进一步提高编码效率本文在h 2 6 4 a v c 标准参考软件j m1 2 2 上实现了新的算法实验结果表明新算法能够改善c a b a c 编码器的编码性能 r d o 是在h 2 6 4 a v c 编码器中应用的另外一个重要技术它能够在一定的编码约束条件下取得最佳的客观视频质量但是它却忽略了主观视频质量然而由于最终的视频质量是由人类视觉系统 h v s 来判断的所以我们可以根据人眼视觉特性来调整编码算法本文提出了一个基于h v s 感知特性的以宏块为基本单位的r d o 算法论文结合二个重要的视觉特性建立了三个视觉失真敏感度模型然后这些模型被用来使视觉失真达到最小而不是使传统的平均绝对差 m a d 失真达到最小在r d o 过程中根据这三个视觉失真敏感度模型拉格朗日乘予被逐个宏块地进行调整待编码帧的每个宏块的拉格朗日乘予能够自动地按照如山东大学硕士学位论文下方案进行修改视觉敏感度较高的宏块被分配较小的拉格朗日乘子这样能够以较大的码率减小这些宏块的整体失真另一方面通过给视觉敏感度较低的宏块分配较大的拉格朗日乘子来达到码率平衡这样虽然解码后图像的这些宏块中会出现一定的失真但是人眼很难察觉到本文同样在j m1 2 2 软件平台上实现了这个新的r d o 算法仿真结果表明新算法能够在不牺牲p s n r 的情况下改善重建图像的主观质量关键词 c a b a c 运动矢量上下文建模 r d o 视频图像感知编码自适应感知拉格朗日乘子山东大学硕士学位论文 a b s t r a c t h 2 6 4 a v ci st h en e w e s ti n t e r n a t i o n a lv i d e oc o d i n gs t a n d a r dt h a tp r o v i d e sm u c h h i g h e rc o m p r e s s i o n p e r f o r m a n c et h a no t h e rp r e v i o u ss t a n d a r d s t h er e a s o nc o n t r i b u t et o t h i si sh 2 6 4 a v ca d o p t ss e v e r a le s s e n t i a lt e c h n o l o g i e s s u c ha sc o n t e x t b a s e d a d a p t i v e b i n a r ya r i t h m e t i cc o d i n g c a b a c a n dr a t e d i s t o r t i o no p t i m i z a t i o n r d o t h ep u r p o s e so ft h i st h e s i sa r et os t u d ya n do p t i m i z ec a b a ca n dr d o a l g o r i t h mi no r d e rt of u r t h e ri m p r o v ee n t r o p yc o d i n ge f f i c i e n c ya n ds u b j e c t i v ev i d e o q u a l i t y c a b a ci sa l le f f i c i e n te n t r o p yc o d i n gm e t h o du s e di nt h em a i np r o f i l ei n h 2 6 4 a v cc o d e rt h a tp r o v i d e so v e r2 0 b i t r a t er e d u c t i o nt h a nt h a to b t a i n e di nt h e b a s e l i n ee n t r o p yc o d e r o n ee s s e n t i a lr e a s o ni st h a ti tu s e st h es t a t i s t i c a lp r o p e r t i e so f t h ed a t as y m b o l st oe l i m i n a t ei n t e r s y m b o lr e d u n d a n c i e s i nc a b a c b i tu s a g ef o r c o d i n gm o t i o nv e c t o r s m v s a c c o u n t sf o rac o n s i d e r a b l ep o r t i o no ft h eb i tb u d g a a c c u r a t e l ys e l e c t i n gc o n t e x tm o d e l sf o rt h ee n c o d i n gm o t i o nv e c t o rd i f f e r e n c e m v d c a no b t a i nb i t r a t es a v i n g si nc a b a c t or e a l i z et h i s a ne f f i c i e n ta l g o r i t h mf o rm o t i o n v e c t o rc o d i n gi sp r o p o s e di n t h i st h e s i s i nt h en e wa l g o r i t h mf o rc o d i n gav e r t i c a l m v d c o m p o n e n t iu s en o to n l yt h ei n t e r c o r r e l a t i o nb e t w e e nt h ec u r r e n th o r i z o n t a l m v dc o m p o n e n ta n dt h ev e r t i c a lo n et h a tw i t h i nt h es a m eb l o c k b u ta l s ot h e c o r r e l a t i o ni nt h en e i g h b o r i n gv e r t i c a lm v dc o m p o n e n t st os e l e c ta na p p r o p r i a t e c o n t e x tm o d e l m o r e o v e r ia d o p td i f f e r e n ts c h e m e sa c c o r d i n gt ot h ee n c o d i n gp a r t i t i o n s i z e s f o rs m a l lb l o c ks i z e s io n l yc o n s i d e rt h ec o r r e l a t i o na m o n gt h en e i g h b o r i n g b l o c k s w h e r e a sf o rl a r g eb l o c ks i z e s ia l s oe m p l o yt h ei n t e r c o r r e l a t i o nb e t w e e nt h e t w om v dc o m p o n e n t si nt h ec u r r e n tb l o c ki no r d e rt oi m p r o v et h ep r o b a b i l i t y e s t i m a t i o no fs y m b o l s t h e s es t r a t e g i e se n h a n c et h ea c c u r a c yo ft h ec o n t e x tm o d e l s e l e c t i o ni nm o t i o nv e c t o rc o d i n g t h u se l e v a t et h ee f f i c i e n c yo ft h ec o n t e x t b a s e d a r i t h m e t i cc o d e r ih a v ei m p l e m e n t e dt h ep r o p o s e da l g o r i t h mb a s e do nt h eh 2 6 4 a v c r e f e r e n c ec o d e rj m12 2 e x p e r i m e n t a lr e s u l t ss h o wt h a tt h ep r o p o s e da l g o r i t h m i m p r o v e sc o m p r e s s i o np e r f o r m a n c ec o m p a r e dt ot h eo r i g i n a lc a b a c s c h e m e r d oi sa n o t l l e l i m p o r t a n tt e c h n i q u eu s e di nh 2 6 4 a v cc o d e r i tt r i e sa l lt h eb e s t t oi m p r o v et h eo b j e c t i v ev i d e oq u a l i t yu n d e rc e r t a i nr a t ec o n s t r a i n t s i nt h em e a n t i m ei t 3 山东大学硕士学位论文 i g n o r e st h es u b j e c t i v eq u a l i t y h o w e v e r t h eu l t i m a t ev i d e oq u m i t yi sj u d g e db yt h e h u m a nv i s u a ls y s t e m h v s t h e r e f o r i ti sw i s et oa d a p tt h ec o d i n ga l g o r i t h mt ot h e s e n s i t i v i t yo ft h eh u m a ne y e s t l l i st h e s i sp r o p o s e san o v e lm a c r o b l o c k l e v e lr d o a l g o r i t h mb a s e do np e r c e p t u a lf e a t u r e so fh v s t h r e ev i s u a ld i s t o r t i o ns e n s i t i v i t y m o d e l sa l ec r e a t e dt om i n i m i z et h ep e r c e p t u a ld i s t o r t i o nr a t h e rt h a nt r a d i t i o n a lm e a n a b s o l u t ed i f f e r e n c e d i s t o r t i o n d u r i n gt h er a t e d i s t o r t i o no p t i m i z a t i o np r o c e s s t h el a g r a n g em u l t i p l i e ri s a d j u s t e da d a p t i v e l ya c c o r d i n gt o t h ev i s u a ld i s t o r t i o n s e n s i t i v i t yo ft h ee n c o d i n gm a c r o b l o c k s f o rv i s u a ld i s t o r t i o ns e n s i t i v em a c r o b l o c k s i a s s i g ns m a l l e rl a g r a n g em u l t i p l i e rs ot h a tt h ed i s t o r t i o n r e d u c t i o ni sw e i g h t e dm o r e t h a nr a t e r e d u c t i o n b e t t e rv i s u a lq u a l i t yi so b t a i n e db yt h el o w e rd i s t o r t i o ni nt h e s e r e g i o n sw i t har e l a t i v e l yh i g h e rr a t e o nt h eo t h e rh a n d r a t eb a l a n c ei sa c h i e v e db y a r r a n g i n gl a r g e rl a g r a n g em u l t i p l i e rt om a c r o b l o c k s t h a ta r ep e r c e p t u a l l yl e s ss e n s i t i v e t ot h ed i s t o r t i o n s ot h a tm o r ed i s t o r t i o ni sa l l o w e d w i t h o u tn o t i c e a b l ev i s u a l d e g r a d a t i o ni nt h ed e c o d e di m a g e s e x p e r i m e n t sa l s oh a v eb e e nc o n d u c t e d b a s e do nt h e r e f e r e n c ec o d e rj ml2 2 s i m u l a t i o nr e s u l t ss h o wt h a tt h es u b j e c t i v eq u a l i t i e so ft h e d e c o d e df r a m e sa r ei m p r o v e dw i t h o u tc o m p r o m i s i n gp s n r k e y w o r d c a b a c m o t i o nv e c t o rc o n t e x tm o d e l i n g r d o p e r c e p t u a lv i d e o c o d i n g p e r c e p t u a l l ya d a p t i v el a g r a n g em u l t i p l i e r 4 山东大学硕士学位论文 1 1 引言第一章绪论图像是人类获取外部信息的主要来源和手段与文本和语音相比它具有直观高效的特点但是由于视频图像的数据量非常大难以存储和传输因此解决视频图像压缩问题成为其应用的关键经过几十年的不懈努力尤其是上世纪八十年代后期以来数字图像和视频压缩编码技术取得了令人瞩目的进展已经逐步从过去纯学术研究的领域走上了标准化产业化的道路其应用包括可视电话视频会议视频点播机顶盒数字视频广播高清电视和交互式电视等等互联网和多媒体技术的进步和发展扩大了人们的应用需求无线多媒体通信多媒体电子邮件交互式多媒体远程医疗和电了商务等应用成了人们关注的焦点从技术角度看低码率视频压缩是实现这些应用的关键它对压缩效率视频编码质量等方面的研究提出了更高的要求视频压缩编码的方式多种多样其应用涉及方方面面因此建立用于视频图像压缩传输的国际标准就成为图像技术应用和普及的基础各大商对视频图像编码技术及其应用的浓厚兴趣是促使研究不断深入的巨大动力也是视频图像压缩编码技术标准化的直接原因上世纪九十年代以来随着视频图像编码技术的日益成熟国际标准化组织 i n t e r n a t i o n a ls t a n d a r d i z a t i o no r g a n i z a t i o n i s o 和国际电信联盟 i n t e r n a t i o n a lt e l e c o m m u n i c a t i o nu n i o n i t u 相继推出了一系列图像视频压缩编码的国际标准例如j p e g h 2 6 x 系列和m p e g 系列等等它们分别针对不同的应用场合现有的视频编码技术虽然可以较好满足各自应用领域的需求但是随着多媒体通信技术的发展传统的视频编码技术又面临着新的挑战比如要求更低的码率更好的容错性能等虽然计算机存储技术和网络技术也有了很大的发展硬盘的容量不断增大网络带宽也今非昔比但是仍无法满足视频应用这种巨大数据量的存储和传输要求所以改进现有的视频压缩编码技术和寻找更优的压缩算法意义极为重大山东大学硕士学位论文 1 2 视频数据的冗余度分析 c e s h a n n o n l 在创立信息论时提出把数据看作是信息和冗余的组合这些冗余数据对于信息的表达从信息的完备性角度来看是没有意义的在一般的视频图像数据中主要有下面几方面的冗余存在 1 时间冗余视频信号本质上是一系列连续的图像一般情况下由于采样间隔很小相邻两帧图像之间的变化较小或者当前帧某像素或像素块是从前一帧的某个位置移动而来这样相邻两幅图像之间存在着很强的相关性我们把这种图像帧间的冗余成为时间冗余 2 空间冗余除了边缘等情况外图像的相邻像素之间的灰度值大部分是连续变化的即相邻点之间有着比较强的相关性一个像素的值可以比较方便地由其邻近像素的值预测出来这意味着冗余信息的存在这种像素间冗余就称为空间冗余 3 符号兀余视频图像的二进制编码符号之间有时存在非常大的相关性这种相关性意味着冗余信息的存在我们把这种编码符号之间的冗余成为符号冗余 4 熵编码冗余熵编码是建立在随机过程的统计特性基础上的设信源能从一个有限或无穷可数的符号集合中产生一个随机符号序列即信源的输出是一个离散随机变量这个集合 a 1 既珥称为信源符号集a 其中每个元素国称为信源符号信源产生符号毋这个事件的概率是p a j 且尸 1 产生单个信源符号尸口时的自信息是一l o g p a j 对个信源输出的平均信息记为日以则 h u e p a l o g p a j 日似称为信源的熵在编码中中用熵值来衡量是否为最佳编码若以丙表示编码器输出码予的平均码长则当 h 0 时为有冗余日不可能霄日为最佳编码如果编码的平均码长不能达到或接近熵值就说明存在熵编码冗余山东大学硕士学位论文 5 视觉冗余人的眼睛并不是对所有视觉信息有相同的敏感度有些信息相对来说不那么敏感甚至可以忽略这些信息可认为是视觉冗余的去除这些信息并不会明显地降低所感受到的图像的质量视觉冗余的存在与人观察图像的方式有关人在观察图像时主要是寻找比较明显的目标特征而不是定量的分析图像中每一个像素的亮度人通过大脑分析这些特征与先验知识结合以完成对图像的解释过程比如人的眼睛对纹理区域的失真不敏感对产生在静止区域和图像的边缘区域的失真同样不敏感然而人眼却对运动区域图像中心区域物体边缘区域和平坦区域的失真非常敏感如何最大限度地消除视频序列中的这些冗余信息同时保证图像的质量是当代视频压缩编码的主要目标也是本文的丰要任务 1 3 视频编码的基本方法信息理论认为若信源编码的熵大于信源的实际熵该信源中一定存在冗余度去掉冗余不会减少信息量仍可原样恢复数据但若减少了熵数据则不能完全恢复根据压缩过程中是否减少了熵目前常用的压缩编码方法可以分为两大类一类是无损压缩编码也称冗余压缩或熵保持编码另一类是有损压缩编码也称为压缩熵编码无损压缩编码去掉或减少了数据中的凡余但这些几余值是可以重新插入到数据中的因此这种压缩是可逆的也称为无失真压缩为了去除数据中的冗余度常常要考虑信源的统计特性或建立信源的统计模型因此许多适用的冗余度压缩技术均可归结于统计编码方法统计编码方法有哈大曼 h u f m a n 编码 2 和算术编码 3 等冗余压缩不会产生失真它能保证完全地恢复原始数据但这种方法压缩比较低如l z w 编码 4 1 行程编码 h u f m a n 编码的压缩比一般在2 1 5 l 之间有损压缩编码压缩了熵会减少信息量因为熵定义为平均信息量而损失的信息是不能再恢复的因此这种压缩法是不可逆的熵压缩由于允许一定程度的失真可用于对图像声音视频等数据的压缩如采用混合编码的j p e g 和m p e g 9 山东大学硕士学位论文等标准对灰度图像一般可压缩几倍到几十倍而对于彩色图像压缩比将达到几十倍甚至上百倍采用自适应差分脉冲编码调制的音频数据压缩比通常能到4 1 8 1 视频数据的压缩比最为可观采用混合编码的多媒体系统压缩比通常可达1 0 0 1 4 0 0 1 另外随着感知生理心理学的发展人们越来越清楚地认识到人的视觉特点与统计意义上的信息分布并不一致即统计上需要更多的信息量才能表征的特征对视觉感知可能并不重要比如人眼睛对于图像量化误差的敏感度与存在量化误差的图像的变化程度有密切的关系图像变化越剧烈量化误差越不容易察觉比如图像的轮廓及边缘部分因此这部分图像的量化可以采用较大的量化参数而在图像变化平坦的区域量化误差容易被察觉因此需要采用较小的量化参数进行细量化这时压缩技术的研究就突破了传统的s h a n n o n 信息理论的框架注重对感知特性的利用这种编码叫做视觉感知编码绷视觉感知编码使得压缩效率得到进一步的提高 1 4 视频编码的标准化进程近二十年来图像编码技术得到了迅速发展和广泛应用并且日臻成熟其标准是多个关于图像编码的国际标准的制定 i s o 和国际电工委员会 i n t e r n a t i o n a l e l e c t r o t e c hn i c a lc o m m u s s i o n i e c 关于静止图像的编码标准j p e g j p e g 2 0 0 0 j o i n tp h o t o g r a h i ce x p e r t sg r o u p j p e g 关于运动图像的编码标准m p e g 1 m o v i n gp i c t u r ee x p e r t sg r o u p m p e g m p e g 2 m p e g 4 等以及i t u 制定的视频图像编码标准h 2 6 x 系列这些标准融合了各种性能优良的图像编码算法代表了目前图像编码技术的发展水平 u 的前身国际电报电话咨询委员会 c o n s u l t a t i v ec o m m i t t e eo fi n t e r n a t i o n a l t e l e g r a p ha n dt e l e p h o n e c c i t t 于1 9 8 8 年制定了电视电话和会议电视的h 2 6 1 建议草案 h 2 6 1 是最早出现的实用的视频编码标准它是特别为面对面的可视电话和视频会议而设计的 h 2 6 1 的基本思路是使用类似j p e g 标准的算法压缩视频流中的每一帧图像同时采用运动补偿的帧间预测来消除视频流在时间维度上的冗余信息 1 9 9 6 年3 月n u 制定的h 2 6 3 标准是一种用于低比特牢视频业务中 1 0 山东大学硕士学位论文运动图像部分的压缩编码方法视频编码算法的基本思想是基于1 1 r u 的h 2 6 1 标准把减少空间冗余的帧内预测法和减少时间冗余的变换编码法结合起来编码器有运动补偿能力并有一些功能编码方法选项与采用全象素精度和一个环形滤波器的h 2 6 1 标准的运动补偿比较 h 2 6 3 标准采用了半象素精度位移估值 h 2 6 3 是对原有标准的修订和改进包括图像格式总开销和减少方块效应等尽管这些选项使编码器复杂但能显著改善图像的质量 1 9 9 8 年i t u 推出的h 2 6 3 是h 2 6 3 建议的第二版它提供了十二个新的可协商模式和其他特征进一步提高了压缩编码性能另外 h 2 6 3 对h 2 6 3 中的不受限运动矢量模式进行了改进加上十二个新增的可选模式不仅提高了编码性能而且增强了应用的灵活性 h 2 6 3 在h 2 6 3 基础上增加了三个选项增强型参考帧选项数据分片选项和在h 2 6 3 的码流中增加补充信息主要是为了增强码流在恶劣信道上的抗误码性能同时为了提高增强编码效率在此基础上 i s o 在1 9 9 3 年通过了运动图像专家组提出的m p e g 1 标准 m p e g 1 可以对普通质量的视频数据进行有效编码为了支持更清晰的视频图像特别是支持数字电视等高端应用 i s o 于1 9 9 4 年提出了新的m p e g 2 标准相当于c c i t t 的h 2 6 2 标准 m p e g 2 对图像质量作了分级处理可以适应普通电视节日会议电视高清晰数字电视等不同质量的视频应用在我们的牛活中可以提供高清晰画面的d v d 影碟所采用的正是m p e g 2 标准因特网的发展对视频压缩提出了更高的要求 i s o 于1 9 9 9 年通过了m p e g 4 标准相当于 i t u 的h 2 6 3 和h 2 6 3 标准 m p e g 4 标准拥有更高的压缩比率支持并发数据流的编码基于内容的交互操作增强的时间域随机存取容错基于内容的尺度可变性等先进特性 m p e g 4 标准同以前标准的最显著的差别在于它是采用基于对象的编码理念即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象分别编码后再经过复用传输到接收端然后再对不同的对象分别解码从而组合成所需要的视频和音频这样既方便我们对不同的对象采用不同的编码方法利表示方法又有利于不同数据类型间的融合并且这样也可以方便的实现对于各种对象的操作及编辑例如我们可以将一个卡通人物放在真实的场景中或者将真人置于一个虚拟的演播室里还可以在瓦联网上方便的实现交瓦根据自己的需要有选择的组合各种视频音频以及图形文本对象山东大学硕士学位论文从h 2 6 1 视频编码建议到h 2 6 3 h 2 6 3 h 2 6 3 以及m p e g 1 m p e g 2 m p e g 4 等视频编码标准都有一个共同的不断追求的目标即在尽可能低的码率或存储容量下获得尽可能好的图像质量而且随着市场对图像传输需求的增加如何适应不同信道传输特性的问题也日益显现出来为了解决这些问题 i s o i e c 和i t u 两大国际标准化组织于2 0 0 1 年1 2 月在泰国p a t t a y a 成立了视频联合工作组 j o i n tv i d e ot e a m n t 由这两个国际标准化组织的有关视频编码的专家联合组成 j t 的工作目标是制定一个新的视频编码标准以实现视频的高压缩比高图像质量良好的网络适应性等目标于是视频压缩新标准一 h 2 6 4 觚于2 0 0 3 制定出来其中在r r u t 该标准被称为h 2 6 4 在i s o i e c 称之为m p e g 4 的第1 0 部分先进视频编码 a d v a n c ev i d e oc o d i n g a v c 在本文将该技术统一称为h 2 6 4 a v c 图1 1 概况地给出了上述这些视频编码标准的发展历程 1 9 8 21 9 8 61 9 8 81 9 9 21 9 9 62 0 0 02 0 0 4 图1 1视频编码的发展历程 1 5 视频编码中的熵编码技术视频图像编码的最后一步是熵编码是无损压缩的编码方法它生成的码流能经解码无失真地恢复出原数据在视频压缩中常用的熵编码方法有h u f m a n 编码和算术编码它们都是基于概牢统计特性的熵编码方法可以逼近熵下界两者相比算术编码的性能更好更能逼近待编码信源的熵值且容易适应信号统计 1 2 圉曰山东大学硕士学位论文特性的变化但它比h u f m a n 编码更复杂在早期的标准中根据典型视频序列的统计特性设计v l c 码表在随后的编码过程中 v l c 码表一般就是固定的但信源的统计特性实际上是变化的因此固定码表就不能自适应地匹配图像内容的改变和充分利用编码符号之间的相关性针对上述缺点熵编码的发展方向是自适应地利用基于上下文内容的相关性更好地去除这些相关性提高压缩效率 h 2 6 4 a v c 中有两种熵编码方法基于上下文的自适应变长编码 c o n t e x t b a s e da d a p t i v ev a r i a b l el e n g t hc o d i n g c a v l c 和基于上下文的自适应二进制算术编码 c o n t e x t b a s e da d a p t i v e b i n a r ya r i t h m e t i c c o d i n g c a b a c 对不同的编码方案采用不同的选择它们充分考虑和利用了视频流的上下文信息利用己编码符号为待编码符号选择合适的上下文模型上下文模型提供了对当前待编码符号的概率估计利用这些信息可以进一步消除编码符号之间的相关性提高编码效率由于这种选择是在编码的过程中实时进行的它们能够自适应视频流的实际统计信息保证选择的上下文模型能够匹配视频流的实际统计特性 1 6 视频编码中的率失真优化技术率失真优化理论源于信息论是视频编码优化的理论基础同时在实际视频编码器中率失真优化编码技术贯穿整个视频编码系统首先率失真优化的失真与晕化紧密相关因而牢失真优化在量化器设计中起着重要的作用常用来设计加权量化矩阵等率失真优化还可用于选择宏块的编码参数如在编码宏块的过程中如何选择最优的运动矢量编码模式等解决优化位分配问题是率失真优化编码技术的另一重要应用即如何在宏块图像间进行优化位分配使得在满足一定比特数约束条件下总的失真最小这也是码率控制通常要解决的问题由于位分配单元宏块或图像间的失真是彼此相关的这种依赖关系使得位分配问题变得更加复杂对此常利用率失真函数的单调性或假定其是不相关的来降低问题的求解复杂性码牢控制就是率失真优化技术的一典型应用在码率控制的过程中通常先建山东大学硕士学位论文立率失真模型然后根据率失真模型进行位分配量化参数调整使得在达到码率控制的同时使失真最小率失真的模型一般可以通过理论推导或数据统计的方法建立在实际实现过程中可以分为两步进行第一步为位分配即根据目标码率以及缓冲区状态为每一帧图像分配一定的比特数第二步通过调整量化参数使得编码该帧图像所用的比特数接近分配给该帧的比特数从而达到目标码率通常可以在宏块片或帧级进行量化参数调整以产牛所需要的编码码流每种视频编码标准都推荐了一种适合其自身的码率控制方案如m p e g 2 的t m 5 h 2 6 3 的t m n 8 和m p e g 4 的v m 8 等在h 2 6 4 a v c 标准中使用了拉格朗日率失真优化策略此优化操作是对拉格朗日函数的最小化对于所有帧内帧间宏块编码模式及多参考帧的选择都是通过对拉格朗日函数的最小化来实现的 1 7 本文主要研究内容和结构安排论文工作的丰要内容在于对h 2 6 4 a v c 标准中c a b a c 算法和r d o 算法进行研究和优化进一步提高h 2 6 4 a v c 编码器的编码效率以及重建图像的主观质量本文各章节安排如下第一章绪论第二章 h 2 6 4 a v c 视频编码标准概述第三章 h 2 6 4 a v c 标准中的c a b a c 与r d o 技术概述第四章基于c a b a c 的运动矢量上下文建模算法的研究和优化第五章基于人类视觉系统感知特性的r d o 算法的研究和优化第六章总结和展望 1 4 山东大学硕士学位论文第二章 h 2 6 4 a v c 视频编码标准概述新的视频编码标准h 2 6 4 a v c 的宗旨在于开发出适应各种不同应用的视频高压缩需求的新建议诸如视频会议数字存储媒体电视广播以及互联网传输与通信等并要求新建议的编码视频表示要以更加灵活的方式来适应各种不同的网络环境应允许可供操作的活动视频以计算机数据的方式在各种不同的存储媒体中存储在现存的和未来的网络中传播和接收并在现存的与未来的广播信道上传播 h 2 6 4 a v c 视频编码标准中采用了分层处理技术主要包括两层视频编码层 v i d e oc o d i n gl a y e r v c l 和网络抽象层 n e t w o r ka b s t r a c t i o nl a y e r n a t v c l 主要研究基于常规的运动补偿系数变换编码熵编码等编码技术来提高视频信号编码效率使用的最基本的表示法是片技术即将一个待处理的图像分割成许多宏块 m a c r o b l o e k m b 来进行处理除了研究提高编码效率和简化语法形式之外为了实现网络友好和无缝传输v c l 数据 n a l 将v c l 从具体的传输层中抽象出来定义了一个基本的和独立于网络的表示法 n a l 负责使用下层网络的分段格式来封装数据包括组帧逻辑信道的信令定时信息的利用或发序列结束信号下面简单介绍几个应用在h 2 6 4 a v c 标准中的关键技术 2 1h 2 6 4 a v c 标准中的关键技术 1 帧内坝测编码帧内编码用来去除图像的空间冗余为了提高帧内编码的效牢 h 2 6 4 a v c 在给定帧中充分利用相邻宏块的空间相关性相邻的宏块通常含有相似性因此在对给定宏块编码时首先可以根据周围的宏块预测典型的是根据左上角的宏块因为此宏块已经被编码处理然后对预测值与实际值的差值进行编码这样相对于直接对该帧编码而言可以大大减小码率在h 2 6 4 a v c 中 4

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（信号与信息处理专业论文）h264avc标准中cabac熵编码和率失真优化技术的研究与优化.pdf

文档简介

温馨提示

最新文档

评论

（信号与信息处理专业论文）h264avc标准中cabac熵编码和率失真优化技术的研究与优化.pdf

文档简介

温馨提示

最新文档

评论

相关文档