（微电子学与固体电子学专业论文）h264帧内预测算法的研究及其vlsi设计.pdf

上传人：活*** IP属地：宁夏上传时间：2019-12-15 格式：PDF 页数：56 大小：12.81MB 积分：0 举报 版权申诉

（微电子学与固体电子学专业论文）h264帧内预测算法的研究及其vlsi设计.pdf_第2页

（微电子学与固体电子学专业论文）h264帧内预测算法的研究及其vlsi设计.pdf_第3页

（微电子学与固体电子学专业论文）h264帧内预测算法的研究及其vlsi设计.pdf_第4页

（微电子学与固体电子学专业论文）h264帧内预测算法的研究及其vlsi设计.pdf_第5页

已阅读5页，还剩51页未读，继续免费阅读

（微电子学与固体电子学专业论文）h264帧内预测算法的研究及其vlsi设计.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要 i illilllli l l l l l l li l lii i i ii l l l li il y 2 1 2 8 4 6 3 论文题目：h 2 6 4 帧内预测算法的研究及其v l s i 设计学科名称：微电子学与固体电子学研究生：何凯签名：鱼i 也指导教师：余宁梅教授签名：金i 迅摘要目前h 2 6 4 视频编码技术在视频压缩领域应用最为广泛，也代表了当今最先进的视频编码技术。本研究是对h 2 6 4 帧内预测模式选择的算法进行研究的基础上对其中关键模块进行 a s i c 设计。帧内预测技术是以消除空问冗余来实现压缩的技术，本文首先对帧内预测的模式选择算法进行研究。如果在帧内预测模式选择中全部采用全搜索算法，将产生很高的计算复杂度。本文研究了针对h 2 6 4 帧内预测进行基于边缘方向矢量的快速算法及其优化，从而达到代替全搜索算法降低计算复杂度的目的。优化算法用c 语言实现后，在h 2 6 4 的j m l 6 1 校验模型中进行实验比较。最终的实验结果表明：与全搜索算法相比，快速算法降低了3 0 左右的编码时间，计算复杂度大幅降低的同时峰值信噪比几乎不变。帧内预测的硬件设计是课题组的视频处理器设计的一部分，以降低通用处理器运算量为主要目的。以全搜索算法为对象，采用s a t d 代价模型进行硬件结构设计，用v e r il o gh d l 语言实现各模块，实现基于a s i c 的硬件加速的目的。关键词：h 2 6 4 帧内预测边缘矢量峰值信噪比a s i c 西安理工大学硕士学位论文 t h e s i s ：r e s e a r c ha n dv l s ii m p l e m e n t a t i o no fi n t r ap r e d i c t i o na l g o r i t h mo n t h eh 2 6 4v i d e oc o d i n gs t a n d a r d s u b j e c t ：m i c r o e l e c t r o n i c sa n ds o l i de l e c t r o n i c s s t u d e n t ：h e k a i t u t o r ：p r o f e s s o ry un i n g m e i a b s t r a c t s i g n a t u r e ：比妨： s i g n a t u r e ：m m a tp r e s e n t h 2 6 4i st h em o s tw i d e l yu s e dv i d e oc o d i n gc o m p r e s s i o na l g o r i t h mi nt h ef i e l d o fv i d e oc o m p r e s s i o n ，a l s or e p r e s e n t st h em o s ta d v a n c e dv i d e oc o d i n gt e c h n i q u e s f i r s t l y , t h i s a r t i c l er e s e a r c h e dt h eh 2 6 4i n t r ap r e d i c t i o nm o d es e l e c t i o na l g o r i t h m ，o nt h eb a s i so fw h i c h p r o p o s e da s i cd e s i g nf o rt h ek e ym o d u l e s i n t r ap r e d i c t i o ni st h et e c h n o l o g yw h i c hr e d u c e st h e s p a t i a lr e d u n d a n c yt oi m p r o v e c o m p r e s s i o ne f f i c i e n c yo fv i d e oe n c o d i n g f i r s t l y , t h i sa r t i c l er e s e a r c h e dt h ei n t r ap r e d i c t i o nm o d e s e l e c t i o na l g o r i t h m i ff u l ls e a r c hi su s e df o ra l li n t r ap r e d i c t i o nm o d ea l g o r i t h m ，r e s u l t i n gi nh i g h c o m p u t a t i o n a lc o m p l e x i t y i nt h i sp a p e r , t h er e s e a r c hf o c u s i n go nt h ei n t r ap r e d i c t i o nf a s t a l g o r i t h mf o rt h ee d g ed i r e c t i o nv e c t o ra n dt h eo p t i m i z a t i o no fi t ，i n s t e a do ff u l ls e a r c ha l g o r i t h m t oa c h i e v et h ec o m p u t a t i o n a lc o m p l e x i t yo ft h ep u r p o s eo fr e d u c i n g f r a m ep a r t sf o rt h e o p t i m i z a t i o na l g o r i t h m ，a n dc o m p l e t e dt h eo p t i m i z a t i o n o ft h ec l a n g u a g ea n db r o u g h t o p t i m i z a t i o ni nh 2 6 4j m 16 1c h e c kt h em o d e le x p e r i m e n t a l l y t h er e s u l t ss h o w e dt h a t ：c o m p a r e d w i t ht h ef u l ls e a r c ha l g o r i t h m ，f a s ta l g o r i t h mr e d u c e st h ee n c o d i n gt i m ea b o u t3 0 ，w h i l et h e p s n ri sa l m o s tc o n s t a n t t h eh a r d w a r ed e s i g no ft h ei n t r ap r e d i c t o ni st h ep a r to ft h ev i d e op r o c e s s o rd e s i g ni n r e s e a r c hg r o u pt or e d u c et h eg e n e r a lp u r p o s ep r o c e s s o r f o rt h ef u l ls e a r c ha l g o r i t h m ，t h ed e s i g n a d o p t ss a t dc o s tm o d e l ，u s i n gv e r i l o gh d ll a n g u a g ed e s i g n e dt h em o d u l e s ，w h i c ha c h i e v et h e g o a lo fh a r d w a r ea c c e l e r a t i o n k e yw o r d s ：h 2 6 4 a v ci n t r ap r e d i c t i o ne d g ev e c t o rp s n ra s i c 2 目录目录 1绪论1 1 1 研究背景1 1 2视频编码技术的研究现状1 1 3论文研究内容4 1 4 论文组织结构4 2h 2 6 4 视频编码标准的原理及技术特点5 2 1h 2 6 4 的基本框架5 2 1 1 编解码器框图5 2 1 2h 2 6 4 的分层结构7 2 1 3h 2 6 4 的档次和级8 2 2 帧内预测编码8 2 2 1帧内预测原理及流程8 2 2 2 几种帧内预测模式9 2 2 34 4 亮度块帧内预测1 0 2 2 41 6 1 6 亮度块帧内预测1 6 2 2 58 8 亮度块帧内预测1 8 2 2 68 8 色度块帧内预测1 8 2 3h 2 6 4 其他主要算法1 9 2 3 1 帧间预测编码1 9 2 3 2 整数d c t 变换与量化1 9 2 3 3 熵编码2 0 2 4 本章小结2 1 3h 2 6 4 帧内预测模式选择优化算法的研究2 2 3 1h 2 6 4 的代价函数模型2 2 3 1 1s a ( t ) d 代价函数模型2 2 3 1 2r d o 代价函数模型2 3 3 2 帧内预测算法优化2 3 3 2 1基于r d o 模型的帧内全搜索算法2 3 3 2 2 快速帧内预测算法2 4 3 2 3 基于边缘矢量的帧内优化算法的原理2 5 3 2 4 基于边缘矢量的帧内优化算法的流程2 6 3 2 5 基于边缘矢量的帧内优化算法的实现及思考2 7 3 3 本章小结3 2 4h 2 6 4 帧内预测模式选择的v l s i 设计3 3 1 西安理工大学硕士学位论文 2 4 1 帧内预测模式选择的结构设计3 3 4 2i n t r a 4 x 4 模式设计3 4 4 3i n t r a 8 x 8 模式4 5 4 4i n t r a l 6 x 1 6 模式4 7 4 5 本章小结4 8 5结束语4 9 致谢5 0 参考文献5 1 绪论 1 绪论 1 1 研究背景随着时代发展，科学技术日新月异，9 0 年代初期人们憧憬的信息高速公路已经变成了现实。硬件设施的支持下人们对于信息的需求，早己不满足于文字，声音，而生动、直观、形象的视频资讯正大量的出现在教育、娱乐、科技、商务等各个领域。为了满足视频资讯的存储、传输和观看，视频处理技术飞速发展并获得了广泛的关注。人们在享受视频资讯带来的越来越生动便捷的体验的同时，也要面临视频图像在数字化后数据容量庞大，在传输、存储及处理的过程中遇到许多不易克服的困难。以一帧c i f 图像为例，其信息量大于9 0 0 k b i t ，如要实时传输则2 2 m b i t 秒，1 g b 硬盘也不过存储6 分钟视频。假如图像是1 0 8 0 p 全高清，其存储所需容量之大将更为惊人，对其进行实时传输的带宽要求则不可想象。因此在视频会议，可视电话，视频监控，数字电视等要求视频信息实时传输的领域，视频图像数据量大的问题更加凸显。视频压缩即是将原始数字视频经过一系列的变换处理，用处理后的小容量数据来表示原始视频的大容量数据信息的过程。用这些较小的数据可以完全地或者近似于完全地恢复原始视频信息。数字视频信号本身的特点也具备了对其进行压缩的可能： l 、客观上，视频信号存在大量冗余，图像变换一般有个过程，大部分区域信号不会剧烈变换，特别是背景部分，图像在空间和时间上具有相关性，这两种相关性分别就称为空间冗余和时间冗余。对这种冗余进行编码并且重构后可以最大限度的恢复图像的完整性。 2 、主观上，利用人眼的视觉特性，人眼对于图像的细节、运动、对比度的分辨率都有一定的感觉界限。因此可以降低例如图像灰度之类的信号以客观失真换取一定的压缩比率，只要在处理时引起的失真不明显，仍可认为图像是完整的或者足够好的。此背景下，就要研究怎样才能最大限度的压缩图像而使重建后的图像能够被用户所接受，大量学者、机构、组织参与到视频压缩技术的研究中来，各种视频图像压缩编码标准不断产生。“1 1 2视频编码技术的研究现状进入上个世纪8 0 年代后期，视频编码技术发展进入快车道。1 9 8 4 年c c i t t ( 国际电报电话咨询委员会) 第1 5 研究组发布了数字集群电视会议编码标准h 1 2 0 建议。1 9 8 8 年c c i t t 通过了“p x 6 4 k b p s ( p = 1 ，2 ，3 ，4 ，3 0 ) ”视频编码标准h 2 6 1 建议，被称为视频压缩编码的一个里程碑。从此，i t u t ( 从1 9 9 3 年3 月1 日起，国际电报电话咨询委员会( c c i t t ) 改组为国际电信联盟( i t u ) 电信标准化部门，简称i t u t 。) 、i s o ( 国际标准化组织) 等公布的基于波形的一系列视频编码标准的编码方法都是基于h 2 6 1 中的混合编码方法“1 。 1 西安理工大学硕士学位论文 h 2 6 1 视频编码器的目设计的是为了在带宽为6 4 k b p s 的倍数的综合业务数字网 ( i s d nf o ri n t e g r a t e ds e r v i c e so i g i t a ln e t w o r k ) 上传输质量可接受的视频信号。编码程序设计的码率是能够在4 0 k b p s 到2 m b p s 之间工作，能够对c i f 和o c i f 分辨率的视频进行编码，即亮度分辨率分别是3 5 2 x 2 8 8 和1 7 6 x 1 4 4 ，色度采用4 ：2 ：0 采样，分辨率分别是1 7 6 x 1 4 4 和8 8 x 7 2 。在1 9 9 4 年的时候，h 2 6 1 使用向后兼容的技巧加入了一个能够发送分辨率为7 0 4 x 5 7 6 的静止图像的技术。 h 2 6 1 作为第一种实用的数字视频编码标准，具有以下特点：t t 2 6 1 使用了混合编码框架，包括了基于运动补偿的帧间预测，基于离散余弦变换的空域变换编码，量化， z i g z a g 扫描和熵编码。h 2 6 1 编码时基本的操作单位称为宏块。h 2 6 1 使用y c b c r 颜色空间，并采用4 ：2 ：0 色度抽样，每个宏块包括1 6 x 1 6 的亮度抽样值和两个相应的 8 x 8 的色度抽样值。 1 9 8 6 年，i s o 和c c i t t 成立了联合图像专家组( j p e g ) ，研究连续色调静止图像压缩算法国际标准。1 9 9 2 年7 月通过了j p e g 标准。 1 9 8 8 年，i s o i e c 信息技术联合委员会成立了活动图像专家组( m p e g ) 。1 9 9 1 年公布了 m p e g 一1 视频编码标准，码率为1 5 m b p s ，主要用于家用v c d 的视频压缩。1 9 9 4 年1 1 月，公布了m p e g 一2 标准，用于数字视频广播( d v b ) 、家用d v d 的视频压缩及高清晰电视( h d t v ) 。码率从4 m b p s 、1 5 m b p s 、直至l o o m b p s ，分别用于不同档次，不同级别的视频压缩中。 m p e g 一1 是为c d 光碟介质定制的的视频和音频压缩格式。m p e g 一1 视频算法主要采用有以下技术：可变图像尺寸、i 帧编码、p 帧编码、b 帧编码、多参考帧运动补偿、1 2 像素精度的运动估计、量化矩阵、g o f ( g r o u po ff r a m e ) 结构、s l i c e 结构等。m p e g - 1 的缺点如下：一是压缩比还不够大；二是图像清晰度还不够高，m p e g l 最大清晰度仅为3 5 2x2 8 8 ；三是对传输图像的带宽有一定的要求，不适合网络传输；四是m p e g l 的录像帧数固定为每秒2 5 帧，不能丢帧录像，使用灵活性较差。 m p e g 一2 是为更清晰的制定的视频压缩标准。m p e g 一2 视频算法主要采用以下技术：基于 8 x 8 块的余弦变换( d c t ) 、符合视觉系统的量化器、z i g z a g 扫描、游程编码、采用霍夫曼编码的熵编码机制、码率可控信道缓存、双向运动估计、运动补偿等。 1 9 9 5 年，i t u t 推出h 2 6 3 标准，用于低于6 4 k b p s 的低码率视频传输。1 9 9 8 年和2 0 0 0 年又分别公布了h 2 6 3 + 、h 2 6 3 + + 标准。 h 2 6 3 视频编码标准是专为中高质量运动图像压缩所设计的低码率图像压缩标准。 2 6 3 标准在低码率下能够提供比h 2 6 1 更好的图像效果，主要区别有6 个方面：第一、h 2 6 3 的运动补偿使用半象素精度，而h 2 6 l 则用全象素精度和循环滤波；第二、数据流层次结构的某些部分在h 2 6 3 中是可选的，使得编解码可以配置成更低的数据率或更好的纠错能力；第三、h 2 6 3 包含四个可协商的选项以改善性能；绪论第四、h 2 6 3 采用无限制的运动向量以及基于语法的算术编码；第五、采用事先预测和与m p e g 中的p b 帧一样的帧预测方法；第六、h 2 6 3 支持5 种分辨率，即除了支持h 2 6 l 中所支持的q c i f 和c i f 外，还支持 s q c i f 、4 c i f 和1 6 c i f ，s q c i f 相当于q c i f 一半的分辨率，而4 c i f 和1 6 c i f 分别为c i f 的4 倍和16 倍。 h 2 6 3 具有以下技术特点：将编码过程分为帧内和帧间编码两个部分。帧内用改进的d c t 变换并量化，在帧间采用1 2 像素运动矢量预测补偿技术，使运动补偿更加精确，量化后使用改进的编码表( v l c ) 对量化数据进行熵编码，得到最终的编码系数。 1 9 9 9 年1 2 月，i s o i e c 通过了m p e g 4 标准，它在定义视频编码标准外，还强调了多媒体通信的交互性和灵活性。这一特点使它有别于之前的各种编码标准。 m p e g 一4 除采用第一代视频编码的核心技术，如变换编码、运动估计与运动补偿、量化、熵编码外，还提出了以下关键技术：l 、视频对象提取技术。2 、v o p 视频编码技术。3 、视频编码可分级性技术。4 、运动估计与运动补偿技术。 m p e g - 4 第一次提出了基于内容、基于对象的压缩编码思想。它要求对自然或合成视听对象作更多分析甚至是理解，这正是信息处理的高级阶段。1 i t u - t 视频编码专家组( v c e g ) 和i s o i e c 运动图像专家组( m p e g ) 于2 0 0 1 年成了联合视频组( j v t ) ，为了研发一种新型的、面向实际应用的高质量、高压缩比的视频标准。2 0 0 1 年7 月，m p e g 认为新的编码方式较之前的m p e g 一4 标准有很大的优势，有必要吸收到m p e g 一4 中对其进行完善。因此联合视频组对h 2 6 l 展开研究，为了推出能够覆盖所有低带宽和高带宽应用的高质量的标准。2 0 0 3 年3 月新的标准发布，命名为i t u th 2 6 4 或者i s o i e c m p e g 一1 0a v c 。2 0 0 3 年3 月由i t u t i s o 发布h 2 6 4 视频编码标准，作为新一代视频压缩标准，拥有相比以往标准更出色的性能。例如，与h 2 6 3 或者m p e g 一4 相比，在同样的质量下，其码率降低5 0 左右；换句话讲就是在同样的码率下，其信噪比明显提高。正是由于如帧内预测、1 4 精度运动估计、多参考帧、c a b a c 、c a v l c 、环路滤波等技术的采用，h 2 6 4 拥有出色的压缩性能和良好的网络亲和性，使得h 2 6 4 标准在互联网大量普及的今天格外有吸引力，这也是本文的研究对象。1 观撷隧缘派揣抓准图1 1 视频图像压缩编码国际标准发展历史 f i g 1 1v i d e o i m a g ec o m p r e s s i o nh i s t o r yo fi n t e r n a t i o n a ls t a n d a r d s 西安理工大学硕士学位论文 1 3 论文研究内容本文首先对h 2 6 4 编码器原理进行掌握，尤其对帧内预测模式选择算法进行深入研究。在对一个1 6 x 1 6 宏块图像进行帧内模式选择时，需计算代价相关函数进行比较获得最佳模式信息。以研究的高档次模式为例，支持4 种帧内预测模式：用于4 x 4 亮度块的有i n t r a 4 x 4 、用于8 x 8 亮度块的i n t r a 8 x 8 、用于1 6 x 1 6 亮度块的i n t r a l 6 x 1 6 和用于8 x 8 色度块c i n t r a 8 x 8 的，它们分别具有9 种、9 种、4 种、4 种预测值计算模式。共有4 ( 1 6 x 9 + 4 x 9 + 4 ) = 7 3 6 种不同的组合，每种组合需要计算出代价函数值，因此计算量很大。本文以p a n 算法为基础对帧内预测模式选择算法进行研究，考虑几种不同的应用方式，在j m l 6 1 校验模型中进行对比实验。其次，在深入研究了帧内预测算法的基础上，对帧内预测模式选择的关键模块进行硬件设计，用v e r i l o g 语言完成各模块代码并测试。最终将与课题组其它模块配合使用在视频处理芯片中，以达到降低通用处理单元运算量的目的。 1 4 论文组织结构第一章绪论，着重阐述了课题的研究背景及其现实意义，并对各种视频编码标准进行简要介绍，最后在分析了目前相关课题的国内外研究现状的基础上，阐明了本文的研究内容。第二章详细介绍h 2 6 4 视频编码原理及帧内预测模式选择过程。第三章在深入研究h 2 6 4 算法的基础上，对帧内预测模式选择的优化算法进行研究。第四章分析图像处理流程，设计h 2 6 4 帧内预测模式选择硬件结构，编写各个模块代码并测试。第五章总结与展望。 4 h 2 6 4 视频编码标准的原理及技术特点 2 h 2 6 4 视频编码标准的原理及技术特点 i 2 6 4 是在h 2 6 i 。的基础上推出的，i t u t 和i s o 共同使用的新一代视频编码标准，并和以前的m p e g 系列标准形成技术体系。和以前的标准相比，它具有以下优点： 1 、增强的预测方式基于不同大小块的运动补偿、四分之一像素的运动估计、边界外推的运动矢量、多参考帧管理、显示次序的倒置、权重预测、增强的直接型 “s k i p p e d ”和“d i r e c t ”运动推测、帧内预测、环路滤波器等。 2 、增强的编码效率4 x 4 的整数变换和两种基于内容的熵编码：c a b a c 上下文自适应的二进制算术编码、c a v l c 上下文自适应的可变长编码。 3 、数据的强鲁棒性采用参数集机构、灵活的宏块顺序、灵活的片组大小和任意的片排序等。 4 、良好的网络亲和性主要表现在网络抽象层的单元语法机构和冗余图像数据划分及s p s i 帧。这些优于以前的特点使h 2 6 4 标准成为当前许多应用的理想标准。因而其应用范围十分广泛。b 1 2 1 h 2 6 4 的基本框架 2 1 1 编解码器框图 h 2 6 4 没有明确规定一个编解码器如何实现，而是规定了一个编码后视频流的句法和该比特流的编码方法。各个厂商的编解码器能够在此框架下互通，在现实上具有一定的灵活性，有利于互相竞争，促迸发展。编码框图如图2 一l 所示：西安理工大学硕士学位论文原始宏块图2 1h 2 6 4 编码器 f i g 2 1h 2 6 4v i d e oc o d i n gs c h e m a t i cd i a g r a m 进行编码的宏块由1 6 1 6 像素构成。每个宏块选择使用帧内预测还是帧间预测编码模式。不管经过哪种编码模式，都得到预测块。在帧内模式中，宏块的最佳帧内预测模式下得到的预测块要通过当前块和经过处理的重构块信息配合得到。在帧间模式中，预测宏块是通过一个或者多个参考帧经过运动补偿预测生成的。在图2 1 中，参考块就是之前编码得到的帧中对应的宏块；不过，并不只是一个参考帧，每个预测宏块都是由一个或者两个，之前或者之后的，已经编过码和重建所生成的帧中的对应宏块所生成的。当前宏块减去预测宏块生成残差宏块。残差宏块经过变换、量化后生成由一系列变换量化系数组成的数组。然后，对这些系数进行重排序和熵编码。熵编码生成的系数，附上解码宏块所需要的附加信息生成压缩比特流。压缩比特流被传到网络提取层( n a l ) 以发射或者储存酾1 。重建流程：为了生成重建帧以编码以后的宏块，将量化后的宏块残差系数进行解码。系数经过反量化，反变换生成残差宏块。此时的残差宏块与原先的残差宏块并不相同，原因是在量化过程中引入了失真。预测宏块与此时生成的残差宏块相加生成重建宏块。为了减小块效应失真，引入了专门的滤波器。滤波之后的宏块就是重建块，一系列的重建宏块组成了参考帧。编码器的重建流程的目的是为了确保编码端和解码端使用一致的参考帧来生成预测宏块。如果参考帧不一致，那么编码端和解码端的预测宏块就不一致，导致在编码端和解码端之间生成渐增的误差或者“漂移”。解码框图如图2 2 所示： 6 h 2 6 4 视频编码标准的原理及技术特点参考块图2 2h 2 6 4 解码器 f i g 2 2h 2 6 4 d e c o d e r 从n a l 中，解码器取得压缩比特流。数据元素经过熵解码和重排序生成一系列量化后的系数，也是重建的参考块。使用从比特流中解码出来的头信息，解码器生成预测宏块，与先前在编码器中生成的预测宏块一致。预测宏块与此时产生的残差宏块相加生成重建宏块，然后经过滤波，生成解码宏块。 2 1 2 h 2 6 4 的分层结构为了满足不同网络应用环境对于视频编码的需求，h 2 6 4 在系统层面上提出了一个新的分层设计的概念，具体分为网络提取层v c l 和视频编码层n a l ，如图2 3 所示。视频编码层作用是对数字视频进行高效的编解码。该层包含了视频图像的核心压缩编码算法的描述。网络抽象层的作用是将v c l 层提供的头信息、段结构信息、实际载荷等数据映射到不同的网络。使得h 2 6 4 编码的视频流可以在不同的网络上传输，具有网络适应性强，差错恢复能力强，抗误码能力强等优点。图2 3 视频编码层和网络提取层 f i g 2 3v i d e oc o d i n gl a y e ra n dt h en e t w o r ka b s t r a c t i o nl a y e r 西安理工大学硕士学位论文 2 1 3h 2 6 4 的档次和级 2 0 0 4 年7 月，针对广播级别的应用，在基本档次( b a s e l i n ep r o f i l e ) 、主要档次( m a i np r o f i l e ) 及扩展档次( e x t e n d e dp r o f i l e ) 之外又提出了高级档次( h i g hp r o f i l e ) 。三种常规档次的关系如图 2 4 所示。图2 4 三种档次结构关系及主要特征 f i g 2 - 4t h et h r e eg r a d es t r u c t u r ea n dm a i nc h a r a c t e r i s t i c s 基本档次主要用于电视会议、可视电话、远程医疗、扩展档次主要用于网络视频流，如视频点播。主要档次主要用于消费电子类的应用，如数字电视、高级档次主要应用于高清视频。“1 2 2 帧内预测编码远程教学等。数字视频存储等。次帧内预测是h 2 6 4 a v c 的重要特性之一，它可以利用相邻块中已经解码重建的像素值对当前块进行预测，然后对预测块和实际块的残差进行变换、量化、熵编码，从而消除空间冗余信息。视频图像经过这样的处理后，可以进一步提高编码效率，减少编码比特数。帧内预测技术可以充分利用视频图像在局部空间上的高度相关性，并且利用这种相关性进行预测，从而去除图像的空间冗余，有效的提高视频帧内预测编码的压缩效率。 2 2 1 帧内预测原理及流程帧内预测原理：帧内预测编码的原理是利用图像内部空间上相邻像素之间的相关性，采用帧内预测技术，最大程度的消除或减少空间冗余信息。同时，对预测残差进行变换、量化和熵编码，消 h 2 6 4 视频编码标准的原理及技术特点除编码冗余。虽然帧内编码主要用于i 帧编码，但p 帧和b 帧中的部分宏块也需要采用帧内编码方式。总的来说，帧内编码主要应用在以下几个方面：工帧：协议规定i 帧独立进行编码而不依赖于其他图像帧，因此i 帧必须采用帧内编码方式； p 帧和b 帧中的部分宏块：对于现有的视频编码标准( 除了m p e g 一4 第二部分) ，输入图像首先在空间上进行宏块级的分割，然后以宏块为基本单位进行编码。对于p 帧和b 帧中的每一个宏块，都要按照帧间编码和帧内编码两种方式进行编码，通过率失真函数计算两种方式的编码代价。对于某一个宏块，如果帧内编码的代价小于帧间编码的代价，则该宏块采用帧内编码方式。这种现象的主要原因是由于序列运动过于剧烈，导致参考帧中没有合适的参考块能够很好的与待编码宏块匹配，从而使得帧间编码代价过高。另一方面，当待编码帧是场景切换后的第一帧时，由于失去了时间上的相关性，因此尽管是p 帧或b 帧，也需要采用帧内编码方式。差错恢复：在解码端，为了对采用帧问方式进行编码的宏块进行解码，必须得到当前宏块参考块的信息。如果由于信道的问题导致传输过程中出现差错，在解码端不能得到参考块的信息或得到错误的信息时，当前宏块就不能按照帧间方式正确的进行解码，对于这种受错误影响的区域，可以采用帧内编码方式来进行差错恢复。在编码端，通过信源算法或缓冲区算法估计出待编码宏块对应的失真度，以确定该宏块是否采用帧内编码方式。这种差错恢复技术被称为帧内更新，也是帧内编码的一个重要应用。帧内预测的流程如图2 5 所示。最优预测模式华丽斟斋削可纠可耳磊目二躺图2 5 帧内编码流程图 f i g 2 5i n c a - c o d e df l o wc h a r t 码流经过帧内预测后得到最优预测模式和未经过变换量化的预测残差，残差经过变换量化后同最佳模式一起编码就得到视频比特流。 2 2 2 几种帧内预测模式 t t 2 6 4 支持三种亮度帧内预测和一种色度预测： 1 ) 用于4 4 亮度块编码的i n t r a 一4 4 ，有9 种预测模式，其中包括8 种方向性预测模式和一种均值预测模式，由于块尺寸较小，适合于图像细节丰富的区域； 9 西安理工大学硕士学位论文 2 ) 用于1 6 1 6 亮度宏块编码的i n t r a 一1 6 1 6 ，有4 种预测模式，适合于图像中的平坦区域： 3 ) 此外还有一种拓展模式8 8 亮度块编码的i n t r a 一8 8 ，与i n t r a 一4 x4 类似具有9 种预测模式； 4 ) 用于8 8 色度块编码的c i n t r a 一8 8 ，也有4 种预测模式，除预测模式编号不同外，与i n t r a 一1 6 1 6 相同。阳1 2 2 34 x 4 亮度块帧内预测 9 种预测模式，每种模式都有固定的方向，如果2 - 6 所示，4 x 4 预测时需要用的预测样值分布如图2 - 7 所示。心彦万n 5 8 6 图2 - 64 x 4 亮度块预测方式下的预测方向 f i g 2 6 p r e d i c tt h ed i r e c t i o no f4 x 4 mabc d efgh abcd e k mno 图2 7 帧内预测时的像素分布 f i g 2 7 t h ep i x e ld i s t r i b u t i o no fi n t r ap r e d i c t i o n 4 x 4 块中 a ，b ，c ，d ，e ，f ，g ，h ，i ，j ，k ，l ，m ，n ，o ，p为预测值由预测样值 a ，b ，c ，d ，e ，f ，g ，h ，i ，j ，k ，l ，m 通过预测算法计算得到。具体算法如下： l 、i n t r a 一4 x 4 一v e r t i c a l ( 模式0 ) ：在i n t r a 一4 x 4 一v e r t i c a l 预测模式下，当前4 x 4 块的像素值由相邻的像素a 、b 、c 和 d 预测得出，像素预测值由式( 2 1 ) 决定，示意图如图2 8 所示： p r e d 4 x 4 l x ，y 】_ p x ，一1 ，x ，y = 0 3 ( 2 1 ) 1 0 h 2 6 4 视频编码标准的原理及技术特点 me ( 【 i(t(j 】 ei k【1 l 1n 一 lr 1 i 图2 - 8 f i g 2 8 模式0 m o d e 0 2 、i n t r a 一4 x 4 一h o r iz o n t a l 预测模式( 模式1 ) ：在i n t r a4 x 4h o r i z o n t a l 预测模式当前4 x 4 块的像素值被相邻的像素i 、j 、k 和l 预测得出，像素预测值由式( 2 2 ) 决定，示意图如图2 9 所示： p r e d 4 x 4 l 【x ，y = p 【1 ，y ，x ，y = 0 3 ( 2 2 ) mabcd tk tfl j6 l ，1 ，d - j l 一图2 9模式1 f i g 2 9 m o d e1 3 、i n t r a4 x 4d e 预测模式( 模式2 直流预测) ：在i n t r a4 x 4d e 模式下在这种预测方式下，当相邻像素a 、b ，c ，d ，i ，j ，k 及 l 均存在时由其像素值的平均值预测当前4 x 4 的亮度块；若只有像素i l 存在，则当前4 x 4 块由i l 像素值的平均值预测得到；若只有像素a d 存在，则当前4 x 4 块由a d 像素值的平均值预测得到；否则当前4 x 4 块的预测值均为1 2 8 ，如图2 一1 0 所示。西安理工大学硕士学位论文 1 2 mabc d l j k l i l) l 厂 + d + 2 ) 4 mabc d i j k l ，i 上i 上v l + 2 ) 4 图2 1 0 f i g 2 - 1 0 m abcd l j k l ，上亡l 上，、i n j m abc d l 1 2 81 2 81 2 81 2 8 j1 2 81 2 81 2 81 2 8 k1 2 81 2 81 2 81 2 8 l1 2 8 1 2 81 2 81 2 8 模式2 m o d e2 i + j + k + l + 4 ) 8 4 、i n t r a 一4 x 4 一d i a g o n a l d o w n l e f t 预测模式( 模式3 ) ：在i n t r a4 x 4d i a g o n a ld o w nl e f t 预测模式下，当前4 x 4 块的像素值被相邻的像素 a 、b 、c 、d 、e 、f 、g 和h 预测得出，像素预测值由式( 2 3 ) 决定，示意图如图2 1 1 所示。： p r e d 4 x 4 l x ，y 】_ ( p 6 ，- 1 】+ 3 木p 【7 ，一1 】+ 2 ) 2 ，x ，y = 3 p r e d 4 x 4 l x ，y 】= ( p x + y ，一1 】+ 2 木p 【x + y + 1 ，- 1 + p x + y + 2 ，- l 】+ 2 ) 2 x ，y 为其他值 ( 2 3 ) mabcdefgh j v y i 衫 yy l 少 j yy k y、y yy l 影彤图2 一ll f i g 2 11 模式3 m o d e3 5 、i n t r a _ 4 x 4 一d i a g o n a l d o w n r i g h t 预测模式( 模式4 ) ： h 2 6 4 视频编码标准的原理及技术特点在i n t r a _ 4 x 4 _ d i a g o n a l d o w n _ r i g h t 预测模式下，当前4 x 4 块的像素值被相邻的像素 a 、b 、c 、d 、i 、j 、k 、l 和m 预测得出，像素预测值由式( 2 4 ) ( 2 5 ) ( 2 6 ) 决定，示意图如图2 1 2 所示 p r e d 4 x 4 l 【x ，y 】= ( p x y - 2 ，一1 】+ 2 木p x y 一1 ，一1 】+ p x y ，一1 】+ 2 ) 2 ，x y ( 2 4 ) p r e d 4 x 4 l x ，y = ( p 一1 ，y - x 一2 + 2 术p 一1 ，y x - 1 】+ p 一1 ，y x 】+ 2 ) 2 ，x 2x ，y 为其他值 ( 2 6 ) 叭ab f d efg 、工文夭、拗j 、汰 y k 弋y l 、历猢沁图2 1 2 模式4 f i g 2 1 2 m o d e4 6 、i n t r a 4 x 4 一v e r t i c a l r i g h t 预测模式( 模式5 ) ：在i n t r a _ 4 x 4 _ v e r t i c a l r i g h t 预测模式下，当前4 x 4 块的像素值被相邻像素a 、b 、c 、d 、i 、j 、k 、l 和m 预测得出，像素预测值由式( 2 7 ) ，( 2 8 ) ，( 2 9 ) 决定：如图2 1 3 所示。 p r e d 4 x 4 l x ，y 】= ( p x 一( y 1 ) 一1 ，一1 】+ p x 一( y 1 ) ，一1 + 1 ) 1 ，( 2 7 ) 2 木xy = 0 , 2 ，4 ，6 z u 。p r e d 4 x 4 l x ，y 】= ( p x y - 2 , - 1 + 2 木p 【x y - 1 , - 1 】+ p x y ，。1 + 2 ) ( 2 8 ) 2 x y z u o p r e d 4 x 4 l 【x ，y 】- ( p 【0 ，一1 + 2 木p - 1 ，一1 + p 一1 ，0 + 2 ) 2 ，x ，y 为其他值 ( 2 9 ) 1 3 西安理工大学硕士学位论文 mabcd 工 rpfr j p 0占i 力j k ipr ， l 叁0 p j r q 3 图2 1 3 f i g 2 - 13 模式5 m o d e5 7 、i n t r a4 x 4h o r i z o n t a ld o w n 预测模式( 模式6 ) ：在i n t r a4 x 4h o r i z o n t a ld o w n 预测模式下，当前4 x 4 块的像素值被相邻的像素a 、b 、 c 、i 、j 、k 和l 预测得出，如图2 1 4 所示，像素预测值由式( 2 1 0 ) ，( 2 1 1 ) ，( 2 1 2 ) ，( 2 1 3 ) 决定：

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（微电子学与固体电子学专业论文）h264帧内预测算法的研究及其vlsi设计.pdf

文档简介

温馨提示

最新文档

评论

（微电子学与固体电子学专业论文）h264帧内预测算法的研究及其vlsi设计.pdf

文档简介

温馨提示

最新文档

评论

相关文档