H264 帧内预测模式选择快速算法.doc_第1页
H264 帧内预测模式选择快速算法.doc_第2页
H264 帧内预测模式选择快速算法.doc_第3页
H264 帧内预测模式选择快速算法.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精品论文h.264 帧内预测模式选择快速算法卢伟 武汉理工大学信息工程学院,湖北武汉(430070) e-mail:摘要:h.264引入帧内预测编码并用率失真优化(rdo) 进行预测模式选择,这显著提高了 压缩率,但增大了计算复杂性。本文从帧内预测模式判决代价函数和减少选择模式的数目两 个方面,提出了一种改进的算法。实验结果表明,该算法在保持图像质量的同时,降低了计 算的复杂度并提高了编码速度。关键词:h.264;帧内预测;快速算法 中图分类号:tn919.81. 引 言基于空间域的帧内预测是 h.264 的一项重要的新技术,以前的标准只是利用宏块内部的 相关性,而忽视了宏块之间的相关性,因而编码后的数据量一般很大,帧内预测则是利用了 图像的空间相关性,根据已解码的相邻块的信息来预测当前块的信息,对进一步提高编码的 性能具有重要作用,h.264 采用了 dro 技术获得了较好的编码效果,但由于 h.264 支持帧 内预测模式很多,所有编码的复杂度很高。从帧内预测的重要性和预测的复杂性可以看出, 研究帧内预测的快速算法具有重要的实用价值。一般说来,减少帧内预测复杂度的方法有两种。一种是简化代价函数,因为代价函数 本身的计算就很复杂;另一种是减少所要计算的预测模式数,对于第二种方法,可以预先排 除某些可能性很小的预测模式或是提前终止选择较佳的预测模式,从而降低帧内预测的复杂 度。本文首先介绍帧内预测算法的基本知识,其次对全搜索算法和当前存在的帧内预测模 式算法作出简要说明,并提出快算帧内预测模式选择算法,最后对实验结果进行分析。2.h.264 帧内预测模式选择算法h.264中帧内预测算法1支持两种块大小:4x4及16x16,根据已经编码及重建的块(当前 块上方,左方及左上方的块)来预测当前块,充分利用子块间的相关信息来降低码率。如图1 所示,一个4x4块包括16个像素a-p,周围块的像素am已经解码生成。4x4预测模式表示如 何用全部或部分周围块的像素a-m来预测生成当前块的16个像素值a-p。在4x4帧内预测中共 有9种不同方向的预测模式,如图2所示,其中模式2为dc预测,所有像素值(a-p)的预测值为(a+ b + c + d + i +j + k+ l) / 8。图1 4x4块及周围像素- 5 -图2 帧内预测模式类似地,在16x16预测中,周围宏块的33个像素被用来预测当前块,其中32个像素来自 上方和左方的宏块,一个像素来自左上方的宏块。16 x16有4种预测模式,如图3所示.图3 16x16块帧内预测模式8x8色度块的帧内预测模式与intra_16x16基本相同,共4种模式:垂直预测、水平预测、 均值预测和平面预测模式。四种模式的具体计算与16x16亮度块的计算相似。下面给出h.264 的参考软件jm8.6模型2中采用rdo技术的全搜索帧内选择过程:1)选择16x16分块下4种模式中的最小代价( rd _ cos t16 x16 )模式,代价按照如下计算。 a残差宏块分成16个4x4块分别进行hadamard变换。 b将以上变换的16个直流分量的1/4组成一个4x4块,对直流系数块进行hadamard变换。 c对所有的hadamard变换的系数的绝对值求和(a中的直流系数不计算在内),取和的1/2作为 rd _ cos t 。2)对16个4x4的小块分别计算9种帧内预测模式的代价,得到代价最小的模式,取16个最小代 价 之和得 到 rd _ cos t4 x 4 ,代 价计算 公 式 为 rd _ cos t = ssd + * r ,其中 ssd =( x , y a )2s x , y , t s x , y , t , = 0.85 2(qp 12) / 3,r表示熵编码之后的码率。3)比较 rd _ cos t16 x16 、 rd _ cos t4 x 4 ,选择代价较小的作为帧内预测模式。3. 快速算法的提出用全搜索法计算一个宏块的预测模式,需要计算 592 个不同的代价函数以选择最佳模 式,计算复杂度很大,需要采用一些快速算法进行优化。feng pan 等人在 jvt 会议提出了 一种基于边缘方向直方图的快速决策算法3,这种方法运用 sobel 算子映射出的边缘方向上的采样点对当前像素进行预测,通过边缘方向来确定候选模式,降低了运算量。bojun meng等人在文献提出了一种基于分组像素点的快速决策算法45,用分组像素点来代表一个块, 在决策的每一个步骤中仅计算一组像素点的代价函数,以此减少计算点数,简化运算。这两 种算法各有优缺点,但基本上能在保持编码效率的基础上减少运算的复杂度。本文在这个两 种算法的基础上及对代价函数的简化,提出了一种快速模式选择算法。3.1 代价函数选取在 jm8.6 模型中为了降低复杂度,也可以不使用 rdo 计算代价的方法而采用如下计 算方法:对于 4x4 块使用 cost = sa(t )d + 4 * p * ,其中 satd 表示进行 hadmard 变换之1,mod e=mpmp =后的 sad,0.mod e mpm ,mpm 是通过相邻宏块的编码模式预测当前块最有可能编码模式。对 qcif 格式的 foreman 序列(300 帧)使用全 i 帧的编码,设帧率为 30 帧/秒,分别使 用 satd,sad,rdo 三种判别方法进行编码,测试结果如表 1,可以看出使用 satd 比使用 sad 性能更接近 rdo 的结果,所以在 jm8.6 中采用 satd 的方法来计算代价花费。表 1 使用不同代价函数比较3.2 算法思想对一个 16x16 宏块,如果分成 16 个 4x4 子块进行 intra4x4 预测的话就要计算 144 种模 式,而直接使用 intra16x16 预测的话则只需要计算 4 种预测模式。事实上,intra4x4 预测适 合于宏块细节较多的情况,intra16xl6 预测更适合于相对平坦区域的预测,可以根据宏块的细 节度来选定一种预测模式进行预测,而不必两种预测都进行。现有算法就是利用这一点通过 判断提前中止来减少预测模式数的,它们基本上是通过设定一个闭值 t 来比较代价值进而 判断是否中止某些模式,但仍然先要计算 intra16xl6 的预测模式。算法基本思想是:首先根据宏块的细节度判断它是否平坦,平坦时采用 intra_16xl6 的预 测模式进行预测,否则将宏块划分成 16 个 4x4 的子块,对每个子块使用 intra_4x4 预测,这 样就避免了必须先进行 intra_16xl6 预测,减少了预测模式数.通过提取宏块直方图灰度值的 方法来判断其是否平坦。本文算法的流程图如图 4。16x 16 宏块 计算 直方 图灰 度值 由灰 度值 确定 分组 in t r a_ 1 6 x 1 6 预y测模 式in t r a _ 4 x 4 预测 模式 分别 预测 4 种 方向 宏块 分成 16 个 子块 选择 最优方 向分别预 测 9 种 方向 完成 编码 选择 最优 方向 完成 编码 图 4算法 流程 3.3 测试结果本文采用 jm8.6 作为测试的平台,并对代码作了部分修改,选取 froeman 和 news 两个 标准视频序列,每个序列选取 100 帧,且均为 qcif 格式,量化参数 qp 选择 24 和 32 两个 值,每个视频序列以全 i 帧方式编码,用全搜索算法 fs 作为对比,本文算法简称 new,下 面表 2 显示了测试的结果。表中 psnr 表示 y 分量的峰值信噪比,bit-rate 表示编码的码率。表 2 测试结果由上表测试结果可知,本文提出的算法与全搜索算法相比,能在降低很小 psnr 的值 的情况下增加较多码率,是一种比较有效的快速算法。4. 结束语在h. 264 帧内预测方法的基础上,本文提出了一种基于模式预测的快速帧内预测算法. 该算法针对全i帧编码,通过简化代价函数和利用图像的特征,提前中止模式判别,极大地减少 了帧内预测所需计算的模式数量,降低了运算复杂度. 实验结果表明:与全搜索相比,该快速 算法在保持编码视频的图像质量同时降低了计算量。参考文献1richardson iain ec.h.264/mpeg-4 part10s.white paper,2003-04 2joint video team (jvt).reference software jm8.63feng pan ,xiao lin, rahardja susanto et al, fast mode decision for intra predictionc.in: jvt g013,7thjvt meeting,2003-34bojun meng ,oscar c au,chi-wah womg et al.efficient intra-prediction algorithm in h.264c.in : ieee international conference on mutimedia&expo,maryland,2003:837-8405bojun meng, oscar c au. fast intra-prediction mode selection for 4x4 blocks in h.264c. in: icassp2003,2003:389-392a fast intra prediction algorithm in h.246lu weischool of information engineering, wuhan university of technology, wuhan hubei province(430070)abstracth.264 introduces intra prediction coding and uses rate distortion optimization (rdo) for modelchoice,it enhances intra encoding efficiency, but at zhe same time it increases the complexity of encoder. in consider of the cost function and the number of prediction models, we propose a f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论