外文翻译-hevc视频解码标准结构和复杂度分析

上传人：h*** IP属地：贵州上传时间：2018-03-17 格式：DOC 页数：13 大小：450KB 积分：30 举报 版权申诉

已阅读5页，还剩8页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

杭州电子科技大学毕业设计（论文）外文文献翻译毕业设计（论文）题目HEVC视频解码标准结构和复杂度分析翻译题目HEVC帧内编码的快速CU大小决定和决策模式算法学院通信工程学院专业通信工程专业HEVC帧内编码的快速CU大小决定和决策模式算法1摘要新兴起的高效视频编码HEVC是继H264/AVC的下一个国际视频编解码标准，在HEVC联合模式中，采用树结构编码单元（CU），它允许递归分割到四个同样大小的块。在每一深度水平处，它能够达到34帧内预测模式。HEVC中帧内模式决定过程使用所有可能的深度水平和预测模式，找到一个使用拉格朗日乘子有最小的速率失真（RD）成本的模式。它可以实现最高编码效率，但需要非常高的计算复杂度。在本文中，我们对HEVC帧内编码提出了一个快速CU大小决定和模式决定算法。由于最佳CU深度级别是高度内容相关的，为一个整体的图像使用固定CU深度范围是没有效率的。因此，我们可以跳过CU附近一些很少使用的特定深度级别空间。与此同时，不同深度级别或CU附近的空间有RD成本和预测模式的相关性。通过充分利用这些关系，我们可以跳过某些预测模式，如在高深度级别或CU附近的空间很少使用的关联的CU。实验结果证明忽略损失的编码效率该算法可以1LIQUANSHEN,ZHAOYANGZHANG,PINGAFASTCUSIZEDECISIONANDMODEDECISIONALGORITHMFORHEVCINTRACODINGIEEETRANSACTIONSONCONSUMERELECTRONICS,2013,591207213节省21计算复杂性。关键词HEVC，模式选择，帧内预测。I引言最近几年，数字视频在许多消费类应用的媒体内容中已经成为主导形式。视频编码是有利于数字视频传送的技术之一。为了提高对高清视频的编码效率，ISO/IEC运动图像专家组（MPEG）和ITUT视频编码专家组（VCEG）最近组成联合协作小组对视频编码（JCTVC）制定下一代视频编码标准。新标准化项目称为高效视频编码（HEVC），旨在与H264/AVC相比较大幅度提高编码效率，它以增加计算复杂度为代价，来达到占用一半带宽而得到与原来相媲美的图像质量，从而减少比特率的要求。HEVC采用树结构的编码单元（CU），并且这种结构完全打破了在H264/AVC的1616的宏块的正常程序（MB）的编码体系结构。在当前HEVC（HM）的测试模型，图像分为片，片分为一系列的树块。一个树块是一个NN（6464）的亮度样本块与色度采样的两个对应的块组合在一起，其概念是大致类似于所述在以前标准中的MB，如H264/AVC。CU是用于帧间/帧内预测区域分割的基本单位。在CU概念允许递归分裂成四个同样大小的块。这个过程提供了一个内容自适应编码树结构包括CU块可能大到一个树块或者小如88个像素。预测单元（PU）是承载相关的预测处理过程中信息的基本单元。对于帧内预测，每一深度处的水平都支持2种PU尺寸，这是2N2N和NN。PUS首先按照深度其次按照字母顺序优先原则进行编码。在当前HM，帧内编码支持5种类型的PU，它是6464，3232，1616，88，和44。除了预测块数量的增加，预测模式对于每个CU数也增加。内预测支持多达34方向以选择最佳方向。例如，模式的序号为6464，3232，1616，88和44前端已提高到34，34，34，34和17。以这种方式，与H264/AVC相比较总的计算负担急剧增加。图1表示树状结构CU的体系结构和各个PU的预测方向。如图1（A）部分所示CU的分裂过程（从6464到88），和（B）是PU大小和预测方向。对于目前的（X）水平CU的一部分的过程如图1（A）所示。当分离标志启用时，当前CU将被分割到下一深度级别（X1）。CU被分为4个子CU。图1（A）过程也将对于每个子CU进行。为确定最佳的深度级别，HM测试每个可能的深度水平，以估计由CU大小决定的每个CU编码性能。与此同时，一个CU可以分割成几个PU，如图1（B）。除了直流（DC）预测模式，各个PU具有33个可能帧内预测方向如图1（B）所示。类似于H264/AVC中，在HEVC帧内模式决策过程中使用所有可能的深度级别（CU大小）和帧内模式以找到一个使用拉格朗日乘数的最少速率失真（RD）成本的模式。在HM使用RD成本函数如下SEBJEEEMODODMOD其中，模式选择中指定要考虑比特成本，这取决于每个决定案件。SSE是当前CU和匹配块之间的平均差值，是拉格朗日乘数。这些深层次的决定，帧内预EOD测模式决定引起编码过程中的主要计算复杂性，这应为快速编码器的实施克服。图1递归CU结构插图和每一深度水平处帧内预测方向近来，已经提出了若干快速算法来降低HEVC编码器模式决定复杂度，以实现显著时间节省且有很小的编码效率损失。引入哈达玛成本的预判定以确定所述前N个最佳候选帧内模式。不是总帧内预测模式决定，而是RD优化仅应用于由粗模式决定选择的N个最佳候选模式，粗模式决定中所有模式在这个决定中比较。然而，在空间上相邻的CU帧内模式相关性在模式决策过程中尚未探索。由于局部图像纹理具有一致的取向可以覆盖附近的几个的CU，相邻的CU的模式信息可以被用来加速的帧内模式决定的过程。为进一步减轻编码器的计算负荷，利用的空间上相邻的CU的方向信息，以加快帧内模式决定。同时，相应的先前深入的PU帧内模式和电流深入的块尺寸转换单元9被用于提前终止帧内模式决定的过程。快速HEVC帧内模式决策算法10，11分别使用当前PU与梯度模的边缘信息直方图来选择候选预测的减少集方向。梯度信息或纹理的复杂性计算需要大量的时间。低复杂度的成本模型12用来为不同尺寸的CU实施水平滤波处理，从而降PU的需要五到两个级别数。编码邻接块的PU大小信息13被用来跳过当前块的小预测候选部。上述方法在HEVC发展很好，能够显著节省时间。然而，不同深度水平之间的编码信息的相关性的研究还是不充分的。与视频性能类似，在深度级X的CU预测模式是与其父CU在深度级X1强烈相关的。父CU预测模式信息可以为帧内模式决定减少候选。为了克服这些问题，本文对HEVC提出了一种快速CU大小和帧内模式决定算法。考虑到最佳CU深度水平高度依赖于内容，为全序列使用固定CU深度范围是没有效率的。因此，我们可以跳过在CU附近很少使用的某些特定的深度层。同时，有不同深度的水平上或空间上相邻的CU之间的RD成本与预测模式具有相关性。通过充分利用这些关系，我们可以跳过一些在上部深度水平或空间上在父CU很少使用得CU相邻模式。本文的其余部分安排如下。在第二节中，我们分析CU之间不同深度级别或空间附近的CU的编码信息的相关性，并提出了快速CU大小决定和帧内模式决策算法。第三节比较算法与国家最先进的快速算法的性能。第四节总结全文。II提出的快速帧内预测算法A快速CU大小决策算法HM通常允许最大CU大小等于64，深度级范围是从0到3，在HM整个视频序列CU深度具有固定范围。事实上，在均匀区域小深度值趋向于被选择为CU，大深度值均选用的控制单元拥有丰富的质感。我们可以从帧内编码的实验得知在大同质区域编码“0”值深度出现很频繁。另一方面，深度值“0”是很少被选用具有丰富的纹理树块。这些结果表明CU深度范围应当基于树块的属性适当地确定。在自然照片中，附近树块通常具有类似的纹理。因此，当前树块的最佳深度水平与周边树块可能有强大的相关性。基于此概念，可以通过使用在空间上邻近树块（示于图2）来预测当前块树（预深度）的深度级别,10NIIPREWDTH其中N是树块等于4的数，表I中是根据定义当前树块与周边树块之间的相I关性确定的树块权重因子。是深度级别值。由于除了左树块，在当前块编码之I前不能得到的左下方树块的信息编码，上层树块，左层树块和右层树块如图2。图2相邻树块深度水平之间的联系（C代表当前树块、L代表左边树块、U代表上方树块、LU代表做上方树块、RU代表有上方树块）表1分配到相邻树块的权重因子通过对树块深度水平的预测，可以将树块分为以下四种类型当深度05,树块为类当05深度15，树块为类当15深度25，树块为类当深度25，树块为类广泛的模拟已经用不同的方法对6种不同分辨率视频序列进行深度级别的分析以分配给这四种类型的树块，这些测试序列中，“HORSERIDING”和“BASKETBALL”是“720576”格式，“SHIPCALENDAR”和“STOCKHOLMPAN”是“1280720”格式，而“FLAMINGO”和“FIREWORKS”是“19201088”格式。测试条件如下量化参数（QP）选择24，30和36RD优化（RDO）和上下文自适应二进制算术编码（CABAC）熵编码被启用树块大小64编码帧的数目50。在上述测试条件下利用HM下详尽的帧内模式决定，我们给这四种类型的树块分配深度级别。表二所示对于每种类型的树块，其中的深度水平分布“1”，“2”，“3”和“4”的树块类型和“0”，“1”，“2”和“3”的深度级别。由此可以看出，对于“1”树块型，约35的总树块最佳深度级别选择“0”，以及约54的树块的最佳深度级别选择“1”。换句话说，如果最大深度级被设定为“1”时，它很可能会覆盖约89树块。对“”类型的树块，约92树块的选择深度级别为“0”，“1”和“2”。如果最大深度级被设定为“2”时，它很可能会覆盖约92的树块。另一方面，对“”类型的树块，选择“0”深度级别的概率非常低，小于3，因此帧内预测上的“0”（CU尺寸64深度级别64）可跳过。对“IV”类型的树块，选择“2”和“3”的深度级别的概率是88以上，因此在“0”和“1”的深度级别帧内预测（CU尺寸6464和3232）可跳过。表2对四种类型树块深度水平分布的统计分析在我们提出的快速帧内模式决策算法中，我们使用粗模式判定（RMD）和RDO过程来选择最佳帧内方向的组合。HM确定基于所述RMD过程的第N个最佳候选模式，其中所有模式用剩余信号的阿达玛变换系数和模式位的最小绝对值测试。不是总帧内预测模式决定，RDO仅适用于由粗模式决定所选择的N个最佳候选模式，其中所有的模式都在本决定中相比较，在RMD的RDO过程中N个最佳模式的数量见表3。表3N个粗模式选择的数量然而，编码器的计算量还是非常大的。在另一方面，所述帧内预测模式总是与附近的CU相关的，这没有在HM考虑之中。HM编码器中帧内模式决定和该方法有两个差异。首先，我们利用中间CU附近的预测方向相关性提早终止RDO的过程其次，RD成本相关性被用于降低某些用于RDO过程概率很低方向可能性。通过利用附近CU（包括空间相邻的CU和在上部的深度级别的父CU）的帧内预测信息，我们减少参与RDO进程方向的数量。这种算法显著降低编码器复杂度。详细的算法描述如下。策略1基于模式相关性的早期终止（ET）基于大量的实验，我们首先观察到，根据自己的候选人排名的RDO最优模式从粗糙的模式选择决定考生呈现下降趋势。同时，相邻块通常具有自然照片相似的纹理。因此，当前的CU的最佳帧内预测具有与周边的CU很强的相关性。此外，还有从退出的跨级相关的观点不同深度水平之间的帧内预测模式的相关性。具有相似视频特征，当前CU在深度级别X的预测模式与其父CU中深度级X1的是强烈相关的。在第二节A中在上述实验条件HM中对CU大小详尽决定，我们分别估计当前CU最佳帧内方向成为RMD第一候选的可能性，在当前CU附近的先前深度级别空间父CU的最佳模式或最可能的模式（MPM）的最佳模式。空间附近的CU的MPM是由左，上，左，后，右和向上的CU获得。表四显示当前CU的条件概率最佳内部方向。可得出RMD的第1候补有586，225和336的CU选择最优预测模式，父CU的最佳模式和MPM从空间上邻近的CU，从我们的统计结果，我们发现，RMD的第一候选，从空间上邻近的CU中父CU和MPM的最佳模式具有大的可能性成为当前CU的最佳方式，不同的序列之间这些比率仅有一点波动。表4最优帧内模式条件概率当RMD第一候选时，父CU在先前深度级别最佳模式和空间上邻近CU有相同的帧内预测模式，它表示当前的CU和其附近的CU具有一致的方向。因此，当前的CU的最佳帧内模式与从它的附近的CU的最佳模式具有很高的相似性。我们可以跳过其他的帧内模式测试，编码时间可以显着减少。判定最优模式是凭经验获得的，并且在这里的预期是之后在我们的实验结果验证了的。策略2基于RD成本相关ET可以从表可以看出，多数帧内模式决定后的最佳预测模式来自RMD的第一候选，从先前深度级别父CU的最佳模式或空间上邻近的CU的MPM。因此，HEVC中最好是有从快速帧内模式决策算法的中途的适当的ET的策略。我们分析，从粗糙的模式选择出的空间上相邻的CU的最佳模式和候选。图3示出RMD的候补的百分比或在高效率的测试条件下，附近CU的最佳模式对当前CU是最优的预测模式。从我们的统计结果我们发现，RMD中的第一候选具有最大比率成为当前CU的最佳模式，这超过55。从RMD第二候选的比率约15。从空间附近的CU的MPM和父CU的先前最佳模式深度级别平均也呈现出较大的比例成为RDO最优模式，分别达到34和23。在我们的算法中，我们首先检查从空间附近CU的MPM和从父的最佳模式CU是否包含在从RMD候选中。如果这两个最佳模式不包括在候选集合，N2模式包括RMD的N个最佳模式，这两个候选模式将在RDO过程中被采用。否则，只有N个最佳方式将采用RDO过程。然后，我们根据图3的分布RDO的最佳模式下降趋势对候选模式排名。图3选为最佳预测模式的概率基于相邻的RD成本的阈值用于实现不同模式的ET，这使得它依内容而定。阈值（TR）被设置为邻近的CU的RD成本的平均值，在图（4）中，是来自左C上CU，左上、右上LTRDCOSUTDCOSULTRCSURTDCOSCU的RD损耗，是上层深度水平下的当前CU的RD损耗。当候选的最低PRD成本比THR小，终止帧内模式决定的程序在当前CU。为了验证提出的两种ET方法的合法性，已经在一组视频序列进行了大量的模拟如表五。在第A上述试验条件下利用在HM穷举CU大小决定，我们研究提议的ET方法的有效性。表5显示了该ET方法的精度。所提出的ET的基础上，模式的相关性的平均精度大于80。基于RD相关性建议ET的平均准确度在“STOCKHOLMPAN”达到91，最高为95，并在“BASKETBALL”最小为86。建议ET方法的准确度对不同性质的所有测试序列是一致。在表V中所示的结果表明，所提出的方法的ET能准确减少不必要的帧内预测模式。5COS/URULULPTDTTTTTR表5对ET方法精度的统计分析C总体算法基于上述分析，包括快速CU大小决定和帧内模式决定的方法在内，我们对HEVC提出了一个快速的帧内预测算法，如下。步骤1对树块开始帧内预测。步骤2推导树块附近空间的深度级别信息包括左，上，左上和右上树块。步骤3基于（2）计算和将当前树块分成四种类型“1”，“2”，“3”和“4”四PREDTH种类型。如果当前树块属于类型“I”，最大深度级别重置为“1”；否则，如果目前的树块属于类型“II”，最大深度级别被重置为“2”；否则，如果当前的树块属于类型“三”，最小深度级别被重置为“1”；否则，如果当前的树块属于类型“IV”，最小深度级别被重置为“2”。步骤4从最小深度级到最大深度级遍历各深度水平。步骤41推导CU附近的空间的编码信息和先前的深度级别的父CU。步骤42从RMD第一候选，父CU的最佳模式和从空间上与CU邻近MPM都具有相同的帧内预测模式（M），可以选择M作为最佳模式跳过帧内模式决策过程，转到步骤45。步骤43基于（4）为RD成本计算THR。步骤44遍历第IIB定义的每个候选。如果候选的最低RD成本比THR小，终止在当前深度级别帧内模式决定的程序。步骤45转至步骤41，继续下一个深度水平，结束循环。步骤5确定最佳帧内预测模式和深度级别。转到步骤1并继续下一树块。III实验结果为了评价所提出的快速帧内预测算法性能，在最近的HEVC参考软件（HM52）进行测试。我们对HEVC在低复杂性配置算法与国家的最先进的快速帧内预测算法进行比较，也就是说，快速帧内算法（FIMDA）模式决定8和帧内预测初终止（ETIP）9。该算法性能示于表VI和VII。对所有的I帧的序列进行了实验。编码树块具有6464个象素（对于亮度）和最大深度级为4，最小CU尺寸88个像素，并且CABAC被用作熵编码器。该算法用QP22，27，32和37四项决议建议JCTVC序列14（416240/832480/19201080/25601600格式）进行评估。需要注意的是六个训练序列，其在第二节中被用于验证算法的合法性，它不被用作测试序列。编码效率以PSNR以及比特率来衡量，计算复杂度用消耗的编码时间来衡量。BDPSNR（分贝）和BDBR（）用于表示平均PSNR以及比特率的差异15，“DT（）”是用来表示编码时间内的变化百分比。正值和负值分别表示增量和减量。表6与FIMDA算法相比该拟议算法的结果表VI展示了与FIMDA相比所提出的快速帧内预测算法表现。该算法可以大大减少所有序列编码时间。该算法可以减少21的编码时间，在“KIMONO1”（19201080）最多36和在“RACEHORSES”（416240）最低13。对于大分辨率序列（如19201080和25601600），该算法显示了不俗的表现，节约超过25的编码时间。我们的算法增益高，因为不必要的小尺寸CU决定已经跳过。对于大纹理光滑的领域，如“KIMONO1”和“BASKETBALLDRIVE”，该算法节省超过30的编码时间

人人文库> 全部分类> 专业文献 > 建筑环境

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

外文翻译-hevc视频解码标准结构和复杂度分析

文档简介

温馨提示

最新文档

评论

外文翻译-hevc视频解码标准结构和复杂度分析

文档简介

温馨提示

最新文档

评论

相关文档