CN112385230B 通过使用仿射预测处理视频信号的方法和设备（Lg电子株式会社）

上传人：x*** IP属地：重庆上传时间：2025-09-24 格式：DOCX 页数：81 大小：3.51MB 积分：11.4 举报 版权申诉

CN112385230B 通过使用仿射预测处理视频信号的方法和设备（Lg电子株式会社）_第2页

CN112385230B 通过使用仿射预测处理视频信号的方法和设备（Lg电子株式会社）_第3页

CN112385230B 通过使用仿射预测处理视频信号的方法和设备（Lg电子株式会社）_第4页

CN112385230B 通过使用仿射预测处理视频信号的方法和设备（Lg电子株式会社）_第5页

已阅读5页，还剩76页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

(12)发明专利PCT/KR2019/0080872019WO2020/009449KO2020.01.09公司11127AKULA,SriNitchithetal.DescofSDR,HDRand360°vitechnologyproposalcoGoPro,andHiSilicon.JVMeeting.2018,第55-57页.开始开始结束21.一种使用仿射预测来处理视频信号的方法，该方法包括以下步骤：获得指示所述仿射预测是否被应用于当前块的第一语法元素；获得指示是否应用自适应运动矢量差精度模式的第二语法元素；基于所述第一语法元素指示所述仿射预测被应用于当前块并且所述第二语法元素指示应用了所述自适应运动矢量差精度模式，获得指示在所述仿射预测中使用的控制点运动矢量CPMV的运动矢量差的精度是否是预定义的精度的第三语法元素；基于所述第三语法元素，获得包括关于所述运动矢量差的精度的信息的第四语法元素，其中，所述第四语法元素指示所述运动矢量差的多个不同精度中的至少一个精度；基于所述第三语法元素和所述第四语法元素中的至少一个语法元素推导所述当前块的控制点运动矢量；基于所述控制点运动矢量推导所述当前块中包括的多个子块中的每一个的运动矢量；以及基于每个所述子块的所述运动矢量生成所述当前块的预测样本，其中，所述仿射预测中使用的所述CPMV的所述运动矢量差的所述至少一个精度包括1/16像素精度，其中，当所述运动矢量差大于预定义的特定值时，使用截断二进制化方法对所述运动其中，当应用包括1/4画素精度、1画素精度或4画精度素的预定义的精度时，使用截断二进制化方法对所述运动矢量差进行二进制化。2.根据权利要求1所述的方法，其中，所述预定义的精度被预先设置为1/4像素精度。3.根据权利要求2所述的方法，其中，除了所述预定义的精度之外的各项剩余精度包括整数像素精度、4像素精度或1/8像素精度。4.根据权利要求1所述的方法，其中，推导所述控制点运动矢量的步骤包括以下步骤：基于所述运动矢量差的所述精度获得所述运动矢量差。5.根据权利要求4所述的方法，其中，获得所述运动矢量差的步骤包括以下步骤：获得包括关于所述运动矢量差是否大于0的信息的标志；以及当所述运动矢量差大于0时，获得包括关于所述运动矢量差是否大于所述预定义的特定值的信息的标志。6.根据权利要求5所述的方法，其中，当所述运动矢量差大于0并且小于或等于所述预定义的特定值时，使用阶数为1的指数Golomb码对所述运动矢量差进行二进制化。7.一种使用仿射预测编码视频信号的方法，该方法包括以下步骤：确定所述仿射预测是否被应用于当前块；确定是否应用自适应运动矢量差精度模式；基于所述仿射预测被应用于所述当前块并且应用了所述自适应运动矢量差精度模式，3基于指示所述运动矢量差的所述精度是否是所述预定义的精度的信息，确定所述运动基于指示所述运动矢量差的所述精度是否是所述预定义的精度的信息和关于所述至基于所述控制点运动矢量推导所述当前块中包括的多个子生成指示所述仿射预测是否被应用于所述当前块的第一语法元生成指示是否应用所述自适应运动矢量差精基于所述第一语法元素指示所述仿射预测被应用于所述当前块并且所述第二语法元基于所述第三语法元素，生成指示所述运动矢量差的所述至其中，所述仿射预测中使用的所述CPMV的所述运动矢量差的所述至少一个精度包括1/其中，当所述运动矢量差大于预定义的特定值时，使用截断二进制化方法对所述运动8.一种计算机可读存储介质，所述计算机可读存储介质存储编码的图片数据，所述编基于所述仿射预测被应用于所述当前块并且应用了所述自适应运动矢量差精度模式，基于指示所述运动矢量差的所述精度是否是所述预定义的精度的信息，确定所述运动基于指示所述运动矢量差的所述精度是否是所述预定义的精度的信息和关于所述至基于所述控制点运动矢量推导所述当前块中包括的多个子基于所述第一语法元素指示所述仿射预测被应用于所述当前块并且所述第二语法元基于所述第三语法元素，生成指示所述运动矢量差的所述至4其中，所述仿射预测中使用的所述CPMV的所述运动矢量差的所述至少一个精度包括1/16像素精度，其中，当所述运动矢量差大于预定义的特定值时，使用截断二进制化方法对所述运动其中，当应用包括1/4画素精度、1画素精度或4画精度素的预定义的精度时，使用截断二进制化方法对所述运动矢量差进行二进制化。9.一种用于数据的发送方法，所述数据包括与视频信号相关的比特流，该发送方法包括以下步骤：获得与所述视频信号相关的所述比特流；以及发送包括所述比特流的所述数据，其中，所述比特流通过执行以下步骤生成：确定仿射预测是否被应用于当前块；确定是否应用自适应运动矢量差精度模式；基于所述仿射预测被应用于所述当前块并且应用了所述自适应运动矢量差精度模式，确定控制点运动矢量CPMV的运动矢量差的精度是否是预定义的精度；基于指示所述运动矢量差的所述精度是否是所述预定义的精度的信息，确定所述运动矢量差的多个不同的像素精度中的至少一个精度；基于指示所述运动矢量差的所述精度是否是所述预定义的精度的信息和关于所述至少一个精度的信息中的至少一者，推导所述当前块的控制点运动矢量；基于所述控制点运动矢量推导所述当前块中包括的多个子块中的每一个的运动矢量；基于每个所述子块的所述运动矢量生成所述当前块的预测样本；生成指示所述仿射预测是否被应用于所述当前块的第一语法元素；生成指示是否应用所述自适应运动矢量差精度模式的第二语法元素；基于所述第一语法元素指示所述仿射预测被应用于所述当前块并且所述第二语法元素指示应用了所述自适应运动矢量差精度模式，生成指示所述运动矢量差的所述精度是否是所述预定义的精度的第三语法元素；以及基于所述第三语法元素，生成指示所述运动矢量差的所述至少一个精度的第四语法元其中，所述仿射预测中使用的所述CPMV的所述运动矢量差的所述至少一个精度包括1/16像素精度，其中，当所述运动矢量差大于预定义的特定值时，使用截断二进制化方法对所述运动其中，当应用包括1/4画素精度、1画素精度或4画精度素的预定义的精度时，使用截断二进制化方法对所述运动矢量差进行二进制化。5通过使用仿射预测处理视频信号的方法和设备技术领域[0001]本公开涉及一种用于使用仿射预测(affineprediction)来处理视频信号的方法和设备，并且更具体地，涉及一种通过控制在仿射预测中使用的仿射运动矢量(affinemotionvector)的分辨率(resolution)来处理视频信号的方法和设备。背景技术[0002]压缩编码是指用于通过通信线路发送数字化信息的一系列信号处理技术，或用于以适合于存储介质的形式存储信息的技术。包括图片、图像、音频等的介质可以是用于压缩编码的目标，并且特别地，用于对图片执行压缩编码的技术被称为视频图像压缩。[0003]一般认为下一代视频内容具有高空间分辨率、高帧速率和场景表示的高维度的特性。为了处理这样的内容，将导致存储器存储容量、存储器访问速率和处理能力的急剧增[0004]因此，需要设计一种用于高效地处理下一代视频内容的编码工具。发明内容[0006]本公开的目的是提出一种控制在仿射预测中使用的仿射运动矢量的分辨率的方法，以提高仿射预测的精确度。[0007]此外，本公开的目的是提出在对MVD执行熵编码时依赖于运动模型的唯一统计的熵编码方法而不是恒定熵编码方法。[0008]本公开中要实现的技术目的不限于上述技术目的，并且根据以下描述本公开所属领域的普通技术人员可以清楚地理解上面未描述的其它技术目的。[0010]在本公开的一方面，一种使用仿射预测来处理视频信号的方法可以包括以下步骤：检查仿射预测是否被应用于当前块；如果作为检查的结果应用仿射预测，则获得指示在仿射预测中使用的运动矢量差的分辨率的至少一个语法元素；基于所述至少一个语法元素，推导当前块的控制点运动矢量；基于控制点运动矢量，推导当前块中包括的多个子块中的每一个的运动矢量；以及使用每个子块的运动矢量生成当前块的预测样本。[0011]优选地，获得至少一个语法元素的步骤可以包括以下步骤：获得指示运动矢量差的分辨率是否是预设的默认分辨率的第一语法元素；以及当运动矢量差的分辨率不是默认分辨率时，获得指示除默认分辨率之外的各项剩余分辨率当中的运动矢量差的分辨率的第二语法元素。[0012]优选地，默认分辨率可以被预[0013]优选地，各项剩余分辨率可以包括整数像素精度、4像素精度、1/8像素精度或1/16像素精度中的至少一种精度。[0014]优选地，推导控制点运动矢量的步骤可以包括以下步骤：使用至少一个语法元素6来确定运动矢量差的分辨率；以及基于运动矢量差的分辨率获得运动矢量差。[0015]优选地，获得运动矢量差的步骤可以包括以下步骤：获得指示运动矢量差是否大于0的标志；以及当运动矢量差大于0时，获得指示运动矢量差是否大于预定义的特定值的[0016]优选地，当运动矢量差大于0并且小于或等于预定义的特定值时，可以使用阶数为1的指数Golomb码对运动矢量差进行二进制化。当运动矢量差大于预定义的特定值时，可以使用截断二进制化方法对运动矢量差进行二进制化。[0017]在本公开的另一方面，一种用于使用仿射预测来处理视频信号的设备，该设备可以包括：仿射预测模式识别单元，其被配置为检查仿射预测是否被应用于当前块；语法元素获取单元，其被配置为如果作为检查的结果应用仿射预测，则获得指示在仿射预测中使用的运动矢量差的分辨率的至少一个语法元素；控制点运动矢量推导单元，其被配置为基于所述至少一个语法元素来推导当前块的控制点运动矢量；子块运动矢量推导单元，其被配置为基于控制点运动矢量来推导当前块中包括的多个子块中的每一个的运动矢量；以及预测样本生成单元，其被配置为使用每个子块的运动矢量来生成当前块的预测样本。[0018]优选地，语法元素获取单元可以被配置为获得指示运动矢量差的分辨率是否是预设的默认分辨率的第一语法元素，并且当运动矢量差的分辨率不是默认分辨率时，获得指示除默认分辨率之外的各项剩余分辨率当中的运动矢量差的分辨率的第二语法元素。[0019]优选地，默认分辨率可以被预先设置为1/4像素精度。[0020]优选地，各项剩余分辨率可以包括整数像素精度、4像素精度、1/8像素精度或1/16像素精度中的至少一种精度。[0021]优选地，控制点运动矢量推导单元可以被配置为使用所述至少一个语法元素来确定运动矢量差的分辨率，并且基于运动矢量差的分辨率来获得运动矢量差。[0022]优选地，控制点运动矢量推导单元可以被配置为获得指示运动矢量差是否大于0的标志，并且当运动矢量差大于0时，获得指示运动矢量差是否大于预定义的特定值的标[0023]优选地，当运动矢量差大于0且小于或等于预定义的特定值时，可以使用阶数为1的指数Golomb码对运动矢量差进行二进制化。当运动矢量差大于预定义的特定值时，可以使用截断二进制化方法对运动矢量差进行二进制化。[0024]有益效果[0025]根据本公开的一个实施方式，可以通过控制在仿射预测中使用的控制点的运动矢量精度来提高仿射运动预测的精确度并且可以提高压缩效率。[0026]此外，根据本公开的一个实施方式，可以通过针对每个经分区的MVD区域自适应地设置二进制化方法来提高编码效率和压缩性能。[0027]在本公开中可获得的效果不限于上述效果，并且本公开所属领域的普通技术人员可以根据以下描述清楚地理解以上未描述的其它技术效果。附图说明[0028]为了帮助理解本公开，作为详细描述的一部分包括的附图提供了本公开的实施方式，并且与详细描述一起描述了本公开的技术特征。7[0029]图1是作为应用了本公开的实施方式的其中执行视频/图像信号的编码的编码设备的示意性框图。[0030]图2是作为应用了本公开的实施方式的其中执行视频/图像信号的解码的解码设备的示意性框图。[0031]图3是示出可以应用本公开的多类型树结构的示例的图。[0032]图4是示出作为可以应用本公开的实施方式的具有嵌套的多类型树结构的四叉树的分区信息的信令机制的图。[0033]图5是示出作为可以应用本公开的实施方式的基于四叉树和嵌套的多类型树结构将CTU分割为多个CU的方法的图。[0034]图6是示出作为可以应用本公开的实施方式的用于限制三叉树分割的方法的图。[0035]图7是示出作为可以应用本公开的实施方式的在二叉树分区和三叉树分区中可能出现的冗余分区模式的图。[0036]图8和图9是示出根据本公开的实施方式的基于帧间预测的视频/图像编码方法和根据本公开的实施方式的编码设备中的帧间预测单元的图。[0037]图10和图11是示出根据本公开的实施方式的基于帧间预测的视频/图像解码方法和根据本公开的实施方式的解码设备中的帧间预测单元的图。[0038]图12是用于描述作为应用了本公开的实施方式的在合并模式或跳过模式中使用的相邻块的图。[0039]图13是示出根据应用了本公开的实施方式的用于配置合并候选列表的方法的流程图。[0040]图14是示出根据应用了本公开的实施方式的用于配置合并候选列表的方法的流程图。[0041]图15示出了根据本公开的一个实施方式的运动模型的示例。[0042]图16示出了根据本公开的一个实施方式的用于仿射运动预测的控制点运动矢量的示例。[0043]图17示出了已经应用根据本公开的一个实施方式的仿射运动预测的针对块的每个子块的运动矢量的示例。[0044]图18示出了根据本公开的一个实施方式的在仿射合并模式下用于仿射运动预测的相邻块的示例。[0045]图19示出了其中使用已经应用了根据本公开的实施方式的仿射运动预测的相邻块对其执行仿射运动预测的块的示例。[0046]图20是用于描述根据本公开的一个实施方式的使用外围仿射编码块生成合并候选列表的方法的图。[0047]图21和图22是用于描述根据本公开的一个实施方式的使用由仿射预测编码的相邻块来配置仿射合并候选列表的方法的图。[0048]图23示出了根据本公开的一个实施方式的在仿射帧间模式下用于仿射运动预测的相邻块的示例。[0049]图24示出了根据本公开的一个实施方式的在仿射帧间模式下用于仿射运动预测的相邻块的示例。8[0050]图25和图26是示出根据本公开的一个实施方式的在仿射帧间模式下使用相邻块的运动信息来推导运动矢量候选的方法的图。[0051]图27示出了根据本公开的一个实施方式的以子块为单位推导仿射运动矢量场的方法的示例。[0052]图28示出了在已经应用了根据本公开的实施方式的仿射运动模型的帧间预测中生成预测块和运动矢量的方法。[0053]图29是示出根据本公开的一个实施方式的基于控制点的运动矢量执行运动补偿的方法的图。[0054]图30是示出根据本公开的一个实施方式的基于非规则块中的控制点的运动矢量来执行运动补偿的方法的图。[0055]图31是示出根据本公开的一个实施方式的基于非规则块中的控制点的运动矢量来执行运动补偿的方法的图。[0056]图32至图38是示出根据本公开的一个实施方式的基于非规则块中的控制点的运动矢量来执行运动补偿的方法的示图。[0057]图39示出了根据本公开的一个实施方式的用于推导运动矢量的整体编码结构。[0058]图40示出了根据本公开的一个实施方式的MVD编码结构的示例。[0059]图41示出了根据本公开的一个实施方式的MVD编码结构的示例。[0060]图42示出了根据本公开的一个实施方式的MVD编码结构的示例。[0061]图43示出了根据本公开的一个实施方式的MVD编码结构的示例。[0062]图44是示出根据应用了本公开的一个实施方式的推导仿射运动矢量差信息的方法的图。[0063]图45是示出根据应用了本公开的一个实施方式的运动矢量差的编码结构的图。[0064]图46是示出根据本公开的一个实施方式的基于精度信息推导仿射运动矢量的方法的图。[0065]|图47是示出根据应用了本公开的一个实施方式的运动矢量差的编码结构的图。[0066]图48是示出根据应用了本公开的一个实施方式的基于仿射预测生成帧间预测块的方法的流程图。[0067]图49是示出根据应用了本公开的一个实施方式的基于仿射预测的帧间预测设备的图。[0068]图50示出应用了本公开的视频编码系统。[0069]图51是应用了本公开的一个实施方式，并且示出了内容流系统的结构。具体实施方式[0070]在下文中，参照附图详细描述本公开的优选实施方式。将与附图一起公开的详细描述旨在描述本公开的一些实施方式，并且并非旨在描述本公开的唯一实施方式。以下详细描述包括更多细节以便于提供对本公开的全面理解。然而，本领域技术人员将理解，可以在没有这种更多细节的情况下实现本公开。[0071]在一些情况下，为了避免本公开的概念变得模糊，已知的结构和装置被省略或可能基于每个结构和装置的核心功能以框图的形式示出。9[0072]尽管本公开中使用的大多数术语是从本领域中广泛使用的通用术语中选择的，但是申请人已经任意选择了一些术语，并且根据需要在以下描述中详细解释了它们的含义。因此，应当以术语的预期含义而不是其简单名称或含义来理解本公开。[0073]已经提供了以下描述中使用的特定术语以帮助理解本公开，并且可以在不脱离本公开的技术精神的情况下以各种形式改变这些特定术语的使用。例如，可以在每个编码过[0074]在本说明书中，“处理单元”是指其中执行诸如预测、变换和/或量化的编码/解码[0075]此外，处理单元可以解释为包括针对亮度分量的单元和针对色度分量的单元的含相对应。[0076]另外，处理单元可以解释为针对亮度分量的单元或针对色度分量的单元。例如，处理单元可以与针对亮度分量的编码树块(CTB)、编码块(CB)、预测单元PU或变换块(TB)相对此，并且可以解释为包括针对亮度分量的单元和针对色度分量的单元的含义。[0077]另外，处理单元不必限于方形块，并且可以被配置为具有三个或更多个顶点的多边形形状。[0079]图1是作为应用了本公开的实施方式的对视频/图像信号进行编码的编码设备的示意性框图。[0080]参照图1,编码设备100可以被配置为包括图像划分器110、减法器115、变换器120、量化器130、去量化器140、逆变换器150、加法器155、滤波器160、存储器170、帧间预测器180、帧内预测器185和熵编码器190。帧间预测器180和帧内预测器185可以统称为预测器。换句话说，预测器可以包括帧间预测器180和帧内预测器185.变换器120、量化器130、去量化器140和逆变换器150可以被包括在残差处理器中。残差处理器还可以包括减法器115。在器150、加法器155、滤波器160、帧间预测器180、帧内预测器185和熵编码器190可以被配置为一个硬件组件(例如，编码器或处理器)。此外，存储器170可以包括解码图片缓冲器(DPB),并且可以由数字存储介质来实现。[0081]图像划分器110可以将输入到编码设备100的输入图像(或图片或帧)划分为一个或更多个处理单元。例如，处理单元可以被称为编码单元(CU)。在这种情况下，可以基于四叉树二叉树(QTBT)结构从编码树单元(CTU)或最大编码单元(LCU)递归地分割编码单元。例如，基于四叉树结构和/或二叉树结构，一个编码单元可以被分割为深度更深的多个编码单元。在这种情况下，例如，可以首先应用四叉树结构，并且然后可以应用二叉树结构。另选地，可以首先应用二叉树结构。可以基于不再被分割的最终编码单元来执行根据本公开的编码过程。在这种情况下，最大编码单元可以根据图像特性基于编码效率直接用作最终编码单元，或者如果需要，可以将编码单元递归地分割为更深的编码单元。因此，具有最优大小的编码单元可以用作最终编码单元。在这种情况下，编码过程可以包括诸如稍后将描述的预测、变换或重构的过程。针对另一个示例，处理单元还可以包括预测单元(PU)或变换单元(TU)。在这种情况下，可以从每个最终编码单元对预测单元和变换单元中的每一个进行划分或分区。预测单元可以是用于样本预测的单元，并且变换单元可以是从中推导变换系数的单元和/或其中从变换系数推导残差信号的单元。[0082]根据情况，单元可以与块或区域互换使用。在一般情况下，M×N块可以指示配置有M列和N行的一组样本或一组变换系数。通常，样本可以指示像素或像素的值，并且可以仅指示亮度分量的像素/像素值或仅指示色度分量的像素/像素值。在样本中，一个图片(或图像)可以用作与像素或画素(pel)相对应的术语。[0083]编码设备100可以通过从输入图像信号(原始块或原始样本阵列)中减去帧间预测器180或帧内预测器185输出的预测信号(预测块或预测样本阵列)来生成残差信号(残差块或残差样本阵列)。所生成的残差信号被发送到变换器120。在这种情况下，如图所示，编码设备100内的其中从输入图像信号(原始块或原始样本阵列)减去预测信号(预测块或预测样本阵列)的单元可以被称为减法器115。预测器可以对处理目标块(在下文中称为当前块)执行预测，并且可以生成包括针对当前块的预测样本的预测块。预测器可以确定在当前块或CU单元中是应用帧内预测还是应用帧间预测。预测器可以生成诸如稍后将在对每个预测模式的描述中描述的预测模式信息的关于预测的各项信息，并且可以将该信息发送到熵编码器190.关于预测的信息可以在熵编码器190中被编码并且可以以比特流的形式输出。[0084]帧内预测器185可以参照当前图片内的样本来预测当前块。所参考的样本的位置可以根据预测模式与当前块相邻或可以与当前块间隔开。在帧内预测中，预测模式可以包括多个非角度模式和多个角度模式。非角度模式例如可以包括DC模式和平面模式。例如，根据预测方向的精细程度，角度模式可以包括33个角度预测模式或65个角度预测模式。在这种情况下，例如，根据配置，可以使用多于或少于33个角度预测模式或65个角度预测模式的角度预测模式。帧内预测器185可以使用应用于相邻块的预测模式来确定应用于当前块的预测模式。[0085]帧间预测器180可以基于在参考图片上由运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下，为了减少在帧间预测模式下发送的运动信息的量，基于相邻块与当前块之间的运动信息的相关性，运动信息可以被预测为块、子块或样本单元。运动信息可以包括运动矢量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测)信息。在帧间预测的情况下，相邻块可以包括当和参考图片内的时间相邻块。包括参考块的参考图片和包括时间相邻块的参考图片可以相同或不同。时间相邻块可以被称为以下名称：并置参考块或并置CU(colCU)。包括时间相邻块的参考图片可以被称为并置图片(colPic)。例如，帧间预测器180可以基于相邻块来构造运动信息候选列表(motioninformationcandidatelist),并且可以生成指示哪个候选用于推导当前块的运动矢量和/或参考图片索引的信息。可以基于各种预测模式来执行帧间预测。例如，在跳过模式和合并模式的情况下，帧间预测器180可以使用相邻块的运动信息作为当前块的运动信息。在跳过模式的情况下，与合并模式不同，可能不会发送残差信号。在运动矢量预测(motionvectorprediction,MVP)模式的情况下，可以将相邻块的运动矢量用作运动矢量预测值(motionvectorpredictor)。当前块的运动矢量可以通过发信号通知运动矢量差来指示。[0086]通过帧间预测器180或帧内预测器185生成的预测信号可以用于生成重构信号或11残差信号。(transformcoefficient)。例如，变换方案可以包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen-Loeve变换(KLT)、基于图形的变换(GBT)或有条件的非线性变换(CNT)中的至少一个。在这种情况下，GBT表示如果将像素之间的关系信息表示为图形则从该图形获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而获得的变换。此外，可以将变换处理应用于具有相同大小的方形的像素块，或者可以应用于具有可变大小而非方形的块。[0088]量化器130可以量化变换系数，并将其发送到熵编码器190。熵编码器190可以对经量化的信号(关于量化变换系数的信息)进行编码并且将其以比特流形式输出。关于量化变换系数的信息可以称为残差信息。量化器130可以基于系数扫描顺序(coefficientscansequence)以一维矢量形式重新布置块形式的量化变换系数，并且可以基于一维矢量形式的量化变换系数来生成关于量化变换系数的信息。熵编码器190可以执行诸如指数Golomb、上下文自适应可变长度编码(CAVLC)和上下文自适应二进制算术编码(CABAC)的各种编码方法。除了量化变换系数之外，熵编码器190还可以一起或另外对视频/图像重构所必需的信息(例如，语法元素的值)进行编码。编码信息(例如，编码的视频/图像信息)可以以比特流的形式以网络抽象层(NAL)单元为单位被发送或存储。比特流可以通过网络发送或者可以存储在数字存储介质中。在这种情况下，网络可以包括广播网络和/或通信网络。数字存码器190输出的信号的发送器(未示出)和/或用于存储信号的存储器(未示出)配置为编码设备100的内部/外部元件，或者发送器可以是熵编码器190的元件。[0089]由量化器130输出的量化变换系数可以用于生成预测信号。例如，可以通过经由环路(loop)内的去量化器140和逆变换器150对量化变换系数应用去量化和逆变换来重构残差信号。加法器155可以将经重构的残差信号与由帧间预测器180或帧内预测器185输出的预测信号相加，从而可以生成重构信号(重构图像、重构块或重构样本阵列)。如果像已应用跳过模式的情况那样没有针对处理目标块的残差，则可以将预测块用作重构块。加法器155可以被称为重构器或重构块生成器。所生成的重构信号可以用于当前图片内的下一处理目标块的帧内预测，并且可以通过滤波而用于下一图片的帧间预测，这将在后面进行描述。[0090]滤波器160可以通过将滤波应用于重构信号来提高主观/客观图片质量。例如，滤波器160可以通过将各种滤波方法应用于重构图片来生成经修改的重构图片。经修改的重构图片可以存储在存储器170中，更具体地，存储在存储器170的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环路滤波和双边滤波。滤波器160可以生成用于滤波的各项信息(如稍后将在对每种滤波方法的描述中所述),并且可以将它们发送到熵编码器190。滤波信息可以由熵编码器190编码并且以比特流形式输出。[0091]发送到存储器170的经修改的重构图片可以用作帧间预测器180中的参考图片。如果应用帧间预测，则编码设备可以避免编码设备100和解码设备中的预测失配，并且可以提高编码效率。[0092]存储器170的DPB可以存储经修改的重构图片以将其用作帧间预测器180中的参考图片。存储器170可以存储其中推导(或编码)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被转发到帧间预测器180,以用作空间相邻块的运动信息或时间相邻块的运动信息。存储器170可以存储当前图片中的重构块的重构样本，并将其转发到帧内预测器185。[0093]图2是应用本公开的实施方式，并且是用于对视频/图像信号进行解码的解码设备的示意性框图。[0094]参照图2,解码设备200可以被配置为包括熵解码器210、去量化器220、逆变换器230、加法器235、滤波器240、存储器250、帧间预测器260和帧内预测器265。帧间预测器260和帧内预测器265可以统称为预测器。也就是说，预测器可以包括帧间预测器180和帧内预测器185。去量化器220和逆变换器230可以统称为残差处理器。也就是说，残差处理器可以波器240、帧间预测器260和帧内预测器265可以根据一个实施方式被配置为一个硬件组件(例如，解码器或处理器)。此外，存储器250可以包括解码图片缓冲器(DPB),并且可以由数字存储介质来实现。[0095]当输入包括视频/图像信息的比特流时，解码设备200可以根据图1的编码设备中的处理视频/图像信息的处理来重构图像。例如，解码设备200可以使用在编码设备中应用的处理单元来执行解码。因此，例如，用于解码的处理单元可以是编码单元。可以根据四叉树结构和/或二叉树结构从编码树单元或最大编码单元分割编码单元。此外，可以通过回放装置回放通过解码设备200解码并输出的重构图像信号。[0096]解码设备200可以以比特流形式接收由图1的编码设备输出的信号。可以通过熵解码器210对所接收的信号进行解码。例如，熵解码器210可以通过解析比特流来推导用于图像重构(或图片重构)的信息(例如，视频/图像信息)。例如，熵解码器210可以基于诸如指数构的语法元素的值或关于残差的变换系数的量化值。更具体地，在CABAC熵解码方法以从比特流接收与每个语法元素相对应的二进制数(bin),可以使用解码目标语法元素信息和相邻和解码目标块的解码信息或在先前步骤中解码的符号/二进制数的信息来确定上下文模型，可以基于所确定的上下文模型来预测二进制数出现的概率，并且可以通过对二进制数执行算术解码来生成与每个语法元素的值相对应的符号。在解码方法中，在确定上下文模型之后，可以使用针对下一符号/二进制数的上下文模型解码的符号/二进制数的信息来更新上下文模型。可以将在熵解码器2110中解码的信息当中的关于预测的信息提供给预测器(帧间预测器260和帧内预测器265)。可以将与已经在熵解码器210中对其执行了熵解码的残差值有关的参数信息(即，量化变换系数)输入到去量化器220。此外，可以将在熵解码器210中解码的信息当中的关于滤波的信息提供给滤波器240。此外，接收由编码设备输出的信号的接收器(未示出)可以被进一步配置为解码设备200的内部/外部元件，或者接收器可以是熵解码器210的元件。[0097]去量化器220可以对量化变换系数进行去量化并输出变换系数。去量化器220可以以二维块形式重新布置量化变换系数。在这种情况下，可以基于在编码设备中执行的系数扫描顺序来执行重新布置。去量化器220可以使用量化参数(例如，量化步长信息)对量化变换系数执行去量化，并且可以获得变换系数。[0098]逆变换器230可以通过对变换系数应用逆变换来输出残差信号(残差块或残差样本阵列)。[0099]预测器可以对当前块执行预测，并且可以生成包括针对当前块的预测样本的预测块。预测器可以基于由熵解码器210输出的关于预测的信息来确定是对当前块应用帧内预测还是帧间预测，并且可以确定具体的帧内/帧间预测模式。[0100]帧内预测器265可以参考当前图片内的样本来预测当前块。根据预测模式，参考样本的位置可以与当前块相邻或可以与当前块间隔开。在帧内预测中，预测模式可以包括多个非角度模式和多个角度模式。帧内预测器265可以使用应用于相邻块的预测模式来确定应用于当前块的预测模式。[0101]帧间预测器260可以基于参考图片上由运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下，为了减少在帧间预测模式下发送的运动信息量，基于相邻块与当前块之间的运动信息的相关性，运动信息可以被预测为块、子块或样本单元。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测和Bi预测)信息。在帧间预测的情况下，相邻块可以包括当前图片内的空间相邻块和参考图片内的时间相邻块。例如，帧间预测器260可以基于相邻块来配置运动信息候选列表，并且可以基于所接收的候选选择信息来推导当前块的运动矢量和/或参考图片索引。可以基于各种预测模式来执行帧间预测。关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。[0102]加法器235可以通过将所获得的残差信号添加到由帧间预测器260或帧内预测器265输出的预测信号(预测块或预测样本阵列)中来生成重构信号(重构图片、重构块或重构样本阵列)。如果像已应用跳过模式的情况那样没有针对处理目标块的残差，则可以将预测块用作重构块。[0103]加法器235可以被称为重构器或重构块生成器。所生成的重构信号可以用于当前图片内的下一处理目标块的帧内预测，并且可以通过滤波而用于下一图片的帧间预测，这将在后面进行描述。[0104]滤波器240可以通过将滤波应用于重构信号来提高主观/客观图片质量。例如，滤波器240可以通过将各种滤波方法应用于重构图片来生成经修改的重构图片，并且可以将经修改的重构图片发送到存储器250,更具体地，发送到存储器250的DPB。各种滤波方法可[0105]存储在存储器250的DPB中的(经修改的)重构图片可以用作帧间预测器260中的参考图片。存储器250可以存储其中推导(或解码)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被转发到帧间预测器260,以用作空间相邻块的运动信息或时间相邻块的运动信息。存储器170可以存储当前图片中的重构块的重构样本，并将其转发到帧内预测器265。[0106]在本公开中，在编码设备100的滤波器160、帧间预测器180和帧内预测器185中描述的实施方式可以分别地、相同地或以对应方式应用于解码设备200的滤波器240、帧间预测器260和帧内预测器265。[0107]块分区(BlockPartitioning)[0108]可以基于各种详细技术来执行根据本公开的视频/图像编码方法，并且如下描述各种详细技术中的每一个。对于本领域技术人员显而易见的是，本文中描述的技术可以与以上所述和/或以下所述的视频/图像编码/解码过程中的诸如预测、残差处理((逆)变换和[0109]根据本公开的块分区过程可以在上述编码设备的图像划分器110中执行，并且可以在熵编码器190中对分区相关信息进行(编码)处理，并将其以比特流格式转发给解码设备。解码设备的熵解码器210可以基于从比特流获得的分区相关信息来获得当前图片的块分区结构，并且基于此，可以执行用于图像解码的一系列过程(构和环路滤波等)。[0110]将图片分区为CTU[0111]可以将图片划分为编码树单元(CTU)的序列。CTU可以与编码树块(CTB)相对应。另选地，CTU可以包括亮度样本的编码树块和相应的色度样本的两个编码树块。换句话说，针对包括三种类型的样本阵列的图片，CTU可以包括亮度样本的N×N块和色度样本的两个相应样本。[0112]用于编码和预测的CTU的最大支持大小可以不同于用于变换的CTU的最大支持大小。例如，CTU中亮度块的最大支持大小[0113]使用树结构对CTU进行分区[0114]CTU可以基于四叉树(QT)结构被划分为CU。四叉树结构可以被称为四元结构。这是叉树的多类型树结构分区来划分CTU。在下文中，QTBT结构可以包括四叉树和二叉树结构，并且QTBTTT可以包括基于二叉树和三叉树的分区结构。另选地，QTBT结构还可以包括基于四叉树、二叉树和三叉树的分区结构。在编码树结构中，CU可以具有方形形状或矩形形状。首先，CTU可以被划分为四叉树结构。并且然后，四叉树结构的叶节点可以通过多类型树结构另外划分。[0115]图3是示出作为可以应用本公开的实施方式的多类型树结构的示例的图。[0116]在本公开的一个实施方式中，多类型树结构可以包括如图3所示的4种分割类型。这4种分割类型可以包括垂直二元分割(SPLIT_BT_VER)、水平二元分割(SPLIT_BT_HOR)、垂直三元分割(SPLIT_TT_VER)和水平三元分割(SPLIT_TT_HOR)。可以将多类型树结构的叶节的块大小。然而，在最大支持的变换长度小于颜色分量的宽度或高度的情况下，CU和TU可以具有不同的块大小。[0117]图4是示出作为可以应用本公开的实施方式的具有嵌套的多类型树结构的四叉树的分区分割信息的信令机制的图。[0118]这里，CTU可以被视为四叉树的根，并且最初被分区为四叉树结构。之后可以将每个四叉树叶节点进一步分区为多类型树结构。在该多类型树结构中，发信号通知第一标志(例如，mtt_split_cu_flag)以指示相应的节点是否被进一步分区。在相应节点被进一步分区的情况下，可以发信号通知第二标志(例如，mtt_split_cu_vertical_flag)以指示分割是二元分割还是三元分割。例如，基于mtt_split_cu_vertical_flag和mtt_split_cu_binary_flag,可以如下面的表1中所示推导多类型树分割模式(MttSplitMode)。mtt_split_cu_vertical_mtt_split_cu_binary_00011011[0121]图5是示出作为可以应用本公开的实施方式的基于四叉树和嵌套的多类型树结构将CTU分区为多个CU的方法的图。[0122]这里，加粗的块边缘表示四叉树分区，并且剩余边缘表示多类型树分区。具有经嵌套的多类型树的四叉树分区可以提供内容自适应的编码树结构。CU可以与编码块(CB)相对应。或者，CU可以包括亮度样本的编码块和相应的色度样本的两个编码块。CU的大小可以大到与CTU一样大，也可以小至4×4(以亮度样本为单位)。例如，在4:2:0颜色格式(或色度格式)的情况下，最大色度CB大小可以是64×64,并且最小色度CB大小可以是2×2。[0123]在本公开中，例如，最大支持的亮度TB大小可以是64×64,并且最大支持的色度TB大小可以是32×32。在根据树结构分区的CB的宽度或高度大于最大变换宽度或高度的情况[0124]此外，针对具有嵌套的多类型的四叉树编码树方案，可以将以下参数定义或识别为SPS语法元素。[0126]-MinQTSize:最小允许四叉树叶节点大小[0127]-MaxBtSize:最大允许二叉树根节点大小[0128]-MaxTtSize:最大允许三叉树根节点大小[0129]-MaxMttDepth:从四叉树叶中分割出的多类型树的最大允许层次深度[0130]-MinBtSize:最小允许二叉树叶节点大小[0131]-MinTtSize:最小允许三叉树叶节点大小[0132]作为具有嵌套的多类型树的四叉树编码树方案的示例，可以将CTU大小设置为128×128个亮度样本和两个相应色度样本的64×64个块(在4:2:0色度样本中)。在这种情况下，可以将MinOTSize设置为16×16,可以将MaxBtSize设置为128×128,可以将MaxTtSzie设置为64×64,可以将MinBtSize和MinTtSize(针对宽度和高度两者)设置为4×4,并且可以将MaxMttDepth设置为4。可以将四叉树分区应用于CTU并生成四叉树叶节点。四叉树叶节点可以被称为叶QT节点。四叉树叶节点的大小可以从16×16的大小(即，MinOTSize)到128×128的大小(即，CTU大小)。在叶QT节点为128×128的情况下，叶QT节点可以不被分区为二QT节点可以是多类型树的根节点，并且叶QT节点可以具有多类型树深度(mttDepth)0值。在多类型树深度达到MaxMttdepth(例如，4)的情况下，可以不再考虑附点的宽度等于MinBtSize且小于或等于2×MinTtSize的情况下，可以不再考虑附加水平分区。在多型树节点的高度等于MinBtSize且小于或等于2×MinTtSize的情况下，可以不再考虑附加垂直分区。[0133]图6是示出了作为可以应用本公开的实施方式的用于限制三叉树分割的方法的[0134]参照图6,为了在硬件解码器中支持64×64亮度块和32×32色度管道(pipeline)设计，在特定情况下可以限制TT分割。例如，在亮度编码块的宽度或高度大于预定特定值[0135]在本公开中，编码树方案可以支持亮度和色度块具有各自的块树结构。针对P条带针对I条带，亮度和色度块可以具有各自的单独的块树结构。在应用单独块树模式的情况下，可以基于特定的编码树结构将亮度CTB分区为CU,并且可以基于不同的编码树结构将色度CTB分区为色度CU。这可能意味着I条带中的CU可以包括色度分量的编码块或两个色度分量的编码块，并且P条带或B条带中的CU可以包括三个颜色分量的块。[0136]在上述“使用树结构对CTU进行分区”中，描述了具有嵌套的多类型树的四叉树编码树方案，但是其中对CU进行分区的结构不限于此。例如，BT结构和TT结构可以被解释为包括在多分区树(MPT)结构中的概念，并且可以解释为CU过QT结构和MPT结构对CU进行分区的示例中，可以发信号通知包括关于QT结构的叶节点被分区为的块的数量的信息的语法元素(例如，MPT_split_type)和包括关于在垂直方向和水平方向当中的QT结构的叶节点被分区的方向的信息的语法元素(例如MPT_split_mode),并且可以确定分割结构。较低层深度的CU分区为较高层深度的CU的1/2大小、或根据TT结构将较低层深度的CU分区为较高层深度的CU的1/4大小或1/2大小不同，在一些情况下，将较低层深度的CU分区为较[0138]在树节点块的一部分超过底部或右侧图片边界的情况下，可以限制相应的树节点块，以使得所有经编码的CU的所有样本都位于图片边界内。在这种情况下，例如，可以应用以下分割规则。[0139]-如果树节点块的一部分超过底部和右侧图片边界二者，[0140]-如果块是QT节点，并且块的大小大于最小Q[0143]-如果块是QT节点，并且块的大小大于最小QT大小，并且块的大小大于最大BT大小，则块被强制使用QT分割模式进行分割。[0144]-否则，如果块是QT节点，并且块的大小大于最小QT大小，并且块的大小小于或等[0145]-否则(块是BTT节点，或者块的大小小于或等于最小QT大小),则块被强制使用[0147]-如果块是QT节点，并且块的大小大于最小QT大小，并且块的大小大于最大BT大小，则块被强制使用QT分割模式进行分割。[0148]-否则，如果块是QT节点，并且块的大小大于最小QT大小，并且块的大小小于或等[0149]-否则(块是BTT节点，或者块的大小小于或等于最小QT大小),则块被强制使用[0150]伴随多类型树的四叉树编码块结构可以提供非常灵活的块分区结构。由于多类型树支持的分割类型，在一些情况下，不同的分割模式可能会导致相同的编码块结构。限制冗余分割模式的生成，以减少分区信息的数据量。将参照以下附图进行描述。[0151]图7是示出作为可以应用本公开的实施方式的在二叉树分区和三叉树分区中可能出现的冗余分区模式的图。[0152]如图7所示，在一个方向上的两级连续二元分割与在三元分割之后针对中间分区的二元分割具有相同的编码块结构。在这种情况下，可以限制针对三叉树分割的中间分区的二叉树分割(沿给定方向)。该限制可以应用于所有图片的CU。当特定分割被限制时，可以通过反映这种限制情况来修改语法元素的信令，并且可以通过经修改的信令来减少针对分区发信号通知的比特数。例如，与图7所示的示例类似，当针对CU的中间分区的二叉树分割被限制时，可以不发信号通知指示分割是二元分割还是三元分割的语法元素mtt_split_cu_binary_flag,并且解码器可以将该值推断为0。[0154]为了重构其中执行解码的当前处理单元，可以使用包括当前处理单元的当前图片或其它图片的解码部分。[0155]仅将当前图片用于重构(即，执行帧内预测)的图片可以称为帧内图片或I图片(条带),使用最多一个运动矢量和参考索引以便预测每个单元的图片(条带)可以称为预测图片或P图片(条带),并且使用最多两个运动矢量和参考索引的图片(切片)可以称为双边预测图片(bi-predictivepicture)或B图片(条带)。[0156]帧内预测是指从同一解码图片(或条带)的数据元素(例如，样本值等)推导当前处理块的预测方法。换句话说，帧内预测是指通过参考当前图片中的重构区域来预测当前处理块的像素值的方法。[0159]帧间预测是指基于除当前图片之外的图片的数据元素(例如，样本值或运动矢量)来推导当前处理块的预测方法。换句话说，帧间预测是指通过参考除当前图片以外的其它重构图片中的重构区域来预测当前处理块的像素值的方法。[0160]作为用于消除图片之间存在的冗余的技术的帧间预测(图片间预测)主要通过运动估计(motionestimation)和运动补偿(motioncompensation)来执行。[0161]在本公开中，进行以上在图1和图2中描述的帧间预测方法的详细描述，并且解码器可以被表示为将在下面描述的图10的基于帧间预测的视频/图像解码方法和图11的解码设备中的帧间预测单元。此外，编码器可以被表示为将在下面描述的图8的基于帧间预测的视频/图像编码方法和图9的编码设备中的帧间预测单元。另外，可以以比特流的形式存储图8和图9的编码数据。[0162]编码设备/解码设备的预测单元可以通过以块为单位执行帧间预测来推导预测样本。帧间预测可以表示通过依赖于除当前图片之外的图片的数据元素(例如，样本值或运动信息)的方法推导的预测。当帧间预测被应用于当前块时，可以基于在参考图片索引所指示的参考图片上由运动矢量所指定的参考块(参考样本阵列)来推导针对当前块的预测块(预测样本阵列)。[0163]在这种情况下，为了减少在帧间预测模式下发送的运动信息量，基于相邻块与当前块之间的运动信息的相关性，可以以块、子块或样本为单位来预测当前块的运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括帧间预测类型(L0预测、L1预测和Bi预测等)信息。[0164]在应用帧间预测的情况下，相邻块可以包括在当前图片中存在的空间相邻块和在参考图片中存在的时间相邻块。包括参考块的参考图片和包括时间相邻块的参考图片可以彼此相同或彼此不同。时间相邻块可以被称为诸如并置参考块、并置CU(colCU)等的名称，并且包括时间相邻块的参考图片可以被称为并置图片(colPic)。例如，可以基于当前块的相邻块来配置运动信息候选列表，并且可以发信号通知指示选择(使用)哪个候选的标志或索引信息以便于推导当前块的运动矢量和/或参考图片索引。[0165]可以基于各种预测模式来执行帧间预测，并且例如，在跳过模式和合并模式的情况下，当前块的运动信息可以与所选相邻块的运动信息相同。在跳过模式的情况下，可以不像合并模式那样发送残差信号。在运动矢量预测(MVP)模式的情况下，可以将所选相邻块的运动矢量用作运动矢量预测值(motionvectorpredictor),并且可以发信号通知运动矢量差。在这种情况下，可以通过使用运动矢量预测值和运动矢量差之和来推导当前块的运[0166]图8和图9是示出根据本公开的实施方式的基于帧间预测的视频/图像编码方法和根据本公开的实施方式的编码设备中的帧间预测单元的图。[0167]参考图8和图9,S801可以由编码设备的帧间预测单元(帧间预测器)180执行并且S802可以由编码设备的残差处理单元执行。具体地，S802可以由编码设备的减法器115执行。在S803中，预测信息可以由帧间预测单元(帧间预测器)180推导，并且可以由熵编码器190进行编码。在S803中，残差信息可以由残差处理单元推导，并且由熵编码器190进行编码。残差信息是关于残差样本的信息。残差信息可以包括关于残差样本的量化变换系数的[0168]如上所述，可以通过编码设备的变换器120将残差样本推导为变换系数，并且可以通过量化器130将变换系数推导为量化变换系数。可以由熵编码器190通过残差编码过程对关于量化变换系数的信息进行编码。[0169]编码设备针对当前块执行帧间预测(S801)。编码设备可以推导当前块的帧间预测模式和运动信息，并生成当前块的预测样本。这里，可以同时执行帧间预测模式确定过程、运动信息推导过程以及预测样本的生成过程，并且任何一个过程可以比其它过程更早地执行。例如，编码设备的帧间预测器180可以包括预测模式确定单元181、运动信息推导单元182和预测样本推导单元183,并且预测模式确定单元181可以确定针对当前块的预测模式，运动信息推导单元182可以推导当前块的运动信息，并且预测样本推导单元183可以推导当前块的预测样本。[0170]例如，编码设备的帧间预测单元(帧间预测器)180可以通过运动估计来在参考图片的预定区域(搜索区域)中搜索与当前块相似的块，并且推导与当前块的差最小或等于或小于预定标准的参考块。可以基于其推导指示参考块所在的参考图片的参考图片索引，并且可以基于参考块与当前块之间的位置差来推导运动矢量。编码设备可以在各种预测模式当中确定应用于当前块的模式。编码设备可以比较针对各种预测模式的RD成本(RDcost),并且确定针对当前块的最优预测模式。[0171]例如，当将跳过模式或合并模式应用于当前块时，编码设备可以配置以下将描述的合并候选列表(mergingcandidatelist),并且在由合并候选列表中包括的合并候选所指示的参考块当中推导与当前块的差最小或等于或小于预定标准的参考块。在这种情况下，可以选择与所推导出的参考块相关联的合并候选，并且可以生成指示所选择的合并候选的合并索引信息并将其发信号通知给解码设备。可以通过使用所选择的合并候选的运动信息来推导当前块的运动信息。[0172]作为另一示例，当将(A)MVP模式应用于当前块时，编码设备可以配置下面将要描述的(A)MVP候选列表，并将(A)MVP候选列表中包括的运动矢量预测值(mvp)候选中的所选择的mvp候选的运动矢量用作当前块的mvp。参考块的运动矢量可以用作当前块的运动矢量。并且，在mvp候选当中具有与当前块的运动矢量的差最小的运动矢量的mvp候选可以成为所选择的mvp候选。可以推导作为通过从当前信息发信号通知给解码设备。此外，当应用(A)MVP模式时，参考图片索引的值可以被配置为参考图片索引信息，并且被单独地发信号通知给解码设备。[0173]编码设备可以基于预测样本来推导残差样本(S802)。编码设备可以通过将当前块的原始样本与预测样本进行比较来推导残差样本。[0174]编码设备对包括预测信息和残差信息的图像信息进行编码(S803)。编码设备可以以比特流的形式输出编码图像信息。预测信息可以包括关于预测模式信息的信息(例如，跳过标志、合并标志或模式索引等)和作为与预测过程有关的信息的关于运动信息的信息。关于运动信息的信息可以包括作为用于推导运动矢量的信息的候选选择信息(例如，合并索引、mvp标记或mvp索引)。此外，关于运动信息的信息可以包括关于MVD的信息片索引信息。[0175]此外，关于运动信息的信息可以包括指示是应用LO预测、L1预测还是双边预测的信息。残差信息是关于残差样本的信息。残差信息可以包括关于残差样本的量化变换系数的信息。[0176]输出比特流可以被存储在(数字)存储介质中，并且被传送到解码设备或者经由网络被传送到解码设备。[0177]此外，如上所述，编码设备可以基于参考样本和残差样本来生成重构图片(包括重构样本和重构块)。这是为了推导与由解码设备执行的预测结果相同的预测结果，并且由此，可以提高编码效率。因此，编码设备可以将重构图片(或重构样本或重构块)存储在存储器中，并且将重构图片用作参考图片。如上所述，环路滤波过程可以进一步应用于重构图[0178]图10和图11是示出根据本公开的实施方式的基于帧间预测的视频/图像解码方法[0179]参照图10和图11,解码设备可以执行与由编码设备执行的操作相对应的操作。解[0180]可以由解码设备的帧间预测单元(帧间预测器)260执行S1001至S1003,并且可以单元的逆变换器230可以通过针对变换系数执行逆变换来推导针对当前块的残差样本。[0181]具体地，解码设备可以基于所接收的预测信息来确定针对当前块的预测模式(S1001)。解码设备可以基于预测信息中的预测模式信息来确定将哪种帧间预测模式应用将跳过模式或合并模式应用于当前块时，解码设备可以配置以下将描述的合并候选列表，并且在合并候选列表中包括的合并候选当中选择一个合并候选。可以基于选择信息(合并mvp候选的运动矢量用作当前块的mvp。可以基于选择信息(mvp标志或mvp索引)来执行选择。在这种情况下，可以基于关于MVD的信息来推导当前块的MVD,并且可以基于当前块的[0186]解码设备可以基于当前块的运动信息来生成针对当前块的预测样本(S1003)。在这种情况下，可以基于当前块的参考图片索引来推导参考图片片上的由当前块的运动矢量指示的参考块的样本来推导当前块的预测样本。在这种情况[0187]例如，解码设备的帧间预测单元(帧间预测器)260可以包括预测模式确定单元261、运动信息推导单元262和预测样本推导单元263,并且预测模式确定单元261可以基于所接收的预测模式信息来确定针对当前块的预测模式，运动信息推导单元262可以基于关于所接收的运动信息的信息来推导当前块的运动信息(运动矢量和/或参考图片索引),并[0188]解码设备基于所接收的残差信息生成针对当前块的残差样本(S1004)。解码设备跳过模式、MVP模式和仿射模式(affinemode)等的各种模式。解码器侧运动矢量细化(decodersidemotionvectorrefinement,DMVR)模式、自适应运动矢量分辨率(adaptivemotionvectorresolution,AMVR)模式等可以进一步用作辅助模式[0192]指示当前块的帧间预测模式的预测模式信息可以从编码设备被发信号通知给解式(independentmode)被发信号通知，或者作为合并模式或MVP模式的相关模式片中的原始块来在参考图片中的预定搜索范围内以小数像素(fractionalpixel)为单位相位的样本值的差来推导块的相似度。例如，可以基于当前块(或当前块的模板[0197]图12是用于描述作为应用本公开的实施方式的在合并模式或跳过模式中使用的模式。例如，可以使用多达五个合并候选块，但是本公开不限于此。另外，可以在条带报头(或图块组报头(tilegroupheader))中发送合并候选块的最大数量，并且本公开不限于此。在找到合并候选块之后，编码器可以生成合并候选列表，并且在合并候选块当中选择具有最小成本的合并候选块作为最终合并候选块。[0200]本公开提供了针对构成合并候选列表的合并候选块的各种实施方式。[0201]作为合并候选列表，例如，可以使用五个合并候选块。例并候选和一个时间合并候选。作为具体示例，在空间合并候选的情况下，图12所示的块可以用作空间合并候选。[0202]图13是示出根据应用本公开的实施方式的用于配置合并候选列表的方法的流程[0203]参照图13,编码设备(编码器/解码器)将通过搜索当前块的空间相邻块而得到的空间合并候选插入到合并候选列表中(S1301)。例如，空间相邻块可以包括当前块的左下角述空间相邻块之外，还可以将包括右相邻块、下相邻块和右下相邻块等的附加相邻块用作空间相邻块。编码设备可以通过基于优先级搜索空间相邻块来推导可用块，并且可以推导B2的顺序搜索图12所示的五个块，并依次索引可用候选并将经索引的候选配置为合并候选[0204]编码设备将通过搜索当前块的时间相邻块而获得的时间合并候选插入到合并候选列表中(S1302)。时间相邻块可以位于作为与当前块所在的当前图片不同的图片的参考图片上。时间相邻块所在的参考图片可以被称为并置图片或col图片。可以在col图片上按照针对当前块的并置块(co-locatedblock)的右下角相邻块和右下中间块的顺序搜索时间相邻块。[0205]此外，当应用运动数据压缩时，可以针对每个预定存储单元将特定运动信息作为col图片中的代表运动信息(representativemotioninformation)进行存储。在这种情况下，不需要存储预定存储单元中的所有块的运动信息，并且结果，可以获得运动数据压缩效果。在这种情况下，可以针对每个16×16样本单元或8×8样本单元预先确定上述预定存储单元，或者可以将预定存储单元的大小信息从编码器发信号通知给解码器。当应用运动数据压缩时，可以将时间相邻块的运动信息替换为时间相邻块所在的预定存储单元的代表运[0206]换句话说，在这种情况下，就实现而言，可以基于覆盖基于时间相邻块的坐标(左上样本位置)以预定值算术右移并且然后算术左移的位置的预测块(而不是位于时间相邻块的坐标的预测块)的运动信息来推导时间合并候选。例如，当预定存储单元是2n×2n样本单元时，如果时间相邻块的坐标是(xTnb,yTnb),位于作为经修改的位置的((xTnb>>n)<<n),(yTnb>>n)<<n))处的预测块的运动信息可以被用于时间合并候选。[0207]具体地，例如，当预定存储单元是16×16样本单元时，如果时间相邻块的坐标是(xTnb,yTnb),位于作为经修改的位置的((xTnb>>4)<<4),(yTnb>>4)<<4))的预测块的运动信息可以被用于时间合并候选。另选地，例如，当预定存储单元是8×8样本单元时，如果时间相邻块的坐标是(xTnb,yTnb),位于作为经修改的位置的((xTnb>>3)<<3),(yTnb>>3)<<3))的预测块的运动信息可以被用于时间合并候选。[0208]编码设备可以检查当前合并候选的数量是否小于合并候选的最大数量(S1303)。合并候选的最大数量可以被预先定义或从编码器被发信号通知给解码器。例如，编码器可以生成关于合并候选的最大数量的信息，并对生成的信息进行编码，并将经编码的信息以比特流的形式传送到解码器。当合并候选的最大数量完全用尽时，可以不执行后续的候选添加过程。[0209]作为检查结果，当当前合并候选的数量小于合并候选的最大数量时，编码设备将附加的合并候选插入到合并候选列表中(S1304)。附加的合并候选可以包括例如ATMVP、组合的双边预测合并候选(当当前条带的条带类型是类型B时)和/或零矢量合并候选。[0210]作为检查结果，当当前合并候选的数量不小于合并候选的最大数量时，编码设备可以终止合并候选列表的配置。在这种情况下，编码器可以基于率失真(rate-distortion,RD)成本在构成合并候选列表的合并候选当中选择最优合并候选，并且向解码器发信号通知指示所选择的合并候选的选择信息(例如，合并索引)。解码器可以基于合并候选列表和选择信息来选择最优合并候选。[0211]可以如上所述将所选合并候选的运动信息用作当前块的运动信息，并且可以基于当前块的运动信息来推导当前块的预测样本。编码器可以基于预测样本来推导当前块的残差样本，并将针对残差样本的残差信息发信号通知给解码器。解码器可以如上所述根据基于残差信息所推导的残差样本和预测样本来生成重构样本，并且基于所生成的重构样本来生成重构图片。[0212]当应用跳过模式时，可以通过与如上所述应用合并模式的情况相同的方法来推导测样本可以被直接用作重构样本。[0213]MVP模式[0214]图14是示出根据应用了本公开的实施方式的用于配置合并候选列表的方法的流[0215]当应用运动矢量预测(MVP)模式时，可以通过使用经重构的空间相邻块(例如，可以是上面图12中描述的相邻块)的运动矢量和/或与时间相邻块(或Col块)相对应的运动矢量来生成运动矢量预测值(mvp)候选列表。换句话说，经重构的空间相邻块的运动矢量和/或与时间相邻块相对应的运动矢量可以用作运动矢量预测值候选。[0216]关于预测的信息可以包括指示在列表中包括的运动矢量预测值候选当中所选择可以通过使用选择信息在运动矢量候选列表中包括的运动矢量预测值候选当中选择当前块的运动矢量预测值。编码设备的预测器可以获得当前块的运动矢量和运动矢量预测值之间的运动矢量差(MVD),并且对所获得的MVD进行编码并且以比特流的形式输出经编码的MVD。换句话说，可以通过从当前块的运动矢量中减去运动矢量预测值而获得的值来获得MVD。在这种情况下，解码设备的预测器可以获得关于预测的信息中包括的运动矢量差，并通过将运动矢量差和运动矢量预测值相加来推导当前块的运动矢量。解码设备的预测器可以从关于预测的信息中获得或推导指示参考图片的参考图片索引。例如，可以如图14所示配置运动矢量预测值候选列表。示的四个运动模型。表示能够表示仿射运动模型的运动当中的三个运动(平移、缩放和旋转)的仿射运动模型被称为相似(similarity)(或简化)仿射运动模型。在描述本公开的实[0221]图16示出了根据本公开的一个实施方式的用于仿射运动预测

人人文库> 全部分类> 行业资料 > 各类标准

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN112385230B 通过使用仿射预测处理视频信号的方法和设备（Lg电子株式会社）

文档简介

温馨提示

最新文档

评论

CN112385230B 通过使用仿射预测处理视频信号的方法和设备（Lg电子株式会社）

文档简介

温馨提示

最新文档

评论

相关文档