版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Informationtechnology—Datacodingfor2024-05-20发布深圳市8K超高清视频产业协作联盟发布I 3 3 本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定——第2部分:图像。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。T/SUCA024旨在确立面向机器智1面向机器智能的数据编码第2部分:图像本文件规定了适应多种比特率、分辨率和质量要求的面GB/T33475.2—2016信息技术高效多媒体编码第2部分:T/SUCA024中语法、语义及算法的),2预测补偿predictionco34缩略语CNN:卷积神经网络(ConvolutionalNeuralNetwCDF:累积分布函数(CumulativeDiFPN:特征金字塔网络(FeaturePyramidNetwork)LSB:最低有效位(LeastSignificant5.1通则——优先级高的运算符先于优先级低的运算符进行计算,运算符的优先级的值越小表示该运算符5.2算术运算符+5-5*43/4整除运算,沿向0的取值方向截断。例如,7/4和-7/-4截断至1,-7/4和7/-4截断÷4a4f(i)5自变量i取由a到b(含b)的所有整数值时,函数f(i)的累加和445.3逻辑运算符4!2如果表达式express的结果为真或不为0,则使用a进行赋值;否则>77<77885.5位运算符&9|~26将a以2的补码整数表示的形式向右移b位。仅当b取正数6将a以2的补码整数表示的形式向左移b位。仅当b取正数5.6赋值=11递减,x--相当于x=x-1。当用于数组下标时,在自减运算前55.7数学函数 x——自变量x。j——上界。5.8结构关系符例如:a->b表示a是一个结构,b是a5.9位流语法、解析过程和解码过程的描述方法语法表描述了所有符合本文件的位流语法的超集,附加的语法限制在相关条中说明。表7给出了描述语法的伪代码例子。当语法元素6ne(v)/*花括号括起来的语句组是复合语句,在功能上视作单个语句{…}否则执行alternative语句。如果alternative语句不需要执行,结分和相关的alternative语句可if(condition)primarystatementfor(initialstatement;condition;suprimarystatementbreak7概述byte_aligned()next_bits(n)read_bits(n)5.9.3描述符u(n)义取特定值的连续n个二进制位。解析过程在7ne(v)有符号整数语法元素。解析过程使用基于神经网络的概率估计和数值熵解析,在7.无符号整数语法元素。解析过程使用码表解析,在7“禁止”定义了一些特定语法元素值,这些值不应出现在符合本文件的“标记位”(marker_bit)指该应忽略这些位。“保留位”不应出现从任意字节对85.10数据形式5.10.1张量和张量中的元素对于张量T,T[i][j][k]代表一个由i、j、k索5.10.2矩阵和矩阵中的元素对于矩阵M,M[j1:j2][:w]代表第1个维度从j1索引到(j2-1)索引确定的所有元素,其中j1为小于h5.10.3列表和列表中的元素不大于a且大于i1的非负整数。当i1不出5.11二维卷积二维卷积表示为Conv(c_in,c_out,s,k_ver,k_hor)(input,weight,bias)——s表示卷积步长;——k_ver和k_hor表示卷积核的高和宽。9解析和解码过程加载了神经网络的整套模型参数。Conv的weight和bias是该整套模型参数中的一部当在一系列操作中调用本条中定义的Conv且未明确设置输入张量的情况下,默认将输入张量设置Conv(c_in,c_out,s,k_ver,k_hor)。Conv(c_in,c_out,s,k_ver,k_hor)(input,weight,bias){for(j=0;j<h_out;j++){}}}}}5.12超分重组超分重组表示为Shuffle(s_vh)为该系列操作中当前操作的前一个操作的输出张量,此时Shuffle简略表示为Shuffle(sfor(j=0;j<h_out;j++)}5.13交叉超分重组交叉超分重组表示为CrossUpShuffl——c_out=c_in/4。当在一系列操作中调用本条中定义的CrossUpShuffle且未明确设置输入张量的情况下,默认将输入张量设置为该系列操作中当前操作的前一个操作的输出张量,此时CrossUpShuffle简略表示为for(j=0;j<h_in;j++){}}}5.14交叉降分重组——h_out=h_in/2;——w_out=w_in/2;入张量设置为该系列操作中当前操作的前一个操作的输出张量,此时CrossDownShuffle简略表示为CrossDownShuffle(inpfor(j=0;j<h_out;j++){}}张量拼接表示为Concat(input该过程的输入是两个宽度和高度大小相同的张量input1(c1,h,w)和input2(c2,h,w)。该过程的结果是张量output(c1+c2,h,w)。for(j=0;j<h;j++)5.16渗漏激活函数渗漏激活函数表示为LeakyReLU(设置为该系列操作中当前操作的前一个操作的输出张量,此时LeakyReLU简略表示为LeakyReLUfor(j=0;j<h_out;j++){output[i][j][k]=}}}5.17标准激活函数当在一系列操作中调用本条中定义的ReLU且未明确设置输入张量的情况下,默认将输入张量设置为该系列操作中当前操作的前一个操作的输出张量,此时ReLU简略表示为ReLfor(j=0;j<h_out;j++){}}5.18二维深度卷积二维深度卷积表示为DepthConv(c,s,k_ver,k_hor)(input,weight,bias),其中:——s表示卷积步长;——k_ver和k_hor表示卷积核的高和宽。DepthConv(c,s,k_ver,k_hor)(input)。DepthConv(c,s,k_ver,k_hor)。DepthConv(c,s,k_ver,k_hor)(input,weight,bias){for(j=0;j<h_out;j++){}output[x][j][k]+}}5.19二维整数卷积二维整数卷积表示为IntConv(c_in,c_out,s,k_ver,k_hor)(input,weight,bias,——c_in表示输入整数张量的通道数;——s表示卷积步长;——k_ver和k_hor表示整数卷积核的高和宽。——输入整数张量的截断值max;IntConv(c_in,c_out,s,k_ver,k_hor)(input)。当在一系列操作中调用本条中定义的IntConv且未明确设置输入张量的情况下,默认将输入张量设(c_in,c_out,s,k_ver,k_hor)。for(j=0;j<h_in;j++)clipped_input[i][j][k]=Clip3(-max,max-1,input[i][j][k])Conv(c_in,c_out,s,k_ver,k_hor)(clipped_input[:c_in][:h_in][w_in],weight,bias)for(j=0;j<h_out;j++)5.20二维转置卷积二维转置卷积表示为Tconv(c_in,c_out,s_vh,k_ver,k_hor)(input,weight,bias——k_ver和k_hor表示卷积核的高和宽。当在一系列操作中调用本条中定义的Tconv且未明确设置Tconv(c_in,c_out,s_vh,k_ver,k_hor)。Tconv(c_in,c_out,s_vh,k_ver,k_hor)(input,weight,bias){for(j=0;j<h_in;j++)Conv(c_in,c_out,1,k_ver,k_hor)(temp[:c_in][:h_out][:w_out],weight,bias)}——front表示在张量的通道维度上向前填充张量样本的数量;——c_out=c_in+front+back;默认的填充的值为0。当在一系列操作中调用本条中定义的Pad且未明确设置输入张量的情况下,默Pad(up,bottom,left,right,front,back)。Pad(up,bottom,leftfor(j=0;j<h_out;j++)if(i>=front&i<(c_out-back)&j>=left&j<(h_out-right)&k>=up&k<(w_out-bottom))output[i][j][k]=input[i-front][j-up][k-left]}——h_out表示在裁剪后的张量的高度;当在一系列操作中调用本条中定义的Crop且未明确设置输入张量的情况下,默认将输入张量设置为该系列操作中当前操作的前一个操作的输出张量,此时Crop简略表示为Crop(h_out,wfor(j=0;j<h_out;j++)}5.23张量取绝对值该系列操作中当前操作的前一个操作的输出张量,此时ABS简略表for(j=0;j<h;j++)}——low_thr表示张量中元素值被截断的下限值;该系列操作中当前操作的前一个操作的输出张量,此时Clip简略表示为Clip(low_thr,highfor(j=0;j<h;j++)output[i][j][k]=clip3(low_th}Add执行如下操作:Add(input1,input2){for(j=0;j<h;j++)}5.26二维加权卷积二维加权卷积表示为MaskConv(c)(input,weight1,weight2,bias1,bias2),其中:c表示张量的通道一部分参数,在解析和解码过程中不再变化。此时MaskConv简略表示为MaskConv(c)(i当在一系列操作中调用本条中定义的MaskConv且未明确设置输入张量的情况下,默认将输入张量设置为该系列操作中当前操作的前一个操作的输出张量,此时MaskConv简略表示为MaskConvfor(j=0;j<h;j++)5.27二维残差卷积二维残差卷积表示为ResConv(c_in,c_out,tp)(input,weight1,weight2,weight3,bias1,bias2,bias3),——c_out表示输出张量的通道数;为ResConv(c_in,c_out,s,k_ver,k_hor)(input)。ResConv(c_in,c_out,s,k_ver,k_hor)。起始码由起始码前缀和起始码值构成。起始码前缀是位串‘00000if(image_structure_enabled_flag)if(image_rec_enabled_flag)}u(4)u(8)u(8)u(8)image_structure_enabledu(1)u(1)if(image_structure_enabled_flag){u(16)u(16)}u(1)if(imh_extension_fu(15)for(i=0;i<imh_extimh_extension_data_byte[i]u(8)}}u(5)for(j=0;j<zH;j++)ne(v)for(j=0;j<yH;j++)ne(v)u(1)if(ifd_extension_flag){u(15)ifd_extension_data_byte[i]u(8)}}image_structure_datu(4)for(j=0;j<iW/bS;j++)bounding_boxes_enabledu(1)if(bounding_boxes_enabled_flag){bounding_boxes_num_miu(16)u(14)u(14)u(14)u(14)bounding_box_category_u(8)}}u(1)if(isd_extension_flu(32)for(i=0;i<isd_eisd_extension_data_byte[i]u(8)}}u(6)u(6)u(6)u(6)u(4)u(1)}超先验张量宽度z_width_mi超先验张量高度z_height_m012图像结构数据允许标志image_str15位无符号整数。表示图像头中扩展数据的长度,以字节为单位。如果位流中不存在图像头扩展数据字节imh_extension_da码过程。符合本文件的解码器应忽略imh_extension_data_byte[i]的码率控制因子标号rate_control_fact5位无符号整数。表示解码应使用的码率控制因子qRC,码率控制因子标号和码率控制因子的对应0123456789特征残差张量元素值y_residue[i][j][k]16位无符号整数。表示图像特征数据中扩展数据的长度,以字节为单位。如果位流中不存在ifd_extension_length不存在,但ifd_extension_length的使用可以在本文件的某些未来版本中指定,并且符合本文件的解码器图像特征数据扩展数据字节ifd_extension_d码过程。符合本文件的解码器应忽略ifd_extension_data_byte[i块掩膜覆盖区域尺寸大小标号group_mask_block_si4位无符号整数。规定块掩膜中一个掩膜点在图像中覆盖的方形区域的尺寸大小bS(见表义块掩膜中所有掩膜点在图像中覆盖的方形区域的尺寸大group_mask_block_size_bS的值01块掩膜值group_mask_valubounding_box_category_id[i]的值01人2车16位无符号整数。表示图像结构数据中扩展数据的长度,以字节为单位。如果位流中不存在不存在,但isd_extension_length的使用可以在本文件的某些未来版本中指定,并且符合本文件的解码器也应允许isd_extension_lengt图像结构数据扩展数据字节isd_extension_d码过程。符合本文件的解码器应忽略isd_extension_data_byte[i重建图像数据格式标号rec_imarec_image_format_id的值0123——如果语法元素的描述符是u(n),应使用7.2的操作;——如果语法元素的描述符是f(n),应使用7.3的操作;——如果语法元素的描述符是le(v),应使用7.5的操作。无符号整数的解析值为函数read_bits(n)(见)的返回值,该返回值用高位在前的二进制表b)如果当前语法元素是z,进行7.4.2的初始化操作,然后c)如果当前语法元素是y_residue,进行7.4.2的初始化操作,然后执行7.4.4的操作。MaskCdf=0x0000000000000001<<CdfPrecision-1MaskBypass=0x00000001<<BypassPrecision-1StateLowerBound=0x0000000000000001<<(StatePrecision-1)StateLSB=read_bits(StatStateMSB=read_bits(State4)将Offsets[:zN]按照D.14)将Offsets[:yN]按照D.23)将MaxValue设置为MaxValues[5)执行7.4.6的操作,得到z[i]3)将MaxValue设置为MaxValues[5)执行7.4.6的操作,得到y_residue[i][j][k]的值;c)使用二维整数卷积IntConv(C,C,1,3,3);for(j=0;j<yH;j++){}}ABS()zABS()z——State。CDFCur=State&MaskCdf}c)进行的解析状态值检验,将State设置为检验后的NewState;——State。New=read_bits(StatePrecision)——State。1)进行的数据读取,得到BypassVal和State;3)如果BypassVal的值不等于Maskb)将RawVal和j的值均初始化为0,循环进行BypassLen1)进行的数据读取,得到BRawVal=(BypassVal<<(j*B——State。——BypassVal;——State。b)进行的解析状态值检验,将State设置为检验后的NewState。1)令j=0~(iW/bS),每次按照附录D.3中表D.3规定的块掩膜码表进行解析得到group_mask_value[i][jb)解析图像位流(见8.2);d)解码图像特征数据(见8.3);),注:图像特征数据可以通过特征适配以用于本文件在表15中约定的任务网络以外的其他任a)按照第6章规定的位流中语法元素的顺序,使用第7章规定的解析过程逐个解析图像位流中b)按照第6章中的规定,根据这些语法元素的解析值推导得到的本文件中的全局变量的值。),b)进行特征张量超分(见8.3.3),得到重建a)进行反量化(见);b)进行超先验张量超分(见);c)进行特征张量预测补偿(见);d)进行特征张量调制(见)。反量化for(j=0;j<yH;j++)yResDQ[i][j][k]=float(y_resb)使用二维转置卷积Tconv(C,C,2,4,4);e)使用二维卷积Conv(C,C,1,3,3);f)使用二维转置卷积Tconv(C,C,2,4,4);LeakyReLU()LeakyReLU()LeakyReLU()LeakyReLU()zyHyperzyResDQPad[:C][:yHP][:yWP]=Pad(c)进行第0阶特征张量预测(见.2);d)进行第1阶特征张量预测(见8.3.2.e)进行第2阶特征张量预测(见.4);f)进行第3阶特征张量预测(见.5);g)进行预测张量调整(见.10);h)进行第4阶特征张量预测(见.6i)进行第5阶特征张量预测(见j)进行第6阶特征张量预测(见.8);k)进行第7阶特征张量预测(见.9);l)进行交叉超分重组:b)将i设置为0,进行预测融合(见.11d)将i设置为1,进行预测融合(见.11);d)将i设置为2,进行预测融合(见.11d)将i设置为3,进行预测融合(见.11);c)将i设置为4,进行预测融合(见.11);d)将i设置为6,进行预测融合(见.11);b)进行二维卷积Conv(C/2,C,1,3,3);d)进行二维卷积Conv(C,C,1,3,3); yTmpyTmpModifiedyTmpyPredTmpyHyperPadDownPartCPadyPredTmpfor(j=0;j<yW;j++)for(j=0;j<yH;j++)ReLUReLU()h)进行二维加权卷积:MaskConv(C)MaskConv(C)MaskConv(C)MaskConv(C)ryra)如果bounding_boxes_enabled_flag的值为1,解码),3)第i个目标框的高度BoundingBox[i]->4)第i个目标框的宽度BoundingBox[i]->w等于bo——riW=rW*4-crop_left_siz——riH=rH*4-crop_upper_sfor(j=crop_upper_size;j<rH*4-crop_bottomimR[j-crop_upper_size][k-crop_left_sizeimG[j-crop_upper_sizeimB[j-crop_upper_size][k-crop_left_size]=RT15[2}for(j=0;j<riW;j++)for(j=0;j<riW;j++)}for(j=0;j<riW;j++)}for(j=0;j<riW;j++){}4)如果rec_image_format_id的值为3,for(j=0;j<riW;j++){}}MaskConv(C/2)MaskConv(C/2)MaskConv(C)MaskConv(C)rr低有效位,检查该位之前写入的22位,如果这22位都是‘0’,在该位之前插入‘10’,该位成为下一字节构成位串‘000000000000000000000010’,丢弃当前字节的最低两个有效位。丢弃一个字节最低两个有效位可采用任意等效的方式,本文件不 个档次规定的解码器应完全支持该档次定义本附录描述了不同档次所对应的各种限制。所有未被限定的语法元素和参数可以取任何本文件所profile_id定义了位流的档次。profile_id的值CyNy的累计概率列表数yPy的概率精度44yScaleFactor4神经网络模型参数包括神经网络中卷积操作使用的卷积核权重和偏置以及神经网络中其他操作的解析和解码过程中使用的神经网络模型参数,按照PyTorch的序列化状态字典格式存储在电子附件中,获取路径为:/share/506555c6f2b1906fb4c5492D.1解析z[i][j][k]时使用的解析语法元素z[i][j][k]时使用的矩阵、列表和张量及其获取方式如下:——矩阵CDFS,其数据内容参见URL1的csv文件,其存放格式为:令i=0~zN,逐行存放/share/9ffa3bd4936653b62edde7/share/7f28f3ee8841dd0ecd400a/share/12f16695be3d77134627de3/share/a0d37a965e9a54dd860f/share/967c95258b7ef510c50cD.2解析y_residue[i][j][k解析语法元素y_residue[i][j][k]时使用的矩阵和列表及其获取方式如下:——矩阵CDFS,其数据内容参见URL6的csv文件,其存放格式为:令i=0~yN,逐行存放/share/90b79d6ddbd909cf6e25151/share/ab35cbfe233478f1d8b9eb6/share/7f03cf5b8163109e4ce7e1/share/9f60a1e0307a201bb58af/share/b102cbe51b6e23740b4dd8c解析group_mask_value时使用的码表01234567891101111101000011111011110000000111111111111111111111111110111110100001111101111000011011111010000111110111100000001111110111110100001111101111000000011111111111111111111111111111111101111101000011111011110000000111111111111111111111111111101111101000011111011110000000111111111111111111111111111110111110100001111101111000000011111111110111110100001111101111000000011111111111011111010000111110111100000001111111111110111110100001111101111000000011111111111110111110100001111101111000000011111111111111011111010000111110111100000001111111111111110111110100001111101111000000011111111111111110111110100001111101111000000011111111111111111101111101000011111011110000000111111111111111111101111101000011111011110000000111111111111111111110111110100001111101111000000011111111111111111111011111010000111111101111101000011111011110000000111111111111111111111011111010000111110111101111101000011111011110000000111111111111111111111101111101000011111011110110111110100001111101111000000011111111111111111111111011111010000111110111100001101111101000011111011110000000111011111010000111110111100000001111111011111010000111110111101111101000011111011110000000111111111111011111010000111110111110111110100001111101111000000011111111111111011111010000111110111111011111010000111110111100000001111111111111111011111010000111110111101101111101000011111011110000000111111111111111111011111010000111110111101101111101000011111011110011011111010000111110111100011011111010000111110110111110100001111101111000001101111101000011111011111011111010000111110111100000011011111010000111110111100000001111111011111010000111110111100000001101111101000011111011110011011111010000111110111100000001111101111101000011111011110000110111110100001111101111000000011111111111111111111111110111110100001111101111000000011111111111111111111110111110100001111101111000000011111111111111111111111111111011111010000111110111100000001111111111111111111111111111111111111111111111111111111011111010000111110111100000001111111101111101000011111011110000000111111111111111111111111111111110111110100001111101111000000011111111101111101000011111011110000000111111111111111111111111111110111110100001111101111000000011111111111111111111111111111111101111101000011111011110000000111111111110111110100001111101111000000011111111110111110100001111101111000000011111111111011111010000111110111100000001111111111111011111010000111110111100000001111111111110111110100001111101111000000011111111111110111110100001111101111000000011111111111111101111101000011111011110000000111111111111110111110100001111101111000000011111111111111101111101000011111011110000000111111111111111110111110100001111101111000000011111111111111110111110100001111101111000000011111111111111111011111010000111110111100000001111111111111111110111110100001111101111000000011111111111111111110111110100001111101111000000011111111111111111111011111010000111110110111110100001111101111000000011111111111111111111011111010000111110111011111010000111110111110111110100001111101111000000011111111111111111111101111101000011111011111101111101000011111011110110111110100001111101111001101111101000011111011110000000111111111111111111111101111101000011111011110001101111101000011111011110000011011111010000111110111100000011011111010000111110111100000001111011111010000111110111100000001111111111011111010000111110111100000001111111101111101000011111011110000000111111111111111111111111011111010000111110111100000001111111111101111101000011111011110111110100001111101111000000011111111111111111101111101000011111011110000000111111111111111111111111101111101000011111011110000000111111111111101111101000011111011110000000111111111111110111110100001111101111000000011111111111111011111010000111110111100000001111111111111111111111111101111101000011111011111101111101000011111011110000000111111111111111111111111111011111010000111110111100000001111111111111111110111110100001111101111000000011111111111111111111111111110111110100001111101111011011111010000
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年预防艾滋病健康教育教案
- 文昌房地交易合同
- 新疆二手车交易合同
- 日常关联交易合同
- 景瑞物业合同
- 朱旭航交易合同
- 棚户区物业合同
- 毛胚装修物业合同
- 江苏学校物业合同
- 没签居间服务合同
- 2026年同等学力申硕英语模拟卷
- 摩根士丹利 -半导体:中国AI加速器-谁有望胜出 China's AI Accelerators – Who's Poised to Win
- 2026辽宁沈阳汽车集团有限公司所属企业华亿安(沈阳)置业有限公司下属子公司招聘5人笔试历年参考题库附带答案详解
- 2025~2026学年江苏镇江市第一学期高三“零模”化学试卷
- 2026年公路养护工职业技能考试题库(新版)
- 宜宾市筠连县国资国企系统2026年春季公开招聘管理培训生农业考试模拟试题及答案解析
- 2026年福建南平市八年级地生会考考试真题及答案
- 2025-2030非洲智能汽车零部件行业市场供需理解及投资潜力规划分析研究报告
- 2026季华实验室管理部门招聘3人(广东)建设笔试模拟试题及答案解析
- 北京市大兴区瀛海镇人民政府招聘劳务派遣4人考试参考试题及答案解析
- 4.7-北师数学二下第四单元《有多厚》课件
评论
0/150
提交评论