演示文稿数字视频压缩标准_第1页
演示文稿数字视频压缩标准_第2页
演示文稿数字视频压缩标准_第3页
演示文稿数字视频压缩标准_第4页
演示文稿数字视频压缩标准_第5页
已阅读5页,还剩131页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

演示文稿数字视频压缩标准目前一页\总数一百三十六页\编于十二点(优选)数字视频压缩标准目前二页\总数一百三十六页\编于十二点数字视频压缩标准

图像压缩国际标准

近十年来,图像编码技术得到了迅速发展和广泛应用,并且日臻成熟,其标志就是几个图像压缩国际标准的制定。即关于静止图像的编码标准JPEG和JPEG2000、关于电话/会议电视的视频编码标准H.261,H.263和关于活动图像的编码标准MPEG-1,MPEG-2,MPEG-4和H.264等。

JPEG(JointPhotographicExpertGroup)

MPEG(MotionPictureExpertsGroup)目前三页\总数一百三十六页\编于十二点图像压缩国际标准标准标题起止日期目标比特率应用场合主要编码技术JPEG连续色调静态图像1986.3~1992.10

压缩比为2~30·因特网·数字照相·图像/视频编辑

·DCT·知觉量化·霍夫曼编码·算术编码

JPEG2000新一代静态图像编码标准

1996.2~2000.12

压缩比为2~50·因特网·移动通信·数字照相·遥感·传真·数字图书馆·JPEG所有技术·小波变换·EBCOT·ROI编码·可扩展编码目前四页\总数一百三十六页\编于十二点图像压缩国际标准标准标题目标比特率应用场合主要编码技术MPEG-1运动图像及其伴音不超过1.5Mb/s

·光盘存储·VCD·视频监控

·JPEG所有技术·自适应量化·运动补偿预测MPEG-2

运动图像及其伴音1.5~35Mb/s

·数字高清晰度电视·高品质视频·卫星/有线电视·地面广播·MPEG-1所有技术·基于帧/场的运动补偿·扩展编码·容错编码

目前五页\总数一百三十六页\编于十二点图像压缩国际标准标准标题目标比特率应用场合主要编码技术MPEG-4音视频对象的通用编码

8kb/s~35Mb/s

·因特网·交互式视频·2D/3D计算机图形·移动通信

·MPEG-2所有技术·小波变换·运动估计/补偿·可扩展编码·位图形状编码·对象编码·动态网络编码

MPEG-7多媒体描述接口·多媒体数据库等

MPEG-21多媒体框架

目前六页\总数一百三十六页\编于十二点图像压缩国际标准标准标题目标比特率应用场合主要编码技术H.261

Px64kb/s的音视频服务Px64kb/s(p:1~30)

·ISDN视频会议·DCT·自适应量化·运动补偿预测·运动估计·霍夫曼编码H.263低比特率通信的视频编码8kb/s~1.5Mb/s

·POTS视频电话·桌面视频电话·移动视频电话

·H.261所有技术·双向运动补偿·半像素运动估计·高级运动估计·重叠运动补偿·算术编码

目前七页\总数一百三十六页\编于十二点数字视频压缩标准静态图像压缩国际标准1、JPEG国际静止图像压缩标准目前八页\总数一百三十六页\编于十二点6.2

静态图像压缩国际标准

JPEG是面向静态图像编码的国际标准。在相同图像质量条件下,JPEG文件拥有比其他图像文件格式更高的压缩比。JPEG目前被广泛应用于多媒体和网络程序中,是现今万维网中使用最广泛的两种图像文件格式之一。JPEG是一种有损压缩,即在压缩过程中会丢失数据,每次编辑JPEG图像后,图像就会被重复压缩一次,损失就会有所增加。目前九页\总数一百三十六页\编于十二点6.2

静态图像压缩国际标准JPEG允许四种编码模式:(1)顺序式(Sequential)DCT方式:从左到右、从上到下对图像顺序进行基于离散余弦变换(DCT)的编码。DCT理论上是可逆的,但在计算时存在误差,因而基于DCT的编码模式是一种有损编码。目前十页\总数一百三十六页\编于十二点静态图像压缩国际标准(2)渐进式(Progressive)DCT方式:基于DCT,对图像分层次进行处理,从模糊到清晰地传输图像(与GIF文件的交错方式类似)。有两种实现方法,一种是频谱选择法,即按Z形扫描的序号将DCT量化序数分成几个频段,每个频段对应一次扫描,每块均先传送低频扫描数据,得到原图概貌,再依次传送高频扫描数据,使图像逐渐清晰;另一种是逐次逼近法,即每次扫描全部DCT量化序数,但每次的表示精度逐渐提高。目前十一页\总数一百三十六页\编于十二点静态图像压缩国际标准(3)无失真(Lossless)方式:使用线性预测器,如DPCM,而不是基于DCT。(4)分层(Hierarchical)方式:在空间域将源图像以不同的分辨率表示,每个分辨率对应一次扫描,处理时可以基于DCT或预测编码,可以是渐进式,也可以是顺序式。目前十二页\总数一百三十六页\编于十二点静态图像压缩国际标准JPEG定义了三种系统:基本系统(BaselineSystem)扩展系统(ExtendedSystem)失真压缩系统(LosslessSystem)一个符合JPEG标准的编解码器至少要满足基本系统的技术指标。基本的JPEG算法属于变换类编码,下面针对基于DCT的顺序式基本系统编码来说明JPEG的编码方法。

目前十三页\总数一百三十六页\编于十二点静态图像压缩国际标准JPEG编码/解码器的流程目前十四页\总数一百三十六页\编于十二点静态图像压缩国际标准JPEG压缩算法的实现步骤:离散余弦变换(DCT);量化(Quantization);Z字型编码(ZigZagScan);使用差分脉冲编码调制(DPCM)对直流系数(DC)进行编码;使用游程长度编码(RLE)对交流系数(AC)进行编码;熵编码(EntropyCoding)。目前十五页\总数一百三十六页\编于十二点静态图像压缩国际标准JPEG编码算法过程目前十六页\总数一百三十六页\编于十二点静态图像压缩国际标准1、数据分块

对图像进行编码前,将每个分量图像分割成不重叠的8×8像素块,每一个8×8像素块称为一个数据单元(DU)。在彩色图像中,JPEG分别压缩图像的每个彩色分量。虽然JPEG可以压缩通常的红绿蓝分量,但在YCbCr空间的压缩效果会更好。这是因为人眼对色彩的变化不如对亮度的变化敏感,因而对色彩的编码可以比对亮度的编码粗糙些,这主要体现在不同的采样频率和量化精度上。因此,编码前一般先将图像从RGB空间转换到YCbCr空间,再把各分量图像分割成8×8数据块。

目前十七页\总数一百三十六页\编于十二点

在对图像采样时,可以采用不同的采样频率,这种技术称为二次采样。由于亮度比色彩更重要,因而对Y分量的采样频率可高于对Cb、Cr的采样频率,这样有利于节省存储空间。常用的采样方案有YUV422和YUV411。把采样频率最低的分量图像中一个DU所对应的像区上覆盖的所有各分量上的DU按顺序编组为一个最小编码单元(MCU)。对灰度图像而言,只有一个Y分量,MCU就是一个数据单元。而对彩色图像而言,以4:1:1的采样方案为例,则一个MCU由4个Y分量的DU、1个Cb分量的DU和1个Cr分量的DU组成。静态图像压缩国际标准目前十八页\总数一百三十六页\编于十二点静态图像压缩国际标准2、离散余弦变换(DCT)

对每个8×8的数据块进行DCT后,得到的64个系数代表了该图像块的频率成分,其中低频分量集中在左上角,高频分量分布在右下角。其中F(0,0)(即第一行第一列元素)代表了直流(DC)系数,即8*8子块的平均值,要对它单独编码,其余63个叫交流(AC)系数。

目前十九页\总数一百三十六页\编于十二点静态图像压缩国际标准由于两个相邻的8*8子块的DC系数相差很小,所以对它们采用差分编码DPCM,可以提高压缩比,也就是说对相邻的子块DC系数的差值进行编码。8*8的其它63个元素是交流(AC)系数,采用行程编码。目前二十页\总数一百三十六页\编于十二点静态图像压缩国际标准

DC系数占原来数组能量的93%。

目前二十一页\总数一百三十六页\编于十二点静态图像压缩国际标准3、系数量化在DCT处理中得到的64个系数中,低频分量包含了图像亮度等主要信息。在从空间域到频域的变换中,图像中的缓慢变化比快速变化更易引起人眼的注意,所以在重建图像时,低频分量的重要性高于高频分量。因而在编码时可以忽略高频分量,从而达到压缩的目的,这也是量化的根据和目的。

目前二十二页\总数一百三十六页\编于十二点静态图像压缩国际标准表1亮度量化矩阵表2色度量化矩阵

161110162440516112121419265860551413162440576956141722295187806218223756681091077243555648110411924964788710312112101729295981121001099

17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999目前二十三页\总数一百三十六页\编于十二点在JPEG标准中,用具有64个独立元素的量化表来规定DCT域中相应的64个系数的量化精度,使得对某个系数的具体量化阶取决于人眼对该频率分量的视觉敏感程度。理论上,对不同的空间分辨率、数据精度等情况,应该有不同的量化表。不过,一般采用上述量化表,可取得较好的视觉效果。之所以用两张量化表,是因为Y分量比Cb和Cr更重要些,因而对Y采用细量化,而对Cb和Cr采用粗量化。静态图像压缩国际标准目前二十四页\总数一百三十六页\编于十二点量化就是用DCT变换后的系数除以量化表中相对应的量化阶后四舍五入取整。由于量化表中左上角的值较小,而右下角的值较大,因而起到了保持低频分量、抑制高频分量的作用。静态图像压缩国际标准目前二十五页\总数一百三十六页\编于十二点图

源图像亮度数据块

静态图像压缩国际标准目前二十六页\总数一百三十六页\编于十二点图

量化结果静态图像压缩国际标准目前二十七页\总数一百三十六页\编于十二点静态图像压缩国际标准4、Z字型扫描

为了保证低频分量先出现,高频分量后出现,以增加行程中连续”0”的个数,这63个元素采用了”Z”字型(Zig—Zag)的排列方法,可使大多出现在右下角的“0”值能够连续起来。然后再对直流(DC)系数进行差分编码DPCM,交流(AC)系数采用行程编码。目前二十八页\总数一百三十六页\编于十二点静态图像压缩国际标准Z扫描模型0156141527282471316262942381217253041439111824314044531019233239455254202233384651556021343747505659613536484957586263目前二十九页\总数一百三十六页\编于十二点静态图像压缩国际标准5、熵编码直流系数(DC)编码

8X8图像块经过DCT变换之后得到的DC直流系数有两个特点,一是系数的数值比较大,二是相邻8X8图像块的DC系数值变化不大。根据这个特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,即用前一数据块的同一分量的DC系数作为当前块的预测值,再对相邻图像块之间量化DC系数的差值进行Huffman编码。目前三十页\总数一百三十六页\编于十二点

若DC系数的动态范围为-1024~+1024,则差值的动态范围为-2047~+2047。如果为每个差值赋予一个码字,则码表过于庞大。因此,JPEG对码表进行了简化,采用“前缀码(SSSS)+尾码”来表示。前缀码指明了尾码的有效位数B,可以根据DIFF从表中查出前缀码对应的哈夫曼编码。尾码的取值取决于DC系数的差值和前缀码。如果DC系数的差值DIFF大于等于0,则尾码的码字为DIFF的B位原码;否则,取DIFF的B位反码。静态图像压缩国际标准目前三十一页\总数一百三十六页\编于十二点静态图像压缩国际标准使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩,在JPEG有损压缩算法中,使用霍夫曼编码器来减少熵。使用霍夫曼编码器的理由是可以使用很简单的查表(lookuptable)方法进行编码。目前三十二页\总数一百三十六页\编于十二点静态图像压缩国际标准压缩数据符号时,霍夫曼编码器对出现频度比较高的符号分配比较短的代码,而对出现频度较低的符号分配比较长的代码。这种可变长度霍夫曼表可以事先进行定义。目前三十三页\总数一百三十六页\编于十二点表

图像分量为8位时DC系数差值的典型哈夫曼编码表目前三十四页\总数一百三十六页\编于十二点静态图像压缩国际标准交流系数(AC)编码

量化后AC系数的特点是1X64矢量中包含有许多“0”系数,并且许多“0”是连续的,因此使用简单和直观的行程编码(RLE)对它们进行编码。JPEG使用了1个字节的高4位来表示连续“0”的个数,而使用它的低4位来表示编码下一个非“0”系数所需的位数,跟在它后面的量化AC系数的数值。目前三十五页\总数一百三十六页\编于十二点静态图像压缩国际标准

经Z形排列后的AC系数,更有可能出现连续0组成的字符串,从而对其进行行程编码将有利于压缩数据。JPEG将一个非零DC系数及其前面的0行程长度(连续0的个数)的组合称为一个事件。目前三十六页\总数一百三十六页\编于十二点静态图像压缩国际标准将每个事件编码表示为“NNNN/SSSS+尾码”,其中,NNNN为0行程的长度,SSSS表示尾码的有效位数B(即当前非0系数所占的比特数),如果非零AC系数大于等于0,则尾码的码字为该系数的B位原码,否则,取该系数的B位反码。目前三十七页\总数一百三十六页\编于十二点静态图像压缩国际标准由于只用4位表示0行程的长度,故在JPEG编码中,最大0行程只能等于15。当0行程长度大于16时,需要将其分开多次编码,即对前面的每16个0以“F/0”表示,对剩余的继续编码。目前三十八页\总数一百三十六页\编于十二点表AC系数的尾码位数表SSSSAC系数的尾码位数表001-1,12-3,-2,2,33-7~-4,4~74-15~-8,8~155-31~-16,16~316-63~-17,17~637-127~-64,64~1278-255~-128,128~2559-511~256,256~51110-1023~-512,512~1023目前三十九页\总数一百三十六页\编于十二点表

亮度AC系数码表目前四十页\总数一百三十六页\编于十二点续表目前四十一页\总数一百三十六页\编于十二点续表目前四十二页\总数一百三十六页\编于十二点表

色差AC系数编码目前四十三页\总数一百三十六页\编于十二点续表目前四十四页\总数一百三十六页\编于十二点续表目前四十五页\总数一百三十六页\编于十二点静态图像压缩国际标准JPEG图像数据片段

目前四十六页\总数一百三十六页\编于十二点静态图像压缩国际标准FFD8:图像开始标记(SOI),标识压缩数据的开

始,标记是用来标识压缩数据格式中的不同

的结构单元的,所有的标记都是由1个FF字

节和1个不等于0或FF的字节组成的,本文所

分析的标记都是典型且必须的。FFE0:应用数据标记(APP0),标识应用数据段的开

始。0010:应用数据段长度参数(Lp),该参数本身长度为

两个字节,其值表示应用数据段包含的字

数,但是不包括APP0的两个字节,这里长

度为16个字节。目前四十七页\总数一百三十六页\编于十二点静态图像压缩国际标准4A46494600:文件标识符,即JFIF+NUL的ASCII

码。0101:文件版本号,一般为0101或0102。01:表示X和Y的密度单位,值为0,无单位,

值为1,单位为“点数/英寸”,值为2,单位为

“点数/厘米”。0060:表示X轴方向密度。0060:表示Y轴方向密度。目前四十八页\总数一百三十六页\编于十二点静态图像压缩国际标准00:表示缩略图水平像素数目,一般为00。00:表示缩略图垂直像素数目,一般为00。FFD8:定义量化表标记(DQT),标明量化表说

明参数的开始,可能有多个该标记,分

别用来表示量化表0.量化表1....,量化表

n,这里表示量化表0。目前四十九页\总数一百三十六页\编于十二点静态图像压缩国际标准0043:表示长度参数(Ld),该参数本身长度为

两个字节,其值表示量化表包含的字节

数,但是不包括DQT的两个字节,这里

长度为67个字节。目前五十页\总数一百三十六页\编于十二点静态图像压缩国际标准00:前4位为量化表元素精度参数(Pq),值0表示

量化表元素精度为8位,值1表示量化表元素

精度为16位;后4位为量化表目标标识符(Tq)

指定位于解码器中的4个可能目标中的1个用

于安装量化表,这里指定目标0。08060607060508······38323C2E33332:

以上为量化表元素(Qr}共有64个。FFDB:定义量化表标记(DQT},这里表示量化表1。目前五十一页\总数一百三十六页\编于十二点静态图像压缩国际标准2、JPEG2000国际静止图像压缩标准

多媒体应用的发展,对图像压缩技术提出了更高的要求,传统的JPEG已无法满足人们对多媒体图像的进一步需要,主要表现为以下不足:低比特率压缩性能:目前的JPEG标准在中高速比特率的情况下,有较好的率失真性能,但是,当比特率低于0.25bpp时,方块效应显著,视觉失真很大。无损和有损压缩:目前的JPEG标准不能在同一个压缩码流中同时提供无损和有损两种压缩编码方式。目前五十二页\总数一百三十六页\编于十二点静态图像压缩国际标准单一的解码过程:目前的JPEG有44中模式,大部分模式是针对不同的应用提出的,没有通用性,这给交换、传输压缩图像数据带来很大的麻烦。噪声环境下的传输:在噪声环境下,传输JPEG压缩码流产生误码时,图像恢复质量将很差。计算机图形:当前的标准对自然图像的压缩性能较好,但是处理由计算机绘制的图形,其压缩性能变差。复合文档:使用JPEG对包含有文字、图像等内容的复合文档,如HTML等进行压缩,效果不好。目前五十三页\总数一百三十六页\编于十二点静态图像压缩国际标准

另一方面,小波技术日益发展成熟。小波变换的一个最大特点就是能够同时在时域和频域上反映信号的局部特性。图像经过小波变换后,被分解成不同频段的子带,根据人类视觉特性,对不同频段的数据进行粗细不同的量化处理,可达到较好的压缩效果。此外,小波变换快速算法简单、运行速度快,从而,小波技术成为当前图像压缩领域的研究热点,涌现出许多优秀的基于小波变换的图像压缩算法,不仅大大提高了压缩性能,而且还增强了压缩码流的功能。目前五十四页\总数一百三十六页\编于十二点静态图像压缩国际标准综上,随着多媒体技术和网络的发展,原有的图像压缩标准已不能满足应用的需要,同时,基于小波变换的图像压缩算法日益成熟,为新压缩标准的制定提供了解决方案,新一代的图像压缩标准——JPEG2000应运而生。

目前五十五页\总数一百三十六页\编于十二点静态图像压缩国际标准二、JPEG2000图像编码系统和解码系统目前五十六页\总数一百三十六页\编于十二点静态图像压缩国际标准目前五十七页\总数一百三十六页\编于十二点静态图像压缩国际标准三、JPEG2000的关键技术为了实现上述特点,JPEG2000采用多种技术,本文对其中主要的关键技术,如压缩码流的可分级技术,ROI(RegionofInterest)区域处理,随机存取码流数据,码流的容错技术等作以介绍。

目前五十八页\总数一百三十六页\编于十二点静态图像压缩国际标准1、压缩码流的可分级性

许多应用希望解码器能够解码出具有不同质量或者分辨率的图像,为了满足这一要求,JPEG2000图像编码系统采用EBCOT算法思想,使得压缩码流同时具有质量可分级性和分辨率可分级性。图像的可分级压缩编码是指通过编码,可获取多于一个质量级或者分辨率级的图像。目前五十九页\总数一百三十六页\编于十二点静态图像压缩国际标准质量可分级性质量可分级性,也称信噪比(SNR)可分级性,是指解码系统对同一个压缩码流源进行解码,可获得至少两层或两层以上具有相同大小,不同质量的图像。其中,较低层提供基本的图像质量,高层,即增强层,在低层的基础上改善图像质量。目前六十页\总数一百三十六页\编于十二点静态图像压缩国际标准质量可分级性

(a)0.0625bpp(b)0.25bpp图

质量可分级示意图目前六十一页\总数一百三十六页\编于十二点静态图像压缩国际标准分辨率可分级性

分辨率可分级性,也称空间可分级性,是指解码系统对同一个压缩码流源进行解码,可获得至少两层或两层以上具有不同大小的图像。其中,较低层提供基本的图像分辨率,高层即增强层在低层的基础上增加图像的分辨率。目前六十二页\总数一百三十六页\编于十二点静态图像压缩国际标准分辨率可分级性(a)分辨率级为0级(b)分辨率级为1级图

分辨率可分级示意图目前六十三页\总数一百三十六页\编于十二点静态图像压缩国际标准2、感兴趣区域处理(ROI,RegionofInterest)在处理图像时,通常,我们只对其中的部分区域感兴趣,对这样的区域往往有较高的质量要求,有时甚至希望是无损压缩,称此区域为ROI区域。为了得到较高的压缩效率,我们可把图像的其他部分看成是背景,分配较少的比特数,而给ROI区域分配较多的比特数。在传输图像的压缩码流时,ROI区域可先于图像的其他部分被传输,如果压缩码流被截取,则在一定程度上可保证ROI的质量。目前六十四页\总数一百三十六页\编于十二点静态图像压缩国际标准感兴趣区域处理

(a)0.0625bpp(b)0.25bpp

(c)0.5bpp(d)2.0bppROI区域编码示意图目前六十五页\总数一百三十六页\编于十二点静态图像压缩国际标准3、抗误码性能通常,无线通讯信道上有很大的噪声干扰,往往会形成随机的或者迸发性的比特错误。在互联网上,由于堵塞也会产生丢失数据包的错误。因此,要求在这种环境中传输的数据码流具有较强的容错性。在JPEG2000标准中,采取了一些措施,来提高图像压缩码流的抗误码性能。分块编码:对量化后的子带系数分成若干个小的编码单元——码块,对每个码块进行独立的编解码。这样,当一个码块的位流发生比特错误时,只会把错误引起的影响限制在本码块中,不会造成误码的传播。目前六十六页\总数一百三十六页\编于十二点静态图像压缩国际标准算术编码的终止处理:在进行嵌入式码块编码时,允许算术编码器在每个编码通道上终止,重新初始化上下文。这样,解码器发现错误时,可终止该编码通道的解码,对后面的编码通道位流继续执行正确的解码过程。压缩码流格式中的抗误码处理:在形成最终的压缩码流时,采用了称为包(packet)的结构单元,用来存放压缩位流数据。每个包的数据前面含有再同步信息标志,允许发生错误后重新恢复同步。目前六十七页\总数一百三十六页\编于十二点数字视频压缩标准MPEG数字视频压缩标准视频数据的特点镜头的时间冗余特性;图像的空间冗余特性;人眼的视觉冗余特性。视频压缩编码的出发点

基于块的运动估计以消除时间冗余;基于变换的方法以是能量更加集中;针对性的量化方法视觉冗余特性;基于频谱重排以消除统计冗余。目前六十八页\总数一百三十六页\编于十二点数字视频压缩标准一、MPEG-1视频压缩标准

MPEG-1是由ISO/IEC于1991年提出的,正式名称为“用于数字存储媒体的1.5Mbit/s以下的活动图像及相关音频编码”(ISO/IEC11172)。其中的数字存储媒体包括光盘(CD),视频光盘(VCD),其中分配比特的方案是在1.5Mbps的数据传输中1.2Mbps用于编码视频,256Kbps用于立体声。目前六十九页\总数一百三十六页\编于十二点数字视频压缩标准MPEG-1包括五个部分:系统、视频、音频、一致性、及软件。在MPEG-1只采用逐行扫描方式,采用4:2:0的亚采样格式,其源输入格式是SIF,有352x288x25

352x288x30

两种格式。目前七十页\总数一百三十六页\编于十二点MPEG数字视频压缩标准1、MPEG-1编码器原理

目前七十一页\总数一百三十六页\编于十二点MPEG数字视频压缩标准MPEG-1采用两种压缩方法:帧内压缩算法:采用与JPEG压缩算法大致相同的方法,即基于DCT的变换编码技术,用以减少空间冗余信息。帧间压缩算法:采用运动补偿算法、预测编码方法、以及差补法等编码方法。帧间编码技术可以减少时间冗余信息。

目前七十二页\总数一百三十六页\编于十二点MPEG数字视频压缩标准2、MPEG-1视频帧的定义

目前七十三页\总数一百三十六页\编于十二点6.3MPEG数字视频压缩标准

3、MPEG-1码流结构

目前七十四页\总数一百三十六页\编于十二点6.3MPEG数字视频压缩标准视频帧的重排

目前七十五页\总数一百三十六页\编于十二点MPEG数字视频压缩标准例题:1、MPEG-1编码时三种类型图像(I帧、P帧和B帧)的关系为:IBBBPBBBPBBB,请排列出编码器实际的编码图像顺序。

目前七十六页\总数一百三十六页\编于十二点MPEG数字视频压缩标准3、MPEG-1视频压缩编码算法在MPEG-1编码中,为了支持随机访问与高效压缩的要求,定义了三种编码类型:I帧图像编码(帧内图像)、P帧图像编码(预测图像)、B帧图像编码(差补图或双向预测图像)。

D帧图像编码(直流分量图像)这三种类型的帧按某种方式组织在一起就构成了GOP。目前七十七页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

目前七十八页\总数一百三十六页\编于十二点MPEG数字视频压缩标准I帧图像的编码

I帧图像是利用图像的空间相关性进行压缩,其压缩编码采用类似JPEG压缩算法,同时I帧图像又是P帧图像和B帧图像的参考图像,所以I帧图像压缩率不高,压缩倍数在8倍左右。

目前七十九页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

帧内图像I不参照任何过去的或者将来的其它图像帧,压缩编码采用类似JPEG压缩算法:如果电视图像是用RGB空间表示的,则首先把它转换成YCrCb空间表示的图像。每个图像平面分成8×8的图块,对每个图块进行离散余弦变换DCT。DCT变换后经过量化的交流分量系数后进行Z扫描,然后再使用无损压缩技术进行编码。目前八十页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

DCT变换后经过量化的直流分量系数采用差分脉冲编码DPCM,交流分量系数采用游程编码RLE,然后再采用霍夫曼(Huffman)编码或者用算术编码。具体算法如前面介绍的JPEG时所述,它的编码框图下图所示

目前八十一页\总数一百三十六页\编于十二点MPEG数字视频压缩标准I帧编码目前八十二页\总数一百三十六页\编于十二点MPEG数字视频压缩标准P帧图像的编码

P帧图像是参考过去的I帧图像(帧内图像)或者过去的预测得到P帧图像用运动补偿预测技术进行编码,这些预测图像通常作为进一步预测的参考帧,预测图像的编码效率较高。

目前八十三页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

P帧图像的编码也是以图像宏块为基本编码单元。预测编码的基础是运动估值,它将直接影响到整个系统的编码效率和压缩性能,因此希望找到一种预测精度高同时计算量又小的运动估值算法。

目前八十四页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

目前八十五页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

P帧编码目前八十六页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

P帧编码时,编码器需要对每一个宏块作以下选择:(1)决定是否作运动补偿(MC/No-MC),即是将

运动矢量发送出去,还是设其为0。在许多

情况下,使用非零的运动矢量并不比使用零

值的运动矢量所形成的误差少多少。而非

零运动矢量需要额外的编码比特,因此这

时可设运动矢量为0,这样可以提高编码效

率。目前八十七页\总数一百三十六页\编于十二点MPEG数字视频压缩标准(2)决定采用帧内编码还是帧间编码,即是采

用帧内宏块编码还是利用运动矢量预测编

码。在许多情况下,某些宏块采用帧内编

码方式也许会用更少的比特。这通常发生

在由于运动十分剧烈而导致运动估计失败

的情况。目前八十八页\总数一百三十六页\编于十二点MPEG数字视频压缩标准(3)决定宏块要不要编码。有时在量化后,宏

块中所有的DCT系数都是0,这种宏块就不

需要被编码。在对这种宏块解码时,只需

要从过去的帧中把对应的宏块复制到这个

宏块就行了。(4)决定量化等级是否符合要求,是否需要改

变。目前八十九页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

B帧图像的编码

B帧图像(或称双向图)在预测时,既可使用前向预测方式,也可使用后向预测方式,或同时使用双向预测后取平均方式(双向帧间预测),取决于哪一种方式下表示该宏块所需的信息量为最少。使用双向预测后,可以使那些在前一帧中预测不到的内容很好地在后一帧中预测到,而且通过预测后取平均,非常有效地减少了预测噪声的影响。它的压缩效率最高,但双向预测图像不作为预测的参考图像。目前九十页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

B帧编码目前九十一页\总数一百三十六页\编于十二点MPEG数字视频压缩标准类似于P帧,B帧在编码前同样要作一系列的决定,其流程如下:(1)决定运动补偿模式,即前向,后向及插值

运动补偿中哪个能达到最佳。

宏块运动补偿模式的选择是基于代价函数的最小值。代价函数是运动补偿宏块和当前宏块的亮度差的均方误差。解码器通过一种简单的方法为前向运动补偿计算最佳运动补偿宏块。然后再为后向运动补偿计算最佳运动补偿宏块。最后再求两种运动补偿宏块的均值,从而产生宏块的插值。然后再选择它与当前宏块均方误差最小的方式。如果找不出最小值,就选取宏块插值方式。目前九十二页\总数一百三十六页\编于十二点MPEG数字视频压缩标准(2)决定采用帧内/帧间编码。即宏块类型是帧内编码还是使用运动矢量作运动补偿编码。计算方法和P帧的类似,解码器计算差分宏块和当前宏块的变化。如果两者的变化相同则选择非帧内编码(参考该节的流程序图分析)。目前九十三页\总数一百三十六页\编于十二点MPEG数字视频压缩标准(3)如果宏块类型是非帧内宏块,则要决定这

个宏块是否编码,即残差是否大得足以采

用DCT变换。解码器根据量化的结果选择编

码与否,当所有量化系数都为零时,则这个

块不用编码.如果宏块中没有编码的块,则

这个宏块不需编码,否则该宏块需要编

码。(4)决定量化尺寸是否满足要求,是否需要改

变尺寸。目前九十四页\总数一百三十六页\编于十二点MPEG数字视频压缩标准D帧编码D帧图像只包含有直流分量的图像,也称为直流图像,它是专门为快速播放和快速检索功能而设计的,但由于它不能作为其它帧的预测帧,一次使用不多。目前九十五页\总数一百三十六页\编于十二点MPEG数字视频压缩标准二、MPEG-2视频压缩标准

MPEG-2标准的发展始于1990年,其正式名称为“通用活动图像及其伴音编码”(ISO/IEC13818)。MPEG-2是一个通用多媒体编码标准,具有更为广阔的应用范围和更高的编码质量,其应用范围包括数字储存,高清晰数字电视,高质量视频通信。根据应用不同,MPEG-2的码率范围为1.5~100Mbit/s。一般情况下,只有码率超过4Mbit/s的MPEG-2视频,其质量才能明显优于MPEG-1。

目前九十六页\总数一百三十六页\编于十二点MPEG数字视频压缩标准根据其档次与级别的不同,MPEG-2支持分辨率由高到低的多种图像类型,支持三种采样格式,即4:2:0、4:2:2、4:4:4。可采用逐行扫描方式也可采用隔行扫描方式。MPEG-2采用不同档次与级别共20中组合,选取其中11中作为应用选择。目前九十七页\总数一百三十六页\编于十二点MPEG数字视频压缩标准MPEG-2目前九十八页\总数一百三十六页\编于十二点MPEG数字视频压缩标准在应用方面与MPEG-1的不同之处在于,MPEG-1是为一台计算机的CD上以较低的码率存储和播放视频而定制的。MPEG-2用于高于4Mbps的码率的存储和播放更高质量的视频。MPEG-2标准制定初衷是为高清数字电视HDTV标准而开发的并可以用于其他方面。目前九十九页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

从某种程度上来说,MPEG-2可视为一组MPEG-1的最高级编码标准,但其编码流程从本质上与MPEG-1是相同的。MPEG-2与MPEG-1编码的相同点:I-帧编码模式相同,都是采用8×8的DCT

变换;2)P以及B帧都是采用半象素的运动补偿;3)编码MV时所用的预测方法相同。目前一百页\总数一百三十六页\编于十二点MPEG数字视频压缩标准MPEG-2与MPEG-1编码的不同点:1、MPEG1只处理逐行扫描的序列,而MPEG2的目

标时支持高分辨率的隔行扫描的序

列(BT.601=4CIF)2、更先进的运动估计方法(帧/场预测模式)

以提高隔行扫描序列的运动估计精度3、针对隔行扫描序列开发了不同的DCT模式和

扫描方法4、MPEG2具有各种模式的可伸缩性5、MPEG2具有不同级别和层次的方法,每个方

法均可用于不同的应用。

目前一百零一页\总数一百三十六页\编于十二点MPEG数字视频压缩标准目前一百零二页\总数一百三十六页\编于十二点MPEG数字视频压缩标准MPEG-2编码模式基于帧的编码基于场的编码目前一百零三页\总数一百三十六页\编于十二点MPEG数字视频压缩标准DCT扫描模式Zig-Zag扫描模式交错扫描模式:更加注重利用水平方向的

相关性。因为隔行扫描其

水平方向相关性较强。目前一百零四页\总数一百三十六页\编于十二点MPEG数字视频压缩标准MPEG-2中可伸缩的编码(ScalableVideoCoding)

WhyweneedSVC?MPEG-2的应用(数字广播、HDTV、DVD)码率不同、不同用户、需求不同目前一百零五页\总数一百三十六页\编于十二点MPEG数字视频压缩标准MPEG-2中可伸缩的编码

(1)SNR可伸缩(2)空间可伸缩(3)时间可伸缩(4)混合可伸缩目前一百零六页\总数一百三十六页\编于十二点MPEG数字视频压缩标准SNR可伸缩和空间可伸缩目前一百零七页\总数一百三十六页\编于十二点MPEG数字视频压缩标准数据分割:一个基本层和多个增强层基本层可通过独立编码、传输和解码获得基本

的传输质量;增强层的编码和解码依赖于基层及其之前的增

强层目前一百零八页\总数一百三十六页\编于十二点MPEG数字视频压缩标准目前一百零九页\总数一百三十六页\编于十二点MPEG数字视频压缩标准三、MPEG-4视频压缩标准MPEG-4标准于1999年发布。它不仅针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。这个标准主要应用于视像电话、视像电子邮件等,对传输速率要求较低,在4800-6400bit/s之间,分辨率为176×144。目前一百一十页\总数一百三十六页\编于十二点MPEG数字视频压缩标准MPEG-4利用很窄的带宽,通过帧重建技术、数据压缩,以求用最少的数据获得最佳的图像质量。利用MPEG-4的高压缩率和高的图像还原质量可以把DVD里面的MPEG-2视频文件转换为体积更小的视频文件。经过这样处理,图像的视频质量下降不大,但数据可缩小几倍,可以很方便地用CD-ROM来保存DVD上的数据。

目前一百一十一页\总数一百三十六页\编于十二点MPEG数字视频压缩标准1、MPEG-4标准目标(1)专门用于64kbps以下甚低码率的音视频

编码(高压缩率)(2)适用于移动通讯、个人通讯、固定公用

通讯网和电视电话(质量可调性)(3)提供互动性,基于内容的编码2、MPEG-4视频编码的特点(1)基于对象的编码(音视频对象A/VO)(2)提供互动性(3)自然视频于计算机生成媒体的整合

目前一百一十二页\总数一百三十六页\编于十二点MPEG数字视频压缩标准目前一百一十三页\总数一百三十六页\编于十二点MPEG数字视频压缩标准

MPEG-4以对象为基本编码单位,对一系列VOP的纹理、形状和运动信息进行编码。首先编码器的对象分割单元分析输入视频,按照方法把视频分割成多个VO,然后

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论