




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 多媒体数据压缩编 码技术3.1 多媒体数据压缩编码的重要性和分类3.2 量化3.3 统计编码3.3 预测编码3.5 变换编码3.6 多媒体数据压缩编码的国际标准本章重点介绍1.统计编码、预测编码和变换编码的原理2.多媒体数据压缩编码的国际标准 JPEG3.多媒体数据压缩编码的国际标准 MPEG3.1 多媒体数据压缩编码的 重要性和分类3.1.1 多媒体数据压缩编码的重要性3.1.2 多媒体数据压缩的可能性3.1.3 多媒体数据压缩方法的分类3.1.1 多媒体数据压缩编码 的重要性多媒体技术最大难题是海量数据存储与传送电视信号数字化后的数据量。信息量与数据量的关系 I = D + duI
2、 信息量D数据量du冗余量1. du在平时说话时是大量存在的。2. 中文百科全书扫描进入计算机冗余更大。3. 图像信息、视频信息的冗余就更大了。3.1.2 多媒体数据压缩的可能性1.空间冗余规则物体和规则背景的表面物理特性具有相关性。例: 图象中的“A”是一个规则物体,光的亮 度、饱和度及颜色都一样具有规则,因此,数据A有很大的冗余。 2.时间冗余 3.信息熵冗余(编码冗余)信息量: 指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。信息熵:指一团数据所带的信息量,平均信息量就是信息熵(entropy)。 4.结构冗余 图象有非常强的纹理结构。 如草席图结构上存在冗余。5.知识冗余
3、图像的理解与某些基础知识有关。 例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上 6.视觉冗余 视觉冗余是非均匀、非线性的,视觉系统并不能对于图像的任何变化都有所感知。 7.其他冗余 图象空白的非定长性。 3.1.3 多媒体数据压缩方法 的分类 按编码算法原理分: (1) 预测编码 (2) 变换编码 (3) 量化与向量量化编码 (3) 信息熵编码 (5) 子带编码 (6) 结构编码 (7) 基于知识的编码多媒体数据编码分类PCM:脉冲编码调制 多媒体数据压缩方法根据不同的依据产生不同的分类: 根据质量有无损失有损失编码和无损失编码(不可逆编码和可逆编码); 按照其作用域
4、在空间或频率上空间方法,变换方法和混合方法; 根据是否自适应自适应性编码和非适应性编码。按压缩方法分: 有失真压缩、 无失真压缩1脉冲编码调制PCM脉冲编码是连续模拟信号的数字采样表示。若量化器为N级,N=2b ,则每一个采样用b位的二进制代码表示。信号的量化中,每一色彩分量一般用8位表示。脉冲编码调制编码器和解码器位于一个图像编码系统的起点(A/D转换器)和终点(D/A转换器2预测编码DPCM编码器记录与传输的不是样本的真实值,而是它与预测值的差差值脉冲编码调制方法。预测值由欲编码图像信号的过去信息决定。本方法通常采用线性预测,比例系数由统计特性估计得到。预测不仅可以在相邻像素值之间进行,还
5、可以在行与行之间进行。由于真实值与预测值的差值变化远远小于真实值的变化范围,因而可采用较少的位数来表示。如果利用人的视觉特性对差值进行非均匀量化,能够获得更高的压缩比。3变换编码利用图像块(矩阵)的像素值之间的相关性,把图像变换到一组新的域上,使得能量集中到少数几个变换系数上,通过存储这些系数达到压缩的目的。本方法采用对整幅的原始图像分成许多个矩形区域子图像独立进行变换。常用变换有: 卡亨南洛维变换(KLT) 离散余弦变换(DCT) 沃尔什哈达玛变换(WHT) 离散傅里叶变换(DFT)。4统计编码哈夫曼(Huffman)编码(统计编码最常用的一种)。对于出现频率大的符号用较少的位数来表示;对于
6、出现频率小的符号用较多的位数来表示。其编码效率主要取决于需编码的符号出现的概率分布,越集中则压缩比越高。算术编码每一符号对应0,1上的一子区间,区间长度为该符号出现的概率。算术编码的优点是可方便地使用自适应编码,可以根据当前接收的数据不断地更改概率模型。5混合编码合并变换和预测技术的编码方法。在某一方向上进行酉变换,而在另一方向上采用DPCM对变换系数进行预测编码。对动态图像而言,采用二维变换加上时间方向上的DPCM预测。3.2 量 化3.2.1 量化原理3.2.2 标量量化器的设计3.2.3 矢量量化量化指模拟信号到数字信号的映射。量化操作:实质上是用有限的离散量代替无限的连续模拟量的多对一
7、映射操作。3.2.1量化原理将一个连续性的一批数值集合,量化到一个输出值上。如:256图像灰度值是连续的,而我们 通常使用和看到的是用0255之间的整数表示的图像灰度,即:0255级。 这样可以用log2256=8比特表示一个图像像素的灰度值,或色差信号值量化原理 量化原理:是使数据比特率下降的一个强有力的措施。 量化输入值动态范围很大,需要以多比特数表示一个数值,量化输出只能取有限个整数,称量化级。每个量化输入被强迫归一到与其接近的某个输出,即量化到某个级。量化处理总是把一批输入量化到一个输出级上,所以量化是个多对一的处理过程,量化中有信息丢失,或者说,会引起量化误差(量化噪声)。 数据压缩
8、编码中的量化不是指A/D变换后的量化,而是指以PCM(脉冲编码调制)码作为输入,经正交变换、差分或预测处理后,在熵编码前,对正交系数、差值或预测误差的量化处理。 PCM编码:模拟量经过A/D转换,得到二进制码的过程,就是脉冲编码调制(PCM)编码过程,也称PCM编码。3.2.2标准量化器的设计1.量化器的设计要求设计量化器的两种情况:给定量化分层级数,满足量化误差最小;限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。2量化方法和量化特性W1 W2 W3 W4 W5 W6 W7 W8(-255255)点数灰度差W1 W2 W3 W4 W5 W6 W7 W8(a)图(b)图(c
9、)图3.2.3矢量量化矢量量化编码是近年来图像语音信号编码技术中流行的一种新型量化编码方法。矢量量化编码方法一般是有失真编码方法。对于PCM数据,一个数一个数地进行量化叫标量量化。对于数据分组,每组K个数构成一个K维矢量,然后以矢量进行量化,称矢量量化。矢量量化可以更有效地提高压缩比。 矢量量化 *量化的关键问题是设计一个良好的码本*矢量量化编码、解码框图编码搜索输入矢量发送端码本C传输矢量下标ii查表码本C输出矢量接收端33 统计编码3.3.1 统计编码原理信息量和 信息熵3.3.2 哈夫曼(Huffman)编码3.3.3 算术编码根据信息论的原理,可以找到最佳数据压缩编码方法,数据压缩的理
10、论极限是信息熵(一组数据所携带的信息量)。熵编码要求在编码过程中不丢失信息量,即要求保存信息熵,这种信息保存编码又叫熵保存编码。熵编码是无失真数据压缩。用这种编码结果经过解码后可无失真地恢复原图像。3.3.1统计编码原理信息量和信息熵为什么要引入信息熵?信息熵与图像的概率分布和信息量之间有何关系?就下面信源编码模型可以说明问题。 编码器信源(消息集)编码输出集X=x1,xnZ=z1,zn符号集Am=a1,amX:是消息集,由几个信号单元xj构成(j=1,2,.n)Z:是输出集,由几个码字zj构成(j=1,2,n),zj与xj一一对应。Am 是符号集,由m个码元 ai构成( i=1,2,m),符
11、号集中的码元组成输出码字。当信源发出某个随机事件(消息)xj后,接收端收到一个相应的码字zj,从数量上说,所收到的码字中包含有多少可用的信息量是不确定的。 概念 1. 信息:是用不确定性的量度定义的。2. 信息量:从N个相等可能事件中选出一个 事件所需要的信息度量或含量。3. 熵:如果将信源所有可能事件信息量进行平均就得到信息的熵(熵就是平均 信息量)。信息量信息量指从N个相等可能事件中选出一个事件所需要的信息含量。信息是用不确定性的度量定义的。一个消息的可能性愈小,其信息愈多;反之,消息的可能性愈大,信息愈少。在数学上,所传输的消息是其出现概率的单调下降函数。 举例:确定一个在一组数之中的数
12、例如:从63个数中选出某一个数,可先问“是否大于32?”消除半数的可能,这样只要6次就可选出某数。这是因为每提问一次都会得到1比特的信息量。因此,在63个数中选定某一数所需的信息量是log2 63=6(bits) 。设从N个数中选任意一个数X的概率为P(x),假定选定任意一个数的概率都相等, P(x)= 1/N,因此定义信息量I(x)=log2N= -log2(1/N)= -log2P(x)=IP(x)信息论定义一种度量信息量的方法为:I(xj) =-log2 P(xj) 信息熵信息熵:指一团数据所带的信息量,平均信息量就是信息熵(entropy)。如果将信源所有可能事件的信息量进行平均,就得
13、到了信息熵(entropy)。熵就是平均信息量。信息源的符号集为 Xj (j=1,2,3.N)设X出现的概率为P(xj),则信息源X的熵为 H(X)=P(xj) log2 P(xj)3.3.2哈夫曼(Huffman)编码最佳编码定理:在变字长码中,对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码,如果码字长度严格按照符号概率的大小的相反顺序排列,则平均码字长度一定小于按任何其他符号顺序排列方式得到的码字长度。 Huffman编码就是利用这个定理,把信源符号按概率大小顺序排列,并设法按逆次序分配码字长度。 Huffman编码的方法(1) 把信源符号按概率大小顺序排列
14、,并设法按逆次序分配码字的长度。(2) 在分配码字长度时,首先将出现概率最小的两个符号的概率相加合成一个概率。(3) 把这个合成概率看成是一个新组合符号地概率,重复上述做法直到最后只剩下两个符号概率为止。(3) 完成以上概率顺序排列后,再反过来逐步向前进行编码,每一次有二个分支各赋予一个二进制码,可以对概率大的赋为0,概率小的赋为1。Huffman 编码字长参差不齐Huffman编码在信源编码概率分布不均匀时效率高,所以效率比较均匀时,不用Huffman编码。好处:解决对称性,降低了编码时间。概率统计和Huffman编码一般不对称。 举例说明举例说明 4 X0.25 0.250.20 0.15
15、 0.10 0.05对其进行编码,写出其码树、码长,并计算平均码长。符号 概率 编码过程 编码X1 0.25 01X2 0.25 10X3 0.20 11X3 0.15 000X5 0.10 0010X6 0.05 0011所以码长分别为:2,2,2,3,4,4。平均码长为2.83几个问题值得注意1.霍夫曼码没有错误保护功能;2.霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码;3.接收端需保存一个与发送端相同的霍夫曼码表。3.3.3 算术编码20世纪60年代初,E1ias提出了算术编码概念。1976年,Bissanen和Pasco首次介绍了它的实用技术。算术编码在图
16、像数据压缩标准(如JPEG,JBIG)中扮演了重要的角色。在算术编码中,消息用0到1之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。基本思路 用一个浮点输出数值代替一个流的输入符号 把要压缩的整段数据映射到一段实数半开区间0,1)内的某一区段,然后构造出小于l且大于或等于0的一个数值,这个数值就是对该输入流进行压缩编码后的输出代码。 例如:可将输入字符流“eai”映射到区间0.23,0.236),然后取该区间的任一个数,如0.23,作为
17、该输入字符流的编码。基本原理将编码的信息表示成实数0和1之间的一个间隔,信息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。算法举例 假设信源符号为00, 01, 10, 11,这些符号的概率分别为 0.1, 0.4, 0.2, 0.3 ,根据这些概率可把间隔0, 1)分成4个子间隔:0, 0.1), 0.1, 0.5), 0.5, 0.7), 0.7, 1),二进制消息序列的输入为:10 00 11 00 10 11 01算法举例算术编码算术编码是一种二元码的编码方法。在不考虑信源统计的情况下,只要监视一小段时间内码出现的频率,不管统计是平稳的或非平稳的,编码的码率总能趋近于
18、信源熵值,每次迭代时的编码算法只处理一个数据符号,并且只有算术运算。设编码初始化子区间为0,1),Qe从0算起,则Pe=1-Qe。随着被编码数据流符号的输入,子区间逐渐缩小。 新子区间的起始位置=前子区间的起始位置+当前符号的区间左端前子区间长度;新子区间的长度=前子区间的长度当前符号的概率(等价于范围长度);最后得到的子区间的长度决定了表示该区域内的某一个数所需的位数。算术编码在编、译码的过程中,子区间的起始位置和长度值的小数点后的位数越来越长,实际中无法实现。因此较实用的改进算法是限制小数点后的位数例如:已知信源0 1X 0.250.75试对1011进行算术编码LPS 0 Qe0.25,M
19、ps 1 Pe=0.75设C为子区间的左端起始位置,L为子区间的长度, 则符号“0”有 C0,L0.25 符号“1”有 C0.25,L0.75LPS:C=C,L=L*0.25Mps:C=C+L*0.25,L=L*0.75初始区间为0,1),算法编码如下:步序 符号 C L 1 1 0.25 0.75 2 0 0.25 0.75*0.25 3 1 0.25+0.1875*0.25 0.1875*0.75 4 1 0.3375+0.1306*0.25 0.013*0.75最后的子区间左端起始位置C(0.332)d=(0.01010101) b最后的子区间长度L(0.10536875)d=(0.01
20、11) b编码取值为0.011可编码为011在算术编码中需要注意的几个问题:1.由于实际计算机精度不可能无限长,运算中溢出是明显的问题,但多数机器都有16位、32位或者64位的精度,因此可使用比例缩放法解决。 2.算术编码器对消息只产生一个码字,这个码字是在0, 1)中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。 3.算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。算术编码 算术编码可以是静态的或者自适应的。在静态算术编码中,信源符号的概率是固定的。在自适应算术编码中,信源符号的概率根据编码时符号出现的频繁程度动态地进行修改,在编码期间估
21、算信源符号概率的过程叫做建模。需要开发算术编码的原因是因为事先知道精确的信源概率是很难的,而且是不切实际的。当压缩消息时,我们不能期待一个算术编码器获得最大的效率,所能做的最有效的方法是在编码过程中估算概率。因此动态建模就成为确定编码器压缩效率的关键。特点:不必预先定义概率模型,自适应模式具有独特的优点;信源符号概率接近时,建议使用算术编码,这种情况下其效率高于Huffman编码。算术编码实现方法复杂一些,但JPEG成员对多幅图像的测试结果表明,算术编码比Huffman编码提高了5%左右的效率,因此在JPEG扩展系统中用算术编码取代Huffman编码。3.3 预测编码3.3.1 预测编码的基本
22、原理3.3.2 DPCM 和ADPCM3.3.3 帧间预测编码3.3.1预测编码方法基本原理 从相邻数据之间由强的相关性特点考虑,可以利用前面已经出现的数值,进行预测(估计),得到一个预测值,将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法即成为预测编码方法。DPCM基本原理转入f(i,j)e(i,j)量化器预测器预测器编码器解码器信道传输e(i,j)f(i,j)输出f(i,j)f(i,j)f(i,j)f(i,j)预测编码 不带量化器的DPCM线性预测编码,属于无失真编码系 统;带有量化器的DPCM线性预测编码,属于有失真编码系统。 最佳量化器的设计,可利用人眼的视觉可见度阈值
23、和视觉掩蔽效应等生理特征,来确定量化器的级数和步距,使量化误差总处于人眼难以觉察的范围内,达到主观评定准则的要求。3.3.2自适应预测编码ADPCM 自适应技术的概念是:预测器的预测系数和量化器的量化参数,能够根据图像的局部区域分布特点自动调整。 实践证明,ADPCM编、解码系统与DPCM编、解码系统相比,不仅能改善恢复图像的评测质量和视觉效果,同时还能进一步压缩数据。 ADPCM系统包括自适应预测,即预测系数的自适应调整和自适应量化,即量化器参数的自适应调整两部分内容。3.3.3 帧间预测编码条件补充法运动补偿法均方误差MSE平均绝对帧差MAD3.5变换编码3.5.1 变换编码的基本原理3.
24、5.2 K-L变换3.5.3 离散余弦变换(DCT变换)3.5.1 变换编码的基本原理利用图像块像素值之间的相关性,把图像变换到一组新的基上,使得能量集中到少数几个变换系数上,通过存储这些系数达到压缩的目的。本方法采用对整幅的原始图像分成许多个矩形区域子图像独立进行变换。常用变换有: 卡亨南洛维变换(KLT) 离散余弦变换(DCT) 沃尔什哈达玛变换(WHT) 离散傅里叶变换(DFT)。基本原理图子块 1子块 2子块 n.正变换滤波量化编码信道解码逆变换综合拼接源图像(发送)恢复图像(接收)变换编码沃尔什(Walsh)变换傅立叶(Fouries)变换离散正弦(DST)变换离散余弦(DCT)变换
25、哈尔(Haar)变换斜(Slant)变换K-L(Karhunen-Loeve)变换小波(Wavelet)变换3.5.3 离散余弦变换(DCT变换)DCT变换使用下式计算逆变换使用下式计算3.6多媒体数据压缩的国际标准3.6.1 静态图像压缩标准JPEG3.6.2 MPEG3.6.1 静态图像压缩标准JPEG内容:1、 JPEG标准的主要内容2、 JPEG静态图像压缩算法JPEG标准的主要内容JPEG 是 Joint Photograph Experts Group的缩写,这是一个在1986年CCITT和ISO联合成立的一个图像专家组。JPEG标准即多灰度连续色调静态图像压缩编码,这是一个适用于
26、彩色和单色多灰度或连续色调静止数字图像的压缩标准。JPEG压缩算法具有如下特点:1)参数化解码器,可大范围调节压缩质量比;2)适应于任何连续色调图像;3)硬件要求低;3)有四种工作模式: a.基于DPCM (空间线性预测技术)的无失真算法 b.顺序编码 c.累进编码 d.分层编码JPEG标准选定ADCT作为静态图像压缩的标准化算法。该算法包含以下两种方式: (1)DCT方式(非可逆编码),包含基本系统(必须保证的功能)和扩展系统(扩充功能);(2)空间方式(可逆编码)。JPEG标准有两大分类:第一类方式以DCT(离散余弦变换)为基础;第二类方式以二维空间DPCM(线性空间预测编码)为基础。在D
27、CT方式中,又分为基本系统和扩展系统两类基本系统是实现DCT编码与解码所需的最小功能集,大多数的应用系统只要用此标准,就能基本上满足要求。扩展系统是为了满足更为广阔领域的应用要求而设置的。另一方面,空间方式对于基本系统相扩展系统来说,被称为独立功能。2、JPEG静态图像压缩算法1.)基于DPCM的无失真压缩算法 2.)基于DCT的有失真压缩编码3.)基于DCT的累进操作方式编码 3.)基于DCT的分层操作方式1.基于DPCM无失真压缩算法基于DPCM的无失真编码中,为了满足无失真压缩的需要,JPEG选择一个简单的预测编码。优点: 硬件易实现,重建图像质量好缺点: 压缩比太低,大约为2:1预测器
28、的工作原理是对X的预测值, 将X- 进行无失真熵编码。熵编码器采用Huffman编码或算术编码。2.基于DCT的有失真压缩编码基于DCT压缩编码算法包括两种不同的系统,即基本系统和增强系统。增强系统是基本系统的扩充。基于DCT编码其压缩比:10:1100:1。在压缩比小于30:1的情况下,压缩后还原得到的图象与原始图象相比较,主观效果几乎一样,因此得到了广泛的应用。基于DCT编码器的工作原理框图表示了图像中一个单分量信号(Y,U,V)的压缩过程。基于DCT的有失真压缩编码基于DCT的JPEG压缩算法,对中等复杂程度压缩效果的评价:基于DCT编码的关键步骤为:第一步:分割子块第二步:对子块进行正
29、向离散余弦变换FDCT;第三步:对获得的DCT系数进行量化处理;第四步:DC系数差分编码、AC系数行程编码;第五步:熵编码。基于DCT编码的关键步骤第一步分割子块把原始图像顺序分割成88子块;子块:8 8 象元,特点:象元间变化平缓,相关性高基于DCT编码的关键步骤第二步正向离散余弦变换 对每个单独的彩色图像分量,把整个分量图像分成88的图像块,如图所示,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。DCT变换使用下式计算逆变换使用下式计算基于DCT编码的关键步骤第三步量 化对于有损压缩算法,JPEG算法使用如图所示的均匀量化器进行量化,量化步距是按照系数所在
30、的位置和每种颜色分量的色调值来确定。 量化表 因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。此外,由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。基于DCT编码的关键步骤第四步DC系数编码和AC系数ZIGZAG编码熵编码可分成两步进行,先把DC码和行程码转换为中间符号序列,然后给这些符号赋以变长码字。 JPEG建议的熵编码是Huffman编码和自适应二进制算术编码。基于DCT编码的关键步骤第五步 使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。 在JPEG有损压缩
31、算法中,使用霍夫曼编码器来减少熵。使用霍夫曼编码器的理由是可以使用很简单的查表(lookup table)方法进行编码。压缩数据符号时,霍夫曼编码器对出现频度比较高的符号分配比较短的代码,而对出现频度较低的符号分配比较长的代码。这种可变长度的霍夫曼码表可以事先进行定义。基于DCT的有失真压缩编码算法总结DCT变换子块分割差分编码 量 化 行程编码 熵编码3.基于DCT的累进操作方式编码 基于DCT的累进操作方式编码方法基本与顺序方式一致。不同的是,累进方式中每个图像分量的编码要经过多次扫描才完成。第一次扫描只进行一次粗糙图像的扫描压缩,以相对于总的传输时间快得多的时间传输粗糙图像,并重建一帧质
32、量较低的可识别图像,在随后的扫描中再对图像作较细的压缩,这时只传递增加的信息,可重建一幅质量提高一些的图像。这样不断累进,直到满意的图像为止。有两种累进方式:(1)频谱选择法: 一次扫描中,只对63个DCT变换系数中某些频带的系数进行编码、传送,在随后的扫描中,对其他频带编码、传送,直到全部系数传送完毕为止;(2)按位逼近法: 沿DCT量化系数有效位方向分段累进编码。如第一次扫描只取最高有效位的”位编码、传送,然后对其余位进行编码、传送;扫描分段依次为7653位,3位,.,0位。在必须使用低分辨率的设备来存取或观察高分辨率图像的应用中,分层操作方式很有效。所谓的分层方式,即将一幅原始图像的空间
33、分辨率,分成多个分辨率进行“锥形”的编码方法。水平(垂直)方向分辨率的下降以2的倍数因子发生改变。3. 基于DCT的分层操作方式基于DPCM的预测编码无失真编码器源图像数据压缩的图像数据预测器熵编码器表说明DPCM预测编码框图3.6.2 MPEGMPEG的全称是运动图像专家组Moving Picture Experts Group是专门制定多媒体领域内的国际标准的一个组织,该组织成立于1988年,由全世界大约300名多媒体技术专家组成。1 MPEG标准简介MPEG标准是面向运动图像压缩的一个系列标准。最初MPEG专家组的工作项目是3个,即在1.5Mbps,l0Mbps,30Mbps传输速率下对
34、图像编码,分别命名为MPEG-1,MPEG-2,MPEG-3。l992年,MPEG-2适用范围扩大到HDTV,能支持MPEG-3的所有功能,因而MFEG-3被取消。MPEG-1即“用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码”。MPEG-1的任务主要是,将视频信号及其伴音以可接收的重建质量压缩到约1.5Mbps的码率,并复合成一个单一的MPEG位流,同时保证视频和音频的同步。2 MPEG-1标准MPEG系统:定义音频、视频及有关数据的同步;MPEG视频:定义视频数据的编码和重建图像所需的解码过程,亮度信号分辨率为360230,色度信号分辨率为180120;MPEG音频:定义音
35、频数据的编码和解码;一致性测试。MPEG-1标准分3个部分MPEG-1标准没有规定编码器和解码器的体系结构或实现方法,但提出了功能和性能上的要求。此外,MPEG算法编码过程和解码过程是一种非镜像对称算法,也就是说运动图像的压缩编码过程与还原解码过程是不对称算法,解码过程要比编码过程相对简单。实际上,MPEG-1和MPEG-2只规定了解码的方案,重点将解码算法标准化。因而用硬件实现MPEG算法时,人们首先实现MPEG的解码器,如CCube公司CL350解码器系列。 MPEG音频压缩算法是第一个高保真音频数据压缩国际标准,它同时可完全独立应用。MPEG音频(1)音频信号采样率可以是32kHz,33
36、.1kHz或 38kHz;(2)压缩后的比特流可以按3种模式之一支持单 声道或双声道;(3)压缩后的比特流具有预定义的比特率之一;(3)MPEG音频标准提供3个独立的压缩层次;(5)编码后的比特流支持循环冗余校验CRC;(6)MPEG音频标准支持在比特流中载带附加信息MPEG音频标准具有如下特点:MPEG数据压缩过程中存在的主要问题是:(1)仅使用帧内编码方法无法达到很高的压缩比;(2)用单一的静止帧内编码方法能最好地满足随机存取的要求。MPEG-1视频编码技术具体实现中采用了一个折中解决方案,在MPEG算法中采用两种基本技术(1)基于块的运动补偿技术,目的是减少时间上冗余性;(2)基于DCT
37、变换的ADCT技术,以减少空间上冗余性。基于块的运动补偿技术 MPEG视频数据流的结构基于块的运动补偿技术 MPEG视频数据流的结构宏块 一个块由一个1616的亮度信息和两个88色度信息构成。运动信息包含在宏块中,每个宏块可有一个/二个运动矢量。基于块的运动补偿技术图像类型MPEG将运动图像类型分为3种:I图像(帧内图)P图像(预测图)B图像(双图)基于块的运动补偿技术图像类型 (1)I图像 利用图像自身的相关性压缩,提供压缩数据流中的随机存取的点,采用基于ADCT的编码技术,压缩后,每个像素为12比特。 I图像也称帧内图,类似与JPEG中的帧内编码。(2)P图像 用最近的前一个I图像(或P图
38、像)预测编码得到(前向预测),也可以作为下一次预测的参照图像,也称为预测图。(3)B图像 B图像在预测时,既可使用前一个图像作参照,也可使用下一个图像作参照或同时使用前后两个图像作为参照图像(双向预测),也称双图。其预测方法采用4种技术: (1)帧内编码 (2)前向预测 (3)后向预测 (4)双向预测 基于块的运动补偿技术运动序列流的组成基于块的运动补偿技术运动补偿技术主要用于消除P图像和B图像在时间上的冗余性,提高压缩效率。在MPEG方案中,运动补偿技术在宏块一级工作。各图像类型的宏块及处理技术见下表 所谓基于块的运动补偿技术即:(1)在参照帧中寻找符合一定条件限制、当前被预测块的最佳匹配块
39、;(2)当找到匹配块后,在恢复被预测块时,采用两种处理方法: 直接用匹配块代替; 用匹配块加上预测误差(预测误差采用ADCT编码)。每个包含运动信息的1616宏块,相对于前面相邻块的运动信息作差分偏码,得到运动差值;然后对运动差值,使用变长码编码方法,进一步压缩数据。注意:MPEG标准只说明了怎样表示运动信息,并没有说明运动矢量如何计算。MPEG标准 帧内图像I 不参照任何过去的或者将来的其他图像帧,压缩编码采用类似JPEG压缩算法帧内图像I的压缩编码算法 预测图像P使用两种类型的参数来表示:一种参数是当前要编码的图像宏块与参考图像的宏块之间的差值,另一种参数是宏块的移动矢量。*P380预测图
40、像P的压缩编码算法预测图像P的压缩编码算法移动矢量的算法框图预测图像P的压缩编码算法绝对差值AE均方误差MSE平均绝对帧差MAD最佳匹配判据算法框图插补图像B的压缩编码算法MPEG三种图像的压缩后的典型值(比特)MPEG-2标准 MPEG-2标准从1990年开始研究,1993年ISO汉城会议正式通过。它是一个直接与数字电视广播有关的高质量图像和声音编码标准。MPEG-2可以说是MPEG-1的扩充,因为它们的基本编码算法都相同。但MPEG-2增加了许多MPEG-1所没有的功能,例如增加了隔行扫描电视的编码,提供了位速率的可变性能(scalability)功能。MPEG-2要达到的最基本目标是:位
41、速率为39 Mbit/s,最高达15 Mbit/s。 MPEG-2的标准号为ISO/IEC 13818,标准名称为“信息技术 电视图像和伴音信息的通用编码 MPEG-2标准的主要内容如下:(1)MPEG2视频利用网络提供的更高的带宽(1.5Mbps以上),来支持具有更高分辨率图像的压缩和更高的图像质量;(2)为了适应不同应用的要求,保证数据的可交换性,定义了不同的功能档次,每个档次又分为几个等级(3)编码器的设计有较大的自由度(4)MPEG-2定义了11种规范,以保证与MPEG-1向下兼容及广播、通信、计算机、家用视听设备的需求;(5)MPEG-2音频向后与MPEG1音频兼容MPEG-2的编码
42、方法和MPEG-l的区别主要是在隔行扫描制式下,DCT变换是在场内还是在帧内进行由用户自行选择,亦可自适应选择。一般情况下,对细节多、运动部分少的图像在帧内进行DCT;而细节少、运动分量多的图像在场内进行DCT。 MPEG2采用可调型和非可调型两种编码结构,且采用两层等级编码方式。MPEG-2编码方法 MPEG2视频体系要求必须保证与MPEG1向下兼容,并同时力求满足数字存储媒体、会议电视/可视电话、数字电视、高清晰度电视(HDTV)、广播、通信、网络等应用领域对多媒体视频、音频通用编码方法日益增长的新需求。 如分辨率有低、中、次高、高不同档次,压缩方法从简单到复杂有不同级别等。MPEG2 Video 配置(框架)和级别 视频压缩编码的数据分层比特流结构 对比特流制定了更高层语法结构的语义规范MPEG2 Video 特色编码方式:信噪比可变性(Signal-to-Noise Scalability空间分辨率可变性(Spatial Scalability)时间分辨率可变性(Temporal Scalability)MPEG2 Video 配置和级别MPEG标准MPEG2 Video 配置MPEG2 Video 级别Simple Main SNR Spatial
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 陈虎谈新质生产力
- 新质生产力发展经过
- 物流管理成本与效益管理分析
- 家庭教育手机管理
- 双口小学校园文化建设阶段性总结模版
- 脑干梗塞的临床护理
- 新零售店面接待流程标准化课件
- 幼儿园公务员试题及答案
- 养老消防安全试题及答案
- 盐城国企面试题库及答案
- 四川省凉山州2022-2023学年七年级下学期期末历史试题
- JBT 1306-2024 电动单梁起重机(正式版)
- QBT 2262-1996 皮革工业术语
- 《工程建设标准强制性条文电力工程部分2023年版》
- 心理干预各论家庭治疗
- 《输变电工程无人机倾斜摄影测量技术规程》
- 医疗废物的分类及管理
- 2024氢气长管拖车安全使用技术规范
- 《大学生创业基础系列课程》课件-第14-4课-创业营销理论-1学时
- 垃圾中转站安全培训
- TCALC 003-2023 手术室患者人文关怀管理规范
评论
0/150
提交评论