第3章多媒体数据压缩编码技术1_第1页
第3章多媒体数据压缩编码技术1_第2页
第3章多媒体数据压缩编码技术1_第3页
第3章多媒体数据压缩编码技术1_第4页
第3章多媒体数据压缩编码技术1_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多媒体技术电子教学课件第3章3/4/20231第3章多媒体数据

压缩编码技术3.1多媒体数据压缩编码的重要性3.2预测编码技术3.3哈夫曼编码技术3.4行程〔游程〕RLE编码技术3.5静态图像压缩编码国际标准—JPEG3.6运动图像压缩编码国际标准—MPEG3/4/20232第3章多媒体数据

压缩编码技术3.1多媒体数据压缩编码的重要性

3.1.1数据冗余类型

3.1.2数据压缩技术的分类

3/4/20233第3章多媒体数据

压缩编码技术3.1媒体数据压缩编码的重要性信息时代的重要特征是信息的数字化。早期的计算机系统采用模拟方式表示信息,但存在着明显的缺点:①经常会产生噪音和信号丧失,并且在复制过程中逐步积累噪音和误差。②模拟信号不适合数字计算机加工处理。3/4/202343.1媒体数据压缩

编码的重要性数字化后未经压缩的视频和音频等媒体信息的数据量是非常大的1.图像数据量的大小可用下面的公式来计算:图像数据量=图像的总像素×色彩深度÷8〔单位为Byte,简写为B〕

例如,一幅640×480、24位〔bit〕真彩色的图像,其文件大小为:

640×480×24÷8=921.6KB3/4/202353.1媒体数据压缩

编码的重要性2.双通道立体声激光唱盘,采用脉冲码调制采样,采样频率为44.1KHz,采样精度16位,其一秒钟时间内的采样数据量为: 44.1×1000×16×2÷8=176.4KB

一个650MB的CD—ROM,大约可存1小时的音乐。3/4/202363.1媒体数据压缩

编码的重要性3.对动态图形和视频图像。例如对于彩色电视信号,设代表光强Y的带宽为4.2MHz、色彩I为1.5MHz和色饱和度Q为0.5MHz,采样频率>2倍原始信号频率,各分量均被数字量化为8位,从而1秒钟电视信号的数据量为:〔4.2+1.5+0.5〕×2×8×1000000÷8=12.4MB3/4/202373.1媒体数据压缩

编码的重要性容量为650MB的CD—ROM仅能存1分钟的原始电视数据。假设为高清晰度电视〔HDTV〕其1秒钟数据量约为150MB〔1.2Gbps÷8〕,一张CD—ROM还存不下5秒钟的HDTV图像。巨大数字化信息的数据量对计算机存储资源和网络带宽有很高的要求,解决的方法就是要对视、音频的数据进行大量的压缩。播放时,传输少量被压缩的数据,接收后再对数据进行解压缩并复原。3/4/202383.1.1数据冗余类型1.空间冗余基于离散像素采样来表示物体颜色的方式通常没有利用景物外表颜色的这种空间相关性,这些相关性的光成像结构在数字化图像中就表现为空间冗余。我们可以通过改变物体外表颜色的像素存储方式来利用空间相关性,到达减少数据量的目的。3/4/202393.1.1数据冗余类型2.时间冗余时间冗余反映在图像序列中的相邻帧图像〔电视图像、动画〕之间有较大的相关性,一组连续画面中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,把一帧图像中的某物体或场景可以由其他帧图像中的物体或场景进行处理后重构出来,可以大大减少时间冗余。3/4/2023103.1.1数据冗余类型3.结构冗余有些图像具有较强的相似性的纹理结构,例如布纹图像和草席图像,方格状的地板图案等,我们称此为结构冗余。4.知识冗余有许多图像的理解与某些根底知识有相当大的相关性,这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。根据已有的知识,我们可以构造图像物体的根本模型,并创立图像库。3/4/2023113.1.1数据冗余类型5.视觉冗余人的接收系统如视觉系统和听觉系统是有一定限度的,人眼并不能觉察图像场的所有变化,如人类视觉系统分辨能力约为64灰度等级,而一般图像量化采用256灰度等级,这类冗余我们称为视觉冗余。6.听觉冗余人耳的敏感性不能觉察所有频率的变化,存在听觉冗余。3/4/2023123.1.2数据压缩技术

的分类根据多媒体数据冗余类型的不同,解码后数据与原始数据是否完全一致、质量有无损失来进行分类,压缩方法可被分为有失真编码和无失真编码两大类。无失真压缩法也称无损压缩,无失真压缩的特点是压缩比较小,大约在2∶l至5∶l之间,主要用于文本数据、程序代码和某些要求严格不丧失信息的环境中,常用的无失真压缩编码有如哈夫曼编码等。3/4/2023133.1.2数据压缩技术

的分类

有失真压缩法也称有损压缩,有失真压缩法的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等,压缩比可以从几到几百倍,常用的有失真压缩编码技术有预测编码、变换编码、模型编码、混合编码方法等。主要用于压缩图像、声音等信息。3/4/202314

常用的图像和视频压缩方法如图3-1所示:

图像和视频压缩方法哈夫曼编码行程编码算术编码LZW编码DCT编码小波变换子带编码无失真压缩有失真压缩预测编码变换编码模型编码运动补偿混合编码分形编码JPEGMPEGH.2613.1.2数据压缩技术

的分类3/4/2023153.2预测编码技术根据离散信号之间存在着一定的相关性的特点,利用图像像素的以往样本值〔前面一个或几个点的数据〕对于新样本值〔下一个点的数据〕进行预测,然后将样本的实际值与其预测值相减得到一个误差值(较小),这样可以用比较少的数码进行编码得到较大的数据压缩结果,到达压缩数据的目的,因此预测编码技术是一种有失真编码方法。3/4/202316

最常用的是差值脉冲编码调制法,简称为DPCM。图3-2所示的是DPCM编、解码系统原理图传输信道输入预测器量化器编码器解码器预测器XnenXn″en′输出Xn′Xn′en′Xn″3.2预测编码技术3/4/2023173.2预测编码技术设xn为tn时刻的亮度取样值,预测器根据tn时刻之前的样本值x1,x2…,xn-1对xn作预测,得到预测值xn′,xn与xn′之间的误差为:en=xn-xn′〔3-1〕接收端恢复的输出信号为xn″是xn的近似值,两者的误差是:△xn=xn-xn″=xn′十en-〔xn′十en′〕=en-en′〔3-2〕3/4/2023183.2预测编码技术

在预测编码中,量化器的量化对像是预测误差en-en′分布在零值附近,正负两边的分布一般是对称的,图3-3预测误差分布特性示意图。概率预测误差图3-3预测误差分布示意图3/4/202319量化输出输入电平非均匀量化间隔非均匀量化器3/4/2023203.2预测编码技术非均匀量化器对于具有相同的输入信号动态范围、相同的图像主观评价质量下,输出的比特数较低。预测编码系统的缺点:预测误差的量化是造成图像质量下降的主要原因,比方在图像边界斜率过载,表现为图像轮廓变模糊;因最小量化电平不够小〔量化位数不够高〕,使图像灰度缓变区产生颗粒噪声。3/4/2023213.3哈夫曼编码技术假设一个信息源能产生的事件序列中的事件取自一个有限事件集,事件集S中的任一事件Si发生的概率为P(Si)都相等,即P(Si)=1/S,那么其所能携带的信息量I(Si)定义为:

I(Si)=-log21/S=-log2P(Si)〔3-3〕

这里P(Si)是信息源产生的事件为Si的概率。等式右边加一负号的目的是保证I(Si〕的数值不为负值。定义中用2为底的对数,并规定信息量I(Si)的计量单位为比特〔bit〕。3/4/2023223.3哈夫曼编码技术如果一个信息源发出的是由8个二值数〔0,1〕表示的组合信息。如果这种组合是等概率的,即P(Si)=1/256,〔i=0,1,2,…255〕,那么此8个数字提供的信息量按〔3-3〕式计算:I(Si)=-log21/256=-log21十log2256

=8〔bit〕〔3-4〕组合的总数是256种可能,每一种可能的组合为8比特。如果上述256种可能组合中是非等概率的,可以证明信息量I(Si)将小于8〔bit〕的。3/4/2023233.3哈夫曼编码技术离散无记忆〔不受其前面事件出现与否的影响〕信息源中一个事件所携带的平均信息量H〔S〕定义为:

〔3-5〕

平均信息量又称为信息熵,熵实际上是信源事件集中各事件所携带的信息量的数学期望。熵值的单位是比特。

数据压缩的另一个根本途径那么是去去除联合信源中各信源间的相关性。3/4/2023243.3哈夫曼编码技术

哈夫曼编码利用了以上原理,属于一种变字长码,把信息源事件按概率大小顺序排列,对出现概率大的信息源事件赋予短码字,而对于概率小的信息源事件赋予长码,只要码字长度按照信息出现的概率大小逆顺序排列,可通过数学证明这一结论:平均码字长度一定小于其它任何事件顺序的排列方式。3/4/2023253.3哈夫曼编码技术哈夫曼编码一般过程如下:1.把事件〔消息〕按出现的概率由大到小排成一个序列。如P(1)>P(2)>P(3)>…>P(Sm-1)>P(Sm),即将信息源事件按概率递减顺序排列。2.把其中两个最小的概率P(Sm-1),P(Sm)挑出来,且将事件“1〞赋给其中最小的,即P(Sm)→1;事件“0〞赋给另一稍大的即P(Sm-1)→0。

3/4/2023263.3哈夫曼编码技术3.把两个最小概率相加作为新事件的概率,即求出P(Sm-1),P(Sm)之和P(Si):

P(Si)=P(Sm-1)十P(Sm)

设P(Si)是对应于一个新的消息的概率。4.将P(Si)与上面未处理的〔m-2〕个消息P(Sm-2〕的概率重新由大到小再排列,构成一个新的概率序列。5.重复步骤2〕,3〕,4〕,在每次合并信息源时,将被合并的信源分别赋“0〞和“1〞直到所有m个事件的概率均已全部合并处理为止。3/4/2023273.3哈夫曼编码技术6.寻找从每一个信息源事件到概率总和为1处的路径,对每一信息源事件写出“1〞、“0〞序列〔从树根到信息源事件节点〕作为码字。

Huffman编码的平均码字长度可以用以下公式求出:〔3-6〕

这里的ni,为第i个消息事件的码字长度,P(Si)为第i个消息出现的概率。举一例子来说明这一编码过程。

表3-1信息源消息事件及其对应的概率

3/4/2023283.3哈夫曼编码技术图3-5哈夫曼编码全过程:F3/4/2023293.3哈夫曼编码技术根据哈夫曼的编码规那么,我们得到如表3-2所示:

由于8个消息事件A,B,C…,H的每个概率为,那么哈夫曼码的平均长度L可按公式〔3-6)计算为:

L=1×0.4十3×〔0.18+0.10〕+4×〔0.10十0.06十0.07〕十5×〔0.05十0.04〕=2.61比特

3/4/2023303.3哈夫曼编码技术图像的熵H〔S〕可按公式〔3-5)计算为:

定义编码效率为熵值H〔S〕与平均码长L的比值,即:编码效率〔3-7〕

=2.55/2.61=97.8%

哈夫曼编码有它的缺乏之处:

必须先得到信息源码元〔消息〕的统计概率,才能进行编码。折中的方法是根据经验值人为地给出Huffman码表,但这样的编码无法到达最正确。3/4/2023313.4行程〔游程〕

RLE编码技术行程编码主要思路是用编码器不断比较信息源符号相邻元素值的变化幅度,一旦发现有明显的变化,就开始一个行程。编码器检测每一个行程起点位置开始的屡次重复的比特或者字符序列,然后将一个相同值的连续串出现次数作为行程长度,并将行程长度转换成代码,再取用信息源符号的一个代表值作为代码,这种编码称为行程编码,或称游程编码,常用RLE表示。3/4/202332对一幅两维图像F〔i,j〕作水平扫描后得到的局部像素的像素值3/4/2023333.4行程〔游程〕

RLE编码技术

用RLE对这一行数据编码后得到的码字表:

RLE编码压缩编码技术尤其适用于:

计算机生成的图形图像和黑白二值图像的编码,解压缩速度很快。RLE的压缩率的大小取决于图像本身的特点,可以得到较大的压缩比。对复杂的图像不适宜用RLE进行编码。3/4/2023343.5静态图像压缩编码

的国际标准--JPEG静态图像压缩编码JPEG概况3.5.1JPEG压缩编码的根本系统〔1〕数据块准备〔2〕离散余弦正变换DCT〔3〕量化〔4〕DCT系数Z形扫描〔5〕DC系数编码〔6〕AC系数编码3.5.2JPEG压缩编码的扩展系统3/4/202335

3.5静态图像压缩编码的国际标准--JPEGJPEG是国际上彩色、灰度、静止图像的第一个国际标准。用来在低分辨率到高分辨率的较宽范围内支持较高的图像分辨率和量化精度。它不仅适用于黑白、彩色照片和印刷图片等静止图像的压缩,而且扩大到了彩色、会议、新闻图片的传送上,以及电视图像序列的帧内图像的压缩编码也常采用JPEG压缩标准。3/4/2023363.5静态图像压缩编码

的国际标准--JPEG变换编码的根本思路:1.编码时略去某些能量很小的高频分量以降低码率。2.变换编码还可以根据人眼对不同频率分量的敏感程度而对不同系数采用不同的量化台阶,以进一步提高压缩比。JPEG开发的压缩编码算法有三种工作方式:1.根本系统〔单次扫描〕。2.扩展系统〔常采用累进编码或分层编码方式〕。3.无损压缩编码。3/4/2023373.5.1JPEG压缩编码的根本系统

下面我们讨论一个基于离散余弦正变换DCT的有失真JPEG编解码的工作原理,图3-7是基于DCT的JPEG编码的过程框图。

3/4/2023381.数据块准备块准备将一帧〔幅〕图像分成8×8的数据块。对于彩色图像,可以看作多分量〔Y亮度信号分量和U和V色度信号分量〕进行压缩处理。假设图像的大小为480行,每一行有640个像素。并假设按4∶l∶l取样格式,即四个亮度分量,一个色差分量U,一个色差分量V,那么亮度分量就是一个640×480的数值矩阵,色差分量是一个320×240的数值矩阵。块准备必须划分出4800个〔640×480÷8〕亮度块和两份1200个〔320×240÷8〕色差块,共计7200个数据块。3/4/2023392.离散余弦正变换DCT假设采样精度为P位,采样数据在范围〔0,2P-1〕,那么变成在范围〔-2P-1,2P-1-l〕内,以此作为DCT正变换的输入。在解码器的输出端经IDCT反变换后,得到一系列8×8的图像数据块,需将其数值范围由〔-2P-1,2P-1-l〕再变回到〔0,2P-1〕范围内的无符号整数,才能重构图像。2.离散余弦正变换DCT离散变换可以用矩阵表示。假设信源序列为一个n行k列的矩阵X,变换矩阵为T,经过某种变换后得到输出序列Y为:

Y=TX3/4/2023402.离散余弦正变换DCT如果所采用的变换是正交变换,那么T为正交矩阵,即有:

T-1T=I

其中I是单位矩阵。在接收端,进行变换:

X=T-1Y

那么可以恢复源信号序列X。

JPEG将8×8大小的子块图像进行离散余弦DCT变换。3/4/2023412.离散余弦正变换DCT

下面是离散余弦正变换DCT和它的IDCT逆变换的数学表达式。

DCT变换为

3/4/2023422.离散余弦正变换DCT将每个数据块的数据从空间域变换到频率域,输出64个DCT变换系数。如图3-8所示,64个像素变换为64个系数。

〔a〕像素块〔b〕DCT系数阵列横向频率增加方向U纵向频率增加方向VXY3/4/2023432.离散余弦正变换DCT

图3-9为二维离散余弦变换的示意图。幅度x

ya=f(x,y)DC系数DCT系数Fx

Fyc=g(Fx,Fy)3/4/2023443.量化量化是一种不可逆的、有失真的过程,在基于DCT的编码器中,量化是引起信息丧失的主要原因。对DCT系数进行量化有两个作用:①降低系数的幅值。②增加系数中值为0的项数。3/4/2023453.量化

表3-4缺省的亮度Y分量量化表3/4/2023463.量化

表3-5缺省的色度U、V分量量化表。3/4/2023473.量化

JPEG的量化器的公式可定义为:

其中:DCT变换系数C(u,v);Q(u,v)是量化器步长,它是量化表的元素。3/4/2023484.DCT系数Z形扫描图3-10Z形扫描顺序其一维数组元素的位置顺序如图3-10。ZZ〔0〕=C〔0,0〕,ZZ〔1〕=C〔0,l〕,ZZ〔2〕=C〔l,0〕,…,ZZ〔63〕=C〔7,7〕。编码顺序依据ZZ的序号。01561415272824713162629423812172530414391118243140445310192332394552542022333846515560213437475056596135364849575862633/4/2023495.

DC系数编码对相邻块之间的DC系数的差值DIFF=Di-Di-1进行编码。DIFF=ZZ〔0〕-PRED进行无失真编码。因输入数据已偏移到零电平,已先行减去了2P-1,在扫描起点初始化时刻,规定PRED=0。Blocki-1Blocki图3-11DC系数的差值DIFF=Di-Di-1DiDi-1┅┅┅┅3/4/2023505.

DC系数编码假设后面的ZZ〔0〕的动态范围为-1023~+1023,那么DIFF的动态范围可达-2047~+2047,这样每个值赋予一个码字那么码表过于庞大。因此,JPEG对码表进行简化,采用“前缀码〔SSSS〕+尾码〞。前缀码表示尾码的有效位数〔设为B位〕,尾码那么直接采用B位自然二进制码。8位精度的SSSS值的范围为0~11(12项),其码表可参见表3-6原始图像分量为8位精度时DC系数差值的典型哈夫曼编码表所示。3/4/2023515.

DC系数编码对于尾码为DIFF的B位:当DIFF≥0,用原码,尾码的最高位是“l〞;当DIFF<0,用反码,尾码的最高位是“0〞;如设DIFF=12,SSSS=4,其前缀码字为“101〞,4位尾码为“1100〞,从而DIFF=12的编码为“1011100〞。如果DIFF=-12,4位尾码为12反码“0011〞,从而DIFF=-12的编码为“1010011〞。解码时,由前缀码“101〞知尾码有4位;假设码字是“1100〞,因其最高位为“1〞,立即可得DIFF=12;假设码字是“0011〞,那么因其最高位为“0〞,知DIFF应为负数,尾码是个反码,取反后可得实际值DIFF=-12。3/4/2023526.AC系数的编码Z形扫描将二维量化系数矩阵转换成一维数组ZZ中的“零游程/非零值〞。假设最后一个“零游程/非零值〞中只有零游程〔ZRL〕,那么直接传块结束码字“EOB〞结束本块。“零游程/非零值〞编码表示为“NNNN/SSSS+尾码〞。其中:4位“NNNN〞为相对于前一个非零值的零游程计数,表示ZRL=0~15;如果ZRL>15,那么用“NNNN/SSSS〞=“1111/0000〞表示ZRL=16,再对ZRL=ZRL-16继续编码。3/4/2023536.AC系数的编码对于根本系统,SSSS将不超过10,可参见表3-7AC系数的尾码位数赋值表。前缀码的二维哈夫曼码表的大小为NNNN×SSSS+2=162;亮度和色差各有自己的码表〔分别见表3-8亮度AC系数码表和表3-9色差AC系数码表〕。3/4/2023546.AC系数的编码假设ZZ〔k〕为非零AC系数,那么其编码步骤与DC系数的类似:①根据ZZ〔k〕的幅度范围由表3-7查出尾码的位数SSSS=B。②由ZRL计数值NNNN以及SSSS从表3-8或表3-9中查出前缀码字。③按以下规那么直接写出尾码的码字,当ZZ〔k〕≥0,用原码,当ZZ〔k〕<0,用反码。3/4/2023556.AC系数的编码现以一实例说明其编码过程。设某亮度图像块的量化系数矩阵按Z形扫描得到:k01234567ZZ〔k〕125-202000k89~303132~63ZZ〔k〕10-10假设其前一亮度块的量化DC系数为12。3/4/2023566.AC系数的编码那么编码过程如下:第一步,DC系数编码,因为DIFF=ZZ〔0〕-PRED=12-12=0,由表3-6直接查得其前缀码“00〞。第二步,AC系数编码。第1个非零值ZZ〔1〕=5,它与ZZ〔0〕之间无零系数,故NNNN=0,因“5〞落入表3-7中的第3组,故SSSS=3,而NNNN/SSSS=0/3,由表3-8查得为“100〞,从而ZZ〔1〕=5的编码为“100101〞。第2个非零值ZZ〔2〕=-2,它与ZZ〔1〕之间无零系数,故NNNN=0,因“-2〞落入表3-7中的第2组,故SSSS=2,而NNNN/SSSS=0/2,由表3-8查得为“01〞,而-2的反码为“01〞。从而ZZ〔2〕=-2的编码为“0101〞。3/4/2023576.AC系数的编码第3个ZZ〔4〕=2,NNNN/SSSS=1/2,查表3-8得码字“11011〞,而2的原码为10,所以取ZZ〔3〕~ZZ〔4〕的编码为“1101110〞。第4个ZZ〔8〕=1,NNNN/SSSS=3/1,查表3-8得码字“111010〞,而1的原码为1,所以取ZZ〔5〕~ZZ〔8〕的编码为“1110101〞。第5个ZZ〔31〕=-1,由于NNNN=30-9+1=22>15,故先编码ZRL=16,由表3-8查得F/0〔16NNNN=22-16=6<15,故再编码NNNN/SSSS=6/1,查出其码字为“1111011〞,而-1的反码为0,从而ZZ〔9〕~ZZ〔31〕3/4/2023586.AC系数的编码此后无非零值,直接用一个“EOB〔0/0〕〞结柬本块,查表3-7得其码字为“1010〞。综合以上两个步骤,可知该图像块的编码位流为:

共用了49位,而原始图像块要用8×8×8=512位表示,故压缩比为512∶49=10.45∶1。3/4/2023593.5.1JPEG压缩编码

的根本系统

对于中等复杂程度的彩色图像,其压缩比与恢复图像的质量大致如表3-10所示。表3-10压缩效果与恢复图像质量的关系

3/4/2023603.5.1JPEG压缩编码

的根本系统

顺序编码运行方式3/4/2023613.5.2JPEG压缩编码

的扩展系统1.基于DCT的累进编码运行方式 累进编码方式要扫描屡次。3/4/2023623.5.2JPEG压缩编码

的扩展系统2.分层编码运行方式水平方向和垂直方向分辨率以2的倍数因子下降〔降低原始图像的空间分辨率〕,导出假设干低分辨率的原图像,分层后再采用JPEG的压缩编码方法进行编码,随后以上重复步骤,直到图像到达完整的分辨率编码为止。3/4/2023633.5.2JPEG压缩编码

的扩展系统3.无损压缩预测编码运行方式源图像数据表说明预测器熵编码器压缩后图像数据3/4/202364无损压缩预测编码

运行方式

DPCM编码简单,易于用硬件实现。由于是无失真编码,解码后的图像质量很高。

Px3/4/2023653.6运动图像压缩编码的国际标准—MPEG运动图像压缩编码—MPEG概况3.6.1MPEG标准简介3.6.2帧间编码技术3.6.3运动补偿技术3.6.4MPEG视频压缩数据流结构3.6.5MPEG音频3/4/2023663.6运动图像压缩编码的国际标准——MPEGMPEG专家组工作将整个过程分为三步:①要求提出要求有双重的目的:目标,竞争的原那么。②竟争提出了14个不同的方案。③集中测试和评价,并综合出一个最正确方案。3/4/2023673.6.1MPEG标准简介1.MPEG—1标准MPEG—1的标准名称为“动态图像和伴音的编码〞—用于速率小于每秒约1.5Mbps的数字存储媒体。MPEG—1的最大压缩比可达约1∶200。MPEG—1标准有3个局部组成:MPEG—1视频〔Video〕MPEG—1音频〔Audio〕MPEG—1系统〔System〕3/4/2023681.MPEG—1标准设计目标是把每秒30帧、亮度信号的分辨率为360×240,色度信号分辨率为180×120,传送压缩成数据率为1.2Mbps的编码图像。MPEG—1电视图像的压缩算法采用两种根本压缩技术:①为减少时间冗余度,采用16×16个像素组成的图像块的运动补偿技术。②为了减少空间冗余度,采用8×8图像化的DCT变换技术。3/4/2023691.MPEG—1标准声音压缩编码技术支持高压缩的音频数据流,其采样率为48,44.l或22KHz,量化精度为16位的声音压缩。支持两个声道,可设置成单声道〔mono〕、双声道〔dual〕或立体声〔stereo〕。采用MPEG—1算法可以把位速率降到0.192Mbps。MPEG—1系统采用多路复合技术,把数字电视图像和声音复合成单一数据位流,MPEG—1的数据位流分成内外两层,外层为系统层,内层为压缩层。3/4/202370

2.MPEG—2标准MPEG—2标准称为“活动图像及有关声音信息的通用编码〞标准。设计目标是把以10Mbps速度传送每秒30帧、分辨率为720×572高分辨率的播送级视频图像,压缩后的传送数据率为3~15Mbps。MPEG—2标准是HDTV、DVD以及新型数字式交互有线网所采用的数字视频压缩标准。MPEG—2标准是MPEG—1标准的扩充、丰富和完善,并与MPEG—1标准相兼容。3/4/2023712.MPEG—2标准MPEG—2标准主要分为四局部:第一局部:系统。第二局部:视频。第三局部:音频。第四局部:一致性测试。MPEG—2标准使计算机处理全彩色、全屏幕、全动态的视频图像,同时也能使有线、无线、CD-ROM等传输和存储介质有效地传送视频图像,并且具有CD的音质,使多媒体技术与通信和播送等技术结合起来。3/4/2023723.MPEG—4标准用来支持低比特率下的多媒体通信,还支持用于通信、访问和数字视听数据处理的新方法。注重多媒体系统的交互性和灵活性,以最少量的数据、极低的音频/视频压缩码率来显示建立精确的画面,到达具有高效编码、高效存储与传播以及可交互操作的特性。3/4/2023734.MPEG—7标准正式名称为多媒体内容描述接口。MPEG—7标准只规定信息内容描述格式,而不规定如何从原始的多媒体资料中抽取内容描述和查询、检索方法。MPEG—7标准不针对特定的应用领域,而是尽可能支持广泛的应用领域。主要用途:在数字图书馆、多媒体目录效劳、图像分析、音乐词典、教育、多媒体编辑、多媒体业务引导等多个领域。3/4/2023744.MPEG—7标准视频压缩算法用到了三项根本技术:①帧间编码技术和基于块的运动补偿技术。②空间压缩〔也称为帧内压缩〕技术。③熵编码,使用Huffman编码技术。MPEG标准所用的编码模型与JPEG的编码模型类似,分为5个阶段:帧间编码和运动补偿、变换编码、量化、直流分量DC及交流分量AC的编码和熵编码。3/4/2023753.6.2帧间编码技术利用的时间相关性可进一步消除视频其相邻帧之间具有冗余信息,提高压缩比。将图像分成三种类型:1.参考帧〔I〕以自身图像的相关性进行压缩处理,必须要传送。2.预测帧〔P〕用前面的参考帧或预测帧作为参照图像信息进行预测编码,并可作为下一个预测帧〔B帧图像或P帧图像〕的参照图像信息。但因此可能引起预测误差。3/4/2023763.6.2帧间编码技术3.双向预测帧〔B〕又称插补帧,在预测时,既可以使用前面或后面的视频帧〔I参考帧,P预测帧〕进行双向预测,也可以同时使用前后两个视频帧进行预测编码,但本身不能作为下一个预测帧的参照图像信息。在编码时,先对参考帧进行变换编码,然后对预测帧进行编码,再对两者之间的双向预测帧进行编码,这个过程对随后的下一个预测帧和双向预测帧重复,直到完成所有帧的编码为止。3/4/2023773.6.2帧间编码技术

采用下述四种预测技术:①帧内编码②前向预测③后向预测④双向预测

图3-12显示一个典型的视频图像序列次序。

IBBPBBPBBPBBPBBIBB123456789101112131415161718

I帧和P帧间有两个B帧每十五帧有一幅I帧图像〔0.5秒〕3/4/2023783.6.2帧间编码技术

编码器的输出视频图像序列排列顺序。1423756108IPBBPBBPB9131112161415……

BPBBIBB……

发送端编码器的输出到接收端解码器的输入端,经解码器的输出,又恢复为图3-12编码器输入顺序显示。3/4/2023793.6.3运动补偿技术运动矢量选择二维16×16像素块作为一个的运动矢量处理。运动矢量又称为宏块,它有不同的类型:可以是I帧内型,F前向预测型、B后向预测型A平均值(双向预测〕型。概念:当前图像可看作是前一帧图像位移后的结果,其位移的内容包括运动方向和运动幅度。运动补偿方法是跟踪画面内的运动情况并对其加以补偿后,与当前的图像宏块值相减得到预测误差,再进行编码、传送。3/4/2023803.6.3运动补偿技术

讨论预测器计算表达式,设前一参照帧为I0,后一参照帧为I2,当前帧为I1的示意图。3/4/2023813.6.3运动补偿技术

表3-13给出了I帧内

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论