版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1多媒体技术根底蔡宇辉湖南大学软件学院rj_cyhhnu2第四章 多媒体数据紧缩编码技术3第四章的内容多媒体数据紧缩编码概述重要性、能够性、分类脉冲编码调制PCM统计编码:Huffman编码、算术编码预测编码:DPCM、ADPCM、帧间预测变换编码多媒体数据紧缩编码的国际规范JPEG、MPEG4第一节 数据紧缩编码概述1.1 多媒体数据紧缩编码的重要性1.2 多媒体数据紧缩编码的能够性1.3 多媒体数据紧缩编码的分类51.1 数据紧缩编码的重要性在多媒体技术中,处置的多媒体数据都应是数字信号,传统的媒体信息需求进展采样和量化后方能在计算机中处置。ADC放大器6原始媒体信息数字化后的数据量宏大。
2、例1:一页B5180255mm大小的文件,以中等分辨率300dpi、8位色方式扫描,其数据量为6.61MB。保管一部1813页需求11983.93M650M的CD得刻19张。7例2:立体声的激光唱盘,采样频率为44.1kHz,量化位数为16,那么一秒钟的音频数据量就可达172KB。650M的CD只可存储1小时音乐。ADC8对于视频,数据量的问题那么更加突出。例3:采用PAL制式,采样格式为4:4:4,24位色,那么一秒钟的视频数据量就可达31.3MB。电影时长100分钟需求约289张650M的CD存放。采集卡9由于多媒体信息的数据量非常庞大,给存储器的存储容量、通讯线路的带宽资源、传输速率以及
3、计算机的处置速度都添加了极大压力。处理方法:从硬件设备入手:添加存储器、带宽资源;研讨新型线缆提高传输效率;运用快速的高档计算机从信息内容入手:进展数据紧缩编码。根本的处理之道10数据紧缩对多媒体运用的意义经过数据紧缩技术可减少多媒体信息的数据量,其意义在于:提高了传输效率节约了存储空间使计算机可以实时处置多媒体信息加快了处置速度111.2 数据紧缩编码的能够性多媒体数据能否进展紧缩?研讨阐明,多媒体信息中存在大量的冗余,去掉这些冗余数据便可实现数据的紧缩。冗余数据可用信息原始的多媒体数据12音频中的冗余音频中的冗余信息主要有:时域冗余幅度的非均匀分布;样本间的相关性;周期之间的相关性;基音之
4、间的相关性;静止系数间隔;长时自相关函数。频域冗余非均匀的长时功率谱密度;语音特有的短时功率谱密度。人耳的听觉得分辨才干有限。13图像/视频中的冗余图像/视频信息中包含有大量的冗余,主要有以下不同类型的冗余信息:空间冗余时间冗余构造冗余知识冗余视觉冗余图像区域的一样性冗余纹理的统计冗余14a. 空间冗余空间冗余是静态图像中最主要的一种冗余。通常的图像都描画了某个场景,其相邻像素点之间存在一定的空间衔接性。假设编码时不思索这一相关性,就会呵斥空间冗余。左边的图像显示了一个规那么物体,其大量像素点的亮度、饱和度、颜色等参数都一样。 15b. 时间冗余时间冗余是视频中常见的一种冗余。序列图像中,相邻
5、帧往往包含有一样的背景和运动物体,只是运动物体的位置有所变化,因此相邻两帧的数据差别很小,具有时间上的衔接性。假设编码时不思索这一相关性,就会呵斥时间冗余。16c. 构造冗余有些图像中有规那么纹理,其像素值存在明显的分布方式,只需知道分布方式,便可经过某种方法生成图像,这种数据冗余即构造冗余。规那么的纹理图像17d. 知识冗余对图像的了解有时与某些知识有相当大的相关性,例如人脸的图像就具有同样的五官位置。可以根据已有的知识构造根本模型,并创建特征图像库,那么只需提供少量的特征参数信息便可生成图像,这种数据冗余即知识冗余。18e. 视觉冗余视觉冗余是针对人眼的视觉特性而言的。人对图像的敏感性是非
6、均匀、非线性的,而普通的编码却是线性方式,因此存在视觉冗余。视觉系统对亮度比对色度敏感。视觉系统对低频信号比对高频信号敏感。视觉系统对静止图像比对运动图像敏感。视觉系统对程度、垂直线条比对斜线条敏感。随着亮度的添加,视觉系统对量化误差的敏感度降低。高光区可用较少的量化位数视觉系统把图像的边缘和非边缘区域分开处置。视觉系统总是把视网膜上的图像分解成假设干个空间有向的频率通道后,再做进一步处置。19f. 图像区域的一样性冗余有的图像存在一些一样或相近的区域,从而产生数据的反复性存储,这就是图像区域的一样性冗余。可以只记录一个区域中各个像素的值,与其一样或相近的区域那么不用记录。向量量化方法就是针对
7、这种冗余进展数据紧缩的。20g. 纹理的统计冗余有些纹理并不严厉服从某一分布规律,但它在统计意义上又符合该规律,这种数据冗余即纹理的统计冗余。孔雀羽毛的纹理分布211.3 数据紧缩编码的分类22多媒体数据紧缩编码方法有很多种,根据不同的根据可产生不同的分类:按照编码算法的原理:分成脉冲编码调制、预测编码、变换编码、量化与向量量化编码、统计编码、子带编码、构造编码、模型编码、混合编码等等;根据质量有无失真:分成有损失编码和无损失编码;按照其作用域在空间或频率上:分成空间方法、变换方法和混合方法;根据能否自顺应:分成自顺应性编码和非顺应性编码。23无损编码和有损编码实践上,信息进展数字化时,量化误
8、差是不可防止的。此处的“无损 和“有损是针对编码过程而言的。无损编码:也称冗余紧缩法。将编码后的数据进展解码,所得数据和编码前的原始数据严厉一致,紧缩比约为2:15:1,常用的算法有:Huffman编码、算术编码、行程编码RLE、词典编码等。有损编码:也称熵紧缩法。解码得到的复原数据与原始数据之间存在一定的误差,但并不影响人对原始资料表达信息的了解,紧缩比从几倍到上百倍。2425紧缩软件实践上就是运用上述这些算法进展紧缩的。26衡量编码方法优劣的目的衡量紧缩编码方法优劣的重要目的有:紧缩比要高;紧缩与解压的速度快;算法简单,适宜于硬件实现;解紧缩后复原信息的质量高。27第二节 脉冲编码调制脉冲
9、编码调制:PCM,即将延续模拟信号数字化,包括采样、量化/编码。模拟量经过A/D转换,得到二进制码的过程,也称PCM编码。其它的编码方法都是在模拟信号经过PCM编码后再进展的紧缩编码方法。28PCM编码过程29第三节 统计编码数据紧缩技术的实际根底是信息论,根据信息论的原理,可以找到最正确的数据紧缩编码方法。数据紧缩的实际极限是信息熵,统计编码就是利用了信息熵原理,因此也称作信息熵编码、熵保管编码或熵编码。统计编码是一种无损的紧缩方法,如香农编码、 Huffman编码、算术编码等。303.1 统计编码的原理信息量和信息熵熵是信息论中的概念,是信息量的度量方法。要了解什么是“信息熵,先得了解信息
10、、信息量的含义。什么是“熵?31下面以信源编码模型来阐明。编码器信源音讯集编码输出集X=x1,xnZ=z1,zn符号集Am=a1,amX为音讯集,由n个信号单元xj构成Z为输出集,由n个码字zj构成,zj与xj一一对应。Am 是符号集,由m个码元 ai构成,符号集中间的码元组成输出码字。32当信源发出某个随机事件音讯xj后,接纳端收到一个相应的码字zj。那么,接纳到的这个码字中包含了多少有用的信息呢?信息是用不确定性的量度定义的。音讯xj出现的能够性愈小,那么其带给人们的信息就愈多;反之,音讯出现的能够性愈大,那么它能给人们提供的新信息有用信息就愈少。在数学上,一条音讯所传输的信息是其出现概率
11、的单调下降函数。33信息量信息量:从N个能够事件中选出一个事件所需求的信息度量或含量。对于计算机的二进制编码,可以这么了解:从N个事件中区分出一个特定事件,最少需求回答多少次“yes or no疑问。现实上,每次提问都会得到一个“yes or no的回答,可以用0或1表示,即1bit,假设提问n次,那么信息量为nbit。34例如例一:从164的整数中选出一个数。可先提问“能否大于32?,以消除半数的能够,然后再进展半数的讯问,这样只需6次便可确定一个数,其信息量为6bit。例二:假设只需区分某个数能否大于32,那么只需讯问一次便可得出结论,其信息量只需1bit。从上两例中可看出,大于或者小于3
12、2,这种情况的概率比详细等于某一个数的概率要大,但其信息量反而小单调下降。35信息量的数学表述信息论定义了一种度量信息量的方法:其中:I(xj)是信源X发出xj后,接纳端接纳到的信息量的量度。P(xj)是信源X发出xj的先验概率,有:请用上述公式求例一的信息量。36信息熵假设将信源一切能够事件的信息量进展统计平均即求其数学期望,就得到了信息熵。信源X发出的xjj=1,2,n,xj出现的概率为P(xj),那么信源X的熵为:37例如假设一幅由40个像素组成的灰度图像,共有5级灰度,每一级灰度都是一种信源发出的符号,分别用AE表示。40个像素中有15个灰度为A,7个灰度为B,7个灰度为C,6个灰度为
13、D,5个灰度为E。试求该灰度图像的熵。38 该灰度图像的熵为2.196bit。39统计编码的目的统计编码就根据信源信号出现概率的分布特性进展紧缩的。统计编码的目的:在信源符号和码字之间建立明确的一一对应关系;编码过程中不丧失信息量即信息熵的大小不变,以便在恢复时能准确地再现原信号,实现无损紧缩;平均码长或码率应尽量小。40熵和平均码长可用熵来衡量该编码能否为最正确编码:当 ,有冗余,不是最正确;当 ,不能够出现;当 ,是最正确编码 稍大于 其中 表示编码器输出码字的平均码长。可见,熵值是平均码长的下限。413.2 Huffman编码最正确编码定理:在变字长码中,对于出现概率大的信息符号编以短字
14、长的码,对于出现概率小的信息符号编以长字长的码。假设码字长度严厉按照符号概率的大小的相反顺序陈列,那么平均码字长度一定小于按任何其他符号顺序陈列方式得到的码字长度。Huffman编码:利用了最正确编码定理,是最常用的一种统计编码。42Huffman编码方法先把信源符号按概率大小顺序陈列,并设法按逆次序分配码字长度。对于出现频率大的符号用较少的位数来表示;对于出现频率小的符号用较多的位数来表示。Huffman编码方法采用的码字长度是可变的,因此较难在紧缩编码后的文件中进展内容的查找。43Huffman编码的思绪把信源符号按概率大小顺序陈列,并设法按逆次序分配码字的长度。在分配码字长度时,首先将出
15、现概率最小的两个符号的概率相加合成一个概率。把这个合成概率看成是一个新组合符号地概率,反复上述做法直到最后只剩下两个符号概率为止。完成以上概率顺序陈列后,再反过来逐渐向前进展编码,每一次有二个分支各赋予一个二进制码,可以对概率大的赋为0,概率小的赋为1。44Huffman编码的步骤对每个信息符号进展概率统计;将信源符号按概率的递减顺序陈列;将最后的两个小概率相加作为新符号的概率, 此时概率个数将减少一个;反复第2、3步,直到只剩两个概率;将概率大的赋“0,概率小的赋“1;逆顺序往信源符号推,不是合并的编码不变,假设是合并的,那么在编码后面按照第5步的方法添加0或1。45编码实例信源X有7个信息
16、符号,其概率为: 请对其进展Huffman编码,写出其码树、码长,并计算平均码长和熵。12345670.350.200.150.100.100.060.0446信息符号概率第1步第2步第3步第4步第5步10.350.350.350.350.400.6020.200.200.200.250.350.4030.150.150.200.200.2540.100.100.150.2050.100.100.1060.060.1070.04011000100011011001011010011001001001111011100100100111101110111147码字的平均码长为:熵为:48Huff
17、man编码小结平均码长大于熵,小于等长码的码长。Huffman编码能保证解码的独一性,短码字不会是长码字的前缀。Huffman编码没有错误维护功能。运用Huffman编码时,接纳端需保管一个与发送端完全一样的Huffman码表。Huffman编码在信源符号出现概率分布不均匀时编码效率较高,假设概率分别均匀时普通不采用Huffman编码。Huffman编码的紧缩比取决于信源符号出现的概率,越集中那么紧缩比越高。493.3 算术编码20世纪60年代初,Elias初次提出了算术编码的概念。1976年,开展了算术编码的适用技术。算术编码方法比Huffman编码复杂,但它不需求接纳端保管一份Huffma
18、n码表,且具有自顺应才干。算术编码是目前实现高效紧缩数据中很有出路的编码方法。50根本原理和编码步骤算术编码实践上是用一个浮点数替代一个输入流中的符号。将实数半开区间0, 1) 进展分割,每一符号对应0, 1)上的一个子区间,区间长度为该符号出现的概率;把要编码的整段音讯映射到0, 1),根据这段音讯符号的顺序确定新的实数子区间;最终得到一个0, 1)上的子区间,从中任选一个实数,该实数就是对整段数据进展编码后的输出代码。51例:输入“eai,最后得到的子区间为0.23, 0.236),取该区间的任一个数普通取最小的值,如0.230即为eai的编码。52在算术编码中,一段音讯是用0到1之间的一
19、个实数来编码表示的。算术编码方法用到了两个根本的参数:信源符号的概率和编码间隔。信源符号的概率决议了紧缩编码的效率,也决议了编码过程中的间隔。编码间隔最终决议了符号编码后的输出。需求编码的信息越长,那么表示它的编码间隔就越小,实数的小数位就越多。53编码实例假设信源符号有4个(00, 01, 10, 11),其概率分别为(0.1, 0.4, 0.2, 0.3)。根据概率把间隔0, 1)分成4个子间隔:0, 0.1), 0.1, 0.5), 0.5, 0.7), 0.7, 1)。音讯序列的输入为:10 00 11 00 10 11 015455二进制的算术编码计算机中任何音讯都是由0、1组合而成
20、的,可以了解为信源符号只需0和1。即:每次分割区间时,只需分成两个子区间,一个对应0,一个对应1。例:知二进制符号中0出现的概率为0.25,1出现的概率为0.75,试对输入流1011进展算术编码。56设C为子区间的左端起始位置,L为子区间的长度,那么对于符号“0,C=0,L=0.25;对于符号“1,C=0.25,L=0.75。算术编码步骤如下:步骤 输入符号C L 1 1 0.25 0.75 2 0 0.25 0.75*0.25=0.1875 3 1 0.25+0.1875*0.25 0.1875*0.75=0.296875=0.140625 4 1 0. 296875+0.140625*0.
21、750.140625*0.25=0.10546875=0.3320312557当4个字符输入完后,最终得到的子区间左端起始位置为0.33203125,终止位置为C+L=0.4375。换算成二进制为:(0.33203125)d=(0.01010101) b(0.4375)d=(0.0111) b在0.01010101和0.0111之间取一个数,要求其二进制方式的长度最短,如本例中取0.011,那么该串输入“1011最终可编码成011,数据量有所减少。58几个问题由于计算机的精度有限,算术编码的计算过程中容易发生溢出,可以采用限制小数位数的方法来处理。 算术编码器对音讯只产生一个码字在区间0, 1
22、)中的一个实数,译码器在接纳到表示这个实数的一切位之前不能进展译码。 算术编码对错误很敏感,假设有一位发生错误就会导致整个音讯译错。59自顺应才干现实上,由于人们事先无法知道准确的信源概率,因此编码算法最好具有自顺应才干,处理这一问题最有效的方法是在编码过程中进展估算动态建模。算术编码可以是静态的,也可以是具有自顺应才干的动态编码。在静态算术编码中,信源符号的概率是固定的。在自顺应算术编码中,将根据编码时符号出现的频繁程度动态地修正信源符号的概率。动态建模是确定编码器紧缩效率的关键。60算术编码小结不用预先定义概率模型,具有自顺应才干,可根据当前接纳的数据不断更改概率模型。假设信源符号的概率值
23、都很接近时,不宜运用Huffman编码,建议运用算术编码。算术编码的实现较Huffman编码更复杂,但对多幅图像进展测试的结果阐明,算术编码较Huffman编码提高了5%左右的紧缩率,JPEG扩展系统中采用的就是算术编码。613.4 游程编码RLE:run length encoding,游程编码,也称行程编码。用RLE编码方法得到的代码为:80315084180 623.5 词典编码词典编码是根据数据本身包含有反复内容这一特性进展紧缩的。词典编码是无损的。常见的词典编码算法有:LZ77 算法、LZ78算法、LZW算法等。63指针式词典如LZ77 算法、LZSS算法、LZ78算法。64索引式词
24、典如LZW算法65第四节 预测编码预测编码:先利用以往的样本值对新样本进展预测,再将新样本的实践值和预测值相减得到一个误差值,最后对该误差值进展量化编码传送。假设样本的时间或空间相关性较强,那么误差值的变化范围将远远小于原始信号的变化范围,量化等级可大量减少,从而实现数据紧缩。66预测编码主要是利用数据在时间或空间上的相关性来进展预测的,广泛适用于音频、图像、视频等媒体的编解码。对于音频,主要利用时间上的相关性,采用时间上的前几个采样值来做预测。对于静止图像,主要利用空间上的相关性,好像一行上的前几个采样值,甚至可以是前几行上的像素。对于视频,不仅可以利用时间上的相关性帧间预测,还可以利用空间
25、上的相关性帧内预测。67684.1 DPCM模拟信号进展采样量化后,假设直接运用PCM编码,那么数据量将很大,此时可以运用预测编码的思想来进展二进制编码,常用的方法有线性预测LPC和非线性预测。DPCM:差分(值)脉冲编码调制,是线性预测方法。DPCM编码器记录与传送的不是样本的真实值,而是它与预测值的差。69DPCM的根本原理转入f(i,j)e(i,j)量化器预测器预测器编码器解码器信道传输e(i,j)f(i,j)输出f(i,j)f(i,j)f(i,j)f(i,j)发送端接纳端e(i,j)704.2 ADPCMADPCM:自顺应差分脉冲编码调制。在ADPCM中,预测器的预测系数和量化器的量化
26、参数,都可以根据原数据的区域分布特点自动调整,具有自顺应才干。自顺应预测:添加一个预测参数,该参数可根据预测值的大小自顺应调整;自顺应量化:量化阶距的大小可自顺应调整。实际证明,ADPCM与DPCM相比,紧缩比更高,解码后的质量也更好。714.3 帧间预测编码帧间预测编码技术是专门针对视频对象的,利用延续几帧之间存在的时间相关性来消除冗余。常见的帧间预测编码方法有:条件补充法:假设帧间各对应像素的差值超越阈值,那么传送;假设没超越阈值那么不传送,接纳端运用上一帧相应像素值替代。运动补偿技术:跟踪画面内运动部分的位移情况,对其加以补偿后再进展帧间预测。72第五节 变换编码变换编码技术较成熟,目前
27、广泛运用于图像、视频的数据紧缩。算法思想:将空间域中的图像信号映射变换到另一个正交的矢量空间中,产生一批变换系数,然后对这些变换系数进展编码。假设变换的新正交空间选择得好,那么可以减少数据间的相关性,从而减少了数据的冗余度,到达数据紧缩的目的。73例子有相邻的两个采样值x1和x2,各用3位来表示,即有8种能够取值。思索到样值的相关性,x1和x2同时出现相近幅度的能够性最大,即图中的直线阴影部分。信源的相关性越大,阴影部分就越扁平。74假设将坐标系旋转45度,样本值x1变换成y1,x2变换成y2。不论y1在07的能够等级内如何变化,y2一直只在相当小的范围内变化。可见,旋转后y1和y2的相关性减
28、小了。 75变换编码的原理图子块 1子块 2子块 n.正变换滤波量化编码信道解码逆变换综合拼接源图像发送恢复图像接纳76常用的变换方法常用变换有:沃尔什(Walsh)变换傅立叶(Fouries)变换离散正弦(DST)变换离散余弦(DCT)变换哈尔(Haar)变换斜(Slant)变换K-L(Karhunen-Loeve)变换小波(Wavelet)变换77第六节 多媒体数据紧缩编码规范6.1 静态图像紧缩编码的国际规范JPEG6.2 动态图像紧缩编码的国际规范MPEG-1MPEG-2MPEG-4MPEG-7MPEG-21786.1 JPEG规范JPEG:Joint Photograph Exper
29、ts Group,结合图像专家组,于1986年由CCITT和ISO结合成立。JPEG规范即多灰度延续颜色静态图像紧缩编码,是适用于多级灰度、延续颜色、静态的数字图像紧缩编码规范。实践上,JPEG不仅适用于静态图像,视频的帧内紧缩就可采用JPEG编码。79JPEG是一个适用范围很广的通用规范,其研发时的目的如下:算法在图像紧缩率方面应接近当前科学程度,图像的保真度在较宽的紧缩范围里的评价是“很好、“优秀到与原图像“不能区别。算法可实践运用于任何一类静态数字图像,对图像的大小、颜色空间、像素的长宽比、图像的内容、复杂程度、颜色数及统计特性等都不加限制。在计算的复杂程度方面可以调整,因此可根据性能和
30、本钱要求来选择用软件执行还是用硬件执行。包括四种操作方式:顺序编码、累进编码、无失真编码和分层编码。 80JPEG紧缩算法为了保证通用性,JPEG专家组开发了两种根本的紧缩算法:基于离散余弦变换DCT的有损紧缩。基于空间DPCM预测技术的无损紧缩。实践上,JPEG专家组还研讨了一种称做JPEG 2000的规范,其采用的紧缩算法为基于小波wavelet变换的变换编码。81JPEG的组成部分JPEG系统可分成三个组成部分:根本系统:是实现离散余弦变换DCT编码/解码所需的最小功能集。扩展系统:是为了满足更为宽广领域的运用要求而设置的。独立功能:相对于JPEG的根本系统和扩展系统来说,运用空间DPC
31、M预测方法的部分称为独立功能。82基于DPCM的无损紧缩如图,预测器对原始数据X进展预测,求得差值后再对差值进展无失真的熵编码。熵编码器常采用Huffman编码或算术编码。83基于DCT的有损紧缩基于DPCM预测编码的紧缩比仅能到达2:1,而DCT编码的紧缩比可高达10:1100:1。当紧缩比小于40:1时,复原的图像与原始图像相比客观效果几乎一样。压缩效果(比特/像素)质量0.250.50中好0.500.75好很好0.751.5极好1.22.0与原始图像分不出来8485DCT变换公式88的子块作为DCT变换的输入。DCT变换运用下式计算:逆变换IDCT运用下式计算:86基于DCT编码的步骤基
32、于DCT编码的计算步骤为:分割子块:通常顺序分割成88的子块。对子块进展正向的离散余弦变换FDCT。对获得的DCT系数进展量化处置。将量化后的DCT系数进展Z字形编排。对直流系数DC进展DPCM编码。对交流系数AC进展RLE游程编码。熵编码。876.2 MPEG规范MPEG:Moving Pictures Experts Group,运动图像专家组,于1988年由ISO与IEC结合成立,努力于运动图像及其伴音的编码规范化。 MPEG规范包括三个部分:MPEG视频:如VCD、SVCD、DVD就是采用这部分规范制造的电子产品。MPEG音频:如mp3。MPEG系统:担任视频和音频的同步。88最初,M
33、PEG专家组的任务工程是3个:MPEG-1:在1.5Mbps传输速率下对图像编码。MPEG-2:在l0Mbps传输速率下对图像编码。 MPEG-3:在40Mbps传输速率下对图像编码。 l992年,MPEG-2的适用范围扩展到HDTV高清电视,能支持MPEG-3的一切功能,于是便取消了MPEG-3。到目前为止,MPEG共包括5个工程:MPEG-1和MPEG-2。MPEG-4:针对低速率下的视频、音频编码, 更注重多媒体系统的交互性和灵敏性。MPEG-7:支持多媒体基于内容的检索。MPEG-21:多媒体运用框架。896.2.1 MPEG-1规范MPEG-1的主要义务:将视频信号及其伴音信号以可接
34、受的重建质量,紧缩到约1.5Mbps的码率,并复合成一个单一的MPEG位流,同时保证音视频的同步。MPEG-1主要用于在CD光盘上存储视频图像(VCD),它针对规范分辨率的图像进展紧缩(NTSC制为352240,PAL制为352288),每秒30帧,具备CD音质。90MPEG-1规范的组成MPEG-1规范包括了5个部分:MPEG系统(11172-1):定义音频、视频及有关数据的同步;MPEG视频(11172-2):定义视频信号的编解码过程,亮度信号分辨率为360240,色度信号分辨率为180120;MPEG音频(11172-3):定义音频的编解码过程;一致性测试(11172-4):规定如何测试
35、编解码器,以确认能否符合前三部分的要求;软件模拟(11172-5):该部分并非规范,只是关于用软件执行前三部分的技术结果报告。91MPEG-1视频MPEG-1规范中实现视频紧缩编码的根本思想:在空间上的帧内紧缩:采用基于DCT变换的类JPEG算法;在时间上的帧间紧缩:采用基于块的运动补偿技术。在MPEG视频中,宏块是最根本的编码单元。运动信息就包含在宏块中,每个宏块可有一至二个运动矢量。92MPEG视频数据流的构造运动图像序列图片组图片图片切片宏块块8像素8像素YUV采样格式为4:2:093运动矢量运动矢量,也称挪动矢量。运动矢量94MPEG视频的图像类型MPEG将视频图像分成3种类型:I图像
36、:也称帧内图,采用基于DCT的JPEG编码技术紧缩,每像素紧缩后只需12bit。P图像:也称预测图,用最近的前一个I图像或P图像预测得到(前向预测) ,也可以作为下一次预测的参照图像。B图像:也称插补图、双向预测图,预测时需求同时运用前后两个I图像或P图像作为参照图像(双向预测)。95四种预测方法:帧内预测、前向预测、后向预测、双向预测96典型的图像类型次序MPEG编码器允许选择I图像的频率和位置,普通1秒钟运用2次I图像。MPEG编码器也允许选择在一对参照图像之间的B图像的数目。1秒参照帧间有2个B图像 每0.5秒就有1帧I图像 I B B P B B P B B P B B P B B I
37、 B B P B B P B B P B B P B B典型的图像类型次序97传输顺序假设接纳端接纳的17帧图像顺序不变,同样为IBBPBBP,那么解码第2帧B时,由于它是由第1帧I和第4帧P预测出的,但此时第4帧尚未恢复,将无法解码。为了便于解码器,MPEG编码器需对图像重新排序后再传输,以保证参照图像先于B图像恢复。上述17帧传输的次序应为:4213756IPBBPBB98I图像的编码帧内图像I不参照任何其他图像,可采用类似JPEG的紧缩算法。99P图像的编码P图像运用两种类型的参数来表示:当前要编码的宏块与参考宏块之间的差值;宏块的运动矢量。100B图像的编码101基于块的运动补偿技术在
38、MPEG方案中,运动补偿技术在宏块这一等级任务,主要用来消除P图像和B图像在时间上的冗余。基于块的运动补偿技术,即:在参照帧中寻觅符合一定条件、当前被预测块宏块的最正确匹配块。找到匹配块后,可直接运用匹配块作为被预测块,也可以将匹配块预测误差采用ADCT编码作为被预测块。102搜索运动矢量103各种图像类型的宏块处置技术I图像的数据量最大,B图像的数据量最小。1046.2.2 MPEG-2规范MPEG-2规范于1993年发布,全称为“信息技术电视图像和伴音信息的通用编码,是一个与数字电视广播有关的、高质量图像和声音的编码规范。MPEG-2在MPEG-1的根本编码算法根底上进展了扩展,添加了许多新功能,如对隔行扫描电视的编码、可变位速率等。MPEG-2要到达的最根本目的是:位速率为49Mbit/s,最高达15Mbit/s。105MPEG-2可利用网络提供的3100Mbps的数据传输率,来支持具有更高分辨率图像的紧缩和更高的图像质量。MPEG-2是DVD的指定规范,其音频编码可提供5.1声道甚至7.1声道。MPEG-2规范定义了三种质量不同的编
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外研八下英语Unit 6 Developing ideas《合作探究二》课件
- 人教 八年级 语文 下册 第2单元《6.恐龙无处不有》课件
- 2025 网络基础中网络职业技能培训的网络教学模式创新课件
- 2025 高中信息技术数据结构在电商用户购买偏好变化跟踪课件
- 2026年客栈租房合同(1篇)
- 2026年消防系统维修合同(1篇)
- 2026年旅游代开发合同(1篇)
- 2026年及未来5年市场数据中国金融仓储物流中心建设行业发展监测及投资战略咨询报告
- 现代社会调查方法解析
- 2025 高中信息技术数据与计算之算法的萤火虫算法课件
- 中国艺术研究院社会招聘试题
- 2026年教育局思想政治工作科工作计划
- 2025年安徽卫生健康职业学院单招职业适应性测试试题及答案解析
- 医保村卫生室管理制度
- 陕西从优 秀村干部中考录乡镇公务员考试真题
- 2025年军事设施建设与管理规范
- 儿科学营养性vitD缺乏
- “党的二十届四中全会精神”专题题库及答案
- 厂房基础注浆加固施工方案
- 人工智能技术应用规范
- 无锡银税协议书
评论
0/150
提交评论