多媒体压缩技术_第1页
多媒体压缩技术_第2页
多媒体压缩技术_第3页
多媒体压缩技术_第4页
多媒体压缩技术_第5页
已阅读5页,还剩29页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多媒体压缩技术第

7章7.1多媒体数据压缩基础知识■数据压缩的必要性■数据压缩的可能性■数据压缩基本原理7.2数据压缩编码算法■统计编码

■预测编码■变换编码7.3常见多媒体数据压缩标准

■音频压缩标准■静态图像压缩标准■运动图像和视频压缩标准第一页,共三十四页。​●教学重点:●教学目标:了解媒体数据压缩基础知识,包括数据压缩的必要性、数据压缩的可能性、数据压缩基本原理;了解数据压缩的编码算法,包括统计编码、预测编码、变换编码;了解常见多媒体数据压缩标准,包括音频压缩标准、静态图像压缩标准、运动图像和视频压缩标准等。

了解多媒体数据压缩的必要性、多媒体数据压缩的可能性、数据压缩方法的分类。

教学进程多媒体压缩技术第

7章第二页,共三十四页。​7.1多媒体数据压缩基础知识7.1.1数据压缩的必要性■随着多媒体技术的发展,多媒体数据的传输和存储过程日益频繁。未经处理的多媒体数据数据量巨大,使数据在存储、传输和处理等过程中有诸多不便,因此,多媒体数据的压缩是多媒体应用中的关键问题之一。

教学进程第三页,共三十四页。​教学进程■一幅具有800×600分辨率的真彩色图像(24位/像素),它的数据量为:800×600×24=10.98Mb=1.37MB

7.1多媒体数据压缩基础知识7.1.1数据压缩的必要性BGR相当于72万汉字在计算机中存储的数据量!第四页,共三十四页。​教学进程■视频数据按我国使用的PAL制式,要达到每秒25帧的全动态显示要求。若每帧显示分辨率为640×480的真彩色图像(24位/像素),则每秒所需的数据量为7.1多媒体数据压缩基础知识7.1.1数据压缩的必要性650MB的CD-ROM光盘只能存放29.6秒的视频!640×480×24×25=175.8Mb=21.97MB第五页,共三十四页。​教学进程7.1多媒体数据压缩基础知识7.1.1数据压缩的必要性■1分钟高保真立体声数字音频的数据量为:(44100×16×2)×60/8=10.09MB一首歌曲的播放时间大概是4分钟,也就是说,一首歌曲文件的大小是40MB左右,若保存在一个容量为512MB的U盘中,只能存储12首这样的歌曲。

●巨大的多媒体数据量对于数据的存储和传输带来了很大的困难,因此,多媒体数据必须被压缩!第六页,共三十四页。​教学进程多媒体数据的数据量是非常巨大的,但这些数据量表示的信息量并不等于数据量本身的大小,也就是说,多媒体数据中存在着数据冗余。应用某种编码方法提取或减少这些数据冗余,便可以达到压缩数据的目的,这就是多媒体数据可以压缩的原因。

7.1多媒体数据压缩基础知识7.1.2数据压缩的可能性可用公式表示如下:du=D-I其中,D是指数据量,I指信息量,du指的是冗余量。第七页,共三十四页。​教学进程例如:180个汉字,在计算机中存储的数据量为180×2B=360B7.1多媒体数据压缩基础知识7.1.2数据压缩的可能性广播员朗读这些内容1分钟,数字化时采样频率8000Hz,单声道,8位量化,则数据量为(8000×8×1)×60/8=480000B。可见,传递同样信息,音频数据中则存在冗余。第八页,共三十四页。​教学进程■空间冗余:数字化图像中某个区域的颜色、亮度、饱和度等相同,则该区域里的像素点数据也是相同的,我们只需记下一个像素点的数据及其他像素点的位置,就可以得到该区域的所有信息,大量的重复像素数据就形成了空间冗余。7.1多媒体数据压缩基础知识7.1.2数据压缩的可能性●数据冗余类型●空间冗余常存在图像数据中第九页,共三十四页。​教学进程■时间冗余经常存在于视频和音频数据中。视频是由位于时间轴上的一组连续的帧构成的,相邻帧之间具有很强的时间相关性,且往往变化不大,后一帧的数据与前一帧的数据有许多相同之处,这样就形成了时间冗余。

7.1多媒体数据压缩基础知识7.1.2数据压缩的可能性第十页,共三十四页。​教学进程■视(听)觉冗余:人类的视觉和听觉系统由于受到生理特征的限制,对于图像和声音信号的一些细微变化是感觉不到的,忽略这些变化后,信号仍然被认为是完好的。我们把这些超出人类视(听)觉范围的数据称为视(听)觉冗余。

7.1多媒体数据压缩基础知识7.1.2数据压缩的可能性第十一页,共三十四页。​教学进程7.1多媒体数据压缩基础知识7.1.2数据压缩的可能性■知识冗余:图像的记录方式与某些知识有着—定的相关性,例如,人脸的图像就有固定的结构,鼻子位于中间,上方是眼睛,下方是嘴等。这类规律性的结构可由先验知识和背景知识得到,但计算机并不具备这些知识,只是一个像素一个像素地存人数据,这就形成了知识冗余。

第十二页,共三十四页。​教学进程7.1多媒体数据压缩基础知识7.1.2数据压缩的可能性■结构冗余:在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等。我们称这种冗余为结构冗余。若已知分布模式,可通过某一过程产生图像。第十三页,共三十四页。​教学进程●数据压缩本质数据的压缩实际上是一种编码过程,即根据原始数据的内在联系将数据从一种编码映射为另一种编码,以减少表示信息所需要的总位数。

7.1多媒体数据压缩基础知识7.1.3数据压缩基本原理●数据压缩过程第十四页,共三十四页。​教学进程●数据压缩方法分类无损编码

●用无损编码压缩的数据是可以完全恢复的,解码后的数据与原始数据完全一致,故也称无失真编码或可逆编码。

有损编码●有损编码又称为有失真编码,即在编码过程中要丢失一些人的视/听觉不敏感的信息,且丢失的信息不可恢复。

7.1多媒体数据压缩基础知识7.1.3数据压缩基本原理混合编码

●混合编码是指同时使用两种或两种以上的编码方法进行组合编码的方法。第十五页,共三十四页。​教学进程7.1多媒体数据压缩基础知识7.1.3数据压缩基本原理第十六页,共三十四页。​教学进程●数据压缩方法的衡量指标■压缩率■压缩质量■压缩/解压缩速度7.1多媒体数据压缩基础知识7.1.3数据压缩基本原理第十七页,共三十四页。​教学进程■统计编码属于无损编码,它是根据信息出现的概率分布规律来进行压缩编码。其方法是:找到消息和码字之间的对应关系,以便恢复时能够准确无误地将原数据再现出来。常用的统计编码包括行程编码、哈夫曼编码和算术编码三种。

●行程编码

■行程编码又称为游程编码,其编码原理是将具有相同值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。

例如:要编码的字符串为“aabbbcddddd”,编码后为“2a3b1c5d”,压缩前字符个数为11个,压缩后字符个数为8个,压缩率为11:8。

■行程编码简单直观,编码/解码速度快,因此许多图形和视频文件,如BMP、TIFF及AVI文件均采用这种方法压缩。7.2数据压缩编码算法7.2.1统计编码第十八页,共三十四页。​教学进程●哈夫曼编码原理■其基本思想是:对于给定的数据串,先计算其每个字符的出现频率,并得到频率表,运用哈夫曼算法按出现频率由高到低分配编码位数,然后给出一个最优的编码。一般而言,字符出现的频率越高对应的编码越短,出现频率越低对应的编码越长。

7.2数据压缩编码算法7.2.1统计编码第十九页,共三十四页。​教学进程●哈夫曼编码过程(1)初始化,统计各字符出现的概率,根据概率的大小给字符排序。把(2)两个概率最小的字符的概率加起来,形成一个新的概率。(3)把这个新的概率看成是一个新字符的概率,并与其他字符概率重新排序。(4)重复步骤(1)~(3)到最后概率等于1为止。(5)编码方法:每次合并概率的时候,把即将合并的两个概率分别赋值为0和1:可以给大的概率赋值为0,小的复制为1;也可以给大的概率赋值为1,小的赋值为0。但前后赋值必须统一。

(6)概率1到信源字符之间的路径的赋值编码就是哈夫曼编码的码字。

7.2数据压缩编码算法7.2.1统计编码第二十页,共三十四页。​教学进程●哈夫曼编码实例7.2数据压缩编码算法7.2.1统计编码■待编码字符:

第二十一页,共三十四页。​教学进程●哈夫曼编码实例7.2数据压缩编码算法7.2.1统计编码■编码过程:

7.2数据压缩编码算法7.2数据压缩编码算法第二十二页,共三十四页。​教学进程●哈夫曼编码实例7.2数据压缩编码算法7.2.1统计编码■编码结果:

■编码以后的信源字符串的平均码长为:2×0.3+4×0.08+4×0.11+1×0.37+3×0.14=2.15(位)。而采用等长码长对5个字符进行编码需要的码长是3位。第二十三页,共三十四页。​教学进程7.2数据压缩编码算法7.2.1统计编码●算术编码原理■其基本思想是:把整个信源字符串看作是一个集合,它把集合表示为实数线上的0到1之间的一个区间。这个集合中的每个元素都要用来缩短这个区间。信源集合的元素越多,所得到的区间就越小,当区间变小时,就需要更多的数位来表示这个区间,这就是区间作为代码的原理。■新老区间的边界计算公式如下:新区间起始位置(Ns)=前区间起始位置(Fs)+当前区间左端(Cl)×前区间长度(L)新区间结束位置(Ne)=前区间起始位置(Fs)+当前区间右端(Nr)×前区间长度(L)新区间长度(L)=新区间结束位置(Ne)-新区间起始位置(Ns)

第二十四页,共三十四页。​教学进程7.2数据压缩编码算法7.2.1统计编码●算术编码实例■待编码字符为:X1X3X4X2,其字符出现的概率和初始区间为:第二十五页,共三十四页。​教学进程■消息X1X3X4X2可以转化为范围[0.0646,0.067]中的任意一个数值,用一个数值代表了一个字符串,达到了数据压缩的目的

7.2数据压缩编码算法7.2.1统计编码第二十六页,共三十四页。​教学进程●预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。

■差分脉冲编码调制

■自适应差分脉冲编码调制7.2数据压缩编码算法7.2.2预测编码第二十七页,共三十四页。​教学进程7.2数据压缩编码算法7.2.3变换编码●变换编码是指先对信号进行某种函数变换,从一种信号变换到另一种信号,然后再对信号进行编码。变换编码系统中压缩数据有变换、变换域采样和量化三个步骤。变换本身并不进行数据压缩,它只把信号映射到另一个域,使信号在变换域里容易进行压缩,变换后的样值更独立有序。这样,量化操作通过比特分配可以有效地压缩数据。●变换编码是一种有损编码的方法。第二十八页,共三十四页。​教学进程●电话语音压缩标准

●调幅广播语音压缩标准

●高保真立体声的宽带音频压缩标准

7.3常见多媒体数据压缩标准7.3.1音频压缩标准第二十九页,共三十四页。​教学进程●JPEG标准●JPEG2000标准7.3常见多媒体数据压缩标准7.3.1静态图像压缩标准第三十页,共三十四页。​教学进程●MPEG标准

●H.26X标准7.3常见多媒体数据压缩标准7.3.1动态图像和视频压缩标准第三十一页,共三十四页。​END1.

多媒体数据为什么需要进行压缩?2.

多媒体数据为什么能进行压缩?3.

多媒体数据存在哪些类型的冗余?4.

数据压缩技术可分为哪几类?各有什么特点?5.

如何衡量一种数据压缩方法?6.

简述行程编码过程。7.

简述哈夫曼编码

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论