CH4数据压缩课件_第1页
CH4数据压缩课件_第2页
CH4数据压缩课件_第3页
CH4数据压缩课件_第4页
CH4数据压缩课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章多媒体数据压缩多媒体数据编码算法分类静态图像压缩标准JPEG视频图像压缩标准4.1

4.24.3数据压缩基本概念和方法多媒体具有数据量大和传输速率高的特点,使用压缩技术可以降低存储器和带宽的要求。数据压缩实际就是减少或取消冗余数据的过程。为什么要对多媒体数据进行压缩处理?媒体信息的数据量大,不利于计算机的数据存储和传输什么是数据压缩?用最少的数码来表示信号,叫数据压缩为什么可以对数据进行压缩?数据中存在一些多余的成分(冗余数据),去除这些冗余部分,不会影响人体的感官有哪些数据冗余的形式?空间冗余、结构冗余、知识冗余、视觉冗余、信息熵冗余数据压缩的基本概念一、压缩的必要性:一篇约100页的word文档,未压缩为14MB,使用winRAR压缩后为7.3MB,使用Acrobat转换后为850KB;一篇1024×768的真彩色图像,占有尺寸为2.25MB;

1分钟CD音乐的大小为10.3MB;数据压缩的基本概念二、压缩的可行性:信息论认为,若信源编码的熵大于信源的实际熵,则该信源中一定存在冗余。冗余的分类:空间冗余时间冗余结构冗余视觉、听觉冗余信息熵冗余知识冗余时间冗余序列图像(电视图像、动画)中所包含的冗余信息。例如,原地踏步结构冗余是在某种场景中,存在明显的图像分布模式,这种分布模式称为结构冗余。例如,方格状的图案空间冗余图像数据中经常存在的一种冗余。例如,一幅图像中连续的区域为相同颜色数据压缩的基本概念信息熵冗余也称为编码冗余,如果图像中平均每个像素使用的比特数超过该图像的信息熵,则图像中存在冗余,该冗余称为信息熵冗余。知识冗余指某些图像的结构可以由这些图像的先验知识和背景知识获得。视听觉冗余指人的视觉、听觉的分辨率低于实际图像、音频的分辨率所产生的冗余,使用算法将其去掉并不会丢失实质性的信息或含义。数据压缩的基本概念数据压缩的基本概念三、压缩的原理:计算机处理的数据是以二进制存储的,因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。只要通过合理的数学计算公式,文件的体积都能被压缩到“数据无损稠密”的效果。4.1多媒体数据压缩编码方法分类根据有无质量损失,分为:有损压缩、无损压缩根据其作用域在空间域或频域上,分为:空间方法、变换方法、混合方法根据是否自适应,分为:自适应编码、非自适应编码有损压缩编码PCM编码预测编码DPCM编码ADPCM编码帧间预测编码变换编码DCT变换K-L变换小波变换无损压缩编码霍夫曼编码行程编码算术编码混合编码JPEGMPEGH.261一、概念:无损压缩:指使用压缩后的数据进行重构,重构后的数据与原来的数据完全相同。如zip,rar等有损压缩(不可逆):指使用压缩后的数据进行重构,重构后的数据与原来数据有所不同,但不影响人对原始资料表达信息的理解,不会造成误解。如jpeg,mpeg等4.1多媒体数据压缩编码方法分类压缩比率:被压缩的文件原始大小与压缩后文件大大小的比率。压缩质量:即压缩的数据与原来有无明显差别,对无损压缩而言,不存在该问题。压缩与解压的速度:实现压缩的算法要简单,压缩和解压的速度越快越好。4.1多媒体数据压缩编码方法分类4.1.1PCM脉冲编码调制一、概念:

PCM,脉冲编码调制,其工作原理是对模拟声音信号进行采样、量化、编码后得到数字编码(PCM样本)。即模拟量经A/D转换后得到的二进制码的过程。4.1.1PCM编码框图:4.1.1PCM脉冲编码调制4.1.1PCM——量化的分类二、量化的分类:1、均匀量化:即采用相同的量化间隔对采样得到的信号进行量化,也称为线性量化。2、非均匀量化:即采用不同的量化间隔……,也称为非线性量化。说明:现代通讯系统都采用非线性量化。4.1.1PCM——非线性量化在非线性量化中,采样输入信号幅度与量化输出数据之间定义了两种对应关系:Α律压扩算法和μ律压扩算法。

Α律压扩算法主要用在欧洲和中国大陆等地区的数字电话通信中;μ律压扩主要用于北美和日本等地。4.1.2预测编码什么是预测?知道某时刻以前信号的表现,就可以推断它以后的数值。具体到信号的采样过程,就是通过前几次的样值来预测后一次的样值。预测编码的应用:多用于图像和声音压缩。因为对于图像而言,预测的对象是下一个像点、下一条线或下一帧,像素间存在一定的相关性。声音也是如此。类型帧内预测(DPCM和ADPCM)和帧间预测。4.1.2预测编码预测编码是有损压缩编码,预测编码是根据算法模型,用已有的样本值对新样本进行预测,得到一个预测值,然后将样本的实际值与预测值相减得到预测误差值,再对该误差值进行编码。如果误差值越小,则预测越准确,即误差的幅度小于原始信号,从而达到数据压缩的目的。原理:(1)根据算法模型,用原有的样本值对新样本进行预测,得到新样本的预测值。(2)新样本的实际数值-预测值=预测误差值(3)对误差值进行编码由此可见,预测越准确,误差越小,压缩率越高。模拟信号TEXT预测计算误差差值编码数字信号4.1.2预测编码4.1.2预测编码——DPCMDPCM差分脉冲编码调制,是预测编码中最主要的方法。利用样本间存在的信息冗余进行编码。与PCM区别:PCM:量化每一个样本值DPCM:量化的是实际值与预测值之间的差值

实现:(1)输入信号是Xn,即样本值(2)预测器计算预测值Xn’(3)对误差值en

(=Xn-Xn’)进行量化编码e’n(4)解码时,用误差编码值e’n+Xn’还原信号4.1.2预测编码——DPCM举例说明DPCM编码原理:

在图像信号中使用DPCM,主要用于像素的比较,用作预测的像素和被预测的像素在同一行、同一帧或不同帧上,在比较时,若两像素存在差异,则传送该差值;若不存在差异,则是数据冗余,不传送。4.1.2预测编码——DPCM举例说明DPCM编码原理:

设DPCM系统预测器的预测值为前一个样值,假设输入信号已经量化,差值不再进行量化。若系统的输入为{0121123344…},则预测值为{0012112334…},差值为{011–1011010…},差值的范围比输入样值小,可以用较少的位数进行编码。4.1.2预测编码由此可见,建立一个理想的预测器是很关键的。思考:能否精确的预测数据源输出?不能,因为数据源是不确定的。没有一个实际的系统能找到可以精确预测输出的模型,能找到最优预测模型是以某种最小误差意义下的预测模型。4.1.2预测编码——ADPCMDPCM技术存在的问题:如果某一个像素的编码出错,可能导致后面的像素在预测时产生更大的误差。解决方法:ADPCM(自适应差分脉冲编码)根据图像区域的分布特点自动调节预测器的预测系数(自适应预测)和量化器的量化参数(自适应量化)2.2.2预测编码——ADPCM二、自适应量化:利用自适应的思想来改变量化阶的大小,即使用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值。一、自适应预测:算法中有不同的预测参数,编码时根据特征自动的选择采用哪组预测参数。4.1.3变换编码例早期的彩色电视机:由于人眼对亮度的敏感性远远大于对色度的敏感性,所以将RGB颜色空间的色彩转换到YCbCr空间,并利用较低的分辨率来表示色差(Cb和Cr)信号。这使得彩色电视机可以使用与黑白电视机相同的约6M的带宽来传送,而人眼感觉不到太大差别。4.1.3变换编码4.1.3变换编码变换编码是一种有损压缩编码,主要用于图像数据的压缩。原理:将图像信号从一个域(比如时间域)变换到另一个域(比如频率域),然后对变换后的信号进行量化与编码。常用的变换编码有K-L变换、傅里叶变换、离散余弦变换(DCT)等。4.1.4统计编码统计编码分为定长码和变长码。常用的是变长码。预测编码和变换编码通过去除数据间的相关性达到压缩的目的;统计编码则根据消息出现的概率分布特性进行压缩编码。4.1.5Huffman编码1952年,Huffman提出从下到上的编码方法,它是一种统计最优的变码长符号编码,让出现最频繁的符号具有最短的编码。一、编码过程:即生成一棵二叉树(H树),树中的叶节点为被编码符号及其概率;中间节点为两个概率最小的符号所构成的符号串及其概率所组成的父节点;根节点为所有符号之串及其概率为1。是一种统计编码,无损4.1.5Huffman编码二、编码步骤:1、将符号按照出现概率递减的顺序从左到右排列树叶节点;2、将概率最小的两个符号的概率相加,组成父节点,并计算父节点的概率,并在到左右节点的两根连线上分别标记0和1;3、重复步骤1和2直到概率相加的结果等于1(即得到根节点),形成一棵二叉树为止;4、从根节点开始到相应于符号的叶节点的0/1串,就是该符号的二进制编码。4.1.5Huffman编码三、例1:

有一幅40个像素组成的灰度图像,灰度共有5级,分别用符号A,B,C,D,E表示,40个像素中各级灰度出现的次数见下表所示,如采用霍夫曼编码对其压缩,请计算压缩比。符号ABCDE出现的次数1577654.1.5Huffman编码四、说明:1、概率大的符号编码长度短,概率小的符号编码长度长。2、H树并不是唯一的,即编码结果不唯一,但这仅仅是分配的代码不同,而代码的平均长度是相同的。例2:某一事件序列agdfaghdabsb,请写出其霍夫曼编码过程。1、电视信号

电视系统中,摄像机的功能将镜头前的图像转换为电子信号;电视机的功能是将电子信号转换为活动图像。4.1.7电视编码扫描的两种方式:逐行和隔行方式三种广播电视标准:NTSC、PAL、SECAM4.1.7电视编码两种电视编码方法:分量编码与复合信号编码1、混合编码JPEG和MPEG等压缩标准都采用了多种编码方法。4.1.8其他编码2、行程编码

属于统计编码的一种,无损。4.1.8行程编码(RLE)又称为游程编码,是一种使用广泛的熵编码,它被用于jpeg,mpeg,pdf等编码中。原理:将连续相同的数据值序列用一个重复次数和单个数据值来表示。例如,字符串:AAAAAARRRRTSSSDEEEEEEEEE行程编码表示为:*6A*4RT*3SD*9E4.1.8行程编码(RLE)说明:(1)*表示RLE编码的开始,后面的字符表示重复次数,数字后的字符即被重复的字符。(2)RLE译码采用与编码相同的规则,还原后的数据与压缩前完全一致,因此,属于无损压缩编码。(3)连续相同的字符数越多,压缩比越高。而压缩比究竟多少,取决于数据本身的特点,如果图像数据中具有相同颜色的图像块越大,获得的压缩比就越高;反之压缩比就小。4.1.8增量调制编码DM是一种预测编码技术。由前一个信号的编码值得到下一个信号的预测值,然后对实际值与预测值之差的极性进行编码,将极性变成“0”和“1”这两种可能的取值之一。如果极性为正,则编码输出为1;反之则为0。4.1.8词典编码词典编码(DictionaryEncoding)是根据数据(字符串)本身包含有重复代码块(词汇)这个特性。4.1.8词典编码输入串ABABABCBABABABCBABAB,采用LZW算法:循环次数缓冲区读取字符表中存储内容发送内容新的缓冲值1ABAB(代码=3)0(A的代码)B2BABA(代码=4)1(B的代码)A3ABAB4ABAABA(代码=5)3(AB的代码)A5ABAB6ABCABC(代码=6)3(AB的代码)C7CBCB(代码=7)2(C的代码)B8BABA9BABBAB(代码=8)4(BA的代码)B循环次数缓冲区读取字符表中存储内容发送内容新的缓冲值10BABA11BABBAB12BABABABA(代码=9)8(BAB的代码)A13ABAB14ABCABC15ABCBABCB(代码=10)6(ABC的代码)B16BABA17BABBAB18BABABABA19BABABBABAB(代码=11)9(BABA的代码)总结1、PCM:采样、量化、编码2、DPCM:预测、量化(误差值=样本实际值-预测值)、编码3、ADPCM:自动调节预测器的预测系数(自适应预测)和量化参数(自适应量化)总结4、变换编码:将图像信号从一个域变换到另外一个域,对变换后的信号进行编码5、行程编码:把连续的数据值序列用一个重复次数和单个数据值表示。比如*3AB*2C6、霍夫曼编码:基于不同符号出现的不同概率使用不同的编码位数。4.2静态图像压缩标准静态图像压缩标准中使用最广泛的是JPEG标准,可以支持很高的图像分辨率和量化精度。

1986年,ISO和CCITT成立“JointPhotographicExpertGroup联合图像专家小组”,专门致力于静态图像压缩的研究。静态图像压缩技术主要对空间信息进行压缩,获得极高的压缩比(10:1——40:1),属有损压缩。4.2静态图像压缩标准迄今为止,JPEG已开发三个图像标准:1、JPEG标准,正式名叫“连续色调静止图像的数字压缩编码”,于1991年公布;2、JPEG-LS,静态图像无损编码,1999年公布;3、JPEG2000,该标准不仅仅提高图像的压缩质量,还包含许多新功能,包括根据图像质量、视觉感受和分辨率进行渐进传输等。4.2静态图像压缩标准JPEG确定的目标是:1、达到近乎完美的图像质量;2、可以压缩任何连续色调的静止图片,包括灰度和色彩,任意的色彩空间和大多数尺寸;3、可适用于大部分的通用计算机平台,硬件条件适中。JPEG花费了大量的时间,致力于图像的压缩和实现。他们在思维上创新且拥有精湛的技术,终于使JPEG静止图片压缩技术成为一种最广泛认可的标准。JPEG的基本压缩方式已成为一种通用技术,很多应用程序都采用了与之配套的软硬件。4.2静态图像压缩标准一、JPEG标准包含三个层次:1、基本系统:用于压缩和解压,保持高压缩比2、扩展系统:用于特殊压缩需求3、特殊无损功能:保证解压后数据没有损失二、JPEG标准具有四种工作模式:基于DCT(离散余弦变换)的顺序编码、基于DCT的累进编码、无损编码、分层编码JPEG四种工作模式1、顺序的基于DCT模式(SequentialDCT-based)由DCT系数的形成、量化和熵编码三步组成。从左到右、从上到下扫描信号,为每个图像编码。2、累进的基于DCT模式(ProgressiveDCT-based)

生成DCT系数和量化中的关键步骤与基本顺序编码解码器相同,主要区别在于每个图像部件由多次扫描进行编码,而不是一次扫描,每次继续的扫描都对图像做了改善,直到达到由量化表建立的图像质量为止。3、无损模式(Lossless)独立于DCT处理,用来定义一种达到无损连续色调压缩的手段。预测器将采样区域组合起来并基于采样区域预测出邻系统区域,预测出的区域对照着每一区域的完全无损采样进行预测,同时通过Huffman编码或算术熵编码法对这一差别进行无损编码。4、分层模式(Hierarcical)该模式的原理是将一个图像的空间分辨率按水平和垂直方向分成多个分辨率进行编码,使高分辨率的图像输出时为低分辨率的图像。JPEG四种工作模式三、JPEG编码原理

JPEG编码主要存储颜色变化,尤其是亮度变化,因为人眼对亮度变化要比对颜色变化更为敏感。只要压缩后重建的图像与原来图像在亮度变化、颜色变化上相似,在人眼看来就是同样的图像。其原理是不重建原始画面,而生成与原始画面类似的图像,丢掉那些未被注意到的颜色。四、JPEG编码步骤:图像处理(预测或变换)、量化、编码4.2静态图像压缩标准4.2.1

JPEG编码步骤1、图像处理:使用离散余弦变换DCT,把空间域表示的图变换成频率域表示的图。2、量化:使用加权函数对DCT系数进行量化,这个加权函数对于人的视觉系统视最佳的。3、熵编码:使用Huffuman可变字长编码器对量化系数进行编码。原始图像DCT量化编码压缩图像1、DCT变换:是傅立叶变换的一种,指在对图像处理时,将图像分成8×8的图像块,同时将采样数据转换为符号整数,产生64个DCT系数。4.2.1

JPEG编码步骤说明:当i=0,j=0时,得到64个值的平均,称为直流系数DC,其余i,j取1~~7时,称为交流系数AC。假设P描述某图像的亮度(R亮度),取值0~~255。4.2.1

DCT变换——举例2、量化:量化过程是将DCT系数除以量化表中对应位置的量化步长(量化表中的元素)后四舍五入取整。量化实际是进一步的压缩。4.2.1

JPEG编码步骤说明:其中,U矩阵为量化步长,根据人类的视觉特性制定了均匀量化表。4.2.1量化——举例3、编码:4.2.1

JPEG编码步骤DCT后,产生1个DC系数和63个AC系数。在编码前对8×8矩阵中64个系数进行Z字编排,。对AC系数采用RLC编码方法。DC系数的特点:能量集中在这里,值较大相邻子块的DC值变化不大,因此采用DPCM。继续对DC和AC系数采用熵编码进一步压缩。一、其编码方式有两种:1、基于DCT的编码模式:主要为了兼容JPEG,但对算法进行了改进;2、基于小波变换的编码模式:将一幅图像作为一个整体进行变换和编码,压缩比高。4.2.3

JPEG2000标准二、JPEG的优点静态图像常用JPEG标准进行信息压缩。目前JPEG中使用

A

算法,它属于

B

方法。JPEG是有损压缩,恢复的图像质量低于原来的图像,为了获得较高信息压缩比,误差由

C产生。

A:

①DFT

②DCT

③wavelet

④K-L

B:

①矢量编码

②统计编码

③预测编码

④变换编码

C:

①所有的算法本身②对算法产生的数据进行量化

③对量化的数据进行熵编码

④图像恢复算法JPEG思考题4.3动态图像压缩标准1988年,由运动图像专家组(MPEG)制定。

MPEG的基本方法是:在单位时间内采集并保存第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论