图像压缩(my)青岛大学_第1页
图像压缩(my)青岛大学_第2页
图像压缩(my)青岛大学_第3页
图像压缩(my)青岛大学_第4页
图像压缩(my)青岛大学_第5页
已阅读5页,还剩151页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、图像压缩编码图像压缩编码图像压缩编码图像压缩编码 数据压缩与信息论基础数据压缩与信息论基础 图像压缩与编码基本概念图像压缩与编码基本概念 信息论基础信息论基础 图像压缩编码图像压缩编码 无损压缩无损压缩 有损压缩有损压缩 图像压缩编码主要国际标准图像压缩编码主要国际标准静止图像压缩编码标准静止图像压缩编码标准-JPEG运动图像压缩编码标准运动图像压缩编码标准-MPEG 第一节图像压缩与编码基本概念第一节图像压缩与编码基本概念 为什么要进行图像压缩为什么要进行图像压缩 图像数据压缩的可能性图像数据压缩的可能性 数据冗余数据冗余 图像压缩的目的图像压缩的目的 图像数据压缩技术的重要指标图像数据压缩

2、技术的重要指标 图像数据压缩的应用领域图像数据压缩的应用领域 图像编码中的保真度准则图像编码中的保真度准则 信息论基础信息论基础 图像压缩模型图像压缩模型一一. .为什么要进行图像压缩?为什么要进行图像压缩? 数字图像通常要求很大的比特数,这给图像的数字图像通常要求很大的比特数,这给图像的传输和存储带来相当大的困难。要占用很多的资源,传输和存储带来相当大的困难。要占用很多的资源,花很高的费用。花很高的费用。 如一幅如一幅512*512的灰度图象的比特数为的灰度图象的比特数为 512*512*8= 再如一部再如一部9090分钟的彩色电影,每秒放映分钟的彩色电影,每秒放映2424帧。帧。把它数字化

3、,每帧把它数字化,每帧512*512象素,每象素的象素,每象素的 、 、三分量分别占三分量分别占8 bit8 bit,总比特数为,总比特数为 90*60*24*3*512*512*8bit=。 如一张如一张CDCD光盘可存光盘可存600600兆字节数据,这部电兆字节数据,这部电影光图像(还有声音)就需要影光图像(还有声音)就需要张张CDCD光盘用来光盘用来存储。存储。 对图像数据进行压缩显得非常必要。对图像数据进行压缩显得非常必要。 二二. .图像数据压缩的可能性图像数据压缩的可能性 一般原始图像中存在很大的冗余度。一般原始图像中存在很大的冗余度。 用户通常允许图像失真。用户通常允许图像失真。

4、 当信道的分辨率不及原始图像的分辨率时,降当信道的分辨率不及原始图像的分辨率时,降低输入的原始图像的分辨率对输出图像分辨率影低输入的原始图像的分辨率对输出图像分辨率影响不大。响不大。 用户对原始图像的信号不全都感兴趣,可用特用户对原始图像的信号不全都感兴趣,可用特征提取和图像识别的方法,丢掉大量无用的信息征提取和图像识别的方法,丢掉大量无用的信息。提取有用的信息,使必须传输和存储的图像数。提取有用的信息,使必须传输和存储的图像数据大大减少。据大大减少。 设:设:n1和和n2是在两个表达相同信息的数据集中,所携是在两个表达相同信息的数据集中,所携带的单位信息量。带的单位信息量。 压缩率压缩率:描

5、述压缩算法性能描述压缩算法性能CR = n1 / n2其中,其中,n1是压缩前的数据量,是压缩前的数据量,n2是压缩后的数据量是压缩后的数据量 相对数据冗余相对数据冗余:RD = 1 1/CR例:例:CR=20; RD = 19/20描述信源的数据是信息量(信源熵)和信息冗余量之和。描述信源的数据是信息量(信源熵)和信息冗余量之和。三三. . 数据冗余数据冗余1 1)数据冗余的基本概念)数据冗余的基本概念 A. A. 编码冗余:编码冗余: 2 2)常见的数据冗余)常见的数据冗余在数字图像压缩中,常有在数字图像压缩中,常有3种基本的数据冗余:编码冗种基本的数据冗余:编码冗余、像素间的冗余以及心理

6、视觉冗余余、像素间的冗余以及心理视觉冗余为表达图像数据需要用一系列符号,用这些符号根据为表达图像数据需要用一系列符号,用这些符号根据一定的规则来表达图像就是对一定的规则来表达图像就是对图像编码图像编码。对每个信息或事件所赋的符号序列称为对每个信息或事件所赋的符号序列称为码字码字,而每个,而每个码字里的符号个数称为码字里的符号个数称为码字的长度码字的长度。设定义在设定义在0,1区间的离散随机变量区间的离散随机变量sk代表图像的灰度代表图像的灰度值,每个值,每个sk以概率以概率ps(sk)出现出现Ps(sk)=nk/n k=0,1,2,L-1其中其中L为灰度级数,为灰度级数,nk是第是第k个灰度级

7、出现的次数,个灰度级出现的次数,n是是图像中像素总个数。设用来表示图像中像素总个数。设用来表示sk的每个数值的比特的每个数值的比特数是数是 ,那么为表示每个像素所需的平均比特数就,那么为表示每个像素所需的平均比特数就是是avg10( )( )kskLkLl s p s( )kl s编码所用的符号构成的集合称为编码所用的符号构成的集合称为码本码本。等长码:对于一个消息集合中的不同消息,用相同长等长码:对于一个消息集合中的不同消息,用相同长度的不同码字表示,度的不同码字表示,编解码简单,编码效率不高编解码简单,编码效率不高。变长码:与等长码相对应,对于一个消息集合中的变长码:与等长码相对应,对于一

8、个消息集合中的不同消息,也可以用不同长度的码字表示,不同消息,也可以用不同长度的码字表示,编码效编码效率高,编码解码复杂。率高,编码解码复杂。例:如果用例:如果用8 8位表示该图像的像素,我们就说该位表示该图像的像素,我们就说该图像存在着编码冗余,因为该图像的像素只有两图像存在着编码冗余,因为该图像的像素只有两个灰度,用一位即可表示。个灰度,用一位即可表示。如果一个图像的灰度级编码,使用了多于实际如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余。需要的编码符号,就称该图像包含了编码冗余。 B.B.像素冗余:像素冗余: 由于任何给定的像素值,原理上都可以通过它的由

9、于任何给定的像素值,原理上都可以通过它的邻居预测到,单个像素携带的信息相对是小的。邻居预测到,单个像素携带的信息相对是小的。 对于一个图像,很多单个像素对视觉的贡献是冗对于一个图像,很多单个像素对视觉的贡献是冗余的。这是建立在对邻居值预测的基础上。余的。这是建立在对邻居值预测的基础上。 原始图像越有规则,各像素之间的相关性越强,原始图像越有规则,各像素之间的相关性越强,它可能压缩的数据就越多。它可能压缩的数据就越多。例:原图像数据:例:原图像数据:234 223 231 238 235 压缩后数据:压缩后数据:234 11 -8 -7 3相同的目标相同的目标相同的直方图相同的直方图象素间的相象

10、素间的相关性不同关性不同类似还有:类似还有:图像彩色光谱空间的冗余;图像彩色光谱空间的冗余;视频图像信号在时间上的冗余;视频图像信号在时间上的冗余; 一些信息在一般视觉处理中比其它信息的相对重要一些信息在一般视觉处理中比其它信息的相对重要程度要小,这种信息就被称为视觉心理冗余。程度要小,这种信息就被称为视觉心理冗余。 (3)(3)视觉心理冗余:视觉心理冗余:33K15K四四. .图像压缩的目的图像压缩的目的 图像数据压缩的目的是在满足一定图像质量图像数据压缩的目的是在满足一定图像质量条件下,用尽可能少的比特数来表示原始图像,条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图

11、像存储的容量。以提高图像传输的效率和减少图像存储的容量。在信息论中称为信源编码。在信息论中称为信源编码。 图像从结构上大体上可分为两大类,一类是具图像从结构上大体上可分为两大类,一类是具有一定图形特征的结构,另一类是具有一定概率有一定图形特征的结构,另一类是具有一定概率统计特性的结构。统计特性的结构。 基于不同的图像结构特性,应采用不同的压缩基于不同的图像结构特性,应采用不同的压缩编码方法。编码方法。五五. .图像数据压缩技术的重要指标图像数据压缩技术的重要指标(1 1)压缩比压缩比:图像压缩前后所需的信息存储量之比,:图像压缩前后所需的信息存储量之比,压缩比越大越好。压缩比越大越好。(2 2

12、)压缩算法压缩算法:利用不同的编码方式,实现对图:利用不同的编码方式,实现对图像的数据压缩。像的数据压缩。(3 3)失真性失真性:压缩前后图像存在的误差大小。:压缩前后图像存在的误差大小。 全面评价一种编码方法的优劣,除了看它全面评价一种编码方法的优劣,除了看它的的编码效率编码效率、实时性实时性和和失真度失真度以外,还要看它以外,还要看它的的设备复杂程度设备复杂程度,是否,是否经济与实用经济与实用。 常采用混合编码的方案,以求在性能和经常采用混合编码的方案,以求在性能和经济上取得折衷。济上取得折衷。 随着计算方法的发展,使许多高效而又比随着计算方法的发展,使许多高效而又比较复杂的编码方法在工程

13、上有实现的可能。较复杂的编码方法在工程上有实现的可能。1)办公自动化;)办公自动化;2)医学图像处理;)医学图像处理;3)卫星遥感遥测系统;)卫星遥感遥测系统;4)高清晰度电视)高清晰度电视HDTV;5)可视电话、会议电视;)可视电话、会议电视;6)移动多媒体图像及视频传输:)移动多媒体图像及视频传输: 彩信业务,手机视频;彩信业务,手机视频;凡是涉及到图像数据的传输、交换与存储的领域均凡是涉及到图像数据的传输、交换与存储的领域均要求进行图像数据的压缩。要求进行图像数据的压缩。六六 图像数据压缩的应用领域图像数据压缩的应用领域七七. .图像编码中的保真度准则图像编码中的保真度准则 图像信号在编

14、码和传输过程中会产生误差,图像信号在编码和传输过程中会产生误差,尤其是在有损压缩编码中,产生的误差应在尤其是在有损压缩编码中,产生的误差应在允许的范围之内。在这种情况下,保真度准允许的范围之内。在这种情况下,保真度准则可以用来衡量编码方法或系统质量的优劣。则可以用来衡量编码方法或系统质量的优劣。通常,这种衡量的尺度可分为通常,这种衡量的尺度可分为客观保真度准客观保真度准则则和和主观保真度准则主观保真度准则。 通常使用的客观保真度准则有输入图像和输出通常使用的客观保真度准则有输入图像和输出图像的图像的均方根误差均方根误差;输入图像和输出图像的;输入图像和输出图像的均方根均方根信噪比信噪比两种。两

15、种。 均方根误差均方根误差: : 设输入图像是由设输入图像是由N NN N个像素组成,个像素组成,令其为令其为f (x ,y)f (x ,y),其中,其中x ,y=0,1,2,N-1x ,y=0,1,2,N-1。这样。这样一幅图像经过压缩编码处理后,送至受信端,再经一幅图像经过压缩编码处理后,送至受信端,再经译码处理,重建原来图像,这里令重建图像为译码处理,重建原来图像,这里令重建图像为g g (x ,y)(x ,y)。它同样包含。它同样包含N NN N个像素,并且个像素,并且x ,y=0,1,2,N-1x ,y=0,1,2,N-1。(1) (1) 客观保真度准则客观保真度准则在在0,1,2,

16、N-10,1,2,N-1范围内范围内x,yx,y的任意值,输入像素和对应的输的任意值,输入像素和对应的输出图像之间的误差可用下式表示:出图像之间的误差可用下式表示:而包含而包含N NN N像素的图像之像素的图像之均方误差均方误差为为: :1010222),(1NxNyyxeNe101022),(),(1NNNNyxfyxgN由式可得到由式可得到均方根误差均方根误差为为2/12eerms( , )( , )( , )e x yg x yf x y 如果把输入、输出图像间的误差看作是噪声,那么,如果把输入、输出图像间的误差看作是噪声,那么,重建图像重建图像g(x,y)g(x,y)可由下式表示:可由

17、下式表示:),(),(),(yxeyxfyxg 在这种情况下,另一个客观保真度准则在这种情况下,另一个客观保真度准则重建图重建图像的均方信噪比如下式表示:像的均方信噪比如下式表示:10102101021010210102),(),(),( ),(),()(NxNyNxNyNxNyNxNymsyxfyxgyxgyxeyxgNS 图像处理的结果图像处理的结果, ,大多是给人观看,由研究人员大多是给人观看,由研究人员来解释的,因此,图像质量的好坏,既与图像本身来解释的,因此,图像质量的好坏,既与图像本身的客观质量有关,也与视觉系统的特性有关。的客观质量有关,也与视觉系统的特性有关。 有时候,客观保真

18、度完全一样的两幅图像可能有时候,客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量,所以又规定了主观保会有完全不相同的视觉质量,所以又规定了主观保真度准则,这种方法是把图像显示给观察者,然后真度准则,这种方法是把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅图像的主观把评价结果加以平均,以此来评价一幅图像的主观质量。质量。 (2) (2) 主观保真度准则主观保真度准则评分评分评价评价说明说明1优秀的优秀的优秀的具有极高质量的图像优秀的具有极高质量的图像2好的好的 是可供观赏的高质量的图像,干扰并不令人讨厌是可供观赏的高质量的图像,干扰并不令人讨厌 3可通过的可通过的 图像质量可

19、以接受,干扰不讨厌图像质量可以接受,干扰不讨厌4边缘的边缘的图像质量较低,希望能加以改善,干扰有些讨厌图像质量较低,希望能加以改善,干扰有些讨厌5劣等的图像质量很差,尚能观看,干扰显著地令人讨厌6不能用不能用图像质量非常之差,无法观看图像质量非常之差,无法观看另外一种方法是规定一种绝对尺度,如:另外一种方法是规定一种绝对尺度,如:表表6.1 6.1 电视图像质量评价尺度电视图像质量评价尺度八八. .信息理论信息理论(一)、信源空间概述(一)、信源空间概述1 1、信息:事物运动状态或存在方式的不确定性的描述;、信息:事物运动状态或存在方式的不确定性的描述;2 2、信源:、信源:信源是产生各类信息

20、的实体。信源给出的符号信源是产生各类信息的实体。信源给出的符号是不确定的,可用随机变量及其统计特性描述。是不确定的,可用随机变量及其统计特性描述。 信源空间:随机符号及其出现概率的空间;信源空间:随机符号及其出现概率的空间;3 3、信源的分类:、信源的分类:(1 1)连续信源)连续信源离散信源;离散信源;(2 2)无记忆信源)无记忆信源有记忆信源(相关信源)有记忆信源(相关信源)有限长度有限长度记忆信源(记忆信源(MarkovMarkov信源)信源)(二)、信息的度量(二)、信息的度量1、信息公理、信息公理(1)信息由)信息由不确定性程度不确定性程度进行度量;进行度量; 确定事件的信息量为零。

21、确定事件的信息量为零。(2)不确定性程度)不确定性程度越高越高信息量信息量越大越大;(3)相互独立性与信息量可加性;)相互独立性与信息量可加性; 独立事件的联合信息等于两个独立事件的信息总和。独立事件的联合信息等于两个独立事件的信息总和。 满足上述公理的函数为:满足上述公理的函数为:)(log)(aPaI2、离散无记忆信源(、离散无记忆信源(DNMS)的信息量度量:)的信息量度量:(1)信源符号)信源符号 的自信息量定义为:的自信息量定义为:)(log)(iiaPaI(a)非负性;非负性;(b)信息量的单位:信息量的单位:底为底为2时时单位为:比特(单位为:比特(bit)底为底为e时时单位为:

22、奈特(单位为:奈特(Nat)底为底为10时时单位为:哈特单位为:哈特ia(2)、信源平均自信息量(信息熵)、信源平均自信息量(信息熵)离散无记忆信源离散无记忆信源A的平均自信息量(信息熵)定义为:的平均自信息量(信息熵)定义为:miiimiiiaPaPaIaPAH11)(log)()()()(熵是编码所需比特数的下限,即编码所需要最少的比特熵是编码所需比特数的下限,即编码所需要最少的比特例例 :设设8个随机变量具有同等概率为个随机变量具有同等概率为18,计算信息,计算信息熵熵H。 解解 :根据公式根据公式4-10可得:可得:H=8*-1/8*(log2(1/8)=8*-1/8*(-3)=3 图

23、像熵图像熵指该图像的平均信息量,即表示图像指该图像的平均信息量,即表示图像中各个灰度级比特数的统计平均值,等概率事件中各个灰度级比特数的统计平均值,等概率事件的熵最大。的熵最大。3、平均码字长、平均码字长借助熵的概念可以定义量度任何特定码的性能的准借助熵的概念可以定义量度任何特定码的性能的准则,即平均码字长度。则,即平均码字长度。其中其中i为灰度级为灰度级di所对应的码字长度。所对应的码字长度。 的单位也的单位也是比特是比特/字符。字符。 miiidpN1)(N4、编码效率、编码效率编码符号是在字母集合编码符号是在字母集合A=a1,a2,a3,am中选取的中选取的。如果编码后形成一个新的等概率

24、的无记忆信源,字母。如果编码后形成一个新的等概率的无记忆信源,字母数为数为n,则它的最大熵应为,则它的最大熵应为logn比特比特/符号。因此这是一符号。因此这是一个极限值。如果个极限值。如果H(d)/ =logn,则可以认为编码效率,则可以认为编码效率已经达到已经达到100%,如果,如果H(d)/ logn,则可认为编,则可认为编码效率较低。码效率较低。NnNdHlog)(nNdHnNRdlog)(log1N编码效率编码效率冗余度冗余度 根据信息熵编码理论,可以证明在根据信息熵编码理论,可以证明在 H条件下,总可条件下,总可以设计出某种无失真编码方法。以设计出某种无失真编码方法。 若编码结果使

25、若编码结果使 远大于远大于H,表明这种编码效率很低,占,表明这种编码效率很低,占用的比特数太多。用的比特数太多。 若编码结果使若编码结果使 等于或接近于等于或接近于H,这种状态的编码方法,这种状态的编码方法称为最佳编码。称为最佳编码。 若要求编码结果使若要求编码结果使 1)NvyNuxyxfvucvuFNxNy2) 12(cos2) 12(cos),(),(),(101001, 1 , 0,NvuNvyNuxvuFvucyxfNuNv2) 12(cos2) 12(cos),(),(),(101011, 1 , 0,Nyx2104N0102/102/1),(uvvuuvvuvuc且二维离散余弦变

26、换:)()(1010) 1( )(1)(ubxbNxiNiixfNuB1, 1 , 0Nu)()(1010) 1( )()(ubxbNuiNiiuBxf1, 1 , 0Nx离散哈达玛变换)()()()(1010210) 1( ),(1),(vbybubxbNxNyiNiiiiyxfNvuB1, 1 , 0,Nvu)()()()(101010) 1( ),(),(vbybubxbNuNviNiiiivuByxf1, 1 , 0,Nyx 基于FFT变换的图像压缩技术 基于DCT变换的图像压缩技术 基于变换的图像压缩技术 例erms 均方根误差从erms值比较可知,DCT比FFT和HT有更强的信息集

27、中能力.例如,在JPEG图像压缩算法中,首先将输入图像划分为88的方块,然后对每一个方块执行二维离散余弦变换,最后将变换得到的量化的DCT系数进行编码和传送,形成压缩后的图像格式。在接受端,将量化的DCT系数进行解码,并对每个88方块进行二维IDCT,最后将操作完成后的块组合成一幅完整的图像。 在变换编码中,首先要将图像数据分割成子图像,然后对子图像数据块实施某种变换,如DCT变换,那么子图像尺寸取多少好呢?根据实践证明子图像尺寸取44、88、1616适合作图像的压缩,这是因为: 如果子图像尺寸取得太小,虽然计算速度快,实现简单,但压缩能力有一定的限制。 如果子图像尺寸取得太大,虽然去相关效果

28、变好,因为象DFT、DCT等正弦型变换均具有渐近最佳性,但也渐趋饱和。若尺寸太大,由于图像本身的相关性很小,反而使其压缩效果不显示,而且增加了计算的复杂性。 (2) 子图像尺寸选择变换编码的步骤 这里考虑对子图像经过变换后,要截取的变换系数的数量和保留系数的精度。在大多数变换编码中,选择保留的系数办法有以下二种: 根据最大方差进行选择的,称为区域编码。 根据最大值的量级选择,称为阈值编码。 而整个对变换后的子图像的截取、量化和编码过程称为比特分配 (3) 比特分配变换编码的步骤区域编码具有最大方差的变换系数携带着图像大部分信息并在编码处理的过程中应该保留下来。uvnunvvumvuTHF),(

29、),(1010最大方差的系数通常被定位在图像变换的原点周围。区域取样处理可看成每个T(u,v)与相应的区域模板中的元素相乘。对区域取样过程中保留的系数必须进行量化和编码。因此,区域模板有时表示成对每个系数编码的比特数。两种分配方案:给系数分配相同的比特数给系数不均匀地分配几个固定数目的比特数(a)(b)区域编码的几点说明:因为人眼对亮度信号比对色差信号更敏感,因此使用了两种因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。此外,由于人眼对低频分量量化表:亮度量化值和色差量化值。此外,由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步的图

30、像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。距要比右下角的量化步距小。例:阈值编码(门限编码)对任何子图像,最大量级的变换系数对重构子图像的品质具有最大的影响.因为不同子图像的最大系数的位置是变化的,所以通常将 m(u,v)T(u,v) 的元素重新排列成一个一维行程编码.有3种基本途径对一幅变换后的子图像进行门限处理(即生成子图像门限模板函数) 对所有的子图像使用单一的全局门限; 对不同图像的压缩等级不同. 对每幅图像使用不同的门限; 对每幅子图像丢弃相同数目的系数,编码率恒定. 门限随子图像中每个系数的位置函数的变化而变化. 编码率变化,但是可以将门限处理和

31、量化过程结合起来.),(),(),(vuZvuTroundvuT),(vuT),(vuT) 1, 1() 1 , 1()0 , 1() 1, 1 () 1 , 1 ()0 , 1 () 1, 0() 1 , 0()0 , 0(nnZnZnZnZZZnZZZZ对Z(u,v)赋予某个常数c 使用88 DCT系数的12.5%门限编码区域编码利用DCT标准化阵列的压缩34:167:18:1误差预测编码的基本概念预测编码的基本概念 预测编码(预测编码(PredictionCodingPredictionCoding)是根据某一种模型,利用以前的是根据某一种模型,利用以前的(已收到)一个或几个样值,对当前

32、的(正在接收的)样本值(已收到)一个或几个样值,对当前的(正在接收的)样本值进行预测,将样本实际值和预测值之差进行编码。进行预测,将样本实际值和预测值之差进行编码。如果模型足如果模型足够好,图像样本时间上相关性很强,一定可以获得较高的压缩够好,图像样本时间上相关性很强,一定可以获得较高的压缩比。具体来说,从相邻像素之间有很强的相关性特点考虑,比比。具体来说,从相邻像素之间有很强的相关性特点考虑,比如当前像素的灰度或颜色信号,数值上与其相邻像素总是比较如当前像素的灰度或颜色信号,数值上与其相邻像素总是比较接近,除非处于边界状态。那么,当前像素的灰度或颜色信号接近,除非处于边界状态。那么,当前像素

33、的灰度或颜色信号的数值,可用前面已出现的像素的值,进行预测(估计),得的数值,可用前面已出现的像素的值,进行预测(估计),得到一个预测值(估计值),将实际值与预测值求差,对这个差到一个预测值(估计值),将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法称为预测编码方法。值信号进行编码、传送,这种编码方法称为预测编码方法。预测编码预测编码2022-4-9统计编码126v就是根据过去的信号样值预测下一个样值,并仅把预就是根据过去的信号样值预测下一个样值,并仅把预测值与现实的样值之差(预测误差)加以量化、编码以测值与现实的样值之差(预测误差)加以量化、编码以后进行传输的方式,如下图所示

34、,在接收端,经过和发后进行传输的方式,如下图所示,在接收端,经过和发信端的预测完全相同的操作,可以得到量化的原信号,信端的预测完全相同的操作,可以得到量化的原信号,然后再通过低通滤波便可恢复与原信号近似的波形。然后再通过低通滤波便可恢复与原信号近似的波形。预测编码的原理预测编码的原理预测编码的基本思想预测编码的基本思想 建立一个数学模型 利用以往的样本数据 对新样本值进行预测 将预测值与实际值相减 对其差值进行编码,这时差值很少,可以减少编码码位预测编码的分类预测编码的分类 预测编码:预测编码:在均方误差最小的准则下,使其误差最小的方法。 线性预测:线性预测:利用线性方程计算预测值的编码方法。

35、线性预测编码方法,也称差值脉冲编码调制(DifferentionPulseCodeModulation,DPCM) 非线性预测:非线性预测:利用非线性方程计算预测值的编码方法。 帧内预测编码:帧内预测编码:根据同一帧样本进行预测的编码方法。 帧间预测编码:帧间预测编码:根据不同帧样本进行预测的编码方法。 自适应预测编码(自适应预测编码(ADPCMADPCM):):预测器和量化器参数按图像局部特性进行调整的编码方法。 条件补充帧间预测编码:条件补充帧间预测编码:在帧间预测编码中,若帧间对应像素样本值超过某一阈值就保留,否则不传或不存,恢复时就用上一帧对应像素样本值来代替,称为条件补充帧间预测编码

36、。 运动补偿预测编码:运动补偿预测编码:在活动图像预测编码中,根据画面运动情况,对图像加以补偿再进行帧间预测的方法称为运动补偿预测编码方法。DPCMDPCM的基本原理的基本原理对于具有对于具有M M 种取值的符号序列种取值的符号序列 x xk k,其第其第L L个符号的熵满足个符号的熵满足: :知道了前面的符号知道了前面的符号 x xk k( (k k L L),),再猜后续再猜后续符号符号x xL L, ,则知道得越多则知道得越多, ,熵越小。熵越小。意味着该信源的不确定度减小意味着该信源的不确定度减小, ,数码率自然降低。数码率自然降低。基础理论:基础理论:HxxxxHxxxHxxHxHM

37、LLLLLLLLL),|(),|()|()(log1212112发展历史发展历史19521952年,年,BellBell实验室的实验室的B.M.Oliver B.M.Oliver 等人开始线性预测等人开始线性预测编码理论研究。同年,该实验室的编码理论研究。同年,该实验室的C.C.CulterC.C.Culter取得了取得了DPCM (Differential Pulse Code Modulation, DPCM (Differential Pulse Code Modulation, 差分脉差分脉冲编码调制冲编码调制) )系统的专利,奠定了真正实用的预测编码系统的专利,奠定了真正实用的预测编

38、码系统的基础系统的基础。预测编码技术:预测编码技术: 从过去的符号样本来从过去的符号样本来预测预测下一个符号样本的值。下一个符号样本的值。直观理解:直观理解:根据:根据:认为在信源符号之间存在认为在信源符号之间存在相关性相关性。如果符号的预测值与符号。如果符号的预测值与符号的实际值比较接近,它们之间的差值幅度的变化就比原始信的实际值比较接近,它们之间的差值幅度的变化就比原始信源符号幅度值的变化小,因此量化这种差值信号时就可以用源符号幅度值的变化小,因此量化这种差值信号时就可以用比较少的位数来表示差值。比较少的位数来表示差值。DPCMDPCM的基础的基础 对预测的样本值与原始的样本值之差进行编码

39、。对预测的样本值与原始的样本值之差进行编码。DPCM系统系统DPCMDPCM系统原理框图系统原理框图量化器量化器预测器预测器编码器编码器xk-ekkxkekxSk信信 道道解码器解码器预测器预测器kekx接收端接收端发送端发送端kx发送端发送端 先发送一个起始值先发送一个起始值 x0 ; 接着就只发送预测误差值接着就只发送预测误差值 kkkxxe接收端接收端 接收到量化后的误差接收到量化后的误差 与本地算出的预测值与本地算出的预测值 相加相加, ,得到恢复信号得到恢复信号 ;ke kx kxNkkxxxfxNk ),(21式中式中线性预测:线性预测:1( ) , Nkiiixa k xkN式中

40、式中 表示表示 的时序在的时序在 之之前,为因果性预测,否则为非因果性预测。前,为因果性预测,否则为非因果性预测。Nk 21,Nxxxkx如果没有传输误码,预测编码系统的误差为:如果没有传输误码,预测编码系统的误差为:这正是发送端量化器造成的量化误差。即整个预这正是发送端量化器造成的量化误差。即整个预测编码系统的失真完全来自量化器。测编码系统的失真完全来自量化器。对于对于xk 已经是数字信号,去掉量化器,已经是数字信号,去掉量化器, qk = 0 :可用可用于于“信息保持型信息保持型”(Lossless)编码;编码;如果如果qk 0:可用于可用于“非信息保持型非信息保持型”(Lossy)编码。

41、编码。kkkkkqeexx算法简单、速度快、易于硬件实现。编码压缩比不太高,DPCM一般压缩到24bit/s。误码易于扩散,抗干扰能力差。预测编码方法的特点预测编码方法的特点分形编码 分形编码分形编码 分形是分形是20世纪世纪70年代出现的一门非线性学科。分形一年代出现的一门非线性学科。分形一词最早由数学家词最早由数学家Mandelbrot提出,用以描述这样的几何提出,用以描述这样的几何外形,它与欧几里德外形相反,处处无规则可言,但在外形,它与欧几里德外形相反,处处无规则可言,但在各种尺度上都有同样程度的不规则性。各种尺度上都有同样程度的不规则性。 20世纪世纪80年代中期,年代中期,Barn

42、sley提出了迭代函数系统提出了迭代函数系统(IFS)的分形图像压缩编码方法,为图像编码提供了一的分形图像压缩编码方法,为图像编码提供了一个全新的思路。在此之后,他的学生个全新的思路。在此之后,他的学生Jacquin又提出分又提出分块的迭代变换算法理论,为利用计算机自动进行分形块的迭代变换算法理论,为利用计算机自动进行分形压缩奠定了基础。压缩奠定了基础。 从分形的角度,许多视觉上感觉非常复杂的图形其从分形的角度,许多视觉上感觉非常复杂的图形其信息量并不大,可以用算法和程序集来表示,在借助信息量并不大,可以用算法和程序集来表示,在借助计算机可以显示其结合形态,这就是可以用分形的方计算机可以显示其

43、结合形态,这就是可以用分形的方法进行图像压缩的原因。法进行图像压缩的原因。 对于分形图像压缩,它是一个逆问题,即把欲编对于分形图像压缩,它是一个逆问题,即把欲编码的图像当作一组压缩仿射变换的迭代极限,假如码的图像当作一组压缩仿射变换的迭代极限,假如能够找到这些压缩仿射变换的参数,就可以重建原能够找到这些压缩仿射变换的参数,就可以重建原始图像。为此寻找一个压缩仿射变换,使它对原图始图像。为此寻找一个压缩仿射变换,使它对原图像进行压缩仿射变换后的结果能与原图像的一部分像进行压缩仿射变换后的结果能与原图像的一部分吻合。如果原图像各个部分均可被对原图的不同压吻合。如果原图像各个部分均可被对原图的不同压

44、缩仿射变换的结果所覆盖,则就找到了一个将图像缩仿射变换的结果所覆盖,则就找到了一个将图像映射成自身的变换。映射成自身的变换。 分形编码由于其计算量的繁复、庞大,在实际应分形编码由于其计算量的繁复、庞大,在实际应用中受到了限制。用中受到了限制。 图像标准的制定:图像标准的制定: ISOISO和和CCITTCCITT(国际电报电话咨询委员会)联合制定(国际电报电话咨询委员会)联合制定 标准的类型:标准的类型: 连续图像压缩标准:连续图像压缩标准:静止帧黑白、彩色压缩:静止帧黑白、彩色压缩:(1)(1)面向静止的单幅图像面向静止的单幅图像JPEGJPEG连续帧黑白、彩色压缩:连续帧黑白、彩色压缩:(

45、2)(2)面向连续的视频影像面向连续的视频影像MPEGMPEG 第四节图像压缩编码标准第四节图像压缩编码标准 JPEG标准简述标准简述 JPEG压缩流程压缩流程 JPEG压缩算法的实现压缩算法的实现 JPEG压缩举例压缩举例 静止图像压缩编码标准静止图像压缩编码标准JPEG JPEG JPEG标准简述标准简述 由由ISO/IECISO/IEC与与CCITTCCITT联合发起的联合图像专家联合发起的联合图像专家组,在过去十几年图像编码研究成果的基础上于组,在过去十几年图像编码研究成果的基础上于2020世纪世纪9090年代初制定了静止图像年代初制定了静止图像( (包括包括8bit/8bit/像素像

46、素的灰度图像与的灰度图像与24bit/24bit/像素的彩色图像像素的彩色图像) )的编码标准。的编码标准。 JPEGJPEG标准在较低的计算复杂度下,能提供较标准在较低的计算复杂度下,能提供较高的压缩比与保真度。在视觉效果不受到严重损高的压缩比与保真度。在视觉效果不受到严重损失的前提下,算法可以达到失的前提下,算法可以达到1515到到2020的压缩比。如的压缩比。如果在图像质量上稍微牺牲一点的话,可以达到果在图像质量上稍微牺牲一点的话,可以达到40:140:1或更高的压缩比。或更高的压缩比。 JPEG JPEG定义了一个基本系统,一个符合定义了一个基本系统,一个符合JPEGJPEG标准的编标

47、准的编解码器至少要满足基本系统的技术指标。解码器至少要满足基本系统的技术指标。JPEGJPEG基本系统基本系统其核心属于其核心属于变换编码变换编码。JPFGJPFG编码时,对原始图像的每一编码时,对原始图像的每一个分量首先分割成互不重叠的个分量首先分割成互不重叠的8 88 8像素块,然后对每个像素块,然后对每个像素块的编码过程可分为二维像素块的编码过程可分为二维DCTDCT变换。变换。 根据图像信号的特点,对图像块进行二维根据图像信号的特点,对图像块进行二维DCTDCT变换可变换可以消除像素间的相关性。自然图像的像素块经以消除像素间的相关性。自然图像的像素块经DCTDCT变换变换后,图像信号的

48、能量主要集中到块的左上角,即图像的后,图像信号的能量主要集中到块的左上角,即图像的低频成分中。低频成分中。 DCTDCT变换后得到的系数矩阵中包括左上角变换后得到的系数矩阵中包括左上角的一个直流的一个直流(DC)(DC)系数与系数与6363个交流个交流(AC)(AC)系数,从左到系数,从左到右水平频率增高,从上到下坚直频率增高。右水平频率增高,从上到下坚直频率增高。JPEGJPEG编码的总体框架编码的总体框架输入图像图像被分割成8*8小方块DCT变换标量量化和DC系数预测熵编码基于块编码码流之字形扫描,游程编码JPEGJPEG图像压缩算法图像压缩算法q JPEG JPEG 是有损压缩算法是有损

49、压缩算法q JPEG JPEG 核心是离散余弦变换核心是离散余弦变换(DCT)(DCT) 连续帧图像的定义连续帧图像的定义 连续帧图像压缩的基本思想连续帧图像压缩的基本思想 帧间运动补偿预测编码技术帧间运动补偿预测编码技术 MPEG1/2/4MPEG1/2/4标准标准运动图像压缩编码标准运动图像压缩编码标准MPEG 连续帧图像的定义连续帧图像的定义由多幅尺寸相同的静止图像组成的图像序列,由多幅尺寸相同的静止图像组成的图像序列,被称为被称为连续帧图像连续帧图像。与静止帧图像相比,与静止帧图像相比,连续帧图像连续帧图像多了一个时多了一个时间轴,成为三维信号,因此间轴,成为三维信号,因此连续帧图像连

50、续帧图像也被也被称为称为三维图像三维图像。 基于如下基本假设:基于如下基本假设: 在各连续帧之间存在简单的相关性平移运动。在各连续帧之间存在简单的相关性平移运动。 一个特定画面上的像素量值:一个特定画面上的像素量值:1 1)可以根据)可以根据同帧同帧附近像素来加以预测,被称为:附近像素来加以预测,被称为:帧帧内内编码技术编码技术2 2)可以根据)可以根据附近帧附近帧中的像素来加以预测,被称为:中的像素来加以预测,被称为:帧间帧间编码技术编码技术 连续帧图像压缩的基本思想连续帧图像压缩的基本思想 通过减少通过减少帧间图像数据冗余帧间图像数据冗余,来达到减少数据,来达到减少数据量、压缩连续帧图像体

51、积的目的。量、压缩连续帧图像体积的目的。 将连续帧图像序列,分为将连续帧图像序列,分为参考帧参考帧和和预测帧预测帧,参,参考帧用静止图像压缩方法进行压缩,预测帧对考帧用静止图像压缩方法进行压缩,预测帧对帧差图像帧差图像进行压缩。由于进行压缩。由于帧差图像帧差图像的数据量大的数据量大大小于大小于参考帧参考帧的数据量,从而可以达到很高的的数据量,从而可以达到很高的压缩比。压缩比。 MPEG-1 MPEG-1标准是由国际标准化组织标准是由国际标准化组织ISOISO与国际电工与国际电工委员会委员会IECIEC共同制定的,标准的编号是共同制定的,标准的编号是ISO/IEC/11172ISO/IEC/11

52、172,标准的题目是,标准的题目是“码流速率约为码流速率约为l.5Mb/sl.5Mb/s时,用于数字存储媒体的活动图像及其伴时,用于数字存储媒体的活动图像及其伴音的编码音的编码”。 MPEG1标准标准MPEG2标准标准 为了在高速网络的环境下(如为了在高速网络的环境下(如ATMATM)提供高比特率、)提供高比特率、高质量的视频应用高质量的视频应用,ISO,ISO下属的下属的MPEGMPEG委员会在委员会在19941994年又发年又发布了布了MPEG2.MPEG2MPEG2.MPEG2是一种高质量视频的编码标准是一种高质量视频的编码标准, ,也称为也称为广播电视的视频编码标准广播电视的视频编码标准.ISO.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论