静态图像信息处理_第1页
静态图像信息处理_第2页
静态图像信息处理_第3页
静态图像信息处理_第4页
静态图像信息处理_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

静态图像信息处理图像处理就是将客观世界中的物体映射成数字化图像,然后用数学方法通过编程在计算机中进行处理、存储和显示。与数字音频类似,数字图像的数据量一般都比较大,在存储时会占用大量的空间,因此需要对图像进行压缩编码。本章主要介绍色彩的基本概念和表示方法、图像数据压缩的基本算法、图像的存储和编辑处理的基本方法。

第2页,共94页,2024年2月25日,星期天4.1彩色空间表示及其转换4.1.1颜色的基本概念

1.亮度、色调和饱和度彩色可用亮度、色调和饱和度来描述,人眼看到任意彩色光都是这三个特性的综合效果。亮度是发射光或物体反射光明亮度程度的量度色调是由于某种波长的颜色光使观察者产生的颜色感觉,每个波长代表不同的色调。它反映颜色的种类,决定颜色的基本特性,例如红色、棕色等都是指色调。某一物体的色调,是指该物体在日光照射下所反射的各光谱成分作用于人眼的综合效果,对于透射物体则是透过该物体的光谱综合作用的结果。第3页,共94页,2024年2月25日,星期天1.亮度、色调和饱和度饱和度是颜色强度的度量。对于同一色调的彩色光,饱和度越深颜色越鲜明或者越纯。例如红色和粉红色的区别,虽然这两种颜色有相同的主波长,但一种也许是混合了更多的白色在里面,因此显得不太饱和。饱和度还与亮度有关,因为若在饱和的彩色光中增加白光的成分,这增加了光能,因而变得更亮了,但它的饱和度却降低了。通常把色调、饱和度统称为色度,上述内容总结为亮度表示某彩色光的明亮程度,而色度则表示颜色的类别与深浅程度。

第4页,共94页,2024年2月25日,星期天2.三基色(RGB)原理

自然界常见的各种颜色光,都可由红(R)、绿(G)、蓝(B)三种颜色按不同的比例相配而成,这就是色度学中最基本的原理——三基色原理。三基色的选择必须遵循一条规律:任一种颜色都不能由其他两种颜色合成。因为人的眼睛对红、绿、蓝这三种色光最敏感,因此,以这三种颜色作为基色相配来获得彩色得到了最为广泛的应用。第5页,共94页,2024年2月25日,星期天把三种基色光按不同的比例相加称之为相加混色。某种颜色和这三种颜色之间的关系可用下面的式子来描述:R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)=颜色用公式表达如下:红色(100%)+绿色(100%)+蓝色(0%)=黄色红色(100%)+蓝色(100%)+绿色(0%)=品红绿色(100%)+蓝色(100%)+红色(0%)=青色红色(100%)+绿色(100%)+蓝色(100%)=白色我们称青色、品红和黄色为红、绿、蓝三色的补色,从图4-1中还可以看出:红色+青色=绿色+品红=蓝色+黄色=白色第6页,共94页,2024年2月25日,星期天4.1.2色彩的空间表示

在多媒体系统中常涉及到用几种不同的色彩空间表示图形和图像的颜色,如计算机显示时采用RGB彩色空间或色彩模型;在彩色全电视数字化时使用YUV色彩模型;彩色印刷时采用CMYK模式等。不同的彩色空间对应不同的应用场合,在图像的生成、存储、处理及显示时对应不同的彩色空间,需要做不同的处理和转换。

第7页,共94页,2024年2月25日,星期天1.RGB彩色空间

由于某种颜色可以由红(R)、绿(G)、蓝(B)三种色光按不同的比例相加混色来得到,如果将R、G、B看成三个变量,就形成RGB三维彩色空间。在多媒体计算机中,用的最多的是RGB彩色空间。不管其中采用什么形式的彩色空间表示方法,多媒体系统最终的输出一定要转换成RGB空间表示。

对任意彩色光F,其配色方程可写成:F=r[R]+g[G]+b[B]

其中r、g、b为三色系数r[R],g[G],b[B]为F色光的三色分量。任意一种色光,其色度可由相对色系数中的任意两个唯一的确定。因此,各种彩色的色度可以用二维函数表示。用r和g作为直角坐标系中两个直角坐标所画的各种色度的平面图形,就叫RGB色度图,如右图。第8页,共94页,2024年2月25日,星期天2.HSI色彩空间

HSI色彩空间指从人的视觉系统出发,用色调(hue)、色饱和度(saturation或chroma)和亮度(intensity或brightrless)来描述色彩。HSI色彩空间可以用一个圆锥空间模型来描述,其中以亮度I为纵轴,色调H为绕着圆锥截面度量的色环,色饱和度S为穿过中心的半径横轴。亮度值是沿着圆锥的轴线度量的,沿着圆锥轴线上的点表示完全不饱和的颜色。按照不同的灰度等级,最亮点为纯白色,最暗点为纯黑色。圆锥截面的圆周一圈上的颜色为完全饱和的纯颜色。

第9页,共94页,2024年2月25日,星期天人的视觉对亮度的敏感程度远强于对颜色浓淡的敏感程度,当图像亮度有变化时视觉反应明显,而当颜色浓淡有变化时视觉往往没有反应。由于HSI色彩空间更接近人对色彩的认识和解释,因此采用HSI方式能够减少彩色图像处理的复杂性,提高处理速度。在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便地使用,它们可以分开处理而且是相互独立的。因此,用HSI色彩空间可以大大简化图像分析和处理的工作量。HSI色彩空间和RGB色彩空间只是同一物理量的不同表示法,因而它们之间存在着转换关系,如公式(4-1)所示。彩色图像的获取可采用RGB空间,图像的编辑可采用HSI空间。

其中:(4-1)第10页,共94页,2024年2月25日,星期天3.YUV和YIQ彩色空间

在彩色电视制式中,图像是通过YUV和YIQ空间来表示的。PAL彩色电视制式使用YUV模型,Y表示亮度,UV用来表示色差,U、V是构成彩色的两个分量。YUV彩色空间中,三管彩色摄像机或CCD摄像机就是把拍摄的彩色图像,经分色棱镜分成R0G0B0信号,然后进行放大和γ校正得到RGB,再经过矩阵变换电路得到亮度信号Y、色差信号R-Y和B-Y,发送端将Y、R-Y及B-Y三个信号进行编码,用同一信道发送出去。

YUV表示法中,亮度信号(Y)和色度信号(U、V)是相互独立的。其中,Y信号分量构成黑白灰度图,U、V信号构成另外两幅单色图。利用YUV分量之间的独立性原理,黑白电视能接收彩色电视信号,解决了黑白电视和彩色电视的兼容问题。

YUV表示法可以利用人眼的特性来降低数字彩色图像所需要的存储容量。

第11页,共94页,2024年2月25日,星期天美国、日本等国家采用的NTSC电视制式选用YIQ彩色空间,Y仍为亮度信号,I、Q仍为色差信号,与U、V不同的是,在它们之间存在着一定的转换关系。人眼的彩色视觉特性表明,人眼分辨红、黄之间的颜色变化的能力最强,而分辨蓝色与紫色之间的变化的能力最弱。通过一定的变换,I对应于人眼最敏感的色度,而Q对应于人眼最不敏感的色度。

在考虑人的视觉系统和阴极射线管(CRT)的非线性特性之后,RGB和YUV的对应关系可以近似的用方程式4-2表示:Y=0.299R+0.587G+0.114BU=-0.147R-0.289G+0.436B(4-2)

V=0.615R-0.515G-0.100B或者写成矩阵的形式:RGB和YIQ的对应关系用方程式4-3表示:

Y=0.299R+0.587G+0.114BI=0.596R-0.275G-0.321B(4-3)

Q=0.212R-0.523G+0.311B第12页,共94页,2024年2月25日,星期天4.YCrCb彩色空间

YCrCb彩色空间是由YUV彩色空间派生的一种颜色空间,主要用于数字电视系统。是数字视频信号的世界标准。基本上,YCrCb代表和YUV相同的彩色空间。在这两个彩色空间中Y表示明亮度,也就是灰阶值;而U和V表示的则是色度,作用是描述影像色彩及饱和度,用于指定像素的颜色。“亮度”是通过RGB输入信号来创建的,方法是将RGB信号的特定部分叠加到一起。“色度”则定义了颜色的两个方面——色调与饱和度,分别用Cr和Cb来表示。其中,Cr反映了RGB输入信号红色部分与RGB信号亮度值之间的差异。而Cb反映的是RGB输入信号蓝色部分与RGB信号亮度值之同的差异。

数字域中的彩色空间变换与模拟域的彩色空间变换不同。它们的分量使用Y、Cr和Cb来表示,与RGB空间的转换关系如公式4-4所示:

Y=0.299R+0.578G+0.114B Cr=(0.500R-0.4187G-0.0813B)+128(4-4)

Cb=(-0.1687R-0.3313G+0.500B)+128第13页,共94页,2024年2月25日,星期天5.CMY彩色空间

印刷机或彩色打印机就不能用RGB颜色来印刷或打印,它只能使用一些能够吸收特定的光波而反射其他光波的油墨或颜料来实现。油墨或颜料的三基色是青(cyan)、品红(magenta)和黄(yellow),简称为CMY。青色对应蓝绿色,品红对应紫红色。理论上说,任何一种由颜料表现的色彩都可以用这三种基色按不同的比例混合而成,这种色彩表示方法称CMY色彩空间表示法。由CMY混合的色彩又称为相减混色。CMY又写成CMYK。在实际应用中,一幅图像在计算机中用RGB空间或其他空间表示并处理,最后打印输出时要转换成CMY空间表示。第14页,共94页,2024年2月25日,星期天4.2图像数据压缩的基本算法

4.2.1数据压缩编码简介

图像数据压缩的主要依据有两个:一是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;另一个依据是人眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到了数据压缩的目的。有损压缩技术和无损压缩技术基于数据冗余的压缩技术是无损压缩技术,而基于人眼视觉特性的压缩技术是有损压缩技术。实际上,图像压缩技术是各种有损和无损压缩技术的综合实现。

第15页,共94页,2024年2月25日,星期天1.常见的图像数据冗余

(1)空间冗余。在任何一幅图像中,均有由许多灰度或颜色都相同的邻近像素组成的区域,它们形成了一个性质相同的集合块,即它们相互之间具有空间(或空域)上的强相关性,在图像中就表现为空间冗余。(2)结构冗余。在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的板图案等,我们称此为结构冗余。已知分布模式,可以通过某一过程生成图像。

(3)时间冗余。这是序列图像(电视图像、运动图像)表示中经常包含的冗余。图像序列中两幅相邻的图像有较大的相关,这反映为时间冗余。(4)视觉冗余。人类视觉系统的一般分辨能力估计为26灰度等级,而一般图像的量化采用的是28的灰度等级。像这样的冗余,我们称之为视觉冗余。(5)知识冗余。有些图像的理解与某些知识有相当大的相关性。例如:狗的图像有固定的结构,比如,狗有四条腿,头部有眼、鼻、耳朵,有尾巴等。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。空间冗余和时间冗余是将图像信号看作为随机信号时所反映出的统计特征,因此有时把这两种冗余称为统计冗余。第16页,共94页,2024年2月25日,星期天2.数据压缩方法的分类

根据编、解码后数据是否一致来进行分类,数据压缩的方法一般被划分为两类:(1)可逆编码(无损编码)。此种方法的解码图像与原始图像严格相同,压缩比大约在2:1~5:1之间。主要编码有Huffman编码、算术编码、行程长度编码等。(2)不可逆编码(有损编码)。此种方法的解码图像与原始图像存在一定的误差,但视觉效果一般可以接受,压缩比可以从几倍到上百倍调节。常用的编码有变换编码和预测编码。第17页,共94页,2024年2月25日,星期天根据压缩的原理分为如下几种(1)预测编码。它是利用空间中相邻数据的相关性来进行压缩数据的。通常用的方法有脉冲编码调制(PCM)、增量调制(DM)、差分脉冲编码调制(DPCM)等。这些编码主要用于声音的编码(2)变换编码。该方法将图像时域信号转换为频域信号进行处理。这种转换的特点是把在时域空间具有强相关的信号转换到频域上时在某些特定的区域内能量常常集中在一起,数据处理时可以将主要的注意力集中在相对较小的区域,从而实现数据压缩。一般采用正交变换,如离散余弦变换(DCT)、离散傅立叶变换(DFT)

(3)量化与向量量化编码。对模拟信号进行数字化时要经历一个量化的过程。为了使整体量化失真最小,就必须依据统计的概率分布设计最优的量化器。最优的量化器一般是非线性的,已知的最优量化器是Max量化器。我们对像元点进行量化时,除了每次仅量化一个点的方法外,也可以考虑一次量化多个点的做法,这种方法称为向量量化。即利用相邻数据间的相关性,将数据系列分组进行量化。

第18页,共94页,2024年2月25日,星期天(4)信息熵编码。依据信息熵原理,让出现概率大的信号用较短的码字表示,反之用较长的码字表示。常见的编码方法有Huffman编码、Shannon编码以及算术编码。(5)子带(subband)编码。将图像数据变换到频率后,按频率分带,然后用不同的量化器进行量化,从而达到最优的组合。或者分布渐进编码,在初始时,对某一个频带的信号进行解码,然后逐渐扩展到所有频带。

第19页,共94页,2024年2月25日,星期天4.2.2信息熵及基本概念

1.信息量与信息熵

信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量或含量,也就是在辨识N个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数。设从N个数中选定任一个数xj的概率为p(xj),假定选定任意一个数的概率都相等,即p(xj

)=,因此定义信息量见公式4-5。定义信息量见公式4-5。

如果将信源所有可能事件的信息量进行平均,就得到了信息的“熵”,即信息熵。式中,P(xj)是信源X发出xj的概率。I(xj)的含义是,信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。(4-5)第20页,共94页,2024年2月25日,星期天信源X发出的xj(j=1,2,…,n)共n个随机事件的自信息统计平均,即

H(X)称为信源X的“熵”,即信源X发出任意一个随机变量的平均信息量。其中:等概率事件的熵最大,假设有N个事件,由(4-6)式得此时熵为:(4-6)当P(x1)=1时,P(x2)=P(x3)=…=P(xj)=0,由(4-6)式得此时熵为由上可得熵的范围为:第21页,共94页,2024年2月25日,星期天在编码中用熵值来衡量是否为最佳编码。若以Lc表示编码器输出码字的平均码长,则当Lc≥H(X)有冗余,不是最佳。Lc<H(X)不可能。Lc=H(X)最佳编码(Lc稍大于H(X))。熵值为平均码长Lc的下限。平均码长Lc的计算公式为:(j=1,2,…,n)(4-7)其中:P(xj)是信源X发出xj的概率,L(xj)为xj的编码长。第22页,共94页,2024年2月25日,星期天2.冗余度、编码效率与压缩比

设原图像的平均码长为L,熵为H(X),压缩后图像的平均码长为Lc,则定义冗余度为(见公式4-8):

(4-8)编码效率(见公式4-9):

(4-9)压缩比(见公式4-10): (4-10)

在数字图像通信系统中,冗余度、编码效率与压缩比是衡量信源特性以及编解码设备性能的重要指标。第23页,共94页,2024年2月25日,星期天4.2.3信息熵编码

信息熵编码也称为统计编码,是利用信息源出现的概率来进行编码,目前比较常见的信息熵编码包括哈夫曼编码、香农-范诺编码、行程编码和算术统计编码等。

1.哈夫曼编码

基本原理

依据信源字符出现的概率大小来构造代码,对出现概率较大的信源字符,给予较短码长,而对于出现概率较小的信源字符,给予较长的码长,最后使得编码的平均码字最短。

第24页,共94页,2024年2月25日,星期天具体的编码步骤如下:(1)将信源符号出现的概率按由大到小的顺序排序。

(2)将两处最小的概率进行组合相加,形成一个新的概率。(3)将新出现的概率与未编码的字符一起重新排序。

(4)重复步骤(2)、(3),直到出现的概率和为1。

(5)分配代码。代码分配从最后一步开始反向进行,对最后两个概率一个赋予0代码,一个赋予1代码。如此反向进行到开始的概率排列。在此过程中,若概率不变则采用原代码。

第25页,共94页,2024年2月25日,星期天例4-1:设输入图像的灰度级{a1,a2,a3,a4,a5,a6}出现的概率分别是0.4、0.2、0.12、0.15、0.1、0.03。试进行哈夫曼编码,并计算编码效率、压缩比、冗余度。

编码步骤:(1)初始化,根据符号概率的大小按由大到小顺序对符号进行排序,如图4-2所示。(2)把概率小的两个符号组成一个节点,如图4-2中的a5、a6组成节点P1。(3)重复步骤2,得到节点P2、P3、P4、P5,形成一棵“树”,其中P5为根节点。(4)从根节点P5开始到相应于每个符号的“树叶”,从上到下标上1(上枝)或者0(下枝),至于哪个为1哪个为0则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。最终编码结果为:a1=1,a2=000, a3=011,a4=001,a5=0100, a6=0101

第26页,共94页,2024年2月25日,星期天由公式(4-6)可求得图像信源熵是:H(X)=

=-(0.4×log20.4+0.2×log20.2+0.12×log20.12+ 0.15×log20.15+0.1×log20.1+0.03×log20.03)

=2.25bit根据哈夫曼编码过程图给出的结果,由公式(4-7)可求出它的平均码字长度:Lc=0.4×1+0.2×3+0.15×3+0.12×3+0.1×4+0.03×4=2.33由公式(4-9)得编码效率为:压缩之前8个符号需要3个比特量化,经过压缩之后的平均码字长度为2.33,由公式(4-10)得其压缩比为:由公式(4-8)得冗余度为:r=1-η=3.4%第27页,共94页,2024年2月25日,星期天采用哈夫曼编码时有两个问题值得注意:(1)哈夫曼编码没有错误保护功能,在译码时,如果码串中没有错误,那么就能一个接一个的正确译出代码。但如果码串中有错误,哪怕仅是1位出现错误,不但这个码本身译错,更糟糕的是后面的译码可能全错,这种现象称为错误传播(ErrorPropagation)。(2)哈夫曼编码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑。第28页,共94页,2024年2月25日,星期天2.算术编码

算术编码(arithmeticcodingAC)是利用0和1之间的间隔来表示信源编码的一种方法,其编码值是间隔的上、下限包含的相同二进制。编码过程中的间隔决定了符号压缩后的输出。算术编码用到两个基本的参数:符号的概率和它的编码间隔。

信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。

算术编码器的编码过程可用例4-2加以解释。

第29页,共94页,2024年2月25日,星期天例4-2:假设信源符号为{A,B,C,D},这些符号的概率分别为{0.1,0.4,0.2,0.3},根据这些概率可把间隔[0,1]分成4个子间隔:[0,0.1],[0.1,0.5],[0.5,0.7],[0.7,1],其中[x,y]表示半开放间隔,即包含x不包含y,如表4-1所示。符号ABCD概率0.10.40.20.3初始编码间隔[0,0.1][0.1,0.5][0.5,0.7][0.7,1]表4-1信源符号、概率和初始编码间隔如果消息序列的输入为:CADACDB,其编码过程如下:首先输入的符号是C,找到它的编码范围是[0.5,0.7];由于消息中第2个符号A的编码范围是[0,0.1],因此它的间隔就取[0.5,0.7]的第一个1/10作为新间隔[0.5,0.52];编码第3个符号D时取新间隔为[0.514,0.52];编码第4个符号A时,取新间隔为[0.514,0.5146],…。第30页,共94页,2024年2月25日,星期天消息的编码输出可以是最后一个间隔中的任意数,整个编码过程如图4-3所示。最后在[0.5143876,0.51442]中选择一个数作为编码输出值:0.5143876。解码时,解码器由编码输出值:0.5143876,可马上解得一个字符为C,然后依次得到唯一解A,D,A,C,D,B。第31页,共94页,2024年2月25日,星期天在算术编码中需要注意的几个问题:(1)由于实际的计算机的精度不可能无限长,运算中出现溢出是一个明显的问题,但多数机器都有16位、32位或者64位的精度,因此这个问题可使用比例缩放方法解决。

(2)算术编码器对整个消息只产生一个码字,这个码字是在间隔[0,1)中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。

(3)算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。

第32页,共94页,2024年2月25日,星期天3.行程长度编码

是一个针对包含有顺序排列的多次重复的数据的压缩方案。其原理就是把一系列的重复值用一个单独的值再加上一个计数值来取代,行程长度就是连续且重复的单元数目。如果想得到原始数据,只需展开这个编码就可以了。

例如,计算机制作图像中,常常具有许多颜色相同的图块,而且在行上都具有相同的颜色,或者在一行上有许多连续的像素都具有相同的颜色值。这时,就不需要存储每一个像素的颜色值,而仅存储一个像素的颜色值以及具有相同颜色的像素数目就可以,或者存储一个像素的颜色值,以及具有相同颜色值的行数,这种压缩编码称为行程编码。具有相同颜色的连续的像素数目称为行程长度。

第33页,共94页,2024年2月25日,星期天如图所示,假定一幅灰度图像,第n行的像素值为:用RLE编码方法得到的代码为:3150841160。代码斜黑体表示的数字是行程长度,黑体字后面的数字代表像素的颜色值。例如黑体字50代表有连续50个像素具有相同的颜色值,它的颜色值是8。

对比RLE编码前后的代码数可以发现,在编码前要用73个代码表示这一行的数据,而编码后只要用10个代码表示代表原来的73个代码,压缩前后的数据量之比约为7:1,即压缩比为7:1。这说明RLE确实是一种压缩技术,而且编码技术实用。第34页,共94页,2024年2月25日,星期天RLE的性能好坏主要取决于图像本身的特点。RLE压缩编码尤其适用于计算机生成的图像,对减少图像文件的存储空间非常有效。然而,由于颜色丰富的自然图像在同一行上具有相同颜色的连续像素往往很少,而连续几行都具有相同颜色值的连续行数就更少,如果仍然使用RLE编码方法,不仅不能压缩图像数据,反而可能使原来的图像数据变得更大。

译码时按照与编码时采用的相同规则进行,还原后得到的数据与压缩前的数据完全相同。因此,RLE属于无损压缩技术。第35页,共94页,2024年2月25日,星期天(补充)词典编码词典编码属于无损压缩技术,其根据是数据本身包含有重复代码序列这个特性。词典编码的种类较多,归纳起来有两类。第一类词典编码的基本思想是查找正在压缩的字符序列是否在前面输入的数据中出现过,如果是,则用指向早期出现过的字符串的“指针”替代重复的字符串。这种编码思想如图。这里所指的“词典”是指用以前处理过的数据来表示编码过程中遇到的重复部分。这类编码中的所有算法都是以AbrahamLempel和JakobZiv在1977年开发和发表的称为LZ77算法为基础的,1982年由Storer和Szymanski改进的称为LZSS算法。第36页,共94页,2024年2月25日,星期天第二类算法的思想是从输入的数据中创建一个“短语词典”(dictionaryofthephrases)(这种短语可以是任意字符的组合)。编码数据过程中,遇到已经在词典中出现的“短语”时,编码器就输出这个词典中该短语的“索引号”,而不是短语本身,如图。第37页,共94页,2024年2月25日,星期天J.Ziv和A.Lempel在1978年首次发表了介绍这种编码方法的文章。在他们研究的基础上,TerryA.Weltch在1984年发表了改进这种编码算法的文章,因此把这种编码方法称为LZW(Lempel-ZivWalch)压缩编码。这种算法首先在高速硬盘控制器上得到了应用。在众多的压缩技术中,LZW算法时一种通用的、性能优良并得到广泛应用的压缩算法。LZW是一种完全可逆的算法,与其他算法比较,往往具有更高的压缩效率,因此被广泛应用于多种流行的压缩软件中。第38页,共94页,2024年2月25日,星期天变换编码不是直接对空间域图像信号编码,而是首先将空间域图像信号映射变换到另一个正交矢量空间,产生一批变换系数,然后对这些变换系数进行编码处理。图4-5显示了一个变换编码解码过程的示意图。4.2.4变换编码第39页,共94页,2024年2月25日,星期天变换编解码系统通过发送端将原始图像分割成1到n个子图像块,每个子图像块送入到正交变换器作正交变换,变换器输出变换系数经过滤波、量化、编码后送到信道传输到接收端,接收端作解码、逆变换、综合拼接,恢复出空域图像。人们通过对大量自然景物图像的统计分析发现,绝大部分图像信号在空间域中像素之间的相关性是很大的。它们经过正交变换以后,其能量主要集中在低频部分;而且经过正交变换后的变换系数之间的相关性大大降低。变换编码的基本思路就是利用上述特点,在编码时略去某些能量很小的高频分量,或在量化时对方差较小的分量分配以较少的比特数,以降低码率。另外,变换编码还可以根据人眼对不同频率分量的敏感程度而对不同系数采用不同的量化台阶,以进一步提高压缩比。变换编码的性能取决于子图像的大小、正交变换的类型、样本的选择和量化器的设计。第40页,共94页,2024年2月25日,星期天1.正交变换类型从均方误差最小和主观图像质量两个观点来看,最好的变换类型是离散K-L变换。但由于离散K-L变换的基核向量是不固定的,一般没有快速算法,因此只宜作理论分析和试验。在数字信号处理技术中,傅里叶变换是应用最为广泛的一类正交变换,它不仅具有物理含义明确的优点,而且可以使用快速算法来减少运算量。但它应用在图像编码中时也有两个明显的弱点:一是要进行复数运算;二是收敛速度较慢。变换压缩编码的基本依据是变换系数的方差比较集中。因此通常按系数方差大小作出变换系数的分布函数,以说明方差的集中程度。当原始图像为相关函数的高斯型一阶马尔可夫过程时,第41页,共94页,2024年2月25日,星期天离散余弦DCT可与最佳变换K-L媲美,因为DCT与K-L变换压缩性能和误差比较近,而且DCT也具有多种快速算法,因而在图像压缩编码中被广泛的应用。DCT变换具有如下特点:DCT变换计算复杂度适中。DCT变换域系数矩阵能量集中在直流和低频区。DCT的直流系数近似满足瑞利分布,交流系数近似满足拉普拉斯分布。DCT系数相关性很小。第42页,共94页,2024年2月25日,星期天在变换编码中,选择哪些变换系数进行量化编码,略去哪些系数不予传输,对变换压缩编码的性能有很大影响。原则上,应保留能量集中、方差大的变换系数予以编码传输。系数选择通常有两种方法:区域取样和门限取样。2.样本选择与量化方案门限取样:是把变换系数的方差和某个门限值比较,超过门限的会予以编码,否则舍弃。区域取样:是对设定形状内的变换系数进行量化编码,略去区域外的变换系数。由于DCT变换域系数矩阵能量集中在直流和低频区,则在图4-6所示的DCT系数中能量将主要集中在左上角的系数上。为此,可只传左上角上的系数,并按图中的“之”字形扫描路径输出系数。第43页,共94页,2024年2月25日,星期天在选定了要编码传输的系数后,有几种方法可以对其量化:(1)对所有变换系数分配相同的比特数。在发送端先对各变换系数进行归一化,使它们变得有相同的方差,然后用一个统一的量化器对所有的系数进行量化及编码。在该方式下,由于接收端要把归一化的系数恢复回去,原来方差大的系数要乘大的倍数,因此量化误差大。(2)对方差大的变换系数分配较多的比特数,使比特数正比于该系数方差的对数。可以证明,这样的分配方案可使量化造成的总均方误差最小。在该方式中,对不同的变换系数要用不同的量化器,它们之间不仅量化级数不同,判决电平和量化输出电平的变化规律也可以不同,以适合各自系数的分布规律。(3)利用人眼视觉特性设计量化器。由于人眼对不同空间频率的失真敏感度不同,在比特分配时可对人眼较为敏感的变化系数分配较多的比特,而不太敏感的系数分配较少的比特。按这种方式设计的量化器可使变换编码系统总的主观图像质量较好。变换编码中对变换域系数的量化是造成图像质量下降的主要原因,量化器设计的好坏将直接影响图像质量。变换编码中图像质量下降的主要表现形式是方块效应,也即在图像分块的边缘产生较易为人眼所察觉的误差。第44页,共94页,2024年2月25日,星期天3.子图像大小选择在变换编码系统中,考虑到矩阵变换所需的计算量、变换编码的性能和传输时误码的影响等因素,一般将图像分成若干小的子图像进行处理。从变换编码的压缩特性来看:子图像尺寸n越大,所计入的相关像素越多,总的均方差性能越好。但根据对大量自然图像的统计分析结果,大多数图像仅在约20个相邻像素间有较大的相关性,n>16后对性能的改善不大。变换编码对图像进行分块处理的另一特点,是可以将传输时误码造成的图像损伤限制在子图像范围内。显然,子图像尺寸越大误码造成的图像损伤范围越大;反之范围越小。综合考虑上述因素,一般子图像尺寸选为8×8或16×16。第45页,共94页,2024年2月25日,星期天通常,图像中局部区域的像素是高度相关的,因此可以用先前像素的有关灰度知识来对当前像素的灰度进行估计,这就是预测。如果预测是正确的,则不必对每一个像素的灰度都进行压缩,而是把预测值与实际像素值之间的差值经过熵编码后发送到接收端,接收端通过预测值+差值信号来重建原像素。预测编码可分为线性预测编码和非线性预测编码。前者常被称为差分脉冲编码调制(DPCM),其基本原理是基于图像中相邻像素之间的相关性,每个像素可通过与之相关的几个像素来进行预测,如图4-7所示。4.2.5预测编码第46页,共94页,2024年2月25日,星期天图中x(n)为采样的声音或图像数据,为x(n)的预测值,是实际值和预测值的差值,是d(n)的量化值,是引入量化误差的x(n)。第47页,共94页,2024年2月25日,星期天预测编码可以获得比较高的编码质量,并且实现起来比较简单,因此被广泛地应用于图像压缩编码系统。但是它的压缩比不高,而且精确的预测有赖于图像特性的大量的先验知识,并且必须进行大量的非线性运算,因此一般不单独使用,而是与其他方法结合起来使用。例如,在JPEG中使用了预测编码技术对DCT直流系数进行编码。第48页,共94页,2024年2月25日,星期天1.模型编码模型编码则是利用计算机视觉和计算机图形学的知识对图像信号进行分析与合成。模型编码采用图像分析和描述的方法,将图像信号看成三维世界中的目标和景物投影到二维平面的产物,对图像的结构和特征进行分析,提取出图像的特征参数,如运动参数、形状参数等,并用某种模型加以描述,通过对模型参数的编码达到图像编码的目的。图像解码时,根据参数和模型先验知识用图像合成技术重建图像。由于编码的对象是特征参数,而不是原始图像,因此有可能实现比较大的压缩比。模型编码引入的误差主要是人眼视觉不太敏感的几何失真,因此重建图像非常自然和逼真。

4.2.6其他编码方法第49页,共94页,2024年2月25日,星期天模型编码目前的研究目标主要集中于可视电话和会议电视的应用中。这是因为此类应用传送的图像中主要感兴趣的内容是人的头肩像,是一种基本固定的特定场景,因此可以预先建立人体头肩像的三维模型,从而进行模型编码。人的头肩像三维模型由人脸形状模型和脸部表情模型两部分组成。其形状模型可用许多小三角形的组合即“线框”(Wireframe)去逼近,脸部表情模型由“基本活动单元”(ActionUnit)的线性组合来实现。通信时首先要将被传输对象的基本特征传送到对方,以建立人的头肩像三维模型;通信开始后,当头部发生运动、脸部表情发生变化时,抽取这些运动和变化的参数并对其进行编码发送给对方;接收端用已知的三维模型和收到的参数,用图像合成技术重建图像。由于头部运动和脸部表情参数变化是一种非刚体运动,精确的运动估值是相当困难的。目前采用的是在一定约束条件下建立在预测和反馈技术上的运动跟踪算法。第50页,共94页,2024年2月25日,星期天2.混合编码用两种或两种以上的方法对图像进行编码称为混合编码,是今年来广泛采用的一种方法。混合编码通常使用DCT等变换进行空间冗余度的压缩,用帧间预测或运动补偿预测进行时间冗余度的压缩,以达到对运动图像的更高的压缩率。后面要介绍的JPEG和MPEG都属于混合编码。混合编码器有两种不同的结构,如图4-8所示,分别表示空/时压缩和时/空压缩两种不同的方案。图4-8是这两种方案的结构框图,其中T、IT代表正、反变换,Q、IQ代表正、反量化。方案I由于把变换部分放在预测环内,因此预测环本身工作在图像域内,便于使用性能优良、带有运动补偿的帧间预测,因而被广泛地应用于研究和使用;而方案II由于把变换部分放在预测环外,需要在变换域(频率域)进行预测,处理上不方便。方案I经过若干年的研究总结后,发展为带有运动补偿性质的帧间预测与DCT结合的方案。这一方案具有压缩性能高、编码技术成熟,以及编码延迟短等特点,目前已成为运动图像压缩的主流方案。第51页,共94页,2024年2月25日,星期天第52页,共94页,2024年2月25日,星期天4.3常用图形、图像文件的格式

4.3.1矢量图和位图

计算机包含两种类型的图形格式:矢量图(VectorBasedImage)和位图(BitMappedImage)。1.矢量图(图形)主要用于工程图、白描图、图例、卡通漫画和三维建模等。由图形应用程序创建,在数学上定义为一系列由线连接的点,其内部表示为单个的线条、文字、圆、矩形、多边形等图形元素。每个图元称为对象,可以用一个代数式来表达,并且是一个独立的实体,具有颜色、形状、大小和屏幕位置等属性。通过软件,矢量图很容易转化为位图,而位图转化为矢量图则需要复杂而庞大的数据处理。第53页,共94页,2024年2月25日,星期天2.位图(图像)是直接量化的原始图像信号形式,图像的最小单位是像点,用于表现自然影像。像素点由若干个二进制位进行描述,二进制位代表像素点颜色的数量,二进制位与图像之间存在严格的“位映射”关系,具有位映射关系的图叫作“位图”。3.位图与矢量图的不同点1)位图的容量一般较大,与图的尺寸和颜色有关;矢量图一般较小,与图的复杂程度有关。2)位图的文件内容是点阵数据;矢量图的文件内容是图形指令。3)位图的显示速度与土的容量有关;矢量图的显示速度与图的复杂程度有关。4)从应用特点看,位图适于“获取”和“复制”,表现力丰富,但编辑较复杂;矢量图易于编辑,适于“绘制”和“创建”,但表现力受限。第54页,共94页,2024年2月25日,星期天4.3.2常见的位图格式1.图像的文件结构

文件头的主要内容包括产生或编辑该图像文件的软件信息以及图像本身的参数。文件体主要包括图像数据以及色彩变换查找表或调色板数据。这部分是文件的主体,对文件容量的大小起决定作用。文件尾可包含一些用户信息。文件头软件ID软件版本号图像分辨率图像尺寸图像深度色彩类型编码方式压缩算法文件体图像数据色彩变换表文件尾用户名注释开发日期工作时间表4-2位图文件结构示意第55页,共94页,2024年2月25日,星期天2.BMP图像文件格式

是微软公司为其Windows环境设置的标准图像格式。Windows系统软件中内含了一系列支持BMP图像处理的API函数。非压缩格式是BMP图像文件所采用的一种通用格式。

两种压缩方式:如果图像为16色模式,则采用RLE4压缩方式;若图像为256色模式,则采用RLE8压缩方式。可以存储单色、16色、256色以及真彩色4种图像数据。3.GIF图像文件格式

是最早由CompuServe公司于1987年制定的标准,主要用于网络图形数据的在线传输和存储。GIF提供了足够的信息并很好地组织了这些信息,使得许多不同的输入输出设备能够方便的交换图像。它最多支持8位(256种颜色),图像的大小最多是64K×64K个像点。GIF的特点是LZW压缩、多图像和交错屏幕绘图。第56页,共94页,2024年2月25日,星期天4.JPEG图像文件格式

JPEG(JointPhotographicExpertsGroup)图像格式是一种比较复杂的文件结构和编码方式的文件格式。它是用有损压缩方式去除冗余的图像和彩色数据,在获得极高压缩率的同时能展现十分丰富和生动的图像,适用于在Internet上作图像传输。JPEG文件格式具有以下特点:适用性广,大多数图像类型都可以进行JPEG编码;对于数字化照片和表达自然景物的图片,JPEG编码方式具有非常好的处理效果;对于使用计算机绘制的具有明显边界的图形,JPEG编码方式的处理效果不佳。第57页,共94页,2024年2月25日,星期天5.TIFF图像文件格式

是一种通用的位映射图像文件格式。

TIFF文件格式具有以下特点:支持从单色到32位真彩色的所有图像;适用于多种操作平台和多种机器,如PC机和Macintosh机;具有多种数据压缩存储方式等。

6.PNG图像文件格式

是20世纪90年代中期开发的图像文件格式,其目的是企图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。PNG用来存储彩色图像时其颜色深度可达48位,存储灰度图像时可达16位,并且还可存储多达16位的Alpha通道数据。PNG文件格式具有以下特点:流式读写性能、加快图像显示的逐次逼近显示方式、使用从LZ77派生的无损压缩算法以及独立于计算机软硬件环境等。

第58页,共94页,2024年2月25日,星期天7.PSD图像文件格式

是Adobe公司的图像处理软件Photoshop的专用格式。PSD其实是Photoshop进行平面设计的一张“草稿图”,它里面包含有各种图层、通道、蒙板等多种设计的样稿,以便于下次打开文件时可以修改上一次的设计。

8.PCX图像文件格式是ZSOFT公司在开发图像处理软件PaintBrush时开发的一种格式,存储格式从1位到24位,它是经过压缩的格式,占用磁盘空间较少。它主要与商业性PC-PaintBrush图像软件一起使用。

PCX文件可以分成三类:各种单色PCX文件、不超过16种颜色的PCX文件、具有256颜色的PCX图像文件。由于该格式出现的时间较长,并且具有压缩及全彩色的能力,所以PCX格式现在仍十分流行。第59页,共94页,2024年2月25日,星期天图片类型说明BMP鲜艳、细腻,但尺寸大GIF尺寸小,有小动画效果JPEG、JPG质量高,尺寸小,略失真TIFF、TIF用于扫描仪、OCR系统PNG适合在网络上传输及打开PSDPhotoshp专用,图像细腻PCX压缩比适中,能快速打开表4-3常见的位图文件格式第60页,共94页,2024年2月25日,星期天4.3.3常见的矢量图格式

(1)WMF文件格式:是常见的一种图元文件格式,是它具有文件短小、图案造型化的特点,整个图形常由各个独立的组成部分拼接而成,但其图形往往较粗糙。WMF文件的扩展名为.wmf。

(2)EMF文件格式:是微软公司开发的一种Windows32位扩展图元文件格式。其总体目标是要弥补使用WMF的不足,使得图元文件更加易于接受。EMF文件的扩展名为.emf。

(3)EPS文件格式:是用PostScript语言描述的一种ASCII码文件格式,即可以存储矢量图,也可以存储位图,最高能表示32位颜色深度,特别适合PostScript打印机。

(4)DXF文件格式:是AutoCAD中的矢量文件格式,它以ASCII码方式存储文件,在表现图形的大小方面十分精确。DXF文件可以被许多软件调用或输出。DXF文件的扩展名为.dxf。

(5)SWF(ShockwaveFormat)文件格式:是二维动画软件Flash中的矢量动画格式,主要用于Web页面上的动画发布。目前,已成为网上动画的事实标准。SWF文件的扩展名为.swf。第61页,共94页,2024年2月25日,星期天4.4静态图像压缩标准

4.4.1JPEG简介

JPEG(JointPhotographicExpertsGroup)是联合图像专家小组的英文缩写,这个专家组开发的算法称为JPEG算法,并且成为国际上的彩色、灰度、静止图像的第一个国际标准,因此又称为JPEG标准。JPEG是一个适用范围很广的静态图像数据压缩标准,不仅适用于静止图像的压缩,也常常被用于电视图像序列的帧内图像压缩编码。目前JPEG专家组开发了两种基本的压缩算法:一种是采用以离散余弦变换DCT为基础的有损压缩算法;另一种是采用以预测技术为基础的无损压缩算法。使用有损压缩算法时,在压缩比为25:1的情况下,压缩后还原得到的图像和原始图像相比较,非图像专家难以找到它们之间的区别,因此得到了广泛的应用。例如在V-CD和DVD-Video电视图像压缩技术中,就使用JPEG的有损压缩算法来取消空间方向上的冗余数据。

第62页,共94页,2024年2月25日,星期天JPEG压缩是有损压缩,它利用了人的视角系统的特性,使用量化和无损压缩编码相结合来去掉视角的冗余信息和数据本身的冗余信息。JPEG算法框图如图4-9所示,压缩编码大致分成三个步骤:(1)使用正向离散余弦变换(ForwardDiscreteCosineTransform,FDCT)把空间域表示的图变换成频率域表示的图。(2)使用加权函数对DCT系数进行量化,这个加权函数对于人的视觉系统是最佳的。(3)使用哈夫曼可变字长编码器对量化系数进行编码。

译码或者叫做解压缩的过程与压缩编码过程正好相反。JPEG算法与彩色空间无关,因此“RGB到YUV变换”和“YUV到RGB变换”不包含在JPEG算法中。JPEG算法处理的彩色图像是单独的彩色分量图像,因此它可以压缩来自不同彩色空间的数据,如RGB、YCbCr和CMYK。第63页,共94页,2024年2月25日,星期天第64页,共94页,2024年2月25日,星期天4.4.2JPEG压缩的基本原理

JPEG压缩编码过程主要包含四个阶段:离散余弦变换(DCT)、量化、编码(EndingPhase)和组成位数据流阶段。下面我们通过一个简单的例子,分别阐述这四个阶段的原理。1.离散余弦变换

(1)首先把一幅图像划分成一系列的图像块,每个图像块包含8×8个像素。如果原始图像有640×480个像素,则图片将包含80列60行的方块。如果图像只包含灰度,那么每个像素用一个8比特的数字表示。因此可以把每个图像块表示成一个8行8列的二维数组。数组的元素是0~255的8比特整数。离散余弦变换就是作用在这个数组上。如果图像是彩色的,那么每个像素可以用24比特、相当于三个8位比特的组合来表示(用RGB或YIQ表示,在这里没有影响)。因此,可以用三个8行8列的二维数组表示这个8×8的像素方块。每一个数组表示其中一个八位比特组合的像素值。离散余弦变换作用于每个数组。

第65页,共94页,2024年2月25日,星期天DCT变换是做什么的?简单的说,是用一个8行8列的二维数组产生另一个同样包含8行8列二维数组的函数,也就是说,把一个数组通过一个变换,变成另一个数组。如图下图所示,对每个图像块做离散余弦变换。通过DCT变换可以把能量集中在矩阵左上角少数几个系数上。

f(i,j)经DCT变换之后得到F(i,j),其中F(0,0)是直流系数,称为DC系数,其他为交流系数,称为AC系数。第66页,共94页,2024年2月25日,星期天(2)用f表示像素值的数组,f(ij)表示i行j列的值,则离散余弦变换后定义一个新的数组F(u,v),表示u行v列的值。

DCT变换使用公式(4-11)计算:(4-11)它的逆变换使用公式(4-12)计算:(4-12)上面两式中,C(u),C(v)=,当u,v=0;C(u),C(v)=1,其他。

第67页,共94页,2024年2月25日,星期天图4-11显示了对一个源图像的8×8的图像样本的原始数组应用离散余弦变换的结果。为便于计算在对源数组f进行变换之前首先对源图像中的每个样本数据减去了128。然后再按公式(4-11)分别计算出结果数组F中每个数组元素的值。比如说,计算F(0,0)的值过程如下:=235.6(因为cos(0)=1)这样再继续计算出数组中其余元素的值,得到数组F。第68页,共94页,2024年2月25日,星期天图4-11

离散余弦变换的数组f(i,j)经DCT变换之后得到F(i,j),其中F(0,0)是直流系数,称为DC系数,其他为交流系数,称为AC系数。第69页,共94页,2024年2月25日,星期天(3)在计算二维的DCT变换时,也可使用下面的计算式(4-13)、(4-14)进行简化,把二维的DCT变换变成一维的DCT变换,如图4-12所示为二维DCT变换方法。(4-13)(4-14)图4-12

两维DCT变换方法第70页,共94页,2024年2月25日,星期天2.量化为了达到压缩数据的目的,DCT系数需做量化。量化是对经过FDCT变换后的频率系数进行量化,这是一个多到一映射的过程。量化的目的是减小非0系数的幅度以及增加0值系数的数目,在一定的主观保真的前提下,丢掉那些对视觉效果影响不大的信息,量化是图像质量下降的最主要原因。对于有损压缩算法,JPEG算法使用如图4-13所示的均匀量化器进行量化,量化步距是量化表的元素,它由系数所在的位置和每种颜色分量的色调值来确定。因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:如表4-4所示的色度量化值和表4-5所示的亮度量化值。此外,由于人眼对低频分量的图像比对高频分量的图像更敏感,因此图中左上角的量化步距要比右下角的量化步距小。表4-4和表4-5中的数值对CCIR601标准(国际无线电咨询委员会CCIR[InternationalRadioConsultativeCommittee]在20世纪80年代初制定的彩色电视图像数字化标准)电视图像已经是最佳的。如果不使用这两种表,你也可以用自己的量化表替换它们。第71页,共94页,2024年2月25日,星期天第72页,共94页,2024年2月25日,星期天对于上面的例子,我们用表4-4的量化表对其进行量化,得到数组Q(i,j)。量化的公式为: Q(i,j)=Integer(F(i,j)/U(i,j))其中:U(i,j)为量化数组中对应的数组元素。也就是用数组F中的各元素分别除以量化数组Q中的相应元素,如图4-14所示。图4-14

用量化表量化的数组第73页,共94页,2024年2月25日,星期天以上是编码时对图像块的正向离散余弦变换和量化过程,解码的时候要进行逆量化和逆向离散余弦变换,图4-15说明了解码的过程,并且在逆向离散余弦变换之后对重构图像中的每个样本数据加了128,最后得到重构图像样本:第74页,共94页,2024年2月25日,星期天3.编码阶段

(1)Z字形编排。对于量化后的二维数组,我们还要对其进行线性化,然后再进行压缩加以传输。一个合理的线性化方法可能是一次传输Q的一行。由于出现这么多的0,可以使用行程编码。这是可行的,但还有更好的方法。(2)直流系数的编码。8×8图像块经过DCT变换之后得到的DC直流系数有两个特点,一是系数的数值比较大,二是相邻8×8图像块的DC系数值变化不大。根据这个特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值进行编码。Delta=Dc(0,0)k-Dc(0,0)k–1

(4-15)第75页,共94页,2024年2月25日,星期天(3)交流系数的编码。量化AC系数的特点是1×64矢量中包含有许多0系数,并且许多0是连续的,因此可以使用非常简单和直观的游程长度编码(RLE)对它们进行编码。JPEG使用了1个字节的高4位来表示连续0的个数,而使用它的低4位来表示编码下一个非0系数所需要的位数,跟在它后面的是量化AC系数的数值。(4)熵编码。使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。在JPEG有损压缩算法中,使用哈夫曼编码器来减少熵。

第76页,共94页,2024年2月25日,星期天4.组成位数据流JPEG编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据,这样做的目的是为了便于传输、存储和译码器进行译码,这样组织的数据通常称为JPEG位数据流。第77页,共94页,2024年2月25日,星期天4.4.3JPEG2000为了能用单一的压缩码流提供多种性能、满足范围更为广泛的应用,JPEG工作组于1996年开始探索一种新的静止图像压缩编码标准,并且称它为JPEG2000。

JPEG2000是JPEG工作组制定的并于2000年底陆续公布的基于JPEG标准的最新的静止图像压缩编码的国际标准,它之所以比JPEG标准优越,主要是不再采用离散傅立叶变换DCT算法为主的编码方法,改用以DWT(DiscreteWaveletTransformation,离散小波变换算法)为主的多解析编码方法。

第78页,共94页,2024年2月25日,星期天它与JPEG的基本系统相比有以下的优点:(1)既支持有损压缩,也支持无损压缩方式。(2)在压缩时,可指定图片感兴趣的区域,并指定压缩质量;在解压缩时,对这些区域指定解压缩顺序及解压缩质量。因为子波在时域及频域上具有局域性,有可能完全恢复或以高分辨率恢复图像的某个局部。(3)在高压缩比下,仍能保持较高的图像质量。在类似质量的前提下,JPEG2000的压缩比比JPEG高10%~30%。JPEG2000主要由6个部分组成:第一部分,图像编码系统,它是标准的核心系统。第二部分,扩展系统,在核心系统上添加一些功能。第三部分,运动JPEG2000,针对运动图像提出的解决方案。第四部分,兼容性。第五部分,参考软件。第六部分,复合图像格式,主要是针对印刷和传真应用。第79页,共94页,2024年2月25日,星期天(4)支持渐进式传输,即开始时显示一个模糊、不清晰且质量低的图像,随着数据进一步被接收,图像清晰度和质量逐步提高,最后显示出一个高清晰度且高质量的图像。JPEG2000在节约和充分利用有限带宽方面显得更加优越。(5)在有限带宽上进行文件传输时,有很强的纠错能力,在用户指定文件尺寸时,能保证较高的再现图像质量,以致在无线领域得到广泛应用。(6)可对编码流进行随机访问和处理,因为它的块编码是独立的,且编码流具有包裹式结构。(7)使用Alpha通道,以满足图形艺术和Internet的发展和需求;(8)在彩色图像处理方面,JPEG2000可处理256个通道的信息。第80页,共94页,2024年2月25日,星期天标准JPEGJPEG2000标题连续色调静止图像的数字压缩编码新一代静止图像压缩编码主要编码技术离散余弦变换(DCT)

知觉量化

Zigzag扫描

霍夫曼编码

算术编码离散小波变化(DWT)

EBCOT核心算法

ROI编码

空间可扩展编码

质量可扩展编码

面向对象编码

位图形状编码

容错编码、TCQ、零数扫描压缩比2~302~50算法效率30:1以上急剧下降100:1以上急剧衰减速率失真特性比JPEG提高30%应用场合Internet

数字照相

图像视频编辑Internet

数字照相

数字图书馆

电子商务

打印、扫描、传真、遥感表4-6JPEG与JPEG2000的性能比较第81页,共94页,2024年2月25日,星期天把自然的影像转换成数字化图像的过程叫做“图像获取过程”,图像获取过程的实质是进行模/数(A/D)转换,即通过相应的设备和软件,把作为模拟量的自然影像转换成数字量。图像获取的一个重要途径是使用专用计算机扩展设备,如扫描仪、数码照相机等对图像进行获取。除硬件设备外,还需要设备驱动程序、图像处理工具等软件。图像的处理须通过图像处理软件完成,目前使用最广泛的是专业图像处理软件Photoshop7.0。4.5图像的获取与处理第82页,共94页,2024年2月25日,星期天4.5.1获取的途径图像的获取途径主要有两个:(1)利用彩色扫描仪和数码照相机等设备进行模/数转换。对于收集的图像素材,如印刷品、照片以及实物等,使用彩色扫描仪对照片和印刷品进行扫描,经过少许的加工后,即可得到数字图像。使用数码照相机可直接拍摄景物,再传送到计算机中进行处理。(2)从数字图像库或网络上获取图像。数字图像库通常采用光盘作为数据载体,多采用PCD文件格式和JPG文件格式。其中,PCD文件格式是Kodak公司开发的Photo-CD光盘格式;JPG文件格式是压缩数据文件格式。国际互联网络的某些网站也提供合法的图片素材,有些需要支付少量的费用。第83页,共94页,2024年2月25日,星期天4.5.2用彩色扫描仪来获取图像用扫描仪获得高质量的图像依靠正确的扫描方法、设定正确的扫描参数、选择合适的颜色深度,以及后期的技术处理。ScanWizard扫描软件是现在相当普及的扫描软件,该软件具有编辑和修改功能,能够节约原本需在图像处理软件内进行修整的时间。1.ScanWizard扫描软件的功能(1)进行预扫描。单击“预视”键可完成真正扫描之前的预视结果,然后选择最后需扫描的范围,单击“扫描”键可开始扫描。(2)可以检查图像被修改过后的RGB值。(3)可建立多项扫描。(4)可选择扫描图像的类型。它既可以按原格式进行扫描,也可以用别的格式扫描。例如:彩色图像也可采用灰度及线条方式进行扫描。(5)在预视提示下,图像可通过设置窗口中的图像增强工

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论