版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第第 5 章章多媒体数据压缩技术多媒体数据压缩技术5.1 数据压缩基本原理数据压缩基本原理 5.1.1 信息、数据与编码信息、数据与编码 5.1.2 数据压缩的条件数据压缩的条件 5.1.3 数据冗余数据冗余5.2 数据压缩算法数据压缩算法 5.2.1 数据压缩算法分类数据压缩算法分类 5.2.2 预测编码原理预测编码原理 5.2.3 变换编码原理变换编码原理 5.2.4 统计编码原理统计编码原理 5.2.5 霍夫曼编码原理霍夫曼编码原理 5.2.6 行程编码原理行程编码原理 5.2.7 算术编码原理算术编码原理 5.2.8 lzw压缩编码压缩编码5.3 静态图像静态图像jpeg压缩编码技术
2、压缩编码技术 5.3.1 jpeg标准的由来标准的由来 5.3.2 jpeg压缩算法压缩算法 5.3.3 无失真预测编码无失真预测编码 5.3.4 有失真有失真dct压缩编码压缩编码5.4 动态图像动态图像mpeg压缩编码技术压缩编码技术 5.4.1 基本原理基本原理 5.4.2 mpeg技术标准技术标准2数据压缩基本原理数据压缩基本原理5.15.1.1 信息、数据与编码信息、数据与编码1信息和熵信息和熵 信息量的大小和消息有一定的关系。在数学上,消息是其出现概率信息量的大小和消息有一定的关系。在数学上,消息是其出现概率 的单调下降函数。信息量越大,消息的可能性越小,反之亦然。的单调下降函数。
3、信息量越大,消息的可能性越小,反之亦然。 信息量:为了从信息量:为了从n个相等的可能事件中挑选出一个事件所需的信息个相等的可能事件中挑选出一个事件所需的信息 度量和含量,所提问度量和含量,所提问“是或否是或否”的次数。也就是说,在的次数。也就是说,在n个事件中辨个事件中辨 识特定的一个事件要询问识特定的一个事件要询问“是或否是或否”次数。次数。要从要从256个数中选定某一个数,可以先提问个数中选定某一个数,可以先提问“是否大于是否大于128?”,不,不论论回答是与否,则半数的可能事件被取消。如果继续询问下去,每次回答是与否,则半数的可能事件被取消。如果继续询问下去,每次询问将对应一个询问将对应
4、一个1bit的信息量。的信息量。例例3例例随着每次询问,有半数的可能事件被取消,这个过程由公式表示:随着每次询问,有半数的可能事件被取消,这个过程由公式表示:可看出:对于可看出:对于256个数的询问只要进行个数的询问只要进行8次,即可确定一个具体的数。次,即可确定一个具体的数。设:从设:从n个数中选定任意一个数个数中选定任意一个数x的概率为的概率为p(x),假定选定任意一个数,假定选定任意一个数的概率都相等,即的概率都相等,即p (x)=1/n,则信息量为:,则信息量为:log2256 = 8 bit如果将信息源所有可能事件的信息量进行平均,即可得到信息的如果将信息源所有可能事件的信息量进行平
5、均,即可得到信息的“熵熵” (熵是平均信息量熵是平均信息量),信息源,信息源x的符号集为的符号集为xi(i=1,2,n)。设:设:xi出现的概率为出现的概率为p(xi),则信息源,则信息源x的熵为:的熵为:i(x) = log2n = - log21n = - log2p(x) = ip(x)h(x) =p(xi )log2p(xi )p(xi ) i p(xi ) = -ni=1ni=14信息与数据信息与数据2.信息可以用函数表示,该函数由信息论创始人信息可以用函数表示,该函数由信息论创始人c.e.shannon提出,提出,以概率论的观点对信息进行定量描述,具体的信息函数表达式为:以概率论的
6、观点对信息进行定量描述,具体的信息函数表达式为:i(ai ) = -log2pi (i = 1,2,r )公式中,公式中,pi (i = 1,2,r )是随机消息组合是随机消息组合xa1,a2,ar中的中的消息消息ai (i = 1,2,r )的先验概率。的先验概率。pi 可以度量可以度量ai (i = 1,2,r )所含的信息量。所含的信息量。而而i(ai) (i = 1,2,r )在在x的先验概率空间的先验概率空间pp1,p2,pr中的中的统计平均值为信息源统计平均值为信息源x的熵:的熵:信息源信息源x的熵用来度量的熵用来度量x中每种消息所包含的平均信息量。信息熵中每种消息所包含的平均信息
7、量。信息熵主要表示信息系统的有序程度,而不是热力学中系统的无序程度。主要表示信息系统的有序程度,而不是热力学中系统的无序程度。h(x) = hp1,p2,pr = -pilog2pini=15多媒体信息的数据量多媒体信息的数据量3.1) 文本文本 假设屏幕显示分辨率为假设屏幕显示分辨率为1024768,字符为,字符为1616点阵,点阵, 每个字符用每个字符用4个字节表示,则显示一屏字符所需要的存储空间为:个字节表示,则显示一屏字符所需要的存储空间为: (1024/16)(768/16)4 b = 12288 b(约合(约合12kb)2) 图像图像 假定图像显示在假定图像显示在1024768分辨
8、率的屏幕上,则满屏幕分辨率的屏幕上,则满屏幕 像点所占用的空间为:像点所占用的空间为: 1024768log2256 = 768 kb3) 音频音频 假定模拟声音频率假定模拟声音频率22050 hz,其数字采样频率,其数字采样频率44100 hz, 采样精度为采样精度为16bit,双声道立体声模式,则,双声道立体声模式,则1min所需数据量为:所需数据量为: 44100hz2b (16bit采样精度采样精度)2 (双声道双声道)60s = 10 mb/min4) 视频视频 采用带宽为采用带宽为5mhz的的pal制视频信号,扫描速度制视频信号,扫描速度25帧帧/ s, 样本宽度样本宽度24bit
9、,采样频率最低,采样频率最低10mhz,则一帧数字化图像所占用的,则一帧数字化图像所占用的 最少存储空间为:最少存储空间为: 10 (采样频率采样频率)25 (扫描速度扫描速度)24 (样本宽度样本宽度) = 9.6mbit (合合1.2 mb)6数据压缩的条件数据压缩的条件5.1.2 数据冗余度数据冗余度 (重复数据、可忽略数据重复数据、可忽略数据) 信息传输与存储的限制信息传输与存储的限制 (压缩压缩 传输或存储传输或存储 解压缩解压缩) 44.1khz / stereo 1.3mb 22.0khz / mono 0.3mb stop重复数据重复数据可忽略数据可忽略数据 人类不敏感因素人类
10、不敏感因素 (颜色、亮度、细节等颜色、亮度、细节等)224 颜色颜色 (16,777,216色色)28 颜色颜色 (256色色) 音频不敏感因素音频不敏感因素 (试听试听) 颜色不敏感因素颜色不敏感因素7数据冗余数据冗余5.1.3 冗余基本概念冗余基本概念 冗余冗余 信息所具有的各种性质中多余的无用空间信息所具有的各种性质中多余的无用空间 冗余度冗余度 多余的无用空间的程度多余的无用空间的程度i = d dui 信息量信息量 d 数据量数据量 du 冗余量,包含在冗余量,包含在d中中 信息量与冗余的关系信息量与冗余的关系 冗余举例冗余举例播音员播音员 180字字/分钟,分钟,2byte一个字,
11、一个字,360byte (合合0.35kb/分钟分钟)音频数据音频数据8khz采样采样8bit60秒秒 = 3840kbit (合合480kb/分钟分钟)8冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与
12、携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余9冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述
13、7种以外的冗余种以外的冗余10冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余11冗余分类冗余分类1 空间冗余空间
14、冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余12冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗
15、余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余13冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余
16、统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余224色色28色色14冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和
17、时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余15冗余分类冗余分类1 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、
18、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余,数据与携带的信息编码冗余,数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余声音频率声音频率文字组句文字组句色彩渐变色彩渐变主观意识主观意识:16数据压缩算法数据压缩算法5.25.2.1 数据压缩算法分类数据压缩算法分类 无损压缩编码无损压缩编码 压缩数据还原后,压缩数据还原后,与原始数据一致,无损失。与原始数据一致,无损失。(可逆编码可逆编码)霍夫曼编码霍夫曼编码行行 程程 编编 码码算算 术术 编
19、编 码码 有损压缩编码有损压缩编码 压缩后再还原压缩后再还原的数据有损失。的数据有损失。(不可逆编码不可逆编码)预测编码预测编码变换编码变换编码统计编码统计编码行程编码行程编码算数编码算数编码lzw编码编码17预测编码原理预测编码原理5.2.2 预测编码预测编码 有损压缩编码,主要对统计冗余进行压缩。有损压缩编码,主要对统计冗余进行压缩。1预测编码的基本原理预测编码的基本原理 用原样本值对新样本进行预测,得到新样本的预测值。接着,取新用原样本值对新样本进行预测,得到新样本的预测值。接着,取新 样本的实际值和预测值进行比较,二者相减得到差值,然后对差值样本的实际值和预测值进行比较,二者相减得到差
20、值,然后对差值 进行编码。进行编码。2预测编码的应用预测编码的应用 预测编码用于图像的传输和存储。对于连续的多帧图像,新一帧通预测编码用于图像的传输和存储。对于连续的多帧图像,新一帧通 常保留前一帧的部分内容。首先存储当前内容,如像点、帧或线。常保留前一帧的部分内容。首先存储当前内容,如像点、帧或线。 然后与下一帧图像进行比较(预测),把不同点存储或传输,而相然后与下一帧图像进行比较(预测),把不同点存储或传输,而相 同点则是数据冗余,予以剔除。同点则是数据冗余,予以剔除。18dpcm预测压缩算法预测压缩算法3. dpcm(differential pulse code modulation)
21、 差分脉冲编码调制算法,主要用于对图像的像素进行预测、压缩处理。差分脉冲编码调制算法,主要用于对图像的像素进行预测、压缩处理。 工作原理工作原理 首先比较相邻的两个像素,如果存在差异,则传送差异之处的差值;若首先比较相邻的两个像素,如果存在差异,则传送差异之处的差值;若 无差异,则不传送差值。由于图像相邻像素通常是类似的,差异很小,无差异,则不传送差值。由于图像相邻像素通常是类似的,差异很小, 因此,传送的差值总是少于图像的像素值,达到了减少数据量的目的。因此,传送的差值总是少于图像的像素值,达到了减少数据量的目的。4adpcm自适应差分编码自适应差分编码adpcm(adaptive diff
22、erential pulse code modulation)自适应差分编码调制编码,具有自适应特性。自适应差分编码调制编码,具有自适应特性。该编码包括自适应量化和自适应预测两种形式,主要用于对中等质量的该编码包括自适应量化和自适应预测两种形式,主要用于对中等质量的音频信号进行高效率压缩,如语音信号、调幅广播信号的压缩等。音频信号进行高效率压缩,如语音信号、调幅广播信号的压缩等。19变换编码原理变换编码原理5.2.3 变换编码变换编码 (transform coding) 有损压缩编码,用于对统计冗余有损压缩编码,用于对统计冗余 (图像数据图像数据)的压缩。的压缩。 工作原理工作原理 首先对时
23、域上的信号进行首先对时域上的信号进行函数运算函数运算,并变换到频域上,并变换到频域上, 然后在频域上对变换后的信号进行编码。在频域上,然后在频域上对变换后的信号进行编码。在频域上, 信息是按照频谱的能量和频率分布进行排列的。信息是按照频谱的能量和频率分布进行排列的。卡胡南卡胡南劳埃夫变换劳埃夫变换离散傅里叶变换离散傅里叶变换离散余弦变换离散余弦变换wht变换变换5.2.4 统计编码原理统计编码原理统计编码统计编码 无损压缩编码。根据消息出现的概率分布特性,在消息和无损压缩编码。根据消息出现的概率分布特性,在消息和码字之间确定严格的对应关系,以便准确无误地恢复数据。码字之间确定严格的对应关系,以
24、便准确无误地恢复数据。一般而言,图像中某些数据出现概率比较高,而另一些出现概率较低。一般而言,图像中某些数据出现概率比较高,而另一些出现概率较低。对出现概率高的数据分配短码,对出现概率低的数据分配长码。此种方对出现概率高的数据分配短码,对出现概率低的数据分配长码。此种方式不舍弃数据冗余,只改变编码分配的长度,因此总数据流量降低。式不舍弃数据冗余,只改变编码分配的长度,因此总数据流量降低。20霍夫曼编码原理霍夫曼编码原理5.2.5 霍夫曼编码霍夫曼编码 无损编码。无损编码。 编码特点编码特点1 编码长度可变,压缩与解压缩较慢。编码长度可变,压缩与解压缩较慢。2 硬件实现困难。硬件实现困难。3 编
25、码效率取决于信号源的数据出现概率。编码效率取决于信号源的数据出现概率。 编码原理编码原理 出现频率高的数据编码长度短,反之亦然。出现频率高的数据编码长度短,反之亦然。1 信号源的数据按照出现概率递减的顺序排列。信号源的数据按照出现概率递减的顺序排列。2 合并两个最小出现概率,作为新数据出现概率。合并两个最小出现概率,作为新数据出现概率。3 重复进行重复进行12,直至概率相加为,直至概率相加为1为止。为止。4 合并运算时,概率大者取合并运算时,概率大者取0,概率小者取,概率小者取1。5 记录概率为记录概率为1处到信号源的处到信号源的0、1序列。序列。21行程编码原理行程编码原理5.2.6 行程编
26、码(行程编码(run length coding) 无损压缩编码。无损压缩编码。例例一个字符串:一个字符串:5 5 5 5 5 5 7 7 7 7 7 3 3 3 2 2 2 2 1 1 1 1 1 1 1行程编码:行程编码:(5,6) (7,5) (3,3) (2,4) (1,7)可见,行程编码的位数远远少于原始字符串的位数。可见,行程编码的位数远远少于原始字符串的位数。 基本原理基本原理用一个符号值或串代替具有相同值的连续符号,使符号长度少于用一个符号值或串代替具有相同值的连续符号,使符号长度少于原始数据的长度。原始数据的长度。在对图像数据进行编码时,沿一定方向排列的,具有相同灰度值的在对
27、图像数据进行编码时,沿一定方向排列的,具有相同灰度值的像素被看成是连续符号,并用字串代替这些连续符号,可大幅度减像素被看成是连续符号,并用字串代替这些连续符号,可大幅度减少数据量。少数据量。22算术编码原理算术编码原理5.2.7 算术编码算术编码 无损压缩编码,属于统计编码。无损压缩编码,属于统计编码。20世纪世纪60年代由年代由elias提出,某些方面优于霍夫曼编码。因此,提出,某些方面优于霍夫曼编码。因此,在在jpeg标准的扩展系统中,算术编码已经取代了霍夫曼编码。标准的扩展系统中,算术编码已经取代了霍夫曼编码。 基本原理基本原理将被编码的信息表示成实数轴上将被编码的信息表示成实数轴上0和
28、和1之间的间隔,信息越长,间隔越小,之间的间隔,信息越长,间隔越小,表示这一间隔所需的二进制位数就越多。表示这一间隔所需的二进制位数就越多。 特点特点1) 算术编码有基于概率统计的固定模式,也有相对灵活的自适应模式。算术编码有基于概率统计的固定模式,也有相对灵活的自适应模式。2) 自适应模式适用于不进行概率统计的场合。自适应模式适用于不进行概率统计的场合。3) 当信号源符号的出现概率接近时,算术编码的效率高于霍夫曼编码。当信号源符号的出现概率接近时,算术编码的效率高于霍夫曼编码。4) 算术编码的实现相应地比霍夫曼编码复杂,但在图像测试中表明,算术编码的实现相应地比霍夫曼编码复杂,但在图像测试中
29、表明, 算术编码效率比霍夫曼编码效率高算术编码效率比霍夫曼编码效率高5左右。左右。23lzw压缩编码压缩编码5.2.8 lzw(lempel ziv welch)无损压缩编码,用于图像数据的压缩。)无损压缩编码,用于图像数据的压缩。 基本原理基本原理把复杂的数据用简单的代码表示,并把代码和数据的对应关系建立转换把复杂的数据用简单的代码表示,并把代码和数据的对应关系建立转换表,又叫表,又叫“字符串表字符串表”。转换表记录了代码和数据的对应关系。在压缩。转换表记录了代码和数据的对应关系。在压缩和解压缩过程中,和解压缩过程中,lzw压缩编码会生成两个完全相同的转换表,数据以压缩编码会生成两个完全相同
30、的转换表,数据以严格对应的方式被压缩和还原。严格对应的方式被压缩和还原。 特点特点1) 对于可预测性不大的数据效果较好,常用于对于可预测性不大的数据效果较好,常用于gif格式的图像压缩。格式的图像压缩。2) 对于数据流中连续重复出现的字节和字串,具有很高的压缩比。对于数据流中连续重复出现的字节和字串,具有很高的压缩比。3) 被用于文本程序等数据压缩领域。被用于文本程序等数据压缩领域。4) 有很多变体,如常见的有很多变体,如常见的arc、rkarc、pkzip高效压缩程序。高效压缩程序。5) 压缩和解压缩速度较快,对硬件条件要求不高。压缩和解压缩速度较快,对硬件条件要求不高。24静态图像静态图像
31、jpeg压缩编码技术压缩编码技术5.35.3.1 jpeg标准的由来标准的由来1991年,联合专家组提出了年,联合专家组提出了iso cd建议草案建议草案,后经过国际电子技术委员,后经过国际电子技术委员会会iso/iec的批准,正式成为第的批准,正式成为第10918号标准,并正式命名为号标准,并正式命名为“jpeg高质高质量静止图像压缩编码标准量静止图像压缩编码标准”,简称,简称“jpeg标准标准”。 四种编码模式四种编码模式1) dct顺序编码模式顺序编码模式 基本操作模式,也称基本系统,所有基本操作模式,也称基本系统,所有jpeg 编码解码器都必须支持基本系统,采用二维余弦变换的编码方案。
32、编码解码器都必须支持基本系统,采用二维余弦变换的编码方案。2) dct递增模式,该模式又叫累进模式。递增模式,该模式又叫累进模式。3) 无失真编码模式。无失真编码模式。4) 分层编码模式。分层编码模式。多灰度静止图像的数字压缩编码标准多灰度静止图像的数字压缩编码标准25jpeg压缩算法压缩算法5.3.2 适用于连续色调、多级灰度、彩色或黑白图像的数据压缩。适用于连续色调、多级灰度、彩色或黑白图像的数据压缩。无损压缩比:大约为无损压缩比:大约为4:1。有损压缩比:在有损压缩比:在10:1100:1之间。不大于之间。不大于40:1时,还原的图像在色彩、时,还原的图像在色彩、 清晰度、颜色分布等方面
33、与原始图像相比,误差不大,清晰度、颜色分布等方面与原始图像相比,误差不大, 基本上保持了原始图像的风貌。基本上保持了原始图像的风貌。 特点特点1) 对图像进行帧内编码,每帧色调连续,随机存取。对图像进行帧内编码,每帧色调连续,随机存取。2) 在宽范围内调节图像的压缩比和保真度,解码器可参数化。在宽范围内调节图像的压缩比和保真度,解码器可参数化。3) 对图像进行压缩时,可随意选择期望的压缩比值。对图像进行压缩时,可随意选择期望的压缩比值。4) 对于硬件环境要求不高,只要有一般的对于硬件环境要求不高,只要有一般的cpu运算速度即可。运算速度即可。5) 可运行四种编码模式:可运行四种编码模式:dct
34、顺序编码模式、顺序编码模式、dct递增模式、无失真递增模式、无失真 编码模式和分层编码模式。编码模式和分层编码模式。26无失真预测编码无失真预测编码5.3.3 无失真预测编码无失真预测编码 无损压缩,压缩比一般为无损压缩,压缩比一般为2:1。原始图像数据经过无失真原始图像数据经过无失真编码器进行预测编码,然编码器进行预测编码,然后把压缩图像数据存储在后把压缩图像数据存储在介质中或传送出去。介质中或传送出去。在使用图像时,经过解码在使用图像时,经过解码器解码,建立与原始图像器解码,建立与原始图像一致的不失真图像。一致的不失真图像。 原理原理预测器预测器 图像数据图像数据 熵编码器熵编码器 码表说
35、明码表说明 解码器解码器 压缩图像数据压缩图像数据 无失真编码器无失真编码器还原图像数据还原图像数据 采用了简单的线性预测编码方法,采用了简单的线性预测编码方法,dpcm压缩算法和霍夫曼压缩算法,压缩算法和霍夫曼压缩算法,硬件容易实现,重新建立的图像质量与原始图像无差别。硬件容易实现,重新建立的图像质量与原始图像无差别。 特点特点27有失真有失真dct压缩编码压缩编码5.3.4 采用采用dct(discrete cosine transform)离散余弦变换的压缩算法。)离散余弦变换的压缩算法。1dct离散余弦变换离散余弦变换 原理原理源图像在输入到编码器之前,被分割成一系列顺序排列的由源图像
36、在输入到编码器之前,被分割成一系列顺序排列的由88像点像点构成的数据块,把原始采样数据中无符号整数转换成有符号整数,进构成的数据块,把原始采样数据中无符号整数转换成有符号整数,进行正变换。行正变换。还原图像时,解码器输出端经过逆变换,重新建立图像。由于运算误还原图像时,解码器输出端经过逆变换,重新建立图像。由于运算误差和系数的量化,因而重建不很精确,与源图像存在差异。差和系数的量化,因而重建不很精确,与源图像存在差异。2dct系数的量化系数的量化量化依据量化表进行,量化表中的元素由开发人员根据人类视觉特性量化依据量化表进行,量化表中的元素由开发人员根据人类视觉特性制作。量化的定义:制作。量化的
37、定义:cq(u,v) = integer round f(u,v)/q(u,v)解量化是量化过程的逆运算,其公式为:解量化是量化过程的逆运算,其公式为:c q(u,v) = cq(u,v)q(u,v)28有失真有失真dct压缩编码压缩编码5.3.43图像的质量与压缩比图像的质量与压缩比 采用采用dct算法存在失真,但是,只要量化表中的元素更科学、更算法存在失真,但是,只要量化表中的元素更科学、更 符合人类视觉敏感度,则压缩后的图像不会产生过大的视觉变化。符合人类视觉敏感度,则压缩后的图像不会产生过大的视觉变化。压缩结果压缩结果bit/像素像素图像质量的主观评价图像质量的主观评价 假定某图像的像
38、素采用假定某图像的像素采用8bit编码,则压缩结果和图像效果见下表。编码,则压缩结果和图像效果见下表。1.5 2.00.75 1.50.5 0.750.25 0.5色彩、灰阶过度、清晰度等与原始图像差别不大。色彩、灰阶过度、清晰度等与原始图像差别不大。图像质量良好,灰阶过度和层次略感有损失。图像质量良好,灰阶过度和层次略感有损失。图像质量中等,灰阶过度、层次、色彩稍差。图像质量中等,灰阶过度、层次、色彩稍差。图像质量一般,色彩和灰阶与原始图像相比有明图像质量一般,色彩和灰阶与原始图像相比有明显差别。显差别。29动态图像动态图像mpeg压缩编码技术压缩编码技术5.45.4.1 基本原理基本原理1
39、动态图像压缩主要解决的问题动态图像压缩主要解决的问题1) 正确区分静止图像和动态图像。正确区分静止图像和动态图像。2) 提取动态图像中的活动成分。提取动态图像中的活动成分。3) 进行帧之间的预测,提供压缩的依据。进行帧之间的预测,提供压缩的依据。2帧的预测编码帧的预测编码1) 条件像素补充法条件像素补充法 比较两帧对应位置的像素亮度,若亮度差超过预先规定的阀值,比较两帧对应位置的像素亮度,若亮度差超过预先规定的阀值, 则认为两个像素有变化,传送像素。若亮度差未超过阀值,不处理。则认为两个像素有变化,传送像素。若亮度差未超过阀值,不处理。2) 运动补偿法运动补偿法 跟踪画面上的活动元素,并进行向
40、量计算,加以补偿,然后再跟踪画面上的活动元素,并进行向量计算,加以补偿,然后再 利用帧间预测进行压缩。适用于活动元素少的可视电话和电视会议。利用帧间预测进行压缩。适用于活动元素少的可视电话和电视会议。30图像的分类图像的分类3. mpeg标准根据处理图像的性质,把图像分成以下三类:标准根据处理图像的性质,把图像分成以下三类:1) 帧内图像(帧内图像(intra pictures) 又称又称“i图像图像”,jpeg标准按照静止图像的模式进行压缩处理。标准按照静止图像的模式进行压缩处理。 主要利用静止图像自身的相关性进行编码,实现数据压缩的目的。主要利用静止图像自身的相关性进行编码,实现数据压缩的
41、目的。 帧内图像的压缩比属于中度压缩,典型的压缩像素编码为帧内图像的压缩比属于中度压缩,典型的压缩像素编码为2 bit。2) 预测图像(预测图像(predicted pictures) 又称又称“p图像图像”,通过对最近的前一帧,通过对最近的前一帧i图像或者图像或者p图像进行预测图像进行预测的的“前向预测前向预测”过程,把前面图像作为预测下一帧图像的参照物,使图过程,把前面图像作为预测下一帧图像的参照物,使图像编码的数据量减少。预测图像有较高的压缩比,但会增加失真。像编码的数据量减少。预测图像有较高的压缩比,但会增加失真。3) 双向图像(双向图像(bidirestional pictures)
42、 又称又称“b图像图像”,可使用前一帧图像和后一帧图像作参照物,进,可使用前一帧图像和后一帧图像作参照物,进行双向预测。双向预测可以采用四种编码技术,即帧内图像编码、前向行双向预测。双向预测可以采用四种编码技术,即帧内图像编码、前向 预测编码、后向预测编码、双向预测编码。预测编码、后向预测编码、双向预测编码。31mpeg技术标准技术标准5.4.2 mpeg-标准标准 诞生于诞生于1991年,主要特点:年,主要特点:1) 以以1.5mb/s的速率传输视频信号,即压缩信号带宽为的速率传输视频信号,即压缩信号带宽为1.5mb/s。2) 以单通道以单通道64kb/s、128kb/s和和192kb/s的
43、传输速率传输音频信号。的传输速率传输音频信号。3) 可通过差值运算,在可通过差值运算,在352240画面分辨率上显示活动图像。画面分辨率上显示活动图像。4) 分三个组成部分:视频、音频和系统。分三个组成部分:视频、音频和系统。5) 对于帧内图像,采用二维余弦变换、自适应算术编码、行程编码、对于帧内图像,采用二维余弦变换、自适应算术编码、行程编码、 变字长编码,以及差分脉冲编码(变字长编码,以及差分脉冲编码(dpcm)进行压缩。)进行压缩。6) 帧间压缩采用运动补偿预测编码和运动补偿内插编码。帧间压缩采用运动补偿预测编码和运动补偿内插编码。 允许采用多种存储介质,如允许采用多种存储介质,如cd-rom、数字录音带、磁盘、数字录音带、磁盘、cd-r、 cd-rw、m.o.,以及,以及isdn集成服务数字网络、集成服务数字网络、lan局域网络等。局域网络等。 设
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 环保公开制度、培训制度、档案管理制度
- 物资代保管制度
- 爆炸品仓库五双制度
- 烟花爆竹售卖制度
- 村社区消防安全责任制度
- 胖子日常活动方案策划(3篇)
- 装修家具营销方案(3篇)
- 贵州民俗活动策划方案(3篇)
- 车身除锈施工方案(3篇)
- 金饰类目营销方案(3篇)
- 华能电力定员标准
- 《诊断学基础 十三五高职 》读书笔记思维导图PPT模板下载
- GB/T 7926-2015数控往复走丝电火花线切割机床精度检验
- GB/T 16983-2021化学试剂二氯甲烷
- GA/T 1433-2017法庭科学语音同一认定技术规范
- 果蔬汁及果蔬饮料加工技术
- 新版人教版小学美术四年级美术下册全册教案
- GB∕T 8050-2017 纤维绳索 聚丙烯裂膜、单丝、复丝(PP2)和高强度复丝(PP3)3、4、8、12股绳索
- DB62∕T 2992-2019 黄土地区高速公路路基施工技术规范
- 《愿望的实现》原文大全
- 线束加工基础知识
评论
0/150
提交评论