第二章多媒体数据压缩技术

上传人：q*** IP属地：湖北上传时间：2022-07-02 格式：PPT 页数：216 大小：11.52MB 积分：28 举报 版权申诉

已阅读5页，还剩211页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、1第第2 2章章多媒体数据压缩技术多媒体数据压缩技术数据的高效表示和压缩技术是多媒数据的高效表示和压缩技术是多媒体系统的关键技术体系统的关键技术22.1 2.1 前言（数据压缩概述）前言（数据压缩概述）n数字化数字化n数据压缩数据压缩n数据压缩的途径数据压缩的途径n数据压缩方法数据压缩方法32.1.1 2.1.1 数字化数字化n在多媒体技术中，绝大在多媒体技术中，绝大多数数字媒体是对模拟多数数字媒体是对模拟媒体进行适当处理而得媒体进行适当处理而得到的，即所谓到的，即所谓“数字化数字化”n数字化的好处数字化的好处A A）数字化后处理更方便）数字化后处理更方便B B）易于存储和远距离传输）易于存

2、储和远距离传输C C）没有累积失真）没有累积失真4数字化数字化过程过程n数字化过程：连续信号数字化过程：连续信号离散信号，采样离散信号，采样（时空）（时空）n数字化过程包括三步骤数字化过程包括三步骤n采样采样n量化量化n编码编码5数字化数字化过程过程模拟信号采样量化0 0 1 1 1 0 0 1 1 0 1数字信号（编码）6采样采样n采样（采样（samplingsampling）通过某种频率的采样脉冲将模拟信息的值取出，通过某种频率的采样脉冲将模拟信息的值取出，变连续的模拟信号为离散信号变连续的模拟信号为离散信号n采样定理：采样频率采样定理：采样频率原始信号频率的原始信号频率的2 2倍时，倍

3、时，采样信号才可以保真地恢复为原始信号（奈奎采样信号才可以保真地恢复为原始信号（奈奎斯特理论，斯特理论，Nyquist theoryNyquist theory） 7不同采样点数对图像质量的影响不同采样点数对图像质量的影响（a）原始图像）原始图像(256256)；（；（b）采样图像）采样图像1(128128)；（；（c）采样图像采样图像2(6464)；（d）采样图像）采样图像3(3232)；（e）采样图像）采样图像4(1616)；（；（f）采样图像采样图像5(88) 8量化量化n量化（量化（QuantizationQuantization）将采样样本的幅度按照量化级别决定其取值的过将采

4、样样本的幅度按照量化级别决定其取值的过程。目的是程。目的是将采样样本的幅度值离散化将采样样本的幅度值离散化。量化之前需要规定量化级，比如量化之前需要规定量化级，比如8 8级，级，1616级等级等9不同量化级别对图像质量的影响不同量化级别对图像质量的影响（a）原始图像原始图像(256色色)；（b）量化图像量化图像1(64色色)；（c）量化图像量化图像2(32色色)；（d）量化图像量化图像3(16色色)；（e）量化图像量化图像4(4色色)；（f）量化图像量化图像5(2色色) 10编码编码n编码编码n用相应位数的用相应位数的二进制代码表示二进制代码表示量化后的采样样量化后的采样

5、样本的量级本的量级n如果有如果有N N个量化级，那么对应的二进制位数就个量化级，那么对应的二进制位数就为为loglog2 2N N。当。当N N1616，二进制需要，二进制需要4 4位位n经过编码之后，每个样本都表示为相应的二进经过编码之后，每个样本都表示为相应的二进制代码制代码n脉冲编码调制（脉冲编码调制（PCMPCM，Pulse Code Pulse Code ModulationModulation）, ,完成模拟信号的数字化完成模拟信号的数字化1100010010001101000101011001111000100110101011120,1.50,1.5分成分成1515个区间，个区

6、间，间隔长度间隔长度0.10.1，形成，形成1616个量化级个量化级13数字化带来的问题数字化带来的问题数据量巨大数据量巨大文文本本图图像像音音频频视视频频分辨率为分辨率为1024768，字符大，字符大小为小为88点阵，每个字符占用点阵，每个字符占用两个字节，则满屏字符的数据两个字节，则满屏字符的数据存储量为：存储量为：（1024/8）（768/8）2Byte24576Byte24KB 一幅一幅1024768分辨率的真彩分辨率的真彩色图像为例，其数据存储量为：色图像为例，其数据存储量为：102476883bit=18874368bit=2.25MB。高质量的音频（如高质量的音频（如CDCD音

7、质）音质）,1,1分钟这样的分钟这样的声音数据的存储量为：声音数据的存储量为：44.1K44.1K2Byte2Byte（16bit16bit采样精度）采样精度）2 2（双声道）（双声道）6060（秒）（秒）10.34MB10.34MB1s的电视信号的电视信号的数据量为：的数据量为：（4.2+1.5+0.5）M28bit=12.4MB14多媒体数据多媒体数据数据量数据量电话（电话（20203400Hz3400Hz）80008000样本数样本数/ /秒秒1212比特比特/ /样本样本96kbps96kbps宽带语音宽带语音（50507000Hz7000Hz）1600016000样本数样本数/ /秒

8、秒1414比特比特/ /样本样本224kbps224kbps宽带音频宽带音频（202020000Hz20000Hz）4410044100样本数样本数/ /秒秒1616比特比特/ /样本样本2 2信道信道1.412Mbps1.412Mbps图像图像512512512512像素色彩图像像素色彩图像2424比特比特/ /像素像素6.3M6.3M比特比特/ /图像图像视频视频640640480480像素色彩图像像素色彩图像2424比特比特/ /像素像素3030帧帧/ /秒秒221Mbps 221Mbps 高清晰度电视（高清晰度电视（HDTVHDTV）12801280720720像素色彩图像像素色彩图像

9、2424比特比特/ /像素像素6060帧帧/ /秒秒1.3Gbps1.3Gbps152.1.2 2.1.2 数据压缩数据压缩n大容量存储问题大容量存储问题n实时传输问题实时传输问题数据压缩数据压缩从目前计算机的软硬件发展水平及发展趋势来看，在将从目前计算机的软硬件发展水平及发展趋势来看，在将来很长的一段时间内，数字化的媒体数据以压缩形式存来很长的一段时间内，数字化的媒体数据以压缩形式存储和传输仍将是唯一的选择储和传输仍将是唯一的选择16数据压缩数据压缩n数据压缩数据压缩 “ “历史悠久历史悠久”，已经发展了，已经发展了6060多年，多年，但直到但直到2020世纪世纪8080年代以后才不断涌现出

10、适合各种年代以后才不断涌现出适合各种应用场合的编码和压缩算法应用场合的编码和压缩算法n数据能够进行压缩的原因：数据能够进行压缩的原因：1 1）数据中存在大量的）数据中存在大量的冗余冗余（相关性相关性），如空间冗余、），如空间冗余、时间冗余、结构冗余、知识冗余及纹理统计冗余时间冗余、结构冗余、知识冗余及纹理统计冗余 2 2）对于图像、音频和视频等，人的）对于图像、音频和视频等，人的感知感知可容忍某些细节可容忍某些细节信息的丢失（失真）。（感知冗余信息的丢失（失真）。（感知冗余）17数据压缩的条件数据压缩的条件n统计冗余统计冗余n空间冗余和时间冗余反应了信号的统计特性，有空间冗余和时间冗余反应了

11、信号的统计特性，有时把这两种冗余称为统计冗余。它们也是多媒体时把这两种冗余称为统计冗余。它们也是多媒体数据处理中两种最主要的数据冗余数据处理中两种最主要的数据冗余重复数据重复数据可忽略数据可忽略数据18数据压缩的条件数据压缩的条件n人类敏感度人类敏感度n人类不敏感因素人类不敏感因素 ( (颜色、亮度、细节等颜色、亮度、细节等) )颜色不敏感因素颜色不敏感因素224 颜色颜色 (16,777,216色色)28 颜色颜色 (256色色) 44.1kHz / Stereo 1.3MB 22.0kHz / Mono 0.3MB Stop音频不敏感因素音频不敏感因素 (试听试听)192.1.3 2.1.

12、3 数据压缩的途径数据压缩的途径n数据压缩途径数据压缩途径消除冗余消除冗余n数据冗余的类型主要有数据冗余的类型主要有n空间冗余空间冗余 n时间冗余时间冗余 n结构冗余结构冗余n信息熵冗余信息熵冗余n视觉冗余视觉冗余 n听觉冗余听觉冗余n知识冗余知识冗余201 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相

13、互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余，数据与携带的信息编码冗余，数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余211 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余，

14、数据与携带的信息编码冗余，数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余221 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余，数据与携带的信息编码冗余，数据与携带的信息8 其他冗余其他冗余上述上述7种以外

15、的冗余种以外的冗余231 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余，数据与携带的信息编码冗余，数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余241 空间冗余空间冗余规则物体的物理相关性规则物体的物理相

16、关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余，数据与携带的信息编码冗余，数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余251 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统

17、计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余，数据与携带的信息编码冗余，数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余224色色28色色261 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6

18、视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7 知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余，数据与携带的信息编码冗余，数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余271 空间冗余空间冗余规则物体的物理相关性规则物体的物理相关性2 时间冗余时间冗余视频与动画画面间的相关性视频与动画画面间的相关性3 统计冗余统计冗余具有空间冗余和时间冗余具有空间冗余和时间冗余6 视觉冗余视觉冗余视觉、听觉敏感度和非线性感觉视觉、听觉敏感度和非线性感觉7

19、知识冗余知识冗余凭借经验识别凭借经验识别4 结构冗余结构冗余规则纹理、相互重叠的结构表面规则纹理、相互重叠的结构表面5 信息熵冗余信息熵冗余编码冗余，数据与携带的信息编码冗余，数据与携带的信息8 其他冗余其他冗余上述上述7种以外的冗余种以外的冗余声音频率声音频率文字组句文字组句色彩渐变色彩渐变主观意识主观意识:282.1.4 2.1.4 数据压缩的方法数据压缩的方法n数据压缩就是去掉信号数据的冗余性数据压缩就是去掉信号数据的冗余性n19481948年年 OliverOliver提出脉冲编码调制（提出脉冲编码调制（PCMPCM）编码理论）编码理论(PCM(PCMPulse Code Modula

20、tion)Pulse Code Modulation)n根据解码后数据与原始数据是否完全一致，数据压缩方根据解码后数据与原始数据是否完全一致，数据压缩方法划分为两类法划分为两类n可逆编码（无失真编码，无损压缩）可逆编码（无失真编码，无损压缩）解码数据与原始数据严格相同，压缩比大约在解码数据与原始数据严格相同，压缩比大约在2 2：1 1到到5 5：1 1之间，之间，如如HuffmanHuffman编码、算术编码、行程长度编码等编码、算术编码、行程长度编码等n不可逆编码不可逆编码( (有失真编码，有损压缩有失真编码，有损压缩) )还原数据与原始数据存在一定的误差，但（视觉还原数据与原始数据存在一

21、定的误差，但（视觉/听觉）效果一听觉）效果一般可以接受，压缩比可以从几倍到上百倍来调节，般可以接受，压缩比可以从几倍到上百倍来调节，如变换编码和如变换编码和预测编码等预测编码等292.2 2.2 常用数据压缩技术常用数据压缩技术n压缩和解压缩过程压缩和解压缩过程n数据压缩分类数据压缩分类n预测编码预测编码n变换编码变换编码n信息熵编码信息熵编码302.2.1 2.2.1 压缩和解压缩过程压缩和解压缩过程 n数据压缩就是去掉信号数据的冗余性。数据压缩数据压缩就是去掉信号数据的冗余性。数据压缩常常又称为数据信源编码，或简称为常常又称为数据信源编码，或简称为数据编码数据编码n与此对应，数据压缩的逆过

22、程称为数据解压缩，与此对应，数据压缩的逆过程称为数据解压缩，也称为数据信源解码，或简称为也称为数据信源解码，或简称为数据解码数据解码n数据压缩的典型操作包括预准备、处理、量化和数据压缩的典型操作包括预准备、处理、量化和编码等过程编码等过程31压缩和解压缩过程压缩和解压缩过程n解压缩是压缩的逆过程解压缩是压缩的逆过程n具体的编码器和解码器以不同的方法构成具体的编码器和解码器以不同的方法构成n在对称应用中（如对话应用），编码和解码代在对称应用中（如对话应用），编码和解码代价应基本相同价应基本相同n在非对称应用中（如在非对称应用中（如DVDDVD等视频应用），解码等视频应用），解码过程比编码过程耗费

23、的代价要小，这种技术用过程比编码过程耗费的代价要小，这种技术用于以下情形于以下情形n压缩的过程仅一次，采样的时间不限压缩的过程仅一次，采样的时间不限 n解压缩经常用到并需要迅速完成解压缩经常用到并需要迅速完成输入数据输入数据编码器编码器（压缩）（压缩）存储或网存储或网络传输络传输解码器解码器（解压缩）（解压缩）输出数据输出数据32数据压缩系统组成数据压缩系统组成信息源编码器内部码编码器通信线路或存储媒体内部码解码器信息源解码器原始数据复原数据332.2.2 2.2.2 数据压缩分类数据压缩分类n预测编码预测编码利用空间中利用空间中相邻数据的相关性相邻数据的相关性来预测来预测未来点的数据。如差

24、分脉冲编码调制和自适应差未来点的数据。如差分脉冲编码调制和自适应差分脉冲编码调制分脉冲编码调制n变换编码变换编码将图像将图像时域信号变换到频域时域信号变换到频域空间上处空间上处理。时域空间有强相关的信号，反映在频域上是理。时域空间有强相关的信号，反映在频域上是某些特定的区域内能量常被集中在一起，从而实某些特定的区域内能量常被集中在一起，从而实现压缩。如正交变换、离散余弦变换、离散付立现压缩。如正交变换、离散余弦变换、离散付立叶变换和叶变换和Walsh-HadamardWalsh-Hadamard变换变换n量化和矢量量化编码量化和矢量量化编码为了使整体量化失真最小，为了使整体量化失真最小，就

25、必须依照就必须依照统计的概率分布统计的概率分布设计最优的量化器设计最优的量化器34n信息熵编码信息熵编码根据信息熵原根据信息熵原理，让理，让出现概率大的用短出现概率大的用短的码字表达的码字表达，反之用长的，反之用长的码字表示。最常见的方法码字表示。最常见的方法有有HuffmanHuffman编码、编码、ShannonShannon编码以及算术编码编码以及算术编码n子带编码子带编码使用带通滤波器使用带通滤波器组将信号组将信号频带分割频带分割成若干成若干个子频带，然后分别处理个子频带，然后分别处理n模型编码模型编码编码时首先将图编码时首先将图像中边界、轮廓、纹理等像中边界、轮廓、纹理等结构特

26、征结构特征找出来，保存这找出来，保存这些参数信息。解码时根据些参数信息。解码时根据结构和参数信息进行合成，结构和参数信息进行合成，恢复出原图像。具体方法恢复出原图像。具体方法有轮廓编码、域分割编码、有轮廓编码、域分割编码、分析合成编码、识别合成分析合成编码、识别合成编码、基于知识的编码、编码、基于知识的编码、分形编码等分形编码等35常用压缩编码方法分类常用压缩编码方法分类 36压缩算法的衡量标准压缩算法的衡量标准n衡量压缩算法的三个主要指标衡量压缩算法的三个主要指标n压缩比大压缩比大n算法简单，压缩算法简单，压缩/ /解压缩速度快，以满足解压缩速度快，以满足实时性要求实时性要求n压缩损失少，失

27、真小，即解压恢复的效压缩损失少，失真小，即解压恢复的效果要好果要好n当三者不能兼得时，要综合考虑当三者不能兼得时，要综合考虑372.2.3 2.2.3 预测编码预测编码n线性预测线性预测-DPCM-DPCM（差分脉冲编码调制）差分脉冲编码调制）主要用于图像处理主要用于图像处理基本原理是基于图像中相邻像素之间具有基本原理是基于图像中相邻像素之间具有较强的相关性。每个像素可较强的相关性。每个像素可根据已知的前根据已知的前几个像素来作预测几个像素来作预测。因此在预测编码中，。因此在预测编码中，编码和传输的并不是像素采样值本身，而编码和传输的并不是像素采样值本身，而是这个采样值的预测值与其实际值之

28、间的是这个采样值的预测值与其实际值之间的差值差值n非线性预测（不讨论）非线性预测（不讨论）38DPCMDPCM系统原理框图系统原理框图预测器预测器量化器量化器编码器编码器解码器解码器预测器预测器信信道道接收端输出XNXNeNXNeNeNXN+输入XN发送端+-392.2.4 2.2.4 变换编码变换编码n有损压缩有损压缩编码，用于对统计冗余编码，用于对统计冗余 ( (图像数据图像数据) )的的压缩压缩n首先对时域上的信号进行首先对时域上的信号进行函数运算函数运算，并变换到频，并变换到频域上，然后在域上，然后在频域频域上对变换后的信号进行上对变换后的信号进行编码编码。在频域上，信息是按照频

29、谱的能量和频率分布进在频域上，信息是按照频谱的能量和频率分布进行排列的行排列的n输入图像输入图像G G经正交变换经正交变换U U变换到频域空间，像素之变换到频域空间，像素之间相关性下降，能量集中在变换域中少数变换系间相关性下降，能量集中在变换域中少数变换系数上，已经达到了数据压缩的效果数上，已经达到了数据压缩的效果40变换编码变换编码n对变换系数对变换系数A A中那些幅度大元素予以保留，其他中那些幅度大元素予以保留，其他数量多的幅度小的变换系数，全部当作零不予编数量多的幅度小的变换系数，全部当作零不予编码，再辅以非线性量化，进一步压缩图像数据码，再辅以非线性量化，进一步压缩图像数据n由于量化器

30、存在，量化后变换系数由于量化器存在，量化后变换系数A A和和A A间必然间必然存在量化误差，从而引起输入图像存在量化误差，从而引起输入图像G G和输出图像和输出图像G G间存在误差。下页图中间存在误差。下页图中U U是是U U的逆变换的逆变换 n实际应用中采用一些准最佳变换如实际应用中采用一些准最佳变换如DCTDCT，DFTDFT和和WHTWHT等等41变换编码原理框图变换编码原理框图变换变换量化量化编码器编码器解码器解码器逆变换逆变换信信道道输入发送端接收端输出GGUUAA422.2.5 2.2.5 信息熵编码信息熵编码n又称为统计编码，它是根据信源符号出现概率的又称为统计编码，它是根据信源

31、符号出现概率的分布特性而进行的压缩编码分布特性而进行的压缩编码n基本思想：基本思想：在信源符号和码字之间建立明确的在信源符号和码字之间建立明确的一一对应关系，以便在恢复时能准确地再现原信一一对应关系，以便在恢复时能准确地再现原信号，同时要使平均码长或码率尽量小号，同时要使平均码长或码率尽量小n如如HuffmanHuffman编码、算术编码编码、算术编码43HuffmanHuffman编码编码nHuffmanHuffman定理定理 n在变长编码中，对出现概率大的信源符号赋于在变长编码中，对出现概率大的信源符号赋于短码字，而对于出现概率小的信源符号赋于长短码字，而对于出现概率小的信源符号赋于长码

32、字。如果码字长度严格按照所对应符号出现码字。如果码字长度严格按照所对应符号出现概率大小逆序排列，则编码结果平均码字长度概率大小逆序排列，则编码结果平均码字长度一定小于任何其他排列方式一定小于任何其他排列方式nHuffmanHuffman定理是定理是HuffmanHuffman编码的理论基础编码的理论基础 44HuffmanHuffman编码步骤编码步骤n 初始化，根据符号概率的大小，按由大到小初始化，根据符号概率的大小，按由大到小顺序对符号进行排序顺序对符号进行排序n 把概率最小的两个符号组成一个新符号（节把概率最小的两个符号组成一个新符号（节点），即新符号的概率等于这两个符号概率之和点），即

33、新符号的概率等于这两个符号概率之和n 重复第重复第2 2步，直到形成一个符号为止，其概率步，直到形成一个符号为止，其概率等于等于1 1n 从编码树的根开始回溯到原始的符号，从上从编码树的根开始回溯到原始的符号，从上到下标上到下标上“0”0”或或“1”1”。通常左分支标为。通常左分支标为0 0，右，右分支标为分支标为1 1n 从根节点开始顺着树枝到每个叶子写出每个从根节点开始顺着树枝到每个叶子写出每个符号的代码符号的代码45HuffmanHuffman编码举例编码举例n信源信源A A的符号及其概率的符号及其概率Aa1a2a3a4a5a6a7a8P(A)80.170.150.

34、100.0050.005编码过程：编码过程：a1 0.20a2 0.19a3 0.18a4 0.17a5 0.15a6 0.10a7 0.005a8 0.005100.01100.11100.26100.35100.39100.61101编码编码结果结果：01001111101011001100011000046HuffmanHuffman编码举例编码举例55433322码长码长w810000w710001w61001w5101w4110w3111w200w101码字码字(Wi)a8a7a6a5a4a3a2a1符号符号编码结果：编码结果：平均码长：平均码长：)/(73. 225005. 041

35、0. 0315. 0317. 0318. 0219. 0220. 0)(81i信源符号bitlaPLii47HuffmanHuffman编码举例编码举例如果上表中，首次对缩减如果上表中，首次对缩减信源最后两个概率最小的信源最后两个概率最小的符号用码符号标记为符号用码符号标记为0,1时，时，也可反过来标记为也可反过来标记为1,0，则，则可得到另一组霍夫曼码：可得到另一组霍夫曼码：w7w801w60101w5w3w40101w1w2010101111,01110,0110,010,001,000,11,1087654321wwwwwwww注意：注意：上述过程的等价编码树上述过程的等价编码树48算术

36、编码算术编码编码步骤编码步骤n 编码器在开始时将编码器在开始时将“当前间隔当前间隔”设置为设置为00，1)1)n 根据信源符号的概率，将根据信源符号的概率，将“当前间隔当前间隔”分为分为子间隔，每个符号一个子间隔，子间隔大小为信子间隔，每个符号一个子间隔，子间隔大小为信源符号的概率源符号的概率n 根据信源符号序列，编码器选择子间隔对应根据信源符号序列，编码器选择子间隔对应于下一个符号，并使它成为新的于下一个符号，并使它成为新的“当前间隔当前间隔”，编码将编码将“当前间隔当前间隔”分为子间隔，子间隔的大小分为子间隔，子间隔的大小与下一个符号的概率成比例与下一个符号的概率成比例n 重复步骤重复步骤

37、，直到符号序列的最后一位，消，直到符号序列的最后一位，消息的编码输出可以是最后一个间隔中的任意数息的编码输出可以是最后一个间隔中的任意数49算术编码算术编码编码举例编码举例n信源符号，概率和初始编码间隔信源符号，概率和初始编码间隔符号符号ABCD概率概率0.3初始编码间隔初始编码间隔0,0.1)0.1,0.5)0.5,0.7)0.7,1如果二进制消息序列的输入为如果二进制消息序列的输入为CADACDBCADACDB，则编码过程为：，则编码过程为：信源符号信源符号111001000.5C输入输入01A0.70.520.5D0.520.514A0.51460.514C0.5144

38、20.5143D0.514420.5143840.5144020.5143876B输出为期间任意数50算术编码算术编码编码过程说明编码过程说明步骤步骤输入符号输入符号编码间隔编码间隔编码判决编码判决1C0.5,0.7符号的间隔范围符号的间隔范围0.5,0.72A0.5,0.520.5,0.7间隔的第间隔的第1个个1/103D0.514,0.520.5,0.52间隔的最后间隔的最后3个个1/104A0.514,0.51460.514,0.52间隔的第间隔的第1个个1/105C0.5143,0.514420.514,0.5146间隔从第间隔从第5个个1/10开始的开始的2个个1/106D0.514

39、384,0.514420.5143,0.51442间隔的最后间隔的最后3个个1/107B0.5143876,0.5144020.514384,0.51442间隔从第间隔从第1个个1/10开始的开始的4个个1/108从从0.5143876,0.514402中选择一个数作为输出：中选择一个数作为输出：0.514387651算术编码算术编码解码过程解码过程步骤步骤间隔间隔译码符号译码符号译码判决译码判决10.5,0.7C0.51439在间隔在间隔 0.5,0.7)20.5,0.52A0.51439在间隔在间隔 0.5,0.7)的第的第1个个1/1030.514,0.52D0.51439在间隔在间隔0

40、.5,0.52)的第的第7个个1/1040.514,0.5146A0.51439在间隔在间隔0.514,0.52的第的第1个个1/1050.5143,0.51442C0.51439在间隔在间隔0.514,0.5146的第的第5个个1/1060.514384,0.51442D0.51439在间隔在间隔0.5143,0.51442的第的第7个个1/1070.51439,0.5143948B0.51439在间隔在间隔0.51439,0.5143948的第的第1个个1/108译码的消息：译码的消息：C A D A C D B522.3 2.3 数字图像编码技术数字图像编码技术n颜色空间及其变换颜色空间

41、及其变换n数字图像文件格式数字图像文件格式n多媒体数据的转换多媒体数据的转换532.3.1 2.3.1 彩色空间及其变换彩色空间及其变换n颜色颜色视觉系统对可见光的感知结果视觉系统对可见光的感知结果n人的视网膜有对红、绿、蓝颜色敏感程度不一样人的视网膜有对红、绿、蓝颜色敏感程度不一样的三种锥体细胞的三种锥体细胞n自然界中任何一种颜色都可以由自然界中任何一种颜色都可以由RGBRGB这这3 3种颜色值种颜色值之和来确定，构成一个三维的之和来确定，构成一个三维的RGBRGB矢量空间，由矢量空间，由此形成一个此形成一个RGBRGB彩色空间。彩色空间。n彩色模型（颜色模式，彩色空间）彩色模型（颜色模式，

42、彩色空间）用简单方法描述所有颜色的一套规则和定义用简单方法描述所有颜色的一套规则和定义54电磁波谱电磁波谱可见光谱可见光谱 55彩色模型彩色模型n常见模型：常见模型： n RGBRGB彩色模型彩色模型n HISHIS彩色模型彩色模型 n YUVYUV彩色模型彩色模型 n YIQYIQ彩色模型彩色模型 n CMYKCMYK彩色模型彩色模型56RGBRGB颜色模型颜色模型n颜色模型用来描述人们颜色模型用来描述人们能感知的和处理的颜色能感知的和处理的颜色nRGBRGB颜色模型是颜色最颜色模型是颜色最基本的表示模型，也是基本的表示模型，也是计算机系统彩色显示器计算机系统彩色显示器采用的颜色模型。其中

43、，采用的颜色模型。其中，R R，G G，B B分别代表红分别代表红（RedRed）、绿（）、绿（GreenGreen）、）、蓝（蓝（BlueBlue）三色。）三色。RGBRGB颜色模型通常用单位立颜色模型通常用单位立方体来表示方体来表示57RGBRGB颜色模型颜色模型nRGBRGB模型也称为模型也称为加色模型加色模型，各种颜色由不同比例，各种颜色由不同比例红、绿、蓝红、绿、蓝3 3种基本色的叠加而成。任意颜色种基本色的叠加而成。任意颜色F F的的配色方程为：配色方程为：nF FrRrRgGgGbGbGn式子中式子中rRrR、gGgG、bGbG为为F F色的三色分量色的三色分量n如果如果rRrR

44、、gGgG、bGbG三个分量各占一个字节三个分量各占一个字节（8 8位），这样共可表示位），这样共可表示2 22424=16 777 216=16 777 216种颜色种颜色58RGBRGB颜色模型颜色模型RGBRGB三基色叠加效果三基色叠加效果59HSIHSI颜色模型颜色模型n用用H(Hue,H(Hue,色调色调) )、S(Saturation,S(Saturation,饱和度饱和度) )、I(Intensity,I(Intensity,光强度光强度) )表示一种颜色表示一种颜色n一种直观的颜色模型，更适合人的视觉特一种直观的颜色模型，更适合人的视觉特性性nHSI(HSL) HSI(HSL)

45、 RGBRGB60在饱和的彩色光中增加白光的成分，相当于在饱和的彩色光中增加白光的成分，相当于增加光能增加光能，因而变得更亮，但是它的饱，因而变得更亮，但是它的饱和度却降低了。若增加黑色光的成分，相当于降低光能，因而变得更暗，其饱和度也降和度却降低了。若增加黑色光的成分，相当于降低光能，因而变得更暗，其饱和度也降低了低了照射的光越强，反射光也越强，看起来越亮。显然，如果彩色光的强度降到使人看照射的光越强，反射光也越强，看起来越亮。显然，如果彩色光的强度降到使人看不到了，在亮度标尺上它应与黑色对应。同样，如果其强度变得很大，那么亮度等不到了，在亮度标尺上它应与黑色对应。同样，如果其强度变得很大，

46、那么亮度等级应与白色对应。亮度是非彩色属性，级应与白色对应。亮度是非彩色属性，彩色图像中的亮度对应于黑白图像中的灰度彩色图像中的亮度对应于黑白图像中的灰度同一物体因受光不同会产生亮度上的变化同一物体因受光不同会产生亮度上的变化 61YUVYUV颜色模型颜色模型n由广播电视需求的推动而开发的彩色空间，主要由广播电视需求的推动而开发的彩色空间，主要目的是为了压缩色度信息以便有效的播送彩色电目的是为了压缩色度信息以便有效的播送彩色电视图像视图像nY Y为亮度信号，为亮度信号，U U、V V是色差信号（是色差信号（B-Y,R-YB-Y,R-Y）U U和和V V构成彩色的两个分量构成彩色的两个分量nP

47、ALPAL模拟彩色电视采用的彩色空间模拟彩色电视采用的彩色空间n优点是亮度和色差信号分离，容易使彩色电视系优点是亮度和色差信号分离，容易使彩色电视系统与黑白电视信号兼容统与黑白电视信号兼容62n变换公式变换公式 Y = 0.299Y = 0.299* *R + 0.587R + 0.587* *G + 0.114G + 0.114* *B B U =-0.169 U =-0.169* *R - 0.332R - 0.332* *G + 0.500G + 0.500* *B B V = 0.500 V = 0.500* *R + 0.419R + 0.419* *G - 0.081G - 0.0

48、81* *B B63YIQYIQ颜色模型颜色模型nNTSCNTSC制式的模拟彩色电视采用的彩色空间制式的模拟彩色电视采用的彩色空间nY Y是亮度，是亮度，I I和和Q Q是两个彩色分量，共同描述是两个彩色分量，共同描述图像的色调和饱和度图像的色调和饱和度n亮度与色差分离，可以更有效的压缩图像亮度与色差分离，可以更有效的压缩图像的数据量的数据量n变换公式变换公式(YIQ(YIQRGB)RGB) Y = 0.299Y = 0.299* *R + 0.587R + 0.587* *G + 0.114G + 0.114* *B B I = 0.211 I = 0.211* *R - 0.523R -

49、0.523* *G + 0.312G + 0.312* *B B Q = 0.596 Q = 0.596* *R - 0.275R - 0.275* *G - 0.322G - 0.322* *B B64CMYKCMYK颜色模型颜色模型nCMYKCMYK模型以打印在纸上的油墨的光线吸收模型以打印在纸上的油墨的光线吸收特性为基础特性为基础n当白光照射到半透明油墨上时，色谱中的当白光照射到半透明油墨上时，色谱中的一部分被吸收，而另一部分被一部分被吸收，而另一部分被反射反射回眼睛。回眼睛。哪些光波反射到眼睛中，决定了人们能感哪些光波反射到眼睛中，决定了人们能感知的颜色知的颜色65红光显红色是因为红光

50、显红色是因为.66绿光显绿色是因为绿光显绿色是因为67CMYKCMYK颜色模型颜色模型nCMYKCMYK模型中也定义了颜料的三种基本颜模型中也定义了颜料的三种基本颜色色青色青色(Cyan)(Cyan)、品红、品红(Magenta)(Magenta)和黄色和黄色(Yellow)(Yellow)。理论上，任何一种颜色都可以。理论上，任何一种颜色都可以用这三种基本颜料按一定比例混合得到用这三种基本颜料按一定比例混合得到n由于所有打印油墨都包含一些杂质，因此由于所有打印油墨都包含一些杂质，因此这三种油墨实际生成土灰色，必须与黑色这三种油墨实际生成土灰色，必须与黑色(K)(K)油墨合成才能生成真正的黑色

51、油墨合成才能生成真正的黑色68CMYKCMYK颜色模型颜色模型用于印刷用于印刷分色胶片分色胶片印版印版印辊印辊成品成品印纸印纸69CMYKCMYK颜色模型颜色模型n与与RGBRGB模型相对，模型相对，CMYKCMYK模型被称为模型被称为减色模型减色模型n理论上，在相减混色中理论上，在相减混色中n等量黄色等量黄色(Y)(Y)和品红和品红(M)(M)相减而青色相减而青色(C)(C)为为0 0时，得到红时，得到红色色(R)(R)n等量青色等量青色(C)(C)和品红和品红(M)(M)相减而黄色相减而黄色(Y)(Y)为为0 0时，得到蓝时，得到蓝色色(B)(B)n等量黄色等量黄色(Y)(Y)和青色和青色

52、(C)(C)相减而品红相减而品红(M)(M)为为0 0时，得到绿时，得到绿色色(G)(G)n100%100%的三种基本颜料合成将吸收所有颜色而生成黑色的三种基本颜料合成将吸收所有颜色而生成黑色70n相加色和相减色之间成对出现，称为互补色相加色和相减色之间成对出现，称为互补色相加混色相加混色相减混色相减混色生成的颜色生成的颜色RGBRGBCMYCMY000000111111黑黑001001110110蓝蓝010010101101绿绿011011100100青青100100011011红红101101010010品红品红110110001001黄黄111111000000白白712.3.2 2.3

53、.2 数字图像文件格式数字图像文件格式n图像文件图像文件存放图像数据存放图像数据n常见的图像文件格式有常见的图像文件格式有nBMPBMPnTIF TIF nPCXPCXnGIFGIFnJPEGJPEGnPNG PNG nTGATGAn. http:/ n由由Zsoft公司开发公司开发 n使用行程编码的方法进行压缩使用行程编码的方法进行压缩 n占用少量存储空间，以牺牲时间为代价占用少量存储空间，以牺牲时间为代价 73BMPBMP格式格式文件头文件头（文件头和（文件头和信息头）信息头）色彩表色彩表（反向排列）（反向排列）图像数据图像数据n由由MicrosoftMicrosoft公司为公司为Wind

54、owsWindows开发开发 n能应付高速度的操作要求能应付高速度的操作要求 n与设备无关与设备无关 n可以是可以是2 2色、色、1616色、色、256256色或色或16 777 21616 777 216色色 74TIFFTIFF格式格式文件头文件头标志信息区标志信息区图像数据图像数据n支持的色彩数最高可达支持的色彩数最高可达16M16M种种 n存储的图像质量高，占用的存储空间大存储的图像质量高，占用的存储空间大 n细微层次信息多，利原稿阶调与色彩复制细微层次信息多，利原稿阶调与色彩复制 n独立于操作平台和软件独立于操作平台和软件 n常用于印刷常用于印刷 75GIFGIF格式格式文件头文件头

55、逻辑屏逻辑屏幕描述幕描述调色板信息调色板信息图像数据图像数据结束标志结束标志n具有具有87a87a和和89a89a两种格式两种格式 87a87a描述单一（静止）图像描述单一（静止）图像 89a89a描述多帧图像描述多帧图像n采用采用LZWLZW压缩算法压缩算法 n最多处理最多处理256256种色彩，不能存储真彩色图像种色彩，不能存储真彩色图像 n支持支持65535655356553565535分辨率分辨率 76GIFGIF格式格式77JPEGJPEG格式格式经压缩的经压缩的图像数据图像数据各类压缩各类压缩算法算法n可以达到可以达到30:130:1的压缩比的压缩比 n属于有损压缩属于有损压缩 n

56、支持全彩（支持全彩（2424位、位、1677721616777216色）图像色）图像 78PNGPNG格式格式文件头文件头数据块数据块n采用采用lz77lz77压缩算法压缩算法 n可以是灰阶的、彩色的或可以是灰阶的、彩色的或8 8位的索引色位的索引色n显示速度快，只需要下载显示速度快，只需要下载1/641/64的图像信的图像信息就可以显示出低分辨率的预览图像息就可以显示出低分辨率的预览图像 n不支持动画不支持动画n常用于网络常用于网络( (预览预览) )79TGATGA格式格式文件头文件头调色板信息调色板信息图像数据图像数据数据补充区数据补充区n由美国由美国TruevisionTruevisi

57、on公司开发公司开发n结构比较简单结构比较简单 n计算机生成图像向电视转换的首选格式计算机生成图像向电视转换的首选格式 n常用于专业动画影视常用于专业动画影视 80A4幅面幅面(横横)24 bit彩色彩色300 dpi分辨率分辨率. JPG 883 KB损失损失15%色色重复保存重复保存,损失加剧损失加剧. GIF 4,501 KB256色色格式转换容易失真格式转换容易失真. BMP 25,481 KB真彩色真彩色数据量大数据量大. TGA 25,481 KB真彩色真彩色数据量大数据量大. PCD 25,481 KB真彩色真彩色数据量大数据量大. TIF 25,697 KB真彩色真彩色

58、数据量大数据量大数据对比数据对比812.3 2.3 多媒体数据转换多媒体数据转换n为了交流不同类型媒体信息需要进行转换为了交流不同类型媒体信息需要进行转换n媒体之间的转换是人们关心的内容之一媒体之间的转换是人们关心的内容之一n有些媒体之间的转换是非常困难的事情，需要研有些媒体之间的转换是非常困难的事情，需要研究人类本身对各种媒体理解原理和解释过程究人类本身对各种媒体理解原理和解释过程n有些媒体之间的转换则相对容易，几乎不用做什有些媒体之间的转换则相对容易，几乎不用做什么工作么工作82部分媒体的转换关系部分媒体的转换关系转换转换位图图像位图图像图形图形语音语音音乐音乐文本文本视频视频数值数值位图

59、图像位图图像*映射映射？*映射映射*冻结冻结？图形图形 *轮廓或理解轮廓或理解 * 波形波形*乐谱乐谱*矢量化矢量化？*可视化可视化语音语音？*波形波形*语音合成语音合成？*合成合成音乐音乐？*识别识别*音乐合成音乐合成？文本文本*文字识别文字识别*识别识别*语音识别语音识别*转换转换？*符号化符号化视频视频*序列化序列化*序列化序列化？数值数值？*计算计算*识别识别？*转换转换？83我的芯片能闻味：西门子微型芯片气我的芯片能闻味：西门子微型芯片气味传感器味传感器http:/ 2004年年09月月18日日 16:31 驱动之家驱动之家近日，西门子的科研工作者们成功研制出一种近日，西门子的科研

60、工作者们成功研制出一种全新构造的微型芯片传感器，它可以辨别气体与其味道。据称，此全新构造的微型芯片传感器，它可以辨别气体与其味道。据称，此种微型芯片将被应用与多种领域，例如检测空气中臭氧含量，监测种微型芯片将被应用与多种领域，例如检测空气中臭氧含量，监测火灾以及气体泄漏。一个非常实用的应用便是作为旅行者的一种便火灾以及气体泄漏。一个非常实用的应用便是作为旅行者的一种便携预警设备，即便在睡袋中也能知晓外界风云动向。携预警设备，即便在睡袋中也能知晓外界风云动向。此款芯片拥有体积小，成本低以及超低功耗等诸多优点，可以此款芯片拥有体积小，成本低以及超低功耗等诸多优点，可以在在100毫瓦至毫瓦至1毫瓦

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第二章多媒体数据压缩技术

文档简介

温馨提示

最新文档

评论

第二章 多媒体数据压缩技术

文档简介

温馨提示

最新文档

评论

相关文档

第二章多媒体数据压缩技术