多媒体数据压缩(改).ppt

上传人：x*** IP属地：四川上传时间：2020-02-14 格式：PPT 页数：91 大小：2.36MB 积分：15 举报 版权申诉

已阅读5页，还剩86页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第6章多媒体数据压缩 2 本章主要内容 6 1数据压缩技术概述6 2数据压缩技术原理6 3JPEG静止图像压缩标准6 4运动图像压缩标准MPEG 3 6 1数据压缩技术概述 6 1 1数据压缩的概念采样数据不仅仅是所代表的原始信息本身还包含着其它一些没必要保留的确定的可推知的信息即存在着数据冗余 M D d其中M表示实际媒体信息 D表示数字化后的采样数据 d表示数据冗余量数据压缩就是从采样数据中去除冗余即保留原始信息中变化的特征性信息去除重复的确定的或可推知的信息在实现更接近实际媒体信息描述的前提下尽可能的减少描述用的信息量 4 6 1 2多媒体数据的冗余随着计算机技术的高度发展以及通信计算机和大众传媒三大技术的相互融合计算机已经不再局限于数值计算文字处理的范畴而成为处理图形图像视频音频等多种信息的工具但数字化后的声音图像视频和音频等多媒体数据是非常庞大的例如一页在A4 216mm 300mm 纸上的照片以300dpi 12像素 mm 采样每个像素用24位真彩色信号表示其数据量约为27MB 页 650MB的CD ROM只可放24页双声道立体声光盘采样率是44 1kHz 采样精度16位一秒钟数据量是44 1 16 2 8 172KB s 一张CD只能存放约1小时的声音 5 6 1 2多媒体数据的冗余对于如此巨大的多媒体数据如果不经过压缩不仅超出了计算机的存储和处理能力而且在现在的通信信道的传输速率下是无法完成大量多媒体信息的传输的多媒体数据的高速传输和储藏所需要的巨大容量已经成为多媒体数据通信技术的最大障碍因此为了存储处理和传输这些数据必须进行压缩 6 6 1 2多媒体数据的冗余一般而言多媒体数据中存在的数据冗余情况主要有以下几种 P107 信息熵冗余空间冗余时间冗余结构冗余知识冗余视觉冗余听觉冗余纹理的统计冗余信息熵冗余信息熵定义为一组数据所表示的信息量即式中 E为信息熵 N为数据的种类或称码元个数 Pi为第i个码元出现的概率一组数据的数据量显然等于各记录码元的二进制位数即编码长度与该码元出现的概率乘积之和即式中 D为数据量为第i个码元的二进制位数一般取如ASCII编码把所有码元都编码为7比特这样得到的D必然大于E 这种因码元编码长度的不经济带来的冗余称为信息熵冗余或编码冗余信息熵冗余图26个英文字母相对频率空间冗余同一景物表面上各采样点的颜色之间往往存在着空间连贯性但是基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间连贯性从而产生了空间冗余可以通过改变物体表面颜色的像素存储方式来利用空间连贯性达到减少数据量的目的时间冗余这是序列图像电视图像运动图像表示中经常包含的冗余序列图像一般为位于一时间轴区间内的一组连续画面其中的相邻帧往往包含相同的背景和移动物体只不过移动物体所在的空间位置略有不同所以后一帧的数据与前一帧的数据有许多共同的地方这种共同性是由于相邻帧记录了相邻时刻的同一场景画面所以称为时间冗余结构冗余在有些图像的纹理区图像的像素值存在着明显的分布模式例如方格状的地板图案等我们称此为结构冗余已知分布模式可以通过某一过程生成图像知识冗余有些图像的理解与某些知识有相当大的相关性例如人脸的图像有固定的结构这类规律性的结构可由先验知识和背景知识得到我们称此类冗余为知识冗余根据已有的知识对某些图像中所包含的物体我们可以构造其基本模型并创建对应各种特征的图像库进而图像的存储只需要保存一些特征参数从而可以大大减少数据量知识冗余是模型编码主要利用的特性视觉冗余事实表明人类的视觉系统对图像场的敏感性是非均匀和非线性的然而在记录原始的图像数据时通常假定视觉系统是线性和均匀的对视觉敏感和不敏感的部分同等对待从而产生了比理想编码即把视觉敏感和不敏感的部分区分开来编码更多的数据这就是视觉冗余通过大量实验发现以下视觉的非均匀特征视觉系统对图像的亮度和色彩度的敏感性相差很大随着亮度的增加视觉系统对量化误差的敏感度降低人眼的视觉系统在图像的边缘和非边缘区域分开来处理人类的视觉系统总是把视网膜上的图像分解成若干个空间有向的频率通道后再进一步处理图像区域的相同性冗余它是指在图像中的两个或多个区域所对应的所有像素值相同或相近从而产生的数据重复性存储这就是图像区域的相似性冗余在以上的情况下记录了一个区域中各像素的颜色值则与其相同或相近的其他区域就不在记录其中各像素的值向量量化方法就是针对这种冗余性的图像压缩编码方法纹理的统计冗余有些图像纹理尽管不严格服从某一分布规律但是它在统计的意义上服从该规律利用这种性质也可以减少表示图像的数据量所以我们称之为纹理的统计冗余思考图像序列中的两幅相邻图像后一幅图像与前一幅图像之间有较大的相关这是 A 空间冗余 B 时间冗余 C 信息熵冗余 D 视觉冗余 16 下列哪一种说法是正确的信息量等于数据量与冗余量之和信息量等于信息熵与数据量之差信息量等于数据量与冗余量之差信息量等于信息熵与冗余量之和 17 18 6 1 3数据压缩技术的发展过程 20世纪40年代人们开始系统地研究数据压缩技术主要表现在数据压缩算法方面首先是ClaudeShannon与R M Fano的Shannon Fano编码方法 1952年 D A Huffman提出了Huffman编码方法 1968年 P Elias发展了Shannon Fano编码构造出更为完美的Shannon Fano Elias编码 1976年 J Rissanen提出了一种可以成功地逼近信息熵极限的编码方法算术编码 1982年 Rissanen和G G Langdon一起改进了算术编码 1977年 JacobZiv和AbrahamLempel提出了LZ77编码算法 78年又作了改进被称为LZ78编码算法 1984年 TerryWelch提出了LZ78算法的变种算法 LZW LZ77 LZ78 LZW三种压缩技术就是目前无损压缩领域中最为流行的被称为字典式编码的压缩技术 19 6 1 3数据压缩技术的发展过程续数据压缩标准逐渐形成有损压缩算法快速出现 1986年开始制定静态图像压缩标准 1994年后成为国际标准称为JPEG标准 ITU制定的电视会议系列标准 H 261 H 262 H 263 H 264等以及由ISO制定的视频系列标准 MPEG 1 MPEG 2 MPEG 4 中均采用了有损压缩原理作为其核心压缩算法其中的MPEG 4标准相当于ITU的H 263和H 263 标准是为了适应网络视频的需求特点而制定的具有更高的压缩比支持并发数据流编码基于内容的交互操作增强的时间域随机存取容错基于内容的尺度可变性等新特性 20 6 1 4数据压缩的分类 1 按照压缩内容分为音频数据压缩静态图像数据压缩视频数据压缩和其他数据文件压缩等四种类型 2 按照压缩方式分为对称压缩和非对称压缩两种类型 3 按照压缩效果分为有损压缩与无损压缩两种类型普通数据文件一般采用无损压缩对于冗余度较小的图像需要采用有损压缩 21 4 按照算法思想分为信息熵编码预测编码变换编码混合编码以及其他编码等五种每种类型包含了一些具体算法如下图 22 6 1 5数据压缩的主要指标衡量不同压缩方法优劣的技术指标是相同的主要包括以下几个方面 1 压缩比指压缩前后的数据量之比它反映了施加某压缩算法之后数据量减少的比例 2 恢复效果指经解压缩算法对压缩数据进行处理后所得到的数据与其表示的原信息的相似程度 3 算法简单速度快主要指实现算法的复杂度 23 6 2数据压缩技术原理 6 2 1信息熵与编码 1 信息熵的概念信息论中编码数据量与所表示的信息量以及冗余信息之间的关系为数据量信息量冗余量信息是对所表现的事件中不确定性的描述信息量多少与不确定性的程度有关通常可以用概率来描述不确定性的大小某信息描述的事件状态的出现概率越小其不确定性越大其表达的信息量就越多冗余量就越少信息熵信息熵用来度量信息量的大小对于单个事件如字符来说其信息熵定义为 H i log2 Pi bit 1 公式 1 表示发生概率为Pi的事件i所具有的信息熵为H i 单位为bit 比特 24 25 对于一个消息队列如字符串的信息熵定义为 H X Pi log2 Pi Pi H i 2 其中 Pi表示某一事件i发生的概率例如有一字符串 babbdcaacb 包含a b c d四种字符其长度为10 字符a b c d分别出现了3 4 2 1次则a b c d在信息中出现的概率分别为0 3 0 4 0 2 0 1 它们的熵分别为 H a log2 0 3 1 737 bit H b log2 0 4 1 322 bit H c log2 0 2 2 322 bit H d log2 0 1 3 322 bit 26 每种字符的信息熵就是该字符编码所用的理想位数二进制整条信息的熵就是表达整个字符串需要的位数这里用字符出现的次数代替概率 H X Pi log2 Pi H a 3 H b 4 H c 2 H d 1 18 465 bit 若用ASCII编码需要多少bit 27 2 编码编码实质上是对要处理的源数据或源文件按一定的规则进行变换映射力图用尽可能少的符号代码来表示较多较长的源符号信息编码方法中的码字代码有固定长度和可变长度两种 3 压缩模型模型是规则和数据的集合即压缩算法模型编码 28 4 压缩还原压缩是指设法去掉部分或全部冗余从而减少文件或数据所占的存储空间还原解压缩则是指利用相反的算法使文件或数据恢复原状 29 30 6 2 2无损压缩编码 1 Shannon Fano编码简称为S F编码是一种变长编码其基本思想是按信源符号出现的概率大小进行排序出现概率大的分配短码反之则分配长码具体编码过程如下 1 信源符号按概率递减顺序排列 2 把符号序列分成上下两部分使上下两部分的概率和相等或接近相等 3 对上部分子序列编码为 0 相当于左子树对下部分子序列编码为 1 相当于右子树 4 重复上述步骤直到每个子序列只包含一个符号为止 31 举例有信源字符序列S为 aaabbceeehddabafffbdddgghhabccedabdgghha其长度为40个字符由a b c d e f g h共8种字符构成假设在编码之前每种字符出现的概率已由某种模型统计出来用来表示具体值分别为 a 8 b 6 c 3 d 7 e 4 f 3 g 4 h 5 32 a 8d 7b 6h 5e 4g 4c 3f 3 a 8d 7b 6 h 5e 4g 4c 3f 3 a 第一步 b 第二步解首先将信源符号按概率递减顺序排列形成图 a 所示结果然后再把符号序列分成上下两部分使上下两部分的概率和相等或接近相等形成图 b 所示结果其中上部分符号序列概率和为21 编码为0 下部分为19 编码为1 33 最后再重复第二步不断对子符号序列进行划分最后得到一棵二叉树如图 c 所示 34 最终得到的符号编码分别为 a 00 b 011 c 1110 d 010 e 101 f 1111 g 110 h 100 信源字符序列S的编码总位数L等于每种字符编码位数与字符出现次数乘积的和即 L 2 8 3 6 4 3 3 7 3 4 4 3 3 4 3 5 118 位如果直接用ASCII码则要用40 8 320位因此 S F编码实现了数据压缩 35 2 Huffman编码其编码思想与Shannon Fano编码方法基本一致但构造二叉树的方法则相反不是自上而下而是自下而上从树叶到树根生成二叉树具体编码过程如下 l 将信源符号按概率递减顺序排列 2 把两个最小的概率加起来作为新符号的概率 3 重复步骤 1 和 2 直到概率达到 1 为止 4 在每次合并消息时将被合并的消息赋于 1 和 0 或 0 和 l 5 寻找从每一信源符号到概率为 1 处的路径记录下路径上的 l 和 0 6 对每一符号写出从码树的根到终结点的 l 0 序列 36 例如对于信源其编码过程如下最后得到的编码为 x1 01 x2 10 x3 11 x4 000 x5 0010 x6 0011 其中x1 x2 x3的码长为2 x4的码长为3 x5 x6的码长为4 平均码长为2 45 0 05 0 15 0 45 0 55 信源符号及其概率如下求其Huffman编码信息熵及平均码长 37 Huffman编码体现了统计编码的思想 Huffman编码的基本原理是按信源符号出现的概率大小进行排序出现概率大的分配短码出现概率小的则分配长码 38 39 3 算术编码算术编码也是一种信息熵编码方法它用0到1之间的一个实数对输入的信息进行编码用到两个基本的参数一是信源符号的概率二是信源符号对应的编码区间一般的信源符号集x可表示为对于一个给定的信源符号输入序列S x1x2x3 xm 其中xi属于信源符号集X中的任意符号可按以下过程进行编码 40 1 定义初始区间 0 1 表示一个0到1之间的半开区间并规定初始概率p0 0 2 根据信源中各符号的概率值把 0 1 区间划分成N个子区间Q1 Q2 Qn 其中 Qi Li Ri Li Ri Li Pi i 1 2 N 3 3 设置输入序号i的初值 i 1表示开始输入第一个信源符号 41 4 当输入符号为xi xi对应信源符号集X中的第k个符号可按以下公式定义新的子区间Ii 并计算区间长度di Ii li ri li li 1 di 1 ri li 1 di 1 di ri li 5 i i 1 如果还有信源符号未输入完毕则转第4 步继续输入下一个信源符号如果全部输入完毕则当前区间Ii li ri 中的任意数就是所需的编码 42 例有四个符号a1 a2 a3 a4的信源其对应概率分别为0 5 0 25 0 125 0 125 如果输入序列为S a2a1a3a2a4 根据以上编码过程得如下结果 43 从以上的编码过程可以看出以下几个问题 1 算术编码器对整个消息只产生一个码字这个码字是在间隔 0 1 中的一个实数因此译码器在接受到表示这个实数的所有位之前不能进行译码运算中出现溢出是一个明显的问题但多数机器都有16位 32位或者64位的精度因此该问题可使用比例缩放方法解决 3 算术编码也是一种对错误很敏感的编码方法如果有一位发生错误就会导致整个消息译错 44 4 行程编码行程编码 RLE 通过统计信源符号中的重复个数并以格式来编码适用于压缩包含大量重复信息的信源其基本思想是按行存储一个颜色值和相同色值的像素个数如下图 45 说明 RLE压缩编码尤其适用于计算机生成的图像对减少图像文件的存储空间非常有效然而 RLE对颜色丰富的自然图像就显得力不从心如果使用RLE编码方法不仅不能压缩图像数据反而可能使原来的图像数据变得更大 46 5 词典编码词典编码主要是利用编码数据本身存在字符串重复特性来实现数据压缩的算法的核心就是如何动态地形成词典以及如何选择输出格式以减小冗余词典编码又可分为两类第一类词典编码的思想是查找正在压缩的字符序列是否在以前输入的数据中出现过然后用已经出现过的字符串替代重复的部分并将指向重复字符串的指针作为输出编码指针P指向了重复字符串 abc 所以当再次出现相同字符串时则输出指针P 47 第二类词典编码的思想是从输入的数据中创建一个由短语组成的编码词典编码数据过程中当遇到已经在词典中出现的短语时编码器就输出这个词典中短语的索引号而不是短语本身如下图 48 6 2 3有损压缩编码介绍有损数据压缩编码方法通常用于对静态图像音频以及视频等多媒体信息的编码压缩这些多媒体信息大多数是通过对模拟信息的数字化采样与量化而得到的 1 预测编码 1 预测编码的基本概念预测编码是数据压缩的重要技术原理之一它是根据离散信号之间的空间或时间相关性利用前面的一个或多个信号对下一信号进行预测然后对实际值和预测值的差进行编码常用的预测编码方法有DPCM 差分脉冲编码调制和ADPCM 自适应差分脉冲编码调制等 49 2 DPCM 差分脉冲编码 DPCM DifferentialPulseCodeModulation 差分脉冲编码调制用采样量化后的样本值与预测值之间的差值来编码原理如下图所示 s k 是PCM样本值 se k 1 是s k 的预测值 d k 是差分信号即d k s k se k 1 I k 是差分信号d k 的量化值 st k 是重构信号是由逆量化器产生的量化差分信号与对过去样本信号的估算值se k 1 求和得到以作为预测器确定下一个信号估算值的输入信号原理P205 50 3 ADPCM 自适应差分脉冲编码 ADPCM是自适应量化和自适应预测方法的总称是对DPCM方法的进一步改进通过调整量化步长对不同频段设置不同的量化字长使数据得到进一步的压缩自适应量化就是使量化间隔大小的变化自动地去适应输入信号大小的变化根据信号分布不均匀的特点使系统具有随输入信号的变化而改变量化区间的大小以保持输入量化器的信号基本均匀的能力 51 下图给出了反馈自适应的基本原理 52 2 变换编码先对信号进行域变换以寻求更大的信号独立性减少相关性然后再对变换后的信号进行采样和量化编码数据编码过程分为三步即变换变换域采样和量化编码如下图所示常用的变换有KLT DCT WHT以及WLT 53 1 KLT KLT Karhunen LoeveTransform 通常称为K L变换亦称主要成分变换是一个离散变换用一组不相关的系数来表示连续信号实现正交变换是失真最小的一种变换故称作最佳变换 2 DCT DCT DiscreteCosineTransform 是离散余弦变换的简称对于图像编码来说 DCT先将整体图像分成若干个NxN的像素块然后每个NxN像素块逐一进行DCT变换 54 DCT变换公式如下其中 N为所划分图像方阵的行列数一般N 8 x y 原图像方阵内某个数据的坐标位置取值为0 N 1 f x y 代表原图像数据方阵内的某个数值 u v DCT后矩阵内某个数值的坐标位置取值为0 N 1 C u v 代表DCT变换后矩阵内的某个数值当u 0且v 0时 E u E v 1 1 414 当u 0或V 0时 E u E v l DCT逆变换公式 55 3 WHT WHT Walsh HadamardTransform 又称哈达玛特变换这是一种有效地去除噪波的方法基本思想为对于图像压缩首先将输入值按4x2分成小块分别进行实时快速哈达玛特变换图像经变换后转换成相应成分的系数这些系数分别代表直流分量水平方向细节和色度分量垂直方向细节斜方向细节及色度分量等而噪波变换后均匀散在各系数中这样就能更有效地区分出信号和噪波从而达到更有效地进行自适应降噪的目的 56 4 WLT WLT WaveLetTransform 又称小波变换是近年来新兴的一种变换方法解决了较好地解决突变信号与非平稳信号的问题是空间时间和频率的局部变换小波变换的基本思想是将信号展开成一族基函数的加权和即用一族函数来表示或逼近信号或函数这一族函数是通过基本函数的平移和伸缩构成的 57 3 混合编码混合编码不是一类原理性编码方案是两种或两种以上相关编码方法优点与特长的混合应用比如在MPEG和JPEG标准中都混合应用了不同的编码方法从而实现较为理想的编码压缩效果 58 4 其它编码主要包括分形编码矢量量化编码子带编码等独具特色编码方法 1 分形编码分形的概念分形指某种形状或结构的一个局部或片断它可以有许多种大小尺寸的相似形分形编码是一种以分形几何学为理论基础的编码方法它利用分形几何中自相似的原理来实现数据压缩的首先对把一幅数字图像通过一些图像处理技术然后在分形集中寻找各子图像之间的相似性其压缩比超出经典编码方法近3个数量级 59 2 矢量量化编码矢量量化编码利用相邻图像数据间的高度相关性将输入图像数据序列分组每一组由n个数据构成一个N维矢量一起进行编码即一次量化多个点 3 子带编码子带编码技术是一种高质量高压缩比的图像编码方法其基本思想是依据语音和图像信号可以划分为不同的频域段而人眼对不同频域段的敏感程度不同的特性将要压缩的信息分离成高低不同的两个频带子带再根据频带的特性分别进行量化和编码完成对信息的编码压缩练习数据压缩可分为两种类型一种叫做另一种叫做 60 61 在数据压缩方法中有损压缩具有的特点 A 压缩比大不可逆B 压缩比小不可逆C 压缩比大可逆D 压缩比小可逆衡量数据压缩技术性能好坏的重要指标是 1 压缩比 2 标准化 3 恢复效果 4 算法复杂度A 1 3 B 1 2 3 C 1 3 4 D 全部 62 63 6 3JPEG静止图像压缩标准6 3 1JPEG概述 JPEG是一个适用于彩色和单色多级灰度连续色调的静止数字图像的压缩标准它定义了两种基本的压缩算法一种是基于DPCM 差分脉冲编码调制及Huffman编码或算术编码的无失真压缩算法压缩此较小另一种是基于DCT 离散余弦变换的有失真压缩算法压缩比可以很大这种压缩算法又可分为基本和增强两种系统 64 6 3 2无失真压缩为了实现无失真压缩 JPEG选择了一个简单的空间线性预测算法 DPCM 具体编码处理过程如图7 16所示 65 6 3 3有失真压缩 JPEG的有失真压缩算法是基于DCT变换和Huffman编码的具体压缩过程如图所示也就是说有失真压缩经颜色模式转换及采样 DCT变换量化编码等4步实现 66 1 颜色模式转换及采样 JPEG采用的是YCbCr色彩系统先把RGB颜色模式图像数据转换为YCbCr颜色模式的数据 Y代表亮度 Cb和Cr则代表色度饱和度通过下列计算公式可完成数据转换 Y 0 2990R 0 5870G 0 1140BCb 0 1687R 0 3313G 0 5000B 128Cr 0 5000R 0 4187G 0 0813B 128 67 2 DCT变换利用DCT变换可将一组光强数据转换成频率数据以便得知强度变化的情形根据DCT变换的要求先将原始图像数据分成若干个NxN数据单元矩阵例如 8x8矩阵此时具体的DCT变换公式可具体化为相应地解码时所用的逆变换公式为注各参数的意义参见前面的DCT变换 68 3 量化量化是多对一映射其作用是在保持一定质量前提下丢弃图像中对视觉效果影响不大的信息量化是造成DCT编码信息损失的根源 JPEG标准中采用线性均匀量化器量化过程为对64个DCT系数C 除以量化步长并四舍五入取整量化步长由量化表决定量化表元素因DCT系数位置和彩色分量的不同而取不同值具体量化公式可表示为 Cq Integer C Q 其中 Q 表示量化表中的某一元素 Cq 表示量化后的DCT系数 69 JPEG标准给出了推荐的量化表如下所示与DCT变换系数一一对应用作编码器的一个输入量化表中元素为1到255之间的任意整数其值规定了其所对应DCT系数的量化步长 70 4 编码包括DC系数编码 AC系数编码和熵编码三部分 1 DC系数编码经过DCT变换后低频分量集中在左上角其中C 0 0 即频率矩阵的第一行第一列元素代表了DC系数即8x8子块的平均值由于图像中相邻块之间有很强的相关性 JPEG标准对DC系数采用DPCM编码方法即对相邻的8x8像素块之间的DC系数的差值进行编码也就是 DC码 DCi DCi 1 i代表图像块的编号 71 2 AC系数编码 DCT系数矩阵中有63个元素是交流 AC 系数为了保证低频分量先出现高频分量后出现对这63个元素采用如右图的 Z 字形 Zig Zag 顺序排列并采用行程编码进行压缩图7 22 72 63个AC系数行程编码的码字用两个字节表示其中第一个字节的高四位记录两个非0值之间连续0的个数最多可记录16个第二个字节记录下一个非0系数的实际值如图7 23所示最后的编码结果称之为AC码图7 23 73 3 熵编码为了进一步压缩数据需要对DC码和AC码再做基于统计特性的熵编码熵编码方法有 Huffman编码和自适应二进制算术编码 74 6 4MPEG运动图像压缩标准 6 4 1MPEG概述 MPEG是ISO指定的专门用于运动图像压缩的一个系列标准其中包括MPEG 1 MPEG 2 MPEG 4 MPEG 7以及MPEG 21等具体标准其中MPEG 1是视音频压缩的基础标准包括MPEG 1视频 MPEG 1音频和MPEG 1系统三大部分 75 6 4 2MPEG 1视频 1 MPEG 1的编码技术对亮度与色差信号进行采样减少数据量采用运动补偿技术减少帧间冗余度采用二维DCT变换去除空间相关性对DCT分量进行量化舍去不重要的信息将量化后DCT分量按照频率重新排序将DCT分量进行变字长编码对每数据块的直流分量 DC 进行预测差分编码 76 具体编码过程如图7 24所示输入的视频序列先进行预处理插入滤波然后用运动估计来帮助建立当前图像和已传送图像的预测器图7 24 77 解码器完成对变长编码的解码功能通过逆量化和逆DCT变换实现对编码数据的重构再与图像预测器结合形成当前图像也为以后接收到的图像作预测经过后处理插入和滤波得到结果图像实现视频输出图下图给出了MPEG 1解码过程示意图7 25 78 2 MPEG 1的帧类型 MPEG 1将帧率为30fps或25fps的帧序列图像以三种类型的图像格式表示如图7 26所示其中 I表示帧内图其信息由自身画面决定 P为预测图它是由帧内图I或预测图P由前向预测方法产生对其预测误差有条件地传送 B为插补图它可根据前面和后面的双向预测产生增加B图的数目会减少参考图I与参考图P之间的相关对提高压缩比有益而对图像质量有损失图7 26 79 I帧图像采用帧内编码方式 JPEG 主要用于接收机的初始化和信道的获取以及节目的切换和插入周期性出现在图像序列中的出现频率可由编码器选择 P帧和B帧图像采用帧间编码方式 P帧图像中可以包含帧内编码的部分也可以是帧内编码 B帧图像采用双向时间预测大大提高压缩倍数从压缩的程度来看 I帧的压缩率最小 P帧得到了较大的压缩而B帧的压缩率是最大的这也是使得B帧不能作为预测基准的原因 80 3 运动补偿运动补偿是一种帧间编码的方法其原理是利用帧间的空间相关性减小空间冗余度实现帧间编码的方法是运动估计和运动补偿图7 27图示了这一过程 81 实际上在做运动估计和运动补偿时是以16x16的块也称为宏块逐个进行的如图7 28所示这是将当前帧划分为16x16的块各块在X和Y方向上的宽度分别记为wx和wy 对每一块在过去帧中大小为 N 2wy x N 2wx 的范围内进行搜索以求得最优匹配从而得到运动矢量的估值 dx dy 如图7 29所示 82 6 4 3MPEG 1音频编解码思想下面给出的是MPEG 1音频编码系统的结构示意图其中图 a 为编码器示意图 b 为解码器示意 83 心理声学模型 MPEG 1音频编码过程中用到了心理声学模型这是为了使编码符合人的听觉系统特点人的听觉系统对不同频率音频信号的敏感度不同频率处的噪声容忍度有着很大的差异通常把一个音频信号可使人的听觉系统感觉不到另一个音频信号的存在的现象称为音频信号的掩蔽特性心理声学模型是为计算掩蔽特性而设计的 MPEG 1标准中推荐了模型和模型两个心理声学模型心理声学模型通对频率的分析得到声音信号和噪声的成分并且求得掩蔽阈值最后得到子带的信号掩蔽比声音心理学模型从能量入手运用卷积等工具也可得到信号的掩蔽比 84 三层编码结构 MPEG 1音频编码标准构造了一个通用的编码系统分为三层 1层 Layer1 2层 Layer2 和3层 Layer3 层次越高其性能和复杂度也越高层1是MUSICAM MaskingpatternadaptedUniversalSubbandIntegratedCodingAndMultiplexing 自适应掩蔽模式的通用子带综合编码和复用编码方案的简化版本编码器最简单压缩比较小编码器的输出数据率为384Kbps 是适合于家庭数字磁带录音本地硬盘磁光盘等不要求很低码率的应用 85 层2编码器的复杂程度属中等使用了更精确的量化编码器的输出数据率为256Kbps 192Kbps 主要用于数字声音广播电视录音多媒体通信等民用或音频专业领域层3 通常称为MP3 是ASPEC AdaptiveSpectralPerceptual

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

多媒体数据压缩(改).ppt

文档简介

温馨提示

最新文档

评论

多媒体数据压缩(改).ppt

文档简介

温馨提示

最新文档

评论

相关文档