第三章多媒体数据压缩技术ppt课件

上传人：闯*** IP属地：广东上传时间：2020-04-23 格式：PPT 页数：94 大小：830.50KB 积分：25 举报 版权申诉

已阅读5页，还剩89页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第3章多媒体数据压缩技术本章重点 1 数据压缩的基本概念2 各种压缩技术的分类3 预测编码的基本原理4 变换编码的基本原理5 统计编码的基本原理6 分析合成编码的基本原理7 声音压缩标准8 图像视频压缩标准 3 1数据压缩的基本原理和方法 3 2音频的压缩 3 3图像和视频的压缩第3章多媒体数据压缩技术 3 1数据压缩的基本原理和方法压缩的必要性音频视频的数据量很大如果不进行处理计算机系统几乎无法对它进行存取和交换例如一幅具有中等分辨率 640 480 的真彩色图像 24b 像素它的数据量约为7 37Mb 帧一个100MB Byte 的硬盘只能存放约100帧图像若要达到每秒25帧的全动态显示要求每秒所需的数据量为184Mb 而且要求系统的数据传输率必须达到184Mb s 对于声音也是如此若采用16b样值的PCM编码采样速率选为44 1kHZ 则双声道立体声声音每秒将有176KB的数据量 3 1数据压缩的基本原理和方法视频图像声音有很大的压缩潜力信息论认为若信源编码的熵大于信源的实际熵该信源中一定存在冗余度原始信源的数据存在着很多冗余度空间冗余时间冗余视觉冗余听觉冗余等 3 1 1数据压缩技术的性能指标节省图象或视频的存储容量增加访问速度使数字视频能在PC机上实现需要进行视频和图象的压缩有三个关键参数评价一个压缩系统压缩比图象质量压缩和解压的速度另外也必须考虑每个压缩算法所需的硬件和软件 3 1 1数据压缩技术的性能指标 1 压缩比压缩性能常常用压缩比定义输入数据和输出数据比例 512 480 24bit pixel bpp 输出15000byte输入 737280byte压缩比 737280 15000 49 1 3 1 1数据压缩技术的性能指标 2 图象质量压缩方法无损压缩图象质量不变和有损压缩有损压缩失真情况很难量化只能对测试的图象进行估计 3 1 1数据压缩技术的性能指标 3 压缩和解压速度在许多应用中压缩和解压将在不同时间不同的地点不同的系统中进行所以压缩解压速度分别估计静态图象中压缩速度没有解压速度严格动态图象中压缩解压速度都有要求因为需实时地从摄像机或VCR中抓取动态视频 3 1 1数据压缩技术的性能指标 4 硬软件系统有些压缩解压工作可用软件实现设计系统时必须充分考虑算法复杂压缩解压过程长算法简单压缩效果差目前有些特殊硬件可用于加速压缩解压硬接线系统速度快但各种选择在初始设计时已确定一般不能更改因此在设计硬接线压缩解压系统时必须先将算法标准化 1 空间冗余在同一幅图像中规则物体和规则背景的表面物理特性具有相关性这些相关性的光成像结果在数字化图像中就表现为数据冗余 2 时间冗余时间冗余反映在视频帧序列中相邻帧图像之间有较大的相关性一幅图像中的某物体或场景可由其他帧图像中的物体或场景重构出来 1 数据冗余的类型 3 1 2数据冗余的类型与压缩方法分类 3 信息熵冗余信息熵冗余是指数据所携带的信息量少于数据本身而反映出来的数据冗余 4 视觉冗余人类的视觉系统由于受生理特性的限制对于图像场的注意是非均匀的人眼并不能察觉图像场的所有变化事实上人类视觉的一般分辨能力为26灰度等级而一般图像的量化采用的是28灰度等级即存在着视觉冗余 3 1 2数据冗余的类型与压缩方法分类 5 听觉冗余人耳对不同频率的声音的敏感性是不同的不能察觉所有频率的变化对某些频率不必特别关注因此存在听觉冗余 6 结构冗余数字化图像中物体表面纹理等结构往往存在着数据冗余这种冗余称为结构冗余 7 知识冗余由图像的记录方式与人对图像的知识之间的差异所产生的冗余称为知识冗余 3 1 2数据冗余的类型与压缩方法分类 3 1 2数据冗余的类型与压缩方法分类 2 数据压缩技术分类根据解码后数据与原始数据是否完全一致可以分为两大类一类是熵编码冗余压缩法也称无损压缩法无失真压缩法二是熵压缩法也称有损压缩法有失真压缩法从熵损失角度分为无损压缩和有损压缩两种无失真压缩又称熵编码由于不会失真多用于文本数据的压缩但也有例外非线性编辑系统为了保证视频质量有些高档系统采用的是无失真压缩方法有失真压缩又称熵压缩法大多数图像声音动态视频等数据的压缩是采用有失真压缩 3 1 2数据冗余的类型与压缩方法分类从信息语义角度分为熵平均信息量编码和源编码两种熵平均信息量编码 EntropyCoding 熵编码是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术它是基于平均信息量的技术把所有的数据当作比特序列而不根据压缩信息的类型优化压缩也就是说平均信息量编码忽略被压缩信息的语义内容熵编码分为重复序列消除编码含消零行程编码统计编码等 3 1 2数据冗余的类型与压缩方法分类源编码 SourceCoding 源编码的冗余压缩取决于初始信号的类型前后的相关性信号的语义内容等源编码比严格的平均信息量编码的压缩率更高当然压缩的程度主要取决于数据的语义内容比起平均信息量编码它的压缩比更大源编码主要分为预测编码变换编码向量量化等 3 1 2数据冗余的类型与压缩方法分类 EntropyCoding RunLengthCoding StatisticalCoding Huffman Arithmetic 3 1 3常用数据压缩方法的基本原理 1 统计编码方法是识别一个给定的流中出现频率最高的比特或字节模式并用比原始比特更少的比特数来对其编码即就是频率越低的模式其编码的位数越多频率越高的模式编码位数越少若码流中所有模式出现的概率相等则平均信息量最大信源就没有冗余 3 1 3常用数据压缩方法的基本原理 1 行程编码 RunLengthCoding 是最简单最古老的压缩技术之一主要技术是检测重复的比特或字符序列并用它们的出现次数取而代之该方法有两大模式一是消零消空白二是行游程 runlength 编码消零或消空白法将数字中连续的 0 或文本中连续的空白用一个标识符或特殊字符后跟数字N 连续 0 的个数来代替如数字序列 742300000000000000000055编码为 7423Z1855 3 1 3常用数据压缩方法的基本原理行程编码法任何重复的字符序列可被一个短格式取代该算法适合于任何重复的字符一组n个连续的字符c将被c和一个特殊的字符取代当然若给定字符仅重复两次就不要用此方法任何重复4次或4次以上的字符由该字符记号 M 重复次数代替例如数字序列 Name CR编码为 Name M10CR 3 1 3常用数据压缩方法的基本原理 2 LZW编码LZW算法在压缩文本和程序数据的压缩技术中唱主角它的压缩率高压缩处理所化费的时间比其它方式要少 LZW编码时首先将原始的数据分成多个条纹每个条纹都单独进行压缩 LZW算法基于一个转换表或字串表它将输入字符映象到编码中使用可变长代码最大代码长度为12位 3 1 3常用数据压缩方法的基本原理 LZW算法中的字串表对于每个条纹都不同并且不必保留给解压缩程序因为解压缩过程中能自动建立完全相同的字串表实际上它是通过查找冗余字符串并将此字符串用较短的符号标记替代的压缩技术 3 1 3常用数据压缩方法的基本原理 3 哈夫曼编码1952年Huffman提出了对统计独立信源能达到最小平均码长的编码方法也即最佳码最佳性可从理论上证明这种码具有即时性和唯一可译性该编码是常见的一种统计编码对给定的数据流计算其每个字节的出现频率根据频率表运用哈夫曼算法可确定分配各字符的最小位数然后给出一个最优的编码代码字存人代码表中 3 1 3常用数据压缩方法的基本原理哈夫曼编码过程例现有A B C D E五个待编码的符号它们的概率分别是0 3846 0 1795 0 1538 0 1538 0 1283 用哈夫曼算法求出这五个符号所分配的代码和熵平均码长 1 初始化根据符号概率的大小按由大到小顺序对符号进行排序 2 把概率最小的两个符号组成一个节点如D和E组成节点P1 3 1 3常用数据压缩方法的基本原理 3 重复步骤2 得到节点P2 P3 P4 形成一棵树 P4为根节点 4 从根节点P4开始到相应每个符号的树叶从上到下标上 0 上枝 1 下枝注至于哪个为 1 哪个为 0 则无关紧要最后的结果仅仅是分配的代码不同而代码的平均长度是相同的 3 1 3常用数据压缩方法的基本原理 Huffman编码的优缺点优点当信源符号概率是2的负幂次方时 Huffman编码法编码效率达到100 一般情况下它的编码效率要比其它编码方法的效率高是最佳变长码 3 1 3常用数据压缩方法的基本原理缺点 1 编码中每个符号的编码长度只能为整数如果源符号集的概率分布不是2的负n次方的形式则无法达到熵极限 2 为可变长度码译码复杂 3 需要事先知道输入符号集的概率分布 4 没有错误保护功能 3 1 3常用数据压缩方法的基本原理 4 算术编码算术编码把一个信源集合表示为实数线上的0到1之间的一个区间这个集合中的每个元素都要用来缩短这个区间信源集合的元素越多所得到的区间就越小当区间变小时就需要一些更多的数位来表示这个区间这就是区间作为代码的原理算术编码首先假设一个信源的概率模型然后用这些概率来缩小表示信源集的区间 3 1 3常用数据压缩方法的基本原理新子区间的起始位置前子区间的起始位置当前符号的区间左端前子区间长度新子区间的长度前子区间的长度当前符号的概率等价于范围长度最后得到的子区间的长度决定了表示该区域内的某一个数所需的位数 3 1 3常用数据压缩方法的基本原理例假设信源符号为 00 01 10 11 这些符号的概率分别为 0 1 0 4 0 2 0 3 根据这些概率可把间隔 0 1 分成四个子区间 0 0 1 0 1 0 5 0 5 0 7 0 7 1 如果二进制消息序列的输入为 10001100101101 请运用算数编码进行编码 3 1 3常用数据压缩方法的基本原理 2 预测编码 PredictionCoding 预测编码是指利用前面的一个或多个信号对下一个信号进行预测然后对实际值和预测值的差进行编码 DPCM与ADPCM是两种典型的预测编码 3 1 3常用数据压缩方法的基本原理 1 差分脉码调制 DPCM PCM PulseCodeModulation 原始的模拟信号经过时间采样然后对每一样值进行量化作为数字信号传输 DPCM不对每一样值都进行量化而是预测下一样值并量化实际值和预测值之间的差 DPCM是基本的编码方法之一在大量的压缩算法中被采用比如JPEG的DC分量就是采用DPCM编码的 3 1 3常用数据压缩方法的基本原理举例说明DPCM编码原理设DPCM系统预测器的预测值为前一个样值假设输入信号已经量化差值不再进行量化若系统的输入为 0121123344 则预测值为 0012112334 差值为 011 1011010 差值的范围比输入样值的范围有所减小可以用较少的位数进行编码 3 1 3常用数据压缩方法的基本原理量化器编码器预测器信道译码器预测器 Xn dn d1n x1n x2n d1n x1n x2n 发送端接收端 DPCM典型的工作原理误差qn xn x1n xn x2n d1n xn x2n d1n dn d1n 3 1 3常用数据压缩方法的基本原理 2 自适应差分脉码调制 ADPCM 为了进一步改善量化性能或压缩数据率可采用自适应量化或自适应预测的方法只要采用了其中的任一种自适应方法均称为ADPCM 自适应预测预测参数的最佳化依赖于信源的统计特性要得到最佳的预测参数是一件繁琐的工作而采用固定的预测参数往往又得不到好的性能为了既能使性能较佳又不致于有太大的工作量可以将上述两种方法折衷考虑采用自适应预测 3 1 3常用数据压缩方法的基本原理具体方法是预测参数仍采用固定的但此时有多组预测参数可供选择这些预测参数根据常见的信源特征求得编码时具体采用哪组预测参数根据信源的特征来自适应的确定为了自适应的选择最佳参数通常将信源数据分区间编码编码时自动地选择一组预测参数使该区间实际值与预测值的均方误差最小随着编码区间的不同预测参数自适应的变化以达到准最佳预测 3 1 3常用数据压缩方法的基本原理例如 Microsoft的ADPCM采用二预测参数提供7组预测系数如右表所示编码时根据选定的准则如最小均方误差准则每个编码区间自动地选取一组最佳的参数自适应量化根据信号分布不均匀的特点系统具有随输入信号的变化而改变量化区间大小以保持输入给量化器的信号基本均匀的能力这种能力称为自适应量化 3 1 3常用数据压缩方法的基本原理 3 1 3常用数据压缩方法的基本原理 3 变换编码 TransformationCoding 在变换编码时初始数据要从初始空间或时间域进行数学变换变换为一个更适于压缩的抽象域该过程是可逆的即使用反变换可恢复原始数据如将时域信号变换到频域因为声音图像大部分信号都是低频信号在频域中信号的能量较集中再进行采样编码就可以压缩数据 3 1 3常用数据压缩方法的基本原理变换本身是可逆的因而其也是一种无损技术然而为了取得更满意的结果某些重要系数的编码位数比其他的要多某些系数干脆就被忽略了这样该过程就成为有损的了数学家们已经构造了多种数学变换除了傅里叶变换外还有余弦 Hadamard Haar KarhunenLoeve变换最实用最常用的数学变换是离散余弦变换 DCT 3 1 3常用数据压缩方法的基本原理典型的变换编码系统框图信源序列变换变换域采样量化编码存储或传输译码填零反变换再现序列变换编码系统压缩数据的三个步骤 3 1 3常用数据压缩方法的基本原理 1 最佳变换 K L变换数据压缩主要是去除信源的相关性若考虑到信号存在于无限区间上而变换区域又是有限的那么表征相关性的统计特性就是协方差矩阵当协方差矩阵中除对角线上元素之外的各元素都为零时就等效于相关性为零所以为了有效地进行数据压缩常常希望变换后的协方差矩阵为一对角矩阵同时也希望主对角线上各元素随的增加很快衰减因此变换编码的关键在于在已知的条件下根据它的协方差矩阵去寻找一种正交变换使变换后的协方差矩阵满足或接近为一对角矩阵 3 1 3常用数据压缩方法的基本原理当经过正交变换后的协方差矩阵为一对角矩阵且具有最小均方误差时该变换称最佳变换也称Karhunen Loeve变换可以证明以矢量信号的协方差矩阵的归一化正交特征向量所构成的正交矩阵对该矢量信号所作的正交变换能使变换后的协方差矩阵达到对角矩阵 3 1 3常用数据压缩方法的基本原理 2 离散余弦变换 DCT变换如果变换后的协方差矩阵接近对角矩阵该类变换称准最佳变换典型的有DCT DFT WHT HrT等其中最常用的变换是离散余弦变换DCT DCT是从DFT引出的 DFT可以得到近似于最佳变换的性能但DFT的运算次数太多且需要复数运算 DCT从DFT中取实部并可用快速余弦变换算法因此大大加快了运算同时其压缩性能十分逼近最佳变换的压缩性能所以 DCT在图像压缩中得到了广泛的应用 3 1 3常用数据压缩方法的基本原理 4 分析合成编码通过对原始数据的分析将其分解为一系列更适合于表示的基元或者从中提取出更有本质意义的参数编码仅对这些基本单元或者特征参数进行而解码时则借助于一定的规则或者模型按照一定的算法将这些基元或者参数再综合成原始数据的一个逼近 3 1 3常用数据压缩方法的基本原理矢量量化量化编码按照一次量化的码元个数可分为标量量化和矢量量化两种对数字化后的数据或PCM数据样本值一个一个地进行量化称为标量量化而将这些数据分组每组K维矢量再以矢量为单元逐个进行量化称其为矢量量化矢量量化是标量量化的多维扩展 3 1 3常用数据压缩方法的基本原理标量量化中可在随机变量X出现概率比较高的间隔内选择较小的判决间隔而在其他区域内选择较大的间隔这样可以以较小的量化均方误差进行量化矢量量化基于语义编码其基本思想是采用非线性量化器即对空间频率及能量分布较大的系数分配较多比特数反之分配较少的比特数从而达到压缩的目的 3 1 3常用数据压缩方法的基本原理小波变换编码小波变换是一个线性变换能够将一个信号分解成对空间和时间频率的独立贡献同时又不失原信号所包含的信息经过小波变换后的图像能量很集中便于对不同的分量作不同的处理达到较高的压缩比 3 1 3常用数据压缩方法的基本原理分形编码分形编码是一种模型编码它利用模型的方法对需要传输的图像进行参数估测分形的方法是把一幅数字图像通过一些图像处理技术如颜色分割边缘检测频谱分析纹理变化分析等等将原始图像分成一些子图像子图像可以是简单的物体也可以是一些复杂的景物然后在分形集中查找这样的子图像分形集实际上并不是存储所有可能的子图像而是存储许多迭代函数通过迭代函数的反复迭代恢复出原来的子图像表示这样的迭代函数一般只需几个数据即可这就达到了很高的压缩比 3 1 3常用数据压缩方法的基本原理子带编码利用带通滤波器组把信号频带分割成若干子频带然后分别处理通过等效于单边带调幅的调制过程将各子带搬移到零频率附近以得到低通表示后再以奈奎斯特速率对各子带输出取样并对取样值进行通常的数字编码恢复时将各子带信号解码并重新调制回其原始位置再将所有子带输出相加就可得到接近于原始信号的恢复波形它的复杂度与变换编码差不多但客观质量高主观效果好 3 2音频的压缩 3 2 1音频压缩编码的基本方法 3 2 2电话质量的语音压缩标准 ITU TS建议的语音压缩的标准 G 711 采用PCM编码采样速率为8kHz 量化位数为8bit 对应的比特流速率为64kbit s G 721 ITU建议的G 721将64Kbps的比特流转换为32Kbps的流它是基于ADPCM技术每个数值差分用4位编码其采样率为8kHz 3 2 2电话质量的语音压缩标准 G 723 G 723是一种以24Kbps运行的基于ADPCM的有损耗压缩标准其音质不如非压缩的G 711PCM标准以及基于SB ADPCM的G 722标准 G 723 1和G 723 2用于H 324标准 G 728 它的比特率为16Kbps 带宽限于3 4kHz 其音质比G 711或G 722差得多它基于一种称为低延迟代码激励线性预测 LD CELP 的向量量化技术 3 2 2电话质量的语音压缩标准 CELP是一种常用的语音压缩技术它用于美国联邦标准1016 可将语音压缩至4 8Kbps 美国联邦标准1015使用CELP的一个简本称为线性预测编码 LPC LPC一10E标准可以运行于2 4Kbps 采用了一种向量量化方法声音听起来有点象机器在说话但4 8Kbps与电话差不多 3 2 3调幅广播质量的音频压缩标准调幅广播质量 50Hz 7kHz 称 7kHz音频信号 G 722 G 722基于子带ADPCM技术 SB ADPCM 它是将现有的带宽分成两个独立的子带信道分别采用差分脉码调制算法 G 722压缩信号的带宽范围为50Hz到7kHz 而G 711仅限于3 4kHz 其比特率为48 56 64Kbps 在标准模式下采样速率是16KHz 幅度深度为14比特 3 2 4高保真立体声音频压缩标准高质量的声音信号频率范围 50Hz 20kHz目前国际上比较成熟的高质量声音压缩标准为MPEG音频 MPEG l的音频信号在ISO11172 3文档中的描述 MPEG音频不是单个一种压缩算法而是3种音频编码和压缩方案的一个系列 MPEG声音编码分为层 l 层 2 层 3 随着层数的增加算法的复杂度也增大 3 2 4高保真立体声音频压缩标准所有3层都分级兼容最复杂的译码器即在层 3工作的译码器也可对层 2或层 l的码流进行译码所有3层都运用同一原理变换编码和子带编码频谱被分为32个子带应用快速博里叶变换来表示高频域中的信号应用心理声学模型来变换信号以估计刚能引起注意的噪音级层l 2和3主要在最后一个阶段即量化阶段的方式上有所区别但不是唯一的差别 3 2 4高保真立体声音频压缩标准声音数据的压缩主要依据是人耳的听觉特性使用心理声学模型来达到压缩声音 1 心理声学模型中一个基本概念就是听觉系统中存在一个听觉阈值电平低于这个电平的声音信号就听不到因此可以把这部分声音信号去掉 2 心理声学模型的另一个基本概念就是听觉掩饰特点意思是听觉阈值电平是自适应的即听觉阈值电平会随听到的不同频率的声音而发生变化 3 3图像和视频的压缩 3 3 1图像和视频压缩编码的基本方法 3 3 1图像和视频压缩编码的基本方法原始的彩色图像一般由红绿蓝三种基色的图像组成 R G B 然而人的视觉系统对彩色色度的感觉和亮度的敏感性是不同的因此产生了不同的彩色空间表示 H S I彩色空间 H为色调 S为饱和度 I表示光的强度或亮度 Y I Q方式和Y U V方式这两种表示方式的一个共同点是用其中一个分量Y表示象素的亮度用其余两个分量表示象素的色度 3 3 2静止图像压缩标准静止图像压缩已有多个国际标准如ISO制订的JPEG标准 JointPhotographicExpertsGroup JBIG标准 JointBilevelImageGroup ITU T的G3 G4标准等特别是JPEG标准适用黑白及彩色照片彩色传真和印刷图片可以支持很高的图像分辨率和量化精度 3 3 2静止图像压缩标准 1 JPEG压缩标准压缩比高图像质量保真程度好算法能适应不同的数字图像参数大小图像内容彩色空间统计特性等但不包括二值图像用户可以对压缩比质量效果进行选择应该满足硬软件实现的计算需求支持多种操作方式 3 3 2静止图像压缩标准 1 JPEG的无损预测编码算法无损压缩不使用DCT方法而是采用一个简单的预测器预测器可以采用不同的预测方法不同的预测方法将决定有哪些相邻的象素将被用于预测下一个象素常用的预测方法如三领域预测法 3 3 2静止图像压缩标准 2 JPEG的基于DCT的有损编码算法 3 3 2静止图像压缩标准块准备块准备将一帧帧图像分成8 8的数据块 DCT变换原始的图像数据块经过DCT变换后将每个数据块的数据从空间域变换到频率域输出64个DCT变换系数其中低频分量集中在左上角高频分量分布在右下角系数矩阵左上角的叫做直流 DC 系数它代表了该数据块的平均值其余63个叫交流 AC 系数 JPEG压缩编码步骤 3 3 2静止图像压缩标准量化 JPEG的量化采用线性均匀量化器量化是用DCT变换后的系数除以量化表中相对应的量化阶后四舍五入取整由于量化表中左上角的值较小而右下角的值较大因而起到了保持低频分量抑制高频分量的作用 Z字型扫描 DCT系数量化后构成一个稀疏矩阵用Z Zigzag 形扫描将其变成一维数列将有利于熵编码 Z形扫描的顺序如图3 10所示 3 3 2静止图像压缩标准 DCT系数的编码 JPEG中对DC系数采用DPCM编码 63个AC系数在JPEG算法中采用行程编码熵编码经过DPCM编码的直流项和经过行程编码的交流项再进行霍夫曼编码或自适应二进制算术编码 3 3 2静止图像压缩标准 JPEG压缩编码算法的主要计算步骤如下 1 正向离散余弦 FDCT 2 量化 3 Z字型编码 ZigzagScan 4 使用差分脉冲编码调制 DPCM 对直流系数 DC 进行编码 5 使用行程编码 RLE 对交流系数 AC 进行编码 6 熵编码 3 3 2静止图像压缩标准压缩比和图像质量基于DCT的JPEG标准的压缩是有失真的 DCT变换后系数的量化是引起失真的主要原因压缩效果与图像内容本身有较大的关系对于中等复杂程度的彩色图像其压缩比与恢复图像的质量大致如下表所示 3 3 2静止图像压缩标准原图像每像素采用8bit编码 3 3 2静止图像压缩标准 2 JPEG2000简介内容 JPEG2000图像编码系统核心部分应用扩展在核心上扩展更多特性运动JPEG2000兼容性即包容性与继承性参考软件目前主要为JAVA与C程序复合图像文件格式如传真式的服务等 3 3 2静止图像压缩标准核心离散小波变换算法特点 1 高压缩率 2 无损压缩 3 渐进传输 4 感兴趣区域压缩 5 多种色彩模式 6 图像处理简单渐进传输就是先传送图像轮廓数据然后再逐步传输其他数据不断提高图像质量 ROI RegionofInterest 即感兴趣区域可以指定图片上的感兴趣区域在压缩时再对这些区域指定压缩质量或在恢复时指定某些区域的解压缩要求 3 3 2静止图像压缩标准 JPEG2000与JPEG相比有哪些优点 1 JPEG2000放弃了JPEG所采用的以离散余弦变换 DCT 算法为主的区块编码方式改用以离散小波变换算法 DWT 为主的多解析编码方式 2 JPEG2000还将彩色静态图像采用的JPEG编码方式 2值图像采用的JBIG编码方式及低压缩率的JPEGLS统一起来成为对应各种图像的通用编码方式 3 JPEG2000还考虑人的视觉特性增加了视觉权重和掩模在不损害视觉效果的情况下大大提高了压缩效率 3 3 2静止图像压缩标准 4 JPEG2000可为一个JPEG文件加上加密的版权信息 3 3 3视频压缩标准视频压缩的一个重要标准是MPEG MotionPictureExpertsGroup 已推出了MPEG 或MPEG MPEG MPEG 等系列标准新的标准MPEG MPEG 21等标准也在酝酿之中另一个重要标准是H系列包括H 261 H 263等标准此外还有运动JPEG等压缩标准 3 3 3视频压缩标准 1 MPEG 1压缩标准能够传输用户可以接受的视频能够支持对称或者非对称的压缩解压应用根据需要可以支持随机存取除了正常播放之外根据需要支持快进快倒快放等多种工作方式能够支持视频和音频的同步工作能够避免出现大的障碍当需要时可以控制压缩解压的延迟如果需要可以具有编辑能力能够以灵活的格式支持窗口视频演示不排斥使用价格低廉又能够实时编码的芯片 3 3 3视频压缩标准 MPEG 标准 ISO IEC11172 的目标是以约1 5Mbps的速率传输电视质量的视频信号亮度信号的分辨率为360 240 色度信号的分辨率为180 120 每秒30帧 MPEG 标准包括 MPEG系统 ISO IEC11172 1 MPEG视频 ISO IEC11172 2 MPEG音频 ISO IEC11172 3 测试验证 ISO IEC11172 4 四大部分内容所以MPEG涉及的问题是视频压缩音频压缩及多种压缩数据流的复合和同步问题 3 3 3视频压缩标准 1 时间冗余量的减少为了减少时间冗余量 MPEG将1 30秒时间间隔的帧序列电视图像以三种类型的图像格式表示内码帧 I 预测帧 P 和插补帧 B 另有第四种类型帧是D帧它是一种专用帧格式仅仅用于实现快速查询中 3 3 3视频压缩标准 I帧又称内码帧是完整的独立编码的图像是不能由其他帧构造的帧必须存储或传输 P帧也称为预测帧通过对它之前的I帧进行预测对预测误差作有条件的存储和传输 B帧又称为双向帧或插补帧是根据其前后的I帧或者P帧的信息进行插值编码而获得该过程有时也称为双向插值 3 3 3视频压缩标准运动补偿有两种算法运动补偿预测法画面上的运动部分在帧与帧之间必然有连续性预测法根据这一特性将当前的图像画面看作是前面某时刻图像的位移位移的幅度和方向在图像画面的各处可有不同运动补偿插补法用插补的方法进行运动的补偿可以大幅度地压缩运动图像的信息 3 3 3视频压缩标准 2 空间冗余量的减少MPEG视频信息的帧内图和预测图都有很高的空域冗余度用于减少这方面冗余的技术很多在正交变换中 DCT具有许多明显的优点且相对来说较易实现所以帧内压缩也采用基于DCT的方法这和静态图像的压缩标准JPEG相同且实现的步骤也一样只是在JPEG压缩算法中针对静止图像对DCT系数采用等宽量化而在MPEG中的视频信号包含有静止画面帧内图和运动信息帧间预测图等不同的内容量化器的设计需作特殊考虑 3 3 3视频压缩标准 3 MPEG的分层结构和位流MPEG视频图像数据流是一个分层结构目的是把位流中逻辑上独立的实体分开防止语意模糊并减轻解码过程的负担 MPEG视频位流分层结构共包括

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第三章多媒体数据压缩技术ppt课件

文档简介

温馨提示

最新文档

评论

第三章 多媒体数据压缩技术ppt课件

文档简介

温馨提示

最新文档

评论

相关文档

第三章多媒体数据压缩技术ppt课件