




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6
章
多媒体数据压缩解码技术引言6.1数据压缩解码概述6.1.1基本概念6.1.2数据压缩条件6.1.3压缩和解压缩分类和衡量标准6.2数据压缩算法6.2.1霍夫曼编码6.2.2算术编码6.2.3游程编码RLE6.2.4词典编码6.2.5预测编码6.2.6变换编码6.3常见压缩标准6.3.1静态图像压缩标准JPEG6.3.2运动图像压缩标准MPEG6.3.3音频压缩编码技术标准本章小结思考与练习引言数字化后的图像、音频和视频等媒体信息具有海量性,与当前计算机所提供的存储资源和网络带宽之间有很大的差距,这给存储及传输多媒体信息带来了很大的困难。为此人们尝试了各种技术方法,其中数据压缩解码技术作为解决上述问题的有效途径,成为了当今通信、广播、存储和多媒体娱乐等领域的一项必不可少的关键技术。
本章讲述了数据压缩的基本概念、压缩条件和压缩编码分类,并介绍了几种数据压缩算法和常见的压缩标准。6.1数据压缩解码概述数字化了的多媒体信号的数据量非常大。6.6.1基本概念从硬件和软件两方面考虑硬件方面:提高存储介质的容量、提高系统和网络的传输速率。有局限性,现有硬件发展的速度和程度不能和当前多媒体应用的海量数据量需求相匹配。软件方面:采用数据压缩技术降低数据量,以压缩形式存储和传输数据。是行之有效的方法,既节约空间,又提高通信干线的传输效率。数据压缩流程最初作为信息论研究中的一个重要课题,在信息论中被称为信源编码。近年已成为独立的体系,主要研究数据的表示、传输和转换方法,以减少数据存储空间,方便传输和存储。数据压缩解码技术
在不丢失信息的前提下,按照一定的算法对数据进行重新组织,减少数据冗余和存储空间,提高传输、存储和处理效率的一种技术方法。
其本质是去掉数字信号数据中的冗余数据,用尽可能少的比特数来表示源信号并能将其还原。1.数据压缩
还原压缩数据的过程。
按压缩和解压缩算法耗费代价的不同,分为对称应用和非对称应用。对称应用:编码和解码代价应基本相同。如视频会议系统。非对称应用:解码比编码过程耗费代价小。2.数据解码6.1.2数据压缩条件人类感官的生理局限性2.多媒体数据的冗余
冗余:信息所具有的各种性质中多余的无用空间。听觉局限性:听觉掩蔽效应等。又称“认知冗余”,人类的视觉、听觉系统存在着各种生理局限性。视觉局限性:对色彩的感知不如对亮度的感知敏感;对蓝色敏感度差;只能识别几百种颜色等。1.人类感官的生理局限性纹理结构规则、相互重叠的结构表面。结构冗余人类可以凭借经验辨识事物,无需进行全面的比较和鉴别。但计算机则没有经验可循,只能按部就班地扫描和处理数据,这种与人类的差异所造成的数据冗余就是知识冗余。知识冗余多媒体数据中存在的数据冗余类型:2.多媒体数据的冗余空间冗余时间冗余信息熵冗余结构冗余知识冗余静态图像中经常存在。
图像中,规则物体和背景的表面物理特征具有相关性。空间冗余音频视频中经常存在。如:图像序列中的两幅相邻的图像之间有较大的相关性,甚至几乎完全相同。时间冗余信息熵冗余什么是信息熵?为了从N个相等的可能事件中挑选出一个事件所需的信息度量和含量,即在N个事件中辨识特定的一个事件要询问“是或否”次数。信息量从256个数中选定某一个数。先问“是否大于128?”,从而消除半数的可能事件;这样只需要8次即可选出某数。每次询问对应一个1bit的信息量,在256个数中选定某数所需的信息量是:log2256=8bit例信息量和事件出现的概率有关,概率越大信息量越小,概率越小,信息量越大。
如果将信源所有可能事件的信息量平均,就得到了“平均信息量”。而信息熵就是一组数据所携带的平均信息量,即信息熵=平均信息量。定义:
其中:H为信息熵;N为数据类数或码元个数;Pi为yi出现的概率。信息熵也称“编码冗余”。无失真编码定理:无失真编码极限=信源所含平均信息量(熵)信源编码时,为使单位数据量d接近或等于信息熵H(达到压缩极限),应使:其中:d为单位数据量;N为数据类数或码元个数;b(yi)是分配给码元yi的比特数,
b(yi)=-log2Pi。实际应用中个码元的先验概率很难预测,比特分配很难达到最佳,因此实际单位数据量d>信息熵H,即存在信息熵冗余。信息熵冗余也称熵压缩法。既减少数据量,又减少信息量。解压缩后不能完全恢复原始数据。
包括:预测编码、变换编码、子带编码等。广泛应用于语音、图像和视频的数据压缩。去掉了数据中的冗余,但不减少信息量,解压缩后能完全恢复原始数据。包括:霍夫曼编码、游程编码、算术编码、香农编码、LZW编码等。一般用于文本数据、特殊应用场合的图像数据(如指纹图像、医学图像等)及应用软件的压缩,压缩率较低。6.1.3压缩和解压缩分类和衡量标准1.有损压缩编码和无损压缩编码有损压缩编码无损压缩编码多媒体数据压缩技术2.定长编码和变长编码采用不相同的位数对数据进行编码。
如霍夫曼编码、香农编码。采用相同的位数对数据进行编码。
如:ASCII码,码长为1字节;
汉字国标码,码长为2字节。变长编码定长编码压缩比:原始数据量和压缩后数据量的比值,衡量数据压缩器效率的质量指标。定义:R=输出流大小/输入流大小R<1——压缩R>1——扩大如:MPEG-1音频压缩比1:4;MPEG-2音频压缩比1:6~1:8;MPEG-4可达1:10~1:12;MPEG对图像的压缩比达1:200。3.压缩编码的技术指标压缩速度:编码或解码的快慢程度。
不同的应用要求不同:对称压缩时,要求压缩和解压缩速度都快,即实时进行;而非对称压缩,压缩速度没有过高要求,但解压缩速度则必须是实时的。计算量:压缩的计算量比解压缩计算量要大,如动态图像压缩编码的计算量约为解压缩的4倍。3.压缩编码的技术指标压缩质量:压缩后对媒体的感知效果。
只有有损压缩会影响人对媒体的感知效果。6.2数据压缩算法属统计编码一种,按信源符号出现概率大小排序,概率大的分配短码,概率小的分配长码。变长编码,无损压缩编码基于编码树技术,算法步骤:(1)将信源根据符号出现概率的大小按递减的顺序进行排序。
(2)把概率最小的两个符号之概率相加合并组成一个新符号(节点),新符号的概率等于这两个符号概率之和。(3)重复进行第1步和第2步,直到概率的和值等于1为止。
(4)从编码树的根开始回溯到原始的符号,并将每一下分枝赋值为1,上分枝赋值为0。(5)最后记录下从概率1开始到当前信源符号之间的0、1序列,得到每个符号的编码。
6.2.1霍夫曼编码
已知各信源数据出现的概率如下:P(A)=0.16,P(B)=0.51,P(C)=0.09,P(D)=0.13,P(E)=0.11求霍夫曼编码。编码过程:1、P(C)和P(E)概率值为最小的两个,被排在第一棵二叉树中作为树叶。它们的根节点CE的组合概率为P(CE)=P(C)+P(E)=0.20。从CE到C的一边被标记为1,从CE到E的一边被标记为0。2、现在各节点相应的概率为:P(A)=0.16,P(B)=0.51,P(CE)=0.20,P(D)=0.13P(D)和P(A)为概率最小的两个节点,将这两个节点作为叶子组合成一棵新的二叉树。根节AD的组合概率为P(AD)=P(A)+P(D)=0.29。由AD到A的一边标记为1,由AD到D的一边标记为0。例:霍夫曼编码
3、剩下节点的概率如下:P(AD)=0.29,P(B)=0.51,P(CE)=0.20P(AD)和P(CE)两节点的概率最小,再将它们生成一棵二叉树。其根节点ADCE的组合概率为0.49。由ADCE到AD一边标记为0,由ADCE到CE的一边标记为1。4、最后两个节点相应的概率如下:P(ADCE)=0.49,P(B)=0.51它们生成最后一棵根节点为ADCEB的二叉树。由ADCEB到B的一边记为1,由ADCEB到ADCE的一边记为0。5、下图为霍夫曼编码。编码结果被存放在一个表中:w(A)=001,w(B)=1,w(C)=011,w(D)=000,w(E)=010例:霍夫曼编码例:霍夫曼编码编码长度可变,压缩与解压缩较慢。硬件实现困难。编码效率取决于信号源的数据出现概率。编码不唯一,当几个节点的概率值相同时,选择方式的不同和构造新节点的两个子节点位置关系不同都可以导致不同的编码,但不同的编码方案平均码长基本一致。没有错误保护功能,在译码时,但如果码串中有错误,那怕仅仅是1位出现错误,也会引起一连串的错误。霍夫曼编码特点属统计编码一种,无损压缩编码。某些方面优于霍夫曼编码,在JPEG标准的扩展系统中,算术编码已经取代了霍夫曼编码。给定事件序列的算法步骤:编码器在开始时将“当前间隔”[L,H)设置为[0,1)。
对每一事件,按步骤(a)和(b)进行处理
(a)将“当前间隔”分为子间隔,每一个事件一个。
(b)一个子间隔的大小与下一个将出现的事件的概率成比例,选择子间隔对应于下一个确切发生的事件相对应,并使它成为新的“当前间隔”。
最后输出的“当前间隔”的下边界就是该给定事件序列的算术编码。
6.2.2算术编码设信源符号为{A,B,C,D},符号概率分别为:{0.1,0.4,0.2,0.3}如果二进制消息序列的输入为:CADACDB算术编码过程如下图:算术编码——例1:DCBACADACDB编码过程译码过程适用于静态图像。基本编码原则:重复的数据值序列(或称为“流”)用一个重复次数和单个数据值来代替。常用格式三字节编码:二字节编码:6.2.3游程编码RLE控制符
重复次数
被重复字符
设有字符串:“RTAAAASDEEEEE”三字节编码为:RT*4ASD*5E
说明——“*”为控制符二字节编码:1R1T4A1S1D5E游程编码——例重复次数
被重复字符
词典:用以前处理过的数据来表示编码过程中遇到的重复部分。编码思想:企图查找正在压缩的字符序列是否在前面的输入数据中出现过,如果是,则用指向早期出现过的字符串的“指针”替代重复的字符串。代表算法:LZ77算法、LZSS算法无损压缩编码依据数据本身包含有重复代码序列的特性。6.2.4词典编码第一类词典编码输入数据流输出数据流短语词典:从输入的数据中创建。编码数据过程中,当遇到已经在词典中出现的“短语”时,编码器就输出这个词典中的短语的“索引号”,而不是短语本身。代表算法:LZ78算法、LZW算法第二类词典编码输入数据流输出数据流6.2.5预测编码根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。
1.预测编码的原理预测编码步骤:(1)建立一个供预测用的数学模型。(2)利用以往的样本数据对新样本值进行预测。(3)将预测值与实际值相减,对其差值进行预测。减少了数据时间和空间上的相关性如果预测比较准确,误差就会很小较适合于声音、图像数据的压缩直观、简捷、易于实现,特别是用于硬件实现,但压缩能力有限,如DPCM只能压缩到2~4bit像素几种预测编码:自适应脉冲编码调制APCM、差分脉冲编码调制DPCM、自适应差分脉冲编码调制ADPCM等预测编码特点在PCM系统中,原始的模拟信号经过采样后得到的每一个样值都被量化成为数字信号。为了压缩数据,可以不对每一样值都进行量化,而是预测下一样值,并量化实际值与预测值之间的差值,这就是差分脉冲编码调制DPCM。2.差分脉冲编码调制DPCM先对信号进行某种函数变换,从一种信号(空间)变换到另一种(空间),然后再对信号进行编码。一种间接编码方法。它是将原始信号经过数学上的正交变换后,得到一系列的变换系数,再对这些系数进行量化、编码、传输。6.2.6变换编码编码、解码原理6.3常见压缩标准6.3.1静态图像压缩标准JPEG
JPEG(JointPhotographicExpertsGroup)是由国际标准化组织ISO和国际电工技术委员会IEC联合组成的一个专家组,负责制定静态的数字图像数据压缩编码标准,这个专家组开发的算法称为JPEG算法,已成为国际通用标准,因此又称为JPEG标准。用JPEG标准编码的图像文件后辍名为“.jpg”或“.jpeg”,是一种支持8位和24位色彩的压缩位图格式,适合在网络上传输。
JPEG简介JPEG编码处理过程图像块排序系数的Z形排序适用于连续色调的、多级灰度和彩色的静止图像。可随意选择期望的压缩比值。平均压缩比大约15:1;无损压缩比大约为4:1;有损压缩比在10:1~100:1之间。当压缩比大于50倍时将可能出现方块效应。适用于大部分通用的计算机平台JPEG特点6.3.2运动图像压缩标准MPEG
ISO和IEC成立的运动图像专家组(MPEG,MovingPictureExpertsGroup),研究和开发运动图像和音频的压缩。MPEG标准是音频、视频解压算法的综合描述,它还对怎样多路复合压缩比特流和如何使解码后的媒体同步等进行讨论和规定。
MPEG简介MPEG-1标准(信息技术——用于数据率1.5Mbit/s的数字存储媒体的电视图像和伴音编码)。1991年制定,文件扩展名包括*.mpg、*.mlv、*.mpe、*.mpeg及VCD光盘中的.dat文件等。MPEG-2标准(信息技术——活动图像和伴音信息的通用编码)。1994年制定,设计目标为高级工业标准的图像质量以及更高的传输率。文件扩展名有.mpg、.mpe、.mpeg、.m2v及DVD上的.vob文件等。MPEG-4标准(甚低速率视听编码)。制定于1998年,为了播放流式媒体的高质量视频而专门设计。MPEG-7标准(多媒体内容描述接口)MPEG-21标准(多媒体框架)已开发和正开发的MPEG标准6.3.3音频压缩编码技术标准国际电报电话咨询委员会(CCITT)和国际标准化组织(ISO)先后提出一系列有关音频编码的建议。G.711标准:主要应用于公共电话网。G.721标准:目前其应用包括电视会议的语音编码、多媒体多路复用装置、数字录音电话及高质量的语音合成器。G.722标准:主要用于高质量语音通信会议等。G.723标准:应用于可视电话、IP电话等。G.728标准:为了进一步适应低速率语音通信的要求而制定的标准,主要用于公共电话。G.729.A标准:主要用于无线移动网、数字多路复用系统和计算机通信系统的应用。1.语音压缩解压标准语音压缩/解压标准应用在多媒体数字通信方面(包括电视会议等)的标准。2.H系列标准
MPEG-1音频压缩技术的数据速率为每声道32~448kbit/s,适合于CD-DA光盘应用。MPEG-2音频标准由两部分组成:MPEG-2音频和MPEG-2AAC(先进的音频编码,ISO/IEC13818-3)。MPEG-2音频编码标准是对MPEG-1后向兼容的、支持二至五声道的后继版本。MPEG-4Audio标准可集成从话音到高质量的多通道声音,从自然声音到合成声音。MPEG-7Audio标准提供了音频描述工具。3.MPEG音频标准本章小结数据压缩技术一般分为有损压缩和无损压缩。
无损压缩是指重构压缩数据(还原,解压缩),而重构数据与原来数据完全相同。典型的无损压缩算法有:香农编码、哈夫曼编码、算术编码、行程程编码等。
有损压缩是重构使用压缩后的数据,其重构数据与原来数据有所不同,但不影响原始资料表达信息。常用的有损压缩算法有预测编码、变换编码等。各类编码算法衍生出不同的压缩标准,包括:静态图像压缩标准JPEG、运动图像压缩标准MPEG和音频压
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 木地板表面装饰工抗压考核试卷及答案
- 手风琴校音工职业考核试卷及答案
- 配膳员综合考核试卷及答案
- 游泳池救生员工艺考核试卷及答案
- 感光材料乳剂熔化工综合考核试卷及答案
- 石脑油预处理装置操作工测试考核试卷及答案
- 家具制作工三级安全教育(车间级)考核试卷及答案
- 生活垃圾清运工特殊工艺考核试卷及答案
- 客车司机特殊工艺考核试卷及答案
- 矿井防尘工应急处置考核试卷及答案
- 2025-2026学年人教版小学数学四年级上册教学计划及进度表
- 水泥路施工安全知识培训课件
- 2025年秋季学期(统编版)二年级上册语文教学工作计划及教学进度表
- 2025年福建省厦门市【辅警协警】笔试真题(含答案)
- 2025年浙江省医疗器械专业技术资格考试(医疗器械专业知识与技能)历年参考题库含答案详解(5卷)
- 2025年云南警务辅助人员招聘考试(基本法律知识和公文写作)历年参考题库含答案详解(5卷)
- (2025年标准)委托他人要账协议书
- 2025年河南开封产城融合投资集团有限公司招聘考试笔试试题(含答案)
- 2025年广西中考语文试题卷(含答案)
- 改革开放以来教育方面的变化课件
- DB44-T 2197-2019配电房运维服务规范-(高清现行)
评论
0/150
提交评论