




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
现代通信理论第二章第1页,课件共103页,创作于2023年2月
§2.1引言-关于信源编码数字通信系统因具有许多优点而成为当今通信的发展方向。在数字通信系统中,信道传输的是数字信号。但是在自然界中,很多信源输出的是模拟量,如话音、图像等。因此在利用数字通信系统进行信息传输时,首先需先对信号(模拟的)数字化,即A/D。模拟信号的数字化属于信源编码的范畴。第2页,课件共103页,创作于2023年2月数字通信中的编码概念编码和译码是数字通信发送与接收设备的重要组成部分。第3页,课件共103页,创作于2023年2月数字通信中的编码概念(续)数字通信系统中包含编码和译码,编码的逆过程是译码。数字通信中的编码涉及两部分,含义完全不同:信源编码信道编码第4页,课件共103页,创作于2023年2月信源编码的作用作用之一是设法减少码元数目和降低码元速率,即通常所说的数据压缩。码元速率将直接影响传输所占的带宽,而传输带宽又直接反映了通信的有效性。我们所熟悉的典型的压缩:音频压缩MP3
图像压缩JPEG、MPEG等
作用之二是当信息源给出的是模拟信号时,信源编码器将其转换成数字信号,以实现模拟信号的数字化传输。模拟信号数字化传输的方式有脉冲编码调制(PCM)和增量调制(ΔM)、ADPCM等。作用之三是加密第5页,课件共103页,创作于2023年2月信道编码信道编码是为了降低误码率,提高数字通信的可靠性而采取的编码。信道编码技术的基本思想是通过对信息序列作某种变换,使原来彼此独立,相关性极小的信息码元产生某种相关性,从而在接收端利用这种规律检查或纠正信息码元在信道传输中所造成的差错。具体做法是信道编码器对传输的信息码元按一定的规则加入保护成分(监督元),组成所谓“抗干扰编码”。接收端的信道译码器按一定规则进行解码,从解码过程中发现错误或纠正错误,从而提高通信系统抗干扰能力,实现可靠通信。与信源编码相反,信道编码提高了可靠性。第6页,课件共103页,创作于2023年2月本章涉及内容语音信号的编码问题-重点讨论语音编码的基本方法,包括波形编码(脉冲编码调制(PCM),对增量调制(ΔM)、自适应差分脉码调制(ADPCM)、参数编码(线性预测LP)、混合编码(码激励线性预测CELP等。图像信号的编码问题-压缩编码,如静态图像压缩方法JPEG、动态图像压缩方法MPEG等。第7页,课件共103页,创作于2023年2月§2.2音频信号编码语音编码概述时域波形编码变换域编码参数编码混合编码各种音频信号编码方法的比较现代语音处理技术及应用第8页,课件共103页,创作于2023年2月语音编码概述
语音是人类进行交流的重要手段,通信系统中最常见的数据形式就是语音。语音通信是人类通信最基本、最重要的方式之一。随着移动通信与互联网的飞速发展,语音通信技术也在不断地进行更新并与之相融合。语音信号的数字化传输和存储,在可靠性、抗干扰语音信号的数字化传输和存储,在可靠性、抗干扰能力、快速交换等方面远胜于模拟化,且灵活方便,易于保密,价格低廉,所以从20世纪50年代以来,数字化语音在通信系统中所占的比重越来越大。语音编码是数字语音通信中的一项重要技术。为了压缩数字语音传输的比特率,以使同样的信道容量能传输更多路的语音信号,节省存储空间,语音压缩编码也有了很大的发展,并在有线/无线电话的话带语音信号、会议电视的宽带语音信号、HDTV和高保真音乐等的音频信号等领域有广泛的应用。第9页,课件共103页,创作于2023年2月语音编码算法语音编码大致分为四种方式:时域波形编码-不基于声学模型.只针对语音波形进行编码变换域编码-不基于声学模型的编码方法参数编码-参数编码是基于声学模型的编码方法混合编码-结合上述几种编码方式的优点有时也将时域的波形编码和变换域编码统称波形编码,因此也可以称语音编解码算法分为波形编码、参数编码(声码器)和混合编码三类。第10页,课件共103页,创作于2023年2月§2.2.1时域波形编码时域波形编码不基于声学模型.只针对语音波形进行编码。这种方法在降低量化每个语音样本比特数的同时,又保持了相对良好的语音质量。波形编码主要有脉冲编码调制(PCM)、增量调制(ΔM)、自适应增量调制(ADM)、自适应差分脉码调制(ADPCM)等。第11页,课件共103页,创作于2023年2月一、采用PCM的模拟信号数字传输系统m(t)模拟随机信号mo(t)模拟随机信号{ak}数字随机序列{a’k}数字随机序列模拟信息源受信者数字传输系统抽样、量化和编码译码和低通滤波第12页,课件共103页,创作于2023年2月PCM数字化的过程一般分三步:抽样量化编码m(t){ak}“抽样”指抽取样值,或抽取样点,抽样的多少对通信的性能指标有决定影响。抽样的多少即快慢由抽样定理规定。复习或回忆抽样定理-低通抽样定理频率受限于(0,fH)的时间连续信号m(t),其抽样频率fs≥2fH、抽样间隔Ts≤1/2fH第13页,课件共103页,创作于2023年2月抽样应用实例:1)对于电话质量的语音信号2)声卡8kHz为电话质量11kHz为AM广播质量22kHz为FM广播质量44kHz为激光视盘(CD)质量第14页,课件共103页,创作于2023年2月带通抽样定理频率受限于(fL,fH)的时间连续信号m(t),其最小抽样频率满足:第15页,课件共103页,创作于2023年2月抽样小结抽样以后连续时间信号m(t)变成了时间离散的脉冲,脉冲幅度随m(t)连续变化,本质上仍为模拟信号。要完成数字化,需要进一步的处理。第16页,课件共103页,创作于2023年2月第二步:模拟信号的量化(一)、概念:
1.量化定义:用预先规定的有限个电平来表示模拟抽样值的过程,如后图。*注意这里的量化指标量量化-数与后面要讲的矢量量化不同。第17页,课件共103页,创作于2023年2月量化过程示意图信号的实际值信号的量化值量化误差q7m6q6m5q5m4q4m3q3m2q2m1q1Ts2Ts3Ts4Ts5Ts6Ts7Tsmq(t)m(t)mq(6Ts)m(6Ts)t量化器{m(kTs)}{mq(kTs)}第18页,课件共103页,创作于2023年2月3.量化电平
q1,q2………qM为量化电平指量化器可能的输出电平,M为量化电平数,4.量化间隔V=mi-mi-1m(kTs)——为抽样值2.量化信号mq(t),为m
(t)的近似值第19页,课件共103页,创作于2023年2月5.量化误差只能减小(量化电平个数多一点),无法消除,也称量化噪声,大小由量化电平个数及量化方法决定。6.量化信噪比量化信噪比是量化器的主要性能指标之一。第20页,课件共103页,创作于2023年2月量化方法:均匀量化有不足之处A律13折线近似方法:先对x轴上的输入信号归一化取值范围,按1/2递减规律分为8段,分段点依次为1/2、1/4、1/8、1/16、1/32、1/64、1/128,再把y轴上输出的归一化取值范围均匀地分成8段,即每段长为1/8,然后把x轴和y轴的相应分段线的交点连接起来,共得到8段斜线。负向8段斜线按同样方法得到。每一段再均匀分为16个量化级采用非均匀量化-折线近似法第21页,课件共103页,创作于2023年2月A律13折线
第22页,课件共103页,创作于2023年2月第三步:编码量化完成了幅度的离散,但直接传输时,电平数多,判决困难,故需要将量化电平用代码表示。(一)、概念:1.编码:把量化后的信号变换成代码的过程。2.译码:由代码重建量化信号的过程。第23页,课件共103页,创作于2023年2月(二)编码实现:
1、码型选择:自然二进制码折叠二进制码小信号时折叠二进制码误差小自然码误差大大信号时自然码误差小折叠二进制码误差大样值脉冲极性格雷二进制自然二进码折叠二进码量化级序号正极性部分10001001101110101110111111011100111111101101110010111010100110001111111011011100101110101001100015141312111098负极性部分01000101011101100010001100010000011101100101010000110010000100000000000100100011010001010110011176543210第24页,课件共103页,创作于2023年2月2.码位安排极性码段落码段内码C1C2C3C4C5C6C7C8>0,“1”<0,“0”段落序号段落码C2c3c4876543211
11110101100011010001000电平序号段内码电平序号段内码c5c6c7c8c5c6c7c815141312111098111111101101110010111010100110007654321001110110011001010011001000010000第25页,课件共103页,创作于2023年2月(三)编码方法——逐次比较法原理图:第26页,课件共103页,创作于2023年2月PCM码流速率计算:第27页,课件共103页,创作于2023年2月PCM系统的抗噪性能第28页,课件共103页,创作于2023年2月3)总信噪比:第29页,课件共103页,创作于2023年2月二、自适应差分脉冲编码调制(ADPCM)64kb/s的A律或μ律的对数压扩PCM编码已经在大容量的光纤通信系统和数字微波系统中得到了广泛的应用。但PCM信号占用频带要比模拟通信系统中的一个标准话路带宽(3.1kHz)宽很多倍,这样,对于大容量的长途传输系统,采用PCM的经济性能很难与模拟通信相比。
以较低的速率获得高质量编码,一直是语音编码追求的目标。通常,人们把话路速率低于64kb/s的语音编码方法,称为语音压缩编码技术。第30页,课件共103页,创作于2023年2月语音压缩编码方法很多,其中,自适应差分脉冲编码调制是语音压缩中复杂度较低的一种编码方法,它可在32kb/s的比特率上达到64kb/s的PCM数字电话质量。近年来,ADPCM已成为长途传输中一种新型的国际通用的语音编码方法(G.721)。ADPCMADPCM是在差分脉冲编码调制(DPCM)的基础上发展起来的,为此,下面先介绍DPCM的编码原理与系统框图。第31页,课件共103页,创作于2023年2月由于相邻样值的差值比样值本身小,可以用较少的比特数表示差值。这样,用样点之间差值的编码来代替样值本身的编码,可以在量化台阶不变的情况下(即量化噪声不变),编码位数显著减少,信号带宽大大压缩。这种利用差值的PCM编码称为差分PCM(DPCM)。在PCM中,每个波形样值都独立编码,与其他样值无关,这样,样值的整个幅值编码需要较多位数,比特率较高,造成数字化的信号带宽大大增加。然而,大多数以奈奎斯特或更高速率抽样的信源信号在相邻抽样间表现出很强的相关性,有很大的冗余度。利用信源的这种相关性,一种比较简单的解决方法是对相邻样值的差值而不是样值本身进行编码。1、DPCM如果将样值之差仍用N位编码传送,则DPCM的量化信噪比显然优于PCM系统。实现差分编码的一个好办法是根据前面的k个样值预测当前时刻的样值。编码信号只是当前样值与预测值之间的差值的量化编码。第32页,课件共103页,创作于2023年2月DPCM系统原理框图第33页,课件共103页,创作于2023年2月式中,(S/N)q是把差值序列作为信号时量化器的量化信噪比,与PCM系统考虑量化误差时所计算的信噪比相当。Gp可理解为DPCM系统相对于PCM系统而言的信噪比增益,称为预测增益。如果能够选择合理的预测规律,差值功率E[e2n]就能远小于信号功率E[x2n],Gp就会大于1,该系统就能获得增益。对DPCM系统的研究就是围绕着如何使Gp和(S/N)q这两个参数取最大值而逐步完善起来的。通常Gp约为6~11dB。因此DPCM系统总的量化信噪比可表示为第34页,课件共103页,创作于2023年2月可见,DPCM系统总的量化信噪比远大于量化器的信噪比。因此,要求DPCM系统达到与PCM系统相同的信噪比,则可降低对量化器信噪比的要求,即可减小量化级数,从而减少码位数,降低比特率。第35页,课件共103页,创作于2023年2月2、ADPCM值得注意的是,DPCM系统性能的改善是以最佳的预测和量化为前提的。但对语音信号进行预测和量化是复杂的技术问题,这是因为语音信号在较大的动态范围内变化。为了能在相当宽的变化范围内获得最佳的性能,只有在DPCM基础上引入自适应系统。有自适应系统的DPCM称为自适应差分脉冲编码调制,简称ADPCM。第36页,课件共103页,创作于2023年2月
ADPCM的主要特点是用自适应量化取代固定量化,用自适应预测取代固定预测。自适应量化指量化台阶随信号的变化而变化,使量化误差减小;自适应预测指预测器系数可以随信号的统计特性而自适应调整,提高了预测信号的精度,从而得到高预测增益。通过这两点改进,可大大提高输出信噪比和编码动态范围。如果DPCM的预测增益为6~11dB,自适应预测可使信噪比改善4dB;自适应量化可使信噪比改善4~7dB,则ADPCM比PCM可改善14~22dB,相当于编码位数可以减小3位到4位。因此,在维持相同的语音质量下,ADPCM允许用32kb/s比特率编码,这是标准64kb/sPCM的一半。因此,在长途传输系统中,ADPCM有着远大的前景。相应地,CCITT也形成了关于ADPCM系统的规范建议G.721、G.726等。ADPCM(续)第37页,课件共103页,创作于2023年2月三、增量调制(ΔM或DM)1、与PCM区别
PCM码表示样值大小,N位码,ΔM代码表示相邻样值的关系,一位码,是DPCM的特例。2、ΔM基本原理(1).编码第38页,课件共103页,创作于2023年2月ΔM波形示意e(ti)=m(ti-)-m’(ti-)>0e(ti)=m(ti-)-m’(ti-)<0输出1,上升一个台阶s输出0,下降一个台阶s
第39页,课件共103页,创作于2023年2月波形编码小结PCM、ΔM、ADPCM是基于时域的波形编码技术,不基于声学模型。波形编码器作用于所有输入信号,因此会产生高质量的样值。然而,波形编码器工作在高比特率。例如:ITU-G.711规范(PCM)用的比特率为64kbps。**引出其它编码,目的是降低比特率,提高有效性。第40页,课件共103页,创作于2023年2月§
2.2.2
变换域编码-频域编码变换域编码方式也是不基于声学模型的编码方法,但对信号进行频域处理,再编码。典型的变换域编码有子带编码(SBC)第41页,课件共103页,创作于2023年2月子带编码(sub—bandcoding,SBC)SBC利用带通滤波器将语音频带分成若干子带,并且分别进行采样、编码,编码方式可以用ADPCM或ADM,SBC速率可以达到9.6kb/s。可变SBC可使子带的设计不固定,而是随共振峰变化,使编码效率进一步提高,这种方式在码率为4.8kb/s时可具有相当于7.2kb/s的固定SBC的语音质量。第42页,课件共103页,创作于2023年2月SBC原理框图(a)编码器
(b)解码器
第43页,课件共103页,创作于2023年2月子带编码应用1976年子带编码技术首次被美国贝尔实验室的R.E.Crochiere等人应用于语音编码。子带编码器SBC愈来愈受到重视。在中等速率的编码系统中,SBC的动态范围宽、音质高、成本低。使用子带编码技术的编译码器已开始用于话音存储转发(voicestore-and-forward)和话音邮件,采用2个子带和ADPCM的编码系统也已由CCITT作为G.722标准向全世界推荐使用。1986年Woods等将子带编码又引入到图像编码,此后子带编码在视频信号压缩领域得到了很大发展。目前,已经研制出采用子带编码技术的具有演播室质量的140MbpsHDTV硬件编解码系统。第44页,课件共103页,创作于2023年2月§
2.2.3
参数编码(参量编码)
与波形编码不同,参量编码又称为声源编码(声码器),是将信源信号提取特征参量,并将其变换成数字代码进行传输。解码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体说,参量编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的可靠性,即保持原语音的语意,但重建信号的波形同原语音信号的波形可能会有相当大的差别。这种编码技术可实现低速率语音编码,比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低,连熟人都不一定能听出讲话人是谁。线性预测编码(LPC)及其它各种改进型都属于参量编码。
第45页,课件共103页,创作于2023年2月声码器声码器(vocoder)不会再生原始波形。这组编码器会提取一组参数,这组参数被送到接收端,用来导出语音产生模形。第46页,课件共103页,创作于2023年2月声码器质量在电话系统中使用声码器,语音质量不够好。
第47页,课件共103页,创作于2023年2月对于语音数据,人们已经找到了较合理的声道模型,声音数据的参数编码方法就是基于声音参数的分析与合成来实现的。声道模型在声音合成等领域也有成功应用。统计表明,语音过程是一个近似的短时随机过程。所谓短时,是指在10-30ms的范围。由于这一性质,使一帧一帧地处理语音信号成为可能,每一帧的信号近似满足同一模型,提取模型参数即可再现信号。这是方法假设的基本前提。实际应用中,每帧取20ms。语音参数编码原理
第48页,课件共103页,创作于2023年2月语音生成机构模型:①声源。声源分三类:元音:由声带的自激振动所产生;摩擦音:靠声道变窄时气流所产生的喘流噪声产生;爆破音:由闭合的声道急速打开时形成的脉冲波所产生的喘流噪声所产生。模型中用基音周期参数描述声源。②共鸣机构,也称声道。由鼻腔、口腔与舌头组成。模型中用共振峰参数描述。③放射机构:由嘴唇和鼻孔组成,其功能是发出声音并传播出去。模型中用语音谱和声强参数描述。常用语音参数
-基音周期、共振峰、语音谱、声强等。第49页,课件共103页,创作于2023年2月①分帧:声音变为帧序列f1,f2,…。②计算每一帧fi的参数向量(基音周期,共振峰,语音谱,声强)i。
③直接传送参数向量或对参数向量进行矢量量化。语音参数编码过程:
第50页,课件共103页,创作于2023年2月LPC线性预测编码(LPC)用来获取一时变数字滤波器的参数。这个滤波器用来模拟说话人的声道输出。
由图一中所示,声音的产生被模拟成声源和声道两个部分构成。声源为噪声和脉冲两种,声道相当于一个滤波器,气管口腔形状不同相当于声道滤波器的参数不同,最后就生成不同声音。
第51页,课件共103页,创作于2023年2月参数编码小结参数编码数据量小,但计算量很大。由于声音从发声模型出发,不是从波形出发仿真,保真难度大,目前的保真度还很差。例如,某人说了一句话,分析出参数再由参数合成的声音,能听出这段话的字句就合格了,听起来不是机器语言,即自然度好一些已相当不错了,要能听出谁在说话就不容易。由于压缩比高,成本低,很多低档的学习机就是采用了这种语音压缩方式,出来的声音生硬、含混不清、毫无语感,对英语的语音学习不但毫无帮助,而且会误导正确的语音学习。第52页,课件共103页,创作于2023年2月§2.2.4混合型编码
混合编码则是在波形编码和参数编码的基础上,以相对较低的比特率上获得较高的语音质量,所以其数据率和音质介于二者之间。
当波形编码的比特率每声道低于16kbps后,音质下降很快。而参数法由于机理本身就是一种模拟,比特率上升到10kbps以上后再上升音质也没有多少改善。所以,两者结合的混合编码法就被消费类电子公司开发出来。
第53页,课件共103页,创作于2023年2月发展与应用计算机的发展为语音编码技术的研究提供了强有力的工具,大规模、超大规模集成电路的出现,则为语音编码的实现提供了基础。80年代以来,语音编码技术有了实质性的进展,产生了新一代的编码算法,这就是混合编码。它将波形编码的高质量和参量编码的低数据速率组合起来,克服了原有波形编码和参量编码的弱点,结合各自的长处,力图保持波形编码的高质量和参量编码的低速率,在4-16Kbit/s速率上能够得到高质量的合成语音。目前较为成功的混合型编码方案有多脉冲激励线性预测编码(MPLPC)和码激励线性预测编码(CELP)。很显然,混合编码是适合于数字移动通信的语音编码技术。
第54页,课件共103页,创作于2023年2月LDCELP低时延码激励线性预测编码是LowDelay-CodeExcitedLinearPrediction的缩写。16kbit/sLDCELP是CCITTG.728语音编码标准算法,这种法在CELP算法的基础上,采用后向自适应线性预测、50阶合成滤波、短激励矢量(5个样值)等改进方法,从而达到高质量和低时延的目的,总的编码时延小于2ms。第55页,课件共103页,创作于2023年2月RPE/LTP规则脉冲激励—长时预测—线性预测编码是RegularPulseExcited-LongTermPredition-LinearPredictiveCoding的缩写。这种算法是MPE-LPC的改进算法,除了增加长时预测功能外,激励脉冲的位置具有一定的规律。这种算法是欧洲900MHz数字蜂窝移动电话的语音编码标准(GSM),也为数字蜂窝系统DCS1800所采用。
MPE-LPC(多脉冲线性预测编码)
多脉冲线性预测编码是Multi-PulseExcitedLPC的缩写。这种算法在一帧语音中选择几十个典型脉冲作为激励信号。INMARSAT的9.6kbit/s语音编码航空标准采用这种算法。第56页,课件共103页,创作于2023年2月VSELPVSELP(矢量和激励线性预测编码)
矢量和激励线性预测编码是VectorSumExcitedLinearPrediction的缩写。这种算法采用三个码本作为激励信号,其中两个是随机码本,一个是自适应码本,最终的激励信号是三个激励矢量的和。美国电信工业协会(TIA)选择8kbit/sVSELP算法作为北美第一代数字蜂窝移动电话的编码标准(IS54)。日本的全速率数字移动电话也采用VSELP算法作为语音编码标准(JDC),速率为6.7kbit/s。第57页,课件共103页,创作于2023年2月§2.2.5各种音频信号编码方法的比较编码方法传输速率(kb/s)最小基带带宽(kHz)质量PCMADPCMSBC+ADPCM△MSBC(子带)RPE/LTP(规则脉冲激励)LD-CELP(低延迟码激励)MPE/LPC(多脉冲)CELP(码本激励)LPC(线性预测)LPC+VQ(矢量量化)6432643216161684.82.41.23216321688842.41.20.6长途电话质量长途电话质量广播质量通信质量通信质量通信质量接近长途质量通信质量通信质量合成质量合成质量第58页,课件共103页,创作于2023年2月电话质量的音频(0.3--3.4K
kHz
)G728,LD-CELP16kb/s,GSM,RPE/LTP,13kb/s,(欧洲移动)GTIA,VSELP,8kb/s(美国移动)NSA,CELP,4.8kb/sNSA,LPC,2.4kb/s第59页,课件共103页,创作于2023年2月调幅广播质量的音频50Hz-7kHz
采样率16KHz
,14bit量化,PCM码率224Kb/s,采用G.722(子带)标准可压缩到64Kb/s,适于ISDN的B信道,传输高质量语音。第60页,课件共103页,创作于2023年2月高保真立体声音频压缩标准即CD音质音频20Hz--20KHz采样率44.1kHz,,16位量化,立体声数据量为
44.1*16b*2=1411.2kb/s=176.4KB/s1小时为
176.4KB/s*3600s=635MB
目前,采用MPEG音频标准,有三层(第三层MP3),采用子带及熵编码技术,可压缩到每声道32kb/s-448kb/s第61页,课件共103页,创作于2023年2月MP3及其基本原理
MP3就是采用国际标准MPEG中的第三层音频压缩模式,对声音信号进行压缩的一种格式,中文也称"电脑网络音乐"。MPEG中的第三层音频压缩模式比第一层和第二层编码要复杂得多,但音质最高,可与CD音质相比。第62页,课件共103页,创作于2023年2月多媒体视听业务音频
ITU关于电视电话系统和终端设备的技术标准针H.320用于ISDN网,不适合窄带电话网,而H.324既适合高速数字网,也适合在普通电话之类的窄带网上使用,H.323标准用于质量不能保证的局域网LAN在H.320中,语音编码标准为G.711(64kb/s
)、G.722(64kb/s
)、G.728(16kb/s
),H.324分配给语音带宽6.5kb/s
(高——采用MP-MLQCELP)和5.3K(低——采用ACELP),采用的语音压缩标准为G.723H.323系统语音压缩方法有6种,即G.711(64kb/s
)、G.722(64kb/s
)、G.728(16kb/s
)、G.723、G.729、MPEGAUDIO
第63页,课件共103页,创作于2023年2月§2.2.6现代语音处理技术及应用第64页,课件共103页,创作于2023年2月§2.3图像信号的压缩图像信号压缩的必要性图像信号压缩基础图像压缩编码方法图像压缩编码标准第65页,课件共103页,创作于2023年2月§2.3.1图像信号压缩的必要性与文字信息不同,图像信息占据大量的存储容量,而且传输的带宽有限例1:一张A4(210mm×297mm)大小的照片,若用中等分辨率(300dpi)的扫描仪按真彩色扫描,其数据量为多少?(注:dpi表示每英寸像素,1英寸=25.4mm)若按每像素3个字节计算,上述结果为约26M例2:目前的WWW互联网包含大量的图像信息,如果图像信息的数据量太大,会使本来就已经非常紧张的网络带宽变得更加不堪重负(WorldWideWeb变成了WorldWideWait)第66页,课件共103页,创作于2023年2月图像信号压缩的必要性(续)视频数据量:对于电视画面的分辨率640*480的彩色图像,每秒30帧,则一秒钟的数据量为:640*480*24*30=221.12Mbit/s=28MB/s实时传输:在10M带宽网上实时传输的话,需要压缩到原来数据量的0.045存储:1张CD可存640MB,如果不进行压缩,1张CD则仅可以存放20几秒的数据可见,单纯依靠增加存储器容量和改善信道带宽无法满足需求,必须进行压缩第67页,课件共103页,创作于2023年2月§2.3.2图像压缩编码基础 图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。第68页,课件共103页,创作于2023年2月(1)空间冗余
在一幅图像中规则的物体和规则的背景具有很强的相关性。
(2)时间冗余
电视图像序列中相邻两幅图像之间有较大的相关性。(3)结构冗余和知识冗余
图像从大面积上看常存在有纹理结构,称之为结构冗余。(4)视觉冗余
人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。1.图像数据的冗余度第69页,课件共103页,创作于2023年2月(1)亮度辨别阈值
当景物的亮度在背景亮度基础上增加很少时,人眼是辨别不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。人眼刚刚能察觉的亮度变化值称为亮度辨别阈值。2.人眼的视觉特性第70页,课件共103页,创作于2023年2月(2)视觉阈值 视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个统计值。(3)空间分辨力 空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。(4)掩盖效应
“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像信号变化的剧烈程度有关。第71页,课件共103页,创作于2023年2月图像压缩的可能性与基本思想各种冗余和视觉特性就是压缩图象数据的出发点和依据。图象编码的目的就在于采用各种方法去除冗余和不太重要的部分内容,以尽量少的数据量来表示个重建图象。压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,
它是使数字信号走上实用化的关键技术之一。第72页,课件共103页,创作于2023年2月§2.3.3图像压缩的方法图像压缩方法有很多种,而且很多方法还在不断地发展和完善。从不同的角度出发有不同的分类方法。1.根据解压重建后的图像与原始图像是否有误差,可分为无损压缩与有损压缩两大类;第73页,课件共103页,创作于2023年2月图像压缩的方法(续)2.根据实施编码所在的数据域可分为空间域和变换域编码第74页,课件共103页,创作于2023年2月(1)基于图像信源统计特性的压缩方法,有预测编码、变换编码、矢量量化编码、子带-小波编码和神经网络编码法等。(2)基于人眼视觉特性的压缩方法,有基于方向滤波的图像编码法和基于图像轮廓-纹理的编码法等。(3)基于图像景物特征的压缩方法,有分形编码法和基于模型的编码方法等。3.根据压缩机理的不同,数据压缩编码方法大致可以分成三类第75页,课件共103页,创作于2023年2月图像压缩的方法图像压缩有损压缩无损压缩行程编码LZW编码哈夫曼编码算术编码无损预测编码位平面编码有损预测编码分形编码模型编码子带编码神经网络编码变换编码K-L变换Haar变换Walsh.Hadamard变换离散余弦变换离散傅立叶变换斜变换小波变换第76页,课件共103页,创作于2023年2月衡量一个压缩编码方法优劣的重要指标
(1)压缩比要高,有几倍、几十倍,也有几百乃至几千倍;
(2)压缩与解压缩要快,算法要简单,硬件实现容易;
(3)解压缩的图像质量要好。
需要说明的是选用编码方法时一定要考虑图像信源本身的统计特征;多媒体系统(硬件和软件产品)的适应能力;应用环境以及技术标准。第77页,课件共103页,创作于2023年2月几种典型的图像压缩方法原理霍夫曼(Huffman)编码游程编码预测编码变换编码混合编码第78页,课件共103页,创作于2023年2月
1.霍夫曼(Huffman)编码霍夫曼(Huffman)编码是一种可变长编码,编码方法如下图所示。
(1)将输入信号符号以出现概率由大至小为序排成一列。
(2)将两处最小概率的符号相加合成为一个新概率,再按出现概率的大小排序。
(3)重复步骤(2),直至最终只剩两个概率。
(4)编码从最后一步出发逐步向前进行,概率大的符号赋予“0”码,另一个概率赋予“1”码,直至到达最初的概率排列为止。第79页,课件共103页,创作于2023年2月霍夫曼(Huffman)编码将最常出现(概率大的)的符号用最短的编码,最少出现的符号用最长的编码。第80页,课件共103页,创作于2023年2月游程编码(RLC,RunLengthCoding)是一种十分简单的压缩方法,它将数据流中连续出现的字符用单一的记号来表示。例如,字符串5310000000000110000000012000000000000可以压缩为5310-10110-08120-12,其中,“-”后面两个数字是“-”前面数字的连续个数。游程编码的压缩率不高,但编码、解码的速度快,仍被得到广泛的应用,特别是在变换编码后再进行游程编码,有很好的效果。
2.游程编码第81页,课件共103页,创作于2023年2月3.预测编码(1)预测编码基本原理 预测编码是根据某一模型利用过去的样值对当前样值进行预测,然后将当前样值的实际值与预测值相减得到一个误差值,只对这一预测误差值进行编码。
-DPCM第82页,课件共103页,创作于2023年2月(2)预测方法1).帧内预测 帧内预测利用图像信号的空间相关性来压缩图像的空间冗余,根据前面已经传送的同一帧内的像素来预测当前像素。2).帧间预测 电视图像在相邻帧之间存在很强的相关性。3.预测编码(续)第83页,课件共103页,创作于2023年2月图像变换编码是将空间域里描述的图像,经过某种变换(如傅立叶变换、离散余弦变换、沃尔什变换等)在变换域中进行描述。这样可以将图像能量在空间域的分散分布变为在变换域的相对集中分布,便于用“Z”(zig-zag)字形扫描、自适应量化、变长编码等进一步处理,完成对图像信息的有效压缩。4.变换编码第84页,课件共103页,创作于2023年2月变换编码将被处理数据按照某种变换规则映射到另一个域中去处理,图像编码采用二维正交变换的方式,若将整个图像作为一个二维矩阵,变换编码的计算量太大。所以将一幅图像分成一个个小图像块,通常是8×8或16×16小方块,每个图像块可以看成为一个二维数据矩阵,变换编码以这些小图像块为单位进行,变换编码把统计上密切相关的像素构成的矩阵通过线性正交变换,变成统计上较为相互独立,甚至完全独立的变换系数所构成的矩阵。第85页,课件共103页,创作于2023年2月在常用的正交变换中,DCT(DiscreteCosineTransform)变换的性能接近最佳,是一种准最佳变换。DCT变换矩阵与图像内容无关,是因为它构造成对称的数据序列,避免了子图像轮廓处的跳跃和不连续现象。DCT变换也有快速算法(FDCT),在图像编码的应用中,大都采用二维DCT变换。典型的变换编码方法-离散余弦变换(DCT)
第86页,课件共103页,创作于2023年2月图像块的DCT变换(a)背景部分图像块的DCT;(b)细节部分图像块的DCT第87页,课件共103页,创作于2023年2月Z字形扫描第88页,课件共103页,创作于2023年2月混合编码是近年来广泛采用的方法,这种方法充分利用各种单一压缩方法的长处,以期在压缩比和效率之间取得最佳的平衡。如广泛流行的JPEG和MPEG压缩方法都是典型的混合编码方案。
5.混合编码第89页,课件共103页,创作于2023年2月§2.3.4图像压缩编码标准制定图像标准的国际组织是ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)静止图像:JPEG(JointPhotographicExpertGroup,联合图像专家组)通常为有损压缩(采用DCT变换编码),JPEG是目前静态图像压缩比最高的,但失真的程度非常小也支持无损压缩(采用预测编码),但压缩比降低(无损压缩的压缩比总有个极限)运动图像:MPEG(MovingPictureExpertGroup,运动图像专家组)第90页,课件共103页,创作于2023年2月1.JPEG压缩流程编码流程:解码流程:量化器DCT变换构造8x8的子图输入图像符号编码器压缩数据量化表码表压缩数据符号解码器DCT逆变换反量化器量化表输出图像码表(从压缩数据中得到)第91页,课件共103页,创作于2023年2月颜色空间转换JPEG使用的颜色空间不是RGB空间,而是YCbCr空间,在进行DCT变换之前完成,这是因为人眼对亮度信息更敏感,相互之间的转换为:R=Y+1.40200(Cr–128)G=Y–0.34414(Cb–128)–0.71414(Cr–128)B=Y+1.77200(Cb–128)Y=0.299R+0.5870G+0.1140BCb=–0.1787R–0.3313G+0.5000B+128Cr=0.5000R–0.4187G–0.0813B+128第92页,课件共103页,创作于2023年2月量化Y为亮度分量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业采购培训课件
- 佳能考试题目及答案
- 爱国语言教育体系构建
- 基层党务考试题及答案
- 安全教育开学第一课
- 酒店遗留物品培训
- 平衡的爱:二胎教育
- 红色简约竞聘述职汇报
- A1学情分析培训总结
- 初中思政培训
- 优秀物业管理项目评选方案
- 贵州大方富民村镇银行股份有限公司(筹)招聘上岸提分题库3套【500题带答案含详解】
- GB/T 5470-2008塑料冲击法脆化温度的测定
- GB/T 40998-2021变性淀粉中羟丙基含量的测定分光光度法
- 图书管理系统毕业论文参考文献精选,参考文献
- 中国当代旧体诗选读幻灯片
- 吉林省全省市县乡镇卫生院街道社区卫生服务中心基本公共卫生服务医疗机构信息名单目录995家
- 倔强的小红军-精讲版课件
- 信息隐藏与数字水印课件(全)全书教学教程完整版电子教案最全幻灯片
- 公开招聘社区居委专职工作人员考试笔试、面试题集及相关知识(11套试题含答案)
- 中职数学基础模块下册《等差数列》ppt说课稿
评论
0/150
提交评论