




已阅读5页,还剩108页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章 声音广播基础知识,学习指导,本章重点: 2.1 声音基础知识,2.1.3分贝的概念 2.2传声器和扬声器 2.3立体声原理本章难点: 2.1.3 分贝的概念 2.3 立体声原理选学内容: 2.4 数字音频信号的压缩编码,2.1 声音基础知识,2.1.1声音的产生和传播(P9),声音:物体振动产生的声波通过介质对人耳产生的感觉。声波通过听觉器官所产生的印象。声音的产生:粒子波动运动的结果,由物体机械振动或气流扰动引起弹性媒质发生波动产生。声音的传播:必须通过空气或其它的媒质形成声波进行传播。自然状态下的传播:,描述声波的基本参量(P10),声波的频率:空气密度和压力每秒钟变化的次数,常用符号f 表示,单位是赫兹(Hz)。声波的周期:一个声波完成一次振动所需要的时间,用符号T表示,单位为秒(s)。声波的波长:声波在一个周期的时间内传播的距离,用符号表示,单位通常为米(m)。声波的传播速度:声波每秒内传播的距离,用符号 表示,单位为米/秒(m/s)。波长、声速 及频率 之间的关系为:,3、声波的传播特性(P11),1、声源的方向性:取决于声波波长与声源的尺寸当辐射出来的声波波长比声源的尺寸大很多倍时,声波比较均匀地向各方向传播;当辐射出来的声波波长小于声源的尺寸时,声波集中地向正前方一个尖锐的圆锥体的范围内传播。2、声波的反射和折射:反射定律:入射角=反射角。(凹面墙-聚集,凸面墙-扩散)折射:声波从一种媒质进入到另一种媒质,其传播方向发生变化的现象。,声波的传播特性(P11),3、声波的衍射和散射: 衍射:声波遇到障碍物时,频率低的声波大部分能绕过障碍物继续向前传播的现象。衍射规律:取决于声波的波长与物体大小之间的关系。对于同一个障碍物,频率较低的声波较易衍射,而频率较高的声波不易发生衍射现象,它具有较强的方向性。 散射:声波无规则衍射的现象。,4、表征声音强弱的三个参量(P12),1、声压:声波引起的交变压强,单位是帕(Pa =1N/m2 )基准声压=210-5 Pa 。2、声功率:声源在单位时间内向外辐射的总声能(声源辐射功率)。单位是瓦(W)。3、声强:穿过垂直于声波传播方向上单位面积内的声功率(声波能流密度),用符号I表示,单位是W/ m2。声强与声压的平方成正比。基准声强(参考声强)=10-12 W/ m2。,2.1.2人耳的听觉(P12),人耳组成部分:外耳中耳内耳听觉的产生:声波外耳道鼓膜产生振动中耳里的听小骨内耳 耳蜗中的淋巴液振动 刺激听觉神经传递给大脑。,2、声音的三要素(P12),1、响度(声音的大小):人耳对声音强弱的主观感觉。主要取决与声强,还与频率有关,也与持续时间有关。可用声压级表示。2、音调(声音频率的高低) :人耳对声音高低的感觉。主要取决于声音频率,还与声压级和持续时间有关。人能听到声音的范围是20Hz20kHz。,2、声音的三要素,3、音色(声音的特色) :人耳对各种频率、各种强度的声波的综合反应。人耳区别具有同样响应和音调的两个声音的主观感觉。与声音的频谱结构有关。,听觉的方向感和灵敏度(P14),3、听觉的方向感:判定声源方位能力。由人双耳听到声音的强度差、时间差和音色差综合判定声源方位。水平方向判断能力高于垂直方向判断能力。4、听觉的灵敏度:人耳对声压、频率和方位细小变化的判断能力。对声压级变化的判断:13dB对频率变化的判断:3Hz以上对方位变化的判断:水平方向高于垂直方向。,分贝概念和常用分贝制,分贝(dB):用于表征声音和电信号量值和增减程度的计算单位。采用分贝制理由:符合听觉特性便于计算将乘除运算转化为加减运算;将较大不便的数值表示范围转化为简明的表示。,一、对数函数(P16) 2.1.3,定义:y = Log a x (底a0) 指数函数:x = a y x:真值,y: x以a为底的对数曲线:特点:经(1,0)点渐近线为x = 0(纵轴)零和负数无对数 底a大于零,对数运算公式,公式:Log a 1 = 0 , Log a (xy) = Log a x + Log a y Log a a = 1 , Log a (x/y) = Log a x -Log a y Log a x r = r Log a x , Log a x(1/ r) =(1 /r) Log a x换底公式: Log a x = (Log b x )/(Log b a ), Log b a Log a b = 1,二、电平(Level),定义:某点功率P1与选定基准功率P0之比的对数关系,通常用分贝(或奈培)表示。性质:它是描述功率的物理量。 P1(dB) = 10lg(P1/P0) dB由于选定基准功率P0的不同,从而也就有不同的分贝制。同一电平(功率)也就有可以有不同的表示方式。,三、相对电平(增益/衰减) dB,含义:用分贝表示两个电平的相对大小。计算: AdB= 10lg(P2/P1) = 10lgP2- 10lgP1 = P2 dB - P1 dB =10lg(U22/z2) / (U12/z1) = 20lg (U2/U1)+ 10lg(z1 / z2)当z2 = z1时, AdB= 20 lg (U2/U1)dB 放大器AdB0,衰减器AdB 0, 保持器AdB=0,四、基本运算法则,乘积的对数等于各乘数对数之和 (xy) dB = x dB+ y dB商的对数等于被除数对数与除数对数之差 (x/y) dB = x dB - y dB倒数的对数等于原数对数的负值 (1/x) dB = - x dB乘幂的对数等于幂次与原数对数的积 (xn) dB = n x dB方根的对数等于原数对数与开方次数商 (x1/n) dB = (1/n) xdB,五、常用的分贝制(绝对电平),由于采用不同的基准电平P0,形成不同的分贝制分贝瓦 dBW P 0=1W 0dBW 分贝毫瓦dBm P 0 =1mW 0dBm 分贝毫伏dBmV P 0 =(1mV)2 /75=0.0133W0 dBmV 分贝微伏dBV P 0 =(1V)2 /75=0.0133pW0 dBV 分贝音频单位dBu P 0 =(0.775V)2 /600=1 mW 0dBu,功率电平:Pm=10lg P/Po dBm( dBmw ) dBm表示以一毫瓦为基准的功率电平的分贝值 参考功率:Po=1mw=0 dBm 例如:功率为1W时,电平为0dBm; 功率为 100W时,电平为20dB零电平参考值:规定600欧姆电阻上1mw功率的电压值或电流为零电平参考值。 Uo= PR= 0.001*600=0.775V Io P/R= 0.001/600=1.29A电压电平(苏联):Pv=20lg U/Uo dB电压电平功率电平换算: PmPv+ 10lg (600/Z)dBm Z为负载。前式带入可以求证,五、常用的分贝制(绝对电平)dBmw,dBm,dBmv,dBuv,dBmv:若以1mV作为基准电压,则电压为U时对应的电平为20lg(U/1mV),单位记为dBmV(分贝毫伏)。dBv:若以1uV为基准电压,则电压为U时对应的电平为20lg(U/1uV),单位记为dBuV(分贝微伏)。 在CATV系统中,常常用场强仪来测量绝对电压电平,其读数为dBV,表示在75阻抗上所测得的微伏数相对于75阻抗上的1V(即所谓0dBV的确定量)之比值 。dBv:以Vr=1V为基准电压时所求得的电压电平值,单位为dBv。 目前dBuv通用于广播方面,如调音台的调音设备及电气测试设备及仪表等。dBv比较通用于声学及其它测试仪器。,例如:要把115dBuV化为dBW单位表示 利用表中最后一行第一列数-138.75,即用原来的数加138.75得-23.75,说明115dBV相当于-23.75dBW;。,六、常用分贝制之间的转换关系,0dBW = =10lg(1000/1)= 10lg10 3 = 30 dBm 0dBm = 10lg(10 - 3 /10 - 6 /75 )= 48.75 dBmV0dBmV = 10lg( 10 - 6 /75/ 10 - 12 /75 )= 10lg 10 6 = 60 dBV,七、阻抗不同时的换算关系,采用不同的阻抗,应考虑阻抗修正因子10lg(z1 / z2)。基本规律:由高阻抗折算成低阻抗,电平修正因子为正,应加上修正值。 如阻抗由75折算成50时,修正因子为10lg(75/50)=1.76 dB 如阻抗由600折算成75时,修正因子为10lg(600/ 75)=9 dB由低阻抗折算成高阻抗,电平修正因子为负,应减去修正值。如阻抗由50折算成75时,修正因子为10lg(50 / 75)= -1.76 dB 如阻抗由75 折算成600 时,修正因子为10lg(75 / 600)= -9 dB,八、分贝的速算,分贝的推算,10lg(2) = 3 dB10lg(4) = 10lg(2 2) =2 10lg(2) = 2 3=6 dB10lg(8) = 10lg(2 3) =3 10lg(2) =3 3=9 dB10lg(5) = 10lg(10/2)= 10lg10- 10lg(2) =10- 3 =7 dB10lg(3) = 10lg(811/4)= 10lg(801/4)=(1/4) 10lg80= (1/4) 10lg(8) + 10lg(10)=19/4= 4.75 dB10lg(6) = 10lg(2) + 10lg(3) = 3 + 4.75 =7 .75 dB10lg(9) = 10lg(3 2) =2 10lg(3) = 2 4.75 = 9.5 dB10lg(7) = 10lg (491/2)= (1/2) 10lg(50)= (1/2) 10lg(100/2)= (1/2) 20-2=17/2=8.5 dB,3、声音信号的分贝值(P17),1、声压级:参考声压Pr210-5(Pa),相当于一般具有正常听力的年轻人刚刚能够觉察到1000Hz的声音存在时的声音大小。声压级=20lgP/Pr (dBPa)2、声强级:参考声强Ir 10-12 (dBW/ m2)声强级=10lgI/Ir(dBW/ m2),分贝计算举例(由分贝求真值),例1,若某点的噪声为80dBW/ m2,则意味着该点的声压为0.2Pa,声强为10-4 W/ m2 。 (运算过程见P18)例2,某功率放大器的放大倍数为20dB,则意味着该放大器的功率放大倍数为100倍。10lgKp=20,lgKp=2,Kp= 100例3,设电路上某点的电压电平级为20dBm,则意味着该点的电压为7.75V。20lg(U/0.775)=20, U/0.775=10, U =7.75V,2.2传声器和扬声器,2.2.1传声器(话筒、麦克风)(P18),作用:将声音振动转变为相应的电流变化的换能器件。种类:根据接收声波的原理:声压式和压差式。按照能量转换方式:动圈式,电容式,压电式等。根据指向特性:无指向性传声器,双指向性传声器和单指向性传声器等。使用最广泛的传声器:动圈传声器和电容传声器。驻极体静电传声器由于使用方便而成为电容传声器中使用最广的一种。,传声器的基本工作原理,两个过程:(1)感应外界的声波并将其转换成相应的机械振动,(2)再将机械振动转换成相应的电信号。两个部分:声波接收器力/电换能器(机械能电能转换)。,动圈传声器的结构部件(P19),主要三个部件的作用1、永久磁铁:形成由N极向S极的辐射状均匀磁场。2、振膜:检取外界的声波振动,并将其传递给音圈。3、音圈:在磁场的作用下,将机械能转换成电能。,动圈传声器(P19),结构:主要由永久磁铁、软铁、音圈和振膜等部分组成。工作原理( 演示 )电磁感应:运动导体切割磁力线产生感应电动势,在闭合电路中产生感应电流。过程:1、磁铁产生磁场,2、声波使振膜振动,3、振膜将带动音圈切割磁力线,4、音圈中产生出和声音变化相应的变化电流。使用场合:语言广播和扩声,电容传声器的结构(P19),结构:主要由电容、直流电源和负载电阻构成。一个极板:用作检取声波的振膜,用导线固定在传声器上。另一个极板:直接固定在传声器上。电容、直流电源和负载电阻构成了一个电流回路。电容的两个极板相距2050,形成50200pF的电容。,电容传声器(P19),工作原理: ( 演示 )电容器的电容量与极板间离成反比。电容两端充满电荷,声波使金属膜片发生振动,改变极板间距,电容量发生变化,输出电压变化。分类:早期:外加直流极化的静电换能式现在:自极化的驻极体式使用场合:广播电台、电视台、电影制片厂、厅堂扩声和电声测量。,其它传声器( P 21自学),铝带传声器:铝带切割磁力线。复合传声器:采用不同力/电换能器所产生的电信号进行电路合成以达到复合效果。新型传声器无线传声器:调频方式立体声传声器:由两只符合要求的传声器组装而成超指向性传声器:增加聚集部件,2、传声器技术指标(P22),灵敏度:声压为1Pa时传声器所输出的电功率。反映声能/电能转换效率。单位V /Pa或mV /Pa。频率响应:传声器输出信号大小与频率的关系,用给定频率范围内不均匀性描述,通常用灵敏度与频率的关系描述。指向特性:灵敏度随声波入射方向变化的特性,声波以某角入射时传声器的灵敏度与轴向入射时灵敏度的比值。可用指向性图、指向性因数或指向性函数描述。固有噪声:没有声波作用于传声器时,输出端所出现的电压,通常用等效噪声级描述。,传声器的指向性图(P23),传声器的指向特性:灵敏度随声波入射角的改变而变化的特性。指向性函数:声波以角入射时传声器的灵敏度与轴向入射时灵敏度的比值,描述:指向性图。,常见的指向性特性和特点(P23),1、无指向性(全指向性,传声器在所有方向上的灵敏度相同)。2、双指向性(8字形,传声器在相对的两个方向上有较高的灵敏度,而在与之垂直的方向上灵敏度为零)。3、单指向性(心形,传声器只在一个主方向上有较高的灵敏度,而在与之相反的方向上灵敏度接近于零)4、强指向性(超指向性,传声器在一个很窄的范围内有很高的灵敏度,而在其它方向上则灵敏度接近于零),3、传声器的使用(P23),指向性选择开关:实现指向特性的变换功能,高档传声器中才有。音质选择开关:改变输出端跨接电感、电容以改变传声器频率特性;M档是音乐,V档是拾音。电平衰减开关:对输入电平进行必要的衰减。防止在强声级时的音质失真或传声器损坏。阻抗变换开关:使传声器输出阻抗与后级的输入阻抗匹配。防风罩的使用:防风、防潮、防尘、防干扰。,2.2.2扬声器(P24),作用:将按声音变化的电信号转换为声音信号的换能器件(电能/声能换能器件)。种类:电动式、压电式、舌簧式等。电动式扬声器可分为纸盆扬声器、球顶形扬声器和号筒形扬声器。,纸盆扬声器(P25),组成:磁铁、软铁、音圈、纸盆和固定装置。 工作原理: ( 演示 )磁铁产生磁场,音圈中通入按声音变化的电流,音圈在电磁力的作用下产生振动,带动纸盆一起振动。纸盆将振动通过空气传播出去,产生声音。,其它扬声器(P27),球顶形扬声器:一种在高保真立体声系统中广泛采用的扬声器,一般用来放中、高音。 铝带式扬声器 :一种理想的高音发声单元。平膜扬声器 :高频响应非常平滑,而且可以展宽至40kHz以上。静电扬声器 :高频响应可达20kHz,并且具有良好的瞬态响应。新型扬声器 :空气变换式扬声器 、磁流体扬声器 、气流式扬声器。,2、扬声器的技术参数(P28),共有五项:1、频率响应:在规定的音频电压作用下,扬声器轴向一定距离处的辐射声压级随频率变化的特性。2、灵敏度:扬声器轴向1米处的声压级和输入电压之比。3、辐射特性:描述扬声器向各方向辐射声能的不均匀程度的特性。,2、扬声器的技术参数(P28),4、失真:失真包括非线性失真,互调失真,以及瞬态失真等。非线性失真:机械振动产生的声波波形并不与驱动它的电信号波形完全一致,不成线性关系。互调失真:指扬声器在同时放送复合频率信号时,输出信号中除了出现所加信号的频率外,还会出现一些新的频率分量而形成的失真。瞬态失真:指由于振动系统的惯性使扬声器发声时跟不上信号快速变化而造成的失真。5、功率和效率:额定功率:允许输入扬声器中的最大电功率。最大瞬时功率:保持非线性失真在允许范围内时输入扬声器中的最大电功率。输出声功率:额定功率下,扬声器在规定重放频率范围内所辐射的声功率。效率:输出声功率与输入电功率的比值。,3、扬声器箱(音箱)P29,扬声器箱(音箱)敞开式音箱封闭式音箱倒相式音箱组合音箱立体声耳机电动式静电式,2.3立体声原理,立体声的概念(P31),立体声:具有层次分明、具有立体感(方位感和深度感)的声音效果 。立体声系统: 由两个或两个以上的传声器、传输通路和扬声器(或耳机)组成的系统,经过适当安排,能使听者有声源在空间分布的感觉。单声道系统:只由一只传声器拾音(或由几只传声器拾音后混合在一起),经一个传输通路传输后,由一只扬声器或由一组扬声器重放出来的系统。,2.3.1双耳听觉特性(P31),辨别声源的两个物理因素: ( 演示 )1、声音到达左右耳的时间差(或相位差);2、声音到达左右耳的声级差(或强度差)。人耳辨别声音纵深感原因:主要是直达声与连续反射声的声能之比不同。立体声广播中实际立体声效果实现方式: 使用声级差(强度差)方式实现,便于和单声道系统兼容。 没有使用时间差方式,因为它不便于和单声道系统兼容。,2.3.2立体声的五种拾音方式(P33),拾音技术:指如何用传声器拾取声音信号,包括传声器的选择、摆放等。立体声拾音特点:立体声广播要求有声源方位感觉,拾音时要分别得到左、右两路信号。双声道立体声拾音方式:主要有仿真头方式、A-B方式、X-Y方式、仿真头方式和多声道拾音方式等。,1、 A-B方式,拾音方法:用两个型号、性能完全相同的传声器并排放置于声源的前方,左、右两传声器拾音后分别将信号送至左右两个声道。话筒距离:两传声器相距过近,拾得的立体声效果不明显,两传声器相距过远,中间声源的信号将很弱,出现中间空洞和中间凹陷现象。通常两传声器相距15cm30cm。使用场合:一般用在要求不高的场合,作为混 响声传声器。,2、X-Y方式,方法: ( 演示 )用两只指向特性完全一致的传声器,使其成一定的角度一上一下紧靠排列,主轴向左的传声器X输出的信号送入左声道;主轴向右的传声器Y输出的信号送入右声道。特点:各个方向的声源传到两传声器的直达声几乎不存在时间差,而只有声强差。两个传声器中部的声音经拾音后在左右两个声道中有相同的大小,因此放音时产生的声像也位于两个扬声器的中部。要求:两个传声器必须是同类型且特性一致;为了避免两个信号的时间差并提高拾音质量,通常将两个传声器安装在一个壳体内,构成重合传声器。,3、M-S(和差)方式,方法:将横放的双指向性传声器与任意指向性传声器成主轴夹角90度一上一下紧靠排列。任意指向性传声器拾取为和信号M,双指向性传声器拾取为差信号S。将和信号M和用差信号S经加减矩阵电路转换成左声道L和右声道R。分别送入左声道和右声道。特点:和信号M可直接用作单声道,有较好的兼容性。组合产生的左、右声道信号比X-Y方式更精确。要求:两个传声器的幅频、相频特性要一致。通常将两个传声器安装在一个壳体内,构成组合传声器。,4、仿真头方式,方法:用塑料或木材仿照人头形状做成仿真头,在左右耳道末端分别装上一个全向型电容传声器。拾音时将仿真头放置于现场,两个传声器的输出分别作为左、右声道的信号。特点:立体声系统临场感强,较为真实,但必须用高保真立体声耳机收听,经双扬声器系统放音效果很差。,5、多声道拾音方式,方法:将大型演播室分隔成小房间,乐器组分别在自己的小房间中演奏,并由各自的传声器拾音上传,经控制、放大后记录在对应的磁迹上。后期加工时,各条磁迹声音分别进行必要延时,也可加入人工混响或频响补偿。最后通过声像移动器分配到左声道L和右声道R。将和信号M和用差信号S经加减矩阵电路转换成左声道L和右声道R。分别送入左声道和右声道。优点:乐器组互不干扰,录音层次分时。录音安排灵活,可先后录音,然后合成。对乐器组录音处理更细致和理想。便于修正演奏或演唱中的失误。便于实现一名演员多重唱和一名演奏员多乐器演奏。,2.3.3立体声的听声(P36),听声要求:房间面积大于12m2,两个扬声器相距2.5m,听声者处于垂直平分线上,距两个扬声器2.5m。 (等腰三角形)双声道听声系统:声级差大5dB,声像偏移11度;大10dB,声像偏移19度;大15dB,声像则定位于单个扬声器。声级相同,先发声1mS,声像向先发声扬声器偏移11度;先发声2mS,声像向先发声扬声器偏移19度;先发声3mS,声像则定位于单个扬声器。立体声效果的实现:所有立体声广播、立体声录音带和立体声唱片都是利用两个扬声器的声级差产生的声像分布实现立体声效果。利用声级差的方法有利于立体声和单声道之间兼容。,2.4 数字音频技术基础,数字音频技术:指把声音信号数字化,并在数字状态下进行记录、传送、重放以及其它加工处理的一整套技术。,四类信号表示形式,广播电视系统的主要问题,模拟广播电视系统线性失真:同样的放大、同样的延时非线性失真:不产生新的频率成分数字广播电视系统信源编码:解决通信的有效性,“快”;信道编码:解决通信的可靠性,“准”。噪声问题是两者所共有的,2.4.1“模拟”和“数字”的概念(P37),模拟信号:指在时间和幅度上都连续变化的信号。 数字信号:指在时间和幅度上都离散的信号。信号处理:指用特定系统对含有信息的信号进行处理(变换),以获得人们所希望的信号,从而达到提取信息、便于利用的目的。信号处理的内容:包括滤波、变换、检测、谱分析、估计、压缩、识别等一系列的加工处理。,数字信号处理的优点(P38),1、精度高2、灵活性高3、可靠性强4、易于大规模集成5、可实现时分复用6、可实现二维与多维信号处理,2.4.2模拟信号数字化(P38),模/数转换(脉码调制PCM)过程1、取样(Sample): ( 演示 )将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,使其成为时间上离散的脉冲序列,也即将信号在时间域离散化。2、量化(Quantization) :在幅度轴上将连续变化的幅度值用有限位的数字表示,也即将信号幅度离散化。3、编码(Coding) :将已量化的信号幅值用二进制数码表示。,连续信号的取样结果,时间上取样造成时间离散化,使连续信号变成脉冲序列(PAM);频谱上取样造成信号频谱的周期延拓。取样之后的频谱相当于原信号频谱以取样频率(fs)为周期所进行的周期延拓。,取样频率要求(P39),对取样频率要求(奈奎斯特取样定理) :要想取样后能够不失真地恢复出原信号,则取样频率必须大于信号最高频率的二倍。 fs2 fm ( 演示 )原因:fm(fs/2),取样后的频谱中,各个周期之间相互不重叠。采用一个截至频率为fs/2的低通滤波器即可将原始信号的频谱恢复出来。fmfs/2,取样后频谱的各个周期之间发生相互重叠(频谱折叠)。无法从取样信号的频谱恢复原信号的频谱。,三个基本数字音频取样频率(P40),结论:要重建原始信号,取样信号频谱中的两个相邻部分不能互相重叠。数字卫星广播:32kHzCD: 44.1kHz演播室: 48kHz,2、量化(P40),量化:在幅度轴上将连续变化的幅度值用有限位的数字表示,也即将幅度离散化。量化之后,连续变化的幅值就被有限个量化等级所取代。 量化比特数:区分所有量化级所用二进制码的位数n。量化比特数(n)与十进制的量化等级数(M)之间的关系:量化比特数= log2量化等级数n = log2M,量化等级数考虑因素(P40),因素:量化比特数越大, 则:(1)量化误差越小。(2)信号数码率就越大。数码率=取样频率(fs)量化比特数(n)(bps,比特/ 秒)存储量=(采样频率量化比特数声道数 )/8(Byte,字节)结论:量化比特数的选取要权衡各方面的因素综合考虑。,脉冲序列的量化,量化噪声(补充),量化误差=量化值-原样值。量化噪声:量化误差在信号上产生杂波干扰。量化信噪比计算公式:单极性的信号(如亮度信号):SNRdB=10.76+6.02n dB双极性的信号(如声音信号):SNRdB=1.76+6.02n dB,3、编码(P40),编码:将已量化的信号幅值用二进制数码表示。PCM系统常用的码型:自然二进制码(NBC):与二进制数一一对应,符合二进制数进位规律,可进行算术运算和比较大小;高位发生误码,产生较大误差。格雷码(RBC) :非权重码,相邻电平变化时,只有一位变化;发生误码时,只有一个阶梯差,影响最小。折叠二进制码(FBC) :沿中心电平上下对称、且适用于表示正负双极性信号,最高位MSB=0,代表正值, MSB=1,代表负值。,编码示意图,2.4.3数字信号处理过程 (P42),数字信号处理系统(P41)(五个组成部分),1、前置低通滤波器:将输入信号中高于某一频率(即取样频率的一半)的频谱分量滤除,以保证取样后不发生频谱重叠。2、模/数(A/D)转换器:对滤波之后的模拟信号进行取样、量化和编码,将模拟信号转换为数字信号。3、数字信号处理器:对数字信号按预定要求进行各种处理,包括滤波、变换、检测、谱分析、估计、压缩、识别等,以便获得人们所希望的信号,4、数/模(D/A)转换器:将处理之后的数字信号转换成模拟信号。5、模拟低通滤波器:滤除信号中不需要的高频分量,平滑成所需的模拟输出信号。,信源编码(Source Encoding),信源编码:解决模拟信号的数字化、降低冗余度和提高数字信号的有效性所进行的编码。主要任务:(1)A/D变换;(2)压缩编码。,信道编码(Channel Encoding),信道编码:提高数字传输可靠性、降低误码率、按一定规则加入冗余码元所进行的编码。主要任务:(1)码型变换;(2)差错控制。,2.4.4数字音频信号的信源编码,必要性:(1)有效地存储数字音频信号,(2)有效地交换数字音频信号,(3)有效地传输数字音频信号。可能性:(1)去除信号中的“冗余”部分,包括在时域和频域都存在的信息冗余度;(2)去除声音中与听觉无关的“不相关”部分,对于人耳感觉不到的不相关部分不编码、不传送。基本概念:数据量=信息量+冗余量=听觉有关信息量+听觉无关信息量+时域冗余量+频域冗余量,信息的冗余度(P43),时域信息冗余度主要表现在幅度非均匀分布,即不同幅度的样值出现的概率不同,小幅度的样值比大幅度样值出现的概率高。尤其在语言和音乐信号的间隙,会有大量的低电平样值出现。频域信息冗余度主要表现在非均匀的长时间功率谱密度。在较长时间间隔内进行统计平均,得到的功率谱密度函数表明,功率谱呈现很大的不平坦性。这说明没有充分利用给定的频带,或者说存在固有的冗余度。功率谱的高频成分能量较低。,声音信号中的“不相关”部分,人耳听觉特性的无关部分或不相关部分因为人耳对信号幅度、频率和时间的分辨能力是有限的,凡是人耳感觉不到的成份,即对人耳辨别声音信号的强度、音调、方位没有贡献的成份。利用人耳听觉的心理声学特性数据压缩对于人耳感觉不到的不相关部分不编码、不传送。掩蔽效应指一种弱信号被另一个强信号所遮盖或淹没而造成听不见或看不见的现象。,数字音频压缩标准(P44)一、MPEG-1音频编码标准,标准编号:ISO/ IEC 11172。标准全名:“信息技术用于数据速率高达大约1.5Mbps的数字存储媒体的电视图像和伴音编码”(Information Technology-Coding of moving pictures and associated audio for digital storage media at up to about 1.5Mbps)。主要目标:压缩的输出速率定义在1.5 Mbit/s以下。应用场合:用于在CD-ROM上存储数字影视和在网络上传输数字影视;激光视盘VCD(352288)。固定速率:视频速率1.5Mbps ,音频速率64kbps、128kbps、192kbps。,MPEG-1音频压缩方案,MPEG专家组在制定音频压缩标准时,征求了14种方案,先保留了4种,最后确定了2种: MUSICAM(Masking Pattern Adapted Universal Subband Integrated Coding And Multiplexing)掩蔽型通用子频带集成编码与频分复用。 ASPEC(Adaptive Spectral Perceptual Entroy Coding)自适应频谱感知熵编码。,三种层次(子系统),层次1为简化的MUSICAM,层次2标准MUSICAM ,层次3ASPEC算法与算法MUSICAM结合,并对层次1、层次2向下兼容的一类算法。,MPEG-1音频压缩算法的压缩比,MUSICAM编码的理论基础,减少冗余:尽量降低声音信号中冗余。丢弃不相关:尽量降低声音信号中不相关(人耳不能感觉到的部分),只对人耳能感觉到的信号进行编码和传输。,MUSICAM技术特征,充分利用了人类听觉的心理声学现象和声音信号统计的内在联系。技术特征:把声音信号的频谱分割为32个子频段(每子频带24kHz/32=750Hz)丢弃子频带内同听阈以下的频谱成分子频带内同听阈以上的频谱成分采用不同的量化比特数(只要量化噪声低于最小同听阈),MUSICAM 编码分类,根据声音信号在各频率范围中的分析和综合方法的不同,MUSICAM 编码分为变换编码和子频段编码。变换编码时,输入时域信号,应用快速算法将其转换为频域信号,所产生的频谱值和相位值经过心理声学模型进行处理之后,以最少的量化进行编码、传输,最后在解码器中扩展,变换为时域信号;子频带编码时,使用多相滤波器组将宽带的声音信号分割成32个子频段,对各个子频段的采样值分别进行数据率降低的编码。,MUSICAM编、解码器原理,MPEG-1音频压缩标准(归纳),1、三种取样频率:32、44.1、48kHz2、数据率:32kbps384kbps3、四种声音模式:单声道、双声道、立体声、联合立体声4、编码算法:(1)MUSICAM掩蔽型通用子频带集成编码与频分复用。(2)ASPEC自适应频谱感知熵编码。5、三个层次:L1(简化MUSICAM,1:4,每声道192kbps)L2(标准MUSICAM,1:8,每声道96128 kbps)L3(MUSICAM与ASPEC结合,1:101:12,每声道6456 kbps)。,二、MPEG-2 音频编码标准,标准编号:ISO/IEC 13818。标准全名:“信息技术活动图像及有关声音信息的通用编码”(Information Technology-Generic Coding of Moving Pictures Associated Audio Information)。 1995年制订,对MPEG-l标准的发展和扩展,用于广播电视的图像压缩和音频编码。基本目标:一般为4Mbps9Mbps、最高达15Mbps的运动图像及其伴音的数字压缩编码。 应用场合:用于数字电视,广泛用于各种速率(2-20Mbps)和各种分辨率的情况,而且可接受隔行扫描的输入信号。DVD(720576)。,MPEG-2音频编码标准(P44),MPEG-2音频编码标准是对 MPEG-l音频编码标准的发展和扩展。发展和扩展两个方面:多声道环绕声编码(5.1声道)和多语言(7种)节目编码;低取样频率(LSF)低比特率编码。,MPEG-2音频压缩编码,MPEG-2音频压缩编码由双声道扩展到多声道,仍然保持三层次,声道数扩展到5.1(或3/2/0.1),即左、中、右三个主声道,加左环和右环两个环绕声道和一个重低音声道0.1。MPEG-2基本的帧格式与MPEG-1码流完全相同。附加的通道,例如中、左环、右环在MPEG-1的附属数据区中传送。利用这些附加通道,能够支持多语言解说声音。 MPEG-2增加了使用较低采样频率(即低于32kHz)的方式,这些方式可在码率预算很有限的情况下应用于解说和电视会议系统(语音)。,MPEG-2音频标准的两个重要部分,第三部分:MPEG-2后向兼容多声道音频编码MPEG-2 BC(MPEG-2 backward compatible multichannel audio coding)标准,与MPEG-1音频压缩编码算法是兼容的;第七部分: MPEG-2非后向兼容多声道音频编码MPEG-2 NBC(Non Backward Compatible) ,也称为MPEG-2高级音频编码 MPEG-2 AAC(MPEG-2 Advanced Audio Coding) 。对于低比特率的多声道编码能提供相当高的声音质量,最高可支持48个声道。,AAC音频编码标准由来,高级音频编码AAC ( Advanced Audio Coding )音频标准是日本高清晰度电视系统ISDB中的音频编码标准。有时也被称为NBC,即后向不兼容编码(Non-Backward Compatible)。按这种编码标准做的音频编码同样具有CD音质,而且占用的存储空间更小。它是MPEG-2的一部分,也是MPEG-4规范的核心 。,AAC音频编码标准特点,AAC是一种高压缩比的音频压缩算法。压缩比远远超过了较老的音频压缩算法,如AC-3、MP3等。AAC和AC-3都是变换编码算法,但AAC使用了分辨率更高的滤波器组,因此它可以达到更高的压缩比。使用了最新技术:临时噪声重整、后向自适应线性预测、联合立体声技术和量化哈夫曼编码等,这些新技术的使用都使压缩比得到进一步的提高。AAC比AC-3更灵活:支持更多种采样频率和比特率、支持1个到48个音轨、支持多达15个低频音轨、具有多种语言的兼容能力、还有多达15个内嵌数据流。更多种采样频率:采样频率从8kHz到96kHz。,AAC的层次,现在已有使用AAC算法编码和解码的样本软件,样本解码器软件的功能比较齐全,可以解码全部三种AAC格式(层次):主要Main(Main)低复杂性LC (Low Complexity)可变取样率SSR(Scaleable Sampling Rate),MPEG-2音频编码标准(归纳),对MPEG-l音频编码标准的发展和扩展:多声道环绕声编码(5.1声道)和多语言(7种)节目编码;低(半)取样频率(LSF:16、22.05、24kHz)低比特率编码。两种音频编码标准:(1)MPEG-2 BC:兼容MPEG-1音频压缩编码算法。应用层次:L1、L2、L3。工作模式:5.1声道环绕声。(2)MPEG-2 NBC/ MPEG-2 AAC:高级音频编码,与MPEG-1不兼容,结合使用多种最新技术,在极低数据率时实现广播级的音频质量。应用层次:主要类型、低复杂度类型、可变化取样频率类型。工作模式:最高48声道。,三、MPEG-4音频编码标准,标准编号:ISO/IEC 14496。标准全名:甚低速率视听编码(Very-low bitrate audio-visual coding)标准性质:遵照基于对象的编码(Object Based Coding)的思想,对多媒体运动图像中AV对象编码、存储、传输和组合而制定的标准。目前已经成为一套工具集。主要目的:提高多媒体业务的交互性。在异构网络环境下能够高度可靠地工作,实现个人通信中的“闻其声”且“见其人”。,MPEG-4音频编码的特点,提供有效、全新的编码算法,支持新的功能(针对不同的应用和信号的具体特点)(1)由内容决定的交互性;(2)通用存取(通过完全不同网络存取);(3)高编码效率。将音频的合成编码与自然声音的合成编码相结合包含对人工合成和自然两种不同声音素材进行压缩编码的多种算法。在自然声音信号压缩方面,MPEG-4支持的数据率为264kb/s。,MPEG-4音频编码的特点,3、支持不同质量要求的信号等级高保真、中等质量音乐、宽带语言、电话质量语言、很低比特率语言、合成音乐、合成语言。支持七种信号等级: (1)HiFi的CD质量(64kbps) (1520kHz);(2) 中等质量(1648kbps) (511kHz);(3)宽带语音(1632kbps) (7kHz);(4)电话语音(48kbps) (3kHz);(5)低比特率语音(2kbps) ;(6)合成音乐(16kbps) ;(7)合成语音。4、增加了通信用途用于各种传输线路和连接方式,可以各种数据率传送信息。提供多媒体系统的交互性和灵活性。,MPEG-4与MPEG-1、2主要区别,重点提供多媒体系统的交互性和灵活性应用方面,优势在于不仅支持自然声音。还支持合成声音,MPEG-4的音频部分将音频的合成编码与自然声音的合成编码相结合。,MPEG-4重要概念,引入音频对象AO (Audio Object),实现基于内容的编码。AO可以是混合声音中的任一种基本音,通过对不同AO的混合和去除,能得到所需要的某种基本音或混合音。支持合成自然混合编码SNHC(SyntheticNatural Hybrid Coding),以算法和工具形式对音频对象进行压缩和控制,如以可分级码率进行回放,通过文字和乐器的描述来合成语音和音乐等。,MPEG-4音频编码标准(归纳),基于内容的编码:引入音频对象,实现基于内容的编码。 三种编码形式:传统的自然音频编码、结构音频缩码和合成/自然混合编码。支持七种信号等级: 码率从2kbps到64kbps 。应用特点:(1)与MPEG-1、2的主要区别:提供多媒体系统的交互性和灵活性,尤其是低比特率的应用。(2)优势:将音频的合成编码与自然声音的合成编码相结合。,MPEG-7标准,标准名称:“多媒体内容接口” (Multimedia Content Description Interface)。主要目的:制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便更快更有效地检索信息。解决信息业高速发展,需提供庞大的图像、声音信息管理和搜素的要求。主要特点:不是一种具体压缩编码方法,而是建立在其它标准基础上的一个用于描述各种不同类型多媒体信息的描述符的标准集合。,MPEG-7标准,适用场合:多媒体对象的存储和编码,主要应用于Internet网页、电子出版业、多媒体教学、电子图书馆、电子商务等。基本方法:通过模式识别、信号处理、音乐心理学等交叉学科枝术,运用计算机系统来识别声音的特征。,4、杜比AC-3音频压缩编码(P46),AC-3:美国HDTV标准(ATSC)中声音系统数据压缩标准。AC-3标准规定的取样频率为48kHz(也支持44.1 kHz和32 kHz),其编码器最多可接收5.1声道的PCM信号,即左(L)、中(C)、右(R)、左环绕(LS)、右环绕(RS)5个全带宽(20Hz20kHz)声道和1个频宽仅为20120Hz的超低音声道(通常称该增强低音效果的声道为0.1声道LFE声道)。编码后数据率可由大约5Mb/s(648kHz18bit
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 母婴店做活动策划方案(3篇)
- 散水坡道修复施工方案(3篇)
- 游园朗诵活动策划方案模板(3篇)
- 民间户外游戏活动方案策划(3篇)
- 落砂井施工方案(3篇)
- 写一份通知题目及答案
- 小鸭子学游泳题目及答案
- 时间的脚印课件
- 快递收发服务平台搭建合同
- 大型超市与电商平台采购合同
- 乏力诊治与管理专家共识解读 2
- 2025-2030牛结核病防控技术进展与行业影响分析报告
- 2024年泰州市靖江市公安局招聘警务辅助人员真题
- 国际快递基本知识培训课件
- 2025年四川省高考生物试卷(含答案与解析)
- 塔吊拆除安全操作方案模板
- 普惠金融业务讲座
- 虚拟健康咨询接受度分析-洞察及研究
- 巡检员质量培训
- JJG 693-2011可燃气体检测报警器
- 学校安全隐患排查整治表
评论
0/150
提交评论