已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字电视原理与应用,PrincipleandApplicationofDigitalTelevision,主讲:张文军教授上海交通大学电子信息工程学院Email:zhangwenjun20062007学年第一学期,MPEG-2音频编码及其测量,class04,2,数字电视原理与应用,课程安排,MPEG-2音频编码及其测量,class04,3,数字电视原理与应用,数字电视基本原理,视频压缩原理第5章MPEG-2视频编码部分及其测量第4,6,11章MPEG-2音频编码及其测量第7章MPEG-2系统部分及其测量第3,9,10章数字调制基础第12章数字电视中的纠错编码原理补充,MPEG-2音频编码及其测量,class04,4,数字电视原理与应用,MPEG-2音频编码及其测量,1.数字音频源信号,MPEG-2音频编码及其测量,class04,5,数字电视原理与应用,人耳动态范围大约140dB,听觉带宽最大20kHz。在模拟音频信号采样数字化之前,要经过低通滤波器进行带限。然后进行模数转换:采样分辨率至少16bits采样频率:32kHzMPEG标准仍支持,但已经不用44.1kHz音频CD48kHz/96kHz演播室质量16bit48kHz采样的码率每个信道786kbit/s,立体声信号近似码率为1.5Mbit/s,1、数字音频源信号,图7.1数字音频源信号,1520kHzBW,1520kHzBW,A,D,32/44.1/48kHz音频采样频率,A,D,32/44.1/48kHz音频采样频率,Right,Left,16bit,Upto768kbit/s,16bit,Upto768kbit/s,1.5Mbit/s,Compression,100400kbit/s,MPEG-2音频编码及其测量,class04,6,数字电视原理与应用,音频压缩的目标是将1.5Mbit/s码率降低到100400kbit/sMP3音频文件通常码率为32kbit/s与视频压缩相似,音频压缩也有两种方式:冗余度消除省略多余信息,无损不相关性消除省去接收端(人耳)不能察觉的信息,有损所有音频压缩方法基于心理声学模型,利用人耳的不足,消除音频信号中的不相关信息。人耳不能察觉频域和时域中强声音脉冲邻近的声音对人耳而言,某些声音可以掩盖其他低幅度的声音信号。,1、数字音频源信号,MPEG-2音频编码及其测量,class04,7,数字电视原理与应用,MPEG-2音频编码及其测量,1.数字音频源信号,2.音频编码历史,MPEG-2音频编码及其测量,class04,8,数字电视原理与应用,MASCAM1988,InstitutfrRundfunktechnik(IRT)为DAB(digitalaudiobroadcasting)系统提出MUSICAM(maskingpatternuniversalsubbandintegratedcodingandmultiplexing)1989,CCETT,Philips和Matsushita联合提出用于DAB上两种都基于子带编码,音频信号分成大量子带,每个子带进行或大或小程度的不相关性消除。ASPEC方法FraunhoferGesellschaft和Thomson提出基于变换编码利用DCT将时域音频信号变换到频域,然后消除不相关性信号分量。,2、音频编码历史,MPEG-2音频编码及其测量,class04,9,数字电视原理与应用,子带编码的MUSICAM和变换编码的ASPEC都包含在MPEG-1音频压缩标准(1991ISO/IEC11172-3)中,分为3层:LayerI和IIMUSICAM编码LayerIII(MP3音频文件)ASPEC编码MP3不是MPEG-3,MPEG-3起初为实现HDTV,但HDTV后来集成到MPEG-2,所以MPEG-3不存在。MPEG-2音频(1994ISO/IEC13818-3)在MPEG-1基础上又增加了layerIIMC(multichannel),2、音频编码历史,MPEG-2音频编码及其测量,class04,10,数字电视原理与应用,2、音频编码历史,MASCAMIRTMunich,1988,MUSICAMIRT,CCETT,Philips,Matsushita,1989,ASPECFraunhoferGesellschaft,Thomson,MPEG-2音频编码及其测量,class04,11,数字电视原理与应用,美国Dolby实验室提出的Dolby数字音频标准(AC-3)1990年提出,1991年12月,第一部AC-3音频编码电影“StarTrackVI”公映许多电影采用Dolby数字技术。美国数字地面广播ATSC只采用AC-3音频编码。其他一些国家(如澳大利亚)将同时采用MPEG和AC-3音频。MPEG和AC-3音频的质量基本没有差别,现代MPEG解码芯片支持两种方法。DVD同时支持PCM音频、MPEG音频和AC-3音频编码。,2、音频编码历史,MPEG-2音频编码及其测量,class04,12,数字电视原理与应用,AC-3的应用电影ATSCMPEG-2TS流DVDAC-3基于MDCT(modifiedDCT),5.1声道,每声道128kbit/sMPEG支持新音频编码方法:MPEG-2AAC(advancedaudiocoding)ISO/IEC13818-7MPEG-4ISO/IEC14496-3(自然/合成音频对象)MPEG-7ISO/IEC15938,2、音频编码历史,MPEG-2音频编码及其测量,class04,13,数字电视原理与应用,MPEG-2音频编码及其测量,1.数字音频源信号,3.人耳心理声学模型,MPEG-2音频编码及其测量,class04,14,数字电视原理与应用,冗余度降低(无损)和不相关性降低(有损)可以将原始声音信号码率降低90。不相关性降低依赖于人耳的心理声学模型Zwicker教授知觉编码人耳不能分辨的声音分量不传输。人耳剖面图,分为三个主要部分:外耳、中耳、内耳。,3、人耳心理声学模型,图7.3人耳剖面图,MPEG-2音频编码及其测量,class04,15,数字电视原理与应用,3、人耳心理声学模型,外耳实现阻抗匹配功能,声音通过空气传输,类似3kHz区域回声递升滤波器。人耳灵敏度最高的范围正是:3kHz4kHz。耳膜或鼓膜将声波转换为机械振动,通过锤骨、砧骨、镫骨传送到通向感觉内耳的膜状窗。耳膜前后的空气压力必须相同,这由耳膜后面的咽鼓管来保证,咽鼓管使得该区域与咽部相连通。当我们到很高的高度时,耳内会有很大压力,通过吞咽动作,咽鼓管内的黏膜可以补偿压力。,图7.4人耳的技术模型,图7.3人耳剖面图,MPEG-2音频编码及其测量,class04,16,数字电视原理与应用,内耳有平衡器官,由几个充满液体的弓形和耳蜗构成。耳蜗是真正的听觉器官,直接听到声音。如果展开耳蜗会在其入口处发现高频传感器,然后是中频传感器,最末端是低频传感器。耳蜗由一个螺旋型管道组成,内部有一个更小的膜状螺旋型通道,从前到后越来越宽。内耳膜上分布着频率选择、声音采集传感器,将听觉神经连接到大脑。,3、人耳心理声学模型,图7.4人耳的技术模型,图7.3人耳剖面图,MPEG-2音频编码及其测量,class04,17,数字电视原理与应用,3、人耳心理声学模型,听觉神经传送的电信号幅度近似为100mVpp,电脉冲的重复率为1kHz数量级,这个速率包含的信息是某个频率音调的音量。音调的音量越高,重复率越大。每个频率传感器通过一个独立的神经线与大脑通讯。传感器的频率选择性在低频处最大,随频率升高而降低。,图7.5人耳的机械/电子模型,MPEG-2音频编码及其测量,class04,18,数字电视原理与应用,与音频编码相关的人耳特性,人耳的灵敏度在很大程度上依赖于频率。低于20Hz,高于20kHz的声音信号人耳无法听到。人耳最敏感范围为3kHz4kHz,在该范围之外,人耳敏感度向高频和低频两个方向降低。低于某个阈值的声音人耳无法听到,该阈值取决于频率,声音信号中低于该阈值的分量无需传送,对人耳而言是不相关信息。,图7.6听觉阈值与频率关系,MPEG-2音频编码及其测量,class04,19,数字电视原理与应用,与音频编码相关的人耳特性,掩蔽现象:例如一个测试人员听一个幅度固定的1kHz正弦波,同时添加其他不同频率和幅度的正弦波,发现在1kHz附近低于某个阈值的其他正弦信号听不到,该阈值取决于频率,称作掩蔽阈值。掩蔽阈值曲线取决于掩蔽信号的频率,掩蔽信号的频率越高,被掩蔽的范围越大。这一特性叫做频域掩蔽。在掩蔽阈值以下的声音分量不需传送。,图7.7频域掩蔽,图7.8掩蔽阈值,MPEG-2音频编码及其测量,class04,20,数字电视原理与应用,与音频编码相关的人耳特性,时域掩蔽时域中一个强脉冲会掩蔽该脉冲前后低于某个阈值的声音信号。这种现象,尤其是前掩蔽,很难想象,但可以进行很好的解释。是由于人耳的有限时域分辨率,再加上信号通过听觉神经传输到大脑的方式。目前的音频压缩方法只利用了频域掩蔽。,图7.9时域掩蔽,MPEG-2音频编码及其测量,class04,21,数字电视原理与应用,MPEG-2音频编码及其测量,1.数字音频源信号,4.音频编码的基本原理,MPEG-2音频编码及其测量,class04,22,数字电视原理与应用,4、音频编码的基本原理,量化噪声:对完全调制正弦信号进行模数转换,由于量化噪声的影响,分辨率为Nbits时的信噪比约为6NdB(经验值)8bit分辨率的信噪比为48dB16bit分辨率的信噪比为96dB音频信号通常采样分辨率为16bit或更高16bit分辨率仍然不能满足人耳的动态范围140dB,图7.10基于知觉编码的音频编码原理框图,FilteringprocessTime:fineFrequency:coarse,SubbandQuantizer,DataCoding,SpectrumAnalysisTime:coarseFrequency:fine,Psycho-acousticmodel,CompressedAudioout,Redundancyreduction,Irrelevancyreduction,FrequencySubbands,Audioin,MPEG-2音频编码及其测量,class04,23,数字电视原理与应用,数字声音源信号在编码器中分为两个分支:滤波将声音信号经过滤波分为许多子带。如果某个子带的信号值低于掩蔽阈值,该子带被其他子带完全掩蔽,不需传送,该子带信息对人耳完全不相关。滤波过程的时域分辨率必须足够高,否则会丢失时域信息;相应只需较低的频域分辨率。频谱分析通过FFT进行频谱分析。测定低时域分辨率和高频域分辨率声音信号的成分。基于心理声学模型(掩蔽效应),可以确定出当前信号中的不相关频率分量。频谱分析模块后是心理声学模型模块,该模块决定子带选择完全抑制或者选择或粗或细量化两种方式。量化通过子带量化器控制。然后通过特殊数据编码进行冗余度降低。,4、音频编码的基本原理,MPEG-2音频编码及其测量,class04,24,数字电视原理与应用,不相关性降低的另一种可能性:如果某个子带信号只有部分边缘在掩蔽阈值以上,该子带的量化可以很粗,使得该子带量化噪声低于阈值而听不到。低于听觉阈值的信号不需传送。针对各子带的不同听觉阈值,可以选择或粗或细的量化,使得量化噪声总是低于阈值。频率越高,分辨率可以越低。知觉编码有多种方式实现:子带编码变换编码混合编码,4、音频编码的基本原理,MPEG-2音频编码及其测量,class04,25,数字电视原理与应用,MPEG-2音频编码及其测量,1.数字音频源信号,5.子带编码,MPEG-2音频编码及其测量,class04,26,数字电视原理与应用,声音信号通过32个滤波器组成的滤波器组,将信号分成750Hz的频率子带,每个子带有独立量化器。量化器受FFT模块和心理声学模型模块控制。量化器可以完全抑制子带或减少量化阶数。,5、MPEGLayerI,II子带编码,图7.11子带编码,MPEG-2音频编码及其测量,class04,27,数字电视原理与应用,LayerII中,每隔24ms对1024个采样值做FFT,即心理声学模型模块的输入每隔24ms变化。在24ms间隔中,子带根据心理声学模型模块的信息做不相关性降低。认为24ms内信号不变。各子带的听觉阈值不同,因此不同子带的码字分配和量化都不同。低频分量必须做细量化,高频量化可以变粗。,5、MPEGLayerI,II子带编码,MPEG-2音频编码及其测量,class04,28,数字电视原理与应用,5、MPEGLayerI,II子带编码,音频传输中不相关性消除的两例:某子带中有一个5kHz的信号在掩蔽阈值以上,因此该子带只能减少量化阶。另一子带中有一个约10kHz的信号在掩蔽阈值以下,该子带被相邻子带信号完全掩蔽,可以被完全抑制。,图7.12利用掩蔽效应的不相关性消除,为进一步降低不相关性,还要分析子带中是否有谐波位于邻近低端子带内;以及被掩蔽信号是否有谐波分量。只有没有谐波分量的被掩蔽信号可以被完全抑制。,Signallevelinsubbandbelowmaskingthresholddeteminedbyasignalat8kHz:subbandcompletelysuppressed,Signallevelinsubbandabovemaskingthresholddeterminedbyasignalat4kHz:Quantizationnoiseadjustedtobelowthreshold,spectrumcalculatedbymeansofFFT;ThresholdscalculatedafterFFT;Quantizercontrolledbypsychoacousticmodel,MPEG-2音频编码及其测量,class04,29,数字电视原理与应用,MPEG编码中,每帧的采样值数目固定。LayerI一帧每个子带有12个采样值;LayerII每个子带有3x12个采样值。,5、MPEGLayerI,II子带编码,图7.13MPEG-2LayerI,II数据结构,MPEG-2音频编码及其测量,class04,30,数字电视原理与应用,5、MPEGLayerI,II子带编码,图7.14MPEG-2LayerI,II冗余度降低,对每一块(12个采样值)找出最大值,作为整个块12个采样值的比例因子,来降低冗余度。,Highestvalueisusedforscalefactordeterminationforablockofsamples,Blockofsamples,MPEG-2音频编码及其测量,class04,31,数字电视原理与应用,MPEG-2音频编码及其测量,1.数字音频源信号,6.变换编码,MPEG-2音频编码及其测量,class04,32,数字电视原理与应用,变换编码与子带编码相反,不用滤波器组进行子带滤波,声音信号的频域分离通过DFT实现。利用DCT或MDCT,声音信号变换为256或512个频谱能量值。与子带编码相同,同时对声音信号做相对高频域分辨率的FFT,FFT输出的数据送到心理声学模型模块,来控制MDFT得到的音频信号能量值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 奢侈品鉴定师考试试卷及答案
- 桥式起重机电气调试技师岗位招聘考试试卷及答案
- 阳江商用电脑租赁协议书
- 可以采取书面形式的协议书
- 附着式升降脚手架施工工艺要点
- 自动化产品开发协议书模板
- 民国签的协议书中国承认
- 取公积金代缴公积金协议书
- 数据治理合规互认协议
- 大型仓库钢结构屋盖施工方案
- 代还信用贷款合同
- SMT设备安全培训材料
- 专题04 名篇名句默写-(2020-2024)5年高考1年模拟语文真题分类汇编(天津专用)
- 伙食管理委员会职责
- 管道直饮水项目可行性研究报告
- 小型农田灌溉工程施工组织设计
- 2024年广东省广州市市中考道德与法治试卷真题(含答案逐题解析)
- GB/T 4008-2024锰硅合金
- 车辆租赁服务方案
- 《深度学习:基于PyTorch 》 课件汇总 第1-7章:深度学习简介-序列模型
- GB/T 43081-2023道路车辆灯泡和光源尺寸、光电性能要求
评论
0/150
提交评论