版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第11MPEG第11MPEG声音目MPEG-2MPEG-2AudioMPEG-2MPEG-2AACMPEG-2AACMPEG-2AACMPEG-4MPEG-4AudioMPEG-4AudioMPEG-4听觉系统的感知特感知声音编MPEG-1声音声音压缩的基本原波形声音压缩编码(如参数编码(如感知声音编码(PerceptualAudio如MPEG-1,MPEG-第11第11MPEG声前展,先后制定了MPEG-1AudioMPEG-2Audio,MPEG-2AAC和MPEG-4Audio等标准,并把由于其中涉及的许多具体算法已经超出本课听觉系统听觉系统的感知特Audio压缩编码算法中的三个特音高(频率对响对响度的感知声音的响度就是声音的强对响对响度的感知人耳的听觉范痛域:声音强到使人耳感到疼痛时的声音强听觉范围:位于听阈和痛域之间,见图11-“听阈—频率”“听阈—频率”曲线和“痛阈—频率”曲听阈—频率”曲线听阈—频率”曲线和“痛阈—频率”曲实验表明,听阈是随频率变化的最靠下面的一根曲线叫做“零方等响度级”曲线,也称“绝对听阈”曲线,最靠上面所示的一根曲线。这条曲线也就是方等响度级曲线。在“听阈—频率”曲线和“痛阈—频率”曲线之间的区域就是人耳的听觉范围。这个范围内的等响度级曲线也是用同样的方法测量出来的。人耳对不同频率的敏感程度差别很大,其中对k~范围的信号最为敏感,幅度很低的信号都能被人耳听到。在低频区和高频区,能被人耳听到的信号幅度要高得9of对音高(频对音高(频率)的感客观上用频率表示声音的音高,其单位Hz。而主观感觉的音高单位则是“美主观音高与客观音高的关系Mel1000log2(1f的单位为Hz,Hz和Mel不同但有联人耳对频率的感知范围,可以听到20音高-频率曲测量主观音高音高-频率曲测量主观音高时,为40dB的纯音,固定掩蔽效掩蔽效掩蔽效应Effects),心理声学为同步掩蔽,也叫声响掩掩蔽声音(maskedtone)如何理解掩如何理解掩蔽效应-类例想象一只在太阳前面飞翔的小鸟。你看到鸟从左边飞到你和太阳之间,然后小鸟如何理解掩如何理解掩蔽效应-类例在一个安静的环境中,吉他手的手指轻轻过琴弦的响声都能听到,但如果同样的如何理解掩如何理解掩蔽效应-MP3处理方式声音信号1,是个1000hz的正弦波,音量小声音信号小一个1100hz的正弦波,音量同时出现时,大多数人感知不到声音信号的存但声音信号2不容易被感知,不仅因为它如何如何理解掩蔽效应-MP3处理方式逐渐增加声音信号2的频率,但保持它的量不变,直到我们能听到它。假定它的频率增加到4000hz的时候我们就能听到这个声音的音调了,一个比较大声,另一个比较小如何如何理解掩蔽效应-MP3处理方式这个过程就是心理声学所说的“同步掩蔽考虑到这种现象,MP3在编码过程中尽量掩蔽掩蔽效掩蔽可分成频域掩蔽和时域掩频域掩时域掩频域掩频域掩蔽高B听频域掩蔽频域掩蔽要想让Hz的纯音也听不到,则需要它降到比1000Hz的纯音低45dB频域掩蔽频域掩蔽 频域掩蔽频域掩蔽图11-4中的一组曲线表示为250Hz,1kHz和4kHz纯音的掩蔽效应,它们的声强均为60dB250Hz,1kHz和4kHz临界临界频带(critical人耳刚可感知两种频率的声音有差别的频范声音频率与掩蔽曲线不是线性关系,为从感知上来统一度量声音频率,引入了“临界频临界频带是一个主观反映突然发生变化的临界临界频带(critical人耳是以临界频带为单位对声音进行处理临界频带临界频带(critical通常认为声音(audio)有25个临界频带,见临界频带的宽度随声音频率的变化而变在低频端,宽度小于100Hz,可认为接近于常临界频带的单位为Bark(巴克1Bark等于一个临界频带的宽临界临界频带(critical时域时域掩蔽时域时域掩蔽如果两个声音在时间上特别接近,人类在辨它们的时候也会有困难时域时域掩蔽失后出现的现象,可以持续50~200ms通常只有大约2~20ms产生时域掩蔽的主要原时域掩时域掩蔽11.2感知11.2感知声音编频率为Hz的声音数据压缩技应用于MPEG-1Audio、MPEG-2Audio、MPEG-2AAC(AdvancedAudioCoding)和MPEG-4AudioMPEG声音主要采纳两种感知编码算感知子带编码(perceptualsub-band心理声心理声心理声学人脑解释声音的方32ofMPEG声MPEG声音的压缩依听觉系统存在听觉阈值电低于阈值电平的信号听不到,因此可把这部分信号去听觉掩饰特听觉阈值电平会随听到的不同频率的声音而发生变例如,1000Hz和1100Hz的声音同时存在,前者的强度大于后者18dB,在这种情况下,1100Hz的声音就感知感知子带编简化算法框图见图11-感知子感知子带编杜比数字(Dolby杜比数字(Dolby前称为AC-3,简称AC-多声道环绕声格式,现已作为国际标立体声的位速率通常为1925.1声道的位速率通常为384kbps,但可高达640杜比数编码器框杜比数编码器框图见图11-必须是32,44.1或48kHz,样本精度可多到20位11.3MPEG-111.3MPEG-1MPEG-1Audio(ISO/IEC11172-3是世界上第一44.1或48kHz编码器的输出信号为32~38432,483238411.3MPEG-1Audio(续11.3MPEG-1Audio(续MPEG-Audio定义了三个独立压缩层第1层—MP1(MPEGAudioLayer第2层—MP2(MPEGAudioLayer数据率为256~192kbps,算法复杂度中等第3层—MP3(MPEGAudioLayer缩比为1:10~1:12,相应的数据率为128~112kbps,声音质量11.3MPEG-1Audio(11.3MPEG-1Audio(续MPEG-Audio的压缩11.3MPEG-111.3MPEG-1Audio(续redundancycheck,CRC)。11.4MPEG-2MPEG-211.4MPEG-2MPEG-2标准委员会定义了两种声音数据缩标MPEG-2Audio(ISO/IEC13818-也称MPEG-Multichannel(多通道声音MPEG-2AAC(ISO/IEC13818-称为非后向兼容MPEG-2NBC(Non-Backward-MPEG-2Audio和MPEG-1MPEG-2Audio和MPEG-1Audio相比都使用相同的编译码器,3个编码层的编结构也相MPEG-2声音标准做了如下扩增加了16kHz22.05kHz和24kHz~640kbps扩展到增加了声道数,支持5.1声道和7.1声道的环绕支持LinearPCM(线性PCM)和DolbyAC-3(AudioCodeNumber3)编码MPEG-2AudioMPEG-2Audio和MPEG-1Audio相比它们的差别见表11-MPEG-2Audio使MPEG-2Audio使用的环绕5.1环绕声,也称3/2-立体声加.1(lowfrequencyeffects,LFE)加7.1声道环绕立体声与5.1声道类似,见图11-11.511.5MPEG-2MPEG-2AdvancedAudioCoding的缩写,声音知编码标FraunhoferIIS、杜比实验室、AT&T、Sony(索尼)等术和PS技术,为了区别于传统的MPEG-2AAC又称为MPEG-4AAC11.5MPEG-211.5MPEG-2采样频率可从kHz,编码器的输入来自单声道、立体声或多声道音源的声可支持48个声道、16个低频音效加强通(LFE)、16个配音声道(overdubchannel)11.511.5MPEG-2在压缩比为11:1时,很难区分压缩前和压还原后的声kbps,5个声道的总数据率为320kbps在声音质量相同的前提与MPEG-1/-2Audio的第2层相比,AAC的压缩与MPEG-1/-2Audio的第3层相比,AAC的数据11.6MPEG-4包罗万象的声音对象编码标准(ISO-IEC14496-3,11.6MPEG-4包罗万象的声音对象编码标准(ISO-IEC14496-3,24682084图11-23MPEG-普通声音编码(generalaudio话音编码(speech可变速率编码器(Scalable11.6MPEG-4该标准11.6MPEG-4该标准为每个声道规定的数据速率为具(codingtool)”在数据速率为2~6kbps范围内,可使用参数编码(parametriccoding),声音信号的采样频率使用8kHz在数据速率为6~24kbps的范围内,可使用码激励线性预测技术(codeexcitedlinearprediction,CELP),声音信号的采样频率使用8kHz或16kHz在数据速率为16~64kbps范围内,可使用时间/频率编码(time/frequencycoding)或称为“基于变换的普通声音编码(transform-basedgeneralaudiocoding)”技术,如用MPEG-2AAC经过改进的MPEG-4AAC,支持8~96kHz的声音信号采样频率关于关于MPEG-4Audio的标准文从20世纪90年代中期以来已有多个版本,图11-24,前后版本的差别也比较MPEG-4Audio概MPEG-4V1(1999)MPEG-4MPEG-4AudioMPEG-4Audio概MPEG-4V1(1999)MPEG-4MPEG-4AudioSSC:sinusoidalcodingSLS:scalablelosslessMC/LSF:multi-channelandlowsamplingfrequencyAAC:advancedaudiocoderSBR:spectralbandMPEG-4Audio工具与文提供的声音工具可MPEG-4Audio工具与文提供的声音工具可分成8种类(1)话音编码工具(2)声音编码工具(4)声音合成工具(5)编排工具(6)性能可变工具描述各种描述各种工具的文描述各种工具的文档(ISO-Subpart1:Subpart2:Speechcoding—HVXCSubpart3:Speechcoding—CELP14496-3)有10部Subpart4:GeneralAudiocoding(GA)—AAC,TwinVQ,BSACSubpart5:StructuredAudio(SA)Subpart6:TextToSpeechInterface(TTSI)Subpart7:ParametricAudioCoding—HILNSubpart8:Parametriccodingforhighqualityaudio—SSCSubpart9:MPEG-1/2AudioinMPEG-4Subpart10:Losslesscodingofoversampledaudio—第11MPEG声音(参考文第11MPEG声音(参考文献参考文献和站TheMPEGHomePage,/mpeg/MPEGIndustryForum,/resources.phpMPEGAudioResourcesandSoftware,TheMPEGAudioWebPage,J.S.Tobias,Ed.,FoundationsofModernAuditoryTheory,Vol.1,AcademicPress,NewYork,1970HugoFastlandEberhardZwicker,Psychoacoustics:FactsandModels(SpringerSeriesinInformationSciences),3rded.2007.TedPainterandAndreasSpanias,PerceptualCodingofDigitalAudio,ProceedingsoftheIEEE,VOL.88,NO.4,April2000.第11MPEG声音(参考文第11MPEG声音(参考文续MiroslavaRaspopovic,CharlesThompson,DonnClark,DesignofPerceptionBasedAudioCodec-FinalReport,May25th,2001.TeddySuryaGunawan,EliathambyAmbikairajah,AudioCompressionandSpeechEnhancementusingTemporalMaskingModels,thesissubmittedforthedegreeofDoctorofPhilosophy,2007./adt-AdvancedTelevisionSystemsCommittee,Inc.,DigitalAudioCompressionStandard(AC-3,E-AC-3),RevisionB,DocumentA/52B,14June2005.ITURadiocommunicationStudyGroups,AguidetodigitalterrestrialtelevisionbroadcastingintheVHF/UHFbands,1998.ISO/IEC13818-3,ISO/IECJTC1/SC29/WG11NO803,InformationTechnology-GenericCodingofMovingPicturesandAssociatedAudio:P.U.Y.Dehery,M.Lever,AMUSICAMsourcecodecfordigitalaudiobroadcastingandstorage,inProceedingsofInt.Conf.Acoustic,Speech,SignalProcessing,pp.3605--3608,IEEE,1991第11MPEG声音(参考第11MPEG声音(参考文续K.Brandenburg,J.Herre,J.D.Johnston,Y.Mahieux,andE.Schroeder,ASPEC:Adaptivespectralentropycodingofhighqualitymusicsignals,inProc.90thConvention.Aud.Eng.Soc.,Feb.1991P.Noll,WidebandSpeechandAudioCoding,IEEEComm.Mag.,pp.34-44,Nov.1993.DavisPan.ATutorialonMPEG/AudioCompression.IEEEMultimedia,1995,pp60-74.KarlheinzBrandenburg,OCF-ANewCodingAlgorithmforHighQualitySoundSignals,1987.PrincenJ,Bradley,A.Analysis/SynthesisFilterBankDesignonTimeDomainAliasingCancellation.IEEETransactions,ASSP-34,No.5,Oct1986,pp1153-1161,第11MPEG声音(参考文第11MPEG声音(参考文续YeWangandMiikkaVilermo,TheModifiedDiscreteCosineTransform:ItsImplicationsforAudioCodingandErrorConcealment,AES22ndInternationalConferenceonVirtual,SyntheticandEntertainmentAudio,2002..sg/~wangye/papersHosseinNajafzadeh-Azghandi,PerceptualCodingofNarrowbandAudioSignals,April2000.http://www-mmsp.ece.mcgill.ca/MMSP/Theses/T1999-ISO/IEC11172-3,Codingofmovingpicturesandassociatedaudiofordigitalstoragemediaatuptoabout1.5mbit/s,3-AnnexC(informative)Theencodingprocess.1993ISO/IEC13818-7:2004(E),Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation—Part7:AdvancedAudioCoding(AAC)BosiMetal,ISO/IECMPEG-2AdvancedAudioCoding.JournaloftheAudioEngineeringSociety,No.10,pp.789-813,October1997.TakehiroMoriya,NoboruHarada,YutakaKamamoto,andHiroshiSekigawa,MPEG-4ALS—InternationalStandardforLosslessAudioCoding,NTTTechnicalReview,pp40-45,Vol.4No.8,Aug.2006.第11MPEG声音(参考文续ISO/IEC14496-3,Thirdedition,2005-12-01,Informationtechnology第11MPEG声音(参考文续ISO/IEC14496-3,Thirdedition,2005-12-01,Informationtechnology—Codingofaudio-visualobjects—Part3:Audio.DennisH.Klatt.Reviewoftext-to-speechconversionforEnglish.J.Acoustical.Soc.Am.82(3),September1987.StefanMeltzerandGeraldMoser,MPEG-4HE-AACv2-audiocodingfortoday'smediaworld,EBUTechnicalReview–JanuaryTilmanLiebchen,TakehiroMoriya,NoboruHarada,YutakaKamamoto,andYuriyA.Reznik,TheMPEG-4AudioLosslessCoding(ALS)Standard-TechnologyandApplications,119thAESConvention,NewYork,October7-10,2005
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 餐饮服务操作与规范手册(标准版)
- 城市绿化管理与服务手册
- 工厂车间现场安全管理手册
- 加味玉屏风多糖对免疫抑制小鼠肠道损伤的保护作用
- 污水处理厂污泥调质细则
- 某针织厂废料回收制度
- 某针织厂缩率检测办法
- 某针织厂火灾应急制度
- 慢性病护理与管理策略
- 教师职业道德培训阶段测试题及答案
- 2026年包头轻工职业技术学院单招综合素质考试题库附答案详解(基础题)
- 2026年兴安职业技术学院单招职业倾向性测试题库及答案详解(新)
- 国家基层糖尿病防治管理指南(2025版)
- 2025年国企招聘考试(建筑工程及造价)经典试题及答案
- (2026)中华人民共和国海关注册登记和备案企业信用管理办法解读课件
- 年产10吨功能益生菌冻干粉的工厂设计改
- 主要通风机无计划停电停风应急预案
- 统筹方法平话及补充
- GB/T 10609.1-2008技术制图标题栏
- 课件五笔输入法
- 最新景观照明培训专业知识讲座课件
评论
0/150
提交评论