已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多媒体技术基础,MPEG声音,一、MPEG-1Audio二、MPEG-2Audio三、MPEG-2ACC四、MPEG-4Audio,MPEG-1Audio、MPEG-2Audio、MPEG-2ACC声音数据压缩编码感知声音编码(perceptualaudiocoding)利用人的听觉系统的感知特性来达到压缩声音数据的目的不同于与波形声音压缩编码(如ADPCM)和参数编码(如LPC):依据波形本身的相关性和模拟人的发音器官的特性),MPEG声音,对响度的感知“听阈频率”曲线,MPEG声音,对音高的感知“音高频率”曲线,MPEG声音,掩蔽效应一种频率的声音阻碍听觉系统感受另一种频率的声音的现象频域掩蔽一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽时域掩蔽在时间上相邻的声音之间的掩蔽现象。两种时阈掩蔽:超前掩蔽和滞后掩蔽,MPEG声音,心理声学模型(psychoacousticmodel)听觉阈值电平听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。(大多数人2kHz5kHz)一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。听觉掩饰特性听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的声音而发生变化。,MPEG声音,MPEGAudio采用的两种感知编码:感知子带编码(perceptualsub-bandcoding)思想是首先把时域中的声音数据变换到频域,对频域内的子带分量分别进行量化和编码,然后根据心理声学模型确定样本的精度,从而达到压缩数据量的目的。不局限于只对话音进行编码,也不局限于哪一种声源。DolbyAC-3编码,MPEG声音,感知子带编码压缩算法框图,MPEG-1Audio,DolbyAC-3压缩编码算法框图,MPEG-1Audio,MPEG声音编码器结构图,MPEG-1Audio,MPEG声音解码器结构图,MPEG-1Audio,ISO/MPEGaudio层1和层2编码器和解码器的结构,MPEG-1Audio,ISO/MPEGaudio层3编码器和解码器的结构,MPEG-1Audio,MPEG-1和-2的声音数据规格,MPEG-2Audio,MPEG-2AAC(Advancedaudiocoding)编码思想:主要使用听觉系统的掩蔽特性来减少声音的数据量,并且通过把量化噪声分散到各个子带中,用全局信号把噪声掩蔽掉。与MPEG-1声音格式不兼容适用范围:AAC支持的采用频率可从8kHz到96kHzAAC编码器的音源可以是单声道的、立体声的和多声道的声音。(AAC标准可支持48个主声道、16个低频音效加强通道LFE(lowfrequencyeffects)、16个配音声道(overdubchannel)或者叫做多语言声道(multilingualchannel)和16个数据流。),MPEG-2AAC,MPEG-2AAC(Advancedaudiocoding)压缩率:MPEG-2AAC压缩比为11:1(即每个声道的数据率为(44.116)/11=64kb/s)。在5个声道的总数据率为320kb/s的情况下,很难区分还原后的声音与原始声音之间的差别。与MPEG的层2相比,MPEG-2AAC的压缩率可提高1倍,而且质量更高;与MPEG的层3相比,在质量相同的条件下数据率是它的70。,MPEG-2AAC,MPEG-2AAC的配置开发MPEG-2AAC标准采用模块化的方法:把整个AAC系统分解成一系列模块,用标准化的AAC工具(advancedaudiocodingtools)对模块进行定义(MPEGAudio标准是对整个系统进行标准化)AAC标准定义了三种配置:基本配置低复杂性配置可变采样率配置,MPEG-2AAC,MPEG-2AAC,MPEG-2AAC编码器框图,MPEG-2AAC解码器框图,MPEG-2AAC,MPEG-4Audio标准:集成从话音高质量的多通道声音;从自然声音合成声音编码方法:参数编码(parametriccoding)码激励线性预测(codeexcitedlinearpredictive,CELP)编码时间/频率T/F(time/frequency)编码结构化声音SA(structuredaudio)编码合成声音:MIDI;TTS,MPEG-4Audio,自然声音(naturalaudio)MPEG-4声音编码器支持数据率2kb/s64kb/s之间的自然声音。三种类型声音编码器:,MPEG-4Audio,1、参数编码器参数编码提供了两种编码工具:HVXC和HILN。谐音矢量激励编码HVXC(HarmonicVectorXcitationCoding)编码工具允许对语言信号在2kbit/s和4kbit/s之间进行可分级性编码。谐音和独立线性加性噪声HILN(HarmonicandIndividualLineplusNoise)编码工具允许对非语言信号,例如音乐以4kbit/s和更高的码率进行编码。HILN支持在速度、音调、码率和复杂度上的可分级性。可以将HVXC和HILN联合起来使用以获得更宽范围内的信号和码率。可以在两者编码器的输出之间动态地切换或混合。,MPEG-4Audio,2、CELP编码器CELP的解码器包括一个激励源、一个合成滤波器和一个需要时添加的后置滤波器。激励源拥有两种分量,一是由自适应码书产生的周期分量,另一个是由一个或多个固定码书产生的随机分量。在解码器中,使用码书索引和增益索引来重建激励信号。激励信号接着通过线性预测合成滤波器,最后,为了获得增强的语言质量,可以使用后置滤波器。CELP支持两种采样率:8kHz和16kHz输出数据率624kb/s,MPEG-4Audio,3、T/F编码器(时间-频率(time-to-frequency,T/F)技术)当码率为每声道64kbit/s时就是MPEG2AAC编码标准,此时可以获得极好的音频质量。比特分片算述编码BSAC(thebit-slicedarithmeticcoding),作为一种无噪声编码它能提供从16kbit/s至64kbit/s之间以1kbit/s的步率实现码率的分可级性。变换域加权插入矢量量化TwinVQ作为一种无噪声编码和量化工具也是一种选择,它使用线性预测编码(LPC)模型来定义量化器步阶,对插入和量化的频谱系数进行矢量量化,特别适用于需要码率可分级性和强纠错的系统中。,MPEG-4Audio,MPEG-4Audio编码方框图,MPEG-4Audio,文-语转换TTS(text-to-speech)将文本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临时雇佣安全协议书
- 水务集团聘用合同范本
- 施工合同增项补充协议
- 期货合作分成协议书
- 新昌学校搬迁协议书
- 旅游签署保密协议书
- 柴油独家供应合同范本
- 2026-2031年中国身体成分分析仪行业市场研究及投资战略预测报告
- 检测机构驻场协议书
- 2026-2031桥梁健康监测技术发展现状及趋势分析
- 2025民用无人机驾驶员合格审定规则
- 2025年液体闪烁仪市场发展现状
- 建筑工程质量员课件
- 2025年山东滨州市无棣县丰达建设工程集团有限公司招聘笔试参考题库含答案解析
- 风电项目前期手续办理流程
- 统编版语文三年级上册习作《这儿真美》 课件
- 《高级氧化技术》课件
- 运维公司保密管理制度
- 变电站GIS组合电器安装工程风险识别及预防措施
- 汽车维护与保养作业指导书
- 安全生产文件和档案管理制度
评论
0/150
提交评论