文档简介
1、,四川交通职业技术学院 计算机工程系,2012.10,Audio Compression,第五讲 音频压缩,AU音频编辑,2,声波性质,音频特性,采样,量化,压缩编码,编辑发布,音频编辑是非常烦琐的工作,要做好音频编辑,对声波性质、人类听觉特性、音频信号数字化过程的了解和应用都是必不可少的。,对声音的良好感觉,3,回顾几个重要的概念问题 AU的振幅问题 声道和音轨 采样频率和声音频率 量化位数和声音分辨率 可变码率和恒定码率,4,AU振幅问题 Audition 第十课 振幅,削波,分贝数,5,AU振幅问题,6,声压:声波在空气传播过程中,引起空气质点振动,使空气发生疏密变化,导致空气压强变化叫
2、声压。 声压级:,7,8,回顾几个重要的概念问题 AU的振幅问题 声道和音轨 采样频率和声音频率 量化位数和声音分辨率 可变码率和恒定码率,9,声道和音轨,10,回顾几个重要的概念问题 AU的振幅问题 声道和音轨 采样频率和声音频率 量化位数和声音分辨率 可变码率和恒定码率,11,采样频率和声音频率 在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中最高频率fmax的2倍时(fs.max=2fmax),采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的510倍;采样定理又称奈奎斯特定理。,采样定理说明采样频率与信号频谱之间的关系,是连续信
3、号离散化的基本依据。,12,回顾几个重要的概念问题 AU的振幅问题 声道和音轨 采样频率和声音频率 量化位数和声音分辨率 可变码率和恒定码率,13,AU中的分辨率参数就是量化位数,14,回顾几个重要的概念问题 AU的振幅问题 声道和音轨 采样频率和声音频率 量化位数和声音分辨率 可变码率和恒定码率,15,码率的计算 码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是kbps即千位每秒。 例,采样率11.025kHz,量化位数8bit,那么码率为: 811.025 而位的量化位数可以量化 (即)个级别的声音,16,与 几乎所有的编码格式重视的都是如何用最低的码率达到最少的失真,围绕这个
4、核心衍生出来的cbr(固定码率)与vbr(可变码率)。 就是压缩率不是恒定的,而是随着音源的复杂和简单而变化,可以在保证音质的前题下最大限度的节省空间.,17,恒定码率(CBR)就是我们常谈到的MP3码率,大多数MP3都采用这种方式,数值越高声音质量越好。,变长码率(VBR),音频文件是以8320kbPs的可变码率进行压缩,得到相对小的文件来节约存储空间。,总体来说,恒定码率的MP3文件体积较大,但效果最好。如果不在乎空间并且要最大限度保护音质的话选择高编码率的CBR,如 CBR320, 折中的办法是选择VBR192。,18,解码,编码,计算机 音频,19,1.,重要问题回顾,2.,音频压缩编
5、码技术,3.,音频编码技术标准,4.,内容提纲,20,对于不同类型的音频信号而言,其信号带宽是不同的,如: 电话音频信号(200Hz3.4kHz) 调幅广播音频信号(50Hz 7kHz) 调频广播音频信号(20Hz 15kHz) 激光唱盘音频信号(10Hz 20kHz),音频压缩编码技术,21,几种音频业务的动态范围,音频压缩编码技术,22,量化位数和动态范围比较,音频压缩编码技术,23,音频压缩编码技术,随着对音频信号音质要求的增加,信号频率范围逐渐增加,要求描述信号的 数据量也就随之增加,从而带来处理这些数据的时间和传输、存储这些数据 的容量增加,因此多媒体音频压缩技术是多媒体技术实用化的
6、关键之一。,24,音频压缩编码技术,编码的作用其一是采用一定的格式来纪录数字数据,其二是采用一定的算法来压缩数字数据以减少存贮空间和提高传输效率。 压缩算法包括有损压缩和无损压缩;有损压缩指解压后数据不能完全复原,要丢失一部分信息。压缩编码的基本指标之一就是压缩比,它通常小于1。压缩越多,信息丢失越多、信号还原后失真越大。根据不同的应用,应该选用不同的压缩编码算法。,编码算法,25,音频压缩编码技术,音频数字压缩编码算法及其特性,音频信号的压缩编码采用了在数据编码中介绍的一些技术。一般来说,主要有以下几种主要类型: 熵 波形 参数 混合 感知,26,1.,重要问题回顾,2.,音频压缩编码技术,
7、3.,音频编码技术标准,4.,内容提纲,27,1.,重要问题回顾,2.,音频压缩编码技术,3.,音频编码技术标准,4.,内容提纲,28,频率范围,300Hz3.4kHz,基本参数,采用标准的脉冲编码调制(PCM),当采样频率为8kHz,进行8bit量化时,所得数据速率为64kbit/s,技术标准,G.723: 一种ITU-T 推荐标准 H.324:一个ITU-T 标准。它在模拟电话线(POTS)上提供了点对点的数据、视频和音频会议。,50Hz7kHz,G.722标准是采用16kHz采样,14bit量化,信号数据速率为224kbits,用G.722标准可以在窄带综合服务数据网N-ISDN中的一个
8、B信道上传送调幅广播质量的音频信号。,50Hz20kHz,44.1kHz采样频率,16bit量化,数据速率每声道达705kbits,ISO/IEC标准组织成立了ISO/IES JTC1/SC29/WG11,即MPEG(活动图像专家组)系列,音频压缩编码技术标准,电话质量,调幅广播 质量,高保真度 立体声,29,音频压缩编码技术标准,电话质量 脉冲编码调制 (Pulse Code Modulation)是一种对模拟信号数字化的取样技术,将模拟语音信号变换为数字信号的编码方式,特别是对于音频信号。PCM 对信号每秒钟取样 8000 次;每次取样为 8 个位,总共 64 kbps。 适应低速率语音通
9、信的要求 较强的抗干扰能力,其他语音相关标准 ,30,频率范围,300Hz3.4kHz,基本参数,采用标准的脉冲编码调制(PCM),当采样频率为8kHz,进行8bit量化时,所得数据速率为64kbit/s,技术标准,G.723: 一种ITU-T 推荐标准 H.324:一个ITU-T 标准。它在模拟电话线(POTS)上提供了点对点的数据、视频和音频会议。,50Hz7kHz,G.722标准是采用16kHz采样,14bit量化,信号数据速率为224kbits,用G.722标准可以在窄带综合服务数据网N-ISDN中的一个B信道上传送调幅广播质量的音频信号。,50Hz20kHz,44.1kHz采样频率,
10、16bit量化,数据速率每声道达705kbits,ISO/IEC标准组织成立了ISO/IES JTC1/SC29/WG11,即MPEG(活动图像专家组)系列,音频压缩编码技术标准,电话质量,调幅广播 质量,高保真度 立体声,31,调幅广播质量 采用子带编码方法,将输入音频信号经滤波器分成高子带和低子带两个部分,分别进行ADPCM编码,再混合形成输出码流。 自适应差分脉冲编码调制(ADPCM),是对信号和它的预测值的差分信号进行量化,同时再根据邻近差分信号的特性自适应改变量化参数,从而提高压缩比,又能保持一定信号质量。 ADPCM对中等电话质量要求的信号能进行高效编码,而且可以在调幅广播和交互式
11、激光唱盘音频信号压缩中应用。,音频压缩编码技术标准,32,频率范围,300Hz3.4kHz,基本参数,当采样频率为8kHz,进行8bit量化时,所得数据速率为64kbit/s,技术标准,G.723: 一种ITU-T 推荐标准 H.324:一个ITU-T 标准。它在模拟电话线(POTS)上提供了点对点的数据、视频和音频会议。,50Hz7kHz,G.722标准是采用16kHz采样,14bit量化,信号数据速率为224kbits,用G.722标准可以在窄带综合服务数据网N-ISDN中的一个B信道上传送调幅广播质量的音频信号。,50Hz20kHz,44.1kHz采样频率,16bit量化,数据速率每声道
12、达705kbits,ISO/IEC标准组织成立了ISO/IES JTC1/SC29/WG11,即MPEG(活动图像专家组)系列,音频压缩编码技术标准,电话质量,调幅广播 质量,高保真度 立体声,33,高保真立体声压缩的必要性 动态范围可达100dB, 频响范围可达20Hz20KHz。因此,声音数字化后的信息量也非常大,例如把声道环绕立体声数字化,按每声道取样频率48KHz,每样值18bits 表示,则数字化后的数据码率为:648KHz18bits5.184Mbit/s,即使是两声道立体声,数字化后码率也达到1.5Mbps 左右,而电视图像信号数字压缩后码率大约为1.5Mbps10Mbps。 因
13、此,相对而言声音未经数字压缩的码率就太高了,为了更有效地利用宝贵的信道资源,必须对声音进行数字压缩编码。,音频压缩编码技术标准,34,MPEG的由来 由于有必要确定一套通用的视频和声音编码方案,ISO/IEC标准组织成立了ISO/IES JTC1/SC29/WG11,即MPEG(活动图像专家组)。该小组负责比较和评估几种低码速率数字声音编码技术,以产生一套国际标准,用于活动图像、相关声音信息及其结合,和用数字存储媒体(DSM)存储与重现。 MPEG针对的DSM包括CD-ROM、DAT、磁光盘和电脑磁盘。基于MPEG的压缩技术还将用于多种通信信道,如:ISDN、局域网和广播。,35,音频压缩编码
14、技术标准,MPEG-1制定于1992年,为工业级标准而设计,可适用于不同带宽的设备,如CD-ROM、Video-CD、CD-i。 它可针对SIF标准分辨率(对于NTSC制为352X240;对于PAL制为352X288)的图象进行压缩,传输速率为1.5Mbits/sec,每秒播放30帧,具有CD(指激光唱盘)音质,质量级别基本与VHS相当。 MPEG的编码速率最高可达4-5Mbits/sec,但随着速率的提高,其解码后的图象质量有所降低。,MPEG - 1,MPEG - 1,绝大多数的VCD采用MPEG-1格式压缩。MPEG-1也被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL),
15、视频点播(VOD),以及教育网络等。同时,MPEG-1也可被用做记录媒体或是在INTERNET上传输音频。,36,MP3 MPEG-1音频第一和第二层次编码是将输入音频信号进行采样频率为48kHz,44.1kHz,32kHz的采样,经滤波器组将其分为32个子带,同时利用人耳屏蔽效应,根据音频信号的性质计算各频率分量的人耳屏蔽门限,选择各子带的量化参数,获得高的压缩比。 MPEG-1第三层次是在上述处理后再引入辅助子带,非均匀量化和熵编码技术,再进一步提高压缩比。MPEG音频压缩技术的数据速率为每声道32448kbits,适合于CDDA光盘应用。,37,音频压缩编码技术标准,MPEG-2制定于1
16、994年,设计目标是高级工业标准的图象质量以及更高的传输率。 MPEG-2所能提供的传输率在3-10Mbits/sec间,其在NTSC制式下的分辨率可达720X486,MPEG-2也可提供并能够提供广播级的视像和CD级的音质。 MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道(DVD可有8种语言配音的原因)。由于MPEG-2在设计时的巧妙处理,使得大多数MPEG-2解码器也可播放MPEG-1格式的数据,如VCD。,MPEG - 1,MPEG - 2,MPEG-2做为DVD的指定标准外,还应用在HDTV(高清晰电视广播)和一些高要求的视频编辑、处理方面,
17、如用于为广播,有线电视网,电缆网络以及卫星直播(DirectBroadcastSatellite)提供广播级的数字视频。,38,MPEG-3 MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。 (MPEG-3要求传输速率在20Mbits/sev-40Mbits/sec间,但这将使画面有轻度扭曲)。 MPEG-2的另一特点是,其可提供一个较广的范围改变压缩比,以适应不同画面质量,存储容量,以及带宽的要求。 按压缩比大小的 不同分成五个档次(profile),每一个档次又按图像清晰度的不同分成四种图像格式,或称为级别(level 对于最终用
18、户来说,由于现存电视机分辨率限制,MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显,到是其音频特性(如加重低音,多伴音声道等)更引人注目。,39,MPEG-2多声道,40,AC-3编码 AC-3(Audio Code Number 3)是Dolby公司的数字声音数据压缩算法,MPEG-2音频支持它。 AC-3的主要特点是利用人的听觉系统特性来压缩声音数据,并支持5个声道(左、中、右、左环绕、右环绕和0.1 kHz以下的低音音效声道),声音样本的精度为20比特,每个声道的采样率可以是 32kHz, 44.1kHz或者 48kHz。,41,音频压缩编码技术标准,MPEG-4
19、 Audio标准(ISO/IEC 14496-3)可集成从话音到高质量的多通道声音,从自然声音到合成声音 更加注重多媒体系统的交互性和灵活性。这个标准主要应用于视像电话、视像电子邮件等,对传输速率要求较低,在48006400bits/s之间,分辨率为176144。 MPEG4利用很窄的带宽,通过帧重建技术、数据压缩,以求用最少的数据获得最佳的图像质量。 利用MPEG4的高压缩率和高的图像还原质量可以把DVD里面的MPEG2视频文件转换为体积更小的视频文件。经过这样处理,图像的视频质量下降不大但体积却可缩小几倍,。,MPEG - 1,MPEG - 4,MPEG-4的特点是其更适于交互AV服务以及
20、远程监控。 可以很方便地用CDROM来保存DVD上面的节目。另外,MPEG4在家庭摄影录像、网络实时影像播放也大有用武之地。,42,音频压缩编码技术标准,MPEG-7 Audio 标准(ISO/IEC 15938-3)提供了音频描述工具。 MPEG7并不是一种压缩编码方法,其正规的名字叫做多媒体内容描述接口,其目的是生成一种用来描述多媒体内容的标准,可以被传送给设备和电脑程序,或者被设备或电脑程序查取。 建立MPEG-7标准的出发点是依靠众多的参数对图象与声音实现分类,并对它们的数据库实现查询,就象我们今天查询文本数据库那样。,MPEG - 1,MPEG - 7,可应用于数字图书馆,例如图象编目、音乐词典等;多媒体查询服务,如电话号码簿等;广播媒体选择,如广播与电视频道选取;多媒体编辑,如个性化的电子新闻服务、媒体创作等。,43,音频压缩编码技术标准,计算机中采用数字音乐合成技术,主要采用两种方法: 频率 调制合成法(Frequenncy Modulation Synthesis) FM合成是通过硬件产生正弦信号,再经处理合成音乐。合成的方式是将波形组合在一起,理论上可以有无限多组波形。 波表合成法(Wavetable Synthesis,也称为乐音样本合成法) 将每种真实乐器发出的声音抽样,加以适当的处理后存储成声音样本(音色文件),记录在合成器的内存当
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 整个鞋子的营销方案(3篇)
- 旧窗翻新施工方案(3篇)
- 柱变拆除施工方案(3篇)
- 歌瑞森营销方案(3篇)
- 沙滩引流活动策划方案(3篇)
- 消防室外管施工方案(3篇)
- 热乎小吃冬季营销方案(3篇)
- 瑞克斯酒吧-营销方案分析(3篇)
- 知识营销方案案例分析(3篇)
- 立邦外墙修复施工方案(3篇)
- 病区免陪照护服务的规范化管理与实践
- 北京路沂河桥及两岸立交改造工程桥梁顶升专项施工方案
- 《医疗器械用粉末床电子束增材制造装备T CAMDI 073-2021》
- 从创意到创业知到智慧树章节测试课后答案2024年秋湖南师范大学
- 甲状腺结节课件教学
- 《民航服务与沟通学》课件-第16讲 电话沟通
- 《农产品质量管理与认证》 课件 项目六 农产品地理标志认证
- 场地授权委托书
- 领导干部忏悔书
- 分子生物学实验
- 立体构成(高职艺术设计)PPT完整全套教学课件
评论
0/150
提交评论