




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第2章 音频处理技术,西安交通大学计算机教学实验中心,2,简述,音频是多媒体技术中媒体的一种,由于音频信号是一种连续变化的模拟信号,而计算机只能处理和记录二进制的数字信号,因此,音频信号必须经过一定的变化和处理,变成二进制数据后才能送到计算机进行编辑和存储。,3,声音的基本特性,音频信号 所携带的信息大体上可分为语音、音乐和音响三类。 语音是指具有语言内涵和人类约定的特殊媒体; 音乐是规范的符号化了的声音; 音响指其他自然声音,如动物的叫声、机器的轰鸣声、风雨雷电声等;,4,音频信号的特征,声音机械振动产生声波。 声波可以用一条连续的曲线来表示,它在时间和幅度上都是连续的,称为模拟音频信号。,5,声音的物理特性,频率/带宽 单位时间内声源振动的次数或空气中气压疏密变化的次数,称为声源的频率f,单位赫兹(Hz) 频带宽度或称之为带宽,它描述组成复合信号的频率范围,6,频谱,乐器很少产生单一频率的纯音,而是复音。 复音的产生基于物体的复杂振动,可以分解为许多不同振幅和不同频率的简谐振动(即看成简谐振动的叠加)。 简谐振动的振幅按频率排列的图形称为频谱。频谱可一目了然地看出复杂振动的频率结构。,钢琴的复音频谱,基频为253Hz,7,音频信号的质量指标,频带宽度 音频信号所包含的谐波分量越丰富,音色越好。在广播通信和数字音响系统中,以声音信号所包含的谐波分量的频率范围来衡量声音的质量,即带宽。,不同质量的声音的频带对比示意图,8,声音的数字化,数字化就是将连续信号变成离散信号。 对音频信号,首先在时间上离散,取有限个时间点,称为采样。 然后在幅度上离散,取有限个幅度值,称为量化。 再将得到的数据表示成计算机能够识别的格式,称为编码。,9,PCM编码,PCM是一种把模拟信号转换成数字信号的最基本的编码方法,它主要包括采样、量化和编码3个过程。,是一种最通用的无压缩编码,特点是保真度高,解码速度快,但编码后数据量大,CD就是采用这种编码方式。,10,量化位数,11,数字音频的技术指标,采样频率 采样频率是指一秒钟采样的次数。采样频率越高,单位时间内采集的样本数越多,得到波形越接近于原始波形,音质就越好。 根据奈奎斯特(Harry Nyquist)采样理论:如果采样频率高于输入信号最高频率的两倍,重放时就能从采样信号序列无失真地重构原始信号。例如,话音的信号频率约为3.4 kHz,若采样频率选为8kHz,就能无失真地重放原始声音。,12,常用采样频率,11.025kHzAM广播 22.05kHz FM广播 44.1kHz CD高保真音质声音 现在声卡的采样频率一般为48kHz甚至96kHz。,13,采样精度,采样精度用每个声音样本的位数表示,也叫样本精度或量化位数。它反映度量声音波形幅度的精度。 例如,每个声音样本用16位表示,则量化样本值在065535的整数范围内,它的精度是输入信号的1/65536 采样精度影响到声音的质量 位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。,14,声道数,单声道(mono)信号一次产生一组声波数据。如果一次产生两组声波数据,则称其为双声道或立体声(stereo)。 双声道在硬件中占两条线路,一条是左声道,一条是右声道。 立体声不仅音质、音色好,而且能产生逼真的空间感。但立体声数字化后所占空间比单声道多一倍。,15,音频数据传输率,音频信号数字化后,产生大量数据 产生数据的速度或播放声音时需要传输数据的速度影响声音的播放质量。数据传输率用每秒钟传输的数据位数表示,记为bps(bit per second)。 未经压缩的数字音频数据传输率为: 数据传输率(bits)=采样频率(Hz)量化位数(bit)声道数,16,例,高保真立体声数字音频的量化位数为16,试计算其数据传输率 解:高保真立体声数字音频采样频率为44.1kHz,双声道,其数据传输率为 数据传输率=44.1(kHz)16(bit)2(channel)=1411.2(kbps) 如果采用PCM编码,数字音频文件所占用的空间可用如下的公式计算: 音频数据量(Byte)=数据传输率持续时间8(bit/Byte) 其中数据量以字节(Byte)为单位;数据传输率以每秒比特(bps)为单位;持续时间以秒(s)为单位。,17,例,计算1分钟未经压缩的高保真立体声数字声音文件的大小。 解:高保真立体声数字音频采样频率为44.1kHz,16位量化,双声道,其数据传输率为: 数据传输率=44.1(kHz)16(bit)2(channel)=1411.2(kbps) 1分钟这样的声音文件的大小为 音频数据量=1411.2(kb/s)60(s)/8(bit/Byte)=10584kB 未经压缩的4分钟的歌曲文件约42M数据.,18,数字音频文件格式,数字声音文件格式是数字音频在磁盘文件中的存放形式,相同的数据可以有不同的文件格式,而不同的数据也可以有相同的文件格式. WAVE文件格式 WAVE文件是一种通用的音频数据文件,文件扩展名为“WAV”,Windows系统和一般的音频卡都支持这种格式文件的生成、编辑和播放。 CD激光唱盘中包含的就是WAVE格式的波形数据,只是扩展名没写成“.WAV”。一般说来,声音质量与其WAVE格式的文件大小成正比。 WAVE文件的特点是易于生成和编辑,但在保证一定音质的前提下压缩比不够,不适合在网络上播放,19,MP3文件,MP3文件是采用MP3算法压缩生成的数字音频数据文件,以“.MP3”为文件后缀。 MP3利用MPEG(Motion Picture Expert Group,运动图像专家组)制定的MPEG-1 Audio layer 3的压缩标准,将音频信息用10:1甚至12:1的压缩率,变成容量较小的数据文件。 MPEG1压缩主要用于VCD数据的压缩,也用来压缩不包含图像的纯音频数据,音频压缩算法包括MPEG Audio Layer1、MPEG Audio Layer2等,而MPEG Audio Layer3有很高的压缩比。 MP3是一种利用了人类心理声学特性的有损压缩,人耳基本不能分辨出失真,音质几乎达到了CD音质标准。按照这种算法,10张CDDA的内容可以压缩到l张CDROM中,而且视听效果相当好。,20,RA文件,Real Audio是Real networks推出的一种音乐压缩格式,它的压缩比可达到96:1,因此在网上比较流行。经过压缩的音乐文件可以在通过速率为14.4kbs的MODEM上网的计算机中流畅回放。其最大特点是可以采用流媒体的方式实现网上实时播放,即边下载边播放。,21,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025河北邢台清河县职业技术教育中心招聘人事代理教师30人考试参考题库及答案解析
- 2025云南丽江现代花卉产业园招聘景区运营专员5人考试参考题库及答案解析
- 2025中国人民大学校园建设中心招聘1人考试模拟试题及答案解析
- 2025山东临沂工学院(筹)招聘专任教师、行政教辅人员130人考试模拟试题及答案解析
- 2025年合肥市新安江路小学教师招聘备考考试试题及答案解析
- 2025吉林长春内镜中心洗消工招聘考试参考题库及答案解析
- 2025天津津湾大剧院招聘舞美电工岗备考模拟试题及答案解析
- 企业投资合作协议范本及风险管控要点
- 2025年芜湖镜湖区张家山社区卫生服务中心紧急公开招聘2名考试模拟试题及答案解析
- 2025浙江温州市苍南县县域医共体联合招聘卫生专业技术人员31人考试模拟试题及答案解析
- 业余少体校管理办法
- 天津校外培训管理办法
- 小学生晨会课件
- 依法治校视角下高校后勤管理法律风险的识别与化解策略
- 2025至2030锆英砂行业市场发展分析及发展趋势与投资报告
- DB44∕T 2499-2024 海堤生态化建设技术导则
- 地质灾害诱因成因分析方法-洞察阐释
- 护林防火培训
- 大小便失禁护理指南
- 物业弱电维修课件
- 部编版语文(2024)二年级上册第一单元综合素养测评A卷(含答案)
评论
0/150
提交评论