音频处理技术_第1页
音频处理技术_第2页
音频处理技术_第3页
音频处理技术_第4页
音频处理技术_第5页
已阅读5页,还剩34页未读 继续免费阅读

音频处理技术.ppt 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

音频处理技术 知识点 1 声音的基本概念2 音频数值化过程3 常用音频压缩技术4 常用的音频存储格式 课后作业 1 什么是声音 声音三要素是什么 2 声音数字化的三个步骤是 3 什么是采样频率 4 采样的量化位数与音频质量成反比 与存储空间成正比 这句话正确吗 为什么 5 常用的音频压缩技术有哪些 1 声音的基本概念 1 1什么是声音声音是由物体振动产生 正在发声的物体叫声源 声音以声波的形式传播 声音只是声波通过固体或液体 气体传播形成的运动 声波振动内耳的听小骨 这些振动被转化为微小的电子脑波 它就是我们觉察到的声音 1 2声音特性 一 响度 loudness 人主观上感觉声音的大小 俗称音量 由 振幅 amplitude 和人离声源的距离决定 振幅越大响度越大 人和声源的距离越小 响度越大 单位 分贝dB 二 音调 pitch 声音的高低 高音 低音 由 频率 frequency 决定 频率越高音调越高 频率单位Hz hertz 赫兹正常人能够听见20Hz到20000Hz的声音 而老年人的高频声音减少到10000Hz 或可以低到6000Hz 左右 人们把频率高于20000Hz的声音称为超声波 低于20Hz的称为次声波 超声波 高于20000Hz 和正常声波 20Hz 20000Hz 遇到障碍物后会向原传播方向的反方向传播 而部分次声波 低于20Hz 可以穿透障碍物 俄罗斯在北冰洋进行的核试验产生的次声波曾经环绕地球6圈 超低频率次声波比其他声波 10Hz以上的声波 更具对人的破坏力 一部分可引起人体血管破裂导致死亡 但是这类声波的产生条件极为苛刻 能让人遇上的几率很低 人的发声频率在100Hz 男低音 到10000Hz 女高音 范围内 三 音色 musicquality是指声音的感觉特性 不同的发声体由于材料 结构不同 发出声音的音色也不同 这样我们就可以通过音色的不同去分辨不同的发声体音色是声音的特色 根据不同的音色 即使在同一音高和同一声音强度的情况下 也能区分出是不同乐器或人发出的 同样的音量和音调上不同的音色就好比同样色度和亮度配上不同的色相的感觉一样 2 声音信号的数字化 2 1模拟音频与数字音频的区别自然声音是连续变化的 人类最早记录声音的技术是利用一些机械的 电的或磁的参数随着声波引起空气压力的连续变化而变化来模拟和记录自然的声音 例如麦克风 当人对着麦克风讲话时 麦克风能根据它周围空气压力的不同变化而输出相应的连续变化的压力值 这种变化的电压值便是一种对人类讲话声音的模拟 称为模拟音频 它把声音的压力变化转变为电压信号 当输出连续变化的电压值到录音机时 通过相应的设备将它转换成对应的电磁信号记录在录音磁带上 因而便记录了声音 而数字化音频的获得是通过每隔一定时间间隔测一次模拟音频的值 如电压 并将其数字化 这一过程称为采样 每秒钟采样的次数称为采样率 一般地 采样率越高 记录的声音越自然 反之 将失去声音的自然特性 这一现象称为失真 由模拟量转变为数字量的过程称为模 数转换 A D 由上可知 数字音频是离散的 而模拟音频是连续的 数字音频的好坏与采样率密切相关 2 声音信号的数字化 由上节可知 自然界的声音是一种模拟的音频信号 是连续量 而计算机只能处理离散的数字量 这就要求必须将声音数字化 数字化声音优点 一 传播时抗干扰能力强 存储时重放性能好二 易处理 能进行数据压缩三 可纠错 容易混合 音频信号数字化的关键步骤是采样 量化和编码2 2采样把模拟音频转成数字音频的过程 就称作采样 所用到的主要设备便是模拟 数字转换器 AnalogtoDigitalConverter 即ADC 与之对应的是数 模转换器 即DAC 采样的过程实际上是将通常的模拟音频信号的电信号转换成二进制码0和1 这些0和1便构成了数字音频文件 2 2 1采样频率每秒钟的采样样本数叫做采样频率 采样频率越高 数字化后声波就越接近于原来的波形 即声音的保真度越高 但量化后声音信息量的存储量也越大 采样频率与声音频率之间的关系 根据采样定理 只有当采样频率高于声音信号最高频率的两倍时 才能把离散模拟信号表示的声音信号唯一地还原成原来的声音 目前在多媒体系统中捕获声音的标准采样频率定为44 1kHz 22 05kHz和11 025kHz三种 分别对应 高保真立体声级 20Hz 20kHz调幅广播级 50Hz 7kHz电话语音级 300Hz 3 4kHz 2 2 2采样位数采样位数可以理解为采集卡处理声音的解析度 这个数值越大 解析度就越高 录制和回放的声音就越真实 采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度 8位代表2的8次方 256 16位则代表2的16次方 64K 比较一下 一段相同的音乐信息 16位声卡能把它分为64K个精度单位进行处理 而8位声卡只能处理256个精度单位 造成了较大的信号损失 最终的采样效果自然是无法相提并论的 2 3量化将采样后的音效信息数字化的过程称为量化量化精度 表示每个声音样本值采用的二进制数反映了度量声音波形幅度的精度 例如 每个声音样本用16位表示 测得的声音样本值为0 65536 它的精度就是1 65536 样本位数的大小影响到声音的质量 位数越多 声音的质量越高 而存储所需的空间越多 2 4编码数字化的波形声音是一种使用二进制表示的比特流 它遵循一定的标准或规范进行编码 由于声音的数字化 将有大量的数据需要计算机存储 如果不对这些数据进行压缩 则很难在计算机上实现多媒体功能 例如 10分钟44 1KHz 16位 双声道立体声需要 MB 数据之所以可以压缩是因为原始信源数据有很大冗余度 人类的生理特性决定只能听到20Hz 20KHz范围内的声音 因而可以实现高压缩比 2 5重构数字化声音若要重新播放还必须经过解码 D A转换和插值解码是编码的逆过程D A转换是将数字量转换为模拟量便于扬声器发音插值是为了弥补采样过程中引起的语音信号失真而采取的弥补措施 3 音频信号压缩技术 常用压缩技术 脉冲编码调制 自适应脉冲编码调制 差分脉冲编码调制 自适应差分脉冲编码调制 增量调制 自适应增量调制 3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论