




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
音频信号 1 2 1数字音频基础 音频信息涉及人耳所能听到的声音信息 包括语声和乐声 据统计 人类从外界获得的信息大约有16 是从耳朵得到的 由此可见音频信息在人类获得信息方面的重要性 2 2 1 1认识声波 周期 声源完全振动一次所需要的时间频率 单位时间内声波的周期数振幅 振幅是指在振动过程中 质点偏离平衡位置的最大值 常用 表示 3 频域特性是指的声音信号是由很多的正弦分量组成的 从频谱分析来看 大多数声音都是由线状谱和连续谱组成的 从幅度来看 连续谱相比于线状谱来说比较弱 正是有了这些连续频谱成分 使声音显得生动 活泼 真实 常用声波频率 声压 声强等参数来描述声音 2 1 2音频信号特性 4 2 1 3人耳听觉特性 响度 音调和音色称为人耳听觉特性的三要素 音调 基音 由发音体的振动频率决定 频率高则音调高 频率低则音调低 音色 指音的感觉特性 取决于谐波成分 响度 声音的大小 幅值 5 1模拟音频信号的物理特征 频率 体现音调的高低 单位Hz幅度 体现声音的强弱 单位dB谐波 体现音色的优美程度 可听频率带宽 音频 20Hz 20kHz 6 时间 秒 时间 秒 女生信号时域波形 男生信号时域波形 7 频率 Hz 男生信号幅度频谱 频率 Hz 女生信号幅度频谱 8 按频带区分音频信号 9 常见声音的分贝量级 声音的响度特点 10 2听觉的掩蔽效应一个频率声音的听阈由于另一个声音的存在而上升的现象称为掩蔽 在安静的环境中人耳刚能够感觉到的最小声音强度成为静掩蔽门限 图2 1静掩蔽门限曲线图 当有一个强度为70dB 频率为1kHz的纯音出现时 与静掩蔽门限曲线混合 形成新的同掩蔽门限曲线 11 1 频谱掩蔽效应 图2 2同掩蔽门限曲线图 12 2 时间掩蔽效应声压强度大的声音信号出现之前和之后的短暂时间内已存在的弱音信号也会被强音信号掩蔽掉 分别称为前掩蔽 20ms 和后掩蔽 100 200ms 13 3声音质量评价 声音质量与带宽有关 频率范围越宽 声音质量越高 1 声音质量分级 按照声音信号的频率范围将声音质量分为5级 2 信噪比 SNR 即有用信号与噪音信号的强度之比 对于声卡或音箱则是其产生的最大不失真声音信号强度与同时发出的噪音强度之比 单位是分贝 14 3 声音主观质量的度量 主观度量就是大多数人对声音质量的感觉 15 2 1 4声音的数字化 16 1 抽样 将时间上连续的音频信号波形按一定的时间间隔取出样值 形成在时间上离散的脉冲序列 称为抽样 或采样 17 1 抽样 根据抽样定理 如果抽样频率 fs 大于模拟信号上限频率 fM 的2倍 即fs 2fM 就不会在抽样中丢失有用信息 人类能够听到的声音上限频率大致为20kHz 在声音数字化时 为保证质量 其抽样频率fs应大于40kHz 应用提示 18 2 量化 将抽样值相对于振幅进行离散的数值化的操作称为量化 均匀量化法 19 3 编码 编码指的是将抽样 量化所得的量值变换为二进制码 量化值的二进制编码 20 第2章音频技术及应用 21 2 2音频信号压缩编码 2 2 1音频压缩编码方法2 2 2音频压缩编码的国际标准2 2 3我国的音频压缩编码技术 22 2 2 1音频压缩编码方法 1 依据 声音信息中存在着多种冗余听觉器官的不敏感性采样的标本中存在着相关性2 压缩算法通常应能满足下列需求压缩倍数高 压缩后的数据率低 解码后的信号失真小 质量高 算法简单 执行速度快 延迟时间短 编码器 解码器的成本低 23 2 2 1音频压缩编码方法 时域压缩 波形编码 子带压缩变换压缩混合编码 24 2019 12 28 25 1 时域压缩 原理 直接针对音频PCM码流的样值进行处理 通过静音检测 非线性量化 差分等手段对码流进行压缩 G 711ADPCM线性预测编码码激励线性预测编码块压扩技术特点 方法简单 数码率较高 在64Kbps至32Kbps之间音质优良 当数码率低于32Kbps的时候音质明显降低 16Kbps时音质非常差 26 2 子带压缩 原理 将信号分解为若干子频带内的分量之和 对各子带分量根据不同的分布特性采取不同的压缩策略以降低码率 特点 划分多个子带 各频带内噪声受到限制 不会相互干扰 动态分配比特数 压缩效率高 27 3 变换压缩 原理 对一段音频数据进行 线性 的变换 对所获得的变换域参数进行量化 传输 DolbyAC 2ASPECPAC特点 信号的短时功率谱对变换域参数进行合理的动态比特分配可以使音频质量获得显著改善 计算复杂度高 变换域压缩具有一些不完善之处 如块边界影响 预回响 低码率时声音质量严重下降 28 2 2 2音频压缩编码的国际标准 1 G 7xx语音编码标准2 MPEG音频编码标准3 移动通信语音编码标准4 Dolby音频编码标准5 保密通信电话标准 29 1 G 7xx语音编码标准 G 7xx主要应用于电话语音编码 300 3400Hz G 711 PCM64kbit sG 721 ADPCM32kbit sG 726 40k 32k 24k 16kbit sG 723 1 CELP5 3 6 3kbit sG 728 CELP16kbit sG 729 CELP8kbit s 波形编码 码激励预测编码 30 2 MPEG音频编码标准 1 MPEG 1MPEG 1音频编码的信号频带是20 20kHz 取样频率使用的是32kHz 44 1kHz和48kHz 采用的编码算法是感知子带编码 国际标准化组织下属的运动图像专家组 MPEG 制定图像编码标准时 也制定了音频编码标准 MPEG压缩编码是对声音频带 20Hz 22kHz 的编码 31 MPEG系统的基本框架 层次 用混合带通滤波器提高频率分配率 采用非均匀量化 自适应分段和量化值熵编码技术 每通道64kbit s 层次 采用自适应的比特分配 子带低频量化精度为4bit 中频段为3bit 高频段为2bit 比例因子为6bit 高保真度码率为128kbit s 层次 将音频信号输入按一定格式固定分割成32个子带 子带系数的量化精度为4bit 比例因子为6bit 单声道码率为192kbit s MPEG 1 32 MPEG 1音频编码三个编码层次主要技术特点 MPEG 1 33 2 MPEG音频编码标准 2 MPEG 2MPEG 2BC是在MPEG 1的基础上发展来的 是MPEG为多声道声音开发的低码率编码方案 并与MPEG 1的声音标准保持后向兼容 MPEG 2AAC AdvancedAudioCoding 是MPEG 2标准中一种非常灵活的编码标准 采用感知编码方法 主要是利用听觉系统的掩蔽特性来减少声音编码的数据量 并且通过子带编码将量化噪声分散到各个子带中 用全局的声音信号将噪声掩蔽掉 34 2 MPEG音频编码标准 3 MPEG 4MPEG 4音频编码综合了多种类型的音频编码 MPEG 4音频编码标准集成了从话音到高质量的多声道声音 从自然声音到合成声音 采用的编码方法有多种 包括参数编码 码激励线性预测编码CELP 时间 频率编码 结构化声音SA编码和文 语系统TTS的合成声音 35 3 移动通信语音编码标准 1 欧洲数字蜂窝电话标准全速率13kbit s半速率5 6kbit s增强的全速率12 2kbit s自适应多速率 8种速率4 75 12 2kbit s 36 3 移动通信语音编码标准 2 北美数字蜂窝电话标准IS 96 A变速率编码 0 8 8kbit s IS 127增强型变速率IS 733用于个人通信 1 8 14 4kbit s IS 54全速率语音编码标准7 95kbit sIS 641 A增强的全速率语音编码 3 日本数字蜂窝电话标准VSELP全速率6 7kbit s 与IS 54类似 PSI CELP半速率3 6kbit s 37 4 Dolby音频编码标准 AC 1 常用于卫星通信和数码有线广播AC 2 用于专业音频的传输和存储AC 3 数字多声道音频处理技术DolbyE 数字电视音频编码系统 38 5 保密通信电话标准 美国国防部制定了一系列应用于保密通信的语音编码标准 1984年 FS 1015标准 2 4kbit sLPC 10e1991年 FS 1016标准 4 8kbit sCELP2 4 1 2kbit sMELP 混合激励线性预测 39 2 2 3我国的音频压缩编码技术 AVS标准是 信息技术先进音视频编码 系列标准的简称 包括系统 视频 音频 数字版权管理4个主要技术标准和一致性测试等支撑标准 40 1 WAV文件 波形文件 微软开发 需要的存储量大 多用于存储简短的声音片段和旁白 2 MIDI文件 记录的是生成音乐的指令 MIDI文件短小 由于MIDI记录的并不是真正的声音 所以不同的声卡 不同软波表 不同硬件音源的音色是不相同的 相同的MIDI文件在不同的设备上播放也会有不同的效果 MIDI文件适合作为背景音乐来播放 3 MP3文件 是MPEG音频第3层的简称 有损压缩 压缩比达12 1 MP3利用人耳的掩蔽特性 削减音频中人耳听不到的成分 同时尽可能地维持原来的声音质量 4 RA文件 属于RealMedia的音频部分 采用流式传输方式 可以在非常低的带宽下提供足够好的音质让用户能在线聆听 5 WMA文件 WindowsMedia的音频部分 无损压缩 支持多声道编码 6 AC3文件 又叫杜比数码环绕立体声 压缩比10 1 提供的环绕声系统由5个全频域声道和1个超低音声道组成 称为5 1声道 一般作为DVD的伴音 数字音频文件的格式 41 音频信号文件格式 某个音频文件格式实际上是与研制它的机构有关联的 Wave WaveAudioFiles 文件 其扩展名为WAV Wave格式是Microsoft公司开发的一种声音文件格式 它来源于对声音模拟信号波形的采样 AIFF文件 其扩展名为AIF或AIFF AIFF是音频交换文件格式 AudioInterchangeFileFormat 的英文缩写 这种声音文件格式是由苹果计算机公司开发的 被Macintosh平台及其应用程序所支持 Audio文件 其扩展名为AU Audio文件是SunMicrosystems公司推出的一种经过压缩的数字声音格式 是Internet中常用的声音文件格式 NetscapeNavigator浏览器中的LiveAudio也支持Audio格式的声音文件 Sound文件 其扩展名为SND Sound文件是NeXTComputer公司推出的数字声音文件格式 支持压缩 42 VQF 就是TwinVQFiles是由NipponTelegraphandTelephone NTT 开发的一种音频压缩技术 无论在音频压缩率还是在音质上 VQF比MP3都有较大的优势 当然技术上的优势并不代表市场上的优势 Voice文件 其扩展名为VOC Voice文件是CreativeLabs 创新公司 开发的声音文件格式 多用于保存CreativeSoundBlaster 创新声霸 系列声卡所采集的声音数据 被Windows平台和DOS平台所支持 支持CCITTA Law和CCITT Law等压缩算法 每个VOC文件由文件头块 headerblock 和音频数据块 datablock 组成 文件头包含一个标识版本号和一个指向数据块起始的指针 数据块分成各种类型的子块 如声音数据静音标识 ASCII码文件重复的结果重复以及终止标志 扩展块等 MPEG音频文件 扩展名为MP1 MP2 MP3 RealAudio文件 其扩展名为RA RM RAM RealAudio文件是RealNetworks公司开发的一种新型流式音频 StreamingAudio 文件格式 它包含在RealNetworks公司所制定的音频 视频压缩规范RealMedia中 音频文件的格式 43 第2章音频技术及应用 44 2 3音频技术应用示例 IP电话 2 3 1IP电话的语音编解码技术2 3 2IP电话的三种实现方式 45 2 3 1IP电话的语音编解码技术 G 723 1编码器是VoIP论坛选用的IP电话语音编码器之一 G 729A在噪声较大的环境下有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年山西省河津市中考数学常考点试卷附答案详解【黄金题型】
- 2025年常州市交通运输局下属事业单位招聘社会化用工笔试高频难、易错点备考题库带答案详解
- 招商银行宁波市宁海县2025秋招笔试专业知识题专练及答案
- 浦发银行荆州市沙市区2025秋招笔试英文行测高频题含答案
- 浦发银行重庆市沙坪坝区2025秋招群面案例总结模板
- 期货从业资格之期货投资分析题库练习备考题含答案详解(模拟题)
- 民生银行北京市大兴区2025秋招信息科技岗笔试题及答案
- 中信银行宁波市镇海区2025秋招小语种岗笔试题及答案
- 民生银行洛阳市偃师区2025秋招无领导模拟题角色攻略
- 2025年浙江衢州江山市事业单位招聘高层次紧缺人才27人笔试备考题库及答案详解1套
- 儿科常用急救技术
- IT运维服务合同(模板)7篇
- 网络安全培训课件
- 呼吸困难的急诊处理
- C172机型机身6章培训
- 2025年国有企业管理岗竞聘笔考试试题库及答案
- (完整word版)高中英语3500词汇表
- 四级单词完整版excel
- 植物生理学第十三章植物的逆境生理课件
- 生活老师管理制度(7)
- 车用驱动电机原理与控制基础PPT课件(200页)
评论
0/150
提交评论