版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、南通大学计算机应用教研室,1,2章声音和语音编码,2,南通大学计算机应用教研室,牙齿章节的主要内容,声音概述声音的数字电子合成音乐语音代码脉冲代码调制(PCM) PCM应用其他编码方法,3,南通大学计算机应用教研室,2.1声音概述,声音为声音,是专业音频设备的曹征尺度中常见的相对单位(例如增益大小、衰减量、上升量、平面量等)。dB数=20lgA/B,但是在电源、音响强度和能量级别,DB数=10lgA/B表达式中,A定义为电压、电流等的比较绝对量。b是比较的标准量。使用DB数表示度量的优点是减少数字大小,从而使度量的显示更简单、更具体,从而简化计算。同时,变化范围广的物理量标志或刻度,非常方便。
2、(威廉莎士比亚、斯图亚特、巴姆),6,南通大学计算机应用研究室,2.1声音概述(继续),音宽和频带:称为频带宽度或带宽,说明构成复合信号的频率范围。图2.1声音的波段,7,南通大学电脑应用研究室,2.1.1音频信号的指标,1。频带宽度:音频信号的频带越宽,包含的音频信号分量越丰富,音质就越好。图2.2声音的频带宽度,8,南通台电脑应用研究室,2.1.1音频信号的指标(继续),2动态范围:动态范围越大,信号强度的相对变化范围越大,音响效果越好。动态范围20log(信号的最大强度/信号的最小强度)单位:(dB),表2.1声音的动态范围,语调,9,南通大学电脑应用实验室,2.1.1音频信号的指标(继
3、续),三大噪声比噪音可分为环境噪音和设备噪音信噪比越大,声音质量越好。10、南通大学电脑应用研究室、牙齿章节的主要内容、声音的数字电子合成音乐语音代码脉冲代码调制(PCM) PCM应用节目其他编码方法、11、南通大学电脑应用研究室、2.2声音的数字化、模拟和数字信号声音信号的数字采样频率采样精度声音质量和数据速率、12、南通大学采样测量模拟信号在某一时刻的振幅,并在时间上离散化量化采样信号振幅的值,从而离散化采样信号振幅的值。如果样本振幅为0,255,离散化方法在值0,1,2,255采样和量化后得到的信号是数字信号,13,南通大学电脑应用实验室,2.2.1模拟信号转换为数字信号,为什么要从模拟
4、信号转换为数字信号?以前,在远距离音响传输中,用传记信号模拟声波,处理传记信号,使用模拟传记部件,受到环境的巨大影响(温度、电磁场干扰),很难纠正错误。使用数字信号和数字信号处理器(DSP)进行数学计算对环境的影响较小,具有容错性。14,南通大学电脑应用研究室,2.2.1数字信号处理的优点,数字信号计算是不受时间和环境变化影响的准确计算方法。用数学操作实现(模拟)原始物理部件的能力相对容易。无需更换物理部件(DSP),即可更改数学计算方法以执行多种功能。这意味着您只需对DSP进行编程。,15,南通大学电脑应用研究室,2.2.2声音信号数字化,声音信号数字化阶段:采样量化一个小时内的离散振幅值,
5、通过连续时间的离散化,通过采样,通常量化统一采样连续宽度的离散化。南通大学计算机应用研究室,2.2.2语音信号的数字化(图),图2.3语音信号的数字化,17,南通大学计算机应用研究室,采样和量化示例,如果有声音信号的话,采样和量化。量表是四舍五入为1,2,3,4,5,6,7,8的方法。结果如下表2.2,18,南通大学计算机应用研究室,2.2.2声音信号数字化,目前比较广泛的采样方法:奈奎斯特(Nyquist)采样正交采样带通采样Sigma-Delta()采样等,19,量化的准确性?每秒钟采样数(Bps),20,南通大学计算机应用实验室,2.2.3采样频率,采样频率是在一秒内采样的次数。Nyqu
6、ist theory :模拟信号采样后,采样后可恢复的最大信号频率只有采样频率的一半。或者,只要采样频率至少是输入信号最大频率的两倍,就可以在采样信号系列中重新配置原始信号。21,南通大学计算机应用研究室,2.2.3采样频率,奈奎斯特采样定理3360 fs=2 fmax fs是采样频率,fmax是信号最大频率,fmax是声音信号的最大频率。在实际应用中,fs需要2.5倍以上的fmax,以提高输入信号的信噪比,从而更容易实现高级别消除锯齿滤镜。22,南通大学计算机应用研究室,2.2.3采样频率,根据斯特采样定理,CD激光光盘采样频率为44KHz,可记录的最高音频为22KHz,这种音质与远视声音几
7、乎没有区别。这就是我们常说的超高保真音质。声音样本的三个茄子标准频率分别为44.1KHz 22.05KHz 11.025KHz。23,南通大学计算机应用研究室,2.2.3采样频率,人耳听觉上限为20KHz,根据奈奎斯特的理论,数字音频的采样频率应为40 KHz,为什么规定了44.1 KHz等特殊标准?在处理模拟声音信号时,在20KHz时有明显的衰减,因此需要大于44 KHz的50Hz和60Hz(国际通用的两个茄子交流频率)的共同倍数的数据,以便将信号阻塞频率提高到22 KHz,从而最大限度地减少交流纹波的负面影响。24,南通大学计算机应用研究室,2.2.4量化精度量化数量级,量化位数是模拟音频
8、信号的振幅轴数字化,确定模拟信号数字化后的动态范围。由于计算机按字节计算,所以一般的量化位数为8位和16位。量化位越高,信号的动态范围越大,数字化音频信号越接近原始信号的可能性越大,但是所需的存储空间也越大。您银行的存款位数,25,南通大学计算机应用研究室,2.2.4量化精度量化数量级,例如,如果用8位表示一个声音样本,则样本值为0到255之间的256个整数值。此时,采样精度为1/256。量化精度、存储空间、声音(了解),26,南通大学计算机应用研究室,2.2.4正合适度信噪比,信噪比SNR(signal-to-noise ratio)公式:SNR=10日志(Vsignal) 2如果采样精度为
9、8位,则Vsignal28的信噪比:SNR=20 log(v signal/v noise)=20 log(28/1)=20 * 8 * log 2=表2-表2也称为立体声声音,两个频道在硬件上占据两条线路,音质和音色很好,但是在立体声数字化后,它所占用的空间是单声道的两倍。数据速率:每秒比特数,(bps)。数据速率是计算机处理时必须掌握的基本技术参数。声音质量和数据速度的对应包括教材表2-1 p11,31,南通大学电脑应用研究室,牙齿章节的主要内容,声音的数字电子合成音乐语音代码脉冲代码调制PCM应用节目其他编码方法,32,南通大学电脑应用研究室,2.3电子合成音乐MIDI,乐器数字介面MI
10、DI (Musice)需要播放牙齿歌曲时,按照录制的乐谱指示,通过音乐合成器生成和放大音乐声波,然后在扬声器上播放。33,南通大学计算机应用研究室,2.3.1 MIDI术语,一,音乐合成器:用于创建和修改正弦波的叠加,然后通过声音生成器和扬声器发出特定声音。泛音的合成决定了声音的音质。第二,复调音:简称Polyphony,是指合成器同时演奏多个音时发出的声音。集中在同时演奏的音符数上。34,南通大学计算机应用研究室,2.3.1 MIDI术语,3,Timbre:指同时演奏多种茄子不同乐器时发出的声音。集中在同时演奏的乐器的数量上。第四,MIDI标准1,MIDI电子乐器:能够生成特定声音的合成器,
11、数据传输符合MIDI通信约定。35,南通大学计算机应用研究室,2.3.1 MIDI术语,2,MIDI信息(message)或指示:以乐谱的记录形式对应于乐谱语言。3,MIDI介面(interface):MIDI硬件网络协议4,MIDI通道(channel):共16个通道,每个通道一个逻辑合成器,36,南通大学电脑应用实验室,2.3.1,37电脑可以通过音序软件收集MIDI电子乐器发出的一系列指令。一系列牙齿命令可以写入MIDI文件。在计算机上,音频排序器可以编辑和修改MIDI文件。最后,将MIDI命令发送到音乐合成器,合成器解释MIDI命令符号,生成波形,然后通过声音生成器将其发送到扬声器进行
12、播放。,38,南通大学计算机应用研究室,2.3.2计算机上的MIDI生成过程,图2.4 MIDI生成过程,39,南通大学计算机应用研究室,2.3.3 MIDI合成生成方式,1,频率调制合成(合成方法结合波形,理论上可以有无限多的波形集,但实际上不能其泛音的合成和模拟比较困难,实际质量不高。2、波表合成的原理是在ROM中存储了各种实际乐器的声音样本。如果需要,调用相应的样本合成该乐器的音乐。ROM容量越大,合成效果越好,价格也越贵。40,南通大学计算机应用研究室,2.3.4两个茄子音频档案比较,表2-4 MIDI与WAVE档案比较,41,南通大学计算机应用研究室,牙齿章节的主要内容,声音概述声音
13、的数字电子合成音乐语音编码(教材第3章)脉冲代码调制PCM特征:比特率高,PCM特征可以分为PCM、ADPCM、M等期间波形编码。频域波形编码,如子频带编码(SBC)、自适应变换编码等。参数编码从源信号的一个域中提取要素参数,并将其转换为数字代码流。特征:比特率低,解码后质量低,延迟大。示例:各种博科圣地。线性预测编码(LPC),43,南通大学电脑应用实验室,2.4语音编码实现方法,混合编码将牙齿两种茄子方法混合在一起。低比特率可以获得高质量,适当的延迟,复杂。示例:GSM中的语音编码。44,南通大学计算机应用研究室,语音代码历史:数字电话(1),波形代码PCM原理(37年,法阿列利斯)电子管PCM(46年,贝尔实验室)电晶体PCM(62年,西华Fade lo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肺癌化疗的护理方法
- 2024-2025学年度计算机四级通关题库附答案详解(培优A卷)
- 香水科普小讲堂
- 2024-2025学年全国统考教师资格考试《教育教学知识与能力(小学)》每日一练试卷及参考答案详解【A卷】
- 2024-2025学年医院三基考试复习提分资料含答案详解(满分必刷)
- 胃肠道恶性肿瘤综合治疗方案
- 2024-2025学年度火电电力职业鉴定全真模拟模拟题【A卷】附答案详解
- 肌肉扭伤康复方案
- 2024-2025学年度一级建造师模拟试题及答案详解(名校卷)
- 肝性脑病急救护理要点
- 2026广西桂林市从“五方面人员”中选拔乡镇领导班子成员139人考试备考题库及答案解析
- 2026年职业卫生培训考试试题及答案
- 2025-2030中国别墅产业投资战略规划及前景方向分析研究报告
- 2026“才聚齐鲁成就未来”山东铁投集团春季社会招聘23人易考易错模拟试题(共500题)试卷后附参考答案
- 安徽省江南十校2026届高三上学期综合素质检测英语试卷(含音频)
- 2026年安徽国际商务职业学院单招职业技能测试题库含答案详解(能力提升)
- 2026山东青岛新泊控股集团有限公司社会招聘10人笔试模拟试题及答案解析
- 2026年山东春季高考烹饪类专业知识(理论)模拟试题
- T-CASEI 026-2023 在役立式圆筒形钢制焊接储罐安全附件检验技术标准
- 深静脉穿刺置管术操作规程
- 武汉大学教职工重大疾病补助网上申报操作说明
评论
0/150
提交评论