多媒体音频信息处理技术_第1页
多媒体音频信息处理技术_第2页
多媒体音频信息处理技术_第3页
多媒体音频信息处理技术_第4页
多媒体音频信息处理技术_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多媒体音频信息处理技术第一页,共八十六页,编辑于2023年,星期五4.1认识声音4.1.1声音处理技术的历史回顾4.1.2声音信号的形式与特征4.1.3声音质量的评价第二页,共八十六页,编辑于2023年,星期五4.1.1声音处理技术的历史回顾1.自古以来人类很早就开始研究声音,并利用当时已掌握的声音的某些规律来制造乐器、进行建筑设计或传声装置设计等,使声音更悦耳动听或传得更远。请举出古代利用声音的例子天坛的回音壁、三音石,古代乐器,等铁路工人用铁锤敲击铁轨、医生的听诊器、行军打仗的号角鼓声这个时期,声音处理技术的特征:凭耳朵辨别声音,不能记录和存储声音第三页,共八十六页,编辑于2023年,星期五4.1.1声音处理技术的历史回顾2.机械方法记录和播放19世纪爱迪生发明留声机启发现象电话传话器里的膜板随着说话声会引起震动的现象是一种播放声音的机械装置,预先按声音波形特征刻制在唱片表面(弧形凹槽),播放时引起探针的不同幅度的振动并传递发声。第四页,共八十六页,编辑于2023年,星期五4.1.1声音处理技术的历史回顾3.电声技术依靠电信号来记录并播放声音通过电压产生模拟声波变化的电流信号,灌录成早期的唱片或磁带,这种电流信号称为模拟信号。磁带上的磁极变化或唱片音槽内的纹路起伏变化都是声音信号的变化对应成正比的。第五页,共八十六页,编辑于2023年,星期五4.1.1声音处理技术的历史回顾4.数字化声音处理技术依靠数字信号来记录并播放声音核心技术是对声音的采样。第六页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征1.什么是声音?(声音的形式)声音是一种振动波,是机械振动或气流扰动引起周围的弹性介质发生波动的现象。许多声音的波形混合在一起可能构成交响乐、交谈声,也可能完全是噪声。在物理上,声音可用一条连线的曲线来表示,它是在时间和幅度上都连续变化的量,所以称为模拟量。第七页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征2.声音的物理特征(1)频率:即声波振动的快慢,单位Hz。根据频率,声音可分为A.次声波:低于20HzB.正常声音:20Hz—20KHz(语音:300Hz—3KHz)C.超声波:高于20KHz频率的倒数为周期具有周期性的声音通常会更悦耳动听。第八页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征也可用声音的波长来描述声音波长:沿声音传播方向,振动一个周期所传播的距离;或在波形上相位相同的两个相邻点间的距离,单位m.声音的频率也反映了声音的速度声速:单位时间内声音传播的距离,单位m/s.声速、周期、波长的关系为第九页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征(2)幅度:是指信号的基线到当前波峰的距离,即声波振动的强弱,决定了信号音量的强弱程度。A.在物理上,通常用声压和声压级来衡量声音的强弱程度。声压:指在声场中某处由声波引起的压强的变化值,单位为“帕斯卡(Pa)”。正常人刚刚能听到的最微弱声音的声压为2X10-5Pa,这个声压值称为人耳的“听阈”。使人耳产生剧烈疼痛感觉的声音的声压约为20Pa,这个声压值称为人耳的“痛阈”。第十页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征经研究发现:人耳对声音强弱的感觉大体上与声压的对数成正比,称为声压级,单位为分贝(dB)分贝数的计算公式为其中P0为基准声压值,取P0=2X10-5Pa第十一页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征B.在物理上,也可用声功率和声强来衡量声音的强弱程度。声功率:是指单位时间内,声波通过垂直于传播方向某指定面积的声能量,单位为W。声强:是指单位时间内,声波通过垂直于传播方向的单位面积的声能量,单位为W/S2。声压与声强的关系为第十二页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征也可用声功率或声强计算声音分贝数,分别称为声功率级LW和声强级LI,其公式为声强级与声压级的关系为其中W0=10-12w,

I0=10-12w/s2b与媒介的声特性阻抗有关,因此与空气的温度t和压强p有关,可查表。第十三页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征(3)声音的相加和相减即两个以上独立声源作用于某一点叠加形成的声音。声音的能量(声功率W,声强I)是可以代数相加的,但声压(声压P,声压级L)不能直接相加。一些主要结论:两个声音相加,总声压级不会比其中一个大3dB以上两个声音的声压级相差10dB以上时,叠加增量可以忽略不计。第十四页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征2.声音的听觉特征(主观感受)(1)音调:即声音频率的主观反映,也称音高。一般地,音调的高低与频率的高低是一致的。当频率不变时,强度的变化对音调稍有影响(强度增大时,低频率音调显得更低,高频率音调显得更高)。(2)音色:日常生活中通常是复合音,包括基音和谐音成分。人耳对复合音中各种谐音成分总和起来的主观印象,称为音色。第十五页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征谐音的频率和振幅决定音色任何复杂的周期性振动都可分解为许多谐波,称为傅里叶定律;把复杂的振动分解成各种频率成分的过程称为傅里叶分析,也称频谱分析;分析结果称为谱图。第十六页,共八十六页,编辑于2023年,星期五4.1.2声音信号的形式与特征例如:基音为100Hz的钢琴声约有15个振幅不同的谐音基音为100Hz的黑管声约有9个振幅不同的谐音.语音:特殊的复合音,包括元音和辅音。(3)音响:即声音的响度,是声音振幅的主观属性。振幅越大,响度越大,但它们也不是线性关系。音乐中的音阶:就是按频率的对数取等分来确定的。每八度的声音,其频率就升高或降低一倍。第十七页,共八十六页,编辑于2023年,星期五4.1.3声音质量的评价声音质量的评价是很困难的,也是一个值得研究的课题。目前,主要有两种度量方法1.声音质量的客观度量2.声音质量的主观度量第十八页,共八十六页,编辑于2023年,星期五1.声音质量的客观度量法即用仪器对声波进行测量和分析常用仪器:声级计是一种能对声音做出类似人耳反应的仪器,它能进行客观且可重复的声压测量和声级测量。主要指标:信噪比SNR即有用信号与噪声之比,单位为分贝。一般用信号的功率计算,也可用信号的电压计算。信噪比数值越高,噪声越小。一般地,HiFi音响要求SNR达到70dB以上,CD机要求SNR达到90dB以上。第十九页,共八十六页,编辑于2023年,星期五2.声音质量的主观度量(1)评分标准5优不能察觉失真4良刚能察觉,但不讨厌3中察觉失真,稍微讨厌2差讨厌,但不令人反感1劣极其讨厌,令人反感目前这种评分标准和方法广泛应用于多媒体技术和通信中,如可视电话、电视会议、语音信箱、语音电子邮件,等。第二十页,共八十六页,编辑于2023年,星期五2.声音质量的主观度量(2)评价方法主要根据音质的三要素(音调/音色/音响)的变化和组合来主观评定音质的一些特性。例如:低频响亮—声音丰满,高频响亮—声音明亮

低频微弱—声音平滑,高频微弱—声音清澄(3)评价音质的常用听感空间感(环绕感)、定位感(方向感)、层次感(厚度感)力度感、亮度感、软硬感、松紧感、宽窄感,等第二十一页,共八十六页,编辑于2023年,星期五3.声音质量的分级与带宽从频带宽度的角度上,频带越宽,信号强度的相对变化范围就越大,音响效果就越好。第二十二页,共八十六页,编辑于2023年,星期五4.2声音的数字化方法4.2.1数字化声音的优点4.2.2声音的数字化过程4.2.3声音数据的编码方法与标准第二十三页,共八十六页,编辑于2023年,星期五4.2.1数字化声音的优点1.动态范围大若采用8bit量化,音频信号幅度可分为256个量化级,动态范围达96dB。2.信息易处理可以通过计算机对音频、视频信号进行各种特技及非线性编辑。3.媒体易保存使用时间长,采用数字化的光盘,重放时不存在机械磨损,使用寿命长。第二十四页,共八十六页,编辑于2023年,星期五4.2.1数字化声音的优点4.成本低数字化信息便于大规模集成电路的存储和处理,可降低成本。5.可靠性高数字信号只要求脉冲的有无,而不依赖信号的幅值大小,对硬件一致性和稳定性要求下降了许多,从而提高了可靠性。第二十五页,共八十六页,编辑于2023年,星期五4.2.2声音的数字化过程声音的数字化过程可分为三步1.采样2.量化3.编码第二十六页,共八十六页,编辑于2023年,星期五1.声音的采样(Sampling)(1)什么是采样?对给定的模拟声音波形信号,以适当的时间间隔采取样本值(波形的幅度值)的过程。常用器件:A/D转换器(2)采样频率即单位时间内采集样本点的个数。一般地,采样频率越高,样本点就越多,声音信号的还原效果越好。根据采样频率可分为均匀采样和非均匀采样。第二十七页,共八十六页,编辑于2023年,星期五1.声音的采样(Sampling)采样示例第二十八页,共八十六页,编辑于2023年,星期五1.声音的采样(Sampling)(3)奈奎斯特(Nyquist)定理只有采样频率高于声音信号最高频率的2倍时,才能把数字信号表示的声音还原为原来的声音。反之,建议:采样频率通常应高于原信号频率的2倍。(4)常用采样频率8,11.025,22.05,44.1(KHz)第二十九页,共八十六页,编辑于2023年,星期五2.声音的量化(Quantifying)(1)什么是量化?将整个模拟声音波形信号的幅度划分成有限个区段的集合,把落入某个区段的样本值归为一类,并赋予相同的值,这种过程称为量化。可分为均匀量化和非均匀量化。(2)量化级数整个声音波形信号的幅度被划分出来的区段数,称为量化级数,例如:256级,65536级,等.一般地,考虑到二进制数的表示和存储特性,量化级数取2n。第三十页,共八十六页,编辑于2023年,星期五2.声音的量化(Quantifying)(3)量化位数与量化级数2n对应的二进制位数n,即用多少位二进制数来表示每一个样本值。量化位数越高,声音的质量越好。(4)量化示例第三十一页,共八十六页,编辑于2023年,星期五2.声音的量化(Quantifying)(5)量化误差在量化过程中由于四舍五入所造成的样本值与量化值之差。设量化级差为“△”,则量化误差不会超过“△/2”.例如:设有10级量化,级次分别为0,1,2,…,9

则级差△=1,任意样本值的量化误差必≤1/2.(6)量化噪声与信噪比由于量化误差而引起的声音失真,称为量化噪声,也可用信噪比来衡量。一般地,量化位数每增加1位,信噪比增大6dB.第三十二页,共八十六页,编辑于2023年,星期五声音的采样与量化示例1采样频率为1000Hz,10个量化等级的波形第三十三页,共八十六页,编辑于2023年,星期五示例1--还原的波形图直线段波形有较大失真第三十四页,共八十六页,编辑于2023年,星期五声音的采样与量化示例2采样频率为2000Hz,20个量化等级的波形第三十五页,共八十六页,编辑于2023年,星期五声音的采样与量化示例3采样频率为4000Hz,40个量化等级的波形第三十六页,共八十六页,编辑于2023年,星期五3.声音的编码(Encoding)(1)什么是编码?将量化得到的二进制数按一定格式组装成可存储或传输的二进制格式,这个过程称为编码。(2)为什么要编码?原因1:存储需要为声音定义一种文件存储或传输格式,量化得到的二进制数不一定刚好符合这样的文件格式,因此需要重新组装。原因2:压缩不压缩的数字化声音,数据量较大。第三十七页,共八十六页,编辑于2023年,星期五3.声音的编码(Encoding)(3)声音数据能否压缩?客观上,数据之间存在冗余性和相关性数据之间存在许多冗余性数据之间存在很强的相关性利用一定的数学方法可去除这些冗余,达到压缩目的;反之,可利用相应方法恢复冗余数据,以再现原始声音。主观上,人的听觉器官具有某些不敏感性。如果去掉不敏感的数据也不会影响或较小影响人的听觉感受。例如:人耳的“掩蔽效应”—强音抑制弱音的现象。第三十八页,共八十六页,编辑于2023年,星期五4.2.3声音数据的编码方法声音数据编码方法的分类1.基于声音数据的统计特性的编码典型技术是波形编码,包括PCM,DPCM,ADPCM等适应性强,还原音质好,但压缩比不大,数据率高。2.基于声音的声学特性的参数编码常用声学特性参数:共振峰、线性预测系数、滤波器数据率低,还原音质较差;但保密性好。3.基于统计特性和声学特性的混合编码例如:CELP,MPLPC等。4.基于人的听觉特性的编码利用掩蔽效应,设计心理声学模型,如:杜比AC-3.第三十九页,共八十六页,编辑于2023年,星期五1.声音的波形编码方法(1)脉冲编码调制-PCM即把声音经A/D(采样)转换得到的样本值简单直接地量化为计算机二进制数(如二进制补码)的方法,称为PCM。如:Win系统的“录音机”即采用该编码方法第四十页,共八十六页,编辑于2023年,星期五1.声音的波形编码方法(2)律和A律PCM编码主要思路:在PCM基础上,设法让量化阶距随信号的概率密度的减小而增大(把大的量化误差留给出现概率小的样本值)。具体方法:引入和A参数,量化时用对数函数将幅度(样本值)压缩,解码时再用指数函数进行幅度还原。已形成语音国际标准:G.711广泛用于数字电话、可视电话、电视会议等。第四十一页,共八十六页,编辑于2023年,星期五1.声音的波形编码方法(3)自适应脉冲编码调制-APCM有两种思路:A.使量化的阶距(△n)随输入信号的方差而增减B.在固定阶距(△n)基础上+增益量在两种方法中随需要随时估计输入信号的时变幅度,以修正阶距或增益值。(都称为自适应量化编码方法)具体方法(根据估计方法的不同分两类):A.前馈自适应量化:由输入信号本身来估计B.反馈自适应量化:由输出信号来估计第四十二页,共八十六页,编辑于2023年,星期五1.声音的波形编码方法(4)差值量化-DM研究表明,相邻声音样本值之间存在很大的相关性,因此样本值之差的方差比信号本身的方差要小。根据上述原理形成的编码方法称为增量调制(DM)(5)自适应差值量化编码-ADPCM综合采用自适应量化和自适应预测的PCM编码方法。第四十三页,共八十六页,编辑于2023年,星期五2.声音的参数编码是基于话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。常用的音频参数有共振峰、线性预测系数和滤波器组等。其优点是数据率低,但还原信号的质量较差,自然度低,而且由于受到话音生成模型的限制,增加数据率对提高合成话音的质量无济于事。但是保密性好,因此常用于军事领域。第四十四页,共八十六页,编辑于2023年,星期五3.声音的混合编码综合运用声音的统计特性和声学特性进行编码。第四十五页,共八十六页,编辑于2023年,星期五4.声音的感知编码基于人的感知特性进行编码常见的感知特性:可听范围时差效应双耳效应俺蔽效应第四十六页,共八十六页,编辑于2023年,星期五5.常用音频编码算法和标准类别算法名称数据率标准应用质量波形编码PCM均匀量化公共网ISDN配音4-4.5(A)(A)64G.711APCM,DPCM(自适应,差值)量化ADPCM自适应差值量化32G.721SB-ADPCM子带-自适应差值量化64G.7226.3G.723参数编码LPC线性预测编码2.4保密话声2-3混合编码CELPC码激励LPC4.8移动通信3-4VSELP矢量和激励LPC8语音邮件RPE-LTP长时预测规则码激励13.2LD-CELP低延时码激励LPC16G.728/9MPEG多子带,感知编码128CD5AC-3感知编码音响5第四十七页,共八十六页,编辑于2023年,星期五4.3声音的MIDI技术4.3.1MIDI技术的产生4.3.2MIDI系统及其工件过程4.3.3MIDI消息与文件第四十八页,共八十六页,编辑于2023年,星期五4.3.1MIDI技术的产生1.如何使计算机输出优美的音乐?(1)早期技术---录音/重放方式利用模/数(A/D)转换部件采集和存储---录音利用数/模(D/A)转换部件播放---重放(2)后期技术---音乐合成技术从硬件上,增加一个独立的“音乐合成”部件从软件上,通过编程控制该部件将一些基本的音符波形合成为一首音乐所需要的波形数据。(3)两类主要的合成技术:A.调频(FM)技术B.波表(WaveTable)技术第四十九页,共八十六页,编辑于2023年,星期五4.3.1MIDI技术的产生2.音乐合成技术带来的影响音乐的“合成”意味着在计算机硬件和软件的帮助下,计算机不再是简单地对音乐的记录和重放。音乐“合成”技术促使计算机声卡不断升级以获得更好的音质效果,也促使计算机音乐创作软件的不断丰富和发展。第五十页,共八十六页,编辑于2023年,星期五4.3.1MIDI技术的产生3.调频(FM)合成技术(1)基本方法在正弦波或余弦波基础上,根据需要产生的音符的波形特征,通过调节基础波形的频率或振幅来达到近似(称为调制),从而产生不同的乐音。(2)声音效果可以达到广播级声音质量但音乐的频域范围比较广,有部分声音无法表达第五十一页,共八十六页,编辑于2023年,星期五4.3.1MIDI技术的产生4.波表(WaveTable)合成技术(1)基本方法首先,对音乐中常用音符的波形数据进行采样和存储(称为波表库或音源库)。其次,当需要播放音乐时,在硬件和软件帮助下从波表库中查表并叠加音符的波形数据。最后,通过数/模(D/A)转换部件播放出来。(2)声音效果可以达到CD级声音质量,受音源库的影响很大。音源库一般随声卡驱动程序而安装在系统中。第五十二页,共八十六页,编辑于2023年,星期五4.3.1MIDI技术的产生5.MIDI技术的产生在波表合成技术基础上,如何让各种音乐乐器都能连接到计算机上,做到随时弹奏、随时录制、随时播放?MIDI技术就是这样的背景下产生的。MIDI技术的重要意义使任何人都可以在计算机硬件和软件的帮助下将音乐乐器连接到计算机中进行音乐的创作、编辑和播放。而且这种数字化音乐可以被无限次地复制。第五十三页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统1.什么MIDI技术?即数字音乐接口(MusicalInstrumentDigitalInterface).它是一套标准和规范,规定了电子乐器与计算机相连的物理标准和数据通信的协议。说明:MIDI不是数字音响技术的范畴,它记录和传输的是电子乐器演奏音乐时的音符、速度、音量等乐谱信息.MIDI技术是使计算机能够利用“记谱”的方法进行音乐的数字录音及放音。第五十四页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统2.MIDI系统就是将各种电子乐器连接到计算机上进行音乐创作的电子模拟系统。第五十五页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统3.MIDI系统的构成一般地,MIDI系统主要包括:(1)多媒体计算机(2)合成器(3)音序器(4)音源(5)MIDI键盘(6)录音设备(7)监听设备这些设备可以是独立的,也可以是集成的。第五十六页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统(1)合成器通过振荡器的电流振荡产生各种波形并进行处理,合成出新的音色。合成器的历史比声卡和MIDI都要久远,早在1955年,世界上第一台合成器RCA就已经诞生了。随着计算机技术的发展,早期合成器的音序器功能、硬件音源功能、MIDI控制键盘功能等逐渐分离出来,形成独立的、可随意组合搭配的部分。第五十七页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统具有USB接口的MIDI键盘第五十八页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统(2)音源即声音样本库,内部有很多不同音色的样本波形。如:钢琴音色的真实样本波形

吉它音色的真实样本波形音源只是一个资源库,何时被调用由音序器来完成。音源可以是硬件音源。专业人士通常需要使用独立的硬件音源一般用户可获得声卡上的一个含有128种音色的GM音色库,即MIDI音源。音源也可以是软件音源一般以插件形式提供,对MIDI音乐的普及有很大贡献。第五十九页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统硬件音源产品:RolandJV1080第六十页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统(3)音序器是用来记录、编辑和播放MIDI文件的设备,可分为硬件和软件两种。硬件音序器(编曲机)它可以是独立的,也可以内置于合成器中。其编辑和修改操作必须在它的面板上进行,使用不方便。软件音序器是安装在计算机中的多功能音乐创作、编辑软件,如常用的CakeWalk等。功能可以通过升级不断增强,操作方便。第六十一页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统(4)采样器普通的音源是封闭的,所能提供的音色品种和数量都是有限的,不能满足制作者对新音色的需求。采样器是一种开放式的音源,它可以对任何声音进行采样,并把它们编辑成音色供计算机音乐系统使用。(5)其他设备录音设备、监听设备、音箱功放等。第六十二页,共八十六页,编辑于2023年,星期五4.3.2MIDI系统4.MIDI系统的工作过程MIDI电子乐器MIDI文件MIDI接口计算机音序器软件MIDI合成器音响系统消息或指令存储编辑合成播放第六十三页,共八十六页,编辑于2023年,星期五4.3.3MIDI消息与文件1.MIDI消息它是对MIDI电子乐器演奏音乐时的动作描述信息,通过MIDI接口发送到计算机的音序器软件中予以记录、保存和再现。它包括音符、节拍、乐器种类等信息,因此可被理解为对乐谱的数字化描述。它包括两类信息:(1)状态信息:描述音符被演奏或声音被加强等信息(2)数据信息:描述哪个音符被演奏,或声音加强的强度是多少。第六十四页,共八十六页,编辑于2023年,星期五4.3.3MIDI消息与文件2.MIDI消息示例在MIDI电子琴上按下键和松开键时按下键时的MIDI消息:Note-On/CH1#(1001CCCC)NoteNumber(0NNNNNNN)Velocity(0VVVVVVV)松开键时的MIDI消息:Note-Off/CH1#(1001CCCC)NoteNumber(0NNNNNNN)Velocity(0VVVVVVV)第六十五页,共八十六页,编辑于2023年,星期五4.3.3MIDI消息与文件3.MIDI文件将MIDI消息按一定格式保存得到的计算机文件。MIDI文件通常由音序器软件创建和编辑,文件扩展名通常为.mid或.midi。第六十六页,共八十六页,编辑于2023年,星期五4.3.3MIDI消息与文件4.MIDI声音与波形声音的比较波形声音MIDI声音优点(1)是对声音波形的真实记录,回放质量具有一致性(与设备无关)(2)适应面广,既可制作音乐,也可制作特效声音,如自然界的特殊音响,还可制作话音;(3)须懂得乐理知识(1)是对音乐乐谱的直接数字化,因此它不是声音波形的真实记录(2)文件体积小,通常比波形声音文件小200至1000倍(3)MIDI音乐数据是完全可编辑的局限性(1)文件体积大(2)声音数据不易按希望编辑(1)回放质量具有不一致性,与音响设备密切相关(2)要用于音乐类声音(3)须懂得乐理知识第六十七页,共八十六页,编辑于2023年,星期五4.4计算机声卡与声音文件格式4.4.1计算机声卡4.4.2计算机声音文件格式第六十八页,共八十六页,编辑于2023年,星期五4.4.1计算机声卡1.计算机声卡的分类(从接口形式可分为)板卡式集成式外置式第六十九页,共八十六页,编辑于2023年,星期五2.声卡的工作原理(1)声卡的功能结构图第七十页,共八十六页,编辑于2023年,星期五2.声卡的工作原理(2)声卡的主要功能部件①主芯片承担声音信号处理、特殊音效的过滤与处理、语音识别、实时音频压缩、MIDI合成等主要任务。是一块具有强大运算能力的可编程DSP芯片。第七十一页,共八十六页,编辑于2023年,星期五2.声卡的工作原理②混音芯片(CODEC)即多媒体数字信号编/解码器,主要包含模/和数数/模转换器两个部件,简称为混音器。承担对原始声音信号的采样与编码,对来自不同音源的声音进行混音处理,并提供软件上的音量控制功能.多声道声卡:模/数(A/D)转换部件负责声音的录制,仍是两声道录制但数/模(D/A)转换部件可以支持多个声道的输出一般地,混音芯片都有独立的I/O端口,可利用汇编语言等对其编程设置.第七十二页,共八十六页,编辑于2023年,星期五2.声卡的工作原理③

音乐合成芯片主要用于合成并播放音乐,也称MIDI合成器。根据计算机合成音乐技术的发展过程,MIDI合成器可分为两种:频率调制(FM)合成器在正弦波或余弦波基础上,通过对频率或振幅进行调制,使其波形近似于要表达的声音波形。波表(WaveTable)合成器预先采集高质量的每种乐器的单音波形数据,形成波表库,需要合成并播放音乐时,以查表方式获取各音符的波形数据.第七十三页,共八十六页,编辑于2023年,星期五2.声卡的工作原理④

总线接口和控制器总线接口和控制器由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑和DMA控制逻辑组成。⑤外部输入输出口声卡外部输入输出口均为3.5mm规格插口(MIDI/Joystick除外)第七十四页,共八十六页,编辑于2023年,星期五2.声卡的工作原理第七十五页,共八十六页,编辑于2023年,星期五3.声卡的主要性能指标(1)支持的音频技术指标采样频率和量化位数(2)MIDI音乐的能力(3)声道数(4)多音频流输出能力(5)I/O接口数量(6)驱动程序及应用软件的丰富性(7)总线结构第七十六页,共八十六页,编辑于2023年,星期五4.4.2计算机声音文件的格式第七十七页,共八十六页,编辑于2023年,星期五1.WAV声音文件格式(1)概述又称波形声音文件,是微软公司开发的一种声音文件格式,扩展名为.wav,是最早的数字音频格式之一,被Windows系统及应用程序广泛支持.早期的WAV格式直接采用PCM编码方法,因此是未压缩的数字化声音。标准格式采用44.1KHz

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论