版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、音视频处理技术音视频处理技术( (公选课公选课) )2009-20102009-2010第二学期第二学期本课程大纲本课程大纲2121世纪紧缺型人才培训规划教材世纪紧缺型人才培训规划教材 多媒体应用技术专业多媒体应用技术专业 韩雪涛韩雪涛 编著编著 中国水利水电出版社中国水利水电出版社信息产业部职业鉴定指导中心信息产业部职业鉴定指导中心 推荐教材推荐教材课程基本内容课程基本内容Premiere pro Premiere pro 与与 AEAECool Edit proCool Edit pro推荐学习网址推荐学习网址1 1二、 音频信号的数字处理四、 数字音频的压缩标准一、 声音信号的基本特点三
2、、 音频文件的常见格式五、 音频接口及声卡一、声音信号的基本概念、特点一、声音信号的基本概念、特点声音是通过一定介质传播的一种连续波声音是通过一定介质传播的一种连续波-正弦波正弦波振幅:振幅:音量的大小音量的大小周期:周期:重复出现的时间间隔(重复出现的时间间隔(s s)频率:频率:指信号每秒钟变化的次数指信号每秒钟变化的次数(Hz)(Hz)t振幅周期A第1章 音频的基础知识图1-1 声波传播状态的信号波形1 1 声音按频率分类:声音按频率分类: 次声波次声波可听声波可听声波超声波超声波20Hz20kHzf(Hz)人类说话声音频率范围:人类说话声音频率范围:300Hz-3kHz300Hz-3k
3、Hz声音质量的频率范围:声音质量的频率范围:10 20 50 200 3.4k 7k 15k 20kCD-DAFM广播广播AM广播广播电话电话f(Hz)0120 dB telephonetelephoneAmplitude modulationAmplitude modulation调调幅幅Frequency modulationFrequency modulation调频调频CDCD光盘、光盘、DATDAT数字录音带数字录音带第1章 音频的基础知识2 2 声音质量和数据率声音质量和数据率: 这这4 4个等级个等级中,使用的采样频率、样本精度、通道数和数据中,使用的采样频率、样本精度、通道数和
4、数据率如下表示:率如下表示:质量质量采样频率采样频率(kHz)(kHz)样本精度样本精度(bit/s)(bit/s)单道声单道声/ /立体声立体声数据率数据率(kB/s(kB/s) )( (未压缩未压缩) )频率范围频率范围电话电话* *8 88 8单道声单道声8 8 2002003 400 Hz3 400 HzAMAM11.02511.0258 8单道声单道声11.011.0202015 000Hz15 000HzFMFM22.05022.0501616立体声立体声88.2 88.2 50507 000Hz7 000HzCDCD44.144.11616立体声立体声176.4176.42020
5、20 000 Hz20 000 HzDATDAT48481616立体声立体声192.0192.0202020 000 Hz20 000 Hz第1章 音频的基础知识3 3 声音信号的基本特点声音信号的基本特点t振幅周期A声音:一般由空气的振动传到人的耳朵形成,即是靠空声音:一般由空气的振动传到人的耳朵形成,即是靠空气的疏密波动传播的。气的疏密波动传播的。第1章 音频的基础知识4 4 声音信号的基本特点声音信号的基本特点u声音的种类(声音的种类(9 9种):种):纯音(纯音(Pure SoundPure Sound): : 轻敲音叉所发出的一种单一频率的正弦波声音轻敲音叉所发出的一种单一频率的正弦
6、波声音复合音(复合音(Complex SoundComplex Sound): : 包含两个以上纯音的声音包含两个以上纯音的声音 基本音(基本音(Fundamental ToneFundamental Tone): : 周期性的复合音与周期相同的声音周期性的复合音与周期相同的声音或或 非周期性的复合音中最低频率的声音非周期性的复合音中最低频率的声音 谐波(谐波(HarmonicHarmonic): : 又称倍音,具有周期性的复合音中,除基本音又称倍音,具有周期性的复合音中,除基本音 以外,与基本音成整数倍的声音以外,与基本音成整数倍的声音 单音(单音(Single toneSingle ton
7、e): : 一个基本音与其整数倍的谐波组成的一个基本音与其整数倍的谐波组成的 声音声音 第1章 音频的基础知识5 5第1章 音频的基础知识谐和音(谐和音(ConsnanceConsnance): : 在单音的混合声中,其倍频音相在单音的混合声中,其倍频音相等的声音等的声音 噪音(噪音(NoiseNoise): : 无规律(非周期性)的声音无规律(非周期性)的声音 白噪音(白噪音(White NoiseWhite Noise): : 在宽广的频率范围内能量分布在宽广的频率范围内能量分布均匀的声音均匀的声音 黑噪音(黑噪音(Back GroudBack Groud Noise Noise): :
8、在对信号的处理时,以在对信号的处理时,以某些声音为对象时,该声音以外的声音某些声音为对象时,该声音以外的声音 声音信号的基本特点声音信号的基本特点 声音信号的基本特点声音信号的基本特点u声音的声音的三要素三要素:声调(声调(PitchPitch音调)音调)响度(响度(LoundnessLoundness)音色(音色(TimbreTimbre)u表示声音性质的基本因素表示声音性质的基本因素第1章 音频的基础知识声强是以正常听觉的人所能听到的最小声压(声强是以正常听觉的人所能听到的最小声压(0.00002Pa0.00002Pa)为基准,此时的声强作为为基准,此时的声强作为0dB0dB,0dBSPL
9、=0dBSPL=这是这是1kHz1kHz的最小可听值的最小可听值u声强与声压的关系-P36 6等感度曲线等感度曲线二、音频信号的数字处理二、音频信号的数字处理 波形声音实际上已经包含了所有的声音形式,它可以把波形声音实际上已经包含了所有的声音形式,它可以把任何声音都进行采样量化,并恰当地恢复出来。任何声音都进行采样量化,并恰当地恢复出来。 1).1).声音信号的类型声音信号的类型 模拟信号模拟信号( (自然界、物理自然界、物理) ) 数字信号数字信号( (计算机计算机) )第1章 音频的基础知识u图1-6 模拟信号的数字处理及还代替过程示意7 7二、音频信号的数字处理二、音频信号的数字处理 u
10、模拟音频信号的特点:模拟音频信号的特点:第1章 音频的基础知识 模拟信号具有直观、形象的特点模拟信号具有直观、形象的特点 是在时间轴上连续的信号,可以用它的某些参数去是在时间轴上连续的信号,可以用它的某些参数去模拟其数值的大小模拟其数值的大小 模拟信号精度低,表示的范围小,且容易受到干扰模拟信号精度低,表示的范围小,且容易受到干扰u图1-7 受至干扰的模拟信号示意图8 8u数字信号的特点数字信号的特点 数字信号具有较强的抗干扰能力,数字信号的波形简单,数字信号具有较强的抗干扰能力,数字信号的波形简单,物理上容易实现,便于存储、延迟和变换。物理上容易实现,便于存储、延迟和变换。 代表信息的物理量
11、以一系列数据组的形式来表示,它在时代表信息的物理量以一系列数据组的形式来表示,它在时间轴上是不连续的间轴上是不连续的 数字信号只有两种状态,即数字信号只有两种状态,即 0 0 或或 1 1 ,这样单个信号本身,这样单个信号本身的可靠性大为改善,而多个信号的组合数又几乎不受限制的可靠性大为改善,而多个信号的组合数又几乎不受限制 取样取样量化量化编码编码 数字信号受干扰易修复,并且经过处理、变换或传输后干数字信号受干扰易修复,并且经过处理、变换或传输后干扰杂波不会积累扰杂波不会积累二、音频信号的数字处理二、音频信号的数字处理 第1章 音频的基础知识u图1-8 模拟信号与数字信号的关系u图1-9 受
12、到干扰的数字脉冲信号处理9 92).2).声音数字化过程声音数字化过程采样采样量化量化编码编码模拟信号模拟信号数字信号数字信号模拟信号模拟信号数字信号数字信号A/D ADCD/A DACu音频信号的音频信号的A/DA/D和和D/AD/A变换:变换: A/D A/D变换变换 模拟信号变换成数字信号模拟信号变换成数字信号 D/AD/A变换变换 数字信号转换为模拟信号数字信号转换为模拟信号第1章 音频的基础知识图1-10 模拟信号的数字处理过程1010声音是如何数字化的呢?声音是如何数字化的呢? 数字音频可分为波形声音、语音和音乐。数字音频可分为波形声音、语音和音乐。 连续的模拟声音信号连续的模拟声
13、音信号声音信号的采样声音信号的采样离散的音频信号离散的音频信号3).3).声音数字化过程图示声音数字化过程图示第1章 音频的基础知识1111第1章 音频的基础知识(1 1)取样:)取样:以恒定的频率在时间轴上对模拟信号离散以恒定的频率在时间轴上对模拟信号离散 的进行取样的进行取样 音频信号的数字处理音频信号的数字处理 u 直观、形象直观、形象 u 模拟信号精度低,表示的范围小,且容易受到干扰模拟信号精度低,表示的范围小,且容易受到干扰(2 2)量化和编码)量化和编码u 量化:量化:把取样保持处理后的信号变为有限个在幅度上离把取样保持处理后的信号变为有限个在幅度上离散的二进制信号的过程散的二进制
14、信号的过程 u 编码:对量化的每个值点的数值进行二进制编码的过程编码:对量化的每个值点的数值进行二进制编码的过程 1212第1章 音频的基础知识(3 3)量化噪音:)量化噪音:在量化时忽略的在量化时忽略的信号信号实际值与量化值之间存实际值与量化值之间存在在偏差偏差,是,是由量化编码的位数决定,它也决定了量化的精度由量化编码的位数决定,它也决定了量化的精度 音频信号的数字处理音频信号的数字处理 1313量化级差越小,就越能对信号进行精确的还原、转换16位量化(2 2的的1616次次方方=65536=65536级宽度级宽度 )一般可以达到消除量化噪声的要求第1章 音频的基础知识(4 4)动态范围:
15、)动态范围:指噪声电平(最小信号电平)和最大不失真指噪声电平(最小信号电平)和最大不失真信号电平之间的范围信号电平之间的范围 u 音频信号在动态范围内可得到不失真的正常传输音频信号在动态范围内可得到不失真的正常传输 u 动态范围越宽越好动态范围越宽越好音频信号的数字处理音频信号的数字处理 1414动态范围动态范围 = 6= 6N+1.8 (dB) N-N+1.8 (dB) N-量化位数量化位数16位 量化时动态范围可达98dB4).4).声音数字化三要素声音数字化三要素采样频率量化位数声道数每秒钟抽取声波幅度样本的次数每个采样点用多少二进制位表示数据范围使用声音通道的个数采样频率越高声音质量越
16、好数据量也越大量化位数越多音质越好数据量也越大立体声比单声道的表现力丰富,但数据量翻倍11.025kHz22.05 kHz44.1 kHz 8位256 个值16位65536个值单声道立体声 声音的数字化声音的数字化 第1章 音频的基础知识1515数据量采样频率量化位数声道数/8(字节/秒)5).5).声音数字化计算公式声音数字化计算公式采样频率(kHz)量化位数(bit)数据量(KB/s)单声道立体声11.025810.7721.531621.5343.0722.05821.5343.071643.0786.1344.1843.0786.131686.13172.27第1章 音频的基础知识16
17、16理解压缩(1) WAV文件WAV是Microsoft/IBM共同开发的PC波形文件。因未经压缩,文件数据量很大。特点:声音层次丰富,还原音质好。(2)MP3文件MP3(MPEG Audio layer 3)是一种按MPEG标准的音频压缩技术制作的音频文件。特点:高压缩比(11:1),优美音质。音质还原较好。三、音频文件的常见格式三、音频文件的常见格式 第1章 音频的基础知识1717WMA(Windows Media Audio)是Windows Media格式中的一个子集(音频格式)。特点:压缩到MP3一半,相同的音质,与其兼容。(3)WMA文件(4)MIDI文件MIDI(Musical
18、Instrument Digital Interface 乐器数字接口的国际标准)是由一组声音或乐器符号的集合。(非数字化声音 非波形文件)特点:数据量很小,缺乏重现自然音。(依赖硬件)第1章 音频的基础知识1818u音频素材的格式转换及工具音频素材的格式转换及工具l 豪杰超级音乐工作室软件支持的文件格式有: CD File:*.CDA MIDI File:*.MID; *.RMI Movie File:*.MPG;*.DAT;*.MPA ;*.MOV Audio File:*.Mp3;*.Mp2;*.Mp1;*.MPA;*.ABS AC3 File:*.AC3 DVD File:*.VOB
19、WAVE File:*.WAV Text File:*.TXT2.2 听觉媒体技术u音频素材的格式转换及工具音频素材的格式转换及工具由于采集设备的不同,所选用音频编辑软件的不同以及最终用途的差由于采集设备的不同,所选用音频编辑软件的不同以及最终用途的差异,数字音频文件的存储格式有很多种,对于它们之间的相互转换有异,数字音频文件的存储格式有很多种,对于它们之间的相互转换有专门的工具应用软件。专门的工具应用软件。常用的转换工具:l 豪杰超级音乐工作室l Hero3000.Hero.Retail - 豪杰超级解霸 3000 英雄完全版l CoolEdit Pro2.0 l Audio Maestro
20、常用的音频文件格式:常用的音频文件格式:2.2 听觉媒体技术第1章 音频的基础知识 * *.RA.RA、* *.RM.RM、* *.RAM .RAM 这些文件格式是这些文件格式是RealReal文件的主要格式,可以随网络带文件的主要格式,可以随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,另带宽较充裕的听众获得较好的音质音的前提下,另带宽较充裕的听众获得较好的音质 * *.AIF.AIF、* *.AIFF.AIFF、* *.AU.AU 常见的几种音频文件格式,其中常见的几种音频文件格式,其中AIFAIF、AIFFAIFF是
21、是AppleApple公公司开发,被司开发,被MacintoshMacintosh平台及其应用程序所支持;平台及其应用程序所支持;AUAU是由是由Sun MicrosystemsSun Microsystems公司与公司与AppleApple公司为公司为UNIXUNIX系统共同开发系统共同开发的一种经过压缩的数字声音文件格式,这种也是的一种经过压缩的数字声音文件格式,这种也是InternetInternet上最古老的声音文件格式之一上最古老的声音文件格式之一 1919第1章 音频的基础知识 * *.ASF.ASF、* *.ASX .ASX 、* *.WMA.WMA、* *.WAX.WAX AS
22、F ASF和和WMAWMA是是MicrosoftMicrosoft公司针对公司针对RealReal公司开发的新一代公司开发的新一代网上流式数字音频压缩技术。这种压缩技术同时兼顾了保网上流式数字音频压缩技术。这种压缩技术同时兼顾了保真度和网络传输的需求,具有一定的先进性真度和网络传输的需求,具有一定的先进性 * *.VQF .VQF 它是它是YAMAHAYAMAHA公司的专用音频格式。采用减少数据流量公司的专用音频格式。采用减少数据流量但保持音质的方法来达到更高的压缩比,但保持音质的方法来达到更高的压缩比, 该文件格式我们该文件格式我们并不常见并不常见 2020第1章 音频的基础知识 CD-DA
23、 CD-DA CD-DACD-DA是数字音频光盘是数字音频光盘Compact Disc DitigalCompact Disc Ditigal Audio Audio的英的英文缩写,这种音乐格式在我们的日常生活中十分常见,它的文缩写,这种音乐格式在我们的日常生活中十分常见,它的数字化音频效果完全能够再现原始的声效且文件小数字化音频效果完全能够再现原始的声效且文件小 MD MD MD MD是是MiniDiscMiniDisc的简称,是的简称,是SONYSONY公司推出的一种便携式音公司推出的一种便携式音乐格式。具有很强的编辑功能。用户可以快速完成选曲、编乐格式。具有很强的编辑功能。用户可以快速完
24、成选曲、编曲等基本编辑操作,极具个性化。目前流行的曲等基本编辑操作,极具个性化。目前流行的MDMD汽车音响、汽车音响、MDMD随身听等都是采用这种音乐格式随身听等都是采用这种音乐格式 2121第1章 音频的基础知识音频文件格式简介音频文件格式简介 * *.MID.MID、* *.RMI.RMI、* *.CMF.CMF、* *.RCP .RCP 这些文件格式属于这些文件格式属于MIDIMIDI文件范畴,这类文件主要应用于计文件范畴,这类文件主要应用于计算机音乐创作,用户可以通过专业的音频创作软件实现谱曲,算机音乐创作,用户可以通过专业的音频创作软件实现谱曲,或直接通过声卡或直接通过声卡MIDIM
25、IDI接口将外部音序器演奏的乐曲输入到计算接口将外部音序器演奏的乐曲输入到计算机中完成音乐创作机中完成音乐创作 MOD MOD MOD MOD的结构类似于的结构类似于MIDIMIDI,是一种类似于波表的音乐格式,常,是一种类似于波表的音乐格式,常用于游戏的背景音乐用于游戏的背景音乐 2222由于采集设备的不同,所选用音频编辑软件的不同以及由于采集设备的不同,所选用音频编辑软件的不同以及最终用途的差异,数字音频文件的存储格式有很多,了最终用途的差异,数字音频文件的存储格式有很多,了解这些文件格式的特点和基本原理对进行音频的编辑是解这些文件格式的特点和基本原理对进行音频的编辑是非常必要的。非常必要
26、的。1.1.* *.WAV.WAV2.2.* *.MP3.MP39.9.* *.MID.MID、* *.RMI.RMI、* *.CMF.CMF、* *.RCP .RCP 第1章 音频的基础知识23233.3.* *.RA.RA、* *.RM.RM、* *.RAM.RAM5.5.* *. ASF. ASF、* *.ASX.ASX、* *.WMA.WMA、* *.WAX .WAX 4.4.* *.AIF.AIF、* *.AIFF.AIFF、* *.AU.AU6.6.* *.VQF.VQF7.CD-DA7.CD-DA8.MD8.MD10.MOD10.MOD由于采集设备的不同,所选用音频编辑软件的不同
27、以及由于采集设备的不同,所选用音频编辑软件的不同以及最终用途的差异,数字音频文件的存储格式有很多,了最终用途的差异,数字音频文件的存储格式有很多,了解这些文件格式的特点和基本原理对进行音频的编辑是解这些文件格式的特点和基本原理对进行音频的编辑是非常必要的。非常必要的。1.*.WAV2.*.MP3第1章 音频的基础知识2424uCDCD盘里的文件格式直接转换为下面的两种常用文件格式:盘里的文件格式直接转换为下面的两种常用文件格式:u比较文件大小:比较文件大小:.cda.cda豪杰工具p.cda.cda : 1k : 1kp.wav : 49M.wav : 49Mp.mp3 : 4.45M .mp
28、3 : 4.45M 对声音的抽象化(即符号化)表示包括两种类型 :v一种是音乐一种是音乐v一种是语音一种是语音MIDIMIDI消息就是乐谱的数字描述。消息就是乐谱的数字描述。 与波形声音相比,与波形声音相比,MIDIMIDI数据不是声音而是指令,所以它的数据不是声音而是指令,所以它的数据量要比波形声音少得多。数据量要比波形声音少得多。 半小时的立体声半小时的立体声1616位高品质音乐,如果用位高品质音乐,如果用.WAV.WAV波形文件无波形文件无压缩录制,约需压缩录制,约需300MB300MB的存储空间。而同样时间的的存储空间。而同样时间的MIDIMIDI数据数据大约只需大约只需200KB20
29、0KB,两者相差两者相差15001500倍之多。倍之多。 由于由于音乐音乐完全可用符号来表示,所以音乐可看作完全可用符号来表示,所以音乐可看作是符号化的声音媒体。是符号化的声音媒体。 uMIDIMIDI与音乐合成与音乐合成第1章 音频的基础知识2525uMIDIMIDI技术技术 利用数字信号处理技术合成的音效有: 模仿钢琴、小提琴、吉他等音色 超越时空的太空音乐。MIDI是一种利用合成器产生的音乐技术。 Musical Instrument Digital Interface译为乐器数字接口。MIDIMIDI是各种电子音乐设备之间以及与是各种电子音乐设备之间以及与计算机交换信息的国际标准。计算
30、机交换信息的国际标准。(Yamaha,Roland)(Yamaha,Roland)第1章 音频的基础知识2626uMIDIMIDI标准标准 MIDI硬件规范:硬件接口标准和信号传输机制(I/O通道类型、连接电缆和插座形式)。 MIDI软件规范:音乐信息数字化编码方式(音符、音符长短、音调和音量等)。原声钢琴原声钢琴8 8分音符的分音符的C3C3音:音:00 0000 00 60 60音色音色PianoPiano编号编号 音符音符C3C3编号编号 8 8分音符编号分音符编号当一组MIDI信息通过音乐合成器演奏时,合成器将解释这些符号并产生音乐。第1章 音频的基础知识2727uMIDIMIDI合成
31、方式合成方式 调频合成法FM 原理:利用傅立叶级数进行分解。 特点:系统开销小,声音较清脆; 声音音色少,音质差。 波形表合成法WT 原理:预先存放实际乐器的声音样本。 特点:音乐真实感强,音色自然。 硬波形表,软波形表。第1章 音频的基础知识2828uMIDIMIDI的工作过程的工作过程 音序器是音序器是MIDIMIDI音乐音乐创作的核心控制部件。创作的核心控制部件。第1章 音频的基础知识2929u简单的简单的MIDIMIDI系统系统v它由一个MIDI键盘控制器和一个MIDI声音模块组成。许多MIDI键盘乐器在其内部既包含键盘控制器,又包含MIDI声音模块功能。在这些单元中,键盘控制器和声音
32、模块之间已经有内部链接,这个链接可以通过该设备中的控制功能(local control)对链接打开(ON)或者关闭(OFF)。第1章 音频的基础知识3030v单个物理MIDI通道(MIDI channel)分成16个逻辑通道,每个逻辑通道可指定一种乐器。在MIDI信息(MIDI messages)中,用4个二进制位来表示这16个逻辑通道。音乐键盘可设置在这16个通道之中的任何一个,而MIDI声源或者声音模块可被设置在指定的MIDI通道上接收。第1章 音频的基础知识3131u复杂的复杂的MIDIMIDI系统系统v在一个在一个MIDIMIDI设备上的设备上的MIDI INMIDI IN连接器接收到
33、的信息可通连接器接收到的信息可通过过MIDI THRUMIDI THRU连接器输出到另一个连接器输出到另一个MIDIMIDI设备,并以菊花链设备,并以菊花链的方式连接多个的方式连接多个MIDIMIDI设备。设备。v这些模块也可以做在一起构成一个叫做多音色这些模块也可以做在一起构成一个叫做多音色(multitimbral(multitimbral) )的声音模块,它同样可以起到同时接收和的声音模块,它同样可以起到同时接收和播放多种声音的作用。播放多种声音的作用。第1章 音频的基础知识3232u音乐制作系统音乐制作系统 需3种基本设备 1.音源:声卡(模拟乐器发声的设备) 2.音序器:硬件音序器、
34、软件音序器,即编曲机 3.输入设备:电子琴(MIDI In,MIDI Out) MIDI键盘 Cakewalk中的虚拟键盘MIDIMIDI连接线连接线第1章 音频的基础知识3333音乐制作技术 提取原音软件:Exact Audio Copy(EAC) MP3数字CD抓轨 把CD音轨转换成WAV格式(无失真)。 音频处理软件:Cool Edit 2000 原音伴唱消除:Effect/Amplitude/ Channel MixerVocal Cut VCD(卡拉OK):左声道、右声道 人声 伴音第1章 音频的基础知识3434四、数字音频的压缩标准四、数字音频的压缩标准 音频信号是多媒体系统的重要
35、组成部分。 电话质量的语音调幅广播质量的音频信号调频广播质量的音频信号高保真立体声信号 频率范围:300HZ3.4kHz 频率范围:50HZ7KHz 频率范围:10HZ20KHz 频率范围:20HZ15KHz 第1章 音频的基础知识针对不同的音频信号,已制定了相应的压缩标准。 3535针对不同的音频信号,已制定了相应的压缩标准。 在多媒体音频处理中,一般需要对数字化后的音频信号进行压缩编码,使其成为具有一定字长的二进制数字序列,并以这种形式在计算机内传输和存储,最后由解码器将二进制编码恢复成原来的音频信号播放。 第1章 音频的基础知识3636音频压缩处理流程 输输入入音音频频信信号号 输输出出
36、音音频频信信号号 编编码码器器 传传输输/存存储储 解解码码器器 所谓压缩编码技术,就是指用某种方法使数字化信息的编码率降低的技术。 音频信号能进行压缩编码的基本依据有两个: 声音信号中存在很大的冗余度,通过识别和去除这些冗余度,便能达到压缩编码率的目的。 人的听觉具有一个强音能抑制一个同时存在的弱音的现象,这样就可以抑制与信号同时存在的量化噪声。 第1章 音频的基础知识3737无损压缩法无损压缩法 包括不引入任何数据失真的各种熵编码熵编码。有损压缩法有损压缩法 分为波形编码波形编码、模型(参数)编码模型(参数)编码和同时利用这两种技术的混合编码混合编码方法。 第1章 音频的基础知识音频压缩编
37、码的基本方法音频压缩编码的基本方法3838熵编码这是以信息论变长编码定理为理论基础的编码方法,如霍夫曼编码、算术编码和行程编码等。 波形编码 编码是利用采样和量化过程来表示音频信号的波形,使编码后的音频信号与原始信号的波形尽可能匹配。根据人耳的听觉特性进行量化根据人耳的听觉特性进行量化。 特点:特点:是适应性强,音频质量好,在较高码率的条件下可以获得高质量的音频信号。 方法:方法:全频带编码( PCM、DPCM、ADPCM ) 、子带编码(ATC、心理学模型)和矢量量化编码等。 第1章 音频的基础知识3939参数编码目的是重建音频,保持原始音频的特性。参数编码的压缩率很大,但计算量大,保真度不
38、高,适合于语音信号的编码。 参数编码是将音频信号以某种模型来表示,利用特征提取的方法抽取必要的模型参数和激励信号的信息,并对这些信息编码,最后在输出端合成原始信号。有线性预测(LPC)声码器、通道声码器、共振峰声码器等。 第1章 音频的基础知识4040混合编码混合编码是在参数编码方法的基础上,引用波形编码准则优化激励源信号的一种方案。可以在较低的码率上得到较高的音质。 多脉冲线性预测编码(MP_LPC)码本激励线性预测编码(CELP)短延时码本激励线性预测编码(LD-CELP)长延时线性预测规则码激励(RPE-LTP)等。方法方法:第1章 音频的基础知识4141音频压缩技术标准音频压缩技术标准
39、 1.1.电话质量的音频压缩标准电话质量的音频压缩标准 语音压缩编码的标准。 电话质量语音信号的频率范围是电话质量语音信号的频率范围是2002003400Hz3400Hz,采用标准的,采用标准的脉冲编码调制脉冲编码调制(PCM)(PCM),当采样频率为,当采样频率为8kHz8kHz,量化位数为,量化位数为8 8位时,位时,对应的数据速率为对应的数据速率为64Kb64Kbs s。 标标 准准说说 明明G711采用PCM编码,采样频率为8kHz,量化位数为8位,因此速率为64KbsG721将64Kbs的比特流转换成32Kbs,基于ADPCMG723一种以24Kbs运行的基于ADPCM的有损压缩标准
40、G728采用LD-CELP压缩技术,比特率为16Kbs,带宽限于3.4kHz第1章 音频的基础知识4242随着数字移动通信的发展,人们对于低速语音编码有了更迫切的要求。q为了适应保密通信的要求,美国国家安全局NSA分别于1982年和1989年制定了基于LPC,速率为2.4Kbs和基于CELP,速率为4.8Kbs的编码方案。 q1989年美国公布的数字移动通信标准CTIA,采用矢量和激励线性预测技术(VSELP),速率为8Kbs。q1983年欧洲数字移动特别组(GSM)制定了采用长时线预测规则码激励(RPE-LTP)压缩技术的GSM编码标准,作为移动电话的压缩标准。第1章 音频的基础知识4343
41、2.2.调幅广播质量的音频压缩标准调幅广播质量的音频压缩标准 1988年ITU制定了G722标准,它可把信号速率压缩成64Kbs。 调幅广播质量音频信号的频率范围是507000Hz,当使用16kHz的采样频率和14位的量化位数时,信号速率为224Kbs。 G722标准采用基于子带的ADPCM技术,将现有的带宽分成两个独立的子带信道,使输入信号进入滤波器组分成高子带信号和低子带信号,然后分别进行ADPCM编码,最后进入混合器形成输出码流。 适合于需要存储大量高质量音频信号的多媒体系统使用。 第1章 音频的基础知识44443. 3. 高保真立体声音频压缩标准高保真立体声音频压缩标准 世界上第一个高
42、保真立体声音频压缩标准为“MPEG 音频”压缩算法。 q 高保真立体声音频信号的频率范围是5020kHz,在441kHz采样频率下用16位量化,信号速率为每声道705Kbs。 MPEG音频标准提供了3个独立的压缩层次: 第一层的编码器最为简单,编码器的输出数据率为384Kbs,主要用于小型数字合式磁带(Digital Compact Cassette,DCC) 。压缩层压缩层第二层的编码器的复杂程度属于中等,编码器的输出数据率为192256Kbs,其应用包括数字广播音频、数字音乐、CD-I和VCD等 第三层的编码器最为复杂,编码器的输出数据率为64Kbs,主要应用于ISDN上的声音传输。 第1
43、章 音频的基础知识4545编码器的原理 编码器处理数字音频信号,并生成存储所需要的数据流。例如:音频掩蔽阀值估计的编码、量化和缩放,只要编码器输出的数据能符合标准即可。 时域 频域q两个声音心理学模型都通过计算信号的掩蔽比来为编码服务。 q编码的结果将封装成帧,如果需要的话,再加上其他信息,例如校正信息等。 第1章 音频的基础知识4646编码的过程编码的过程 输入的音频采样值读人编码器,映像器首先对音频数据流进行滤波,然后建立输入音频数据流的子带采样表示。 第第1 1层和第层和第2 2层的解码过程:层的解码过程:MPEGMPEG音频的解码首先要作的事情音频的解码首先要作的事情是使解码器与位流同
44、步,通过搜索同步字,便可获得同步。是使解码器与位流同步,通过搜索同步字,便可获得同步。识别和处理编码数据的公共数据之后,开始对各层进行编码。识别和处理编码数据的公共数据之后,开始对各层进行编码。首先读取位分配信息以及第一个子带的缩放因子,进行位分首先读取位分配信息以及第一个子带的缩放因子,进行位分配解码。缩放因子选择信息解码,对子带样点进行逆量化,配解码。缩放因子选择信息解码,对子带样点进行逆量化,通过合成于带滤波器后,输出通过合成于带滤波器后,输出PCMPCM采样值。采样值。第第3 3层的解码最复杂:层的解码最复杂:主要包括找同步、附加信息、主数据主要包括找同步、附加信息、主数据开始、缩放因
45、子、霍夫曼编码、逆量化器、逆量化和全缩政开始、缩放因子、霍夫曼编码、逆量化器、逆量化和全缩政公式、重排序、立体声处理、合成滤波器组等。公式、重排序、立体声处理、合成滤波器组等。 第1章 音频的基础知识4747音频压缩工具音频压缩工具 MP3、WMA、RA格式都是比较流行的音频压缩文件格式,可以把需要压缩的各种音频文件(wav、mid、mpg、dat、ra、rm等)添加到左侧的列表框中。 豪杰公司出品的MP3压缩工具,即豪杰超级解霸3000中的一个实用工具。 MP3格式转换器第1章 音频的基础知识4848五、音频接口及声卡五、音频接口及声卡多媒体技术的特点是计算机交互式综合处理声文图信息。多媒体
46、技术的特点是计算机交互式综合处理声文图信息。声音是携带信息的重要媒体。音频卡的原理及其应用、语声音是携带信息的重要媒体。音频卡的原理及其应用、语音合成和音乐合成以及语音识别技术。音合成和音乐合成以及语音识别技术。 音频卡的工作原理音频卡的工作原理 处理音频信号的 PC插卡是音频卡(Audio Card),又称声音卡,声音卡处理的音频媒体有数字化声音(Wave)、合成音乐(MIDI)、CD音频。 4949第1章 音频的基础知识1音频卡的功能和分类声音卡的主要功能:是音频的录制与播放、编辑与合成、MIDI接口、文-语转换、CD-ROM接口及游戏接口等。 2音频卡的体系结构音频卡由下列部件组成:MI
47、DIMIDI输入输入/ /输出电路,输出电路,MIDIMIDI合合成器芯片,用来把成器芯片,用来把CDCD音频输入与线输入相混合电路,带音频输入与线输入相混合电路,带有脉冲编码调制电路的模数转换器,(有脉冲编码调制电路的模数转换器,(1 1)用于把模拟信)用于把模拟信号转换为数字信号以生成波形文件;(号转换为数字信号以生成波形文件;(2 2)用来压缩和解)用来压缩和解压音频文件的压缩芯片;(压音频文件的压缩芯片;(3 3)用来合成语音输出的语音)用来合成语音输出的语音合成器;(合成器;(4 4)用来识别语音输入的语音识别电路,以及)用来识别语音输入的语音识别电路,以及输出立体声的音频输出或线输
48、出的输出电路等。输出立体声的音频输出或线输出的输出电路等。 5050第1章 音频的基础知识声卡的工作原理核心器件核心器件声卡外部接口声卡外部接口5151第1章 音频的基础知识 数字化声音处理 声音卡用数字信号处理器DSPDSP芯片芯片管理所有声音输入输出和MIDI操作,整个数字音频信息获取技术的工作原理、流程与主要组成部分: 5252第1章 音频的基础知识 混音器混音器音频卡上的混音器(音频卡上的混音器(MixerMixer)芯片可以对以下)芯片可以对以下音频源进行混合音频源进行混合:数字化声音数字化声音(DACDAC)。调频)。调频 FMFM合成音乐合成音乐(FMFM)、)、CD-Audio
49、CD-Audio音频音频(CD-ROMCD-ROM)、)、线路输入线路输入(AUXAUX)、)、话筒输入话筒输入(MICMIC)、)、PCPC扬声输扬声输出出(SPKSPK)。多声源混音:)。多声源混音: 5353第1章 音频的基础知识 合成器合成器 标准的多媒体标准的多媒体 PCPC机平台通过内部合成器(机平台通过内部合成器(SynthesizeSynthesize)或通)或通过外接到计算机过外接到计算机MIDIMIDI端口的外部合成器播放端口的外部合成器播放MIDIMIDI文件。文件。MIDIMIDI合合成器的类型目前有两种成器的类型目前有两种: 频率调制FM合成(中级仅要求掌握该种合成器
50、原理); 波形表(Wave Table)合成。 通过改变调制单元的频率和振幅,就可以改变FM合成器产生的声音音质。 5454第1章 音频的基础知识音乐合成和音乐合成和MIDIMIDI接口规范接口规范音乐合成与音乐合成与MIDIMIDI MIDI MIDI(Musical Instrument Digital InterfaceMusical Instrument Digital Interface)是指)是指乐器数字接口,是数字音乐的国际标准。乐器数字接口,是数字音乐的国际标准。 任何电子乐器,只要有处理MIDI消息的微处理器,并有合适的硬件接口,都可以成为一个MIDI设备。MIDI消息,实际
51、上就是乐谱的数字描述。当一组当一组MIDIMIDI消息通过音乐合成器芯片演奏时,合成器就会消息通过音乐合成器芯片演奏时,合成器就会解释这些符号并产生音乐。解释这些符号并产生音乐。 5555第1章 音频的基础知识音乐合成和音乐合成和MIDIMIDI接口规范接口规范电子琴的MIDI接口。 音量控制器的使用?5656第1章 音频的基础知识音乐合成和音乐合成和MIDIMIDI接口规范接口规范MIDI规范允许MIDI装置以预先说明的方式通信。为了提供单电缆连接和通信端口标准,关键之一是物理连接的标准化。MIDI标准中规定MPC包括一个内部合成器和标准MIDI端口。MIDI装置应有一个或多个下列端口:MI
52、DI In,MIDI Out和 MIDI Thru。每种端口有特定的用处,如发送、接收或在MIDI装置间转发MIDI消息。这种设计允许你同时控制所连接的多个MIDI装置。各端口的功能简述如下:MIDI In(输入口):接收从其他 MIDI装置传来的消息。MIDI Out(输出口):发送某装置生成的原始 MIDI消息。向其他设备发送 MIDI消息。MIDI Thru(转发口):传送从输人口接收的消息到其他 MIDI装置。 5757第1章 音频的基础知识音乐合成和音乐合成和MIDIMIDI接口规范接口规范 音箱音箱 音箱是一种电声转换的发音设备,它由箱体、扬音箱是一种电声转换的发音设备,它由箱体、
53、扬声器、电源和信号放大器等组成。声器、电源和信号放大器等组成。 分类分类:2.02.0双声道立体声双声道立体声 2.1/4.1/5.1/7.12.1/4.1/5.1/7.1 5.1 5.1五声道超重低音声道五声道超重低音声道5858第1章 音频的基础知识声卡与音箱声卡与音箱 杜比环绕杜比环绕 立体声技术立体声技术5959第1章 音频的基础知识语音合成语音合成 一般来讲,实现计算机语音输出有两种方法:一是录音/重放,二是文一语转换。第二种方法是基于声音合成技术的一种声音产生技术。它可用于语音合成和音乐合成。 语音识别语音识别 语音识别是将人发出的声音、语音识别是将人发出的声音、字字或或短语短语转换成转换成文字、文字、符号符号,或给出响应,如执行控制、作出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 客户服务代表的投诉处理技巧
- 旅游景区开发与管理岗位实战经验
- 护士分级护理康复指导
- 护理精神科护理技术教案
- 护理实践中的法律风险与防范
- SJG 217-2026 装配式桥梁技术规程
- 护理健康教育与健康教育服务
- 创业就业指导中心规划
- 初中道德与法治统编版(2024)七年级下册 10.1 认识民法典 课件
- 基于数据挖掘的铁路运营决策支持系统研究报告
- 《商务礼仪》课件-01初识商务礼仪
- 水电站春节安全生产培训
- 软硬件测试方案
- 语文教育与学生心理健康
- 中央空调施工安全培训
- 英语四级词汇加例句
- 四级翻译句子及答案
- 中学语文拟写人物短评课件
- 四川大学成人教育 《工程估价》 期末考试复习题及参考答案
- GB/T 41498-2022纤维增强塑料复合材料用剪切框测定面内剪切应力/剪切应变响应和剪切模量的试验方法
- 博弈策略的生活解读 课件
评论
0/150
提交评论