第二章 数字声音及话音编码课件_第1页
第二章 数字声音及话音编码课件_第2页
第二章 数字声音及话音编码课件_第3页
第二章 数字声音及话音编码课件_第4页
第二章 数字声音及话音编码课件_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主要内容主要内容2.1.1 2.1.1 声音与听觉器官声音与听觉器官2.1.2 2.1.2 声音信号数字化声音信号数字化2.1.3 2.1.3 音频处理音频处理2.1.4 2.1.4 电子乐器数字接口系统电子乐器数字接口系统MIDIMIDI2.1.5 2.1.5 数字音频的文件格式数字音频的文件格式2.2.1 2.2.1 话音编码概要话音编码概要2.2.2 2.2.2 脉冲编码调制脉冲编码调制(PCM)(PCM)2.2.3 2.2.3 增量调制增量调制2.2.4 2.2.4 自适应差分脉冲编码调制自适应差分脉冲编码调制2.2.5 2.2.5 线性预测编码线性预测编码(LPC)(LPC)的概念的

2、概念导语:导语:声音是携带信息的极其重要的媒体。声音是携带信息的极其重要的媒体。声音的种类繁多。声音的种类繁多。声音有共同的特性,也有各自的特性。声音有共同的特性,也有各自的特性。 我们将研究声音的基础知识,掌握声我们将研究声音的基础知识,掌握声音数字化的两个最基本的概念;了解基本音数字化的两个最基本的概念;了解基本的音频信号编码技术。的音频信号编码技术。第一节第一节 数字声音数字声音声音是通过空气传播的一种连续的波,声音是通过空气传播的一种连续的波,叫叫声波声波。声音的强弱(音强)声音的强弱(音强)音调的高低(频率)音调的高低(频率)声波的特性声波的特性 反射反射 ( (reflection

3、)reflection)、折射折射 ( (refraction)refraction)和衍射和衍射 ( (diffraction)diffraction)2.1.1 声音与听觉器官声音与听觉器官声音信号由许多频率不同的信号组成。声音信号由许多频率不同的信号组成。 带宽:带宽:它用来描述组成复合信号的频率范围。它用来描述组成复合信号的频率范围。202020000 20000 HzHz(音频,人能感知的)(音频,人能感知的), ,低于低于2020的是次音,高于的是次音,高于2 2万的是超声波。万的是超声波。0 0120 120 dBdB(人能感知的音强)(人能感知的音强)80803400 Hz 3

4、400 Hz (话音)(话音)2.1.1 声音与听觉器官声音与听觉器官 人可以从声波中判断出声音的来源、强度以及人可以从声波中判断出声音的来源、强度以及声音的特殊空间效果。声音的特殊空间效果。 人是根据人是根据三个现象三个现象来确定声音的方向:来确定声音的方向:(a)(a)声音在时间上的差别(相位)声音在时间上的差别(相位)(b)(b)声音强弱的差别(音量)声音强弱的差别(音量)声音衰减;声音频率对声音的强度差别有影响。声音衰减;声音频率对声音的强度差别有影响。 (c)(c)声音的遮挡效果(阴影)声音的遮挡效果(阴影)头部与障碍物的遮挡。头部与障碍物的遮挡。判别声源的其他方法:视觉帮助、声音知

5、识、耳廓判别声源的其他方法:视觉帮助、声音知识、耳廓等。等。声音的方向性是产生立体声效果和空间效果的基础。声音的方向性是产生立体声效果和空间效果的基础。声音方向的确定声音方向的确定音音 乐乐n以小提琴为例,当它的A弦振动时,并不仅仅是整根弦在振动,这根弦的1/2、1/3、1/4处都在振动着。n整根弦的振动产生了最主要的频率,称为基音基音。n弦长的1/2、1/3、1/4等处的振动则产生了一些次要的频率,称为泛音泛音。 n如果泛音是基音的整数倍整数倍,这个音就会具有清晰的音高,称为乐音乐音,如钢琴,小提琴等发出的都是乐音乐音;如果泛音是基音的非整数倍非整数倍,这个音就不具备清晰可辨的音高,称之为噪

6、音噪音。 音强中音强中分贝分贝的的定义定义定义示例声音质量的度量声音质量的度量n声音的质量与声音的带宽带宽有关,一般来说频率范围越宽,声音质量也就越高。声音类型带 宽电话语音200Hz3.4kHz调幅广播50Hz7kHz调频广播20Hz15kHzCDDAT20Hz20kHz20Hz20kHz清P48 各声音的相各声音的相应数据率见应数据率见书书P48(清华清华版版)声音质量的度量声音质量的度量清P48n客观质量度量:信噪比(SNR)n主观平均判分法(MOS)由评委打分声音质量评分标准参见P482.1.2 声音信号数字化声音信号数字化n为什么要数字化? n话音信号是典型的连续信号,不仅在时间上是

7、连续的,而且在幅度上也是连续的。n声音进入计算机的第一步就是数字化,数字化过程中最重要的步骤是:采样采样和量化量化。n采样采样(sampling):将声音信号在时间上离散化,比如,每隔相等的一段时间抽取一个信号样本。(均匀采样均匀采样)2.1.2 声音信号数字化声音信号数字化n量化量化(quantization):将连续的信号幅度离散化。如果幅度的划分是等间隔的,称为线性量化线性量化,否则为非线性量化非线性量化。 电压范围电压范围 量化量化(dec) 编码编码(bin) 0.5 0.7 3 011 0.3 0.5 2 010 0.1 0.3 1 001 -0.1 0.1 0 000 -0.3

8、-0.1 -1 111 -0.5 -0.3 -2 110 -0.7 -0.5 -3 101 -0.9 -0.7 -4 100例:例:2.1.2 声音信号数字化声音信号数字化n采样频率 奈奎斯特理论指出:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,称为无损数字化。 f s = 2 f max 例:话音信号最高频率约为3.4kHz,所以采样频率取为8kHz。2.1.2 声音信号数字化声音信号数字化n采样精度采样精度 两种表示方法:两种表示方法: 1、每个声音样本的数字化位数反映了声音、每个声音样本的数字化位数反映了声音波形幅度的采样精度。波形幅度的采样精度。

9、质量采样频率(kHz)样本精度单道声/立体声数据率(kb/s)频率范围(kHz)电话88单道声642003400AM11.0258单道声88507000FM22.05016立体声705.62015000CD44.116立体声1411.22020000DAT4816立体2、信噪比、信噪比(signal-to-noise ratio,SNR)SNR 10 log (Vsignal / Vnoise)220 log (Vsignal / Vnoise)2.1.2 声音信号数字化声音信号数字化 音频信号的带宽音频信号的带宽 数字激光唱盘(CD)FM无线电调频广播AM无线调幅广

10、播0.017电 话f / kHz0.020.050.23.415 20人人- -机通信机通信 计算机接收音频信号。获取、计算机接收音频信号。获取、语音识别与理解。语音识别与理解。机机- -人通信人通信 计算机输出音频。音频合成;计算机输出音频。音频合成;声音重构、模拟。产生真实感的声音。声音重构、模拟。产生真实感的声音。人人- -机机- -人通信人通信 人通过网络进行语音通信,人通过网络进行语音通信,需要的处理包括:语音采集、编码解码、传输、需要的处理包括:语音采集、编码解码、传输、检索,识别。检索,识别。音频信号处理的音频信号处理的内容:内容:2.1.3 音频处理音频处理1. 数字音频信号的

11、获取数字音频信号的获取 音频信号的获取框图如下所示。音频信号的获取框图如下所示。图4-5 音频信号获取框图话筒放大滤波采样保持A/D接口微型机采样脉冲图4-6 音频信号的回放框图滤波音箱 功放 压放D/A接口微型机2、音频信号的回放、音频信号的回放经压缩的音频信号以一定的格式记录在媒体经压缩的音频信号以一定的格式记录在媒体上(磁带、磁盘及光盘等),或者传送到接收端。上(磁带、磁盘及光盘等),或者传送到接收端。回放音频信号时,首先由专用的硬件或软件回放音频信号时,首先由专用的硬件或软件对压缩数据进行解压缩,恢复音频数字信号,然对压缩数据进行解压缩,恢复音频数字信号,然后,由图示的电路框图对音频信

12、号进行放音。后,由图示的电路框图对音频信号进行放音。 关于信号的几个问题2.1.3 音频处理技术n数字信号与模拟信号n离散时间信号和离散幅度信号n采样和量化n信号的时间域与频率域表示n奈奎斯特(Nyquist)理论与混迭效应(Aliasing)n信号的重构音频信号处理的流程原始声音信 号声电信号转 换低 通滤 波模拟数字转 换数字信号处 理传 输存 储声 音合 成功 率放 大数字模拟转 换电声信号转换2.1.4 电子乐器数字接口系统电子乐器数字接口系统MIDIMIDI nMIDI(乐器数字化接口乐器数字化接口),是一种用于计算机与电子,是一种用于计算机与电子乐器之间进行数据交换的通信标准。乐器

13、之间进行数据交换的通信标准。nMIDI文件文件(.mid)记录了用于合成记录了用于合成MIDI音乐的音乐的各种控制指令各种控制指令(包括发声乐器、所用通道、音量大小等包括发声乐器、所用通道、音量大小等)。n由于由于MIDI文件本身不包含任何数字音频信号,文件本身不包含任何数字音频信号,因而所占的贮存空间比因而所占的贮存空间比wav文件要小得多。文件要小得多。MIDIMIDI标准的特点标准的特点n是一种在计算机和音乐合成器之间交是一种在计算机和音乐合成器之间交换音乐信息的标准协议。换音乐信息的标准协议。nMIDI不是声音信号,在不是声音信号,在MIDI电缆上电缆上传递的是指令。传递的是指令。nM

14、IDI音乐常用作游戏音乐或背景音乐,音乐常用作游戏音乐或背景音乐,典型应用就是手机音乐。典型应用就是手机音乐。MIDIMIDI音乐合成方法音乐合成方法n常用的合成方式有FM(调频)与Wave table(波表)两种 。n早期的声卡及目前大多数廉价的声卡都采用的FM合成方式。FM合成是通过振荡器产生正弦波,然后再叠加成各种乐器的波形。由于振荡器成本较高,即使是OPL3这类高档的FM合成器也只提供了4个振荡器,仅能产生20种复音。因此MIDI音乐听起来生硬呆板,带有明显的人工合成色彩,即所谓的电子声。 乐音的波形用数字来表乐音的波形用数字来表示,再通过数模转换器示,再通过数模转换器来生成乐音来生成

15、乐音由以下五部分组成:由以下五部分组成: 数字载波器数字载波器 调制器调制器 声音包络发生器声音包络发生器 数字运算器数字运算器 模数转换器模数转换器频率调制(频率调制(FM)合成合成法法FM声音合成器的工作原理声音合成器的工作原理从理论上讲,从理论上讲,FM合成方法可以产生任何乐音,但是,这合成方法可以产生任何乐音,但是,这种种“物理式物理式”的合成方法合成出来的声音不够真实。的合成方法合成出来的声音不够真实。乐音样本合成法乐音样本合成法n乐音样本合成法是把真实乐器发出的声音以数字的形式记录下来,播放时再加以调整、修饰和放大,生成各种音阶的音符。n乐音样本通常放在ROM芯片上,播放时以查表的

16、方式给出,所以这种合成器又叫做波表(wave table)合成器。乐音样本合成器的工作原理:乐音样本合成器的工作原理:主流的音频格式:nWAV WAV nMIDI MIDI nPCM PCM nMP3 MP3 nWMA WMA nAPE APE nOGG OGG WAVWAV文件文件 又称波形文件,是Microsoft公司的音频文件格式。Microsoft将WAV文件作为标准格式的文件,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。 WAV文件来源于对声音模拟波形的采样,并以不同的量化位数把这些采样点的值转换成二进制数。 WAV声音文件是使用RIFFRI

17、FF(资源交换文件)的格式描述的,RIFF格式文件是一种带有标记带有标记的文件结构的文件结构,它由文件头文件头和波形音频文件数据音频文件数据块块组成。文件头包括标志符、语音特征值、声道特征以及PCM格式类型标志等。数据块是由数据子块标记、数据子块长度和波形音频数据3个数据子块组成。 Wave格式支持MSADPCM、CCITT A_Law、 CCITT _Law和其他压缩算法,支持多种音频位数、采样频率和声道。WAV文件文件n特点:音质非常好,被大量软件所支持。 n缺点:wav文件占用很大的贮存空间。16bit、44.1Khz采样精度录制的My heart will go on为例,5分10秒的

18、长度需要占用近55M的空间 。n适用于:多媒体开发、保存音乐和音效素材Windows提供的WinAPI中有不少函数可以直接播放wav,因此,在开发多媒体软件时,往往大量采用wav,用作事件声效和背景音乐。PCM编码的wav可以达到相同采样率和采样大小条件下的最好音质,因此,也被大量用于音频编辑、非线性编辑等领域。 WAV文件文件 MPEG音频文件音频文件.MP1/.MP2/.MP3 这里指的是MPEG标准中的音频部分,即MPEG音频层(MPEG Audio Layer)。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层,分别对应MP1、MP2和MP3这三种声音文

19、件; MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为41和6181,而MP3的压缩率则高达101121 也就是说一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。MP3nMP3具有不错的压缩比,使用合适的参数,LAMELAME编码的MP3很适合于音乐欣赏。由于MP3推出年代已久,几乎所有著名的音频编辑软件支持MP3,可以将mp3象wav一样使用。n由于mp3编码是有损有损的,因此多次编辑后,音质会急剧下降,mp3并不适合保存素材,可作为作品的demo。网络上可以找到大量的mp3资源,mp3player日渐成为一种

20、时尚。MP3也并非完美,在较低码率下表现不好。MP3也具有流媒体的基本特征,可以做到在线播放。 n特点特点:音质好,压缩比比较高,被大量软件和硬件支持,应用广泛。 n适用于适用于:适合用于比较高要求的音乐欣赏。 MP3PROnMP3pro是对MP3格式的改良,其编码算法要比MP3复杂得多。MP3pro分两层编码,是在MP3的基础上再与SB频段复制技术进行混合编码。表现出了相当不错的素质,高音丰满,这种格式在低比特率的时候压缩率非常高,同比特率的MP3pro文件体积要比MP3和WMA都小得多,而音质却最好!n特点特点:低码率下的音质之王 适用于适用于:低要求下的音乐欣赏 OGGnOgg是一种非常

21、有潜力的编码,在各种码率下都有比较惊人的表现,尤其中低码率下。Ogg除了音质好之外,她还是一个完全免费的编码。Ogg有着非常出色的算法,可以用更小的码率达到更好的音质,128kbps的Ogg比192kbps甚至更高码率的mp3还要出色。n但Ogg的高音具有一定的金属味道,因此在编码一些高频要求很高的乐器独奏时,Ogg的这个缺陷缺陷会暴露出来。Ogg目前的被支持的情况还不够好。 n特点:特点:可以用比mp3更小的码率实现比mp3更好的音质,高中低码率下均具有良好的表现。 n适用于:适用于:用更小的存储空间获得更好的音质WMAn微软开发的WMA同样也是不少朋友所喜爱的,在低码率下,有着好过mp3很

22、多的音质表现,有微软背景的WMA获得了很好的软件及硬件支持,Windows Media Player就能够播放WMA,也能够收听基于WMA编码技术的数字电台数字电台。因为播放器几乎存在于每一台PC上,越来越多的音乐网站都乐意使用WMA作为在线试听的首选了。除了支持环境好之外,WMA在64-128kbps码率下也具有相当出色的表现,虽然不少要求较高的朋友并不够满意,但更多的朋友接受了这种编码,WMA很快普及。 n特点:特点:低码率下的音质表现难有对手 n适用于:适用于:数字电台架设、在线试听、低要求下音乐欣赏 APEn一种新兴的无损音频编码,可以提供50-70%的压缩比,但对于追求完美的朋友简直

23、是天大的福音。APE可以做到真正的无损真正的无损,而不是听起来无损,压缩比也要比类似的无损格式要好。 特点:特点:音质非常好。 适用于适用于:最高品质的音乐欣赏及收藏 RealAudio文件.RA/.RM/.RAM RealAudio文件是RealNetworks公司开发的一种流式音频(Streaming Audio)文件格式;它包含在RealNetworks所制定的音频视频压缩规范RealMedia中,主要用于在低速率的广域网上实时传输音频信息;网络连接速率不同,客户端所获得的声音质量也不尽相同:对于28.8kb/s的连接,可以达到广播级的声音质量;如果拥有ISDN或更快的线路连接,则可获得

24、CD音质的声音。 小小 结结n自然界数据进入计算机包含两个过程,转自然界数据进入计算机包含两个过程,转换成电信号和转换成数字信号。换成电信号和转换成数字信号。n采样和量化是数字化过程中的基本过程。采样和量化是数字化过程中的基本过程。n声音的基本特性包括声强,音频,不同类声音的基本特性包括声强,音频,不同类别的声音具有不同的频率范围,具有不同别的声音具有不同的频率范围,具有不同的处理方法。的处理方法。n各种数字音频格式。各种数字音频格式。作作 业业n清华版书 第63页 1-8题第二节第二节 话音编码话音编码(Speech CodingSpeech Coding)话音技术的研究热点话音技术的研究热

25、点n话音压缩编码(Speech Coding)n基于内容的音频检索技术(Content-based Audio Retrieval )n话音识别(Speech Recognition)n文本话音转换(Text To Speech)2.2.1 2.2.1 话音编码概要话音编码概要 话音信号具有高度的周期性,可利用这话音信号具有高度的周期性,可利用这个特性对话音编码,减少数据率。个特性对话音编码,减少数据率。衡量话音编码器的因素或指标:n音频质量n数据率n编/解码延时n算法复杂度n价格因素2.2.1 2.2.1 话音编码概要话音编码概要2.2.1 2.2.1 话音编码概要话音编码概要话音编译码器的

26、分类话音编译码器的分类(1)n波形编译码器(waveform coder):不利用生成话音的信号的任何知识,将话音视为一种普通的声音,直接对波形信号进行采样和量化。例如PCM、DPCM、ADPCM等。n音源编译码器(Source coder):也叫参数编译码器、声码器(vocoder)。它从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。n混合编译码器(Hybrid coder):综合使用上述两种技术。使用的激励信号波形尽可能接近于原始话音信号的波形。例如CELP。n基于音频数据的统计特性(波形编码)n基于音频声学参数的编码(线性预测编码)n基于人的听觉特性编码(掩蔽

27、效应)nMPEG中高频编码nDolby AC3话音编译码器的分类话音编译码器的分类(2)(2)音音质质与与数数据据率率2 4 8 16 32 642 4 8 16 32 64 kbits/Skbits/S优优良良中中差差坏坏PCMPCM波形编码波形编码音源编码音源编码混合编码混合编码研究目标研究目标质量质量音频编码比较音频编码比较2.2.2 2.2.2 脉冲编码调制脉冲编码调制(PCM)(PCM)波形编码技术波形编码技术1、PCM的概念的概念1101011000110100010002、 PCM的量化方式的量化方式均匀量化均匀量化 与与 非均匀量化非均匀量化3、非均匀量化中两种压扩算法、非均匀

28、量化中两种压扩算法数字电话通信G.711n m m律律( (m m-Law) )压扩压扩Sin(x):x的极性=255nA律律(A-Law)压扩压扩A:最大量化间隔/最小量化间隔0 0 = | |x x| | = 1/A 1/A 1/A 1/A = | |x x| | = 1 1(分两段分两段)n频分多路复用 如:信道频带1400Hz,分成4个子信道。相邻子信道间距240Hz。 这是模拟载波通信的主要手段。n时分多路复用 如:话音信号的采样频率f=8000Hz,采样周期是125s ,为1帧。每帧24路(或30路)信道。 这是数字通信的主要手段。4、PCM在通信中的应用在通信中的应用2.2.3

29、波形编码中的增量调制波形编码中的增量调制增量调制增量调制( (调制,调制,DM)DM)自适应增量调制自适应增量调制(ADM)(ADM)如何克服?如何克服? 2.2.4 自适应差分脉冲编码调制自适应差分脉冲编码调制nAPCM是一种根据输入信号幅度大小自动改变量化阶大小的一种波形编码技术。n前向自适应n后向自适应1、自适应脉冲编码调制(、自适应脉冲编码调制(APCM)2、差分脉冲编码调制、差分脉冲编码调制(DPCM)nDPCM是利用相邻样本之间冗余信息来进行编码的一种数据压缩技术。自适应差分脉冲调制自适应差分脉冲调制(ADPCM) ADPCM综合了综合了APCM的自适应特性和的自适应特性和DPCM

30、系系统的差分特性统的差分特性64Kb/s32Kb/s2.2.5 线性预测编码线性预测编码(LPC)的概念的概念n线性预测编码 (Linear Predictive Coding,LPC) 是一种非常重要的编码方法。从原理上讲,LPC是通过分析话音波形来产生声道激声道激励励和转移函数的参数转移函数的参数,对声音波形的编码实际就转化转化为对这些参数的编码,这就使声音的数据量大大减少。在接收端使用LPC分析得到的参数,通过话音合成器重构话音。清P60n合成器实际上是一个离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型。时变线性滤波器既当作预测器使用,又当作合成器使用。 分析话音波形时,主

31、要是当作预测器使用,合成话音时当作话音生成模型使用。随着话音波形的变化,周期性地使模型的参数和激励条件适合新的要求。线性预测编码(线性预测编码(LPCLPC)n线性预测器是使用过去的P个样本值来预测现时刻的采样值。如图所示,预测值可以用过去P个样本值的线性组合来表示。GSM 算法简介 nGlobal System for Mobile communicationsn GSM算法是1992年柏林技术大学(Technical University Of Berlin)根据GSM协议开发的,这个协议是欧洲最流行的数字蜂窝电话通信协议。nGSM的输入是帧(frame)数据,一帧(20毫秒)由采样频率为

32、8 kHz的带符号的160个样本组成,每个样本为13位或者16位的线性PCM(linear PCM)码。 GSM 编译码器框图AC3编码介绍nDolby AC-3技术是由美国杜比实验室主要针对环绕声环绕声开发的一种音频压缩技术。在5.1声道的条件下,可将码率压缩至384kbps,压缩比约为10:1。nDolby AC-3最初是针对影院系统开发的,但目前已成为应用最为广泛的环绕声压缩技术之一。nDolby AC-3是一种感知型压缩编码技术。n数字音效编码,信噪比更高,提供32K到640K的数据传输率。n独立6声道大功率输出(超重低音120hz),声音定位能力更强。n使用自适应变换编码和心理声学特

33、性,实现失真度极小的大幅度压缩。杜比数字环绕杜比数字环绕EXEX(Dolby® Dolby® Digital Surround EXDigital Surround EX)是在杜比数字标准是在杜比数字标准上加入了上加入了第三个环第三个环绕声道绕声道。第三个环。第三个环绕声道被解码之后,绕声道被解码之后,通过影院系统中设通过影院系统中设置在观众座位正后置在观众座位正后方的环绕声扬声器方的环绕声扬声器来播放(也被称为来播放(也被称为后中置后中置),而左),而左/ /右环绕声道音频信右环绕声道音频信息则通过设置在座息则通过设置在座位左右方的环绕声位左右方的环绕声扬声器

34、来播放。扬声器来播放。n考虑到兼容性,后中置声道经矩阵编码后考虑到兼容性,后中置声道经矩阵编码后录制在常规的录制在常规的5.15.1系统的左系统的左/ /右环绕声轨中,右环绕声轨中,这样当影片在常规的这样当影片在常规的5.15.1系统的影院系统播系统的影院系统播放时就不会发生信息丢失的现象。放时就不会发生信息丢失的现象。n杜比数字环绕杜比数字环绕EXEX的优势在于加入了新的环的优势在于加入了新的环绕声道,从而使得后方声音效果得到较大绕声道,从而使得后方声音效果得到较大的改善。目前已经有越来越多的高质量的改善。目前已经有越来越多的高质量DVDDVD影碟开始支持这个全新的标准。影碟开始支持这个全新的标准。 子带编码(子带编码(Subband Coding) 子带编码是音频压缩方法的一种。它将输入的音频信号的频带分成若干个连续的频段,每个频带称为子带,然后针对各个子带中的音频信号采用不同的编码方案以降低码率。 子带编码的算法复杂度较低,这使得MPC可以有很快的压缩速度,但也带来了它在低码率下表现不佳的先天缺陷。 CCITTCCITT和和ISOISO先后提出了一系列有先后提出了一系列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论