




已阅读5页,还剩62页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
阅读讨论PPT,PB08210092,第三章:语音信号分析,概述语音信号的数字化和预处理语音信号的时域分析语音信号的频域分析语音信号的倒谱分析语音信号的线性预测分析语音信号的小波分析,3.1概述,语音信号分析:语音信号处理的前提和基础,只有分析出可表示语音信号特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。语音合成的音质好坏和语音识别率的高低,也都取决于语音信号分析的准确性和精确性。语音信号分析在语音信号处理中具有举足轻重的地位。,分类:,参数性质分析方法,时域分析频域分析倒谱域分析,模型分析方法非模型分析方法,简单、计算量小、物理意义明确,感知特性较好,更为重要,依据语音信号产生的数学模型来分析和提取表征这些模型的特征参数,不进行模型化分析,短时分析技术:,贯穿于语音分析的整个过程;语音信号从整体来看其特征及表征其本质特征的参数均是随时间而变化的,所以它是一个非平衡态过程,不能用处理平衡信号的数字信号处理技术对其进行分析处理。但是在一个短时间范围内(一般认为在10-30ms的短时间内),其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。不论是分析怎么样的参数以及采用什么分析方法,在按帧进行语音分析,提取语音参数之前,有一些经常使用的、共同的短时分析技术必须预先进行,如语音信号的数字化、语音信号的端点检测、预加重、加窗和分帧等,这些也是不可忽视的语音信号析的关键技术。,3.2数字化和预处理,语音信号的数字化一般包括放大及增益控制、反混叠滤波、采样、A/D变换及编码(一般就是PCM码);如下图:预处理一般包括预加重、加窗和分帧等。分析和处理之前必须把要分析的要分析的语音信号部分从输入信号中找出来,叫做语音信号的端点检测。,预滤波、采样、A/D转换,预滤波的目的有两个:抑制输入信号各频域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。抑制50Hz的电源工频干扰。这样,预滤波器必须是一个带通滤波器,设其上、下截止频率分别是fH和fL:则绝大多数语音编译码器有:fH=3400Hz,fL=60-100Hz,fS=8kHz,预滤波、采样、A/D转换,语音信号经过预滤波和采样后,由A/D变换器变换为二进制数字码。A/D变换中要对信号进行量化,量化不可避免地会产生误差。量化后的信号值与原信号值之间的差值称为量化误差,又称为量化噪声。若信号波形的变化足够大,或量化间隔足够小时,可以证明量化噪声符合具有下列特征的统计模型:它是平稳的白噪声过程量化噪声与输入信号不相关量化噪声在量化间隔内均匀分布,即具有等概率密度分布,预滤波、采样、A/D转换,若用x2表示输入语音信号的方差,2Xmax表示信号的峰值,B表示量化字长,e2表示噪声序列的方差,可以证明量化信噪比SNR(信号与量化噪声的功率比)为:假设语音信号的幅度符合Laplacian分布,此时信号幅度超过4x的概率很小,只有0.35%,因而可取Xmax=4x,则上式表明量化器中的每bit字长对SNR的贡献为6dB。A/D转换器分为线性和非线性转换器两类。目前的线性A/D转换器绝大部分是12bits的(即每一个采样脉冲转换为12位二进制数)。非线性A/D转换器则是8位的,它与12位线性转换器等效。,预处理,由于语音信号的平均功率谱受声门激励和口鼻辐射影响,高频端大约在800Hz以上按6dB/倍频程跌落,要在预处理中进行预加重(Preemphasis)处理。预加重目的:提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析。预加重可在语音信号数字化时在反混叠滤波器之前进行,不仅可以进行预加重,而且可以压缩吸纳后的动态范围,有效提高信噪比。预加重一般在语音信号数字化之后,利用数字滤波器实现:值接近1。,预处理,进行过预加重数字滤波处理后,接下来就要进行加窗分帧处理。一般每秒的帧数约为33-100帧,视实际情况而定。分帧虽然可以采用连续分段的方法,但一般要采用如图3-1所示的交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的比值一般取为0-1/2。,预处理,分帧是用可移动的有限长度窗口进行加权的方法来实现的,这就是用一定的窗函数(n)来乘s(n),从而形成加窗语音信号s(n)=s(n)*(n)。在语音信号数字处理中常用的窗函数是矩形窗和汉明窗等,它们的表达式如下(其中N为帧长):矩形窗:汉明窗:,预处理,窗口的形状:在时域因为是语音波形乘以窗函数,所以要减小时间窗两端的坡度,使窗口边缘两端不引起急剧变化而平滑过渡到零,这样可以使截取出的语音波形缓慢降为零,减小语音帧的截断效应;在频域要有较宽的3dB带宽以及较小的边带最大值。可以看出:汉明窗的主瓣宽度比矩形窗大一倍,即带宽约增加一倍,同时其带外衰减也比矩形窗大一倍多。矩形窗的谱平滑性能较好,但损失了高频成分,使波形细节丢失;而汉明窗则相反,从这一方面来看,汉明窗比矩形窗更为合适。,预处理,窗口的长度:采样周期Ts=1/fs,窗口长度N和频率分辨率f之间存在下列关系:f=1/NTs,采样周期一定时,f随窗口宽度N的增加而减小,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。应该根据不同的需要选择合适的窗口长度。有时窗口长度的选择,更重要的是要考虑语音信号的基音周期。通常认为在一个语音帧内应包含17个基音周期。然而不同人的基音周期变化很大,所以N的选择比较困难。通常在10kHz取样频率下,N折中选择为100200点为宜(即1020ms持续时间)。,3.3语音信号的时域分析,语音信号的时域分析就是分析和提取语音信号的时域参数。应用范围:常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。特点:表示语音信号比较直观、物理意义明确。实现起来比较简单、运算量少。可以得到语音的一些重要的参数。只使用示波器等通用设备,使用较为简单等。,短时能量及短时平均幅度分析,如图所示,设语音波形时域信号为x(t)、加窗分帧处理后得到的第n帧语音信号为xn(m),则xn(m)满足下式:xn(m)=(m)x(n+m)其中,n=0,1T,2T,并且N为帧长,T为帧移长度。设第n帧语音信号xn(m)的短时能量用En表示,则其计算公式如下:,Tx=x2,短时能量及短时平均幅度分析,En是一个度量语音信号幅度值变化的函数,但它有一个缺陷,即它对高电平非常敏感(因为它计算时用的是信号的平方)。为此,可采用另一个度量语音信号幅度值变化的函数,即短时平均幅度函数Mn,它定义为:Mn也是一帧语音信号能量大小的表征,它与En的区别在于计算时小取样值和大取样值不会因取平方而造成较大差异,在某些应用领域中会带来一些好处。用途:区分浊音段和清音段,浊音是En值比清音时大得多;用来区分声母和韵母的边界,无声和有声的边界,连字的分界;作为一种超音段信息,用于语音识别中。,短时过零率分析,短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。过零分析是语音时域分析中最简单的一种。对于连续语音信号,过零即意味着时域波形通过时间轴;而对于离散信号,如果相邻的取样值改变符号则称为过零。过零率就是样本改变符号的次数。定义语音信号xn(m)的短时过零率Zn为:式中,sgn是符号函数,即,短时过零率分析,短时能量、平均幅度和过零率都是随机参数,概率密度函数如图:应用:区分清音和浊音;从背景噪声中找出语音信号,判断寂静无声段和有声段的起点和终点位置;当语音以某些音位开始或结尾时(弱摩擦音、弱爆破音、鼻音等),过零率和短时平均能量一起结合使用,更为有效。,短时过零率分析,实际问题:如果输入信号中包含有50Hz的工频干扰或者A/D转换器的工作点有偏移(等效于输入信号有直流偏移),计算的过零率参数很不精确。解决方法:A/D转换器前的防混叠带通滤波器低端截止频率应高于50Hz,有效抑制电源干扰。采用低直流漂移器件,也可以算出每一帧的直流分量并加以滤除。,短时相关分析,一、短时自相关函数定义:其中K最大的延迟点数。性质:如果是周期的(Np),则自相关函数是偶函数,即当k=0时,自相关函数有最大值,即并且等于确定性信号序列的能量或随机序列的平均功率。,短时相关分析,右图中:N=401,Fs=8kHza、b是浊音信号,c位清音信号,由图可以看出浊音信号的自相关函数具有一定得周期性,而清音信号的自相关函数缺乏周期性。,短时相关分析,窗长选择考虑因素:估计均值(矩形窗)窗长越小,窗内基音周期变化越小n(k)估计不准,偏差大;窗长越大,窗内基音周期性明显,但窗内基音周期变化越大偏差小,但n(k)周期性变差;,短时相关分析,二、修正的短时自相关函数:问题引出:传统的自相关函数对窗长具有依赖性。解决方法:用两个不同的窗口,截取两个不等长的序列进行卷积和,两个窗口的长度相差最大的延迟数为K。定义:其中:,增补K点,互相关,短时相关分析,浊音的修正自相关(a)N=401;(b)N=251;(c)N=125.均是矩形窗,浊音的自相关(a)N=401;(b)N=251;and(c)N=125.均是矩形窗.,窗长小时,修正的作用比较明显,窗长大时,修正的作用被基音变化所掩盖,短时平均幅度差函数,由于短时自相关函数预算量大,所需时间较长,为了避免乘法,采用差值短时平均幅度差函数(AMDF)来进行语音分析。原理:对于周期(Np)信号,相距位整数倍的样点上的幅值是相同的,差值为0;即短时平均幅度差函数:由周期性可知Fn(k)在K=Np,2Np时出现最小值,3.4语音信号的频域分析,定义:分析语音信号的频域特征。广义上讲:语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等;常用的频域分析方法有带通滤波器组法、傅里叶变换法、线性预测法等几种。本章介绍的是语音信号的傅里叶分析法。因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。,用短时傅里叶变换求语音的短时谱,为什么用STFT分析语音信号?清音:噪音激励LTI,其谱较平坦;浊音:周期脉冲激励LTI,浊音的特性主要由LTI的频谱特性决定=语音谱是表征语音特性的重要参数而语音是非平稳的,语音的谱是时变的=STFT是信号的一种时频分析方法,具有明确的物理意义语音的时变:syllabicrates(10times/sec)缓变性:10-30msec内,大部分语音信号的特性可看着是时不变的。,用短时傅里叶变换求语音的短时谱,对第n帧语音信号xn(m)进行傅里叶变换(离散时域傅里叶变换,DTFT),可得到短时傅里叶变换,其定义如下:可知,短时傅里叶变换实际就是窗选语音信号的标准傅里叶变换。这里,窗(n)是一个“滑动的”窗口,它随n的变化而沿着序列x(m)滑动。由于窗口是有限长度的,满足绝对可和条件,所以这个变换是存在的。当然窗口函数不同,傅里叶变换的结果也将不同。,用短时傅里叶变换求语音的短时谱,我们还可以将式(3-27)写成另一种形式。设语音信号序列和窗口序列的标准傅里叶变换均存在。当n取固定值时,(n-m)的傅里叶变换为:根据卷积定理有:因为上式右边两个卷积项均为关于角频率的以2为周期的连续函数,所以也可将其写成以下的卷积积分形式:即,假设x(m)的DTFT是X(ej),且(m)的DTFT是X(ej),那么Xn(ej)是X(ej)和W(ej)的周期卷积。,用短时傅里叶变换求语音的短时谱,在语音信号数字处理中,功率谱具有重要意义,在一些语音应用系统中,往往都是利用语音信号的功率谱。根据功率谱定义,可以写出短时功率谱与短时傅里叶变换之间的关系:或者:式中*表示复共轭运算。并且功率谱Sn(ej)是短时自相关函数Rn(k)的傅里叶变换。,3.5语音信号的倒谱分析,语音信号的倒谱分析就是求取语音倒谱特征参数的过程,它可以通过同态处理来实现。同态信号处理也称为同态滤波,它实现了将卷积关系变换为求和关系的分离处理,即解卷(可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期)。对语音信号进行解卷,求取倒谱特征参数的方法有两种:一种是线性预测分析,一种是同态分析处理。同态信号处理就是将非线性问题转化为线性问题的处理方法。按被处理的信号来分类,大体分为乘积同态处理和卷积同态处理两种。由于语音信号可视为声门激励信号和声道冲击响应的卷积,所以这里仅讨论卷积同态信号处理。,同态信号处理的基本原理,如图所示为一卷积同态系统的模型。包含两个特征子系统和一个线性子系统。第一个子系统,如c所示,它完成将卷积性信号转化为加性信号的运算;第二个子系统是一个普通线性系统,满足线性叠加原理,用于对加性信号进行线性变换;第三个子系统是第一个子系统的逆变换,它将加性信号反变换为卷积性信号,如d所示。,同态信号处理的基本原理,第一个子系统D*完成将卷积性信号转化为加性信号的运算,即对于信号x(n)=xl(n)*x2(n)进行了如下运算处理:由于x(n)为加性信号,所以第二个子系统可对其进行需要的线性处理得到y(n)。第三个子系统是逆特征系统D*-1,它对y(n)=y1(n)+y2(n)进行逆变换,使其恢复为卷积性信号,即进行了如下处理:从而得到卷积性的恢复信号,复倒谱和倒谱,虽然D*与D*-1系统中的x(n)和y(n)信号也均是时域序列,但它们所处的离散时域显然不同于x(n)和y(n)所处的离散时域,所以我们把它称之为“复倒频谱域”。x(n)是x(n)的“复倒频谱”,简称为“复倒谱”,有时也称作对数复倒谱。在绝大多数数字信号处理中,X(z),X(z),Y(z),Y(z)的收敛域均包含单位圆,因而D*与D*-1系统有如下形式:D*=D*-1=,复倒谱和倒谱,设:则取其对数得:即复数的对数仍是复数,它包含实部和虚部。注意,这时对数的虚部argX(ej)由于是X(ej)的相位,所以将产生不一致性。如果,我们只考虑X(ej)的实部,令:显然c(n)是序列x(n)对数幅度谱的傅里叶逆变换。c(n)称为“倒频谱”或简称为“倒谱”,有时也称“对数倒频谱”。倒谱对应的量纲是“Quefrency”,它也是一个新造的英文词,是由“Frequency”转变而来的,因此也称为“倒频”,它的量纲是时间。c(n)实际上就是我们要求取的语音信号倒谱特征。,复倒谱和倒谱,复倒谱和倒谱特点和关系(1)复倒谱要进行复对数运算,而倒谱只进行实对数运算。(2)在倒谱情况下一个序列经过正逆两个特征系统变换后,不能还原成自身,因为在计算倒谱的过程中将序列的相位信息丢失了。(3)与复倒谱类似,如果c1(n)和c2(n)分别是x1(n)和x2(n)的倒谱,并且x(n)=x1(n)*x2(n),则x(n)的倒谱c(n)=c1(n)+c2(n)。(4)已知一个实数序列x(n)的复倒谱x(n),可以由x(n)求出它的倒谱c(n)。(5)已知一个实数序列x(n)的倒谱c(n),能否用它来求出复倒谱x(n)(若x(n)满足两个条件:x(n)=x(n)*u(n),并且X(Z)=Z(x(n)的零极点都在单位圆内时,可由倒谱求复倒谱)。,语音信号的倒谱分析实例,由同态分析求出的语音信号倒谱实例一个信号的倒谱定义为信号频谱模的自然对数的逆傅里叶变换(即设相位恒定为零)。设信号为s(n),则其倒谱为:据语音信号产生模型,语音信号s(n)是由声门脉冲激励e(n)经声道响应v(n)滤波而得到,即:设三者的倒谱分别为s(n)、e(n)及v(n),则有:倒谱域中基音信息与声道信息是相对分离的,可通过滤波分别求出e(n)和v(n),求出基音周期。,语音信号的倒谱分析实例,基音检测中,加窗选择很有必要,应选缓变窗。一般选择汉明窗。如图:可以看出,当使用矩形窗函数时,基音峰变得模糊不清。加汉明窗的倒谱基音峰清晰突出。,语音信号的倒谱分析实例,如图为一段清辅音语音的波形及相应的倒谱,倒谱中没有出现任何在浊音情况下的那种尖峰,然而倒谱中的低时域部分仍然包含了关于声道冲击响应的信息。,语音信号的倒谱分析实例,MEL频率倒谱系数(MECC)与普通实际频率倒谱分析不同,MFCC(Mel-FrequencyCepstralCoefficents,简称MFCC)的分析着眼于人耳的听觉特性,因为,人耳所听到的声音的高低与声音的频率并不成线性正比关系,而用Mel频率尺度则更符合人耳的听觉特性。所谓Mel频率尺度,它的值大体上对应于实际频率的对数分布关系。Mel频率与实际频率的具体关系可用式(3-89)表示:这里,实际频率的单位是Hz。,模拟人耳恒Q滤波,语音信号的倒谱分析实例,MFCC参数的计算流程:,3.6语音信号的线性预测分析,基本思想:由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即一个语音的抽样能够用过去若干个语音抽样或它们的线性组合来逼近。通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。而这组预测系数就反映了语音信号的特性,可以作为语音信号特征参数用于语音识别、语音合成等。,线性预测分析的基本原理,线性预测分析的基本思想是:用过去p个样点值来预测现在或未来的样点值:预测误差(n)为:这样就可以通过在某个准则下使预测误差(n)达到最小值的方法来决定惟一的一组线性预测系数ai(i=1,2,p)。,线性预测分析的基本原理,系统的输入e(n)是语音激励,s(n)是输出语音,模型的系统函数H(z)可以写成有理分式的形式:式中ai,bl及增益因子G是模型的参数,p和q是选定的模型的阶数。根据H(z)的不同,有三种不同的信号模型:同时含有极点和零点,称为自回归-滑动平均模型(ARMA)。分子多项式位常数,即bl=0时,H(z)为全极点模型,输出只取决于过去的信号值,称为自回归模型(AR)。分母多项式为1,H(z)为全零点模型,称为滑动平均模型(MA)。,线性预测分析的基本原理,实际的语音信号处理中最常用的模型是全极点模型;理由:如果模型的阶数足够高,则可用全极点模型表示零极点模型。可以用线性预测的方法估计全极点模型参数。采用全极点模型,辐射、声道以及声门激励的组合谱效应的传输函数为:式中p是预测器阶数,G是声道滤波器增益。故语音抽样是s(n)和激励信号e(n)之间的关系可用下列差分方程表示:即语音点间具有相关性。对于浊音,e(n)是单位冲激,对于清音,e(n)是稳恒白噪声。,线性预测分析的基本原理,在模型参数估计程中,把如下系统称为线性预测器:式中ai称为线性预测系数。从而,p阶线性预测器的系统函数具有如下形式:预测误差为:线性预测分析要解决的问题是:给定语音序列(显然,鉴于语音信号的时变特性,LPC分析必须按帧进行),使预测误差在某个准则下最小,求预测系数的最佳估值ai,这个准则通常采用最小均方误差准则。,线性预测分析的基本原理,线性预测方程的推导:把某一帧内的短时平均预测误差定义为:为使E2(n)最小,对aj求偏导,并令其为零,有:上式表明采用最佳预测系数时,预测误差(n)与过去的语音样点正交。由于语音信号的短时平稳性,要分帧处理(10-30ms),对于一帧从n时刻开窗选取的N个样点的语音段Sn,记n(j,i)为则有:,线性预测分析的基本原理,显然,只需找到一种有效地方法求解这组包含p个未知数的p个方程,就可得语音段Sn上预测系数aj,另外可得最小均方预测误差为:整理得:因此,最小预测误差有一个固定分量和一个依赖于预测器系数aj的分量构成,线性预测方程组的求解,求解方法:自相关法、协相关法和格型法。下面讨论自相关方法:对于语音段Sn,它的自相关函数为:由于自相关函数是偶函数,且只和j和i的相对大小有关,可以定义n(j,i)为因此有:,线性预测方程组的求解,把上式展开写成矩阵形式:这种方程叫Yule-Wslker方程,方程左边的矩阵称为托普利兹(Toeplitz)矩阵,它是以主对角线对称的、而且其沿着主对角线平行方向的各轴向的元素值都相等。这种Yule-Wslker方程可用莱文逊-杜宾(LevinsonDurbin)递推算法来高效地求解。下面介绍Durbin快速递推算法。,线性预测方程组的求解,Durbin算法的完整递推过程如下:ifipgoto(1),Durbin算法从零阶预测开始,此时p=0,a0=1,可逐步递推,在运算过程中出现的各阶预测系数的最后一个值被定义为,线性预测方程组的求解,Durbin算法的应用实例:(二阶预测器求预测系数)P=2,先计算出Rn(0),Rn(1),Rn(2),则有:对于i=1,有对于i=2,有最后得,LPC谱估计和LPC复倒谱,LPC谱估计:当求出一组预测器系数后,就可以得到语音产生模型的频率响应,即:因此在共振峰频率上其频率响应特性会出现峰值。所以线性预测分析法又可以看做是一种短时谱估计法。其频率响应H(ej)即称为LPC谱。若信号s(n)是一个严格的p阶AR模型,则事实上信号并非是模型,而是模型,可由模型逼近:,LPC谱估计和LPC复倒谱,LPC谱估计具有一个特点:在信号能量较大的区域即接近谱的峰值处,LPC谱和信号谱很接近;而在信号能量较低的区域即接近谱的谷底处,则相差比较大。这个特点对于呈现谐波结构的浊音语音谱来说,就是在谐波成分处LPC谱匹配信号谱的效果要远比谐波之间好得多。LPC谱估计的这一特点实际上来自均方误差最小准则。从以上讨论我们知道如果p选得很大,可以使|H(ej)|精确地匹配于|S(ej)|,而且极零模型也可以用全极点模型来代替,但却增加了计算量和存储量,且p增加到一定程度以后,预测平方误差的改善就很不明显了,因此在语音信号处理中,p一般选在814之间。,LPC谱估计和LPC复倒谱,LPC复倒谱LPC系数是线性预测分析的基本参数,可以把这些系数变换为其他参数,以得到语音的其他替代表示方单。LPC系数可以表示整个LPC系统冲激响应的复倒谱。设通过线性预测分析得到的声道模型系统函数为:其冲击响应为h(n),设h(n)表示h(n)的复倒谱,则两边对求导数,有,LPC谱估计和LPC复倒谱,由ak可求得h(n):按上式求得的复倒谱h(n)称之为LPC复倒谱,LPC谱估计和LPC复倒谱,LPC复倒谱由于利用了线性预测中声道系统函数H(z)的最小相位特性,避免了相位卷绕问题;且LPC复倒谱的运算量小,它仅是用FFT求复倒谱时运算量的一半;又因为当p时,语音信号的短时复频谱S(ej)满足|S(ej)|=|H(ej)|,因而可以认为h(n)包含了语音信号频谱包络信息,即可近似把h(n)当作s(n)的短时复倒谱s(n),来分别估计出语音短时谱包络和声门激励参数。在实时语音识别中也经常采用LPC复倒谱作为特征矢量。对以上所介绍的进行总结可知,为了估计语音信号的短时谱包络,有三种方法:由LPC系数直接估计语音信号的谱包络;由LPC倒谱估计谱包络;求得复倒谱s(n),再用低时窗取出短时谱包络信息,这种方法称之为FFT倒谱。,LPC谱估计和LPC复倒谱,LPC美尔倒谱系数(LPCCMCC)求得复倒谱h(n)后,由c(n)=1/2h(n)+h(-n)即可求出倒谱c(n)。但是,这个倒谱c(n)是实际频率尺度的倒谱系数(称为LPC倒谱系数:LPCC)。根据人的听觉特性可以把上述的倒谱系数进一步按符合人的听觉特性的美尔(MEL)尺度进行非线性变换,从而求出如下所示的LPC美尔倒谱系数(LPCMCC)。,线谱对分析,线谱对分析也是一种线性预测分析方法,只是它求解的模型参数是“线谱对”(LineSpectrumPair,简称为LSP),它是频域参数,因而和语音
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025授权代理委托合同
- 2025销售补充合同范本
- 2025春季呼和浩特石化分公司高校毕业生招聘20人模拟试卷完整答案详解
- 2025广东珠海市香洲区劳动人事争议仲裁委员会选聘特邀调解员10人考前自测高频考点模拟试题及答案详解(各地真题)
- 2025福建亿力集团有限公司所属单位招聘98人考前自测高频考点模拟试题(含答案详解)
- 2025贵州黔南州瓮安县江界河镇招聘城镇公益性岗位人员1人考前自测高频考点模拟试题及1套参考答案详解
- 2025年上半年四川凉山州宁南县考核招聘教师44人考前自测高频考点模拟试题(含答案详解)
- 2025年甘肃医学院招聘事业编制专业技术人员13人(第一批)模拟试卷及答案详解(易错题)
- 2025福建福州市长乐区行政服务中心管理委员会招聘编外人员2人考前自测高频考点模拟试题及参考答案详解1套
- 2025知识产权许可合同样书
- 2025年中国华电集团招聘面试题解析及备考建议手册
- 2025年机器人面试题及答案解析
- 高三第一次月考总结主题班会课件
- 参考活动2 善待身边的人教学设计-2025-2026学年初中综合实践活动苏少版七年级下册-苏少版
- 2021年全球工作场所状况报告 State of the Global Workplace 2021 Report
- 2025年度江苏省档案管理及资料员基础试题库和答案
- 球墨铸铁管-施工方案(3篇)
- 口腔咨询顾问入门知识培训课件
- 新疆课课件教学课件
- 【2024版】健康知识竞赛题目及答案
- 2025年安徽省安庆市笔试辅警协警预测试题(附答案)
评论
0/150
提交评论