




已阅读5页,还剩56页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音信号的倒谱分析 v根据语音信号的产生模型,语音信号S(Z)是一个线 性非移变因果稳定系统V(Z)受到信号E(Z)激励后所 产生的输出。 v在时域中,语音信号s(n)是该系统的单位取样响应 v(n)和激励信号e(n)的卷积。 v在语音信号数字处理所涉及的各个领域中,根据 s(n)来求得v(n)和e(n)具有非常重要的意义。 v由卷积信号求得参与卷积的各个信号的过程称为解 卷过程。 语音信号的倒谱分析 v解卷算法可以分为两大类: 第一类是首先为线性系统V(Z)建立一个模型,然后对模型 参数按照某种最佳准则进行估计,这种方法称为参数解 卷方法。采用的模型可以分为全极点模型(AR模型)和 零极点模型(ARMA模型),如果采用最小均方误差准则 对AR模型进行估计,就得到线性预测编码算法(LPC)。 第二类算法称为非模型解卷。同态信号处理完成解卷任 务就是其中最重要的一种。 语音信号的倒谱分析 v对信号进行分析得出它的倒谱参数的过程称为同态 处理。 v对语音信号的某一帧同样可以分析出它的短时倒谱 参数,总的说来,无论对于语音通信、语音合成或 语音识别,倒谱参数所含的信息比其他参数多,也 就是语音质量好,识别正确率高。 v但其缺点是运算量比其他参数大,尽管如此,倒谱 分析方法仍不失为一种有效的语音信号的分析方法 。 同态分析的基本原理 v有很多客观物理现象中的信号,其中各组成分量的组 合,并不是按照加法组合原则组合起来的,如图像信 号、地震信号、调制信号、语音信号等,它们都不是 加性信号,而是乘积性或卷积性组合的信号。 v显然,这时不能用线性系统来处理,而必须用满足该 组合规则的非线性系统来处理。但是非线性系统地分 析非常困难。 v同态信号处理法就是设法将非线性问题转化为线性问 题来处理的一种方法。按照被处理的信号来分类,大 体上可以分为乘积同态信号处理和卷积同态信号处理 。 v由于语音信号可以视为声门激励信号和声道响应信号 的卷积结果。我们仅讨论卷积同态信号处理系统的问 题。 卷积同态信号处理系统 同态系统可以分解为两个特征系统(即特征系统和逆 特征系统)(指取决于信号的组合规则)和一个线 性系统(仅取决于处理要求) 卷积同态信号处理系统 卷积同态信号处理系统 v由于加性信号的Z变换结果仍为加性信号,所以倒谱这种时 域信号,是可以用线性系统来处理的,经线性处理之后,如 欲在恢复出语音信号,则可以采用逆特征系统来实现,即特 征系统的逆运算。即将线性系统输出的加性倒谱信号: 卷积同态信号处理系统 特征系统与逆特征系统的组成 语音信号的倒谱 语音信号的倒谱 复倒谱经过正逆两个特征系统变换后,序列可以还原为 本身。但是倒谱经过正逆两个特征系统变换后,序列不 可以还原为本身。 由序列的复倒谱求倒谱的方法 v由于偶对称序列的DTFT是实函数,奇对 称序列的DTFT是虚函数。 由序列的复倒谱求倒谱的方法 因此 相位倒谱的概念 假设 则 称p(n)为相位倒谱。 已知倒谱求复倒谱的方法 要想由倒谱求复倒谱,首先复倒谱必须满足一 定的条件,比如是因果序列 则 因此 已知倒谱求复倒谱的方法 v如果复倒谱是一个反因果序列: v则可以推导出: v只有当x(n)是一个因果最小相位序列是其复倒谱序 列才是一个因果稳定序列。这要求x(n)应满足两个 条件:1 x(n)=x(n)u(n);2 X(Z)=Zx(n)的零极点都 应该在单位圆内。 语音信号倒谱和复倒谱的性质 v根据语音信号产生的模型,在z域中语音信号S(Z)等于激励 信号E(Z)和声道传输函数V(Z)的乘积,即S(Z)=E(Z)V(Z)。 经过同态系统后可以得到: v先讨论声门激励信号。除了人们发清音时,声门激励是能量 较小、频谱均匀分布的白噪声之外;发浊音时,声门激励是 以基调周期为周期的周期脉冲序列 语音信号倒谱和复倒谱的性质 语音信号倒谱和复倒谱的性质 v由上式可以得出以下结论:一个周期冲激的有限长度序列, 其复倒谱也是一个同周期长度的周期冲激序列,只是其长度 变为无限长度、振幅随着K值的增加而衰减,衰减速度比原 来序列要快,显然,周期冲激序列的倒谱的这些性质对于语 音信号的分析是很有用的,这意味着除了原点之外,可以用 “高时窗”来从语音信号的倒谱中提取浊音激励信号的倒谱, 从而使倒谱法提取音调成为现实。 语音信号倒谱和复倒谱的性质 语音信号倒谱和复倒谱的性质 语音信号倒谱和复倒谱的性质 语音信号倒谱和复倒谱的性质 语音信号倒谱和复倒谱的性质 语音信号倒谱和复倒谱的性质 v在清音情况下,e(n)具有噪声特性,因而其 复倒谱也没有明显的峰起点,且分布范围很 宽,从低时域延伸到高时域。而v(n)的复倒谱 仍然只分布在低时域中。 求复倒谱的一种有效的递推算法 v前提:x(n)是最小相位序列。 v因为 求复倒谱的一种有效的递推算法 语音信号的线性预测分析 vLinear Prediction 1947年维纳提出; 1967年板仓等人应用于语音分析与合成; v语音信号处理与分析的核心技术 提供了预测功能; 提供了声道模型和声道模型的参数估计方法; v基本思想: 语音样本之间存在相关性,一个语音信号的样本可 以用过去若干个样本的线性组合来逼近; 线性预测原理 v线性预测是目前分析语音信号的最有效的方法之一,分 析的结果是得到一组信号的全极点模型参数,所以又称 为信号参数模型法。 v这个方法的基本思想是将被分析信号模型化,即用有限 数目的模型参数来描述信号中的信息,具体来说,将被 分析信号s(n)视为某系统(即模型)的输出,而系统的 输入,在s(n)为确定性信号是采用单位取样序列。在 s(n)为随机信号是采用白噪声序列。 语音信号的模型 v常用来产生合成语音,所以称为合成滤波器 求解滤波器参数和G 的过程就是线性预测 的分析过程。 线性预测原理 v在基于参数模型的谱估计方法和系统辨识中,常常假 定系统的传递函数是有理函数,也就是变量Z的有理分 式,这种有理分式有三种情况: 只有零点没有极点的情况,称为滑动平均模型。即MA模型 只有极点没有零点的情况,称为自回归模型。即AR模型 既有零点又有极点的情况,称为自回归滑动平均模型。即 ARMA模型 线性预测原理 全极点模型的参数估计十分简单,只需很小 的几个极点就可以相当好的估计一种频谱或 一种系统的频率响应,因此传递函数相当于 一个递归数字滤波器。即IIR滤波器 线性预测法正是基于全极点模型的假定,采 用时域均方最小误差准则来估计模型参数的 。 参数解卷的通用模型 对模型的限制 v为了得到一种高效的求解方法。 v令G(Z)=1,模型中只含有极点不含有零点。这种 模型称为全极点模型; v对未知序列e(n)加以限制,表示成Ge(n)的形式, 其中e(n)是一个周期脉冲序列或者高斯白噪声序 列;系数G是非负实数,用来控制输出序列的幅 度。 由全极点模型构成的参数解卷模式 周期序列或高斯 白噪声序列 虽然采取了一些限制,但是这种全极点模型的适应面还是很宽的。特 别适合于语音信号处理领域 利用线性预测方法估计全极点模型的参数的命题 v现在讨论如何用线性预测的方法来解决全极点 模型的参数估计问题,从而完成解卷的任务。 v参数解卷的命题是:如果得到语音序列s(n),并 且知道它是由一个周期脉冲序列或高斯白噪声 序列激励一个全极点模型产生的。那么,采用 什么样的算法,才能在最佳意义上估计出模型 参数,激励信号e(n)和增益系数G。 v线性预测算法能按照最小均方误差的准则给出 问题的解。 利用线性预测的方法解决全极点模型的参数估计 v在序列s(n)中任取一个时刻n,假设n以前的p个 样点上的语音样值s(n-1),s(n-2),s(n-p) 已知,而时刻n的语音样值s(n)未知,现用这p 个已知的样值取某种线性组合来预测未知的样 值,则未知样值s(n)的预测值可以表示为: 利用线性预测的方法解决全极点模型的参数估计 可以用 的均方值 来衡量线性预测 的质量。 对于一个给定的语音序列, 取决于p和各个预测 系数的值。如果能够找到一个特定的预测阶数p 和一组预测系数,使得 达到最小值,那么这 组预测系数称为最佳预测系数,记为 利用线性预测方法估计的一个结论 v结论:如果已知s(n)确实是由全极点模型产生的, 那么最佳预测阶数应该是p=p,最佳预测系数应 该是 结论的证明 v按照全极点模型的表示可以得到 结论的证明 考虑误差序列e(n)是白噪声的情况,这时候序列e(n)的各个样点值相互统 计独立,不难导出f(n)和g(n)相互统计独立 实现这一点的充分必要条件是下面的两项中任一项成立。 全极点模型中阶数p的选择 v如果全极点模型的阶数p预知,则可以设置预测阶 数p=p。 v如果阶数p不能确定,则可以采用尝试的方法,观 察 随着p的变化情况,显然,当p=p时,再增加p就 不能使其下降可确定预测阶数p。 全极点模型中阶数p的选择 v实际的语音序列s(n)并不都是完全符合全极点理想模型 。当s(n)不是由理想全极点模型产生时,这种情况下提 高p值总可以改善逼近效果。 v在语音信号处理领域中,模型阶数p一般选择在812 之间。一般而言,当语音采样率为6.667kHz时,选 P=8;采样率为8KHz时,选P=12。 v要想使模型的假定较好的符合语音的实际产生模型主 要考虑两个因素: 模型的阶数要与共振峰的个数相吻合; 声门脉冲形状和口唇辐射影响的补偿。 考虑了上述两个因素的线性预测分析,预测误差序列 近似于白噪声序列,表明由某一短时信号所得到的 线性预测系数能较好的描述产生这段语音的声道特 性。 p=p条件下求最佳预测系数的方法 v令 对p个预测系数的偏导数为0,得到p个方 程,解方程组得到最佳预测系数。 p=p条件下求最佳预测系数的方法 v进行求偏导数可以得到: v假设 完全由输入语音信号决定 v则可以得到: 称为线性预测编码(LPC)正则方程。 p=p条件下求最佳预测系数的方法 v当预测系数等于最佳预测值时,均方值可以达到最小值 LPC正则方程组的自相关解法和自协方差解法 v考虑到语音信号的短时平稳特性,对语音信号 进行LPC分析时同样采用短时分析。对语音信 号进行短时分析有两种方案: 对语音信号s(n)与窗函数w(n)相乘,得到加窗语音 信号sw(n),然后对加窗语音信号进行LPC分析,这 种方法称为自相关法 限制均方误差的求解式的求和区间,这种方法称为 自协方差法 LPC正则方程组的自相关解法 假设加窗语音信号的非零区间为0,N-1,对加窗语音信 号进行线性预测分析 利用加窗语音信号sw(n)代替s(n),进行相同的推导可以 得到最佳预测系数是 的解。 其中, 求和区间为1,N+p-1 LPC正则方程组的自相关解法 v假设n-i=m,则 vsw(n)的自相关函数为: v采用自相关法的LPC正则方程为: LPC正则方程组的自相关解法 系数矩阵是对称矩阵,称为Toeplitz矩阵,具有快速算法。 LPC正则方程组自相关解法的特点 v用加窗语音信号代替原有的语音信号必然引入误差,从一种角度上讲误 差是因为利用加窗语音信号的自相关函数代替原有语音信号的自相关函 数引起的,从另一种角度利用加窗语音信号进行线性预测时,在加窗语 音信号的起始端和结尾端必然会引起较大的误差。 无论选用哪种窗函数两端的误差都是不可避免的,但是当Np时,误差段 在整个语音段中所占的比重比较小,用自相关算法得到的参数估计值比 较准确,当N和p相当时,估计的误差比较大。 语音信号处理中,一般N值介于160200之间,而p值介于812之间, 符合Np,可以采用自相关法。 LPC正则方程组的自协方差解法 v对于语音信号不进行加窗,对均方值的求解区间进行限定, 即为自协方差法。假定求和区间为0,N-1,则 v同样可以得到: LPC正则方程组的自协方差解法 令n-i=m,则: LPC正则方程组的自协方差解法 自协方差法的突出优点时不存在自相关解法中两端出现很大预测误差 的情况,当N和p比较接近时,能够给出比较精确的参数估计值。但 是在计算过程中没有高效递归算法。 两种正则方程解法的对比 性能自相关法协方差法 窗口函数需要不需要 稳定性可以保证不能保证 有限字长时的稳定性 不能保证不能保证 乘法运算量 参数精度最差最好 v线性预测反射系数 线性预测系数、反射系数、倒谱系数 LPC谱估
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉字巡展活动方案
- 水上知识进社区活动方案
- 每月英语活动方案
- 棋艺运动会活动方案
- 江北除夕活动策划方案
- 汽车夜晚活动活动方案
- 民俗调研活动方案
- 残疾人阳光宣讲活动方案
- 桌子声势律动活动方案
- 水库放水养鱼活动方案
- 静电放电(ESD)及其防护措施培训课件
- 离婚不离家协议书
- 社区干事考试试题及答案
- 2025年建筑工程管理考试试题及答案
- 2025年广西南宁宾阳县昆仑投资集团有限公司招聘笔试参考题库含答案解析
- 2025年军人离婚协议书范本
- DB11∕T045-2025医学实验室质量与技术要求
- 工程造价复审报告书范文
- 《星形胶质细胞》课件
- SAP S4HANA 用户操作手册-成本控制CO操作手册-002-订单成本核算
- 幼儿园2025-2026学年度第一学期园本培训计划
评论
0/150
提交评论