




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
标题:共振峰提取技术的理论研究任务标题和要求:标题:共振峰提取技术的理论研究要求:(1)广泛审查有关福曼提取技术的资料(可以通过网络或图书馆在网上找到相关信息:如formant Estimation等关键词)。(2)各种共振峰分析方法及其应用的分析和总结;(3)写有关疱疹棒提取技术及其应用技术现状的论文。一、带状疱疹的概念疱疹峰是反映通道共振特性的重要特征,表示发音信息的最直接来源,人在语音识别中利用疱疹峰信息。因此,疱疹峰在语音信号处理中是一个非常重要的特征参数,已经被广泛地用作语音识别的主要特征和语音编码传输的基本信息。共振峰信息包含在频率包络中,因此共振峰参数提取的核心是估计自然语音频谱包络,一般认为频谱包络的最大值是共振峰。和基因检查一样,疱疹峰的估计看起来很容易,但实际上又受到了很多问题的困扰。这些问题包括:(1)虚假的峰值。正常情况下,频谱包络的最大值完全再次由共振峰引起。但是在出现在线预测分析方法之前,频谱包络估计器中出现虚假峰是相当普遍的现象。使用线性预测方法时,也不是没有假峰。为了提高灵活性,预测器中还可以添加额外的极点,用于表示这些极点的虚假峰值。(2)福尔曼合并。相邻共振峰的频率太接近,可能很难分辨。这时出现了共振峰合并现象,而识别共振峰合并的理想共振峰提取算法存在很多实际困难。(3)高频音。传统的频谱包络估计方法是利用谐波峰值提供的采样点。高频蜂鸣声的谐波间隔更大,因此用于频谱包络估计的采样点更少,因此频谱包络的估计不准确。使用线性预测的频谱包络估计也可能出现此问题。在这些语音中,线性预测包络峰倾向于离开实际位置,向最近的谐波峰移动。共振峰参数包括共振峰频率、频带宽度和振幅,共振峰信息包含在语音频谱的包络中。因此,共振峰参数提取的核心是估计语音频谱包络,认为频谱包络的最大值是共振峰。通过语音谱傅里叶变换反向变换相应的低频部分,可以得到语音谱的包络曲线。光谱包络的峰值能量大小决定了1 4共振峰,如图所示。二、共振峰提取方法提取共振峰的一些常用方法如下:(1)基于线性预测(LPC)的共振峰计算方法。一种有效的频谱包络估计方法是从线性预测分析角度推导信道滤波器,以此信道滤波器为基础寻找共振峰。线性预测方法有一些缺点,例如频率灵敏度与人类耳朵不一致,但在很多应用领域仍然是有效的方法。线性预测带状疱疹通常有两种选择。一种方法是使用求根的标准程序来求根的方法,即计算预测误差滤波器的根。另一种方法是在预测器导出的光谱包络中查找局部最大值。这称为峰值方法。(2)倒谱法。信道响应的逆频谱衰减相当小-25,25以外的值,因此,通过构造相应的逆频谱过滤器,分离信道的逆频谱,进行分离的逆变换,获得信道函数的代数谱,进一步处理,就可以得到所需的每个空位。三、共振峰实现的提取(1)基于线性预测(LPC)在语音信号的LPC模型中,语音信号样本s(n)可以用以下差分方程表示:表达式中,u(n)是此处的函数,g是增益, AKK=1 1,2,p是LPC系数。相应的数字过滤器传递函数H(z)常识也可以用p极的级联形式表示:在公式中,H(z)是z平面中的第k个极。如果H(z)稳定,则所有极都在z平面的单位圆内。k次共振峰的频率和带宽分别是和,t是语音信号采样周期。语音信号的共振峰可以由数字激光传递函数H(z)估计,最直接的方法是通过多项式寻找源,并通过其根判断共振峰或光谱形状的极点。但是,此方法很难快速有效地找到管线值。获得共振峰的另一有效方法是用语音信号LPC谱的峰值检测方法估算疱疹峰,该方法需要解决疱疹峰带的问题。McCandless在z平面单位圆内反复计算H(z),试图分离组合共振峰,另一种有效的方法是使用对数LPC谱的二次导数估计共振峰,从而获得更好的结果。(2)倒谱方法语音信号不是加性信号,而是线路信号。可以先用卷积同构系统处理,以便用线性系统处理。通过卷积同构系统输出的伪时序序列称为原始序列的“复杂逆谱”。其定义可以表示为:倒谱或“逆谱”定义如下:与复合cepstral的主要区别是序列对数振幅谱的傅里叶逆变换,是复合cept的偶对称分量。他们都将线路运算从伪时间区改为加法运算,这样就可以用满足重叠性的线性系统处理信号。复合倒频谱包含复合代数运算,而逆频谱仅执行实际代数运算,与复合回退频谱运算相比大大减少。和分别是和的逆谱,如果x(n)=*,则x(n)的逆谱c(n)=。(2)倒谱方法选择最常用的零模式,以下列形式描述通道的相应x(n):傅立叶变换后,对数和逆傅立叶变换后,得到复合翻转谱。倒数只考虑振幅特性,表明它是比1/|n|更快的衰减序列。因此,与原始信号x(n)相比,在原点附近更集中或更短的时间内工作。四、福曼提取方法的应用(1)基于线性预测(LPC)的应用技术现状报废类冲击声带。通过通道的响应形成声音。不同的通道形状产生不同的通道响应,从而导致不同的声音。渠道的数学模型主要有两个观点。(a)用几个不同截面的声频管排成行,即声频管模型;(b)将信道视为谐振腔,谐振杆是其共同谐振频率的谐振杆模型。由于在人耳中听的柯蒂斯机构按频率排列其位置,证明谐振杆模型方法非常有效。共振峰是描述语音信号特征的重要参数,因此,准确有效的共振峰提取算法对语音信号的分析、阶段形成和编码具有重要意义。线性预测编码(LPC)是进行语音信号分析、语音信号编码的最有效技术之一,其重要性在于提供一组相对准确地表示语音信号振幅谱的简明语音信号模型参数,分析该方法所需的计算量是LPC对相对语音信号波幅杆的分析方法的主要特征之一,在由预测系数构成的多项式中,可以准确估计共振峰频率和带宽。过去的研究中提出了很多利用LPC分析提取共振峰的方法。(2)倒谱法应用技术现状倒谱法根据对数功率谱的逆傅里叶变换,分离光谱包络和微结构,非常准确地获得俯仰频率和共振峰信息,但其运算量相对较大。使用无噪声语音时,利用逆谱提取音调效果理想。但是,当有加法噪声时,对数功率谱低级部分的噪声将被填充,以掩盖俯仰谐波的周期性。这意味着逆频谱输入不再是纯粹的周期性成分,逆频谱的俯仰峰变宽,被噪音污染,从而减少了逆频谱检测方法的灵敏度。在基音估计中,也可以在经过中央削波或三电平削波后使用自相关法,该方法在信噪比低的情况下可以获得良好的性能。五、摘要疱疹棒是反映通道共振特性的重要特征,它表示发音信息的最直接来源。变更疱疹峰会产生所有的原音和部分辅音,疱疹峰也包含辅音的重要信息。人在语音识别中也利用了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025公务员考试题型预测题及答案
- 2025公务员结构化面试试题及答案
- 2025大厂公务员考试题目及答案
- 两类空间分数阶扩散方程反问题解析及其在热防护服设计中的创新应用
- 2025财政与金融期末试题及答案A
- 2025财务与金融面试题及答案
- 2024年衢州常山县卫健系统事业单位真题
- 汽车电子工业园项目资金申请报告(参考模板)
- 2024年河北社区《网格员》模拟训练及答案
- 2024年西安医学院儿童医院招聘真题
- 保险车险知识培训总结课件
- 施工合同 补充协议
- 楼梯切割安全生产合同范本
- 加油站秋季安全知识培训课件
- 2025-2026学年人教版2024八年级上册开学摸底考试英语模拟卷
- 2025至2030中国CPU市场运行现状与发展前景分析报告
- 2025年贵州中考化学试卷真题答案详解解读(精校打印)
- 2025抗战胜利80周年现代诗歌朗诵稿(16篇)
- GB/T 23781-2024黑芝麻糊质量通则
- CAMDS操作方法及使用技巧
- (新版)铁路防洪知识题库(含答案)
评论
0/150
提交评论