(信号与信息处理专业论文)基于lpc分析的自适应滤波器研究.pdf_第1页
(信号与信息处理专业论文)基于lpc分析的自适应滤波器研究.pdf_第2页
(信号与信息处理专业论文)基于lpc分析的自适应滤波器研究.pdf_第3页
(信号与信息处理专业论文)基于lpc分析的自适应滤波器研究.pdf_第4页
(信号与信息处理专业论文)基于lpc分析的自适应滤波器研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(信号与信息处理专业论文)基于lpc分析的自适应滤波器研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于l p c 分析的自适应滤波器研究 基于l p c 分析的自适应滤波器研究 摘要 语音信号处理及建模是现代信号处理的一个重要子科课题,论文以提取语音 库中的一段语音信号为试验载体,基本完成了较完整的参数提取,根据获得数据 对语音信号进行线性预测建立预测模型,文中首先介绍了a r 模型,l p c 线性预 测原理及其参数算法,对实际语音信号进行l p c 分析实验,讨论了实际语音信 号线性预测时a r 模型参数求取及模型阶数确定,m a t l a b 仿真绘出功谱图, 分析实验残差,研究表明l p c 分析对短数据的频谱分辨率效果明显。 论文重点研究了基于l p c 分析的自适应滤波器,以语音信号进行l p c 分析得 到a r 信号作为输入,采用l m s 算法进行训练,i “a t l a b 仿真构造了自适应线性预 测器,通过试验对影响算法收敛性的参数进行了分析讨论,研究表明输入信号特 征值的分散度越大其收敛性则越差。论文研究将模型法功率谱分析与l m s 自适应 算法结合起来取长补短,注重信号的先验信息,在先验的基础上训练以改善滤波 效果,结合模型参数对l m s 算法收敛性进行分析,以求得到良好的滤波效果,文 中对自适应噪声抵消技术进行了实验研究,成功地从强干扰信号中提取清晰语音 信号,探讨了自适应噪声抵消器的原理、当前应用情况及其前景,并进行了计算 机仿真,给出了仿真结果。 论文研究以试验为主,注重理论与试验相结合,以理论为试验指导,以试验 对理论进行检验。 关键词:a r 模型;l p c 分析;自适应滤波;l m s 算法 壮于l p c 分析的白适f ;,滤放器研究 as t u d yo fa d a p t i v ef ii t e rb a s e do nl p ca n a i y z i n g a b s t r a c t s p e e c hs i g n a lp r o c e s s i n ga n dm o d e l i n gi s av e r yi m p o r t a n td i s c u s s i o no f m o d e ms i g a a lp r o c e s s i n g , i nt h i st h e s i s ,ap a r to fs p e e c hs i g n a lw h i c hi sc o l l e c t e d f r o mt h es p e e c hs t o r e h o u s eo fa c o u s t i c si st h ec a r r i e ro fas e r i e st e s t ,o nt h ew h o l et h e p a r a m e t e r si sp i c k e du pf r o mt h ea rm o d e l a c c o r d i n gt ot h ed a t aap r e d i c t i o nm o d e l i sf o u n d e d f i r s t l y , h o wt os t r u c t u r ea rm o d e li si n t r o d u c e di nt h i sp a p l e r , a n dt h e nt h e a l g o r i t h m sa n dp r i n c i p l eo fl p ca n a l y s i sb eu s e di ns p e e c hm o d e la r ep r e s e n t e d ,h o w t od e f i n et h em o d e lp a r a m e t e r sa n dt os t r u c t u r ea rm o d e li sd i s c u s s e d as p e e c h s i g n a li st e s t e dt os t r u c t u r em o d e la n dt os y n t h e s i z eu s i n gm a t l a bs i m u l a t i o n t 1 1 e r e s e a r c hr e s u l ts h o w sag o o de f f e c to ns p e e c hd i s c e m e db ym e a n so fl p ca n a l y s i s m o d e lu s i n gs h o r td a t ac a nb ep r o v i d e d t h ea d a p t i v ef i l t e rb a s e do nl p ca n a l y s i si ss t u d i e de m p h a t i c a l l yi nt h i st h e s i s a rs i g n a lb a s e do l ls p e e c hl p ca n a l y s i sa si n p u t a d a p t i v el i n e a rp r e d i c t i o ni s s t r u c t u r e db ym e a n so fl m sa l g o r i t h mt ot r a i n t h r o u g ht h et e s t ,t h ep a r a m e t e r s i n f i u e n c i n gt h ec o n v e r g e n c eo fl m sa l g o r i t h mi sd i s c u s s e d t h er e s e a r c hr e s u l ts h o w s t h a tt h ec h a r a c t e r i s t i co fi n p u ts i g n a li sm o r es c a t t e rt h ec o n v e r g e n e eo fa d a p t i v e p r e d i c t i o ni sw o r s e l m sa d a p t i v ea l g o r i t h mi sj o i n e di ns p e c t r a le s t i m a t i o nb ym e a n s o fa rm o d e la n a l y s i s ,i ti sa t t a c h e di m p o r t a n c et ot h ea p r i o r i t yo fs p e e c hs i g n a l , a d a p t i v ea l g o r i t h mi st r a i n e db a s e do nl p cl i n e a rp r e d i c t i o n t h er e s u l to ff i l e ri s b e t t e re a r n e s t l y a d a p t i v en o i s ec a n c e l l a t i o ni se x p e r i m e n t a l l ys t u d i e di nt h i sp a p e r , b y r e c e i v i n gas p e e c hs i g n a lw i t has p e c i a li n t e r f e r e n c es i g n a l t h r o u g ht h ea d a p t i v ef i l t e r , t h ei n t e r f e r e n c es i g n a li se f f e c t i v e l yc a n c e l l e da n dac l e a rs p e e c hs i g n a li sg a i n e d s o m eb a s i cp r i n c i p l e sf o ra d a p t i v ec a n c e l l a t i o na n ds o m et y p i c a la p p l i c a t i o na r e a sa t p r e s e n ta r ed i s c u s s e di nt h ea r t i c l e f i n a l l y , ar e s u l to fc o m p u t e rs i m u l a t i o ni sa l s o 西y e no u t i nt h i st h e s i s t h et e s ti sa t t a c h e di m p o r t a n c et oc o m b i n et h et h e o r y , t h et h e o r yi s g u i d a n c et od i r e c tt h et e s t 。t h et e s ti sa ne x a m i n a t i o no f t h et h e o r y k e yw o r d s :a rm o d e l :l p ca n a l y s i s :a d a p t i v ef i l t e r :l m sa l g o r i t h m 2 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写 过的研究成果,也不包含未获得 l 洼! 塑遗直基丝益要挂剔直塑 的:奎拦亘窒2 或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对本研 究所傲的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:国王青争 签字日期;2 0 0 75 月2 9 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并向国家有 关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权学校可以将学 位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手 段保存、汇编学位论文。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:田王酋争 导师签字: 却狮 签字日期:2 0 0 7 年5 月2 9 日 签字日期:2 0 0 7 年5 月2 9 日 学位论文作者毕业后去向: 工作单位:青岛理工大学现代教育技术中心 通讯地址:青岛理工大学现代教育技术中心 电话:8 5 0 7 1 3 0 7 ( 0 5 3 2 ) 邮编:2 6 6 0 3 3 基于l p c 分析的自适应滤波器研究 1 绪论 1 1 语音信号处理的研究历史 语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段, 也是人类进行思维的一种依托。由于人们在语言通信过程中信号不可避免地会受 到媒介,环境等因素引入的噪声干扰,而各类噪声( 乘性,卷积) 经过变换处理 后都可转化为加性噪声,因而通信过程中核心问题是从噪声背景中恢复原始语音 信号。 语音处理技术的发展可以从1 8 7 6 年的贝尔发明电话算起,贝尔利用电话, 第一次将语音用电信号传输到远方。1 9 3 9 年h d u d l e y 首次成功设计出了声码 器,将语音提取参数后,传输语音的参数,然后在接收端重新生成语音,此发明 的意义是语音信号的建模思想形成。1 9 4 7 年b e l l 实验室发明了语谱图仪,对连 续的语音信号,按时间顺序作重叠或不重叠,以帧为单元的短时傅立叶变换 ( s t f t ) ,形成时频二维图谱,来表示语音信息,将图像转换为声音信号输出。1 9 4 8 年由h a s k i n s 实验室研制的“语谱回放机”,能把经手绘制在薄膜片上的语谱图, 自动转换为语音,可以进行语音合成,虽然合成的语音显得单调、呆板,但其学 术思想具有深远意义,这是人类首次人工合成语言,共振峰合成法就是源于这种 思想,至今此方法还被认为是一种较好的语音合成方法。d a n e s 和m a t h e w 在1 9 6 0 年用数字计算机实现了自动语音识别,引入了时间规整算法改进匹配性能的方 法,从此数字计算机成为语音处理研究的重要工具。在6 0 年代中期,形成了一 系列数字语音信号处理方法和技术,如数字滤波器,快速傅里叶变换( f f t ) 等, 它们成为了数字信号处理的理论和技术基础。对语音处理技术产生决定性影响的 是上个世纪7 0 年代的三项研究成果:( 1 ) 7 0 年代初期的将动态规划法用于语音 识别及隐马尔可夫模型,为语音识别在匹配算法上提供了新的方法。( 2 ) 中期的 线性识别、语音编码等方面获得了极大成功,成为现代语音处理的主要方法。( 3 ) 七十年代末期的矢量编码量化技术,进一步推进了语音处理技术的发展。 8 0 年后是语音处理技术走向市场化、商品化的黄金时期,i b m 公司在1 9 8 5 年研制成功了5 0 0 0 单词的英语听写机t a n g o r a 一5 ,在此基础上又推出了 皋卜l p c 分析的自适脚滤被器研究 t a n g o r a 一2 0 ,其识别率町达到9 4 6 9 ,且有自适应识别的特性。随着多媒体时 代的来临,语音信号处理在实用化方面取得了许多实质性的进展,语音处理系统 从实验室走向实用。1 9 9 7 年i b m 公司推出了汉语听写机产品。国内的研究较之 国外起步较晚,主要的研究单位育清华大学、中科院声学所和西安电子科技大学 等单位。无限词汇汉语听写机首先由清华大学于1 9 8 8 年研制成功,在9 0 年代初 使之产品化,但从目酊的市场应用范围来看,语聋产品的实际应用还很狭窄,这 说明语音技术产品还存在缺陷,达不到市场化、商品化的要求,在技术上尚有许 多工作要做。 语暂信号处理之所以能够长期地吸引广大学者,除了它的实用性之外,另一 个重要原因是,它始终与当代信息科学中最活跃的前沿科学保持密切的联系,并 且一起发展。比如模糊集、模型识别、神经网络、小波和时频分布等是当前非常 热门的研究领域,这些领域的研究常常不可避免的把语音处理任务作为一个应用 实例,而语音处理研究者也常常从这些领域的研究中找到进展突破口,使语音处 理技术取碍突破性进展。一方面,促使声学语音统计模型的研究逐渐深入,鲁捧 的语音识别、基于音段的语音建模方法及隐马尔可夫模型与人工神经网络结合成 为研究的热点;另一方面,为了语音识别实用化的需要,自适应滤波、听觉模型、 快速搜索识别算法等研究课题同时倍受关注。 1 2 语音处理的研究现状阮1 语音信号和其它的信号一样,可以用时域和频域的方法来分析处理它,同 时,它又有自己的特殊性和特点,随着对语爵的产生机理和特征分析研究的深入, 语音信号的非线性、非平稳性越来越受到人们的重视,语音模型化是深入研究语 音技术的关键,当前具有代表性的语音研究方法主要有:基于语音参数模型的研 究方法,基于状态转移的隐马尔科夫模型研究方法,基于自适应滤波的预测及噪 声对消法,基于谐波模型的语音频率估计法等,现将这些语音处理方法给予简单 的介绍:。3 州“ 1 ( 1 ) 基于语音参数模型的语音处理方法:语音的发声过程可以模型化为受激励 源激励的一个线性时变滤波器,对不同类型的语音视为不同的激励源。如:对于 浊音,激励源为周期与基音周期相同的周期性脉冲串:而对于清音,激励源为高 2 基于l p c 分析的自适应滤波器研究 斯白噪声。在语音的生成模型中,应用最为广泛的是语音的全极点模型。利用信 号建模可以对语音信号进行频谱估计,声道建模等处理,其广泛用于语音合成及 提取语音和说话者识别的特征。 ( 2 ) 基于自适应滤波的预测及噪声对消法:预测系统的性能依赖于预测器的准 确性。实际应用中,用线性预测器形成对现有样值的估计或预测,即将其表示成 材 m 个过去样值的线性组合x 4 ( 疗) = 吼x ( n - k ) ,线性预测器的系数k 斧由输入 t c l 信号的相邻值的相关性决定,以使预测误差尽可能的小。因为信号的统计特性是 未知的,时变得,因此不可能设计出最佳的固定预测器,这个问题可以用自适应 线性预测器来解决,它会不断地自动调整自己的系数,从而做出比较正确的预测。 自适应噪声抵消则是直接从带噪语音中,或者是在时域或者是在频域将嗓声分量 减去,则能有效增强带噪语音,噪声对消法就是以此作为出发点的。噪声对消法 的最大特点是需要采集背景噪声作为参考信号,参考信号准确与否直接决定着噪 声对消法的性能。如果能准确地得到背景噪声特性,则即使是在很强的噪声环境 下不论是自噪声还是有色噪声,这种方法均能取得很好的增强效果。在采集背景 噪声的时候,往往采用自适应滤波技术,以便使背景噪声的估计尽可能逼近带噪 语音中的噪声分量。 ( 3 ) 隐马尔科夫模型语音增强方法:语音信号可细分为不同的类型,如鼻音、 摩擦音、爆破音等。要表示这些语音类型,人们提出了语音的混合源模型,人们 将语音看成由一定数量的子源组成的,每个子源代表一种语音类型。不同的语音 类型也可理解为不同的语音状态,则一段语音可看成一个在不同状态间、转移的 马尔科夫过程,这就是语音的隐马尔科夫模型思想。同样对噪声也有其隐马尔科 夫模型。这样在语音增强过程中就可针对不同语音状态选择不同的滤波器,这样 就得到了隐马尔科夫模型语音增强方法。如果能正确建立语音和噪声的隐马尔科 夫模型,则采用隐马尔科夫模型方法进行语音增强处理收效甚好,此方法适用于 商信噪比。 ( 4 ) 基于谐波模型的语音频率估计法:在一些应用中,语音信号是包含在白噪 声中的复指数型信号( 如语音处理中的共振峰频率,雷达中的移动目标及空间传 播信号) ,此时谐波模型更有利于问题处理。 幕 【t c 分析的自适l ;瘴被器研究 基f 谐波模型的语爵频率估计法有:p i s a r e n k o 皆波分解法、p r o n y 法、m u s i c 法以及e s p r i t ( 用旋转不变技术估计信号参数) 法。这些方法均利用特征分解又叫 特征结构或者j f 交子空间,其基本信号是:白噪声加n 个复正弦波。将( p + 1 ) 个信号相关阵进行特征值分解,得到一组相瓦正交的特征矢量,形成1 个( d + 1 ) 维矢量空间。随后把该矢量空间再分解成2 个子空问。- 个是由n 个大特征值所 对应的特征矢量张成的信号子空间,另一个则是由( p 十1 一n ) 个小特征值所对应 的特征矢量张成的噪声子空间。谐波信号模型就是用复指数的和为信号建模,所 有方法都基于从一个被估计的相关矩阵计算伪谱或求多项式的根。 语爵处理技术应用广泛,根据应用方向的不同,它的理论基础和实际处理方 法,也有所不同。语音技术研究发展过程中人们提出了多种模型、方法和概念来 表达、模拟和研究语音的特征和产生机理,但其中最为成功的是基于发音原理的 声道模型和线性预测( l p c ) 方法。l p c 分析“”是进行语音分析的有效技术之一。 它的重要性在于,它提供了一组简洁的模型参数,这一组参数能够比较精确的表 征语音信号的频谱幅度。而且获得这些参数所需要的计算量相对较小。 1 3 噪声特性 由于噪声来源于实际的应用环境,所以噪声特性变化无穷。噪声可以是加性 的,也可以是非加性的。非加性的噪声往往可以转化成加性噪声。加性噪声大致 有以下几种: ( 1 ) 周期性噪声:周期性噪声来源于发动机等周期性运转的机械,具有很多离散 的线谱。这种噪声可以用梳状滤波器加以抑制。 ( 2 ) 脉冲噪声:脉冲噪声表现为时域波形中突然出现的窄脉冲。它柬源于爆炸、 撞击和放电等。消除脉冲噪声可以在时域进行,也可以根据相邻信号样值,通过 内插的方法将脉冲噪声在时域上进行平滑。 ( 3 ) 宽带噪声:宽带噪声的来源很多,热噪声、气流噪声及各种随机噪声源。对 于平稳的宽带噪声,通常可认为是高斯白噪声。 ( 4 ) 同声道语音干扰:在实际生活中经常遇到多人同时说话的情况,此时不需要 的语音就形成了同声道干扰。简单地说,就是多个语爵叠合在一起在单信道中传 输时形成的干扰。 4 基于l p c 分析的自适应滤波器研究 对于语音信号来说,受加性宽带噪声干扰的情况比较普遍。高斯白噪声由 于其e ( x ) = o ,d ( x ) :c 数学处理特性,在研究中得以广泛应用。本论文中研 究的噪声信号为商斯白噪声,噪声模型见图1 1 : 图1 1 带噪语音模型图 1 4 本论文的主要工作及创新点 l m s 算法自适应滤波由于计算量相对较小,易实现的特点在实际应用中得到 了广泛的应用,是一种较好的语音处理方法,但是由于本地参考信号的二阶距不 宜获得,加上收敛过程中存在稳态均方误差从而影响滤波效果。怎样改善滤波效 果得到较纯净的语音,一直是语音处理,语音识别领域孜孜以求的问题。 本课题期望通过对语音信号采用l p c ( a r 模型) 进行预处理,获得较多的先验 信息,根据上述对语音预处理后,由a r 模型得到的信号功率谱来指导采用l m s 算法自适应滤波器的本地参考输入信号,从而得到优良的期望响应二阶距,再对 输入的语音信号进行自适应滤波训练;同时,在进行l m s 算法时做一些相应的改 进,通过试验得到较好的滤波处理效果,即得到较纯净的语音信号。 试验信号经d t f t 变换后,作相关数学处理,得到自相关数据阵;采用 l e v i n s o n d u r b i n 算法求得模型参数,经谱分析确定模型阶数;模型参数的确定 即为先验信息,将得出的数据自相关阵特征分解其分解值在后续的l m s 滤波算法 中对其算法的收敛性有着重要的影响作用。论文探讨了模型参数与特征值之间存 在的数学关系,并给出了低阶模型参数与数据特征值的换算公式。 本课题的创新点是:将模型法功率谱分析与l m s 自适应算法结合起来取长补 短,注重信号的先验信息,在先验的基础上训练以改善滤波效果,结合模型参数 对l m s 算法收敛性进行分析,以求得到良好的滤波效果,在强噪声背景中提取语 音信号。 壮卜l p c 分析的自适西滤破; 研究 1 5 论文的组织结构 本论文第一章为绪论,介绍论文的研究背景及方向。第二章,讨论线性预测 原理,a r 模型基本结构原理及相关算法,并初步探讨了线性预测在语音建模及 识别中的应用。第三章,对实际语音信号进行线性预测分析试验,对语音片段做 功谱分析确定模型阶数及参数,并对试验数据结果进行分析做残差讨论。第四章, 介绍自适应滤波的原理、算法及应用,讨论了l m s 算法收敛性及缺点给出改进算 法。第五章,基于l p c 分析的自适应滤波器研究,进行自适应线性预测试验讨论 试验结果及分析影响算法收敛性的相关参数;进行自适应噪声抵消计算机仿真试 验,讨论试验结果及其意义。第六章对研究工作进行总结。 6 基于l p c 分析的自适应滤波器研究 2l p c 分析( a r 模型) 预测理论及应用 根据声学研究语音信号( 除鼻音) 经如窗后,在短时间信号上近似平稳随机 过程,采用a r 模型可以很好地描述,得到良好的谱估计。 语音信号是一种典型的非平稳信号,它的均值函数u ( x ) 和自相关函数r ( x l , x 2 ) 都随时间而发生较大的变化。但是,语音是由于发声气流冲击发音器官产生 物理振动而产生的,发音器官形状的变化与声音的变化速度相比较是很缓慢的过 程。因此,在信号处理时,往往将语音信号作为一个短时的平稳过程来处理,即 假定在一段时间( 1 0 - 2 0 m s ) 内,发音器官的形状( 频谱参数和物理特征) 保持不变。 这个假设条件是语音处理中的一个重要前提。技术实践证明,这种假设与实际情 况是相符合的。在此基础之上,产生了所谓“帧”处理的概念。实际处理中都是 先将连续的语音数据流用一个窗函数序列分割成些连续段,然后对每一段( 帧) 进行处理。 几种典型的分割窗函数序列有:矩形窗、汉明窗和汉宁窗,分别定义为: 矩形窗:峨栉,= :。s 姜暑一1 汉明氤川= o 5 4 枷。4 6 m 髦。 汉掘删= r 氆5 菩2 喇。眍裂。1 它们的时域波形和频域响应分别表示在图2 1 中,设时域窗长为l ,频域主 瓣宽度为a ,旁瓣高度为b ,则可以看出,矩形窗主瓣最小,但旁瓣最高:汉明窗 具有最宽的主瓣,和最低的旁瓣高度。从应用的角度来说,矩形窗有最高的频域 分辨率,但泄漏较高,汉明窗可以有效克服泄漏现象,具有平滑的低通特性,因 而得到广泛应用。几种窗函数的特性比较见图2 1 : 7 筚卜i ,p c 分析的白适一,瘟波嚣研究 矗 召 卜i 一 图2 1 几种窗函数的特性比较图 根据以上分析,本实验采用汉明窗。 2 1a r 模型基本构造原理小州删 有参线性通信系统可用常系数差分方程描述: ( 2 1 ) x ( n ) ,w ( n ) 分别为输入信号,取双边z 变换,其系统函数是: :盟: w ( z ) 对于o = 0 ,d o = 1 得到全极点模型( a r 模型) : h ( z ) = 士 1 + 吼z “ ( 2 2 ) ( 2 3 ) 用白嗓激励一个有参模型,即似) 1 1 d 0 , 昂 ,那么: r 。o ,) = 配j 何 ”) 1 2 足,( z ) = 艿:丑( z ) 嚣( 1 z ) 8 ( 2 4 ) ( 2 5 ) o加o加船 ) 一玎 ( 缈 i d o = ) t一珂 ( x i 口 ,“ + ) 玎 ( x 力一力以一刖 = 一 一z ,一吼 睾喀 基f l p c 分析的自适应滤波器研究 通过归一化d o = l ,及设:输入的方差为髭,构造一个有参信号模型”,模 型参数定义集由 口l ,口:,4 ,;占,2 ) 给出。在利用模型法进行谱估计时,先假设所讨 论的随机过程服从某一具有有限多参数的模型,再利用随机序列值( 数据) 估计 模型的参数,然后将估计出的模型参数代入该模型的理论p s d 公式( ( 4 ) 式) ) , 得到所需的谱估计。模型构造图见图2 2 : 输入 h m d ( z ) 输出 r ”7 4 ( z ) , w ( 露) x ( 疗) 图2 2 模型构造图 2 2l p c 分析( 线性预测) 原理 帕n 鲫 用过去p 个时刻语音采样值的线性组合以最小预测误差,来预测语音信号下 一时刻的采样值,称为对语音信号的p 阶线性预测。 设 s ( n ) ;n = o ,1 ,n 一1j 为一帧语音采样序列,则第n 个语音样值s ( n ) 的p 阶线性预测值为: s 4 ( 聊= 一i = 1q j ( 阿一0 ( 2 6 ) 式中,p 是预测阶数, 口,:( i = l ,2 ,p ) 是预测系数,称为线性预测系 数。在p 阶预测的情况下,一帧语音信号用p 个口,系数组成的p 维矢量表示,该参 数在语音编码、语音增强、语音识别中有着非常重要的作用,预测误差用e ( n ) 表 e ( n ) = s ( n ) 一j “( 月) 示,则: :s ( n ) + 羔a l s 伽一f ) ;兰qs 一f ) ( 2 - 7 ) l ;ll = m 式中,a 。= l 。在均方误差最小准则下,线性预测系数 a 。:( i = l ,2 p ) 的 选择应使预测误差的均方值e e 2 0 ) 】最小。 9 袋于l p c 分析的自遣声滤彼器研究 令a e _ e 2 一( n ) :o ,f :1 ,2 ,3 ,p 可推得: 0 0 , p 吼r ( i - k ) = - e ( o ,f = 1 23 p ( 2 8 ) e l 由上式可得p 个方程,写成矩阵形式为: r ( o )r o )r ( p 一1 ) r ( 1 )r ( o )r ( e 一2 ) ;j r ( p l r ( p 一2 ) r ( o ) 4 i d 2 : 盘, r ( 1 ) 月( 2 ) : 冠( p ) ( 2 9 ) ,m 为信号的自相关阵,r k 】为信号与期望响应的互相关阵。由式可见语音 信号特征值与a r 模型具有很好的拟合性。由方程可以求出p 个预测系数口。,因为 上式中的自相关矩阵具有对称性、托布列兹( t o e p l i t z ) 性和非负定性,可以通过 求解方程,解得p 个预测系数。通过l p c 分析,由若干帧语音可以得到若干组l p c 参数,每组参数形成一个描绘该帧语音信号的特征值,即l p c 特征值。l p c 特征值 在语音编码和识别领域有着重要的应用价值。由于采用l p c 特征值能用很少的数 据对语音进行描述在信息传输中可大大节省频带资源,可以肯定l p c 分析法在压 缩编码等领域有着非常广阔的应用蔚景。 2 3a r 模型参数算法 2 3 1 固定阶数算法2 1 由于a r 模型参数及序列的自相关与输入白噪的功率之间满足y u l e - w a l k e r 方程“,a r 模型参数可直接由方程求出: r a o )r a l ) r a l )( o ) ( p )( p 1 ) r a p ) ( p 一1 ) r a o ) 由y u l e w a l k e r 方程可知参数算法: 1 0 1 q : 玎p 爱 0 : o ( y u l e - w a l k e r 方程) ( 2 1 0 ) 基于l p c 分析的自适戍滤波器研究 1 q : 口p = 瞄料 0 j o ( 2 一1 1 ) 由于此算法需做矩阵求逆,且估计器的阶数是固定的,如果选择了不同的阶 数就要重复所有的计算,运算量巨大,但是对于低阶模型则简单直观,适用于求 低阶a r 模型参数。 2 3 2 平稳随机过程的简化算法 由于平稳随机过程的自相关阵是t o e p l i z e 脚的,利用矩阵的嵌套和递归发展 出相应的递归算法嘲: l e v i n s o n d u r b i n 算法: 输入;,( o ) ,r ( 1 ) ,( 2 ) ,( m ) 初始化: p 。= ,( o ) ,风= ,( 1 ) p 篙非b q 。1 2 过程:对于m = 1 , 2 。m 一1 p 。= p + 成一l 一l r m = 【,( 1 ) r ( 2 ) ,( m ) j r 七。:一笠 以:口磊+ r ( 矾+ 1 ) ( 2 - - 1 3 ) 叫讣附k p 。= p 卅- i + 尾 输出:a m , 后。 。m - i , p 。 ? l e v i n s o n 递推算法( 下推) 础2 南f ) - - k m 1 a m + 1 ( m - i + 1 ) ( 2 - - 1 4 ) 七。= 口。( 加) 幕j - l p c 分 f 的白适脚瘟波器研究 1 2 可可“ 式中i :1 , 2 m 使用l e v i n s o n d u r b i n 算法不但大大简化了运算量,而且十分便于程序 ( m a t l a b ) 实现,具有很强的实际应用意义。 2 4 线性预测在语音识别处理中的应用 线性预测分析( l p c ) 法之所以成为目前进行语音特征分析的最有效、最重要 的方法之一,这是由于“”: ( 1 ) 它有效地解决了短时平稳信号的模型化问题,可把语音信号看成是由全 极点模型产生的。 ( 2 ) 能很好地逼近共振峰,提供谱估计。 ( 3 ) 提供的语音信号模型参数( 如基音、共振峰、谱、声道面积函数等) 简洁 而准确,计算量较小,便于实时处理。 ( 4 ) 可用于低数码率传输的环境。 ( 5 ) 将l p c 参数形成的模型参数储存起来,在语音识别中提高识别率和减少识 别时间。下面对线性预测在语音建模及合成方面的应用作简要讨论。 2 4 1 语音建模 根据声学研究发音器官能发出一系列声波,采用数字模型产生与此声波相对 应的信号序列,这种模型是一种线性系统,它的组参数选定之后就可以使得系 统的输出具有所希望的语音性质,系统的这些参数和语音产生过程有关。在发音 时,激励和声道形状都随时间而变化,但语音信号随时间的变化是非常缓慢的, 通常认为激励与声道的面积函数在1 0 2 0 m s 的时间范围内是近似不变的。因此可 以设想语音的数字模型是一个缓变的线性系统,这个线性系统的参数在l o - 2 0 m s 的时间范围内是近似不变的。 语音建模步骤“1 : ( 1 ) 预加重。语音信号经过高通滤波器处理降低频谱的动态范围,使谱的包 络变平,以便以后的处理对数值问题不过于敏感。 摹于l p c 分析的自适应滤波器研究 ( 2 ) 帧块处理。预加重信号被封装为n 个样本值的帧,语音识别中,n = 3 0 0 , 采样速率f s = 6 6 7 h 2 。 ( 3 ) 加窗,每个帧用n 个样本的窗( 通常用汉明窗) 和它相乘,以去掉帧开 始和结束处的不连续性。 ( 4 ) 自相关计算,l p c 处理器计算自相关序列的前p + 1 个值。r ( 0 ) 的值提供 了帧的能量,它对于语音检测很有用。 ( 5 ) l p c 分析,用p + 1 个自相关系数为每个语音帧计算一组l p c 数, 参数的计算可利用l e v i n s o n d u r b i n 算法式( 2 1 2 ) ,( 2 1 3 ) 求得。语音模型 化处理器框原理图见图2 3 2 4 2 语音合成 图2 3 模型处理器框图 语声的恢复合成“”“1 ,可利用数字技术来模拟语音信号的产生,线性预测 语音合成器利用线性预测语音分析方法,通过分析自然语音样本,计算出l p c 系数,就可以建立信号产生模型,从而合成出语音。线性预测合成模型是由白噪 声序列和周期脉冲序列构成的激励信号,经过选通、放大并通过时变数字滤波( 由 语音参数控制的声道模型) ,就可以再获得原来的语音信号。 语音信号的l p c 合成数字模型如图2 4 所示:它包括三部分:激励源、声道 模型和辐射模型。激励源分为浊音和清音两个部分,浊音清音开关所处的位置 来决定发出的是浊音还是清音。 壮卜l p c 分析的自适w 滤玻器研究 图2 4 语音信号恢复模型( l p c 语音合成) 在图( 2 4 ) 的模型。1 中,每一帧语音在一帧长的时间内,可以看作是由激 励信号对一个线性定常系统( 对一帧来说) 进行激励后,产生语音信号。图中的浊 音和清音切换代表了不同信号加在声道上的激励的变化:当语爵帧为清音时,输 入激励为随机噪声:为浊音帧时,激励信号为周期脉冲序列。上述模型可以看成 是对语音信号的进行线性系统的模拟和拟合。研究和实践都证明,对于大多数的 语音都可以用全极点函数模型来表示声管模型,而且表示鼻音和某些摩擦音所需 要的零点,也可以用多个极点来近似,因而使用全极点模型代表发音模型是适当 的。 下面给出合成试验结果见合成结果比较图2 5 : s e v e n 的原始语音信号波形图 l p c 合成后的信号波彤图 图2 5 合成结果比较图 l p c 分析提供了一组简洁的模型参数,这一组参数能够比较精确的表征语音 信号的频谱幅度,而且获得这些参数所要的计算量相对较小。基于l p c 分析的语 1 4 基于l p c 分析的自适应滤波器研究 音建模在压缩编码中极具研究价值,可以肯定其在语音处理和识别等领域有着非 常广阔的应用前景。 接卜l p c 分析的白适滤波器研究 3 基于l p c 分析的语音处理试验 l p c ( 线性预测编码) “在现行研究中l p c 为线性预测系统,即用骑采样 x ( h ) 的m 个过去采样的线性组合作为x “( ) 的估计,即: 吖 x 4 ( 疗) = 口x ( n - k ) ( 3 一1 ) t ;l 线性预测的系数k r 取决于如何选择输入信号相邻采样间的相关性,使预测误 差:e ( n ) = x ( n ) 一x + ( ) 动态范围尽可能小,从而达到有效预测,便于后续进行压 缩编码,本论文重点研究线性预测,对编码不做讨论。 采用a r 模型进行频谱分析( l p c ) 试验的步骤: 1 用白噪作为输入,激励全极点滤波器,产生一个a r 信号。 2 数据与噪声混合,将混合信号进行帧块处理。 3 利用y u l e w a l k e r 方程从信号中得到a r 模型( 模型参数) 。比较得到的a r 模型与a r 信号。用l p c 进行线型预测,对实际语音信号与预测信号相比较, 得出a r 模型的谱估计。 4 分析比较结果,对比较得到的预测误差进行分析,从而得到有用数据。 分析计算的框图见图3 1 : 图3 1 分析计算的框图 1 6 摹于l p c 分析的自适府滤波器研究 3 1 试验准备 3 1 1 语音信号提取 从声学语音库中取得标准普通话清音语声信号,语音的时域部分波形见图3 2 : 6 0 0 0 4 0 2 0 0 0 0 2 0 0 0 一0 0 0 - 8 0 0 0 图3 2 纯净语音的时域部分波形图 3 ,1 。2 语音片段( 实际信号) 频谱分析 通过对实际信号频谱预分析可以获得先验信息,以便对预测谱估计效果分析 评价,下面进行语音信号预处理: ( 1 ) 预加重,语音信号经过高通滤波器,滤波器函数为: h ( z 1 = 1 一舷一1 0 9 a 1 此时a = o 9 5 ,经过预加重,使谱的包络变平降低数值敏感度。经过此次预加重, 引起频谱在国= 0 时比在= 石时有大约3 2 d b 的提高。 ( 2 ) 进行帧块处理,加汉明窗,去掉开始和结束出的不连续性,清音语声信号 时域采样后,加汉明窗的信号频域图片段见图3 3 : o - 5 0 0 5 1 图3 ,3 语音帧片段 ( 3 ) 语音帧的频谱“1 ,将信号以采样频率f l = 6 6 7 k 1 - i z 采样后,用姒t l a b 对实 际语音帧求解,所得到短时傅立叶变换曲线,语音帧的频谱见图3 4 : 1 7 挚卜l p c 分析们臼透而滤玻嚣硝究 八 钮旭懈绒 弋 ,仓一 、。 = = ;_ :j 。 3 2 线性预测分析 图3 4 语音帧的频谱 将语音信号加汉明窗,时域信号见图3 5 : 图3 5 语音信号片段 l p c ( 线性预测) 分析流程,分析过程见流程图3 6 图3 6 数据采样,采样点缓冲 0 分帧加窗 i 预加重处理( 高通滤波,) l l p c 分析( 求出) 系 0 l p c 模犁功率谱 1 8 “ o 舯 w 舶 埘 。 基于l p c 分析的自适应滤波器研究 用白噪激励一个全极点滤波器,产生一个a r 信号。利用y u l e - w a l k e r 方程 从信号中构造a r 模型:当白噪激励全极点滤波器产生的a r 信号其统计特性与实 际语音信号相匹配时,求解y u l e - w a l k e r 方程就能得出全极点滤波器的参数。 m a t l a b 中的a r y u l e 函数,可以完成用l e v i n s o n o u r b i n 算法解y u l e w a l k e r 方 程。 此过程用程序实现,以下为m a t l a b “”“7 仿真程序段: b = f i r l ( 5 1 2 ,5 ) : d ,p 0 = l p c ( b ,7 ) ; r a n d n ( s t a t e ,p i ) : u = s q r t ( p 0 ) * r a n d n ( 6 1 9 2 ,1 ) : x = f i l t e r ( 1 ,d ,u ) : d 1 p 1 = a r y u l e ( x ,7 ) : d 2 ,p 2 = l p c ( x ,7 ) : d 1 ,d 2 x h = f i l t e r ( - d 2 ( 2 :e n d ) ,1 ,x ) : a n s = 1 0 0 0 0l 0 0 0 0 3 5 0 1 0 - 3 5 0 1 0 6 7 8 5 66 7 8 5 6 9 1 4 3 5- 9 1 4 3 5 8 7 6 4 38 7 6 4 3 6 0 2 0 3- 6 0 2 0 3 2 8 2 1 3 2 8 2 1 3 - 0 6 7 9 9- 0 6 7 9 9 由求得的模型参数,得出a r 模型的系统函数: 日( z ) = 1 - 3 5 0 1 0 z - + 6 7 8 5 6 z - 2 _ 9 1 4 3 5 z - 3 + 8 7 6 l 4 3 z - 4 _ 6 0 2 0 3 z - s + 2 8 2 1 3 z - 6 _ 0 6 7 9 9 z - 7 根据估计得出的模型参数,用下式: 1 9 糕干l p c 分析的自适随瘴放黯磷究 r ”个阿1 ( 3 - 2 ) 1 1 + 酗一叫 计算被分析过程的p s d 1 9 5 0 1 5 3 ,畀a 1 耿仃。2 一- - 1 ,即w c n ( o ,1 ) 。根据上述 分析,选择p = 7 ,用一个a r ( 7 ) 模型与数据拟合。同时,考虑到计算量在p = 5 时截断,选用a r ( 4 ) 拟合数据。由m a t l a b 仿真,并绘出功谱图,见信号的p s d 估计图3 7 : - - r f 撇 孵 哪叫删嘲删 帆 懈 f 1 _ 0 0 0 6 0 1 0 1 50 2 o _ 2 s 0 30 3 50 40 4 5 0 - 5 f r ”m c y 州z ) a r ( 7 ) 信号的p s d 估计 6 - - 一 。 ,、 蕊啦 n 献穴 一沮 舡 溯 唧 o 0 0 50 10 1 5o oo 2 5 o3 o 04o j 5o j f r e 0 3 a 帅o yo o r z )

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论