(机械设计及理论专业论文)基于声音识别的新型输油泵阀门泄露检测原型系统.pdf_第1页
(机械设计及理论专业论文)基于声音识别的新型输油泵阀门泄露检测原型系统.pdf_第2页
(机械设计及理论专业论文)基于声音识别的新型输油泵阀门泄露检测原型系统.pdf_第3页
(机械设计及理论专业论文)基于声音识别的新型输油泵阀门泄露检测原型系统.pdf_第4页
(机械设计及理论专业论文)基于声音识别的新型输油泵阀门泄露检测原型系统.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(机械设计及理论专业论文)基于声音识别的新型输油泵阀门泄露检测原型系统.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 阀门泄漏是石油工业中经常遇到的故障,常常因为没有及时发现而导致严重的经济 损失,因此,对于阀门的监测是很有必要的。目前对于阀门的监测多是通过专门的硬件 设备来实现的,成本较高,且不容易及时发现故障。 在德国新型输油泵软管隔膜活塞泵国产化项目中,根据声学原理用于监测软管 隔膜活塞泵进出口阀门是否泄漏的声学实时监测系统是其中重要的子系统。 本论文的任务就是研究设计软管隔膜活塞泵进出口阀门声学实时监测系统的软件 系统原型。系统通过对国产化软管隔膜活塞泵进出口阀门声音实验样本进行特征参数提 取、h m m 训练、h m m 识别及识别后处理等一系列的操作实现对故障识别。 特征参数提取是指从阀门音频信号的大量数据中提取出随时间变化的声音特征序 列,去除冗余信息,提取足以代表语音特征的统计数据作为观测序列,是建立h m m 的 关键。系统中使用m f c c 作为特征参数。 隐马尔可夫模型训练的目的是根据观测序n 乇- i - 算模型的参数,即从一组训练样本中 确定状态的转移概率,作为后期故障识别的依据。系统中采用前向后向算法实现h m m 的训练。 模型训练完成之后将模型参数存储。此时,系统就具备了故障诊断的能力。即根据 给定的h m m 参数和观测序列,决定最有可能产生可见观测序列的隐状态序列。 在实验条件下的系统测试中,h m m 的平均识别率为9 5 ,再辅以识别后的结果处 理,系统的识别率达到了1 0 0 。理论分析和实验证实,本论文提出的软件原型系统具 有较好的实用价值,为进一步实用化提供了有力的支持。 关键词:阀门,泄漏检测,m f c c ,h m m a b s t r a c t a b s t r a c t v a l v el e a k a g ei np e t r o l e u mi n d u s t r yo f t e nh a p p e n sa n de v e nl e a d st os e r i o u se c o n o m i c l o s sf o rn o tb e i n gd i s c o v e r e di nt i m e ,s oi ti sv e r yn e c e s s a r yt om o n i t o rt h ev a l v e s p r e s e n t l y , v a l v em o n i t o r i n gi sm o s t l ya c h i e v e db yu s i n gs p e c i a lh a r d w a r e s ,w h i c hc o s t sal o ta n do f t e n f a i l st od i s c o v e rt h ep r o b l e m si nt i m e i nt h ed o m e s t i cp r o j e c to fp r o d u c i n gg e r m a n i cn e wp a t t e np u m p - h o s ed i a p h r a g m p i s t o np u m p ,a c o u s t i cr e a lt i m e v a l v ep e r f o r m a n c em o n i t o r i n gs y s t e mi sa ni m p o r t a n t s u b s y s t e m ,a n di ti su s e dt om o n i t o rt h ev a l v e so f h o s ed i a p h r a g mp i s t o np u m p t h ep a p e ri s a s s i g n e dt os t u d ya n dd e s i g nt h ea c o u s t i cr e a lt i m ev a l v ep e r f o r m a n c em o n i t o r i n gs y s t e m p r o t o t y p eo f h o s ed i a p h r a g mp i s t o np u m p t h i ss y s t e mr e a l i z e st h et r o u b l ei d e n t i f i c a t i o nb yf e a t u r ee x t r a c t i o n ,h m mt r a i n i n g , h m mi d e n t i f i c a t i o n ,p o s t - i d e n t i f i c a t i o na n do t h e ro p e r a t i o n so fd o m e s t i ch o s ed i a p h r a g m p i s t o np u m pv a l v e s s o u n de x p e r i m e n ts a m p l e s f e a t u r ee x t r a c t i o ni st h ek e yo fb u i l d i n gt h eh m m i tr e f e r st oe x t r a c t i n gt i m e v a r y i n gs o u n d f e a t u r es e q u e n c ef r o mag r e a td e a ld a t ao fv a l v es o u n ds i g n a l s ,w i p i n go f ft h er e d u n d a n c y i n f o r m a t i o na n dt h e nt a k i n gs t a t i s t i cd a t aw h i c hi se n o u g ht or e p r e s e n ta c o u s t i cf e a t u r e sa s o b s e v a t i o ns e q u e n c e t h ep u r p o s eo fh m mt r a i n i n gi st oc o m p u t em o d e lp a r a m e t e r sb a s e do no b s e v a t i o n s e q u e n c e ,n a m e l yt oc o m p u t et h et r a n s f e rp r o b a b i l i t yo fs t a t ea st h eb a s i so fp o s tt r o u b l e i d e n t i f i c a t i o nf r o mag r o u pt r a i n i n gs a m p l e s t h es y s t e mu s e sf o r w a r d b a c k w a r da r i t h m e t i ct o t r a i nt h eh m m a f t e rt h em o d e lt r a i n i n gc o m p l e t e d ,p a r a m e t e r sa r es a v e d t h e n ,t h es y s t e mh a st h e a b i l i t yt oi d e n t i f yt r o u b l e s t h a ti st os a yt h em o s t l yp o s s i b l eh i d d e ns t a t es e q u e n c ew h i c h b r i n g st h ev i s i b l eo b s e v a t i o ns e q u e n c ec a nb ed e c i d e da c c o r d i n gt oh m mp a r a m e t e r sa n d o b e r v a t i o ns e q u e n c eg i v e n t h ea v e r a g ei d e n t i f i c a t i o nr a t eo fh m mi ne x p e r i m e n tc o n d i t i o ns y s t e mt e s ti s9 5 ,a n d w i t ht h ea i do fp o s t i d e n t i f i c a t i o nr e s u l t sd i s p o s a lt h ei d e n t i f i c a t i o nr a t eo fs y s t e mr e a c h e d 10 0 t h e o r ya n a l y s e sa n de x p e r i m e n t sh a v ep r o v e dt h a tt h es o f t w a r ep r o t o t y p es y s t e m i l a b s t r a c t p r o p o s e di nt h i sp a p e rh a sh i g hp r a c t i c a lv a l u e s ,s oi tp r o v i d e sc o n v i n c i n gs u p p o r tf o rf u r t h e r p r a c t i c a l i t y k e yw o r d s :v a iv e ,ie a k a g ed e t e c tio n m f c c ,h m m i i i 关于硕士学位论文使用授权的说明 本学位论文作者完全了解大连工业大学有关保留、使用学位论文的规 定,大连工业大学有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有 关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学 位论文,并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 是否保密( 否) ,保密期至年月日为止。 学生签名:垂鲴霪 导师签名:3 立趣 玉谚年4 月尸日 第一章绪论 1 1 研究的目的和意义 第一章绪论弟一早三百下匕 在石油工业中,阀门是一种使用数量多、操作使用频繁的设备。据统计,购买阀门 的费用相当于一个新建工厂投资的8 【l 】。在阀门的使用过程中,因阀门的磨损等原因 会出现内外渗漏或泄漏等情况,从而引起跑油、混油等严重事故,影响石油质量,造成 极大的经济损失和资源浪费。因此,阀门泄漏的检测有着重大的现实意义。 当阀门关闭时,若有泄漏,其主要特征是在泄漏处形成多相湍射流,该射流不但使 流体发生紊乱,而且与泄漏孔壁相互作用,在孔壁上产生高频应力波,并在阀体中传播, 称之为被动声发射。用声发射传感器接触阀体外壁,接收泄漏产生的在阀体中传播的弹 性波,转换成电信号,经信号放大处理后显示和监听,从而达到检测阀门泄漏的目的【2 引。 声学检测具有动态、快速和经济的特点,既可以保证阀门的安全使用,又可以为维 修、决策提供依据,降低更换费用。且当前的理论和实践表明,利用声学检测阀门泄漏 是一种行之有效的无损检测的方法【4 j 。 泵工作时,输油通道的出口阀关闭,进口阀打丌,输送物料进入输油通道。然后, 进口阀关闭,出口阀打开,通过工作将石油输送到输油通道,从出口阀输出。依次循环。 在工作过程中,如果进出口阀出现泄漏,就会出现管道内压力不足,石油输出质量降低 等一系列的问题,影响泵的工作效率,造成资料浪费和经济损失。因此,需要对泵的进 出口阀进行实时监控。 实时监控系统利用声音传感器,将阀门泄漏时的声发射现象与计算机技术相结合, 通过软件实现对阀门泄漏声音的自动识别,提高阀门检测的自动化水平和检测精度,及 时发现阀门故障,减少不必要的资源损失和资金的浪费,达到实时高效的自动检测阀门 泄漏的目的,以满足自动化生产的需要。 在德国新型输油泵软管隔膜活塞泵国产化项目中,根据声学原理检测软管隔膜 活塞泵进出口阀门是否泄漏的声学实时监测系统是其中重要的子系统。 本论文的任务就是研究设计软管隔膜活塞泵进出口阀门声学实时监测系统的软件 系统原型。 将德国的软管隔膜活塞泵国产化,既可以节约设备资本,又可以提高国内的输油泵 第一章绪论 制造技术。在国产化的过程中,对输油泵在机械结构上进行了改进,由原来的一路输油 改进到现在的七路输油。这样既可以提高输油效率,也使得石油的输出更加平稳。 随之改变的是阀门声音的检测技术。在德国的软管隔膜活塞泵中,只有一路输油通 道,因此,只需要对一路通道的两个阀门进行声音检测;而改进之后,输油通道扩展为 七路输油通道,从而需要对七路通道的十四个阀门进行声音检测。在一路输油管道中, 只有两个阀门的开闭操作,声音相对单一,从而对于阀门泄漏的异常声音的识别相对简 单。而多路输油多个阀门在同时工作时的声音复杂多样,会出现声音干扰,混音等现象, 因此在识别阀门泄漏声时,需要隔离出背景声音和其他阀门工作声音的干扰。从而对本 系统提出了更高的要求。 1 2 国内外研究现状 1 2 1 国外研究现状 国外是从2 0 世纪6 0 年代起开始阀门泄漏检测技术的研究。1 9 7 9 年,d a v i dw t a y l o r n a v a ls h i pr & dc e n t e r 开发了a c o u s t i cv a l v el e a kd e t e c t o r ,通过声学原理较准确的检 测内漏点,从而避免打开水下管道系统进行人工检测【5 】。1 9 8 6 年,d i m m i c kj o s e p hg 和 c o b bj o h nm 在u l t r a s o n i cl e a kd e t e c t i o nc u t sv a l v em a i n t e n a n c e c o s t s 中阐述了利用阀门泄漏时的声发射现象分析阀门泄漏点的技术及实际应用【6 】。 1 9 8 8 年,r o c h as m 开发出a l d a p 软件包,用于管道远程泄漏的检测。利用声学原理, 从泄漏发生到检测到仅需几秒的时间,且可以较精确的确定泄漏的位置【7 1 。1 9 9 8 年, s h a r i f m o h a m e da 和g r o s v e n o rr o g e ri 进行了详尽的试验研究,推理出可以通过声发射 现象监测控制阀的内漏,从而保证阀门的可靠性,发表了i n t e r n a lv a l v el e a k a g ed e t e c t i o n u s i n ga na c o u s t i ce m i s s i o nm e a s u r e m e n ts y s t e m 的论文。在系统中,通过两个声发射传感 器和处理系统监控不同工作情况下的阀门泄漏,通过实时可编程过滤器降低声发射时的 背景噪音,同时,使用放大器提高传感器的灵敏性。声发射的频谱分析表明,阀门泄漏 时的频谱可以从背景声音中区分开来,从而可以利用声发射技术检测工业环境下控制阀 的泄漏例。 在国外的输油泵产品中,已经出现了利用声学检测阀门泄漏的技术的应用。在德国 新型的软管隔膜活塞泵中,利用了声学原理,对输油泵进出口阀进行工况监测,始终监 测阀门的操作,及时发现泄漏,从而提高泵的工作效率。 2 第一章绪论 1 2 2 国内研究现状 我国在阀门泄漏检测方面起步比较晚,传统的检测方式多是手动或者半自动的方 式,通过专业的硬件检测工具进行检测,例如:机械式法兰阀门检测、液压式法兰阀门 检测、机械式螺纹阀门等。这样的检测方式不能及时发现故障,且效率低,准确度不高, 难以满足自动化生产的需要【9 啦】。 2 0 0 3 年,石油大学和油田合作,开发了多阀门检测的计算机测控系统。根据阀门泄 漏时通道内压力的变化,通过压力传感器检测阀门的泄漏,使得阀门的检测过程由传统 的手动与半自动操作改进为只需手动装卸阀门、自动检测,提高了检测精度和工作效 率【1 3 】。 而通过声学原理自动检测阀门泄漏方面,目前还只是处于理论研究和试验阶段,出 现了阀门泄漏时声发射现象的研究理论和数学模型,以及阀门泄漏时的频谱分析研 究1 1 4 - 15 1 。 2 0 0 3 年,戴光等人发表了承压阀门内漏声学检测方法,分析了承压阀门内漏过 程中流体流动状态,以及声源产生机理,建立了阀门泄漏产生的声源信号幅度与内漏率 的一般关系。利用研制的实验台对阀门内漏进行检测实验,并探讨了泄漏时阀门丌度、 两侧压差等状态变化时的声学特性。研究结果表明,可以利用声学方法检测承压阀门是 否存在泄漏。 2 0 0 6 年,王永涛等人根据阀门内泄漏时产生的泄漏量与泄漏时湍流产生的声发射特 征,研制了便携式阀门内泄漏声学检测仪。阐述了基于声学的阀门内泄漏检测系统,通 过检测阀门内泄漏产生的泄漏谱估算了阀门的泄漏量。该系统采用了2 只压电传感器对 泄漏的声信号进行采集,利用d s p 技术进行谱分析,并将泄漏谱在频域相减,实现了弱 小泄漏的有效检测【1 6 1 。 目前,国内石油行业尚没有基于声音的成熟的应用于产品中的通过软件自动检测阀 门泄漏的技术。 1 3 研究内容、关键问题 1 3 1 研究内容 本系统利用声学原理,将声学检测故障技术应用到输油泵国产化的阀门的检测中, 3 第一章绪论 通过软件实时、自动监测阀门的泄漏情况。且在德国先进技术的基础上进行了改进,由 原来的检测一路输油管道的两个阀门提升为检测七路输油管道的十四个阀门。通过本系 统可以实时、动态的自动检测阀门的使用状况,实现由单路简单声音的识别到多路复杂 声音的识别的改进。工作内容主要是针对软管隔膜活塞泵进出口阀门开启特性和泄漏的 具体环境,研究设计软管隔膜活塞泵进出口阀门声学实时监测系统的软件系统原型。具 体包括下述内容: 1 特征参数提取 特征参数提取是指从阀门音频信号的大量数据中提取出随时间变化的语音特征序 列,去除冗余信息,提取有用的足以代表语音特征的统计数据作为观测序列,是建立 h m m 模型库的关键。 2 h m m 模型训练 隐马尔可夫模型训练的目的是根据观测序列计算模型的参数,即从一组训练样本中 确定状态的转移概率,作为后期故障识别的依据。到目前为止,还没有能够根据训练样 本确定最优参数集合的方法,本文中采用前向后向算法( f o r w a r d b a c k w a r da l g o r i t h m ) 【8 1 ,利用这种方法训练出的模型具有较高的识别率【1 7 】。 3 模式识别 模型训练完成之后将模型参数存储,此时,系统就具备了故障诊断的能力。即根据 给定的h m m 参数和它所产生的观测序列,决定最有可能产生这个可见观测序列的隐状 态序列。诊断过程中,输入待检测阀门音频信号,经过预处理、特征参数提取后,得到 观察值序列。然后,快速有效的计算出观察值序列在各h m m 模型下的输出概率,通常 情况下,概率最大的模型即为识别结果。 4 识别后处理 由于h m m 模型识别故障并不是1 0 0 的识别,如果出现错误判断,致使停工检查, 则误时误工,代价较大。况且,即使h m m 模型对于故障的识别是1 0 0 的识别,由于输 油泵本身的工作特点,也可能会有阀门没有关严等情况,而这些情况所发出的声音跟阀 门真正泄露的声音极其相似,从而会导致h m m 模型误判。因此,需要对h m m 识别后的 结果进行再处理,这样既保证了系统的灵敏度,又保证了系统识别异常的准确性。 1 3 2 关键问题 论文要解决的关键问题是针对软管隔膜活塞泵进出口阀门丌启特性和泄漏的具体 4 第一章绪论 环境的特征参数提取和h m m 模型训练。 特征参数的提取是在声音信号的大量数据中,去除冗余信息,提取其特征作为观测 序列,因此特征参数提取的是否恰当,直接影响观测序列的代表性。好的特征提取算法 可以在尽可能不损失重要信息的前提下压缩数据,因此特征参数的提取是建立h m m 模 型的关键问题。 h m m 模型的训练是产生模型参数的过程,参数是否恰当直接影响到故障识别的结 果是否准确,因此h m m 模型训练是本论文的一个关键问题。 5 第二章皋于声音识别的新型输油泵阀门泄漏检测原型系统的体系结构 第二章基于声音识别的新型输油泵阀门泄漏检测原型系统的体 系结构 2 1 工作环境介绍 图2 1 输油泵工作示意图 f i g 2 1t h ep u m ps c h e m a t i cd i a g r a m 基于声音识别的新型输油泵阀门泄漏检测原型系统是德国新型输油泵软管隔 膜活塞泵国产化的一个子系统。软管隔膜活塞泵系统共有七路输油通道,一路原油输送 工作原理如图2 1 所示。图中n o 1 所示位置是原油出口阀,n o 2 所示位置是原油出口阀声 音检测传感器位置;对应右下部是原油入口阀及声音检测传感器位置;n o 3 所示位置是 浆料与软管和阀门内侧相接触;n o 4 所示位置是直线彤的流通通道;n o 5 所示位置是平 隔膜的央紧区域;n o 6 所示位置是组合式超压安全阀;n o 7 所示位置是油泵在油内工作。 图2 1 的右边电机带动曲柄使活塞左右移动,同时带动一个塞轮机构( 图2 1 中未画 出) 控制原油出进 j 阀门的的开关。随着进口阀打丌,出口阀的关闭,活塞从左向右移 动,隔膜软管中的压力变低,原油进入软管;当活塞到达右端时,原油进l 1 阀关闭;活 塞向左端前进,到达一定路径时,塞轮机构启动原油出口阀打丌,活塞继续向夕r :前进, 挤压软管隔膜将原油压出出口阀。 6 第二章基于声音识别的新型输油泵阀f - 1 泄漏榆测原型系统的体系结构 从上述的简单工作原理中可以得到,原油进出口阀在完成一次挤压原油的过程中经 历了八个阶段。 第一阶段:出口阀门关闭,进口阀门逐步打开,活塞从左向右运动,使泵内空间逐 步增大,压力逐步变小,原油进入输油通道; 第二阶段:出口阀门关闭,进口阀门已完全打开,活塞继续从左向右运动,使泵内 空间逐步增大,压力进一步变小,原油继续进入输油通道; 第三阶段:出口阀门关闭,逐步关闭进口阀门; 第四阶段:出口阀门关闭,进口阀门关闭; 第五阶段:进口阀门保持关闭,出口阀门逐步打开,活塞从右向左运动,挤压隔膜 软管输出石油; 第六阶段:进口阀门保持关闭,出口阀门完全打开,活塞继续从右向左运动,挤压 隔膜软管输出石油; 第七阶段:进口阀门关闭,出口阀门逐步关闭。 第八阶段:进口阀门关闭,出口阀门关闭。 从上述分析的软管隔膜活塞泵工作原理中得到,一路输油通道的两个阀门频繁的打 开关闭。现有参数是每分种完成1 2 0 次输油,也就是每秒完成两次输油过程。在输油过 程中,阀门的逐步打开和逐步关闭的阶段,在阀门处会产生与泄漏现象几乎相同的多相 湍射流的声发射现象,这将给后续的识别算法增加难度。由于本系统之目标是检测出现 阀门损坏或者阀门关闭不严等异常情况导致的阀门泄漏。因此只需对阀门关闭阶段进行 检测,而对阀门在逐步打开和全打开的时段是不必关心的。也就是,系统只需要在第八 阶段到第四阶段的时段对出口阀门进行检测,在第四阶段到第八阶段期间对进口阀门进 行检测。由于系统中阀门的打开与关闭由凸轮机构控制,在凸轮机构上安装位置传感器, 以获得进出口阀门关闭打开的时刻,区分出声音识别的时段。( 软管隔膜活塞泵进出口 阀门声学实时监测系统硬件结构就不在此祥述) 2 2 系统的总体框架 软管隔膜活塞泵进出口阀门声学实时监测系统软件原型系统主要由预处理、特征参 数提取、h m m 模型训练、模式识别和识别后处理等五部分构成。系统结构如图2 2 所示: 7 第二章基于声音识别的新型输油泉阀门泄漏榆测原型系统的体系结构 识别 图2 - 2 系统结构 f i g 2 2s y s t e ms t r u c t u r e 其中,各部分的工作内容如下: 1 预处理 为了提高模型训练和模型识别的效率,需要从音频信号的大量数据中去除冗余信 息,提取其特征。为了方便特征提取,需要对信号进行采样量化、预加重处理、加窗等 预处理操作。 2 特征参数提取 特征参数提取是指从阀门音频信号的大量数据中提取出随时间变化的语音特征序 列,提取有用的足以代表语音特征的统计数据作为观测序列,是建立h m m 模型库的关 键。 3 h m m 模型训练 隐马尔可夫模型训练的目的是根据观测序列计算模型的参数,即从一组训练样本中 确定状态的转移概率,作为后期故障识别的依据。 4 模式识别 即根据给定的h m m 参数和它所产生的观测序列,决定最有可能产生这个可见观测 序列的隐状态序列。 5 识别后处理 根据实际需要,对h m m 识别后的结果进行再处理,以提高系统识别故障的准确性。 8 第三章特征提取 第三章特征提取弟二早寸哥位淀耳义 3 1 信号提取的可靠性处理 进出口阀门的关闭时段由位置传感器获得,而位置信号又由凸轮控制机构决定。随 着机械运动的的磨损,阀门的关闭位置与信号同步可能出现偏移。为此,在设计中将阀 门关闭的时段两端向内收缩各1 0 m s ,有效的提高了信号的可靠性,而又不影响信号的 识别。 3 2 特征提取 声音信号中含有大量丰富的信息,特征参数的提取即通过对声音信号的分析处理, 去除对声音识别无关紧要的冗余信息,获得影响声音识别的重要信息,是建立h m m 模 型库的关键【18 1 。 3 2 1 常用的声音特征 语音信号是冗余度很高的随机信号,在进行信号处理时,经过特征提取能够有效的 降低信号的冗余度。特征提取本质上是降低信号冗余度,用较少的数据表现语音信号的 特征。 现有语音识别系统采用的最主要的两种语音特征是线性预测倒谱参数( l i n e a r p r e d i c t i o nc e p s t r u mc o e f f i c i e n t ,l p c c ) 和m e l 频率倒谱系数( m e lf r e q u e n c yc e p s t r u m c o e f f i c i e n t ,m f c c ) 1 9 2 1 1 。 对特征参数的要求是: 1 提取的特征参数能够有效地代表语音特征,具有很好的区分性。 2 各阶参数之间有良好的独立性。 3 特征参数要计算方便,最好有高效的计算方法,尽可能缩短计算时间,以保证 声音识别的实时性。 线性预测倒谱系数是基于语音信号为白回归信号的假设,利用线性预测分析获得倒 谱参数。l p c c 参数的优点是计算量小,对元音有较好的描述能力,其缺点在于对辅音 9 第三章特征提取 的描述能力较差,抗噪声性能较差。 m e l 频率倒谱系数考虑了人耳的听觉特性,将频谱转化为基于m e l 频率的非线性频 谱,然后转换到倒谱域上。人的听觉系统是一个特殊的非线性系统,它响应不同频率信 号的灵敏度是不同的,基本上是一个对数的关系。人的耳朵能够从嘈杂的背景噪声中听 到语音信号,这是因为人的内耳基础膜对外来信号会产生调节作用。对不同的频率,在 相应的临界带宽内的信号会引起基础膜上不同位置的振动。可以用滤波器组来模拟人耳 听觉,从而减少噪声对语音的影响。由于充分模拟了人的听觉特性,而且没有任何前提 假设,m f c c 参数具有识别性能和抗噪能力,实验证明在语音识别中m f c c 参数的性 能明显优于l p c c 参数【z 2 。 标准的m f c c 参数只反映语音参数的静态特征,而人耳对语音的动态特征更为敏 感,通常使用差分倒谱参数来描述语音的动态变化。 本文使用的特征是m f c c 和其一阶差分a m f c c 。 特征提取分为预处理( 采样量化、预加重处理、加窗) 和特征提取两大部分。连续 的声音信号经过采样量化转换为离散的声音信号,离散的声音信号经过预加重和加窗处 理后即可进行特征提取,从而得到声音信号的特征向量序列。如图3 1 所示: 连续声音 离散声音。预加重 特征向量。 信号 采样量化 r 加窃特征提取 r 信号 处理 序列 3 2 2 预处理 图3 - 1 特征参数提取 f i g 3 一lf e a t u r ee x t r a c t i o n 3 2 2 1 采样量化 为了将原始的模拟声音信号变为数字信号,必须经过采样和量化两个步骤,从而得 到时间和幅度上均为离散的数字声音信号。 采样,即把模拟信号x 。( t ) 在时间域上进行等间隔抽取,得到序列 x ( n ) = x a ( n t ) 一 n 丁 相应的窗谱为: m ,2 警+ 封掣+ 等字】 由此式可以看出,汉宁窗可以看作是3 个矩形时间窗的频谱之和,或者说是3 个 s i n ( t ) 型函数之和,而括号中的两项相对于第一个谱窗向左、右各移动了7 t t ,从而使旁 瓣互相抵消,消去高频干扰和漏能。可以看出,汉宁窗主瓣加宽并降低,旁瓣则显著减 小,从减小泄漏观点出发,汉宁窗优于矩形窗但汉宁窗主瓣加宽,相当于分析带宽加 宽,频率分辨力下降。 汉明窗也是余弦窗的一种,又称改进的升余弦窗,其时间函数表达式为: 1 3 第三章特征提取 邮,2 1 ( 0 5 4 + 0 4 c o s 争。鬻 俘4 , m h 。8 警+ o 4 6 等字+ 等字1 田l圆十石田一石l 更小。分析表明,汉明窗的第一旁瓣衰减- - 4 2 d b 汉明窗的频谱也是由3 个矩形时窗 不同的窗函数对信号频谱的影响是不一样的,这主要是因为不同的窗函数,产生泄 漏的大小不一样,频率分辨能力也不一样。信号的截断产生了能量泄漏,而用f f t 算法 由于矩形窗使得每一帧信号在起始点和终点处发生突变,不再连续,从而导致j i b b s 现象的出现。为了减小起始点和终点处的不连续性,可以改变窗函数的时域特性,使其 在起始点和终点处逐渐变为零,女h h a m m i n g 窗( 即升余弦窗) ,减少j i b b s 效应: 州n ) = 0 5 4 - 0 4 6 c o s i 悬l 悯1 ,n _ 1 ( 3 _ 5 ) 本文使用h 撇m i n g 窗进行加窗处理。其中n 称作帧长,为时间窗的窗宽。为尽可能 不丢失语音信号动态变化的信息,常采用滑动窗,即帧与帧之间有一定的重叠。如图3 5 图3 - 5 分帧示意图 f i g 3 5s k e t c hm a p o ff r a m e 1 4 第三章特征提取 啼一 醐罄馘琵。 图3 6 帧长和帧移示意图 f i g 3 - 6s k e t c hm 印o f f r a m es i z ea n df r a m es h i f t 3 2 3m f c c 特征参数提取 语音信号经预处理后,即可对其进行特征参数提取。m e l 频率倒谱系数( m e l f r e q u e n c yc e p s t r u mc o e f f i c i e n t ,m f c c ) 主要着眼于人耳的听觉特性,利用听觉前端滤波 器组模型,能很好的体现音频信号的主要信息,在语音识别、音频分类和检索领域应用 十分广泛。本系统选用m f c c 特征参数及其一阶差分a m f c c 。m f c c 是在m e l 标度频率 域提取出来的倒谱参数。它与频率的关系可用下式近似表示: f m e l ( f ) = 2 5 9 5 1 0 9 l o ( 1 + 熹) u u ( 3 6 ) 式中:伪频率,单位h z 。如图3 7 所示。 t - t 一 _ ; 一十 :i ;lf :l 0:jjj 。 一叫一1 。:卜。; ;i ;一一i | :;:,: 1 ;。f t i;i , ; 。? ”;。;? j _ ; l l j小- o - k _ 。- - i 卜- 扣 : : :;: 1 0 31 0 4 图3 7m e i 标度与频率的关系 f i g 3 7t h er e l a t i o nb e t w e e np i t c ha n df r e q u e n c y m f c c 参数的提取过程如下: 1 将预处理后的信号进行快速傅立叶变换( f f t ) ,将时域信号转换为频域信号, 1 5 1:t;:!-j;t!;-:r;t-:;:111;量。;。-r;-;,;lr,k;。 - - i ;中:-|;上: r - - - -tj,:1:i:“=)一t”xi-一=”鬣“ i - -1i-;-| 咖 啪 啪 姗 啪 _ 量 1 , ,_ l 1 一智墨z暑墨 磅 h 2 几 船 6 驴 e ;2 第三章特征提取 再计算其模的平方得到能量谱p i 】,l k n 1 。 傅里叶变换是建立以时间为自变量的“信号与以频率为自变量的“频谱函数 之 间的某种关系。也就是说任一信号可以有时域和频域两种描述方法。信号在一个域中所 具有的特性,必然在另一个域中有其相对应的特性出现。为了进一步了解时域和频域之 间的内在联系,当在某一个域中分析发生困难时,利用傅里叶变换的性质可以转换到另 一个域中进行分析计算。 经过预处理后的信号在时间和频率上都是离散的,因此可以采用离散傅旱叶变换 ( d f t ) 进行转换。但是由于d f t 计算量太大,即使采用计算机也很难对问题进行实时 处理,因此本文采用离散傅里叶变换的一种快速算法快速傅里叶变换( f f t ) 进行转换。 2 设计一个具有m 个带通滤波器的滤波器组,采用三角滤波器,中心频率从0 f 2 间按m e l 频率分布。m 为滤波器的个数,通常取通常2 4 4 0 ,本文取2 4 ;n 为一帧语音信 号的点数,为了计算f f t 的方便,通常取n 为2 5 6 。取采样频率l1 0 2 5 h z ,则对应的三角 滤波器如图3 8 所示: 图3 - 8m e i 尺度滤波器组 f i g 3 8b a n ko fm e l f i l t e r s 再根据m e d l ( f ) 频率与实际线性频率啪关系计算出三角带通滤波器组h m 【k 】。 h 。( k ) = 0 2 ( k f ( m 一1 ) ) k f ( m + 1 ) 0 、 1 6 第三章特征提取 其中 m l hm ( k ) = 1 m = 0 则每个滤波器组输出的对数能量为: s m 】:n - i i n ( p k h 。 k 】) o m m - l( 3 - 8 ) s m 】= 。 k 】) o 冬m 冬m 。l3 - 8 对数能量对噪音和谱估计误差有更好的鲁棒性。 3 对s 【m 进行离散余弦变换( d c t ) 即得到m f c c 系数。 m l c 【n 】_ s m ( n n ( m + 0 5 ) m ) o n m - 1 ( 3 - 9 ) m = 0 4 取c 【1 】,c 【2 】,c v 】作为m f c c 参数,其中v 是m f c c 参数的维数,本文中 取v = 1 2 。 5 差分倒谱参数 标准的m f c c 参数只反映了声音参数的静态特征,而人耳对声音的动态特征更为敏 感,通常使用差分倒谱参数来描述这种动态特性。 差分参数的计算公式如下: d ( 炉击萎仅c ( n “) ( 3 - 1 0 ) 、i 2 忙 w 其中,c ( n ) 和d ( n ) 都表示一帧语音参数,k 为常数,通常取2 ,本文中取k = 2 ,则差 分参数就是当前帧的前两帧和后两帧参数的线性组合。 由式( 3 1 0 ) 计算得到的差分参数为一阶m f c c 差分参数,即a m f c c 。在实际应 用中,将m f c c 参数和一阶差分参数合并为一个矢量,作为一帧语音信号的参数。 1 7 第三章特征提取 u d 0 4 n 2 i 。浊- 。一ik 上瞳 。i “_i 且越l j且1 “ ( - 0 ,2 。 rf1 i i r l “ 一即聊i r1 iw n ,i f 口- f 1 w - 0 毋6 由8 , , ot2 43 一4g6 7 、 l 。 i i j 一,i ? 。j i_ |,、? i ,i 心 图3 - 9 bm f c c 参数 f i g 3 9 bm f c cp a r a m e t e r 图3 - 9 c 第一维m f c c 参数图3 - 9 d 第一维a m f c c 参数 f i g 3 - 9 ct h ef i r s tm f c cp a r a m e t e rf i g 3 9 dt h ef i r s ta m f c c p a r a m e t e r 图3 - 9m f c c 参数 f i g 3 - 9m f c cp a r a m e t e r 第四章隐马尔可夫模型 第四章隐马尔可夫模型 4 1 隐马尔可夫模型概述 隐马尔可夫模型( h i d d e nm a r k o vm o d e l ,h m m ) 是一种时间序列统计建模工具, 它能够对非平稳信号变化的规律进行统计并建立参数化模型,另外利用该模型可以方便 地进行概率推理,因此它常常作为动态模式分类的工具。隐马尔可夫模型的强大之处在 于在观察到的事件与内在的状态间建立了一种概率模型【2 3 1 。 1 8 7 0 年,俄国有机化学家v l a d i m i rvm a r k o v n i k o v 第一次提出马尔可夫模型。考虑 连续时间上的一系列状态,在t 时刻的状态记为( t ) ,一个( 在时间上) 长为t 的状态序 列记为t = ( 1 ) ,( 2 ) ,( t ) ) ,记p ( q ( t + 1 ) ( t ) ) = a u ,表示系统在某一时刻处于状态蛾 的情况下,在下一个时刻变为状态i 的概率,即转移概率。转移概率是与具体的时刻无 关的,即可以用a i i 而不是a i i ( t ) 来表示。这里,并不需要转移概率是对称的,即不需要有 a i j _ a i i ,而且,有可能前后两个时刻都处于同一状态之中,即有可她i 范a i i o 。 图4 1 为基本马尔可夫模型,用节点表示离散的状态i ,用连线表示转移概率a i i 。在 一阶离散时间马尔可夫模型中,在任一时刻t ,系统位于状态c o ( t ) 。而时亥u t + l 的系统所位 于的状态则是一个随机函数,与时刻t 时系统的状态和转移概率都有关系。假设已经有了 某一个模型0 ,即全部的转移概率a i i 都已经知道,并且还知道某一个特定的序歹l j o ) t , 例如: 0 ) t = i ,( 0 4 ,0 2 ,c 0 2 ,l ,嘶,) 。为了计算产生如上所述的序列的概率,我们需要做的仅仅是把 连续的转移概率相乘。例如:p ( c 0 1 1 0 ) = a 1 4 f 1 4 2 a 2 2 a 2 1 a 1 4 。 然而,在语音识别中,人的听觉系统并不能感觉到这些状态,我们能够感知到的只 是发出的声音。这样就必须对马尔科夫模型进行改进,引入“可见状态”即那些能 够被用某种方式观测到的外部状态,和g o 状态那些不能被观测到的内部状态。 假设在某一时刻t ,系统都处于某一个状态( t ) 中,同时,这个系统还激发出某种可 见( 可被观测到的) 的符号v ( t ) ,则每一个可能发出的状态v k ( t ) 都有相应的概率。把这个 概率记为:p ( v k ( t ) ic o j ( t ) ) = b j k 。因为我们只能观测到可见的状态,而不能直接知道i 处于 哪个内部状态,所以整个模型被称为“隐马尔可夫模型”。如图4 2 所示,为具有三个隐 状态的隐马尔可夫模型。状态之间的连线表示隐状态之间的转移概率,虚线表示每一个 隐状态产生的可见状态。 1 9 第四章隐马尔可夫模型 v 4 图4 1 马尔可夫模型 f i g 4 1m a r k o vm o d e l 图4 - 2 隐马尔可夫模型 f i g 4 2h i d d e nm a r k o vm o d e l h m m 建模方法具有良好的识别性能和抗噪性能,在交通检测系统、图像识别、语 音识别以及基于震动信号的故障诊断等中都得到了较好的应用,也是目前为止最有效的 语音信号识别方法【2 4 】。 h m m 有多种形式,如离散h m m 、连续h m m 和半连续h m m 等,本文使用的是 连续混合高斯h m m ,简称c h m m 。由于c h m m 直接以语音特征向量本身为观测序列, 而不是像离散h m m ( d h m m ) 那样先将语音特征向量经矢量量化为观测符号,因此 2 0 第p q 章隐马尔可夫模型 c h m m 有优于d h m m 的识别精度【2 5 】。 在c h m m 中,对于每一个状态,都用若干个正态高斯概率密度函数( 简称为p d f ) 的线性组合来表示,每个p d f 有各自的均值矢量和协方差矩阵,这些都是通过对特征参 数进行统计得到的。 h m m 可以分为两部分,如图4 3 所示:一个是m a r k o v 链,描述状态的转移,由兀、 a 来描述,产生的输出为状态序列;另一个随机过程,描述状态与观察序列间的关系, 由b 来描述,产生的输出为观测值序列。 随机过程 ( b ) r i 篙磐 q l ,q 2 ,q to l ,0 2 ,o t 图4 - 3h m m 的组成示意图 f i g 4 3s k e t c hm a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论