




已阅读5页,还剩56页未读, 继续免费阅读
(信号与信息处理专业论文)基于频域bss的语音增强方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 现实生活中,语音信号经常会受到噪声和房间混响的干扰,这不仅影响人们的听觉 质量,而且对语音处理的其它环节也会产生影响。因此,必须采用信号处理技术对带噪 语音信号进行增强处理。实际上,除了语音增强之外,语音分离也可以用来减小噪声和 混响的影响。信号盲源分离( b l i n ds o u r c es e p a r a t i o n , b s s ) 是一项具有挑战性的研究课 题,也是信号处理领域近年来的研究热点之一目前,对该问题的研究已经取得了很大 的进展。但是,还远未达到成熟的地步,其中,对于实际环境下的卷积语音信号分离问 题的研究可以说还处于起步阶段。本论文在前人工作的基础上,主要从以下三个方面对 频域盲源分离语音增强方法进行了研究。 一 独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 的b s s 算法是一种分离信号 的有效方法,但是该方法在进行非线性优化时收敛速度较慢。针对这一问题,本文介 绍一种新的b s s 算法,即基于i c a 和波束形成的混合算法,该算法比通用的基于i c a 的b s s 算法具有更好的分离性能,并且由于在i c a 中利用了零波束形成,因而有效地 改善了算法的分离性能和收敛性能。实验结果表明,该算法适用于混响情况。 对语音信号和音乐信号进行盲解卷是一个具有挑战性的问题。在实际环境中的卷积 混合情况下,i c a 算法的分离效果不太理想,分离出的信号中有串扰成分存在。为了解 决这一问题,本文介绍了一种基于小波域i c a 和收缩函数后处理的b s s 方法。该方法 首先将麦克风阵列接收信号分别进行小波变换,然后将得到的小波系数进行i c a 分离, 再将分离出的系数进行收缩函数后处理,最后将处理后的系数分别进行小波反交换,得 到分离出的语音信号和音乐信号。用计算机模拟的带噪语音信号对本文方法进行了测 试,实验结果表明,该方法能较好地分离语音信号和音乐信号。 针对噪声和混响情况下的语音增强问题,本文提出一种基于子带带参考信号的独立 分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i sw i t hr e f e r e n c e , i c a r ) 算法和收缩函数后处 理的语音增强方法。该方法将i c a r 和收缩函数算法相结合,在噪声和混响环境中通过 对两路带噪语音信号进行增强处理,以实现增强目标语音信号的目的。首先对两路带噪 语音信号进行子带分解;然后在子带内利用i c a - r 算法从带嗓语音信号中提取出子带目 标信号,再经过子带综合滤波器形成全带目标信号;最后,将该信号经收缩函数后处理, 得到增强后的目标语音信号。实验结果表明,该方法具有较强的噪声抑制能力,对语音 信号造成的损伤较小。 关键词:语音增强;独立分量分析;盲源分离;小波变换;收缩函数 s t u d y o n f r e q u e n c yd o m a i nb l i n ds o u r c es e p a r a t i o nb a s e ds p e e c h e n h a n c e m e n tm e t h o d s a b s t r a c t i no u rl i v e s ,s p e e c hs i g n a l sa 尬o f t e nd i s t u r b e d b yv a r i o u si n t e r f e r e n c e s s u c ha s b a c k g r o u n dn o i s ea n dr o o mr e v e r b e r a t i o n 1 1 坞e x i s t i n go fn o i s ea n dr e v e r b e r a t i o nn o to n l y a f f e c t sh u m a n h e a r i n g , b u ta l s oh a si n f l u e n c eo no t h e rs t e p so fs p e e c hs i g n a lp r o c e s s i n g s oi t i si m p o r t a n tt oa n 】瞳m c es p e e c hu s i n gs i g n a lp r o c e s s i n gt e c h n o l o g y i nf a c t , b e s i d e ss p e e c h e n h a n c e m e n t , s p e e c hs e p a r a t i o nc a r la l s og e tr i do ft h ei n f l u e n c eo fn o i s ea n dr e v e r b e r a t i o n b l i n ds o u r c es e p a r a t i o n ( b s s ) i sa c h a l l e n o n gs u b j e c ta n db o o o m e $ t ob eap o p u l a r r e s e a r c h a 托ai ns i g n a lp r o c e s s i n gf i e l di nr e c e n ty e a r s i nt h el a s tt w od e c a d e s ,an u m b e ro fa l g o r i t h m s a d d r e s s i n gt h ei n s t a n t a n e o u sb s sp r o b l e m sh a v eb e e np r o p o s e da n dg a i n e ds o m er e s u l t s h o w e v e r , c u r r e n tr e s u l t sa r ef a rf r o mi t sm a t u r es o l u t i o n m o r e o v e rr e s e a r c ho nr e a l w o r l d c o n v o l u t i v es p e e c hs i g n a l sh a sj u s tb e g u n t h i st h e s i sf o c u s e so nt h em e t h o d so ff r e q u e n c y d o m a i nb l i n ds o k r c es e p a r a t i o nb a s e ds p e e c he n h a n c e m e n tw h i c hi n c l u d et h r e ep a g t s : 1 1 圮i n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) - b a s e db s sa p p r o a c hs e e m st ob eav e r y f l e x i b l ea n de f f e c l i v et e c h n i q u ef o rs o u l 优s e p a r a t i o n , b u ti th a sa ni n h e r e n td i s a d v a n t a g ei n t h a tt h e r ei sd i f f i c u l t yw i t ht h es l o wc o n v e r g e n c eo fn o n l i n e a ro p t i m i z a t i o n i nt h i st h e s i s ,a l l e wa l g o r i t h mi si n t r o d u c a x tf o rb l i n ds o u i s e p a r a t i o n , i nw h i c hi c aa n db e a m f o r m i n ga r e c o m b i n e dt or e s o l v et h es l o w - c o n v e r g e n c ep r o b l e mt h r o u g ho p t i m i z a t i o ni ni c a 硼豫 t e m p o r a lu t i l i z a t i o no fn u l lb e a m f o r m i n gt h r o u g hi c ai t e r a t i o n s c a nr e a l i z ef a s t - a n d h i g h - c o n v e r g e n c eo p t i m i z a t i o n n 圮r e s u l t so ft h es i g n a ls e p a r a t i o ne x p e r i m e n t sr e v e a lt h a t t h es i g m js e p a r a t i o np e r f o r m a n c eo ft h ep r o p o s e da l g o r i t h mi ss u p e r i o rt ot h a to ft h e c o n v e n t i o n a li c a - b a s e db s sm e t h o d , e v e nu n d e rr e v e r b e r a n tc o n d i t i o n s b l i n ds e p a r a t i o no fh u m a ns p e e c hw i t hm u s i cs i g n a l si sad i f f i c u l tp r o b l e m t h e s e p a r a t i o no fi c ad e t e r i o r a t e s f o rr e a l w o r l dc o n v o l u t i v em i x l u 他s h e n c e , t h es e p a r a t e d s i g n a l sc a nh a v ec r o s s - t a l kc o m p o n e n t s a na l g o r i t h mf o rb s so fc o n v o l u t i v em i x t u r o si s i n t r o d u c e dh e r e s e p a r a t i o no fs i g n a l si sp e r f o r m e di nt w os t a g e s n ef i r s ts t a g ei n v o l v e st h e a p p l i c a t i o no fa ni c aa l g o r i t h m , a n ds h r i n k a g ef u n c t i o n sa r ea p p l i e dt oa s e to fw a v e l e t c o e f f i c i e n t si nt h es e c o n ds t a g e 田地r e s u l t ss h o wt h a tt h et e c h n i q u ec a ns e p a r a t em u s i cf r o m s p e e c hs i g n a l sw i t hh i g h l ya c c e p t a b l er e s u l t s a s p e e c he n h a n c e m e n tm e t h o db a s e do ni n d e p e n d e n tc o m p o n e n ta n a l y s i sw i t hr e f e r e n c e ( i c a - r ) i ns u b b a n da n ds h r i n k a g ef u n c t i o np o s t - p r o c e s s i n gi sp r o p o s e d , w h i c hi su s e di n n o i s ea n dr e v e r b e r a t i o ne n v i r o n m e n t s c o m b i n i n gi c a ra n ds l m n k a g ef u n c t i o n , t w o m 基于频域b s s 的语音增强方法研究 c h a n n e ln o i s ys i g n a l sw l ep r o c e s s e dt oo b t a i nt h ee n h a n c e dt a r g e ts i g n a l f i r s t l y ,t w o c h a n n e ln o i s ys i g n a l sw l ep a s s e dt h r o u g ht h ea n a l y s i sf i l t e rb a n k st og e n e r a t et h es u b b a n d n o i s ys i g n a l s t h e n , i c a - rw 勰u s e di ns u b b a n dt o x h - a c tt h ee s t i m a t e dt a r g e ts i g n a lw e w a t ei n t e r e s t e di n f i n a l l y , a f t e r s y n t h e s i sf i l t e rb a n k s ,s h r i n k a g ef u n c t i o nw a su s e dt o c n h a n o e s t i m a t e dt a r g e ts i g n a lf m t h o r t h ee x p e r i m e n t a lr e s u l t ss h o wt h a tt h ep r o p o s e d m e t h o di se f f e c t i v ea n dt h ed i s t o r t i o no f t h et a r g e ts i g n a li ss m a l l k e yw o r d s :s p e e c he n h a n c e m e n t :i n d e p e n d e n tc o m p o n e n ta n a l y s i s : b l i n ds o u r c es e p a r a t i o n :w a v e l e t t r a n s f o r m :s h r i n k a g ef u n c t i o n - - 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意 若有不实之处,本人愿意承担相关法律责任。 学位论文题目: 羔盈趔堡塾鱼邀堕边三塑砑巫 作者签名 :互三氅卜一 日期:二型年埘卫日 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 一缩印、或扫描等复制手段保存和汇编本学位论文 学位论文题目:一蒸盈趔垦丝壹至薹盏超达丝盆显 作者签名:一一杰蚋 日期- 盟年堡月鱼日 导师签名:皇堕垒日期:型窭年监,月j 卫日 大连理工大学硕士学位论文 1绪论 语音信号处理是信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等 新兴领域的核心技术之一,它主要包括语音通信、合成、识别和语音增强等方面。通常 人们在获得语音信号的同时,不可避免地会受到来自传输媒介引入的噪声、通信设备内 部电噪声、房间混响乃至其他说话人的话音干扰。这些干扰不仅会使接收者得到的语音 被噪声污染,同时也会导致许多语音处理系统的性能急剧恶化。例如,语音识别已取得 重大进展,正在步入实用阶段。但目前的识别系统大都是在安静环境中工作的,在噪声 环境尤其是强噪声环境中,语音识别系统的识别率将受到严重影响。因此语音增强作为 一种预处理手段,不失为一种有效途径。 一 基于麦克风阵列的语音增强方法继承了天线阵列的有关算法,同时也吸收了一些常 用的单克风语音增强方法,如谱相减及维纳滤波方法等,大大提高了麦克风阵列语音增 强系统的消噪效果。 1 1麦克风阵列语音增强方法概况及存在的问题 近十几年来,基于麦克风阵列的语音处理技术逐渐成为各国学者关注的焦点。该技 术在声源定位、语音识别以及语音增强中取得了良好的效果。至今为止,人们已经提出 诳多基于麦克风阵列的语音增强方法,其中比较经典的方法包括波束形成、盲信号分离 以及后置滤波等几大类。下面对这几类方法分别加以概述。 ( 1 ) 波束形成算法【1 - 3 。1 9 7 2 年,f r o s t 提出了线性约束自适应波束形成方法i l j , g r i f f i t h s 和j i m 在其基础上提出了广义旁瓣抵消( g e n e r a l i z e ds i d e l o b ec a n c e l ,g s c ) 算 法1 2 】,成为波束形成的经典算法。此后,不少学者在此基础上提出了各种改进方法。如 h o s h u y a m a 等人 3 1 对g s c 算法中的阻塞矩阵进行改进,使得泄漏到噪声参考信号中的语 音信号最小,达到进一步改善语音质量的目的。对于混响情况下,g a n n o t 等人1 4 j 提出基 于传递函数的广义旁瓣抵消器算法,通过对传递函数进行估计,构造了新的阻塞矩阵, 同时把g s c 算法推广到频域。 ( 2 ) 盲信号分离方法 5 - 8 1 。近几年来,盲信号分离已成为信号处理学界和神经网 络学界共同感兴趣的研究热点领域,并获得了迅速的发展。由于一般的盲源分离( b l i n d s o u r c es e p a r a t i o n , b s s ) 算法只能解决瞬时混合问题,对于卷积混和问题却无能为力, 因此一些日本学者提出了一类基于卷积混合的b s s 算法 9 - 1 2 】,该类算法利用了时域内卷 积相当于频域瞬时混合的性质,可用于抑制房间混响。但是,该类方法存在尺度不定性 和排列混乱问题。 基于频域b s s 的语音增强方法研究 ( 3 ) 后置滤波方法【1 3 1 5 1 。该类方法多用来进一步提高系统的增强能力。例如,利 用该类方法对延迟求和及自适应波束形成的输出进行后置处理。 1 2 频域8 s s 技术研究综述 现有的信号b s s 方法从混合方式上大致可以分为四类:( 1 ) 瞬时混合信号的盲分 离0 6 q s l ;( 2 ) 延时混合信号的盲分离【1 9 - 2 2 1 ;( 3 ) 卷积混合信号的盲分离 2 3 - 2 6 1 ,即将混 合看做是源信号和信道的卷积过程,使得盲分离成为盲解卷积问题; ( 4 ) 非线性混合 的盲分离。从观测信号的数日和源信号的数日上又可以分为:( 1 ) 观测信号的数目等 于源信号的数目;( 2 ) 观测信号的数目小于源信号的数目( 欠定b s s ) ;( 3 ) 观测信 号的数日大于源信号的数目( 超定b s s ) 从盲分离算法上可以分为:( 1 ) 基于独立分 量分析的盲分离算法;( 2 ) 基于信号稀疏性的盲分离算法。其中对瞬时混合且观测信 号的数目等于源信号的数目情况研究的比较深入,发展的也比较完善;目前,对于卷积 混合情况下的盲分离问题还没有实质性的进展。本文主要讨论观测信号数目等于源信号 数目的卷积混合信号的盲分离问题。 卷积混合语音信号的分离技术是当前的研究热点之一。频域b s s 是解决卷积混合语 音信号b s s 问题的常用方法之一。相对于时域b s s 算法来说,频域b s s 将时域卷积混合 的语音信号转换成各个频率点上线性混合信号,有利于采用各种相对较为成熟的线性混 合分离算法。同时,由于模拟室内混响冲激响应的f i r 滤波器少则几百阶,多则几千阶, 导致时域b s s 算法很难收敛,而且计算量大,因此频域b s s 算法由于计算量小而受到人 们的关注。 在频域b s s 算法中,由于线性混合分离算法是在每个频率点上分别进行,因此,必 然存在幅度和排序模糊性的问题,是影响频域b s s 算法性能的主要原因之一。在近年提 出的一些b s s 算法中,利用小波变换或短时傅里叶变换的时频方法1 2 7 1 来解决卷积混合 b s s 问题往往存在频率的置换模糊,并且在长混响环境中分离效果很差【2 引。 1 3 本文的主要研究内容及章节安排 由于语音信号的非平稳性,噪声干扰的多样性和房间混响的复杂性,使语音增强成 为一个极具困难但又非常吸引人的研究课题。本文在回顾和总结前人工作的基础上,结 合实际情况给出了改进的方法,通过仿真实验,表明了这些方法的有效性。 本论文的章节安排如下: 第1 章主要介绍了麦克风阵列的特点及频域b s s 的语音增强方法。 第2 章简要介绍了随后各章中所要用到的一些基础知识。包括语音特性及人耳感知 特性、噪声、噪声场特性、传声器阵列模型和语音增强效果评价方法等。 大连理工大学硕士学位论文 第3 章介绍一种基于i c a 和波束形成的快速收敛的b s s 算法。该方法通过结合i c a 和波束形成,来解决在i c a 优化过程中收敛速度慢的问题。实验结果表明,该方法可以 适用于混响情况。 第4 章介绍一种基于小波域i c a 和收缩函数后处理的b s s 算法。该方法首先将麦 克风接收到的信号分别进行小波变换,然后将得到的小波系数进行i c a 分解,再将分离 出的系数通过一系列的收缩函数进行进一步处理,最后将系数分别进行小波反变换,得 到分离出的语音信号和音乐信号。实验结果证明了该方法能较好地分离语音信号和音乐 信号。 第5 章给出一种基于子带i c a - r 和收缩函数后处理的语音增强方法。该方法将 i c a - r 和收缩函数算法相结合,在噪声和混响环境中通过对两路带噪语音信号进行增强 处理,以实现增强目标语音信号的目的实验结果表明,该方法具有较强的噪声抑制能 力,对语音信号造成的损伤较小。 最后对全文进行了总结。 基于频域b s s 的语音增强方法研究 2 语音增强的基础知识 语言是人类特有的功能,通过语音相互传递信息是人类最重要的基本功能之一。随 着人类社会进入信息时代,语音通信在生产和生活中起着越来越重要的作用,人们希望 在任何时候、任何地点能够方便地进行语音通信。 然而人们在语音通信过程中,不可避免地会受到来自周围环境和传输媒介引入的噪 声以及其他讲话者的干扰,如公路、商场、飞机、汽车环境中的噪音,电话系统中的回 声等,这些都会对原始语音造成污染。噪声不仅影响语音的质量和清晰度,造成人耳听 觉疲劳,还会影响语音通信系统的性能。 另一方面,语音识别技术近年来取得了很大进步,人机语音交互作为最自然、便捷 的人机通信方式,越来越受到人们的重视。但是目前的语音识别系统大多在安静的环境 下工作,在强噪声环境中,或者存在别的说话者的情况下,语音识别系统会受到严重的 影响,识别率显著下降。而在实际应用中,不可避免的存在各种噪声,大大妨碍了语音 识别技术在实际生活中的大规模应用。 语音增强是解决噪声污染的一种有效方法,其主要目的就是从带噪语音中尽可能提 取纯净的原始语音。由于噪声都是随机的,因而从带噪语音中提取完全纯净的语音几乎 是不可能的。在这种情况下,语音增强的目的主要有两个:一是改善语音质量,消除背 景噪声,使听者不感觉疲劳;另外一个目的是提高语音可懂度,这是一种客观度量。语 音增强已经广泛应用于语音通信、语音识别、人机交互等领域。此外,语音增强在多媒 体应用、助听等方面也取得了广泛的应用。 2 1语音特性及人耳感知特性 语音增强不但与信号处理技术有关,而且涉及到人的听觉感知和语音学。另外,噪 声来源众多,不同应用场合的噪声特性也各不相同,因此很难找到一种适合于各种噪声 情况的语音增强算法。语音特性、入耳感知特性以及噪声特性是各种语音增强算法的基 础。 2 1 1语音特性 ( 1 ) 语音是时变的、非平稳的随机过程。 人类具有特有的发音系统,其生理结构的变化速度有一定限度。在一段短时间内, 人的声带和声道形状具有相对稳定性,可认为其特征是不变的,应此语音的短时谱具有 相对稳定性。在语音增强中,可利用语音短时谱的这种平稳性。 大连理工大学硕士学位论文 ( 2 ) 语音可分为清音和浊音两大类。 两者在时域和频域具有明显的差异。浊音在时域上呈现出明显的周期性;在频域上 有共振峰结构,而且能量大部分集中在较低频段内。而清音段没有明显的时域和频域特 征,类似于自噪声。 ( 3 ) 语音信号作为一个随机过程可以用统计分析特性来描述。 由于语音信号是一种非平稳、非遍历的随机过程,长时间的时域统计特性在语音增 强的研究中意义不大。 2 1 2 人耳感知性 语音感知对语音增强研究有重要作用。一方面是因为语音增强的最终度量是人的主 观感受:另外入耳对背景噪声有惊人的抑制作用,了解其中机理将大大有助于语音增强 技术的方展。语音感知是一个复杂的问题,目前己有的一些有用结论可以应用于语音增 强技术。 ( 1 ) 人耳对语音的感知主要通过语音信号频谱分量幅度获取的,对相位谱则不敏 感。 盛 啊 ( 2 ) 人耳对频谱分量强度的感受是频率与能量的二元函数,响度与频谱幅度的对 一数成正比。 ( 3 ) 人耳对频率高低的感受近似与该频率的对数成正比。 ( 4 ) 入耳有掩蔽效应。掩蔽效应是指一个声音的存在会对另外一个声音的感知产 生掩蔽作用,即强信号对弱信号有掩盖的抑制作用。掩蔽效应主要发生在同时进入听觉 系统的不同频率的两个声音之间,即同时掩蔽效应。也可以发生在时间上先后进入听觉 系统的两个声音之间,即前向掩蔽和后向掩蔽效应。还可以发生在两个耳朵之间,即双 耳掩蔽。 ( 5 ) 短时谱中的共振峰对语音的感知非常重要,特别是第二共振峰比第一共振峰 更为重要,因此对语音信号进行一定程度的高通滤波不会对可懂度造成影响。 ( 6 ) 人耳在两人以上的讲话环境中有能力分辩出需要聆听的声音。 2 2 噪声及噪声场特性概述 2 2 1 噪声 实际环境中无时无刻不存在噪声,而且噪声特性变化无穷。噪声可以是加性的,也 可以是非加性的( 非加性噪声往往可以通过某种变换,如同态滤波,转为加性噪声) 基于频域b s s 的语音增强方法研究 加性噪声通常分为冲激噪声、周期噪声、宽带噪声、语音干扰噪声等。非加性噪声主要 是残响和传送网络的电路噪声等。 ( 1 ) 冲激噪声 冲激噪声的时域波形是类似于冲激函数的窄脉冲,例如放电、打火、爆炸都会引起 冲激噪声。消除冲激噪声影响的方法通常有两种:对带噪语音信号的幅度求均值,将该 均值作为判断阈值,凡是超过该阈值的均判为冲激噪声,在时域中将其滤除;当冲激脉 冲不太密集时,也可以通过某些点内插的方法避开或者平滑掉冲激点,从而能在重建语 音信号中去掉冲激噪声。 ( 2 ) 周期噪声 最常见的有电动机,风扇之类周期运转的机械所发出的周期噪声,5 0 h z 交流电源 哼哼声也是周期噪声。在频谱图上它们表现为离散的窄谱,通常可以采用陷波器方法予 以滤除。 ( 3 ) 宽带噪声 说话时同时伴随着呼吸引起的噪声,随机噪声源产生的噪声,以及量化噪声等都可 以视为宽带噪声,应用中常近似为c _ r a u s s 噪声或白噪声。其显著特点是噪声频谱遍布于 语音信号频谱之中,导致消除噪声较为困难。一般需要采用非线性处理方法。 ( 4 ) 语音干扰 干扰语音信号和期望语音信号同时在一个信道中传输所造成干扰称为语音干扰。区 别有用语音和干扰语音的基本方法是利用它们的基音差别。考虑到一般情况下两种语音 的基音不同,也不成整数倍,这样可以用梳状滤波器提取基音和各次谐波,再恢复出有 用语音信号。 ( 5 ) 传输噪声 传输噪声是传输系统的电路噪声。与背景噪声不同,它在时间域里是语音和噪声的 卷积。处理这种噪声可以采用同态处理的方法,把非加性噪声变换为加性噪声来处理。 2 2 1 噪声场特性 在麦克风阵列语音增强方法中,噪声场也是一个很重要的概念。不同的方法可能适 用于不同类型的噪声场。所以,对不同类型噪声场的适用性,也是衡量语音增强算法消 噪性能的一个重要标准。通常主要考虑三种类型的噪声场:相干噪声场,非相干噪声场 大连理工大学硕士学位论文 和散射噪声场阎。噪声场可用噪声的时空相关函数来描述。设传声器阵列中第f 个和第 个传声器分别位于弓和弓处,接收到的噪声信号分别为( ,) 和( ,) ,如图2 1 所示。 图2 1 麦克风阵列接收到的噪声 f i g 2 1 n o i s e sr e c e i v e db ym i c r o p h o n ea r r a y 定义噪声在空间时间上的相关函数如式( 2 1 ) 所示,其中丹= 弓一弓 尺( 如,t ) = 厨刀j ( ) 7 0 9 + t ) 】 ( 2 1 ) 进而可以定义在空间频率上的相干函数为: 州= 尚 亿2 ) 其中( 丹,c o ) 为吩) 和乃( f ) 的互功率谱,由互相关函数灭( 丹,d 的离散傅立叶变换 得到,o ( ,c o ) 和西心,呦分别为噪声吩( ,) 和刀,( ,) 的自功率谱。 模平方相干函数的定义为: q = 呐1 2 = 揣 ( 2 3 ) 引入模平方相干函数后,可以将传声器阵列所处的噪声场分为相干噪声场、非相干 噪声场和散射噪声场。当只有一个噪声源存在时,所有传声器接收到的噪声只有相位和 幅度上的差异,这时g 徊) = 1 ,称之为相干噪声场;当各个传声器上的噪声信号彼此间 基于频域b s s 的语音增强方法研究 不相干这时e ) = 0 ,称之为非相干噪声场。在实际环境中,这两种噪声场会同时存 在此时0 c ,( m ) c ( w ( 川 ( 3 2 2 ) 。删= = 搽捌二篙黜 住2 3 , 如果第i + 1 次迭代是最后一次迭代,则转到步骤6 ;否则,返回到步骤2 继续i c a 迭代运算,此时,由式( 3 2 3 ) 给出的w ( 厂) 替换式( 3 1 3 ) 中的w + 。( ) ,同时,将, 基于频域b s s 的语音增强方法研究 ( 6 ) 排列和尺度问题 利用步骤3 获得的d o a 信息,可以检测和修正信号的排列和尺度问题【4 1 1 ,通过归 一化方向模型的增益可以解决尺度问题,如下式所示: y ( f , t ) y ( ,) w ( 厂) x ( r ) ( 不需要解决排列问题) ( 3 2 4 ) w ( 厂) x ( 厂,f ) ( 需要解决排列问题) ( 3 2 5 ) 式( 3 2 4 ) 和式( 3 2 4 ) 中,w ( 厂) 是由式( 3 2 3 ) 所得的最终解混矩阵,并且最i f ,) 由下式给出: 正( 六簏) ,丘( 五) r = w ( 厂) e ( 五) 卜l 龟) ,el ,龟汀= w ( 力e l 反) 3 4 计算机仿真实验结果 两个麦克风中心点距离为4 c m ,假设语音信号分别来自两个不同方向:- 3 0 。和4 0 。 混响时间( r e v e r b e r a t i o nt i m e ,r t ) 分别设为0 s ,0 1 5 s 和0 3 s ,房间的声学转移函数 利用h i l a g e m 模型产生,混响时间r t 可以由e ”- i n g 公式【4 3 1 计算得到 r t = 里:! 箜! ( 3 2 8 ) - s l o g ( 1 - 1 7 ) 一南南。 ) ) 6 7 2 2 c _ j j,-,l 大连理工大学硕士学位论文 其中,y 、s 、刁分别表示房间的体积、总面积与墙壁的反射系数,这里假定各面 墙的反射系数相等。 实验中,噪声n ( 力为信噪比为1 0 d b 的不相干白噪声。源信号为两段采样频率为 8 0 0 0 h z ,采样点数为3 0 0 0 0 点的连续语音。 短时傅立叶变换帧长为1 2 8 m s ,即1 0 2 4 点,帧移为6 4 点。可以使用汉明窗或矩形 窗。模拟实验的混响房间平面图如图3 3 所示。 图3 3 模拟实验的混响房间平面图 f i g 3 3l a y o u to f r e v e r b e r a n tr o o mu s e di ns i m u l a t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 压力安全阀校验员培训课件
- 古县2025山西临汾市古县招聘事业单位人员31人笔试历年参考题库附带答案详解
- 南京市2025南京医科大学卫生分析检测中心招聘56人笔试历年参考题库附带答案详解
- 商品收纳师培训课件
- 2025长三角(宣城)产业投资有限公司招聘4人(安徽)笔试参考题库附带答案详解
- 卸车安全培训课件
- 2025河北唐山政务服务外包有限公司为服务项目招聘66人笔试参考题库附带答案详解
- 2025昆明渝润水务有限公司招聘15人笔试参考题库附带答案详解
- 2025年数字安徽有限责任公司所属企业社会招聘13人笔试参考题库附带答案详解
- 2025山东济南二机床集团(平阴)产业园有限公司招聘9人笔试参考题库附带答案详解
- 人工造林项目投标方案(技术方案)
- 自动扶梯维护培训课件
- 铁丝镀锌工操作规程培训
- 严防管制刀具 对自己和他人负责-校园安全教育主题班会课件
- 医院培训课件:《护患沟通技巧》
- 公路技术状况检测与评定-公路技术状况评定
- 正式员工正规劳动合同范本
- 人工搬运风险与控制培训课件
- 新能源材料与器件PPT完整全套教学课件
- 肺癌中医护理常规(整理)
- 住宅专项维修资金管理系统方案
评论
0/150
提交评论