(信号与信息处理专业论文)麦克风阵列语音增强的若干方法研究.pdf_第1页
(信号与信息处理专业论文)麦克风阵列语音增强的若干方法研究.pdf_第2页
(信号与信息处理专业论文)麦克风阵列语音增强的若干方法研究.pdf_第3页
(信号与信息处理专业论文)麦克风阵列语音增强的若干方法研究.pdf_第4页
(信号与信息处理专业论文)麦克风阵列语音增强的若干方法研究.pdf_第5页
已阅读5页,还剩114页未读 继续免费阅读

(信号与信息处理专业论文)麦克风阵列语音增强的若干方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理j :大学博七学位论文 摘要 在车载系统、电话会议与多媒体会议等语音处理系统中,由于受到混响、背景噪声 及干扰等因素的影响,麦克风拾取的信号通常为带噪的语音信号。这样,不仅影响语音 的可懂度,而且影响语音处理系统的整体性能。因此,需要进行有效的噪声抑制,以增 强语音信号的质量。 通常情况下,单麦克风语音增强方法具有良好的噪声抑制性能,但在复杂的声学环 境下,其噪声抑制性能急剧退化。麦克风阵列具有空间选择特性与高信号增益特性,因 而成为非手持式智能语音处理系统中捕捉说话人语音的重要手段。近年来,基于麦克风 阵列的语音增强方法已经逐渐成为语音增强技术的研究热点。 本文以阵列处理和自适应处理作为信号处理的主要工具,以全带波束形成与子带波 束形成、远场波束形成与近场波束形成、传统波束形成与盲波束形成等几个方面为主线, 对麦克风阵列语音增强方法进行深入研究。此外,本文还从理论上分析了麦克风阵列拓 扑结构对麦克风阵列语音增强系统性能的影响。 本文的主要研究成果包括: ( 1 ) 全带波束形成与单通道语音增强相结合方法研究。考虑到空时滤波和谱减法的 各自优势,提出一种联合波束形成与谱减法的麦克风阵列语音增强方法。该方法采用子 阵代替单个麦克风组成嵌套麦克风阵列,提高了阵列的空间滤波能力;采用谱减法对波 束形成输出端的残留噪声进行抑制,进一步提高了语音信号质量。仿真实验结果表明, 该方法具有良好的噪声抑制性能。 ( 2 ) 基于子带自适应波束形成的麦克风阵列语音增强方法研究。考虑到全带自适应 波束形成具有较慢的收敛速度和较高的计算复杂度,本文提出一种基于过采样余弦调制 滤波器组的子带自适应波束形成语音增强方法。该方法针对其在噪声与混响环境下存在 的语音信号抵消现象,采用归一化泄漏l m s 算法产生噪声参考信号,并用子带平均相 干函数来约束子带自适应波束形成器系数的更新过程;同时,采用改进的后置滤波器抑 制残留噪声。仿真实验结果表明,子带自适应波束形成麦克风阵列语音增强方法改善了 自适应波束形成的收敛速度,且具有较好的噪声抑制效果。 ( 3 ) 基于近场波束形成的麦克风阵列语音增强方法研究。当声源位于阵列近场时, 阵列所有的入射波为球面波而非平面波,此时如果采用远场波束形成方法来增强近场语 音信号,那么麦克风阵列语音增强系统的性能就会下降。为此,本文利用近场球面波的 波前弯曲率,提出了基于近场固定波束形成器和近场优化波束形成器的两种近场波束形 王冬霞:麦克风阵列语音增强的若干方法研究 成麦克风阵列语音增强方法。实验结果表明,近场波束形成语音增强方法改善了近场声 学环境下的语音信号质量。 ( 4 ) 基于盲波束形成的麦克风阵列语音增强方法研究。大多数麦克风阵列语音增强 方法以传统波束形成方法为基础,需要期望语音信号波达方向与阵列几何结构等先验知 识。但在实际复杂的声学环境下,波达方向的准确估计具有一定困难。为此,本文分别 提出了基于高阶累积量和基于盲源分离的两种盲波束形成麦克风阵列语音增强方法。仿 真结果表明,在语音信号波达方向未知的情况下,盲波束形成麦克风阵列语音增强方法 具有较好的噪声抑制能力。 ( 5 ) 阵列拓扑结构对麦克风阵列语音增强系统性能影响的研究。根据阵列信号处理 理论,麦克风空间摆放对麦克风阵列语音增强性能具有一定的影响。与语音增强算法本 身相比,有关麦克风阵列拓扑结构方面的研究相对较少。因此,本文以阵列波束形成性 能、阵列输出信噪比和时延估计性能( 即时延估计c r a m 6 r r a o 界限) 作为衡量麦克风阵 列系统性能的三个方面,从理论上推导了麦克风阵列空间摆放对上述麦克风阵列系统性 能的影响。并针对麦克风阵列语音增强中常见的麦克风阵列拓扑结构,进行仿真实验, 验证了理论分析的结论。 关键词:语音增强;麦克风阵列;波束形成;子带自适应波束形成:近场波束形成:盲 波束彤成;阵列拓扑结构;高阶累积量;c r a m 6 r r a o 界限 n 大连理t 大学博士学位论文 s t u d yo nm e t h o d sf o rs p e e c he n h a n c e m e n tb a s e do nm i c r o p h o n ea r r a y a b s tr a c t i na ni n t e l l i g e n ts p e e c hc o m m u n i c a t i o na p p l i c a t i o ns u c ha st h ec a r ,v i d e o c o n f e r e n c ea n d m u l t i m e d i ac o n f e r e n c e ,t h es p e e c hs i g n a lr e c e i v e db yam i c r o p h o n ei so f t e nc o r r u p t e db yt h e b a c k g r o u n dn o i s e ,r e v e r b e r a t i o na n di n t e r f e r e n c e t h e s em a yc a u s et h ed e g r a d a t i o no fs p e e c h q u a l i t y ,w h i c hw i l lh a v eab a di n f l u e n c eo nt h et h ep e r f o r m a n c eo fs p e e c hp r o c e s s i n gs y s t e m f o rs u c ha na d v e r s ea c o u s t i ce n v i r o n m e n t ,t h e r e f o r ei ti sn e c e s s a r yt od e v e l o pe f f e c t i v en o i s e s u p p r e s sm e t h o d st or e c o v e rt h eo r i g i n a ls p e e c hf r o mt h em i c r o p h o n es i g n a l t h ep e r f o r m a n c eo fs o m ec o n v e n t i o n a ls i n g l e m i c r o p h o n es p e e c he n h a n c e m e n tm e t h o d s s e r i o u s l yd e g r a d e si nt h ee n v i r o n m e n tw h e r er e v e r b e r a t i o na n di n t e r f e r e n c ec o e x i s t w i t h s p a t i a lf i l t e r i n ga n dh i g h e rs i g n a lg a i n ,m i c r o p h o n ea r r a y ( o rm u l t i m i c r o p h o n e s ) b e c o m e sa l l i d e a lw a yo fi m p r o v i n gs p e e c hq u a l i t yi nt h ei n t e l l i g e n tc o m m u n i c a t i o ns y s t e m m i c r o p h o n e a r r a ys p e e c he n h a n c e m e n tm e t h o dh a sr e c e n t l yb e e nar e s e a r c hf o c u si ns p e e c hp r o c e s s i n g n i sp a p e rd e a l sw i t hs o m es p e e c he n h a n c e m e n tm e t h o d s t h ep u r p o s eo fw h i c hi st o d e v e l o pf r a m e w o r ko fm i c r o p h o n ea r r a ys p e e c he n h a n c e m e n tt e c h n o l o g yi nt h ed i f f e r e n t a c o u t s t i ce n v i r o n m e n t s a l lt h ea p p r o a c h e sa r es t u d i e da l o n gt h r e el i n e s ,f a r - f i e l dv s n e a r f i e l db e a m f o r m i n g ,f u l l b a n dv s s n b b a n db e a m f o r m i n g ,a n dc o n v e n t i o n a lv s b l i n d b e a m f o r m i n g ,r e s p e c t i v e l y i na d d i t i o n ,ad e t a i l e da n a l y s i so ft h er e l a t i o n s h i pb e t w e e n m i c r o p h o n ea r r a yc o n f i g u r a t i o na n da r r a ys y s t e mp e r f o r m a n c ei sa l s og i v e ni nt h ep a p e r t h em a i nc o n t r i b u t i o n so f t h ep a p e ra r ea sf o l l o w s : ( 1 ) s t u d yo nc o m b i n gf u l l b a n db e a m f o r m i n g 、 ,i ms i n g l ec h a n n e ls p e e c he n h a n c e m e n t m e t h o d w i t ht h ea d v a n t a g e so fs p a t i a lf i l t e r i n g ,am e t h o do fs p e e c he r t h a n c e m e mb a s e do n m i c r o p h o n ea r m yi nf r e q u e n c yd o m a i ni sp r o p o s e dt os u p p r e s st h en o i s ei na ne n c l o s u r e a m a s k i n gt h r e s h o l db a s e ds p e c t r a ls u b t r a c t i o nm e t h o di sa d d i t i o n a l l yu s e dt os u p p r e s st h e r e s i d u a ln o i s eo fb e a m f o r m e ro u t p u t s o m es i m u l a t i o n sr e s u l t sd e m o n s t r a t et h a tb e s i d e sl o w c o m p u t a t i o nc o m p l e x i t y ,n o i s er e d u c t i o np e r f o r m a n c eo ft h ep r o p o s e dm e t h o di sb e t t e rt h a n t h a to fo t h e rm e t h o d s ( 2 ) s t u d y o ns u b b a n d a d a p t i v eb e a m f o r m i n g b a s e d m i c r o p h o n ea r r a ys p e e c h e n h a n c e m e n tm e t h o d c o n s i d e r i n gs l o wc o n v e r g e n c es p e e da n dc o m p u t a t i o nc o m p l e xo f f u l l b a n da d a p t i v eb e a n a f o r m i n g ,as u b b a n di d e aw i t ht h eo v e r s a m p l e dc o s i n e m o d u l a t e d f i l t e rb a n k si sa p p l i e di n t ot h ef u l l - b a n db e a m f o r m i n g as u b b a n da d a p t i v eb e a m f o r m i n g b a s e dm i c r o p h o n ea r r a ys p e e c he n h a n c e m e n tm e t h o di st h u sp r e s e n t e di nt h ep a p e r t h e n o r m a l i z e dl e a k yl m sa l g o r i t h mi su s e di nb l o c k i n gf i l t e ra n das u b b a n dm e a nc o h e r e n c e 千冬霞:麦克风阵列语音增强的若干方法研究 f u n c t i o ni si n t r o d u c e dt oc o n t r o lt h es u b b a n da d a p t i v ep r o c e s s i n g ,a l lo fw h i c hc a nr e d u c et h e s p e e c hs i g n a lc a n c e l l a t i o nb r o u g h tb yr e v e r b e r a t i o n am o d i f i e dp o s t f i l t e r i sa d o p t e dt o s u p p r e s sr e s i d u a ln o i s e s i m u l a t i o n sr e s u l t ss h o wt h a t t h ep r o p o s e dm e t h o da c h i e v e sf a s t c o n v e r g e n c es p e e da n dag o o dn o i s es u p p r e s s i o np e r f o r m a n c e ( 3 ) s t u d yo nn e a r f i e l db e a m f o r m i n gb a s e dm i c r o p h o n ea r r a ys p e e c he n h a n c e m e n t m e t h o d w i t h 廿l ea d v a n t a g eo fs p h e r i c a ln a t u r eo fs o u n dw a v e f r o n t am i c r o p h o n ea r r a y s p e e c he n h a n c e m e n tm e t h o db a s e do nn e a r - f i e l db e a m f o r m i n gi sp r e s e n t e di nt h ep a p e r d i s t a n c ed i s c r i m i n a t i o nu s e dh e r er e d u c e st h eb a de f f e c to fb o t hr e v e r b e r a t i o na n dn o i s eo n t h es p e e c hs i g n a l s i m u l a t i o n sr e s u l t sd e m o n s t r a t et h a tt h ep r o p o s e dm e t h o de x h i b i t sab e t t e r n o i s er e d u c t i o np e r f o r m a n c et h a no t h e rm e t h o d s ( 4 ) s t u d yo nb l i n db e a m f o r m i n gb a s e dm i c r o p h o n ea r r a ys p e e c he n h a n c e m e n tm e t h o d c o n s i d e r i n gt h ee f f e c to fs t e e r i n gv e c t o re r r o r so np e r f o r m a n c eo fs p e e c he n h a n c e m e n tb a s e d o nc o n v e n t i o n a lb e a m f o r m i n g ,ab l i n db e a m f o r m i n gb a s e dm i c r o p h o n ea r r a ys p e e c h e n h a n c e m e n tm e t h o di sp r o p o s e di nt h ep a p e r i td o e sn o tn e e da n yp r i o rk n o w l e d g eo f d i r e c t i o no fa r r i v a l ( d o a ) a n da r r a ym a n i f o l d s i m u l a t i o n sr e s u l t ss h o wt h a tt h ep r o p o s e d b l i n db e a m f o r m i n gm e t h o de x h i b i t sg o o dn o i s es u p p r e s s i o np e r f o r m a n c ee v e nw i t ht h e u n k n o w np r i o rk n o w l e d g es u c ha sd o a ( 5 ) s t u d yo nt h er e l a t i o n s h i pb e t w e e nm i c r o p h o n ea r r a ys p a t i a lp l a c e m e n ta n dt h e p e r f o r m a n c eo fa r r a ys p e e c he n h a n c e m e n t c r i t e r i o n si n c l u d i n ga r r a yb e a m p a t t e mr e s p o n s e , a r r a yg a i na n dc r a m 6 r r a ob o u n do ft i m ed e l a ye s t i m a t i o n a r ed e r i v e dt oe v a l u a t et h e p e r f o r m a n c eo f m i c r o p h o n ea r r a ys y s t e mf o rag i v e na r r a yc o n f i g u r a t i o n e x p e r i m e n t a lr e s u l t s s h o wt h a ts p a t i a lp l a c e m e n to fm i c r o p h o n e sa f f e c t st h ep e r f o r m a n c eo fs p e e c he n h a n c e m e n t s y s t e m ,a n do p t i m a lm i c r o p h o n e sp l a c e m e n ti s a b l et o s i g n i f i c a n t l yi m p r o v et h es p e e c h q u a l i t y k e yw o r d s :s p e e c he n h a n c e m e n t ;m i c r o p h o n ea r r a y ;b e a m f o r m i n g ;s u b b a n d a d a p t i v eb e a m f o r m i n g ;n e a r f i e l db e a m f o r m i n g ;b l i n d b e a m f o r m i n g ;a r r a y c o n f i g u r a t i o n ;h i g h e ro r d e rc u m u l a n t ;c r a m r - r a nb o u n d 独创性说明 作者郑重声明:本博士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 作者签名: 大连理工人学博士研究生学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名: 导师签名 够钇 大连理1 :大学博十学位论文 第一章绪论 语音增强是语音处理系统、消费电子产品、多媒体系统等领域的核心技术之一。在 车载系统、视频会议系统,非手持式移动电话、音控系统和助听器等系统中,麦克风阵 列具有提供一种自然通信方式的潜质。这使得使用者无论置身于任何复杂声学环境中, 都能获得高质量语音信号,而且可以自由走动而无需佩戴耳机和麦克风。此外,还可以 使有听力障碍的使用者可能同那些无听力障碍的人一样,与其它人进行正常交流。所有 这些让我们有理由相信,麦克风阵列语音增强具有良好的应用前景。 1 1 语音增强 在实际复杂的声学环境下,麦克风在拾取语音信号的同时,不可避免地存在传输媒 介引入的噪声、通信设备内部的电噪声、房间混响乃至其他说话人的话音干扰。这些因 素使得接收者接收到的语音为带噪语音,降低了语音信号的可懂度,导致语音处理系统 性能的退化。因此,需要进行有效的噪声抑制,以减小声学环境下干扰因素对语音信号 的影响,提高整个语音处理系统性能。 语音增强是指从带噪声信号中提取出语音信息,它是语音信号处理的一个重要分 支,在提高语音质量方面发挥着重要作用【l 】。自1 9 7 0 年代以来,人们对语音增强技术进 行了深入研究,提出了谱减法、卡尔曼滤波、自适应滤波方法和子空间方法等经典的语 音增强方法。这些方法具有较好的噪声抑制效果,并以其方法简单、易于实现的特点广 泛应用于现有语音通信系统与消费电子系统中,但这要求声源与麦克风之间的位置相对 固定。如果声源位置改变或语音谱和噪声谱发生重叠,那么将导致语音增强性能下降。 麦克风阵列融合了语音信号的空时信息,具有灵活的波束控制、较高的空间分辨率、 高的信号增益与较强的抗干扰能力等特点,这就使麦克风阵列成为智能通信系统中捕捉 说话人语音、改善语音质量的重要手段【2 】。近年来,麦克风阵列语音增强方法逐渐成为 语音增强的研究热点。 1 1 1 单麦克风语音增强 由于噪声特性多种多样,语音增强方法也不尽相同。按照处理方式的不同,可将目 前较为常用的单麦克风语音增强方法大致分为参数方法、非参数方法和其它方法。 参数方法对语音的模型参数依赖性强,在低信噪比条件下不容易得到正确的模型参数。比 较典型的参数语音增强方法有:梳状滤波器法、维纳滤波器法、卡尔曼滤波器法等。 于冬霞:麦克风阵列语音增强的若干方法研究 非参数语音增强算法不需要从带噪语音信号中估计模型参数,因此应用范围较广。 这类方法主要包括噪声对消法、谱相减法等。其它方法如小波变换语音增强方法、人工神经 网络方法等。但由于没有利用语音信号的统计信息,其结果通常不是最优。 单麦克风语音增强方法要求声源与麦克风距离很近且位置相对固定。如果声源位置 改变或麦克风距离声源较远,就必须人为移动麦克风,否则会引入大量的噪声、一定程 度的混响及干扰,从而导致拾取信号的质量下降。针对这些局限性,人们提出用麦克风 阵列取代单麦克风进行语音增强。 1 2 麦克风阵列语音增强的研究进展 国际上,将麦克风阵列技术用于语音信号处理的研究相对较晚。麦克风阵列语音增 强方法的研究始于1 9 8 0 年代,并在1 9 9 0 年代后期逐渐成为研究热点。每年在诸如i e e e t r a n s a c t i o n so ns p e e c ha n da u d i op r o c e s s i n g 、i e e et r a n s a c t i o n so ns i g n a lp r o c e s s i n g 及 s p e e c hc o m m u m c a a o n 等权威期刊及i c a s s p 国际会议上都有大量相关文章发表。近年, 国内一些高校和科研单位也相继开展了麦克风阵列语音增强的研究工作。 1 2 1 固定波束形成方法 纵观麦克风阵列语音增强的研究历史可以看到,最早的麦克风阵列语音增强方法是 1 9 8 5 年美国学者f l a n a g a n 提出的延时一求和波束形成方法 3 1 。该方法通过对麦克风阵列 接收信号进行时延补偿,使得各麦克风中的语音信号同步,然后加权、求和,最后系统 输出。从理论上讲,延时一求和波束形成方法在保持语音信号幅度不变的同时,衰减了 干扰噪声信号。 该类麦克风阵列语音增强方法实现简单且有韧性,但需要较多麦克风才能得到较好 的噪声抑制能力【4 】,因此,实际中很少单独使用。 1 2 2 自适应波束形成方法 自适应波束形成是现在广泛使用的一类麦克风阵列语音增强方法。 最早的自适应波束形成方法是1 9 7 2 年斯坦福大学f r o s t 提出的线性约束最小方差 ( l c m v ) 波束形成【5 1 。该波束形成器也称为f r o s t 波束形成器,它在满足探视方i 句( l o o k d i r e c t i o n ) 目标信号频率响应的同时,通过约束阵列输出功率最小,达到抑制噪声的目的。 1 9 8 2 年,g r i f r h s 和j i m 在f r o s t 波束形成器的基础上引进阻塞矩阵,提出一种无约束 的时域自适应波束形成,即广义旁瓣抵消器( g s c ) 方法【6 】。实际上,g s c 是将w i d r o w 自 适应噪声抵消原理应用到阵列处理中。由于使用较少数目的传声器可以获得较强的干扰 噪声抑制性能,因此o s c 是大多数自适应波束形成语音增强方法的理论原型。从1 9 9 0 大连理工大学博七学位论文 年开始,c o m p e m o l l e 、n o r d h o l m 和g r e n i e r 等将g s c 应用到语音增强中,相继提出了 基于自适应波束形成的麦克风阵列语音增强方法【8 “”。但是,由麦克风位置与其增益、 目标信号方向估计误差或室内混响所带来的目标信号方向误差,使得g s c 不可避免地 存在目标信号抵消现象,从而严重地影响了麦克风阵列语音增强方法的性能。于是,许 多学者开展了减小g s c 自适应波束形成中目标信号抵消的研究工作,并提出了一些相 应的解决方法【1 2 - 1 6 1 。由于这些波束形成方法对方向误差具有韧性,因此称为韧性自适应 波束形成。其中比较典型的方法有:1 9 9 6 年h o s h u y a m a 提出了基于约束自适应阻塞滤 波的韧性自适应波束方法【1 7 , 1 8 。该方法采用系数约束的自适应阻塞滤波器,来取代g s c 中的阻塞矩阵,使得泄漏到g s c 噪声参考通道中的语音信号最少,同时采用系数约束 的归一化自适应噪声抵消器完成噪声抑制。2 0 0 1 年g a r m o t 等采用估计语音信号声学通 道传递函数比率( 面非传递函数本身) ,构建时变阻塞矩阵来取代g s c 中的阻塞矩阵,进 而提出了另一种韧性g s c 方法”。 总之,基于自适应波束形成的麦克风阵列语音增强方法同理论原型g s c 一样,对 声学环境中的相干噪声具有较强的抑制能力。 1 2 3 后置滤波方法 后置滤波是另一类常见的麦克风阵列语音增强方法,它可以用来去除声学环境中的 非相干噪声。 1 9 7 7 年a l i e n 提出将后置滤波用于语音增强圆l ,但该方法仅使用两个麦克风而非严 格意义上的麦克风阵列。1 9 8 8 年z e l i n s k i 将其扩展到麦克风阵列中,即对延时一求和波 束形成的输出端进行后嚣滤波,从而提出真正意义上基于后置滤波的麦克风阵列语音增 强方法【2 0 2 1 。由于完成滤波功能的后置滤波器是时变滤波器,所以该方法可以有效地去 除房间中的非平稳背景噪声。考虑到z e t i n s k i 滤波器在推导中存在着对噪声的过估计, 1 9 9 2 年s i m m e r 等通过改变滤波器输入信号自功率谱估计,改进了后置滤波器的转移函 数1 2 3 ,2 4 。z e l i n s k i 后置滤波和s i m m e r 后置滤波两者本质一样,都不能消除环境中的相干 噪声。2 0 0 2 年,m c c o w a n 等将噪声场理论模型扩展到后置滤波器转移函数中,得到广 义后置滤波语音增强方法 2 5 2 6 1 。该方法在理论上适用不同噪声场,可以去除环境中的非 相干及相干噪声。同年,c o h e n 引进瞬时波束比率因子,对语音谱和参考噪声谱两者进 行功率谱估计,将后置滤波器的意义扩展为对自适应波束形成器后处理,提出一种多通 道后置滤波麦克风阵列语音增强方法l 明,以去除声学环境中可能出现的突发、瞬间高强 度噪声。 王冬霞:麦克风阵列语音增强的若干方法研究 尽管有些方法理论上可以抑制声学环境中的相干噪声,但与自适应波束形成麦克风 阵列语音增强方法相比,后置滤波方法在对非相干噪声抑制方面,具有明显的优势。 鉴于实际声学环境下噪声类型和噪声场的复杂性,许多学者将性能互补的方法相结 合,以改善其中任何一种语音增强方法的噪声抑制能力。1 9 9 6 年,f i s c h e r 和s i m m e r 提 出了g s c 与w i e n e r 滤波相结合的频域麦克风阵列语音增强方法,以抑制声学环境中的 相干和非相干噪声1 2 ”。2 0 0 3 年,g a n n o t 和c o h e n 提出了基于传递函数g s c 和后置滤波 的频域麦克风阵列语音增强方法,以去除噪声场中可能存在的相干噪声、非相干噪声及 非平稳噪声【2 巩3 0 j 。1 9 9 7 年,m e y e r 和s i m m e r 提出一种将w i e n e r 滤波和谱减法相结合的 麦克风阵列语音增强方法,以抑制波束形成输出端的高频与低频噪声【3 ”。1 9 9 8 年, m a h n o u d i 和d r y g a j l o 提出一种基于小波域后置滤波的麦克风阵列语音增强方法1 3 2 】,以 提高无语音段噪声的抑制性能。2 0 0 3 年,j a c y o u n 等将谱减法应用到麦克风阵列各通道 中,并进行波束形成p ”,该方法在减弱音乐噪声的同时,提高了固定波束形成的噪声抑 制能力。 1 2 4 子空间方法 子空间方法也是一类麦克风阵列语音增强方法。 1 9 9 7 年,h a n s e n 提出分别对每个麦克风信号使用单通道子空间方法,然后进行延 时一求和波束形成刚l 。严格意义上讲,该方法仅利用单通道子空间信息,不是基于阵列 子空间的语音增强方法。1 9 9 7 年,日本学者a s a n o 等提出基于阵列接收信号相关矩阵子 空间的麦克风阵列语音增强方法【3 5 栅。该方法利用相关矩阵子空间构建信号子空间,然 后采用最大似然或最小方差波束形成来进行噪声抑制。1 9 9 9 年至2 0 0 5 年间,d o c l o 等 相继提出并完善了基于广义奇异值分解的麦克风阵列语音增强方法1 3 8 - 4 0 。 基于子空间的麦克风阵列语音增强方法计算量较大,因此,该类麦克风阵列语音增 强方法实时处理具有一定困难,没有像其它类方法那样得到学者的广泛关注。 1 2 5 子带波束形成方法 子带波束形成是最近才出现的一类麦克风阵列语音增强方法。 早在1 9 9 3 年,k h a l a b 提出了子带波束形成宽带卫星通信方法1 4 ”。与全带波束形成 相比,子带波束形成具有噪声抑制能力强、收敛速度快等优点 4 2 - 4 5 】。之后,学者们开始 研究基于子带波束形成的麦克风阵列语音增强方法 4 6 - 4 8 2 0 0 1 年,m c c o w a n 等对z e l i n s k i 后置滤波进行子带处理,提出了一种基于均匀d f t 子带波束形成语音增强方法【4 9 1 。2 0 0 2 年至2 0 0 3 年,澳大利亚学者g r b i c 等相继开展了基于过采样d f t 子带波束形成麦克风 阵列语音增强方法的研究 5 0 - s 2 1 。 一4 一 大连理工大学博士学位论文 1 2 6 近场波束形成方法 近场波束形成是另一类新出现的麦克风阵列语音增强方法。 1 9 9 7 年,b e l l 实验室w a r d 和e l k o 将球面波动方程扩展,提出一种混合近场与远场 波束形成的设计方法1 5 副;r y a n 和g o u b r a n 提出基于阵列增益优化准则的近场固定波束 形成方法畔 6 】;k e n n e d y 等根据波动方程解的唯一性,提出一种基于波束图转换的近场 波束形成方法i - m 堋。上述近场波束形成方法均建立在固定权值或噪声统计模型的基础 上。1 9 9 9 年,a b h a y a p a l a 和k e n n e d y 等提出了一种自适应近场宽带波束形成方法 6 0 l , 该方法基于f r o s t 波束形成器,其自适应的对象是声学模型系数而不是滤波器系数。2 0 0 4 年,z h e n g 等将特征值约束的远场l c m v 波束形成方法扩展到近场环境,提出了一种基 于距离差的韧性近场波束形成方法,用于小房间内的干扰噪声抑制 6 1 - 6 3 1 。 由于近场声学的复杂性,目前有关近场波束形成麦克风阵列语音增强方法的研究相 对较少。 1 2 7 去混晌方法 房间混响严重地影响了语音处理系统的性能,因此,去混响也是麦克风阵列语音增 强的一个方面。 1 9 9 1 年,w a n g 和i t a k u r a 提出一种基于逆滤波的麦克风阵列去混响方法 6 4 1 。1 9 9 4 年,p e t r o p u l u 和s u b r a m a n i a m 提出了基于倒谱域解卷积的去混响方法1 6 5 , 删。该方法在倒 谱域重构房间冲激响应,进而重构语音信号。1 9 9 5 年,l i u 等提出了另一种基于倒谱域 的麦克风阵列语音去混响方法 6 7 - 6 9 i 。该方法通过对麦克风阵列信号中的最小相位成分和 全通成分分开处理,来完成语音信号去混响。2 0 0 1 年以来,一些学者提出基于盲解卷理 论的语音信号去混响方法- f 7 0 - 7 2 j 以及基于语音模型参数的多通道去混响方法r 7 3 ,7 4 】。 除了上述方法外,文献【7 5 ,7 6 】提出了基于盲分离的麦克风阵列语音增强算法,文献 7 7 】提出了基于神经网络的麦克风阵列语音增强算法,文献 7 8 】将基于语音模型的线性预 测方法用到麦克风阵列语音增强中。 所有这些工作对麦克风阵列语音增强技术的发展起到了极大的推动作用。 1 3 本文主要研究内容 多样性噪声源与环境混响所造成噪声场的复杂性,使得麦克风接收的语音信号质量 较差。在复杂的声学环境下,选择合适算法与麦克风阵列拓扑结构进行语音增强,具有 非常重要的研究意义。目前,麦克风阵列语音增强方法以远场、自适应波束形成方法研 究居多,而针对宽带信号方面与近场环境方面麦克风阵列语音增强的算法研究与阵列拓 扑结构对语音增强性能影响方面的研究却相对较少。 王冬霞:麦克风阵列语音增强的若干方法研究 为此,本文从子带、近场与盲波束形成等三方面入手,对波束形成语音增强方法进 行了深入研究,分别提出了基于子带自适应波束形成、基于近场波束形成和基于盲波束 形成的麦克风阵列语音增强方法。此外,从阵列波束形成性能、阵列时延估计性能和阵 列输出信噪比三方面,对麦克风阵列拓扑结构对麦克风阵列语音增强性能的影响做了理 论研究。论文以中小会议室为声学环境,对所有相关算法进行了模拟实际声学环境的仿 真实验分析。 全文主要研究内容如下: 第一章绪论。阐述麦克风阵列语音增强的研究背景;介绍麦克风阵列语音增强方 法的研究进展;最后引出本文的研究对象、研究目的和主要内容安排。 第二章麦克风阵列语音增强的基础理论和基本方法。探讨了麦克风阵列语音增强 的基础理论和基本方法,给出麦克风阵列语音增强方法的性能评价指标。为本论文的研 究工作搭建了一个平台。 第三章联合波束形成和谱减法的麦克风阵列语音增强方法。考虑到在散射噪声场 中,传统波束形成方法及单通道谱减法对噪声抑制的局限性和阵列空时滤波的优势,本 章提出一种将波束形成与谱减法相结合的频域麦克风阵列语音增强方法。该方法选择嵌 套线阵的麦克风阵列拓扑结构,首先通过波束形成器的空间滤波达到衰减噪声的目的。 然后采用谱减法对波束形成器输出端的残留噪声进行后置处理。 第四章基于子带自适应波束形成的麦克风阵列语音增强方法。大多数麦克风阵列 语音增强方法基于全带自适应波束形成。但是,随着输入语音数据相关矩阵条件数的增 加,自适应学习过程收敛较慢。于是,本章将过采样余弦调制的子带处理思想引进到自 适应波束形成中,提出了基于子带自适应波束形成的麦克风阵列语音增强方法。 第五章基于近场波束形成的麦克风阵列语音增强方法。当麦克风阵列用于封闭环 境中非手持式语音拾取时,必须面对的一个问题是声场为阵列近场的问题。为此,本章 提出了基于近场波束形成的麦克风阵列语音增强方法。该方法充分利用了近场球面波的 波前弯曲率,有效地衰减了混响和噪声对语音信号的影响。 第六章基于盲波束形成的麦克风阵列语音增强方法。考虑到声学环境下干扰( 噪声) 或( 和) 混响对期望语音信号的影响,本章提出基于盲波束形成的麦克风阵列语音增强方 法。该方法不需要传统波束形成所要求的语音信号来波方向与阵列拓扑结构等先验知 识。 第七章麦克风阵列拓扑结构对麦克风阵列语音增强系统性能的影响。考虑到大多 数的麦克风阵列语音增强方法基于时延估计技术,本章从理论上推导了麦克风阵列拓扑 - 6 - 大连理工大学博士学位论文 结构对麦克风阵列系统时延估计性能、波束形成性能和阵列输出信噪比的影响,并分析 了其物理意义,得出了重要结论。 第八章总结与展望。概要总结本文的主要研究内容及取得的成果,并对需进一步 研究的问题进行讨论。 本论文研究来源于国家自然科学基金项目“基于麦克风阵列的语音增强和定位方法 研究( 6 0 3 7 2 0 8 2 ) ”与教育部跨世纪优秀人才基金项目“基于麦克风阵列语音增强方法研 究”。 王冬霞:麦克风阵列语音增强的若干方法研究 第二章麦克风阵列语音增强的基础理论与基本方法 本章将分别阐述麦克风阵列语音增强的基础理论和基本方法。 2 1 麦克风阵列语音增强的基础理论 2 1 1 麦克风阵列与波束形成 麦克风分为全方向麦克风和方向性麦克风。本文的研究对象为全方向麦克风。所谓 麦克风阵列是指由一组在空间不同位置的麦克风按一定规则布置形成的阵列,也可以将 其解释为:对空间传播声音信号进行空间采样的一个装置。错误f 未找到引用源。l 为 一例麦克风阵列示意图。从图中可以看到,各麦克风接收信号中既包含声源的直达信号, 也有由声源经刚性面( 如墙面等) 的反射信号,还有背景噪声信号。 麦克风阵列 图2 1 麦克风阵列 f i g 2 im i c r o p h o n ea r r a y 麦克风阵列较之单麦克风具有许多优点,具体表现在以下几个方面: ( 1 ) 麦克风阵列具有空间选择特性。它能以电子瞄准的方式,在提供高质量的声源 定位信号、削弱干扰噪声和环境噪声的同时,控制会议室里的单一摄像机或一组摄像机, 实现音视频同步,而无须人为操作,摒弃传统的人为操作摄像机及其笨拙的相关声音设 备。 ( 2 1 高方向性的单麦克风通常只能拾取一路信号,且一般不能随声源一起运动,因 此使用范围受到了限制;即使带在衣服上或手持的麦克风可以随着说话人一起运动,由 于需要大量的布线,较长的启动时间,也会导致其接收信号的质量下降。 大连理r = 大学博十学位论文 ( 3 ) 麦克风阵列不要求

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论