




已阅读5页,还剩97页未读, 继续免费阅读
(信号与信息处理专业论文)复杂环境下麦克风阵列语音增强方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人连理工大学博士学位论文 摘要 语音增强是信号处理领域中主要的研究内容之一,在现代通信、多媒体技术、人机 交互及智能系统等领域中具有广泛的应用价值。语音增强的主要目的是从带噪声的语音 信号中提取出语音信息,以获得高质量语音信号。但多样性噪声源与环境混响的存在, 使得麦克风接收的语音信号质量较差,这不仅影响语音的可懂度,而且影响语音处理系 统的整体性能。因此,需要进行有效的噪声抑制,以增强语音信号的质量。 通常情况下,单麦克风语音增强方法具有良好的噪声抑制性能,但在复杂的声学环 境下,其噪声抑制性能急剧退化。麦克风阵列融合了语音信号的空间和时间信息,具有 较高的空间分辨率与较强的抗干扰能力等特点,使得麦克风阵列成为视频会议等智能通 信系统中捕捉说话人语音、改善语音质量的重要手段。近年来,基于麦克风阵列的语音 增强方法已经成为语音增强技术的研究热点。 本文以阵列处理和语音处理作为信号处理的主要工具,以视频会议系统为应用背 景,对麦克风阵列语音增强方法进行了深入研究。 本文的主要创新研究成果如下: ( 1 ) 自适应波束形成与后置滤波波束形成融合的麦克风阵列语音增强方法。通常自 适应波束形成语音增强方法适用于强相干噪声场,后置滤波波束形成方法适用于非相干 噪声场,本文将这两种方法进行结合,给出了一种新的波束形成语音增强方法,该方法 在相干噪声场与非相干噪声场环境下均有较好的消噪性能,因此对噪声场有良好的鲁棒 性。 ( 2 ) 混响环境下时延估计方法的研究。在基于波束形成语音增强方法中,需要对麦 克风接收的信号进行时延补偿。目前已有的时延估计算法大都没有考虑混响的影响,为 此,本文给出了一种基于语音建立信号和广义相关加权的时延估计方法。该方法首先利 用避免混响( e c h o a v o i d a n c e ,e a ) 的混响模型( 简称e a 混响模型) 来提取语音建立信号; 然后用语音建立信号估计信号的功率谱,并进行平滑处理;最后采用广义相关加权方法 估计时延。该方法在混响环境下可以有效地估计时延。实验结果验证了该方法的有效性。 ( 3 ) 倒谱域语音去混响方法的研究。本文给出了一种基于倒谱技术的麦克风阵列语 音增强方法。该方法利用人耳对语音信号相位的不敏感特性,采用一种近似手段从含噪 的语音信号中提取相位信息,以减少其运算量。仿真结果表明了该方法的有效性。 ( 4 ) 麦克风阵列语音增强子空间方法的研究。本文在麦克风阵列广义奇异值分解 ( g s v d ) 语音增强方法基础上,从降低计算量的角度,提出了一种基于g s v d 的麦克风 阵列语音增强改进方法。该方法是一种次优滤波语音增强方法,它在干扰噪声是白噪声 复杂环境卜麦克风阵列语音增强方法研究 的情况下,无需进行语音端点检测,因此计算复杂度大大降低。此外,本文还将g s v d 麦克风阵列语音增强方法应用于单麦克风语音增强,同样取得了较好的增强效果。仿真 实验结果表明,该方法能有效地抑制白噪声,使信噪比得到明显提高,同时也改善了语 音质量。 ( 5 ) 基于语音生成模型的麦克风阵列语音增强方法研究。本文将单麦克风时变a r 模型语音增强方法应用于麦克风阵列中,同时结合麦克风阵列的空间特性,给出了一种 基于语音生成模型的麦克风阵列语音增强方法。该方法适合并行处理,可用较少的数据 及a r 模型阶数来实现语音增强处理。仿真实验验证了该方法的有效性。 关键词:语音增强;麦克风阵列;波束形成;倒谱;时延估计;子空间;广义奇异值分 解;a r 模型;混响 大连理工人学博十学位论文 a b s t r a c t s p e e c he n h a n c e m e n ti so n eo f t h ek e yt e c h n o l o g i e sf o r t h ef i e l d ss u c ha st h ei n f o r m a t i o n h i g h w a y ,m u l t i m e d i a , o f f i c ea u t o m a t i z a t i o n ,m o d e mc o m m u n i c a t i o n ,i n t e l l i g e n ts y t e n la n ds o o n t h em a i na i mo fs p e e c he n h a n c e m e n ti st op i c ku ps p e e c hi n f o r m a t i o nf r o mt h es p e e c h s i g n a l sw i t hn o i s e i no r d e rt oo b t a i nh i g hq u a l i t ys p e e c h b u td u et ot h ee x i s t e n c eo ft h en o i s e d i v e r s i t ya n de n v i r o n m e n tr e v e r b e r a t i o n ,t h es p e e c hq u a l i t yr e c e i v e db ym i c r o p h o n ei sn o ts o g o o d ,w h i c ha f f e c t st h es p e e c hi n t e l l i g i b i l i t ya n dt h es p e e c hp r o c e s s i n gp e r f o r m a n c e s o e f f e c t i v en o i s es u p p r e s s i o ni sn e c e s s a r yt oi m p r o v et h es p e e c hs i g n a l sq u a l i t y g e n e r a l l y ,s i n g l em i c r o p h o n es p e e c he n h a n c e m e n t h a s g o o d n o i s e s u p p r e s s i o n p e r f o r m a n c e ,b u tu n d e rc o m p l e xa c o u s t i ce n v i r o n m e n t ,i t sn o i s es u p r e s s i o np e r f o r m a n c e d e c l i n e sr a p i d l y m i c r o p h o n ea r r a yt e c h n i q u ec o m b i n e st h es p a c ea n dt i m ei n f o r m a t i o no f s p e e c hs i g n a l s ,a n dh a sf l e x i b l eb e a mc o n t r o l ,h i g h e rs p a c er e s o l u t i o n ,h i g h e rs i g n a lg a i na n d b e t t e ra n t i - i n t e r f e r e n cp e r f o r m a n c e n o wm i c r o p h o n wa r r a yt e c h n i q u eb e c o m e sv e r y i m p o r t a n tm e t h o d sf o rc a p t u r i n gs p e a k e rs p e e c ha n di m p r o v i n gt h es p e e c hq u a l i t yi nt h e i n t e l l i g e n tc o m m u n i c a t i o ns y s t e ms u c h 嬲v i d e oc o n f e r e n c es y s t e m i nr e c e n ty e a r s t h e s p e e c he n h a n c e m e n tm e t h o d sb a s e do nm i c r o p h o n ea r r a yh a v eg r a d u a l l yb e c o m et h er e s e a r c h h o tp o to fs p e e c hp r o c e s s i n g t h i st h e s i sa d o p t sm i c r o p h o n ea r r a yp r o c e s s i n ga n da d a p t i v ep r o c e s s i n ga st h em a i n s i g n a l sp r o c e s s i n gt o o l s ,v i d e oc o n f e r e n c es y s t e ma st h ea p p l i c a t i o nb a c k g r o u n d ,t h i st h e s i s s t u d i e ss o m em i c r o p h o n ea r r a ys p e e c he n h a n c e m e n tm e t h o d s m o r e o v e r , c o n s i d e r i n gt h e d e l a ye s t i m a t i o nf o rm i c r o p h o n ea r r a ys p e e c he n h a n c e m e n t ,t h i st h e s i sa l s od i s c u s s e st h et i m e d e l a ye s t i m a t i o nu n d e r r e v e r b e r a t i o ne n v i r o n m e n t t h em a i nr e s e a r c hr e s u l t so ft h i st h e s i sa r e 勰f o l l o w s : ( 1 ) r e s e a r c ho na d a p t i v eb e a m f o r m i n ga n dp o s t f i l t e r i n gb e a m f o r m i n gc o m b i n e d m i c r o p h o n ea r r a ys p e e c he n h a n c e m e n tm e t h o d s c o n s i d e r i n gt h ea d v a n t a g e so fa d a p t i v e b e a m f o r m i n gm e t h o da n dp o s t f i l t e rb e a m f o r m i n gm e t h o du n d e rd i f f e r e n tn o i s ef i e l d s ,t h i s t h e s i sc o m b i n e st h e s et w om e t h o d st op r o p o s ean e wb e a m f o r m i n gs p e e c he n h a n c e m e n t m e t h o d t h ep r o p o s e dm e t h o dh a sg o o dn o i s ec a n c e l l a t i o np e r f o r m a n c eu n d e rb o t ht h e c o r r e l a t i v en o i s ef i e l da n dn o n c o r r e l a t i v en o i s ef i l e d s oi th a sg o o dr o b u s tp e r f o r m a n c et o t h ed i f f e r e n tn o i s e ( 2 ) r e s e a r c ho nt i m ed e l a ye s t i m a t i o nm e t h o d su n d e rr e v e r b e r a t i o ne n v i r o n m e n t f o rt h e b e a m f o r m i n gs p e e c he n h a n c e m e n tm e t h o d s ,i ti sn o r m a l l yt oc o m p e n s a t et h ed i f f e r e n t c h a n n e ls p e e c hs i g n a l sw i t ht i m ed e l a y h o w e v e r , m o s to ft h et i m ed e l a ye s t i m a t i o n a l g o r i t h m sd o n tt a k ei n t oa c c o u n tt h er e v e r b e r a t i o ni n f l u e n c e s ot h i st h e s i sp r o p o s e st h et i m e d e l a ye s t i m a t i o nm e t h o db a s e do ns p e e c ho n s e ts i g n a l sa n dg e n e r a l i z e dc o r r e l a t i o nw e i g h t i n g 复杂环境卜麦克风阵列语音增强方法研究 t 1 1 i sm e t h o df i r s tu t i l i z e se c h o - a v o i d a n c e ( e a ) r e v e r b e r a t i o nm o d e lt op i c ku ps p e e c ho n s e t s i g n a l s ,t h e ne s t i m a t e st h ep o w e rs p e c t r u mw i t hs p e e c ho n s e ts i g n a l sa n dc a r r i e so u ts m o o t h p r o c e s s i n g ,a n da tl a s ta d o p t sg e n e r a l i z e dc o r r e l a t i o nw e i g h t e dm e t h o dt oe s t i m a t et h et i m e d e l a y sm e t h o dc a ne s t i m a t et h et i m ed e l a ya c c u r a t e l yu n d e rr e v e r b e r a t i o ne n v i r o n m e n t a n dt h ee x p e r i m e n tr e s u l ts h o w st h ev a l i d i t yo ft h i sm e t h o d ( 3 ) r e s e a r c ho nt h e c e p s t r u m b a s e dd e r e v e r b e r a t i o nm e t h o d s t h e s p e e c h d e r e v e r b e r a t i o ni sa l s oa ni m p o r t a n tp a r to fs p e e c he n h a n c e m e n t t h i st h e s i sp r o p o s e sa m i c r o p h o n ea r r a ys p e e c he n h a n c e m e n t t l l i sm e t h o da d o p t sa na p p r o x i m a t em e t h o dt og a i n t h ep h a s ei n f o r m a t i o nf r o mt h en o i s ys p e e c hs i g n a l sb e c a u s et h eh u m a ne a ri sn o ts e n s i t i v et o t h es p e e c hp h a s e c o m p a r e dw i r ht h et r a d i t i o n a lc e p s t r u ms p e e c he n h a n c e m e n tm e t h o d s ,t h i s m e t h o dh a sl e s sc o m p u t a t i o n a lc o m p l e xa n dc a nb eu s e di nt h er e a lv i d e oc o n f e r e n c es y s t e m w h i c hn e e dt oc o n s i d e rr e v e r b e r a t i o n s i m u l a t i o ns h o w st h e v a l i d i t yo ft h i sm e t h o d ( 4 ) r e s e a r c ho ns u b s p a c em e t h o d sf o rm i c r o p h o n ea r r a ys p e e c he n h a n c e m e n t i no r d e rt o d e c r e a s et h ec o m p u t a t i o n a ll o a d ,t h i st h e s i sp r o p o s e st h eg s v db a s e dm i c r o p h o n ea r r a y s p e e c he n h a n c e m e n tm e t h o d t h i sm e t h o di sas u b o p t i m a lf i l t e r i n gs p e e c he n h a n c e m e n t a n d i ti sn o tn e c e s s a r yt oc a r r ys p e e c he n d p o i n td e t e c t i o ni ft h en o i s ei sw h i t en o i s e m o r e o v e r t h i st h e s i s a p p l i e sm i c r o p h o n ea r r a ys p e e c he n h a n c e m e n tm e t h o dt os i n g l em i c r o p h o n e s p e e c he n h a n c e m e n t ,a n do b t a i n sg o o de n h a n c e m e n tr e s u l t s s i m u l a t i o ns h o w st h a tt h e m e t h o dc a ns u p r e s st h en o i s ee f f e c t i v e l y , a n di m p r o v et h es i g n a lt on o i s e r a t i o ( 5 ) r e s e a r c ho nm i c r o p h o n ea r r a ys p e e c he n h a n c e m e n tm e t h o db a s e do nt h es p e e e c h p r o d u c t i o nm o d e l s t l l i st h e s i sa p p l i e ss i n g l em i c r o p h o n et i m e v a r y i n ga rm o d e ls p e e c h e n h a n c e m e n tm e t h o d st om i c r o p h o n ea r r a ya n dc o m b i n e st h es p a c ec h a r a c t e r i s t i c so f m i c r o p h o n ea r r a y , t h e np r o p o s e st h em i c r o p h o n ea r r a ys p e e c he n h a n c e m e n tm e t h o d sb a s e d o ns p e e c hp r o d u c t i o nm o d e l s t l l i sm e t h o dc a nb ep a r a l e l l i na d d i t i o n t h i sm e t h o du s e sl e s s d a t ap o i n t sa n da rm o d e lo r d e r s ,a n dc a nr e a l i z er e a lt i m es p e e c he n h a n c e m e n t s i m u l a t i o n e x p e r i m e n t ss h o wt h ev a l i d yo ft h em e t h o d k e yw o r d s :s p e e c he n h a n c e m e n t ;m i c r o p h o n ea r r a y ;b e a m f o r m i n g ;c e p s t r u m ;t i m e d e l a ye s t i m a t i o n ;g e n e r a l i z e ds i n g u l a rv a l u ed e c o m p o s i t i o n ;a rm o d e l ;r e v e r b e r a t i o n 独创性说明 作者郑重声明:本博士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包合为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 作者签名: 弦。9 弓 厂 人连理工人学博士学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位 论文版权使用规定,同意大连理工大学保留并向国家有关部门或机构送 交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连理 工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也 可采用影印、缩印或扫描等复制手段保存和汇编学位论文。 作者签名:量丝歪望抱 导师签名: 大连理工大学博士学位论文 1 绪论 语音增强【1 】是指当语音信号被各种各样的噪声( 包括语音) 干扰甚至淹没后,从含噪 声的语音信号中提取出纯净语音,以抑制噪声干扰的影响。近年来,在语音信号处理领 域中,麦克风阵列语音增强算法的理论与应用研究越来越受到重视。本章首先阐述了麦 克风阵列语音增强的研究背景和研究意义;然后综述了麦克风阵列语音增强的发展和研 究现状;最后给出了本文的主要研究内容。 1 1 研究背景和意义 语音是语言的声学表现,是人类最古老、最重要、最常用和最方便的交换信息形式 【2 1 。同时,语音也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式, 因而可为计算机、自动化系统等建立良好的人机交互环境,以迸一步推动计算机和其他 智能机器的应用,提高社会的信息化和自动化程度。语音信号处理已经成为信息高速公 路、多媒体技术、办公自动化、现代通信及智能系统等众多领域应用的重要技术之一。 人们在获取语音的同时,不可避免地会受到来自周围环境噪声、传输媒介噪声、通 信设备内部电噪声、房间混响以及其它说话人的话音干扰,噪声、混响和干扰的存在会 使语音通信的质量下降,也会使许多语音处理系统的性能急剧恶化。例如,安装在汽车、 火车、轮船和飞机上的电话,街道、火车站、机场等场所的公共电话,在嘈杂环境中使 用的手提电话等,常受到背景噪声和其它说话人话音的干扰,严重影响通话质量。在电 话会议系统、视频会议系统等应用中,室内混响严重影响语音的收听效果。语音识别系 统在强噪声环境下识别率会迅速降低,甚至无法实际应用。为进行噪声抑制,提高语音 质量,通常采用语音增强技术。 语音增强【3 】是语音信号处理的一个重要分支,在提高语音质量方面发挥着重要作用。 自1 9 7 0 年代以来,人们对语音增强技术进行了深入研究,相继提出了谱减、法【引、自适应 滤波法【5 1 和子空间法 6 】等经典的单麦克风语音增强方法。这些方法具有较好的噪声抑制 效果,并以其方法简单、易于实现的特点广泛应用于现有语音通信系统与消费电子系统 中,但这要求声源与麦克风之间的位置相对固定。如果声源位置改变,就必须人为地移 动麦克风o f 若麦克风距离声源很远或在麦克风的选择方向之外,则会引入大量的噪声, 导致拾取语音信号的质量下降。为了解决单麦克风的这些局限性,人们提出了用麦克风 阵列进行语音处理的方法。 与单麦克风不同,麦克风阵列采集到的信息要多于单麦克风,因此在消除噪声、提 高语音质量方面要优于单麦克风系统。同时麦克风阵列具有空间选择特性,可以用“电 复杂环境下麦克风阵列语音增强方法研究 子瞄准”的方式从所需的声源位置提供高品质的语音信号,同时抑制环境噪声和其他说 话人的声音。麦克风阵列不要求在声源本地放置麦克风,也不限制说话人的运动,并且 不需要移动位置以改变其接收方向,这些特性有利于麦克风阵列获取多个或移动的声源 信息。正是因为麦克风阵列融合了语音信号的空时信息,因此具有灵活的波束控制、较 高的空间分辨率、较高的信号增益与较强的抗干扰能力等特点,使得麦克风阵列成为视 频会议等智能通信系统中捕捉说话人语音、改善语音质量的重要手段。近年来,麦克风 阵列语音增强方法已经成为语音增强的研究热点。 基于麦克风阵列的语音增强算法继承了天线阵列的有关算法,同时也吸收了一些单 麦克风语音增强方法,如常用的语音参数模型方法 7 - 9 、维纳滤波方法i l0 l 等,从而提高 了麦克风阵列语音增强系统的消噪效果。麦克风阵列在实际语音处理时能提供良好的接 收语音能力,而且伴随着大规模集成电路及数字信号处理芯片的飞速发展,麦克风阵列 已经广泛应用于车载系统环境 1 1 4 3 】、视频会议( 1 4 】、助听装置l 峥1 6 1 、语音识别的前端系统 1 1 7 - 1 8 ) 、大型场所的会议记录系统和机器人导航口 1 1 等领域。国外已经有了一些初期的 产品进入市场,包括免提车载电话、助听器、视频会议终端等( 如图1 1 所示) ,这些 产品已经广泛地应用到社会生活的各个领域,并表现出了极大的优越性。 鬻 黼霹 图1 1 麦克风阵列产品 f i g 1 1m i c r o p h o n ee e r a y 口d d 岫 近年来,许多国际著名的公司和研究机构,如l o m b ) ,b e l l 实验室肚3 喀,都致力于 麦克风阵列的研究和产品开发,麦克风阵列正成为越来越流行的高质量语音采集的工 具,预计在不久的将来,将取代传统的头戴式或桌面式麦克风。近年来,我国一些高校、 研究所和企业也作了大量的跟踪和相关工作,但大都刚刚起步。目前,语音增强技术正 i o 大连理 大学博士学位论文 处于蓬勃发展时期,不断有新的产品研制开发,市场需求逐渐增加,具有良好的应用前 景。 1 2 麦克风阵列语音增强技术的发展和研究现状 早在1 9 6 0 年代,人们就开始了语音增强课题的研究。随着数字信号处理理论的成 熟,1 9 7 0 年代取得了一些基础性成果,并使语音增强发展成为语音信号处理领域的一个 重要分支。同时在1 9 7 0 年代,人们又开始了麦克风阵列语音增强方法的研究。进入1 9 9 0 年代后,麦克风阵列语音增强算法的研究成为一个新的热点,每年在诸如i e e e t r a n s a c t i o n so ns p e e c ha n da u d i op r o c e s s i n g 、i e e et r a n s a c t i o n so ns i g n a lp r o c e s s i n g 及 s p e e c hc o m m u n i c a t i o n 等权威期刊及i c a s s p 国际会议上都有大量相关文章发表。近年 来,国内一些高校和科研单位也相继开展了麦克风阵列语音增强的研究工作。 最早的麦克风阵列语音增强方法是利用麦克风阵列空间特性提出的波束形成语音 增强方法。所谓波束形成方法是将传统阵列信号的波束形成方法应用于语音增强处理中 而得到的语音增强算法。麦克风阵列波束形成语音增强算法以f r o s t 在1 9 7 2 年提出的线 性约束自适应波束形成法( l c m v ) 2 4 】和g r i f f i t h s 与j i m 在19 8 2 年提出的广义旁瓣抵消 ( g s c ) 算法【2 5 】最为经典。线性约束自适应波束形成算法是在某种约束条件下,使输出信 号能量达到最小。这是用优化手段实现语音增强的一种方法。这种算法在相干噪声场情 况下,可以得到较高的信噪比改善,但是随着干扰声源数目的增加和混响的增强,信噪 比会迅速恶化。而且这类方法在弱相干噪声场或在散射噪声场中,性能甚至不如传统波 束形成方法。广义旁瓣抵消算法由于阻塞矩阵的输出常含有语音成分,造成滤波结果的 性能降低。而且该方法对于注视方向上信号的频率响应是固定的或者只允许有一个小的 偏离,因此,对注视方向上的噪声没有消噪能力。此后,一些学者在此基础上提出了各 种改进。如1 9 8 7 年c o x 等人【2 6 】提出归一化自适应抵消器以解决g s c 中的超方向性问题。 1 9 9 9 年h o s h u y a m a 等人【2 7 】提出一种类似于g s c 的结构,使用带泄漏的最小均方( l e a s t m e a ns q u a r e ,l m s ) 算法来减小期望信号能量的泄漏。2 0 0 1 年g a n n o t 等【2 8 】采用估计语音 信号声学通道传递函数比率( 而非传递函数本身) ,构建时变阻塞矩阵来取代g s c 中的阻 塞矩阵,进而提出了另一种韧性g s c 方法。 基于自适应波束形成的麦克风阵列语音增强方法对声学环境中的相干噪声具有较 强的抑制能力,但对非相干噪声无能为力,而后置滤波语音增强方法可以用来去除非相 干噪声。1 9 7 7 年a l l e n 提出将后置滤波用于语音增强【2 9 1 ,但该方法仅使用两个麦克风而 非严格意义上的麦克风阵列。1 9 8 8 年z e l i n s k i 将其扩展到麦克风阵列中,即对延时一求 和波束形成的输出端进行后置滤波,从而提出真正意义上基于后置滤波的麦克风阵列语 复杂环境下麦克风阵列语音增强方法研究 音增强方法【3 0 1 。由于z e l i n s k i 滤波器在推导中存在着对噪声的过估计,1 9 9 2 年s i m m e r 等通过改变滤波器输入信号自功率谱估计,改进了后置滤波器的转移函数【”j 。与z e l i n s k i 后置滤波一样,s i m m e r 后置滤波也不能消除环境中的相干噪声。由于麦克风阵列接收 到的语音信号在低频段具有高度的相关性,m e y e r 和s i m m e r t 3 2 】提出了对语音信号在低频 段进行谱相减,在高频段使用维纳滤波器的增强算法,但是维纳滤波器只能保证在平稳 条件下最小均方误差意义上的最优估计,且该算法没有完全利用语音的生成模型,因此 增强的效果受到了限制。 基于波束形成和后置滤波的麦克风阵列语音增强方法主要用于单一噪声源或有向 噪声源的情况。如果噪声源来自许多方向或环境中存在较强的混响时,麦克风阵列波束 形成方法的去噪性能将大大降低。为克服上述缺点,基于子空间技术的语音增强方洲3 3 训】 得到了快速发展。基于子空间的麦克风阵列语音增强方法是将语音信号空间分解为正交 的信号子空间和噪声子空间【2 】,通过抑制噪声子空间中的噪声并在信号子空间中预测干 净的语音来达到降噪的目的。1 9 9 1 年,d n e d r i n o s 【3 3 】等人最先运用信号子空间理论来进 行语音增强处理。1 9 9 7 年,h a n s e n 提出分别对每个麦克风信号使用单通道子空间方法, 然后进行延时一求和波束形成【3 4 1 。严格意义上讲,该方法仅利用单通道子空间信息,不 是基于阵列子空间的语音增强方法。1 9 9 7 年,a s a n o 等提出基于阵列接收信号相关矩阵 子空间的麦克风阵列语音增强方法【3 5 1 ,该方法利用相关矩阵子空间构建信号子空间,然 后采用最大似然或最小方差波束形成来进行噪声抑制。文献 3 6 , 3 7 】提出的子空间算法 都需要对数据协方差矩阵进行数据块的特征值分解,因而运算复杂度高。r e z a y e e 和 g a z o r t 3 8 】在其算法中引入了投影逼近子空间跟踪算法【3 9 】,以递推最小二乘的形式进行子 空间跟踪,避免了数据块特征值分解的大量运算。但由于该算法将噪声协方差矩阵近似 为对角阵,因此得到的是语音信号的次优估计。1 9 9 9 年至2 0 0 5 年间,d o c l o 等相继提 出并完善了基于广义奇异值分解的麦克风阵列语音增强方法【4 2 1 。麦克风阵列子空间方 法的语音增强算法在环境中存在多方向噪声源和强混响时,仍使语音信噪比有明显的改 善,增强后的语音有良好的质量,但其计算复杂度高是该方法在应用中的瓶颈。 去混响也是麦克风阵列语音增强研究的一个方向,除了子空间方法外,一些学者相 继提出了一系列语音去混响的方法【4 3 弓2 1 。例如,g a u b i t c h 等提出了两步法去语音混响【4 3 1 , 该方法先用线性预测法估计残差信号,然后用谱减法得到增强的语音信号。w a n g 和 i t a k u r a 提出一种基于逆滤波的麦克风阵列去混响方法】。p e t r o p u l u 和s u b r a m a n i a m 提出 了基于倒谱域解卷积的去混响方法【4 5 1 ,该方法在倒谱域重构房i 、日j 冲激响应,进而重构语 音信号。l i u 等提出了另一种基于倒谱域的麦克风阵列语音去混响方法 4 6 ,4 7 1 ,该方法通 过对麦克风阵列信号中的最小相位成分和全通成分分开处理来完成语音信号去混响。之 大连理工大学博士学位论文 后,一些学者提出了基于盲解卷理论的语音信号去混响方法【4 9 1 以及基于语音模型参数 的多通道去混响方法【5 0 5 2 】。 近年来,随着信息论、盲信号处理、神经网络、子带滤波等理论的发展,涌现出了 基于盲源分离【5 3 。5 6 】、神经网络【5 7 1 、隐马尔可夫模型、听觉感知模型、子带分解、粒子滤 波等新的语音增强算法。文献 5 3 提出了基于盲分离的麦克风阵列语音增强算法。文献 5 4 在未知声源信息和麦克风空间位置信息情况下,利用盲信号分离的方法实现了语音 增强。文献 5 5 提出基于盲源分离和时频掩蔽效应的语音增强方法,该方法不需要源的 数目和每个源信号的具体信息。文献 5 6 提出了一种子带盲源分离和后置处理的语音增 强算法,它是将盲源分离的方法和改进的自适应噪声抵消器的算法相结合实现语音增 强。文献 5 7 提出了基于神经网络的麦克风阵列语音增强算法。文献 5 8 将基于语音模型 的线性预测方法用到麦克风阵列语音增强中。 所有这些工作对麦克风阵列语音增强技术的发展起到了极大的推动作用。美国、德 国、法国、意大利、日本、香港等国家和地区许多科学家都在开展这方面的研究工作, 并且已经应用到一些实际的麦克风阵列系统中,如视频会议系统、助听装置等。但这些 应用系统仅限于空间里存在单声源情况,对于混响环境中的多声源情况下的语音增强和 跟踪,目前还没有成熟的技术,理论上的发展也比较缓慢。我国在这方面的研究工作起 步较晚,近几年有一些学者在研究,并取得一定成果。 1 3 本文主要的研究内容 本文主要研究了在复杂环境下的麦克风阵列语音增强方法,对所有相关算法进行了 仿真实验分析。 全文主要研究内容如下: 第一章绪论。阐述麦克风阵列语音增强的研究背景和研究意义;介绍麦克风阵列 语音增强的发展和研究现状;最后阐述了本文主要的研究内容。 第二章麦克风阵列语音增强的基础知识。探讨了阵列的模型、拓扑结构及空间采 样定理、语音信号的生成模型与主要特性、噪声与噪声场、混响等基础知识,同时给出 麦克风阵列语音增强方法的主客观性能评价方法,为本论文的研究工作搭建了一个平 厶 1 :7o 第三章自适应波束形成与后置滤波波束形成融合的麦克风阵列语音增强方法。本 章详细介绍了三种波束形成的麦克风阵列语音增强方法,分析了各种方法的消噪性能, 并针对自适应方法与后置滤波方法在相干噪声场与非相干噪声场不能同时具有较好的 复杂环境下麦克风阵列语音增强方法研究 消噪性能的问题,给出了一种新的波束形成语音增强方法,该方法对噪声场有较好的鲁 棒性。 第四章混响环境下的麦克风阵列时延估计技术。本章探讨了几种典型的时延估计 方法,给出了一种基于语音建立信号和广义相关加权的时延估计方法。该方法首先利用 e a 混响模型来提取语音建立信号;然后用语音建立信号估计信号的功率谱,并进行平 滑处理;最后采用广义相关加权方法估计时延。实验结果验证了该方法在混响环境下仍 能正确的估计时延。 第五章基于倒谱域的麦克风阵列语音增强方法。在小型视频会议房间中,通常室 内比较安静,噪声较小,而客观存在的房间混响则是影响系统性能的主要因素。根据最 小相位倒谱理论,考虑到语音倒谱信号的最小相位分量大都集中在低频部分,在倒谱域 内进行波束形成后再进行低通滤波,可以滤除混响成分。为此,本章在介绍最小相位倒 谱的基础知识后,提出了一种基于倒谱的麦克风阵列语音增强方法。该方法利用了人耳 对相位不敏感的感知特性,有效地降低了算法的复杂度 第六章子空间麦克风阵列语音增强方法。子空间技术将带噪语音信号看成向量空 间,并将此向量空间划分成两个相互正交的子空间:信号子空间和噪声了空间。通过去 除噪声子空间的噪声分量以提高带噪信号的语音质量,并从信号子空间中估计出高质量 的语音信号。本文在研究了g s v d 的麦克风阵列语音增强方法的基础上,从降低计算量 的角度,给出了基于g s v d 的麦克风阵列语音增强方法,并且当干扰为白噪声时,该方 法可以转化为无需端点检测的s v d 语音增强方法;同时,本文还将该方法用于单麦克 风语音增强,得到了较好的增强效果。仿真结果验证了本文方法的有效性。 第七章基于生成模型的麦克风列语音增强方法。时变参数模型法是近年来应用于 非平稳随机信号分析与处理的一种新方法。考虑到语音信号是非平稳信号,本章提出一 种基于生成模型的麦克风列语音增强方法。该方法利用了麦克风阵列的空间特性,当 a r 模型阶数较小时,可以看成是一种时变的a r 模型语音增强方法。 第八章总结与展望。总结了本文研究的主要内容及取得的成果,并对需要进一步 研究的问题进行了展望。 本论文研究来源于国家自然科学基金项目“基于麦克风阵列的语音增强和定位方法 研究( 6 0 3 7 2 0 8 2 ) 与教育部跨世纪优秀人才基金项目“基于麦克风阵列语音增强方法研 究 。 大连理t 大学博十学位论文 2 麦克风阵列语音增强的基础知识 本文主要研究基于视频会议应用的麦克风阵列语音增强系统。在本系统中说话人可 以在房间里自由走动,麦克风阵列则固定在某一位置。由于说话者和麦克风之间的距离 比较远,麦克风阵列不仅接收语音信号,还会拾取到背景噪声。此外,由于该系统工作 于密闭的环境中,因此,混响也将影响着系统的性能。本系统的研究难点在于:( 1 ) 噪 声源可能是非平稳的,且与语音信号占有相同的频带。( 2 ) 噪声源和语音信号可能有相 同的来波方向。( 3 ) 由于混响和语音的相关性,导致语音增强性能在混响较大时急剧下 降。目前虽然提出了一些去混响的方法,但在实际应用中还有许多问题要解决。并且由 于混响的存在,时延估计不可能很精确,因此随着混响时间的增加,系统的性能变差。 为了更好地解决麦克风阵列语音增强系统中的技术问题,本章分别阐述麦克风阵列语音 增强的基础知识,包括阵列处理、语音信号的特点、噪声、噪声场、混响,最后介绍了 语音增强的评价方法。 2 1 阵列概述 阵列信号处理 5 9 邡1 是信号处理的一个重要的分支,已广泛应用于雷达、声纳、医学、 通讯、航空航天等诸多领域中。 阵列是指由分布在不同空间位置上的多个阵元所构成的一个系统,其中阵元包括传 声器、扬声器、摄影机、动作探测器等。阵元为麦克风的系统即为本文研究的麦克风阵 列系统。麦克风阵列既可以看作是由一组在空间不同位置的麦克风按一定规则布置形成 的阵列,也可以解释为对空间传播声音信号进行空间采样的一个装置。 阵列有多种分类方式。依据声源和麦克风阵列( 这里采用等距线阵) 之间距离的远 近,可分为远场模型和近场模型【6 1 】。依据阵列中阵元空间位置的不同,可以分为线性阵 歹u
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肉品加工厂汇报
- 公司的合并与分立课件
- 水电站运行人员年终总结
- 《美丽的青花瓷》课件
- 《美丽的吻》课件
- 《绞刑架下的报告》课件
- 脑出血的初期康复护理
- 药店个人工作总结
- 新员工培训人力政策解读
- 装饰施工员年终工作总结
- 《思想道德与法治》(23版):绪论 担当复兴大任 成就时代新人
- 弘扬志愿服务精神主题班会
- Unit 5 Here and Now (大单元教学设计)2024-2025学年七年级英语下册同步备课系列(人教版2024)
- 劳动监察申请书范本
- 电瓶车撞车调解协议书(2篇)
- 2025年度信息技术项目劳务派遣合作合同模板
- 专利权属协议年
- 人才战略合作协议书
- 解放战争完整版本
- 塑造五种心态培训课件4
- 《印刷工艺》课件 4 印后加工
评论
0/150
提交评论