（通信与信息系统专业论文）麦克风阵列语音增强算法研究(1).pdf

上传人：活*** IP属地：宁夏上传时间：2019-12-11 格式：PDF 页数：60 大小：2.72MB 积分：0 举报 版权申诉

已阅读5页，还剩55页未读，继续免费阅读

（通信与信息系统专业论文）麦克风阵列语音增强算法研究(1).pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要在视频会议、非手持式移动电话、助听器等系统中，语音信号通常不可避免地会受到噪声、混响乃至其他语音的干扰。这些干扰不仅影响语音的可懂度，同时也会导致语音处理系统的性能急剧恶化。因此，采取何种语音增强算法能更有效的从带噪语音中恢复尽可能纯净的语音，是一个亟待解决的课题。本文阐述并比较了几种常用的麦克风阵列语音增强算法。详细讨论了广义旁瓣抵消器结构麦克风阵列语音增强的算法，并仿真了该算法。广义旁瓣抵消器算法会因为目标信号的估计方向与实际到达方向失配而引起信号泄漏，从而导致输出信号失真。针对这个缺点，本文研究了两种改进的基于广义旁瓣抵消器结构的麦克风阵列语音增强算法。第一种算法采用m u s i c ( m u l t i p l es i 印a 1c l 邪s i f i c a t i o n ) 算法来估计目标期望信号的入射角度，降低了定位误差，提高了定位性能，但仍然不能完全消除定位误差引起的性能下降：第二种算法通过改进广义旁瓣抵消器结构中自适应算法，避免因声音到达方向失配带来的信号泄漏，增加反馈模块加快语音增强系统的收敛速度，并采用维纳滤波器使算法更有效地抑制非相干噪声。仿真测试结果表明，相对于传统的广义旁瓣相消器的麦克风阵列语音增强系统，采用改进的算法对语音到达方向失配有更好的强健性，并且具有更高的输出信噪比。关键词：语音增强麦克风阵列广义旁瓣抵消器信号泄漏后置滤波 ab s t r a c t i i lt h es p e e c hc o 舢叭m i c a t i o na p p l i c a t i o ns u c ha u st e l e c o 哦r e n c e ，h a n d s 珩e em o b i l e t e l 印h o n e 锄dh e 耐n ga i d sa n ds oo n ，s p e e c hi su s u a l l yi n e v i t a b l yb ei n t e r f e r e db yn o i s e ， r e v e r b e r a t i o ne v e i lo t h e ra u d i os i 髓a i s t h e s ei n t 刊臼e n c e sw 谢n o to n l yc a u s em e d e 孕l a t i o no fs p e e c hq u a l i t y ，b u ta l s oi e a dt 0as h a 印d e t e r i o r a t i o np e r f o n l l a n c eo ft h e s p e e c hp r o c e s s i n gs y s t e m c o n s e q u e n t l yi ti sb e c o m i n gm o r eu r g e n tt ob es o l v e dt h a t c h 0 0 s ew h i c hs p e e c he n h a j l c e m e n ta 1 9 0 r i t m st 0g e t 雒c l e a i la sp o s s i b l es p e e c h 舶m n o i s ys p e e c h t i l i sp a p e rd e s c r i b e s 锄dc o m p a r e ss e v e r a lc 0 m m o n l yu s e d m i c r o p h o n ea r r a y s p e e c he n h a n c 锄e n ta 1 9 0 r i t l l i i l s t h e i l ，ad e t a i l e da i 】【a l y s i so ft h eg e n e r a l i z e ds i d e l o b e c a n c e i l e rs t r u c t u r ei s 百v e n nt 1 1 eg e i l e r a l i z e ds i d e i o b ec a n c e l l e rs t m c t u r e t h e m i 锄a t c hb 酏w e e l lt h ee s t i m a t e da n da c t u a ld i r e c t i o no fa r r i v a lo fm ed e s i r e ds i 鲷a lw i l l c a u s es i 印a l l e a k a g ew h i c hr e s u l t i n gi ns p e e c hd i s t o i t i o n h lv i e wo ft h i ss h o r t c o m i n 岛觚oi m p r 0 v e da l g o r i t h n l sb 嬲e do ng e n e r a l i z e ds i d e l o b ec a i l c e l l e ra r ep r o p o s e d t h e m u l t i p l es i g n a lc l 嬲s jf i c a t i o na l g o r i t h mi si n t r o d u c e di i lt h ef i r s ti l n p r o v e da 1 9 0 t h mt 0 e s t i m a t et h ed i r e c t i o no fa 币v a lo ft h ed e s i r e ds i 印a l ，w l l i c hr c d u c e st h ep o s i t i o n 朗旧r 锄di m p r 0 v e st h ep o s i t i o np e r f o 唧a n c e ，b u ti ts t i l lc 跚t e l i m 洫a t et h ed e 罩a d a t i o n p e 0 珊锄c ec a u s e db yt h ep o s i t i o n 啪rc o m p l e t e l y s o ，i nt h es e c o n di n l p m v e d a l g 耐t h m ，t h ea d 印t i v ea l g o r i t o ft h ei n l p r o v e dg 饥e r a l i z e ds i d e l o b ec a i l c e l l e r g t m c t u r ei sc h a n g e dt oa v o i dt h es i 印a ll e a l ( a g e ，af e e d b a c km o d u l ei si n 仃d d u c e dt o s p e e du pt l l ec o n v e 略e n c eo ft h es y s t e m sa n daw i e i l e rf i l t e rs t r u c t u r ei sa d o p t e dt 0 s u p p r e 豁t h ei n c o h e r c n tn o i s em o r ee f f - e c t i v e l y t h es i m u l a t i o nr e s u l t ss h o wt h a t ： c o m p a r e dw i t ht r a d i t i o n a lg e n e r a l i z e ds i d e l o b ec a i l c e l l e r t 、op r o p o s 酣i m p r o v e d a j g o r j t h n l sa c h i e v eb e 技e rr o b u s t l l e s sj nt h ep r e s e n c eo fm i s m a t c ho fd i r e c t i o no fa r r i v a l ， a n dh a v eb e t t e ro u t p u ts i 舀l a l t o n o i s er a t i o k e y w o r d s ： s p e e c he h a n c e m e n t m i c r o p h o n ea r r a y g e n e r a z e ds i d e i o b ec a n c e n e r s i g na il e a k a g e p o s t n i t e r i n g 独创性( 或创新性) 声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除了文中特别加以标注和致谢中所罗列的内容以外，论文中不包含其他人已经发表或撰写过的研究成果：也不包含为获得西安电子科技大学或其它教育机构的学位或研究成果；也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处，本人承担一切相关责任。本人签名! 蔓目旦墨婆关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定，即：研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业离校后，发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学校有权保留送交论文的复印件，允许查阅和借阅论文；学校可以公布论文的全部或部分内容，可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证，毕业后结合学位论文研究课题再攥写的文章一律署名单位为西安电子科技大学。 ( 保密的论文在解密后遵守此规定) 本学位论文属丁保密在一年解密后适用本授权书。本人签名：导师签名：同期塑1 2 垒i 旦! ! 旦同期笙k ：! 第一章绪论第一章绪论 1 1 引言语音是人类信息传播和情感交流的重要载体，也是人类信息交流最重要、最有效，最方便的方式。在实际的语音通信中，语音总是不可避免地受到外界环境噪声的干扰，包括传输媒介引入的噪声、通信设备内部电噪声、乃至其它讲话者的干扰。这些干扰使麦克风接收到的语音信号并非纯净的原始语音信号，而是受噪声污染的带噪语音信号，导致许多语音处理系统性能急剧恶化。因此，为了从带噪语音信号中获得尽可能纯净的原始语音信号，就需要进行语音增强。 1 2 语音增强的意义语音增强技术是语音信号处理的一个重要分支，它的主要目的是从带噪语音中提取出相对纯净的语音信号，提高语音信号的可懂度和清晰度，以提高听者的舒适程度、减轻听觉疲劳。它有着广泛的应用，例如车载系统、视频会议系统、非手持式移动电话、音控系统和助听器等，在解决语音噪声污染问题、改进语音通信质量和提高语音可懂度等方面发挥着越来越重要的作用【1 j 。同时人们也在不断努力研究新的语音增强方法，使得语音处理系统在实际环境中有更好的性能。传统语音增强算法包括谱减法、维纳滤波、基于听觉掩蔽的语音增强、基于语音模型的增强算法、以及神经网络、信号子空日j 等增强算法i z j 。传统语音增强方法已经得到广泛的应用，但也存在很多局限性，如在处理时仅利用了一维时间信号的时频信息，因此增强效果有限，且近年来发展比较缓慢，难有新的突破。麦克风阵列语音增强技术是将阵列信号处理与语音增强处理相结合，利用阵列信号的空间相位信息对语音进行增强的一一种技术。它融合了语音信号的空时信息，具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点，这就使麦克风阵列成为智能通信系统中捕捉说话人语音、改善语音质量的重要手段。它可提供比传统语音增强算法更好的噪声抑制效果，并且对应用环境的适应能力更强。近年来，麦克风阵列语音增强方法逐渐成为语音增强的研究热点f 3 j - f 2 0 1 。 2 麦克风阵列语音增强算法研究 1 3 研究现状国外对于语音增强的研究起步远远早于国内，取得了丰硕的研究成果，提出了谱减法、卡尔曼滤波、自适应滤波方法和子空间方法等非常经典的语音增强方法【2 6 】【2 7 l 【2 8 1 。这些方法具有较好的噪声抑制效果，并以简单、易于实现的特点广泛应用于现有语音通信系统与消费电子系统中。基于麦克风阵列的研究和应用是语音信号处理的一个新领域。麦克风接收到的语音信号受到环境噪声和干扰的影响很大，严重影响了通话质量，一般的基于单麦克风的语音增强系统难以获得较好的增强效果。麦克风阵列由于利用了目标信号、噪声和干扰的空间信息，基于麦克风阵列的语音增强系统能提供更好的增强效果。近年来，很多国际著名的大学和研究机构，如卡内基梅隆大学、贝尔实验室等，正致力于麦克风阵列的研究和产品开发。1 9 8 5 年f l a n a g a n 提出的延时一求和波束形成方法1 3 j 是一种较为经典的算法。1 9 7 2 年f r o s t 提出了线性约束最小方差( l i n e a r i yc o n s t m i n e dm i n i m u mv 撕卸c e ，简称l c m v ) 自适应波束形成器【4 j 。在线性约束最小方差自适应波束形成器的基础上，1 9 8 2 年例伍t h s 和j i m 提出一种修币的线性波束形成器，即广义旁瓣消除器【5 l ( g e r a l i z e ds i d e l o b e c 卸c e l i e r ，简称g s c ) 。2 0 0 1 2 0 0 4 年，g a 衄o t 等人以经典的广义旁瓣消除器算法为基础，提出了一种基于有用信号非平稳性的声学转移函数广义旁瓣消除器【6 】同嘲。 b u c k l e y ，g r i 币t l l s 等人在广义旁瓣消除器的基础上提出若干种改进方法【9 1 f 1 8 1 。 1 9 7 7 年a l l e n 提出将后置滤波用于语音增强【1 9 】， 1 9 8 8 年z e l i n s k i 将其扩展到麦克风阵列中【z u j ，即对延时一求和波束形成的输出端进行后置滤波，1 9 9 9 年， a b h a y a p a l a 和k e 曲e d y 等提出了一种自适应近场宽带波束形成方、法1 2 1 】。1 9 9 1 年， w 抽g 和l t a l ( u m 提出一种基于逆滤波的麦克风阵列去混响方法【z 2 1 。1 9 9 4 年， p e 仃o p u l u 和s u b r 锄a i l i 锄提出了基于倒谱域解卷积的去混响方法【2 3 】，该方法在倒谱域重构房间冲激响应，进而重构语音信号。c o m o n 于1 9 9 4 年提出独立分量分析 ( i c a ) 【z 引，从而开始了盲信号分离的研究。s a r u w a t 撕提出基于联合独立分量分析与波束形成的盲信号分离算法【z 5 j ，有效的解决了通用独立分量分析( i c a ) 算法的慢收敛性。我国一些企业、研究所和高校也作了大量的研究工作，但都爿刚刚起步。覃景繁和高鹰各自提出一种新的变j 步长自适应滤波算法【2 9 j 【3 0 1 。何成林等人将多通道维纳滤波器引入广义旁瓣相消器的非自适应支路，提出一种基于子带广义旁瓣相消器结构的语音增强系统p ，该系统具有更快的收敛速度和更高的输出信噪比。殷福亮等人提出一种将延迟一求和波束形成技术和小波变换技术卡 j 结合的语音增强方法i 翊。张贤达，保铮，苏野平，何量，何振亚等学者在盲信号分离方面耿得了较多的成果【3 3 】【矧【碉。第一章绪论 1 4 本文布局本文针对语音环境中存在的干扰和复杂的背景噪声( 非平稳随机噪声、瞬时噪声、回声等) 问题，在基于广义旁瓣抵消器( g e n e r a l i z e ds i d e l o b ec a n c e l l e r ，简称g s c ) 结构的波束形成算法基础上，研究改进了两种自适应的麦克风阵列语音增强算法。第一种是带多信号分离( m u l t i p l es i 伊a lc 1 a s s i f i c a t i o n ，简称m u s i c ) 模块的改进g s c 算法，融合了m u s i c 算法模块与广义旁瓣抵消器结构，增加 m u s i c 算法来估计目标期望信号的入射角度，并将后置维纳滤波模块引入广义旁瓣抵消器的非自适应支路，更有效地抑制相干噪声和非相干噪声。该算法降低了定位误差，提高了定位性能；第二种算法是带反馈滤波器的改进g s c 算法，此算法结构包括广义旁瓣抵消器模块( g s c ) 、后置维纳滤波器模块和反馈滤波器模块。在g s c 的自适应抵消器系数更新算法中加入抑制信号泄漏的因子，来避免因到达方向( d i r e c t i o no f 加1 r i v a l ，简称d o a ) 失配所造成的信号泄漏，增强了系统对于 d o a 的强健性，增加反馈模块来加快g s c 的收敛速度，并且减少了系统稳定后的残余噪声量，并将后置维纳滤波模块引入广义旁瓣抵消器的非自适应支路，可以更有效地抑制相干噪声和非相干噪声。计算机仿真实验结果表明，相对于传统广义旁瓣抵消器算法和带反馈模块的广义旁瓣抵消器算法( d e c i s i o nf e e d b a c k g s c ，简称d f g s c ) 的麦克风阵列语音增强系统，这两种改进算法具有更高的输出信噪比、更快的收敛速度和更强健的性能，对于语音环境中的干扰和复杂背景噪声有较好的抑制效果。论文的具体章节安排如下：第一章阐述了语音增强算法研究的意义，简要分析了语音增强算法的研究现状及本文的主要内容安排。第二章详细讨论了麦克风阵列信号的系统模型和阵列的拓扑结构，探讨了麦克风阵列语音增强的基本算法，并对这些算法进行了比较。第三章详尽阐述了波束形成技术的基本原理；阐述了g s c 算法的框架、工作原理，分析了陔算法所存在的缺陷；并简要叙述了现有的两种改进算法。第四章详尽讨论了传统m u s i c 算：法、麦克风阵列的m u s i c 算法，并研究了一种带m u s l c 模块的改进g s c 算法，该算法降低了定位误差，提高了定位性能，最后仿真了改进算法的有效性。第五章详细讨论研究了带反馈滤波器的改进g s c 算法。该算法小需要知道信号的先验知识，并允许一定的d o a 火配，解决了因d o a 失配所带柬的信号对消问题，最后给出算法的计算机仿真。第六章概要总结本文的j 三要研究内容及取得的成果，并对需崾进一步研究的问题进行了讨论。第二章麦克风阵列语音处理模型及算法简介第二章麦克风阵列语音处理模型及算法简介上一章对语音增强的意义和研究现状进行了大致的讨论，为了进一步深入的研究麦克风阵列语音增强算法，还有必要对阵列处理模型、麦克风阵列的信号模型和噪声特性进行详细的讨论。最后，将阐述几种常用的麦克风阵列语音增强算法，并作简要比较。 2 1 阵列信号模型 2 1 1 传统的阵列信号处理模型传统的阵列信号处理口6 】中主要处理窄带信号，其中心频率为兀。并且，传统模型假设声源位于阵列的远场范围内，即声源可以认为是点声源，各阵元接收的信号之白j 没有幅度差，只存在相位差。最常用的均匀直线阵列的模型如图2 1 所示。 j 、j q j 4 s 图2 1 传统均匀线阵u l a 模璎图2 1 中，m 表示阼元个数，d 表示村l 邻阵元的i u j 距，s 表示目标信号，b 表示目标信号的到达角度，g 2 1 ，2 q 为q 个互小相关的窄带干扰源，q 。为对应干扰源的到达角度。阵列接收的信号矢b 为 x = a s + n ( 2 一1 ) 6 麦克风阵夕i j 语音增强算法研究式( 2 1 ) 为阵列的传输方程，其中，a = 【a ，a ，a 屯，a j q 】c m 。q + 1 为阵列的传输矩阵；a ，c 肌1 ，a ，c 肌1 分别表示目标信号和干扰信号的方向矢量；s c 口+ 1 。1 0 为信号矢量；n c 肌为阵列接收的噪声矢量。式( 2 1 ) 中参数的具体形式为： a = a ，a ，a 如，】 lli l e 心e 一脚e j 物 e 。j e j 2 _e j 2 1e j 2 e j 2 e j ( m _ i ) 匕e j ( m - 1 ) 匕e j ( m - 1 ) e 。j m 1 ) ( 2 - 2 ) s = b ，以，如1 r ，n = k ：，一mr 式( 2 2 ) 中甲，分别表示相邻阵元间接收信号的相位差，g = 1 ，2 ，q ，他们和信号的频率厂、到达角度秒、阵元间距d 等因素有关系，也：螋：掣( 2 3 ) = 等等= 等等一啦，q p 4 ，式( 2 3 ) 和式( 2 4 ) 中的名为信号中心频率所对应的波长，c 为信号传播速度，对于电磁波，c = 3 1 0 8 米秒，对于声波，c = 3 4 0 米秒。在此基础上，对阵列接收的信号进行加权完成波束形成，得到输出信号 y = w x( 2 5 ) 式中，w = 【w ，w 2 r 为权向量。 2 1 2 麦克j x l 阵列信号模型麦克风阵列信号模型是【j i 传统的阵列信号处理模型扩展而来，目前常用的麦克风信号产生模犁有理想模型和实际模型两种【3 7 】1 3 8 1 ，分别如图2 2 和图2 3 所示。 ( 1 ) 理想模型通常情况卜，可以假设声源信号和环境噪声是不相关的，多0 考虑环境噪声，并且各路麦克所接收的噪声彼此之间也是不相关的。麦克风阵列中第f 个麦克风接收到的信号j i ( 足) ( f = l ，2 ，m ) 可以表示为 z f ( 七) = 口，s ( 七一f ，) + 刀f 似) ( 2 6 ) 第二章麦克风阵列语音处理模型及算法简介 7 对应的矢量形式为 x ) = a s o f ) + n o ) ( 2 7 ) 式中 s 一f ) = b 一f 。) ，s 一f ：) ，s o f m ) 】r ( 2 8 ) n ) = k 。 ) ，玎：亿) ，咒m 犷 ( 2 - 9 ) s ) 为声源信号，是声波传播的衰减因子，0 是声波传播到两个麦克风所需要的时间，胛， ) 为环境噪声，而且j ) 和刀， ) o = l ，2 ，m ) 之间彼此不相关。声源尽图2 2 理想声场模型当房间内只存在一个语音源和一个点噪声源时，麦克风接收到的噪声只是点噪声源延迟信号和语音源延迟信号的叠加，则式( 2 7 ) 可以变为 x ) = a s ( 七一t ) + p n 一f ) ( 2 1 0 ) 式( 2 一1 0 ) 描述的就是方向性噪声场中的阵列信号模型。式中 s 一f ) = b ( 七一r 。) ，j ( 七一f ：) ，s ( 七一f m ) r n ( 七一下) = 阢( 疋一f ：) ，刀( 七一f ；) ，刀( 七一f ：，) r ( 2 1 1 ) ( 2 - 1 2 ) s 0 一f ) 和n 传一f ) 分别代表麦克风接收到的语音和噪声向量，并满足s 一f ) 和 n 一f ) 相互独立。f = 【。，f ：，r 和f = 【f ：，f ；，f j ：，】丁分别是语音源和噪声源到麦克j x l 之问的时间延迟向量，由于语音源和噪声源空间位置不同，声音传播经过的路径不同，所以时间延迟也不相同。伍= 舭g b ，口：，口m 】和 p = 击口g 防，缓，几】是两个对角阵，对角线上元素是与信号传播中的衰减有关的常数。 ( 2 )实际模型实际中，由于混响是无法避免的，而且对语音增强的效果影响比较显著，因此，理想自由声场只能作为一一种理论j 二的分析模型，必须既考虑环境噪声，又考虑多径反射噪声。麦克j x l 阵列中第i 个麦克j x l 接收到的信号j ，( 七) ( f 1 ，2 ，m ) 可以表示为 x ，取) = 口s ( 七一o ) + ， ) 麦克风阵列语音增强算法研究 = 口，s g f ，) + 刀盯任) + 拧正 ) = 吃( 七) 幸s o ) + 甩盯 )( 2 1 3 ) 对应的矢量形式可表示为 x ) = h ) s g ) + n ， ) ( 2 1 4 ) 式中符号“木为卷积算子，玎， ) 为干扰成分( 包括各种环境噪声和房间多径反射噪声) ， ) 表示第f 个麦克风接收到的环境噪声，刀腰 ) 表示第f 个麦克风接收到的多径反射噪声。 2 1 3 声源模型图2 3 实际声场模型在空气中，声音传播的速度随着温度和压力的变化而变化，但在标准温度和压力的条件下，声音速度k 约为每秒3 4 0 米。考虑一个平稳声源s 和一个麦克风肘，这里假设声源为点卢源，声源与麦克风之间的距离为d ，这样，声音从s 至m 所用的时间为f ，这里 a r = ，3 4 0 ，l s ( 2 - l 5 ) ，s 如果声源产生的信号是s o ) ，则麦克风接收的信号为工 ) = 船似一f ) + 以( 七) ( 2 1 6 ) 式中f 为时延，口是衰减常数，口与距离d 之间的关系为口。门取) 表示噪声，口可表示为力( 七) = 刀， ) + 刀g ) ( 2 - 1 7 ) 式中，刀，q ) 是【l 于竞争声源所产生的干扰噪声，刀o ) 是混响噪声。前者一般是由风扇、房间罩其他人的活动或吹门哨、空气循环、电子噪卢等产乍的，与s ( 尼) 不相关：后者是由于房f h j 墙壁反射产，的l l j l 波，与s 仅) 相关。这样，传感器接收到的由声源所产生的t ；号为 m 似) = 骝一z ) + 刀e ) = j l 似) 丰s ( 足) ( 2 1 8 ) 第_ 二章麦克风阵列语音处理模犁及算法简介 9 于是，式( 2 1 6 ) 可写成如下形式 j ) = 矗似) 宰s g ) + 刀，0 ) 2 2 麦克风的拓扑结构 ( 2 1 9 ) 在传统的阵列信号处理系统中，阵列的几何结构为均匀直线阵、均匀圆形阵，如图2 4 和图2 6 所示。后来逐渐出现了非均匀直线阵、非均匀圆形阵，如图2 5 和图2 7 所示。均匀直线阵列结构简单，使用方便，并且同时间序列的均匀采样完全对应，可以采用绝大多数基于时间序列的算法，因此应用十分广泛。圆形阵列阵元均匀分布在一个圆环上，用以替代传统的全向天线。近来，出现了三维立体阵，如图2 8 所示，即阵元分布在围绕信号源的空间域中唧j 。阵元间距的选择与信号源的频率以及系统的采样频率密切相关。在子空间理论中，阵列接收一次数据就是对空间的一次采样，阵列收到的是一次空间采样后的采样数据，对于均匀直线阵列而言，阵元间距相当于时间处理中的采样频率，因此必须满足空间采样定理，即阵元间距必须小于或等于波长的一半。平面阵列和三维阵列的尺寸也是以接受信号的波长为单位来确定。实际中应用比较多的是等距线性阵和均匀圆阵，本文中采用的阵列结构为等距线性阵。图2 4 等距线性阵图2 5 不等距线性阵 o a 、一一，图2 6 均匀倒阵，0 7 0 、q 、 ?占 l y 独、7 、f 】、o 、一一一，9 图2 7 非均匀圆阵图2 8 二维立体阵 1 0 麦克风阵列语音增强算法研究 2 3 噪声场在麦克风阵列语音增强中，噪声来源取决于实际的应用环境，噪声场是一个很重要的概念，不同的方法可能适用于不同类型的噪声场。语音信号在封闭环境传输时，由于反射、衍射的影响，会使麦克风阵列接收的语音来自多个路径，这种现象称为混响。混响对语音的影响表现为两个方面：首先，混响使语音信号产生失真：其次，混响改变了噪声场的空间特性。混响对噪声场空间特性的改变体现为，单一的噪声源被扩展为多个不同方位的镜像源，噪声空间接近于散射噪声场。这一特性借助模平方相干函数来界定。设位于和，的两麦克风接收到的噪声分别为刀，( 玎) 和刀，( 甩) ，相应的自功率谱及互功率谱分别( ，w ) 、( 厂，w ) 和( 既，w ) 。于是，定义噪声的空时域模平方相干函数为咖) = 脚1 2 = 揣 ( 2 - 2 。) 根据c f ，( 国) 的值把噪声场分为相干噪声场、非相干噪声场和散射噪声场【4 1 1 。 ( 1 ) 相干噪声场相干噪声场是指噪声信号直接从噪声源传播到麦克风阵列，而没有经过任何因传播环境而产生的反射、散射和耗散。在相干噪声场中，阵列中的不同麦克风接收到的噪声信号具有强相干性，即l l ( 厂) l l 。在实际环境中，相干噪声场存在于开放的空气环境中，在这种环境的周围没有主要的障碍物影响声音传播，而热湍流的影响也很小。 ( 2 ) 非相干噪声场非相干噪声场是指在给定的空间位置的噪声信号与其它所有位置的噪声信号都不相关，也就是说i l ( 厂) i o 。这样理想的非相干噪声场在实际环境中不存在。而在麦克风阵列应用中，麦克风阵列中的电学噪声通常被认为是一种非相干噪声。非相干噪声也被叫做空问白噪声。 ( 3 ) 散射噪声场在散射噪声场，相同能量的噪声信号存各个方向同时进行传播。因此，散射噪声场中的麦克风接收到的噪声信号是弱相关的，并且具有近似柏i - 】的能量。许多实际的噪声环境都可以被看作是散射噪声场。在散射噪声场中，任何两点的噪声信号之问的： - r 性可以用麦克风之间的距离函数来表示 2 7 哦， l ( 厂) = s i nf ( _ )( 2 2 1 ) 式( 2 2 1 ) 中d 。是麦克l x l i 和，之间的距离。第二二章麦克风阵列语音处理模型及算法简介 l l 2 4 麦克风阵列算法简介麦克风阵列语音增强技术是将阵列信号处理与语音增强处理相结合，利用阵列信号的空间相位信息对语音进行增强的一种技术。它融合了语音信号的空时信息，具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点，这就使麦克风阵列成为智能通信系统中捕捉说话人语音、改善语音质量的重要手段。它可提供比传统语音增强算法更好的噪声抑制效果，并且对应用环境有更强的适应能力。近年来，麦克风阵列语音增强方法逐渐成为语音增强的研究热点。目前常用的麦克风阵列语音增强算法大致上有如下几类。 2 - 4 1 固定波束形成方法固定波束形成算法通过延时控制来补偿从声源到每个麦克风的延时，对每个麦克风接收到的信号进行延迟校正，然后使麦克风阵列波束指向有最大输出功率的方向，即波束对准相应空间位置的声源信号，这个算法最早由f l a l l a g 锄提出i 跏。从理论上讲，固定波束形成方法在保持语音信号幅度不变的同时，衰减了干扰和噪声信号。固定波束形成方法可以分为三个部分，即时间延迟估计、时间延迟补偿及累加部分，如图2 9 所示。该类麦克风阵列语音增强方法实现简单，但需要较多麦克风才能获得较好的噪声抑制能力，因此，实际中很少单独使用。 2 k 2 4 2 自适应波束形成方法图2 9 同定波求形成器自适应波束形成是现在j “泛使用的一类麦克风阵列语音增强方法。最早出现的自适应波束形成算法是1 9 7 2 年由f r o s t 提出的线性约束最小方差 ( l i n e a l l yc o n s t r a i n e dm i n i m u m 嘶锄c e ，l c m v ) 自适应波束彤成器【4 j 。其基本思想是在保证有用信号的方向增益一定的条件f ，使阵列输出信号的功率最小。该算法首先对阵列接收信号进行适当的时延补偿，然后在事先设定的频率响应约束条件下，保证波束形成器在期望信号方向j ：的频牢响应不变，并使输出信号的 1 2 麦克风阵列语音增强算法研究总功率最小，这样可使输出信号中的噪声功率最小。在线性约束最小方差自适应波束形成器的基础上，1 9 8 2 年g r i m t h s 和j i m 提出一种修正的线性波束形成器，即广义旁瓣消除器【5 l ( g e n e r a l i z e ds i d e l o b e c 锄c e l l e r ，g s c ) 。广义旁瓣消除器由三个部分组成：固定波束形成器( f i x e d b e 锄f o m l i n g ，f b f ) 、阻塞矩阵( b l o c km a t r i x ，b m ) ，自适应噪声抵消器( n o i s e c 锄c e l l e r ，n c ) ，系统框图如图2 1 0 所示。广义旁瓣消除器的基本思想是将信号通道分为自适应通道和非自适应通道，要求有用信号只能从非自适应通道通过，并利用阻塞矩阵滤除有用信号，使自适应通道仅包含多通道噪声参考信号，最终利用自适应噪声抵消器得到噪声估计，并用所估计的噪声抵消非自适应通道中的噪声分量。广义旁瓣消除器的算法结构较为经典，成为此后许多算法的基本框架。 2 0 0 1 2 0 0 4 年，g 猢o t 等人以经典的广义旁瓣消除器算法为基础，提出了一种基于声学转移函数的广义旁瓣消除器( t r 锄s f e rf u n c t i o ng s c ，t f g s c ) 【6 】。嗍，并对该算法进行了深入研究。该算法是广义旁瓣消除器算法在频域内的扩展，其基本结构与g s c 算法相同，但在构造固定波束形成器和阻塞矩阵时使用了声学转移函数，利用多帧阵列接收信号的互功率谱和最小二乘法估计声学递函数的比值，而不是直接估计声学转移函数本身。这样做可简化求解过程，并使滤波器的系数减少，从而提高了算法的效率和鲁棒性。该算法在平稳噪声场( 方向性噪声、非方向性噪声) 中性能较好，并且增强后的语音失真度较小。广义旁瓣消除器在算法中通过假设已知目标信号的到达方向( d i r e c t i o no f 加1 r i v a l ，简称d o a ) 来构建阻塞矩阵，而目标信号的到达方向往往很难获知，所以目标信号的预期方向往往与实际到达方向不匹配，这称为d o a 失配，这种不匹配会引起有用信号泄漏到自适应通道，从而使输出信号中的有用信号被部分抵消，引起了语音信号的失真，为解决这个问题，研究人员相继提出了改进算法【9 】1 1 4 1 。 9 】和【1 0 】使用一组泄露限制等式来减少目标信号的泄漏和对消。其中【9 】的泄漏限制等式是通过估计阻塞矩阵泄露值获得的， 1 0 】是利用目标信号期望方向上的方向导数定义一组限制等式。【1 l 】中提出一种强健型g s c 结构，采用自适应滤波器组替代阻塞矩阵，滤波器组的输入信号为固定波束形成器的输出，这种结构能减轻因目标信弓预定义相位与实际相位的误差带柬的有用信弓泄露。【1 2 和【1 4 同样基于d o a 失配，提出在通用g s c 结构后接- 一个盲均衡器和一个反馈滤波器，这两部分都是自适应结构，采取l m s 算法更新系数，均衡器主要是信道均衡和 d o a 失配影响均衡，反馈滤波器消除阻塞矩阵中的目标信号。这种结构不仅能消除平稳噪声信号，而且还能消除多道_ f 扰与散射信道噪卢，提高了系统的消噪性能。第二章麦克风阵列语音处理模型及算法简介 1 3 2 4 3 后置滤波方法图2 1 0 自适应波束法系统框图后置滤波可以用来去除声学环境中的非相干噪声，人们提出将波束形成器的输出信号通过后置滤波器以进一步提高输出信号信噪比。1 9 7 7 年a 1 1 e i l 利用波束形成的方向性增益和维纳滤波器对非相干噪声抑制能力，提出将后置滤波用于语音增耐1 9 1 。1 9 8 8 年z e l i n s k i 将其扩展到麦克风阵列中，对延时一求和波束形成的输出端使用自适应维纳滤波器，从而提出基于后置滤波的麦克风阵列语音增强方法【z u j ，进一步改善了噪声抑制能力，系统框图如图2 1 1 所示。鉴于实际声学环境下噪声类型和噪声场的复杂性，许多学者将性能互补的方法相结合，以改善语音增强方法的噪声抑制能力。1 9 9 6 年，f i s c h e r 和s i 咖e r 提出了g s c 与、矾饥e r 滤波相结合的频域麦克风阵列语音增强方法【4 z l ，以抑制声学环境中的相干和非相干噪声。2 0 0 3 年， g 猢o t 和c 0 h e i l 提出了基于传递函数g s c 和后置滤波的频域麦克风阵列语音增强方法f 7 l 【明，以去除噪声场中可能存在的相干噪声、非相干噪声及非平稳噪声。图2 1 l 后置自适应滤波系统框图 1 4 麦克风阵列语音增强算法研究 2 4 4 近场波束形成方法近场波束形成算法是新出现的麦克风阵列语音增强方法。1 9 9 7 年，贝尔实验室w 砌和e 1 1 ( o 将球面波动方程扩展，提出一种混合近场与远场波束形成的设计方法嗣。1 9 9 9 年，a b h a y a p a l a 和k t 釉e d y 等提出了一种自适应近场宽带波束形成方法【z 1 1 ，该方法基于波束形成器，其自适应的对象是声学模型系数而不是滤波器系数。2 0 0 4 年，z h e n g 等将特征值约束的远场l c m v 波束形成方法扩展到近场声学环境，提出一种基于距离差的韧性近场波束形成方法m ，用于小房间内的干扰噪声抑制。由于近场声学的复杂性，目前有关近场波束形成麦克风阵列语音增强方法的研究相对较少。 2 4 5 子空间方法子空间方法的基本思想是对信号自相关矩阵或协方差矩阵进行奇异值分解，将带噪信号空间分为有用信号子空间和噪声子空间。在去除噪声子空间后，可用有用信号子空间重建信号并得到增强后的信号。f j a b l o 岫将一维信号子空间增强方法推广到多维的阵列语音信号增强处理【4 5 】，并取得了比单麦克风更好的消噪性能。、r 觚l 0 a i l 于l9 7 6 年首先提出的广义奇异值分解( g e n e 同i z e ds i n g u l a rv a l u e d e c o i n p o s i t i o n ，g s v d ) 方法是一种比较典型子空间增强算法嗣，应用非常广泛。 1 9 9 9 年至2 0 0 5 年间，d o c l o 等相继提出基于广义奇异值分解的麦克风阵列语音增强方法【4 7 j 。基于子空间的麦克风阵列语音增强方法在相干和非相干噪声场中均有一定的消噪效果，且算法的鲁棒性优于常用的波束形成方法，但是计算量较大，因此，该类麦克风阵列语音增强方法实时处理具有一定困难。 2 4 6 盲信号分离近十年来，盲信号处理成为信号处理领域的一个研究热点，尤其是对语音信号盲分离更是研究的焦点。近些年来，许多著名的专家学者都致力于盲信源分离的研究，己经提出了许多算法，这些算法大致可归纳为三类：第一类方法，信号经过变换后，使不同信号分量之间的相依性( d 印e i l d e n c ”最小化。这类方法称为独立分量分析( i c a ) 【2 4 l ，它是由c o m o n 于1 9 9 4 年提出的。当信号之间的独立性采用不同的准则测度时，即可得到不同的算法，其中最典型的算法是矩阵的联合对角化和神经网络方法。第二类方法采用非线性传递函数对输出进行变换，使得输出分布包含在一个有限的超立方体中，然后熵的最大化将迫使输出分量尽可能在超立方体中均匀散第：章麦克风阵列语音处理模型及算法简介 1 5 布。这类方法称为熵最大化方法。熵最大化最终也得到信号分量独立性的类似测度。第三类方法为非线性主分量分析q m c a ) 。它是线性主分量分析方法的推广，在正交约束下可以实现信号的分离。 2 4 7 算法比较固定波束形成方法结构简单，但是消噪性能也比较有限，对非相干噪声的消除作用十分有限，不能自适应在干扰方向置零点，对目标d o a 的估计误差很敏感，目前很少使用。自适应波束形成器( g s c ) 结构较为简单，对相干噪声抑制效果很理想，适合于时变的声学环境，对非相干噪声的消除作用有限，且依赖于对目标信号d o a 的准确估计。后置滤波方法算法简单，能有效消除非相干噪声，增强之后的语音信号有一定的失真，较少单独使用，大多是结合别的算法。近场波束形成器的阵列在低频处有较强的指向性，对低频噪声有较好的抑制性能，适合于散射噪声场，但是近场声学非常复杂，很难建模，并且要求对近场目标d o a 的准确估计。子空间方法对阵元的增益误差、位置误差不敏感，对干扰有很好的消除性能，但是计算量较大，实时性较差，不适合时变性较强的声学环境。盲信号分离一般都是用高阶累积量进行分离，分离效果较好，但是复杂度比较高，很难实现实时性。对于这几种常见的麦克风阵列语音增强的方法的优缺点见表2 1 。表2 1 麦克风阵列语音增强方法的优缺点算法和结构优点及适川噪声环境缺点对非相干噪声的消除作用十分有同定波束形成法结构简单，消除相干噪声限，对干扰不具有自适应性适合时变的声学环境，对相对爿相干噪声的消除作用有限，对白适应波束法干噪声有很好的消除性能目标d o a 的准确估计很敏感算法简单，能有效消除非相较少单独使用，增强之后的语音信后置维纳滤波法干噪声号有一定的失真对低频噪声有较好的抑制近场卢非常复杂，很难建模，要近场波束形成器性能，适合丁散射噪声场求对近场目标d o a 的准确估计对阵元的增益误差、位置计算鼙较人，不适合时变的声学环 f 空间方法误莠不敏感境，很难实现实时性 h 高阶祟积鹫进 j ：分离，分占信号分离复杂度比较高，很难实现实时性离效果较盘r 麦克风阵列语音增强算法有很多种，但是经典的g s c 算法结构较为简单，对射二 i 噪声消除效果很理想，对时变的声学环境有较好的消噪性能，所以本文选取

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）麦克风阵列语音增强算法研究(1).pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）麦克风阵列语音增强算法研究(1).pdf

文档简介

温馨提示

最新文档

评论

相关文档