(电路与系统专业论文)基于线形麦克风阵列的声源定位算法改进与噪声的实验分析[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)基于线形麦克风阵列的声源定位算法改进与噪声的实验分析[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)基于线形麦克风阵列的声源定位算法改进与噪声的实验分析[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)基于线形麦克风阵列的声源定位算法改进与噪声的实验分析[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)基于线形麦克风阵列的声源定位算法改进与噪声的实验分析[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(电路与系统专业论文)基于线形麦克风阵列的声源定位算法改进与噪声的实验分析[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西北大学硕士论文 摘要 人们对“声的研究由来已久。随着科学技术的不断发展和研究手段的不断进 步,音频信号处理这一方向又出现了许多新的热点与焦点。基于麦克风阵列的音频 信号处理就是其中之一。因其自身优越的性能,开始被应用于许多新的领域,如视 频会议、语音识别、车载系统、机器人控制、助听器、地震报警等。 麦克风阵列的基本用途可以归纳为实现声源定位、跟踪与实现抗干扰语音增强 两种。虽然这两种用途已经被人们广泛研究,但是依然有许多有待解决的问题。本 文的主要工作就是对这两种基于麦克风阵列的语音信号处理方法所遇到的一些实际 问题进行分析并提出改进解决方案。内容包括: 1 简单介绍了麦克风阵列用于声源定位的几种常用方法与用于语音增强时的原 理,讨论了它们的各自特点。 2 对于延时累加可控波束形成方法中所遇到的对称双主瓣、空间角分辨率下降、 频率选择性衰落等主要问题,提出了解决办法。计算机仿真结果说明,联合使用所 提出的三个方法,可以提高室内线形全向麦克风阵列声源定位与跟踪的性能,而不 必改变阵列拓扑结构、不增加硬件成本。 3 在用于语音增强时,波束形成方法对于宽频带信号所对应的不同频点的空间 带宽不同所带来的音色影响问题,讨论了一种恒定波束宽度方法并对已有方法进行 改进。提高了运算速度,减小了系统开销,同时也达到了比较好的控制波束宽度的 效果,并给出了计算机仿真结果。 4 通过进行麦克风音频采集与数据处理实验所得到数据的归纳分析,总结出了 工程实现中需要注意实际问题。得到了实际采集系统中噪声等因素对阵列信号处理 的关键变量信号相位的影响并归纳出一些解决方法。 关键词:麦克风阵列,阵列信号处理,声源定位与跟踪,语音增强 西北大学硕士论文 a b s t r ac t 1 0 u 曲廿l er e s e a r c hn os o u n dh 嬲al o n g1 1 i s t o r y ,t 量l e r ea r em a n yr l e wf o c u s e s 、衍t l l 1 ec o n t m u o u sd e v e l o p m e n to fs c i e n c ea 1 1 dt e c l l l l 0 1 0 9 ya i l dt h ep r o 目e s so nm em e a l l so f r e s e a r c h o n eo ft l l e mi si i l v e s t i g a t i o no nm i c r o p h o n ea r r a yt 1 1 a th a sb e e n 印p l i e dt 0m 龇l y a r e a sb e c a u s eo fi t sa d v a i l c e dc h 卸k t e r ,s u c h 雒v i d e o c o n f e r e n c e s ,h e 耐n ga i dd e s i 朗, r o b o tc o n t m l ,s p e e c hr e c o 嘶d o l l ,e a n l l q u a k ea l a r m i n ga 1 1 ds oo n t h e 咖c o m m o n 如n c t i o n so f 面c r o p h o n ea 玎a y2 u r es o u n ds o u r c el o c a l i z a t i o 玉( i n g 觚ds p e e c he i l h a i l c e m e n t al o to f 、r kh a sb e e nd o n ea b o u tt l l e i i l ,b u tt l l ep r o b l e n l ss t i l l e x i s t t h ec o n t e n t so ft b j st h e s i sa i ea sf o l l o w s : 1 t h eg e i l e r a lm 幽d sb a s e do nm i c r o p h o n ea 彻yf o rd o a ( d i r e c t i o no fa j t i v a l ) a n d s p e e c he r l h a r l c e m e n tw a si n 仃d d u c e d 2 t h ep e o 衄a 1 1 c eo fl i i l e a rm i c r o p h o n ea m y 、v a sa n 柚y z e d a n ds o l u t i o n st 0t h e p r o b l e m s 岫t 研l lo c c u rw h e nn l e 嘶c r o p h o n ea r r a ys e r v e sf o rs o u i l ds o u r c el o c a l i z a t i o n 孤d 仃a c i 血gi i lac l o s e de 眺姗e n t 、v a l sp u tf o 删u s i n gt 1 1 e 山汜em e t l l o d sp r o p o s e d t o g e 也e r 、析ui r l l p r o v et l l ep e r f o n n a n c eo ft 1 1 em i c r o p h o n ea 盯a ym g m yw i 也o u te i l e r c k m g i i l gt h et o p o l o g yo f 锄yo ri 1 1 c r e a s i l l ga d d i t i o n a lh a r d w a r ed e v i c e sc o s t 3 a na d a p t i v em e t h o db a s e do n “c r o p h o n ea r r a yt 0i i l v o l v e 也ec o l l s 觚b e a m v v i d m w a s 咖d l l c e d 加l da n o l e rm e t l l o dt 1 1 a tc a nb ef 瓠t e rw a sp r o p o s e d b o t l lo ft h e m 百v e l es o l u 石。璐t om ep r o b l e m 恤td i f f e r e m 蠡e q u e n c i e sm a | 【et 1 1 eb e 锄诵d t l lm u l t i p l y 4 t h ed a t ao fa 伊o u po fe x p e r i m e n t sw a ss h o w e dt of i n dt l l ec h a r a c t e ro fr e 甜 d a q ( d a t aa c q u i s i t i o n ) e n v 沛砌e n t 1 1 1 en o i s ew h i c h 、v a si n v o l v e d b ym ec 沁u i to fd a q s y s t e mm a d et h ep h a s e so fs i g 砌si i m c c u r a t e t h ei n a c c u r a t ep h a s e s 血p a c t e dt i l er e s u l to f t l l e 血c r o p h o n ea n a yd i r e c t l y s o m es o l u t i o n sw h j c h 、v e r eb a s e do nt 1 1 0 s ee x p e r i m e m s a b o u ti i m c c u r a t ep h a s ew a sp u tf o n ) l 枷a tm ee r l do fe a c he x p e r i m e n t s 1 ( e ,rw o r d s :m i c m p h o n ea n i a 弘a m ys i 朗a lp r o c e s s i n g ,s o u n ds o u r c e1 0 c a l i z a t i o na n d 们c l 【i n 岛s p e e c h 西北大学学位论文知识产权声明书 本人完全了解西北大学关于收集、保存、使用学位论文的规定。 学校有权保留并向国家有关部门或机构送交论文的复印件和电子版。 本人允许论文被查阅和借阅。本人授权西北大学可以将本学位论文的 全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研 究所等机构将本学位论文收录到中国学位论文全文数据库或其它 相关数据库。 保密论文待解密后适用本声明。 学位论文作者签名:指导教师签名: 7 彬年月f p 日切6 年乡月p 日 西北大学学位论文独创性声明 本人声明:所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知除了文中特别加以标注和致谢的地方外,本论文不包含其他人已经 发表或撰写过的研究成果,也不包含为获得西北大学或其它教育机构的学位或证书而 使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确 的说明并表示谢意 学位敝储姥裤 1 ,彩年月肜日 西北大学硕士论文 第一章概述 声音是人类交流信息的载体,从最初的用简单地吼叫来表达情绪,到后来逐 渐发展形成的语言,乃是除了视觉之外的人类获得信息的另一重要来源。 1 1基于麦克风阵列的音频信号处理概述 人类对声音的研究很早就已经开始,从1 8 6 7 年贝尔发明电话开始,新的音 频信号处理技术如同雨后春笋。在音频信号通信与编码,语音识别,人工合成语 音等领域无论从理论方面或者工程应用方面都取得显著的成就【l 】。然而这一古老 的学科在当今信号与信息处理、计算机、数字通信、人工智能等先进技术的推动 下,又一次迅速地发展。 近年来,在音频信号处理与应用领域里又出现了一个新的热点与焦点问题, 那就是基于麦克风阵列音频采集设备的音频信号处理。相对于传统的单一拾音系 统,麦克风阵列独特的性能和特点被人们广泛关注,出现了基于麦克风阵列的音 频信号处理的研究与应用热潮【2 3 j 。 阵列信号处理是现代数字信号处理学的一个重要分支,其概念在二十世纪 5 0 年代后期提出并应用于雷达和水下声纳系统中【】。麦克风阵列是以阵列信号 处理理论为基础而发展起来的一种新兴的音频信号采集设备。与单个麦克风相 比,它除了可以提高信噪比外,还能够实现声源的定位与跟踪【_ 7 1 。 国际上对于麦克风阵列的研究开始于上世纪七十年代【8 】,经过三十多年的发 展,已经有相对成熟的理论,在许多领域也得到了很好的应用。这些应用所涉及 的领域非常广泛,包括视频会议、语音识别、车载系统、机器人控制、助听器、 地震预测与紧急报警等阻13 1 。归结起来大体可以分为两个方面,一是信号源的定 位与跟踪,一是语音增强与抗干扰。前者使用的方法称为达波方向估计 ( d i r e c t i o no fa 矗v 以,d o a ) ,常用的有延时累加可控波束形成方法和高分辨率的 子空间法。后者最为常用的是广义旁瓣对消方法,简单写为g s c ( g e n e r a l i z e d 西北大学硕士论文 s i d e l o b ec a i l c e l ) 。这些方法经过发展已经相对成熟,本文在第二章将作为理论基 础简单介绍。 国内这一方面的研究起步较晚,相关著作不多,但在近几年中,大量的麦克 风阵列研究在各个高校、科研院所和企业内陆续展开1 1 叼。 1 2 麦克风阵列语音采集系统的典型应用 麦克风阵列的应用领域非常广泛,其中,声源定位与跟踪和语音增强是其最 重要的两种用途。 所谓声源定位,就是利用麦克风阵列,通过特定的算法找到发声点的空间位 置信息,这些信息一般包括信号源方向角和俯仰角,对于不同拓扑结构的麦克风 阵列,获得这些信息的能力也是不同的。 图1 1声源信息示意图 图1 1 所示的是一个四阵元麦克风( 血c l 、m i c 2 、面c 3 、m i c 4 ) 阵列,排列在 同一直线o y 上,平面x o y 为麦克风所在的水平面。声源点在平面x o y 上的投 影与原点o 的连线和x 轴的夹角e 和声源点与o 点连线与平面x o y 的夹角巾都 是声源的空间信息,0 称为方向角,由称为俯仰角。但并不是每种应用都需要得 到这两个角度,很多时候,定位只是为了得到它们其中的某一个1 1 7 1 。 麦克风阵列进行声源定位有许多实际用途,其中一种重要应用是对机械设备 进行故障检测与定位。许多大中型机械工作时,由于电机或者活塞等部件的摩擦、 ¥ 一 i 一一 l 卜7 o l 。 袅 西北大学硕士论文 漏测试。 1 3 论文的结构安排 本论文的后面章节内容安排如下: 在第二章中,通过数学推导,介绍麦克风阵列的声源定位与语音增强原理。 其中,声源定位主要介绍延时累加可控波束形成方法和高分辨率的子空间法,语 音增强方法主要介绍自适应的广义旁瓣对消方法。 第三章首先介绍语音信号处理相对于普通阵列信号处理的特点,指出在声源 定位与跟踪的可控波束形成方法中所遇到的一些实际问题,分别针对空间双主瓣 在定位时带来的位置不确定问题,波束宽度引起的分辨率下降问题和密闭空间中 的频率选择性衰落对子带选择的影响等问题进行了分析并提出解决方案,同时进 行了计算机仿真。然后对于采用波束形成方法构成的语音增强系统遇到的主瓣宽 度不一致问题提出一种新的解决方案,并做了计算与仿真。 第四章给出在实际硬件实验中,语音采集系统的性能分析,为工程实现提供 一些实验经验。对由于电路结构、噪声等因素带来的相位延时进行了实验验证与 结果分析,同时对与波束形成联合使用的谱减法去噪方法在实际数据采集系统中 的去噪能力进行了实验验证。 第五章对完成工作进行总结,指出其中的不足与今后研究的展望。 西北大学硕士论文 第二章麦克风阵列的音频信号处理原理 基于麦克风阵列的音频信号处理理论主要来源于阵列信号处理理论。阵列信 号处理涉及波束形成方法( b e 锄f o m 血g ) 、调节阵元特征参数权重的自适应算法 和d o a 估计等。 2 1 信号的复数表达与窄带信号 为了表示方便,信号处理中信号通常使用复数表示。但是,实际过程中传感 器得到的信号是实信号,所以在数学处理时需要对其进行转换。 以正弦信号为例,设信号表达式为 s ( f ) = 口s 访( f + 目) ( 2 1 ) 对它进行傅立叶变换,得到其幅频响应为 l s ( 国) l = 丢口( 6 ( 彩一国。) + 艿( 国+ 彩。) ) ( 2 2 ) 图2 1 正弦信号幅频响应 图2 1 是一个实正弦信号的幅频响应曲线( o = 1 0 0 h z ) ,可以看出它的频率谱 在频率的正负半轴都有分量,且关于原点对称。负频率在变换中只有数学意义, 没有物理意义。因此,如果希望得到一种只有正频率响应,同时能完全表示信号 的性质,复信号可以满足这种要求。 定义信号s ( ,) 的复数表示的解析形式为 西北大学硕士论文 i ( ,) = s ( ,) + 声( f )( 2 3 ) 且满足 聃傺二三三 , 可以看出,复信号的实数部分就是实信号本身,而复信号的功率谱是实信号 正半边谱的二倍。为了得到复信号表达的虚数部分s ( f ) ,重写式( 2 4 ) s ( 缈) = 2 s ( 国) u ( 国)( 2 5 ) 其中u ( 缈) 为阶跃函数,那么对式( 2 5 ) 进行傅立叶反变换可以得到 j ( f ) = j ( f ) 宰 万( f ) 一】( 2 6 ) j 万j 将式( 2 6 ) 展开得到其解析表达为 j ( ,) :s ( r ) + j 三 簿f ( 2 7 ) 亢“t z 比较式( 2 7 ) 与式( 2 3 ) 就可以得到复数表示虚数部分s ( t ) 的表达方法,称这种运算 为希尔伯特变换,即 日( 删:! 仁簿f ( 2 8 ) 兀“f t 希尔伯特变换相当于一个9 0 。移相器,它所有的频率分量幅度响应都是l , 对所有的正频率分量都移相9 0 。,对所有的负频率分量都移相+ 9 0 。 根据以上结论,就可以找到一般信号的复数表达方法: 将原实数信号作为复数信号的实数部分,对实信号进行希尔伯特变换,将希 尔伯特变换后的结果作为复信号的虚数部分,构成的信号就是一般信号的复数表 达,它满足式( 2 4 ) ,可见复数信号只是一种信号的表示方法,它本身并不改变信 号的频率特性( 与实信号的频幅响应相差一个整数倍) 。 这种表达的好处是只会有正频分量的存在,同时在一些数学计算时,也可以 得到简洁的运算结果。 而用这种复数表达可以表示一类有特殊性质的信号窄带信号。图2 2 是 一个典型的窄带信号的时域的图示。 西北大学硕士论文 图2 2 笮带信号 电子系统中信号的频带总是有限的,所以信号通常分为低通与带通两种。定 义功率谱满足式( 2 9 ) 的信号为低通信号 一牌:麓 泣9 , 用同样方法定义功率谱满足式( 2 1 0 ) 的信号为带通信号 坳,= 牌一咆黪 婢 眨 在带通信号中,如果 2 q ,那么,就称这样的信号为窄带信号,是窄 带信号中心频率,2 纯是窄带信号带宽。可以看出,窄带信号可以表示为一个 低通信号经过频谱向高频搬移后的结果。利用傅立叶变换的频移特性,假设低通 信号的表达式为s ( t ) ,那么窄带信号就可以表示为复数形式 工o ) = s ( f ) e x p ( 一j 吐f )( 2 1 1 ) 这样称s ( t ) 为窄带信号的复包络,而e x p ( 一j 啡f ) 为窄带信号的复载波。由于 2 婢,可以看出复载波的变化速度远远高于复包络的变化速度,那么经过 一段非常小的时间后,波形的变化主要被复包络决定。 2 2 基于麦克风阵列的声源定位与跟踪系统的原理 基于麦克风阵列的声源定位最为常见的方法有利用波束形成的方法与利用 子空间分解的方法【2 0 2 ,前者的基本原理是利用多个空间位置各不相同的传感器 阵列构成的空间采样系统,得到一种空域滤波器,这种滤波器可以有选择的使来 西北大学硕士论文 自于某些感兴趣的方向上的信号得到高的增益系数,而其他方向上的增益较小, 从而改变阵列本身的方向特性,再通过比较不同位置的输出功率判断信号的入射 方向。 子空间法是一种高分辨率的定位算法,这种算法的基本思想是将接收信号的 相关矩阵分解为信号子空间与噪声子空间两部分,由信号与噪声的不相关特性得 到定位结果。 2 2 1 波束形成与相控阵列( p h 嬲e da r 阳y - p a ) 的原理 为了方便分析阵列的性质,在分析前做出两种假设,一是窄带假设,二是远 场假设。 窄带信号指的是中心频率远远高于信号频带宽度的信号,在上一小节已经介 绍,这样的信号有许多特殊的性质。如包络相对于载波是缓慢变化的。在对阵列 性能分析时经常基于窄带假设。现假设输入信号为一个窄带信号,它的复数表 达式为( f ) p 一岍钔,( f ) 为信号的包络,p 一卅岛为信号的载波,皖为信号的初 始相位,其中t 为所处时刻,为中心频率。假设声音在空气中传播的速度为c , 那么经过传播延时t 秒后信号的表达式为o + 出) p 一7 卅础+ 剐。如果出很小, 由于( f ) 相对于p 一7 肼碣是缓慢变化的,则可近似认为传播延时f 秒后的信号变 化主要由载波部分引起,包络部分近似不变,那么( f + f ) ( r ) 。则经过传播 延时缸秒后信号的表达式可近似为( f ) p 一,( 叭础+ 钔。 远场假设是指声源距离麦克风阵列的距离非常远,从而可以使各个阵元接收 到的入射波近似认为相互平行,相对于近场对应的球面波模型,远场对应的发射 模型称为平面波阻1 ,除了阵元间的相位差以外,由于传播距离很近,阵元间接 收到的信号所传播的路程差相对于整个传播路程来说是比较大的,所以每个阵元 接收到的信号幅度的衰减也不能像远场时那样认为是相同的。 西北大学硕士论文 声源 图2 3 麦克风阵列接收信号示意图 均匀线阵列是结构最简单的阵列拓扑结构,它是指所有阵元都位于同一直线 上且阵元间距都相等的一维规则拓扑结构。应用窄带假设与远场假设对均匀线形 麦克风阵列接收到的信号进行分析,如图2 3 所示,假设声源到麦克风阵列的各 个阵元的连线与阵列本身所在直线的法线夹角为o ,各个麦克风之间的距离为d , 那么,声源到阵元i i l i c l 所用的路程比到达面c 2 所用的路程多l l = 魂i i l 0 2 c t ( 2 。12 ) 根据波长与频率的关系,可以得到 吨万豳i n 勃a 。 ( 2 1 3 ) 假设阵元i i l i c l 所接收到的信号表达式为( f 弘一皿,其中t 为所处时刻,为中 心频率,z 为波长,那么到达阵元n c 2 的信号表达式可近似为( f ) p 一埘e 吖t “口, 由于1 1 1 i c 2 到r n j c 3 的距离也是d ,所以同理可以推出m i c 3 的近似接收表达式为 ( r ) e 一脚p 一7 t 锄口,第n 个麦克风的接收近似表达为( r 弦一埘p 一产f 如口。假设一 4 石di,一llz石d 个阵列共由n 个阵元构成,那么对这n 个接收信号求和可以得到下式 川) :( 咖删兰p 一半血口 ( 2 1 4 ) 式( 2 1 4 ) 中( f ) p 一埘在窄带假设条件下在t 时刻时近似为一个常数,可以看到t 时 刻的输出y ( t ) 由变量。决定( d 与九保持不变) 。不同的入射方向对应的增益不同, 由堂p 一生产如8 决定该方向上的增益大小,这种空间阵元的求和就是波束形成 系统的基本原理。可定义方向响应函数f ( 0 ) 反映这种增益与入射角的关系。 西北大学硕士论文 定义导向矢量 则这种情况下 口( 臼) :阶。争枷,p 孚州s i 一r( 2 1 5 ) 阶p 半枷1只叫f 一删i ( 2 1 6 ) 式( 2 1 6 ) 为一个等比数列求和问题,经计算可得 脚i 黼i 亿 假设阵元个数为6 ,波长为0 3 米,阵元间距为o 1 米,对式( 2 1 7 ) 进行计算,归 一化后得到均匀线阵的方向图如图2 4 所示。 图2 4均匀线阵方向图 可见,在o = 0 0 ( o = 0 0 与e = 3 6 0 。在空间上对应同一角度) 与0 = 1 8 0 0 附近分别出 现了增益最大的主瓣,主瓣方向就对应波束形成系统的波束方向,主瓣上功率强 度下降到最大功率强度的一半所对应的两个点称为半功率点,这两点的距离称为 主瓣的半功率宽度,简称主瓣宽度2 3 1 ,近似可表示为 b w o5 0 8 8 6 五 d ( r a d )( 2 1 8 ) 主瓣周围的隆起称为旁瓣或副瓣,距离主瓣最近的旁瓣称为第一旁瓣,它的 大小称为第一旁瓣高度。主瓣宽度与第一旁瓣高度都是方向图的重要指标。 由式( 2 1 8 ) 可以看出,方向图的形状是由入射信号的频率( 波长) ,阵元个数与 阵元间距共同决定的。下图2 5 为六阵元均匀线阵在输入波长狩o 3 m 时,不同 西北大学硕士论文 阵元间距p = 0 5 m ,d = 1 o m ,d = 1 5 m ) 所对应的方向图,可以看出主瓣的宽度 变化随阵元间距的增加而减小。 图2 5 不同阵元间距主瓣的比较 阵元个数与输入信号频率对主瓣的影响与阵元间距类似,可由式( 2 1 8 ) 推出。 图2 6 可控波束形成系统 为了能够改变阵列的主瓣所指向的位置,得到一个波束方向可以自由调节的 波束形成系统,令权矢量 : 1 ,p 等d s i n 岛,p 等( ,- 1 ) d s i n 岛r ( 2 1 9 ) 岛是一个参数,权矢量的每一个分量分别与各对应阵元的输入信号相乘,得 o 9 8 7 6 5 3 2 l 0 i o 0 o o 0 o o o o o nr口芒 西北大学硕士论文 到的输出结果求和,如图2 6 ,将会得到一个新的方向响应函数。 ,c 9 ,爿w 口c 9 ,l = l 兰兰兰名凳毫耋耋鼍g 三端l g 2 。, is m l 刀口i s m 一s l n 醵) ,九li 由式( 2 2 0 ) 可以看出,增益的最大值出现在s i l l 萨s i n 岛位置,这样就移动了主 瓣的位置,或者说调整了波束的指向方向。 改变阵列权重矢量中的参数阮,使它遍历入射声波方向角口所有可能的值, 得到的一组输出,结果中最大值所对应的权重系数中的参数阮就是来波的方向 口,因为当波束方向指向信号源时可以得到最大的功率输出。这样就得到了关于 入射角口的一个估计值,从而实现了声源定位。这种方法就是延时累加可控波束 形成方法,也称为波束“电扫( e l e c 臼沁a j l ys c a n n m g ) 。这种方法实际上是人工的 通过加权的方法为信号提供一个延时,改变信号的相位,从而达到控制波束方向 的目的,所以也称为相控阵列畔) 方法。 加权后的波束宽度也会发生变化【2 3 1 ,可表示为 b w o s 0 8 8 6 允s e c 岛万( 砭d ) ( 2 2 1 ) 由式( 2 2 1 ) 可以看出随着主瓣会随着s e c 皖增大而变宽,这样会导致无法准确 找到最大功率点,使系统的空间分辨力下降。如果声源本身是移动的,而且移动 的范围比较大,在跟踪声源的过程中,应尽量保证声源靠近阵列的法方向。因此, 可以转动阵列本身来达到这种要求。 2 - 2 2 多信号分类算法的原理 另一类d o a 估计方法是子空间分解方法,其中最有代表性是多信号分类 m u s i c ( m u l t i p l es i 驴a jc l a s s i f i c a t i o n ) 算法【2 0 】。 仍然以窄带假设与远场假设为基础为信号建立模型。且设阵元间距为d ,入 射角( 入射波与阵列法线的夹角) 为0 。 当有k 个信号同时入射阵列时,阵列的接收矢量为 f l 工( f ) = 口( ( f ) + ,z ( ,) ( 2 。2 2 ) 其中 西北大学硕士论文 x ( f ) = ( f ) ,五( f ) h 一( f ) 】t ( 2 2 3 ) 每个分量对应第n 个麦克风上接收到的信号表达式。嚷为第k + 1 个信号的入射 角度,( ) 为在t 时刻第k + 1 个信号的表达式。 定义信号矢量s 表达式为 s ( f ) = 【o ) ,墨( f ) & 一。( f ) 】t ( 2 2 4 ) 以( r ) 为噪声矢量,给分量为每个阵元的噪声,表示为 玎( f ) = h ( f ) ,碍( f ) 一l ( ,) 】2 ( 2 2 5 ) 口( 哦) 为第k + 1 个信号的导向矢量,令矩阵 彳= 【口( 岛) ,口( q ) 口( 一。) 】 ( 2 2 6 ) 认为处理在某一特定时刻进行的,则可以省略时间变量t ,式( 2 2 2 ) 可以被重写为 一个简单的矩阵运算 工= 加+ 玎 ( 2 2 7 ) 定义矩阵疋为输入矢量x 的相关矩阵 如= e 艇h ) = e 五r 屯h x n x _ 五矿 而而h x n x 五h h 而h h _ r rh n “n ( 2 2 8 ) 其中x 指x 共轭转置,相关矩阵如是一个非常重要的矩阵,它反映了各个阵元 间的输入相关性,假设信号之间互不相关,信号与噪声之间也是统计独立的,那 么就可以把式( 2 。2 7 ) 代入式( 2 2 8 ) ,将如分解成下面情况 如= 民+ 如 ( 2 2 9 ) 其中 比= e 么嚣h 彳h ( 2 3 0 ) 如= e n n h ( 2 3 1 ) 西北大学硕士论文 这样就可以把如分解为两部分,一部分是信号自相关矩阵,一部分是噪声 自相关矩阵如。 从式( 2 2 8 ) 可以得到如的几个性质: 1 ) 埃米尔特性,即 如= 疋h( 2 3 2 ) 2 ) 半正定性( 非负定性) ,即对于任何非零向量国都有 缈疋国h 0( 2 - 3 3 ) 由上面性质分析相关矩阵,可以知道有n 个非负数特征值,且这些特征 值对应的特征向量互相正交,即五五九0 ,且当列向量吼满足特征方 程( 2 3 4 ) 时,有式( 2 ,3 5 ) 成立 r 。q i = 九q i 乃= 0 。悬 ( 2 3 4 ) ( 2 3 5 ) 定义由特征向量构成的特征矩阵q = 【g l ,g :g 】,可以根据式( 2 3 5 ) 得到q 为酉矩阵,即q q h = i 那么相关矩阵可以表示为 如= q 人q h = 兄吼吼h 其中人= 旃昭n ,五,厶】。 同时也可以推导出氏和如有同样的性质。 假设凡对应的特征值为 五l 以2 以o 那么如果有p 个信号入射阵列,且它们互不相关,则仅有 厶 以2 砧 o ( 2 3 6 ) ( 2 3 7 ) ( 2 3 8 ) 西北大学硕士论文 显然冲。假设各阵元的噪声是互不相关的高斯白噪声,且均值为o ,均方 差为盯2 ,那么可以得到 五l = 五2 = = 厶= 盯2 那么根据式( 2 3 6 ) 和式( 2 2 9 ) ,可以有下面结果 ( 2 3 9 ) ( 2 4 0 ) 根据式( 2 4 0 ) 就可以得到信号个数的估计。使用常规的求解方法可以得到相关矩 阵如的特征值,将这些特征值按照从大到小的顺序排列起来,将有较小的n p 个特征值几乎相等( 实际中很难保证各噪声的方差均值严格相等) ,因为它们是 噪声的均方差决定的,而有另外p 个特征值的大小与几乎相等的较小的n p 个 特征值相差较大,因为它们是信号相关矩阵的特征值与噪声的均方差求和。分析 这些特征值,由于入射阵列的信号之间是不相关的,所以它们的个数也应该为信 号相关矩阵的特征值的个数,即p 。这样就得到了信号个数的估计。 分别将较大的p 个特征值对应的特征向量排列成特征矩阵 q = 【g ,9 2 g 尸】( 2 1 4 1 ) 同时也将几乎相等的较小的n p 个特征值对应的特征向量排列成矩阵 q := 【g p + l ,g ,+ 2 g 一| p 】( 2 4 2 ) 称较大p 个特征值为相关矩阵的主特征值,它们所对应的特征向量张成的空间为 信号空间,由q 表示,而另外的n p 个特征值为非主特征值,所对应的特征向 量张成的空间为噪声空间,由q 表示。由于非主特征值的大小基本相等,那么 g 口+ l ,g j p + 2 g 一户 ( 2 4 3 ) 根据式( 2 4 3 ) ,式( 2 3 0 ) ,式( 2 3 4 ) 和式( 2 3 9 ) 得到 ( 疋一盯2 i ) 9 p + l = 彳船h 彳h g 尹+ l = 0 ( 2 4 3 ) 由于彳与船h 都是满秩的,所以得到 彳h 靠+ l = o( 2 4 4 ) h gg 2 盯 珊 + h g、, 盯+ t ,l p试 i j 艮 西北大学硕士论文 展开式( 2 4 4 ) 则得到 口( 岛) 郇+ l 口h ( 岛) g 尸+ l 口( 砟) g 川 0 0 o ( 2 4 4 ) 可以看出,任何一个入射信号对应的导向矢量与噪声对应的特征值都是正交 的。这样只要找到能够使其对应的导向矢量与噪声对应的特征矢量正交的乡,就 可以认为它是信号的入射角度。这就是m u s i c 算法的基本思想。 一般情况下,由于非理想因素的影响,需要构造函数 1 k ( 们2 研砸匆丽 ( 2 4 5 ) 式( 2 4 5 ) 就是常用的一种d o a 估计的m u s i c 算法表达式,在一定的范围内搜索 可能的秒,使唧( 毋) 出现峰值的秒就是一个入射方向。 比较m u s i c 算法与延时累加可控波束形成方法,前者对于多个入射信号有 更好的空间分辨力,不受到波束宽度的制约。但是后者运算量小,系统开销小。 在一些拾音环境下,由于混响等因素的存在,使噪声与信号,信号与信号之间不 能满足强不相关的特性,从而导致定位误差。 也有一些同时运用两种方法的算法【2 4 】,改进了定位性能,称为波束级m u s i c 算法,不再细述。 2 3 基于麦克风阵列的自适应信号增强原理 麦克风阵列的另外一种重要作用是可以进行音频信号增强,达到降低噪声、 消减干扰影响的效果。实际的拾音环境中,往往混杂着大量的干扰与环境噪声, 通常情况下,这些噪声与干扰入射阵列的方向与声音信号入射的方向不同。那么 只要使用波束形成技术,将阵列的最大增益方向指向信号方向,将增益为零或最 小的方向指向干扰或噪声源方向,就可以取得好的增强效果。 西北大学硕士论文 曩( 一) k 相曩 d ( 力) + 一心 唧) 一、=y l 控 耋 ,( 玎) 权 咀 自 蠡 蓥 嘞 阵 权 图2 7 广义旁瓣对消器结构 一种常用的基于麦克风阵列的自适应信号增强系统是广义旁瓣对消器 ( g s c ) ,它的结构如图2 7 。假设已经知道( 通过d o a 或其他方法) 入射信号的方 向,输入阵列的信号通过一个固定的波束形成部分,将最大增益指向信号入射方 向。同时这组入射信号经过一个阻止矩阵,得到一组新的输出,对这组输出加自 适应权求和后与波束形成后的信号结果相减得到最终的输出结果。下面通过数学 分析,详细说明广义旁瓣对消器的工作原理。 阻止矩阵的作用是保证得到的输出结果在信号方向上的功率增益为零,即从 空域阻止信号通过。也就是说要求阻止矩阵与信号源方向对应的输入矢量是正交 的,可表示为( ,z ) = 0 。常用的阻止矩阵的形式有下面形式【8 】 b = 11o 0ll 0o 0 00o o0 o0 ; o0 l一1 ( 2 4 6 ) 信号依然满足式( 2 2 2 ) 的表达,但采样为离散的,采样时刻用n 表示,那么 阻止矩阵输出的为 x ( 甩) = 占士( 以) = 五一而 吃一屯 h 一2 一h l 根据式( 2 4 7 ) 可知,工( f ) 是一个有n 一1 个分量的向量。 ( 2 4 7 ) 西北大学硕士论文 对这一组新的输入加权,权值为 ,国= 融,吐蛳一门r ( 2 4 8 ) 那么输出 y ( 行) = 缈hz l ( ,z )( 2 4 9 ) 构造函数 p ( 以) = d ( 聆) 一y ( 玎)( 2 5 0 ) 其中d 是固定波束形成的结果,它包含噪声与信号两部分的功率,y 是经过阻止 矩阵后的结果,它不包含信号部分的功率。那么随着外界条件的变化,自适应的 调节权值来使输出功率达到最小时,说明y 最大限度的抵消了噪声( 信号功率不 变的情况下,总输出的减小对应噪声功率的减小) ,就完成了自适应语音增强。 为了得到自适应的最优权值彩掣使输出功率p 达到最小,需要使用一定的自 适应算法。自适应算法的种类有很多,最小均方差法( l m s ) 就是其中常用的一 种。 为了保证输出功率最j 、,应有 e ip ( ,z ) 1 2 = e 1 ( d ( 刀) 一y ( 刀) ) 1 2 ( 2 5 1 ) 将式( 2 4 9 ) 代入式( 2 51 ) 得到 e ) 1 2 = e id ( ,z ) | 2 _ 2 缈m d + 彩棚缈 ( 2 5 2 ) 其中 d = e d ( 门) x ( ,? ) 】( 2 5 3 ) 由于e e 2 的物理意义为平均功率,那么式( 2 5 2 ) 一定有最小值。为了得到 最小值与权系数的关系,可以对式( 2 5 2 ) 关于缈求导数,并令其等于零,得到 v 。( e jp ( 甩) 1 2 ) = 一d + 疋,国= o ( 2 5 4 ) 求解方程( 2 5 4 ) 可以得到最优权的表达式 缈掣= 月二:d ( 2 5 5 ) 式( 2 5 5 ) 是最优权的显式表达,然而这种表达的求解需要相关矩阵求逆运算, 用这种方法求最优权称为直接求逆法,对于计算机来说计算量很大。因此常用数 1 r 西北大学硕士论文 值方案来求解方程( 2 5 4 ) 。 由于v 。( er | p ( _ ) | 2 ) 是平均功率对权值的梯度,它反映了功率的变化趋势, 只要使权值沿着梯度的反方向不断变化,就可以使功率不断减小,直到最终达到 v 口。( e iie ( 刀) 1 21 ) = o 。按照这样的原理构造迭代函数 缈。= 缈。一 v 。( e 1p ( 刀) 1 2 ) l 。:叽 ( 2 5 6 ) 将式( 2 5 4 ) 代入式( 2 5 6 ) ,得到 国t “= 缈一 一d + 足y 缈t 】 ( 2 5 7 ) 其中,是个常数,称为为迭代步长。 第七和七+ 1 个时间帧,它不是一个时刻, 这里需要说明的是七和七+ 1 指的是 而是一段时间。e | e ( 推) 1 2 | 口,| = 虬是指 在第j | 个时间帧内的统计均值。所以直接使用这种方法,只有经过一个时间帧后, 才会更新一次权重。这样完成到平衡条件v 。( e | p ( 聆) 1 2 ) = o 所需要的收敛时间 太长。同时由于麦克风阵列采集的很可能是语音信号,由于语音信号的非平稳特 性网,使多个时间帧的统计量未必相同。所以需要做下面改变。 用瞬时值来近似估计统计均值 疋v 石( 胆) x h ( 胛)( 2 5 8 ) d = d ( 刀) x ( 稳) ( 2 5 9 ) 将式( 2 5 8 ) 和式( 2 5 9 ) 代入式( 2 5 7 ) ,可以得到 缈( ”+ 1 ) = 缈( 甩) + x ( 刀) p ( 力)( 2 6 0 ) 式( 2 6 0 ) 就是l m s 算法所使用的自适应迭代公式,在某一时刻阵列输入的采样称 为对输入的一次快拍,每次快拍都会完成一次权重更新,直到达到平衡,使输出 功率最小,完成自适应信号增强。 相对于直接求逆法,这种数字方案虽然需要进行递推运算,需要一定的收敛 时间,但它的计算量小,所以需要的计算时间少。 西北大学硕士论文 2 4 小结 本章主要较为详细的介绍了已有的麦克风阵列处理算法,包括用与d o a 估 计的可控波束形成方法与高分辨率子空间方法,及自适应音频增强方法。 西北大学硕士论文 第三章有限空间线形麦克风阵列算法改进 采用线形麦克风阵列进行声源定位时,由于音频信号本身具有传输带宽较 宽,加之使用环境的不同,与传统的应用于开放式空间天线阵列的窄带处理方法 相比有自己的特点与难点。 3 1 线形麦克风阵列延时累加可控波束形成方法的改进 目前,人们仍然使用延时累加可控波束形成方法,尽管该方法出现得最早, 但依然是一种具有较强的活力与生命力的方法 2 7 1 。但如果直接将该方法应用于 室内线形全向麦克风阵列声源定位与跟踪,其性能会大打折扣。主要是由于对称 双主瓣造成两个可能的声源位置、反射波造成的频率选择性衰落和实际阵元数不 可能太多造成电扫主瓣过宽,从而使声源定位精确度下降。研究表明,对于室内 环境下声源的定位与跟踪,采用一些特定的办法完全可以改善其应用性能而不改 动原阵列的物理结构。 3 1 1 全向线阵系统的对称主瓣问题及解决方法 由于指向性麦克风在采集语音信号时会出现盲区( 不能对整个空间的信号都 做出第一时间的感应) ,因此人们开始使用全向麦克风作为阵元构造一维均匀线 形阵列。但是由此所得到的空间对称双主瓣使得用延时累加可控波束形成方法得 到两个波达角度。尽管可通过构造诸如球形、三角形拓扑结构来解决【2 0 1 ,但 因算法复杂、体积庞大、成本高难以实用。而一维线阵结构简单,数学建模容易, 仍是目前应用最为广泛的阵列拓扑结构之一。 当满足第二章所述的窄带条件和远场条件,声源信号用复信号表示时,均匀 线阵的接收方向函数在第二章( 式2 2 0 ) 已经推导,现重写如下 f ( 口) :陴竺掣尝蜊 ( 3 1 ) 、ls i n 【硝( s i i l p s i i l 岛) 名】j 。 西北大学硕士论文 由式( 3 1 ) 可以看出,当s i i l 萨s i l l 阮时,检测的信号增益将最大,即h 印取最 大值。对于全向阵元来说,其响应角目的变化范围为0 2 7 【,尺回分别在以曰和( 肛回 为中心出现增益最大的主瓣。图3 1 为_ 7 、d 九= 1 3 、导向角阮为1 5 9 时的只d 随p 的变化曲线,其中尺力已归一化。只d 在1 5 9 和1 6 5 。两个方向出现对称主瓣, 这样电扫的结果将会得到两个声源位置,这就是由于不惟一的主瓣带来了声源位 置的不确定问题。 图3 1 阮= 1 5 。麦克风阵列方向图 全向麦克风对所有角度的幅度响应在理论上是相同的,这种特性使得它在声 源定位时,无须机械扫描就可对整个空间信号做出响应而不会出现盲区。使用相 控方法( 第二章已详细介绍) ,改变( 3 1 ) 式中的岛取值,就均匀线阵来说,一个岛 值对应两个主瓣,即搜索最大增益方向也得到两个角度,因此无法正确判断声波 入射方向,这就是由于双对称主瓣给声源定位带来的位置不确定问题。 然而,声源定位的应用大多是声源跟踪,并非阵列不动,而是要随时根据声 源位置转动阵列系统。这就为确定声波方向提供了条件。第一次电扫得到两个可 能声波入射方向后,将阵列本身旋转一个确定的角度,然后再次进行电子扫描。 由于阵列转动角度p l 己知,则可以计算出真实的声波入射方向。过程如下:假 设旋转前两个可能声波入射角分别是岛和( 7 r i ,将阵列转动秒l ,且假定声源位 置没有变化,电扫后得到的两个可能角度分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论