文档简介
1、国内图书分类号:T N 9 1 1 7 2 国际图书分类号:6 2 1 3 8 西南交通大学 研究生学位论文 密级:公开 年 姓 专 二零一四年六月 C l a s s i f i e dI n d e x :T N 91 1 7 2 U D C :6 2 1 3 8 S o u t h w e s tJ i a o t o n g U n i v e r s i t y M a s t e rD e g r e eT h e s i s S P E E C HS O U R C EL O C A L I Z A T I O NA N D T R A C K I N GI NN E A R F
2、 I E L DB A S EO N M I C R O P H O N EA R R A Y S G r a d e : C a n d i d a t e : A c a d e m i cD e g r e eA p p l i e df o r : S p e c i a l i t y : S u p e r v i s o r : 2 U l l W a n gJ u n p e i M a s t e r S i g n a la n d I n f o r m a t i o nP r o c e s s i n g P r o f W a n gJ i a n y i n g
3、 西南交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并 向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授 权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用 影印、缩印或扫描等复印手段保存和汇编本学位论文。 本学位论文属于 1 保密口,在年解密后适用本授权书; 2 不保密日厂磕用本授权书。 ( 请在以上方框内打“- 7 ”) 学位论文作者签名: 拐- 4 E t 期:瑚f 敏多乡 指导老师签名: 己砍) 易 西南交通大学硕士学位论文主要工作( 贡献) 声明 本人在学位论文中所做的主要工作或
4、贡献如下: 1 为了得到良好的语音信号,采用了自适应小波分解层数选取和改进型阈值函数 相结合的方法来提高小波去噪的性能,进而做好语音信号预处理的工作。 2 首先,本文建立了一种改进的麦克风阵列近场信号接收模型,弥补了普通均匀 圆阵等传统麦克风阵列近场模型对俯仰角估计产生角度模糊的缺点;其次,在此基础 上针对近场3 D M U S I C 算法和宽带聚焦3 D M U S I C 算法三维平均空间谱矩阵求解和谱 峰搜索的巨大计算量,给出了分步降维估计法,很大程度上降低了算法的计算量。 3 将现有的基于压缩投影逼近子空I 司( P A S T d ) 算法的信号D O A 跟踪,应用到近场 三维声
5、源跟踪,并针对该算法跟踪误差较大或收敛速度较慢的缺点,给出了可变遗忘 因子P A S T d 算法,通过仿真实验验证了该方法良好的声源D O A 跟踪性能。 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成 果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰 写过的研究成果。对本文的研究做出贡献的个人和集体,均己在文中作了明确说明。 本人完全了解违反上述声明所引起的一切法律责任将由本人承担。 学位论文作者签名: , 王夕坼 日期:勘,争石6 西南交通大学硕士研究生学位论文 第1 页 摘要 随着阵列信号处理技术的日渐成熟,基于麦克风阵列的声源定位与跟
6、踪现 已逐渐得到比较广泛的应用。由于室内声源为宽带非平稳信号,传统的窄带信 号D O A 估计和跟踪算法无法直接应用于此,且现有算法通常具有较高的算法 复杂度,所以基于麦克风阵列的声源定位和跟踪仍然具有较大的改进空间。本 文对基于麦克风阵列的近场声源D O A 估计和跟踪相关算法进行了研究和改 进,主要研究内容包括: 第一、综合分析了语音信号的时频特性,结合阵列信号处理中远场均匀线 阵平面波信号接收模型研究了均匀线阵、均匀圆阵和任意拓扑结构的近场球面 波信号接收模型。 第二、对麦克风阵列接收到的数据进行包括预滤波、预加重、归一化、加 窗分帧和语音降噪等在内的各种预处理和语音端点检测。本文对语音
7、降噪进行 了重点研究,文中采用了自适应小波分解层数选取和改进型阈值函数相结合的 方法来提高小波语音去噪的性能。 第三、采用麦克风均匀圆阵近场模型,对近场3 D M U S I C 算法和宽带聚焦 3 D M U S I C 算法进行了对比研究。针对均匀圆阵等传统麦克风阵列近场信号模 型对声源俯仰角估计产在角度模糊的缺陷,建立了新的麦克风阵列模型;并在 此基础上针对宽带聚焦3 D M U S I C 算法中三维平均空间谱矩阵求解及谱峰搜 索计算量大的问题,提出了分步降维估计法来减小算法计算量。最后,通过实 验仿真验证了该方法在降低算法计算量的基础上,依然保持了良好的D O A 估 计性能。 第四
8、、将基于压缩投影逼近子空间( P A S T d ) 算法的信号D O A 跟踪,应用到 三维近场声源跟踪,并利用第三点所述的分步降维估计法来减小每帧数据 D O A 估计时的计算量。针对该算法跟踪误差较大或收敛速度较慢的缺点,提 出了可变遗忘因子P A S T d 算法,最后通过实验仿真验证了改进算法良好的 D O A 跟踪性能。 关键词:M U S I C 算法;声源定位;P A S T d 算法;声源跟踪;麦克风阵列; 西南交通大学硕士研究生学位论文 第1 I 页 A bs t r a c t W i t ht h ea r r a ys i g n a lp r o c e s s i
9、 n gt e c h n i q u e sb e c o m em o r es o p h i s t i c a t e d ,t h e s o u n ds o u r c el o c a l i z a t i o na n dt r a c k i n gb a s e do nm i c r o p h o n ea r r a yh a sg r a d u a l l y b e e nw i d e l yu s e d A st h ei n d o o rs o u n ds o u r c ei sb r o a d b a n ds i g n a l s ,
10、t r a d i t i o n a l D O Ae s t i m a t i o na n dt r a c k i n ga l g o r i t h mo fn a r r o w b a n ds i g n a lc a nn o tb ed i r e c t l y a p p l i e d ,a n dt h ee x i s t i n ga l g o r i t h m so fw i d e b a n ds i g n a lu s u a l l yh a v eh i g h e r a l g o r i t h mc o m p l e x i t
11、y ,S O t h es o u n ds o u r c el o c a l i z a t i o na n dt r a c k i n gb a s e do n m i c r o p h o n ea r r a ys t i l lh a sal a r g ei m p r o v e m e n t T h i sp a p e rs t u d y sa n di m p r o v e s t h ea l g o r i t h m so fs o u n ds o u r c eD O Ae s t i m a t i o na n dt r a c k i n
12、gf o rn e a r f i e l db a s e d o nm i c r o p h o n ea r r a y T h em a i nc o n t e n t si n c l u d e : F i r s t l y ,t h ep a p e ra n a l y s e st h eT i m e - f r e q u e n c yc h a r a c t e r i s t i c so ft h es p e e c h s i g n a l ,s t u d y st h en e a r f i e l ds p h e r i c a lw a
13、v ea r r a yr e c e i v em o d e lo fU L A ,u n i f o r m c i r c u l a ra r r a ya n da r b i t r a r yt o p o l o g yc o m b i n e dt h ef a r f i e l dU L Ap l a n ew a v e r e c e i v em o d e li na r r a ys i g n a lp r o c e s s i n g S e c o n d l y ,t h ep a p e rs t u d y st h ep r e t r e
14、a t m e n ta n dt h ee n d p o i n td e t e c t i o no ft h e r e c e i v e dd a t a T h ep r e t r e a t m e n ti n c l u d e sp r e - f i l t e r i n g ,p r e - e m p h a s i s ,n o r m a l i z e d , w i n d o w e df r a m i n ga n dn o i s er e d u c t i o n ,e t c T h e p a p e rf o c u s e s o
15、nt h en o i s e r e d u c t i o no ft h es p e e c h ,c o m b i n e st h ea d a p t i v es e l e c t i o no fw a v e l e td e c o m p o s i t i o n l e v e lw i t ht h ei m p r o v e dt h r e s h o l df u n c t i o nt oi m p r o v et h ew a v e l e td e n o i s i n g p e r f o r m a n c e T h i r d
16、l y ,t h ep a p e rc o m p a r e sa n ds t u d y st h en e a r f i e l d3 D - M U S I Ca l g o r i t h m a n db r o a d b a n df o c u s e d3 D - M U S I Ca l g o r i t h mw h i c hu s e st h eu n i f o r mc i r c u l a r a r r a ym i c r o p h o n en e a rf i e l dm o d e l F o ru n i f o r mc i r
17、c u l a ra r r a yn e a r - f i e l ds o u n d s o u r c em o d e le x i s t se s t i m a t e ss h o r t c o m i n g so fa n g l eb l u rw h e ne s t i m a t e dt h ep i t c h a n g l e ,an e wm i c r o p h o n ea r r a ym o d e li sp r o p o s e d ,a n do nt h i sb a s i ss t e pe s t i m a t e s a
18、 n dd i m e n s i o n a l i t yr e d u c t i o nm e t h o di s p r o p o s e dt om a k eu pt h ed i s a d v a n t a g eo f t h eb r o a d b a n df o c u s e d3 D - M U S I Ca l g o r i t h mt h a th a sal a r g ea m o u n to f c a l c u l a t i o nw h e ns o l v i n gt h es p a t i a ls p e c t r u
19、mm a t r i xa n dp e a ks e a r c h i n g F i n a l l y , t h r o u g he x p e r i m e n t sv a l i d a t et h a tt h em e t h o dr e m a i n sag o o dD O Ae s t i m a t i o n p e r f o r m a n c eb a s eo nr e d u c i n gt h ea m o u n to fc a l c u l a t i o n F o u r t h l y ,t h es i g n a lD O
20、At r a c k i n gb a s e do nP A S T da l g o r i t h mi sa p p l i e dt ot h e t r a c k i n go fn e a r - f i e l ds o u n ds o u r c e ,u s i n gt h es t e pe s t i m a t i o na n dd i m e n s i o n a l i t y 西南交通大学硕士研究生学位论文 第1 I I 页 r e d u c t i o nm e t h o dr e d u c e st h ea m o u n to fd a
21、t ap e rf r a m et oc a l c u l a t ee s t i m a t e so f D O A F o rt h es h o r t c o m i n go fl a r g et r a c k i n ge r r o ro rs l o wc o n v e r g e n c er a t e ,t h e p a p e rp r o p o s e sv a r i a b l ef o r g e t t i n gf a c t o rP A S T da l g o r i t h m F i n a l l y ,t h r o u g
22、ht h e e x p e r i m e n t sv a l i d a t e st h eg o o dD O At r a c k i n gp e r f o r m a n c ea n dl o wc o m p u t a t i o n a l c o m p l e x i t yo ft h ea l g o r i t h m K e yw o r d s :M U S I Ca l g o r i t h m ;S o u n ds o u r c el o c a l i z a t i o n ;P A S T da l g o r i t h m ; S o
23、 u n ds o u r c et r a c k i n g ;M i c r o p h o n ea r r a y ; 西南交通大学硕士研究生学位论文 第1 V 页 目录 第1 章绪论1 1 1 本文研究背景及意义1 1 2 麦克风阵列近场声源定位的国内外研究现状1 1 3 麦克风阵列近场声源跟踪的国内外研究现状3 1 4 本文主要工作及内容4 第2 章语音信号特性及阵列模型特征5 2 1 语音信号的特征5 2 1 1 语音信号的时频特性5 2 1 2 语音信号语谱图6 2 2 阵列信号处理模型6 2 2 1 窄带信号处理模型7 2 2 2 宽带信号处理模型7 2 3 麦克风阵列语音
24、信号处理模型8 2 3 1 麦克风远场均匀线阵信号模型9 2 3 2 麦克风近场均匀线阵信号模型9 2 3 3 麦克风近场均匀圆阵信号模型10 2 3 4 任意拓扑结构的麦克风近场信号模型1 1 2 4 本章小结1 2 第3 章预处理和语音端点检测13 3 1 预处理13 3 1 1 预滤波13 3 1 2 加窗分帧1 4 3 1 3 预加重15 3 1 4 归一化1 5 3 1 5 语音去噪1 5 3 2 语音端点检测2 0 3 2 1 语音信号和噪声的频谱差异2 1 3 2 2 基于频谱方差的语音端点检测2 l 3 3 本章小结2 3 第4 章基于麦克风阵列的近场声源定位2 4 4 1 经
25、典M U S I C 算法2 4 4 2 基于宽带聚焦3 D M U S I C 算法的近场声源定位2 5 西南交通大学硕士研究生学位论文 第V 页 4 2 1 普通宽带聚焦算法2 5 4 2 2 基于宽带聚焦的3 D M U S I C 算法2 7 4 2 3 运算量分析2 9 4 2 4 仿真实验3 0 4 3 基于改进型麦克风阵列接收模型的分步降维估计法一3 6 4 3 1 改进的麦克风阵列近场信号模型3 6 4 3 2 分步降维估计法3 7 4 3 3 运算量分析3 9 4 3 4 仿真实验4 0 4 4 本章小结4 2 第5 章基于麦克风阵列的近场声源跟踪4 4 5 1 引言4 4
26、5 2 基于P A S T d 算法的近场声源跟踪4 5 5 2 1 投影逼近子空间( P A S T ) 算法4 5 5 2 2 压缩投影逼近子空f 司( P A S T d ) 算法4 8 5 2 3 基于改进型麦克风阵列的P A S T d 算法4 8 5 3 基于可变遗忘因子P A S T d 算法的近场声源跟踪4 9 5 3 1 可变遗忘因子的选取5 0 5 - 3 2 可变遗忘因子P A S T d 算法5 2 5 4 仿真实验5 3 5 5 本章总结5 8 总结与展望5 9 致 射6 0 参考文献6 1 攻读硕士学位期间发表的论文及科研成果6 5 西南交通大学硕士研究生学位论文
27、第1 页 1 1 本文研究背景及意义 第1 章绪论 随着阵列信号处理技术的日趋成熟,近年来麦克风阵列正逐步应用于各种语音信号 处理系统中,比如:音视频会议、大型舞台、语音识别、智能监控等等。在这些语音 信号处理系统当中,麦克风阵列的作用不仅仅限于语音采集,它还可以对采集到的语音 信号进行包括定位、语音识别、空域滤波、语音增强等在内的各种操作。但是,若采 用传统的单麦克风是根本无法实现和发展这些功能技术的。与单个麦克风相比,麦克 风阵列还具备拾音范围广阔、信噪比高、受环境混响影响小等优点,所以在语音信号 处理中采用麦克风阵列成为近年来的热点。 所谓麦克风阵列【,即将多个麦克风排列成线形、圆形等几
28、何拓扑结构的各种阵列。 与单个麦克风不同,麦克风阵列通过增加空间域,不仅对采集到的信号进行时域和频 域分析处理,还实现了对位于不同方位的空间信号进行空时联合处理,使其具有了定 位跟踪和空域滤波的特性【2 J 。而两者作为麦克风阵列信号处理的基础,定位跟踪又是空 域滤波的前提,所以在语音信号处理技术中定位跟踪扮演着极其重要的角色。例如: 在语音增强中,只有明确了说话人的方位信息,我们才能进一步调整麦克风阵列的波 束方向,进而实现语音增强;在音频视频会议中,说话者不一定一直处于某一位置, 所以通过对说话人位置的定位跟踪,可以使麦克风或者摄像头根据说话人的位置信息 自动对准他她。而所谓基于麦克风阵列
29、的声源定位与跟踪,就是将多个麦克风按照一 定的规则组成各种阵列结构,对获取的信号结合语音信号处理技术和阵列信号处理技 术及算法进行预处理和空时联合处理,从而得到说话人在空间所处的位置信息,比如: 距离、方位角和俯仰角等参数。 然而,由于研究时间较短,目前在麦克风阵列信号处理方面尚存在一些问题,比如: 算法复杂度高,实时处理能力不足,跟踪误差大等。如何在保证麦克风阵列探测精度 的前提下尽可能提高系统响应时间,是目前研究的重要内容之一。 1 2 麦克风阵列近场声源定位的国内外研究现状 B r a n d s t e i n 3 1 将基于麦克风阵列的信号源定位技术大体分为三类:基于最大输出 功率的
30、可控波束形成技术45 】;基于到达时间差( t i m ed i f f e r e n c eo f a r r i v a l ,T D O A ) f l 勺定 位技术【6 】;基于高分辨率谱估计的定位技术7 1 。在实际应用中,基于最大输出功率的 可控波束形成技术,对于声源及环境噪声的相关信息往往需要预估计,而这些信息往 西南交通大学硕士研究生学位论文第2 页 往很难获得,所以应用并不广泛。而基于T D O A 的定位方法算法简易方便、计算量小, 易于实现;但缺点在于:首先,该方法分为时延估计和定位两个阶段来完成,这就导 致时延估计时的误差会进一步传递到位置估计当中,从而产生误差积累;
31、其次,由于 T D O A 估计性能的好坏依赖于信号的采样数目,所以无论是基于互相关函数还是传递 函数求取的时延,对信号的采样频率都有着特殊的要求;此外,这种定位方法在多源定 位上存在盲点,所以仅适用于单个声源定位。高分辨率谱估计是一种超分辨率估计技 术,在一定条件下可以达到任意的定位精度,且与T D O A 估计不同,其空间分辨率不 受信号采样频率的限制,同时还可以解决T D O A 估计方法无法解决的多源定位问题。 因此,本文将采用高分辨率谱估计技术对近场声源进行定位研究。下面重点介绍有关 空间谱估计M U S I C 算法在近场声源定位上的国内外研究现状: 2 0 0 0 年,F A s
32、 a n o ,H A s o h 和T M a t s u i1 7 J 在应用于办公室智能机器人的系统中提 出了二维近场声源定位M U S I C 算法,该算法将传统的M U S I C 算法瞵J 进行扩展并和均 匀线阵二维近场声源信号接收模型相结合,实现了对近场声源水平角和距离的二维定 位。然而,在实际情况下,语音声源通常处于三维空间,因此,居太亮、彭启琮、林静 然等人 9 - 1 5 在均匀线阵二维近场信号模型的基础上,将麦克风阵列扩展到了均匀圆阵、 均匀球面阵以及任意结构麦克风阵列的三维信号接收模型,并在此基础上将近场二维 M U S I C 算法扩展到了三维空间,实现了声源三维定位
33、;同时针对近场M U S I C 算法计 算量大、定位精度较差的问题,提出了将宽带聚焦算法与近场M U S I C 算法相结合的宽 带聚焦2 D M U S I C 和3 D M U S I C 新算法I l 6 J 【l7 1 。该类算法在一定程度上减小了算法的计 算量,并提高了定位性能,但该算法的主要问题仍然在于计算量大、实时性不强,不 能解相干。胡郢等人I l8 J 采用一种基于T 型阵的近场三维M U S I C 声源定位法来解决算 法计算量大的问题,该方法将原有的三维空间谱矩阵运算及谱峰搜索分为了一个二维 空间谱矩阵求解及谱峰搜索和一个一维空间谱矩阵求解及谱峰搜索,但这种方法是在 单
34、个声源的情况下进行定位的。殷作亮等人I l9 J 在二维空间针对信号源为相干信号这种 特殊情况,利用空间平滑去相干方法进行了定位研究,但是其只适用于均匀线阵麦克 风接收模型。2 0 1 0 年,J u n l iL i a n g 和D i n gL i u t 2 0 】提出了混合场声源( 近场、远场同时存 在) D O A 估计,这种方法运用两次M U S I C 算法使用累计量矩阵对非相干声源进行定位, 该方法将二维空间谱矩阵计算和谱峰搜索降低为两个一维空间谱矩阵计算和谱峰搜索 进而降低了算法计算量,且减少了孔径损失。C h u n L i L i u 和H s u e h M i n
35、gH a n g 等人【2 l 】 提出了将M U S I C 算法与I C A 方法相结合的新的定位方法,该方法能够对两个非相干 声源同时进行定位及分离。 通过上面对基于M U S I C 算法的近场声源定位的国内外研究现状进行分析不难发 现:减少算法计算量、提高声源定位的实时性,仍然是基于麦克风阵列的声源定位需 要解决的关键性问题。 西南交通大学硕士研究生学位论文 第3 页 1 3 麦克风阵列近场声源跟踪的国内外研究现状 当信号处于运动状态时,其D O A 通常是随时间变化的函数,在这种情况下,传统 的D O A 估计算法由于采用批处理操作而不能满足实时的需求,需要研究对D O A 进行
36、实时跟踪的算法。 王安定1 2 3 J 将信号D O A 跟踪算法大体分为三类:基于移动目标的动态状态模型, 即卡尔曼滤波技术;基于空域滤波的自适应跟踪方法;基于子空间的参数估计方 法。基于移动目标的动态状态模型算法通常需要移动目标的位置、速度、加速度等统 计信息,所以在实际应用中很难得到较好的实现。基于空域滤波的自适应跟踪方法, 其主要思想是采用空域滤波的概念【2 42 5 J 和梯度下降方法对信号和噪声进行空域分离, 然后对信号进行角度估计,然而在实际应用中,空域滤波通常会对模型产生一定的扰 动,从而降低算法的性能,且其算法复杂度很高。由于子空间的参数估计法具有高分 辨率、高精度的特点,从
37、而在空间谱估计及跟踪方面得到了广泛的应用。因此,本文 采用基于子空间的参数估计方法对近场声源进行跟踪分析和研究。 基于子空间的参数估计方法通常分为两类:第一类是经典的子空间方法,其思想主 要是通过修正和推广采用批处理方法对协方差矩阵的奇异值分解或特征值分解,使之 成为自适应的方法。例如:新的矩阵秩显露U R V 分解【2 5 j 和秩显露Q R 分解【2 6 | ,以及基 于子空间代价函数的方法I i7 J 和基于矩阵的特征向量更新估计的扰动技术f 2 s 】等。与该方 法不同,另一类方法则是将确定信号的特征子空间矩阵当作最优化问题来求解,而最 优化又包含了约束最优化和无约束最优化。约束最优化
38、采用共轭梯度法或随机梯度法 来求解;无约束最优化则利用R L S ( 递归最小二乘法) 对信号子空间进行迭代更新,将 子空间矩阵视为无约束最优化问题求解,其典型代表是B Y a n g 2 93 0 J 在1 9 9 5 年提出的 P A S T ( 投影逼近子空间跟踪) 算法及改进的P A S T d ( 压缩投影逼近子空间跟踪) 算法。由 于此类算法具有较快的收敛速度、较低的跟踪误差和较低的算法复杂度,使其已经在 信号处理的多个方面得到了广泛应用。此后,出现了很多对该类算法的改进,例如: 改进的正交投影逼近子空间跟踪( O P A S T ) p l J 算法,其针对P A S T 算法中
39、子空间不能完 全正交的缺点,严格正交化每次更新得到的信号子空间的特征矢量,使其收敛性能更 好,但是其算法复杂度较高。 2 0 0 0 年,MC h o 和JC h u np 2 J 提出了基于时间分割的方法对宽带信号进行D O A 跟 踪,该方法通过对聚焦变换矩阵的不断迭代更新,实现了对宽带信号D O A 参数的实时 跟踪。D a i s u k eT s u j i 、N o b o r uO h w a d a 和K e n j iS u y a m a 3 3 - 3 5 1 等人采用P A S T 算法实现了 对一维单声源D O A 的跟踪:同时针对算法计算量大等问题,提出了将改进型的
40、P A S T d 算法用于声源D O A 跟踪,并采用I P L S 算法【3 6 】替代M U S I C 谱峰搜索来减小算法的计 算量,不仅降低了算法复杂度、实现了多声源跟踪,而且进一步提高了算法的跟踪性 能。L e n aC h a n g 和C h i n g - M i nC h e n 9 1 3 7 1 采用自适应子空间跟踪算法实现了近场声源距离 西南交通大学硕士研究生学位论文 第4 页 和俯仰角的二维D O A 跟踪,算法同时通过近远场转换,实现了二维空间谱矩阵到一维 空间的转换运算,减小了算法计算量。但是,上述算法均为一维或二维声源D O A 跟踪, 均未对近场三维声源D
41、O A 跟踪进行研究,且算法复杂度较高,所以对于近场声源的 D O A 跟踪还有很大的扩展空间。 1 4 本文主要工作及内容 本论文主要针对基于麦克风阵列的近场声源定位与跟踪算法进行研究,重点在减小 计算量的基础上,保证算法良好的定位及跟踪性能。本文的主要工作和任务安排如下: 第一章,绪论。简单介绍了本论文的研究背景及意义,总结概括和分析了基于麦克 风阵列的近场声源定位与跟踪在国内外的研究现状。 第二章,语音信号特性及阵列模型特征。首先,本章对语音信号的时频特性进行了 分析,并采用语谱图对其时域和频域特征进行了联合分析研究;然后,结合传统窄带 远场均匀线阵平面波模型研究了麦克风阵列近场球面波模
42、型,给出了麦克风阵列的均 匀线阵、均匀圆阵近场接收模型;最后,将阵列信号接收模型扩展到任意拓扑结构, 并对其特征进行了分析和介绍。 第三章,预处理和语音端点检测。针对语音信号的宽带非平稳特性,本章对接收数 据的预处理和端点检测进行了研究分析。针对语音去噪,文中通过采用自适应小波分 解层数选取和改进型阈值函数相结合的方法,提高了小波语音去噪的效果。 第四章,基于麦克风阵列的近场声源定位。本章采用均匀圆阵麦克风近场信号接收 模型,对近场3 D M U S I C 算法和宽带聚焦3 D M U S I C 算法进行了对比研究。针对均匀 圆阵等传统麦克风阵列对三维近场声源的俯仰角定位产生角度模糊的缺点
43、,提出了改 进型的麦克风近场信号接收模型;并在此基础上针对宽带聚焦3 D M U S I C 算法中三维 平均空间谱矩阵求解及谱峰搜索计算量大的问题,提出了分步降维估计法来减小算法 计算量,最后通过实验仿真验证了其良好的定位性能。 第五章,基于麦克风阵列的近场声源跟踪。本章首先简要介绍了投影逼近子空间 ( P A S T ) 算法及其改进的压缩投影逼近子空间( P A S T d ) 算法,然后将基于P A S T d 算法的 D O A 跟踪应用于近场三维声源跟踪。针对P A S T d 算法跟踪误差和收敛速度不能兼顾 的缺点,提出可变遗忘因子P A S T d 算法。最后,通过仿真实验验证
44、了改进算法良好的 D O A 跟踪性能。 西南交通大学硕士研究生学位论文 第5 页 第2 章语音信号特性及阵列模型特征 2 1 语音信号的特征 所谓语音信号,就是人们在说话时声带发出的语音声波所携带的语音信息。语音信 号的特性主要表现在时域和频域两个方面,下面重点对语音信号的时域波形和频域特 征进行分析研究。 2 1 1 语音信号的时频特性 针对时域特性,语音信号可以通过其随时间变化的波形表达出一些重要信息,而频 域特征则表现了语音信号的的整体频谱分布。图2 1 所示,为一段男声语音信号的时 域波形和频谱特性,其采样频率为8 K H z ,采样精度为1 6 b i t 。 釜。肌 语音信号的时
45、域波形 00 2o 4o 6o 811 2 时间s 语音信号的频域波形 10 0 015 0 02 0 0 02 5 0 03 0 0 03 5 0 04 0 0 0 频率H z 一 图2 1 语音信号时域波形及频谱特性 由上图可知,语音信号是时变的、宽带非平稳信号。作为语音信号特性分析的两种 重要方法,虽然时域波形和频域变换在一定程度上反映了语音信号的特征,但是如果 只是独立地采用时域和频域进行分析,则存在一定的局限性:其一、时域波形不能对 语音信号的频域特性进行直观认识,其二、频谱特性又体现不出非平稳语音信号的频 率随时间变化的关系。所以,人们致力于将时域和频域进行联合分析,把信号的频谱
46、随时间变化的图形称作语谱图。下面就来研究语音信号的语谱图。 薹一O批一5 粕一 n蛞氍*,一;,0Hd*ijiIf一 鼬旰一 P k 0 O O 0 O 5 0 5 型坚 西南交通大学硕士研究生学位论文 第6 页 2 1 2 语音信号语谱图 语谱图,指体现语音信号在各个时间点的频谱特征的图形。图2 2 为图2 1 所示语 音信号的语谱图,其横轴表示时间,纵轴表示频率,在给定的时间、给定的频率相对 应点的灰度值或色调的浓淡表示了该点频率的强弱。语谱图是对语音信号时域波形图 和频域特特征图的联合分析,其清楚地显示了语音信号的频率随时间的变化情况。 语音信号的语谱图 时I 司s 图2 2 语音信号的
47、语谱图 由图2 2 中各个定点的灰度值可以看出,语音信号的频率主要集中在1 0 0 2 0 0 0 H z 之间,是多频宽带信号,其频谱不断随时间变化,证明其为非平稳信号。但同时我们 可以看出,在很短的时间( 如3 0 m s 左右,即一帧) 之内其频谱几乎是不随时间变化的, 证明其具有短时平稳性【3 9 1 。 2 2 阵列信号处理模型 根据信号的频域特征表现,可以将信号大体分为窄带信号和宽带信号两类,所以宽 带信号和窄带信号的评判标准很重要。设信号s ( t ) 的带宽为B ,中心频率为f o ,如果兀 和B 满足如下条件【4 0 】: 业 1 ,一般取业 1 0( 2 1 ) BB 、。
48、 则信号s ( t ) 为窄带信号。若信号s ( ,) 不满足上述条件,则为宽带信号。其中,式中兀 :髀 ( 2 - 2 ) 凡一面面i u 吃 4 3 2 1 0 N工芒簪嚣 西南交通大学硕士研究生学位论文 第7 页 B = 上面两式中的s ( c o ) 是s ( f ) 的频谱。 2 2 1 窄带信号处理模型 ( 2 - 3 ) 传统的窄带信号处理模型是阵列信号处理的基础,其处理信号为远场窄带平面波, 可以表示如下【4 1 】: 燃S 三篙:卜咖卵叫, p 4 , l ,O r ) = “O r ) P 八州” 岬1 ” 、7 式中,甜心) 表示阵元接收到的第i 个信号的幅度,为第i 个
49、信号的中心角频率, 国。= 2 矾,缈( f ) 为第i 个信号的相位。由于信号为窄带远场信号,则有 j 甜,o f ) 甜, ( 2 - 5 ) 【缈( ,一r ) 妒( ,) 根据式( 2 - 4 ) 和( 2 5 ) ,可得 S 。O f ) S ,( t ) e 叫7 i = 1 , 2 ,N( 2 6 ) 以远场均匀线阵为例,设个远场窄带信号S 。( ,) ,S :( ,) ,S ( r ) 分别入射到由M 个 阵元( M N ) 组成的均匀线阵上,入射角分别为q ,幺,氏。以第一个阵元作为参考 阵元,据式( 2 6 ) 可得,阵列接受的信号为: 五( f ) x z ( t ) (
50、 ,) 1 e J “b 7 2 2 e 一,嘞2 墨( f ) S 2 ( f ) : s N ( t ) + n l ( t ) I 1 2 ( ,) n M ( f ) = 【口( q ) ,口( 包) ,口( 氏) 】 J 。o ) ,s :o ) ,s v o ) 】r + 琏o ) ,z :O ) ,行M O ) 】r ( 2 - 7 ) = A S + 式中,C O 。= 2 矾= 2 h e 2 ,A 为波长,C 为光速,丁。为相对于参考阵元,第个阵元接 收到的第i 个信号的时间延迟,甩,( ,) 为第个阵元接收到的环境噪声。将式( 2 7 ) 写成矢 量形式为: X ( t
51、) = A S ( t ) + ( f )( 2 - 8 ) 。 2 2 2 宽带信号处理模型 根据上节窄带信号处理模型可知,在不考虑增益的理想情况下,阵列中第,个阵元 接收到的数据可以表示如下: x 心) = s ,( t - Z ,) + 刀心) ,= 1 ,2 ,M( 2 - 9 ) i = l n 屯 “ 哳 , 一 一 1 P; P 】 , 屯 h , 一 一 1 P; P 西南交通大学硕士研究生学位论文 第8 页 由于语音信号为宽带信号,每一时刻信号所对应的频率不是单一的。其阵列流形矩 阵爿( 方向矢量阵) 不仅跟信号的入射方向等有关,还与其频率有关,这就导致上节模型 不能直接运用
52、。 由于语音信号的短时平稳特性,因此,选取一个较短时间段( 一般为2 0 3 0 m s ) 的 数据作为一帧数据,对接收信号进行加窗分帧,那么信号对应的每帧数据都可以认定 为平稳信号。对任意一帧数据进行J 点的D F T 4 2 1 ,则阵元接收数据可以表示为: x ( L ) = 彳( 厂) s ( ) + N ( L ) = 1 , 2 ,J ( 2 1 0 ) 上式中s ( L ) 、N ( f j ) 、x ( 一) 分别为频率点时的声源、噪声和麦克风阵列的接受数 据。另外,式( 2 - 1 0 ) 的阵列流型矩阵A ( L ) 可以表示为: 彳( 工) = a 1 ( 工) a 2
53、 ( ) a N ( 乃) ( 2 - 1 1 ) 其中,q ( ,) = e - r e 4 e - J 2 z 乃b P 川啊 7 。 2 3 麦克风阵列语音信号处理模型 在介绍麦克风阵列语音信号处理模型前,首先简要介绍什么是远场和近场模型。所 谓远场模型,就是指声源和麦克风阵列的距离比较远,声源到达麦克风阵列各个阵元 的相位差很小,可以忽略不计,此时采用的信号模型为平面波模型;而近场模型,指 声源距离麦克风阵列的距离较近时,信号到达各个阵元的相位差不可忽略,此时的信 号模型为近场模型,采用球面波模型。如图2 3 为远场模型和近场模型的示意图。 。 声源 a ) 远场模型b ) 近场模型
54、图2 - 3 麦克风阵列远场模型和近场模型 目前,常用一个经验公式【4 3 1 来对近场和远场进行划分区别: r :孚( 2 _ 1 2 ) r2 - U 。l z ) 九 式( 2 1 2 ) 中,r 为声源距离参考阵元距离,三为阵列长度,A 为声波波长。在实际的应 用中,可以将式( 2 1 2 ) q b 的,和声源与参考阵元的距离厂0 进行比较来区分近远场:如果 ,则信号位于远场。 西南交通大学硕士研究生学位论文 第9 页 2 3 1 麦克风远场均匀线阵信号模型 远场模型的典型阵列结构为均匀线阵,其将M 个麦克风等间距地摆放在一条直线 上所构成,而各个阵元之间的距离通常采用信号波长的一半
55、。对语音信号来讲,其频 率主要集中在1 0 0 3 4 0 0 H z 之间,其在空气中的波长通常为1 0 3 4 0 c m ,综合考虑阵列 尺寸及空间采样定理可得麦克风阵列的阵元间距通常在6 1 5 c m 之间。 由于远场模型的阵元波前模型为平面波,所以各个阵元接收到的信号相位相同,图 2 4 所示,为均匀线阵的远场模型。模型中将第一个阵元作为参考阵元,看做线性麦克 风阵列的中心。 声源S 麦克风 图2 - 4 均匀线阵远场模型 由2 2 2 节可知,阵元接收信号不仅与信号的入射角有关,还与信号的频率有关。 根据式( 2 7 ) 可得,均匀线阵远场接收信号可以表示为: x ( o J ,
56、) = e - J 。2 2 e - J I M 2 s 2 ( 国,) ( 国,f ) + r z l ( c o ,f ) n 2 ( ( - o ,f ) ( 国,f ) ( 2 - 1 3 ) 式中,国为宽带信号分帧并进行D F T 后的某一角频率。式中f 为第i 个信号到达 第个阵元相对于到达第一个阵元的时间延迟。根据图2 - 4 所示,丁,j 表示如下: r ,:业型业( 2 1 4 ) 。 C o 其中,为声速,C o = 3 4 4 m s 。 2 3 2 麦克风近场均匀线阵信号模型 首先,与远场不同,近场模型需要考虑信源到各个阵元的相位差,即信源到各个阵 元的距离不再相同,定
57、位空间从一维扩展到二维。其次,信源到各个阵元的声波幅度 衰减也不可忽略。由声波的传播特性【删可知:由于随着声波传播距离的增长,声波的 声压会逐渐降低,所以声波幅度的增益与声源的传播距离成反比。图2 5 所示为麦克 N n 屯 “ 甜 , 一 一 P P , 砭 “ 一 一 P; P 西南交通大学硕士研究生学位论文 第l O 页 风近场均匀线阵模型。 。 与图2 4 相比,图2 5 引入了任一声源薯( t ) 与各个阵元的距离参数,:,以阵列中心 为参考点,s ,( t ) 到参考点的距离为l ,其他参数与图2 4 相同。因此,只要求出0 就可 以得到信号的传输方向矢量A 。根据图2 5 所示几
58、何结构可得: 。= 厄忑再瓦研 d j = j xd 图2 - 5 近场均匀线阵模型 根据式( 2 - 7 ) ,( 2 - 1 5 ) ,( 2 1 6 ) 可得,近场均匀线阵接收信号可以表示为: X ( 国,f ) = ;j 掣 i P 圳掣 吃1 ; 上e - ,掣 三一,掣e - = - r 2 - J 掣e 。u 乞 ; 艺圳掣e L u 盟e 圳掣 丘P 圳掣 屹v i; 丘。- ,m 掣 一g 2 3 3 麦克风近场均匀圆阵信号模型 s 1 ( 国,f ) s 2 ( 国,t ) s ( 国,f ) + 门1 ( 国,f ) n 2 ( c o ,t ) n ,( c o ,r
59、) 麦克风 ( 2 1 5 ) ( 2 1 6 ) f 2 - 1 7 ) 由均匀线阵到均匀圆阵,麦克风阵列的模型由一维扩展N - 维,声源的定位也从二 维扩展到了三维空间一J ,声源定位包含了距离、方位角和俯仰角。均匀圆阵模型如图 2 - 6 所示,假设坐标原点D 为参考点,第一个麦克风所在的半径作为参考线( 图中虚线) , 任一声源s ,( t ) 在x o y 平面的投影为O P ,投影O P 与参考线的夹角仍为方位角,s ,( t ) 与2 轴的夹角谚为俯仰角,I 为声源到参考点的距离,r 。为声源s ,( f ) 到第个麦克风的距离。 麦克风的个数一般选取4 1 6 个,均匀圆阵的半径R 一般选择1 0 3 0 c m 。 西南交通大学硕士研究生学位论文 第1 1 页 由图2 - 6 可得: 9 p = 9 ;+ 2 x ( j 一1 ) M 。:肛阳开:厅再习丽画画 ( 2 1 8 ) f 2 - 1 9 ) 则该声源s ( t ) 在频率为国时对应的方向矢量为: 咖删:“掣,土P - ,甜掣,土P 巾掣】丁 ( 2 2 0 ) ,眨,锄 将式( 2 2 0 ) 带入式( 2 7 ) 即可得均匀圆阵信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国四氟丙醇市场风险评估及前景产销规模预测报告
- 侵袭性真菌病诊疗指南修订2026
- 电阻率测量报告
- 金属材料工程就业前景分析
- 七年级数学教学工作计划书怎么写(25篇)
- 职业规划:实现梦想的路径
- 历年护理学研究自考试题及答案
- 历史教案板块四世界古近代史第九单元第28讲中古时期的亚洲非洲和美洲
- 2026年贵州省国家公务员考试《申论》真题和答案
- 2025年广西壮族自治区防城港市初二地生会考考试试题及答案
- XJJ 077-2017 高性能混凝土应用技术规程
- 一片叶子的奥秘科学课件
- 重庆特产课件
- 医师责任保险制度:现状、问题与发展路径探析
- 病区临床护理技术操作常见并发症考题(有答案)
- 党建专员面试题目及答案
- 2023版水利工程强条
- 军品科研生产管理制度
- 麻醉科三基三严考试试题及答案
- Amfori BSCI社会责任验厂全套管理手册及程序文件
- 疤痕培训课件
评论
0/150
提交评论