




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、本科毕业设计(论文)基于麦克风阵列的声源定位方法研究石波燕 山 大 学2011年6月本科毕业设计(论文)基于麦克风阵列的声源定位方法研究学 院:电气工程学院 专 业:工业自动化仪表 学生 姓名: 石波 学 号:070103020023 指导 教师: 林洪彬 答辩 日期: 2011-6-24 燕山大学毕业设计(论文)任务书学院:电气工程学院 系级教学单位:自动化仪表系学号070103020023学生姓名石波专 业班 级仪表07-3题目题目名称基于麦克风阵列的声源定位方法研究题目性质1.理工类:工程设计 ();工程技术实验研究型( );理论研究型();计算机软件型( );综合型( )2.管理类(
2、);3.外语类( );4.艺术类( )题目类型1.毕业设计() 2.论文( )题目来源科研课题( ) 生产实际( )自选题目() 主要内容1、设计阵列声音信号处理硬件平台;2、掌握通过麦克风阵列进行声源定位的算法步骤;3、在硬件平台上编程实现声源定位;4、分析算法的性能。基本要求1、方案设计合理、查阅文献充分;2、理论分析正确、论证严密;3、设计、仿真模型可靠,结果与理论相符;4、毕业设计论文符合撰写规范、要求。参考资料1、谢锋.基于麦克风阵列的声源定位方法研究.大连理工大学硕士学位论文, 20082、周浩洋.基于麦克风阵列的声源定位方法研究.大连理工大学硕士学位论文, 20023、张贤达.现
3、代信号处理.清华大学出版社,2002周 次第14周第58周第912周第1316周第1718周应完成的内容查阅资料阅读文献方案论证总体设计理论分析模型研究软件设计仿真调试撰写论文准备答辩指导教师:林洪彬职称:讲师 2010年12月15日系级教学单位审批: 年 月 日摘要麦克风阵列技术是当前语音信号处理领域的研究热门,在噪声抑制和声源定位等场合有着广泛的应用,被认为是最有前景的语音增强技术。本文的研究设计了一套以延时估计为算法核心的声源位置定位技术,具体完成的工作如下:首先,充分了解关于麦克风场模型有关声音信号的相关理论知识,包括声源信号和噪声信号产生的原因及理论处理办法,声源宽带,窄带信号模型和
4、远场近场模型的的区别与选取,麦克风定位阵列结构的选择和实现办法。其次,为了更好的了解麦克风阵列延时定位估计算法,将国内外现有的延时估计算法做出分类与区别,重点讲述了本文所用到的互相关函数法的实现原理,比较了各种延时估计的试用条件与范围。最后,在Matlab平台上进行了仿真定位实验,对400个点进行定位,并根据定位方法中出现的情况逐个进行分析,得到实验结果,并在此基础上求出各点定位的误差精度,分析误差出现原因,验证了设计方案的可行性,指出此定位方法改进的方向。关键词:麦克风阵列;延时估计;声源定位AbstractNowadays,microphone array is playing all i
5、mportant role in many fields,Such as speech enhancement,speaker localization and speech recognition, and it is considered the most promising voice enhancement technology. This paper provide a kind of Sound localization technology which treat the time delay estimation as the core location technology
6、, the specific work done as follows: First, the full field model about the microphone sound signal on the theory of knowledge, including the source signal and noise signal causes and theoretical approach, the source of broadband, narrowband signal model and the near-field far-field difference betwee
7、n the model and selection, Position the microphone array structure of the selection and implementation approach. Secondly, in order to better understand the positioning of the microphone array delay estimation algorithm, the delay estimation algorithm at home and abroad to make the existing classifi
8、cation and distinction, this paper focuses on the cross-correlation function of the method used to achieve the principle of comparing various delay the trial conditions and the estimated range. Finally, take a 400-point positioning simulation on Matlab platform test, and positioning method according
9、 to happen one by one analysis, the experimental results and calculated on this basis, the error of the point positioning accuracy analysis reason for the error appears, verify the design feasibility, positioning the direction of this methods. Key Words:Microphone Array;Time Delay Estimation;Speech
10、enhance目 录摘要IAbstractII目 录III第1章 绪论11.1 论文的研究背景11.1.1 麦克风阵列概述11.1.2 麦克风阵列的应用11.2 声源定位方法概述21.2.1 基于麦克风阵列的声源定位方法21.2.2 基于最大输出功率的可控波束形成的定位方法21.2.3 基于高分辨率谱估计的定位方法31.2.4 基于声波到达时间差(TDOA)的定位方法41.3 论文结构安排6第2章 麦克风阵列理论基础72.1 声源信号模型72.1.1 语音信号72.1.2 噪声信号72.2 窄带信号模型与宽带信号模型82.2.1 窄带信号数学模型82.2.2 宽带信号数学模型92.3 近场模型
11、与远场模型92.3.1 声波传播特性92.3.2 近场模型102.3.3 远场模型112.4 麦克风阵列的几何拓扑112.4.1 麦克风阵元间距122.4.2 麦克风阵元个数122.4.3 麦克风种类122.4.4 麦克风阵列结构选择132.4.5 麦克风阵列结构性能评价142.5本章小结15第3章 麦克风阵列信号延时估计163.1 阵列信号延迟估计概述163.1.1 基本问题163.1.2 基本模型163.2 延时估计体系183.2.1 延时估计算法的分类183.2.2 空间谱估计193.2.3 广义互相关函数法203.2.4 GCC算法族213.2.5 基于方向估计的算法213.2.6 基
12、于最小熵原理的算法223.2.7 互相关函数法233.3 本章小结25第4章 仿真定位实验264.1 信号的产生与接收264.1.1 声源模型264.1.2 信号点接收模型264.2 接收信号的处理284.2.1 互相关函数284.2.2 定位方法304.3 定位结果分析314.3.1 定位结果情况314.3.2 定位结果选取324.4 定位误差分析334.4.1 误差计算与分布334.4.2 误差来源344.5本章小结34结论36参考文献37致谢39附录1 开题报告40附录2 文献综述46附录3 中期报告52附录4 中文翻译57附录5 英文原文65附录6 实验程序75第1章 绪论随着语音识别
13、技术的发展,语音识别系统在人们生活中得到了越来越广泛的应用,但影响语音识别系统进一步推广的主要障碍就是噪声对识别率的严重影响。从上个世纪六十年代开始,人们对此问题展开了深入的研究,提出了不少有效的噪声抑制技术。而麦克风阵列技术是当前最为热门和被业内认为最有前景的一种语音增强技术。本章将介绍本论文的研究背景以及当前国内外麦克风阵列技术的研究现状。1.1 论文的研究背景1.1.1 麦克风阵列概述在二维或者三维空间中,按照某种几何拓扑方式组合的一系列麦克风传感器系统称为麦克风阵列。每个传感器的输出由源语音信号和各种噪声叠加而成。麦克风阵列接收到的信号,利用阵列信号处理技术,可以消除噪声对源语音的影响
14、,确定信号源的数量、位置、强度、运动状态等信息。麦克风阵列技术主要涉及到的理论知识包括:离散时间的语音信号处理、统计信号处理理论、自适应信号处理和阵列信号处理理论。需要注意的是,尽管麦克风阵列技术最初是由天线阵列、雷达阵列信号处理技术发展来的,而且很多麦克风阵列信号处理过程中遇到的问题跟天线阵列信号处理中遇到的问题很相似,但是在实际中,这两项技术还是有很大的区别,主要原因是:语音信号是宽带信号,其频带分布范围很广,混响现象对信号处理结果的影响很明显,噪音很有可能跟声源具有完全相同的特征1。鉴于此,很多在天线阵列信号处理中表现优秀的算法,在麦克风阵列中却不能工作得很好。1.1.2 麦克风阵列的应
15、用目前麦克风阵列技术在以下几个研究领域已经取得了一定的成果:噪声抑制、回音抑制、混响消除、单个或多个声源的定位、声源目标跟踪、声源个数估计、声音信号源的分隔等。此外,基于麦克风阵列的语音降噪系统在实际中也已经有大量成功应用的案例,主要可以分为两类:(1)数字助听器目前在数字助听器中,麦克风阵列技术得到了日益广泛的应用。传统助听器在噪声环境下不能很好地区分语音和噪声,在增强目标语音信号幅度的同时也增强了噪声的幅度。而麦克风阵列可以利用目标语音和噪声在空间域的差异来克服以上问题,从而达到更好的语音增强效果。(2)非手持式麦克风在某些场合下,使用近距离的麦克风或者手持麦克风的条件不允许,如汽车移动
16、和视频会议等应用。在很多国家出于安全考虑,驾驶时禁止使用移动 。由此可见非手持式麦克风的市场前景十分广阔,根据市场研究报告,视频和网络会议系统的市场在2006年已经突破98亿美元,这些都显示了非手持式麦克风的巨大市场潜力。1.2 声源定位方法概述 1.2.1 基于麦克风阵列的声源定位方法基于麦克风阵列的定位问题简而言之就是利用一组按一定几何位置摆放的麦克风定出声源的空间位置2。现有的基于麦克风阵列的声源定位方法主要分为三类:第一类是基于最大输出功率的可控波束形成技术,它是对传声器阵列接收到的信号进行滤波及加权求和,然后直接控制传声器阵列的波束,使其指向具有最大输出功率的方向;第二类是基于高分辨
17、率谱估计技术,通过求解麦克风阵列接收信号之间的相关矩阵来定出声源方向;第三类是基于声波到达时间差技术,该方法首先求出声源信号到达空间不同位置麦克风的时间差,再利用该时间差求得声源信号到达不同位置麦克风的距离差,最后用搜索或几何知识确定声源方向。1.2.2 基于最大输出功率的可控波束形成的定位方法 基于可控波束的定位算法,是早期的一种定位方法。该方法的基本思想是采用波束形成技术,调节麦克风阵列的接收方向,在整个接收空间内扫描,能量最大的方位为声源的方位。采用不同的波束形成器可得到不同的算法。该方法在满足最大似然准则的前提下,以搜索的方式,使麦克风阵列所形成的波束对准信号源,从而获得最大输出功率。
18、基于可控波束形成的定位算法,主要分为延迟累加波束算法和自适应波束算法。前者运算量较小,信号失真小,但抗噪性能差,需要较多的阵元才有比较好的效果。后者因为加了自适应滤波,所以运算量比较大,而且输出信号又有一定程度的失真,但需要的麦克风数目相对较少,在没有混响时有比较好的效果。在文献3中最早提出该方法的理论基础,在文献4中进一步得出可控波束定位的理论和实际的方差,并在文献5中将该方法应用于多声源的定位。其原理框图如图1-1 所示。图1-1 可控波束形成器原理框图可控波束形成技术本质上一种最大似然估计,它需要声源信号和环境噪声的频谱特性的先验知识。而在实际使用中,这种先验知识往往很难获得。此外,最大
19、似然估计是一个非线性优化问题,这类目标函数往往有多个极点,且该方法对初始点的选取也很敏感,因此使用传统的梯度下降算法往往容易陷于局部极小点从而不能找到全局最大点。如果采用别的搜索方法,若要力求找到全局最优点,就会极大地增加计算复杂度,从而不可能被用于实时处理系统6-7。1.2.3 基于高分辨率谱估计的定位方法 该方法来源于一些现代高分辨率谱估计技术(如AR模型,MV谱估计,MUSIC算法,特征值分解等8)。虽然该方法成功地应用于一些阵列信号处理的系统中,但在声源定位中的效果并不佳,其原因有以下方面:该方法需要通过时间平均来估计各麦克风信号之间的相关矩阵,这就需要信号是平稳的,且估计的参数是固定
20、不变的。而声音信号是一个短时平稳过程,它往往不能满足这个条件,因此该方法效果和稳定性不如可控波束形成法。此外,该方法往往假设理想的信号源、相同特性的麦克风等这些在实际中不可行的条件。虽然可以通过某些方法减弱这些因素的影响,但这往往需要成倍的增加运算量9。由于房间的混响作用,使信号和噪声有一定的相关性,这也会降低该方法的有效性。这种方法还需假定声源离麦克风的距离比较远,且麦克风是一个线性阵列,这样声波可近似看成平面波。而这对需近距离定位的系统是不可行的10。高精度谱估计技术往往针对窄带信号,而声源信号往往是宽带信号,这也需要以增加运算量为代价来提高定位精度11。1.2.4 基于声波到达时间差(T
21、DOA)的定位方法 基于声波到达时间差定位方法在导航系统、声纳系统等领域都有广泛的应用。该方法主要是估计各麦克风间的相对时间延迟,适合于单个声源的定位。由于每个麦克风时延唯一对应一个双曲面,因此多个麦克风对就可以确定多个双曲面。双曲面之间的交集从某种意义上就是声源的次最优估计。基于此原理产生许多定位方法,各有自己的优缺点12。由已获得的一组麦克风时延值,大体上可以有两种方法确定声源的位置。其一,用已获得的时延求得一个目标函数,通过搜索的方法来确定声源的位置;其二,用次最优的方法通过几何插值的方法估计出声源的位置。基于声达时间差的定方法在运算量上远远小于可控波束形成和谱估计法,可以在实际中实时实
22、现。但是该方法也有不足之处,其一是估计时延和定位分成两个阶段来完成,因此在定位阶段用的参数已经是对过去时间的估计,这在某种意义上只是对声源位置的次最优估计;其二是时延定位的方法比较适合于单声源的定位,而对多声源的定位效果不好;其三,在房间有较强混响和噪声的情况下,往往很难获得精确的时间延迟,从而导致第二步的定位产生很大的误差13。虽然如此,由于声达时间差定位方法的运算量比较少,而且在适当改进后,在一定的噪声和混响下有比较好的定位精度,因此适合于在实际中实时应用。现今使用的声源定位算法基本上基于以上三种声源定位原理。国际上经过多年的研究,现有的方法都是在这三种方法的基础上进行的改进。语音降噪算法
23、麦克风阵列的研究源于早期的雷达和声纳的研究,随着技术的不断成熟,这项技术引入到语音信号的消噪处理中,到目前为止,已经出现了很多基于麦克风阵列的语音降噪算法,主要包括波束形成、后置滤波等方法:(1)波束形成它首先估计麦克风阵列中每个阵元之间收集到信号的时间差,然后根据不同的延迟对每个阵元所接收到的信号进行延迟补偿,最后将补偿后的信号叠加并进行规一化。这种算法实现简单,速度快,缺点是鲁棒性差,一旦信号问的延迟发生的相对变化,则消噪效果明显下降。这种算法的典型代表是Flanagan等人提出的延迟求和波束形成算法14。以及在此基础上,由Frost在1972年提出的线性约束最小均方误差自适应波束形成方法
24、15。(2)后置滤波针对弱相干噪声的去除问题,将维纳后置滤波的方法嵌入到自适应波束形成方法中,形成了具有后置滤波器的波束形成算法,最有代表性的是具有后置滤波器的广义旁瓣抵消器,它取得了较好的消噪效果具体到延时估计的算法,目前国内外的研究主要分为两种思路:一种是基于互相关函数法,进行各种改进,使算法能够在适应较强的噪音环境。在这类算法中最为著名的是Charles H-Knapp提出的GCCPHAT算法16,证明是GCC算法体系中抗噪性能最好的算法17,种思路是先通过传统阵列中的方向估计算法估计出声源的方向,即DOA(Direction Of Arrival),然后再根据阵列的几何形状,计算出各个
25、阵元信号之间的延时。这类算法主要的研究热点在于如何将比较成熟的传统阵列信号处理中的窄带信号方向估计算法应用到麦克风阵列宽带信号的方向估计中。总得来说,如何提高算法在低信噪比和混响环境中的表现依然是当前最有挑战性的研究课题。另外,最近有些学者提出了一些新颖的算法,例如将信息论中的熵理论用于延时估计18一些学者将信号检测理论用于混响模型的建模,以提高混响环境中延时估计的准确性,并取得了一定的成果。1.3 论文结构安排本文共分5个部分:第一章主要介绍了基于麦克风阵列的声源定位技术在现代生活的广泛应用,分析了基于麦克风阵列的信号处理的特点,提出了本课题的研究意义。确定了本课题主要完成的工作内容及论文的
26、结构安排。第二章对时间延迟估计的原理与各种算法进行了比较深入的研究,介绍了麦克风阵列声源定位的理论基础,包括声源信号模型、宽带窄带模型、近远场模型和麦克风阵列的几何结构等给出了各种算法的优缺点及应用场合。第三章主要介绍麦克风列阵的时延估计,包括延时算法的分类,延时估计的体系,本实验使用的互相关函数法的理论依据以及实现办法。第四章实现了一种简单可行的近场声源定位实验系统,并在Matlab上进行仿真。给出了实验结果,并对实验结果进行分析,全文工作的总结,简要概括了本文研究的主要结论。第2章 麦克风阵列理论基础2.1 声源信号模型麦克风不仅收集来自说话人方向上的语音信号,还有很多其他的噪声和干扰,主
27、要包括墙壁或物体的回波信号、背景噪声等。下面分别分析它们各自的信号模型。2.1.1 语音信号在空气中,声音传播的速度与环境的温度和压力有关,在常温和一个大气压下,声速为342m/s。假设声源为点声源,它与麦克风的距离为d,那么声音到达麦克风的时间为,于是有: (2-1)设语音声源产生的信号是s(t),则麦克风接收到的信号为: (2-2)其中表示衰减系数,一般来说衰减系数反比于距离;用表示噪声,它可以分成两部分的加和: (2-3)其中表示干扰噪声,如风扇,电子噪声等,它与语音信号不相关,表示混响噪声,主要来自于房间或其他物体的反射,它与语音信号相关。如果将麦克风视为一个系统,则(2-2)式也可以
28、写成: (2-4)其中表示麦克风系统的冲击响应函数。2.1.2 噪声信号对于单一麦克风所收集到的信号,其中的噪声和干扰主要由所处的声场环境的背景所决定,1.1.2节中已经介绍各种类型噪声的特性;对于具有多个阵元的麦克风阵列,其本身就具有空间特性,因此有必要引入空间噪声场的概念,根据场中的信号特性,我们可以将噪声场分为三种类型:相干噪声场、非相干噪声场和散射噪声场18。设位于空间中的两个点麦克风接收到的噪声信号(离散后)分别为和,(2-5)式定义了噪声相关函数。 (2-5)当时,麦克风阵列位于相干噪声场,此时噪声只有相位和幅度上的差异;当时,麦克风阵列位于非相干噪声场;当时,麦克风阵列位于散射噪
29、声场。在实际环境中,散射噪声场更能描述噪声模型,但为了讨论简便,一般认为在低频段噪声是相干的,在高频段噪声是非相干的。2.2 窄带信号模型与宽带信号模型麦克风阵列所处理的信号主要是近距离的宽带信号,而传统的阵列处理的应用(雷达和声纳)主要处理远距离的窄带信号。本节将分析窄带信号和宽带信号的数学模型。2.2.1 窄带信号数学模型设某个均匀线性麦克风阵列中阵元的个数为M,N个窄带信号分别以入射角抵达麦克风阵列,于是第i个阵元接收到的信号为: (2-6)其中,表示第i个阵元对第j个信号的增益;表示第j个信号到达第i个阵元相对于参考阵元的延迟;表示第i个阵元接收到的噪声信号。在信号源是窄带的假设下,信
30、号可以用(2-7)式的形式表示: (2-7)其中,表示接收信号的幅度,表示接收信号的相位,表示接收信号的频率。因为是窄带信号,因此有: (2-8)综合(2-7)式和(2-8)式,显然有下式成立: (2-9)其中表示第i个麦克风对延迟差为的信号之间的增益差,可以由(2-10)式表示: (2-10)综合(2-6)式和(2-9)式,得到第i个麦克风接收到的信号为: (2-11)2.2.2 宽带信号数学模型对于宽带信号,假设信号的带宽为B,将观察时间T分为J个子段,针对每段的信号进行K个点的离散傅立叶变换,可以得到宽带模型。 (2-12)其中,、和分别表示对应频率k的接收信号、源信号及噪声的离散傅立叶
31、变换;表示为(2-13)式: (2-13)J表示将带宽B的信号划分为J个子带,在每个子带上可以使用窄带信号数学模型进行处理。此外,还有一种处理宽带信号的方法是通过一种宽带聚焦算法,将信号的能量聚焦到一个窄的频带上,然后采用与窄带信号相同的方法来进行处理。2.3 近场模型与远场模型根据声波的传播特性,可以将麦克风阵列信号分为近场模型和远场模型。一般情况下,对于均匀线性阵列,当满足以下条件时即可当作远场模型来处理: (2-14)其中,r为声源到阵列的距离,L为阵列孔径大小,即直线阵列的长度。为声音传播的速度。在近场模型中,需要使用球面波模型,而在远场模型中可以采用相对简单的平面波模型。2.3.1
32、声波传播特性根据声学原理,点声源的振动可以简化为球面波,它具有各向同性。设声源到麦克风的距离为r,麦克风接收到的声压为P,于是有: (2-15)其中,。表示球面所围成体积的增幅,也成为声源强度;表示媒介密度;表示声波速度;表示球面振动幅值;k表示单位波长的圆频率;表示声源振动的初相位角。由此可见麦克风接收到的声压与距离成反比,无论使用何种麦克风,接收到的信号都与声压成正比,于是设接收到的信号为,则有: (2-16)其中P表示比例系数,对式(2-16)求微分得到式: (2-17)再将式(2-16)代入式(2-17),并整理后得到式: (2-18)当r足够大时可以得到,进而得到出,也就是说当声源与
33、麦克风的距离比较大的时候,麦克风位置的小幅变化对于信号的接收没有影响,此时的球面波可以简化为平面波。2.3.2 近场模型当声源与麦克风的距离较近时,对信号的处理必须使用球面波模型。式(2-16)表明信号幅度的衰减与距离成反比。假设系统有K个声,M个麦克风,令麦克风置为参考麦克风,它在空间中的位置坐标为(0,O,0),在极坐标系中,设声音信号源的坐标为,其中表示空间直线距离,表示信号源的方位角,表示信号源的仰角。在同一坐标系中,定义非参考麦克风的位置坐标为,其中,于是麦克风接收到的信号为: (2-19)其中,是声源发出的信号,为噪声,表示幅度衰减和相位延迟参数,由式(2-20)确定: (2-20
34、)其中表示幅度衰减参数,它与距离成反比,表示信号延迟时间。2.3.3 远场模型当声源与麦克风的距离较远时,麦克风阵列中阵元之间接收到信号的幅度衰减的差异很小,于是我们可以忽略信号中振幅的因素。经过进一步简化,可以认为来自较远处的信号互相平行地投射到麦克风阵列的阵元上,如图2-2所示。图2-2 远场模型平面波图中的表示处于远场中的声源,表示到达麦克风阵列两个相邻阵元的信号,表示阵元所接收到的信号,表示相邻两个阵元之间的距离,表示平面波的入射角。从中可以看出,在远场模型下,对于均匀线性阵列,任意相邻两个阵元之间的信号延时都是相同的。2.4 麦克风阵列的几何拓扑麦克风阵列的构建要考虑阵列的几何结构、
35、阵元间距、阵元个数和采用的麦克风类型等因素。在传统的天线系统中,阵列的几何结构为均匀直线阵、均匀圆阵等。均匀直线阵列由于结构简单,同时间序列的采样完全对应,可以采用绝大多数基于时间序列的算法,因此受到了极大的重视,应用也十分广泛。然而,均匀直线阵列也有很多局限性,适用于分扇区的测向系统,每一扇区均需一个直线阵,如扇区的照射角度为120度,整个系统需要呈三角形放置的三个直线阵。由于系统是分扇区工作,因此,在阵列处理中需要切换。圆形阵的阵元均匀分布在一个圆环上,不需要扇区切换,处理较为容易,得到了广泛的应用。这些阵列一般是针对一维DOA系统设计的,用于二维或三维定位系统时,定位性能上不可避免有些缺
36、陷。下面分别讨论在麦克风阵列设计中,阵元间距、阵元个数、麦克风种类以及结构的选择问题。2.4.1 麦克风阵元间距阵元间距的选择与信号源的频率以及系统的采样频率密切相关。在子空间理论中,阵列接收一次数据(一次快拍),就是对空间的一次采样,阵列收到的是一次空间采样后的数据。对于均匀直线阵列,阵元间距相当于时间处理中的采样频率,因此必须满足空间采样定理,即阵元间距必须小于或等于波长的一半。设声波波速为340 m/s,采样频率选择16 KHz,时间分辨率为0-0625 ms,距离上的精度为2-125 cm。为了保证两个阵元之间接收信号所需要的空间信息,阵元间距应远远大于距离精度。2.4.2 麦克风阵元
37、个数阵元个数的选择,应考虑子系统的成本和处理的难易程度。阵元个数选择过少,阵列的空间信息太少,严重影响系统性能;过多又会增加成本和实现的难度。综合考虑以上因素,麦克风阵列一般选择420 个阵元。2.4.3 麦克风种类麦克风的种类很多,通常包括动圈式、电容式、压电式等几种。按照指向性可分为全向、心形指向和超心形指向等;依照内部结构的不同,分为动圈式、电容式、铝带式、炭粒式等;按产生电压的作用原理不同,可分为恒速度式和恒幅度式两类;按对话筒膜片作用力性质不同,可分为压力式和压差式两类。用于定位系统的麦克风,一般选择全向、电容式麦克风。理论分析时,均假设麦克风的体积远远小于阵列间距,从而可以将麦克风
38、近似成一个点。2.4.4 麦克风阵列结构选择一维阵列(均匀直线麦克风阵列) 最简单的阵列结构为一维均匀直线阵列(ULA,uniform linear array)。把M 个麦克风等间距地放置在一条直线上,就组成了均匀直线阵。阵元数目一般为618 个,阵元间距为波长的一半。在麦克风阵列处理中,由于声源的频率f 在1003400 Hz 之间,在空气中声波的波长为10340 cm。综合考虑空间采样定理、阵列尺寸等因素,阵元间距一般为615 cm。设M 个全向麦克风均匀分布在X 轴上,且阵元的坐标为: (2-21)由式(3-26)、式(3-23)和式(3-24),可得均匀直线阵列的接收信号模型,如式(
39、3-27)所示: (2-22)式中: L 为向量省略符号。二维均匀阵列,最常见的均匀圆形阵列(UCA,uniform circle array)。把M 个麦克风等间角度地放置在一个半径为r 的圆周上,就组成了均匀圆形阵。麦克风的个数一般选取620个,阵列的半径一般选择1540 cm。设M 个阵元均匀分布在以坐标原点为半径,半径为r 的XOY 平面上,则阵元坐标为: (2-23)式中:,由式(3-28)、式(3-23)和式(3-24),可得到均匀圆形阵列的接收信号模型如式(3-29)所示: (2-24)式中: L 为向量省略符号;从前面的讨论可以看出,对于二维或三维定位问题,应该对二维或三维空间
40、均匀采样,即空间分布完全对称的阵列,对每一个方向的增益大致相同,因此具有优良的定位性能。按照对称的原则,这里讨论两种三维阵列:均匀球面阵列(USA,Uniform Spherical Array)和三维均匀直线阵列。均匀球面阵列 把M 个麦克风均匀放在一个半径为r 的球面上,组成均匀球面阵。按照等空间采样,阵元个数一般选取8 个(分别位于正六面体的8 个顶点上),12 个(分别位于正20 面体的12 个顶点上),20 个(分别位于正12 面体的20 个顶点上)。或者按等角度采样,选取18 个(分别位于三个相互垂直的平面上,每个平面取8 元均匀圆形阵)等。三维均匀直线阵列 把一维均匀直线阵推广到
41、三维空间,即三维均匀直线阵列。M 个麦克风以间距d 均匀放在X、Y、Z 轴上,组成三维均匀直线阵。2.4.5 麦克风阵列结构性能评价从上面的讨论可以看出,均匀直线阵列具有结构简单,可选择定位算法多,对应得算法复杂度较低等优点,因此应用十分广泛。但是,在整个360 度范围内定位时,必须分扇区工作,即由多个均匀直线阵列组成一个多边形阵列,增加了系统复杂度和实现成本。如果只需要对部分区域定位(实际系统大多如此),可以选择均匀直线阵列。均匀圆形阵列在平面内定位性能十分优越,在三维空间内定位性能也比较好,可以选择的定位算法也很多,适合于绝大部分的定位系统。三维阵列结构较复杂,可以选择的算法不是很丰富,实
42、现成本较高,但是对三维空间定位性能好,适用于需要对三维空间定位的系统。根据几何拓扑结构的不同,可以将目前己在实际中应用的麦克阵列划分为以下几类:一维均匀线性阵列(ULA,Uniform Linear Array)、二维平面阵列、二维均匀圆形阵列、三维球面阵列和三维立方体阵列。由于不同的拓扑特征,它们分别具有不同的空间结构与算法。由于本项目所采用的只为3阵元的均匀三角麦克风阵列采集信号并进行几何结构分析解答,本文只以平面三角阵为例,介绍它们的解答算法。2.5本章小结本章描述了声源信号模型和阵列信号收集模型,介绍了近场模型和远场模型的区别和联系,传统窄带阵列信号处理与麦克风阵列语音宽带阵列信号处理
43、的异同点,最后分析了几种典型阵列的输出方向图。声源信号模型包含语音信号和噪声信号的特性,这是信号产生的起始点。信号在介质中传播到达传感器阵列,并被收集成数据(采样)。如果声源距离阵元较远(远场模型),那么我们可以忽略这个距离,只考虑信号的入射方向和阵元之间的相对位置;如果声源距离阵元较近(近场模型),那么时间(相位)延迟差异不仅和阵元之间的相对位置有关,还与声源与阵元的相对位置有关。第四节介绍了目前最为常见的两种阵列拓扑结构的组成推导了阵元之间的时间延迟,得出了信号不同入射方向与阵列输出增益的关系,分析了阵列拓扑的特点及优缺点。第3章 麦克风阵列信号延时估计信号延时估计在麦克风阵列信号处理中是
44、必不可少的一个步骤。通过延时估计得到的信号到达各个阵元之间的时间差是阵列信号后续处理的必要参数。因此延时估计算法在基于麦克风阵列的语音增强、方向估计、声源定位等应用中都起着非常重要的作用。本章首先对目前现有的延时估计算法进行了分类总结,然后在理论上详细介绍了各种经典的传统延时估计算法,并对各种算法进行了分析和对比。最后在第四节根据作者在研究过程中的实践经验,提出了在信号延时估计中需要注意的问题并给出了相应的解决方案。在本文第四章中将会通过仿真实验数据来验证本章得出的算法和结论。3.1 阵列信号延迟估计概述3.1.1 基本问题时间延迟估计的基本问题就是准确迅速地估计阵列中各阵元接收到的信号之间的
45、时间差。由于阵列所处的环境可能存在各种噪声和混响干扰,接收到的信号往往湮没在噪声和干扰之中,给延迟估计带来很大的困难。在语音降噪的应用中,信号延迟估计是一个重要环节,因为各个麦克风接收到的信号首先必须要进行时间延迟补偿,使各通道语音信号保持同步,也就是使麦克风阵列的注视方向与说话者的方向相一致,这是进行后续处理的前提。一般来说,各种延时估计算法的改进目标都是在于提高算法的健壮性,使得算法能够在较强的噪声环境中或混响干扰下仍然能够精确地估计延时差。室内混响对延时算的性能影响最为明显,如何提高算法在混响环境中的表现一直是国内外研究的热点。3.1.2 基本模型根据麦克风阵列所处的环境,可以将延时估计
46、的模型分为理想模型(free-model)与混响模型(reverberant model)两种。在理想模型中,假设麦克风阵元只接收到通过直接路径到达阵列的声音信号。而在混响模型中,则不仅考虑通过直接路径到达的信号,还包括声源发出的信号通过环境中的物体,如墙壁、桌子等反射后间接到阵列的信号。与理想模型相比,由于间接信号的路径的数量具有不确定性,基于混响模型的算法复杂度要大很多,但由于基于混响模型的算法并不是消极地回避间接路径信号的干扰,而是积极去用数学模型去拟合干扰的影响,所以基于混响模型的算法的延时估计效果要好一些。但由于算法的复杂性,本文主要基于理想模型来研究麦克风阵列的延时估计算法。图3-
47、1 麦克风阵列延时估计理想模型本章后面的讨论假设只有一个声源,麦克风阵列为均匀间隔的直线阵列,如上图所示。声源信号s(k)位于远场范围中,选择第一个阵元为参考阵元,则第n个麦克风阵元在时刻k接收到的信号可以表示为: (3-1)其中表示声音信号在传播过程中的衰减因子,其值介于0,1之间。t表示信号从到阵元1之间的传播时间。表示在第n个阵元上接收到的加性噪音信号。在这里,假设噪音与语音信号以及其它阵元的噪音信号互不相关。表示阵元l与阵元2所接收到的信号之间的延时差。函数表示第r1个阵元信号与第一个阵元之间的延时。由于这里假设使用的麦克风阵列为远场模型中的均匀直线阵,所以有: (3-2)在近场模型中
48、,由于到达阵列的是球面波,所以不再是的线性函数。此时不仅与阵元之间的间隔有关,而且还依赖于声源信号相对于阵列的位置。对于均匀直线阵列,只函数是已知的,所以延时估计的问题可以转化为估计r的问题,通过延时估计算法,从采集到的有限帧的多通道语音信号中计算出。3.2 延时估计体系3.2.1 延时估计算法的分类在麦克风阵列延时估计算法的研究过程中,笔者对现有的算法进行了分类和总结。当然,根据不同的标准,延时估计算法有着不同的分类,比如根据是否具有自适应性,可以分为自适应算法和非自适应算法;根据是从时域还是频域计算可以分为时域算法和频域算法。与这些分类标准不同,下面给出的分类方法主要基于延时估计算法的原理
49、来进行分类。现有算法基本可以划分为以下体系:图3-2 现有延时估计算法的分类体系如图3-2所示,现有延时估计算法(TDOA:Time Difference Of Arrival)根据原理基本可以分为四大类。第一类是根据互相关函数原理来进行延时估计,由于具备算法原理简单、运算量小的优点,这类算法在实际应用中最为广泛。在原始广义互相关函数法的基础上,根据不同的优化原理,设计出了各种基于不同加权函数的延时估计算法,如SCOT-GCC、PHAT-GCC等。第二类是基于最小均方差原理。算法通过寻找使得两道信号之间区别最小的点来估计延时。第三类方法并不直接估计信号之间的时间差,而是借助现有的成熟的高精度方
50、向估计算法(如MUSIC算法),先估计出声源的方向参数,然后结合阵列的几何特征,再计算出各个阵元信号之间的延时差。这类方法有一个局限性就是只能用于远场信号模型,因为在近场模型中,时间差不仅与声源的方向参数有关,还与声源的距离有关。还有一类算法是近来提出的一些新颖的思路,如在文献中提出的基于最小熵的方法、文献提出的基于盲信号检测理论的方法以及文献提出的基于小波理论的新方法。需要注意的是图中并没有包含了现有的所有延时估计算法,而只是选择了各类算法中应用比较广泛的一些代表性算法。下面将详细介绍各种算法的原理和理论推导。3.2.2 空间谱估计空间谱估计是一种空域参数估计技术,通过空间阵列接收信号数据的
51、相位差来确定一个或几个待估计的参数,这里的参数可以是信号抵达的方位角、俯仰角以及信号源数目等。了解这些参数后,我们可以较容易地分离感兴趣的信号和干扰该信号的噪声,从而达到消噪的目的。整个估计系统可以分成三个部分:信号传播、信号收集和参数估计。信号传播:信号源及其所处的复杂环境形成一个信号空问,按照波的传播理论信号将充满整个空间,系统的目的就是从这个信号空间中估计出信号源的未知参数。信号收集:位于信号空间中,按照一定排列方式的若干阵元接收到信号,信号中包含有噪声和干扰。参数估计:相当于对信号空间的一个重构过程,从复杂的观察数据中得到信号的特征参数。阵列信号输出的绝对值与来波方向之间的关系成为阵列
52、的方向图。方向图体现了阵列对信号在各个方向上的增益,对于分析信号的波达方向、信号数量具有重要意义。下面考察方向图的生成。首先容易得到空间中任意两阵元的几何关系,任意点(极坐标表示),(直角坐标表示)与原点(0,0,0)所接收到信号的时间延迟为: (3-3)其中c表示波的传播速度。由前面的信号模型可知,对于某一个确定的M元阵列,第i个阵元接收到的信号的幅度为: (3-4)其中,表示复振幅,表示第i个阵元与参考阵元的时间延迟。对于来自不同角度的信号,阵元间信号的延迟不同。输出的功率定义为: (3-5)3.2.3 广义互相关函数法由Knapp与Carter提出的广义互相关函数法(GCC,即Gener
53、al ized Cross-Correlation)是目前在实际中应用最广的延时估计算法。与前面的直接互相关函数法类似,GCC算法采用理想模型(free model),并只考虑两阵元麦克风阵的情况。与直接互相关函数不同的地方在于,GCC并不直接在时域计算互相关函数,而是通过在频域计算信号的互功率谱来估计延时。从维纳一辛钦定理可知,信号在时域的互相关函数与信号在频域的互功率谱函数互相对应,所以对频域的互功率谱求离散傅里叶逆变换,即可得出时域上的互相关函数。这么做的主要原因在于:通过在频域上对阵列信号进行一些适当的滤波操作再计算互相关函数,可以达到锐化互相关函数峰值的目的,从而便于搜索与延时相对应的谱峰,提高了延时估计算法在噪声以及混响环境中的健壮性。GCC延时估计算法的原理如下: (3-6)其中表示广义互相关函数,即GCCF,定义如下: (3-7)其中表示离散傅里叶逆变换操作(IDTFF)。表示两信号之间的互功率谱密度,定义如下: (3-8)其中定义如下: (3-9)式(3-7)中的是一个频域加权函数(Weightin
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年国网河南电力招聘高校毕业生笔试真题
- 2024年鞍山海城市招聘医疗岗位笔试真题
- 法律文化在社会中的表现试题及答案
- 网络管理员考试准备清单2025试题及答案
- 企业战略执行案例试题及答案
- 网络管理员培训指南试题及答案
- 网络服务监控与调优试题及答案
- 企业网管案例分析试题及答案
- 材料力学性能测试疲劳韧性重点基础知识点
- 江西省抚州市金溪县2025年八年级数学第二学期期末质量跟踪监视模拟试题含解析
- 2024年保密教育线上培训考试
- 服饰搭配艺术(山东联盟)智慧树知到期末考试答案章节答案2024年德州学院
- 船舶避碰 第十七条直航船的行动
- 绿色矿山造林施工合同
- 中国绝经管理与绝经激素治疗指南(2023版)解读
- 开休闲书吧创业计划书
- 人体常见病智慧树知到期末考试答案章节答案2024年
- 《石油行业安全生产标准化-陆上采油实施规范》
- 异常产程的识别和处理
- 危险化学品“两重点一重大”简介(刘卓)省公开课一等奖全国示范课微课金奖课件
- 完整版购销合同范本(标准版)-2024多场合版
评论
0/150
提交评论