基于压缩感知的麦克风阵列声源定位方法研究毕业论文_第1页
基于压缩感知的麦克风阵列声源定位方法研究毕业论文_第2页
基于压缩感知的麦克风阵列声源定位方法研究毕业论文_第3页
基于压缩感知的麦克风阵列声源定位方法研究毕业论文_第4页
基于压缩感知的麦克风阵列声源定位方法研究毕业论文_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、南京理工大学毕业设计(论文)( 2015 届)题 目: 基于压缩感知的麦克风阵列声源定位方法研究专 业: 电子信息工程 姓 名: 学 号: 指导教师: 职 称: 填写日期: 2015年5月21日 南京理工大学教务处 制摘要信息时代的兴起,人们越来越需要数字信息的获取。基于麦克风阵列的声源定位技术,遍及各种通信环境中。声源定位技术是利用麦克风收集语音信号,并用数字信号处理技术对其进行剖析和处理,然后确定并跟踪声源的空间位置。然而在采样过程中,避免信号失真,引入压缩感知原理,而这种原理不仅为降低采样频率带来了新的突破,也为其他领域的研究提供了更好的契机,所以得到很大的关注。当然在动态定位中更好的是

2、运用卡尔曼滤波,其广泛应用在信号处理与系统控制领域,而且正越来越广泛地应用于计算机应用的各个领域。首先,基于压缩感知的静态定位,本次探索中压缩感知所做的是多个麦克风,一个声源的定位,通过延时加噪,分帧加窗,经过两次FFT变换,采用矩阵算法,最后用正交匹配追踪法重构信号。接着引入基于卡尔曼滤波的动态定位,以最小均方误差为最佳估计准则,采用信号与噪声的状态空间模型,利用前一时刻的估计值和当前时刻的观测值来更新对状态变量的估计,求出当前时刻的估计值。本文主要成果首先是基于压缩感知的静态定位,假定声源位置,增加噪声,最后还原初始信号位置,再根据不同的信噪比,对比误差大小。然后是基于卡尔曼滤波的动态定位

3、,将加噪信号更加逼近精确原始信号。关键词:麦克风阵列,声源定位,压缩感知,卡尔曼滤波AbstractThe rise of the information age, there is a growing need to acquire digital information. Sound source localization based on microphone array technology, across various communication environments. Sound source localization technique is to use a microp

4、hone to collect voice signal and digital signal processing technology to analyze and deal with them, and then to identify and track the spatial position of the sound source. However, in the sampling process, to avoid signal distortion introduced compressed sensing principle, and this principle has n

5、ot only brought a new breakthrough in order to reduce the sampling frequency, but also provides better opportunities for research in other areas, so get a lot of attention . Of course, the better is the use of dynamic positioning Kalman filter, which is widely used in signal processing and system co

6、ntrol in the field, and is increasingly widely used in various fields of computer applications.First, based on compressed sensing static positioning of this exploration is done by compressed sensing multiple microphones, locate a sound source, by delay and noise, framing windowing, FFT transform twi

7、ce, using matrix arithmetic, Finally, the reconstructed signal using orthogonal matching pursuit method. Followed by introduction of the Kalman filter based on dynamic positioning to the minimum mean square error criterion is the best estimate, the state space model uses the signal and noise, using

8、the estimated value of the previous time and the current observation time to update the estimate of the state variables obtained current time estimate.First results of this paper are based on compressed sensing static position, assuming the position of the sound source, increased noise, and finally

9、restore the original signal position, and then depending on the signal to noise ratio, compared to size of the error. Then based on Kalman filter dynamic positioning, will add noise signal more accurate approximation of the original signal.Key Words:Microphone Array; Sound source localization; Compr

10、essed Sensing;Kalman filter目录摘要1Abstract2第一章 绪论41.1 研究意义和背景41.2 研究现状51.2.1 麦克风阵列国内的发展历程51.2.2 麦克风阵列国外的发展历程61.2.3 麦克风阵列信号处理71.3 研究内容和章节安排8第二章 压缩感知与卡尔曼滤波基本原理92.1引言92.2 压缩感知的基本原理92.2.1 压缩感知的基本原理92.2.2 压缩感知的基本框架112.2.3 运用方法132.3 卡尔曼滤波的基本原理142.3.1 卡尔曼滤波的基本原理142.3.2 运用方法17第三章 基于压缩感知的静态定位183.1引言183.2 算法分析1

11、83.3 程序分析19第四章 基于卡尔曼滤波的动态定位234.1 引言234.2 算法分析234.3 程序分析25第五章 总结和展望275.1 总结275.2 展望28致 谢29参考文献30附录:32第一章 绪论1.1 研究意义和背景声音是人们之间相互交流的一种重要方式。人类通过双耳接收声音信号,从而使大脑根据双耳得到的信息来判断声源的方向1。仿照人耳对声源方向的定位,人们用电子设备代替人耳实现声源方位的估计,叫做声源定位技术。在高智能化电子设备的今天,声源定位十分重要。近年来,声源定位在各个领域都有广泛运用。声源定位技术,是实现基于阵列的空域滤波、声源位置跟踪以及语音增强最核心的技术之一2。

12、特别是采用麦克风阵列的方法,对各种运用电子设备等系统中控制摄像头等方面有很大的作用。经典的香农采样定理认为,为了不失真地恢复模拟信号,采样频率应该不小于模拟信号频谱中的最高频率的两倍。但是其中除了利用到信号是有限带宽的假设外,没利用任何的其它先验信息,采集到的数据存在很大程度的冗余。所以提出压缩感知原理,而它的优点在于信号的投影测量数据量远远小于之前的采样方法,使高分辨率信号的采集成为可能,是一个革命性的突破。压缩感知在信息论、图像处理、地球科学、光学/微波成像、模式识别、无线通信、大气、地质等领域受到高度关注,并被美国科技评论评为2007年度十大科技进展。而且CS 理论已发展了分布CS理论3

13、 、1-BIT CS 理论4、Bayesian CS 理论5、无限维CS 理论等,成为数学领域和工程应用领域的一大研究热点。接着,进一步研究卡尔曼滤波,实现动态定位,卡尔曼滤波在信号处理与系统控制领域应用广泛,目前,正越来越广泛地应用于计算机应用的各个领域。20世纪60年代,卡尔曼发表了用递归方法解决离散数据线性滤波问题的论文。在这篇文章里,一种克服了维纳滤波缺点的新方法被提出来,这就是今天称之为卡尔曼滤波的方法。卡尔曼滤波应用广泛且功能强大,它可以估计信号的过去和当前状态,甚至能估计将来的状态,即使并不知道模型的确切性质。本论文主要的是为了实现声源定位算法的复杂环境中,能够准确的获得声源的位

14、置信息。整个算法主要涉及到压缩感知,卡尔曼滤波等方面的内容,主要运用静态定位和动态定位。1.2 研究现状1.2.1 麦克风阵列国内的发展历程自从 Rutgers 大学的 Flanagan 教授将麦克风阵列引入到大型会议的语言增强中,1987年 Brown 大学的 Silverman 教授将麦克风阵列引入到语音识别系统以来,麦克风阵列信号处理已经成为一个新的研究热点。在国外,很早就开始研究声源定位技术,所以现在的研究成果也比较多。主要应用于军事领域,如战场目标声音识别系统、飞机探测系统、声探测预警系统等6。除了军事领域,声源定位技术在其他领域的研究成果也很多,如2007年加拿大魁北克的珊不勒凯大

15、学机电学院研发的避障机器人,使用8元麦克风阵列采集声音,采用波束成形和粒子滤波的方法实现声源的跟踪,有效的解决了当声源处于麦克风连线上时定位精度低和定位前后模糊性等问题。日本HONDA研究院研制的实时跟踪多声源的系统7。该系统由两个麦克风阵列组成,分别为室内的麦克风阵列和嵌入机器人头部的麦克风阵列8。这两个阵列分别采用基于加权延时累加波束成形法和自适应波束成形器法来定位多声源位置。日本的会津大学开发的一种移动机器人,此机器人由实时声音定位系统和障碍物探测声纳系统构成。其中,定位系统三个麦克风组成,形式为等腰三角形阵列,采用基于听觉系统的“优先效应”进行回波和混响的处理。该系统的优点是消除了声音

16、的前后混靖性。后来出现了声视联合的跟踪系统,其声音定位系统采用了波束成形技术,由四个麦克风阵列组成,并运用神经网络技术,确定声源的大致方向。其缺点是多个机器人传感器的数据没有能够进行很好的融合9。由韩国理工学院研发的结合声音和视觉的机器人定位系统,含有两个子系统,分别是概率声音定位子系统和人脸跟踪子系统。声源定位运用了波达延迟估计,它的优点是很好的弥补了说话的人的位置的偏差和拒绝不想有的噪声,但是就是不能从混合的声音中分离得到目标的声音,而且声音和视觉子系统得到的信息没能达到融合。2007年日本早稻田大学提出了一种方法,它能让声音分离,但也不需要严格的HRTF,麦克风阵列安置在机器人的头部,两

17、侧安装一对前向和侧向的麦克风10,可以用来采集完全不同于干扰语音的两线目标语音。1.2.2 麦克风阵列国外的发展历程最近几年,国内的很多大学以及研究所也开始研究声源定位技术。首先有基于平方相干函数的的频域自适应最大似然时延估计法11。该方法由陈华伟提出,其实质是构造广义相位数据最大似然加权函数,将时域的问题转换到频域进行处理,这种新的算法的时延估计方差比原来单纯的频域自适应最大时延估计的方差大概小了两倍。其次,由林静然等提出改进的基于麦克风阵列的近场声源定位算法,其实质是使用双波束进行近场范围内的二维定位12。接着,邵怀宗等设计了基于均匀线阵和均匀圆阵的麦克风阵列,对阵元接收信号的相位和幅度差

18、,实现对近场声源的二维或三维定位。然后是由王增福、陈可提出的基于声压幅度比的声源定位方法,其原理是通过建立以声压幅度比为参量的约束条件表达式,实现声源的定位。最后是改进的自适应特征值分解时延计算法。该算法通过不断重设信道冲击响应的初值的方法,有效地解决了收敛时间慢,对初值敏感等问题,改善了对时延变化的估计。总体来说,声源定位技术伴随着新的问题的不断出现逐步进行改进和完善,并且形成了一些比较有代表性的麦克风阵列信号处理平台。近几年来,麦克风阵列信号处理平台也正在向小型化、便携式方向发展。安徽理工大学电气与信息工程学院,设计了一种智能视频监控系统13。该系统综合应用了声音和光的信息实现定位,突破了

19、传统监控系统监控范围的局限性,提高了监控系统的监控效率。哈尔滨工程大学水声技术国家级重点实验室针对水下近场噪声源的定位,研究了一种矢量阵宽带 MVDR 聚焦波束形成方法14。该方法解决了“左右舷模糊”问题,提高了处理增益,及对实际水声信号的适用性。除外,北京理工大学,南京理工大学,西北工业大学,西北核技术研究所对该项目进行深入研究。其实炮用立靶声音定位系统列入国家军用标准,弹头落点定位系统和敞开型胸怀靶系统已通过鉴定并列入国家军用标准15。另外,如何实现低成本的小型声源定位系统已成为目前研究的一个热点。1.2.3 麦克风阵列信号处理阵列信号处理的发展起源于20世纪40年代,体现在雄于锁相环进行

20、跟踪的自适应天线组合技术上16。利用麦克风阵列进行信号处理来获取声源的二维或者三维信息,其精确度的高低主要受以下几个因素的影响:(1)麦克风阵列的选择。麦克风阵列依据其空间形式的不同,可分为线形阵列、圆形阵列、球形阵列、螺旋形阵列、点阵阵列等,一般情况下,各个阵元之间都是等间隔分布的。目前,麦克风阵列的组成形式己经较为成熟。德国的Mueller BBM PAK,美国的NI公司,在此方面具有一定的优势。国内来说,比如说北京声望声电技术有限公司,具有成型的麦克风阵列,并且能够根据客户的需求对阵列进行定制。合理的选择麦克风阵列会对有效的降低计算的复杂度,提高运算的效率。(2)定位算法的选择。按照定位

21、的原理17,可以将其分为以下三类:基于高分辨率谱估计的定位算法;基于最大输出功率的可控波束成形算法;基于时延估计的定位算法。一般来说,定位算法的选择会受到阵列结构的限制。不同的参量和声场环境也需要釆用不同的定位算法,伴随的是运算量的大小。其中,基于时延估计的定位算法因其计算量较小,且不受阵列结构的限制,得到了广泛的应用。(3)噪声的抑制和混响的消除。由于噪声是无处不在的,在采集的过程中是无法避免的。因此如何有效地去除观测信号中的无用噪声,获取高质量的期望信号一直是麦克风阵列信号处理研究的一个热点问题。利用麦克风独特的空间滤波特性,不仅可以达到一致噪声,而且不会对期望信号产生任何影响。目前噪声抑

22、制的方法主要有基于空间信息的抑制噪声法和自适应噪声对消法。在室内的情况下,麦克风接收的信号除了直达的信号之外,还会接收到经过门窗、墙壁、天花板等的多次反射或者散射产生的反射波,严重的降低了语音信息的可懂性。因此,去除混响和噪声对位定位精度的提高是一个很重要的因素。目前,消除混响的方法分为三类:基于信道反转均衡去混响;基于信源声学模型去混响;通过同形转化分离混响。1.3 研究内容和章节安排具体的研究内容:(1) 研究经典的声源定位算法,分析噪声和混响对定位性能产生影响的本质原因;(2) 学习声源定位算法的相关理论,根据压缩感知和滤波理论,提出新的声源定位算法,实现高精度的静态和动态定位。结合相关

23、研究内容,做出以下章节安排:第一章提出研究意义和背景,并对声源定位的发展历程和研究现状做了介绍,从概念上和原理上对声源定位及麦克风阵列技术进行了基本性介绍。第二章主要介绍了所需的理论基础,压缩感知,卡尔曼滤波及扩展卡尔曼滤波的基本原理和方法,为后面的定位做好理论铺垫。第三章详细描述静态定位的结果,研究了基于压缩感知的声源定位算法,并运用MATLAB仿真。第四章详细描述动态定位的结果,研究卡尔曼滤波的算法,并结合前面的时延估计的测量,得到更精确的定位。第五章对课题进行总结,并对麦克风阵列声源定位进行展望,讲述研究期间的所遇到的问题和如何提高。第二章 压缩感知与卡尔曼滤波基本原理2.1引言本文是为

24、了研究基于压缩感知的麦克风阵列声源定位方法,会应用到一些原理基础,考虑到要不失真地恢复模拟信号,所以本章首先是介绍了压缩感知的基本原理,接着针对动态定位,阐述了卡尔曼滤波及扩展卡尔曼滤波的基本原理。2.2 压缩感知的基本原理2.2.1 压缩感知的基本原理在传统的信号获取与处理中,包含采样、压缩、传输和解压缩四个部分,一般信号采样只有当采样速率达到信号带宽的两倍以上时,才能由采样信号精确重建原始信号18。压缩感知于2004年被提出,但其实早在上个世纪,相关领域已经有相当的理论和应用铺垫,包括图像处理、地球物理、医学成像、计算机科学、信号处理、应用数学等,而本文用于定位。通过对数据进行压缩,舍弃了

25、采样获得的大部分数据,但不影响“感知效果”19。在压缩感知理论中,当信号在某个变换域是稀疏的或可压缩的,可以利用与变换矩阵非相干的测量矩阵将变换系数线性投影为低维观测向量,同时这种投影保持了重建信号所需的信息,通过进一步求解稀疏最优化问题就能够从低维观测向量精确地或高概率精确地重建原始高维信号。所以在这样的框架下,采样速率不再取决于信号带宽,而在很大程度上取决于两个基本准则,即稀疏性和非相干性,或者,稀疏性和等距约束性。该理论主要涉及3个核心问题,分别是具有稀疏表示能力的过完备字典设计、满足非相干性或等距约束性准则的测量矩阵设计、快速鲁棒的信号重建算法设计20。图2-1 给出了传统的信号采样与

26、压缩过程示意图。但是,信号压缩实际上是一种严重的资源浪费,因为大量采样数据在压缩过程中被丢弃了() ,它们对于信号来说是不重要的或者只是冗余信息。从这个意义而言,得到以下结论: 带宽不能本质地表达信号的信息,基于信号带宽的Nyquist 采样机制是冗余的或者说是非信息的。采样信号xN压缩K传输/存储接收K解压Nx的解压缩信号 图2-1 传统的信号采样与压缩/解压过程示意图图2-2 给出了压缩采样理论框架的示意图。在这样的框架下,采样速率不再取决于信号带宽,而在很大程度上取决于两个基本准则,即稀疏性和非相干性,或者,稀疏性和等距约束性。压缩采样信号xK传输/存储接收K重建x的解压缩信号N 图2-

27、2 压缩采样理论框架示意图图2-3是CS-2FFT特征提取框图,主要描述了压缩感知的基本步骤。接到麦克风的信号窗口窗口框架的第一次FFT振幅正常窗系数的总和和的矢量的第二次FFFFT阈值器CS假设的抽样图2-3 CS-2FFT特征提取框图2.2.2 压缩感知的基本框架(1)信号的稀疏性主要考虑实值有限长的离散信号空间。假设是的一组基向量,则任何信号可以线性表示为 或 (1)式中,是在域的变换向量,是的变换矩阵(可以不是正交矩阵)。定义1:稀疏信号称信号在域是K-稀疏的,如果式(1)的线性表示只需不大于K个基向量,;或者说变换向量中最多有K个非零项。定义2:可压缩信号称信号在域是可压缩的,如果变

28、换向量大部分分量的取值很小,直邮少部分分量的取值很大;或者说只需要少部分取值大的分量就能很好地逼近原始信号。 压缩感知的问题考虑一般的采样问题 (2)式中,为原始信号,为采样点,为采样向量。例如,当取为脉冲函数时,为Nyquist 采样模式中的采样点;当取为区域指示函数时,为图像的像素点;当取为正弦波时,为核磁共振成像中的Fourier系数采样点21。特别地,当,即从原始信号直接获取少量的观测值,就是本文关注的压缩感知: (3)式中,为原始高维信号,为的低维压缩测量向量,为的测量矩阵。当,式(3)转化为利用信息算子从变换系数获取少量的压缩测量,即 (4)式中,称为的信息算子。特别地,当信号本身

29、是稀疏的或可压缩的,式(4)退化为,即。现在的问题是: 是否存在测量矩阵以使采样过程保持重建信号所需的足够信息? 是否可以利用个测量值精确重建原始信号? 如何设计快速算法保证重建信号的精确性和稳定性? 由于,因而压缩感知是个不适定的数学反问题,式(3) 存在无数个可行解。但是,当在域是稀疏的或可压缩的,压缩感知在理论上成为可能。2.2.3 运用方法运用压缩感知进行数据采集,计算麦克风接收的信号,但是还是有环境噪声的干扰,所以接着对信号进行处理。运用时延TOA原理,将麦克风对接收到的信号进行语音特征提取处理。其中就是要调用将一长串数据分帧加窗,归一化求和之后,再进行两次FFT变换的函数。采用矩阵

30、算法,记录假定声源的信号。调用正交匹配追踪法重构信号,使用重构算法解方程Z=D*I。表2-1 OMP重建算法OMP重建算法:(1)初始化,(2)找到索引,使得:(3)令(4)计算张成空间的正交投影(5)计算新的近似和残差(6) ,如果,返回第(2)步(7)获得的估计在索引位置的元非零,且在该位置的测量向量逼近为:2.3 卡尔曼滤波的基本原理2.3.1 卡尔曼滤波的基本原理本质上来讲,滤波就是一个信号处理与变换的过程,这个过程既可以通过硬件来实现,也可以通过软件来实现22。卡尔曼滤波属于一种软件滤波方法,其基本思想是:以最小均方误差为最佳估计准则,采用信号与噪声的状态空间模型,利用前一时刻的估计

31、值和当前时刻的观测值来更新对状态变量的估计,求出当前时刻的估计值,算法根据建立的系统方程和观测方程对需要处理的信号做出满足最小均方误差的估计23。基本卡尔曼滤波算法适用于解决随机线性离散系统的状态或参数估计问题。(1)首先建立系统数学模型,在实际应用中,卡尔曼滤波将状态空间理论引入到对物理系统的数学建模过程中来,其假设系统状态可以用 n 维空间的一个向量来表示。作以下假设:物理系统的状态转换过程可以描述为一个离散时间的随机过程;系统状态受控制输入的影响;系统状态及观测过程都不可避免受噪声影响;对系统状态是非直接可观测的。在以上假设前提下,定义系统状态变量为,系统控制输入为,系统过程激励噪声为,

32、可得出系统的状态随机差分方程24为: (1)定义观测变量,观测噪声为,得到量测方程: (2)假设 ,为相互独立,正态分布的白色噪声,过程激励噪声协方差矩阵为,观测噪声协方差矩阵为,即: (3) (4)统称为状态变换矩阵, 是状态变换过程中的调整系数,是从建立的系统数学模型中导出来的,这儿假设它们是常数。(2)然后是滤波器计算原型,从建立的系统数学模型出发,可以导出卡尔曼滤波的计算原型,包括:时间更新方程和测量更新方程。定义先验估计误差和后验估计误差: (5) (6)先验估计误差的协方差矩阵为: (7)后验估计误差的协方差矩阵为: (8)式(9)构造了卡尔曼滤波器的表达式25:先验估计和加权的测

33、量变量及其预测之差的线性组合构成了后验状态估计: (9)式中测量变量及其预测值之差 反映了预测值和实际值之间的不一致程度,称为测量过程的残余。 阶矩阵 叫做残余的增益,作用是(8)式中的后验估计误差协方差最小。 可以通过以下步骤求出 :将(9)式代入(6)式代入(8)式,将 对 求导,使一阶导数为零,可以求出 , 的一种形式为: (10)对卡尔曼增益 的确定是建立滤波模型的关键步骤之一,它能显著影响模型的效率。(3)最后就是滤波器模型的建立,卡尔曼滤波器包括两个主要过程:预估与校正。卡尔曼滤波主要是运用5个公式:基于系统的上一状态而预测出现的状态 : (11)一步预测误差方差阵: (12)修正

34、一步预测结果: (13)卡尔曼增益: (14)更新误差方差阵: (15)注:作用在 上的 状态变换矩阵:作用在控制向量 上的 输入控制矩阵:观测模型矩阵 P最优值(k-1)X最优值(k-1)U(k)P预测值(k)X预测值(k)Z(k)X最优值(k)K(k)P最优值(k)QABRH图2-4 卡尔曼滤波流程图在本文中单单用卡尔曼滤波是不够的,还需要引入扩展卡尔曼滤波。扩展卡尔曼(EKF)算法是在标准卡尔曼滤波算法的基础上发展起来的,它的基本思想是:在滤波值附近,应用泰勒展开算法将非线性系统展开,对于二阶以上的高阶项全部都省去,从而原系统就变成了一个线性系统,再利用标准卡尔曼滤波算法的思想对系统线性

35、化模型进行滤波。EKF的滤波过程是利用上一次的状态估计量来预测本次的状态:首先将上次的状态估计量代入系统状态方程,得到状态一步预测,再将一步预测代入观测方程得到观测量的预测值,然后利用观测量的观测值与预测值之间的偏差来修正状态一步预测,从而得到状态估计量。正是由于利用了不同方式所得到的观测值的偏差来修正状态估计量,才使得各种白噪声干扰得到了有效抑制。时间更新(预测)(1) 向前推算状态变量(2) 向前推算误差协方差测量更新(校正)(1) 计算卡尔曼增益(2)由观测变量更新估计(3)更新误差协方差和为初始估计图2-5 扩展卡尔曼流程图2.3.2 运用方法 卡尔曼滤波作为一种数值估计优化方法,与应

36、用领域的背景结合性很强26。 因此在应用卡尔曼滤波解决实际问题时,重要的不仅仅是算法的实现与优化问题,更重要的是利用获取的领域知识对被认识系统进行形式化描述,建立起精确的数学模型,再从这个模型出发,进行滤波器的设计与实现工作。基本卡尔曼滤波(KF)器限定在线性的条件下,在大多数的非线性情形下,使用扩展的卡尔曼滤波(EKF)器来对系统状态进行估计。 本文首先是基于压缩感知的声源定位,要确定声源的位置,可以采用基于双麦克风的2维平面定位算法,这种阵列尺寸小,主要是算法,通过TDOA的定位确定双曲线,通过ILD的定位确定圆,双曲线和圆有两个交点,也就是有两个位置,通过限制范围只留一个解,最终确定位置

37、,但是比较麻烦。所以最后还是确定用三个麦克风阵列,从时延估计到方位估计,更快收敛到声源位置。同样通过TDOA确定双曲线,三个麦克风就能确定三个双曲面,双曲面的交集就是声源的位置,比较精确方便。但是,在声源定位中还存在噪声干扰等,所以必须要减少干扰信号。第三章 基于压缩感知的静态定位3.1引言本章主要描述基于压缩感知的静态定位方法,压缩感知作为一个新的采样理论,通过开发信号的稀疏特性,在远小于Nyquist采样率的条件下,用随机采样获取信号的离散样本,然后通过非线性重建算法完美的重建信号。3.2 算法分析(1)计算麦克风接收信号在本文中分别选用三、四和五个麦克风和一个声源进行试验,先计算各个麦克

38、风分别到声源的距离,但是考虑到信号传输过程有衰减,这里设置衰减因子为1,设定声速c=341m/s,麦克风1的极坐标是(0,-3),麦克风2的极坐标是(0,3),麦克风3的极坐标是(2/4*pi,4),麦克风4的极坐标是(2/4*pi,3),麦克风5的极坐标是(2/3*pi,-3),声源的极坐标是(3/8*pi,3),有一定延时,加之会有外界环境的噪声干扰,所以加上随机噪声参数,考虑这些因素,得到每个麦克风收到的信号。(2)对信号进行语音特征提取处理这里即是加窗分帧处理,经过数字化的语音信号实际上是一个时变信号,为了能用传统的方法对语音信号进行分析,应假设语音信号,在 10ms30ms 短时间内

39、是平稳的。后面的所有分析都是在语音信号短时平稳这个假设条件下进行的。为了得到短时的语音信号,要对语音信号进行加窗分帧操作。分帧是用可移动的有限长度窗口进行加权的方法来实现的,这就是用一定的窗函数来乘,从而形成加窗语音信号。本文使用汉明窗,窗函数长度:采样周期、,窗口长度N和频率分辨率之间存在:,N=128,可见,采样周期一定时,随窗口宽度 的增加而减小,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。应该根据不同的需要选择合适的窗口长度。(3)使用正交匹配追踪法重构信号其本质上是L_1范数最优化问题,OMP算法本质思想是:以贪婪

40、迭代的方法选择的列,使得在每次迭代中所选择的列与当前的冗余向量最大程度地相关,从测量向量中减去相关部分并反复迭代,直到迭代次数达到稀疏度,强制迭代停止。它保证了每次迭代的最优性,减少了迭代的次数。但是,它在迭代中仅选取一个原子来更新原子集合,这样必然会付出巨大的重建时间代价。3.3 程序分析MATLAB程序见附录(1)首先画出图像:画圆,连线,画出格点,每个交点就是格点位置图3-1 初始图形(2)接着定义声源和麦克风的位置,画出位置图像,本文首先采用3个麦克风,一个声源进行实验。然后分别采用4个和5个麦克风进行试验,相互对比。图3-2 三个麦克风、一个声源的位置图(3)然后计算麦克风接收的信号

41、,但是还是有环境噪声的干扰,所以接着对信号进行处理。运用时延TOA原理,将麦克风对接收到的信号进行语音特征提取处理。其中就是要调用将一长串数据分帧加窗,归一化求和之后,再进行两次FFT变换的函数。采用矩阵算法,记录假定声源的信号。调用正交匹配追踪法重构信号,并使用重构算法解方程Z=D*I。图3-3 三个麦克风、一个声源定位图3-4 四个麦克风、一个声源定位图3-5 五个麦克风、一个声源定位(4)均方根误差,它是观测值与真值偏差的平方和观测次数比值的平方根,在实际测量中,观测次数总是有限的,真值只能用最佳值来代替.方根误差对一组测量中的特大或特小误差反映非常敏感,所以,均方根误差能够很好地反映出

42、测量的精密度。均方根误差,当对某一量进行甚多次的测量时,取这一测量列真误差的均方根差,称为标准偏差,以表示。反映了测量数据偏离真实值的程度,越小,表示测量精度越高,因此可用作为评定这一测量过程精度的标准。 表3-1 不同信噪比的均方根误差SNR0db5db10db15dbRMSE0.360.300.280.12第4章 基于卡尔曼滤波的动态定位4.1 引言本章主要描述基于卡尔曼滤波的动态定位,数据滤波是去除噪声还原真实数据的一种数据处理技术,卡尔曼滤波在测量方差已知的情况下能够从一系列存在测量噪声的数据中,估计动态系统的状态。4.2 算法分析(1) 假设初始位置为原点,开始在x轴和y轴上都以10

43、m/s的速度,形成一条匀速直线的轨迹,设置预测噪声协方差系数是5,测量噪声协方差系数为2,取101个采样点,采样时间为0.1s。(2)接着,按照前面的卡尔曼滤波原理里面的5个公式进行探索。首先要利用系统的过程模型,来预测下一状态的系统。假设现在的系统状态是,根据系统的模型,可以基于系统的上一状态而预测出现在状态: (1)式(1)中,是利用上一状态预测的结果,是上一状态最优的结果,为现在状态的控制量,如果没有控制量,它可以为0。到现在为止,的系统结果已经更新了,可是,对应于的协方差还没更新。用表示协方差: (2)式(2)中,是对应的协方差,是对应的协方差,表示的转置矩阵,是系统过程的协方差。式子

44、1,2就是卡尔曼滤波器5个公式当中的前两个,也就是对系统的预测。现在有了现在状态的预测结果,然后再收集现在状态的测量值。结合预测值和测量值,可以得到现在状态的最优化估算值: (3)其中为卡尔曼增益: (4)到现在为止,已经得到了状态下最优的估算值。但是为了要令卡尔曼滤波器不断的运行下去直到系统过程结束,还要更新状态下的协方差: (5)其中为1的矩阵,对于单模型单测量,。当系统进入状态时,就是式子(2)的。这样,算法就可以自回归的运算下去。(3)除了这最基本的5个卡尔曼公式,在本文中,还需要扩展卡尔曼的应用。这里需要三个麦克风到声源位置的变化,所以上式中的需要更新,是运用扩展卡尔曼的方法进行运算

45、。(4)改变其中的噪声大小或者速度大小,观察仿真出来的波形的差别。(5)这些做的都是理想状态,而需要加入噪声状态,还原原本的信号,这里我没有做出来。4.3 程序分析1. 首先定好各项参数,为五个基本公式做好铺垫2. 计算3个麦克风到声源的位置,组成变换矩阵,增添一个公式,代入进行迭代。3. 把理想状态换成噪声状态(1) 首先在滤波之前噪声比较明显,在滤波之后,信号趋于精确值。图4-1 滤波前信号波形图4-2 滤波后信号波形(2) 噪声更大一点效果会更明显,图4-3令q=30。图4-3 增大噪声信号波形(3) 初速度加快,轨迹更贴近,图4-4令其在x轴和y轴的速度都为15m/s。图4-4 加快速

46、度信号波形第5章 总结和展望5.1 总结本文主要是实现一种在复杂环境下的近场声源定位算法,能够准确的获得声源的位置信息27。首先基于压缩感知的静态定位,压缩感知中的信息获取方法,先经过小部分非线性采样,包含足够信息良好逼近信号,再通过一定类型的线性或非线性解码机制就可高概率精确重建原始信号28。然后引入基于卡尔曼滤波的动态定位,其基本思想是:以最小均方误差为最佳估计准则,采用信号与噪声的状态空间模型,利用前一时刻的估计值和当前时刻的观测值来更新对状态变量的估计,求出当前时刻的估计值,算法根据建立的系统方程和观测方程对需要处理的信号做出满足最小均方误差的估计。在本文中,单单用到卡尔曼滤波还不够,

47、还需要扩展卡尔曼滤波方法。首先是基于压缩感知的声源定位,要确定声源的位置,可以采用基于双麦克风的2维平面定位算法,这种阵列尺寸小,主要是算法,通过TDOA的定位确定双曲线,通过ILD的定位确定圆,双曲线和圆有两个交点,也就是有两个位置,通过限制范围只留一个解,最终确定位置,但是比较麻烦。所以最后还是确定用多于二个麦克风阵列,从时延估计到方位估计,更快收敛到声源位置。同样通过TDOA确定双曲线,三个麦克风就能确定三个双曲面,双曲面的交集就是声源的位置,比较精确方便。但是,在声源定位中还存在噪声干扰等,所以必须要减少干扰信号。在线性离散系统的假设前提下阐述了基本卡尔曼滤波的原理,主要从两个方面进行

48、阐述:系统过程模型及测量模型建立,主要是建立系统的状态差分方程及量测方程,以及确定系统噪声、测量噪声的统计特性,用统计测量的方法进行噪声相关参数的估计,建立系统过程的数学模型;滤波器计算模型的建立,以数学模型为基础,确定滤波器的时间更新方程及状态更新方程,主要在滤波器系数的确定包括状态转换矩阵及相关因子矩阵。卡尔曼主要运用五个基本公式进行迭代,运用状态方程和观测方程,以最小均方误差为最佳估计准则,采用信号与噪声的状态空间模型,利用前一时刻的估计值和当前时刻的观测值来更新对状态变量的估计,求出当前时刻的估计值,算法根据建立的状态方程和观测方程对需要处理的信号做出满足最小均方误差的估计。这里的基本

49、卡尔曼滤波不够解决问题,需要运用扩展卡尔曼滤波(EKF),EKF也是五个基本公式,不过此时,除了最基本的五个基本公式,增加一步计算,然后进行迭代。5.2 展望压缩传感理论的提出极大地丰富了信号获取理论,并为其他相关领域的研究提供了新技术和新思路,研究前景广阔. 然而目前压缩传感理论尚有较多问题需要在未来研究中得到突破: 1)测量矩阵构造研究在压缩传感中,测量矩阵需要满足约束等距性条件,目前所采用到的测量矩阵大多为非确定性测量矩阵,即随机矩阵。但是更复杂的非确定性测量矩阵在硬件实现上比较复杂,因此有必要对确定性测量矩阵进行深入研究。此外,压缩传感技术建立在非自适应线性测量基础之上,不具有灵活性,

50、因而有必要研究自适应压缩传感技术,即根据不同的信号类型采用不同的数据采样和重构策略。2)测量矩阵的优化问题当图像不能在正交基上稀疏表示时,可以将其扩展到冗余字典上进行稀疏表示。如何平衡冗余字典的冗余度与传感矩阵中相关列的数量,即找到最优的冗余字典及其对应的传感矩阵是值得研究的。3)测量值的应用研究许多图像处理的最终目的并不是重构图像,而是为了得到有关目标的信息。 由压缩传感理论可知,在一定条件下,通过少量的测量值就可以准确重构出原始图像,也就是说少数的测量值能够保持原始信号的结构和足够多信息。 因此, 少量的测量值可以直接用于实现各种图像处理任务,并且由于测量值数目较少,信息密度高,可以大大减

51、少相关算法的时间和存储代价。同时,卡尔曼滤波器是一个最优化自回归数据处理算法,它的广泛应用已经超过30年,包括航空器轨道修正、机器人系统控制、雷达系统与导弹追踪等。近年来更被应用于组合导航与动态定位,传感器数据融合、微观经济学等应用研究领域。随着卡尔曼滤波理论的发展,一些实用卡尔曼滤波技术被提出来,如自适应滤波,次优滤波以及滤波发散抑制技术等逐渐得到广泛应用。 致 谢在论文即将完成之际,谨向所有关心和帮助我的师长、同学及家人表示最衷心的感谢。首先,要感谢我的导师xx。本文从选题开始,然后确定方向,再到学习研究,到最后撰写都是在柯老师的悉心指导下完成的。xx老师渊博的学识和丰富的经验,帮助我解决

52、了许多难题;老师严谨的治学态度、认真负责的工作作风让我感受到了对待科研应有的态度。我的每一点成长和进步都离不开老师的信任和帮助。感谢班级的各位兄弟姐妹们和已经毕业的师兄师姐,感谢他们为我创造了良好的学习环境和学术交流氛围,是大家的互助,才使我在一个良好的环境中不断学习、进步,而且在生活上给我留下了美好的回忆。衷心感谢我的父母及家人,正是他们默默的付出才使我能够专心学习。感激之情,无以言表!感谢所有曾经关心和帮助过我的人们。最后,向在百忙之中抽出宝贵时间审阅论文的专家教授表示最深的谢意。参考文献1Otani M, Ise S. Fast Calculation System Specialized for Head-related Transfer Function Based on Boundary Element MethodJ. Journal of the Acoustical Society of America, 2006, 119(5): 2589-2598.2居太亮. 基于麦克风阵列的声源定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论