(信号与信息处理专业论文)声源定位算法研究及实现.pdf_第1页
(信号与信息处理专业论文)声源定位算法研究及实现.pdf_第2页
(信号与信息处理专业论文)声源定位算法研究及实现.pdf_第3页
(信号与信息处理专业论文)声源定位算法研究及实现.pdf_第4页
(信号与信息处理专业论文)声源定位算法研究及实现.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(信号与信息处理专业论文)声源定位算法研究及实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 声源定位技术是高级音频信号处理技术之一。基于麦克风阵列的声源定位在 语音会议、安防以及机器人听觉等领域得到了广泛应用,是智能信号处理系统的 重要组成部分。 论文从声源定位算法的数学模型出发,阐述了定位算法中通用的理论模型及 其扩展模型。论文介绍了三类主流的定位算法,并着重介绍高分辨谱估计定位算 法中利用噪声空间与阵列流型之间关系的m u s i c 算法和利用信号空间与阵列流 型关系的e s r p i t 算法。论文对这两类算法做了深入研究,并通过实验数据比较 二者性能优劣。而后,讨论了信号源数目估计中盖氏圆估计器的理论与实现,并 进行了仿真实验。论文最后设计了声源定位系统的架构并对算法进行了优化和改 进。 对m u s i c 算法和e s p r i t 算法分别从理论和仿真两个方向做了比较。论文 从理论上分析了二者的理论估计误差。利用m a t l a b 仿真重点研究了两种算法对 信噪比和阵元间距的敏感程度,以及信号源数对算法的影响。 用于估计信号源数的盖氏圆算法中由于其估计器参数与快拍数相关,因而不 易于实际应用。本文在多次试验的基础上,总结出该参数的经验值,对实际系统 的搭建具有重要的指导意义。 论文讨论了声源定位系统的系统框图和各模块之间的传递变量,并详细设计 了各个模块。特征值分解是算法实现中较困难的环节之一。论文详细论述了 j a c o b i 实矩阵特征值分解的方法,并将此方法推广至复h e r m i t e 阵。同时,对盖 氏圆算法的酉变换过程进行了优化,降低了系统的运算量。 关键词:声源定位空间谱估计信号源数估计m u s i ce s p r i t 盖氏圆 a b s t r a c t s o u n dl o c a l i z a t i o ni sa m o n gt h ea d v a n c e da u d i os i g n a lp r o c e s s i n gt e c h n o l o g i e s b a s e do nm i c r o p h o n ea r r a y s ,i th a sb e e nw i d e l yu s e di nr e a l m so ft e l e c o n f e r e n c e , s u r v e i l l a n c e ,r o b o t i c sa n de t c i th a sb e e nr e c o g n i z e da sac r u c i a lp a r to fi n t e l l i g e n t s i g n a lp r o c e s s i n gs y s t e m s t a r t i n gf r o mt h ed a t am o d e l i n gi ns o u n dl o c a l i z a t i o n , t h et h e o r e t i c a lm o d a la n d i t sg e n e r a l i z a t i o na r ei n t r o d u c e dw h i c ha r ea p p l i e di nl o c a l i z a t i o na l g o r i t h m s t h r e e k i n d so fp r e v a i l i n gm e t h o d sa r ec o v e r e d s p e c i a li n v e s t i g a t i o nh a sb e e nm a d ei n t o t w oa l g o t i r h m s m u s i ca n de s p r i t t h ef o r m e rm a k e su s eo ft h er e l a t i o nb e t w e e n n o i s es p a c e sa n da r r a yp a t t e r n s ,w h i l et h el a t t e ru l t i l i z e st h a tb e t w e e ns i g n a ls p a c e s a n da r r a yp a t t e r n s t h e i rp r o sa n dc o i l sa r es h o w na c c o r d i n gt oe x p e r i m e n t m o r e o v e r , t h et h e o r ya n dt h ei m p l e m e n t a t i o no fg e r s c h g o r i nd i s ke s t i m a t i o n ( g d e ) f o rs o u r c e n u m b e re s t i m i a t i o na l o n gw i t hi t se x p e r i m e n tr e s u l t sa r ed i s c u s s e d t h ec o m p a r i s o nb e t w e e nm u s i ca n de s p r i ti sc o n d u c t e db o t hi nt h e o r ya n d p r a c t i c e t h et h e o r e t i c a le s t i m a t i o ne r r o ri sa n a l i z e d ,a n dt h e i rs e n s i t i v i t yt os n ra n d t h es p a c e db e t w e e na r r a ye l e m e n t s 嬲w e l la st h ee f f e c to fs i g n a ln u m b e r sa r e e x p l o r e di nm a t l a b o n ep a r a m e t e ri ng d ev a r i e sw i t ht h ea m o u n to fs n a p s h o t s ,w h i c hc o m p l i c a t e s t h ei m p l e m e n t a t i o np r o c e s s a ne m p i r i c a lv a l u ei ss u m m a r i z e di n t h i sd i s s e r t a t i o n u p o n r e s u l t so fe x p e r i m e n t s ,w h i c hi si m p o r t a n ti ns e t t i n gu par e a ls y s t e m al o c a l i z a t i o ns y s t e mi sd e s i g n e ds p e c i f i c a l l yw i t he x a c tm o d u l e sa n dt h e i r i n t e r f a c e s e i g e n d e c o m p o s i t i o ni sak e ym o d u l et h a ti sd i f f i c u l tt or e a l i z e j a c o b i m e t h o df o rr e a lm a t r i xi si n t r o d u c e di n d e t a i la n dg e n e r a l i z e dt ob ea p p l i e dt o c o m p l e xh e r m i t em a t r i x m e a n w h i l e ,t h eu n i t a r yt r a n s f o r m a t i o ni ng d ei so p t i m i z e d t o1 0 w e rt h es y s t e mr e q u i r e m e n tf o rc a l c u l a t i o n k e yw o r d s :s o u n dl o c a l i z a t i o n ,s p a t i a ls p e c t r a le s t i m a t i o n ,s i g n a ln u m b e r e s t i m a t i o n , m u s i c ,e s p r i t , g d e 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得丞壅盘鲎或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名:搏袜 签字同期: 叫 年占月j 日 学位论文版权使用授权书 本学位论文作者完全了解丞盗盘堂有关保留、使用学位论文的规定。 特授权苤鲞盘堂可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:夸豫纠聿 导师签名: 签字同期:厶岬年否月同 粕圯迭 签字同期:妒年易月f 同 签字同期:沙31 年易月f 同 天津大学硕士学位论文第一章声源定位综述 第一章声源定位综述 1 1 声源定位研究的意义 音频信号处理是数字信号处理中的重要分支。时频变换为包括图像、视频信 号处理在内的数字信号处理提供了更为广阔的方法空间。通过对声音在时域和频 域的表征特性的分析,辅以统计等数学手段,人们对音频信号的处理方式从最早 的量化、存储、还原【l 】到高质量数字编解码【2 】【3 】,再到功率增强、分类与识别【4 1 【5 】 等。随着技术的发展和日益增长的应用需求,声音的时空特性越来越受到关注, 因为它能够提供声源的物理位置信息,利用这些信息可以有针对性的处理感兴趣 的声音部分。麦克风阵列( m i c r o p h o n ea r r a y ) 可用于记录声音的空间信息,使 声音的空间信息提取成为可能。 近年来,麦克风阵列在语音信号处理领域迅速普及,得到了广泛应用。系统 可以通过调整各阵元的权重调整阵列指向,在增强感兴趣信号源的同时,可以实 现抑制其他说话人和环境噪声的功能。一套麦克风阵列的性能可以胜过精心设计 的具有高指向性的单一麦克风,并且对麦克风的摆放位置要求相对宽松,说话者 也不会感受到头戴式麦克风带来的不便。因此麦克风阵列可以满足使用多声源和 移动声源的需求。同时,麦克风阵列提供了单一麦克风无法实现的功能,例如自 动声音检测,声源定位和在某一范围内的声源跟踪。目前麦克风阵列的主要应用 有:远程电话会谢6 】【7 1 、语音识别8 1 1 1 、讲话人身份识别12 1 、机器人听觉【1 3 1 、汽 车环境中语音拾取【1 4 1 1 1 5 1 、回响环境中声音拾取 1 6 - 1 8 】、大房间中的会议录音【1 9 1 、 基于声音的安防系统刚 2 l 】和助听设割2 2 1 。 这些传感器阵列系统都需要定位和跟踪语音声源。在音频信号的应用中,若 要有效地改变阵列指向、增强某一方向并削弱其它方向的声音,必须知道主要说 话人以及其它的干涉者和与之相干的噪声声源。在多声源的场合,位置信息可以 用来区分不同的讲话者。有了这些信息,系统就可以自动聚焦并跟踪感兴趣的声 源。在视频会议中,声源估计的结果还可以用于调整摄像头的指向,从而降低对 摄像师的依赖。 在高精确度的前提下,实际的跟踪和波束形成( b e a m f o r m i n g ) 的应用还要 求位置估计数据的快速更新。在增强移动声源的应用中,阵列的指向精度必须达 天津大学硕士学位论文第一章声源定位综述 到厘米级,以避免当声源靠近阵列附近时造成的接收信号的高频滚斛2 3 1 。因此, 一个有效的波束形成系统必须在算法中包含连续并精确的定位过程,以保证良好 的解析度和更新频率。此外,此类估计器的运算量也必须能够在实际系统上实时 实现。 1 2 声源定位研究的相关领域 一个完整的声源定位系统包括声源数目估计、声源定位和声源增强( 波束形 成) 。为了达到更好的估计效果,前端可能会加入信号分类或信号分段的功能模 块,以确保只把包含感兴趣声音的片段送入后面的处理环节。而声音增强的研究 衍生了不同形状的麦克风阵列,从物理结构入手、制造高集成度的麦克风阵列硅 片也是目前研究的重点之一。整个领域如图1 1 所示。 0 信号分类1 声音特征提取,: 分段,j 声源定位算法 t d o a , 最大化可定向波束形成 器输出功率,空间谱估 计,i i r t f , 氐猡 f阵列设计 :阵元数,几何形: i “i a 硅山- i 集成,jl u 术鹏, 图1 1 声源定位领域研究方向 1 声源定位算法 现有的声源定位算法可以大致分为三类:基于最大化可定向波束形成器 ( s t e e r e d - b e a m f o r m e r ) 输出功率的声源定位、基于到达时间差( t i m e d i f f e r e n c e o f a r r i v a l ,t d o a ) 的声源定位和基于高分辨率谱估计( s p e c t r a le s t i m a t i o n ,简 称空间谱估计或谱估计) 的声源定位。这几个大类是根据应用环境和估计方法的 不同来划分的。第一类中,麦克风接收的信号经过滤波、加权和求和后直接用于 位置估计;第二类中,位置估计来自不同的传感器组合测量出的一组时延估计信 息;第三类中,定位信息是通过信号的互相关矩阵获得的。这三类算法将在后文 做详细阐述。 2 天津大学硕士学位论文第一章声源定位综述 还有一类特殊的定位算法,基于头部相关传输函数( h e a d r e l a t e dt r a n s f e r f u n c t i o n ,h r t f ) 1 2 4 1 。h r t f 又被称为是解剖化传输函数( a n a t o n i c a lt r a n s f e r f u n c t i o n , a t f ) ,利用头骨和耳道模型,将头、耳廓和躯干对声音的衍射和反 射特性看作线性系统中的滤波器,把某个位置上某个频率的声音由声源到达耳 鼓、内耳之间经历的变化用线性系统的传递函数来描述。放置在头骨模型中的麦 克风测量出的声源处激励a f t ) 的响应办( f ) ,被称为头部相关激励响应 ( h e a d r e l a t e dh n p l u s er e s p o n s e ,h r i r ) ,其傅立叶交换就是h r t f 日( 厂) 。 可以通过事先测量建立h r t f s 库,记录下头骨模型对不同频率不同方位的声源 的h r t fh ( f ,口,伊) ,再与实际应用中测量到的h ( f ) 一一比对,就可以估计出 声源的位置参数( 0 ,矽) 【2 5 】。 2 声源增强 声源增强和声源定位的结果是密不可分的。可以通过前面的几类方法得到声 源的定位信息,也可以借助摄像头采集的图像判断声源方位【2 6 】。在估计出声源位 置的前提下,增强则是要通过调整麦克风阵列的系数来改变阵列对不同方位声音 响应的波束指向,即波束形成。调整后的阵列在感兴趣的方向上的增益较大,在 其它方向增益较小,达到定向增强的效果。除了对各路麦克风采集的数据进行简 单的延时 2 7 - 2 9 外,波束形成也可以通过通用旁瓣消除( g e n e r a ls i d e l o b e c a n c e l a t i o n ) 3 0 1 1 3 1 1 等算法来实现。同时,由于波束方向对麦克风阵列中阵元间距 和目标频率是敏感的,所以如何实现小尺寸阵列和针对宽带的波束形成【3 2 】也是研 究的热点。此外,同一阵列中各个麦克风的特性并不严格一致,导致波束的指向 性和目标频率产生偏移,有针对性的参数调整以克服这一缺吲3 3 】也是一个令人关 注的方向。 3 信号分类研究 信号分类是一大学科分支,涉及随机信号处理、模式识别等领域,其研究范 围比声源定位要广。在声源定位的应用中,声音分类主要用于判断某段声音中是 否有人声、区分人声和噪矽蚓或在安防领域识别枪矽3 5 1 、尖叫纠3 5 1 等。使用 自回归( a u t or e g r e s s i v e ,a r ) 模型【3 6 1 、高斯混合模型( g a u s s i a nm i x t u r em o d e l , g m m ) 3 4 3 5 】【3 7 硼】、支持向量机( s u p p o r tv e c t o rm a c h i n e , s v m ) 【3 8 】【4 1 1 等进行 通用的或针对特定环境的声音特征提取是其主要研究内容。 4 麦克风阵列研究 声源定位以及声场重现1 4 2 1 等应用为麦克风阵列的设计提出了需求。为了达到 更好的效果,研究人员在麦克风阵列的形状m 3 1 、阵元个数【棚、阵元间距【4 5 1 等问 题上做了很多工作,以达到最好的旁瓣消除效果。麦克风阵列大多体积较大,在 一些诸如手机、助听器等应用场合就很难派上用场,研究人员受到集成电路的启 天津大学硕士学位论文 第一章声源定位综述 发,将阵列集成到硅片上m 则可以有效解决这一问题。 声源定位的其它研究方向包括模型和算法的验证平台的开发4 7 4 明等。 1 3 论文的主要工作和结构安排 本论文对声源定位算法及其相关领域做了系统的阐述,介绍了三类主流的声 源定位算法的理论基础,尤其对空间谱估计的两大类算法m u s i c 和e s p r i t 做 了详细的介绍,通过观察实验数据比较两算法的优劣。同时,论文介绍了声源数 目估计的各类算法,通过实验确定了盖氏圆算法中的未定参数,提高了声源定位 的准确率。此外,论文设计了声源定位系统,并解决了实现中存在的技术难点并 针对算法结构进行了优化,以降低系统对运算量的要求。 第一章:概述了声源定位的研究意义和相关领域的研究现状 第二章:分析信号模型以及基于定向波束和基于t d o a 的声源定位算法 第三章:着重介绍了m u s i c 、e s p r i t 等高分辨谱估计定位算法,并结合试 验结果对各类算法给出评价。这是本文的主要理论基础。 第四章:介绍了各类信号源数估计算法及其比较。 第五章:阐述算法实现难点以及解决方案 第六章:对论文做了总结和后续工作展望。 4 天津大学硕士学位论文第二章基于时延的声源定位算法 第二章基于时延的声源定位算法 声源定位问题也叫做波达方向( d i r e c t i o no f a r r i v a l ,d o a ) 估计问题。d o a 估计大致有三类算法:定向波束形成、t d o a 和空间谱估计。其中,前两类都是 基于时延的定位算法。本章将简单介绍这两类算法。同时,这三类算法所基于的 麦克风阵列的数学模型是相似的。因此,本章将先介绍远场窄带信号输入的数学 模型【5 0 】。 2 1d o a 估计数学模型 2 1 1 通用数学模型 在传感器阵列领域,一个普遍采用的信号模型是假设每个传输信道只对信号 引入某些时延和衰减【”】。在这个假设下,考虑n 个远场的窄带信号入射到某阵 列上,其中阵列天线由m 个阵元组成,这里假设阵元数等于通道数,即各阵元 接收到信号后经各自的传输信道送到处理器,也就是说处理器接收来自m 个通 道的数据。 在信号源是窄带的假设下,信号可用式( 2 1 a ) 的复包络形式表示: ( 2 1 a ) 式中,“f ( f ) 是接收信号的幅度,鲵( f ) 是接收信号的相位,是接收信号的频率。 在窄带远场信号源的假设下,有 陋,( i t - - ;, - ) u j ( f ) 弋 【妒( f r ) 缈( f ) 根据式( 2 1 a ) 和式( 2 1 b ) ,显然有 ( 2 1 b ) s i ( f f ) j 砸弦一7 7 i = 1 , 2 ,n ( 2 2 ) 州叫 蛳 删 吖 一 啡 卜吖 o o ,博一f 天津大学硕士学位论文第二章基于时延的声源定位算法 则可以得到第,个阵元接收信号为 x ,p ) = g s ,( t - r h ) + n ( f ) ,= l ,2 ,n ( 2 - 3 ) t = l 式中,g 。为第,个阵元对第f 个信号的增益,1 t ( ,) 表示第,个阵元在f 时刻的噪声, l h 表示第,个信号到达第,个阵元时相对于参考阵元的时延。 将m 个阵元在特定时刻接收的信号排列成一个列向量,可得 而( t ) 而( f ) 嘞( f ) g ll e 一畸7 “ 9 2 l e 一铫f 2 1 g m l e 一7 唧1 9 1 2 e 一7 响q 2 9 2 2 e 一7 7 2 2 g m 2 e 一7 4 。2 + 啊( ,) 以2 ( f ) ( f ) ( 2 - 4 ) 在理想情况下,假设阵列中个阵元是各向同性的且不存在通道不一致、互耦 等因素的影响,则式( 2 - 4 ) 中的增益可以省略( 即归一化为1 ) ,在此假设下式 ( 2 _ 4 ) 可以简化为 x l ( ,) x 2 ( f ) x 肘( f ) 将式( 2 5 ) 写成向量形式如下: x ( t ) = a s ( t ) + n ( t ) + 刀1 ( f ) ,1 2 ( t ) ,( f ) ( 2 5 ) ( 2 6 ) 式中,x ( t ) 为阵列的m 1 维快拍( s n a p s h o t ,即某一瞬间的接收信号) 数据向量, n ( t ) 为阵列的m 1 维噪声数据向量,s ( ,) 为空间信号的n l 维向量,a 为空间 阵列的m n 维流型矩阵( 导向向量阵) ,且 其中导向向量为: 4 = k l ( 缈o ) 口2 ( c o o ) f l n ( c o o ) 】 ( 2 7 a ) 6 ) ) a ,;o 墨是 蚧 vijojoj业 一 | 一 ) ) 9; 甄勋 v o o o o o o o o 且 “ m ;一 三j 勉 三;毗帅撕 嘣 柏协 p p p h k 蛐晌;嘶 嘲偏;碱 p p p 天津大学硕士学位论文第二章基于时延的声源定位算法 口。( c 0 0 ) = e x p ( 一j c a o r l ,) e x p ( - j w o r 2 f ) e x p ( 一j 一m i 、) ( 2 7 b ) 式中,= 2 矿= 2 万三,c 为光速,彳为波长。 由上述的推导可知,一旦知道阵元间的延迟表达式f ,就可以很容易得出特 定阵列的导向向量或阵列流型。下面推导一下空间阵元间的延迟表达式。结合空 间任意两个阵元,其中一个为参考阵元( 位于原点) ,另一个阵元的坐标为 ( x ,y ,z ) ,两阵列的几何关系见图2 - 1 ,图中“x ”表示阵元。 图2 1 空间任意两阵元的几何关系 由几何关系可以推导出两阵元间的波程差为 f :! ( x c o s 8 c o s 缈+ y s i n 护c o s 缈+ z s i l l 9 ) ( 2 8 ) c 根据式( 2 8 ) 的结论可以得出下面几种阵列及阵元间的相互延迟表达式。 1 平面阵 设阵元的位置为( x 。,y 。) ( 露= 1 ,2 ,m ) ,以原点为参考点,另假设信号入射 参数为( p ,矿从待1 , 2 ,) ,分别表示方位角与俯仰角,其中方位角表示与x 轴 的夹角,则有 :三( 以c o s 只c 。s 仍+ y , s i n e , c 。s 够) ( 2 9 a ) c 7 天津大学硕士学位论文 第二章基于时延的声源定位算法 2 线阵 设阵元的位置为( 七= 1 , 2 ,m ) ,以原点为参考点,另假设信号入射参数 为只( f = 1 , 2 , r ) ,表示方位角,其中方位角表示与x 轴的夹角,则有 :! ( 吒c o s 9 ) c 3 均匀圆阵 设以均匀圆阵的圆心为参考点,则有 ( 2 9 b ) 铲r c ( c o s ( 芈卅c o s 仍) ( 2 9 c ) 其中方位角只( f = 1 , 2 ,n ) 表示与x 轴的夹角,为圆半径。 2 1 2 相干信号源数学模型 当考察多个信号时,这些信号之间可以是不相关的、相关的或相干的。对两 个平稳信号墨o ) 和& 0 ) ,定义它们的相关系数为 胪矗( 2 - 1 0 a )e 【is ,( f ) 1 2 e 【is 。o ) 1 2 】 其中,s :( f ) 代表s 。o ) 的共轭。由s c h w a r t z 不等式可知i 风| 1 ,因此信号之间的 相关性定义如下: t ( f ) ,唧( f ) 独立 s ,( f ) ,& ( f ) 相关 ( 2 1 0 b ) s 心) ,& ( f ) 相干 由式( 2 1 0 b ) 中的定义可知,当信号源相干时,其数学表现为:相干信号 源间只差一个复常数,假设有r 个相干源,即 s ,( f ) = 口,s o ( f ) i = l ,2 ,刀 ( 2 1 1 ) 8 卸陬阻 i _陬叫慨 r,1【 天津大学硕士学位论文 第二章基于时延的声源定位算法 这里 可以称为生成信源,因为它生成了入射到阵列上的玎个相干信号源。将 式( 2 1 1 ) 代入式( 2 6 ) 可得相干信号源模型 x ( t ) = a s ( t ) + ( f ) = = a 口1 i 簟:h ) + ( f ) :1 j = a p s o ( f ) + n ( t ) 式中,p 是由一系列复常数组成的r l 1 维向量。 2 1 3 宽带信号源数学模型 + ( ,) ( 2 1 2 ) 对于宽带信号,假设信号的带宽为b ,同样有第,个阵元的接收数据( 不考 虑增益) 为: | v x ,( f ) - - z s m t h ) + n 几) z = l ,2 ,m ( 2 - 1 3 ) i = 1 如果将观察时间五分成k 个子段,每段时间为乃,然后对观察数据进行点 的离散傅立叶变换( d i s c r e t ef o u r i e rt r a n s f o r m ,d f t ) ,只要子段乃相比信号和 噪声相关时间较长( 为了保证d f t 变换后的数据是不相关的) ,就可以得到如下 的宽带模型: x t ( ,) = a ( f j ) s i ( 乃) + n t ( 乃) ( 2 1 4 ) 式中,鼍( ) ,最( z ) ,以( 乃) 分别为对应某频率的接收数据、信号及噪声的 d f t 变换,其中后= 1 , 2 ,k ,j = 1 , 2 ,j 。 对于式( 2 1 4 ) 所示的宽带信号模型,其阵列流型矩阵应为 a ( f j ) = a i ( 乃) 口:( 乃) 口( ) j 口f ( 厂) :【p 一,2 矾,p 一,2 矿:- p 叫2 札r 9 ( 2 1 5 a ) ( 2 1 5 b ) o o ;u s s s -。l 4 天津大学硕士学位论文 第二章基于时延的声源定位算法 需要指出的是,式( 2 1 4 ) 中的是指将带宽为b 的信号划分为,个子带, 这说明式( 2 - 1 4 ) 对于不同的频率点z , ,力有个等式成立。 2 1 4 误差模型 通常考虑的误差主要有三种:有限数据长度引起的误差、阵列的模型误差及 噪声模型误差。在实际中考虑最多的是阵列的模型误差,文献 5 2 中考虑的误差 模型为: x = c r 垂a s + n ( 2 1 6 ) 式中,c 是阵列的互耦阵( 由阵元间互耦引起) ,f 是各阵元的增益组成的对角 阵,咖是各阵元的初相位组成的对角阵。 2 2 基于定向波束的声源定位 此类算法中,系统的输入就是声源产生的音频信号,使用最优的最大似然 ( m o s tl i k e l i h o o d ,m l ) 估计,旋转波束的指向并搜索输出功率的峰值,最后 将波束方向聚集在输出功率最大的方向。上述求解过程及其改进在国外的文献中 被也称为“聚焦( f o c a l i z a t i o n ) ” 5 3 - 5 5 算法,形象地描述了此类算法的思想。 2 2 1 广义互相关算法 广义互相关函数( g e n e r a l i z e dc r o s sc o r r e l a t i o n ,g c c ) 方法是最常用的时 延估计方法,该方法通过权函数调整其性能。设岛、n j 和吃 为实的、联 合平稳的随机过程,且& ( f ) 与确 、吃均不相关,考虑两个阵元( 麦克风) 的情况,用式( 2 3 ) 中模型表示接收的数据,有鲫 m ) = s l ( ) 4 - n i ( ) ( 2 - 1 7 ) 【x 2 ( f ) = a s l o + d ) 4 - ,1 2 0 ) 假设模型的物理条件( 阵列形状、阵元间距等) 是固定不变的,且环境的变 化应该是非常缓慢的,即信号和噪声的统计特征在有限的观察时间丁内保持不 变,时延d 和衰减量口也是缓慢变化的。此外,估计算法还要有足够的信号与噪 1 0 天津大学硕士学位论文第二章基于时延的声源定位算法 声的先验信息,在声源估计中通常是很容易实现的1 。 设c 为声速,d 为两阵元间距,信号的到达角p 与时延d 的关系如下: 口= 一s ( 争 ( 2 1 8 ) 可见,只要估计出时延d ,就相当于估计出信号的到达角臼。此时声源定位 可以归结为对时延d 的估计问题。常用的方法之一就是计算互相关函数,用目 表示期望, r ”:( f ) = e x l ( f ) x 2 ( f f ) 】 ( 2 - 1 9 ) 使r v :( f ) 最大的f 值就足对时延的正确估计。由于观察的时间r 有限,因此我们 只能得到r :( f ) 的估计值。在一个各态遍历的过程中,对互相关函数的估计可 以是 k ( 加击l ( f ) 硝r 叫d f ( 2 - 2 0 ) 为了提高时延估计d 的准确度,在计算式( 2 2 0 ) 前通常要对而 和恐 进行 预滤波。如图2 - 2 所示,誓通过- , 滤波得到”,其中恐经过时移7 后与而相乘, 积分,平方,直到找出盖 屯( f ) 峰值,进而估计出d 。产生峰值的时移仅仅是真 正时延d 的估计值。如果使用滤波器骂= 马= 1 v f ,d 就仅仅是互相关 函数产生峰值时的横坐标。选择恰当的q 和马有助于估计时筵。 图2 - 2g c c 算法框图 1 声源定位算法中允许先对开始的一小段声音采样分析统计概率后再定向,而在要求更严格的通信系统的 天线中则可能无法使用此策略。 l l 天津大学硕士学位论文 第二章基于时延的声源定位算法 五和恐的互相关与它们的互功率谱密度是有关系的。根据维纳辛钦 ( w i e n e r - k h i n t c h i n e ) 定理 5 6 1 ,有 r x l x 2 ( f ) = g v :( f ) e j 2 # r d f ( 2 2 1 ) 如果如图2 - 2 中描述的,x a 和恐 经过滤波之后,滤波器输出的互功率 谱为: 吒耽( ) = h ,( 厂) h ;( 厂) g 叩:( ) ( 2 2 2 ) 其中奉代表复共轭。将式( 2 2 2 ) 带入式( 2 2 1 ) ,得到一般化的而 和恐的互 相关函数表达式 其中, 尺蹴( r ) = y g ( ) g :( f ) e j 2 斫d f ( 2 2 3 a ) 妙。( 厂) = h l ( ) 日;( 厂) ( 2 - 2 3 b ) 称为广义频率权函数。 在实际应用中,与r 而赶( f ) 类似,我们只能从对而 和恐的有限观察中求 出吒y :( 厂) 的估计值0 乃此( 厂) 。所以,用积分 雠( f ) = 沙g ( ) 6 屯( f ) e m c 7 d f ( 2 2 4 ) 来估计时延。在某些情况下,也是需要估计的,这个估计取决于的 功能和一些先验信息。例如,如果预滤波器的功能是增强信噪比最高的频率的信 号,则应该是信噪比的函数,而信噪比就是先验信息,必须事先知道或者 通过估计求出。 2 2 2 的选取对功率谱的影响 1 的选取是g e e 方法的核心问题。在研究选取的问题前,了解在 1 2 天津大学硕士学位论文 第二章基于时延的声源定位算法 理想情况下对r m ( r ) 的形状的影响是一个关键。在式( 2 - 1 7 ) 的模型中,五和 恐的互相关函数为 谱 r 而,:( f ) = t z r 叩,( f d ) + r 伪也( r ) ( 2 2 5 ) 根据维纳辛钦定理,式( 2 2 5 ) 的傅立叶变换应该是而和艺o ) 的互功率 瓯,:( 厂) = a g 呐( ) p 川和+ g 呐( 厂) ( 2 - 2 6 ) 若和吃不相关( g :( 厂) = o ) ,则五和恐的互功率谱为一个经 过缩放的功率谱乘以一个复指数项。一个域的乘积等于其变换域的卷积,因此在 g 恍( ) = 0 的前提下有 r 而。,( f ) = 出叩( f d ) 0 5 ( t d ) ( 2 2 7 ) 式中圆表示卷积运算。 式( 2 2 7 ) 可以理解为冲击函数在信号频谱的傅立叶变换中“扩展”了。如 果而( f ) 只是一个白噪声,其傅立叶变换就只是一个冲击函数而不会出现“扩展” 的情形。自相关函数的一个重要性质就是咫( 力咫( o ) 。对于周期函数,等号 会在f 取得某些值时成立,但大多情况下等号只在f = 0 时成立。因此对应式 ( 2 2 7 ) 的互相关函数,当- = d 时函数会取得峰值。“扩展”会使峰值变宽。单 时延的情况下并没有问题,但如果考虑信号中存在多个时延的情况,互相关函数 为 r ”:( f ) - - a r 叩。( f d ) 圆口,5 ( t - d ,) ( 2 - 2 8 ) 和民晶( 力卷积后被“扩展”了的冲击函数可能会和相邻的同样被“扩展”的冲击 函数重叠,从而使峰值和时延无法辨别。在理想情况下,夥,g ( f ) 兰g x ,( 厂) ,, 要选择合适的使r ( 力有明显、陡峭的极点,从而保证良好的时延分辨 率。然而,陡峭的极点对有限观察时问所引入的误差十分敏感。因此,与很多其 它的谱估计问题一样,u ) 的选择需要在分辨率和可靠性二者中做取舍。 可供选择的u ) 如表2 1 所示,下面将简单介绍其性能。 天津大学硕士学位论文第一章基于时延的声源定位算法 表2 - 1 权函数的选择 名称权函数 沙( 厂) = h ,( ) :( 厂) 互相关 r o t h 冲击响应 平滑一致变换 ( s c o t ,s m o o t h e dc o h e r e n c et r a n s f o n n ) 相位变换 ( p h a t ,p h a s et r a n s f o r m ) e c k a r t 滤波 1 r o t h 权函数 由r o t h 提出的权函数( 厂) = 1 g 而而( 厂) ,代入式( 2 - 2 4 ) 得 耙y l y m 2 ,= 器扩矿 亿2 9 , 式( 2 2 9 ) 正是对最优线性( 维纳霍夫,w i e n e r - h o p f ) 滤波器【5 7 】冲击响应 = 端 的估计,它描述了由x a 到砭的映射关系。由于有 ( 2 3 0 ) q 。 ( 厂) = 嚷而( ) + 吒啊( ) ( 2 3 1 ) 因此,采用r o t h 权函数时,互相关函数的形式为 夤蹴( f ) = 万( - r 一。) pe 乙乏嬲p 口斫矽 c 2 3 2 , 除了g ,吨( 厂) 与g 而 ( 厂) 是线性关系以外,冲击函数还是会被“扩展”。由上面的 推导可以看出,r o t h 权可以抑制g 1 砷( 厂) 较大、6 砘( 厂) 会被错误估计的频率段。 1 4 。一一一一一伽一 天津大学硕士学位论文第二章基于时延的声源定位算法 2 s c o t 权函数 对6 呐( ) 的估计错误可能由g 川一( ) 较大引起,也可能由g 唧:( ) 较大引 起。在不知道应该使用缈r ( 厂) = i g 柏u ) 还是少月( ) = 1 g m :( 厂) 的情况下, s c o t 使用了权函数 则互相关函数的形式为 其中 沙s ( 俨万丽1 ( 2 - 3 3 ) 爻盘( f ) = 冗,:( ) p ,2 矿矽 ( 2 3 4 ) 知,。耥 协3 5 , 如果日。( ) = 1 小丽,日:( 厂) = l 小莎,s c o t 可以看作在互相关 计算前加入的一个白化滤波器。当g 而而( ) = g 恐,:( ) 时,s c o t 和r o t h 是等效 的。显然,s c o t 无法完全白化互功率谱,因此“扩展”依然存在。 3 p h a t 权函数 为了避免“扩展”,p h a t 的权函数设为 从而有 ( 舻丽1 ( 2 3 6 ) 珊加揣斫矽 协3 7 , 仍考虑式( 2 1 7 ) 的模型,结合式( 2 2 5 ) 考虑,设各噪声之间都是独立的 ( g 呐( 厂) = 0 ) , 天津大学硕士学位论文第二章基于时延的声源定位算法 g ( 川= a g 叩:( 厂) ( 2 3 8 ) 理想情况0 拍( 厂) = g ( 厂) ,有 垒塑= e i s ( ,) _ p 脚( 2 3 9 ) i g 而赴( ) l 是归一化的量,且此时的互相关函数为 j i i 蹴( f ) = d ( r - d ) ( 2 - 4 0 ) 在模型为式( 2 1 7 ) 、噪声互不相关的前提下,p h a t 相比其他权函数没有“扩 展”的现象。但在实际应用中,g 拍( 厂) g ,( f ) ,o ( f ) 2 矽,对r 蹴( f ) 的 估计就不是冲击函数了。p h a t 还有一个明显的缺陷,它在g 而,:( 厂) 上以g 叩。( f ) 的倒数加权。如果信号的功率较小,估计误差就会被放大。在特殊情况 g ( f ) = 0 时,频带内的相位a ( f ) 将不能确定,对相位的估计将会产生漂移。 这一特点要求针对信号功率是否存在而对y ,( 厂) 做补偿。s c o t 是根据信号和噪 声特性来分配权值的权函数之一。 4 e c k a r t 滤波器 e c k a r t 滤波器的原理是将偏移最大化。所谓偏移,就是以信号量为输入时互 相关均值与以噪声为输入时互相关的标准差之比。在一段较长的时间丁内,偏移 定义为 d 2:韭竺竺型型: 旧( 川2 in :( 删2 吒。:( f ) d f ( 2 4 1 ) 其中是与r 成比例关系的常数,g 而屯( ) 是j ,( f ) 和s :( f ) 的互功率谱,有 g q 屯( 厂) = a g 叩。( 厂) p 7 2 和 ( 2 - 4 2 ) 根据柯西一施瓦泽( c a u c h y s c h w a r t z ) 不等式,可得在d 2 取得最大值时, h i ( 厂) 日;( 厂) = e ( 厂) p 7 2 和( 2 - 4 3 ) 1 6 天津大学硕士学位论文第二章基于时延的声源定位算法 其中 州伊耥 协 式( 2 4 4 ) 被称为e c k a r t 滤波器。像s c o t 一样,e c k a r t 滤波器也会抑制噪 声强的频段。而当g 而吐( 厂) - - 0 时,e c k a r t 的权值为0 ,这一点与p h a t 不同。e c k a r t 滤波器需要信号和噪声频谱这些先验信息。 还有其他的权函数,在此不一一介绍。 2 2 3 聚焦算法小结 对权函数的改进的研究是聚焦定位算法的一大研究领域。例如文献【5 8 就提 出了将p h a t 算法推广到多通道的情况。此外,文献 5 3 5 4 1 1 5 5 中谈到了聚焦在 理论和实际中的误差范围,【5 9 】中将定向波束形成的算法推广到多信号源的情 况。所有这些算法都依赖于先验的感兴趣信号和背景噪声的频谱信息,但在实际 中这几乎是不可能实现的。 实现m l 估计需要求解非线性方程。 5 9 】中介绍了最陡峭下降( s t e e p e s t d e s c e n t ) 、n e w t o n r a p h s o n 等典型的递归最优方法。这些方法的一大缺点就是目 标方程并没有明显的极点或者可能存在多个极点,导致这类高效算法不够准确, 而且过分依赖于递归的起始条件。随机区域收缩( s t o c h a s t i cr e g i o nc o n t r a c t i o n , s r c ) 呻】是一类对多模型目标函数的优化方法,可以用于声源方向估计。尽管提 高了估计的准确程度,但是相比于典型的递归算法,其运算量增加很多。总的来 说,由于复杂的目标函数,基于聚焦的m l 估计的运算量因为需要搜索峰值而增 大,导致它在多数情况下不能达到实时定位的效果。 2 3 基于t d o a 的声源定位 相对于基于定向波束的定位算法,t d o a 算法的研究对象不是单一的麦克风 接收到的声音信息,而是一组从时域信号估计得来的相对时延。如果有了一组 t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论