自校准麦克风阵列语音信号的采集_第1页
自校准麦克风阵列语音信号的采集_第2页
自校准麦克风阵列语音信号的采集_第3页
自校准麦克风阵列语音信号的采集_第4页
自校准麦克风阵列语音信号的采集_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、自校准麦克风阵列语音信号的采集:一种系统的方法摘要:麦克风阵列和波束形成技术的语音采集中的应用比单一麦克风的操作系统更有前景。自适应波束形成器提供了一个潜在的优越性,就是固定波束形成器。特别针对时变声场特征或相干噪声比如相干的扬声器或扬声器信号等,优越性更加明显。然而在实际应用中自适应波束形成器存在严重的信号衰减的风险。由麦克风不匹配、转动方向不精确、多径传播引起频率混叠等造成的干扰可能导致自适应波束形成器形成畸变的期望信号。麦克风不匹配一般主要是由生产工艺和器件老化引起的。这篇文献提出了一种自适应的自校准方法。这些方法在系统的正常操作中就可以自校准,因此,不需要额外的自校准程序。这种基于一个

2、系统的方法,需要一些新的结构以及其他一些众所周知的结构。在不同结构下自校准结构的性能检测可以在汽车环境中进行。1 简介麦克风阵列语音应用已经研究了二十多年。但仍只有极少数的产品使用 麦克风阵列。为了用少量麦克风得到较高的性能,必须使用超方向性波束形成方法。鉴于这种方法是基于延迟和求和来形成波束的, 超方向性波束形成器对假定的信号模型中的误差很敏感。 所以比起固定波束形成器,自适应波束形成器往往对这些误差更敏感。还有一个主要问题是制造工艺引起的麦克风失配。 为了达到良好的性能必须对这些不匹配进行补偿。经典的麦克风校准中传递函数是 通过前一次测量控制波束形成。 然而,由于老化效应麦克风传

3、输函数就可能不再适用就需要重新校准。为了克服这些问题,开发了自校准方法,它可以自适应的对信号模型中的误差进行补偿。这些误差也可能是由非理想的声学特性或者多径传播导致的频谱混叠或波束形成器的方向不精确引起。这篇文章的组织结构如下:第2节描述了用于波束形成的经典方法并指出了自适应波束形成器的严重弊端。第3节回顾了防止信号消除的最先进的技术。第4节提出了系统法的自校正,给出由此衍生的其他方法。第5节讲述了对这些方法的评价。第6节是文章的结尾给出了结论。这篇文章,是用分析法和合成滤波器组在频域部分带宽上上做信号处理。2. 波束成形波束成形系统的目标是估算期望信号确切的来波方向或形成一个本地的空间体积。

4、来自其它方向或其他空间点的声波会被波束形成所抑制。因此,波束形成器实现了空间选择性。固定波束形成器是预先计算好的滤波器,而自适应波束形成器的参数是在运行过程中进行优化的,从而可以跟踪不同特性的声场。2.1 自适应波束形成器在实际应用中,自适应波束形成器大多采用MVDR(“最小方差无失真响应”)标准。在此约束下输出信号的功率是最小的,对于期望入射方向而言,无失真响应就会被保留。这个希望的方向也被称为为波束形成器的转向方向。更一般的情况,会存在多个方向的约束,该波束形成器被称为LCMV(“线性约束最小方差”)波束形成器。在篇文章中,我们考虑一个自适应的MVDR波束形成器,信号处理在频率子带上进行。

5、对于M各阵元的阵列麦克风设其全频带麦克风信号,各个信号通过滤波器组分解到频率为P的频域子带上,分解后的信号为。该波束形成器输出的子带信号是系统滤波器组和全频带的时域信号的组合。子带信号具有严格限制的带宽,因此可以彼此独立地进行处理。此外,还可以通过自带上的二次抽样因子R来降低采样速率。因此,可以降低信号处理的计算量同时使自适应滤波器更快地收敛。子采样信号的时间指数由k表示,全频带信号的时间指数由n表示。 图1 自适应波束形成的GSC结构。在上部路径的固定波束形成器增强了信号, 在下部路径的自适应滤波器装置消除了相关噪声一个MVDR波束形成器可以直接或间接地作为一个“广义旁瓣相消”(GSC),如

6、图1所示。在直接形式中的麦克风(子带)信号通过FIR滤波器来滤波,滤波器的长度为L和滤波过程如下: (1)星号表示共轭复数。一种直接形式的MVDR波束形成器的实现方法由 Frost的文章给出。滤波器系数调整时要考虑定向约束,同时要保证滤波器稳定性。GSC的结构是信号处理路径的一个分支如图1所示。上部路径包括一个权重系数为的固定波束形成器(FBF),(如延迟求和波束形成器:我是): (2)在下部路径上用所谓的分块矩阵(BM)拒绝从期望方向来的信号。在最简单的情况下,相邻信道是相减的关系: (3)其它分块矩阵虽然文献5中提到但是很少使用。信号作为多通道干扰消除(MIC)的参考噪声: (4)的长度为

7、,表示多通道干扰消除的自适应滤波器。自适应滤波器是在最小均方意义下进行调节的,从而使得输出信号的功率最小。通过由阻塞矩阵实现的约束来保持期望方向的信号不失真。使用归一化最小均方(NLMS)算法可以使滤波器适配。 2.2 信号衰减MVDR约束强制波束形成器的转向方向上形成固定的频率响应。波束形成器的输出信号的功率是依靠这种定向约束达到最小的。这种方法是基于这样的信号模型:麦克风拥有理想、一致的传输特性,室内声场符合自由场条件,自由场是指期望信号仅仅影响阵列的转向方向而不会产生反射信号。这样MVDR约束就可以在理想条件下实现,但实际应用中这些理想的假设条件总是会有偏差。由于理想信号模型与实际的偏差

8、事先是未知的,所以定向约束往往不符合实际情况。 定向约束的有效性也会被削弱,因为期望信号的其他分量也被功率最小化。尤其是对自适应波束形成器,当在语音活动过程中进行自适应滤波器的自适应调整时,会有严重的信号失真问题。在这种情况下,与期望信号相关的信号会从不是转向方向的其他方向过来。使期望信号被这些非目标信号抵消。这种效应被称为''信号消除''。但即使只在噪声其进行调整,话筒不匹配仍然是一个问题,尽管不存在期望信号:通过波束形成滤波器的自适应对于假设的理想麦克风方向约束是完美的,但是对于真正的(不匹配)话筒,指向方向就会出现失真。因为自适应波束形成是使输出信号的功率

9、最小化,这种失真主要表现为指向方向的衰减,即使讲话期间停止自适应,这种失真仍然存在。因此,麦克风适配削弱了定向约束的有效性。传声器失配已经在文献2中通过测量一系列的麦克风在极性模式下的大小和相位进行了研究。传声器失配的影响,也通过理论分析和对实测数据的仿真进行了研究。人们发现,固定波束形成和自适应波束形成一个相反的行为。当固定波束形成器趋向于放大信号时,自适应波束形成器就会显示出强劲的衰减特性。经过平均后,麦克风失配对于自适应波束形成器的影响是比固定波束形成器更严重,尤其对于低频范围。3 已知的解决方案 有几个众所周知的改善自适应波束形成器的稳健性的方法。 这些方法可分为两类: 一类是波束形成

10、器适度的运行,不管存在的误差如何(针对症状)。 其他类的目的是减少偏差本身(针对原因),也就是说,它们在做均衡或校准。3.1 针对症状信号的衰减通常伴随着滤波器系数幅度的增长。因此可以用范数约束方法通过限制的波束形成器滤波器的最大增益为来防止滤波器系数幅度过度增加: (5)另一种防止滤波器系数幅度增长过大的方法是使用泄漏因子。针对每个时间步长k,滤波器系数大小由一个比1稍小的因子按比例缩小(例如,=0.99)。特别是对于语音应用来说自适应控制是防止信号衰减的有效方法。 波束形成滤波器仅在讲话停止时做自适应。但在语音活动期间滤波器不能跟踪最优解。3.2 针对原因 对抗信号衰减另一种方法是减弱其产

11、生原因, 即麦克风不匹配,以及房间的声学模型与假设模型的不匹配。 一个简单但代价较大的方法是预先选定最佳匹配的麦克风。 另外,也可以利用一些特殊的测量预先确定校准滤波器并随后使用它们。 这些解决方案都需要测量数据。 此外,麦克风的特性由于老化作用或环境影响通常是随时间改变的。出于这个原因,需要可以跟踪这些变化的自适应匹配。 有许多方法解决室内声学的不匹配问题。这些方法试图纠正指向方向不精确性或跟踪移动的讲话者。Van Compernolle在文献8中提出了一种解决方案:在自适应波束形成器前面增加一个额外的自适应单元。 此单元用于补偿扬声器在一定背景下运行时讲话者和麦克风阵列传递函数之间的差异。

12、一个麦克风被选为参考元而阵列的所有其它麦克风 自适应地与这个参考麦克风匹配。自适应控制允许匹配单元或波束形成器适应它的滤波器。 Hoshuyama等人在文献9提出了一种基于自适应阻塞矩阵的GSC波束形成器:固定波束形成器输出信号经过一个系数受限的自适应过滤器滤波后,要从每个麦克风信号中减去这个信号。所得到的差信号被用作多干扰消除器的噪声参考信号。系数约束的自适应滤波器是为了补偿指向方向的小误差。文献10中深入地研究了这种方法。 文献11提出了频率子带框架,文献12则在全频域上进行了研究。另一种方法,是GSC波束形成器的一个扩展,由Gannot等人在文献13中提出:这种方法把从讲话者到麦克风阵列

13、的信号路径建模为传递函数,而不仅仅是简单的延时。对比Hoshuyama等人的方法。此方法用一个单一麦克风信号代替固定波束形成器的输出信号作为基准信号,同样差值信号用作GSC的噪声参考信号。虽然这三种方法是以补偿声学不匹配为初衷来设计的,但它们实际上也适合校正麦克风的不匹配。4 系统的方法 如在第2.2节中讨论的,关键是要使麦克风传输特性的不匹配以及声学传递函数的不匹配尽可能小。 在本节中将会引入一个简单的基本单元,该单元可以补偿这些不匹配。对于多通道的情况要建立一个自校准系统需要可能不止一个基本单元。此外,也有不同的方式来组合基本单元。4.1基本单元 在这篇文献中所提出的方法是基于一个简单的基

14、本单元。这个基本单元涉及了两个输入信号和两个输出信号,如图2所示。参考信号通过有N个系数的自适应FIR滤波器滤波后, 其结果是校准后的输出信号,可由下式算得: (6)图2 自校准的基本单元 参考信号通过自适应 滤波后与期望信号匹配,基本单元的输出信号是校准信号和误差信号。另一个输入信号,是期望信号。用于调节自适应滤波器的误差信号;其计算公式为目标信号和校准信号的差: (7)为了模拟非因果部分,必须引入目标信号的延迟采样。调整滤波器的系数,使得均方误差最小化,这可以利用自适应的NLMS算法实现。 (8)通过调整步长参数可以控制。图2中的结构通常被称为干扰消除器,它最初的目的是为了抵消目

15、标信号中的相关信号(期望)的,而且我们感兴趣的是它的误差信号,然而,此文章中这个基本单元是为了实现与输入信号的匹配,所以校准后的输出信号也是很重要的。4.2 阵列处理的结构在有两个以上的基本单元麦克风的多通道情况下,需要几个基本单元来建立一个自校准系统。选择这些单元的输入信号有多种选择。四种不同的结构可以由图3中的描述来区分,这些结构分别由字母A,B,C和D来分别描述,假设输入信号是关于期望信号时间对其的。在大范围的阵列组态中,这种对其可以通过使用补偿相对时间延迟的分数延迟滤波器来实现。4.2.1 结构A从目标信号的阵列中任意选择的一个麦克风信号作为输出信号,其它M1个麦克风的信号作为M1个基

16、本单元的参考信号。这些信号经过滤波器滤波,从而校正了与目标信号相关的部分。这些经过校正输出的信号可作为随后的波束形成器的输入信号。目标麦克风的信号必须延迟D个采样单元以避免时间上的偏移。4.2.2 结构B如果在结构A中每个基本单元的输入信号交换了一个新的配置结果。那么同样是利用M-1个基本单元但是现在M1个麦克风支持M-1个不同的目标信号。剩余的麦克风的信号作为每个基本单元的参考信号。在图3中,麦克风1的输出作为参考信号。每个单元校准后的输出信号,是从同一个麦克风产生的相关信号经过滤波后产生的。因此,它们不适合作为后续波束形成器的输入信号,因为它们不包含有用的空间信息。然而,误差信号包含了空间

17、信息,因为他们不仅和参考信号相关,而且与目标信号相关。这些误差信号可以用作波束形成器GSC的噪声参考信号。这样,结构B代替了阻塞式矩阵,并可视为波束形成器本身的一部分。4.2.3 结构C结构A和结构B都只利用了单一的麦克风信号,但采用单一的麦克风信号作为参考信号,会有选择了性能不好的麦克风的风险。相反,一个固定的波束形成器的输出信号可以用来作为一个基本单元的增强目标信号。固定波束形成器平均了麦克风的特性,这使得该结构更加可靠。基本单元地基准信号的选择和结构A相似。但是这里必须用到M个基本单元。图3:多通道信号处理的可能的自校验结构。假定对于所有的麦克风信号,对应于期望方向的时延差别是可以补偿的

18、。4.24. D结构通过交换C结构中的基本单位的输入信号可以推断出更深层次的结构。再次校准输出信号,不包含空间信息的基本单位,可以利用一个声源定位。因此, 类似于结构B,误差信号被用在GSC作为噪声参考信号。然后自校准结构取代了阻塞矩阵,可以解释为加拉帕戈斯扩张中心的一部分。4.2.5关系已知的解决方案这一部分介绍了一些配置,它对应于在3.2节里描述的已知的方法。结构A与Van Compernolle在文献8中所提出的系统相一致。而B结构与Gannot et al.13的系统相类似。此外,结构D对应于Hoshuyama et al9的自适应的阻塞矩阵的方法,除了约束的自适应滤波器,在这里我们略

19、过。4.3递归的配置作为一个扩展结构C,递归实现在文献2中有提到。替代了原始的麦克风信号,这里校准麦克风信号应用在一个固定声源定位: (9) (10)这个固定波束形成器的输出信号为滤波器的基本单位提供了一个增强的目标信号自适应性的作用。 (11)图4. 结构Cc是结构C的一个扩展。目标信号是麦克风信号产生的。由于闭环的基本单位IC*已经被额外的措施所稳定。与结构C相比,目标信号的质量进一步加强,因为是用校准信号生成目标信号而不是未校准的信号。这个修改后的结构被称为结构Cc。处理结构如图4所示。通过采用校准信号来产生目标信号而引入了一个闭环。由于这个递归结构,必须采用一定的约束来防止滤波器收敛到

20、零值。麦克风校正滤波器的算术平均值是对应于一个纯延迟D: (12) (13)实现基于NLMS算法的约束适应滤波器系数的一个可能的方法文献2中已经导出。代价函数JmðkÞ的均方误差平方和被最小化: (14)该算法包括两个步骤: (15)随后,将式(12)中的约束条件带入到中间滤波器系数中: (16)对于公式的调整步骤(15)的步长是归一化到自适滤波器的输入数据的幅度平方。 (17)用可以控制自适应的速度。特别地,当输入信号包含了主要的期望话音信号时,自适应只允许在相位范围内进行。然而,在语音中断时,步长必须设置为,为了使其稳定,必须为4.4适应控制在前面几节介绍的自校准系统特

21、别适合与自适应波束形成器结合使用。自校准系统的自适应滤波器只能当讲话者谈话时才能更新,而波束形成器的自适应滤波器只在语音间歇期间进行调整。因此需要一个自适应控制来分析分析麦克风信号并确定自校准和波束形成器的步长。自适应波束形成器和提出的自校准系统的自适应步长由一个准则控制,此准则也期望方向的来波信号。这是通过比较固定波束形成器信号的信号功率公式(2)和阻塞的信号的功率公式(3)来实现的。功率值由一个一阶IIR滤波器随着时间的推移进行平滑处理,其中是一个固定的平滑参数。 (18) (19)在讲话期间的信号功率(通过求和得到)比阻塞信号的强度大的多,这是因为求和信号分量来自指向方向,而阻塞的信号是

22、抑制这些方向的。因此,这两个功率之比可以用来建立一个空间准则用于检测目标方向的来波信号: (20)自适应均衡系数用于比值归一化。它们在讲话停顿时咦这样一种方式自适应,在纯背景噪声的相位中的比值。因此,值大于1表示信号来自指向方向。为了进一步提高这一标准的鲁棒性可以在不同的子带上平均或平滑。仅当比率低于阈值时,波束形成滤波器才会调整。而校准滤波器只有在比值高于门限值且信号功率足够高时才会调整。5.评估文章提出的系统已在有讲话者和行驶噪音的汽车环境中进行了评估。由于奔驰轿车的麦克风阵列实际是一个串联系统。这个系统由M=4个差分麦克风集成在后视镜的底侧,麦克风之间以约5厘米的间距近似线性排列。麦克风信号采样的速率,而且用256点的FFT分解为P =129个子带。多相滤波器组的频率调制汉宁窗的长度,子采样速率为R =64。图5. 时域信号在不同条件下的连续若干次的记录。在第一和最后一种情况都显示一个单麦克风的信号。第二种情况是未校准的GSC的输出号。第三种情况,显示了GSC与自校准结构Cc结合后的信号。在这两种GSC系统中自适应控制起到了很大的作用。自校准的效果可从图5的时间域信号中看到。未经校

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论