(通信与信息系统专业论文)二维麦克风阵列语音增强算法研究.pdf_第1页
(通信与信息系统专业论文)二维麦克风阵列语音增强算法研究.pdf_第2页
(通信与信息系统专业论文)二维麦克风阵列语音增强算法研究.pdf_第3页
(通信与信息系统专业论文)二维麦克风阵列语音增强算法研究.pdf_第4页
(通信与信息系统专业论文)二维麦克风阵列语音增强算法研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(通信与信息系统专业论文)二维麦克风阵列语音增强算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 语音增强技术是语音信号处理的一个重要分支,在语音识别、语音合成、语 音控制等语音处理技术中都要求纯净的语音信号,因此,如何扶含有噪声的语音 信号中得到尽可能纯净的语音信号是一个重要的课题。对接收到的语音信号进行 语音增强,是解决这问题的一个有效手段,本文研究了二维麦克风圆形阵列的语 音增强算法,达到了良好的语音增强效果。 本文深入研究了二维麦克风圆形阵罗| 的信号模型,分析了麦克风圆形阵列语 音增强实现的可行性。本文首先使用加权的m u s i c ( m u l t i p l es i g n a lc l a s s i f i c a t i o n ) 算法对语音信号进行d o a ( d i r e c t i o no f a r r i v a l ) 估计,提高了算法的定位准确度; 其次根据估计得到的d o a 信息,使用改进的波束形成算法对各个麦克风阵元接收 到的语音信号进行波束形成,得到了良好的语音增强效果。本文使用m a t l a b 仿 真实现了本文的算法,仿真结果表明,在低信噪比情况下,语音信噪比可以提升 l o d b ,达到了良好的增强效果。 关键词:语音增强麦克风阵列波束形成d o a 估计频率聚焦 a b s t r a c t s p e e c he n h a n c e m e n ti sa ni m p o r t a n tb r a n c hf o rs p e e c hs i g n a lp r o c e s s i n g c l e a n s p e e c hs i g n a l sa r en e e d e di nt h ea p p l i c a t i o n ss u c ha ss p e e c hr e c o g n i t i o n , s p e e c h b u i l d i n ga n ds p e e c hc o n t r o l 。 i th a sb e c o m ei m p o r t a n tt og e tc l e a ns i g n a l sf r o mn o i s ys p e e c h i ti sa l le f f e c t i v e m e t h o dt os o l v et h i sq u e s t i o nb ys p e e c he n h a n c e m e n t t h i st h e s i sr e s e a r c h e so na 2 - d i m e n s i o nm i c r o p h o n ea r r a ys p e e c he n h a n c e m e n tm e t h o dw i t has a t i s f a c t o r yr e s u l t a g e n e r a ls p e e c hs i g n a lm o d e lf o rm i c r o p h o n ea r r a y sh a sb e e nb u i l ti nt h ef i r s tp a r t o ft h i st h e s i s 。aw e i g h t e dm u s i ca l g o r i t h mi sp r e s e n t e d ,a i m i n ga tm i n i m i z i n gt h e e r r o r so ft h ed o a b a s e do nt h ed o a i n f o r m a t i o n , am o d i f i e db e a m f o r m i n ga l g o r i t h m i sa p p l i e dt og e tab e t t e rs p e e c he n h a n c e m e n tr e s u l t 。t h ea l g o r i t h mh a sb e e nr e a l i z e db y m a t l a b i ti ss h o w nb ys i m u l a t i o n st h a ts n ri si n c r e a s e da b o u tlo d bi nl o ws n r e o f 通i l i 溅 k e yw o r d s :s p e e c he n h a n c e m e n tm i c r o p h o n ea r r a yb e a m f o r m i n g d o ae s t i m a t i o n f r e q u e n c yf o c u s i n g 独创性( 或创新性) 声明 本人声明所里交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他入已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或 其它教育机构的学位或研究成果:也不包含为获得两安电子科技大学或其它教育 机构的学位或证书瑟使用过静材料。与我一同工作的同志对本研究所做的任何荧 献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责彳壬。 本人签名: 器翅立掣 关于论文使用授权的说明 本人完全了解嚣安电子科技大学有关保留和使矮学位论文的规定,即:研究生 在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业 离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学 校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部 或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文在 解密后遵守此规定) 本学位论文属于保密在一年解密后适用本授权书。 本人签名:蔓叠里鱼 导师躲缒 日期鲨i :主:竺 日期一刊:滥 第一章绪论 第一章绪论 1 1 语音增强的尽的及意义 从语言产生以来,在人们日常生活中,语言一直是最重要的一种交流手段, 语音信号蛉处理也一直是研究酶热点。在实际的语音信号处理中,语誊总会受到 外界环境噪声的干扰,这些噪声来自不同的环境,包括从传输介质中引入的噪声、 电气设备的噪声以及人与人之阕的通话干扰等等。这些噪声会不燕程度盼影螭语 音的质量,使得许多语音信号处理系统的性能急剧恶化。例如,汽车中的免提电 话、封闭的会议室里不但会有背景噪声,丽且还伴随着回声,在这种环境中,语 音信号的质量将会严重韵恶能。在缀多语音处理系统中,语音处理蕊效果将会受 到噪声干扰的严重影响。譬如,语音识别系统的识别率在无噪声环境下是很高的, 但是在噪声环境孛箕性能将受到严重影响。嚣姥,语音增强麴骈究在语窘蕊号处 理中是必不可少的。 语誊增强技术同时又是语音藩号处理的一个重要分支,它广泛应用予嘈杂环 境下的噪声抑制、语音压缩编码和语音识别等领域中,在解决语音噪声污染问题、 改进语音通信质量、提高语音可懂度和语音识别率等方面发挥着越来越重要的作 用。 然而在实际环境中,语音中掺杂的噪声信号都是随机产生的,并且噪声掺杂 的方式葚 常复杂瓣,想要完全镯底地港除噪声凡乎是不可能携。语音增强酶嚣熬 是从带噪语音中尽可能地提取纯净的原始语音,消除在纯净语音中混杂的各种背 景噪声。但是,信号处理中背景噪声靛消除是跟语音的盎然度,语音魏失真度是 相对立的。如果单纯追求噪声的清除程度,就会影响语音的诌然度甚至可懂度。 因此在语音处理的过程中,处理过程中要从这添个方惹取一个折衷,使得增强算 法既能改进听觉矮量,又降低语音失真度。 l 。2 语音增强算法和研究现状 语音增强是- - i 1 涉及蘑缀广的交叉学科,它不单单是与语音数字信号处理理 论有关,而且涉及到数理统计、神经生理学和语音学学科。此外,语音增强所面 临的噪声形式也可能众多,常见的如街道、工厂车间、会议室和人声鼎沸的公共 场所等地方的嗓声,因此缀难对语音信号戆楚理建立一个通震的模型。人们在研 究语音增强的方法时一般是从语音特点、人耳的感知特性以及噪声特点等几个方 露鼹潜入手,建立有针对性的模型,进行有错对性戆舍适鲶语音处理。 2二维麦克风阵列语音增强算法研究 1 2 1 语音信号的特性 语音是时变、非平稳、菲遍历的随机过程。语音发声是一个时变过程,很多 因素造成了发声系统的时变性,例如声道的面积随着时间和距离改变,气流速度 随着声门压力变化丽变化等。但是声道形状有耀对稳定性,在一段时间内 ( 1 0 3 0 m s ) ,人的声带和声道形状是相对稳定的,可认为其特征是不变的,因而 语音的短时谱具有相对稳定性,可以把语案信号看成是短时平稳的。在语音分析 中可以把语音信号分为若干帧,每帧的语音可以认为是平稳的【l j 。 语音可以分为周期性的浊音和非周期的涛音,浊音和清音经常在一个音节中 同时出现。浊音部分和音质关系密切,在时域上呈现出明显的周期性,在频域上 有共振峰结构,而且能量大部分集中在较低频段内,是语音中大幅度高能量的部 分;清音则具有明显的时域和频域特征,类似于白噪声,能量较小,在强噪声中 容易被掩盖,但在较高信噪比时能提供较多的信息。在语音增强中,可以利用浊 音的周期性特征,采焉梳状滤波器提取语音分量或者抑制j 语音信号,瑟清蠹则 难以与宽带噪声区分。对于清音与宽带白噪声类似的特性,语音信号处理中很难 对其中的嗓声进行抑制的同时又保证清音不被消除,因此清酱的处理是语音信号 处理的一大难点。 混杂在语音信号中的噪声来源取决于实际的应用环境,因而噪声特性可以说 复杂多样的。噪声可以是加性的,也可以是非加性的,非加性噪声主要是残响及 传送网络的电路噪声等。加性噪声大致上有:周期性噪声、脉冲噪声、宽带噪声 和同声道的其它语音干扰等。 周期性噪声主要来源于发动机等周期性运转的机械,电气干扰,特别是电源 交流声也会辱| 起周期性噪声,其特点是有许多离教的窄谱峰,周期性噪声可以通 过滤波或变换技术将其去除。 脉冲噪声来源于爆炸、撞击和放电等,表现为时域波形中突然出现的窄脉_ 冲。 这种噪声可以在时域内进行,根据带噪语音幅度的平均值确定阈值,当信号幅度 超出这个阈值时,判别为脉冲噪声并将其衰减消除。 宽带噪声的来源很多,包括热噪声、气流( 如风、呼吸) 噪声及各种随机噪 声源,量化噪声通常作为白噪声来处理,也可视为宽带噪声。由于宽带噪声与语 音信号在时域和频域上完全重叠,因而消除它最困难。平稳的宽带嗓声,通常可 认为是白色高斯噪声。 背景噪声对发音的影响主要是指噪声皴环了语音信号原有的声学持征和模型 参数,模糊了不同语音之间的差别,使语音质量下降,可懂度降低。强噪声会使 入产生听觉疲劳,还对讲话人产生影响,使讲话人改变在安静环境或低噪声环境 中的发音方式,从而改变了语音的特征参数,这对语音识别系统有很大影响。 第一章绪论 3 1 2 2 语音增强方法的研究现状 单通道语音增强算法研究已经有很久的历史了,随着数字信号处理理论的成 熟,2 0 世纪7 0 年代研究取得了一些基础性成果,并使语音增强发展成为语音信号 数字处理的一个重要分支。1 9 7 4 年,w e i s s ,a s c h k e n a s y 和p a r s o n s 最早提出了爝谱 相减法来抑制噪声【4 引,利用噪声的平均谱来估计含噪语音段的噪声,就可利用谱 相减法抑制翻链噪声。1 9 7 9 年,l i n 和o p p e h e i m 提融了维纳滤波语音增强方法转翱, 估计带噪语音的a r 模型参数,就能够以迭代的方式进行维纳滤波。 进入8 0 年代后,使用统计方法的语音增强方法成为研究的中心。1 9 8 0 年, m a u l a y 和m a l p a s s 提出了软判决噪声抑制方法1 5 们。1 9 8 4 年,e p h r a i m 和m a l a h 提 出了基于m m s e 短时谱估计的语音增强方法【5 l 】。在4 0 多年的研究中,许多语音 增强方法不断被提出,奠定了语音增强的基础并使之逐渐走向成熟。 9 0 年代后,新的语音增强方法的相继出现。例如对带噪语音信号进行小波变 换l 蹋,或者进行卡维南洛维变换( k l t - - k a r h u n e n l o e v et r a n s f o r m ) 5 3 1 ,或者进 行离散余弦变换( d i s c r e t ec o s i n et r a n s f o r m ) 5 4 j 来进行语音增强,以及基于人耳听 觉掩蔽效应的语音增强方法玲熨,图时,这些方法也不断的被继承、发展。 在实际环境应用中,尽管单通道语音增强发展速度很快,但是单个麦克风的 接收到盼语音信号是由多个声源和环境噪声的叠加构成,在实际应用中,人们常 常只对这些声源中的一个或某几个感兴趣。同时,由于声源( 说话人) 可能在室 内小范围内走动,以及室内各种其它声音的多径反射和混响等因素,都会导致单 个麦克风接收的信号信嗓院降低,从而导致语音逶信质量严重恶化,使得感兴趣 的说话人的声音难以听清。在噪声处理上,传统的麦克风一般采用在频域进行功 率谱抵消帮滤波等技术来抑制噪声。然两,这些接收到的语音信号通常在时闻和 频谱上相互重叠,因此,要分离出不同的声音并有效抑制噪声和干扰( 不感兴趣 的声音) 相当困难。另铃,使用单今麦克风,无法准确对准并跟踪感兴趣的说话 人。在语音通信中,可以使用阵列麦克风来弥补单个孤立麦克风的上述缺陷。 针对单个麦克风的以上不足,研究人员考虑使用麦克风阵列( m i c r o p h o n e a r r a y , m a ) 来提高语音的通信质量。所谓阵列麦克风,就是使用多个麦克风按照一定的 拓扑结构构成一个麦克风阵列,在时域和频域的基础上增加个空间域,对接收 到的来螽空闻不同方向的信号进行空时处理,使麦克风阵列具有去噪、声源定位 和跟踪、语音提取和分离等功能,从而提高嘈杂背景下的语音通信质量。 基翦麦克风阵列语音增强的主要方法是基于波荣形成理论的语音增强算法, 该类方法主要包括有:( 1 ) 最大信噪比波束形成算法【3 】 它通过最大化波束形成输 出信号的信噪比来选择权系数;( 2 ) 多通道旁瓣抵消器算法f 4 j ,它通过抵消辅助通 道上的噪声和干扰来获得去噪语音;( 3 ) 线性约束最小方差( l i n e a r l yc o n s t r a i n e d 4二维麦克风阵列语音增强算法研究 m i n i m u mv a r i a n c e ,简称l c m v ) 自适应波束形成算法【卯,此算法利用对总输出功 率的约寨最小化来实现输擞噪声功率的最小优。在羼来的研究中,c r r i f l ! i t h s 和j i m 提出了广义旁瓣抵消器( g e n e r a l i z e ds i d e l o b ec a n c e l l e r ,简称g s c ) 算法f 6 】- 7 1 ,把 受限的l c m v 最优化问题转化为非约束最优化问题;h o s h u y a m a 等人提出采用自 适应的阻塞矩阵,以及和g s c 相似结构的语音增强算法i s 9 1 ;( 4 ) 参考信号波柬 形成法t 1 0 1 。【l l 】。 此外,最近凡年麦克风阵列语音增强中等| 进了育源分离的方法也取得了良好 的增强效果【5 6 】f 5 7 1 。 1 3 本论文的主要内容与结构安排 本文针对室内语音环境中存在的说话入之间语音的干扰以及复杂的背景嗓声 等问题,利用基于多通道输入的语音增强算法能够充分利用频域和空域信息的特 点,在基于波束形成算法基础上,加入了基于m u s i c 算法的d o a 估计,提高了波 束形成器的增强效果。该算法包含了两部分结构:第一部分是基于m u s i c 算法的 空闻谱估计,利用加权的空闻谱估计方法德计出虽标语音信号和干扰语音信号的 来向;第二部分根据第一部分所得到的目标语音及干扰语音的d o a 信息,使用了 与接收信号相关的统计最优的波束形成方法对接收到的阵列语音信号进行增强。 仿真实验测试结果表明,相对于传统的麦克风阵列波束形成语音增强系统,这种 算法具有更高的输出信噪比,对于解决干扰语音较大的环境下有更好的增强效果。 论文的结构安排如下: 第章主要研究了语音信号处理中语音信号的特性和研究现状。 第二章主要研究讨论麴何在各种麦克风阵列拓扑结构中建立一个语音信号的 模型,研究了一些常见的麦克风阵列语音增强方法,并对它们的性能进行了的分 析比较。 第三章研究了语音d o a 估计的算法,使用m u s i c 算法对语音的来向进行了 估计,并研究讨论了一些提高估计精确度降低估计错误率的一些方法。 第汹章研究了波束形成器的权向量的计算算法,主要讨论了使用频率聚焦算 法的统计最优的波束形成器的权系数计算方法。 第五章对本文研究的算法进行仿真验证。 第六章是对本文所做的工作进行的总结。 第二章麦克风阵列语音增强算法研究 5 第二章麦克风阵列语音增强算法研究 蓠一章对语音信号及噪声的特点以及现存语音增强算法进行了研究,为了进 一步深入的讨论麦克风阵列语音增强算法,建立一个有效的麦克风语音增强的模 型,有必要对麦克风阵列的信号模型和几何尺寸进行深入的讨论。第2 1 节中研究 了一些麦克风语音处理中的近场和远场的概念,确定语音信号的远场和近场概念 是建立一个麦克风阵列语音信号模型所要讨论的前提条件。第2 - 2 节中给出了传统 阵列信号处理的模型,然螽在第2 ,3 节中给出了几种语音处理麦克风拓扑结构的详 细模型描述及其性能分析。2 4 节研究了一些基于阵列模型的经典的麦克风阵列增 强的算法以及语音增强性能毙较。 2 1 语音信号的远场和近场 在语音处理的过程中,远场和近场是一个重要的概念,语音的远场和近场在 麦克风阵列语音信号建模过程孛是很重要的一个因素。在麦壳风阵列语音处理豹 模型建立中,是必须要讨论的。 远场处理和近场处理本质的区别在于:远场中信号到阵列的距离远大于阵列 的宽度,信号到达各个阵元可以幅度的差异可以忽略不计,因此在远场模型中, 信号的模型是平面波模型,忽略各通道接收信号的幅度差,只考虑各通道接收到 的信号的相位差;与远场相反,近场处理使用球面波模型,接收信号的幅度差是 必须考虑的。近场由于考虑了幅度差,大大提高了运算难度,不适合进行实时性 比较强的语音信号处理。对于远场和近场的划分,没有一个绝对的标准,通常认 为离阵列中心的距离远远大于信号波长的区域为远场,反之为近场。这种方法没 个量化标准,因此实际判断起来比较困难。量菊,一个常用的经验公式是【1 4 1 2 l e n 2 , 所示: 0 毫驾浆三瑟0 p 8 , 丸:【辫一翌华m 掰:l ,2 ,膨 u 嗡 对于一个声源,以( m + 1 ) 2 为参考点,第m 个麦克风接收信号幅度为 最= 奠嚣 g 一 其时闻延迟为蛾- r ) c ,e 为声音传播速度3 4 0 m s 。则第m 个麦克风接收到 信号相位( 相对于参考点( m + 1 ) 2 ) 为 ¥= g 一2 矿孚 ( 2 1 0 ) f 为信号的频点频率。把式( 2 9 ) 和式( 2 - 1 0 ) 代入到式( 2 1 ) 则整个模型 豹传输矩阵可以写成 第二章麦克风阵列语音增强算法研究 a r t 1 4 字 坐;型 二e。一e 。 l i 量。鸶五血p 攀警型 r 2 0 1 2 2 32 麦克风均匀圆阵模型 鱼i 攀掣 生;挚 且。一,坐警型 ( 2 1 1 ) 二维均匀阵列中,最常见的是均匀圆形阵列世( 【a ,岍f o 粤c i r c l ea r m y ) ,如 图2 2 中i 蛩f o ) 所示。把肘个麦克风等间角度的放在一个半径为,的圆周上,就组 成了均匀圆形阵,在实际的仿真过程巾为了仿真实现的方便,在圆心上也加了一 路麦克风作为确定阵列位置的参考麦克风。在建立麦克风圆形阵列的信号模型过 程中,使用圆心上的这一路语音信号作为其他各路信号传输矩阵描述的参考向量。 从前面的介绍町知,声波的波长 范围为:1 0 3 4 0 c m 。根据经验数据:1 6 元阵 05 口 4 叩 05 口 4 0 0 2 口 2 2 0 0 0 图2 5 一维圆阵的波束形成器的方向圈 半径为2 5 c m 。这里采取的经验值也是根据式( 2 - 1 ) 所示,对于1 6 个阵元的圆形 竽 垫 p 且h k o 埽 e i k 蓼参 1 2 二维麦克风阵列语音增强算法研究 麦克风阵列,选择半径为2 5 c m ,由简单的圆形的周长公式可以得出,每个麦克风 阵元的距离大约是0 。3 5 c m ,其波束图方向图如图2 5 所示。 二维均匀圆阵的波束形成器的波束方向图的仿真过程使用了2 3 1 节中所讨论 的一维线阵模型的相同的处理方法,阵列模型采用图2 。6 所示的模型。 图2 5 中0 所永为俯仰角,口为水平角,麦克风阵列选择的是一个由1 6 个麦 克风组成的均匀圆形阵列,各个麦克风的分别分布在半径为2 5 c m 的圆上,麦克风 相隔大约0 2 5 n 8 的闻距。图2 5 审选择了四个频率点5 0 0 ,1 0 0 0 ,1 5 0 0 ,2 0 0 0 , 分别做出了波束形成器波束方向图的仿真。 由图2 。5 中所示的方向圈可以看国,二维均匀麦克风圆形阵列对德仰焦具有比 较敏感的波束形成作用。而在水平方向上,由于圆阵的对称特性,水平方向上的 波束形成是条平的直线,即单凭二维均匀麦克风是不能区分水平方向信号的。 本节接下来详细讨论了二维麦克风圆阵情况下的信号模型的建立【1 3 1 f 1 9 】,基于 麦克风均匀圆阵的信号模型如图2 6 所示: 潮2 6 麦霓风均匀圆形阵裂分析模型 该模型是一个三维模型,能提供声音信号的三维信息,选择阵列中心d 和第 一个麦克风麦克风l 为作为整个模型的参考点来确定麦克风的位置。霉2 6 中s 为 声源,为声源在麦克风圆阵平面上的垂足。秽为仇与麦克风圆阵中心法线的夹 角,9 0 一秽即为声源的俯仰角。弼为垂是s 与阵列中心0 的连线蕊与第一个麦 克风与圆心连线的夹角,即为声源的水平角。名是声源到阵列圆心0 的距离。那 么凭借这三个参数0 、口和气声源s 的方位就唯一确定了。令其方位矢量为 o 。= ( ,琅,搿订)g 一1 2 ) 可以按照模型图2 6 所表示的各个参数经过简单几何运算得到,对于第m 个麦 克风,与声源的水平夹角, 第二章麦克风阵列语音增强算法研究 1 3 偿槲:+ 2 n :_ ( m - 1 ) ,掰:l ,2 ,m ( 2 - 1 3 1 2 + t ,掰。l a ,埘 声源到第m 个麦克风的距离 囊一届两可= x r , z + b z - 2 b r , s i n o c o s a , , ( 2 - 1 4 : 再根据2 3 1 节同样的方法,可以得到圆形麦克风阵列模型的传输函数矩阵为 入c 帆彘嚣 三p 。掣 羔g 。掣 吃 。,2 # ( r j u - r j o k ;i e l i ,t p i 2 月f ( r j l :2 - r i ) 建i 。e 5 1 , 2 立p 掣且p 。警掣 r u 名l 澎 2 3 3 均匀球面阵列和三维均匀直线阵列模型 生;挚攀 r j k i k ;罂字 2 且e 吖警掣 ,海簿 ( 2 - 1 5 ) 从前面的讨论中可以看出,空间分布完全对称的阵列对相同方向的增益也应 该大致相同,因此具有优良的定饿性能。按照等角度采样和均匀采样的原癸, l j t 2 镯设 计了两种三维阵列。把肘个麦克风均匀( 等角度排列) 放在一个半径为,的球面上, 就组成了等角度采样( e q u i a n g u l a rs a m p l i n g ) 的均匀球蘧阵。把膨个麦克风均匀( 等 面积排列) 放在一个半径为,的球面上,就组成了均匀( 均匀采样,u n i f o r ms a m p l i n g ) 球面阵。 由于三维阵列的实现的算法复杂度比较高,对于实时的语音信号处理缀难实 现,本文不多做讨论,详细讨论可以阅读参考文献 1 4 】。 k _ _ ,、_ i ,一 2 3 4 各种麦克风阵列拓扑比较总结 经过上面的讨论,一维均匀直线阵列酌阵列结构最简单,定位算法的可选择 性也比较多,算法实现较为容易,对应的算法复杂度也较低等优点,因此得到了 十分广泛的应用。但是囊予均匀直线阵列定位的区域性,特别是在对整个三维空 间定位时必须分扇区工作,即由多个均匀直线阵列组成一个多边形阵列,增加了 区域的切换过程,所以增加了系统复杂度,具体实现时系统的成本也提高了很多。 但是如果定位系统仅仅只需要对部分区域定位,则维均匀直线阵列自然是最佳 选择。 对比一维均匀直线阵列,均匀函形麦克风阵列在平面内定位性麓十分优越, 1 4 二维麦克风阵列语音增强算法研究 同样在三维空间内也能达到比较好的定位效果,没有指向区的域限制,可以选择 懿定位算法也很多,适会手绝大部分的定位系统。所数本文选择了二维麦竟风毽 阵作为仿真的麦克风阵列拓扑模型,在三维空间内的定位达到了良好的效果。 三维阵列结构较复杂,实现成本也较高,但是对整个三维空间定位性能好, 适用于需要对整个三维空阂定位的系统。 2 。4 常焉的阵列语音增强方法研究 2 。4 1 固定波束形成 固定波束形成器的波束形成器的权值固定不变,与麦克风阵列中所接收的语 音信号无关,波柬静形成过程仅仅按照既定翁波柬系数来生成信号,相鲞于波柬 形成的指向方向已经固定,其原理图见图2 7 。 而川j 咽兮 x 2 秘) 帼 兮 辩 延 德 计 咽榭时延补偿 一 图2 + 7 弱定波寒形成器继构溺 从图2 7 可以看出,简单的固定波束形成器实际上就是对麦克风各个阵元接收 到豹谮啻信号进簿篱单的延时相加。延时累热方法可以分为三个部分,邸时阆延 迟估计、时间延迟补偿及累加部分( f l a n a g a n ,1 9 8 5 ) 。其中时阆延迟佶计与使用麦克 风数殿、麦克风间距、声源入射角及采样频率成正比,与声音的传播速度成反比。 加衩方法有很多种,最篱攀的是平均翔棂。该系统具有较磐酶蔷棒性显计算复杂 度也较小。设麦克风阵列的输入信号为t ( 糟) ,各个阵元的加权系数为m ) ,则对 予霾定波紊形成器戆阵捌输壅可以写成翔式2 1 6 ) 所示: 丝 y ( n ) = w _ f ( n ) x i ( n t ) ( 2 1 6 ) t = l 其中膨为麦克风的个数,式中t 表示通过估计而得到的延时补偿。假设w l 各 个权系数摆等,鄄可以设定琰= 1 m ,经过延时补偿 第二章麦克风阵列语蒋增强算法研究 1 5 x i ( n - 1 :f ) = s f 伽) + m )( 2 1 7 ) s a n ) 为语音信号在第个逶道上接收到鹃值,n a n ) 鸯穗瘴通道上接收到的噪 声,把( 2 1 7 ) 代入,则式( 2 1 6 ) 可以写成 罗( 控) = 丢m 面1 趣( 嚣) + 越( 艘) ) = s ( 黠) + 面1 善mm ( 露) ( 2 1 8 ) 由于噪声越( 嚣) 熬不榴关性质,放可以使得噪声降低,对于一舍材通道麴麦克 风阵列波束形成器的信嗓比可提高1 0 l o g 。m d b 。但是可以看出,该方法的语音增 强能力是以增加麦克风阵列的阵无数量作为饯价豹,对于一些不限制麦克风数謦 的场合下,这是一种很好的增强方法犯n 。 2 4 。2 爨适应波束形成方法 固定波束形成器的权值选择完全独立与麦克风阵列所接收到的语酱信号,却 固定波束形成器的权值与接收到的语音信号完全不相关,对各种不丽语音信号进 行处理这显然是不合理的,达不到最优的处理效果。实际环境下语音是变化的, 并豆当说话太不同语音酌变诧毙较显著。如果波束形成器的系数是跟麦克风阵元 接收到的语音信号相关,则得出的麦克风波束形成器的阵元加权系数便成了自适 应熬波束形戒方法7 戮l 。鸯适应波束影藏器g s c ( g e n e r a l i z e ds i d e l o b ec a n c e l l e r ) 模型如图2 8 所示。 霾2 。8 基运痤波束形残挨塑 自适应波柬形成模型主要有三个部分组成:第部分主要是固定波束形成器 部分,这一部分主要曩来产生一个参考语啻信号,作为蜃覆鑫适应部分熬参考信 号;第二部分是一个阻塞矩阵模块,艿是个阻塞矩阵,用来消除接收到的语音 信号,产生噪声参考信号;第三部分是一个自适应噪声抵消模块,综合翦两部分 的语音参考信号、噪声参考信号来产生一个援:较纯净的语音原始信号。 1 6 二维麦克风阵列语音增强算法研究 阻塞矩阵如式( 2 1 9 ) 所示: b = lloo ollo 000l ( 2 - 1 9 ) g s c 将f r o s t 波束形成器【2 2 】改进为由主要通道和辅助通道两部分构成的自适 应波束形成器。 设f r o s t 波束形成器的约束矩阵为p ,与语音信号来波方向楣适应的滤波器系 数矢量为尸,阻塞矩阵输出的噪声参考信号的信号矢量为u ( n ) ,系统输出为y , f r o s t 的约束囊适应迭代过程为剐: 帮( ,l + 1 ) = p h ( n ) - l , t y ( n ) x ( n ) 】+ f( 2 - 2 0 ) 滤波器权系数更新方程为: h j ( 疗+ 1 ) = e ( 功一, u y ( n ) u ( n - i ) ( 2 2 1 ) 式中为步长,f 为阻塞矩阵输出端口的第f 个逶道标示。 从自适应噪声抵消的过程可以看出,g s c 对相干噪声具有较强的抑制能力。 同时,由于时延估计等因素带来的信号方向矢量的误差,使褥在阻塞矩阵输出端 的噪声参考信号中,不可避免的含有了与语音相关的信号成分,从而导致了自适 应波束形成输出端的语音信号的抵消。 g s c 对相关噪声有很姆的消除能力,但是对于非相干噪声其消除能力十分有 限,这都是g s c 模型的缺点。 在开放环境条件下,如果噪声源的数叠比麦克风数疆少,盘适应波慕法能得 到很好的性能。而在封闭环境中由于反射和混响会产生多噪声域的情况,在此散 射噪声条件下自适应波束法的消噪性能比较有限。 2 4 3 后置自适应波束形成方法 考虑到g s c 对相干噪声有很好的消除性能,对于非相干噪声其消除作用十分 有限,面维纳后滤波对非相干噪声有很好的消除作用,已广泛地应用于各种基于 麦克风阵列的语音增强系统中。将维纳滤波结合到g s c 的非自适应支路中,利用 维纳滤波器的输出作为g s c 自适应支路的目标信号。该结构相对于传统的维纳后 滤波面言,不但能更有效地消除时变的噪声和干扰,露且能减小语音信号增强之 后的失真i 玎i 。 第二章麦克风阵列语音增强算法研究 1 7 2 4 4 几种麦克风阵列语音增强的优缺点比较 由上述分析可知,延迟累加波束法和后置酝适应滤波法适用于非相干噪 声和弱相干噪声消除;而自适应波束法适用于消除相干噪声,对非相干噪声或散 射嗓声消除效果较差。丽在实际应用中,噪声域包含的噪声既不是完全散射的也 不是仅有直接路径到达麦克风的,因此需要在以后的研究中探讨可以同时消除这 两静噪声的麦克风阵列语音增强方法。 2 5 本章小结 本章详细阐述了关予麦克风阵列语音增强的基本知识。讨论了麦克阵列的安 放几何拓扑结构,详细研究了在语音增强中麦克风阵列拓扑结构的性能及阵元间 距。研究了麦克风阵列的信号模型的建立过程,给蹴了近似的远场阵列语音增强 的传输矩阵。 本章研究了几种经典的麦克风阵列增强算法,综观这些增强方法,有一个不 可避免的缺点。就是很多算法都是从传统的阵列算法中演变过来的,尽管做了一 些改进,但对于语音的非窄带平稳性质,以及室内语音环境的回响、混响复杂的 噪声环壤等处理起来都有一定的欠缺。本文下凡章讨论了一种阵列语音增强方法, 把语音增强分成了两大部分:第一,先根据各个麦克风接收到的语音数据对声源 的方向进行定位( d o a 检测) ;第二,逶过第一步检测的结果,刹用与接收数据相 关的统计最优的波束形成方法对麦克风阵列各个阵元信号进行加权。如此一来, 提高了处理语音的保真度,对复杂噪声环境进行了空间滤波,降低了混响回响对 语音信号的影响,提高了处理语音信号的信噪比。 , 第三章麦克风阵列的m u s i c 算法声源定位1 9 第三章麦克风阵列的m u s i c 算法声源定位 在传统阵列信号处理中,特征子空闯算法,是现代谱估计最重要的算法之一, 通过对阵列接收数据作数学分解,划分为两个相互正交的子空间,与信号源的阵 列空闻一致的信号子空闻,和与信号子空间正交的噪声子空闻。子空闻分解算法, 就是利用两个子空间的正交特性,构造出非常尖锐的空间谱峰,从而大大提高算 法的分辨力。予空间分解类算法从处理方式上可分为两类:类是以为 m u s i c ( m u l t i p l es i g n a lc l a s s i f i c a t i o n ) 算法为代表的嗓声子空闻算法,另一类是以 旋转不变子空间e s p r i t ( e s t i m a t i o no fs i g n a lp a r a m e t e rv i ar o t a t i o n a li n v a r i a n t e t e c h n i q u e s ) 为代表的信号子空闻算法【| 5 】。 m u s i c 方法是最早的超分辨d o a 估计方法,属于特征结构的予空间方法。 子空闻方法建立在这样一个基本观察之上:若阵元个数比信源个数多,则阵列数 据的信号分量位于接收到信号空间的一个子空间中。在一定条件下,这个子空间 将唯一确定信号的波达方向,并且可以使用稳定的奇异值分解来精确,从而确定 波达方向。由于把线性空间的概念引入到d o a 估计中,子空闻方法实现了信号到 达方向的估计分辨率的突破。算法利用接收数据的协方差矩阵,分离出信号子空 间和噪声子空闻,利用信号方向信息组成的方蠢矢量与噪声予空间的正交性,来 构成空间扫描谱,实现信号的参数估计。 作为子空闻方法的重要代表,m u s i c 算法是空闻谱估计发展史上具有里程碑 意义的算法,实际上己经成为空间谱估计方法和理论的重要基础。其特点是测向 分辨率高:对信源个数、到达方向、噪声干扰强度、来波的强度和相干关系可以 进行渐近无偏估计等。从1 9 7 8 年s c h m i d t 首先提出m u s i c 算法以来,它受到了 广泛的关注,研究人员不断对其进行研究和改进,奠定了算法在空间谱估计算法 中的地位。图3 1 是一个标准的m u s i c 空闽谱估计葬法的模型。 l _ 叫通道l i i 处 f 陟叫通道2l l 理 , i i l l 器 ll :b 一诵谱m l l i 图3 1 空间谱估计算法的模型 懒过竺 2 0二维麦克风阵列语啬增强算法研究 3 1 传统m u s i c 算法 本节首先由图2 1 所示的m 元均匀线阵模型为例,简要介绍传统的m u s i c 算 法【3 0 l 。假定空阆有必+ 1 个远场窄带信号( 躅标信号s 积干扰源五,:,鬈,对应的 d o a 分剐为或釉) ,中心频率为厂。除此之外,还存在功率为玎。2 的空间岛嗓 声,且信号和干扰的功率远远大予噪声功率。那么,阵列的接受信号为: x - - - - - i x lx :x 麓f 吨a k e 匕 + 糕l n 2 n m + 犍l 糕2 n m l 其中,x g c 肌1 为阵列接收的信号矢量,a = 胁,麓m a j 2 ,a 矧暴c m 菇+ 1 为阵 列豹传输矩阵;纛。c 掰埘,鑫藏砖分剐表示瑟标和干扰对应麴方向矢量; s c ( 从1 ) 埘为信号矢量;n 毫c 肌1 为阵列接收的噪声矢量。 定义簿捌接收信号豹空闻相关矩晦r ,芒c 融封为, r x = e x x h 卜e 【( a s + n a s + n ) 何j = a e s s 珏k 辩+ 嚣圣珏h 】 = a r s a 珏+ 2 i ( 3 2 ) 其中,r s 撼e “鼽) 隽源薅号糯关筑阵,蠹手k 专董个信号源互不蠲关,敖r s 是非奇异( 满秩) 的,即其秩为k + i ,r a n k r 。 = k + i 。 对r :进行特锤分解,褥到 r ,= u u h 然【u s u 。 芝寻s 芝兰t u su 。】 = u s s u s 瓤e 。静。嚣( 3 - 3 ) 其中, = d i a g 燕,您,段 e 掰谢耩驻= 羹;,禚2 髓瓣l e 掰蹦分裂炎r 蕈 s五屯;k l。;。oo,且 ,徘球 ;删 ,产:。删。雠雄; l一一:呶 i 。劳呼: 薯 x 瞅 。:懈 第三章麦克风阵捌的m u s i c 算法声源定位 2 l 的特征值矩阵和特征向量矩阵,抛 表示以括号中元素为主对角线的对角矩阵, 按特征值的降序排列,即蚝恐数置稍) 旅x + 2 ) 然7 j i f = z 娃。e 科蛾为对应 的特征向量, m = 1 , 2 ,- m 。另外, s = 历昭杪。,y :,以删) j , 。= 馥裙城+ 2 ) ,孤鬈+ ,) ,u s = - 。,糕:,( 川) 】c 掰洲张成信号子空闽, 信号子空间的与k + 1 信号源有关,它的变化主要受+ 1 个信号源影响,与之相对 应,u 聃= k ( 删) ,髓( n :p 赣l f 】c 材婶一“) 张成嗓声子空间,只受噪声的影响。注意 到: r x u 。= c r :u 。= a r s a 对u 。+ :u 。 黔a r s a 村u 。= 0 ( 3 4 ) 警u a r s a 对u 珏= 0 由于r s 是非奇异( 满秩) 的,有 a 撵u 。= 0 静a u = 0 ,a 泛u 。= 0 ,七拦1 2 一k ( 3 5 ) 器器矩阵a 的各个列向量,或者说,墨+ 1 个信号源对应的方向矢量与噪声予空 间正交,利用这一重要特性,就可以估计出信源的d o a 。 定义m u s i c 算法估计的“空闻谱”为: p 2 面l 两2 而南丽 3 当然,空间谱k p ) 并不是任意意义下的真实谱,它与功率谱等物理谱的概 念的定义方式有明显豹区别。严格来说,它只是信号方向矢量与噪声予空阆之间 的“距离”。尽管如此,它却能在真实d o a 附近出现“谱峰”,超分辨的表达各个信 源的d o a 。例如,p ) 的k + 1 个最高的“谱峰”就对应足+ 1 个信号源的d o a , 即甚和。 考虑到实际麦克风接收的数据矩阵是有限长的,即数据协方差矩阵的最大似 然估计为 食= x x ( 3 7 ) r 一 对螽进行特征分解可以计算得到噪声予空间特征矢量矩阵o 。由于噪声的存 在,信号子空闻矢量和噪声子空间亩。并不能完全正交,因此,m u s i c 算法的谱估 计公式为, k p 2 阿1 = 骊1 p 8 ) 2 2 二维麦克风阵列语音增强算法研究 实际上求d o a 是以最小优化搜索实现的,即 = 鹕雾m i n t x 露净糕蟊 程柳( 3 - 9 ) 以上详细研究了传统的m u s i c 算法,但传统的m u s i c 算法对信号的有着比 较严格的要求,需要髂号梵窄带平稳信号,鞭就,对m u s i c 算法进行改进使其可 以应用在语音信号的处理中是必须要讨论的问题。 3 2 麦克风阵列的m u s i c 算法 3 2 。1 麦竞风阵列m u s i c 算法豹特点 虽然空间谱估计已经取得了大量的研究成果,但是弱前的方法绝大多数是基 手远场窄带信号设计酌。基于麦克风阵刭豹声源定位算法,与传统的d o a 估计方 法有许多共同点,同属于阵列信号处理的范畴。但是,基于麦克风阵列的信号处 理,是针对非窄带平稳嚣巍然语音信号。因此,窄带缎设不褥成立。翔纳趋来, 基于麦克风阵列的声源定位问题,与传统的窄带d o a 问题,主要有以下点不同【1 9 l 。 鬻规的阵列处理接收信号为典型的窄带信号,有较高戆巾心频率,最高频 率 与最低频率石之差相对较小,即信号的分数带宽b ,( 其定义为 嚣,= ( 磊- f , ) 五小予0 0 1 。此时出阵元之阉豹接收信号融延r 弓l 起的摆位差,可 以近似看成褶等,即矿2 z f r 怨2 z f h r 搿2 z f c f ,信号可以近似看成单频信号,相同 的时延引起的相位差相同,时延可以通过简单的相移来补偿。最近几年提擞的宽 带信号处理戮及超宽带信号处理,其分数带宽逮仅仅隽0 o l 翘2 5 程0 2 5 一董。0 。在 麦克风阵列处理中,接收信号是没有经过调制的信号,阵列接收信号的相位差e l l 信号源的特性寒决定。麦亮风阵列接收夔信号,最羝频率常常在1 0 0 h z 左右,甚至 更低,高频常常在4 0 0 0 h z 左右,其分数带宽比接近2 ,时延所引起的相位差随频 率鲍不弱嚣莛不弱,誉能够用篱萃赞相移来枣 偿。因此,无法耀传统的窄带、宽带 甚至超宽带信号处理的算法,来解决声源定位闷题。 传统的阵列处理的接收信号,般为平稳电磁波信号,可以用较长的时间累 计来获得较准确的信号相关豳数。麦克风阵列的接收信号为短时平稳靛语音信号, 当信号时间长度大予4 0 毫秒时,不再具有平稳性,在时域难以获得准确的相关函 数,这导致常规的阵列处理算法性能下降。 常规的阵列处理,假设阵列接收的噪声均为高斯臼噪声,而且是空间囱噪声。 在麦克风阵舞处理孛,噪声情混毙较复杂。铡翔在室蠹环境下,典型的嗓声有空 调风机发出的噪声、工作中的计算机发出的噪声、甚至还可能有突然晌起的电话 铃声、打印枧噪声以及开门关奠等。这些噪声翻于扰显然不满足空闻是噪声条件, 从丽导致定位性能下降甚至错误。 第三章麦克风阵罗l j 的m u s i c 算法声源定位+ 2 3 在绝大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论