已阅读5页,还剩62页未读, 继续免费阅读
(模式识别与智能系统专业论文)阵列信号处理与语音消噪方法研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ab s tr a c t ab s t r a c t t h e re is u n a v o i d a b l e t h a t n o i s e a n d i n t e r f e r e n c e a re b ro u g h t i n d u r i n g t h e r e c e i v i n g o f t h e s i g n a l . u s i n g o f t h e m u lt i - m i c r o p h o n e e x p a n d th e n o i s e re d u c t i o n m e t h o d o f s i n g l e - m i c ro p h o n e , e s p e c ia l l y u n d e r t h e e n v i r o n m e n t o f re v e r b e r a t i o n a n d u n s ta b l e s i g n a l . t h i s t h e s i s i n t r o d u c e s t h e a r r a y s i g n a l p r o c e s s t e c h n i q u e , w i t h t h e w i d e b a n d s i g n a l p r o c e s s a n d s e l f a d a p t iv e a l g o r i t h m , p r e s e n t s t h e i m p ro v e m e n t o n t h e p o w e r s p e c t r u m p h a s e m e t h o d a n d a d a p t i v e g e n e r a l i z e d s i d e l o b e c a n c e l l e r s o t h i s t h e s i s f o c u s e s o n t h r e e a s p e c ts : l u n d e r s t o o d t h e b a s i c th e o ry o f t h e n e a r s p e e c h m o d e l , f a r s p e e c h m o d e l a n d m a t h e m a t i c o n a r r a y s i g n a l p r o c e s s . 2 . a n a ly z e d t h e s i g n a l c o ll e c t i n g i n t h e n e a r s p e e c h m o d e l , p r e s e n t e d t h e d e l a y e s t i m a t e m e t h o d b a s e d o n t h e s e l f - c o r r e l a t i o n . 3 . a n a l y z e d t h e f il t e r i n t i m e d o m a i n , e x p a n d e d t o t h e s p a c e d o m a i n , b r o u g h t i n t h e s e l f a d a p t iv e m e th o d , p r e s e n t e d o p t i m i z e d b e a m f o r m e r . t h e e x p e r i m e n t s h o w t h e i m p r o v e d d e l a y e s t i m a t e m e t h o d e l i m i n a t e s t h e h i g h fr e q u e n c y p a r t in t h e s i g n a l , a n d a d a p t i v e m u lt i - l a n d b e a m f o r m e r c l e a n s t h e n o i s e a n d i n f e re n c e s i n t h e s p e e c h . k e y wo r d s : d e l a y e s t i m a t e , s p a ce f i lt e r , g e n e r a l i z e dc a n c e l l e r , b e a mf or ung 南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、使用学位论文的 规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电 子版,并采用影印、缩印、 扫描、 数字化或其它手段保存论文; 学校有权提供目 录检索以及提供 本学位论文全文或者部分的阅览服务; 学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电 子版; 在不以 赢利为目 的的前 提下,学校可以适当复制论文的部分或全部内 容用于学术活动。 学位论文作者签名: , 刁年 犷 月 z 日 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名: 1% a 学位论文作者签名: t 0 解密时间: 年月日 各密级的 最长保密年限 及书写格式规定如下: 内部5 年 ( 最长5 年,可少于5 年) 秘密1 0 年 ( 最长1 0 年,可少于1 0 年) 机密*2 0 年 最长2 0 牟,可少于2 0 年) 南开大学学位论文原创性声明 本人郑重声明: 所呈交的学位论文, 是本人在导师指导下, 进行 研究工作所取得的成果。 除文中己 经注明引用的内 容外, 本学位论文 的研究成果不包含任何他人创作的、 已 公开发表或者没有公开发表的 作品的内 容。 对本论文所涉及的研究工作做出 贡献的其他个人和集 体, 均已在文中以明确方式标明。 本学位论文原创性声明的 法律责任 由 本人承担。 1 ) 1, 学 位 论 文 作 者 签 名 , 沪粥 勺斗奋 7 w 7 年 夕 月 z 日 第一章引言 第一章引言 语音中的噪声是语音信号处理的关键话题,早在上世纪6 0 年代,人们已经 开始关注与噪声消除相关的课题。本章将介绍消除噪声对语音信号处理的意义, 以及阵列信号处理的基本技术。 第一节 研究背景 语音是人类传递信息的最主要的手段。语音的传输过程不可避免地被加入 一些干扰,这些干扰可能是由环境、传输介质、房间混响和设备内部电噪声所 引入的。而这些干扰将严重影响语音在计算机中的处理过程,使许多语音处理 系统的性能急剧恶化,如语音识别技术已经开始进入实用阶段,但大多数识别 系统都工作在较干净的语音环境下,在噪声环境下,系统的识别率将大幅度下 降。 1 . 1 . 1语音和噪声 语音信号是一个宽带信号, 它的 频谱分量主要集中在3 0 0 h z - 3 4 0 0 h z 之间, 平均频谱包络每8 倍程下降6 d b , 根据奈奎斯特定律, 使用8 k h z 采样并通过带 通滤波器就可以取出完整地语音信号。当然在通常的语音处理系统中,为了实 现更高质量的语音信号,我们往往使用 1 6 k h z 进行采样,从而将频率的范围的 上限扩展到8 k h z a 语音信号具有短时 特性, 一般认为5 - 5 0 m s 内信号处于较稳定的状态, 一旦 超出这个范围,语音可以看作是一个随时间变化的、非平稳的随机过程,时域 包络和频域包络都是连续变化的。 噪声具有多样性,它的来源众多,主要取决于实际的环境。常见的噪声分 为以下几种: ( 1 )周期性噪声 主要来源于周期性运转的机械、电气。最典型的例子是电源的交流分量, 我国的交流电频率是5 0 h z ,为此在5 0 h z 及其附 近频带上会产生周期性噪声。 ( 2 )脉冲噪声 脉冲噪声在时域上表现为波形上突然地尖峰,主要来源于突然的声波冲击, 第一章引言 如爆炸等声音。一般通过波幅的闽值的方法去除此类噪声,统计出平稳时语音 波幅的平均变化范围,消除超出该范围的噪声。 ( 3 )宽带噪声 宽带噪声是指在几乎所有的频带上都有分量的干扰,主要来源于气流的波 动以及随机噪声源. 这种噪声在时域和频域上完全与语音信号重叠。 另外,说话人所处的声学环境也将影响语音收集效果,如声源发出的语音 传播了 一段距离后经过墙壁、 地面、天花板以 及其他物体的反射,并发生衰减, 这些信号都被麦克风收集到.这种畸变信号被称为混响。混响将对说话人语音 的可懂度阁 、 语音识别系统的 识别率. 和声源定 位1o 造成很大的影响。 1 . 1 . 2传统单声道消噪算法 传统的消噪算法主要有四 种类型:噪声对消法 a 、谐波增强法 i 、 分析合成 法 a z 谱估计法 g 7 、 小波 变 换分 解法u s 7 和听 觉掩蔽 法e 7 ( 1 ) 噪声对消法 它的基本原理是从含噪语音中将噪声的部分减去。这种方法可以应用于平 稳和准平稳噪声的消减。主要缺点是消减后的语音会产生一种残留噪声,具有 一定的节奏性起伏。 ( 2 ) 谐波增强法 利用语音信号的周期性,使用自 适应的梳状滤波提取语音分量,从而达到 抑制噪声的目的。该方法的局限性是在强背景噪声下很难估计出语音信号的基 音周期,而基音周期的估计是谐波增强法的关键。 ( 3 )分析合成法 该方法从语音产生原理出发,将发声过程转化为激励源作用下的线性时变 滤波器。如果能够估计出激励参数和声道滤波器参数,就能忽略噪声,合成干 净语音。这种方法的难点是在含噪语音中精确估计参数。 ( 4 ) 谱估计法 利用语音的短时特性, 从含噪语音中 估计出 短时谱幅度, 然后再恢复原始 语音。 ( 5 )小波变换分解法 这种方法通过阐值降噪声与语音进行分隔,阐值的估计就在噪声的小波参 数与目标信号的小波参数之间定义限制。困难的是,我们并不能找到一种普适 第一章引言 的方法能够确定精确的阑值。 ( 6 )听觉掩蔽法 掩蔽效应是一种常见的心理声学现象,表现为一个本来可以听到的声压级 较低的声音,会因一个同时存在或时间上很接近的声压级较高声音的存在,而 变得听不到。因此只要重构语音中的噪声谱,使其在掩蔽阐值之下或者略高于 掩蔽闽值,就可以保证重构语音有较高的主观听觉质量。 1 . 1 . 3单声道消噪的局限性 上一节提到的消噪算法是利用单声道的语音消噪技术,它对噪声具有一定 的抑制作用,但在混响环境和强干扰环境下,消噪效果不理想.如果利用多个 麦克风接收的数据,可以获得空间区域的信息,从而将语音的时域和频域信息 扩展为时 / 空/ 频三个区域,利用空间滤波器将语音信号方向上的语音进行增强, 同时抑制其它方向上的噪声或干扰,明显改善消噪效果。 第二节 麦克风阵列 阵列信号处理最早应用于雷达和声纳,通过多个传感器接收到的信号判断 目标的位置、运动速度和方向。从上世纪八十年代以来,这项技术逐渐被用于 多麦克风的语音降噪方法中,成为研究热点。 1 . 2 . 1麦克风阵列概述 在三维空间中,按照某种几何拓扑方式组合的一系列麦克风传感器系统称 为麦克风阵列。每个传感器的输出由源语音信号和各种噪声叠加而成。麦克风 阵列接收到的信号,利用阵列信号处理技术,可以消除噪声对源语音的影响, 确定信号源的数量、位置、强度、运动状态等信息。 主要涉及到的理论知识包括:离散时间的语音信号处理、统计信号处理理 论、自 适应信号处理和阵列信号处理理论。 1 . 2 . 2国内外研究现状 麦克 风阵列的研究源于早期的雷达和声纳的研究n u 随 着技术的 不断成熟, 这项技术引入到语音信号的消噪处理中,西方一些国家相继展开麦克风阵列技 术的研究,到目前为止,已经出现了很多基于麦克风阵列的语音降噪算法,主 第一章引言 要的方法包括波束形成算法、后置滤波、 信号子空间 理论以 及空间谱估计等方 法,下面分别加以综述: ( 1 ) 波束形成 波束形成方法主要分成两类:固定波束形成和自 适应波束形成。 固定波束形成方法 ( f i x e d b e a m f o r m i n g ) , 它首先估计麦克风阵列中每个 阵元之间收集到信号的时间差,然后根据不同的延迟对每个阵元所接收到的信 号进行延迟补偿,最后将补偿后的信号叠加并进行规一化。这种算法实现简单, 速度快,缺点是鲁棒性差,一旦信号间的延迟发生的相对变化,则消噪效果明 显下降,另外该算法适合于消除非相千噪声或散射噪声,而对相干噪声没有消 除能力。 这种算法的典型 代表是f l a n a g a n 等人提出 的 延迟求和波束形成算法 12 1 ( d e l a y a n d s u m b e a m f o r m i n g ) e 自 适应波束形成方法 ( a d a p t i v e b e a m f o r m i n g )的原型框架式 f r o s t i i i 在1 9 7 2 年提出 的 线 性约 束 最小 均方 误差自 适应波 束形 成方 法 17 , 这种 方 法给出 了信号处理的迭代过程和误差分析结果。此后,在该算法的基础上,g r i f f t h s 和 j i m提出了一种线性约束波束形成器通用实现一一广义旁瓣抵消器iu ( g e n e r a l i z e d s i d e l o b e c a n c e l l e r ) 。该方法将信号中来自 非指定方向 上的噪 声和干扰信号分离出来,并进行抵消,产生接近于源语音的信号。 这种方法的 问 题是在分离的过程中 有可能 将有用信号分离出 来, 造成信号泄露 16 1 16 1 。 为 此, 很多 研究都针对信号泄露问 题提出了 改 进的 方法, 如 h o s h u y a m a等提出了 基于 自 适应阻塞矩阵的鲁棒性广义旁瓣抵消算法 171 。但这类方法对于非相干噪声或 弱相干噪声,或者当噪声源和干扰的数量多于麦克风阵列的阵元数量时,消噪 效果不明显,而在实际的应用环境中,由于物体的反射和混响问题,噪声源的 数量被认为是无限多的,因此这种环境下的消噪效果不如固定波束形成算法的 消噪效果。 ( 2 )后置滤波 针对弱相干噪声的去除问题,将维纳后置滤波的方法嵌入到自适应波束形 成方法中, 形成了具有后置滤波器的波束形成算法 is u 6 1 ,最有代表性的是具有 后置滤波器的广义旁瓣抵消器, 它取得了 较好的消噪效果咖 。 这种方法的缺点 是不能 解决 声音的 混响问 题2 11 ( 3 )信号子空间 这种方法利用矩阵的奇异值分解和k l 变换的子空间技术,分别对信号子空 第一章引言 间和噪声子空间进行降秩处理团, 进而分离出语音中的噪声和干扰信号。 r e z a y e e 和g a z o r 通过对噪声向 量的 协方差 矩阵 对角化的 方法, 将适用于白 噪声 环境下的 算 法扩展到有色噪声 环 境圈. 钟 维保和李双田 将 上述方 法以 递 推更新 的方式得到对角化矩阵的 特征向 量和特征 值2a 1 ,降 低了 算法的计算量。 除了上述方法之外, 有学者将小波变换以及神经网络技术引入到麦克风阵 列信号处理中国圆,取得了 一定的 进展。 第三节 麦克风阵列的应用 基于麦克风阵列的语音降噪系统已 经获得了 一些应用,主要包括以 下几个 方面: ( 1 )数字助听器 声音是由 物质的振动所引起的,人耳感受到这种振动,也就听到了声音。 人耳所能感知的声音频率范围是 2 0 h z - 2 0 1o i z 。我国目 前约有四千多万听力残疾 人,他们受损耳的时间、频率、空间分辨率都弱于正常耳, 在信噪比上有 l o d b 甚至更大的损失,为此我们需要对外界的语音进行消噪处理。 声音信号的接收是一个被动的 过程, 语音和噪声在时域和频域上都混叠在 一起,很难在不损失语音的前提下抑制噪声.而麦克风阵列提供了对声波的波 达方向上的估计途径,扩展了对受损耳的听觉弥补。 ( 2 )非手持式麦克风 在某些场合下,使用近距离的麦克风或者手持麦克风的条件不允许,如汽 车移动电话和视频会议等应用.在很多国家,驾驶时是禁止使用移动电话的, 这是由于手持电话会分散驾驶员的注意力,从而造成交通事故:另外,在多人 参加的视频会议中, 频繁交换麦克风或切换麦克风开关是令人厌烦的。 非手持式麦克风应用于汽车环境中需要解决的问题是回波信号和多个噪声 源 ( 发动机、风扇、轮胎摩擦以及道路环境噪声) ; 应用于视频会议则需要解决 回波信号和混响问题。 非手持式麦克风的市场前景十分广阔,西方发达国家使用非手持式设备的 比 例不到1 5 9 6 ,根据市场研究报告, 视频和网络会议系统的市场在2 0 0 6 年突破 9 8 亿美元, 这些都显示了非手持式麦克 风的巨 大市场潜力。 第一章引言 第四节 本文的主要内容和组织结构 本文介绍了有关阵列信号处理的理论基础,讨论了延迟估计和空间滤波两 个问题。主要内容和组织结构如下: 第一章引言主要介绍语音和噪声的特征, 传统单声道消噪算法及其局限性, 引出多通道消噪算法和麦克风阵列的应用范围。 第二章主要介绍了阵列信号处理的重要技术理论基础信号模型、信号 收集模型、空间谱理论和时空信号处理模型。 第三章讨论了延迟估计的问题。介绍了传统延迟估计算法,提出了改进的 互功率谱相位法, 通过仿真实验分析和比 较了各种方法的性能。 第四章讨论了自适应空间滤波的问题。介绍了传统时域滤波和自 适应滤波 的内 容,并将其引 入空域得到自 适应广义旁瓣抵消, 结合分/ 合频技术, 达到消 除噪声和干扰的目的。 第五章描述了近场环境和远场环境两个综合实验,得到不同环境下的处理 效果。 第六章对本文进行了全面的总结,并对下一步的研究方向进行了展望。 第二章 理论基 础 第二章理论基础 基于麦克风阵列的语音消噪算法需要对声源信号模型、场景模型、时空信 号模型进行分析,并利用麦克风阵列的拓扑结构的空间几何原理和空间谱估计 理论对语音、噪声和干扰的组成进行判定。本章重点介绍这些基础理论。 第一节 声源信号模型 麦克风不仅收集来自说话人方向上的语音信号,还有很多其他的噪声和干 扰,主要包括墙壁或物体的回波信号、背景噪声等。下面分别分析它们各自 的 信号模型。 2 . 1 . 1语音信号 在空气中,声音传播的速度与环境的温度和压力有关,在常温和一个大气 压下,声速为 3 4 2 耐s o 假设声源为点声源,它与麦克风的距离为 d , 那么声音 到达麦克风的时间为t ,于是有: t = 兰 ,v = 3 4 2 m l s ( 2 . 1 ) 设语音声 源产生的 信号是s ( t ) , 则麦克 风 接收到的 信号为: x ( t ) = a s ( t - t ) + n ( t ) ( 2 . 2 ) 其中a 表示衰减系数, 一般来说衰减系数反比 于距离d ; n ( t ) 表示噪声, 它 可以分成两部分的加和: n ( t ) = n , ( t ) + n , ( t ) ( 2 . 3 ) 其中n , ( t ) 表 示 千 扰噪 声, 如 风 扇, 电 子 噪 声 等, 它与 语 音 信 号 不 相 关; n , ( t ) 表示混响噪声,主要来自 于房间或其他物体的反射, 它与语音信号相关。 于是 ( 2 . 2 )式可以写成: x ( t ) = h ( t ) s ( t ) + n , ( t ) ( 2 . 4 ) 其中h ( t ) 表示冲击响应函数。 第二章 理论基 础 2 . 1 . 2噪声信号 对于单一麦克风所收集到的信号,其中的噪声和干扰主要由环境的背景所 决定, 1 . 1 . 1 节中已 经介绍各种类型噪声的 特性: 对于具有多 个阵 元的麦克风阵 列, 其本身就具有空间特性,因此有必要引 入空间噪声场的概念, 根据场中的 信号特性,我们可以将噪声场分为三种类型:相干噪声场、非相干噪声场和散 射噪声场网。 设 位 于 空间中 的 两 个点 麦 克 风 接 收 到 的 噪 声 信 号( 离 散 后) 分 别 为n , ( k ) 和 戈( k ) . ( 2 . 5 ) 式 定 义 了 噪 声 相 关 函 数 . 凡( n ) = e ( n , ( k ) 戈( k + n ) ) ( 2 . 5 ) 当 z = r r , 时 , 麦 克 风 阵 列 位 于 相 千 噪 声 场 , 此 时 噪 声 只 有 相 位 和 幅 度 上 的 差 异 : 当 嘴= 。 时 , 麦 克 风 阵 列 位 于 非 相 千 噪 声 场 ; 当 r y s n ( t ) 分 别 以 入 射角bb z , .1 0 1 抵 达麦 克 风 阵 列 , 于 是 第i 个阵 元 接 收 到 的 信号 为 : x ,( t ) = 艺 g y s , ( t 一 马 ) 十 n ,( r) ( 2 . 6 ) 其 中 , g o 表 示 第i 个 阵 元 对 第j 个 信 号 的 增 益 : z q 表 示 第j 个 信 号 到 达 第 i 个阵元相对于参考阵元的延迟; 在信号源是窄带的假设下, n , ( t ) 表示第i 个阵 元接收到的噪声信号. 信号可以用 ( 2 . 7 )式的形式表示。 s , ( t ) = u , ( t ) e x n + . u ; ) s , ( t - z ) = u , 0 一 f 神 j( 叫 曰 卜 刃 一 ) ( 2 . 7 ) 第二章 理论基础 其中 , u , ( t ) 表 示 接收 信 号的 幅 度, 0 ( t ) 表 示 接收 信 号 的 相 位, 口 表 示 接收 信 号的频率。因为是窄带信号,因此有 ( 2 . 8 ) 综合 ( 2 . 7 )式和 其中g , ( t ) 表示 第 ( 2 . 1 0 )式表示。 q ( t 一 r ) - q ( t ) ( 2 . 8 )式,显然有下式成立: s , ( t 一 r ) - 8 , ( t ) s ,( t ) e - i0 i个麦克风对延迟差为r 的信号之间的增益差, ( 2 . 9 ) 可以由 g , ( t ) = 从 ( t 一 r ) u , ( t ) ( 2 . 1 0 ) 综合 ( 2 . 6 ) 式和 ( 2 . 9 ) 式,得到第i 个麦克风接收到的信号为 x , (t ) = 艺g y 8 ,( t ) s , ( t )e - + n ,( t ) ( 2 . 1 1 ) 2 . 2 . 2宽带信号数学模型 对于宽带信号, 假设信号的带宽为b , 将观察时间t 分为j 个子段, 针对每 段的信号进行k 个点的离散傅立叶变换,可以得到宽带模型。 x , 认) = a ( 人 ) s i ( f k ) + n , 认)( 2 . 1 2 ) 其 中 , x , 优卜s , 伍) 和 n , ( f ) 分 别 表 示 对 应 频 率k 的 接 收 信 号 、 源 信 号 及 噪 声的 离 散 傅 立叶 变 换( k = 1 , 2 , ., k , j = 1 , 2 , ., j ) : a ( f k ) 表 示 为( 2 . 1 3 ) 式 . a ( f ) = e l rl r r, , a 2 f = , ., e / 2 r 1 ( 2 . 1 3 )k j 表示将带宽b 的信号划分为j 个子带, 在每个子带上可以使用窄带信号数 学模型进行处理。 2 . 2 . 3声波特性 根据声学原理,点声源的振动可以简化为球面波,它具有各向同性。设声 源, ( t ) 到麦克风的 距离为r ,麦克风接收到的声 压为p ,于是有: pv1k p a q 4 zr ge / (m r - b )( 2 . 1 4 ) 其 中 , 吼= 4 ;r ,. - . 表 示 球 面 所围 成 体 积 的 增 幅 , 媒 介 密 度 ; c u 表 示 声 波 速 度: u a 表 示 球 面 振 动 幅 值 ; k r a 表示声 源 振动的 初 相 位角. 也 成为 声 源 强 度:v o 表 示 k 表示单位波长的圆频率: 第二章 理论基础 由此可见麦克风接收到的声压与距离成反比,无论使用何种麦克风, 到的 信号 都与声压 成正比 , 于 是设 接收 到的 信 号为s ( t ) , 则 有: s (t ) = 生 p s (t 一 : )( 2 接收 . 1 5 ) 其中p 表示比 例系数,对式 ( 2 . 1 5 )求微分得到式 ( 2 . 1 6 ) : d s(t) = 一 去 p s。 一 )* ( 2 . 1 6 ) 再将式 ( 2 . 1 5 )代入式 ( 2 . 1 6 ) ,并整理后得到式 ( 2 . 1 7 ) d s 一 ( t ) = _ d r s ( t ) r ( 2 . 1 7 ) 当r 足够大时可以 得到d r / r c l , 进而得到d s ( t ) / s ( t ) 二 0 , 也就是说当 声 源与麦克风的距离比较大的时候,麦克风位置的小幅变化对于信号的接收没有 影响,此时的球面波可以 简化为平面波。 2 . 2 . 4近场模型 当声源与麦克风的距离较近时,对信号的处理必须使用球面波模型。式 ( 2 . 1 5 ) 表 明 信 号 幅 度 的 衰 减 于 距 离 成 反 比 . 假 设 系 统 有k 个 声 源凡 , 凡 , :. , 又, m 个 麦 克 风p p 2 , . . , p m , 令 麦 克 风p , 为 参 考 麦 克 风, 它 在 空 间 中 的 位 置 坐 标 为( 0 , 。 , 0 ) , 在极 坐 标系 中 , 设 声 音 信 号 源 的 坐 标 为( r b9 ) , 其中 r , 表 示 空 间 直 线 距 离 , b , 表 示 信 号 源 的 方 位 角 , 凭 表 示 信 号 源 的 仰 角 . 在同 一 坐标系 中, 定 义非 参 考 麦克 风 的 位置 坐 标为pi= ( 叮 双o g ) , 其中 i = 2 , 3 , . . ., m, 于是麦克 风p , 接收 到的 信号为 : x , = 艺a ( r, b j , q , ) s , ( t ) + n , ( t ) , . 1 ( 2 . 1 8 ) 其 中 , s a o 是 声 源 发 出 的 信 号 , n , ( t ) 为 噪 声 , a ( r, , 弓 , w , ) 表 示 幅 度 衰 减 和 相 位延迟参数,由式 ( 2 . 1 9 )确定。 a ( r , , e , , p j ) = a ,e j z x a , a2 e / z r f r, , ., a m e - 1 z s f . r ( 2 . 1 9 ) 其中a 表示幅度衰减参数,它与距离成反比,z 表示信号延迟。 第二章 理论基础 2 . 2 . 5远场模型 当声源与麦克风的距离较远时,麦克风阵列中阵元之间接收到信号的幅度 衰减的差异很小,于是我们可以忽略信号中振幅的因素。 经过进一步简化,可以认为来自 较远处的信号互相平行地投射到麦克风阵 列的阵元上,如图2 . 1 所示。 图2 . 1 近场模型至远场模型的转化 图中的延迟 d随着距离的增大而减小, 信号收集的近场模型可以转化为远 场模型。 第三节 几何拓扑与空间谱估计 麦克风阵列的理论来自 于阵列信号处理。阵列信号处理是信号处理领域内 的一个重要分支。 应用于雷达、通信、声呐等领域。 阵列信号处理最主要的两 个研究方向是自 适应阵列处理和空间谱估计,本节将介绍空间谱估计在麦克风 阵列中的基本理论,第四章将详细阐述自 适应阵列处理的内 容。 2 . 3 . 1空间谱估计 空间谱估计是一种空 域参数估计技术, 通过空间阵列接收信号数据的相位 差来确定一个或几个待估计的 参数, 这里的参数可以 是信号抵达的方位角、 俯 仰角以及信号源数目 等。了解这些参数后,我们可以 较容易地分离感兴趣的信 号和干扰该信号的噪声,从而达到消噪的目的。 整个估计系统可以分成三个部分信号传播、 信号收集和参数估计。 它们时 间是相互衔接的. 第二章 理论基础 ( 1 ) 信号传播 信号源及其所处的复杂环境形成一个信号空间,按照波的传播理论信号将 充满整个空间,系统的目 的就是从这个信号空间中估计出信号源的未知参数。 ( 2 ) 信号收集 位于信号空间中,按照一定排列方式的若干阵元接收到信号,信号中包含 有噪声和干扰。 ( 3 )参数估计 相当于对信号空间的一个重构过程,从复杂的观察数据中得到信号的特征 参数. 阵列信号输出的绝对值与来波方向 之间的关系成为阵列的方向图。方向图 体现了阵列对信号在各个方向上的增益,对于分析信号的波达方向,信号数量 具有重要意义。 下面考察方向图的生成。首先容易得到空间中任意两阵元的几何关系, 任 意点 ( r , 0 , .p ) ( 极坐 标表 示) ,( x , y , z )( 笛 卡 尔 坐 标 表 示) 与 原 点( 0 1 0 1 0 ) 所 接 收到信号的时间延迟为 : 一 1- (s c o s 0 c o s 4p + y s in 0 c o s v + z s in v ) ( 2 . 2 0 ) 其中c 表示波的传播速度. 由 前面的信号 模型可知, 对于某一个确定的m元 阵列,第i 个阵元接收到的信号的幅度为: x , = g o e 一 i 0 i ( 2 . 2 1 ) 其中 , 9 0 表 示复 振幅 ,t , 表 示 第i 个 阵 元与 参 考阵 元的 时 间 延 迟。 对于 来 自 不同角度的信号,阵元间信号的延迟不同。输出的功率定义为: y ( 0 , 9 7) = 艺w i8 oe - !-1 ( 2 . 2 2 ) 其中w , 表示阵 元的 权值, 式 ( 2 . 2 2 ) 就是阵 列 响 应方向 图的 计 算公 式。 下 面分别考察几种典型阵列的方向图。 2 . 3 . 2一维均匀直线阵 一维均匀直线阵由m个阵元等距离地排列成一条直线,假设阵元间的距离 为d ,并且以最左边的阵元为参考点 ( 坐标原点) ,信号的入射方向为0 ,于是 第二章 理论基础 阵元间的时间延迟 ( 式 ( 2 . 2 0 ” 可以简化为: = 1 (x , sin b ) = 1 (i 一 1)d sin o ( 2 . 2 3 ) 于是式 ( 2 . 2 2 )可以简化为: y ( b ) = 艺w s d e - j 2 x “ 一 ,)d s n o /a ( 2 . 2 4 ) 其中a 表示信号的波长。 图2 . 2 和图2 . 3 都表示了 均匀直线阵的方向图, 权 值m , = 1 , 增益g o = 1 . 从两幅图中,我们可以看到在方位角为 0度时,也就是垂直于均匀直线阵 方向的信号 被明显增强, 在其他方向 上,阵列对信号则增益不明显。 考察阵元数量对方向 相应的影响,图2 . 2 显示了阵元数量为8 个和3 2 个的 阵列方向图,实线代表8 个阵元的响应曲 线,虚线代表3 2 个阵元的响应曲线, 阵元的间距d 取波长的一半。 从图中可以看出, 阵元数量的增加,可以 增强对正交方向( 0 度的方向) 的 增益,同时减小其他方向 上的增益,简单来说就是使阵列更加 “ 对准”正交方 向。 均匀直线阵方向圈 100即 即扣e0so们 (沼沮尔随 i i / 0加闷 目o d o o 1 0 0 方位角 度) 图2 . 2 均匀直线阵阵元数量与方向响 应 考察阵元间距对方向 相应的影响,图 2 . 3显示了阵元间距为波长的四分之 一和二分之一的阵列方向图,实线代表二分之一波长间距阵元的响应曲线,虚 第二章 理论基础 线代表四 分之一波长间 距阵元的响应曲 线,阵 元数量取1 6 . 从图中可以看出,阵元间距的增加,可以 增强对正交方向 ( 0 度的方向)的 增益,同时减小其他方向上的增益,也可以 使阵列更加 “ 对准” 正交方向.但 间距超过波长的一半时,正交方向上的增益减小,与正交方向呈4 5 度的方向上 的增益被显著增强,这一点可以由空间意义上的奈奎斯特定义来解释。下面进 行理论方面的分析。 假定信号源位于阵列的远场, 信号到达阵列时为平面波,在二维平面中, 定义波的入射方向与阵列法向量的夹角为0 , 阵元间距为d 。由于阵元间的距离 都相同,由式 ( 2 . 2 4 )可得相邻阵元的相位延迟为: , ,_ 2 ) r d s i n 0 尹k d 1 =少t=- a ( 2 . 2 5 ) 假设d 很大, 那么相邻阵元的相位延迟将超过2 u,此时阵列响应将无法区 分实际的相位延迟。因此阵元间距应该满足: _ 二匕: “二匕 2 s i n 0 2 s i n0 ( 2 . 2 6 ) 于是, 大于二分之一波长的阵列间距将不能重构对应波长的信号。一般来 说,在阵元数量固定的情况下,希望阵元之间有尽可能达的间距,通常为设定 二分之一波长。 对于语音信号,考虑语音的频率范围和速度,得到声波的波长范围是 0 . 1 至 3 . 4米,为了使信号的高频部分不失真,由 式 ( 2 . 2 6 ) 确定的最大阵元间距 为 5 厘米。 第二章 理论基础 均匀直线阵方向圈 100即 a0知的匆翻 娜)公余冲 翻知 1 0f 月 六忽 % p , - , / - , 月目曰勺 口 讯羚阳监介 方位角 ( 度) 图2 . 3 均匀直线阵阵元间距与方向 响应 均匀直线阵具有结构简单,容易分析的优点,但它的最大不足就是,在阵 元的排列方向 ( 与法线呈9 0度或接近 9 0度)上,阵元间的有效距离很小。另 外在三维空间里,可以发现在一个以阵列为轴的锥面上的声源,在抵达阵列时, 信号具有相同的延迟,这反映了均匀直线阵不能处理三维空间的谱估计。 2 . 3 . 3二维平面阵 二维平面阵是指在同一平面上分布的矩形阵, 假设平面阵包含有mx n个阵 元, 设阵列左上角的阵元为参考点, 水平方向 上有n个间距为d 的均匀直线阵, 竖 直方向 上有m个间 距为d的 均 匀直 线阵. 信号 的 方 位角为9 , 俯仰角为4p . 于是,任意阵元接收到信号相对于参考点的延迟为: z = 1 ( x c o s 0 c o s q ? + y s in 0 c o s v ) ( 2 . 2 7 ) 其中,c 表示传播速度,( x , y ) 表示阵元的坐 标。于是阵列输出 方向 为: y ( b , .p ) = 艺 艺 w , ,g oe 一 / ( 一 ,)2 . d - b “ 一 a e /。 一 ,)2 x d d n o - p /a ( 2 . 2 8 ) - 1 y 1 其 中 a 表 示 信 号 的 波 长 图2 . 4 表 示 了 二 维 平 面 阵 的 方 向 图 , 权 值叽= 1 , 增益g , = 1 . 使用1 6 x 1 6 的平面阵列, 间距采用二分之一波长。 从图中可以 看到, 在阵列 第二 章 理论基 础 第四节 时空信号处理模型 我们在前面分析了 信号 模型和阵列模型, 本节我 们将描述信号的 处理方法。 当阵列接收到 信号后, 得到多 通道的 信号数 据, 应用于麦克风阵列的信号 多是宽带信号。在 2 . 2 . 2节中 我描述了宽带 信号的理 论处理方法, 在本节我将 从计算机的实现角度 说明 宽带 信号 的处理方 法。 2 . 4 . 1频域处理 将阵 列接收到的 带宽为b 的信号在频域上分 成若干 个频段,使这些频段满 足窄带信号的条件。 把整个 样本的 时间长度t 分为k 个长 度为 t 的时间间隔, 要求间隔要远远大于信号在阵列中阵元间的最大延迟。 对于连续信号,在每个时间间隔内对接收到的信号进行积分,得到各频段 内的信号向量。 x (w , + kum) = 击r x(t)e-( k)idt ( 2 . 3 1 ) 其中 , w o 表 示 最 低 频 段 的 中 心 频 率 ,山 表 示 频 段 宽 度 , k 表 示 频 段 序 号 。 对于离散信号,在每个时间间隔内对接收到的信号进行累加,得到各频段 内的信号向量。 “ (、 + kw ) = 奋寡 x(n)e 1(,%.k.)$ ( 2 . 3 2 ) 频段的宽度rn = 2 x l a t ,选 择较大的时间间隔 可以 保证各频段的信号为窄 带信号。信号的协方差矩阵为: s ( m o + 人 。 , %+ 气 劝= e 凡: ( %+ 气 m ) x , ( w o + 气 。 ) ) ( 2 . 3 3 ) 如果信号是实高斯随机过程,那么在不同频段和不同时间 n的 x , ( w , + k m , n ) 为 联 合 循 环 复 高 斯 向 量 , 于 是 有 实 部 的 协 方 差 矩 阵 等 于 虚 部的 协 方差矩阵,且实部与 虚部之间的 协方差为零。 当b a t 2 1 6 时, 根据维纳一 辛 钦定理: 恩( s (m o + k m , w o + k w ) 卜s ( rv o + k w ) ( 2 . 3 4) 容易得到不同的频段k与时间n 的信号之间是相互独立的,于是: 第二章 理论基础 几 ( w o + k w , n ) = e (x ( %+ k w ) x ; ( % + k w ) 卜s ( w o + k w ) ( 2 . 3 5 ) 2 . 4 . 2 时域处理 经过分频处理后,针对每个频段内的信号处理使用窄带信号的结论 ( 式 2 . 9 ) 。设阵 列参考点处接收到的 信号为实 信号, 于是有: x (t ) = 万r e (s (t ) e ) 则由窄带信号特性得到第 i 个阵元的信号为: ( 2 . 3 6 ) x ,( r) _ 万r e ( x (t ) e - e i ( 2 . 3 7 ) 第五节 小结 本章描述了声源信号模型和阵列信号收集模型,分析了几种典型阵列的输 出方向图,最后介绍了一种针对宽带信号处理的计算机处理技术。 声源信号模型包含语音信号和噪声信号的特性,这是信号产生的起始点。 信号 在介质中传播到达传感器阵列, 并被收集 成数据( 采样) 。 在这个收集过程, 我们需要考 虑信号的频域和空 域特征。 在频域上, 窄带信号可以 忽略微小距离 所造成的信号幅度衰减,从而简化了信号处理过程;宽带信号通过频带的划分 转化为多个窄带信号分别进行处理。在空域上,声源与阵元的相对位置决定了 阵列中各阵 元所接收到信号的时间 ( 相位) 延迟差异, 如果声源距离阵元较远 ( 远场模型) ,那么我们可以忽 略这个距离, 只考虑信号的 入射方向 和阵元之间 的相 对位置:如果声源距离阵 元较近 ( 近场模型) , 那么时间 ( 相 位) 延迟差异 不仅和阵 元之间的 相对位置有关,还与 声源与阵元的相 对位置有关。 为 此, 不管是近场还是远场, 我们都需 要考虑阵元的 相对位置, 第三节介 绍了目 前 常见几种真累 拓扑结构的组成, 推导了 阵元之间的时间 延迟, 得出了 信 号不同 入 射方向 与阵列输出 增益的 关 系, 绘制了 阵列响 应方向 图, 分 析了 每 种阵列 拓扑 的特点 及 优缺点。 总的 来说, 一维 均匀 直线阵 应用范围 最广, 处 理最简 便; 二 维均匀圆阵 具有最好的性能价 格比 : 三维均匀球 面阵具有 最精确的 信号估计能 力。 最后, 介绍了宽带语 音信号的 处理模型, 得到了信号的 协方差矩阵的 表达式。 第三章信号延迟估计 第三章信号延迟估计 第一节 延迟估计的 基本 理论 在各种基于麦克风阵列的语音处理系统中,时间延迟的估计都是一个基本 问题。如果能够精确得到延迟的估计,不仅对声源信号的定位起到关键作用, 而且对语音信号与噪声的分离具有重要意义,下面我们先引入时间延迟估计的 概念。 3 . 1 . 1基本问题 时间延迟估计的基本问题就是准确迅速地估计阵列中各阵元接收到的信号 之间的时间差。由 于阵列所处的 环境可能存在各种噪声和干扰,接收到的信号 往往湮没在噪声和千扰之中, 更糟糕的是,很多时候声源是移动的,这都给延 迟估计带来很大的困 难。 在语音降噪的应用中,信号延迟估计是一个重要环节,因为各个麦克风接 收到的信号首先必须要进行时间延迟补偿,使各通道语音信号保持同步,也就 是使麦克风阵列的注视方向与说话者的方向相一致,这是进行后续处理的前提。 一般来说,对于含噪语音的延迟估计,主要思路是提高接收信号的信噪比; 对于移动的声源,主要思路是使用自适应的延迟估计方法,它能够根据声源位 置的变化自 动调整估计参数。 3 . 1 . 2基本模型 为了便于处理,常常将信号源假定为点源,如果阵列是一维,则将声源与 阵列放在同 一平面内进行分析,将三维空间划分为二维空间,此时球面波转化 为柱面波:如果声源与阵列的距离较远,此时柱面波又可以转化为平面波
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护士技能试题及答案
- 2024专业技术人员继续教育公需课试题库及答案
- 2025年安全急救知识考试题库(附答案)
- 2025年基本公共卫生妇幼项目培训试题及答案
- 合肥工业大学计算机与信息学院毕业设计改革与实践
- 综拓专员个人介绍
- 计算机网络技术及应用(第2版)课件全套 第1-9章 初识计算机网络 -网络安全
- 护理教学方法程序
- (完整版)妇产科护理学试卷试题及答案通关秘籍题库
- 湖南食品药品考试题及答案
- GB/T 10000-1988中国成年人人体尺寸
- GA/T 452.1-2021居民身份证打印技术规范第1部分:打印质量要求
- 纪委书记政治画像
- 雅思词汇一本全(打印珍藏版)
- 2023统编版高中历史必修中外历史纲要上重点知识点归纳总结(复习必背)
- 高速磁浮大跨度桥梁设计关键技术介绍
- 子宫颈癌课件最新版
- 【教学课件】沪科版数学9上:22.1 第3课时比例的性质和黄金分割参考教学课件
- 生态系统服务功能与生态保护
- 氨水安全周知卡(危化品)
- 科室医护人员德能勤绩考核表
评论
0/150
提交评论