(电路与系统专业论文)卷积语音信号频域盲分离关键技术的研究[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)卷积语音信号频域盲分离关键技术的研究[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)卷积语音信号频域盲分离关键技术的研究[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)卷积语音信号频域盲分离关键技术的研究[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)卷积语音信号频域盲分离关键技术的研究[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(电路与系统专业论文)卷积语音信号频域盲分离关键技术的研究[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除 了特别加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的 研究成果。其他同志对本研究的启发和所做的贡献均已在论文中作了明确的声明 并表示了谢意。 作者签名:塾邀日期:型蔓堡7 论文使用授权声明 本人完全了解复旦大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内 容,町以采用影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此 规定。 作者签名:鳖童掏导师签名同期:竺堡) 摘要 摘要 语音信号的盲分离在近年来成为信号处理的一个热点问题,因为其在语音识 别,高质量的手机通信以及远程会议系统中都有着广泛的应用前景。基于瞬时混 合的语音信号盲分离已经相对成熟,而在实际环境中,由于房间的回响和反射, 使得语音信号不再是简单的瞬时混合,而成为卷积的混合,再加上语音信号本身 的特性,使得卷积语音信号的盲分离变得异常困难。基于卷积混合信号的盲分离 目前还处于实验室阶段,还有很多待解决的问题。卷积语音信号的频域盲分离方 法可以将时域中卷积信号转换为频域中的瞬时混合信号,简化了盲分离的模型。 但是,在频域盲分离算法中,由于解混是在各个频点上单独进行的,各个频点上 解出的源信号存在的次序不一致问题,是亟待解决的问题,同时,频域盲分离算 法大多为批处理算法,很少有在线算法,并且在线算法的收敛速度也较慢,这些 都是频域盲分离算法中需要改进的地方。 针对以上问题,本文在以下几个方面进行了工作与创新性的探索。 ( 1 ) 语音信号在时域中的特点已经得到了广泛的研究,而针对频域中的特点 的研究并不多,因此本文针对卷积混合信号在频域中进行盲分离时所需的条件, 通过实验研究了语音信号在频域中所具有的特性,并且将这些特性应用于频域的 盲分离算法中。 ( 2 ) 在频域的盲分离算法中,各个频点次序不一致问题( p e r m u t a t i o n ) 仍然 是一个未得到很好解决的问题,本文利用语音信号在时频点上的稀疏特性,将时 频分析引入频域的盲分离算法,作为独立元分析的分离信号的参考信号,来解决 各频率点上次序不一致问题,新算法在分离的效果上优于传统的相关算法和 d o a 算法,同时,比起单独用时频二元掩模的方法减少了失真。 ( 3 ) 由于传统的解决次序不一致问题大多为批处理算法,因而导致频域盲分 离的算法不能在线进行,本文利用语音信号的传播特性,利用源信号到接收器的 波达方向( d i r e c t i o no f a r r i v a l 。d o a ) 作为约束条件,来实现频域的在线算法, 新算法可以实现在线分离,并且不像原批处理的d o a 算法需要知道接收器的位 置信息。 ( 4 ) 频域的盲分离算法还存在一个重要问题就是算法的收敛速度,传统的频 域盲分离算法虽然能够达到收敛,但是收敛速度并不令人满意,本文提出了基于 四阶统计量的定点盲分离算法,大大提高了收敛速度,并且收敛效果良好。 关键字:语音信号、盲信号分离、独立元分析、神经网络、四阶统计量 摘要 图书分类号:t n 9 1 1 7 摘要 a b s t r a c t b l i n ds o u r c 宅s e p a r a t i o nf o rs p e e c hs i g n a l sh a sb e c o m eah o tt o p i ci nt h ep a s t d e c a d ea si th a sav e r yp r o m i s i n ga p p l i c a t i o ni ns p e e c hr e c o g n i t i o n ,h i g hq u a l i t y w i r e l e s sc o r m n u n i c a t i o n , r e m o t ec o n f e r e n c ea n de t c b l i n ds o u r c es e p a r a t i o nf o r i n s t a n t a n e o u sm i x e ds i g n a l si sr e l a t i v e l ym a t u r e b u ti nr e a le n v i r o n m e n t ,d u et ot h e r e v e r b e r a t i o na n dr e f l e c t i o ni nt h er o o m ,t h es p e e c hs i g n a l sa r em i x e dc o n v o l u t i v e l y , w h i c hh a sm a d et h eb l i n ds e p a r a t i o nm o l ed i f f i c u l t t h er e s e a r c ho fc o n v o l u t i v eb l i n d s o u r c es e p a r a t i o ni ss t i l li nt h el a bs t a g ea n dm a n yp r o b l e m sn e e dt ob es o l v e d t h e b l i n ds o u r c es e p a r a t i o nm e t h o di nf r e q u e n c yd o m a i ni st ot r a u s f o n nt h ec o n v o l u t i v e m i x t u r e si nt h et i m ed o m a i ni n t ot h ei n s t a n t a n e o u sm i x t u r e si nf r e q u e n c yd o m a i n h o w e v e r , i nf r e q u e n c yd o m a i nm e t h o d , t h ep e r m u t a t i o na m b i g u i t yb e c o m e sas e r i o u s p r o b l e mw h i c hn e e d sp o s t - p r o c e s s i n g w h a ti sm o l e ,m o s to ft h ef r e q u e n c yd o m a i n m e t h o d sa r eb a t c hp r o c e s s i n gw h i l et h eo n - l i n em e t h o di sm o r ep r a c t i c a l t h e c o n v e r g e n c es p e e do ft h ee x i s t i n gm e t h o d si s n o ts a t i s f a c t o r ya ta l l , w h i c hn e e d s i m p r o v e m e n t f o c u s i n g o nt h ea b o v e - m e n t i o n e dp r o b l e m s ,t h et h e s i ss t a r t sac r e a t i v e e x p l o r a t i o n , w o r k i n gf r o mt h e s ef o l l o w i n ga s p e c t s : ( 1 ) t h ec h a r a c t e r i s t i co fs p e e c hs i g n a l si nt h et i m ed o m a i nh a sb e e ns t u d i e d w i d e l yw h i l et h a ti nt h ef r e q u e n c yd o m a i nh a s n t w es t u d i e dt h ec h a r a c t e r i s t i ci nt h e f r e q u e n c yd o m a i na n da p p l i e dt h e s ec h a r a c t e r i s t i c si n t ot h ei m p r o v e m e n to ft h e f r e q u e n c yd o m a i nb l i n ds o u r c es e p a r a t i o nm e t h o d s ( 2 ) hb l i n ds o u r c es e p a r a t i o nm e t h o do ff r e q u e n c yd o m a i n , t h ep e r m u t a t i o n a m b i g u i t y i sn o ts o l v e dw e l l a st h es p e e c hs i g n a l ss e l d o mo v e r l a pi nt h e t i m e - f r e q u e n c yp o i n t ,w ep r o p o s e dan o v e ls c h e m et os o l v et h ep e r m u t a t i o np r o b l e m w i t hf r e q u e n c yd o m a i ni c ab a s e do nt h ei d e af r o mt i m e - f r e q u e n c ym a s k t h e p r o p o s e da l g o r i t h m 啪a v o i dt h ed i s t o r t i o no ft i m e - f r e q u e n c yb i n a r ym a s k a n da tt h e s a m et i m e , i tc a l l e f f e c t i v e l ys e p a r a t et h e c o n v o l u t i v es i g n a l s ,w h i c hh a sb e t t e r p e r f o r m a n c ec o m p a r e d w i t he x i s t i n gm e t h o d s ( 3 ) t h ee x i s t i n gm e t h o d sa r em o s t l yb a t c hp r o c e s s i n gw h i l et h eo n - l i n em e t h o d s a r em o r ep r a c t i c a li nr e a le n v i r o n m e n t w ep r o p o s ean o v e ls c h e m eu s i n gd o aa sa r e s t r i c t i o ns ot h a tt h ep e r m u t a t i o np r o b l e mc a nb es o l v e do nl i n ea n di td o e sn o tn e e d t h el o c a t i o ni n f o r m a t i o no fr e c e i v e r sl i k et r a d i t i o n a ld o a m e t h o d c o m p a r e dw i t ht h e e x i s t i n ga l g o r i t h m s ,t h ep r o p o s e da l g o r i t h mh a sb e t t e rp e r f o r m a n c e 5 摘要 ( 4 ) t h ec o n v e r g e n c es p e e do ft h ee x i s t i n gf r e q u e n c yd o m a i nm e t h o di sn o t s a t i s f a c t o r y w ep r o p o s e dan e wm e t h o du s i n gf i x e d - p o i n tm e t h o db a s e do nt h ef o u r t h o r d e rs t a t i s t i c s ,w h i c hm a k e st h ec o n v e r g e n c es p e e dm u c hf a s t e ra n dt h ep e r f o r m a n c e i s g o o d 脚o r d s :s p e e c hs i g n , s , b l i n ds o u r c es e p a r a t i o n ( s s s ) ,i n d e p e n d e n tc o m p o n e n t a n a l y s i s ( i c a ) ,n e u r a ln e t w o r k s ,f o u r t ho r d e rs t a t i s t i c s 6 第一章绪论 1 1 研究背景及其意义 第一章绪论 1 1 1 盲信号分离的研究背景和研究意义 近年来,随着计算机技术的发展,数字信号处理在通信、雷达、声纳探测等 领域得到了广泛的应用。人们通过传感器检测获取含有信息的数据,并处理这些 数据来获取信息。然而,传感器检测到的往往是信号和噪声混合在一起的信号或 者包含很多无用信号,而且又由于信号传输的通道特性复杂并且未知,使得人们 要得到真实原始的源信号变得非常困难。在这种情况下,如何仅由接收信号去恢 复原始信号,就显得尤为重要,盲信号处理作为数字信号处理的一种新的研究方 法就应运而生了。 盲信号分离( b l i n ds o u r c es e p a r a t i o n ) 是指从混合信号中分离或提取出源信 号的过程。它与传统的信号处理方法,如f i r 滤波,f i r 滤波,小波分析等完全 不同,它是在源信号和传输信道未知的情况下,仅从观测到的混合信号中提取或 恢复出源信号的一种信号处理方法,而所谓的“盲”也就是指没有任何关于源信 号及混合系统的先验知识。 盲信号分离自2 0 世纪年代发展起来后,已成为信号处理领域的一个应用 热点问题。盲信号处理牵涉到信息理论、统计信号处理、神经网络和优化理论等 领域。近年来,对于盲处理的研究受到了国内外广泛的重视,研究也越来越深入, 理论和应用都得到了很大的发展。 现有的盲源分离主要是对观测到的线性瞬时混叠的信号进行分离,在这方面 已经有比较成熟的方法但是,考虑到在实际环境中,由于反射、延迟,造成观测 信号是源信号和通道的卷积,使得盲信号分离变得比较困难。卷积信号的盲分离 在语音,通信等领域都有非常重要的理论价值和实际意义。而语音信号本身的时 间相关性,不平稳性也使得针对语音信号的盲分离要比通信信号更为困难。目前, 针对卷积语音信号的盲分离还没有很好的方法,因此,对卷积语音信号盲分离的 研究是前沿的,有实际意义的。 针对卷积语音信号的盲分离,主要有两大类方法,一类是时域的方法,通过 时域中求解分离滤波器来达到盲分离的目的。一类是频域的方法,通过将在时域 中卷积混合的信号变换到频域中瞬时混合的信号,然后在每个频点上利用相对比 第一章绪论 较成熟的瞬时混合盲分离方法来求解。 时域的方法需要对分离滤波器的阶数进行限定,而且计算量比较大;而频域 的方法则可以利用现有的相对成熟的瞬时混合盲分离方法来进行分离,算法较为 简单,计算量相对较小。但是,在频域盲分离算法中,会带来每个频点的分离信 号排列次序不一致的问题,这一问题还没有得到很好的解决。并且,针对频域盲 分离的方法,还很少有可以在线的方法,这些都值得我们进行研究。因此,本文 选取了卷积语音信号频域盲分离作为研究方向。 1 1 2 盲信号分离的分类 盲信号分离,按照处理的信号的不同,有语音信号的盲分离,通信信号的 盲分离,脑电信号的盲分离等。 按照源信号到接收信号的传输通道的混合方式不同,可以分为线性瞬时混 合,线性卷积混合,和非线性混合三类。 按照传输信道中是否有噪声,可以分为无噪声,有加性噪声,有乘性噪声等。 按照盲分离处理的领域不同,可以分为时域的盲信号处理和频域的盲信号处 理。 本文主要研究的是线性卷积混合语音信号在频域中的盲分离算法。 1 2 语音信号盲分离的发展和国内外研究现状 从语音分离角度来看盲分离算法的研究大致可以分为两个阶段,第一阶段是 盲分离理论形成和发展的阶段,在这一阶段内主要研究了平稳信号的盲分离问 题,到了九十年代中后期人们开始对语音信号这类非平稳信号感兴趣,这是研究 的第二阶段。 盲分离问题的研究开始于八十年代中后期。1 9 8 6 年,法国学者j e a n n yh e r a u l t 和c h r i s t i a nj u t t e n 在人工神经网络计算( n e u r a ln e t w o r k sf o rc o m p u t i n g ) 会议上, 发表了一篇题为( s p a c eo rt i m ea d a p t i v es i g n a lp r o c e s s i n gb yn e u r a ln e t w o r k m o d e l s ) 的论文,提出了一种基于h e b b 学习规则的并行人工神经网络模型,这 种网络模型能对独立信号混合而成的信号进行盲分离,后来将这一算法简称为 “h - j ”算法,这也标志着盲信号分离的开端。 1 9 9 1 年c h r i s t i n ah u t t e n 1 ,j e a n n yh e r a u l t 2 】,p e t t i e rc o m m o n 3 = 人在 s i g n a lp r o c e s s i n g 上发表了关于盲信号分离的三篇经典文章,标志着盲分离研究 的重大进展。之后,lt o n g 和r u e y - w e nl i u 等给出了完善的盲分离数学框架, 将盲分离转化为特征值求解问题,也就是联合对角化问题【4 】。目前,联合对角 第一章绪论 化方法大多从统计信号的高阶累积量出发,解决线性混合情况下的b s s 问题, 这类仅根据源信号独立性这一条件,将盲源分离转化为特殊矩阵对角化问题的方 法,可以快速有效的达到分离目的。 1 9 9 2 年,g b u r c l 5 提出了用b p 神经网络实现线性和非线性混合信号盲分 离方法。1 9 9 4 年,p c o l o n 将主分量分析( p r i n c i p l ec o m p o n e n ta n a l y s i s ) 加 以扩展而成为i c a 6 ,阐述了独立分量分析这一概念,指出i c a 是p c a 的扩展 和推广,i c a 在后来成为盲信号分离中的一类重要方法。 此后,b e l l 和s c j n o w s k i ( 1 9 9 5 ) 提, q - i 基于墒的最大化思想【7 1 ,利用单层前馈网 络有效分离了多个超高斯分布源信号的线性混合问题,此后人们又把这类算法称 为信息最大化( i n f o r m a x ) 算法。 1 9 9 6 年,c a r d o s o 等人提出了i c a 算法中的“相对梯度”、“等变化性”和有 关稳定性及分离精度等重要思想和方法【8 】。同年,p e a r l m u t t e r 在i c a 中引入以 最大似然准则的目标函数【9 】,c a r d o s o 于1 9 9 7 年证明了最大信息方法和最大似 然估计方法是等价的【1 0 】。 2 0 0 0 年,t w l e e 1 1 等人在保留b e l l 的基本算法体系的基础上,结合a m a r i 等提出的“自然梯度”1 2 和最大似然估计法,将i n f o r m a x 算法加以推广,从而 可以有效地实现对具有超高斯和亚高斯分布的混合信号的分离。a h y v a x i n e n 和 o j a 等人根据统计学中峭度的概念和信息论中负嫡的定义,提出了基于独立分量 分析的快速分离算法f a s t l c a 1 3 。 以上的盲信号分离方法都是基于瞬时混合模型的,这些方法相对成熟,在解 瞬时混合模型时已经有了比较满意的效果。但是,在实际研究中,我们发现,这 些瞬时混合模型无法在实际环境中应用。因为在实际的语音环境中,声音传播过 程中会遇到障碍物的反射和衍射,造成麦克风接收到的信号不再是简单的瞬时混 合信号,而是有时延或者卷积的信号。为了在实际环境中对语音信号进行盲分离, 近几年来,研究者们开始关注卷积混叠模型,开始对卷积混合信号的盲分离算法 进行研究。 针对卷积语音信号的盲分离,主要有两大类方法,一类是时域的方法,一类 是频域的方法。 在时域中,1 9 9 1 年,p l a t t 和f a g g a i n 将h - j 算法推广到具有时间延迟和卷积 混迭情况1 1 4 。1 9 9 4 年,y e l l i n 和w e i n s t e i n 给出了基于高阶累积量和高阶谱的多 通道盲反卷积算法,由于用到高阶累积量和需要计算高阶谱,该算法所需要的运 算量极大 1 5 1 。1 9 9 5 年,n g y u e n 和j u t t e n 利用四阶累积量或四阶矩函数,给出 了卷积混迭信号盲分离的自适应训练方法【1 6 】。1 9 9 6 年,k t o k k o h 提出了一个 反馈网络结构,将l n f o m a x 算法推广到更广泛的情况,即具有时间延迟的源的混 第一章绪论 迭或卷积混迭信号的盲分离【1 7 l 。1 9 9 7 年,aj b e l l 和t j s e j n o w s k i 也提出了 最大互信息传输的算法。c i c h o c k i 提出了基于信息最大化的方法【1 8 】。 在频域中,1 9 9 8 年,p s m a r a g d i s 将卷积信号的盲分离变换到频域中的各个 频点的瞬时信号的盲分离,简化了分离模型,分离效果良好【1 9 】。但是,并未很 好地解决频域盲分离中存在的次序不一致问题。 2 0 0 2 年,m z i k r a m 等提出利用b e a m f o r m i n g 原理来解决频域盲分离中的次 序不一致问题【2 0 】。2 0 0 4 年,h i r o s h is a w a d a 等提出了结合b e a m f o r m i n g 和相关 性的方法来解决频域盲分离中的次序不一致问题,取得了较好的效果【2 1 】。但是, 这些方法需要已知麦克风放置的位置,并且,现有的这些方法都是批处理的算法, 无法进行在线计算。 1 3 语音信号盲分离的应用 近年来,盲信号处理成为信号处理的研究热点,并且已经在地震勘探、移动 通信、语音处理、阵列信号处理以及生物医学等领域中显示出诱人的应用前景。 尤其是在语音信号盲分离方面的研究更是盲源分离研究的焦点,这不仅仅是因为 鸡尾酒会问题是盲源分离研究起源更是因为该问题的解决有着很广泛的实际意 义,语音盲信号分离可以应用于下面几个重要的方面: 1 机器人语音识别 当外部环境安静时,机器人对一个人的声音指令的识别率是比较高的,但是 在有很多人同时发布指令或者有较强的背景噪声时,机器人对声音指令的识别率 就会大大降低。这也需要运用语音盲处理的技术来提取机器人所需要的声音指 令。 2 移动通信 在移动通信中,尤其在车内环境中,因为在手机中语音编码器仅仅使语音 编码达到最优,因此对于有噪音的语音信号会导致很差的语音质量。而盲信号分 离能够消除噪声、抑制干扰及增强语音,提高通话质量。 3 远程会议系统 在回响环境中,语音信号的重构相对困难,而盲信号分离技术可以使得理想 的语音信号被重构,结合多通道回声抵消技术可以构建高质量的远程会议系统。 4 助听器的设计 传统的助听器是对有用信号和噪声同时进行放大,使得残疾人耳朵接收到的 信号依然是混合信号的放大,语音分离技术使得助听器有更强大的处理功能,能 够把接收的信号分离出原始的语音信号,使得它更适合残疾人。 事实上,盲信号分离的应用还远远不止语音信号处理的上述几个方面,它在 第一章绪论 生物信号处理,阵列信号处理。图像处理,地球物理信号处理、回波消除、数据 挖掘、机械故障检测甚至金融领域中都有着很好的应用前景。 1 4 论文的思路及创新点 盲信号分离的研究在近十年引起了广泛的兴趣和关注,而语音信号的盲分离 由于应用前景的广泛更是有很多的关注。但是,到目前为止,针对频域中语音信 号的盲分离仍然有很多亟待解决的问题。本文从实用性的角度出发,针对卷积信 号频域盲分离的关键技术,结合语音信号的特点,在以下几个方面进行了工作和 创新性的探索: 1 )本文是针对频域进行语音信号的盲分离,而频域中在每个频点上需要 利用时域的瞬时混合盲分离算法。语音信号在时域中的特点已经得到 了广泛的研究,本文针对盲信号分离所需的条件通过实验研究了语音 信号在频域中所具有的特性,并且将这些特性应用于频域的盲分离算 法中。 2 )次序不一致问题( p e r m u t a t i o n ) 是频域盲分离算法中一个最难解决的 问题,到目前为止还没有得到很好的解决。本文利用语音信号在时频 点上的稀疏特性,将时频分析引入频域的盲分离算法,来解决各频率 点上次序不一致问题,效果比现有的算法好,并且避免了仅用时频二 元掩模带来的信号失真。 3 )因为每个频定分离的源信号存在次序的不一致问题,在从频域返回时 域时必须对源信号的次序进行调整,而在线迭代时很难了解整个源信 号的全貌,因而现有的频域盲分离算法大多为批处理算法,无法在线 分离,本文利用语音信号到接收器的传播特性,利用波达方向 ( d i r e c t i o no f a r r i v a l ,d o a ) 作为约束条件,与原有的最小互信息的目 标函数结合,利用拉格朗日乘子法形成新的目标函数并对之求导得到 新的迭代公式,来实现频域的在线算法,新算法可以实现在线分离, 并且分离效果比传统的批处理算法效果更好。 4 )在线的算法的收敛速度普遍较慢,基于二阶统计量的算法涉及时延的 选择,不适合在线处理。本文基于四阶统计量的广义特征分解,提出 了频域中的定点盲分离在线算法,比原有的在线算法大大提高了收敛 速度,并且收敛效果良好。 第一章绪论 1 5 论文的安捧 论文结合语音信号的特性,研究频率域中盲分离算法的关键技术,将其内容 安排在以下几章: 第一章绪论 简单介绍了盲信号分离的基本概念,研究背景和国内外研究现状。 第二章独立元分析的基本概念和语音信号的特点 介绍了独立元分析( i c a ) 的基本概念,主要算法,根据实验得出了语音信 号在频域中的特点,并且介绍了频域盲分离的基本算法,分析了频域中进行盲分 离的主要问题所在。 第三章利用时频分析解决次序不一致的盲分离算法 介绍了传统的解决次序不一致的批处理算法,分析了语音信号在时频点上的 稀疏特性,提出了将该稀疏特性得到的基于d o a 的二元掩模应用到频域盲分离 算法中,与基于最小互信息的i c a 算法相结合,来解决频域盲分离算法中存在 的次序不一致问题。 第四章在线的频域盲分离算法 提出了将波达方向作为约束条件来在线地解决频域盲分离算法的次序不一 致问题,使得频域盲分离可以在线进行。 第五章快速收敛频域盲分离算法 介绍了快速定点算法,提出了将定点算法应用于基于高阶统计量的频域盲分 离算法,使得算法的收敛速度大大加快。 第六章总结与展望 总结硕士研究生阶段做的工作,以及今后仍需改进之处。 第二章独立元分析的基本概念及语音信号的特点 第二章独立元分析的基本概念及语音信号的特点 盲信号分离是近十年来信号处理领域的研究热点,而独立元分析则是盲信号 分离的一种重要方法。根据信号混合的不同模型,盲信号分离可以分为瞬时混合 和卷积混合两大类。本章主要介绍了盲信号分离的模型,独立元分析的概念和主 要算法,针对卷积混合盲信号分离,又有时域分离方法和频域分离方法,本章分 析了卷积混合频域盲分离存在的主要问题,由于我们研究的源信号主要是语音信 号,为此,本章通过实验分析了语音信号在频域中的特性。 本章内容安排如下: 第一节:介绍瞬时混合信号盲分离的概念及数学模型。 第二节:介绍独立元分析( i c a ) 的基本概念和主要算法。 第三节:介绍卷积混合信号盲分离的概念及数学模型。 第四节:介绍频域盲分离的概念和频域盲分离的主要困难。 第五节:通过实验分析了语音信号在频域中的特性。 第六节:本章小结。 2 1 瞬时混合信号盲源分离的基本概念和数学模型 盲信号分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) 是指从观测到的多个信号的混 合信号中恢复出源信号的过程。通常,观测信号来自一组接收器的输出,其中每 个接收器接收到的是多个源信号的混合。但是关于源信号以及由源信号到混合信 号的传输信道没有任何先验知识。因此无法建立从源信号到接收器的传递函数及 模型,也就是说我们所能得到的唯一的信息就是来自于混合信号中。 根据传输信道的不同,可以将盲信号分离分为瞬时混合模型和卷积混合模 型。当传输信道是一个矩阵模型时,称为瞬时混合,也即不同信号到达接收器的 时间是相同的。用数学语言来描述即为: 假设n 个源信号为墨o ) ,f - 1 , 2 鼻,接受信号为善,o ) ,- 1 , 2 , 朋,从墨o ) 到 x ,( f ) 的传输信道为h 。,那么根据传输信道的不同,可以将盲信号分离分为瞬时 混合模型和卷积混合模型。当传输信道 。,v i ,是常数时,称为瞬时混合,也 就是说不同信号到达接收器的时间是相同的。用数学语言来描述即为; x j ( t ) - 罗 s a t ) ( ,- 1 册) ( 2 - 1 1 ) 镯 写成矩阵形式,如式( 2 1 - 2 ) 所示: 第二章独立元分析的基本概念及语音信号的特点 x ( o - h s ( t )( 2 - i - 劲 其中工( f ) k ( f ) ,o ) r 为接收信号向量,而s ( f ) - h o ) ,s 。o ) r 是源信号向 量,日是zf h h 。组成的混合矩阵仅已知x ( f ) 求s o ) 和h 一般是个病态问题,但 在一定条件下方程( 2 1 2 ) 是有解的。目前最常用的方法有独立元分析法和时 频法,下节将介绍独立元分析的算法。 2 2 独立元分析( i c a ) 的概念及主要算法 2 2 1 独立元分析( i c a ) 独立元分析( i n d e p e n d e n tc o m p o n e n t a n a l y s i s ,i c a ) ,是近年来发展起来的一 种新的盲源分离的方法,它是要从多维的观测信号中去发现隐含在其中的独立的 分量或因素。 在式( 2 - i - 2 ) 中,当混合矩阵日和源信号s ( f ) 未知时,方程的维数为m 维, 即x e r “,要解开个独立元和m x n 个混合矩阵的系数,则未知数的个数为 m x n - f 1 1 个,因为m x n + n m ,用传统的决定性系统中的方法是无法解出该方程 的。但是,如果矗( f ) , 是统计独立的,则可以通过统计的方法来解这一问 题。 如果两个随机变量独立,是指从一个随机变量中不能得到任何关于另一个随 机变量的信息。以随机变量墨( f ) 和s 2 ( t ) 为例,定义p “,5 2 ) 为毛o ) 和( f ) 的联合 概率密度函数,那么s l ( t ) 和s 2 ( t ) 的各自的概率密度函数为: p 1 ) - p p 。,s , ) d s 2 和p 2 瓴) - r p 0 ,屯) c 趣 如果墨 和s 2 ( t ) 统计独立,则它们的联合概率密度可分解为各个随机变量的概 率密度函数之积,如式( 2 2 1 ) 所示: p “,s 2 ) 一p 。“) p :陂) ( 2 - 2 - 1 ) 推广到多维随机变量的独立,如s ( t ) 一h o ) ,s 。o 圹,p ( s ) = p ( s i ,) 为 其联合概率密度函数,那么s 中各元素两两独立的条件为: p ( s ) 。只 ) ( 2 2 2 ) i c a 的目标就是利用观察信号x ( f ) 来估计或恢复出其中相互独立的源信号 s ( t ) 。求解i c a 问题有以下假设: 1 ) 各个源信号( f ) ( i - 1 n ) 都是零均值的随机信号,并且相互统计独 立。 第二章独立元分析的基本概念及语音信号的特点 2 ) 源信号数目n 小于等于观测信号数目m ,即n s m ,并且混合矩阵日可 逆。 3 ) 只允许一个源信号是高斯分布的随机信号。 第3 个假设是由于两个统计独立的高斯分布的信号混合后还是高斯分布的信号, 他们的独立性等同于互不相关。而i c a 是采用统计的方法进行分离的,其分离 的结果都不会改变信号的二阶不相关性。因此,若服从高斯分布的源信号超过一 个,i c a 是无法分出这两个以上的高斯分布的源信号。 假设源信号s 满足上述三个条件,在混合矩阵日和源信号s 均未知的情况 下,i c a 构建一个分离矩阵,通过学习算法调整分离矩阵使得原信号s 的 各个随机元素尽可能的独立。衡量元素独立的有很多种的目标函数,对目标函数 利用梯度寻优的方法可以获得分离矩阵形,设工经过分离矩阵形变换后,得到 n 维输出列向量r ( t ) i 【y l ( t ) ,儿( f ) r 各分量尽可能统计独立。i c a 问题的求解 就可表示成 y(f)-wx(t)(2-2-3) 在本文中,为简单起见,我们都考虑玎- m 的情况,若nt 卅,则可以通过p c a 预处理和降维的方法使得混合信号降为n 维1 2 2 1 。在上式中,为n 弗的分离矩 阵。 i c a 的算法结构如图2 2 1 所示: 图2 2 1i c a 的基本算法结构 第二章独立元分析的基本概念及语音信号的特点 2 2 2i c a 解的不确定性 对于i c a 问题,我们重新写一下式( 2 - 卜2 ) 如下: x o ) 一e s ( f ) ( 2 1 - 2 ) 假定h 一h m ,贝u x ( t ) 一h s 这样s o ) 一 l s ( f ) 其中i f 是一个变换阵,可以写成一个置换矩阵和一个对角矩阵的乘积,如 式( 2 2 - 4 ) 所示: m p d o1 1 o 0 0 o o 1 a0 o 6 0 o o 0 c一 ( 2 2 - 4 ) 其中p 为置换阵,也即在该矩阵中的每一行只有一个1 ,每一列中也只有一个1 , d 为对角矩阵,也即该矩阵只在对角线上有值,其余均为零。 这时恢复出的信号s ( f ) 与源信号相差一个标量比例因子,且信号的排列次 序也可能与源信号不一致,但从信号分离的角度看,这种不确定性并不影响分离, 分离出的信号仍然是统计独立的。这就是i c a 中不确定性问题: 1 ) 置换问题( ( p e r m u t a t i o n ) ,源信号与分离信号的顺序可能是不同的。 2 ) 尺度缩放问题( s c a l i n g ) ,源信号与分离信号的幅度不同。 2 2 3i c a 的主要算法 i c a 的主要原理就是使分离的信号间彼此尽可能的统计独立。不同的i c a 算法主要在于独立性测量的不同,或者代价函数的不同。主要可以分为四大类: 基于高阶统计量的方法,基于信息理论,基于非高斯性的方法以及基于二阶统计 量的方法。因后续章节的新算法的提出是基于最小互信息算法和四阶统计量算法 的,我们会重点介绍这两个算法。 ( 一) 基于高阶统计量的方法 对于高斯信号来说,不相关和独立是等价的。但对于非高斯信号来说,独立 是比不相关更强的条件,是指在包括二阶统计量在内的所有更高阶统计上不相 关。如果没有其他统计信息或约束条件,仅利用二阶统计量是不足以解决盲信号 分离问题的,因此人们更多地寻求高阶统计量的解决方法。 c a r d o s o 较早地提出了利用四阶矩来进行盲信号分离( f o u r t h o r d e rb l i n d i d e n t i f i c a t i o n ,f o b i ) 【2 3 ,提出了一种简单的正交和加权两步代数算法,独立元 第二章独立元分析的基本概念及语音信号的特点 成分可以较容易地用高阶矩矩阵的特征矢量来获取。 t o n g 和h u 等人基于c a t d o s o 的算法,首先通过正交变换,然后通过观测信 号的四阶矩进行奇异值分解( s v d ) ,得到扩展的四阶盲分离算法( e x t e n d e d f o b i ,e f o b i ) 【4 】。c a r d o s o 还提出了基于四阶统计量的联合对角化方法( j o i n t a p p r o x i m a t ed i a g o n a l i s a t i o ne i g c n m a t r i x ,j a d e ) 【2 4 对于f o b i 算法,假设被观察的混合信号矢量为x ( t ) ,是由源信号s ( f ) 和混 合矩阵日得到的;x ( t ) - h s ( t ) 。由于用i c a 解出的独立元在幅度和次序上的 不确定性,我们可以设方程x o ) 一日s o ) 中的源信号满足s ( f ) s ( f ) 7 - j 。预白化 是通过减维和变换将x ( f ) 变换到z ( t ) ,使足- z ( t ) z ( t y i 。令混合信号x ( t ) 的协方差矩阵为患- x ( f ) x o ) r ,把混合方程代入,可得: 冠一x ( f ) x ( f ) 7 - u s ( t ) s ( t ) 7 日7 - h h 7 我们考虑源数目等于混合信号数目的情况( 若开 a 二 由于曰的行向量构成一组正交归一基,可以得到: i z ( f ) | 2 一牡o ) 1 2 则: i z ( 0 1 2z o ) z ( f ) 7 。善n 荟s ( 荟nk ( f ) 1 2 蛔( f p ,( f 归,7 b j ( 2 - 2 - 7 ) 第二章独立元分析的基本概念及语音信号的特点 其中,丑表示b 的第i 个行向量,由于源信号是零均值,且互相独立的,对( 2 2 - 7 ) 式可以分下面三种情况讨论: 1 f - j ,则( ( f p ,( 0 1 s k ( 0 1 2 ) 一( 两( f ) ) ( 即( f ) k o ) 1 2 ) - o ( 2 - 2 - 8 ) 2 f - j - k ,则0 ( 0 s ,( f ) k 州) - ( i 岛硝) ( 2 - 2 9 ) 3 f 一,一七,贝( 岛( f ) s ,( f ) i 岛( f ) | 2 ) 一( i 曲o h 2 ) ( 1 & ( f ) 1 2 ) - 1 ( 2 - 2 1 0 ) 把( 2 2 8 ) 、( 2 2 9 ) 和( 2 2 1 0 ) 式代入( 2 2 7 ) 中,得到: 豆一( 胁+ 埘一1 ) 噩晟 其中,肋一( b ( f ) 1 4 ) 为第f 个源信号的四阶矩。由于岛互相正交,届其实就是是 的特征向量,这样,对豆进行特征值分解求得届,就可以得到归一化的源信号 s ( o : s o ) - 曰4 z ( t ) - b 7 z ( o ( 2 - 2 - 1 1 ) 因此f o b i 算法的步骤为: 1 ) 对混合信号去均值。 2 ) 通过( 2 - 2 - 5 ) 式对混合信号进行预白化,使x o ) 一z ( t ) 。 3 ) 通过( 2 - 2 - 7 ) 式求白化信号的四阶统计量豆。 4 ) 对( 2 2 - 7 ) 式求得的四阶统计量危进行特征值分解,得到特征向量昂, i 1 ,2 ,露 5 ) 通过( 2 - 2 - 1 1 ) 式得到源信号。 ( - - ) 基于最小互信息和熵的方法 图2 2 1 中盲信号分离的分离矩阵可以看作一个线性前馈神经网络,因此可 以利用神经网络的方法来求解。b e l l 和s e j n o w s k i 将盲源分离问题放在信息理论 的框架之下【7 】,为了避免对未知的概率分布函数求梯队,将线性网络的最小互 信息问题转交为非线性网络的最小互信息问题,并采用梯度算法对神经网络连接 权值进行调整,可较好地实现多路线性混合信号的盲源分离。信息论的方法一般 用互信息或熵为目标函数。 互信息,( 】,) 的定义如式( 2 2 1 2 ) 所示: 第二章独立元分析的基本概念及语音信号的特点 。p 0 g 爵 ( 2 2 1 2 ) 当满足( 2 - 2 - 2 ) 中独立的条件时,( y ) - 0 ,否则,( 1 ,) 0 。因此互信息越小,y 中各个元的独立性越好。 最小互信息算法的网络结构如图2 2 2 所示: y r 图“豫最小互信息算法的网络结构 其中x - h $ ,u - w x ,u 一“,1 2 ,) 7 ,u 为网络输出,经过一个非线性变 换g 得到l r 。最小互信息的方法就是要找到分离矩阵使得恢复信号问的互信 息最小。 从( 2 - 2 - 1 2 ) 式可以得到互信息和熵之间的关系如( 2 2 1 3 ) 所示: 7 ( y ) 。善也( m ) 一也( y ) ( 2 - 2 1 3 ) 其中,( y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论