(电路与系统专业论文)卷积语音信号盲分离的频域算法研究[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)卷积语音信号盲分离的频域算法研究[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)卷积语音信号盲分离的频域算法研究[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)卷积语音信号盲分离的频域算法研究[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)卷积语音信号盲分离的频域算法研究[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(电路与系统专业论文)卷积语音信号盲分离的频域算法研究[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理t 大学硕士学位论文 摘要 现实环境下,语音信号经常受到其他语音或噪声的干扰,且麦克风拾取的信号为语 音与干扰信号的卷积混合。因此,对受扰语音进行解卷积是语音增强的重要任务。盲源 分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) 是指源信号和传输信道参数都未知,仅由观测信号 恢复出源信号各个独立成分的方法。由于对先验知识要求低,盲源分离在语音增强中得 到了广泛关注。 现有的卷积混合语音信号的盲源分离分为时域方法和频域方法。当混合滤波器阶数 较高时,时域方法需要学习的参数较多,造成计算时间长、难于收敛。相比之下,频域 方法将时频卷积变换为多个频率段上的乘法运算,运算简单,速度快,因此成为盲解卷 的主流方法。但是,频域算法必须解决b s s 固有的顺序不确定性问题,否则影响分离性 能,这正是本文研究的关键。 针对卷积混合语音盲分离的频域算法,本文主要做了以下三方面工作:( 1 ) 研究 了现有调序方法和语音信号的特性,提出了一种基于能量相关的调序方法,并应用 j a d e 、k m 、c f a s t l c a 和c m n 等四种复数b s s 算法,对仿真和实际语音信号进行了 盲分离,分析比较了分离性能,验证了本文调序方法的有效性。( 2 ) 在c m n 算法和约 束优化的框架下,将语音的能量相关特性直接引入盲分离过程,推导出了约束c m n 的 梯度算法和牛顿算法,将顺序不确定问题在b s s 过程中一并解决,利用仿真和实际语音 信号进行的大量实验表明,约束c m n 算法的性能高于包括c m n 在内的全盲分离算法。 ( 3 ) 研究了影响卷积混合频域算法分离性能的一些因素。主要针对不同的窗函数进行 了仿真实验,分析了语音信号的短时平稳性和窗函数的作用;通过实验分析,探索了 f f t 长度和脉冲响应阶数的关系,为频域算法研究提供了有益的参考。 关键词:卷积语音;盲源分离;频域算法;调序;约束优化 卷积语音信号盲分离的频域算法研究 f r e q u e n c y d o m a i na l g o r i t h m sf o r b l i n ds o u r c es e p a r a t i o no fc o n v o l u t i v em i x t u r e so fs p e e c h e s a b s t r a c t i nr e a le n v i r o n m e n t ,s p e e c hs i g n a l sa r eo f t e ni n t e r f e r e db yo t h e rs p e e c h e so rn o i s e s ,a n d t h es i g n a l sp i c k e du pb ym i c r o p h o n e sa r ec o n v o l u t i o no ft h es p e e c h e sa n dt h ei n t e r f e r i n g s i g n a l s t h e r e f o r e ,d e c o n v o l u t i o no fd i s t u r b e ds p e e c hs i g n a l si sa ni m p o r t a n tt a s kf o rs p e e c h e n h a n c e m e n t b l i n ds o u r c es e p a r a t i o n ( b s s ) r e c o v e r st h ev a r i o u si n d e p e n d e n tc o m p o n e n t sf o r s o u r c es i g n a l sf r o mo b s e r v e ds i g n a l sw i t h o u tk n o w l e d g eo fs o u r c es i g n a l sa n dt r a n s m i s s i o n c h a n n e lp a r a m e t e r s b e c a u s ei tr e q u i r e sl i t t l ep r i o r ik n o w l e d g e ,b s sb e c o m e saw i d e l yu s e d m e t h o df o rs p e e c he n h a n c e m e n t a l g o r i t h m so fb s sf o rs e p a r a t i n gc o n v o l u t i v es p e e c h e sc a nb ed i v i d e di n t ot i m e d o m a i n a n df r e q u e n c y - d o m a i nm e t h o d s w h e nt h er e v e r b e r a t i o nt i m ei sl o n g ,t h et i m e - d o m a i nm e t h o d r e q u i r e sm a n yp a r a m e t e r st ol e a r n ,w h i c hr e s u l t si nl o n gc o m p u t i n gt i m ea n dc o n v e r g e d i f f i c u l t y i nc o n t r a s t ,t h ef r e q u e n c y d o m a i nm e t h o dt r a n s f o r m st h et i m e - f r e q u e n c yc o n v o l u t i o n i n t op r o d u c to p e r a t i o ni nm u l t i p l ef r e q u e n c yb a n d s ,t h u sh a ss i m p l ec o m p u t a t i o na n df a s ts p e e d a ss u c h ,i th a sb e c o m eam a i n s t r e a mm e t h o df o rb l i n dd e c o n v o l u t i o n h o w e v e r , t h e f r e q u e n c y - d o m a i nb s sa l g o r i t h mm u s ts o l v et h ei n h e r e n tp e r m u t a t i o na m b i g u i t yw h i c h o t h e r w i s ea f f e c t st h es e p a r a t i o np e r f o r m a n c e ,t h i si st h ek e yp o i n to ft h i st h e s i s t h em a i nw o r ko ft h i st h e s i si n c l u d e st h r e ea s p e c t s :( 1 ) s t u d yt h ee x i s t i n go r d e ra d j u s t m e n t m e t h o d sa n de x a m i n et h ec h a r a c t e r i s t i c so fs p e e c h e s ,an e wo r d e ra d j u s t m e n tm e t h o db a s e do n e n e r g yc o r r e l a t i o ni sp r o p o s e d i t i sa p p l i e dt oj a d e ,k m ,c - f a s t l c a , a n dc m nt os e p a r a t et h e c o n v o l u t i v em i x t u r e sf r o ms i m u l a t e da n da c t u a ls p e e c h e s ,t h er e s u l t so fa n a l y s i sa n d c o m p a r i s o no fs e p a r a t i o np e r f o r m a n c ev e r i f yt h ev a l i d i t yo ft h em e t h o d ( 2 ) i nt h ef r a m e w o r k o fc m na n dc o n s t r a i n to p t i m i z a t i o n ,t h ee n e r g yc o r r e l a t i o nc h a r a c t e r i s t i c so fs p e e c hi sd i r e c t l y i n c o r p o r a t e di n t ob s sp r o c e s s ,t w on e w s e m i - b l i n dc m n a l g o r i t h m sa r ep r o p o s e di n c l u d i n g g r a d i e n ta l g o r i t h ma n dn e w t o na l g o r i t h m ,a n dt h ep e r m u t a t i o np r o b l e mi ss o l v e dt o g e t h e rw i t h b s s e x t e n s i v ee x p e r i m e n t sw i t hs i m u l a t e da n da c t u a ls p e e c h e ss h o wt h a tp e r f o r m a n c eo ft h e c o n s t r a i n tc m na l g o r i t h m si sh i g h e rt h a nt h a to fo t h e rb s sa l g o r i t h mi n c l u d i n gc m n ( 3 ) e x p l o r es o m ei n f l u e n c ef a c t o r sf o rt h ef r e q u e n c y d o m a i nm e t h o d t h et h e s i s c a r r i e so u t s i m u l a t i o n sw i t hd i f f e r e n tk i n d so fw i n d o wf u n c t i o n s ,a n a l y z e st h es h o r t - t i m es t a t i o n a r i t yo f s p e e c hs i g n a l sa n d t h ee f f e c to fd i f f e r e n tw i n d o wf u n c t i o n s ;e x p l o r e st h er e l a t i o n s h i pb e t w e e n 大连理工大学硕士学位论文 t h el e n g t ho ff f ta n dt h eo r d e ro ft h ei m p u l s er e s p o n s et h r o u g he x t e n s i v ee x p e r i m e n t s t h e s e r e s u l t sp r o v i d eu s e f u lr e f e r e n c e sf o rf u r t h e rs t u d yo ff r e q u e n c y d o m a i na l g o r i t h m s k e yw o r d s :c o n v o l u t i v es p e e c h ;b s s ;f r e q u e n c y - d o m a i na l g o r i t h m ;r e o r d e r i n g ; c o n s t r a i n to p t i m i z a t i o n i 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 学位论文舭蝉鲤墨趁盏堕型绺硝纽 作者签名:避 日期: 哿竺年上月互一日 大连理工大学硕士学位论文 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印、或扫描等复制手段保存和汇编本学位论文。 学位论文题目: 作者签名: 导师签名: 互餐抖日期: 叼知年 月彳e 九认芝 日期:,p 年j 月丘e l 。 大连理丁大学硕士学位论文 1 绪论 1 1课题研究背景和意义 计算机技术的发展,使数字信号处理在通信、图像、医学、声纳探测等领域广泛应 用。环境的复杂性和人类认识水平的局限性使得很多情况下,我们对所获得信息的先验 知识了解很少,只能通过观测信号来进行评估分析。盲信号处理就是在这样的需求下, 成为数字信号处理一个新的研究分支。 盲源分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) 是指源信号和传输信道参数都未知,仅由 观测信号恢复出源信号各个独立成分的过程。由于对先验知识要求低,盲源分离已成为 信号处理领域的研究热点,而对语音信号的盲源分离更是研究的焦点。 较早进行盲源分离研究的是j h e r a u l t 和c j u t t e n ,他们利用梯度下降算法调整网络 权值,最小化网络输出信号的残差,实现信号的盲源分离,他们的方法称为h j 算法【1 1 。 1 9 9 4 年,c o m o n 在他的经典文献“i n d e p e n d e n tc o m p o n e n ta n a l y s i s 中系统地分析了瞬 时混叠信号的盲源分离问题,并明确了独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s , i c a ) 的概念【2 1 ,为盲源分离提供了一种有效手段,也为i c a 的研究和发展奠定了基础。 盲源分离通常是指对线性瞬时混叠信号的分离,作为最原始的盲源分离问题,从研 究开始到现在,相关理论和算法越来越成熟,一系列的研究成果使得瞬时混合盲源分离 相对完善。然而,瞬时混合假设观测信号仅由源信号简单加权得到,有时并不切合实际 情况。在现实环境中,信号的传播会存在一定的时间延迟,并且不同的传感器和信号源 之间的传输通道可能不同,还有环境的反射等多种因素,使得观测信号往往是源信号和 传输通道的卷积混合。 卷积混合盲源分离大致可以分为时域方法1 3 卅和频域方法【8 - 1 们。时域方法一般是瞬时 混合盲分离方法的扩展,c o m o n 等【4 j 把基于联合对角化的代价函数推广到卷积混合信 号;s u n 纠3 j 把基于独立性的等变自适应分离算法推广到卷积混合盲分离中,实现卷积 盲分离。由于时域方法涉及到卷积运算,迭代公式非常复杂,需要迭代更新的参数也很 多,往往需要大量迭代才会收敛,因此计算时间长、速度慢。相比之下,频域方法通过 时频变换将时域中的卷积运算变换为频域中的乘法运算,从而可以在每个频率段上直接 运用成熟的瞬时混合盲源分离算法。由于每个频率段的计算是相互独立的,算法受混合 滤波器阶数的影响就较小,避免了卷积运算,运算速度要快得多。d i n g 等【1 0 】在频域改 进了观测信号的相关系数矩阵,对其进行对角化,精确地解决卷积混合问题;文献【9 】 利用一种新的可以快速收敛的交替最小二乘法实现频域盲源分离。 卷积语音信号盲分离的频域算法研究 盲源分离对源信号进行估计时存在一定程度上的不确定性,即对被估计信号进行了 任意比例的伸缩、排序,但它依然保留了源信号的波形信息。尽管这种不确定性使盲信 号处理有一定的局限性,但在很多实际应用中,这并不是关键问题,因为源信号的大量 信息蕴含在波形而不是振幅或者输出顺序中,因此在时域方法中,这种不确定性并不影 响分离结果。然而对于频域方法来说,在每个频率段上的瞬时混合盲分离结果具有幅度 和顺序不确定性,这就使得分离矩阵是真实混合矩阵的逆阵和某个不可测的置换矩阵的 乘积,而每个频率段上的置换矩阵不一定一致,因此,为了正确估计源信号,必须解决 这种不确定性。 顺序不确定性问题的起因是b s s 并未利用源信号和混合信号的先验信息,而相关信 息又是客观存在的,比如语音信号的时频信息、传感器的空间信息等。频域算法中解决 顺序不确定性问题的方法可以分为后处理型和集成型。后处理型继承性好,可以直接利 用已有的复数b s s 算法,信息最大化法【1 1 】,极坐标法【1 2 l 等,将主要精力放在利用先验 信息进行后处理调序上;集成型将先验信息作为目标函数的约束,在b s s 过程中即同时 解决顺序问题,算法效率高。目前文献大多数利用波束形成中的几何信息,如源信号的 位置信息【1 3 1 、目标语音的方向信息1 1 4 彤】等,只有少数算法利用了语音信号本身的信息【1 6 1 。 目前的研究结果表明无论后处理型还是集成型,都并不完善,且有些方法对先验信 息要求较高,因此频域方法的发展需要进一步研究。为此,本文研究了语音信号的特性, 提出了一种基于能量相关的调序方法,该方法计算简单,性能稳定,且对先验信息要求 低。把这种调序方法集成在b s s 过程中,提出了两种基于能量相关的约束半盲算法,为 频域半盲分离算法的发展提供了参考。 本课题得到了国家自然科学基金项目( n o 6 0 9 7 1 0 9 7 ) 资助。 1 2 论文主要研究内容 本文在前人工作的基础上,深入系统地研究了卷积混合语音信号盲源分离中存在的 问题,提出了自己的解决方法。本文主要贡献包括以下四个方面: 1 提出了一种新的基于能量相关的调序方法。针对现有卷积混合语音信号盲源分离 中固有的顺序不确定问题,分析了语音信号自身的特点,总结得出频域语音信号的能量 相关特性,并根据这个特性提出了一种基于能量相关的调序方法,解决了卷积混合语音 频域全盲分离算法中的顺序不确定问题。利用本文提出的调序方法,分析比较了j a d e ( j o i n ta p p r o x i m a t i v ed i a g o n a l i z a t i o no fe i g e n m a t r i x ) 、峭度最大化、c f a s t i c a 和基于 负熵最大化的频域复数算法的分离特性,同时也验证了本文调序方法的有效性。 大连理工大学硕士学位论文 2 推导出了基于负熵最大化的约束盲分离的梯度算法。通过比较现有频域复数算法 的分离特性,发现基于负熵最大化的c m n 算法相对优于其他算法。所以在c m n 算法 的基础上推导出了频域约束盲分离算法,通过利用语音信号的能量相关特性对算法进行 约束,在迭代分离的过程中解决调序问题。实验表明,约束盲分离算法要优于调序后处 理的全盲分离算法。 3 推导出了基于负熵最大化的约束盲分离的牛顿算法。针对梯度算法对步长有要 求、稳健性差、分离速度相对较慢等问题,提出了约束盲分离的牛顿算法,相对梯度算 法,牛顿算法收敛速度快,精度高,恢复语音质量也较好。 4 研究了卷积混合频域算法中的限制条件。针对不同窗函数进行了仿真实验,分析 语音信号的短时平稳性和窗函数的作用;根据现有文献在脉冲响应和f f r 长度上的不同 结论,进行了仿真实验,分析得到它们之间并没有恒定的约束关系,而是在较短和较长 脉冲响应长度下,f f r 长度的最优选择也不同。 卷积语音信号盲分离的频域算法研究 2 语音混合模型 语音是人类重要的交流工具,因此语音信号的盲分离一直是研究的热点。语音信号 的混合模型分为瞬时混合和卷积混合,瞬时混合模型体现了盲源分离的实质,易于描述, 但是,在现实环境中,语音的混合大多情况下近似于卷积混合。 2 1 瞬时混合模型 假设有冗个未知的源信号s ( f ) = h ( f ) ,s 2 ( f ) ,又( f ) 1 1 ,经过挪嚣维的线性混合矩阵 a 后,传感器接收到小个混合语音信号x ( f ) = 阳( f ) ,x 2 ( f ) ,( f ) 1 1 ,通常咒s 肌。则瞬 时混合模型如图2 1 所示: s l ( t ) s 2 ( t ) s 。( t ) 图2 1 瞬时混合模型 f i g 2 1 i n s t a n t a n e o u sm i x i n gm o d e l 瞬时混合的数学模型可表示为: 鼍( f ) 2j 著a q s i ( f ) f # 1 ,2 ,m 把式( 2 1 ) 表示为向量形式为: x l ( t ) x a o x n ( t ) ( 2 1 ) x ( f ) 一血( f ) ( 2 2 ) 盲源分离的目的在于,在混合矩阵a 和源未知的情况下,寻找一个分离矩阵w , 使得: y ( t ) ;w x ( t ) = d p s ( t ) ( 2 3 ) 其中d 是对角矩阵,反映了算法的幅度不确定性;p 是置换矩阵,反映了算法顺序 不确定性。 瞬时混合盲分离问题可用方框图( 图2 2 ) 表示为: 大连理工大学硕士学位论文 混合 分离 s ( 矩阵 z ( f ) 。 矩阵 aw 图2 2 盲源分离方框图 f i g 2 2 b l o c kd i a g r a mo fb s s 在语音信号的瞬时混合模型中,不同信号到达各个传感器的时间差别可以忽略不 计,并且传感器接收到的是各个源信号的线性混合。瞬时混合模型是其它模型的基础, 其算法的研究对于其他模型有指导意义。 2 2 卷积混合模型 实际环境中由于延时和反射等原因,接收到源信号的混合更近似于卷积而不是简单 的瞬时混合,如图2 3 所示。 图2 3 实际环境中的接收信号 f i g 2 3 t h er e c e i v e ds i g n a l si nr e a lw o r l d 由于既存在直达传输路径又存在反射传输路径,每个路径又有各自的传输时间和传 输通道,所以第f 个传感器上接收到的混合信号用数学表达式可以表示为: p “ 薯o ) = 善三( p ) s ,( t - - p ) = z 宰s j ( f ) f = l 2 ,m ( 2 4 ) 式中,掌表示卷积,表示第j 个源信号到第f 个传感器之间的传输函数,p 是传输函数 的阶数。为了方便起见,把式( 2 4 ) 表示为向量形式: 卷积语音信号盲分离的频域算法研究 x ( t ) = h ( p ) s ( f - p ) ( 2 5 ) 两 这里, 陬,p k ,p1 h ( p ) 一l ; ;i ( 2 6 ) lk - ,p k ,pi 是指延迟为p 时的混合滤波器矩阵。 因为反射路径越长信号能量的衰减越大,同时反射物也会吸收信号的一部分能量, 因此,可以用一个有限冲激响应( f i r ) 滤波器来近似传输函数。在真实环境中,源 信号经过传输通道以不同的时间延迟到达接收器,所以,鸡尾酒会问题不再是线性瞬时 混合问题,而是卷积混合问题。卷积混合信号的盲分离目的就是要找到一个q 阶的 m 的分离滤波器矩阵w ( q 1 ,使得 q y ( f ) = w ( q ) x ( t q ) ( 2 7 ) 和 语音卷积混合的盲源分离其实仍然符合图2 2 所示的盲源分离方框图,只不过图中 的混合矩阵a 和分离矩阵w 分别被混合滤波器和分离滤波器取代了。 卷积是一种有记忆的运算,即任一时刻的观测信号不仅和当前时刻有关,而且和以 前时刻也有关。因此用卷积混合模型来近似实际情况下信号的传输情况,更合理,也具 有实际的研究价值。 卷积混合盲分离算法可以分为两类。一类是时域分离算法,另一类是频域分离算法。 2 3 卷积混合的时域算法 在时域,对卷积混合信号进行盲分离的方法是利用独立分量分析的概念,将瞬时混 合时的标量混合矩阵扩展到卷积混合时的滤波器混合矩阵的方法。可分为基于二阶统计 量、高阶统计量和信息论等的算法。基于二阶统计量的算法包括w e i n s t e i n 算法【1 7 1 、g e v r e n 算洲1 8 j 等;基于高阶统计量的算法有y e l l i n 算法【1 9 j 等;基于信息论的算法有d o u g l a s 算法 i 捌、c h o i 的动态递归神经网络算法【2 1 】等。 卷积混合盲分离算法可以看作是瞬时混合盲分离算法的一种推广,在时域上这种推 广有两种方式:目标函数的直接推广和算法的直接推广。 目标函数的推广是指把瞬时混合盲分离算法的目标函数推广应用到卷积混合信号。 c o m o n l 2 2 】认为输出信号高阶累积量的绝对值或平方之和不仅可以作为瞬时混合盲分离 人连理工大学硕十学位论文 的目标函数,也可以作为卷积混合盲分离的目标函数;s a l a h 等【冽把基于二阶统计量的 算法推广,通过相关矩阵的联合对角化实现卷积分离;k a w a m o t o 【冽和a m a r i l 2 5 】分别把 基于源信号非平稳性和基于信息论的瞬时混合盲分离算法的目标函数推广到卷积混合 盲分离中。 算法的直接推广,需要遵循以下原则: ( 1 ) 瞬时盲分离算法中的矩阵乘积运算,对应卷积盲分离算法中卷积运算; ( 2 ) 瞬时盲分离算法中的矩阵和运算,对应卷积盲分离算法中滤波器矩阵和; ( 3 ) 瞬时盲分离算法中的矩阵转置运算,对应卷积盲分离算法中滤波器矩阵的转 置和元素序列的时间反转; 2 4 卷积混合的频域算法 在频域上,瞬时混合盲分离算法向卷积混合盲分离算法的推广也有两种方式: ( 1 ) 在卷积混合信号的每个频率段上直接应用瞬时混合盲分离算法,然后把得到 的分离子信号连接起来得到源信号的估计。s m a r a g d i s l 2 6 j 把a m a r i 基于信息论的自然梯 度算法直接应用在卷积混合盲分离中。 ( 2 ) 在频域上定义频域积分目标函数。把瞬时混合盲分离算法的目标函数应用到 卷积混合的各个频率段上,然后对频率进行积分,得到卷积混合盲分离算法的频域积分 目标函数,通过对积分目标函数的优化来实现信号分离。r a h b a r 等1 2 7 l 提出,定义频域积 分目标函数可直接获得分离系统的时域参数,避免频域各个子信号输出顺序不一致性问 题。b e l l 等【2 8 】在l a m b e r t 的f i r 多项式矩阵代数理论下,把a m a r i 的自然梯度算法在频 域上推广到卷积混合信号分离,从而得到频域盲分离算法。 在卷积混合的频域算法中,直接在卷积混合信号的每个频率段上应用瞬时混合盲分 离算法,可以利用瞬时混合盲分离算法良好的收敛特性和分离效果,相对于频域积分盲 分离算法而言,这种频域算法的研究更具有继承性和优越性,研究者这方面所作的工作 和取得的成就也更多,因此卷积混合的频域盲分离算法一般是指第一种推广方式。 与时域算法相比,卷积混合的频域算法可以利用成熟完善的瞬时混合盲分离算法, 有很好的继承性。而且混合滤波器阶数较高的时候,时域算法分离滤波器每一阶的求解 都要依赖于滤波器中其余阶的求解,计算量非常大,分离速度慢,分离效果也会变差; 在频域算法中,由于各个频率段上的分离子信号之间存在着正交关系,在各个频率分量 上得到的分离结果相互独立,互不干扰,就使得算法受到混合滤波器阶数的影响较小, 有利于提高算法分离的整体性能。然而,频域算法存在顺序和幅度不确定问题。在时域 盲分离算法中,这两个不确定性问题并不影响分离结果,但在频域盲分离算法中,顺序 卷积语音信号盲分离的频域算法研究 和幅度不确定却会直接导致无法得到正确的分离结果。主要原因在于,频域算法是在每 个频率段上独立地进行瞬时盲分离,盲分离中幅度的不确定性,会使得每个频率段上的 分离信号在幅值上有偏差,从而导致信号频谱的畸变;顺序的不确定性,会使得每个频 率段上的分离子信号排列次序不一致,致使连接起来出现错误。因此,频域盲分离算法 必须要解决顺序和幅度不确定问题,才能得到j 下确的分离信号。为了消除这种不确定性, 一些研究者进行了大量的工作,并且取得了不错的研究成果,这使得通过频域的瞬时混 合盲分离方法求解卷积混合越来越受到研究人员的关注。 一8 一 大连理上火学硕士学位论文 3 复数算法和不确定性问题 时域的卷积混合可变为频域的瞬时混合,从而利用瞬时混合盲分离算法良好的收敛 性和分离效果,提高频域算法的计算效率和分离性能。唯一不同的是,经过傅里叶变换 到频域后,实值信号变为复值信号,所以不能将时域瞬时线性盲分离算法直接用在频域 混合信号上,而是需要将其代价函数、约束函数、迭代学习规则等扩展到复数域才行。 3 1 全盲复数算法 现有的盲源分离算法中,基本都假设源信号统计独立,本文将仅利用源信号统计独 立性进行分离的算法称为全盲算法。复数全盲算法主要有基于高阶统计量和信息论的方 法,下面介绍几种典型算法。 3 1 1j a d e 复数算法 对于高斯信号来说,不相关和独立是等价的,但对于非高斯信号来说,独立是比不 相关更强的条件,它意味着在包含二阶统计在内的更高阶统计上的相互独立。c a r d o s o 2 9 l 提出了基于四阶累积量的联合对角化,即“特征矩阵联合近似对角化算法。 在盲源分离算法中,一般假设源信号为单位方差r ,一 s ( f ) s ( f ) 月 = i ,因为观测 混合信号i = a s ,这里a 为混合矩阵,由此可知混合信号的方差为 r j = e 触( 舢) 日 = a a h ,当v r j v h 一蛆日v 日一i 。时,即表示对混合信号的白化。 对任意白化阵v 存在酉阵u 使得v aau ,这样白化后的混合信号成了源信号“酉矩阵 的混合 ,盲分离问题也从求解混合矩阵a 变为求解酉矩阵u 。j a d e 算法的原理就是 将白化后的混合信号的四阶累积量矩阵通过u 变换,变为一个对角阵,从而实现酉矩阵 的求解。 设一个复数的n 维随机向量v ,m 为任意甩咒矩阵。v 的四阶累积量矩阵q ,( m ) 定 义如下:它的第玎元素q ,( m ) 1 订是 d e f n q v ( m ) 】巧二善善( v ) 1 s i ,js n ( 3 1 ) 式中,k j d ( v ) 为v 中第f ,_ ,k ,z 四个分量的四阶累积量;是矩阵m 的第七,z 元素。 由上推导可知,白化后的混合信号x = v a s = u s ,所以q 。( m ) 一u q 。( m ) u h ,由于 源信号统计独立,其四阶累积量q 。( m ) 为对角阵,所以白化后的混合信号的四阶累积量 卷积语音信号盲分离的频域算法研究 q i ( m ) 可以写为q i ( m ) 一u a u ,也即是u h q i ( m ) u a ,由此可通过对角化四阶累 积量q i ( m ) 来求解u ,进而进行盲分离。 为求解酉阵u ,以白化信号的k 个,l 咒四阶累积量酉化后非对角元素最小为代价函 数: c ( u ) 一m 。羲够( 也( m tu i ) 2 ) 式中,q ( m 。) 表示x 的四阶累积量矩阵,o g ( ) 是非对角元素的平方和,吩为u 阵 的第i 列。最后,由求得的酉阵可得到恢复信号y = u v x 。 3 1 2 基于峭度最大化的k m 算法 由中心极限定理可知,相互统计独立的随机变量的和比其中任何一个随机变量更接 近于j 下态分布( 高斯分布) 。非高斯性是独立分量分析的最重要特征和基础。因此为了 利用非高斯性进行i c a 的估计,需要有度量非高斯性的量。经典的非高斯度量有两种, 一个是峭度( k u r t o s i s ) ,一种是负熵( n e g c n t r o p y ) 。 零均值的随机变量的峭度( 四阶累积量) 定义为【3 0 】: k ( y ) ;e ( 拶) 2 - 2 ( e 拶) ) 2 一e 拶 e y 。y 】 ( 3 3 ) 式中,宰表示共轭,e ( ) 表示求均值。对于高斯变量来说,七( y ) 一0 ,大多数非高斯随机 变量的峭度不为零,当k ( y ) 0 时,则y 服从超高斯分布,后( y ) 0 时,则y 服从亚高斯 分布。由此可知,峭度的绝对值越大,非高斯性也越强,所以可以通过峭度最大化 ( k u r t o s i sm a x i m i z a t i o n ,k m ) 进行i c a 估计。 峭度最大化算法【3 1 】的代价函数是: 肾j ( y i ) 2 渺( y t ) i( 3 4 ) ”l 倒。 。 r 气4 ) s t e y i y : = 略 式中,y ;一w 罗x ,w 尹表示w ,的共轭转置,x 经过白化预处理后e 殛日 = i ,所以代价 函数中的约束条件e y 只y = 岛可转化为w 芦w ,= 岛,因此代价函数的最终目的可理解 为在0 w ;8 = 1 的约束条件下,寻找一组正交的分离向量w ,使得峭度的绝对值最大。 不同的算法主要体现在代价函数和优化方法的不同上,代价函数的选取决定了算法 利用的统计特性,而优化准则则决定了算法的迭代方法,计算速度,性能稳定和内存消 大连理工大学硕士学位论文 耗等。梯度方法可以在非平稳条件下快速达到自适应,是常用的优化算法,因此文献【3 1 】 中采用梯度学习方法迭代求解。 峭度绝对值k ( y ) l 的梯度为掣竺型,把式( 3 3 ) 代入可得到完整峭度式的梯度: 了0 1 k ( y ) = y y y x 卜2 e y y * e y x 一e 抄) e y x ) i ( 3 5 ) 预处理中已经对混合信号x 进行了白化处理,所以 殛日) 一i ,并且由于k ( y ) l 是 在单位球上进行优化,所以每次运算后都要把w 除以其范数,进行归一化处理。由此可 推导出峭度最大化梯度学习算法的两步迭代公式如下: a w s g n k ( y ) a ( e y y y x ) 一2 e y y 。e y x ) 一e y y ) e y x ) ) w ( 3 6 ) _ m 丽 式中,s g n 七( y ) 1 表示峭度的符号函数,a 为学习率。 3 。1 3 基于负熵最大化的c - f a s t i c a 算法 熵( e n t r o p y ) 表示信号中所含的平均信息量。在具有相同协方差阵的概率密度函数 中高斯分布的熵最大,因此把任意概率密度函数为p ) 的随机变量和具有相同协方差的 高斯分布间的k l ( k u l l b a c k l e i b l e r ) 散度作为该随机变量非高斯程度的度量,称其为 负熵( n e g e n t r o p y ) ,用符号, p o ) 表示,其定义为1 3 2 l : m 刚= k l p 删 巾l o g i 器卜 7 ) 式中,p 0 ) 和 ) 分别是随机变量和高斯变量的概率密度函数。在信息论中,一个概 率密度函数为p ( x ) 的随机变量的熵,严格意义上应该为差分熵( d i f f e r e n t i a le n t r o p y ) , 定义为: h o ) 一一f p ( x ) l o g p ( x ) d x ( 3 8 ) 因此,把式( 3 8 ) 代入( 3 7 ) 可得出负熵的简化表示形式: j l p ( x ) i = 日觚 ) - h o ) ( 3 9 ) 式中,阿o ) 和h o ) 分别表示高斯变量和任意随机变量的差分熵,这里说差分 熵是因为它表示的并不是信号熵含量的绝对度量,而是以某值为参考标准的相对意义下 卷积语音信号盲分离的频域算法研究 的信息量。由负熵的定义式可以看出,随机变量的负熵值越大,它的非高斯性也就越强, 因此,从统计理论上来说,负熵是一个很好的度量非高斯性的量。 在复数情况下,信号分为实数和虚数部分,我们定义二变量的负熵为: j 。( y :,y :) = h ( y :。,y 乙。) 一h ( y :,y :) ( 3 1 0 ) 式中,h ( y 刍。,y 朋l 。) 表示一个复数高斯随机变量的负熵,同样地,复数高斯随机变量 也是所有具有相同协方差的二变量分布中负熵值最大的。因为高斯随机变量的负熵值是 常数,所以负熵最大化可以等价为二元差分熵h ( y :,y :) 的最小化。 i c a 中广泛应用的一个随机变量的独立性的判据为互信息。两个随机变量之间的 k l 散度定义为【3 2 j : d ( p ll ip :) = p 。o ) l o g 絮d x ( 3 1 1 ) 。p 2 五, d 为非负数,当且仅当p l ( x ) = p : ) 时d 为零。由l ( l 散度定义可知,如果p 1 ) 是多变 量y - y 。,y :,y 的联合概率密度函数,p : ) 为各分量的边缘概率密度的乘积,则式 ( 3 1 1 ) 即变为互信息的定义,记作i ( y 1 ,其值大于或等于零。当且仅当各个分量相互 独立时,l ( y ) 10 。在参考文献【3 3 】中,已论证了在复数情况下互信息,( y ) 最小化和二 变量负熵和的最大化是一致的,同时也推导出负熵最大化和另一种i c a 常用的判据极大 似然( m a x i m u ml i k e l i h o o d ,m l ) 之间的统一性。因此下面我们主要介绍两种基于负熵 最大化的复数i c a 算法:h y v a r i n e n 的c f a s t i c a 3 4 】和n o v e y 3 3 1 的c m n ( c o m p l e x m a x i m i z a t i o no fn e g e n t r o p y ,c m n ) 算法。 要利用差分熵作为代价函数需要已知或者可以估计概率密度分布函数,而这通常很 难,为了避免这种复杂的估计计算,可以用非线性函数来近似逼近负熵的值。在文献 3 5 】 中,通过稳定性分析得出,实际上任何非二次偶函数可以用来构造代价函数来估计非高 斯性最大化。根据这个结论,h y v a r i n e n 把f a s t i c a 拓展到复数信号c f a s t i c a ,采用“自 底向上 的方法,这种方法可以通过任意非线性函数的选取隐含地利用高阶统计量的信 息,计算简单。其代价函数为: m a x ,托一( w ) = e g ( i gw 日x 1 2 ) j 2 , s j e t ( i :x ) ( w 7 x ) = 6 弘 大连理工大学硕士学位论文 式中,当且仅当歹一足时,6 障- - 1 ,否则6 砖一0 ,w 是一个n 维的复数权向量,g ( 。) 为非 线性函数,如:g l ( y ) = o 1 + y ,g 2 ( y ) = l o g ( 0 1 + y ) ,g 3 ( y ) = i 1 ) ,2 等,其中g 1 ,g 2 比 g 3 变化缓慢,因而也更稳健。 在i c a 数据模型下用固定点优化算法找到代价函数e g ( 1 w h x l 2 ) 的极值点,可得 到c - f a s t i c a 的定点迭代算法如下。 w + 一昱 x ( w 日x ) 。g ( 1 w h x l 2 ) ) 一互 g ( 1 w h x l 2 ) + 1 w h x l 2g ( 1 w 日x 1 2 ) ) w w + ( 3 1 3 ) 5 同 式中,g ( ) 为非线性函数g ( ) 的一阶导数,g ( ) 为g ( ) 的二阶导数。 3 1 4 基于负熵最大化的c m n 算法 由式( 3 1 2 ) 可以看出c - f a s t i c a 的代价函数只利用了模值信息而没有保留相位信 息,因此c - f a s t i c a 算法当假设信号分布为环形时,算法速度非常快且效果很好,然而, 如果信号是非环形的,则算法分离性能下降。c m n 负熵最大化的复数i c a 算法代价函 数【3 3 】如下: j ( w ) = m h a :x 。 i g ( w q ) ( 3 “) 和c - f a s t l c a 一样,g ( ) 是非线性函数,不过这里的非线性函数利用了复数的全部信息, 包括相位和幅值。非线性函数可以是任意复解析函数,如多项式函数或超越函数等。 利用拉格朗日函数可以把在约束条件0 w 0 2 1 下的代价函数转化为: l ( i ,a ) 一j ( w ) + a ( w 日w - 1 ) ( 3 1 5 ) 式中,a 是一个实数的拉格朗日乘子。j ( w ) 为代价函数e l g ( w 日x ) 1 2 。 复数牛顿优化方法定义为: 诉- ( 嘉l ) 1 乳- l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论