(信号与信息处理专业论文)带噪混叠语音信号盲分离方法研究.pdf_第1页
(信号与信息处理专业论文)带噪混叠语音信号盲分离方法研究.pdf_第2页
(信号与信息处理专业论文)带噪混叠语音信号盲分离方法研究.pdf_第3页
(信号与信息处理专业论文)带噪混叠语音信号盲分离方法研究.pdf_第4页
(信号与信息处理专业论文)带噪混叠语音信号盲分离方法研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(信号与信息处理专业论文)带噪混叠语音信号盲分离方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者签名:l 辨 日 期:逝 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:嶙导师签名: 山东大学硕士学位论文 中文摘要 竞争说话者的干扰是语音通信过程中一种常见的干扰情况。人类的听觉 系统可以在多个讲话者的环境中区分和跟踪自己感兴趣的语音信号,并分辨 出自己所需要的声音,这种分辨能力是人体内部语音理解机理所特有的一种 感知能力,也就是人类的语音分离的能力,称为“鸡尾酒会效应”。 在语音和听觉信号处理领域中,如何从多个说话者的混叠语音信号中分 离出各个语音源信号或提取出人们感兴趣的耳标语音,来模仿人类的语音分 离能力,成为一个重要的研究问题。这也是稳健( r o b u s t ) 语音信号处理中 的一个重要研究方向,对语音识别、语音增强等都有着非常积极的促进意义。 目前的混叠语音分离大多是建立在无噪环境中的混叠情形下,主要以盲 源分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) 和计算声场景分析( c o m p u t a t i o n a l a u d i t o r ys c e n e a n a l y s i s ,c a s a ) 两类方法为主,前者是根据信号的统计特 性从几个观测信号中恢复出未知的独立源成分;后者则是利用人耳的听觉感 知要素从混叠语音中分离出感兴趣的目标语音。通常为了研究方便,这些算 法都不考虑环境噪卢的影响。然而,在实际语音通信中,不可避免会受到周 围环境噪声的影响,因此寻找有效的带噪混叠语音分离方法具有非常重要的 理论价值和实际意义。 带噪混叠语音包含了多个说话者和环境噪声,其分离较为困难。目前, 一些学者正致力于带噪盲源分离算法的研究,但总体研究成果不多;而噪声 环境中的感知要素检测困难使计算声场景分析方法受到一定的局限性。国内 外现有的关于带噪混叠语音分离的研究成果非常少。 独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) ,是在研究盲源 分离过程中出现的一种新兴的盲分离技术,自其出现便成为信号处理、数值 分析、统计及神经网络等领域中的热点研究问题,并在语音处理、生物医学 信号处理、模式识别、特征提取、数据压缩、图像处理和电子通讯等方面获 得了非常广泛的应用。目前已有不少学者提出了多种有效的i c a 算法,但 是这些i c a 算法大多都不考虑环境噪声的影响,在解决无噪或低噪情况下 的混叠语音分离时具有非常优越的分离性能,但是当环境噪声较大时分离效 山东大学硕士学位论文 i i i i _ - _ i _ l _ l _ l l - _ _ _ - _ _ _ i l l _ l l i i _ - - - - l 果则不好。 本论文主要结合i c a 技术,将语音去噪作为一个预处理过程,对带噪 声的混叠语音盲分离进行了研究,提出了两种有效的解决方案: 方案一:基于小波变换和i c a 的带噪混叠语音盲分离 小波变换是一种具有多分辨率分析特点的时频分析方法,用它可以较好 的进行信号去噪。在该方案中,我们首先采用小波变换对各个带噪混叠语音 进行消噪处理,然后用i c a 算法对消噪后的混叠语音进行分离,最后根据 分离信号的特点,进一步提出对其进行矢量归一和再消噪处理,最终得到各 个语音源信号的估计。 计算机仿真结果取得了很好的分离效果。 方案二:基于稀疏编码和i c a 的带噪混叠语音盲分离 稀疏编码作为一种稀疏神经元网络表征可以有效的用于去除噪声,这种 稀疏表征可以借助于i c a 特征提取来得到,实际也就是语音数据的特征基 函数。由于稀疏编码去噪主要利用语音数据的特征基来进行消噪处理,因此 它对语音信号的破坏较小,较小波消噪来讲,对带噪语音的增强效果更好。 我们因此进一步提出了基于稀疏编码和i c a 的盲分离方案。在该方案中, 首先采用稀疏编码去噪技术对带噪观测混叠语音分别进行预消噪处理,然后 再利用i c a 盲分离算法对稀疏编码去噪后的混叠语音进行分离,从而得到 各个语音源信号的估计。 计算机仿真结果表明这两种方案具有很好的分离效果,并且同方案一相 比,方案二有着更加优越的分离性能。 另外,在保证观测信号的数目不少于源信号数目的情况下,本文所提方 案均可推广至三个及三个以上说话者的带噪混叠语音盲分离。 但是应该指出的是,混叠语音信号的盲分离研究中仍然存在着许多尚未 解决的问题。论文最后我们对本课题的研究进行了总结和展望。 关键词:带噪混叠语音;语音分离;独立分量分析;小波变换:稀疏编码 2 山东大学硕士学位论文 _ 一i i _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ a b s t r a c t t h ed i s t u r b a n c ef r o mc o m p e t i n gs p e a k e r si sav e r yc o m m o nd i s t u r b i n g s i t u a t i o ni n s p e e c hc o m m u n i c a t i o n t h eh u m a nb e i n g sa c o u s t i c a ls y s t e mc a l l d i s t i n g u i s ha n df o l l o wt h ei n t e r e s t e ds p e e c hs i g n a li ns e v e r a ls p e a k e r s s i t u a t i o n , a n dt e l la p a r tt h es p e e c ht h a th ew a n t s t h i sa b i l i t yo fd i s t i n g u i s h i n gi sas p e c i a l a p p e r c e p t i o nc a p a c i t yo ft h es p e e c hc o m p r e h e n s i o nm e c h a n i s mi nt h eh u m a n b o d y , t h a ti s ,p e o p l e h a v et h e s p e e c hs e p a r a t i o na b i l i t y , a n d i t sc a l l e d “c o c k t a i l - p a r t yp r o b l e m ” i nt h es p e e c ha n da c o u s t i c a ls i g n a lp r o c e s s i n ga r e a , h o wt oi m i t a t eh u m a n s s p e e c hs e p a r a t i o na b i l i t ya n ds e p a r a t eo re x t r a c tt h eo r i g i n a lo ri n t e r e s t e ds p e e c h f r o mt h eo b s e r v e ds p e e c hm i x t u r e s ,h a sb e c o m ea ni m p o r t a n tp r o b l e m t h i si s a l s oas i g n i f i c a n tr e s e a r c hd i r e c t i o ni nr o b u s ts p e e c hs i g n a lp r o c e s s i n g ,a n di t h a sv e r ya c t i v es i g n i f i c a t i o nt os p e e c hr e c o g n i t i o na n d s p e e c he n h a n c e m e n t p r e s e n ts p e e c hs e p a r a t i o nm e t h o d sa r em o s t l yb u i l to nt h es p e e c hm i x i n gi n t h en o i s e - f r e es i t u a t i o n ,a n da r ep r i m a r i l yc l a s s i f i e di nt w ol a r g ec a t e g o r i e s : b l i n ds o u r c es e p a r a t i o n ( b s s ) a n dc o m p u t a t i o n a la u d i t o r ys c e n ea n a l y s i s ( c a s a ) b s si s t or e c o v e rt h eu n k n o w ni n d e p e n d e n ts o u r c e sf r o ms e v e r a l o b s e r v e dm i x e ds i g n a l sa c c o r d i n gt ot h es i g n a l ss t a t i s t i c a lc h a r a c t e r i s t i c ;w h i l e c a s ai st oe x t r a c tt h ei n t e r e s t e do b j e c t i v es p e e c hf r o mt h es p e e c hm i x t u r eb y u s eo fa c o u s t i c a la p p e r c e p t i o ne l e m e n t s g e n e r a l l y ,t os i m p l i f yt h er e s e a r c h w o r k ,t h e s em e t h o d sm o s t l yc o n c e n t r a t eo nt h en o i s e - f r e es i t u a t i o n s h o w e v e r , i nt h er e a l s p e e c hc o m m u n i c a t i o n s ,s p e e c hs i g n a l sc a ni n e v i t a b l yb ei n t e r f e r e d b yt h eb a c k g r o u n dn o i s e s oi ti so fg r e a tv a l u ea n ds i g n i f i c a n c et o r e s o l v e p r o b l e mo fs p e e c hs e p a r a t i o ni nt h en o i s ye n v i r o n m e n t n o i s ys p e e c hm i x t u r e si n v o l v en o to n l yt h es p e e c h e so fd i f f e r e n tp e o p l e b u ta l s ot h eb a c k g r o u n dn o i s e ,s oi ti sv e r yd i f f i c u l tt o s e p a r a t et h eo r i g i n a l s p e e c h e s p r e s e n t l ys o m es c h o l a r sa r ed e v o t i n gt h e m s e l v e st ot h er e s e a r c ho f n o i s yb s sa l g o r i t h m s ,b u tt h ea c h i e v e m e n ti sl i t t l e t h ed i f f i c u l t yi no b t a i n i n g 3 山东大学硕士学位论文 i i i _ _ _ _ _ _ _ _ j _ _ _ _ _ _ _ _ _ _ _ _ t h ea c o u s t i c a la p p e r c e p t i o ne l e m e n t si nn o i s ye n v i r o n m e n ti sa no b s t a c l et ot h e i m p l e m e n t a t i o no fc a s am e t h o d g e n e r a l l ys p e a k i n g ,t h e r ea r ef e wr e s e a r c h a c h i e v e m e n t si nn o i s ys p e e c hs e p a r a t i o nd o m e s t i c l ya n da b r o a d i n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) i san e wb l i n ds e p a r a t i o nt e c h n i q u e w h i c ha p p e a r sd u r i n gt h er e s e a r c ho fb s s s i n c ei t sa p p e a r a n c e ,i c ah a s b e c o m eah o tt o p i ci ns i g n a lp r o c e s s i n g ,d a t aa n a l y s i s ,s t a t i s t i c sa n dn e u r a l n e t w o r k s ,e t c a n di th a sb e e nw i d e l yu s e di ns p e e c hp r o c e s s i n g ,b i o m e d i c a l s i g n a lp r o c e s s i n g ,p a t t e r nr e c o g n i t i o n ,f e a t u r ee x t r a c t i o n ,d a t ac o m p r e s s i o n , i m a g ep r o c e s s i n g ,a n dt e l e c o m m u n i c a t i o n s ,e t c p r e s e n t l y , t h e r eh a v eb e e n s e v e r a li c aa l g o r i t h m sg i v e nb ys o m es c h o l a r s ,h o w e v e r ,m o s to ft h e s ei c a a l g o r i t h m si g n o r et h ei n f l u e n c eo ft h eb a c k g r o u n dn o i s e ,s ot h e ys e p a r a t e s p e e c h e sw e l lw h e nt h e r ei s l i t t l eo rn on o i s ew h i l eb a d l yw h e nt h e r ei sm u c h n o i s e i nt h i sd i s s e r t a t i o n ,w em a k er e s e a r c ho nb l i n ds p e e c hs e p a r a t i o ni nn o i s y e n v i r o n m e n ta n dp r e s e n tt w ov a l i dr e s o l v i n gm e t h o d sm a i n l yb a s e do nt h ei c a t e c h n i q u e : 。f i r s tm e t h o d :b l i n d s e p a r a t i o n o fn o i s ys p e e c hm i x t u r e sb a s e do n w a v e l e tt r a n s f o 啪a n di c a w a v e l e tt r a n s f o r mi sav e r yg o o dt i m e - f r e q u e n c ya n a l y s i sa p p r o a c hw i t h m u l t i r e s o l u t i o nc h a r a c t e ra n di tc a nb eu s e dt od e - n o i s e i nt h i sm e t h o d w e f i r s t l yd e n o i s et h en o i s ym i x t u r e sw i t hw a v e l e tt r a n s f o r mr e a s o n a b l y ;t h e nu s e t h ei c aa l g o r i t h mt og e tt h ed e - n o i s e dm i x t u r e ss e p a r a t e d ;f u r t h e r m o r e ,w e c a r r yo u tt h ep o s tp r o c e s s i n gi n c l u d i n gt h en o r m a l i z a t i o na n dp o s td c - n o i s i n go f t h es e p a r a t e ds i g n a l s a f t e rt h i sw eg e tt h ef i n a le s t i m a t e ds p e e c hs o u r c e s c o m p u t e rs i m u l a t i o nr e s u l t se x h i b i tv e r yg o o ds e p a r a t i n gp e r f o r m a n c e s e c o n dm e t h o d :b l i n ds e p a r a t i o no fn o i s ys p e e c hm i x t u r e sb a s e do n s p a r s ec o d i n ga n di c a 、 s p a r s ec o d i n g ,a sas p a r s en e u r a ln e t w o r kr e p r e s e n t a t i o n ,c a nb eu s e dt o d e - n o i s ev a l i d l y s u c has p a r s er e p r e s e n t a t i o nc a nb eo b t a i n e db yi c af e a t u r e e x t r a c t i o n ,w h i c ha c t u a l l yr e f e r st ot h eb a s i sf u n c t i o n so fs p e e c hs i g n a l b e c a u s e 4 山东大学硕士学位论文 _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 一i t h es p a r s ec o d es h r i n k a g et e c h n i q u em a i n l yu t i l i z e ss t a t i s t i c a lc h a r a c t e ro ft h e s p e e c hd a t at h e m s e l v e s ,s oi td e s t r o y st h es p e e c hn o tt h a tm u c h c o m p a r e dw i t h w a v e l e td e n o i s i n g ,i th a sb e t t e rs p e e c he n h a n c e m e n te f f e c t w es of u r t h e r l y p r o p o s et h en o i s yb l i n ds p e e c hs e p a r a t i o nb a s e do ns p a r s ec o d i n ga n di c a i n t h i sm e t h o d ,w ef i r m l ym a k et h eo b s e r v e dm i x t u r e sp r e - d e n o i s e dw i t hs p a r s e c o d es h r i n k a g e ;t h e nu s e t h ei c aa l g o r i t h mt o g e tt h ed e - n o i s e dm i x t u r e s s e p a r a t e d ,s ow eo b t a i nt h ee s t i m a t i o n so f t h es p e e c hs o u r c e s ,c o m p u t e rs i m u l a t i o nr e s u l t se x h i b i tah i g hl e v e lo fs e p a r a t i n ge f f e c t a n d c o m p a r e dw i t ht h ef i r s tm e t h o db a s e do nw a v e l e tt r a n s f o r ma n di c a ,t h es e c o n d o n eh a se v e nb e t t e rs e p a r a t i n gp e r f o r m a n c e i na d d i t i o n ,o nc o n d i t i o nt h a tt h en u m b e ro ft h eo b s e r v a t i o n si sn o tl e s s t h a nt h a to ft h es o u r c e s ,t h ep r o p o s dm e t h o d si nt h ed i s s e r t a t i o nc a nb e g e n e r a l i z e dt om i x t u r e so f t h r e e o rm o r es p e a k e r s b u tw h a tw es h o u l dp o i n to u ti st h a tt h e r ea r es t i l lm a n yi s s u e su n r e s o l v e d i nt h eb l i n ds e p a r a t i o no fs p e e c hm i x t u r e s a tt h el a s to ft h i sd i s s e r t a t i o n ,t h e f u t u r er e s e a r c hd i r e c t i o n so f t h i st h e s i sa r es u m m a r i z e da n dp r o s p e c t e d k e yw o r d s :n o i s ys p e e c hm i x t u r e s ;s p e e c hs e p a r a t i o n ;i n d e p e n d e n tc o m p o n e n t a n a l y s i s ( i c a ) ;w a v e l e tt r a n s f o r m ;s p a r s ec o d i n g 山东大学硕士学位论文 符号说明 变量命名规则: 标量值一斜体 向量u 小写字母正黑体 矩阵a 大写字母正黑体 下标序列号,用来区分不同的变量。 上标 “ ” 变量的估计版本,例如;表示原始语音的估计; “r ” 矩阵或向量的转置; “日”矩阵或向量的共轭转置: 。” 变量的复共轭。 特别说明:在第二章对i c a 的介绍中,为表示普遍性,以向量s 表示源 信号,以标量s 1s :,表示s 的各个独立的分量;第三章中我们依然用 s = h ,s :, 来表示源信号:而第四章中,为了区别表示不同意义的符号i 我们改用b = 6 l ,b :,九 来表示源信号,这在文中亦有说明 运算符和一般函数: 烈) 烈) 日( ) ( ) k u r t ( ) d 嘣) h c u m 。( ) 圳0 d i a g ( - ) s i g n ( - ) 6 概率分布或概率密度函数 准则函数 计算随机变量的熵 计算随机变量各分量的互信息 计算随机变量的峭度 计算矩阵的行列式 绝对值符号 累积量函数,下标聆表示阶数 求矩阵或向量的2 范数 对角矩阵 符号函数 山东大学硕士学位论文 一般变量: 源语音信号 观测语音信号 分离或恢复源语音 噪声向量 训练语音 混叠矩阵 分离矩阵 特征基函数矩阵 某种未知参数向量 i单位阵 t 白化阵 v酉矩阵 ,7 或 步长因子 a系数 g任意非二次函数 g ( )g 0 的导数 g ,09 0 的导数 缩略名词索引: b s sb l i n ds o u r c es e p a r a t i o n盲源分离 c a s a c o m p u t a t i o n a la u d i t o r ys c e n ea n a l y s i s 计算声场景分析 b db l i n dd e c o n v o l u t i o n盲反卷积 i c a i n d e p e n d e n tc o m p o n e n ta n a l y s i s 独立分量分析 p c a p r i n c i p l ec o m p o n e n ta n a l y s i s 主成分分析 j a d ej o i n ta p p r o x i m a t ed i a g o n a l i z a t i o n联合近似对角化 o fe i g e n - m a t f i c e s m em a x i m u me n t r o p y最大熵 m l e m a x i m u ml i k e l i h o o de s t i m a t i o n最大似然估计 m m im i n i m u mm u t u a li n f o r m a t i o n最小互信息 e m e x p e c t a t i o nm a x i m i z i n g 期望最大化 w tw a v e l e tt r a n s f o r m小波变换 s c s s p a r s ec o d es h r i n k a g e 稀疏编码去噪 s n r s i g n a lt on o i s er a t i o 信噪比 r m s er o o tm e a ns q u a r ee r r o r均方根误差 7 或 r 旷 s x 一” n z a w w o 山东大学硕士学位论文 第一章绪论 1 1 课题的研究背景和意义 竞争说话者的干扰是语音通信过程中一种常见的干扰情况。人耳可以在 两人以上讲话环境中分辨出所需要的声音,这种分辨能力是人体内部语音理 解机理系统特有的一种感知能力,它来源于人的双耳效应和人类语音中包含 的声纹特征。通常情况下语音经双耳输入,人们根据两路输入的不同时延特 性进行分离:同时由于人的发音器官构造的差异,每个人都有自身独特的声 纹,人耳也可以借助于声纹对信号进行分离。即人具有语音分离的能力,人 类的这种分离语音的能力称为“鸡尾酒会效应”【1 捌。多说话者语音干扰的 产生及人耳进行语音分离和增强接收的过程如图1 1 所示。 其他讲话者 嘲 图1 1 多说话者语音干扰的产生及语音分离和增强接收示意图 者 在语音和听觉信号处理领域中,一个重要的问题就是如何从多个说话者 的混叠语音信号中分离出各个语音源信号或提取出人们感兴趣的目标语音, 也即如何使用语音分离算法来模仿人类这种分离语音的能力,这是稳健 ( r o b u s t ) 语音信号处理中的一个重要研究方向,在语音识别、语音增强等 方面都有着非常积极的意义。 目前。国内外在混叠语音分离方面的研究工作大多集中在不考虑噪声影 0 山东大学硕士学位论文 响的混叠语音分离问题上,并且主要以盲信号分离( b l i n ds o u r c es e p a r a t i o n , b s s ) 3 - s 和计算声场景分析( c o m p u t a t i o n a l a u d i t o r y s c e n e a n a l y s i s ,c a s a ) 6 - s 两类方法为主9 。1 0 j : 1 ) 盲信号分离方法 盲信号分离所要解决的问题是如何从传感器接收到的混合观测信号中 恢复出相互独立的各个源信号。所谓“盲”有两重含义:一是指除了源信号 之间的相互独立性外,并不知道任何有关源信号及传输信道的先验知识;二 是指源信号如何混叠是未知的。现在所指的盲源分离通常是对观测到的源信 号的线性瞬时混叠信号进行分离。当考虑到时间延迟的情况下,观测到的信 号是源信号和传输通道的卷积,对卷积混叠信号进行盲分离通常称为盲反卷 积( b l i n dd e c o n v o l u t i o n ,b d ) 。 2 ) 计算声场景分析方法 计算声场景分析则是利用入耳的听觉感知要素从混叠语音中分离出感 兴趣的目标语音,其基本思想是:首先将混叠语音信号分解为一系列的感知 要素,如基音、谐波等,然后将这些感知要素按照声源的不同进行分组,形 成可以对某路信号进行感知的“听觉流”,最后利用来自同一声源的感知要 素重新合成或重建语音信号。 以上已有的b s s 和c a s a 的研究成果一般都是建立在无噪环境中的混 叠语音分离基础上的,很少考虑环境噪声的影响。也即,已有的b s s 算法 大多都是针对的无噪的盲分离模型,c a s a 的研究也是针对纯净的语音环境 中的混合语音基音检测、分组和重构。 然而,在实际语音通信中,语音信号不可避免会受到外界环境噪声的干 扰,一旦待识别的混叠语音中存在噪声和干扰,已有的b s s 和c a s a 的语 音分离效果就会受到影响。因此,寻找有效的带噪混叠语音分离方法具有非 常重要的理论价值和实际意义。 独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 是在研究盲源 分离问题的过程中出现的一种新兴盲分离技术【l l 1 2 l ,近年来已成为信号处 理、数值分析、统计及神经网络领域中的热点研究问题,并在语音处理、生 物医学信号处理、模式识别、特征提取、数据压缩、图像处理和电子通讯等 方面获得了非常广泛的应用1 1 , 1 3 - 1 5 1 。i c a 算法分离性能非常优越,对于无噪 9 山东大学硕士学位论文 或低噪情况下的混叠语音具有非常高的可分离性,算法的稳定性也较高,并 且它不受语音信号的基音和谐波等卢音特征的影响。 本论文将主要结合i c a 技术进行带噪声的混叠语音盲分离研究。 1 2 独立分量分析 独立分量分析( i c a ) 是指在输入源信号和传输信道参数均未知时,根 据输入源信号的统计特性,仅由观测信号恢复出源信号的各个独立成分的过 程【1 2 1 。一般来讲,人们对独立分量分析和盲源分离不加区分。但实际上, 盲源分离是一个更广义的概念。独立分量分析只是在研究盲源分离过程中出 现的一种统计信号处理方法,是解决盲源分离问题的一个最广泛、有效的工 具,盲源分离问题的解决一般都建立在独立分量分析理论之上。 较早进行盲源分离方法研究的是法国的h e i t 和j u t t e n i l6 j ,他们于1 9 9 1 年提出了一种类神经盲源分离方法( h j 算法) 。紧接着,t o n g 和l i u l l 分 析了盲源分离问题的可分离性和不确定性,指出了由于源和混叠参数的未 知,分离出的信号存在幅度和排列次序两种不确定性。一般来讲,这两个不 确定性是可以接受的。1 9 9 3 年,c a r d o s o 1 8 l 提出了基于高阶统计的联合对角 化盲源分离方法,并成功应用于波束形成。1 9 9 4 年,c o m o n b 9 1 系统地分析 了瞬时混迭信号盲源分离问题,并明确了独立分量分析的概念。1 9 9 5 年, s e j n o w s k i 和b e l l l 2 0 j 基于信息理论,针对线性系统得出一种最大信息传输的 准则函数,并由此导出一种自适应盲源分离和盲反卷积方法( 1 n f o m a x 算法) 。 1 9 9 6 年,a m a r i 和c i c h o c k i l 2 1 】基于信息理论中概率密度的g r a m - c h a r l i e r 展 开,利用最小互信息( m i n i m u mm u t u a li n f o r m a t i o n ,m m i ) 准则函数,得 出一类前馈网络的训练算法。1 9 9 7 年,h y v 1 f i n e n 2 2 1 基于源信号的非高斯性 测度( 仅指峭度) ,给出了一类定点训练算法( f i x e d - p o i n t ) ,该算法可以提 取单个具有正或负峭度的源信号。于1 9 9 9 年,h y v l r i n e n 进一步基于近似负 熵准则给出了一种新的i c a 算法,并保留定点迭代这个名字,称为f a s t i c a 算法【2 3 1 。f a s t l c a 算法具有非常突出的优点,其计算简单,收敛速度快,不 需要任何步长参数。并且迭代稳定,占用内存小,另外还可以通过非线性函 数的合适选取来找到最优解,因此自其出现后便被广泛用于各种盲源分离应 1 0 山东大学硕士学位论文 用之中另外还有s t o n e 基于时间预测给出的盲分离算法f 2 4 1 及p e a r l m u t t e r 基于信息理论给出的最大似然估计( m a x i m u ml i k e l i h o o de s t i m a t i o n ,m l e ) 算法【2 5 l 等等。 与此同时,人们对盲反卷积方法也进行了研究。p l a t t 和f a g g i n 2 6 】将h - j 算法推广到具有时间延迟和卷积混迭的情况y e l l i n 和w e n s t e n 2 7 1 给出了基 于高阶累计量和高阶谱多通道盲反卷积方法。t h i 和j u t t e n 2 8 1 利用四阶累积 量或四阶矩函数,给出了卷积信号盲分离自适应的训练方法t o k k o l a l 2 9 , 3 0 1 将i n f o m a x 算法推广到具有时间延迟的源的混迭或卷积混迭信号的盲分离。 l e e 和b e l l t 3 1 1 将基于信息最大传输或最大似然算法得出的盲源分离训练算 法变换到频率域,并利用f i r 多项式代数技术进行盲反卷积。 对于非线性混叠信号的盲源分离问题,较早涉及的是b u r e l 3 2 】,后来 p a r r a ,p a j u n e n ,y a n g ,t a l e b 等人也相应给出了基于梯度下降算法、自组织 映射网络方法、特定非线性盲分离算法思想以及后非线性盲分离算法f 3 ”5 1 国内凌燮亭和何振亚【3 7 枷1 较早地注意了盲信号处理研究。凌燮引3 6 】 利用反馈式神经网络根据h e b b i a n 的学习算法,实现了近场情况下一般信号 的盲分离。何振亚f 3 7 - 4 0 提出了一系列新的基于高阶统计和信息理论的判据和 算法,在盲系统参数估计和盲波束形成等方面取得许多很好的研究成果胡 光锐f 4 1 1 、张贤达等人也开展了盲分离问题的研究。 随着研究者对i c a 越来越多的关注,盲源分离理论研究及其应用取得 了许多进展从1 9 9 9 年到2 0 0 4 年间,关于i c a 的理论和应用专题的国际 学术会议先后在法国、芬兰、美国、日本和西班牙召开。在信号处理界的权 威刊物i e e et r a n s a c t i o ns i g n a lp r o c e s s i n g 以及s i g n a lp r o c e s s i n g 中盲信号处 理的文章也频繁出现。当前国际上对于盲源分离问题研究的主要机构和学者 有:美国的s a l ki n s t i t u t e s 神经生物学计算实验室的s e j n o w s k i 和b e l l ,日本 学者a m a r i 以及c i c h o w s k i ,芬兰赫尔辛基的学者h y v i r i n e n 和o j a ,法国的 学者c o m o n 和c a r d o s o 等【4 2 。4 5 1 。 由于存在噪声的语音分离是困难的,已有的独立分量分析方法大都没有 考虑噪声的影响,有关i c a 的应用也都停留在无噪声的理想情形下,因此 对于实际环境中不可避免会受到噪卢影响的混叠语音盲分离问题,仅仅依靠 i c a 技术尚不能解决。 山东大学硕士学位论文 1 3 带噪混叠语音盲分离 带噪混叠语音不仅包含了多个说话者的声音,而且还要考虑环境噪声的 影响。这种环境噪声包括从周围环境、传输媒质中引入的噪声、电气设备的 噪声等等。通常,这些噪声会影响语音信号的质量,破坏语音信号原有的声 学特征,也因此会削弱不同语音之间的差别,使语音的可懂度降低。严重的 情况下甚至会将语音信号完全淹没在噪声中,无法分辨。不考虑噪声影响的 混叠语音分离就是一个比较棘手的问题,当考虑噪声的影响时,多个说话者 的声音被环境噪声淹没,这种情形下要想实现混叠语音信号的分离,提取出 各个源语音是非常困难的。 就盲信号分离方法而言,目前来讲,已有不少学者提出了一些有效的无 噪盲源分离算法,而对于带噪盲源分离算法,近年来一些学者也开始了这方 面的研究,有人提出把带噪声混叠看作一种非线性,利用非线性方法来处理 带噪混叠信号盲分离。m o u l i n e s 和c a r d o s o 利用逼近最大似然方法进行带噪 声混叠信号的盲源分离和盲反卷积,其中用处理不完全数据的期望最大化 ( e x p e c t a t i o nm a x i m i z i n g ,e m ) 方法作为主要数学工具1 4 6 】。h y v i r i n e n 指 出,在混叠过程中存在噪声意味着观测数据和源信号的关系存在非线性,他 们采用独立成分和混合矩阵的联合最大似然估计方法,用某种去噪操作来近 似观测信号和各独立分量之间的非线性【4 7 1 。但是由于盲信号处理中存在太 多的未知条件,直接利用盲分离算法来实现带噪声的混叠信号分离非常困 难,总的来讲,关于带噪声的盲分离算法的研究成果比较少l l i ”j 。 对于计算声场景分析方法而言,由于基音和谐波信息是最能反映语音特 征的感知元素,因此这种方法中最关键的问题就是要从存在有多个不同的基 音和谐波的混叠语音信号中提取各个源语音信号的基音,即多基音检测问 题。对于单个语音的情形,已有一系列成熟的基音检测方法,并取得了很好 的检测成果。但是,在混叠语音中要分别检测出各个说话者的基音是非常困 难的。因此计算声场景分析方法首先受基本的多基音检测问题的困扰非常 大计算声场景分析方法的概念是由九十年代中期英国学者b r o w ngj 和 c o o k em 提出来的【6 】。1 9 9 9 年,d a ne l l i s ( b e r k e l e yc a ) 综合分析了计算 声场景分析中的重重团难所在【4 耵,如基音检测、声场景描述、数学模型等 山东大学硕士学位论文 难题的影响。国内对于计算声场景分析方法的研究仅处于起步阶段,赵鹤鸣 在2 0 0 2 年展开了计算声场景分析在混合语音分离中的应用研究,并有相应 的成果发表1 8 4 9 删,但这些研究成果都是针对的多基音检测问题。总之,纯 净环境中的多基音检测问题还处于亟待解决,尚

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论