(电路与系统专业论文)混合语音盲分离的研究与实现[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)混合语音盲分离的研究与实现[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)混合语音盲分离的研究与实现[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)混合语音盲分离的研究与实现[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)混合语音盲分离的研究与实现[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(电路与系统专业论文)混合语音盲分离的研究与实现[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 盲信号分离是近几十年来发展起来的一门新兴的技术学科,在理论与实际应 用中都取得了长足的发展。目i i i ,盲信号分离己经成为国内外多方关注的热点问 题之一,被广泛应用于无线通信和图像增强等方面,出现了许多热门方向,也取 得了一些良好的成果。 本文主要研究了盲信号分离在语音分离方面的应用:首先,对盲信号分离的 研究现状和发展水平进行了分析,介绍了理论上比较成熟的几种盲分离算法;其 次,详细研究了混合语音的盲分离问题。包括混合语音的可分离性;混合语音盲 分离中不同的网络结构:语音信号的时频域盲分离算法和频域盲分离的本质,并 利用f a s t l c a 算法在频域上对混合语音信号进行了分离,利用仿真试验和分析证明 其可实现性;接着,介绍了自适应滤波理论。对自适应滤波理论中的最小均方误 差算法和其收敛性进行分析,并基于此算法进行了试验仿真;最后,简单介绍了 遗传算法。改进了遗传算法在语音盲分离中的应用,避丌了传统算法收敛性不好 与收敛性受步长影响的问题,进行了仿真试验,达到了一定的效果。 关键词:盲信号分离( b s s ) ;独立分量分析( i c a ) ;混合语音;自适应滤波;遗 传算法 英文摘要 t h er e s e a r c ha n dr e a l i z a t i o no nb l i n ds e p a r a t i o no fa u d i om i x t u r e s a b s t r a o t b l i n ds o u r c es e p a r a t i o nh a sb e e no n eo ft h en e wb o o m i n gt e c h n o l o g i e so v e rt h e p a s td e c a d e s i th a sm a d eab i g s t r i d eb o t hi nt h e o r i e sa n dp r a c t i c e sa n dt h u sb e c o m e s o n eo ft h eh o ti s s u e st h a ta t t r a c tw o r l d w i d ea t t e n t i o n i ti sw i d e l yu s e di nt h ed o m a i no f w i r e l e s st e l e c o m m u n i c a t i o n sa n di m a g eb u i l d u pa n ds oo n ,i nw h i c hm a n yo r i e n t a t i o n s a n dr e a le f f e c t sh a v eb e e nm a n i f e s t e d t h i st h e s i sm a i n l yf o c u s e so nt h er e s e a r c ho f b s s a p p l i c a t i o ni na u d i os e p a r a t i o n f i r s t l y ,t h es t a t u sq u oa n dd e v e l o p m e n tl e v e lo fb s s i sa n a l y z e d ,i n c l u d i n gt h ei n t r o d u c t i o no fs e v e r a lt h e o r e t i c a l l yr i p eb l i n ds o u r c es e p a r a t i o na l g o r i t h m s e c o n d l y ,t h e t h e s i sg i v e sad e t a i l e da n a l y s i so ft h ea u d i om i x t u r e ss e p a r a t i o n ,i n c l u d i n gt h es e p a r a b i - l i t yo fa u d i om i x t u r e s ,d i f f e r e n tn e t w o r ks t r u c t u r e so fa u d i om i x t u r e ss e p a r a t i o n ,a n a l y s e sf o ra u d i o sf r e q u e n c yr a n g e sa n dt h ee s s e n c eo ff r e q u e n c yb l i n ds o u r c es e p a r a t i o n a l s o ,i nt h i ss e c t i o n ,f a s t l c ai su s e dt os e p a r a t et h ea u d i oo fd i f f e r e n tf r e q u e n c yr a n g e s t h et e s t sa n d a n a l y s e sa r ei n d u d e d t h i r d l y ,i n t r o d u c t i o no f t h es e l f - a d a p t i v ef i l t e r e d t h e o r y ,t h el m sa l g o r i t h ma n di t sc o n v e r g e n c ei sa n a l y z e d ;t h et e s t sa n da n a l y s e sa r c i n c l u d e dt o o i nt h el a s tc h a p t e r , ab r i e fi n t r o d u c t i o no fg e n e t i ca l g o r i t h mi sg i v e na n d t h et h e s i sp r o p o s e sa no p t i m i z e da n a l y s i sm o d e lf o rt h ea u d i os e p a r a t i o n t h ea n a l y s i s m o d e la v o i d st h es h o a c o m i n g so ft h et r a d i t i o n a la n a l y s i sw h i c hd on o th a v eag o o da s - t r i n g e n c ya n d t h ea s t r i n g e n c yi si n f l u e n c e db ys t e p l e n g t h k e yw o r d s :b l i n ds o u r c es e p a r a t i o n ;i n d e p e n d e n tc o m p o n e n ta n a l y s i s ;a u d i o m i x t u r e s ;a d a p t i v ef i l t e r e d ;g e n e t i ca l g o r i t h m 大连海事大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:本论文是在导师的指导下,独立进行研究工作所取得的成果, 撰写成博士硕士学位论文“遇金亟童直佥离的婴窒生塞埋”。除论文中已经注明 引用的内容外,对论文的研究做出重要贡献的个人和集体,均己在文中以明确方 式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公开发表或未 公开发表的成果。 柠舢群魏蟒膈担赢躲寿铈抛徊 论文作者签名:荨、瓢荔e 声f ;月2 乒日 学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连海事大学研究生学位论文提交、 版权使用管理办法”,同意大连海事大学保留并向国家有关部门或机构送交学位论 文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本 学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫 描等复制手段保存和汇编学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于:保密口 不保密因彳请在以上方框内打。,) :静。产霉器紫弩日期:p 年多月z 卵 混合语音盲分离的研究与实现 第1 章绪论 1 1 盲信号分离研究的背景 盲信号分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) ,也称为盲源分离,是自上世纪8 0 年代初随着神经网络的再度兴起而发展起来,目前己成为信息处理领域研究的热 点之一。 我们在信号处理中经常遇到这样的问题:一组未知随机信号,经过某一混合 系统得到一组观测信号,再从观测信号中恢复出这些原始信号。如果重构过程中 没有混合系统和原始信号的先知条件,我们就称该过程为“盲信号分离”。 人工智能是当前的一个热点研究课题,其范围涉及很广。比如,使计算机具 有和人类一样的听觉,是计算机智能领域研究者们的梦想。语音识别技术为我们 实现汁算机听觉的这一目标提供了有效途径,使得计算机能听懂我们人类的语言, 计算机操作从此变得史加互动和简单自然,方便了人机的交流。但是目前这项技 术还远未像人们想象的那么成熟,无论识别率还是识别环境都还有很大的局限性。 我们所要研究的盲信号分离问题也包括对语音信号的盲分离,虽然不能实现计算 机听觉这一目标,但是通过该技术却能使原本相互混叠的语音信号相互剥离,作 为诰音识别的预处理,从而使得噪声环境下和多说话人情形下的语音识别的实现 成为u j 能,从这种意义上束讲,该题目的研究具有很大的现实意义。而且意义不 仅限于此,高质量的语音通信、生物医学图像处理、地震信号处理都会得益于此 项技术。因此,近年来由于实际应用的需求使得盲信号分离成为了信号处理、移 动通讯和神经网络领域的研究热点。 12 盲信号分离的研究现状 任自信号分离中,“盲”指的是对源信号和混合结构无任何先知条件这一特 点。在这一特点下,根掘不同的标准可以将盲信号分离成若干类: ( 1 ) 按混合通道的个数:分为多通道信号盲分离与单通道信号盲分离。 ( 2 ) 按混合方式:分为线性混合盲分离和非线性混合盲分离;瞬时混合盲分离 第1 章绪论 和卷积混合盲分离。 ( 3 ) 按源信号种类:在通常的处理方法下,根据不同的源信号的特点有一止匕独 特的处理技术,这相当于己知源信弓的某些先知条件。 盲信号的主要任务是从观测数掘中恢复未知的源信号,为了弥补先知条件的 不足,经常假设源信号之间是相互独立的,因此分离出的信号也要尽可能的独立。 这样著名的方法独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 便常被用 于实现b s s 。i c a 方法不仅含有信号的一、二阶信息,而且利用了信号的高阶信 息。因此,l c a 方法是处理非高斯信号的一种有效手段。 目前,国际上有关盲信号分离算法的研究主要有:c o m o n 系统分析了混合信 号盲分离问题,并明确了独立分量的概念,通过对概率密度函数的高阶近似,给 出一类基于特征分解的独立分量分析方法;b e l l 和s e j n o w s k i 提出了基于l i n s k e r 的信息最大化准则( i n f o m a x ) 的算法【5 1 ;l e e 和b e l l 将基于信息最大传输的盲信 号分离算法应用于语音信号分离,语音识别率有明显提高。 虽然目前语音盲分离技术发展迅速,但在分离工作中还是存在着一些缺陷, 这也成为今后研究需要改进的方向: ( 1 ) 语音信号的分布密度函数吼 基于信息论的盲分离算法,都是在假定源信号的密度函数已知的条件下进行 的,但是由于非线性函数选择与实际信号的密度函数不一致,会导致分离效果较 差。对于足够多的采样点,我们是有可能估计出其分布函数的,但是要设计出一 种实用的自适应算法还是一个需要深入研究的课题。 ( 2 ) 全局收敛性问题嘲。 由于语音分离是一个时空域上的问题,因此存在着空间上的盲分离和时域上 的反卷积双重任务,使得算法在回响环境中很容易陷入局部最小值,从而使算法 性能下降。 ( 3 ) 说话人数目的确定。 目前。多数算法研究了麦克风数目不少于晚话人数日的情况,向对于说话人 数目未定,或是说话人数目多于麦克风数目的情况则更符合实际应用情形。 混合语音盲分离的研究与实现 ( 4 ) 混合系统是时变的。 当说话人在屋内走动时,语音混合系统就是一个时变系统,而目前算法是针 对非时变系统设计的,要得到实用的盲分离算法,必须设计出能够跟踪时变的自 适应算法。 总的束蜕,盲信号分离具有以下两种发展趋势:一是研究盲信号处理的基础 理论以及新的盲信号处理方法,这是盲信号处理发展的主流:另一种是把己有的 其他研究领域内的技术扩展到盲信号处理中来,这种则是更偏向于实际的应用。 1 3 盲信号分离的基本理论 1 3 1b s s 问题的数学描述 b s s 问题的研究对象是m 个观测信号x 。,x :x 。,这些观测信号是n 个相互 独立的未知源信号s 。,s :j 。,通过一个未知系统混合产生的。b s s 问题的研究目 的就是从这砦观测信号中恢复出各个源信号。 根掘m 年un 之i 训的人小关系,我们町以把亩源分离进行以下定义:当m = n 时, 刚阵兀个数等于源的个数,这种情形称之为“定义”( d e t e r m i n e d ) 的盲分离,可 从观测信号中恢复出源信号:当m ,n ,即阵元个数大于源的个数,这种情形称之 为“超定义”( o v e r d e t e r m i n e d ) 的盲分离,可从观测数据中估计出源的个数;当 m n 情况,我们可以用主分量分析 ( p c a ) 进行维数压缩,使得两者数目相等。源信号独立性的假设是i c a 和b s s 【作的基本前提,假设( 3 ) 是为了防止混和信号出现病态,若多于两个高斯信号, i c a 是无法将其区分的。 通常我1 f j 假设源信号和观测信号的均值为零。如果x 和s 都是随机过程,我 们假设它们是严格意义上的平稳过程,这样可以用时间平均来代替全部期望,保 证算法收敛的局部均值具有全局统计特性f 2 6 1 。 2 2i c a 基本原理与主要算法 2 2 1i c a 算法基本原理 独立分量分析主要依掘原始信号是相互独立的假设,因此,如何衡量分离信 号的独立性是首要解决的问题。首先,我们从数学角度来分析随机矢量的独立性 定义: 假定原始信号是独立分和的非高斯信号,满足下式: j 口( s ) ;n p 。( ) ( 2 5 ) 即其联合密度函数是各个分量概率密度函数之积,满足独立统计特性。如果 观测向量或输出向量彼此不独立,则我们不能在用上式的关系来表示,而要采用 它们的互信息量l ( x ) 来表达: 地卜f p ( x ) l o g 静 ( 2 6 ) 上式中信息量总为正值,并且当且仅当各个分量相互独立时为零。独立分量 分析就是寻找观测向量x 的一个线性变换,使得系统的输出信号满足下式: n y ) 。l :i 讪一) ( 2 7 ) 因此,i c a 的基本原理就是依掘互信息,负熵,非高斯性等独立性度量的准 第2 章独立分母分析的萆本概念年 t 要芹法 则来建立目标函数,使系统输出的信号的高阶相关性最小。从而达到信号分离的 目的。 2 2 2 信息论及统计理论的一些基础知识 由于b s s 和i c a 算法中的独立性或非相关性准则涉及到许多信息论及统计理 论的一些基础知识,因此介绍一些常用到的基本概念,使之在以后章节的叙述中 将不再赘述。 2 2 2 1 熵 熵( e n t r o p y ) 是对随机变量不确定性的描述,也称为平均信息量或信息量。 一个离散随机变量x ,若其可能的取值工。“= 1 , 2 ,) 有n 个,出现的概率分别为 p ( x 。) ,则其熵的定义为: 日( x ) i 一善p ( 啪g p ( x 一) 2 8 引申到一个连续随机变量x ,也有类似的熵,定义为: 日( x ) - - f p ( x ) l o g p ( x ) d x ( 2 9 ) 这里,p ( x ) 是z 的概率密度函数。严格来说,式( 2 9 ) 并不是对随机变量上 熵的绝对度量,而是以某一个值为参照的相对度量,因此我们把连续性随机变量 的熵称作“差分熵”或“微分熵”。 将熵的定义再扩展至多个( 以两个为例) 随机变量x y 时,便可得到联合熵 ( j o i n t e n t r o p y ) 及条件熵( c o n d i t i o n - e n t r o p y ) ,其定义分别为: h ( x ,y ) 一一p ( x ,y ) l o g p ( x ,y ) ( 2 1 0 ) x , y h ( x i y ) 一p ( x ,y ) l o g p ( xj y ) ( 2 1 1 ) j y 上式中p ( x ,y ) 和p ( x i y ) 分别为随机变量x ,y 的联合概率和条件概率。 混合语音盲分离的研究与实现 h ( x ,y ) 是对x ,y 联合取值的不确定性的度量。日( xl y ) 是对在y 己知的情况下x 取值的不确定性的度量。 2 2 2 2 互信息 由于事物是普遍联系的,因此,对于两个随机变量x 和y ,它们之间在某种程 度上也是相吐联系的,即它们之| 日j 存在统计依存关系,称为互信息( m u t u a l i n f o r m a t i o n ) 。这样,在已知随机变量y 的取值条件下,另一随机变量x 的不确定 程度h ( x i y ) 总是不大于x 的熵h ( x ) 的。也就是说,y 未知时,的不确定度为 h ( x ) ;y 己知时,石的不确定度变为h ( x i l ,) ,且有h ( x i y ) t l : ( 2 ) 对于所有的z ,h ( z ) 均是满秩的。 ( 3 ) h ( z ) 是因果的并且是有理式。 显然,h ( z ) 在是最小相位的情况下具有一个稳定因果的逆滤波器,即其是可 分的。 3 3 语音盲分离实现的途径 针对语音混合系统的不同性质,我们可以采用基于不同网络结构:前馈网络 或反馈网络的f i r 滤波器来实现分离系统。此外,信号处理的流程可以是在时域 或频域上进行,也可以是时频域的相结合。下面我们将对不同网络结构的适用情 况和优缺点,以及时、频域盲分离算法的各自实现特点加以讨论。 3 ,3 1 前馈结构 多数实际环境的音频卷积混合可以用一个前馈的混合网络建模,其混合系数 是f i r 滤波器。因此分离系统的设计,在理想的可逆混合系统条件假设下,也可 以用f i r 滤波器知阵的前馈网络柬实现。图3 3 给出了一个典型的t i t o 的前馈网 络结构的混合与分离系统图。 实域上的观测信号为: x l ( z ) 一a 。l ( z ) s l ( z ) + a 1 2 ( z ) s 2 ( :) 石2 ( z ) a 2 l ( z ) s l ( z ) + a 2 2 ( z ) s 2 ( z ) ( 3 1 0 ) 所以,理想解为: 2 5 - 第3 章混合语音信号分离 蹦加蓑豢锱 蹦加裂蒜糍 在前馈网络系统中分离滤波器缈作用于观测数掘x 柬产生源信号,然而,卷 积分离会产生不确定性,而且,一些分离算法由于去冗余还会带来时域上的白化 效果,从而导致分离信号失真。在前馈网络中我们实际上非常希望无需g ( z ) 一1 因子 来学习滤波器,因为所学的滤波器等同于混合滤波器,而不是它们的逆。尽管如 此,却没有一个有效的方法束实现。 3 3 2 反馈结构 对于t i t o 的2 2 情况的反馈结构的网络,有: u 。乜) 一x 。乜) 一啊2 0 ) 【,:( z ) 【,2 ( z ) t x 2 ( z ) 一矸,2 1 ( z ) 【,1 ( z ) ( 3 1 2 ) 所以,理想分离结果为: 啊2 ( z ) - a 1 2 ( z ) 4 2 2 ( z ) 。1 1 ( z ) ta 2 t 0 ) 4 。( z ) 。1 ( 3 1 3 ) 我们可以知道,直接混合通道滤波器的逆也是需要的,如果它们是最小相的 滤波器,则存在稳定的因果逆。也就是说直接通道是因果滤波器的反馈网络可以 实现混合的逆,否则我们必须用非因果滤波器或者是具有非因果的束实现混合滤 波器的逆。下面我们给出反馈网络结构示意图: 混合诰音盲分离的研究与实现 图3 4 反馈网络结构| 璺l f i g3 , 4s t r u c t u r ed i a g r a mo fb a c k w a r dn e t w o r k 对于反馈网络束说,它的参数相对较少,但是应用此有一个前提条件,即该 系统必须是最小相位的。也就是说其滤波器系数对应于最小相位系统,严格的这 样一个系统的冲击响应改是第一个系数大于所有其它系数,而且,其他的冲击响 应呈迅速递减趋势。然而,实际环境中的冲击响应很少是最小相的,即非最小相 系统。它的震荡衰减比较长,因此,用反馈系统来解决这类问题,对于人工合成 数掘是有效而且可能是比较好的选择,但是要学习出一个非最小相滤波器是困难 或不可行的。而此时,选择的馈网络结构,我们可以很好的估计出一系列的f i r 滤波器矩阵,从而:爻现冲击响应的逆。 在分离算法的研究中滤波器长度的选择是一个关键的参数,它不仅影响着算 法的分离效果,而且还是影响算法收敛速度的一个因素,滤波器越短算法的计算 量也就越小。但是一般要求必须有足够长的f i r 滤波器来实现混合系统的逆。 3 4 盲分离算法的时频域实现 目前,对于语音信号的盲分离算法有两种:一种是在时域上进行的,称为时 第3 章混合语音信号分离 域盲分离算法:相应地,另一种在频域上进行,成为频域盲分离算法。下面,我 们将对其逐一进行介绍与分析,并将频域盲分离算法作为本文介绍的土要重点。 3 4 ,1 语音信号时域盲分离算法 在汽车、室内或某些封闭的现实环境中,由于声爵反射的影响。声源信号到 达传感器时会通过不同的信道。因此,第i 个麦克风接收到的信号x ,p ) 可以用这 个声源信号通过不同高阶f i r 滤波器卷积后的混合形式来表示,即: 啪) 。善荟4 ,( f - k ) 3 1 4 这里口,表示第j 个说话人与第i 个麦克风之i 日j 通道的单位冲激相应,对于每个 语音通道都可以用一个l 阶的f i r 滤波器来表示。 上式写成矩阵的形式即为: 石( f ) 。荟a ( ) s ( t - k ) 假设臼暇) 满足荟l - ! 怕( k ) l c ,则直接给出多通道盲卷积模型: y ( t ) - p ) x ( f r ) ;( 2 ) 名( f ) ( 3 1 6 ) 其中y ( f ) 为输出矢量,w ( r ) 为分离矩阵,w ( z ) 为其z 变换,在这晕它可能为 非因果的形式,即当f t 0 时彬一) 一0 。 语音信号的时域盲分离算法即是利用瞬时混合模型的相关准则,通过最小或 最大化某一目标函数对上式中的缈扣) 在时域中直接进行求解,实现对语音信号 的分离。如最小互信息的目标函数,见公式( 2 3 0 ) 。 时域盲分离算法是瞬时混合模型算法在卷积混合模型中的直接扩展,在婶回 响或人造环境中,这类算法得到了较好的分离效果,但在现实环境下,由于空| 日j 的回响深度比理想的要深的多( 混合滤波器的系数一般上千阶) ,系统需要有太多 参数来描述,使得计算复杂度大大增加,去卷积系统参数收敛时缺乏稳定性( 分 离滤波器的系数多于1 0 0 阶时,系统参数就可能发散) ,从而无法得到理想的分离 混合诰爵盲分离的研究与实现 效果。 针对这一问题,通常采用以下两种方法加以解决:一种是基于子带分解的盲 分离算法。它是将接收到的信号首先通过分析滤波器组,对语音信号进行子带分 解,然后对子带信号进行下抽样,在各个子带内进行语音分离,对分离后的信号 进行上抽样,最后通过综合滤波器组恢复出源信号。利用子带分解技术可以将混 合滤波器的卷积系数分配到各个子带中去,从而解决了时域算法中去卷积系统参 数收敛时缺乏稳定性的问题。另外一种即是我们下面要介绍的频域盲分离算法。 34 2 语音信号频域盲分离算法 我们己经知道了混合语音信号是一种卷积混合问题,为什么我们还要研究瞬 时混合这种简单的情况呢? 这是因为语音信号本身是一种非平稳序列,因此在采 用摹于信息论方法的i c a 算法来解决源信号为语音信号的瞬时混合问题时,我们 会遇到事先假定的源密度函数与实际语音信号的概率密度函数不相符的情形,从 而导致分离算法的失效。因此,合适的非线性函数选取对于实际语音信号的盲分 离也是至关重要的一个环节。 在本节我们采用了采自于互联网的语音信号作为源信号,由计算机随机产生 的知阵作为混合矩阵,由此我们可以得到瞬时混合的混合信号,并利用f a s t l c a 算 法对其进行分离。 3 4 2 1f a s t l c a 算法 通过第二章,我们知道i c a 的应用要满足以下三个条件: ( 1 ) 传感器的数目要不少于源信号的数目,即肌乏 。 ( 2 ) 每一时刻的原始信号是彼此独立的。 ( 3 ) 原始信号是非高斯的或者最多有一个高斯( 即是正态分布) 。 由于不同的语音信号之间具有相互的独立性,并且语音具有超高斯分布的特 点,当接收信号的数目不少于语音源信号的数目时,便可满足i c a 分离的条件, 也因此语音信号的分离是i c a 的经典研究问题。 h y i r i n e n 和o j a 给出的快速定点f a s t i c a 算法【“删,训练速度快,并且不需要 第3 章混合语音信号分离 任何学习步长参数,下面我们将详细介绍f a s t l c a 算法。 f a s t l c a 算法的关键步骤就是分离阵的迭代更新,基本步骤如下: w j + 1 ) 一e 惦( h ) 1 y ”一e 诂( ( 女) y ) 扣,( 女) w , + 1 ) 一w : + 1 ) l l w ; k + 1 ) j l ( 3 1 7 ) 其中w ,为分离矩阵w 的列矢量,函数g ( ) 为任意非线性奇函数,g + ( ) 为其导 数,初始权矢量w 由随机选取产生。令g ( ) 一g ( ) ,g 为一任意的非二次函数, 收敛即可得到相应的独立分量。 f a s t l c a 盲源分离过程是一个串行输出各个独立源信号的过程,要估计,1 个独 立分量,则需要运行_ r 1 次基本f a s t l c a 算法,并且在进行每个独立分量提取莳,为 了防止收敛相同,每次迭代后都要对输出w ? y ,w :t y ,一y 进行去相关,从而将分离 矩阵正交归一化,然后再进行相应的提取,这样最后得到的分离矩阵是正交矩阵。 过程中每分离出一个独立分量,就要从观测信号中减去这一分量,如此反复,直 至分离出所有的独立分量。 f a s t l c a 分离中,合适的函数g 可以使估计结果更好,由于二语音佑号只有超高 斯分布的特点,通常情况下,g 和g 可以选择下面的函数: c ( u ) 一一l e x p ( 一a n2 2 ) ( 3 1 8 ) 口 g ( u ) - u e x p ( 一a u2 2 ) ( 3 1 9 ) 通常情况下,a 一1 。 迭代过程采用g r a m s c h m i d t 标准币交化方法进行去相关,假设已经估计出了 w 1 ,2 ,w p ,则运行基本的f a s t l c a 算法得到川,然后令: w ,“- w ,“一羹w l , c 。z 。, w ,+ ,一w ,+ 。w :。,+ 。 ( 3 2 1 ) 这样依次求出h ,w :,w n ,从而得到各个独玄语音源信号,实现语音分离。 混合语音亩分离的研究与实现 3 4 2 2 试验仿真与分析 我们以两组语音信号,即典型的t i t o 为例。两组语音信号均来自于互联网, 记作语音信号a ( 真实声音为钢琴弹奏声) 和语音信号b ( 真实声音为小号演奏声) , 两组声音的长度均为9 0 7 s ,采样频率均为2 2 0 5 0 h z 。 下面,我们给出f a s t l c a 算法流程,其步骤如下: ( 1 ) 先将观测数据进行预处理,包括:中心化和白化处理。这样做有利于改善 算法的收敛特性。 观测信号的中心化有下式确定: x = x m e a n ( x ) ( 3 2 2 ) 其中m e a n ( i ) 为求向量或矩阵均值的函数。 ( 2 ) 选择仟意下交阵作为初值w o ,设胃最大迭代次数f ,本次试验中i = 1 0 0 0 。 ( 3 ) 利用式( 3 2 0 ) 、( 3 2 1 ) 依次求出h 。 ( 4 ) 对分离矩阵w 进行数据正交化。 ( 5 ) 如果w 不收敛,返回到步骤( 4 ) ,重复上面计算步骤,直到达到稳态为止。 我们利用m a t l a b 仿真软件进行仿真,混合矩阵如式( 3 2 3 ) 所示,由计算机 随机生成: 瞄嗣 慨z 。, 第3 章混合语音信号分离 原始信号如下: 混合信号如下: 墅3 5 原始的语音信号 f i g3 5o r i g i n a la u d i os i g n a l s 漫台信号 。i 。j 1 1 1 。i li ! 址iii 。l - _ 7 。f 丌两丌r 图3 6 混合后的语音信号 f i g3 6a u d i om i x t u r e ss i g n a l 3 2 混合语音盲分离的研究与实现 分离信号如下 图3 7 分离后的语音信号 f i g3 7a u d i os i g n a l sa f t e rs e p a r a t i o nb a s e do nf a s t l c a 分离丽后的语音信号a 图3 8 分离前后的语音信号a f i g3 8a u d i os i n g a la b e f o r ea n da f t e rs e p a r a t i o nb yf a s t i c a 3 3 第3 章混合诰音信号分离 分离前后的语音信号b : 图3 9 分离前后的语音信号b f i g3 9a u d i os i n g a lbb e f o r ea n da f t e rs e p a r a t i o nb yf a s t l c a 从试验结果来看,分离后的语音信号基本上保持了原始语音信号的波形,在 听觉上也进行了很好的分离,基本上没有失真效果。因此,说明了混合语音信号 的可分离性。 3 5 小结 本章详细研究了混合语音的盲分离问题。包括混合语音的可分离性、混合语 音盲分离不同的网络结构和实现途径、语音信号的时频域盲分离算法等。最后运 用f a s t l c a 算法在频域上对混合语音信号进行了盲分离,通过仿真试验,取得了王甲 想的分离效果。 混合语音盲分离的研究与实现 第4 章基于l m s 算法的自适应滤波的语音消噪 任f j 实助、蚪境p 的诰旨都是含自噪音的,因此,有效的进行语音消噪是进行 混合语音分离的i j 期步骤之一。本章我们首先将简单介绍自适应滤波理论 4 6 4 9 1 ; 其次介绍自适应滤波理论中的一种重要算法一最小均方误差算法( l ,m s 算法) , 对算法和其收敛性进行分析。 4 1 自适应滤波理论概述 早在2 0 世纪4 0 年代,科学上对平稳随机信号就建立了维纳滤波理论。根据 有用信号和干扰噪声的统计特性( 自相关函数和功率谱) ,以线性最小均方误差估 计准则所设计的最佳滤波器,称为维纳滤波器。这种滤波器能最大程度地滤掉干 扰噪声,提取有用信号。但是,当输入信号的统计特性偏离设计条件,则它就不 再是最佳的了。这在实际应用中受到了限制。到6 0 年代初,由于空间技术的发展, 出现了卡尔曼滤波理论,即利用状态变量模型对非平稳、多输入多输出随机序列 做最优估计。现在,卡尔曼滤波器已成功地应用到许多领域,它既可对平稳、也 可对非平稳的随机信号做线性最佳滤波,或者是非线性滤波。实质上,维纳滤波 器是卡尔曼滤波器的一个特例。 在设计号尔曼滤波器时,必须知道产生输入过程的系统的状态方程和测量方 程,即要求对信号和噪声的统计特性有先验知识。但在实际上,往往难以预知这 些统计特性,因此,实现不了真正的最佳滤波。 1 9 6 7 年,w i d r o w b 等人提出的自适应滤波理论,可使自适应滤波系统的参数 自动地调整而达到最佳状况,而且在设计时,只需要很少的或根本不需要任何关 于信号与噪声的先验统计知识。这种滤波器的实现差不多像维纳滤波器那样简单, 而滤波性能几乎如卡尔曼滤波器一样好。因此,近几年来,自适应滤波理论和方 法得到了迅速发展。 在未知统计特性环境下,要处理观测信号或数据,获得所期望结果时,若利 用自适应波器往往可以获得令人满意的解,其性能远超过用通用方法设计的固定 3 5 第4 章基丁l m s 算法的白适府滤波的语音消噪 参数的滤波器。自适应滤波器是这样的处理器,它在统计特性未知或统计特件变 化时,能够调整自己的参数,以满足某种最佳准则的要求,当输入信号的统计特 性未知时,自适应滤波器调整自己参数的过程称为“学习”过程;而当输入过程 的统计特性变化时自适应滤波器调整自己参数的过程称为“跟踪”过程。 自适应滤波器由参数可调的数字滤波器和自适应算法两部分组成,数字滤波 器既可以是f l r 数字滤波器也可以是f i r 数字滤波器。在维纳滤波器理沦发明的早 期,人们使用i l k 滤波器。但是,现在更多的人使用f i r 滤波器。一个f i r 滤波 器是固有稳定的,因为它的结构只包含正向通路。换句话说,在f i r 滤波器中, 输入一输出交互作用的机理只有一个,即通过正向通路从滤波器输入到滤波器输 出。正是这种信号传输形式,限制了f i r 滤波器的脉冲响应是有限域的。另一方 面,i i r 滤波器同时兼有前馈通路和反馈通路。反馈通路的存在,意味着滤波器输 出的一部分有可能返回到输入端。显而易见,除非通过特别设计,滤波器内部反 馈可能产生不稳定,导致滤波器震荡。当滤波嚣为自适应时,本身就有不稳定的 问题,如果再组合i i r 滤波器的不稳定问题,事情将变得更为复杂,史难处珲。根 据这个理由,在自适应滤波器应用中,一般采用f i r 滤波器。 实际上自适应滤波器是一种能够自动调节本身参数的特殊维纳滤波器,在设 计时不需要事先知道关于输入信号和噪声的统计特性的知识,它能够在自己的上 作过程中逐渐“了解”或估计出所需要的统计特性,并以此为根据自动调整自己 的参数,以达到最佳滤波效果。一旦输入信号的统计特性发生变化,它又能够跟 踪这种变化,自动调整参数,使滤波器性能重新达到最佳。 4 。2 最小均方误差算法及其收敛性分析 4 2 1 最小均方误差算法介绍 在自适应滤波器发展初期,使用的最频繁的算法是最陡下降法。它是一种不 用矩阵求解j 下规方程的方法。它通过递推方式寻求加权矢量的最佳值。最陡f 降 算法不需要知道误差特性曲面的先验知识,其算法就能收敛到最佳维纳解,且与 起始条件无关。但是最陡下降算法的主要限制是它需要准确测得每次迭代的梯度 矢量,这妨碍了它的应用。为了减少计算复杂度和缩短自适应收敛时i 日j ,许多学 混合语音盲分离的研究与实现 者对这方面的新算法进行研究。1 9 6 0 年,美国斯坦福大学的w i d r o wb 等便提出了 最小均方误差( l m s ) 算法 l m s 算法是一种很有用且很简单的估计梯度的方法,这种算法自提出后很快 得到广泛的应用。它的突出优点是计算量小,易于实现。只要自适应滤波器每次 迭代运算叫都知道输入信号和参考响应,那么,选用l m s 算法就是很合适的。 l m s 算法最核心的思想是用均方误差代替平方误差,即梯度矢量用下式来近 似: 奇o ) 。v p :o ) 。扫( f ) v k o ) 】 ( 4 1 ) 其中: v ( e ( f ) 】一v k ( 女) 一w 1 似h ) j 一一z ) ( 4 2 ) 因此,l m s 算法最终可表示为: w o + 1 ) - w q ) + i 1 h 【- 寺o ) - - w o ) + v e ( t ) x ( t ) ( 4 3 ) 从上式我们可以看出,l m s 算法实际上是在每次迭代中使用很粗略的梯度估 计值寺( f ) 柬代替精确值v ( f ) 。不难预计,滤波系数矢量w o ) 的调整路径不可能准 确地沿着理想的最陡下降的路径,因而滤波系数的调整过程是有噪声的。或者说 w ( t ) 小再足确定性函数确变成了随机变量。l m s 算法调整滤波系数不需要进行平 方和统计平均运算,因而实现起来很简单。下一时刻滤波系数矢量w ( t + 1 ) 等于当 前滤波系数矢量w ( t ) 加上一个修正量,该修正量等于误差信e ( t ) 的加权值,加权 系数为蜮( f ) 。它j 下比于当前的输入信号。对权矢量的所有分量来说,误差信号p o ) 是相同的。 我们定义工( f ) 、) ,( f ) 分别为输入、输出信号矢量,d o ) 为期望信号矢量,且 符合下列关系式: y ( t ) 一w 1 0 ) z ( f ) ( 4 4 ) e ( t ) - d ( t ) 一y ( t ) ( 4 5 ) 我们将式( 4 4 ) 、( 4 5 ) 都带入( 4 3 ) 中,得到: 3 7 第4 章基于l m s 算法的白适府滤波的诰音消口j ;6 w ( f + 1 ) - w p ) + t 球( f ) k o ) 一w ( f 弦( f ) j - 0 一v x ( t ) x 7 ( f ) - o ) + 织o ) d p ) ( 4 6 ) 由式( 4 6 ) 我们便得到自适应l m s 算法的信号流程图,如下图。这是个 具有反馈形式的模型: 图4 1 自适府l m s 算法的信号流种| 璺| f i g4 1s i g n a ls c h e m a t i cd i a g r a mo fa d a p t i v el m s 自适应l m s 算法简单,它既不要计算输入信号的相关函数,又不要求矩阵的 逆,因而得到了广泛的应用。但是值得注意的是,由于l m s 算法采用梯度矢量的 瞬时估计,使得它有较大的方差,以致不能获得最优滤波性能。 4 2 2l m $ 算法自适应收敛性分析 自适应滤波器系数矢量的起始值w ( o ) 是仔意的常数,应用l m s 筲法调节滤波 系数具有随机性而使系数矢量州f ) 带柬非平稳过程通常为了简化l m s 算法的统 计分析,往往假设算法连续迭代之间存在以下的充分条件: ( 1 ) 每个输入信号矢量工o ) 与其过去全部信号矢量x ( k ) ,k - 0 ,1 ,l - l 是相互 独立的,不相关的,即有: 混合诰音盲分离的研究与实现 e x ( t ) x 7 ) j 1 0( 4 7 ) 其中:k = 0 ,1 ,t 一1 ( 2 ) 每个输入信号矢量x ( f ) 与全部过去的期望信号矢量d ( k ) ,k = 0 ,1 ,t l 也 是柏0 独、7 的,卜相关的,即有: e k ( f m ( t ) 】。0 ( 4 8 ) 其中:k = 0 ,l ,t 一1 ( 3 ) 期望信号矢量d ( t ) 依赖于输入信号矢量x o ) ,但全部过去的期望信号是相 互独立的。 ( 4 ) 输入信号矢量工o ) 与期望信号矢量d ( f ) 都包含着全部t 的共同的高斯分布 随机变量。 通常,我们将基于上述基本假设的l m s 算法的统计分析称为独立理论 ( g n d e p e n d e n c et h e o r y , g t ) 。 由式( 4 6 ) 可知,自适应滤波器在f + 1 时刻的滤波系数矢i w ( t + 1 1 依赖于下 囱j 个输入: ( 1 ) 输入过程中全部的过去信号矢量:x ( k ) k = 0 ,1 ,t l ( 2 ) 期型信号中全部的过去信号矢量:d ( k 1k = o ,1 ,t 一1 ( 3 ) 滤波系数矢量的起始值w ( o ) 。 从上述基本假设( 1 ) 和( 2 ) 的观点来看,我们可发现滤波系数矢量w ( f + 1 ) 是 与工o + 1 ) 和d o + 1 ) 独立无关的。当然,有许多实际问题对输入过程与期望信号并 小满足上述基本假设。尽管如此,l m s 算法的实践经验证明,在有足够的关于自 适应过程结构信息的条件下,基于这些假设所分析的结果仍可当作可靠的目标函 数,即使在某些问题上还要依赖于数据样本。 为了分析问题,我们定义尺为输入信号矢量z o ) 的相关矩阵,而p 为输入信号 矢量石( f ) 与期望信号矢量d ( f ) 的互相关矩阵,且r 为可逆矩阵,则当: w o - 月。尸 ( 4 9 ) 3 9 笙! 童苎! 坐! 蔓堡塑旦堕翌鲨垫堕堡堂塑堂 一 我们称此解为维纳解,称为目标函数的最佳滤波系数。 因此,我们可以得到系数误差矢量a w ( t 、为: a w ( t ) 一w ( t ) 一w o ( 4 1 0 ) 我们将式( 4 1 0 ) 代入式( 4 6 ) ,得到: 呻+ 1 ) - 【,一v x ( t ) x 7 ( f ) i w ( f ) + 以f ) + 懈。矽o ) - l ,一w c ( t ) x 7 ( t ) b w ( t ) + w o + ”k ( f ) d ( f ) 一x ( t ) x 7 0 ) w 。j ( 4 1 1 ) 从式( 4 1 1 ) 中我们可以看出,如将移至等式左边

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论