(信号与信息处理专业论文)实际语音盲分离的客观评价方法的研究.pdf_第1页
(信号与信息处理专业论文)实际语音盲分离的客观评价方法的研究.pdf_第2页
(信号与信息处理专业论文)实际语音盲分离的客观评价方法的研究.pdf_第3页
(信号与信息处理专业论文)实际语音盲分离的客观评价方法的研究.pdf_第4页
(信号与信息处理专业论文)实际语音盲分离的客观评价方法的研究.pdf_第5页
已阅读5页,还剩73页未读 继续免费阅读

(信号与信息处理专业论文)实际语音盲分离的客观评价方法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上海大学硕士学位论文 实际语音盲分离客观评价方法的研究 摘要 盲分离是当今语音信号处理领域的新热点,可以在源信号和信道没有任何先 验知识的情况下,通过观测到的几个信号来恢复出未知语音源,而使用一般的语 音增强和降噪方法进行分离则比较困难。如何比较盲分离算法性能优劣,将有效 促进算法的进一步发展,因此盲分离的评价方法有重要意义。传统的语音盲分离 评价方法主要有基于混合矩阵和基于信号的两大模型。随着语音盲分离技术的不 断实用化,传统的评价指标因为依赖于已知源信号或信道等先验知识,所以不符 合实际信号采集模型,而仅利用人耳判断分离效果也不能客观的评价盲分离算法 性能。目前的研究中,尚没有公认的适用于实际语音盲分离的客观评价指标。 本论文对盲分离算法的评价方法进行了系统的研究,重点分析了当源信号和 混合信道等先验知识未知时,混合语音盲分离的评价问题,并提出了一些新的观 点和算法,具有一定的研究意义和实际应用价值。论文的主要工作和创新点如下: l 、提出了基于极大似然的独立性检测方法:利用独立分量分析的假设,通过 比较各次计算的目标函数收敛值的大小,检测由初值选取、核函数学习算法等因 素造成性能差异。该方法适用于仅含观测信号的采集环境,摆脱了传统评价方法 对先验知识的依赖,具有一定的创新性; 2 、提出了基于听觉感知模型的评价方法:建立了同步比较模型,并将入耳听 觉对语音特征的感知和模式识别引入该模型,设计出了基于美尔倒谱系数的高斯 混合模型的指标和基于时域信号相关性的指标。在此基础上,提出了听觉独立 性联合指标。该指标分别从听觉感知域和信号独立性角度客观评价语音盲分离的 性能,具有一定创新性; 3 、改进了语音盲分离的可靠性算法:修正了b o o t s t r a p 样本生成范围的方法, 并结合基于组平均距离策略的分级聚类,改进了独立分量分析的可靠性算法,获 得了更精确的参数,并分析了混合维度、运算精度和可靠性的关系,具有一定创 新性; 4 、为了验证以上评价方法的有效性,本文首先分析了盲分离性能指标的基本 理论,并对盲分离基本评价模型的多种评价算法进行了仿真实验。在独立性检测 第1 页 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 方面,以基于极大似然估计为例,对不同算法进行实验比较,分析了精度与独立 性之间的关系;在听觉感知方面:通过实验仿真,将听觉一独立性指标应用于瞬 时混合和真实混合的盲分离评价,客观的量化了人耳对语音盲分离的听觉感知; 对于可靠性分析方面:在三种不同混合维度上,进行了多次的实验仿真,分析了 混合维度、运算精度和可靠性的关系。 关键词:实际语音盲分离,独立分量分析,性能评价,可靠性分析,听觉感知域, b o o t s t r a p 算法 第1 i 页 上海大学硕士学位论文 实际语音盲分离客观评价方法的研究 a b s t r a c t s p e e c hs i g n a l sb l i n ds e p a r a t i o ni sap r o m i s i n gs i g n a lp r o c e s s i n gt e c h n o l o g y , w h i c h c o n s i s t so fr e c o v e r i n gu n o b s e r v e ds o l n - c e sf r o ms e v e r a lo b s e r v e ds i g n a l sw i t h o u tp r i o r k n o w l e d g eo f s o u r c e so rc h a n n e l s t h ep e r f o r m a n c ee v a l u a t i o nf o rs p e e c hs i g n a lb l i n d s e p a r a t i o ni su s u a l l yb a s e do nt w om o d e l s :m i x e dm a t r i xo rs o u r c es i g n a l s t h e r e f o r e , t h e s ep e r f o r m a n c ee v a l u a t i o n sc o u l d n tm a t c ht h em o d e li nr e a le n v i r o n m e n t i nt h e o t h e rh a n d ,i ti sn o ts a t i s f i e dw i t ho n l ys u b j e c t i v ee v a l u a t i o nb yh u m a nb e i n g s t h e r ei s n or e a s o n a b l es e p a r a t i o np e r f o r m a n c ei n d e xr e c o g n i z e dy e ti nr e a le n v i r o n m e n t i nt h i sp a p e r , t h ep e r f o r m a n c ee v a l u a t i o ni ss y s t e m i c a l l ys t u d i e d s o m en o v e l v i e w sa n da r i t h m e t i ca r ep r o p o s e dw i t hc e r t a i nr e f e r e n c e da n dp r a c t i c a lm e a n i n gm a i n l y a i m i n ga ts p e e c hs i g n a l sb l i n ds e p a r a t i o nw i t h o u tp r i o rk n o w l e d g eo fs o u r c e so r c h a n n e l s t h em a i na c h i e v e m e n t so f t h i sd i s s e r t a t i o na r ep u tf o r w a r d : 1 t h ei n d e p e n d e n c ed e t e c t i o nb a s e do nt h em a x i m u ml i k e l i h o o di sp r o p o s e d :r e l y o nt h ec o n c e p to fc o n t r a s tf u n c t i o no fi c a ,t h ea p p l i c a t i o nf i e l do ft h ep e r f o r m a n c e e v a l u a t i o na r ee x t e n d e dt ot h es i t u a t i o nw i t h o u tp r i o rk n o w l e d g e t h ed i f f e r e n c eo f p e r f o r m a n c ec a u s e db ys t o c h a s t i ci n i t i a lp o i n t ,k e r n e r lf u n c t i o na n dd i f f e r e n tg r a d i e n t a l g o r i t h mc o u l db ed e t e c t e d ; 2 ,an e we v a l u a t i o nb a s e do nt h ee a rm e c h a n i s ma n di n d e p e n d e n c em e a s u r ei s p r o p o s e d :t h es i g n a lc o r r e l a t i o ni si n c o r p o r a t e di n t ot h em f c c - b a s e dg m mt o e v a l u a t et h es e p a r a t i o np e r f o r m a n c e s p e e c hs o u r c es i g n a l si su n n e c e s s a r yi nt h i s e v a l u a t i o n ; 3 t h ei m p r o v i n gb o o t s t r a p ,as t a t i s t i cc o n c l u d i n gt e c h n i q u e ,i si n t r o d u c e d ,w h i c h c a ne n h a n c et h er a n g eo fb o o t s t r a ps a m p l ea n da c h i e v em o r ep r e c i s e r e l i a b i l i t y p e r f o r m a n c ep a r a m e t e ro fi c a e s t i m a t i o nf o rs p e e c hs i g n a l s ; 4 t h ep e r f o r m a n c ee v a l u a t i o nm e t h o d sa b o v ea r es i m u l a t e d t h er e s u l t so f e x p e r i m e n tv e i l f yt h ea l g o r t h i m k e y w o r d s :s p e e c hs i g n a l sb l i n ds e p a r a t i o n , p e r f o r m a n c ee v a l u a t i o n , i n d e p e n d e n t 第1 i i 页 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 c o m p o n e n ta n a l y s i s ,p e r c e p t i o nd o m a i n , b o o t s t r a p 第1 v 页 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作。除 了文中特别加以标注和致谢的地方外,论文中不包含其他入已发表或 撰写过的研究成果。参与同一工作的其他同志对本研究所做的任何贡 献均已在论文中作了明确的说明并表示了谢意。 本论文使用授权说明 本人完全了解上海大学有关保留、使用学位论文的规定,即:学 校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可 以公布论文的全部或部分内容。 ( 保密的论文在解密后应遵守此规定) 签名:删导师签名:! 军鱼丝:日期: 上海大学硕士学位论文 实际语音盲分离客观评价方法的研究 第一章绪论 i 1 语音盲分离客观评价的起源和背景 随着科技和社会的不断进步和发展,语音通信已经成为人们生活不可或缺的 一部分,而且人们对语音的依赖性不断增加、对语音质量的要求越来越高。目前 国内外关于获得纯净语音的方法主要是语音增强和麦克风阵列,目前大多数消噪 的算法都假设噪声是加性平稳的。但实际情况并非如此,同时使用者不仅要受到 有色非平稳的环境噪声的影响,还要受到其他讲话者语音的干扰。由于各语音信 号频谱特征相近、声压量级相当,使用一般的语音增强和降噪方法难以从混合语 音中提取所需的原始语音信号。因此提取出高质量的语音信号十分困难。盲信号 分离( b l i n ds i g n a l ss e p e r a t i o n ,b s s ) 是信号处理的一种新技术f i 】,对源信号和信 道没有任何先验知识的情况下,从观测到的几个信号中来恢复出未知的源信号, 有效的解决了语音信号处理领域中传统方法不能处理的难题。由于盲分离问题受 到了越来越广泛的关注,盲信号处理是成为了二十世纪最后十年中迅速发展起来 的一个研究领域,应用范围非常广泛,已成为信号处理学界和神经网络学界共同 感兴趣的热点研究课题,具有非常重要的实用价值【2 1 。 b s s 的主要任务就是在源信号和传输通道参数未知的情况下,根据输入源信 号的统计特性,仅从观测到的混合信号中恢复出源信号。在b s s 的求解过程中常 假定源信号是相互统计独立的,因此分离出来的信号也要尽可能的相互独立。独 立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 方法可以很好地解决b s s 问 题,从数学的角度来看,i c a 是一种对多变量数据的非正交的线性变换方法,其 主要目的就是确定一个线性变换矩阵,使得变换后的输出分量尽可能统计上独立。 语音盲分离方法能从混合语音信号中提取原始语音信号,是解决这一问题的很好 方法,其最经典的应用就是“鸡尾酒会”问题【3 1 。 在“鸡尾酒会”问题中,在个麦克风记录的个声音源中,通常仅仅希望 得到其中感兴趣的一个声音源,而把其它的声音源视为噪声。如果仅一个麦克风, 我们可以用普通的去噪声方法来去噪声,例如:线性滤波,小波或稀疏码收缩方 法。当然,这种去噪声的方法不是很令人满意。我们能利用多个麦克风来收集更 第1 页 上海大学硕士学位论文实际语音言分离客观评价方法的研究 多的数据,以便更有效的去噪声。因为在现场麦克风的位置是任意的,而且混合 过程也未知,为此必须实行盲估计,采用的方法就是盲分离。 研发混合语音盲信号分离系统具有很强的应用背景,可以使语音系统处理最 接近原始语音的信号,从而提高性能和效率。因此,研发混合语音盲分离系统不 仅在理论研究方面具有较高的价值,而且在应用方面也具有巨大的经济效益和社 会效益。 随着语音信号盲分离技术的不断发展,研究者已经不能满足于用人耳听觉对 分离效果的主观判断。如何在没有源信号或信道信息的条件下,仅通过观测信号, 客观评价实际语音盲分离也成为了重要的研究内容。本文的工作就是研究在实际 环境中语音盲分离的评价方法。 目前的研究中,并没有公认的适用于实际语音盲分离的客观评价指标。几乎 所有的盲分离算法评价指标仅针对计算机混合,并分为两种评价模型:基于混合 矩阵的评价方式和基于信号的评价方式。这两种模型都需要先验知识,前者需要 信道混合的参数,后者需要信号源的完整信息。但是仅在计算机模拟实验时保留 源信号或信道信息,当完成分离算法后,通过比较分离信号与源信号或全局矩阵 与广义单位矩阵的其相似程度得到盲分离有效性指标。 语音盲分离算法已经在语音的计算机混合领域中取得了巨大成就,并正向实 际应用方向发展。但是实际语音盲分离并不含有信号源或信道的先验知识,因此 计算机混合使用的盲分离指标不能用于实际语音盲分离。也正是没有客观的实际 语音盲分离指标,通常只能通过人耳主观判断,无法客观定量的比较不同的算法 性能的优劣,阻碍了实际语音盲分离算法的发展。到目前为止,尚未有公认的用 于评价实际语音盲分离的性能指标。 1 2 盲分离指标的研究现状 随着语音盲分离在迅速的发展,令如何判断语音盲分离效果的评价方法也成 为了盲分离的重要研究对象。但在盲分离的算法得到广泛的关注并掀起了的研究 热潮的情况下,盲分离的评价指标却始终没有较大进展,其方法主要是以基于混 合矩阵的评价模型和基于信号的评价模型为基础。 第2 页 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 在基于混合矩阵的评价模型方面,ec o m o n 在1 9 9 4 年发表了i c a 发展史上的里 程碑的论文中,使用了系统矩阵与对角阵之间的误差作为盲分离的性能指标【3 】,奠 定了基于其中基于混合矩阵的评价模型。此后的研究利用该模型的变换形式,提 出了一些评价方法,如y i n o u y e 和s o h n o 在1 9 9 8 年发表的论文中使用了多通道符 号间干扰作为评价方法【4 j 。w h a c h e m 和ed e s b o u v r i e s 和el o u b a t o n 在2 0 0 2 年发表 的论文中使用了实际混合矩阵与分离矩阵的逆阵之间的范数误差作为评价指标【5 】。 c j u t t e n 在2 0 0 2 年发表的论文中使用了系统矩阵与广义交换矩阵之间的距离1 6 1 。在 国内的盲分离研究中,东南大学的何振亚等在1 9 9 8 年发表的文章中使用了行元素 优势指标【7 ,羽。杭州电子工业学院的徐明彪和朱维彰发现源信号各分量的能量差别 较大时,即便信号恢复效果较好,如果对应的源信号分量的幅值太小,仍有可能 被其它分量淹没。在他们2 0 0 2 年发表的文章中,改进了行元素优势指标【9 】。 基于混合矩阵的评价模型的核心是:在排除盲分离的幅度不确定性和次序不 确定性的影响下,计算分离矩阵和实际混合矩阵的乘积与单位矩阵之间的距离。 其差异越小,则分离效果越佳。在先验的确定了混合矩阵,而源信号未知情况下, 可以采用这种评价准则。但如果混合矩阵不能确定,而已知源信号时,就采用基 于信号的评价模型。 在基于信号的评价模型方面,常常利用信号处理中最基本的误差统计方法作 为评价指标,如输出信号的均方误差和信噪比【1 0 1 1 , 1 2 l 。前者统计源信号与分离信 号绝对误差,后者计算源信号与分离信号的相对误差,误差越小,盲分离算法的 性能越佳。ec o m o n 在1 9 9 4 年发表的文章中系统的分析了i c a 的幅度不确定性和次 序不确定性【3 1 。1 9 9 6 年,a c i c h o c k i 和r u n b e h a u e n 在论文中进一步指出,大多数 情况下恢复信号各分量的波形是重要的,幅值并不重要,因为信号的波形中已经 包含了信号的绝大部分相关信息【”】。所以语音净化算法并不要求包含对源信号能 量的估计。实践中也常常忽略其具体幅值的接近程度,计算源信号与分离信号在 时域或频域的相关系数,以线性相关性取代信噪比,评价算法的性能【1 4 1 。2 0 0 2 年, 国内杭州电子工业学院的徐明彪和朱维彰,为使信噪比指标能直接应用于对信号 能量未作估计的情况,提出了基于尺度恢复的信噪比,也消除了幅度不确定性的 影响【w 。 基于信号的评价模型的核心是:在排除盲分离的幅度不确定性和次序不确定 第3 页 上海大学硕士学位论文 实际语音肓分离客观评价方法的研究 性的影响下,通过分离信号与己知的源信号进行比较,计算分离信号和源信号的 相似度,并以相似读来评价盲分离算法的性能。其差异越小,则分离效果越佳。 当在先验的确定了源信号,而混合矩阵未知情况下,可以采用这种评价准则。但 如果源信号不能确定,而已知分离矩阵时,应采用基于混合矩阵的评价模型。 此外,还有将估计信号和混合参数直接通过图形给出衡量性能的方法”,。 1 3 实际语音盲分离评价方法的研究意义 由于作为计算机混合和真实情况下的信号混合的不同的产生方式,所以它们 之间的评价标准也有所不同。计算机混合与真实混合的区别在于,计算机混合, 由于基于验证算法,所以拥有源信号s ( f ) 或混合矩阵w 信息;而实际混合情况下, 只能含有混合后的观测信号( 混合信号) 和分离后的信号,不含有源信号s ( f ) 或混 合矩阵w 。 前面所介绍的语音盲分离的评价模型基本上分为两大原理:一、基于输入信 号与输出信号差异的评价。二、基于全局矩阵与单位矩阵差异的评价模型。这两 大类的盲信号分离的测试指标都是基于计算机混合的,均需要源信号或信道的先 验知识才能进行性能评价。传统的评价模型基于输入输出的评价范畴,是一 种误差度量。这类指标利用真实信号或信道信息作为标准模板,比较估计信号或 信道信息与标准模板的失真大小。但实际采集环境中,研究者只能得到观测信号, 以上评价模型在盲分离的实际应用中失效,使得如何评价语音盲分离成为了很长 时间困扰语音盲分离算法发展的阻碍。 因此,我们需要针对只含有混合信号的条件下,评价盲分离的性能。否则研 究者只能通过语音信号的主观判别对盲分离效果进行判断,难以对语音盲分离算 法有客观可度量的评价,影响研究者对分离算法的研究有效性的比较。如果需要 进一步研究盲分离算法,必须先有在无源信号条件下的评价分离有效性能指标。 但到目前为止,尚未有公认的用于评价实际语音盲分离的性能指标,因此本论文 的研究课题具有重要的意义和价值。 第4 页 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 1 4 论文的主要工作及结构安排 本论文的研究工作得到了上海市科委应用技术开发项目“混合语音信号净化 处理系统的研制”资助,主要研究在无源信号或信道信息的条件下,实际语音盲 分离方法的客观评价方法。 针对无法通过比较分离信号与源信号的相近程度来评价盲分离效果的问题, 本论文从盲信号的独立性、人耳听觉感知域模型和盲分离算法的可靠性进行了研 究,提出了实际语音盲分离性能的评价指标。其中包含有独立性测量,符合人耳 听觉效果的测量和可靠性测量。摆脱了实际盲分离环境中研究者不能获取源信号 或信道信息的局限。在考虑盲分离算法的同时,也将语音信号的特性和人耳听觉 感知域引入了客观评价方法中。通过有效、客观、定量的评价语音盲分离的性能, 达到判断盲分离算法性能优劣的目的,促使盲分离算法不断发展。 本论文的主要工作和创新点在于; l 、分析了盲分离性能指标的基本理论,简单的回顾和总结传统的评价方法, 由此归纳了盲分离的基本评价模型,对基于矩阵评价模型和基于信号评价模型的 多种算法进行了仿真实验: 2 、提出了基于极大似然的独立性检测方法,能适用于仅含观测信号的采集环 境:利用独立分量分析的假设,通过比较各次计算的目标函数收敛值的大小来检 测由初值选取、核函数和学习算法等因素造成性能差异。该方法适用于仅含观测 信号的采集环境,摆脱了传统评价方法对先验知识的依赖,具有一定的创新性。 通过进行实验验证,结果令人满意; 3 、提出了基于听觉感知模型的评价方法:建立了同步比较( s y n c h r o n o u s c o m p a r e ,s c ) 的框架,并将人耳听觉对语音特征的感知和模式识别引入该模型, 设计出了基于美尔倒谱系数的高斯混合模型的指标( m f c cg m ms y n c h r o n o u s c o m p a r e ,m g s c ) 和基于时域信号相关性的指标( t i m ed o m a i nc o r r e l a t i o n s y n c h r o n o u sc o m p a r e ,t d c s c ) 。在此基础上,提出了听觉独立性联合指标 ( e a r - i n d e p e n d e n tu n i o ni n d e x ,e i u i ) 。该指标分别从听觉感知域和信号独立性角度 客观评价语音盲分离的性能,具有一定创新性。通过对瞬时和实际混合进行了仿 第5 页 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 真比较,并针对仿真结果进行了分析; 4 、改进了语音盲分离可靠性的算法:基于传统的b o o t s t r a p 方法【l7 1 的i c a 可 靠性指标不合理,修正了b o o t s t r a p 样本生成范围的方法,并结合基于组平均距离 ( u p g m a ) 策略的分级聚类,改进了可靠性算法,并分析了混合维度、运算精度和 可靠性的关系,具有一定创新性。通过实验仿真验证,获得满意结果。 本论文的内容组织如下: 第一章分析了盲分离在语音信号的应用和优点,说明了客观评价实际语音盲分 离的意义和团难。并概述了国内外盲分离的客观评价的起源、研究历史、现状和 具体模型以及局限性,最后介绍了本论文的主要工作和章节安排; 第二章首先对i c a 的基本理论进行了简要分析,并详细介绍了基于混合矩阵 和基于信号的评价模型,并分析了其各种评价指标间的优劣,最后进行了实验仿 真; 第三章研究了无源信号或信道信息条件下,独立性原理的意义。通过分析目 标函数与盲分离有效性的关系以及研究利用i c a 的目标函数作为盲分离的性能指 标的可行性和适用范围,建立了根据基于独立性检测的i c a 的分离性能指标,并 以最大似然估计的目标函数的方法为例进行实验验证,取得较好结果; 第四章提出了基于同步比较的盲分离指标的测量方法。分别比较信号间的特 征参数在混合阶段的接近度和在分离阶段的接近度,计算接近度在两个阶段的变 化量。根据信号独立性提出了基于时域信号相关性同步比较的指标;根据入耳听 觉感知域提出了美尔倒谱系数为特征参数的高斯混合模型同步比较指标的。在此 基础上,建立了听觉独立性联合指标,从信号角度和听觉角度客观的评价实际语 音盲分离的性能; 第五章分析了由目标函数初值选取和信号样本统计规律引起的误差,这些问 题造成盲信号分离每次结果间的随机差掣1 8 - 9 1 。通过对b o o t s 缸- a p 样本生成范围的 拓展,提出了一种改进的i c a 算法可靠性的指标,建立了盲分离聚类质量指标 乞( q ) 和最优层次指标磊。最后在三种不同混合维度上,进行了多次的实验,并 给出数据,分析了混合维度、运算精度和可靠性的关系: 第6 页 上海大学硕士学位论文 实际语音盲分离客观评价方法的研究 第六章对本论文的工作进行了总结、创新点分析并对未来研究工作所进行了 展望。 基于本文的研究成果,已经完成了实际语音信号盲分离的性能指标和基 于b o o t s t r a p 方法的独立分量分析可靠性研究两篇学术论文,并分别被电声技 术和电子测量技术录用。 第7 页 上海丈学硕士学位论文实际语音盲分离客观评价方法的研究 第二章语音信号盲分离的评价分析 混合语音信号经过盲分离的算法处理后得到主语音信号的估计序列,其中盲 分离的一般方法是i c a 算法。语音盲分离传统的评价模型是基于信号的方式或基 于混合矩阵的方式。这些方法均需要获得信号源或信道等先验知识。本章首先介 绍了线性i c a 的数学模型、理论基础,然后通过分析盲信号分离的性能指标特点 和评价方法,研究语音盲分离的效果和纯净度。 2 1i c a 的理论分析 一个系统的输入信号、输出信号和系统特征这三者之间有着固定的相互联系。 只要其中任意两者为己知,相应的就能求出第三者。然而在很多实际情况中,我 们往往只能观测到输出数据,仅从观测到的信号中恢复所有的原始独立分量,这 一过程称为盲信号处理。盲信号处理是信号处理技术的一种,它要解决的是仅仅 依靠输出信号去重现整个传输系统的问题。该技术主要应用在接收信号y ( k ) 是由 一个未知输a x ( k ) 通过一个未知系统t - l ( k ) 所产生的情况下。“盲”是指信号源信息 和传输信道的信息是事先未知的,即在盲信号处理算法中不能利用这些信息。 图2 1 是一个盲系统的方框简图。其中x ( k ) 是输入信号,y ( k ) 是输出信号,而 t l ( k ) 则是系统传输函数。当整个系统是线性时不变( l t i ) 时,系统输出为 y ( | j ) = x ( | i ) h ( 七) + n ( | i ) 图2 1 输入和传输函数均为未知的系统 其中表示卷积,n ( k ) 代表噪声。 第8 页 ( 2 1 ) 上海大学硕士学位论文 实际语音盲分离客观评价方法的研究 2 1 1i c a 的基本模型 线性瞬时混合i c a 的基本模型可以用图2 2 来表示。假设存在个独立的源 信号,表示成矢量形式,s = b ( f ) ,屯( f ) ,如( f ) 】7 ,其中上标t 表示向量的转置, t = 0 , i ,2 ,以及肘个观测信号x ( 0 = k ( f ) ,x 2 ( t ) ,h o ) 】t 。这m 个观测信号是 由个源信号线性瞬时混合而成的,即在每个时刻t 都有如下关系式: 写成向量矩阵的形式: x i ( t ) - - x n f s j ( f ) i = 1 , 2 ,m ( 2 2 ) x ( f ) = a s ( t ) ( 2 3 ) 其中a 是由混合系数 口) 组成的混合矩阵,源信号s ( 0 和混合矩阵a 都是未知的, 只有混合信号x ( 0 可以观测到。 s ( ox ( 0甄f ) 图2 ,2i c a 的模型 i c a 的目标就是求得一个分离矩阵w ,并通过w 从观测信号力中恢复出源 信号s ( 0 。 设输出的分离信号为y ( f ) - 【j ,l ( f ) ,y 2 ( f ) ,y m ( f ) 】,则分离过程为: y ( f ) = w x ( t ) = w a s ( t )( 2 4 ) 其中输出信号y o ) 是源信号s ( f ) 的一个估计,且“0 的各个分量尽可能的地相 第9 页 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 互独立【2 0 l 。通常只考虑源信号的个数和观测信号的个数相同的情况,即m = n 。 对于m n 的情况,可以采用p c a 方法去掉冗余分量,使得m = n 。在后面的论 述中,如不作特别说明,都假定肘= ,即源信号和混合信号的个数都是膨。 2 1 2i c a 的卷积模型 更为一般的情况是考虑延迟的线性混合,又称卷积混合。设个离散时间t 的序列构成一个维的列向量序列s ( f ) = 【j 。( f ) ,屯( f ) ,曲( f ) 】7 ,t 一,- 1 ,0 ,i ,1 ,m 维观察向量序列为x ( f ) = x d t ) ,x 2 ( t ) ,h ( f ) 】1 ,x ( f ) 和s ( f ) 满足如下关系式: x ( f ) = a ( k ) s ( t - k ) 其中a ( k ) 是m n 维的混合矩阵,又称冲激响应。则盲反卷积的过程为: y ( f ) = w ( k ) x ( t - k ) k - - - ( 2 5 ) ( 2 6 ) 其中w ( k ) 为盲反卷积系数矩阵。盲反卷积又称为盲均衡,若n = 1 ,则为单道盲 均衡问题;若n 1 ,则为多道盲均衡问题。 上述三种i c a 模型都是线性混合的,此外还有非线性混合的i c a 模型。 通过最大化y 的非高斯性来衡量y 各分量之间的独立性【2 ”。 2 1 3i c a 的可解性分析 为简单起见,只考虑无噪模型。观察( 2 2 ) 式和【2 3 ) 式,可以看出方程的个数为 膨,远远小于未知数的个数( 膨+ 1 ) ,严格说来这个问题是无法求解的。但是i c a 是个非常复杂的问题,已经有人证明,在满足一定的假设条件下,可以通过某些 特殊的方法求得该问题的一个解4 2 2 。这些假设条件是: ( 1 ) 源信号s ( f ) 的各个分量在统计上是相互独立的。 ( 2 ) 混合矩阵a 是列满秩的常数矩阵。 第1 0 页 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 ( 3 ) 源信号是非高斯信号或最多只有一个是高斯信号。 条件( 1 ) 是解决i c a 问题的关键,通常源信号都是从不同的物理系统产生的, 因此该假设具有一定的现实意义。条件( 2 ) 实际上是为了保证观测信号的个数不小 于源信号的个数,且i c a 模型是一线性时不变系统。对于条件( 3 ) ,如果源信号都 是高斯分布的,则混合信号也是高斯分布的,可以证明这种情况是不可分离的, 但如果只有一个高斯信号的话,i c a 问题也是可解的【2 3 1 。在实际情况中,上述三 个假设通常都是可以满足的。 事实上i c a 的解不是唯一的,i c a 存在一个固有的解的不确定性问题【2 4 l ,又 称为解的等价性,即分离信号的排列次序和波形的复振幅( 幅值和初始相位) 是 不确定的。下面从数学的角度来说明这种不确定性。 考虑m = n 的情况,在( 2 4 ) 式中令c = w a ,显然当c = i ( 单位矩阵) 时, 有y ( t ) - - - s ( t ) ,这是一个理想的情况。而实际上,当c 是一个广义置换矩阵( 每一行 和每一列都只有一个非零元素) 时,我们也认为i c a 分离成功,称混合矩阵a 是 可辨识的。由矩阵理论可知,c 可以分解为: c = w a = p d ( 2 7 ) 其中p 为置换矩阵( 每一行和每- - n 都只有一个元素1 ) , 索非0 ,其它元素为o ) 。将( 2 7 ) 式代入( 2 4 ) 式得: y ( f ) = w a s c t ) = p d s ( t ) d 为对角矩阵( 对角元 ( 2 8 ) 由上式可知,如果s ( 力的各个分量统计独立,则y ( 力的各个分量也相互独立。 从另一方面来说,如果分离矩阵w 是i c a 问题的一个解,则那么p d w 也是i c a 的一个解2 5 1 ,其中p 为置换矩阵( 每行每列有且只有一个元素1 ,其余为o ) ,d 为对角矩阵( 对角元素都是l ,其余为o ) 。 从物理角度来看,由于源信号和混合矩阵都是未知的,次序不确定性相当于 同时交换源信号和混合矩阵与之对应的列的位置后,所得到的观测信号不变;复 振幅不确定性相当于源信号和与之对应的混合矩阵的列之间互换一个比例因子 后,所得到的观测信号不变。由于有用的信息主要包含在信号的波形中,所以这 两种不确定性对盲源分离技术的应用影响不大2 嗣。 第l l 页 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 一种减小i c a 幅度不确定性影响的方法是假定源信号s ( 0 的各个分量具有单 位方差【2 7 l ,即: e s ( t ) s 1 ( f ) ) = i ( 2 9 ) 则当观测信号x ( 0 确定后,混合矩阵a 的系数的大小固定( 列的排列次序仍未确 定) 。同样,假设输出信号y ( f ) 的各个分量的方差也是1 ,即: e y ( t ) y 1 ( f ) ) = i ( 2 1 0 ) 则分离矩阵w 的系数的大小也已固定。 2 2 传统的盲分离评价指标分析 由于盲信号分离根据混合的机理不同,可以分为计算机混合和实际混合。两 种不同的混合的区别是:计算机混合往往保留了语音源信号或信道混合信息。因 此通过这些信息进行比较,可以评价计算机混合的盲分离算法的性能。传统的盲 分离评价指标都是针对计算机混合的。 在性能仿真实验中,由于源和信道参数已知,可以使用多种性能指标对算法 的性能进行衡量。其中评价准则主要分为两种:基于混合矩阵的评价准则和基于 信号的评价准则。 2 2 1 基于混合矩阵的评价准则 这类评价准则通过计算盲分离得到分离矩阵,由混合矩阵和分离矩阵生成系统 矩阵。通过系统矩阵的特性计算盲分离性能。在先验的确定了混合矩阵,而源信 号未知情况下,可以采用这种评价准则。 2 2 。1 1 系统矩阵与单位阵之间的误差以及仿真 1 算法分析 通过计算分离矩阵w 和实际混合矩阵a 的乘积当为c = w a = b 】时与单位 矩阵i 之问的距离,就可以评价i c a 算法的性能。这是一种理想的情况。实际上 第1 2 页 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 c 是一个置换阵( 或称排列阵) ,我们其中勺为c 的第( f ,力个元素,因此用下列 方法来衡量【2 s 】: 在理想情况下,盲分离算法应能使分离矩阵w 收敛于最优值w ,使得 w a = i ,或者使系统矩阵当为c = w a = 【勺】时收敛于单位阵i 。我们用系统矩阵 c 和单位阵i 之间的距离来度量盲分离算法的分离程度。定义两者之间的误差为: 户= i = 1 巧2 ) 生一1 m m a x n 。; ( 2 1 1 ) 其中,n 表示源信号的个数。p 越小,说明算法分离的效果越好。实际情况中, 为了求得每一个信号的恢复程度,往往对该指标按行计算该行元素与该行最大值 的关系,并进行归一化处理,其修正表达式为: 2 实验仿真 1 n = : 弓( k ) 兰。一1 懋 ( 2 1 2 ) 两个自然语音信号即英语单词“h e l l o ”( s 1 ) 和日语单词“m o s h i m o s h i ”( s 2 ) , 以及一个有色高斯噪声( s ,归一化的峭度为- 0 0 0 3 ) ,通过随机选择的混合矩阵 l o 8 2 0 9 0 0 6 2 l a = l 一0 5 4 0 8 4 0 6 9 l o 5 2 0 2 8 0 6 5l 我们采用f a s t i c a 算法,用系统矩阵与单位阵之间的误差p 作为指标判断的分 第1 3 页 上海大学硕士学位论文 实际语音盲分离客观评价方法的研究 表2 1 系统矩阵与单位阵之问的误差n 作为盲分离指标 语音信号 s ls 2。3 0 0 0 3 70 0 0 4 5 o 0 0 4 2 p i 2 2 1 2 多通道符号间干扰i s i ( 广义交换矩阵的偏差) 1 算法分析 系统矩阵c = w a = 【c u 】每行中只有一个接近于该行最大值的元素,此时系统 矩阵与单位阵之间的误差p 就能确定盲分离算法性能。但这种情况包含了系统矩阵 同行不同列中的元素均出现非常接近于1 的情况。事实上这意味着有至少一路源信 号由于信号干扰被淹没了,而不能得到有效的恢复。我们可以利用与广义交换矩 阵的偏差作为性能指标,测量信号间干扰: 前面已经说明了盲分离存在尺度和排列上的不确定性,c = w a = p i 其中,p 为交换矩阵表示排列不确定性,d 为对角阵表示尺度不确定性。c 符合广义交换矩 阵的定义,因此不允许存在某一行或者某一列的元素存在均接近于1 的情况。根据 以上原因需要对系统矩阵与单位阵之间的误差p 进行休整。 下面定义的信号间干扰在这种情况下,我们采用它作为一个评价准则i 1 1 ,来 衡量信号的分离效果。定义该量为: 用= 如# 斗如鞠一- 亿哟 该方法对系统矩阵行与列进行搜索,避免了系统矩阵同行不同列中的元素均 出现非常接近于1 的情况。同时我们可以对该指标进行归一化处理: 彤宇 2 n 智| i 智 l 州喜品一t 第1 4 页 ,一k呶 上海大学硕士学位论文实际语音盲分离客观评价方法的研究 对于一种好的分离算法,用应该接近于0 。p ( p e r f o r m a n c ei n d e x ) 表示算法 的分离性能,其值越小表示分离的性能越好,当p = 0 时表示信号完全分离。 2 实验仿真 由于以上评价方法是是一种通用的信号处理方式,因此可以用语音盲分离以 及其他盲分离应用领域。为了进一步说明,本实验将该评价方法应用于图像领域 以验证其通用性,采用四幅1 2 8 1 2 8 的标准图像:b a b o o n 、b o a t 、b r i d g e 和l e n a , 其中混合矩阵为在 o , 1 1 上随机产生的4 4 的矩阵: a = 0 0 2 3 2 o 2 3 1 3 0 8 4 5 3 o 7 2 6 4 0 6 9 4 7 0 3 8 3 l 0 4 7 9 8 0 9 6 7 1 0 7 8 3 5 0 4 0 9 7 0 9 5 7 4 o 1 9 7 0 0 5 2 9 3 o 5 0 4 2 0 。4 8 3 4 0 3 7 7 6 本实验采用定点算法和三种自然梯度算法进行混合图像的盲分离实验,得到 这四种方法的性能指标p i ,如表2 2 所示。其中f a s t l c a 为定点算法;n g - f t c a 为柔性( f l e x i b l e ) 自然梯度算法f 2 9 j ;n g o l 为在线自适应( o n 1 i n e a d a p t i v e ) 自 然梯度算法【3 0 1 ;b s s c 算法为基于累积量( c u m u l a n t s ) 的盲源分离算法【3 1 1 。 从表2 2 的实验数据的分离结果可以得出结论,f a s t l c a 算法是分离性能很好 的i c a 算法。 表2 2 定点算法和三种自然梯度算法的学习性能比较 算法 f a s t i c an g f i c an g 旬lb s s c 性能指标p 1 0 1 0 4 50 4 4 5 8 0 1 8 4 2 0 1 7 5 7 2 2 1 3 行元素优势指标及其修正指标 1 算法分析 定义l :设称k l = 1 1 b i ,= 1 ,2 玎,称勺为第f 行的优势元素。如果矩 阵c 所有行的优势元素不同列,则称c 是行元素优势矩阵。 定义2 :定义矩阵c 的行元素优势度量函数: 第1 5 页 上海大学硕士学位论文实际语音肓分离客观评价方法的研究 f 【c ) = m a x l c 。, m - l ,埘,f = 1 ,2 月,朋七如果c 是行元素优势矩阵( 2 1 5 ) f 【c ) = 1如果c 不是行元素优势矩阵( 2 1 6 ) 显然,如果矩阵c 是行元素优势矩阵,则有0 f ( c ) 1 ,f ( c ) 越小,则说明 行元素优势越明显,盲分离的效果越好。文献【7 8 】就是采用的这种指标。由于定义 了行元素优势矩阵,可以避免某路信号被淹没。 这一指标在源信号各分量能量均匀一致的条件下,可以从听觉和信号方面都 取得较好效果。这是因为恢复信号y ( f ) 的一个分量儿( f ) 就是对矩阵c 第i 行中优 势元素所对应的源信号分量的恢复。因而f ( c ) 越小,它分量的叠加越少,盲分离 效果越好。如果源信号各分量的能量差别较大,则从听觉上不适用。因为如果对 应的源信号分量的幅值太小,即使矩阵c 是行元素优势矩阵,即信号恢复效果较 好,但从听觉上仍有可能被其它分量淹没,不能很好的恢复源信号。因此矩阵c 的行元素优势f ( c ) 就不能正确反映从听觉上分辨,需要对其进行如下修正【9 】: 令矩阵r ,= c o v ( s ( t ) ) 。因为s ( f ) 各分量独立,所以r ,在理论上应为对角阵, 矩阵r ,j 的对角元素对应源信号s ( f ) 各分量的幅值。令

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论