




已阅读5页,还剩40页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉科技大学 fiyiiiflfllfflffi7llffll3llffff9lllrrl6lf f i i o l l l l f 3 r f r l 4 研究生学位论文创新性声明 本人郑重声明:所呈交的学位论文是本人在导师指导下,独立进行研 究所取得的成果。除了文中已经注明引用的内容或属合作研究共同完成的 工作外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。 对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名:眸日期: 研究生学位论文版权使用授权书 扣s 如 。 本论文的研究成果归武汉科技大学所有,其研究内容不得以其它单位 的名义发表。本人完全了解武汉科技大学有关保留、使用学位论文的规定, 同意学校保留并向有关部门( 按照武汉科技大学关于研究生学位论文收录 工作的规定执行) 送交论文的复印件和电子版本,允许论文被查阅和借阅, 同意学校将本论文的全部或部分内容编入有关数据库进行检索。 论文作者签 指导教师签 日 武汉科技大学硕士学位论文第1 页 摘要 盲源分离( b 1 i n ds o u r c es e p a r a t i o n ,b s s ) 是指在对信号源和传输信道未知的情况下, 只凭传感器阵列得到的观测信号恢复源信号的过程。由于盲源分离无需知道源信号的先验 信息,从而在信号处理领域得到广泛的应用。 本文主要对卷积混合模型盲分离进行了研究,主要工作如下: 首先介绍了盲源分离的研究背景及意义,阐述了盲源分离的研究现状和一些重要的应 用领域。 然后对卷积模型进行分析与研究,特别介绍了卷积混合模型的复域瞬时分离算法:特 征矩阵的联合近似对角化法( j a d e ) :介绍了频谱相似性、短时分析技术;并通过遗传算法 优化排序模糊性问题以及最速下降法来优化幅值不一致问题。 最后通过实验仿真的手段对语音信号卷积混合模型问题进行了研究和探讨。将j a d e 法 用于实验仿真中,考察它们对人工合成的各种混合语音信号和现实环境中采集的混合语音 信号的分离性能。着重考察了说话者与麦克风之间的距离对盲分离效果的影响。 通过实验仿真,得出了一些重要的结论和启示,这对于今后的进一步的深入研究具有 一定的指导意义。 关键词:盲源分离,语音信号,盲反卷,遗传算法 第1 i 页武汉科技大学硕士学位论文 a b s t r a c t b l i n ds o u r c es e p a r a t i o n ( b s s ) i sap r o c e s so fo b t a i n i n ga n dr e c o v e r i n gs o u r c es i g n a l sf r o m t h eo b s e r v e ds i g n a l st h r o u g hs e n s o r sa r r a yw i t h o u tt h ek n o w l e d g eo ft h em i x i n gs y s t e ma n d s o u r c es i g n a l s w i t h o u tt h en e e do fp r i o rk n o w l e d g eo nt h ep r o c e s so fb l i n ds o u r c es e p a r a t i o n , b s sh a se x t e n s i v ea p p l i c a t i o n si nt h ef i e l do fs i g n a lp r o c e s s t h j st h e s i si sf o c u s e do nt h er e s e a r c ho fc o n v o l u t i o nm i x t u r em o d e l t h em a i nr e s e a r c h w o r k sa r eo u t l i n e da sf o l l o w s : f i r s t ,t h i st h e s i si l l u s t r a t e st h eb a c k g r o u n da n ds i g n i f i c a n c eo fr e s e a r c ho nb s s ,a n d e x p o u n d s i t sr e s e a r c hs t a t u sa n ds o m ei m p o r t a n ta r e a so f a p p l i c a t i o n s s e c o n d l yt h i st h e s i sa n a l y z e sa n dr e s e a r c h e sc o n v o l u t i o nm i x t u r em o d e lw i t hs p e c i a l a t t e n t i o nt ot h et y p i c a l c o m p l e xd o m a i n i n s t a n t a n e o u ss e p a r a t i o na l g o r i t h m ,i e ,j o i n t l y a p p r o x i m a t ed i a g o n a l i s a t i o no fe i g e n m a r i c e s ( j a d e ) m e a n w h i l et h i st h e s i se l a b o r a t e so nt h e s i m i l a r i t yo fs p e e c hs i g n a l si nf r e q u e n c yd o m a i n ,s h o r t - t e r ma n a l y s i sa n ds e t sf o n ha s o l u t i o nt o o p t i m i z ep e r m u t a t i o ni n c o n s i s t e n c yp r o b l e mb yu s i n gt h eg e n e t i ca l g o r i t h ma s w e l la sa n a p p r o a c ht oo p t i m i z ea m p l i t u d ep r o b l e mb ya d o p t i n gt h es t e e p e s td e s c e n tm e t h o d f i n a l l yt h i st h e s i sr e s e a r c h e sa n de x p l o r e st h ep r o b l e mo fc o n v o l u t i o nm i x t u r em o d e lb y c a r r y i n go u ts i m u l a t i o ne x p e r i m e n t s b ya p p l y i n gj a d ea l g o r i t h mi n t os i m u l a t i o ne x p e r i m e n t s , w eo b s e r v ea n ds t u d yt h ep e r f o r m a n c e sf o rd i f f e r e n tk i n d so fs y n t h e t i cm i x i n gs p e e c hs i g n a l s a n df o rs p e e c hs i g n a l sr e c o r d e di nr e a lw o r l d w h e ns e p a r a t i n gs p e e c hs i g n a l sr e c o r d e di nr e a l w o r l d ,w es t u d yt h ee f f e c t so ft h ed i s t a n c eb e t w e e ns p e a k e ra n dm i c r o p h o n eo ns e p a r a t i o n r e s u l t s w i t l ls i m u l a t i o ne x p e r i m e n t s w ea r r i v ea ts o m ec o n c l u s i o n sa n di n s p i r a t i o n sw h i c hm i g h tb e u s e f u lf o rf u r t h e rr e s e a r c hi nt h i sa r e a k e yw o r d s :b l i n ds o u r c es e p a r a t i o n ,s p e e c hs i g n a l ,b l i n dd e c o n v o l u s i o n ,g e n e t i ca l g o r i t h m 武汉科技大学硕士学位论文 第1 l i 页 目录 摘要l a b s 住a c t i i 第一章绪论1 1 1 盲源分离的研究背景1 1 2 盲源分离的发展现状一2 1 3 盲源分离的应用3 1 4 论文内容和安排3 第二章盲源分离基础5 2 1 盲源分离概念5 2 2 卷积混合模型5 2 3 时域盲解卷算法6 2 3 1 i c a 盲解卷主要方法6 2 3 2 基于二阶累积量的盲解卷积6 2 4 盲分离语音信号特征7 2 4 1 语音信号短时平稳特性。7 2 4 2 相邻频点问幅度相似性7 2 5 短时分析技术8 2 6 遗传算法一10 2 7 本章小结1 2 第三章复域分离算法与频域幅值、排序问题分析1 3 3 1 卷积混合算法分类1 3 3 2 复域分离算法1 3 3 2 1 特征矩阵的联合近似对角化法j a d e 法1 4 3 3 基于相邻频点幅度相关的排序问题分析1 5 3 3 1 排序组合优化分析l8 3 3 2 幅值优化分析2 0 3 3 本章小结2 2 第四章语音信号复域盲分离的仿真研究2 3 4 1 人工卷积混合盲分离2 3 4 2 现实环境语音信号的盲分离2 6 4 2 1 声源与传感器距离d 对分离效果的影响2 7 4 3 本章小结3 1 第五章总结与展望3 3 第1 v 页武汉科技大学硕士学位论文 参考文献3 5 致谢3 8 武汉科技大学硕士学位论文第1 页 第一章绪论 1 1 盲源分离的研究背景 在人们平常的生活环境中存在着各种各样的声音信息( 如说话声、广播声、噪声等) , 我们对其中某些声音感兴趣,可以通过录音器或其他的声音传感器记录下这些声音心引。但 记录下来的声音往往不是我们所期待的纯净信息,而是由很多个成分( 包括环境的嘈杂声、 相关声源的干扰、声音通过墙壁的反射、混叠延时等) 混合在一起的复杂信号,并且是未 知的,又由于信号传输的过程中,每一个声源到底是以什么方式混合我们也一无所知。因 此,要得到我们感兴趣的原始信号是很困难的l 幢儿引。 盲信号处理的目的就是要从大量的复杂混合信号中提取人们所希望的成分,获得我们 所需要的信息。由于麦克风记录下来的语音信号是通过某种方式混合后的信号,所以把源 信号分离出来是盲源分离的首要任务。虽然现在有很多信号处理的方法把混合信号分离开 来,比如传统的滤波器就是通过不同的频率段把我们不需要的噪音给滤掉,得到我们想要 的信号,但是现实的声音信号各个成分在频域是重叠的,单独的用频率来分离信号不容易 实现。比如在一个舞会的大厅罩面,有音乐声、跳舞声、说话声,这时我们在大厅的各个 角落安放多个录音器对大厅的声音进行记录,那么所采集下来的信号实际上是由不同的声 源所混合后的信号。要从这些混合信号中分离出我们想要的信号,显然不是一件容易的事 情,这就是大家熟悉的“鸡尾酒会效应川刚 1 。此时,我们面对的问题有两方面。首先是对 每个声音即源信号特征未知,其次就是每个源信号如何混合也未知。于是我们可以得出盲 源分离( b l i n ds o u r c es e p a r a t i o n ,b s s ) 方法与传统的分离方法不同,它是在源信号以及声 音混合信道无法预料的情况下,仅从检测到的混合信号中提取或估计出源信号的一种处理 方法| 4 引。 面对“鸡尾酒会效应”这类说话源很多和环境比较嘈杂的问题,如何把源信号从检测 到的复杂混合语音信号中分离出来是盲源分离研究的主题。目前,随着盲源分离技术的不 断创新,很多分离方法已经运用于盲源分离中,这些分离方法大部分是基于对纯净的声音 源信号进行人工混合,混合的过程中不包含其他的噪声,事先我们就知道了源信号的特征 以及混合的方式,所以分离出来的效果比较好。但是当语音环境中有噪声和其他声音的串 扰时,分离效果就大大降低。而在复杂的现实环境中处处都存在着噪声,包括不同声源的互 相干扰、外界的响声、障碍物的反射、自身的回响等,这些噪声有时候比我们希望获得的 源信号还要强,在这样的苛刻环境下使分离效果大打折扣。如果能够在盲源分离之前把语 音信号与噪音分离开来,这使盲源分离效果有很大的提高,是学者们以后要继续研究的问 题。随着盲源分离技术的不断创新与发展,使得噪声比较大的情况下进行源信号分离成为 可能,增大了分离算法的可行性和适应能力。除此之外,水声定位m 1 、波束形成旧1 等领域的 研究都得益于盲源分离技术。因此,盲源分离技术的研究具有很高的价值和意义。 第2 页武汉科技大学硕士学位论文 1 2 盲源分离的发展现状 盲源分离的研究始于1 9 8 6 年法国学者j e a n n yh e r a u l 和c h r i s t i a nj u t t e n 在美国犹他州 举行的神经网络会议上发表的一篇题为基于神经网络反馈模型的信号处理方法的研究 报告,提出了递归神经网络反馈模型方法,以实现多个独立源信号混叠的盲源分离问题。 这篇报告对信号处理技术产生了很大的冲击力,开创了新的研究领域,也就是我们现在所 说的盲源分离问题乜1 。1 9 8 7 年g i a n n a k i s 等人提出了频域盲信号分离存在排序、幅值不确 定性问题,率先把高阶累积量使用在盲源分离中。1 9 9 1 年j u t t e n ,h e r u a l t 和p c o m m o n 等 三位法国科学家在权威杂志信号处理上先后发表了三篇关于盲信号分离的经典文章, 提出了著名的h j 算法,标志着盲信号处理问题的研究取得了重大进展。1 9 9 4 年p i e r r e c o m m o n 提出了独立分量分析的基本概念,该方法成为了日后研究盲源分离的主流,充分 的利用了信号的高阶统计信息。1 9 9 5 年b e l l 和s e j n o w s k i 提出了通过信息最大化准则 ( i n f o m a x ) 的盲源分离方法。日本学者a r m a r i 于1 9 9 8 年提出了自然梯度算法,大大加快了 算法的收敛速度。l e e 、g i r o l a m i 和s e j n o w s k i ( 2 0 0 0 ) 引将这些盲源分离方法在信息理论的指 导下通过融合,进行了统一。 随着盲源分离技术的发展,越来越多的学者开始研究相关源信号的盲分离问题,提出了 时频分析方法旧。y u a nz h i j i a n 和e r k k io j a 于2 0 0 4 年提出了一种非独立分量分析的f a s t l c a 算法n 叫以及后面提出的联合矩阵对角化算法( j a d e ) 、联合块对角化( j o i n tb l o c k d i a g o n a l i z a t i o n ) 等算法。 国际上,研究盲源分离问题的著名学者有法国学者c o m o n 、c a r d o s o ,美国学者s a l k i n s t i t u t e ,神经实验室学者s e j n o w s k i 和b e l l ,芬兰学者o j a ,日本学者a m a r i 和c i c h o w s k i 等。盲源分离发展至今大部分算法都应用于瞬时线性混合模型中,一些具有良好性能的算 法已经被用于语音识别系统、通信处理系统、地震预报以及生物医学处理等多个领域,具 有广阔的应用前景。近几年,随着盲源分离技术的不断发展,使得非线性混合问题得到了 很大的发展。盲源分离的各种算法适用范围越来越广,广泛应用于自动控制工程、数据挖 掘、无损图像编码以及文件检索等领域。 国内对盲源分离的研究开始的比较晚,盲分离技术还在不断的提高,近几年在理论和 应用方面也取得了很大的进步。近年来国内各类基金大力支持了盲源分离的理论研究和实 际应用,许多高校的硕士与博士论文都是结合盲源分离问题来进行的。 如今大部分盲分离研究都是在时域中处理的,很多分离算法效果都很好,但是这些算 法都是以简单的瞬时混合模型来研究的,有很不足的地方,例如很少有人去研究声源是运 动状态下的盲分离问题,大多都是认为声源是静止的;传感器的个数通常比声源的多或者 相同;假设大部分环境都是无噪声的即忽略干扰的影响等,一但录音环境变得复杂,干扰 比较多的时候,分离算法就比较差。通过这些限制条件我们知道,目前的瞬时混合分离算 法对现实环境的语音信号盲处理问题来说很多情况下都不适用。我们在采集信号的过程 中,很多信号都存在时延、反射等情况,特别是回响情况非常普遍。所以采用卷积混合模 型更加适合复杂的录音情景。但是卷积混合在频域也存在排序的模糊性问题,解决不好这 武汉科技大学硕士学位论文第3 页 个问题,分离效果也会很差。所以说,盲分离技术的发展道路是非常崎岖的,具有很大的 挑战性。 1 3 盲源分离的应用 盲源分离技术在很多方面都得到了广泛的应用,逐渐成为当今信号处理领域的前沿技 术,其广泛应用于生物医学检测、磁共振成像( f m r i ) 、雷达探测、手机信号去噪、抑制 干扰、语音增强、图像滤波以及无线通信等领域。有些学者正在考虑把盲源分离技术应用 到人的表情识别、阅读方式等方面。下面介绍盲源分离的几个主要应用领域他3 钔悔1 。 ( 1 ) 语音辨识、图像处理 大家在现实生活中会看到越来越多的声控设备,如电话录音、手机声音识别、声控计 算机等。声控计算机在识别声音指令时自然会参杂着各种噪音的成分,计算机需要识别指 令与噪声最终执行命令,这就是盲信号分离技术的实际应用 2 1 o 同时在图像处理领域,盲源分离也有很广泛的应用。比如对二维的图像进行滤波、画 质增强。当我们的某些重要相片已经老化或者被污染,这时盲源分离技术在图像数据恢复 过程中起到了关键作用幢引。 ( 2 ) 医学处理领域 随着科学技术的发展,越来越多的信号处理技术应用在医学领域中,比如心电图,脑 电图、b 超等成像技术其实都存在盲信号分离问题引。我们经常通过某些电子仪器来检测 人的脑电波,大多是通过人的皮肤来采集信号的,这个过程中源信号到测点之间的传递介 质是无法测量的,并且不同的人传输的介质参数也不同。目前有很多研究人员已经把盲源 分离技术应用到脑电波成像当中,取得了不错的效果。 ( 3 ) 传感器领域 海洋探测技术也存在盲源分离的情况。传感器在海水中检测信号,海洋的传输介质我 们是无法预测的,这时可以通过盲源分离技术来进行信号的分析。 在军事科技领域雷达通信、遥感技术的作用有目共睹口1 。以前的探测技术都是通过雷 达发出电磁波信号去探测不明飞行物,这样存在很大的危险即自己的方位已经暴露而导致 别人的攻击。随着我国军事侦察技术的进步,现在的雷达只接受信号而不主动的发出电磁 波去探测,这个过程也用到了盲源分离技术。 1 4 论文内容和安排 本论文主要思想是在频域盲分离过程中解决排序模糊性和幅值不一致性问题,同时对 盲源分离的理论知识和各种盲源分离算法在时域、频域进行了深入的研究,并通过对人工 混合的信号和实验室环境中采集的混合信号进行仿真,得到了很多宝贵的经验。 本论文分为五个章节,具体思路如下: 第一章为绪论部分,简单介绍了盲信号处理的历史背景知识以及研究盲源分离技术的 使用价值和国内外研究的情况。对盲源分离技术的提出,发展做了简单的说明。特别是盲 第4 页武汉科技大学硕士学位论文 信号处理技术在生物医学检测、磁共振成像( f m r i ) 、雷达探测、手机信号去噪、抑制干 扰和语音增强、图像滤波以及无线通信领域方面应用越来越广。有些学者正在考虑把盲源 分离技术应用到人的表情识别,以及阅读方式等方面。 第二章对盲源分离的基本概念做了简单的介绍,分析了盲卷积混合系统、时域盲解卷 方法。通过语音信号的特征( 短时平稳) 对测点信号进行加窗傅里叶变换,提出传递函数 相邻频点幅度相关性最大这一特征来解决幅值错误问题的思想。介绍了短时分析技术、窗 函数的类型、窗的大小来讨论频域分离过程中一些要注意的问题。最后介绍了g a 算法优 化的知识,这些基础知识和方法为下一章的算法分析和研究以及后面的实验仿真提供了理 论基础。 第三章对盲源分离算法进行了介绍,对频域盲分离中遇到的排序模糊性和幅值不一致 性问题进行了研究,以频域传递函数在相邻频率点的幅度相关性最大这一特点为基础,使 用遗传算法组合优化方法来解决排序模糊性问题,用最速下降法来优化幅值问题。 第四章将j a d e 法在试验中分别对人工混合的信号与现实环境采集到的混合信号进行 了盲分离。考察了声音源与传感器之间的距离对盲源分离效果的影响。通过实验仿真,理 论与实际相结合,得出了一些重要的结论和启示,对于今后对语音信号的进一步研究具有 一定的指导意义。 第五章对本论文工作进度以及实验过程中的不足进行了总结,并对今后的研究和发展 进行了展望。 武汉科技大学硕士学位论文第5 页 第二章盲源分离基础 2 1 盲源分离概念 盲源分离就是在只有传感器记录下来的信号,对信号源是怎样混合以及信号源是什么 都不知道的情况下估计出信号源的过程。所以这罩的“盲”有两个含义:第一,信号源是 无法检测的即信号源未知。第二,信号源在复杂的环境下通过什么方式混合也未知。也就 是说我们所知道的信息全部都包含在传感器采集的混合信号中,只能通过语音信号的某些 特征把源信号分离出来3 1 。 如图2 1 所示,源信号m ) = 墨蛾曼似,& 】r 通过传输信道混合后得到混合信号 x ( t ) = ( f ) ,x z ( t ) ,屯( f ) 】r 。我们对混合系统内部声音是怎样混合的一无所知,同时对声音 信号源特征也不知道,我们只能通过混合信号球) 求出一个分离系统,输出 y ( t ) = 【y l ( f ) ,y 2 ( t ) ,儿( f ) 】7 使y ( t ) 能够很好的近似为源信号。现实的采集环境是很复杂的, 包含很多的噪声干扰,于是我们把混合系统的混合方式分为两大类:一个是线性混合,另 一个是非线性混合,线性混合又可以分为瞬时混合和卷积混合旧川。 i j 5 c 俯写删鼹察倍号“i 估计储号h , k 混合系统 k 分离系统 - r yi 图2 1 盲源分离系统模型 2 2 卷积混合模型 很多学者在开始研究盲源分离问题时都是以瞬时混合模型来表示信号的混合方式,但 是现实的复杂环境不仅仅是瞬时混合模型就能够表示的,往往信号的混合方式非常复杂, 除了声音直接传播到传感器的信号之外,还有经过不同物体的反射( 不同的墙面对声音信 号的反射系数是不同的) 以及各种各样的时间延迟等因素的影响,瞬时线性混合模型很难 解决复杂的声音混合方式,于是采用源信号和传输通道函数进行卷积的模型将更加合适。 我们把信号通过卷积混合的盲源分离问题称为盲反卷积( b li n dd e c o n v o l u s i o n ,b d ) 1 1 1 1 1 1 2 1 。 卷积模型如下 月r l ( f ) = a o ( k ) s j ( t - k ) i = l ,2 ,m ( 2 1 ) ,= ik - - o 由上式可知x i ( t ) 为第i 个混合信号,a i y 是从第i 个源信号到第个传感器之问的传递系数, 传递函数的阶数为k ,式( 2 1 ) 可以写成矩阵形式 k - i x ( f ) = :a ( k ) s ( t - k ) ( 2 2 ) 而 式中彳( 助是包含着第k 个滤波器系数的m 刀的混合矩阵。卷积模型的盲分离问题就是要估 计出一个q 阶的以m 分离矩阵,使得 第6 页 武汉科技大学硕士学位论文 少( 尼) = w ( q ) x ( t g ) ( 2 3 ) 即y ( k ) 为源信号的估计,w ( q ) 为分离矩阵。我们对混合信号( 2 2 ) 进行傅里叶变换,转 换到频域为 x ( o ) = a ( o ) s ( o ) ( 2 4 ) 由式2 4 可知时域复杂的卷积模型转换为频域的乘积模型降低了运算量,方便了盲源分离 的计算。卷积混合分离过程如图2 2 ,显然源信号的卷积混合模型较线性瞬时混合模型更 符合复杂的实际环境。本文将在后面主要研究卷积混合模型。 图2 2 卷积混合模型 2 3 时域盲解卷算法 由式子2 1 所示,线性卷积混合模型与瞬时混合模型相比,卷积混合模型具有记忆功 能,即是一种反馈系统,这比简单的瞬时混合模型要复杂的多。线性卷积混合模型的盲解 卷积算法一般分为两大类:i c a 分析方法和n 阶累积量m 川憎制。 2 3 1i c a 盲解卷主要方法介绍 随着盲源分离技术的发展,如今盲信号处理的研究达到了很高的高度,我们在假定现 实混合环境是瞬时混合模型的条件下,目前比较经典的算法大致有如下几个,i c a 分析、 熵最大化方法、非线性主分量分析方法等,其中独立分量分析方法在实际运用中是最广泛 的。 独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 阳川n 引是在2 0 世纪9 0 年代后期发 展起来的一项新的语音信号处理方法。它把传感器记录下的语音信号分解成为若干个互相 独立的成分。假设源信号之间是相互独立的,那么就可以把这些相互独立的源信号分解出 来得到想要的源信号。i c a 的发展和盲源分离技术的发然是相辅相成的,i c a 分析方法已 经成为盲源分离过程中的主要方法。 1 9 6 4 年由s a l v i 和w e i n s t e i n 首先提出将i c a 使用到卷积混合模型中去,后来有学者提 出种基于i n f o r m a x 的反馈网络来解决卷积混合盲分离。到2 0 0 1 年,盲信号处理技术已 经发展到完全反馈系统中去。 2 3 2 基于二阶累积量的盲解卷积 通常情况下,我们使用累积量来解决卷积混合的盲分离问题,必须要对采集的统计特 征给出一些限制条件5 1 。 定义:令混合系统h ( z ) 是可逆的,那么源信号的自相关函数要满足以下条件 e s ( t + k ) s 爿( f ) ) = 1 6 ( k ) ( 2 5 ) 上式的8 ( k ) 为单位冲击响应,当混合矩阵满足式2 6 时, 武汉科技大学硕士学位论文 。 第7 页 h ( z ) = h ,( z ) u 人( z ) ( 2 6 ) 源信号通过线性卷积混合系统才可以通过二阶累积量解决卷积混合模型。 2 4 盲分离语音信号特征 人们说话都是通过声音器官产生的,由于每个人的器官构造不同,那么每一段语音信 号也就会有其相应的特征。也就是说,不同的人发出的不同声音在其音调,强度等方面都 会不同。人的语音信号除了以上特征之外,还具有另外一个重要的特征就是特定的语音信 号总能够跟相应的说话人表达的意思相联系,一段语音信号就能表达说话人的思想和意 识。因此,语音信号中所包含的信息十分丰富,通过语音信号本身具有的特征可以快速的 提高语音信号盲源分离的性能,因此掌握语音信号本身的特征和处理方法非常必要1 1 j 1 2 1 3 1 。 2 4 1 语音信号短时平稳特性 在平时的说话中语音信号是非周期的,也就是说我们记录下来的语音信号是相当不规 则的,图2 3 所示的是在实验室采集的某段声音的时域波形图,从图中我们可以清楚的看 出整段语音信号表现的相当不规则性,是非平稳的;图2 4 信号时域波形图取自图2 3 信 号的一部分,根据时域图我们看出此段语音信号则表现出的规律是周期性。因此总的来说, 语音信号是短时平稳长时非平稳的声音信号。我们可以通过语音信号的短时平稳特性对信 号进行加窗处理,将语音信号分成一个个的窗数据,即一帧一帧的连续重叠,每一帧信号 都是比较短的,即信号是平稳的,然后利用平稳信号的处理方法对信号进行分析处理”川制。 语音信号包含着非常丰富的特征,这在我们研究盲源分离问题的过程中能够提供很多 解决的思路,本论文在后面章节将会利用语音信号短时平稳的特征对波形进行加窗处理, 提高盲源分离的效果。( 窗函数取为汉明窗,n = 2 0 0 ) 。 图2 3 语音信号波形 图2 4 语音片段 2 4 2 相邻频点间幅度相似性 上节我们介绍了语音信号在时域具有短时平稳长时非平稳的特性,通过短时傅罩叶变 换我们就可以对一段语音信号进行处理了。这时我们在频域进行盲反卷会遇到两个问题: 第8 页武汉科技大学硕士学位论文 第一就是排序的模糊性。源信号j ( f ) 与混合矩阵a ( t ) 卷积混合得到混合信号,若改变 混合矩阵的任意两列则会使源信号重新排列,所以分离出来的信号不一定与源信号的排列 顺序一致。排序问题的优化将在下一节的g a 中进行简述。 第二就是幅值的不一致性。源信号通过混合矩阵a 进行混合,分别对源信号的某一分量 和a 都乘以相同的比例因子e ,对采集的信号不产生影响,即 x ( f ) = a s ( t ) = 吼- = - o i 薯( f ) ( 2 7 ) 一i = lq 但会造成分离信号的幅值错误,于是在分析语音信号在频谱中的特性得到每一个声音 特性不一样,那么对于某一个声源来说他的频谱在每一个相邻频率点幅度是相关的,相邻 频点幅度之间变化非常平滑。我们对一段语音信号进行频谱分析,语谱图6 1 如下 图2 5 语音信号的语谱图 其中横轴为时间,纵轴为频率。由信号的语谱图我们可以看出语音信号的频谱在相邻 频点之间的过度非常的平滑,通过这一特性我们在频域做盲分离时可以使用混合矩阵在相 邻频点间的幅度相关性最大来解决幅值问题。 时域卷积模型为 x ( f ) = 彳( f ) 木s ( f ) ( 2 8 ) 其中x ( t ) 为混合信号的矩阵形式、a ( t ) 为混合矩阵、s ( f ) 为源信号。 通过加窗傅罩叶变换为 x ,( 国f ) = 彳( 缈,) s ,( 缈f ) ( 2 9 ) ,为窗的顺序,即第,窗。国;为第i 个频率点。我们通过频域算法可以得到每一个频率点 的传递函数a ( c o ,) 的幅值,即彳( 缈。) ,彳( 缈:) a ( c o 。) ,比较传递函数相邻频率点之间的幅 度,相关性最大的两个频率点的幅值是正确的。 2 5 短时分析技术 针对上一节中介绍的语音信号短时平稳长时非平稳的特性,我们引进加窗的短时傅里 叶变换,将语音数据分成相等长度的m 个数据块, 加窗的过程需要注意如下几点m 。“2 1 : ( 一) 窗的宽度太小,信号的频谱将不稳定。 武汉科技大学硕士学位论文第9 页 ( 二) 窗的个数太少将导致信号的信息量不够。 ( 三) 使用什么样的窗函数将会直接影响信号分离的效果。 下面以矩形窗与汉明窗来说明窗的大小以及窗的类型对信号短时分析的影响2 4 3 。 矩形窗2 1 为 从加j 1 ? 手? 州- 1 ( 2 1 0 )从刀) 2 1 云,其余 ) 汉明窗3 1 为 州= f m 抵吼2 翮“肛d l 黧州。 ( 2 ( a ) 矩形窗频谱图 v v ,h z ( b ) 汉明窗频谱图 v v ,h z 图2 6 矩形窗和汉明窗的频谱图 图2 6 所表示的是矩形窗和汉明窗的频谱图。根据频谱图我们可知汉明窗的频谱图的 主瓣宽度大约为矩形窗的频谱图主瓣宽度的两倍,且边带衰减比矩形窗要快的多。带宽取 决于窗函数的宽度大d , n “引。 在对语音信号进行加窗傅罩叶变换分析时,窗函数的长度要进行折中的考虑。窗函数 的长短我们是这样来评价的,窗的长度n 通常要根据语音信号的基调周期来定。一般情况 下一个窗的语音信号罩面应该包含1 7 个基调周期为宜,但是不同的人基调周期是不相同 的,从小孩到老年人,基调周期范围为2 m s 1 4 m s 。所以在一般情况下n 的取值是比较麻烦 的。通过大量的实践得到n 的取值为1 0 0 2 0 0 点比较合适。我们在采集信号的时候,采样频 率为8 0 0 0 h z ,2 0 0 点相当于2 5 m s ,4 0 帧s m 。 通过实验数据对比各种窗函数效果的好坏,窗函数取为汉明窗,n = 2 0 0 ,窗与窗的重叠 部分为n 4 ,数据采样频率为8 0 0 0 h z 。 第1 0 页武汉科技大学硕士学位论文 2 6 遗传算法 在频域算法中,虽然计算量比较少,但是却带来一个新的问题:排序问题。我们必须 对每一个频率点对应的瞬时盲分离结果( 即本论文后面将会提出的频域传递矩阵彳( w ) ) 进行正确的排序,使分离出来的时域信号都来自相同的源信号的频率分量。本节就是为后 面提出遗传算法解决排序优化问题的理论基础。 遗传算法是人们模仿物种遗传,通过人工假设条件来进行物种优化的。根据达尔文的 进化论发展而来,是进化计算的一种重要形式。生物的遗传是一个神奇的变化过程,它通过 自然环境的影响对物种进行选择,优化产生适应环境能力最强的个体。例如在人类的进化 过程中,通过自然环境的选择和淘汰,人类的思维、身体得到了很大的锻炼,慢慢开始掌握一 定的自然规律,更好的生存下来呦1 。因此,物种的进化过程其实也是一种智能的优化过程。 遗传算法一般都是对函数进行优化,全局优化性能比较好。 g a 与其它优化方法相比具有如下特点n 7 1 ( 1 ) g a 不是直接作用在参变量集上,而是利用参变量集的某种编码。 ( 2 ) g a 不是从单个点,而是在群体中从一个点丌始搜索。 ( 3 ) g a 利用适应值信息,无需导数或其它辅助信息。 ( 4 ) g a 利用概率转移规则,而非确定性规则。 2 6 1 遗传算法的基本原理与主要方法 ( 1 ) 编码 我们在做遗传算法时,很多优化问题的变量很多、变量之间的关系很复杂,很难 建立准确的模型,但是可以化为简单的位串形式编码来表示其含义,我们根据生物遗 传学的规律把位串形式编码表示叫做染色体,有的专业术语也称为个体。编码的方式 有二进制编码、浮点数编码、格雷码编码等。遗传算法最常用的编码方法是二进制编 码,假设某一参变量取值范是瞄猡 ,a a + a , ( 2 1 2 ) 11 1111 11 111 11111 = 2 一1 一b 其中 a :_ b - a( 2 1 3 ) d = 。_ 一 l z 2 一l 随机选择一组编码 x :吒吒一l 吒一2 恐五 ( 2 1 4 ) 武汉科技大学硕士学位论文第1 i 页 则上式2 1 4 的编码的解码公式如下 x :曰+ 掣步匆2 ( 2 1 5 ) 2 一l 智 ( 2 ) 选择与适应度函数 通过轮盘赌的方式选择需要进行遗传运算的个体,即随机选择个体。通过群体中个 体的存活概率计算相应的选择概率,设目标函数为贝, l j j ( b i ) 称为个体6 f 的适应度。那 么所的选择概率为 ,一 p 选中岛) = 厂( 6 f ) 厂( 屯) ( 2 1 6 ) ,j = l 为了衡量个体对环境的生存能力,提出了对每一个染色体的适应能力都能够度量 的函数,称为适应度函数,一般取的是目标函数。 ( 3 ) 遗传操作 一般简单的遗传算法操作方法有:交叉、变异。交叉的方法主要是被选择出来的两 个个体p 1 和p 2 作为父代个体。 1 ) 交叉:将二进制分割点互换交叉,如下图所示。 父陀 脑 予代 图2 7 交叉示意图 根据图2 7 所示,例如现在有两个父代个体 p i = 1 0 0 1 1 0 1p 2 :0 1 0 1 11 1 随机在第三位进行分割交叉,则产生的两个子代d j ,叩为 盟卜0 1 0 1 1 0 1 堡1 0 0 1 11 l 2 ) 变异:是根据物种的基因变异原理来进行推理的,首先随机的选择父代个体, 在这个父代个体中的某一位或多位基因以一定的变异概率进行取反产生子个体, 变异的示意图如下 父代子代 口 皿l i 囫嗲i 1ii l l i iii 一 兰竺。脚夕 图2 8 变异示意图 根据图2 8 所示,我们假设有一个父代个体p i = 1 0 10 1l 。 随机的选择1 ,4 位置的基因开始变异,则有子个体0 1 = 0 0 11 11 。 第1 2 页武汉科技大学硕士学位论文 2 6 2 g a 的算法过程 遗传算法是根据人类的生存发展,物种的进化等知识变化过来的,通过变换染色体上 的某些基因寻找好的染色体来求解我们要优化的问题。 遗传算法优化问题的基本步骤如下 n 引,方框图如图2 ( 1 ) 对应用问题的变量选取合适的方式编码。 ( 2 ) 初始化( 群体) ,随机的产生一定数量的群体。 ( 3 ) 计算适应值,选择概率。 ( 4 ) 选择操作。 ( 5 ) 交叉操作。 ( 6 ) 变异操作。 ( 7 ) 若没有满足某种停止条件, 则转入步骤( 3 ) 否则进入下一步。 ( 8 ) 得到适应度最优的染色体个体 作为我们优化的最优解。 为了适应频域盲分离排序组合优化问题,本论 文将在第三章对g a 方法进行详细的介绍。图2 9 遗传算法方框图 2 7 本章小结 本章对盲源分离的基本概念做了简单的介绍;分析了盲卷积混合模型、时域盲解卷算 法。通过语音信号的短时平稳特征对测点信号进行短时加窗分析,得到窗函数的类型与窗 函数的宽度n 对信号短时分析的影响。同时通过相邻频点幅度相关性最大这一点提出解决 幅值模糊性问题的思想。介绍遗传算法的由来、编码、交叉、变异等一系列操作,以及使 用g a 算法优化频域盲源分离过程中的排序问题。这些基础知识和方法为下一章的算法分 析和研究以及后面的实验仿真提供了理论基础。 武汉科技大学硕士学位论文第1 3 页 第三章复域分离算法与频域幅值、排序问题分析 我们在2 2 节中已经对卷积混合模型进行了分析,其中包括i c a 的盲解卷方法以及高 阶累积量方法。在这一节中我们将介绍卷积混合模型频域复值分离算法,使我们进一步的 了解盲源分离技术。另外说明的,本章讨论的都是在声源信号个数与传感器个数相同的情 况下的盲分离。且不记噪声的影响。 3 1 卷积混合模型算法分类 虽然瞬时线性混合模型的分离算法很多,分离性能也不错,但是由于它的模型过于简 单,无法满足现实的复杂语音环境。实际上每个传感器所接收到的信号是不同声源经过不 同的延时方式混合、叠加之后形成的,因此用卷积混合模型更为合适。 卷积混合盲源分离算法分为两类l 舯3 ,时域算法和频域算法。时域算法是解决卷积混 合盲源分离最开始的主要方法,但是它对于混合高阶滤波器来说计算量非常大,这对盲源 分离计算来说比较复杂,且收敛慢。 在频域算法中,虽然我们将时域的卷积问题转变成频域的乘积问题,计算量大大的减 少,但为此却带来了新的问题:排序问题( p e r m u t a t i o np r o b l e m ) 朝1 。在频域做盲分离问题 时,每个频率点会出现排序错误的情况,我们必须校正排列的顺序否则分离出来的信号是 错误的。 本论文利用语音信号的短时平稳,长时非平稳特性对混合信号进行短时傅里叶变换 ( s t f t ) 。通过复域的j a d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年天津市企业单位聘请外来务工人员劳动合同书新范文
- 2025建筑工程玻璃采购安装合同
- 2025年个人房屋租赁合同范本
- 湖南省耒阳市冠湘中学2026届七年级数学第一学期期末达标测试试题含解析
- 2025年建筑工人简化版劳动合同
- 2026届上海市闵行区闵行区莘松中学数学九上期末学业质量监测模拟试题含解析
- 2025年终止劳动合同证明
- 河北省石家庄市2026届数学七年级第一学期期末检测模拟试题含解析
- 中国银行德州市夏津县2025秋招笔试思维策略题专练及答案
- 安徽省宁国市宁阳学校2026届数学八上期末综合测试试题含解析
- 供应链管理综合实验实验报告
- (正式版)JBT 5300-2024 工业用阀门材料 选用指南
- 2024量子人工智能技术白皮书-量子信息网络产业联盟-2024.1
- 公务员考试培训-判断推理通关秘籍
- 第13课《警惕可怕的狂犬病》 课件
- MSOP(测量标准作业规范)测量SOP
- 《社会工作伦理案例分析》课件 儿童和青少年社会工作伦理
- HSK标准教程5下-课件-L2
- 艺人明星形象代言肖像权使用合同模板
- 毕业设计论文-计算机类
- 工作单位接收函
评论
0/150
提交评论