毕业设计(论文)-盲信号处理.doc_第1页
毕业设计(论文)-盲信号处理.doc_第2页
毕业设计(论文)-盲信号处理.doc_第3页
毕业设计(论文)-盲信号处理.doc_第4页
毕业设计(论文)-盲信号处理.doc_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学院毕业设计学院毕业论文设计 盲信号处理 院 (系):电子信息系 专业:电程技术 班级:班 学号:030 姓名: 指导教师: 目录摘要4abstract5第一章 语音信号及噪声概述1 1.1 语音信号的概述1 1.1.1 语音特性分析1 1.1.2 语音信号的基本特征 2 1.2语音噪声特性分析3 1.2.1 信噪比(signal noise ratio,snr) 3 1.2.2 信干比(signal-to-interference ratio,sir)4 第二章 盲信号处理5 2.1盲信号处理的概述 52.1.1 盲信号处理的基本概念5 2.1.2 盲信号处理的方法和分类5 2.1.3 盲信号处理技术的研究应用62.2 盲源分离法7 2.2.1 盲源分离技术7 2.2.2 盲分离算法实现 7 2.2.3 盲源分离技术的研究发展和应用8 2.3 独立成分分析 9 2.3.1 独立成分分析的定义 9 2.3.2 ica的基本原理102.3.3 本文对ica的研究目的及实现12第三章 盲语音信号分离的实现及抑噪分析 15 3.1 盲语音信号分离的实现 15 3.1.1 盲信号分离的三种算法 15 3.1.2 不同算法的分离性能比较 17 3.2 抑制噪声的算法仿真及结果分析 173.2.1 抑噪算法仿真实现 17 3.2.2分离结果分析 20 3.2.2 不同算法的分离性能比较28第四章 结论与展望35 致 谢 37 参考文献 38附 录 39盲信号处理摘要语音信号盲分离处理的含义是指利用bss技术对麦克风检测到的一段语音信号进行处理。混合语音信号的分离是盲分离的重要内容,目前的混叠语音分离大多是建立在无噪环境中的混叠情形下,主要以盲源分离(blind source separation,bss),根据信号的统计特性从几个观测信号中恢复出未知的独立源成分。本文重点研究了以语音信号为背景的盲处理方法,在语音和听觉信号处理领域中,如何从混有噪声的的混叠语音信号中分离出各个语音源信号,来模仿人类的语音分离能力,成为一个重要的研究问题。具体实现主要结合ica技术,将语音去噪作为一个预处理过程,对带噪声的混叠语音盲分离进行了研究,本文详细了介绍三种fastica算法:sobi算法以及cica算法,将三种算法应用于实际的语音信号噪声分离中,并比较了传统算法和基于ica/bss算法在语音消噪和增强方面的差异,文章最后还介绍了分离效果评价准则,并比较了snr和sir参数。关键词: 语音信号,语音信号噪声,盲源分离,独立成分分析abstractblind separation of speech signal processing means is the use of bss techniques microphone detects a voice signal processing. separation of mixed speech signals is important for blind separation, the current separation of overlapping speech is built mostly in the absence of aliasing noise in the environment, under the circumstances, mainly in blind source separation (blind source separation, bss), the statistical characteristics of signal several observations from the unknown signal to recover the independent source components; this article focuses on the background to the blind speech signal processing method, signal processing, speech and hearing, how the noise from a mixture of overlapping speech signal to separate the various audio source signals to mimic human speech separation ability become an important research question. combination of concrete realization of the main ica technology, speech denoising as a preprocessing of speech with noise-aliasing blind separation were studied, the paper introduces three kinds of fastica algorithm: sobi algorithm and the cica algorithm, three kinds of algorithm application the actual noise in speech signal separation, and compared the traditional algorithm and the ica / bss algorithm in speech denoising and enhancement of the differences, the paper finally describes the separation evaluation criteria, and compared the snr and sir parameters.keywords: voice signal, voice signal noise, blind source separation, independent component analysis41第一章 语音信号及噪声概述 1.1 语音信号的概述 1.1.1 语音特性分析1.语音产生机理发声器官分为三部分:肺、喉(声门)和声道。肺的作用相当于一个动力源,将气流输送到喉部。喉将来自肺部的气流调制为周期脉冲或类似随机噪声的激励声源,并送入声道。喉在发声中的作用是控制声带的开启和闭合,使得气流形成一系列脉冲,声带振动的频率决定了声音频率的高低。由声带振动产生的音统称为浊音,而不由声带振动产生的音统称为清音。声道包括口腔、鼻腔和咽腔,它们对声源的频谱进行整形而产生不同音色的声音。声道的谐振频率称为共振峰频率,它与声道的形状和大小有关,每种形状都有一套共振峰频率作为其特征,改变声道的形状就产生不同的语音,因而,当声道形状改变时,语音信号的频谱特性就随之改变。声源经过声道润色频谱后,最后从嘴唇或鼻孔或同时从嘴唇和鼻孔辐射出来,形成可传播的声波,被人感知为语音。综上所述,语音由空气流经过声门激励,经由声道调制,经过嘴辐射出去,完整的语音信号产生的数学模型可以用三个子模型:激励模型、声道模型和辐射模型的串连来表示。2语音的特性(1)短时平稳性根据对语音信号的研究,语音是一种时变的、非平稳的随机过程,但另一方面,由于人类发声系统的生理结构的变化速度是有一定限度的,在一段短时间内(1030ms)人的声带和声道形状基本稳定,并且大部分情况下,激励源参数也是如此,因此可认为短时间内语音特征是不变的,语音的短时性特点是对语音信号进行分析和处理的基础。(2)浊音和清音语音分为浊音和清音两大类,二者从语音产生的机理上有明显的差异,前者由周期性脉冲产生,后者由随机噪声产生,因而在特征上也有明显的区别。浊音在时域上呈现出明显的周期性,在频域上具有共振峰结构而且能量大部分集中在较低频段内。清音则完全不同,它没有明显的时域和频域特征,类似于白噪声。浊音在频谱上有共振峰结构,能量重要集中在低频区(1000hz)。1.1.2 语音信号的基本特征(1)语音信号的时域特征由于说话人在不同时刻的说话内容千变万化,而且没有确定的规律性,因此语音信号是时变的。但由于人类的发声器官的变化速率有限,声道在短时间内(5500ms)处于平稳状态,因此语音信号具有短时平稳性。而这种短时平稳性,也是语音处理中许多理论和算法的必要前提。由于人们在说话时,各个音节或单词之间总会存在着时间上的间隔,因此语音信号在时域上存在着有音段和无音段。通过有音段和无音段的检测,可用去除带噪语音中平稳的噪声。此外,无音段所占比例越大,语音的稀疏性越好,利用这一特点,产生了许多基于语音稀疏性的增强算法。(2)语音信号的频域特征语音信号的频谱能量主要集中在300-3400hz范围内。语音本身由浊音和清音组成,浊音含有语音信号的大部分能量,其频谱分布主要集中在低频段中的基音频率及其各次谐波上,呈现出明显的周期性;清音则表现出随机性,在频谱上类似于白噪声。(3)语音信号的统计特征语音信号可以看作是一个遍历性随机过程的样本函数,其统计特性可用其幅度的概率密度函数来描述。对语音信号的统计特性的研究表明,其幅度分布的概率密度函数可以用两种近似的表达式来较好地描述,其中一种是伽马(gamma)分布 (1-1)式中k是一个常数,与标准差仃,有下列关系 (1-2) 另一种是拉普拉斯分布(laplacian)分布 (1-3)式中,口是一个由标准差仃。决定的常数,即 (1-4)相对说来,伽马分布对语音信号的幅度分布描述更为精确一点,而拉普拉斯分布的函数形式则更加简洁。1.2语音噪声特性分析1.2.1 信噪比(signal noise ratio,snr)最常用的一种客观评价方法就是计算增强后的语音信号的信噪比,又称为讯噪比,狭义来讲是指放大器的输出信号的电压与同时输出的噪声电压的比,常常用分贝数表示。设备的信噪比越高表明它产生的杂音越少。一般来说,信噪比越大,说明混在信号里的噪声越小,声音回放的音质量越高,否则相反。信噪比一般不应该低于 70db,高保真音箱的信噪比应达到110db以上。其计算公式如下: (1-5)式中,是未失真的理想信号,对应于原始纯净语音;是失真后的信号,对应于经过语音增强后的信号。1.2.2 信干比(signal-to-interference ratio,sir)为了说明盲分离的效果,提出的信号干扰比sir(signal interference ratio)的概念:分离性能是通过将每一个估计出的源信号和相应的真实源信号的对比计算出来的。计算分2个步骤进行,首先是将进行分解: (1-6)其中是经某一允许的变形(allowed distortion)修正之后的版本,这里所谓允许的变形是指:例如,对于线性瞬时混合的盲源分离算法,我们可以接受时不变增益的变形(itime-invariant gains allowed distortions);对于卷积混合的盲源分离算法,我们可以接受时不变滤波的变形(time-invariant filters allowed distortions)。而和分别表示干扰、噪声和人工因素带来的误差(artifacts error)。式子(215)右边的4个项分别代表了,如下各部分:来自于期望(wanted)源的部分、来自于不想要的(unwanted)源的部分、来自于传感器噪声的部分咀及来自于其它因素的部分(例如来自于源的禁止变形)。接下来的第2步就是要计算能量比来评估上面4个项的相对数量大小。我们主要关注的是信干比(sir): (1-7)第二章 盲信号处理2.1盲信号处理的概述2.1.1 盲信号处理的基本概念盲信号处理是现代数学信号处理、算智能学近年来迅速发展的重要方向。电子信息、通信、生物医学、图像增强、雷达、地球物理信号处理等众多领域有广泛的应用前景。盲信号处理就是利用系统(如无线信道、通信系统等)的输出观测数据,通过某种信号处理的手段, 获得我们感兴趣的有关信息(如原来独立发射的信号等)。盲信号的研究是当前学术界的一个研究热点,而盲信号分离则是盲信号研究中的一个重要的课题。bss是指从观测到的混合信号中分离出未知的源信号。盲信号中的“盲”意味着两个方面:第一,对源信号一无所知或只有少许的先验知识。第二,混合本身是未知的。这看似是一个不可能的任务,然而理论和实际都证实了只需要相当简单的假设,就可以得到该问题的解。这一特点使得bss成为一种功能相当强大的信息处理方法。混合矩阵分离矩阵噪声向量s(t)x(t)y(t)图2.1.1 盲处理原理框图2.1.2 盲信号处理的方法和分类在盲信号处理中,就源信号进过传输通道的混合方式而言,其处理方法可分为线性瞬时混合信号盲处理、线性卷积混合信号盲处理和非线性混合信号盲处理三类。根据通道传输特性中是否含有噪声、噪声特性(白噪声、有色噪声等)、噪声混合形式,可分为有噪声、无噪声盲处理,含加性噪声和乘性噪声混合信号盲处理等。按源信号和观测信号数目的不同可以将混合方式分为欠定 、适定和超定情况 ;按源信号特性的不同分为 : 平稳 、非平稳 、超高斯 、亚高斯 、超高斯和亚高斯混合分离等 。盲处理的目的可分为盲辨识和盲源分离两大类。盲辨识的目的是求得传输通道混合矩阵(新型混合矩阵、卷积混合矩阵、非线性混合矩阵等)。盲源分离的目的是求得源信号的最佳估计。当盲源分离的各分量相互独立时,就称为独立分量分析,即独立分量分析是盲源分离的一种特殊情况。2.1.3 盲信号处理技术的研究应用近年来,盲信号处理逐渐成为当今信息处理领域中热门的课题之一,并且已经在尤其在生物医学工程、医学图像、语音增强、遥感、通信系统、地震探测、地球物理学、计量经济学和数据挖掘等领域显示出诱人的前景,特别是盲源分离技术、ica的不断发展和应用最为引人注目。下面介绍盲处理应用中的两个主要方面:1.语音识别领域语音信号分离、语音识别是盲处理应用的一个重要领域。最典型的应用就是声控计算机,计算机所接受到的语音指令肯定是肯定是带有各种环境噪声的,还可能存在其他的语音信号(如有其他人说话),而且这些信号源与接收器的相对位置也未知,计算机需要在这种情况下识别出正确的语音命令。在移动通信中,往往存在通信质量问题,极大的影响了通话效果,而盲源分离或盲均衡技术能够消除噪声、抑制干扰及增强语音,提高通话质量。2.生物医学信号处理在生物医学领域,盲信号处理可应用于心电图(ecg)、脑电图(eeg)信号分离、听觉信号分析、功能磁共振图像(fmri)分析等。例如人们常常需要从肌电图中确定神经元细胞信号的触发模式,而emg信号通常由多个特殊的传感器在人体表处测得,从信号源到传感器之间的信号传输介质参数是未知的,而人们之间各不相同。目前已经有一些学者将盲源分离技术成功地够应用于脑电图等信号的数据处理。2.2 盲源分离法2.2.1 盲源分离技术盲源信号分离(blind source separation, bss) 是20世纪90年代迅速发展起来的一个研究领域 。它具有可靠的理论基础和许多方面的应用潜力。其在生物医学工程 、医学图像 、语音增强 、遥感 、通信系统 、地震探测等领域有着广泛而诱人的前景 ,盲源分离成为信号处理和神经网络领域的研究热点 。盲源分离是针对从检测的混合信号中估计或恢复源信号的问题提出的,是指源信号、传输通道特性未知的情况下,仅由观测信号和源信号的一些先验知识(如概率密度)估计出源信号各个分量的过程。例如最著名的鸡尾酒会问题,仅根据多个麦克风检测信号分离或恢复出某种语音源信号。2.2.2 盲分离算法实现在实际的ica盲分离算法应用中,一般有时是必需的对观测数据做一些预处理技术,如用主成分分析 ( pca )降维和白化,用滤波器进行滤波降噪处理等。另外,由于恢复准则的局限以及先验知识的缺乏,盲信号分离方法只能得到源信号的波形,而无法确定信号的幅值以及信号之间的顺序。这两点都需要人为的制定规则(如规定信号的方差为1来确定幅值)来确定。 图2.2.1 盲信号分离基本原理框图2.2.3 盲源分离技术的研究发展和应用1986 年,法国学者jeanny herault和christian jutten提出了递归神经网络模型和基于hebb学习律的学习算法,以实现2个独立源信号混合的分离。这一开创性的论文在信号处理领域中揭开了新的一章,即盲源分离问题的研究。其后二十几年来,对于盲信号分离问题,学者们提出了很多的算法,每种算法都 在一定程度上取得了成功。从算法的角度而言,bss算法可分为批处理算法和自适应算法;从代数函数和准则而言,又分为基于神经网络的方法、基于高阶统计量的方法、基于互信息量的方法、基于非线性函数的方法等。尽管国内对盲信号分离问题的研究相对较晚,但在理论和应用方面也取得很大的进展。清华大学的张贤达教授在其 1996 年出版的时间序列分析高阶统计量方法一书中,介绍了有关盲分离的理论基础,其后关于盲分离的研究才逐渐多起来。近年来国内各类基金支持了盲信号处理理论和应用的项目,也成立了一些研究小组。虽然盲源分离理论方法在最近20年已经取得了长足的发展,但是还有许多问题有待进一步研究和解决。首先是理论体系有待完善。实际采用的处理算法或多或少都带有一些经验知识,对于算法的稳定性和收敛性的证明不够充分。盲源分 离尚有大量的理论和实际问题有待解决,例如多维ica问题、带噪声信号的有效分离方法、如何更有效地利用各种先验知识成功分离或提取出源信号、一般性 的非线性混合信号的盲分离、如何与神经网络有效地结合、源信号的数目大于观察信号的数目时ica方法等。另外,盲源分离可同其他学科有机结合,如模糊系 统理论在盲分离技术中的应用可能是一个有前途的研究方向;盲源分离技术与遗传算法相结合,可以减少计算复杂度,提高收敛速度。如何有效提高算法对源信号统计特性的学习和利用也需要进行深入研究。在硬件实现方面,盲分离问题也存在着极大的发展空间,例如用fpga实现等。经过人们将近20年的共同努力,有关盲分离的理论和算法得到了较快发展,包括 盲分离问题本身的可解性,以及求解原理等方面的基本理论问题在一定程度上得到了解决,并提出了一些在分离能力、内存需求、计算速度等方面性能各异的 算 法。由于该问题的理论研究深度和算法实现难度都较大,目前对于盲分离的研究 仍然很不成熟,难以满足许多实际应用需求,许多理论问题和算法实现的相应技术也有待进一步探索。2.3 独立成分分析独立分量分析 ( independent component analy2sis , ica)是由herault和j utten在1983年提出,该方法不依赖与源信号类型相关的详细知识或信号传输系统特性的精确辨识,是一种有效的冗余取消技术,被广泛应用于盲源分离 ( blind source separation bss)、特征提取和盲解卷、生理学数据分析语音信号处理、图像处理及人脸识别等领域。该方法根据代价函数的不同 ,可以得到不同的ica算法,如信息最大化(infomax)算法、fast ica算法、最大熵( m e)和最小互信息( mm i)算法、极大似然(ml)算法等。在统计学中,独立成分分析或独立分量分析(independent components analysis,缩写:ica)是一种利用统计原理进行计算的方法。它是一个线性变换。这个变换把数据或信号分离成统计独立的非高斯的信号源的线性组合。独立成分分析是盲信号分离(blind source separation)的一种特例。2.3.1 独立成分分析的定义ica是一种用来从多变量(多维)统计数据里找到隐含的因素或成分的方法,被认为是主成分分析(principal component analysis, pca)和因子分析(factor analysis)的一种扩展。对于盲源分离问题,ica是指在只知道混合信号,而不知道源信号、噪声以及混合机制的情况下,分离或近似地分离出源信号的一种分析过程。独立成分分析(independent component analysis, ica)是近年来出现的一种强有力的数据分析工具(hyvarinen a, karhunen j, oja e, 2001; roberts s j, everson r, 2001)。1994年由comon给出了ica的一个较为严格的数学定义,其思想最早是由heranlt和jutten于1986年提出来的。ica从出现到现在虽然时间不长,然而无论从理论上还是应用上,它正受到越来越多的关注,成为国内外研究的一个热点。特别是从应用角度看,它的应用领域与应用前景都是非常广阔的,目前主要应用于盲源分离、图像处理、语言识别、通信、生物医学信号处理、脑功能成像研究、故障诊断、特征提取、金融时间序列分析和数据挖掘等。盲源分离技术是近二十年发展起来的一门新型科学,在各国科学家和研究人员的努力下获得了充分的发展,但是ica的研究方兴未艾,它毕竟是一个涉及面广并且仍处于发展前沿的课题,在理论上还远没有成熟,许多问题有待进一步研究和解决。(1)带噪混合信号的盲分离问题。盲信号处理中的未知条件太多,混合信号含有噪声的情况下的盲源分离问题解决起来是相当困难的。尽管目前已有部分算法对存在噪声的情况表现出了良好的性能,但由于噪声种类繁多,因此处理起来仍很棘手。现有的大多数盲源分离或盲解卷积算法都假设不含噪声或者把噪声看作是一个独立的信源信号来处理。(2)非平稳混合信号的盲源分离算法。许多情况下源信号可能是非平稳的,如何利用信号的非平稳特性进行盲源分离是摆在广大研究人员面前的一个现实问题。(3)卷积混合信号的盲源分离算法。在实际中,系统接收到的混合输入信号是源信号经过不同的传播途径到达接收器。在这个过程中,不可避免的存在信号的时延和反射。针对这种情况的盲源分离算法还很不成熟。(4)ica的推广应用。在算法应用方面,ica可以取得进一步的发展,如可以在语音识别、图像处理、特征提取、医学信号处理方面作进一步的研究。目前的关键的问题是如何将理论算法转化为实际应用,以及如何建立更加符合实际情况的模型等。(5)算法的收敛性。算法全局收敛性的研究,可以考虑将遗传算法、混沌算法等具有全局收敛性的优化算法和ica结合起来,提高算法的全局收敛性。2.3.2 ica的基本原理(1)无噪声的ica模型ica作为生成模型的估计给定随即变量的一组观测,其中是时间或者样本标号,假设它们有独立成分线性混合而产生:=a (2-1)式中,是某个未知矩阵。用向量-矩阵符号方式表示通常比上面的求和表达式更为方便。用随机向量x来表示混合向量,其元素分别为,同样地,用来表示元素,用矩阵表示那些混合系数。所有的向量都理解为列向量;这样或者称的转置就是一个行向量。利用向量和矩阵符号表示,混合模型可以写为: (2-2)有时我们需要使用矩阵a中的列向量,如果将其表示为,则模型也可以写为: (2-3)(2)有噪声的ica模型将基本的ica模型扩展到有噪声的情形,并且假设噪声是以加性噪声形式存在的。这是一个相当现实的假设,因为加性噪声是因子分析和信号处理中通常研究的标准形式,具有简单的噪声模型表达方式。因此,噪声ica模型可表示为: (2-4)式中,是噪声向量。信号源噪声,即直接添加到独立成分(即信号源)上的噪声。信号源噪声可用与式(2.1)稍有差别的下式来表示: (2-5)实际上,如果可以直接考虑带噪声的独立成分,那么可将此模型写为: (2-6)可以看出,这就是基本的ica模型,只是独立成分本身变了。2.3.3 本文对ica的研究目的及实现独立分量分析的含义是把信号分解成若干个互相独立的成分,它是为了解决盲信号分离的问题而发展起来的。如果信号本来就是由若干独立信源混合而成的,ica就能恰好把这些信源分解开来。故在一般的文献中通常把ica等同于bss,ica不同于主分量分析把目光投注于信号的二阶统计量,研究信号间的相关关系,而是基于信号的高阶统计量,研究信号间的独立关系。作为一个形象的图示,我们可以借鉴下面的波形,原始的语言信号是类似图(2.1)中的信号,而混合信号是如图(2.3)样子的数据。需要解决的问题是,如何仅使用图(2.3)中的数据还原的到图(2.1)的“源”信号。图2.3.1 源信号s图2.3.2 混合矩阵a图2.3.3 混合信号x独立成分分析方法能够基于信息的的独立性来估计,这样我们就能从混合信号中分离出三个原始信号。第三章 盲语音信号分离的实现及抑噪分析3.1 盲语音信号分离的实现3.1.1 盲信号分离的三种算法(1)二阶盲辨识(sobi)sobi先对观测信号作白化处理,得到。定义和的时延相关矩阵为 (3-1) (3-2)由易知: (3-3) 又因为,所以 (3-4) (3-5)由各分量相互独立可知,是对角矩阵。由此可见,矩阵可以将对角化。在sobi算法中,取一组不同的值,要求能同时使得各个尽可能的对角化,其中。(2)fastica算法fastica算法是芬兰赫尔辛基工业大学计算机及信息科学实验室hyvarinen等人1997年首先提出并发展起来的,在1999年进一步提出了改进基于负熵的ica固定点算法。该算法基于非高斯性最大化原理,使用固定点(fixed-point)迭代理论寻我w1x非高斯性最大值,采用牛顿迭代算法对观测变量x的大量采样点进行批处理,每次从观测信号中分离出一个独立分量,是独立分量分析的一种快速算法。fastica算法,由于采用了定点迭代的思想,所以又称固定点(fixed-point)算法或定点算法,是一种快速寻优神经网络算法。与普通的神经网络算法不同的是这种算法采用了牛顿迭代的思想对采样点采用批处理的方式,在每一步迭代中有大量的样本数据参与运算。基于目标函数的选择不同,从而产生了fastica算法的基于负熵最大、峭度、互信息最小、最大似然估计等的多种形式。fastica算法的优点:1.收敛速度快,fastica收敛速度为2次以上,普通的ica算法收敛仅为1次(线性)的。2.和梯度算法不同,无须选步长参数,易于使用。3.能利用任何的非线性函数直接找出任何非高斯分布的独立分量,而对于其他的算法来说,概率密度函数的估计不得不首先进行。4.它的性能能够通过选择适当的非线性函数来最佳化。5.独立分量可被逐个估计出来,类似于做投影追踪,这在仅需要估计几个(不是全部)独立分量的情况下,能减小计算量。6.fastica算法有许多神经算法的优点,它是并行、分布式的且计算简单,内存要求很少。然而fastica算法也尤其自身的缺点,首先是它对初值的选择较自然梯度算法敏感,当初值的选择不是很合适的时候,算法的分离性能急剧的下降,其次算法的迭代步长有待进行自适应的优化。(3)cica(constrained independent component analysis,clca)算法本文所使用的约束独立分量分析(constrained independent component analysis,cica)算法倒是一种改良的fastlca算法。在clca提取过程中,通过引入简单的约束参考信号来帮助分离某特定目标分量,从而有利于去除干扰信号。clca算法的基本原理与fastlca相同,每次提取一个独立分量。文中所选用的cica算法,实际上是一种加入了约束参数的fastica算法,从而使ica算法不用再进行特征提取与目标判定,就可以容易的分离出所需要的目标分量。虽然cica算法对信号分离具有良好的效果,但在实际应用过程中,cica还需要进一步的探讨研究。如阈值与学习率的选择不当,就会很容易引起输出结果发散。同时收敛速度与误差函数的选择也有关系,误差函数的形式要根据输入数据和参考信号来进行选择。3.1.2 不同算法的分离性能比较sobi算法利用了源信号的频谱差异性来分离源信号,当源信号中存在频谱结构相似的分量时,分离性能便会较差,这是sobi算法的缺点。fastica算法的特点:1在1ca模型中,fastica算的收敛速度是二次以上的,而梯度搜索法只是一次收敛。2与梯度搜索法相比,fastlca的步长参数容易确定。3该算法适用于任何非高斯信号。4可以通过选择不同的非线性函数g(y)使算法的获得不同的性能。基f独立分量分析的混合语音信号自分离系统的研究5可以逐个的估计独立分量。6该算法是并行的、分布的,且计算简单,需要的内存较少。fastlca算法和其他的ica算法相比,有着许多我们期望的特性:收敛速度快;和梯度算法不同,无需选择步长参数,易于使用;该算法能适用于任何非高斯信号;可以通过使用不同的非线性函数g-(y)使算法获得不同的性能;独立分量可被逐个估计出来,这在仅需要估计几个独立分量的情况下,能减小计算量:fastica算法有许多神经算法的优点:并行、分布、计算简单,内存要求小。3.2 抑制噪声的算法仿真及结果分析3.2.1 抑噪算法仿真实现下面仿真中所使用的语音源信号是在干扰噪声很小的环境下用麦克风录制的4段不同的语音文件,保存成*.wav文件dkumar1.wav, ganesh1.wav, ganesh2.wav, kath2.wav,四个男声采样率均为44100hz,持续时间为7s,采样点数为5000。图41是这4个语音源信号的时域波形,图中的横坐标表示样本点数,纵坐标表不语音信号的幅度水平。原始的语音信号如下: 图3.2.1 原始语音信号s该仿真的混合矩阵是由计算机在icalab工具箱环境下产生的,参数见下图:图3.2.2 矩阵a参数即该矩阵为一个4x4的方阵: 混合后的语音信号: 图3.2.2 混合信号xsobi算法将观察信号x1,x2,x3,x4分离,得到分离后信号y1,y2,y3,y4,分别对应源得到的分离信号y: 图3.2.3 分离信号x从试验结果,我们可以看出分离语音信号从波形上看很好地保持了原始信号的波形,而且实际分离的语音信号在听觉上也很好的实现了分离,而且几乎没有什么失真效果。3.2.2分离结果分析我们分别使用sobi、fastica和cica算法对dkumar1.wav ,ganesh1.wav, ganesh2.wav, kath2.wav 作为源信号的混叠进行盲分离试验,且每种算法分别加入5db、10db、15db的高斯噪声,从中分离出的四个源信号的近似值y1,y2,y3和y4,我们分别用三种上述的盲分离的算法针对本文给出的混合语音信号进行分离并比较每个算法分离后的波形图。下面采用sobi法、fastica法和cica法对混合信号进行分离sobi法的分离结果如图441所示,fastica法的分离结果如图442所示,cica法的分离结果如图4 43所示。图3.2.1 sobi算法在ica工具箱的实现图3.2.2 fpica算法在ica工具箱的实现图3.2.3 cica算法在ica工具箱的实现(1)未加噪声的分离信号:图3.2.4 无噪声的分离结果 (2) 加入噪声为5db的分离信号y:图3.2.5 利用sobi法的分离结果图3.2.6 利用fpica法的分离结果图3.2.7 利用cica法的分离结果(3) 加入噪声为10db的分离信号y:图3.2.8 利用sobi法的分离结果图3.2.9 利用fpica法的分离结果图3.2.10 利用cica法的分离结果(3) 加入噪声为15db的分离信号y:图3.2.11 利用sobi法的分离结果图3.2.12 利用fpica法的分离结果图3.2.13 利用cica法的分离结果比较三种算法得到的分离信号后的波形图4.9图4.10图4.11与原始信号的波形图4.7可以看出三种算法也都较好地恢复除了原始信号的波形虽然在两个源信号中白噪声并不满足非平稳和有色的特性这三种算法也都较好地恢复出了原始信号的波形为了定量地比较三个算法的优劣性我们依然再进行分离前后的信号干扰比的比较。3.2.2 不同算法的分离性能比较 比较三种算法得到的分离信号后的波形图4.4图4.5图4.6与原始信号的波形图4.2可以看出三种算法都较好地恢复了原始信号的波形为了定量地比较三个算法的优劣性下面将对分离前后的信噪比和信号干扰比进行比较。(1)信噪比三种方法信噪比snr对比结果:表3.1 加入噪声为5db的snr对比输出信号算法y1y2y3y4平均snr原始snr3.19488.35280.21460.49543.0644sobi算法42.862638.689027.479128.130934.2904fpica算法37.735838.705028.615833.428134.4673cica算法321.6893325.5677323.2908322.1231323.1677图3.2.14信噪比snr折线图比较一般来说,信噪比越大,说明混在信号里的噪声越小,声音回放的音质量越高,否则相反。由混入5db噪声的语音信号信噪比snr折线图比较可知,经过独立成分分析的三种算法,混入声音信号的噪声已经被大大的降低,即信噪比大大的提高,尤其是cica算法的抑噪效果相对其他两种方法的要明显,分离效果好一些。表3.2 加入噪声为10db的snr对比输出信号算法y1y2y3y4平均snr原始snr4.97530.87870.17614.98072.7522sobi算法42.867248.883840.169427.352039.8180fpica算法39.676132.644035.212032.912835.1112cica算法38.298639.789633.159036.906537.0384图3.2.15 信噪比snr折线图比较从表3.2上可以看到,三种算法获得的snr值基本在40个db左右,有良好的分离性能。由混入10db噪声的语音信号信噪比snr折线图比较可知,经过独立成分分析的三种算法,混入声音信号的噪声已经被大大的降低,即信噪比大大的提高。表3.3 加入噪声为15db的三种方法snr对比输出信号算法y1y2y3y4平均snr原始snr5.48060.02463.49323.98153.2449sobi算法47.909646.617944.696438.290744.3786fpica算法40.854537.189940.594141.088939.9318cica算法44.663546.663534.333135.027540.1716图3.2.15 信噪比snr折线图比较参数snr的值越大,说明结果中分离信号受到相对信号的干扰越小,抗噪声能力也越好,即算法的分离效果越好。(2)信干比三种方法信噪比sir对比结果:sir (5db) y1y2 y3 y4sobi 2.125214.0057 8.904721.8739 fpica 5.1505 9.8687 20.6370 6.0484 cica 13.0533 31.477619.8908 12.2678表3.4 加入噪声为15db的三种方法snr对比图3.2.16 三种算法的信干比sir折线图比较sir可确定分离效果的好坏,sir越大,分离效果越好。由混入5db噪声的语音信号信干比sir折线图比较可知,经过独立成分分析的三种算法,混入声音信号的噪声已经被大大的降低,信干比大大的提高,尤其是cica算法的抑噪效果相对其他两种方法的要明显,分离效果好一些。sir (10db) y1y2 y3 y4sobi0.381420.8609 12.297019.8839 fpica 7.1565 13.9021 3.2482 3.1075 cica 13.8781 3.73120.2918 16.8656表3.5 加入噪声为15db的三种方法snr对比图3.2.17 三种算法的信干比sir折线图比较sir (15db) y1y2 y3 y4sobi18.662720.8026 6.801221.4230 fpica 5.7287 10.12345.4084 1.7941 cica 10.0285 5.85228.5043 17.8183表3.6 加入噪声为15db的三种方法snr对比图3.2.18 三种算法的信干比sir折线图比较sir可确定分离效果的好坏,sir越大,分离效果越好,由上面的折线图可知,混入15db噪声的语音信号信干比sobi分离法分离效果较其他两种好一些。第四章 结论与展望 盲源分离算法是盲源分离问题的核心,本文研究了现有的几种盲源分离算法,并在这些算法的基础上结合具体应用于语音信号的噪声处理,对其加以改进,给出了新的算法。论文的主要工作如下:1研究独立成分分析的原理及其基本模型。传统的选取盲源分离算法只适用于单纯超高斯信号(或者亚高斯信号)混合系统的分离,不适用于杂系混合(超高斯和亚高斯信号)系统的分离。论文中的ica主要应用于语音信号噪声的实现算法,及目前的去除或抑制噪声方法分析,引出独立成分分析不能应用于高斯信号和非独立信号,可用来抑制高斯噪声。2语音信号是一种非平稳信号,本文研究了二阶盲辨识(sobi)盲源分离算法,快速定点(fastica)算法以及约束独立分量分析(cica)算法,利用这三种算法有效地解决了噪声在语音信号中的分离问题,可以在不需要白化过程的情况下,得到良好的分离效果。对算法进行了计算机仿真,并将三种算法在不同噪声环境下的仿真结果进行了比较。盲源分离技术正在不断的发展,新的问题和算法层出不穷。虽然已经有很多成熟的盲源分离算法,但是,作者认为还是有很多问题待于进一步的研究和解决:(1)带噪声混合信号的盲分离问题。由于在盲信号处理中,存在太多的未知条件,带噪声的混迭信号的盲分离是十分困难的。现在研究的大部分盲源分离或者盲反卷积算法,都假设无噪声的情况或者把噪声看作一个独立的源信号,在高阶统计方法中,由于高斯信号高阶累计量为零,所以可以假设加性高斯噪声的存在,但是对于已有的盲源分离算法在什么情况下可以应用到一般的噪声混迭模型,是有待解决的问题。(2)欠完备情形的盲源分离问题。无论是盲源分离还是盲解卷积,现存的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论