基于快速ICA的盲分离应用数理专业毕业论文_第1页
基于快速ICA的盲分离应用数理专业毕业论文_第2页
基于快速ICA的盲分离应用数理专业毕业论文_第3页
基于快速ICA的盲分离应用数理专业毕业论文_第4页
基于快速ICA的盲分离应用数理专业毕业论文_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1北京工业大学毕业设计(论文)任务书题目一种盲分离算法及在实际问题中的应用专业信息与计算科学学号11062206姓名刘颜玮主要内容、基本要求、主要参考资料等独立分量分析是20世纪末发展起来的一类多通道信号分解方法,是信号处理技术发展中的一项前沿热点,本任务主要是实现一个快速ICA算法,然后将其应用在语音信号上,检验其效果。基本要求算法程序主要参看资料“AFASTFIXEDPOINTALGORITHMFORINDEPENDENTCOMPONENTANALYSIS”,AAPOHYVARINEN,EFKKIOJA,NEURALCOMPUTATION,9,148314921997完成期限201505指导教师签章武连文专业负责人签章2015年1月5日23摘要语音信号分离是近几十年来广泛应用于通信、雷达、电子医学等方面的发展方向,其理论基础是语音信号的盲源分离。本文主要介绍了盲源分离和独立分量分析概念以及相关知识,探讨ICA研究中的主要问题。盲信号处理算法分为批处理算法和自适应算法两类,研究得到一种批处理和自适应相结合的快速独立分量分析FASTINDEPENDENTCOMPONENTANALYSIS,FASTICA算法。在语音信号的处理和分离中,声音的信号多种多样,但是来自不同语音源的信号保持相对独立,利用此特点及盲信号分离的思想,将FASTICA算法作用在语音信号的分离及模拟函数信号的分离上。本文重点研究了盲信号处理的思想和ICA算法,明确了ICA方法的数学模型、基本假设条件以及ICA目标函数的估计准则。本文使用三个声音文件以及三个模拟函数信号做实验,用MATLAB进行仿真试验,通过分离前后的波形图进行对比与分析,来证明该算法具有良好的信号分离效果。关键词语音信号分离;盲信号处理算法;独立分量分析;ICA固定点算法45ABSTRACTSPEECHSIGNALSSEPARATIONISWIDELYUSEDINTHEDIRECTIONOFCOMMUNICATION,RADAR,ELECTRONICMEDICALANDOTHERASPECTSINRECENTDECADESTHEIRTHEORYISBASEDONBLINDSOURCESEPARATIONOFSPEECHSIGNALSTHISPAPERDESCRIBESTHEBLINDSOURCESEPARATIONANDINDEPENDENTCOMPONENTANALYSISCONCEPTSANDKNOWLEDGE,TOEXPLOREMAJORISSUESOFICARESEARCHBLINDSIGNALPROCESSINGALGORITHMISDIVIDEDINTOTWOTYPESOFBATCHALGORITHMANDADAPTIVEALGORITHM,THERESEARCHERSOBTAINACOMBINATIONOFBATCHANDADAPTIVEFASTINDEPENDENTCOMPONENTANALYSISFASTINDEPENDENTCOMPONENTANALYSIS,FASTICAALGORITHMINSPEECHSIGNALPROCESSINGANDSEPARATION,SPEECHSIGNALISFULLOFDIFFERENTTYPES,BUTSIGNALSFROMDIFFERENTSOURCESREMAINRELATIVELYINDEPENDENTVOICE,USETHISFEATUREANDBLINDSIGNALSEPARATIONTHOUGHT,THEROLEOFTHEFASTICAALGORITHMANDSIMULATIONFUNCTIONINSEPARATEVOICESIGNALSSEPARATINGTHESIGNALTHISPAPERFOCUSESONTHEIDEAOFBLINDSIGNALPROCESSINGALGORITHMSANDICAALGORITHM,ANDEXPLICITTHEMATHEMATICALMODELOFICA,THEBASICASSUMPTIONSANDCONDITIONSICAESTIMATIONCRITERIAOBJECTIVEFUNCTIONTHISPAPERUSESTHREESOUNDFILESANDTHREEANALOGFUNCTIONSIGNALTOEXPERIMENTWITHMATLABSIMULATIONTEST,THROUGHCOMPARISONANDANALYSISTHROUGHWAVEFORMBEFOREANDAFTERSEPARATION,TOPROVETHATTHEALGORITHMHASAGOODSIGNALSEPARATIONKEYWORDSSPEECHSIGNALSSEPARATIONBLINDSIGNALPROCESSINGINDEPENDENTCOMPONENTANALYSISICAFIXEDPOINTALGORITHM67目录1绪论111研究背景与意义112研究方向12相关知识321概述322处理方法423研究与应用424独立分量分析5241ICA定义6242基本概念63语音信号特性与分析931语音特性932基础知识1033ICA算法10331输入信号波形图分析10332混合信号波形图分析12333模拟信号波形图分析134FASTICA算法1541数据预处理1542FASTICA算法1643基本步骤1844混合信号波形图2045分离信号波形图2146模拟信号的分离波形图2247对比与分析23结论278致谢29参考文献31附录33北京工业大学毕业设计(论文)11绪论11研究背景与意义数字信号处理技术,是自1960年起蓬勃发展起来的。它的发展与计算机的广泛应用密不可分。从诞生起,它便显示出了庞大的潜力,并很快在诸如雷达和声纳,电子通讯工程,以及电子生物医学等领域中应用于实际,并且取得了非常好的效果,使人们对这门技术给予了很大的期望。但是由于上世纪科学能力的不足,只能对一些保持高斯稳态的信号进行处理,在此基础上还需要将其系统控制为因果最小相位,而信号的分析主要使用其相关函数(时域)和功率谱(频域)等二阶统计信息。因为在许多情况下,这些假设大致成立,因此通过实际需要的数字信号处理技术的发展迅速并逐渐完善,且被日益广泛的应用。在这同时,信息理论,盲信号处理,多维信号处理技术,进化算法,模糊推理等等技术过去十年中取得的突破显著,且已经应用到各种通信技术行业中1。在理论与技术方面,这些新的突破已逐渐成为现代数字信号处理的里程碑。使得无论各行各业的研究人员都需要学习并掌握现代信号处理方法,并将其应用于行业中。随着数字信号处理技术的应用在各个行业的发展逐渐深化,以及其本身的潜力与发展空间,大家开始并不满足于对高斯条件下的平稳信号以及线性不变的因果最小相位系统进行处理。因此对于更多无限制条件下的信号进行处理变得迫在眉睫。同时,由于对于高阶统计量和小波变换的研究有很大的进展,现在已经能够对非高斯以及非平稳信号进行信号分析并进行处理。曾经一度让人认为无法解决的加性有色噪声的信号处理,也已经取得了实质性的进展。此外,自适应信号处理算法以及高分辨率频谱分析等方面也有了突破性的发展。12研究方向鸡尾酒会效应,即为盲源分离的一个实际例子。指人在杂乱的环境下或者是很多人同时说话的环境下依旧能分辨出自己感兴趣的声音,这说明人类的大脑可以进行类似于盲源语音分离的工作,在实验中,我们并不能认为计算机可以完全替代人脑对于语音的识别程度,但是通过软件将原本混合在一起的语音信号分开,来模拟杂乱环境下的语音识别系统是可以实现的。北京工业大学毕业设计(论文)2北京工业大学毕业设计(论文)32相关知识21概述盲信号处理是近年来在现代数学信号处理领域中的重要发展前景。它指在信号在无参考信号的条件下,来估计出原始信号的方法,用系统的输出数据,通过处理手段来获得我们想要了解的相关信息。盲信号处理已经能够在移动通信、电子信息处理、探测等等专业行业中深度使用。2盲信号处理的“盲”指的是信号源是不可知的,并且混合系统也是不可知的,因此我们在盲信号处理的过程中不能使用这点。例如,在用移动设备通信时,设备发射的信号是不可知的。而且如果人们在移动中通信,信号源也会移动,使得信道也在不停变化,因此这也是未知的。通信的任务即为从接受到的信号去恢复本身的原始信号。盲信号处理虽然是近几十年内才刚刚发展起来的一门新研究领域,但是由于其应用范围广泛,使得各国科研人员都大力投入在这门学科中,但是研究进程不算太快,因为其涉及的知识面以及应用面都很广阔但是理论却并不是很成熟,因此其中的许多问题都需要进一步的探讨和解决。例如以下几方面1、带噪声的语音信号盲处理很多实际应用的情况下,混合语音信号中往往掺杂着许多噪音,由于本身限制信号处理的制约条件就已经很多,因此在含有大量噪音的情况下去进行盲信号处理还是十分困难的,即使现在很多算法在原语音信号含有噪声的情况下也能展现出较好的处理性能,但是由于噪声种类繁多并且不好控制,进行盲信号处理还是有很大程度的制约。因此在现有的多数盲信号处理的计算方法中,都会假设原信号不含噪音,亦或者是将噪音看作另一个独立的原信号来进行处理。2、非平稳的语音信号盲处理我们的计算过程中一般使用的是平稳的语音信号,但是实际情况中,很多原信号都是非平稳的。在非平稳特性下如何进行盲信号处理也是该学科所面临的一大难题。北京工业大学毕业设计(论文)43、卷积语音信号的盲处理我们进行盲信号处理时一般使用的是直接传递来的语音信号,而大部分实际情况中,系统接收到的信号是通过不同途径传递到接收器中的信号,在传递的过程中,必然会产生信号的反射过程,使得接收到的信号并非原信号本身,在这种情况下的信号盲处理还没有什么很好的解决方式。4、ICA算法的实际应用在进行科学研究中,我们可以在理论的状态下用ICA算法进行识别语音、处理图像、雷达声呐信号处理、处理电子医学信号等等,但是如何将纯理论状态下的算法进行实际推广还有一定难度,因为实际情况远远比理论状态下要复杂的多。将ICA算法推广到实际应用是这门学科发展的当务之急。22处理方法盲信号处理通过各种类别的不同,可划分为很多种方式。其中,依据通过传输信道的混合系统可划分出三类,依次为1线性瞬时混合信号盲处理、2线性卷积混合信号盲处理以及3非线性混合信号盲处理三种3。依据其原信号和观测信号数量的差距可划分为欠定、适定和超定三种情况。依据其原信号分布的不同可划为超高斯、亚高斯、超高斯和亚高斯混合分离,同时其信号还可分为平稳、非平稳等。依据其信道中是否有噪声及其特性可划分为有噪声、无噪声、含加性噪声以及含乘性噪声等。而与此同时,我们可以把盲信号处理的目标分为两种,即盲辨识和盲源分离。一般情况下,我们需要先进行盲辨识,之后进行盲源分离处理。其中盲辨识的目标是为了求出传输通道中用的何种混合矩阵来组成混合系统。而盲源分离的目标则是为了利用混合矩阵来求出原信号的最佳估计。23研究与应用近几年来,盲信号处理已然成为现今时代信息处理领域的重要话题,特别是在生物医学工程,医学影像,语音增强,通信系统,地震勘测,地球物理,计量经济学和北京工业大学毕业设计(论文)5数据挖掘等领域表现出庞大的发展潜力,尤其是盲源分离技术,通过ICA技术的不断挖掘和应用于实际,它已经变得相当令人瞩目。下面介绍盲信号处理被应用的最为广泛的两个领域1、生物医学信号在生物医学领域,盲信号处理可以被应用到心脑电图信号分离,可听信号分析,以及功能性磁共振成像分析等等方面。现在在电子医学方面,心脑电图等等的数据处理上,已经很广泛的应用了盲信号处理的思想与技术来进行识别、除伪迹等工作。42、语音识别领域语音识别是新一代人机交互所需的重要技术之一,也是机器即将更加人性化所需的技术基础,而噪声则是阻碍其进行语音识别的主要影响原因之一,尤其是类似于“鸡尾酒会效应”的环境下,噪声复杂且多变,这使得机器想进行语音识别变得更加的困难,而盲信号处理就可以帮助去除噪音,起到抑制信号干扰,加强语音信号程度,提高语音质量的重要作用,因此盲信号处理在语音识别领域起到了重要的推进作用。24独立分量分析独立分量分析INDEPENDENTCOMPONENTANALYSIS,ICA是1990年前后得以发展并被广泛认知和使用的一种新型信号处理技术,它是一种从多个源信号通过混合系统得出的线性混合信号中,通过计算混合矩阵,来分离出源信号的技术。在这个计算过程中,除去已知源信号是相互独立以外并无其它条件,来分离或近似分离出原信号的分析过程。5从原理上来讲,只靠单一通道去观察信号本身是无法做到这种目的的分解手段,只有通过寻求一组把这些信源按不同混合组合起来的多通道同步观察才有可能完成。从另一个方面讲,ICA算法是分析多导信号的一种手段,然而如果将得到的一组观测信号拆分为几个互不相关的单独信号,拆分结果必然不一定,所以拆分必须加一定的约束条件来使得到的结果更接近我们所期望的数值。ICA算法是基于在各个领域中困扰许久的盲源问题而被广泛重视并研究的,故其又称盲源分离算法。北京工业大学毕业设计(论文)6241ICA定义ICA是在多变量(多维)统计数据中来找出其中隐藏因素及成分的手段,它被广泛认为是主要成分分析PRINCIPALCOMPONENTANALYSIS,PCA和因子分析FACTORANALYSIS的扩展手段。ICA是在仅知混合信号而不知源信号、混合机制及噪声干扰的情况下,通过一定的算法来得到原信号的最佳估计值的手段。在信号处理领域中,盲信号处理(其中涵盖盲辨识、盲信源分解、盲通道均衡等等)是在20世纪90年代后期才发展起来的,ICA是其中的一个重要组成部分。最早提出ICA理念的是JUTTEN与HERAULT分别于1986年和1991年在SIGNALPROCESSING期刊上发表的论文。他们在论文中阐述的理念让人耳目一新,但是理论上却不够完善。在这之后,由COMON在1994年发表了一份新的论文,在理论上赋予了更加严谨的数学定义。到了20世纪末,随着科学技术的发展,ICA出现了很多不同的处理算法,被广泛应用于全世界很多科研单位的科学研究中。5从时间上我们可以看出,ICA的发展历程非常晚,从出现到现在时间很短,但是不论是理论上还是实际应用上,ICA都在被世人所广泛关注着,在国内外都是重点的研究对象。特别在应用方面,ICA所展示出的适用范围和前景是十分可观的。目前其主要应用于盲源分离、语音识别、通信领域、生物医学工程、心脑功能成像、时间序列分析以及数据挖掘等等领域。242基本概念ICA的基本过程如下图所示图21由图示,在信源ST中的每个信号互不干涉的前提下,经过混合系统A混合,再由观察XT来通过解混系统B将其分离开来,使得输出的YT能够最大限度的逼近于ST。一般情况下,我们将解混系统分为两步即为球化W和正交变换系统U,通过这两步来达到解混的目的。北京工业大学毕业设计(论文)7并且通过这个整体过程我们可以知道,独立分量分析在应用上只是一个优化手段,我们所做的过程无法得到唯一解。我们所能做的只是在某一衡量独立性的判断依据最优的意义下来寻求问题的最近似答案,来使得YT中的各个分量能够尽可能的互不干涉;YT与ST不只是相互近似,得出的结果在幅度大小和排列顺序上都允许它们有一定程度的不同。解混系统B中,我们采用两步法来进行解混时,第一步的“球化”是使输出ZT的各个分量Z1T、Z2T等等的方差为1,并且互不相关(但不一定相互独立);第二步的“正交变换”是使输出的分量Y1、Y2等等的方差继续保持为1,同时使其互不干涉。由于输出的Z1T、Z2T等分量均满足了二阶统计量中对于独立性的要求,因此进行第二步的时候我们只需要考虑三阶以上的统计量(通常情况下主要是三阶和四阶统计量),来使算法能够简化。因此在各种文献中,有时我们将ICA作为一种“对于任意多变量数据来寻求一种非正交坐标系统的分解方法”。图21中的流程图中并没有考虑噪声,这种情况下的模型如下1、无噪声ICA模型给定随机变量的一组观测X1T、X2T、X3TXNT,其中T是样本或者时间的编号,假设他们是由独立分量线性混合而成的11223344XTSTXTSTAXTSTXTST21式中的A即为混合系统,是一个未知矩阵。用向量和矩阵符号方式来表述上式。随机向量X指混合向量,由X1、X2XN组成,S指元素S1、S2SN,A指混合矩阵系数AIJ。利用向量和矩阵符号,可以将混合模型表示成如下形式XAS22如果在计算中要用到混合系统A中的列向量时,前模型也可以写为如下形式1NIIIXAS23北京工业大学毕业设计(论文)8当我们将噪声的情况考虑进去时,会得到以下情况。2、有噪声ICA模型现实中很大部分情况,在语音信号处理中是有加性噪声的存在的,我们将上面基本无噪声ICA模型扩展到有噪声的情况下,就会得到如下新的模型XASN24式中的12,TNNNNN是噪声向量。如果噪声是直接添加在原信号的情况下时,信号原噪声可用如下公式来表示XASN25以上即为有噪声情况下的ICA模型。北京工业大学毕业设计(论文)93语音信号特性与分析31语音特性语音,是人们交谈的语言符号的传输系统。语音由人的发声系统产生,承载语言含义。语音的物理基础主要为音长、音强、音调、音色,这是语音的决定性因素。音长,取决于发声持续时间的长短,也可称之为“时长”;音强指声波振动幅度的大小,也称“响度”;音调指声波的频率,即每秒钟振动次数的多少,频率快则音调高,慢则音调低;音色指声音的本质与特色,也称为“音质”,是一种声音相较于其余声音信号辨识度的基本特质。语音信号有如下两点特性1、短时平稳性由对语音信号的研究我们可以知道,语音信号是一种不平稳并且会随时间改变的传输信号。而从另一个角度来说,人的发声系统的结构在一定时间内的变化是有限的,在极短的时间内(1030MS),人的声带形状是基本稳定不变的。由此我们可以认为语音的特性在较短的时间内是稳定不变的,语音的短时平稳性是我们进行语音信号分析以及处理的基础。2、清音和浊音语音主要分为清音、浊音以及爆破音三种,它们在产生的方式上有极大的差别,在这里我们只讨论清音与浊音。清音由随机性噪音所产生,在时域和频域上并无明显周期性及特征,与白噪音相似;而浊音由周期性脉冲产生,在时域上有非常明显的周期性,在频域上浊音的能量主要出现在低频段中,并且会有共振峰结构。3、语音的时域特征在大部分情况下,发声人说话内容时间均不同,毫无规律可言,所以语音信号是随时改变的,但是由语音的短时平稳性作为基础,我们才可以在语音处理中进行计算与分析。人在讲话时,句与句、字与字之间必然会存在一定时间内的间隔,因此从时北京工业大学毕业设计(论文)10域上来看,语音信号可以分为两种音段有音段和无音段。通过检测语音信号中有音段和无音段,可以去除语音中比较明显的噪声,且无音段越多,语音的稀疏性就越好。4、语音的频域特征语音信号中,频谱能量一般集中于3003400HZ的区间中。由于语音信号主要分为浊音和清音,浊音信号所含的能量较多,占据整个语音信号的大部分,频谱集中在低频段,并且会表现出周期性;清音信号出现则较随机,在频谱图上基本与白噪音类似。32基础知识根据所要分析的参数的不同,语音信号处理的手段又可分为时域、频域、倒频域等手段。其中时域分析较简洁,并且物理意义十分明确。在进行频谱分析时,我们需要对语音信号进行加窗处理,通过一个波形函数的分段来使得每次只需要处理“窗”所分出的数据。由于在显示中,语音信号一般有一定长度,而我们并不需要对所有数据进行一次性处理。语音信号一般是在1030MS之间,我们可将其视为平稳的。因此我们可以每次只取一段数据,进行分析,然后取下一段数据分析,依此类推。由于人说话的声音可分为浊音、清音以及静音三部分,所以我们需要改变原语音的基音频率,来达到变声的目的。方法是直接将采样数据乘一个余弦函数,通过这种方法可以将原语音信号的频段调到一个更高的频段,来达到变声的目的。这种方法适于分析时域及频域特效。33ICA算法331输入信号波形图分析在实验中,我们通过MATLAB来处理选取的音频文件,因为MATLAB仅支持WAV格式的音频文件读取及处理,因此我在网上找了几个WAV音频来进行模拟算法,分别为信号一天下无贼中的对白;信号二龙吼的声音;信号三一段萨克斯音乐,来确保三种信号没有类似性。通过书籍以及网络查阅,编写了程序来用MATLAB对这三个音频信号进行处理及分析,程序如附录所示。北京工业大学毕业设计(论文)11图31北京工业大学毕业设计(论文)12332混合信号波形图分析通过程序处理,来将以上三个原始信号进行混合,然后用来模拟ICA算法,下为经过程序处理混合后的语音信号的波形图分析,程序如附录所示。图32北京工业大学毕业设计(论文)13333模拟信号波形图分析通过程序不仅可以模拟语音信号,我们可以将函数信号也使用到算法当中,将一个正弦函数、一个余弦函数和一个高斯随机函数应用到算法中来模拟ICA算法检验其效果,得到的波形图如下图33北京工业大学毕业设计(论文)14图34北京工业大学毕业设计(论文)154FASTICA算法41数据预处理在大多数情况下,我们进行语音信号盲处理时得到的数据都具有着相关性,所以需要在处理之前对数据进行球化,因为球化处理可去除各个观测信号之间的相关性,使得之后在提取独立分量的过程中更加简单一些。并且很多时候,将进行了球化处理的结果与未进行球化处理的结果来比较可以发现,前者的收敛性往往更好。对语音信号数据进行预处理的方式如下假设一个零均值的随机向量ZZ1,Z2,,ZMT满足EZZTI,即可称该向量为球化向量。球化处理即为去相关,与主分量分析是目标一致的。在ICA中,对于均值为0的独立原信号STS1T,S2T,SNTT,有ESISJESIESJ0,当IJ,并且其协方差矩阵是单位阵COVSI,由此可以得知原信号ST是球化的。接下来对观测信号XT,我们需要寻找一个线性变换,来让XT在投影到新的子空间后会变成球化向量,即0ZTWXT41其中W0为球化矩阵,Z为球化向量。接下来用主分量分析,通过计算样本向量能够得到一个变换120TWU42上式中代表协方差矩阵CX的特征值矩阵,U代表协方差矩阵CX的特征向量矩阵。由此我们可以得知,线性变换W0满足球化变换的要求,由正交变换的规律,能够保证UTUUUTI。因此协方差矩阵能够写成如下形式111111222222TTTTTEZZEUXXUUEXXUI43接下来将XTAST代入到ZTW0XT,并令0WAA,有0ZTWASTAST44北京工业大学毕业设计(论文)16因为上式中线性变换A是连接两个球化随机矢量ZT和ST,我们可以得知A必然是正交变换。假如我们将上式中的ZT视为一个新的观测信号,那么可以认为,我们将原混合矩阵A经过球化简化成为了一个新的正交矩阵A。正交变换相当于是对多维矢量所在的坐标轴进行了一次旋转。在多维情况下,混合矩阵A是NN的,经过球化处理之后的新混合矩阵A,因为其本身为正交矩阵,自由度下降为12NN,所以可以说球化处理能使我们进行ICA问题的工作量降低了很多。在ICA问题的处理中,进行球化处理的方法可以有效降低问题的计算量和复杂度,并且算法不算困难,通过传统PCA即可解决。42FASTICA算法FASTICA算法,也称为固定点(FIXEDPOINT)算法,是一种快速寻优迭代算法,有效的统一了自适应与批处理的计算方式,在每一次迭代过程中都运算了大量的样本数据。FASTICA算法有很多种形式,如基于峭度、基于似然最大、基于负熵等等,在这里我们主要使用基于负熵的ICA算法。1997年,芬兰赫尔辛基大学学者AAPOHYVRINEN等人率先提出了一种基于四阶累积量的固定点算法,并且在这之后他们于1999年又提出了一种改进的方法基于负熵的ICA固定点算法。而在2001年,他们在出版的INDEPENDENTCOMPONENTANALYSIS一书中,进行了进一步的简化。由于新的算法相较于自适应以及批处理算法具有更快的收敛速度,由此这种算法也称“快速ICA算法”(FASTICA,FICA)。5由于FASTICA算法是以负熵最大作为寻找方向的,所以我们需要先确定下负熵的判断条件。从信息论理论中,我们可以知道如果所有随机变量均为等方差的情况下,那么其中高斯变量的熵是最大的。所以我们能够利用这个性质来度量非高斯性。由中心极限定理,如果一个随机变量X由许多相互独立的随机变量SII1,2,3,N之和组成,那么只要SI具有有限的均值与方差,不论它是哪种分布,随机变量X必然比SI更接近高斯分布。所以,在分离的过程中,能够使用分离结果的非高斯性的度量来表示分离结果之间的独立性。各独立分量分离完成的条件就是其非高斯性的度量达到最大值。负熵的定义GGAUSSNYHYHY45北京工业大学毕业设计(论文)17上式中的GAUSY是一个和Y拥有相同方差的高斯随机变量;HY是该随机变量的微分熵。其式如下LGYYHYPPD46根据信息论的理论我们可以知道,如果几个随机变量有相同的方差,那么高斯分布的随机变量具有较大的微分熵。当上式中的Y具有高斯分布时,0GNY;并且Y的非高斯性越强,它的微分熵就会越小,GNY的值也会相对越大,所以我们可以将GNY作为随机变量Y的非高斯性测度。但是因为计算微分熵需要知道Y的概率密度分布函数,而我们并不能得知这点,因此只能采取下式作为近似算法2GGAUSSNYEGYEGY47其中EGY是均值运算;GAUSGY为非线性函数,可以设G1YTANH1AY,或22EXP2YGYY,亦或者33GYY。在这里,由于112A,所以通常取1A1。快速ICA算法的目的是找到一个方法来使得WTXYWTX的非高斯性达到最大。快速ICA算法的推导过程如下第一,通过对EGWTX进行优化来得到WTX的最大近似负熵。由KUHNTUCKER条件可得,EWTX2|W|21的约束条件下,EGWTX能再满足下式的条件点上得到最优值0TEXGWXW48上式中,的值恒定,00TTEWXGWX,W0是优化后的W。接下来用F来表示48式左边的函数,可以得到F的雅克比矩阵JFWTTJFWEXXGWXI49为了简化以上的矩阵求逆过程,我们可以将其近似为49式的第一项。因为数据已经进行了球化处理,有TEXXI,得到下式TTTTEXXGWXEXXTEGWXEGWXI410由上式的变换,雅克比矩阵变为了对角阵,较易进行求逆计算。计算得到以下近似牛顿迭代公式/TTWWEXGWXWEGWX北京工业大学毕业设计(论文)18/WWW411在上式中,W是W的新值,TTEWXGWX,将解进行规范化能有有效提高解的稳定性。简化后即可得快速ICA算法的迭代公式如下TTWEXGWXEGWXW/WWW412在实际应用中,快速ICA算法所要用到的期望要用其估计值来取代。最好的估计值必然是数据相应的样本平均。在理想条件下,快速ICA算法应该计算所有的样本有效数据,但是这样会大大降低计算效率。因此,通常在实际应用中,我们要取一部分样本的平均来作为估计值,而这样做会使得估计的精确度很大限度上受制于所取样本数目的多少。因此在迭代计算中,样本应该分别来选取。如果计算中的收敛并不理想的话,应该相应增加样本数量来提高收敛度和估计的精确度。43基本步骤1、将观测数据中心化,使其均值为0XXEX4132、对数据球化处理,求自相关系数以及对自相关系数自相关系数HXREXX414对自相关系数HXUUR415球化处理12HZVX4163、选择一个任意正交矩阵作为初始权矢量W0;4、用迭代公式更新每一列WI,令TTIIIWEZGWZEGWZW417其中非线性函数G可以使用以下函数1TANHGYH222YGYYE418北京工业大学毕业设计(论文)1933GYY5、将W正交化12TWWWW4196、如果W不收敛(迭代后的改变更大),则返回第四步。北京工业大学毕业设计(论文)2044混合信号波形图在论文上一部分中,已经得到了通过随机混合矩阵进行混合的语音信号的波形图,如下所示图41北京工业大学毕业设计(论文)2145分离信号波形图对得到的混合语音信号进行ICA分离,通过MATLAB编程处理的算法进行分析,得到了如下三个分离出的语音信号的波形图,如下图所示图42北京工业大学毕业设计(论文)2246模拟信号的分离波形图用同样的程序对之前的模拟函数信号进行分离,得到的三个分离后的波形图如下图43北京工业大学毕业设计(论文)2347对比与分析(一)通过将原语音信号与分离语音信号放在一起直观对比进行分析图43通过对比原语音信号和进行FICA分离之后得到的语音信号的波形图以及听取分离后得到音频文件,我们可以发现如下几点1、FICA算法比较有效的对语音信号进行了分离;北京工业大学毕业设计(论文)242、在多次试验中我们发现FICA算法不可避免的打乱了输入信号和输出信号的顺序,在上图这次试验中,原信号1是对应解混信号3,原信号2是对应解混信号1,原信号3是对应解混信号2;3、FICA算法对信号的幅值有较大改变,证明FICA算法可用于信号的放大处理上。4、对解混阵的变化幅度进行了微调,乘以从001到099的倍率,解混信号并无太大变化,证明该算法较稳定。(二)通过将原模拟函数信号与分离模拟函数信号放在一起直观对比进行分析图44北京工业大学毕业设计(论文)25通过对比原模拟函数信号和进行FICA分离之后得到的模拟函数信号的波形图,我们可以发现如下几点1、FICA算法比较有效的对模拟函数信号进行了分离;2、与语音信号的试验相同,在多次试验中,FICA算法同样不可避免的打乱了输出信号的顺序,在上图选取的这次试验中,解混信号1对应的是输入信号2,解混信号2对应的是输入信号1,解混信号3对应的是输入信号3;3、对于模拟函数信号,FICA算法对于幅值同样有些许的放大,但是没有语音信号明显;4、在算法过程中,有时会使模拟信号的波形发生上下颠倒。北京工业大学毕业设计(论文)26北京工业大学毕业设计(论文)27结论通过实验我们能够得出快速ICA算法可以有效的进行语音信号的分离处理。对于模拟函数信号同样有很好的分离效果。达到了实验的初衷实现一个快速ICA算法,并将其应用于语音信号上,检验其效果。通过实验我们可以得到如下结论1、快速ICA算法可以有效的对语音信号和模拟函数信号进行分离;2、算法对于参数的变化不太敏感,具有鲁棒性。发现了快速ICA算法在语音信号的放大上存在的潜力。但是本次实验也有几点缺点,比如没有能对比语音信号混合和分离的频谱及幅值等信号图,如果这些信息全部可以得到的话对本次实验能够更有说服力。北京工业大学毕业设计(论文)28北京工业大学毕业设计(论文)29致谢本论文的工作是在我的导师武连文讲师的悉心指导下完成的,武连文老师严谨的治学态度和科学的工作方法给了我极大的帮助和影响,从大一开始我就上过武连文老师的课程,深有感触,武连文老师对他指导的我们所有做毕业设计的同学都很认真,悉心指导学业以及程序设计,深度解答我们的疑问。并且老师平易近人,求真务实,积极进取的人生态度也影响着我们。在此衷心感谢四年来武连文老师对我的学业上的帮助和指导。在编写程序及撰写论文期间,与我同在武连文老师指导下的同学们互相帮助,他们都为我的工作提出了宝贵的意见,对我不懂的问题都给予了很多指导,在此对小组的同学们表示衷心的感谢。另外,感谢我的父母,为我的学业提供了无私的帮助和理解,使我能专心在学业中拼搏。感谢我的家人以及朋友对我的支持。北京工业大学毕业设计(论文)30北京工业大学毕业设计(论文)31参考文献1杨福生洪波独立分量分析的原理与应用清华大学出版社,2006年2TEWONLEEINDEPENDENTCOMPONENTANALYSISKLUWERACADEMICPRESS,1998年3AAPOHYVARINEN,JUHAKARHUNENERKKIOJAINDEPENDENTCOMPONENTANALYSIS,2001年4MARKGIROLAMIINDEPENDENTCOMPONENTANALYSISANDBLINDSOURCESEPARATION。SPRINGERVERLAGLONDONLIMITED,1999年北京工业大学毕业设计(论文)32北京工业大学毕业设计(论文)33附录初始化CLCCLEARALLCLOSEALL读入原始图像,混合,并输出混合图像读入混合前的原始图片并显示I1WAVREADMWAVI1I11,1200000I2WAVREADNWAVI2I21,1200000I3WAVREADOWAVI3I31,1200000RESHAPESUBPLOT4,3,1,PLOTI1,TITLE输入声音1,SUBPLOT4,3,2,PLOTI2,TITLE输入声音2,SUBPLOT4,3,3,PLOTI3,TITLE输入声音3,FS1000N1024T0N

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论