基于ica的语音分离技术研究(参考)_第1页
基于ica的语音分离技术研究(参考)_第2页
基于ica的语音分离技术研究(参考)_第3页
基于ica的语音分离技术研究(参考)_第4页
基于ica的语音分离技术研究(参考)_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于ICA的语音分离技术研究摘要语音分离技术在语音通道、声学目标检测、声音信号增强等方面都有重要的理论意义和实用价值。目前,这方面的最新研究成果主要是盲源分离BSS。而独立分量分析ICA是近二十年逐渐发展起来的一种新的盲源分离方法。它是一种统计方法,其目的是从由传感器收集到的混合信号中分离出相互独立的源信号,是这些分离出的信号尽可能独立。它在语音识别、电信和医学信号处理等信号处理方面有广泛的应用。本文简要阐明了语音分离技术和独立分量分析的目的、意义及发展现状,详细论述了ICA的原理及实现过程,系统介绍了目前几种主要的ICA算法。介绍了一种结构简单的快速定点ICA算法FASTICA。利用该算法的思想及原理,对多通道语音分离进行研究并进行仿真实验。最后对全文作出总结,并对语音分离技术以及ICA在这方面存在的问题和进一步的研究方向进行展望。关键词语音分离盲源分离ICA熵FASTICA多通道单RESEARCHONTECHNOCOGYOFSPEECHSEPARACTIONBASEDONINDEPENDENTCOMPONENTANALYSISABSTRACTTHETECHENIQUEOFSPEECHSEPARATIONHASANVERYIMPORTANTTHEOVETICALSENSEANDUTILITYVALUEINSPEECHCHANEL,ACOUSTISAIMMEASUREANDSPEECHENHANCEMENTATPRESENT,THENEWRESEARCHHARVESTISBLINDSOURCESEPARATIONBSSATTHISASPECTINDEPENDENTCOMPONENTANALYSISICAISANAPPROACHTOBLINDSIGNALSEPARATION,WHICHHASBEENDEVELOPEDDURINGPASTTWENTYYEARSITISASTATISTICALMETHOD,WHICHAIMSTORECOVERINDEPENDENTORIGINALSIGNALSFROMOBSERVEDSIGNALSGIVENBYSENSORSWHICHARELINERMIXTURESOFTHEINDEPENDENTASPOSSIBLEITISWIDELYUSEFULINSIGNALPROCESSINGSUCHASSPEECHRECOGNITIONSYSTEM,TELECOMMUNICATION,ANDMEDICALSIGNALPROCESSINGTHISPAPERBRIEFLYSHOWSTHEAIMS,APPLICATIONANDDEVELOPMENTSTATEOFICAANDSPEECHSEPARATION,PARTICULARLYTREATSBASICPRINCIPLEANDIMPLEMENTATIONOFICA,ROUNDLYINTRODUCESCURRENTSEVERALMAINICAALGORITHMSFOLLOWINGTHEABOVE,THISPAPERINTRODUCESASIMPLESTRUCTUREOFFASTFIXPOINTFASTICAITALSODISCUSSTHEMULTICENTERSPEECHSEPARATIONSPEECHSEPARATIONWITHTHETHINKANDMETHODOFICAANDDESCRIBESOMEEXPERIMENTSONAPPLICATIONINTHEFIELDOFSPEECHPROCESSINGATTHESAMETIME,THERESULTSOFTHEEXPERIMENTSAREGIVEATLAST,SUMSUPTHISPAPERANDDISCUSSESTHEFURTHERRESEARCHISSUESANDPOTENTIALAPPLICATIONSABOUTSPEECHSEPARATIONANDICAKEYWORDSSPEECHSEPARATIONBLINDSOURCESEPARATIONICAENTHROPYFASTICAMULTICENTERSINGLECHANNEL目录中文摘要1英文摘要2目录3第一章绪论411语音分离的目的和意义412语音分离技术的发展和现状413盲信号分离技术514ICA的基本原理和应用515本文的主要工作7第二章ICA及几种算法821预备知识822ICA定义及数学模型1023独立分量分析ICA的原理1124现有的几种ICA算法12第三章基于ICA的多通道语音分离1731引言1732FASTICA算法1733FASTICA算法的特征2034仿真实验21第四章总结和展望2341总结2342展望23致谢25参考文献26第一章绪论11语音分离的目的和意义在现实世界的声学环境中,常常存在许多声源和感兴趣的语音信号的混合在一起的情况。语音分离的目的就是在有多个话者语音同时存在时,提取特定话者的语音。语音分离问题来源于著名的“鸡尾酒会问题”,这个问题可以被描述成在复杂的背景噪声和多个人交谈的情况下,能够集中注意力于某个人说话内容的能力盲信号分离技术是目前的主要研究方向。语音分离技术的研究具有重要的意义在语音识别系统的前端进行语音分离,可以极大的提高识别系统在实际环境中的分辨能力;在电话会议系统中,由于麦克风记录的是混合语音是感兴趣说话人的语音质量大大降低,语音分离技术可以用来提高所感兴趣的人的语音质量,从而改善电话会议的效果;另外语音分离算法可以实现声源定位,确定说话人的个数,这方面的研究对智能机器人的智能化研究具有十分重要的作用1,2。12语音分离技术的的发展和现状语音增强的经典算法是谱减法3,它在检测到目标语音处于不活动状态的情况下,估计背景噪声的统计特性,然后利用这些统计特性实现语音信号的增强。它适合平稳噪声,不适合语音分离,因为干扰语音源是非平稳噪声,在一个时间估计的统计特性在另一时间无效,所以无法进行语音分离。子空间分解法是依据字空间准则,把含噪语音进行分解,信号分解为信号字空间和噪声字空间,得到信号和噪声不同的统计特性,然后去掉噪声,它也只适用于去除平稳噪声3,因为目标语音和干扰语音没有显著的统计特性和谱特性差别,所以该方法同样不能进行有效的语音分离。最小均方算法(LMS)4是利用许多与干涉源信号相关的参考信号,来除去有用语音信号中的干扰项,但在实际的语音分离中,会将部分目标语音去除,导致语音分离的效果变差。基于多麦克风阵列的波束形成技术已经被用来抑制混合语音中的干涉语音。将从多个麦克风阵列中得到的语音通过各种各样的滤波过程,实现对特定语音的抑制或放大,滤波过程依赖于对声学环境的先验知识或利用统计特性的自适应的进行。但它有自身的局限性第一,为增强一个语音需要许多麦克风,代价高;第二,波束形成所需要的麦克风阵列中各个麦克风的距离是由目标语音波长所决定的,使用上不方便;第三,波束形成是频率相关技术,由于语音是全频带信号,很难在各个频段都取得较好的效果。由以上看出由于构成混叠语音的各源语音信号在时域和频域上完全重叠,因而常用的语音增强方法难以将感兴趣的目标语音从干扰语音中分离出来。目前,这方面的最新研究主要以盲信号分离(BLINDSIGNALSEPARATION,BSS)5,6和声场景分析(AUDITORYSCENEANALYSIS,ASA)7两类方法为主。13盲信号分离技术所谓盲信号分离就是根据观测到混合数据向量确定一变换以恢复原始信号或信源。盲信号分离中的“盲”指的是1源信号的形式是未知的,2源信号的混合方式是未知的8。盲信号处理主要应用到阵列信号处理、无线通信中用一个通道实现多用户通信服务、通信均衡、脑电信号分离、多说话人语音信号的分离以及隐性经济因素提取等用途。已经成为目前研究的一个热门。盲信号处理需要几个假设条件1源信号的个数和观测信号的个数相等2源信号的各分量都是零均值的实随机变量,且在任意时刻均相互独立3源信号的各分量中最多允许一个具有高斯分布4各传感器的引入噪声很小5对源信号的概率密度函数有些先验知识14ICA的基本原理和应用141ICA的提出独立分量分析ICA6方法是近二十年逐渐发展起来的一种高效盲信号分离方法。它最早是用来解决“鸡尾酒会”问题的。它最早由HERAULT和JUTTEN9提出。下面我们看一下什么是“鸡尾酒会”问题。假设在一个房间内有两个人同时说话,在不同的位置放两个话筒记录房间的说话声,现在要将两个人的说话声分离出来。假设话筒采集信号为,,两个1X2人的说话语音信号用,表示,由于每个话筒记录的均是两人的混合声音,所以1S2可用如下方程表示211SAX2其中系数A是与话筒和说话人距离相关的参数。在这种情况下我们希望只利用观测信号和,就能得到源信号和,这就是“鸡尾酒会”问题。1X21S2如果值是已知的,利用传统的方法很容易解决,反之,问题就比较复杂。IJA然而,实际上只要,是统计独立的,我们可用统计方法估计出的值。ICA正1S2IJA是这样一种统计方法。它能从传感器观测到的混合信号中分离出源信号,是分离出的信号之间尽可能独立10。ICA的处理流程原始数据预处理后数据分离信号重建XXYX图11ICA的处理流程142ICA的应用近来,通过ICA实现的盲源分离引起了广泛的关注,主要是因为该方法在语音识别、特征提取、生物信号处理以及CDMA通信系统和金融数据分析等方面有着广泛的应用。特征提取是广泛运用在图象和声音压缩技术,通过ICA方法可以对图象或声音进行分解,在噪声消除,语音合成方面有很好的效果。在生物信号处理中,脑电信号是大脑皮层的不同活动产生的生物电信号混合而成的信号,仅由脑电图观测的混合信号不能确切的知道大脑皮层不同的活动,通过运用ICA方法对脑电图信号进行分解,可以分解出大脑皮层的不同活动信息。在CDMA通信系统中,ICA算法可用来解决其中的“远近”问题,该问题实际上是一个多用户检测问题。在金融信息处理方面,一个零售链的现金流是由销售期,顾客购买能力,新的商品价格等诸多因素决定的,而这些因素之间上相互独立的,使用ICA算法能仅通过现金流数据大致分析出这些独立因素的情况,从而制定出相预处理白化和中心化ICA/BSS处理后加工去噪等应的管理策略。15本文的主要内容第一章简单阐述了语音分离技术研究的现状及意义,盲信号分离技术及其假设条件,ICA方法的提出、处理流程及应用。第二章详细论述ICA的定义、数学模型及原理,现有的几种方法及之间的联系,具体介绍快速ICA算法FASTICA。第三章介绍基于ICA多通道语音分离技术并进行仿真实验。第四章探究基于ICA单通道语音分离技术并进行仿真实验。第五章对全文做一个总结,指出基于ICA语音分离存在的不足之处,介ICA一些新的应用和进一步的研究方向。第二章ICA及几种算法21预备知识独立分量分析ICA涉及的基础知识较宽,需要概率论、随机过程以及线性代数的知识,还经常涉及到信息论,所以先介绍以下几个重要的概念及公式。211特征函数特征函数的定义如下对一单变量(也就是一维)情况WEDXEE21XPJWJWX对多变量(也就是多维)情况设,则XTMX,321M,321TXEDXEE22WPJWTXJWT由定义可见特征函数是以为对求得的均值;也可理解成的反演傅氏变换。212熵熵是对随机变量不确定性的描述,也称为平均信息量或信息量。一个随机变量X的熵定义为HXXXDX23P这里,是的概率密度函数,是以2为底的对数,熵的单位是比特(BIT),如果采用以E为底的对数,熵的单位是奈特NIT,采用以10为底的对数,熵的单位是哈莱特。213互信息对于两个随机变量X,Y,它们之间存在统计依存关系,在已知Y取值条件下,X的不确定程度(这里用X的条件熵来度量)HX|Y总不大于X的无条件熵HX|Y的,即HX|YHX。所以HX|Y表示已知Y后X“残留”的不确定性,而这种不确定性的减少为HXHX|Y就是互信息,它实际是已知Y取值后所提供的有关X的信息,同样,我们也可导出已知X后Y的信息HYHY|X,所以互信息定义为IXYHXHX|Y或IYXHYHY|X对于随机变量X,Y之间的互信息有IXYX,Y24PDXYP,设一随机矢量X,则各分量之间的互信息为TMX,321IXXXX25HMII1PDII1214KULLBACKLEIBLERKL散度KULLBACKLEIBLERKL散度也叫KL散度,它是两个概率密度函数间相似程度的度量它的定义如下设是随机变量X的两种概率密度函数,则两者间KL散度是XQP,KL(26)QP,DXQPXLOG由此我们可以看出随机矢量X各分量之间的互信息IX实际是PX与之间的KL散度,即MIIXP1IXXXXKLPX,HII1PDMII1MIIXP1(27)215峰度随机变量X的峰度定义为KURTX4XE230均值高斯信号的峰度恒等于0,而绝大多数非高斯信号的峰度是不等于0的,且峰度与0差越远,信号的非高斯性就越强,因此我们可以根据这个区分高斯信号与非高斯信号,峰度小于0的是亚高斯信号,峰度大于0的是超高斯信号。216负熵随机变量的负熵定义为X的概率密度PX与一高斯概率密度PX之间的GKL散度,这里与有相同的均值与方差。即JXKLPX,PX28GDXPXGLOG由负熵的定义可以推导得JXDXPXGLOGLOGLDXPHHX29GAUSX22ICA定义及数学模型目前被普遍接受的ICA定义及假设如下10为简便起见,假定观测与独立分量个数相同,即假设N个观测变量NX,321由N个独立分量线性组合而成,观测变量和独立分量均为随机变量。对于T时刻的N个观察值,J1N,有210JXNJJJSASASA321令X,S,ATN,321TN,3IJ所以22A可写成矩阵形式,如下XAS211则方程22B所描述的统计模型称为独立分量分析。ICA模型是一个信号产生模型,描述观测变量是如何由独立分量产生,由于S无法直接观测,故称为潜IXIS变量。称A为混合矩阵。与A相对应,为求得独立分量,需要一个解混合矩阵W。ICA模型可参见图21。YWX2121S11Y222NSNXNY图21ICA模型对于线性混合的解混合模型,通常对问题作如下假设10观测变量的个数大于或等于独立源的个数S之间在每一时刻都相互独立至多有一个独立源满足高斯分布的没有噪声,或者仅有微量加性噪声假设1是为了保证A是满秩矩阵,假设2是ICA的基础。假设3是因为两个白高斯过程源信号是无法分离。假设4是因为只有在底噪声的情况下输出信号之间的共有信息才能得到最小化。当然,我们可以把噪声看作一个独立的源信号,通过ICA算法将其分离出来。23独立分量分析ICA的原理由上一节ICA的定义和数学模型,我们可以把ICA方法总结为先设计一个目标函数,然后采用优化算法使之极大或极小,即ICA方法目标函数优化算法11。231ICA的不确定性由223公式知道,ICA目的是通过调节分离矩阵W使混合信号X经过变换得到的新信号Y各分量之间尽可能独立,这时Y即为源信号S的最优近似值。但是混合矩阵A是未知的,ICA算法也不是求A逆矩阵的过程,这样就可能导致虽然Y的各分量独立但可能与S毫无关系。LTONG等人对这个问题进行研究,ICA的不确定性表现为分离出的Y信号与源信号S在能量和排列顺序方面可能不同,但波AW形相同。232ICA的独立性测度准则ICA方法的目的是使分离的信号尽可能独立,那么我们需要了解一些独立性准则。由互信息的定义,我们很容易看出IY是一个天然的独立性测度。下面我们主要看看通过信号的非高斯性作为独立性测度原理12。由统计理论的中心极限定律,多个随机变量的混合信号趋近高斯分布,所以混合信号比任何一个源信号都更接近高斯分布,也就是说分离出的信号的非高斯性越强越可能是源信号。计算信号的非高斯性到目前已经有很多方法使用峰度计算非高斯性这种方法在理论及计算上都比较简单,但信号的峰度是通过信号的抽样值进行计算的,而峰度的计算过程对异常抽样值非常敏感。少量的错误抽样可能会对峰度的值产生影响,即非高斯性鲁棒性不好。使用负熵计算非高斯性这种方法虽然鲁棒性好,但是根据219公式,计算时需要知道信号的概率密度,且计算量很大,没有实际价值。使用负熵估计值计算非高斯性这里我们经常采用新的负熵估计方法,,其中,XJ2VGEXCC是一个正常数,V是均值为0,方差为1的高斯随机变量。X的均值是0,方差是1。GX函数是一个非二次函数。具有计算速度快等优点,经常在实际中被用到。24现有的几种ICA方法目前根据主要原理的不同把ICA算法主要分成三类1独立元素分析算法;2熵最大化算法;3非线性主分量分析。其中1和2可以证明是等价的,本文主要采用基于输出分量间互信息最小判据原理来讨论的算法,如信息极大INFORMAX13、互信息极小MMI6、负熵最大MAXIMIZATIONOFNEGENTROPY14、极大似然估计MAXIMUMLIKELIHOODESTIMATION,MLE15等。以下就介绍这几种方法。241信息极大化法(INFORMAX)1X1U1Y22X2YNNUNY图22INFORMAX算法示意图BELLLOGLOG,(220)将LA带入上式可化简为(221)XX,PKLL因为HX与W无关,所以最大化对数似然可以将和的KL散度最小,A|即(222)XA,PLL因为A是可逆矩阵,且由KL散度的性质知道,KL散度在可逆变换之下是不变的,所以最小化式(2410)中的KL散度等价最小化源信号与估计信号,SPUP即(223)USWAPKLL,由此可见,以上几种方法是是有密切联系的。第三章基于ICA的多通道语音分离31前言多源混合信号的盲分离技术在通讯、语音信号处理、生物医学信号处理、阵列信号处理以及通讯信号分析等方面有着非常重要的应用价值。所谓多通道语音分离简单的说就是N个源语音信号经过混合处理以后得到M路混合语音信号(通常MN)。从这M路混合语音信号中恢复出N个源语音信号的过程叫多通道语音分离。下图是典型的多源多传感器框图源信号TS1TS2TSN传感器TX1TX2TXN图31典型的多源多传感器框图在一定条件下,ICA能有效的从多通道观测信号中分离出源信号。其主要任务是估计分离矩阵W,以实现从多通道观测信号中分离出相互独立的信源(独立分量),即,希望能较好的逼近真实源信号。XS32FASTICA算法本节主要介绍一种结构简单的定点快速ICA算法,该方法基于定点递推算法,对目标函数的优化速度快,对任何数据都适用,具有很好的稳定性,是目前使用非常广泛的一种方法。其结构图如下1X1Y22NXNY图32FASTICA算法框图由(217)公式的推导过程中,我们知道(31)NIIYJI1Y(32)2VGECJII其中是个正常数,是均值为0,方差为1的高斯随机变量。的均值为0,方CVIY差为1。函数是一个非二次函数。由于的值不随分离矩阵W而改变,所GYJ以只要调节W使分离信号的负熵和最大,就等于分离出的信号之间的互信息最小。321目标函数的选取在23一节中,我们提到ICA方法目标函数优化算法。那么在实际计算中所选择的目标函数必须满足计算简单的要求,而且ICA方法的统计特性(如一致性、鲁棒性)取决于目标函数,目前对目标函数的选取有以下17。YGYAYG111COSHLG2EXP22431YW独立判据这里,。是一个较好的通用函数。在上一节中(32)一式21A1G中,我们就选用的该函数作为目标函数的。当独立分量是超高斯性很强的信号且对鲁棒性能要求很高时,我们更经常选。当计算量必须减少时,和就应21G2该用分段多项式函数代替。只适合亚高斯信号,且抽样值没有干扰的情况。3322优化算法优化算法的选择对算法特性(收敛速度,内存要求)起决定作用。具体途径分为两条18,即批处理(BATCHPROCESSING)和自适应处理ADAPTIVEPROCESSING。批处理的计算量比较大,而自适应处理虽然计算简单,但收敛速度慢,需要选择好迭代步长。尽管这样,目前自适应处理还是比批处理的应用范围广一些。批处理的固定点的快速ICA算法(FASTICA)不使用随机梯度搜索法而采用定点迭代法,每次迭代中采样的数据是成批使用,该方法是并行分布式,优化速度快,对任何数据都适用,具有很好的稳定性。FASTICA方法主要分两步实现对观测信号的预处理,独立分量提取。下面我就分别介绍。323信号的预处理在应用ICA之前要对数据做预处理使ICA估计更加简单、稳定,更加符合前面ICA的约束条件,信号的预处理主要包括中心化和白化11。中心化中心化就是去均值,通过对信号减去其均值,使信号的均值为0,这样做只是为了简化ICA的估计算法,设信号X,其均值为,则中心化过程为MXE,这是信号的均值为MX0E白化信号通过一个白化滤波器,得到白化后的信号,也就是对信号进行线X性变换,使的元素是不相关的,而且具有单位方差,的协方差矩阵是一个单X位阵。IXTE通常白化处理采用特征值分解的方法。假定,Z其中为TQX的特征向量阵,为特征值对角阵,则下式可完成对数据的白化处理TEX(33)XQT21相应的也做了变换,变成新的,是一个正交阵,则有下式成立AA(34)SA21T因为是一个正交阵,所以只需估计个参数,而不是个参数,这NI12N就减少ICA一半的工作量。324独立分量的提取在上一节中我们得到被处理过的信号,本节对它进一步处理,即寻找分X离矩阵以实现独立分量的提取(注此处的是针对处理以后的信号而言WWX的)分离过程是一个迭代逼近过程,我们用变量N表示迭代步数,令是NIS中的某一分量,为分离矩阵中与对应的某一行向量,即NSNIWIS(35),321TXSII分离过程中,用(322)式所定义的目标函数对分离结果的非高斯性进行NIS度量,并对进行调整,FASTICA算法的调整公式为NIW(36)NGENEITITIWXXI1当两次的无变化或变化很小时,即可认为,迭代过程结束。由公IISI(36)式中的均值计算可通过时间的平均获得。所以每次迭代后,都要对进行归一化处理,以确保分离结果具有单位能量。以NIWNIIW上是对单个独立分量的迭代过程。同理,我们也可对多个独立分量重复使用上述的迭代方法进行分离,。但每次提取一个独立分量后,从观测信号中减去这一个分量,如此重复,直到独立分量完全分离出来。并可得到混合矩阵和分离矩阵A。W33FASTICA算法的特点在ICA模型中,FASTICA收敛速度是二次以上的,而梯度搜索法只是一次收敛。与梯度搜索法相比,FASTICA的步长参数容易确定。该算法适用任何非高斯信号。可以通过选择不同的使算法获得不同的性能。YG可逐个估计独立分量。该算法是并行的、分布的,计算简单,需要内存少。34仿真实验我们采用一段音乐信号,一段人声信号作为源信号,信号的采样1S2频率是K赫兹长度为40000点,使用混合矩阵对源信号进行线性混合得到两个观测信号,。使用上述FASTICA算法对观测信号进行分离,丛1X2中得出两个源信号的近似值,结果如下图所示1Y2图33音乐信号与语音信号分离结果图我们采用一段甲人的说话声,一段乙人的说话声作为源信号,信号1S2的采样频率是11K赫兹长度为40000点,使用混合矩阵对源信号进行线性混合得到两个观测信号,。使用上述FASTICA算法对观测信号进行分离,1X2丛中得出两个源信号的近似值,结果如下图所示1Y2图34语音信号分离结果上面两个例子中的混合信号是经过随机产生的22矩阵对两路源信号的线性混合产生的,可用来模拟在公共环境下的录音,每一路混合信号均包含两种源信号分量,由于不同的声音的频带是混合的,所以传统频率滤波的方式是无法实现的,但是从上图的分离结果,我们很容易看出ICA算法分离的结果是非常理想的,从分离信号和源信号的波形对比上可以看出,而且经过试听,的确如此。但是我们很容易得出ICA分离结果的不确定性在能量上存在差异,在分离结果的次序上存在差异,这也就是我们在第二章提到的ICA分离结果的不确定性,当对大量信号进行分离时,这个不确定性会带来很多麻烦,但目前还没什么好的解决方法。第四章总结与展望41总结语音分离技术具有现实的应用价值,主要的研究方向是盲信号的分离,而其中的独立分量分析是盲信号分离研究领域中的一个具有创造性的思路。经过十几年的发展,取得了很多的理论,并在众多的领域都有实用价值,目前在语音信号领域的应用已经成为一个研究的热点。本文简单介绍了语音分离技术的额目的、意义,发展过程及现状;盲信号的分离;ICA的提出和应用。本文的第二章详细介绍了ICA算法的定义、数学模型以及几种ICA算法本文的第三章介绍多通道语音分离知识,并介绍了一种常用的ICA算法FASTICA算法,第三章的最后,用FASTICA方法对多通道语音分离做了仿真实验,验证FASTICA方法在语音分离中的有效性。42展望语音分离在近十年引起这一领域研究人员的极大兴趣,也取得很多的研究成果,但是目前语音分离研究工作中还存在很多问题。例如语音信号的概率密度函数基于信息论的盲分离算法都是在假定源信号的概率密度函数已知的情况下得到的。而实际语音信号是一个非平稳随机信号,其概率密度函数通常都采用拉普拉斯分布的概率密度函数来近似。如何找到一个合适的非线性函数,使之更加适合语音分离是目前需要深入研究的课题。说话人数的确定目前语音分离算法中都假设麦克风书目不少于说话人的数目,对于说话人的个数未知,以及麦克风数目少于说话人的数目的情况,分析起来较复杂,目前的ICA算法无法解决,所以是我们以后要进一步研究的方向。混合系统的复杂性和不确定性由于真实环境中,语音混合系统的冲激响应长,进行语音分离需要上千阶的解混合滤波器,使计算非常复杂,并导致算法不收敛。当混合系统是时变系统时,要求语音分离算法具有良好的跟踪特性。如何对复杂混合系统进行语音分离是当前研究的重点。另外,当混合系统为非线性时,ICA算法无法解决,所以在这方面进行的语音分离也是目前研究的热点问题。噪声的影响在语音分离中我们无法忽略噪声,在噪声特性未知的情况下,语音分离的效果会受到影响。源语音信号不互相独立的语音信号的分离在语音分离中,当混合的语音信号不满足相互独立的要求时,基于源语音信号相互独立假设的分离方法的性能就会降低,这也需要我们进一步研究。设计专门的硬件实现ICA算法,具有实用价值我下面继续要做的工作是对单通道语音进行分离。目前ICA在处理多通道语音分离方面显示了很大的优越性,事实也证明用ICA算法分离的语音信号的效果很好。但是从以上学习我们知道ICA的使用条件,它要求观测信号的数目大于或等于独立源的的数量,所以直接用ICA对单路信号做处理目前是无法实现的。目前常用的几种方法如下所示(1)计算声场景分析(CASA)(2)动态嵌入矩阵法其中动态嵌入矩阵法在提取多用脑活动只有单一渠道电磁记录大脑信号,在对记录的脑电信号进行分离是可以实现的,所以该方法可以用来对单通道语音进行分离。致谢我首先要感谢我的指导老师马勇老师。是他谆谆的教诲和耐心的指导才使这篇论文顺利的完成。马老师无论是在论文的选题上还是在有关问题知识的讲解上都显出无比的耐心,他严谨的治学态度、敏锐的洞察力和渊博的知识给我深刻的印象和启迪。他的言传身教将使我受益终身。其次我还要感谢我的同窗好友,谢谢她们帮我录音。正是他们的帮助、支持和鼓励,我才能完成本次毕业设计,向所有关心和支持我的老师、同学和亲人朋友致以真诚的谢意。参考文献1陈雪勤基于计算声场景分析的混叠语音分离研究硕士论文苏州大学2002,152贾凡混叠语音信号盲分离算法研究硕士论文西安电子科技大学2004,3103SFBOLLSUPRESSIONOFACOUSTICNOISEINSPEECHUSINGSPECTRACSUBTRACTIONIEEETRANSACTIONONACOUSTIC,SPEECHANDSIGNALPROCESSING,1979,271131204YEPHRAIMHLVANTREESASIGNALSUBSPACEFORSPEECHENHANCEMENTIEEETRANCTIONONSP

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论