语音信号盲分离课程设计_第1页
语音信号盲分离课程设计_第2页
语音信号盲分离课程设计_第3页
语音信号盲分离课程设计_第4页
语音信号盲分离课程设计_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

...................................................................................................................... 绪 研究背景与意 盲源分离的国内外研究进 线性瞬时混合信 非线性瞬时混合信 语音信号的分 语音信号时域分 语音信号频域分 语音信号的应用程 盲分离的基本概 盲分离的数学模 盲源分离的基本方 盲分离的目标准 盲分离的研究领 盲分离的研究内 FastICA算 数据的预处 FastICA算 分离后的信号的时域和频谱 对比分 小 参考文 附件整体程 线性组合,其每一路语音信号都可视为独立分量,这正好与ICA的假设相符。:语音分离盲算法Separationofspeechsignalsinrecentyears eahotresearchtopicinthefieldofsignalprocessing,inaconferencecall,hearingaidsandportabledevices,speechrecognitionmachinehasmanyapplicationsandimpact.Blindsignalprocessingmethodsoftenusedforspeechseparation"Blind"referstonoknowledgeofthesourcesignalandtransmissionchannel,thetheoreticalbasisoftheblindsourceseparation,independentcomponentysis,itcanbeappliedtoawiderangecommunications,image,voice,biomedical,radar,seismic,sonaratypeofprocessingBlindsourceseparationtechniquecanbeusedtoeliminateunwantedinterferenceinordertoincreasethequalityofvoice.Speechseparationmakeshearingaidsmorepowerfulprocessingcapabilities,makingthereceivedsignalseparationascloseaspossibletotheoriginalvoice.Moresuitableforspeechcodingandpitchdetection.Especiallyinamixedvoicesignalisencoded,thetraditionalsingle-channelapproachisextremelydifficult,andmixedvoicecanbeseenasalinearcombinationofmulti-channelvoicesignal,andeachofitswayvoicesignalcanberegardedasindependentcomponent,whichcoincidedwithICAassumptionsmatch.Speechrecognitioncapabilitiesofthemachinefarlessthanhuman,especiallyinthecontextofnoiseandinterference.Thenasthefrontendofthespeechrecognitionprocessing,blindspeechseparationcanbeverygoodtoremoveinterference,whetheritistheadditivenoiseisnotinterested,greatlyenhancedrecognitionrateoftheKeyword:Speech Blind 盲信号处理(BlindSignalProcessing,BSP)作为计算智能学的研究内容,20世纪最后十年迅速发展起来的一个新研究领域,是人工神经网络与统计信线性瞬时混合信juttenult,1986线性函数的选取具有随意性,并且缺乏理论解释。1991年,,HeraultComonSorouchyariSignalProcessingH-JCMOS集成来实现他们的算法。H-J方法后来由Jutten和、on,CichockiMoszczynski以及其他研究者解释并发展。Tongliu分析了盲源分离的可分得出一种最大信息(Informatianization,简记Infomax)传输的准则函数,并1997年,Hyvarinen等基于源信号非性测度,给出一类定点训练算1999年,LeeGirolamiSejnowski将信息最大化原则的独立分量分析作非线性瞬时混合信Krob1995年,DecoBrauerVolume-Conserving结构的非线性利用两层感知器网络结构得出基于最大熵(MinimumEntropyME)和最小互信息思想(MinimumMutualinformationMMI)的代价函数,并提出了反2001年,ValpolaHonkela和Karhunen提出了集合学习算法(BayesianEnsembleLearningAlgorithm),该算法采用多层感知器神经元网络(MLP),能够对非线性静态和动态过程实现盲源分离。Tan和Wang提出了基于遗传算法(GeneticAlgorithm)的盲源分离方法,该算法利用遗传算法使信号非线性混合度能够在全局范围内寻找最优解。Tan、Wang和Zurada提出了径向基网络算法(RadialBasisFunctionNetworkAlgorithm),使用径向基函数神经网络来近非线 语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析wavrecordwavrecord利用Windows音频输入设备记录声音,其调用形式为:wavrecord(n,fs,chWindowsn个音频采样频率为fsHz通道数为ch。采样值返回到一个大小为n*ch的矩阵中。缺省时,fs=11025,ch=1。waveplay:waveplay利用Windows音频输出设备声音,其调用形为:waveplay(y,fs)fsWindows音频设备发送向量信号。标准的音频采样率有:8000、11025、2205044100Hz。wavread:wavread用于 形式为:y=wavread(file)。其作用是从字符串file所指的文件路径wave文件,将的采样数据送到y中。Y的取值范围:[-1,1]。sound:音频信号是以向量的形式表示声音采样的。sound函数用于将向量转换为声音,其调用形式为:sound(y,fs),作用是向扬声器送出向量y中的音频信号(fs)。、频域分析方法有带通滤波器组法变换法、线件预测法等几种。本文介绍时变换对语音信号的频谱进行分析,相应的频谱称为“短时谱、在的信号处理工具箱中函数FFT和IFFT用于快速变换逆变换。函数FFT用于序列快速变换,其调用格式为y=fft(x),其中,x是序列,y是序列的FFT,x可以为一向量或矩阵x为一向量,yxFFT且和x相同长度x为一矩阵y是对矩阵的每一列向量进行FFT。如果x2fft执行高速基-2FFTfft执行一种混合基的离散变换算法,计算速度较慢。函数FFT的另一种调用格式为y=fft(x,N),式中,x,y意义同前,N为正整数。函数执行N点的FFT,若x为向量且长度小于N,则函数将x补零至长度N;若向量x的长度大于N,则函数xNxx进行处理。语音信号的应用程输入语言的MATLBA时域和频谱图程序分 axis([0100050]) axis([01500050]) axis([015000150])2-12-2混合语音信号的MATLBA时域和频谱图程序分I1=wavread('man.wav')';I2=wavread('dragen.wav')';I3=wavread('music.wav')'; % %阵 %% axis([01000050])% axis([010000100])% axis([010000100])2-32-4

++分离系统3.1 信号向量,A为未知混合系统

t,,x它们均源信号矢量的组合,并受到噪声矢量1,,m

ntn干扰sA均未知的情况下,仅由观测xWys的估计,即:yWx

(3-值的大小取决于传感器与源信号间的相对位置以及信号的速度;(2)源信斯、差3.2最普遍的方法就是使用代价函数来衡量信号独立性和非性或者稀疏分离问题的基段(间接或直接的),这种方法对多于一个分布的源信号不适用。如果源信号具有时序结构,则其有非零的时序相关数,从而可以降低对(SOS这种(SOSi.id()的源信号。时间有不同的变化,就可以考虑利用二阶非平稳性。Matsuoka等人首先考虑了(STF)BSSICABSSICA的基本原理和作用对象,两者之间的区别和联ComonICA给出了较严格的定义:对于观测信号矢量,存在一个线性变ICA过程。与此对应,可以给出BSS的如下定义:对于观测信号矢量,存性变换wG的各行及各列中只有一个非零元素(不妨称之为广义对角矩阵)G=PDP为置换阵;D为对角阵,从而实现信号分离。ICA的目的是通过线性变换使得观测信号的各个分量的统计独立性最大化。通常用输出信号的互信息、熵等作为统计独立性的量度,如基于信息论的Informax算法、Amari的自然梯度算法等。如果源信号之间具有统计独立性,那ICA实现信号的分离。BSS的是在什么条件下可以使全局矩阵实现广义对角化而不去衡量输出信号的统计独立性是否达到最大化。因此BSS并不一定要求源信号是统计独BSSBSSICABSS不仅仅局限于瞬可以说ICA是实现BSS的法,而BSS是ICA的一个具体的应用独立分量分析(Independent 主分量分析(PrincipalComponentysis,PCA)的方法:在尽可能保持原(主分量BSS问题的研究和发展过程中,基于其不同的应用环境,进行了不同角BSS的研究领域做如下的分类:信号本身的属性有平稳信号与非平稳信号之分、窄带信号与宽带信号的差此采用传统的ICA通过对混合系统求伪逆的过程已无法恢复出源信号,这些丢低,适用于实时性要求较高的场合,如故障等。BSS的研究内容涉及优化准则及目标函数的确定、信源概率密度函数(Probabilitydensityfunction,pdf)的估计、各种优化算法、算法的性能评斯性、高阶统计量、熵、互信息、概率密度函数(pdf)以及两种pdf距离的Kullback-Leibler散度等函数进行度量。FastICA 若一零均值的随机向量ZZ,,Z T满足EZZTI,其中:I为单位矩阵,这个向量为白化向量。白化的本质在于去相关。在ICA i 均值的独立源信号StSt,...,StT,有ESSESES i 且协方差矩阵是单位阵covSI因此源信号St是白色的对观测信号Xt,Xt投影到新的子空间后变成白化向量,即:ZtW0X

(4-其中,W0ZW0

(4-其中U和分别代表协方差矩阵CX0线性变换W满足白化变换的要求。通过正交变换,可以保证UTUUUTI0

(4-A~A再将XtASt式代入ZtW0Xt,且令W0A ,ZtWASt~

(4- ASAA~ZtSt~一ZtA~。AAPCA就可完成。FastICA用批处理的方式,即在每一步迭代中有大量的样本数据参与运算。FastICA算法,FastICA算法以负熵最大作为一个搜寻方向。由信息论理论可知:在所有等方差的随量中变量的熵最大,可以利用熵来度量非性,常用熵的修正形式,即负熵。根据中心极限定理,若一随量X由许多相互独立的,量Sii1,2,3,...N之和组成,只要Si种分布,随量X较Si更接近分布。在分离过程中,可通过对分离结果

(4-式中,YGauss是一与Y具有相同方差 量,H为 量的

(4-,根据信息理论,在具有相同方差的随量中分布的随量具有最大的微分熵。当Y具有分布时,NgY0Y的非性越强,其微NgYNgY可以作为随量Y非,于根据式(6)计算微分熵需要知道Y的概率密度分布函数,于是采用如下近似NgYEgY

(4-其中E为均值运算;g为非线性函数,可取g1ytanh(a1y),或23gyyexpy2223

yy3等非线性函数,这里,1

21a111FastICA是找一个方向以便WTXYWTX具有最大的非 算法的推导如下。首先,WTX的负熵的最大近似值能通过对EGWTX进行

(4-这里,是一个恒定值EWTXgWTX,W是优化后的WF 示式(8)左边的函数,可得F的雅可比矩阵JFW如下

(4-为了简化矩阵的求逆,可以近似为(9)WW/W

(4-这里,W是W的新值EWTXgWTX,规格化能提高解的稳定性。FastICA算法的迭代公式:WW/WICA分离的步(1)

xx

(4-x的均值=0x一样)R~R~}X

(4-(是对角阵

UUHx1xZ2VH

(4-(4-(ZE{ZZHI(3)选择任意正交阵作为初值(4)W的每一列wE{zg(wTz)}E{g`(wT

(4- g()g1(y)tanh(

(4-g2(y)ye2g(y)333g`(g()

(4-(5)W

w(wwT)2

(4-(6)如果不收敛(w在迭代后改变量较大)4-14-2法,使我对整个过程有了更加深刻的了解,同时也进一步了解了的基[1],黄建宇,.盲源分离及盲信号提取的研究进展[J].中国民[2].盲源分离与盲信号提取问题研究[D].西安:西安理工大学:,:,,[4]仓陈海洋.盲信号处理[M].国防工业,35-[5],,.基于自然梯度算法的盲信源分离研究[J].[6].基于独立分量分析盲源分离算法的研究[D].太原太原理工大学 clc;clearall;close 读入原始声音混合并输出混合声音%%%%%%%%% %语音信号采样频率为25600%I1=wavreadI2=wavreadI3=wavread('w3.wav')'; %2048FFTtitle('1频谱axis([015000 %2048FFTtitle('2频谱axis([015000 %2048FFTtitle('3频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论