ICA 讲课PPT完整版可编辑_第1页
ICA 讲课PPT完整版可编辑_第2页
ICA 讲课PPT完整版可编辑_第3页
ICA 讲课PPT完整版可编辑_第4页
ICA 讲课PPT完整版可编辑_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

控制工程梁奇20150101012015-11-18IndependentComponentAnalysis

独立成分分析(ICA)ICA简介ICA是20世纪90年代提出的,起初是神经网络的研究中有一个重要的问题,独立成分分析是一个解决问题的新方法。在许多应用方面,包括特征识别、信号分离。这种方法是用一种解线性方程组的估计方式求解信号源。假想一下,在一个房间里的不同位置放着三个麦克风,同时有三个人说话。三个麦克风能同时记录下三个时间信号,如果仅用这三个记录的信号来估计出原来的三个语音信号,那将是一件非常有意义的事情,这也就是所谓的“鸡尾酒会”问题。一、问题的引入鸡尾酒会问题:从嘈杂的人声中提取所关心对象的声音。ICA——一种盲源分离的方法声音提取:典型例子:“鸡尾酒会”的问题。人的大脑可以很快辨出或集中听某种需要关注声音。麦克风1麦克风2麦克风3a为权重的参数,在鸡尾酒舞会问题中为距离,x为三个话筒得到信号,s为三个表演者的声音。这三个人的声音相对独立并且忽略所有的其他因素比如声音的时间延迟。如果我们知道a的参数,也就是说知道距离,反解出s就很简单。(半盲源)但ICA是在不知道a和Si(t)的情况下的一种估计的算法,也就是说的盲信号分离的一种算法。根据源信号的统计特性,仅由观测的混合信号恢复(分离)出未知原始源信号的过程雷达、声纳、通信、语音处理、地震预报和生物医学等“盲”源信号不可观测混合系统的特性事先不可知盲源分离(BlindSourceSeperation)信号的分离盲源分离(BlindSourceSeperation)图像的分离源图像混合后的图像分离后的图像

假设源信号由若干个统计上相互独立的信号组成的,它们在空间中形成交叠,ICA是借助于多个信道(话筒)同步观察交叠信号,将观察信号经过解混分解成若干独立成分,作为对源信号的一组估计。WICA模型ICA模型TwoIndependentSourcesMixtureattwoMics用线性方程组表示为推广到一般:这里,i,j=1,2,…,n是实系数假定:sj是独立的,称为独立成分(IC)转换为向量-矩阵符号表示

ICA模型

ICA理论的目标是通过X求得一个分离矩阵W,使得W作用在X上获得的信号Y是独立源S的最优逼近。

ICA模型的约束为了确保上边刚刚给出的基本的ICA模型能被估计,我们必须要做出一定的假设和约束。1.独立成分被假定是统计独立的;2.独立成分具有非高斯的分布;3.假定混合矩阵是方阵,且可逆;4.假定所有混合变量与独立成分都是零均值。1.独立成分被假定是统计独立的假设是ICA能够成立的前提概念上理解:我们说随机变量y1,y2..yn独立,是指在i≠j时,有关yi的取值情况对于yj如何取值没有提供任何信息。技术角度上理解:联合概率密度等于各边缘概率密度的乘积。2.独立成分具有非高斯的分布如果观测到的变量具有高斯分布,那么ICA在本质上是不可能实现的。原因:如果s1和s2都是标准Gaussian分布,那么他们的联合概率密度为:假定S经过混合矩阵A后,他们的联合概率密度仍不变化,因此我们没有办法在混合后的成分中得到混合矩阵A的信息。3.假定混合矩阵是方阵换句话说,就是独立成分的个数与观测到的混合量个数相同。4.假定所有混合变量与独立成分都是零均值零均值化的目的:去除均值对变换的影响,而减去均值后数据的信息量没有变化,即数据的区分度(方差)是不变的,减少幅度不确定性。ICA预处理变量中心化(零均值化)(1)如果实际情况不满足零均值,可以通过中心化(centering)实现(2)同时,独立成分也变为零均值的量(3)混合矩阵可以保持不变,完成独立成分估计后,可以将独立成分加上而恢复ICA预处理白化(Whitening)

给定一些随机变量,通过线性变换将它们转换为相互无关的变量,这类方法称为白化或者球面化

白化的目的:消除特征之间的相关性,降低输入的冗余性通过白化可使输入具有如下特征:(1)特征之间相关性低;(2)所有特征值具有相同的方差。(1)独立一定不相关(2)不相关不一定独立

但是如果,X,Y服从二维正态分布,那么它们不相关与相互独立是等价的ICA预处理(3)白化比不相关略强些

若一个零均值的随机向量y是白化的,那么它的各分量具有相同的单位方差且互不相关。即y的协方差矩阵是单位阵.(4)白化可以通过线性操作完成给定n维随机向量x,寻找线性变换V(白化矩阵),使得变量z投影到新的子空间后变成白化向量。ICA预处理其中,E=(e1,e2,…,en)是以协方差矩阵

的特征向量的正交矩阵

D是以Cx的特征值的对角阵,

(5)V不是唯一的白化矩阵任何UV(U为正交阵)也是白化矩阵,即y也是白化的,y=Uz(z为白化矩阵)ICA预处理(6)由于y可以是z的任意正交变换,因此,白化最多只能给出在正交变换意义上独立的成分(IC)的一个可能集合。ICA实际上是一种寻优问题,即在各种可能的集合中找到一个最优解,使得分离出的独立分量最大程度的逼近各个源信号。keyICA估计的原理:non-Gaussianity根据中心极限定理,在某些条件下,独立随机变量的和在一定条件下趋近于高斯分布。即独立随机变量的和比原始独立随机变量中的任何一个更接近于高斯分布。可以认为越具有高斯性,其独立性越差

反之,非高斯性越强,独立性越强non-Gaussianity的度量为了在ICA估计中使用non-Gaussianity,我们必须有一个对它的定性度量。常用方法种:

Kurtosis(峭度)

Negentropy(负熵)Kurtosis(峭度)经典的测量非高斯方法是kurtosis,或称4阶累计量。y的kurtosis被定义为Negentropy(负熵)第二个非常重要的非高斯测量方法是负熵,它是基于信息理论上熵的概念。随机变量的熵可解释为给定观察变量的信息度,越随机,熵越大随机向量y的密度f(y)的微熵H被定义为:

Negentropy(负熵)

这里yGuass是一个高斯随机向量,与y有相同的协方差,y为高斯分布时,Negentropy为零,其它分布时不为零ICA估计的原理:non-GaussianityICA模型:x=Ass=A-1x令y=wTx则y=wTx=wTAs=qTs其中q=ATw这样的话y是s的线性组合,y应该比s更具有高斯性,除非wT接近A-1。此时,y=wTx=A-1x=s。也就是说y=s时,y具有最大非高斯性。问题转化为求解w,它最大化wTx的non-Gaussianity性。ICA数值优化问题。基于负熵的快速不动点算法(FastICA)步骤:1.对数据进行零均值化,使其均值为02.进行白化,得到白化矩阵z3.选择一个具有单位范数的初始化向量w4.根据不动点迭代基本公式,更新w的值

函数g可以为:基于负熵的快速不动点算法(FastICA)5.每次迭代完成后对W进行标准化:6.如果尚未收敛则返回第4步经过以上的算法,可以找到一个方向,即单位向量w,使得对应的投影WTZ的非高斯性达到极大化,当非高斯性度量达到最大时,则表明已完成对各独立分量的分离。估计多个独立成分1.利用下面的特性:在白化空间中,不同独立成分的对应向量wi是正交的。因此,若要估计多个独立成分,我们需要将任意一元算法运行多遍,每次迭代后将w1,w2,…,wn正交化2.渐进(串行)正交化利用Gram-Schmidt方式的正交化方法,一个接着一个的将独立成分估计出来。假定,已经估计出了p个独立成分(即w1,…wp),那么可以估计wp+1,并在每次迭代循环后从wp+1中减去其在已经估计出的前p个向量上的投影(wTp+1wj)wj,然后再对wp+1做标准化渐进正交化步骤1.选择要估计的独立成分个数m,设置p=12.初始化wp3.在wp上执行一元估计算法,进行一次迭代4.进行正交化5.对wp进行标准化6.如果wp尚未收敛,转到第3步7.置p=p+1,如果p<=m,返回第2步估计多个独立成分的FastICA算法1.对数据进行中心化,使其均值为02.进行白化,得到z3.选择

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论