版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章,高光谱遥感图像分类,难点:,难点1:高光谱图像的光谱分辨率的提高是以其携带的数据量显著增加为代价的,并且数据之间存在很大的冗余,如何从大量带有冗余的数据中提取有用信息,是高光谱而遥感图像研究的一个具有极大挑战性的问题。 难点2:由于空间分辨率的限制,使得一个像元中可能包含不止一种地物类型(混合像元),如何对这种混合像元精确的分类是高光谱研究的另一个重要课题。,思路:,高光谱遥感图像分类可以分为两种思路:一种是基于图像数据的分类方法,主要利用数据的统计信息来建立分类模型;另一种是基于地物物理性质的分类方法,主要反映地物的光学性质的光谱曲线来进行识别。,传统方法,常用的传统方法监督分类算法
2、:二进制编码法、光谱角填图法、平行六面体方法、最小距离法、最大似然法、神经网络分类法、决策树分类法、基于专家系统的分类法等;无监督的分类算法: IsoData方法、K-Means方法等。 如何面对高光谱数据的海量以及高维特点,将高光谱图像的各种特征相结合,研究快速、高效的目标识别与分类算法是目前和未来一段时间内高光谱图像处理研究的一个热点。,遥感图像分类的主要基础是地物的光谱特征。然而,高光谱的多波段影像的原始亮度值并不能很好地表达类别特征,因此需要对数字图像进行运算处理(如比值处理、差值处理、主成分变换以及KT变换等),以寻找能有效描述地物类别特征的模式变量,然后利用这些特征变量对数字图像进
3、行分类。,1、降维+传统分类,原始高光谱图像,MLC分类,最大似然法因有严密的理论基础,对于呈正态分布的类别判别函数易于建立综合应用了每个类别在各波段中的均值,方差以及各波段之间的协方差,有较好的统计特性,一直被认为是最先进的分类方法。 高光谱影像利用MLC分类的缺点: (1)多维的遥感数据可能不具备正态分布的特征。 (2)要准确估计参数需要大量的样本,当维数越高,需要的样也越多,这是很难实现的。 (3)对高维空间数据,Byes准则所要求的协方差矩阵将难以得到。,特征提取+MLC,特征是指研究对象所表现出来的各种属性和特点。高光谱遥感图像研究中的特征提取重点在于光谱维特征的提取,即通过映射和变
4、换的方法,把原始模式空间的高维数据变成特征空间的低维数据。然后对特征更集中的低维数据进行处理。 基于变换的降维方法,如主成分分析PCA(K-L变换),最小噪声分离变换MNF,小波变换等,经过若干变换直接将高维数据降低到几维,降维速度快。,分类比较,从图的每个类别中各选取300个训样本(所有样本点在这两幅图像中对应相同的空间。原始图像选择所有波段,K-L图像选择前3个波段,用最大似然法分类。,选择训练样本,高光谱遥感图像拍摄的照片在多种物质的交界处往往很杂乱,各种物质交错排列,他们在各个波段的亮度值也相互影响,在遥感图像中很难用肉眼很难分辨。所以最好的办法是在该类物质比较集中的区域进行选择。 样
5、本要具有代表性就是样本的亮度要反映该类地物的亮度特征,当同一地物区域分布不连续时,我们要尽量使样本来自不同的区域。 如:在对海水取样时,既要选择来来自右上角的深水区的样本,又要选择来自河道以及水田中的浅水区的样本。从亮度特征角度而言,对于同一类地物具有不同亮度特征情况,都要选取(同物异谱)。,分类结果比较图,原始图像的最大似然法分类结果,K-L图像的最大似然法分类结果,区域A:在浅水区,K-L分类图像中出现了原始分类图像中没有的像点。这些像点是水中的暗礁和草,RGB图像上用肉眼无法识别到这些细节。,区域B:通过目视解译,可以分辫出这个区域是由田埂分开的一块又一块的稻田,这些稻田中全是海水。原始
6、图像分类时却忽略了这些由植被覆盖的田埂,将其全部分成了海水。甚至将右上角处的海水类分成了植被类。,区域C:可以看到原始图中有很多被错分的像点,如山脉中的部分植被和建筑被类分成了海水类。而K-L变换图像中几乎没有被错分的像点;,SMLC方法,Jia和Richards(1994)根据波段间的相关性,将高光谱数据分成几个组,由不同的组构成每个类别的协方差矩阵,再从每个波段组计算出判别函数值,最后求所有波段组产生的函数值的和,对每个像元进行分类,即简化最大似然分类法。,2、光谱匹配分类法,基于相关/匹配滤波器的分类方法是充分利用高光谱图像的高分辨率的光谱维优势,将待分未知像元的光谱与参考光谱按照一定的
7、规则进行比较,以确定未知像元类别的方法。比较有效的是光谱角填图,相关系数法以及二值编码分类。,光谱角(SAM)分类,光谱角度匹配是比较待识别地物向量与已知地物向量的广义夹角,来确定每类地物的归属。广义夹角定义如下: 由于光谱角度匹配只利用了角度这一唯一的参数,只有当待识别像元的类内方差较小,类间方差较大,且矢量的模中的信息对分类影响不大时,才能得到较高的分类精度。,分类步骤:,(1)参考光谱库的建立:以图像中已知类型的区域为参考光谱,将区域中光谱的几何平均向量作为类中心。 (2)计算未知像元与各类中心的夹角。 (3)通过多次实验分别对不同的类别设置不同的阈值(若设置的闭值大于计算得出的光谱角度
8、,则不对该像元进行分类)。 (4)将给未知像元分类到夹角最小的类别中去。,结合mnf变换,为有效降低原始图像波段间的相关性,将原始图像进行MNF变换后,然后转换到原来的空间,再利用SAM方法采用与上面实验同样的阈值进行分类,分类精度会有所提高。 原因在于:MNF反变换后消除了图像中的噪声,使得某些孤立的像元点得到了较好的分类。,相关光谱匹配(SCM),SCM也称为光谱相似度匹配或光谱相关系数,与SAM原理类似,用光谱间相关系数(r)来衡量整个测量的波长范围内光谱的相似程度,是一种模糊数学的分类方法,可定义为:,二进制编码方法,对光谱进行二值编码是使得光谱可用简单的0-1序列来表述。一旦完成编码
9、,就可利用基于简单的算法来进行匹配识别。 一条光谱曲线,只需要用几个整形数就可以存储,使得高光谱数据得到了巨大的压缩。在进行匹配运算时,也只需要进行简单的位运算(按位异或)即可,算法实现简单,分类效率较高处理速度得到很大提高。,h(n)=0, if x(n)=T; 其中x(n)是像元第n通道的亮度值,h(n)是其编码,T是选定的门限制,一般选为光谱的平均亮度,这样每个像元灰度值变为1bit,像元光谱变为一个与波段数长度相同的编码序列。,分类步骤,设A,B分别是两个光谱曲线的二进编码,其中 Ai,Bi是第i(i=1,2,2N)位编码值,N为波段数,则光谱相似系数r的计算方法如下: 表示异或,除此
10、之外,还可以采用包络线去除法或一阶导的方法将光谱曲线进行变换,提取特征波段后,再利用光谱匹配的技术,进行整个高光谱影像的分类。,3、神经网络分类算法,目前的多种先进而新颖的技术手段层出不穷,人工智能,模糊理论,决策树,神经网络等都被应用于遥感图像的理解和分析当中。 人工神经网络技术,黑匣子,能被用于多源数据的综合分析被广泛用于遥感图像分类。,.1 神经系统原理,神经网络是在生物功能启示下建立的信息 处理系统,摸仿了人脑的结构特征和信息处 理机制,表现出了许多与人脑相同的特征。,简单的神经元网络是对生物神经元的简化 和模拟,其模型如下图:,3.2 人工神经元的基本构成,人工神经元模拟生物神经元的
11、一阶特性。 输入:X=(x1,x2,xn) 联接权:W=(w1,w2,wn)T 网络输入:net=xiwi 向量形式:net=XW,M-P模型,McCullochPitts(MP)模型,也称为处理单元(PE),激活函数,3.3 拓扑结构,网络的拓扑结构是NN的重要特征,从连接方式上可以包括:前馈型网络和反馈型动态网络两大类。,连接的拓扑表示:,层次划分 信号只被允许从较低层流向较高层。 层号确定层的高低:层号较小者,层次较低,层号较大者,层次较高。 输入层:被记作第0层。该层负责接收来自网络外部的信息,第j层:第j-1层的直接后继层(j0),它直接接受第j-1层的输出。 输出层:它是网络的最后
12、一层,具有该网络的最大层号,负责输出网络的计算结果。 隐藏层:除输入层和输出层以外的其它各层叫隐藏层。隐藏层不直接接受外界的信号,也不直接向外界发送信号,多级网h层网络,3.4 学习规则与方式,学习规则:外部环境对系统的输出结果给出评价,学习系统通过强化受奖的动作来改善自身性能。 误差纠错学习(delta) Hebb学习 竞争学习 学习方式: 监督学习(Supervised learning) 非监督学习(Unsupervised learning),联接模式,用正号(“+”,可省略)表示传送来的信号起刺激作用,它用于增加神经元的活跃度; 用负号(“-”)表示传送来的信号起抑制作用,它用于降低
13、神经元的活跃度。 层次(又称为“级”)的划分,导致了神经元之间的三种不同的互连模式:,3.5 常用的神经网络模型,3.6 BP(Back Propagation)神经网络概述,1、BP算法的出现 非循环多级网络的训练算法 UCSD PDP小组的Rumelhart、Hinton和Williams1986年独立地给出了BP算法清楚而简单的描述 1982年,Paker就完成了相似的工作 1974年,Werbos已提出了该方法 2、弱点:训练速度非常慢、局部极小点的逃离问题、算法不一定收敛。 3、优点:广泛的适应性和有效性。,基本BP算法,网络的构成 神经元的网络输入: neti=x1w1i+x2w2
14、i+xnwni 神经元的输出: 权值修改函数:,输出函数分析,应该将net的值尽量控制在收敛比较快的范围内 可以用其它的函数作为激活函数,只要该函数是处处可导的,网络的拓扑结构,BP网的结构 输入向量、输出向量的维数、网络隐藏层的层数和各个隐藏层神经元的个数的决定 实验:增加隐藏层的层数和隐藏层神经元个数不一定总能够提高网络精度和表达能力。 BP网一般都选用二级网络。,网络的拓扑结构,训练过程概述,样本:(输入向量,理想输出向量) 权初始化:“小随机数”与饱和状态;“不同”保证 网络可以学。 1、向前传播阶段: (1)从样本集中取一个样本(Xp,Yp),将Xp输入网络; (2)计算相应的实际输
15、出Op:,2、向后传播阶段误差传播阶段: (1)计算实际输出Op与相应的理想输出Yp的差; (2)按极小化误差的方式调整权矩阵。 (3)网络关于第p个样本的误差测度:,(4) 网络关于整个样本集的误差测度:,基本的BP算法,样本集:S=(X1,Y1),(X2,Y2),(Xs,Ys) 基本思想 : 逐一地根据样本集中的样本(Xk,Yk)计算出实际输出Ok和误差测度E1,对W(1) ,W(2) ,W(L)各做一次调整,重复这个循环,直到Ep。 用输出层的误差调整输出层权矩阵,并用此误差估计输出层的直接前导层的误差,再用输出层前导层误差估计更前一层的误差。如此获得所有其它各层的误差估计,并用这些估计
16、实现对权矩阵的修改。形成将输出端表现出的误差沿着与输入信号相反的方向逐级向输入端传递的过程,算法的主要实现步骤,用不同的小伪随机数初始化W,V; 初始化精度控制参数;学习率 ; 循环控制参数E=+1;循环最大次数M;循环次数控制参数N=0; while E & NM do 4.1 N=N+1;E=0; 4.2 对每一个样本(X,Y),执行如下操作,4.2 对每一个样本(X,Y),执行的操作,4.2.1 计算:O1=F1(XV);O2=F2(O1W); 4.2.2 计算输出层的权修改量 for i=1 to m 4.2.2.1 oi= O2 i*(1- O2 i)*(Yi-O2 i); 4.2.
17、3 计算输出误差:for i=1 to m 4.2.3.1 E=E+(Yi-O2 i)2;,4.2 对每一个样本(X,Y),执行的操作,4.2.4 计算隐藏层的权修改量:for i=1 to H 4.2.4.1 Z=0; 4.2.4.2 for j=1 to m do Z=Z+Wi,j* oj; 4.2.4.3 hi=Z* O1 i(1- O1 i) ; 4.2.5 修改输出层权矩阵:for k=1 to H & i=1 to m 4.2.5.1 Wk,i= Wk,i+ *O1k*oi; 4.2.5 修改隐藏层权矩阵:for k=1 to n & i=1 to H 4.2.5.1 Vk,i=
18、Vk,i+ *Xk* hi;,网络瘫痪问题 在训练中,权可能变得很大,这会使神经元的网络输入变得很大,从而又使得其激活函数的导函数在此点上的取值很小。根据相应式子,此时的训练步长会变得非常小,进而将导致训练速度降得非常低,最终导致网络停止收敛,建议,隐藏层的神经元的个数H作为一个输入参数 同时将、循环最大次数M等,作为算法的输入参数 在调试阶段,最外层循环内,加一层控制,以探测网络是否陷入了局部极小点,实验,本实验数据选取分辨率为30m 的TM 影像。该影像区域为湖北省武汉市,大小为400 像素400 像素,获取时间为1998 年10 月26 日,如图3.6 所示。首先对遥感影像进行集合纠正等
19、预处理,通过对实际区域情况的了解和对图像进行目视解译,该区域大致简单分为4类,通过人工判读,在影像中选择四个区域作为这四种地物类别,如下图所示。,表 四种地物各波段DN值,四种地物波段光谱曲线图,BP神经网络模型的输入层的神经元个数为波段数,即输入层神经元的个数为6,输入值为各个像元的灰度值。输出层的神经元个数为地物端元的个数,输出值为像元在各个典型地物所属的类别。隐含层神经元的个数经过多次的实验确定,同时也可以采用有经验公式计算,本文采用的隐含层节点数计算公式如下: 式中,M为分类数;N为特征向量维数,即影像波段数。,对权值赋予01之间的随机值,然后从网络的输入节点输入样本数据,计算样本信息
20、在正向传播过程中,前一层的神经元数据对本层每个神经元的加权,并利用Sigmoid函数运算输出。接着求出误差进行反向的迭代,调整权值,权值训练完成后,求出满足一定误差条件的权矩阵,就可以用训练后的权值的BP神经网络分类。将数字影像上的任何一个像素的6个波段值作为输入向量,通过计算可得到输出向量,向量分量即对应于该像素在各个预先指定的各个分类类型的概率值,将最大的概率值赋值为1,其余的赋值为0,即得出如下分类图:,从图中可以看出,三种分类方法有大致类似的分类结果。标准BP分 类结果要比传统MLC的分类结果好,能够很好的区分长江和湖泊,而 MLC很难将两种水体分开。,然后采用检验数据与分类图进行分类
21、精度的定量比较,比较方法采用常用的分类比较指标,即混淆矩阵、总精度和Kappa 系数。定义: 长江:River 湖泊:Lake 植被:Vegetation 居民区:Urban 总个数:Sum,不同分类算法的混淆矩阵比较,分类方法的总精度和Kappa系数的比较,高光谱遥感影像分类,3.7 SOM神经网络,Som的全称为self-organizing map,表示自组织映射。由瑞典的科学家Kohonen提出并设计。他认为神经网络中邻近的各个神经元通过彼此侧向的交互作用,互相竞争,自适应发展成检测不同信号的特殊检测器。 当外界输入样本进来后,输入样本引起兴奋细胞的位置各不相同,经过自组织后形成一些细
22、胞群,它们分别反应了输入样本的特征。 在二维的输出空间构成一个神经元映射图,功能相同的神经元靠的比较近,功能不同的神经元分的比较开,这种映射是用竞争算法实现。,SOM网络,SOM网络的结构如图所示,由竞争层和输入层组成,输入层由N维的神经元组成,竞争层由mm的二维平面组成。,Som特点如下: 1、基于竞争学习,网络的输出神经元是相互竞争来被激活,输出一个获胜神经元。 2、只有两个层,用来输入和输出,通常神经元是放在网格节点上面,选取的是二维格网。 3、选取的模型是Kohonen模型,利用了神经生物学所考虑激发的自组织基本导出模型。 4、Som网络的目的是将任意维数的输入信号变成二维的离散映射,并且形成拓扑关系。,学习和适应过程,学习:只需要向网络提供一些具有集群状分布的学习样本,而无需提供期望的输出。比较竞争层上输入样本间的欧式距离,距离最小对应的神经元获胜,然后修改自身和领域内其它神经元的权值。 适应:最终各神经元的连接权值经过自适应调整后具有一定的分布,并把数据之间的相似性组织到代表各类的神经元上,同类中的神经元具有相似的权值,不同的类的神经元之间的权值差别明显。,标准算法过程,1、初始化权值Wij,学习率0,领域半径Nc(0),并确定训 练次数。 2、按照(a)计算连接权值与输入模式之间的距离,选择最小的 距离对应为获胜神经元。 3、按
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论