(电路与系统专业论文)基于流形学习像素分布流的高光谱图像数据分割方法.pdf_第1页
(电路与系统专业论文)基于流形学习像素分布流的高光谱图像数据分割方法.pdf_第2页
(电路与系统专业论文)基于流形学习像素分布流的高光谱图像数据分割方法.pdf_第3页
(电路与系统专业论文)基于流形学习像素分布流的高光谱图像数据分割方法.pdf_第4页
(电路与系统专业论文)基于流形学习像素分布流的高光谱图像数据分割方法.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

(电路与系统专业论文)基于流形学习像素分布流的高光谱图像数据分割方法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 高光谱遥感又称为高光谱分辨率遥感,是当前遥感技术的前沿领域,它利用 很多很窄的电磁波波段从感兴趣的物体获得有关数据,它包含了丰富的空间、辐 射和光谱三重信息。 在处理这种具有更多光谱波段的图像数据时,一个不可避免的问题出现了, 那就是数百甚至上千个波段对传统的图像处理方法在维数上提出了新的要求,如 何应用高光谱图像数据丰富的空间和光谱信息来进行更为精确的分类、目标识别 以及高光谱图像的分割问题已经成为各种高光谱图像数据处理方法的所面对的共 同问题。 针对一般意义下应用流形学习算法解决高光谱数据很难给出分类的标识信 息,本文提出了一种引入2 维空间信息向量的基于流形学习算法的高光谱图像分 类方法。我们将空间信息与光谱反射系数信息加权结合后,通过调节两种特征的 权重关系得到了由图上空间信息到光谱反射系数信息稳定的变化规律,由此确定 用以分类的边界点,并对高光谱数据进行较高正确率的分类标识。 本文工作主要通过引入描述像素位置关系的空间特征而构建的联合高斯距离 测度改进了拉普拉斯特征映射算法,构建了像素分布流用于处理高光谱图像数据。 主要包括以下三个方面: ( 1 ) 在像素的光谱特征基础上引入图像的空间特征,将这两种不同近邻选取 特征通过自定义的高斯距离相乘结合起来,包括如何加权结合两种输入 空间的数据,以及参数的选取。像素分布流的提出以及构建方法。并且 通过简化参数来解释像素分布流的实际物理意义,为之后的应用做了理 论准备。 ( 2 ) 应用像素分布流到实际的高光谱图像数据上,根据数据的实际特点对于 映射结果提出了必须进行的两种后处理方法:包括非线性几何校正,这 种校正可以把映射的结果人为的通过先验的空间特征知识固定,得到较 为稳定的映射结果;以及边界收缩效应的校正,这种校正是针对算法本 身引入空间特征所导致的映射结果边界相比内部不合理的收缩的现象, 得到了边界与内部结果接近一致的结果。最后用单阈值选取边界点的方 法给出小区域高光谱图像数据的分割结果。 ( 3 ) 对于大规模的高光谱图像映射结果,上述的边界收缩效应会更加严重, 导致单阈值无法选取有效边界点的结果。本文提出了一种通过多个阈值 同时选取边界点综合处理的方法解决了这一问题。 i i 摘要 本文工作得到了国家自然科学基金( 6 0 6 7 2 1 2 6 ,6 0 6 7 3 0 9 7 ,6 0 7 0 2 0 6 2 ,6 0 9 7 1 1 2 8 ) ; “8 6 3 计划”项目( 2 0 0 7 a a l 2 2 1 3 6 ) 资助;陕西省自然科学基金( 2 0 0 7 f 0 9 ) 资助i 关键词:高光谱图像联合空间一像素距离拉普拉斯像素分布流 i i i a b s t r a c t h y p e r s p e c t r a lr e m o t es e n s i n gi st h ec u r r e n tf r o n t i e rr e m o t es e n s i n gt e c h n o l o g y , w h i c hu s e sal o to fn a r r o wb a n do fe l e c t r o m a g n e t i cw a v e sf r o mo b j e c t so fi n t e r e s tt o o b t a i nt h er e l e v a n td a t a , w h i c hc o n t a i n sa b u n d a n c ei n f o r m a t i o no fs p a t i a l ,r a d i a t i o na n d s p e c t r a l i nd e a l i n g 谢t l lt h ei m a g ed a t a 谢t hm o r es p e c t r a lb a n d s ,a ni n e v i t a b l eq u e s t i o n a r i s e s ,h u n d r e d so re v e nt h o u s a n d so fb a n d sp r e s e n t e di nt h ed i m e n s i o n so ft h en e w r e q u i r e m e n t so nt h et r a d i t i o n a li m a g ep r o c e s s i n gm e t h o d s i th a sb e c o m eac o m m o n p r o b l e mo fa n a l y s i so fh y p e r s p e c t r a li m a g et h a ti sh o w t ou s et h ea b u n d a n c es p a t i a la n d s p e c t r a li n f o r m a t i o no fh y p e r s p e c t r a li m a g ed a t a t o c a r r yo u t am o r e p r e c i s e c l a s s i f i c a t i o n , r e c o g n i t i o na n dt h es e g m e n t a t i o no fh y p e r s p e c t r a li m a g e m a n i f o l dl e a r n i n gm e t h o d sr e s u l t se f f e c t i v e l ya p p l yt on o n l i n e a rd i m e n s i o n a l i t y p r o b l e m r e c e n t l y ,t h e r ea r eal o to fr e l a t e dr e s e a r c h e sc a r r i e do nh y p e r s p e c t r a li m a g e p r o c e s s i n gu s i n gm a n i f o l dl e a r n i n g f o rt h ep r o b l e mt h a tn o r m a l l yu s i n gm a n i f o l d l e a r n i n ga l g o r i t h m sa p p l i e d t o h y p e r s p e c t r a ld a t aw h i c hc a l lh a r d l yg i v e nl a b e l i n f o r m a t i o n , am e t h o db a s e do nm a n i f o l dl e a r n i n ga l g o r i t h mw h i c ht h es p a t i a lc o n t e x t w i t h i na2 - d i m e n s i o n a la r r a yi si n t r o d u c e df o rc l a s s i f i c a t i o no fh y p e r s p e c t r a li m a g ei s p r o p o s e di nt h i sp a p e r w ew e i g h t e dc o m b i n a t i o no ft h es p a t i a li n f o r m a t i o na n dt h e i n f o r m a t i o no fs p e c t r a lr e f l e c t i o nc o e f f i c i e n t , ar e g u l a rv a r i a t i o no fs t a b i l i t yf r o mt h e s p a t i a li n f o r m a t i o nt ot h ei n f o r m a t i o no fs p e c t r a lr e f l e c t i o nc o e f f i c i e n lt h r o u g h a d j u s t i n gt h ew e i g h t so ft h et w oc h a r a c t e r i s t i c s ,i sa c q u i r e d u s i n gt h i sv a r i a t i o nt h e p i x e l so ft h eb o u n d a r i e sf o rc l a s s i f i c a t i o ni sf o u n d ,a n dl a b e l e dt h eh y p e r s p e c t r a ld a t a 谢t hm g ha c c u r a c y t h i sp a p e rm a i n l yi n t r o d u c e dt h e s p a t i mc h a r a c t e r i s t i c sw h i c hd e s c r i b e st h e r e l a t i o no fp o s i t i o no ft w op i x e l so nt h ei m a g e p r o p o s et h ej o i n tg a s s i a nd i s t a n c e m e a s u r e m e n tt oi m p r o v e dl a p l a c i a ne i g e n m a pa l g o r i t h m ,c o n s t r u c t e dt h ep i x e l d i s t r i b u t i o n - f l o wa n da p p l yt ot h eh y p e r s p e c t r a li m a g ed a t a t h em a i ni n n o v a t i v e p o i n t sa r ea sf o l l o w s : ( 1 ) i n t r o d u c et h es p a t i a lc h a r a c t e r i s t i c st ot h es p e c t r a lc h a r a c t e r i s t i c so fe a c hp i x e l , w ec o m b i n e dt h e s et w ok i n do fc h a r a c t e r i s t i c sw h i c hu s e df o r t h es e l e c t i o no f n e i g h b o r s v i am u l t i p l i e dg a u s s i a nd i s t a n c e s ,i n c l u d i n gh o wt oc o m b i n et h ed a t ao ft w oi n p u t s p a c e s ,a n dt h es e l e c t i o no fp a r a m e t e r s t h ec o n s t r u c t i o no fp i x e ld i s t r i b u t i o nf l o wi s p r o p o s e di nt h i sp a p e r t h ea c t u a lp h y s i c a lm e a n i n go fp i x e ld i s t r i b u t i o nf l o wi s i v a b s t r a c t e x p l m n e dt h r o u g ht h es i m p l i f y i n gt h ep a r a m e t e r s ( 2 ) a p p l yl a p l a c i a ne i g e n m a pp i x e ld i s t r i b u t i o n - f l o wo nh y p e r s p e c t r a li m a g e d a t a a c c o r d i n gt ot h ea c t u a lc h a r a c t e r i s t i c so ft h ed a t as e ta n dt h ei n t r i n s i cp r o b l e mo f t h er e s u l to ft h em a p p i n g ,w ep r o p o s e dt w ok i n dn e c e s s a r ya d j u s t m e n t s i n c l u d i n g n o n l i n e a rg e o m e t r ya d j u s t m e n tw h i c hc a l lo b t a i ns t a b l em a p p i n gr e s u l tv i af i xt h e o r i g i n a lm a p p i n gt h r u g ht h ep r i o rk n o w l e d g eo ft h es p a t i a lc h a r a c t e r i s t i c s a n dt h e a d j u s t m e n tf o ra g g r e g a t i o no ft h em a r g i n a lp a r to ft h ei m a g e t h i sa d j u s t m e n ti sf o rt h e a l g o r i t h mi n t r o d u c e dt h es p a t i a lc h a r a c t e r i s t i c sl e a dt ot h eu n r e a s o n a b l ea g g r e g a t i o no f m a r g i n a lp a r to ft h ei m a g ec o m p a r et ot h ei n t e r n a lp a r to ft h ei m a g e t h e nw es e l e c tt h e b o u n d a r yp o i n t sv i ah a r d - t h r e s h o l da n do b t a i nt h er e s u l to fs e g m e n t a t i o no f h y p e r s p e c t r a ld a t a 、杭t l ll l i 曲a c c u r a c y ( 3 ) f o rl a r g es c a l ep r o b l e ma p p l y i n gl a p l a c i a ne i g e n m a pp i x e ld i s t r i b u t i o n - f l o w , t h ea g g r e g a t i o no ft h em a r g i n a lp a r to ft h ei m a g ew i l lb em o r es e r i o u s ,a n dt h i sw i l ll e a d t h eh a r d - t h r e s h o l dd on o tw o r ka n y m o r e ,i nt h i sp a p e rw ep r o p o s e dm u l i t - t h r e s h o l d s m e t h o dw h i c hu s es e v e r a lu s e f u lt h r e s h o l d st os e l e c tt h e b o u n d a r yp o i n t s s i m u l t a n e o u s l yt os o l v et h i sp r o b l e m t h i sw o r kw a ss u p p o r t e db yt h en a t i o n a ln a t u r a ls c i e n c ef o u n d a t i o no fc h i n a ( 6 0 6 7 2 1 2 6 ,6 0 6 7 3 0 9 7 ,6 0 7 0 2 0 6 2 ,6 0 9 7 11 2 8 ) ;”8 6 3 ”p r o j e c t ( 2 0 0 7 a a l 2 2 1 3 6 ) f u n d i n g ; n a t u r a ls c i e n c ef o u n d a t i o no fs h a a n x ip r o v i n c e ( 2 0 0 7 f 0 9 ) f u n d i n g k e yw o r d s :h y p e r s p e c t r a ii m a g e j o i n ts p a t i a l p i x e lc h a r a c t e r i s t i c sd i s t a n c e l a p l a c i a ne i g e n m a pp i x e ld i s t r i b u t i o n f l o w 创新性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。 尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已 经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其他教育机构的学位 或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确地说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:_ 生垒塾: 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校 攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业离校后,发 表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。学校有权保留送交论 文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采 用影印、缩印或其他复制手段保存论文。( 保密的论文在解密后遵守此规定) 本人签名:立! 圣 导师签名: 第一章绪论 第一章绪论 1 1 背景介绍 高光谱遥感又称为高光谱分辨率遥感( h y p e r s p e c t r a lr e m o t es e n s i n g ) ,是当前 遥感技术的前沿领域,它利用很多很窄的电磁波波段从感兴趣的物体获得有关数 据,它包含了丰富的空间、辐射和光谱三重信息。高光谱遥感的出现是遥感界的 一场革命,它使本来在宽波段遥感中不可探测的物质,在高光谱遥感中可以被探 测到。 高光谱遥感仅仅发展了2 0 余年,它起源于2 0 世纪7 0 年代初的多光谱遥感 技术,它将成像技术与光谱技术结合在一起,在对目标空间特征成像的同时,对 每个空间像元经过色散形成几十乃至几百个窄波段以进行连续的光谱覆盖。高光 谱遥感可以将光谱波段在某一特定光谱域进行细分,从而获得了许多波段的遥感 数据,能产生一条完整而连续的光谱曲线。同传统遥感技术相比,由于其所获取 的图像包含了丰富的空间、辐射和光谱三重信息,高光谱遥感或成像光谱遥感技 术的发展是过去二十年中人类在对地观测方面所取得重大技术突破之一,是当前 遥感的前沿技术。高光谱遥感图像具有图像波段众多( 数百甚至上千个) 、光谱分辨 率更高( 高达5 1 0 r i m ) 、覆盖波长范围更宽( 从可见光光谱波段谱到红外光谱波段) 等突出特点,能够做到对图像目标的精细分类和有效识别。 高光谱遥感是采样部分地表反射的太阳辐射的光谱,这些采样是在几百个连 续的窄带中( 以1 0 n m 为间隔) ,分布于从可见光光谱波段到近红外以及中红外光谱 波段间的( 波长在0 3 1 m a 2 5 1 m a 2 n ) t 1 1 。如此丰富的光谱反射信息对于描述地表特 征十分有用,特别是在环境监测、农业、森林、土壤以及天然和人工植被的研究 方面有很好的应用。用于野外的便携高光谱仪已经具有更多的波段数和更长的光 谱分辨率。已经或者将要发射的遥感卫星构成覆盖全球的同步观测体系,高、中、 低轨道结合,传感器空间分辨率、高光谱分辨率、超多波段结合。几十到数百个 波段的高光谱、超光谱新一代卫星,为全球地貌特征的变化提供了多层次、全方 位的观测资料。 1 9 9 9 年美国航天局( n a s a ) 发射的地球轨道一号( e o 1 ) 高光谱卫星共有2 2 0 个 波段,大气校正仪l a c 具有2 5 6 个波段。一般星载的高光谱传感器光谱分辨率小 于1 0 n m ,空间分辨率为2 0 0 m 一1 0 0 0 m 。高光谱数据的数据量十分庞大,例如, a v i r i s 可在4 3 秒钟收集5 1 2 ( 前向轨迹) 6 1 4 ( 横向轨迹) 2 2 4 ( 波段) 1 2 ( l 匕特) 的 立方数据,对应超过7 0 0 m b i t s :h y p e r i o n 可以在3 秒钟收集到4m b i t s 的数据量, 2 基于流形学习像素分布流的高光谱图像数据分割方法 对应3 6 6 k b y t e s k m 2 【2 】,如此大的数据集在通讯,存储以及处理上对软硬件都提出 了新的要求。在处理这种具有更多光谱波段的图像数据时,一个不可避免的问题 出现了,那就是数百甚至上千个波段对传统的图像处理方法在维数上提出了新的 要求,如何应用高光谱图像数据丰富的空间和光谱信息来进行更为精确的分类、 目标识别以及高光谱图像的分割问题已经成为各种高光谱图像数据处理方法的所 面对的共同问题。 1 2 高光谱图像数据处理的流形学习处理方法 1 2 1 高光谱图像数据处理现状 高光谱遥感图像数据为人们提供了十分详尽精确的地物光谱信息,但如何对 这成百波段的高维数据进行有效的处理,如何克服“维数灾难 所带来的处理上 的问题成为了难点。维数约简成为了处理高光谱图像数据的首要问题。 目前高光谱数据主要处理方法有三类,第一类方法是提取有用的波段,即摒 弃掉各个光谱波段间存在大量冗余信息的特点,从而进行维数约简处理。针对应 用目的( 如分类、识别、压缩等) 获取有效特征,降低计算量,是解决高维数据问题 的重要方法之一。高光谱数据数据降维可以通过特征提取和特征选择来实现,在 高光谱数据处理中则对应波段提取和波段选择 3 1 。波段提取通过由高维向低维的投 影变换实现降维,该投影应尽量保留有用信息;波段选择则是根据搜索策略在原 始波段空间寻找满足某准则函数的波段子集来达到维数约简这一目的。严格说来, 波段选择是波段提取的特例,但与波段提取不同的是它不进行投影变换,保持了 原始波段的物理含义,展现了地物的光谱特性。这些方法都是以保持高信噪比( s n r ) 为原则选择一些谱段1 4 1 5 6 1 7 1 。然而这类方法的缺点也是相当明显的,那就是摒弃 的光谱波段也有含有丰富的信息,而这些信息也很可能对高光谱图像数据的处理 有很大作用,只取出有用的波段无疑使得高光谱数据信息丰富的优势大大降低了。 第二类方法是应用于多光谱以及高光谱图像数据的许多改进的有监督分类算 法,一种比较成功的方法是基于人工神经网络的算法1 8 】,但是这种方法在处理过高 维数的数据时效果会变的很差,并且会出现h u g h e s 现象。近年来,支持向量机 ( s u p p o r tv e c t o rm a c l l i n e s ( s v m - ,- , 9 ,这种方法【1 0 l 已经成功的运用在高光谱图像数据 的分类中【l l 】【1 2 】【1 3 l ,s v m 能成功应用在高光谱图像数据上是因为它用一种鲁棒的方 法处理带有噪声的高维输入数据,并且使用了稀疏的处理方法i l4 。另一种有效的 应用于高光谱图像数据分类的方法就是核f i s h e r 判雯j l j ( k e m e lf i s h e rd i s c r i m i n a n t ) 分 析方法【1 5 1 ,这种方法的优点是在s v m 中结合了k e r n e l 方法,可以得到非线性的解 决方法。但是这两种方法都面临着一个关键性的问题,即标识真实地物样本过高 第一章绪论 3 的成本,以及训练样本的维数问题。 第三类方法就是无监督维数约简算法。无监督的维数约简算法不需要训练样 本,也就避免了有监督算法所面对的训练样本的问题。早期引入高光谱图像数据 处理的无监督将维算法关注的是线性发射问题,例如主成分分析( p r i n c i p a l c o m p o n e n ta n a l y s i s ) t 1 6 j ,这种方法以及多维尺度变换( c l a s s i c a lm u l t i d i m e n s i o n a l s c a l i n g ) t 1 。7 】一样,假设低维的嵌入流形( m a n i f o l d ) 是线性的,但是这并不符合高光谱 图像数据的特征。高光谱图像数据的高维特性呈现出了高度的非线性【1 8 】【1 9 1 。近年 来,流形学习( m a n i f o l dl e a m i n g ) 算、法被引入到了高光谱图像数据处理问题中【l 8 】 【2 0 】【2 l 】【2 2 1 ,这类方法很好的解决的了高光谱图像数据的非线性问题避免t h u g h e s 现 象的出现,因为这些流形学习算法研究的是高维数据的内在几何嵌入流形,并且 基于这样的一种假设:处于同一流形上样本属于同一类。例如局部线性嵌入( l o c a l l i n e a re m b e d d i n g ( l l e ) ) i 2 3 1 、等距映射( i s o m a p ) 1 2 4 】以及拉普拉斯特征映射 ( l a p l a c i a ne i g e n m a p ) t 2 5 1 。 还有一些其它的方法如曲线成分分析( c u r v i l i n e a rc o m p o n e n ta n a l y s i s ) t 2 6 ,曲 线举例分析( c u r v i l i n e a rd i s t a n c ea n a l y s i s ) t 2 7 j ,独立成分分析( i n d e p e n d e n t c o m p o n e n t a n a l y s i s ) t z 引,投影寻踪( p r o j e c t i o np u r s u i o l 2 9 3 0 l ,以及小波分解【3 1 】【3 2 1 都 在近年来被提出过。 1 2 2 流形学习算法的研究现状 在传统数据分析中,对于数据集的分布一般建立在统计意义下,通常假设数 据集存在于全局线性结构,也就是说构成数据集的各变量是独立相关的。因而可 以自然地使用欧式空间的这种全局线性空间来作为数据集存在的几何空间。 然而对于实际中的问题而言,非线性数据集更具有一般性。全局线性结构的 假定使得我们很难获得对数据集的真实结构有清楚地认识。尤其对高维数据集, 假定数据变量间的线性无关性,在简单问题的同时也牺牲了对数据内在几何结构 所存在的规律性的真实反映。 要从数据变量之间存在的非线性相关性以及数据集本身结构表现为非线性来 重新认识数据集的几何结构,我们需要采用于全局线性结构假设不同的数据分析 工具。 流形学习的目的是寻找数据集所在的空间表现出的流形结构,要从存在于这 种空间结构的数据集中提取相应的内在几何结构及其规律性。从流形结构来看, 数据的分布可能依赖于内在维数而非观测维数。这种内在维数实质上表现为嵌套 在欧式空间的低维流形的不变量。一个流形简单说法就是一个拓扑空间,它在局 部上是欧氏的。流形学习一般是指一类无监督统计学习问题,其主要目标是寻找 4 基于流形学习像素分布流的高光谱图像数据分割方法 嵌入在高维观测数据空间的低维光滑流形,研究内容主要包括保留或突出原始数 据特定特征的有限数据集的降维;服从某种分布的高维有限样本点的密度估计问 题;由少量潜在因素影响的高维观测数据的隐变量模型建立。 流形学习的代表算法是l l e t 2 3 1 以及i s o m a p 2 4 1 ,其中l l e 是r o w e i ss t 和 s a u ll k 在2 0 0 0 年提出的,他们认为高维数据在局部上仍然呈现着线性的结构, 如果对于每一个数据点仅仅考虑与其近邻点的线性关系,而在全局上在低维嵌入 空间上重构该数据点与其近邻的关系就得到了描述高维空间流形特征的低维表 述;同样是2 0 0 0 年,m b a l a s u b r a m a n i a n 和e l s c h w a r t z 提出了i s o m a p ,这种 方法其实是在m d s 的基础上发展出来的,m d s 考虑的是数据点之间的欧氏距离, 这样就无法描述出非线性的数据结构,而i s o m a p 则是将m d s 中的欧式距离巧 妙的用测地线距离代替。所谓测地线距离就是沿着流形表面寻找出的一条高维曲 线,测地线距离描述了两个数据点之间在流形上的关系,将所有数据点之间的测 地线距离在低维拓扑空间上重构就得到了原始高维数据的低维表述。这两种方法 都是基于特征分解的提出了从局部考虑,而适用全局的新的处理方法,它们代表 着近代流形学习研究的开始,为流形学习的发展起到了关键性的作用,在之后的 研究中,这两种方法被大量应用于各种高维数据处理的问题之中,例如手写体识 别、人脸识别以及高维图像处理问题等等。 然而流形学习算法存在着两个关键性的问题: ( 1 ) 如何找到低维嵌入空间的维数,即高维数据的内在几何特征维数问题。 ( 2 ) 映射结果的无序性,这是由于算法本身并不是收敛的,因为算法是依赖于 特征分解方法,鲁棒性不强。 拉普拉斯特征映射【2 5 】是一种基于谱图理论的方法,本身并不是很新的一种方 法,但是m b e l k i n 和p n i y o g i 将图的构建用流形距离重新表述了。这种算法与谱 图理论有着很深的联系,对于噪声的鲁棒性很强。类似于l l e ,拉普拉斯特征映 射同样只是考虑近邻之间的关系,这样就可以用稀疏矩阵进行运算,算法空间复 杂度以及时间复杂度都得到了降低。本文的方法是基于拉普拉斯特征映射提出的, 这是由于高光谱图像数据收到很多因素的干扰,例如成像的精度、成像时天气的 影响、光照产生光差等等因素,噪声是不得不考虑的一个问题,所以对算法的鲁 棒性要求很高。 1 2 3 流形学习处理高光谱图像数据的研究现状 近年来,流形学习的算法不断地被应用在高光谱图像数据的处理上,这种无 监督的算法由于没有训练样本,也不需要真实地物的标识信息,所以结果并不同 于一般意义上的识别,而更加类似与图像分割的问题。即在图像尺度上将高光谱 第一章绪论 图像数据分割为各个区域,处理最低结果要求不同类别的数据需要被分开,即以 不产生数据点的误分为基准。 c m b a c h m a n n 明确地提出了高光谱图像数据是可以被描述为在低维嵌入空 间上呈简单几何结构的流形0 9 1 ,他们详尽地考查了各种地物的光谱特性对高光 谱图像数据的流形结构做了详细分析,最终他们使用了i s o m a p 算法对数据进行 处理,尽管c m b a c h m a n n 等人对i s o m a p 的算法进行了复杂度优化,但是非稀 疏矩阵的特征映射依然使得算法无法处理过大的数据。 针对这种问题,采用稀疏矩阵的l l e 被引入【1 8 】【2 3 1 ,算法的复杂度相比i s o m a p 得到了降低。这些应用流形学习算法的方法都考虑到了高光谱图像数据的维数过 高以及呈现的非线性问题,但是对这种特殊的数据而言,包含着一种更为重要的 特征,即非线性的特性而且包含着二维平面图像的特性,我们称之为空间特性, 即每个数据点在图像上具有的坐标位置关系。这种关系对于图像分割而言有着很 重要的作用。首次引入空间特性在这一领域是用k e m e l 学习方法1 2 0 1 ,而a n i s h m o h a n 将空间特性引入了l l e 算法中【l 引,并用这种改进过的l l e 算法处理高光谱 图像数据得到了很好的结果。而且在处理高光谱图像数据的非流形学习方法中也 注意到了空间特性的重要性【3 5 1 3 6 。 尽管高光谱的非线性特性以及空间特性都被考虑到了,但是流形学习的基本 问题仍然没有被解决,甚至被避免了,这两个关键性问题在处理高光谱图像数据 时转变为了: ( 1 ) 高光谱图像数据的低维嵌入空间维数问题:维数问题一直难以被解决的原 因在于近邻子空间的选取没有定论,对于流形学习问题而言,被假设为线 性子空间的邻域大小是与低维嵌入空间维数紧密相关的,在r o w e i ss t 和s a u ll k 的研究【3 7 】中,近邻的选取在很大程度上影响着算法的结果, 在高光谱图像数据的处理中这仍然是一个很重要的问题。 ( 2 ) 映射结果的含义:映射的结果通常只是反应出了各个输入数据点之间的关 系,每次的映射结果由于算法收敛性的影响而变的没有比较的意义。低维 空间的映射结果仅仅是作为处理的中间步骤没有得到完全的利用。 本文的方法将光谱反射系数作为像素特征,加权的结合了空间特征,提出了 一种改进的拉普拉斯特征映射算法,并且构建了一种鲁棒的拉普拉斯特征映射像 素分布流用于处理高光谱图像数据。对于上述问题之前的研究并没有给出详尽的 分析【1 7 】【1 8 】【2 0 1 ,甚至没有给出映射的结果副1 剐。本文提出的方法虽然没有在数学上 解决第一个问题,但是引入空间特性的时候考虑到了这一问题,将高光谱图像数 据当做二维平面图像进行处理,强制性的加强了空间特性的权重,使得我们可以 用2 维向量来重新描述原始图像中各个像素点之间反射系数的相关性;这一方法 的采用,也使得映射的结果和原图像素点的分布对应起来,使得映射的结果具有 6 基于流形学习像素分布流的高光谱图像数据分割方法 了可视化的效果以及直观的观测意义。 选择拉普拉斯特征映射算法作为我们的基本算法是因为算法本身与谱图理论 的关系很密切,并且m b e l k i n 和p n i y o g i 在数学的角度上证明过该算法的收敛性 问题 3 8 】。而且在出现离群点的时候算法的鲁棒性很好【3 9 1 。基于输入相近输出也相 近的这一假设,可以很好的使用结合了像素特征以及空间特征的权值,即r p 和r f 两个空间上的输入数据。其中p = 2 ,r 尸表示空间特征空间;f 是高光谱图像数据 的光谱谱段数。r f 代表的是像素特征空间。 1 3 本文重要工作及内容安排 本文主要研究了基于拉普拉斯特征映射算法像素分布流的高光谱图像数据的 的分割方法。文章的主要内容安排如下: 第二章主要介绍了拉普拉斯特征映射算法的基本知识,其中包括了算法的基本 实现过程、理论推导以及算法核心的介绍。这些知识是我们进一步的引出用于高 光谱图像数据分析的理论基础。 第三章研究了改进的拉普拉斯特征映射算法以及像素分布流的构建。主要的改 进就是将两种不同近邻选取特征通过自定义的高斯距离相乘结合起来,包括如何 加权结合两种输入空间的数据,以及参数的选取。像素分布流的提出以及构建方 法。并且通过简化参数来解释像素分布流的实际物理意义,为之后的应用做了理 论准备。 第四章主要介绍了基于拉普拉斯特征映射像素分布流的高光谱图像数据处理 方法以及利用实际的高光谱图像数据所得到像素分布流的结果。通过实际的数据 测试以及对第三章定义的高斯距离的进一步详细分析确定了参数的选取。对于映 射的结果提出了必须进行的两种后处理方法:包括非线性几何校正,这种校正可 以把映射的结果人为的通过先验的空间特征知识固定,得到较为稳定的映射结果; 以及边界收缩效应的校正,这种校正是针对算法本身引入空间特征所导致的映射 结果边界相比内部不合理的收缩的现象,得到了边界与内部结果接近一致的结果。 最后用单阈值选取边界点的方法给出小区域高光谱图像数据的分割结果。 第五章主要介绍了对大规模高光谱图像数据的分割结果,对于大规模的高光 谱图像映射结果,第四章中提出的边界收缩效应会更加严重,导致单阈值无法选 取有效边界点的结果。这一章提出了一种通过多个阈值同时选取边界点综合处理 的方法解决了这一问题,最后给出了分割结果。 第六章对本文的工作进行了一个总结,并提出不足和展望。 第二章拉普拉斯特征映射 7 第二章拉普拉斯特征映射 2 1 拉普拉斯特征映射算法的基本思想 拉普拉斯特征映射是在2 0 0 3 由m b e l k i n 和p n i y o g i 提出来的【2 5 】。其基本方 法就是谱图理论,而m b e l k i n 和p n i y o g i 则把谱图理论放在黎曼几何的框架内, 给出完整的几何分析的。拉普拉斯特征映射的基本思想就是用一个无向有权图来 描述一个流形,然后通过用图的嵌入来找低维表示。在图论中实际上就是保持图 的局部邻接关系的情况,把这个图从高维空间中重新画在一个低维空间中。在至 今为止的流形学习的典型方法中,拉普拉斯特征映射是速度最快的。而且它有一 个其他方法没有的特点,就是如果出现离群点的情况下,算法的鲁棒性特别好。 拉普拉斯特征映射的基本假设就是如果两个高维空间的输入数据点之间的其 距离( 一般指欧氏距离) 比较接近,那么这两个点在其低维嵌入空间上也是同样接近 的。这其实包含了两个问题: ( 1 ) 算法仅仅考虑在高维空间上接近的数据点,也就是仅仅考虑数据点近邻 空间,这种思想就保证了算法能够描述高维空间的几何流形特性,因为在 黎曼几何的框架内非线性是相对整体而言的,在足够小的邻域内任何维数 的数据都是可以被看做是线性的。 ( 2 ) 基于上述假设,对于一个邻域内的点与点的关系可以在低维空间内很好 的被保持,这样就可以通过一个个近邻邻域很好的保持全局数据点在高 维流形上关系。 2 2 1 流形的定义 2 2 拉普拉斯特征映射算法 所谓流形就是在足够小的邻域是线性的,即分布在高维观测空间中具有低维 自由度的嵌入空间。这种描述是基于认为在小邻域中数据的分布都是线性的假设, 即在一个小邻域内,可以用欧式空间的特性来描述流形。流形的数学描述为:假 设h 4 为嵌入在d 维欧氏空间中的d 维嵌入空间中的一个流形,其中d d 那么从 低维嵌入空间到高维观测空间的映射厂为: f :m cr djr d ( 2 1 ) 基于流形学习像素分布流的高光谱图像数据分割方法 这里a , 4 为r d 上紧致的连接开子集。 设高维观测空间数据集( 输入数据) 为x - - r 1 ,而,h ;其中薯r ? , 汪1 ,2 ,n ,服从某种潜在分布p : 毛= 厂( 乃) + q ,i = 1 ,2 ,n ( 2 2 ) 这里的】,= m ,y 2 ,y n ) ,即对原始数据在低维嵌入空间的描述( 输出数据) , 其中y r d ,t 表示分布独立的噪声。 流形学习的目的是根据高维空间的输入x 重构未知映射函数厂( ) 以及z 在 低维空间中的重新表述】,即对于任意的咒mcr d ,最终的目的是用厂( 儿) 来 重新描述鼍。 2 2 2 拉普拉斯

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论