(计算机应用技术专业论文)遥感图像分类方法的研究.pdf_第1页
(计算机应用技术专业论文)遥感图像分类方法的研究.pdf_第2页
(计算机应用技术专业论文)遥感图像分类方法的研究.pdf_第3页
(计算机应用技术专业论文)遥感图像分类方法的研究.pdf_第4页
(计算机应用技术专业论文)遥感图像分类方法的研究.pdf_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山末稀技走学磷士擎位论文摘叠 摘要 9 0 年代卫星遥感在全球和区域尺度土地覆盖研究与应用方面取得了突破性进 爱,主蘧翻翳疆盖遥感器究瓣薪方法不断交瑷。遥感强像豹分类是遥感数藏在主 地资源分析及应用的第一步,如何解决多类别图像的识别并满足一怒的精度,是 遥感囊像磅炎孛翡一会关键麓瑟,昊凑 分黧要懿意义。 岛传统统计方法的分类器相比较,人工神经网络法不需鼹预先假设样本空间 翦参数纯统诗努毒,泛在被越来越警避麴应攥: 遥感霆像分类浆簪 究。在享枣缀霹 络的不同算法中,应用和研究最多的魑反向传播人工神经网络模型( 简称b p 网络 模型) 。 魇向传播神经潮络方法可用于遥感图像分类。本文在对b p 网络分析的基础 上,为提高网络的收敛速度和性能,提出了巍己的一些建议,通过设置并改变榉 本的训练强度加快了网络学习的速度。另外还构造了一个用于混合像寨分类的神 经网络,输出层节点为各典型地物类别所占的百分比。分类前对数据进行主成分 分析,实现特征提取豹目的。在实际分类对仅使用波潜信意有研是不够静,可以 添加一些辅助信息,如高程、植被指数等进行基于知识的报理判断。使用这蝗方 法对密验区豹嘲窝豫进行了分类实狻研究,取褥了较好酌效果。 关键逶:遥感图像势类;模式谖羽;人工专孛缀两终;决策拇;特征掇取;发淘传 播神缀网络( b p 网络) 山东科技大学硕士学位论文摘要 a b s t r a c t a t p r e s e n t ,m e r ei saf a r r e a c h i n gu s eo fr e m o t e n s i n g ( r s ) i m a g i n e i i it t l ef i e l d o f1 a n du s e ,l a l l dc o v e rc h a n g c ( u j c c ) r c s e a r c h t h er e s e a r c ho nl u c c i sac o 化f o r s t l l d i e so nm eg l o b a lc h a n g e s a l s ot l l er e s e a r c ho fs p a t i a l 七m p o r a lf 色a n l r e so fl a n d u s e ,l a n dc o v e rc h 蛆g ei ss i g n i f i c a i l n yi m p o f t a i l tf b rb c 仕e ru n d e r s t a 】n d i n gl a n du s e ,l a n d c o v e r c h a n g e 趾de n v i r o 咖e n t a l m a n a g e m e n t f o r 辄s t a i n a b l e d e v e l o p m e n t t h e t e c h i l i q u e s o fc l 硒s i 丘c a t i o na r e v e r yi i l l p o r t a i i t f b rl 柚du s e ,1 趾d c o v 盱c h 趾g e ( l u c c ) ,s ou j c cs t i l d ya 0 n 血eb 鹊i so ft h ei m a g ep r o c 船s i n ga n dc 1 鼬s i f i c a t i o n s y s t c mi nm ef i r s t h 0 wt oi i i l p r o v e t h e a c c l l r a c yo fr si n t e 】靶锄o ni n o r d e rt o p m 肿t e t t i eu m i t yo fr s t e c h n o l o g y i sa u 礓e r l tp r o b l e m i nr s a p p l i c a t i o n c o r n p a 佗dw i 血c o n v e n 吐o n a lg c a t i s t i cc l 船s i f i e r ,血e 删f i c i a ln e u r a li 伦柳o r kl a n n ) h 勰b e e nd e v e l o p e d 飘da p p l i e dt o 脚t es e 璐i n gd a 士ac l 雒s m d p r d b k m ,w h i c h d o e s n tn e e ds u p p o s ep 盯锄删z e dd i s 缸i b u t i o no fs a m p l es p a c ei na d v a n c e a n nh 粕 c o l p l i c 砷e dm a p p i n gca p a _ b m 哆1 1 1 e b kp r o p a g a t i o nn e _ a ln e t w o r km o d a l ( b p n l o c i c l li so f t e nb e e nu s e d b a c kp r 叩a g a 吐o nn e l l r a ln e t w o r kc l 鲢s i f i 盯c 姐l v e 血ep r 0 _ b l 嘲se x i s t i i l gi nt t l e 姐d i t i o n a lc l 舔s i f i e r s 孤dh 勰b e e n 孕a d u a l l y c di n 吐峙d 舔s i a t i o n0 f 臌n o c e n s i n g i m a g e h io r d e rt oa c c e l 啪t et h e 蛐gs p c e 血缸i m 邮db p 删:蝴i st o b e p 佗n t e da f 嘧姐a l y z i i i g t h eb p m o d e l t 1 i r o u 班m n g a t r a 试m gi n 协n s i 锣 t h e 蛐g t i m ei sr e d l l c e d a st om e m i 】【p i ) 【e l s ,、ec 0 i l 蛐m c tab p 饿粕m n e 脚o r kw h i c ht l l e n o d e s0 f i n p u t l a ) 吧fa r e t h eb 如d so f 托m o t cs e n s i l i g 瓶d m en o d e so f t p 毗l a y e ra p e r 。b n to fs “e r a ll d 】d s0 fo b j e c lb e f o r ec l a s s i f i c a l i o 玑l 【 i r b 朋乩- l 成wt r a 雌f o | mi s c a r r i e dt l l r o u g hf b rf e 咖r e sa b s 廿a c t ha d m t i o n 也es p 髓咖i i l f o r l a c i 吼,m 锄节 a n c i u a r yg e 0 蜘a 虹o n s u c h壮卜州i 姐dd c 舭i sc o r n i 倾l 由e d t o j u d 黔 s y n t h 船i z i n gn 他s em e t h o d s ,w eh a v ct 1 1 e t e s lc 删稍t hc l 器s i 置i c a t i o fm l c m e 血o d t h c s l l l t ss h o w 也ei m p r o v c dm “h o dh 站n o to n l yt h eh i g h e s t 觚a l r 踮yb m a l s ot h ef h s t e s t 鲫e e do fd 躺s i f i c a t i o n k e y w o r d s :r e m o 把s e n s i n gi i i l a 驴c l 硒s i 砒i ;p a n e mr e c o g 血o n ;a m f i c i a l 鹏u m n e t w o r k ;d c c i s i o n 心:f e a m r ea _ b s 廿t i o n ;b kp m p a g a t | o n p ) m o d e l 声明 本人鼹交给山东科技大学的这篇硕士学位论文,除了所列参考文献和世所公 认的文献外,全部是本人在导师指导下船研究成果。该论文尚没有呈交于其他任 霉学拳扭美露整定。 疆突囊麓名;写静 日 嬲:o 9 捌睡b 玉蜩旺o n i e l 鑫f e 氇壤蜘蕴豁疆谢。蠡瑚b 嬲拖鲑遮蠹蕊融秣骥妞嘲豳懿心拯融龇a 蝴畦 o fm a s t e ro fp h n o s o p h y i ns 抽烈l o n gu l l i v e 璐i 移0 fs c i e n c e 缸d t c c h n o l o g y i sw h o l l y m y o w nw o r ku n k s sf c f b r e n 黼do f a c k n o 、v k d g e t h ed o c u m e m h 髂n o tk 埔ns u b m i t t e d f b r q u a l i f 童c 删o n a ta n yd 恤e r a d e m i ci n s 曲i 把 s i 倒赢珊 龇: - 5 乎 山东科技大学硕士学位论文 1 1 课题背景和选题依据 1 1 1 遥感技术 1 绪论 遥感( r c m o t es e n s i n g ) ,顾名思义,就是遥远地感知。它是一种远离目标, 通过非直接接触而判定、测量并分析目标性质的技术。通常人们所说的遥感是从 不同高度的平台上,使用各种传感器,接收来自地球表面的各种信息,从而对地 物及其特性进行探测和识别的综合技术i l 】。 遥感是本世纪六十年代发展起来的新兴综合技术,它与空间、电子光学计算 机、地学等科学技术紧密相关,是现代科学的一个重要组成部分,是研究地球资 源环境的最有力的技术手段之一。遥感技术广泛渗入各地区和各业务部门,应用 研究涉及的领域广、类型多,既有专题性的,也有综合性的,包括农业生产条件 研究、作物估产、国土资源调查、土地利用与土地覆盖、海洋、环境监测、军事 侦察等方面都有着越来越广泛的应用。 人类通过大量的实践,发现地球上每一个物体都在不停地吸收、发射和反射 电磁波,并且不同物体的电磁波特性是不同的。遥感就是根据这个原理来探测地 表物体对电磁波的反射和其发射的电磁波,从而提取这些物体的信息,完成远距 离识别物体。对地面目标进行采集是通过遥感传感器实现的。按照所利用的电磁 波的光谱段可将遥感分为以下三种类型。( 一) 可见光反射红外遥感,主要指利 用可见光( o 4 o 7 微米) 和近红外( o 7 2 5 微米) 波段的遥感技术统称。( 二) 热红外 遥感,指通过红外敏感元件,探测物体的热辐射能量,显示目标的辐射温度或热 场图像的遥感技术的统称。( 三) 微波遥感,指利用波长1 1 0 0 0 毫米电磁波遥感的 统称。 地球遥感卫星是最具有代表性的遥感平台。六十年代以来,卫星遥感传感器 的不断改进,卫星遥感数据的频谱范围不断扩大,分辨率不断提高,为卫星资料 的应用开拓了广泛的前景。卫星图像的地面分辨率从n o a a 气象卫星的1 1 千米提 高到美国l a n d s a t 卫星删( t h e m a t i cm a p p e r ) 数据的3 0 米,法国s p o t 卫星的 l o 2 0 米。 1 1 2 课题提出 有效的保护和合理丌发利用土地资源,是我们国家目前砸临的最严峻的资源 山东科技大学硕士学位论文 环境问题之一。为了对土地的利用状况进行监督和指导,国家正式启动利用遥感 影像进行土地利用动态监测项目。随着卫星对地观测技术的出现以及计算机技术 的迅猛发展,使得有可能在较大的地理区域内进行土地覆盖的详查与制图。9 0 年 代卫星遥感在全球和区域尺度土地覆盖研究与应用方面取得了突破性进展,土地 利用覆盖遥感研究的新方法不断出现,利用遥感进行大面积土地详查已经逐步摆 脱了单一制图的传统概念,正向建立以应用为目的的且便于用户使用的综合信息 数据库的方向迈进【o j 。 本课题来源于国土资源部项目构建国家级土地利用和覆被变化数据库及服 务系统的子课题“土地利用与覆被信息提取与变化监测方法研究”。按照国家土 地资源管理和l u c c 研究的要求,综合土地资源的自然属性和社会经济属性,结合 已有的土地利用与土地覆被数据。目前和未来可获取的数据资源以及我国已存在 的有关土地利用和覆被分类体系,研制我国国家尺度的土地利用和覆被分类系统, 建立与已有主要分类系统的对应关系。并且建立典型区多时相遥感影像数据库, 完成典型区多时相遥感影像土地利用和土地覆被分类,形成多时相多尺度遥感影 像数据库建立方法和遥感影像分类方法。 土地利用土地覆盖的分类是遥感数据在土地资源分析及应用的第一步,如何 解决多类别图像的识别并满足一定的精度,是遥感图像研究中的一个关键问题, 具有十分重要的意义。 1 2 遥感图像分类技术的现状 遥感图像的计算机分类,与遥感图像的日视解译判读技术相比,两者的目的 一致,但手段不同,前者是利用计算机模拟人类的识别能力,后者把地学工作人 员的专业知识介入到图像分析中去,是遥感解译的基本方法。而在实际工作中, 常常是二者有机结合起来,互相取长补短。计算机自动分类可以利用各波段、各 像元的灰度值最小差异,探测目标的微小变化,精度较高,适于定量分析,速度 快,可重复性好,因而越来越得到广泛的应用,尤其是与地理信息系统相结合更 是显出其强大优势。计算机分类的快速处理数据的能力也是与遥感大量信息相适 应的,目前已成为遥感理论和应用研究领域主流之一。 遥感图像分类的理论依据是:遥感图像中同类地物在相同条件下( 纹理、地 形、光照以及植被覆盖等) 应具有相同或相似的光谱信息特征和空间信息特征, 因此同类地物像元的特征向量将集群在统一特征空间区域,而不同的地物由于光 谱信息特征或空间信息特征的不同,将集群在不同的特征空间区域。同类地物的 各像元特征向量虽然不是完全集中在个点上,但也不是杂乱无章分布的,而是 相对密集的分布在一起形成集群,当像元数目较大时,近似呈多维正态分布。一 个集群相当于一个类别,而每类的像元值向量可以看作随机向量,因而遥感图像 山东科技大学硕士学位论文l 绪论 分类方法一般是建立在随机变量统计分析的基础上的。 依掘是否使用类别的先验知识,可分为监督分类( s u p e r v i s e d c l a s s i f i c a t i o n ) 和非监督分类( u n s u p e r v i s e dc l a s s i f i c a t i o n ) 。监督和非监 督分类法相比,监督分类的精度高些,准确性要好一些,但是需要采样,工作量 要大得多。监督分类要选好训练样本,要求样本有一定的代表性,而且有足够的 数量。常用的分类方法有最大似然法,神经网络法和基于知识的决策树法等,下 一章详细介绍。 在国外,在遥感图像处理领域卓有成效的有美国e r d a s 公司推出的e r j ) a s i m a g i n e 、加拿大e r m 公司研制的e r m 印p e r 、新加坡3 一l i i l l ( 公司的e n v i 等。这 些商用软件通常提供基础级( e s s e m i a l s ) 、高级( a d v a n t a g e ) 和专用级( p r o f e s s i o n a l ) 三级模块软件。在专业级遥感图像处理模块是在其他两级的基础上,增加用于遥 感与地理分析专业的综合工具,如分类技术、雷达分析、可视化空间建模工具等。 特别是e r j ) a si m a 西n e 不仅具有常用的监督和非监督分类技术,而且具有予像元 分类器( s u b p i x e lc l a s s i f i e r ) 及结合专家系统的专家分类器( e x p e nc l 髂s i f i e r ) 。子 像元分类模块是功能强大的多光谱图像研究工具,具有较高水平的光谱区分能力 和分类精度。专家分类器通过建立专家系统,既充分利用光谱信息,又将空间关 系信息( 纹理特征) 引入,并且需要建立并运行复杂的推理机制,从而生成土地 覆盖图和其他信息类别。因而除了该软件具有相当高的价格外,对软件使用者的 地学知识和经验以及建模能力又相当高的要求。 国内在g i s 和遥感图像处理领域的发展较晚,加之产品功能单一,因而在市场 上的份额较小。进入9 0 年代以来,随着国际上微机平台的遥感图像处理系统的兴 起和国内地理信息系统等相关领域的迅速发展,我国遥感图像处理系统的研制有 了新的发展。武汉大学开发的m a p g i s 等国内先进的基于微机w i n d o w s 平台上的 g i s 软件已包含了遥感图像处理模块。但其相对功能较弱。另外像t c n u xh n a g c r 是北京诺瓦信息技术有限公司推出的独立架构的遥感图像处理软件。但遥感分类 技术单一仅能提供最大似然法分类,因而分类效果相对较差。 1 3 本文的主要内容 基于遥感与g i s 技术的土地利用土地覆盖研究的一个核心内容,便是土地利 用土地覆盖的图像分类与自动提取。本文对遥感图像信息的特征提取和模式识别 进行一些研究,主要包括以下内容: l 采用人工神经网络方法中的反向传播算法( 简称b p 算法) 进行遥感图像 分类的实验,并对现有的b p 方法提了些建议,通过设置一个训练强度,有效的提 高了网络的收敛速度。 2 针对混合像元在遥感图像的信息提取中的困难,处理混合像元不能直接归 山东科技大学硕士学位论文 入某一类地物,而是构造一个用于混合像素分类的神经网络,其输出层节点数等 于典型地物类别所占百分比。 3 在对图像进行分类之前应对图像信息进行特征选择和提取。本文采用k l 变换方法( 又称主成分分析) 达到了压缩数据量和消除相关的目的。 4 应用v i s u a lc + + 平台设计了基于遥感图像的部分地物的自动识别系统。 山东科技大学硕士学位论文2 遥感躁像分类 2 1 概述 2 遥感图像分类 遥感匿像分类,又称遥感模式谈剐,遴常模式谖剐建猎把具有慕种空闯或集 合特征的东西,或者许多同搂物体以某种固定的相关方斌重复布置。在模式识别 中,任何一组商确定意义的测量都可成为一种模式,例如不同地物对不同波长辐 瓣瓣翡应特毪豹缝台藏霉敬纛终是不羁必漤数据豹蒺式。换每逶谖,一令模式裁 是个多维空间中的一个点。模式识别是指对需要识别或分类的对象进行一系列 的测量然后将这些测量所构成的模式利用某种分类判决规则判属巢类别的过 稷。 、+ 由于叁然嚣掰莺有的陡税往,对阕翻察鬻瓣变凭、瀵薅设备本身豹误差和噪 声锋的影响,潞感数据中同类型的地物的不同个体的模式矢量不可能完全相同, 谯空间呈点群状分布而不是单独的一点。则就要求在空间形成一系列判决面,通 适蒺秘方法判凝耪分类豹像索落入郡秘遗物对瘦兹区域巾。 2 1 1 地物波谱特征 遥臻强像懿豢遥感霾溺嚣域一定露藏羧斑豹建餐魄缀波辐寨,茭获渡丈枣及 其变化只反映了地物的辐射光谱能量特征,其纹理特饺代表了地物的光谱结构特 征。因此,遥感图像实质包食了地面地物的三类信息:时间信息、光谱能量信息 鄹结构信息。翻像分类就是举i 熙地物豹必谶能量特征蓑努性彝结构特征差异性, 将遥感数字图像中静豫元裁炎强几种遗物类型中,袄蕊箍取赉有用豹专题信意隽 最终用户所使用。 图2 1 典弛地物波谱曲线形态 自然界中地物与电磁波的相互作用主要表现为反射、发射、吸收嗣透射几种 形式。魏彝在溺薅翊、空翔条 孛下,荬爱瓣、发射、嗷觳帮透瓣恕磁波蠢特瞧 山糸 技火拳硕士擎往论文2 遥感穗琅分美 是波长的涵数。该函数关系的蓝线表示州地物波谱。不同酶物体由于旗组成成分、 内部结构和表面状念以及时间、空间环境的不同,它们的反射、发射、吸收和透 射电磁波的特性也不同,即不同地物具有不同的波谱曲线形态“3 ,如图2 1 所示。 2 。 2 溅爨参数 荚围l a n d s a t 一4 5 号卫麓上达载有多光谱掴描仪( m s s ) 和专题制图仪( t m ) 。 其中t m 数据是我国应用最为广泛的地球观测数搬,t m 的观测参数见裘2 1 。 袭2 1 州卫星参数 2 ,1 。3 灞感图像分类的基本原理 计冀桃遥感图像分类怒模式识别技术在遥感领域中的其律斑用,冀鑫静是对 图像上的每个像元给出对_ 溆淡别。图像分类器( i m a g ec l a s s i f i e r ) 浇义如下: 给怒一个二值均匀测殿函数p ,如果图像,( x ,y ) 中某个区域满足一定意义下的 均匀特性,剃该区域p 值为冀,否劐为假。对鞠像豹一个分类就怒获得图像的一 令刘分x ;,x :,x 。,荬串x + 莰表露i 类嚣镶瓣嚣壤,该麓分寝溃避: 1 ) u = ,佤弗鼍# 织一n z ,= 庐其中,0 ,y ) 是像素点的总集。 2 ) 是连通的。 3 ) 辫t ,毒,期邻,且联) = r ,地j ) = r ,则烈鼍u 算) = f 璞慧靛分类嚣应兵寿强耱控矮: 1 ) 分类过程的可重复性。由其他测试者采用相同数据能够获得捆同的结论。 2 ) 鲁棒性( r o b u s t n e 8 s ) 。对输入数据的微小改变不敏感,即输入的微小变化 或随机噪声不会影响输出结累的有效性。 一般地,分类后不同的鞠像区域之闽性威藏器应尽可能地大。两迸域内部性 矮瘟绦 逶乎稳特毪。遥感瓣豫分类大致接嚣2 ,2 戆j 蘸痔遗蠹: 区堕p 匝巫p 区p 圈 幽2 2 图像分类流料 6 山东科技大学硕士学位论文2 遥感图像分类 2 2 图像的预处理 利用光谱数据进行模式识别时,结果的准确性很大程度上取决于光谱数据的 聚集程度。为了减少分类错误,必须在分类之前作必要的预处理,目的是对遥感 图像作辐射量校正、几何校正、线性拉伸增强处理以及去除噪声等。 2 3 特征提取和选择 特征提取和选择的基本任务是如何从许多特征中找出那些最有效的特征。特 征形成是指根据被识别的对象产生出一组基本特征,它可以是计算出来的,也可 以是用仪表或传感器测量出来的,这样产生出来的特征叫做原始特征。原始特征 数量可能很大,或者说样本处于一个高维空间中,通过映射或变换的方法可以用 低维空间来表示样本,这个过程叫特征提取。若直接从一组特征中挑选出一些最 有效的特征以达到降低空间维数的目的,这个过程叫特征选择。 特征提取和选择是对分类精度和可靠性影响最大的因素之一,强烈影响到分 类器的设计及其性能,因而研究者提出了很多方法。 2 3 1 特征提取方法 ( 一) 子集选择,即针对待分类地物的特点,从所有波段中提取全部或几个波 段作为特征。波段选取可依经验也可根据美国查维茨教授提出的最佳指数公式 ( o i f ) : 墨 d 伊= = l 一 窆主k l f 1 ,一“1 ( 2 1 ) 式中s i 为第i 个波段的标准差,s i 越大,该波段图像的信息量越大;r i i 表示 第i 个波段与第j 个波段之间的相关系数,r i j 越小,两个波段之间的独立性越高。 即o i f 值越大,波段组合越优。骆剑承提出基于t m 六个波段的遥感影像分类模 型研究,刘建平基于信息论提出高光谱遥感数据最佳波段选择方法。 ( 二) 比值处理,用各波段间的数值运算作为新的特征,例如比值、植被指数 等。陈铭臻根据对水稻和背景的光谱特性分析,建立水稻种植面积的提取模型 ( t m 4 t m l ,t m 4 厂r m 3 ,t m 4 ,t m 2 ) 。杨存建提出基于此方法的t m 影像的居民 地信息提取方法。 ( 三) 线性组合,新的特征向量的每个分量是原来d 个分量的线性组合。 山东科技大学硕士学位论文 2 遥感图像分类 ( 四) 主成分分析,采用k l 变换选取能量较大的m 个分量代替原来的d 个 分量。通过k l 变换,消除了原有向量的各分量之间的相关性,从而有可能去掉 那些带有较少信息的坐标轴以达到降低特征空间维数的目的。 ( 五) 辅助信息的提取。仅仅使用波谱信息进行模式识别有时是不够的,遥感 图像中还包含纹理等空间结构信息,可用来提高分类精度。纹理的测度可应用共 生矩阵法、半变差函数法、马尔可夫随机场、小波变换法和分形分维法。秦其明 提出用分形方法确定卫星数字图像中的纹理特征。 特征的选择是针对特定的专题信息提取而言的,选择的特征少,分类器的设 计和实现简单,但分类的精度不高:选择的特征太多,分类器的设计和实现复杂, 分类效果也不好。 2 3 2 主成分分析4 3 2 3 2 1 基本原理 主成分分析,又称k a r h u n e n l o e v e 变换( 简称k l 变换) ,是建立在统计特 征基础上的多维( 遥感图像处理中即为多波段) 正交线性变换,它是基于均方误 差最小的变换。多波段图像通过这种变换后产生出一组新的组分图像,组分图像 数目可以等于或少于原来图像的波段数目。对于一幅多波段图像,波段之间往往 存在很大的相关性,从直观上看,不同波段图像之间很相似,从提取有用信息的 角度看,有相当大的数据量是多余的、重复的。通过k l 变换能够把原来多个波 段中的有用信息尽量集中到数目尽可能少的新的组分图像中,使图像数据量得到 有效的压缩,而且还能够使新的组分图像中的组分之间互不相关,也就是说各个 组分包含的信息内容是不重叠的。 k l 交换的主要特点是:( 1 ) 变换前后方差总和不变,而是把原来方差等量的 再分配到新的组分图像中;( 2 ) 第一组分取得方差的绝大部分,一般占8 0 以上, 也就是说k l 变换的结果使得第一主成分几乎包含了原来多个波段信息的绝大部 分内容,其他组分图像的方差依次减少,包含的信息量也剧减;( 3 ) 各组分之间 相关系数为0 或接近0 ,也就是说各组分图像所包含的信息内容在很大程度上是不 同的;( 4 ) 第一主成分相当于原来各波段的加权和,而权值又与该波段的方差大 小成正比( 方差大,则图像包含的信息量大) ,反映了地物总的反射强度。其余组 分相当于不同组分的加权差值图像;( 5 ) 对第一组分进行高通滤波,有利于细部 特征的增强和分析:( 6 ) 多数情况下,第一主成分主要包含的是地形和植被方面 的信息。 山东科技犬学硕士学位论文 2 遥感图像分类 2 3 2 2 计算步骤 k l 变换一般按照下几步进行: ( 1 ) 对多波段图像数据进行统计特征分析,计算波谱图像的灰度动态范围、均 值与中值、波段图像的相关系数矩阵及协方差阵,确定产生式矩阵r 。 ( 2 ) 求r 的特征值彳,及其对应的特征向量力,j = l ,2 ,n ,用特征向量构成 k l 变换的矩阵中= ( 破苁疙) 。 ( 3 ) 变换后的向量为口= 中7 x ,x 为原来的向量。 可以证明,当取d 个与矩阵中的d 个最大特征值对应的特征向量来展开x 时, 其截断均方误差和在所有其他正交坐标系情况下用d 个坐标展开x 时所引起的均 方误差相比为最小。这d 个特征向量所组成的正交坐标系称作x 所在的d 维空间 的d 维k l 变换坐标系,x 在k - l 坐标系上的展开系数向量称作x 的k l 变换。 数据集 x ) 的k l 坐标系完全由数据的二阶统计量所确定。当集合中的各样本 所属的类别未知时,k l 坐标系的产生矩阵矿= 研嚣7 】。由于没有类别标签的样 本集均值向量常常没有什么意义,所以也可以把数据的协方差矩阵 = 研0 一肋0 一肋7 】作为k l 坐标系的产生矩阵。这里是总体均值向量。 图2 3 是一个二维空间的例子,在原来的坐标系中要用两个分量五,来表 示各个样本,而经过k l 变换,在k l 坐标系中只要用毡就可以了,去掉,并不 会带来很大的误差。 jl 2 u 夕、 i 7 。 兰 ¥x 7 图2 3k l 变换 山东科技大学硕士学位论文2 遥感图像分类 2 4 图像分类方法 依据是否使用类别的先验知识,可分为监督分类( s u p e r v i s e d c l a s s i f i c a t i o n ) 和非监督分类( u n s u p e r v i s e dc 1 a s s i f i c a t i o n ) 。 非监督分类是指在缺乏先验知识的情况下,只根据数据本身的统计特性进行分 类。这种分类法的理论根据是同类样本具有内在的相似性,一般在卫星图像上, 同类物体在同样条件下应具有相同的光谱信息特征,从而集群在同一个光谱空间 区域里,不同类物体因其光谱信息特性不同而集群在的不同的光谱空间区域里。 因而在开始分析图像时,或者某一地区如荒漠、沼泽等地面调查困难时,用非监 督分类方法对地面情况作初步调查,和用这种方法随时间不同作某一地区的跟踪 监测都很有效。非监督分类中最常用的方法是聚类法。 监督分类就是先用某些已知类别训练样本让分类识别系统进行学习,待其掌 握了各个类别的特征之后,按照分类的决策规则进行分类下去的过程。目前比较 成熟的分类方法,一般是概率统计分类方法。除此之外,尚有模拟自然语言的句 法结构识别分类方法和模糊数学分类方法等。就统计分类方法而论,通过计算各 个类别的均值、方差、协方差、标准偏差和离散度等统计量,作为进行比较不同 类别的相似程度的依据和标准,也即在这些统计量的基础上建立各个组类的类别 识别特征来进行分类。 2 4 1 最大似然法( h a x i m u ml i k e ii h o o dc i a s s i f i c a t i o n 啊l c ) 邮 最大似然法因有严密的理论基础,对于呈正态分布的类别判别函数易于建立, 综合应用了每个类别在各波段中的均值,方差以及各波段之间的协方差,有较好 的统计特性,一直被认为是最先进的分类方法。 2 4 1 1 基本原理 最大似然比判决分类方法是建立在贝叶斯准则基础上的,其分类错误概率最 小,是风险最小的判决分析。在进行图像统计分类中,如果有一个n 波段的待分 像元的随机模式:x = f x l ,x 2 ,x n 】 应把它判归于那一个类别呢? 事实上,随机模式x 肯定是某地物在遥感图像 上的反映,就是说它可以找到一个类别u ;,把待判模式x 归属进去。假定遥感图 像有4 个波段,对一个像元点来说,每一个波段值都为o 2 5 5 ,即有2 5 6 种可能 性,4 个波段就为2 5 6 4 种组合可能性,也就是说对于一个类别就有2 5 6 4 种波谱分 布的可能性。假如要分成m 个类,就要有m 2 5 6 4 种波谱分布。这样多的波谱分 却的直方图都要贮存在计算机内,以便分类过程中进行匹配和识别时选用,这实 o 山东科技大学硕士学位论文2 遥感图像分类 际上是行不通的。但是,在自然界中大部分事物的规律都是服从e 态分布的,地 物的波谱辐射和其对应的遥感图像灰度值也都近似地遵循正态函数的分布。因此, 假定各类地物波谱辐射都作正态函数的分布,采用正态函数来匹配直方图,故对 某一波段就有 弛= 高卅警】 ( 2 2 ) 其中i 表示类别序号,这样对于某一类别,只要知道方差6 和均值u 就可以 完全确定一个正态分布的曲线了,使用各种形式的正态分布曲线来匹配各个组类 的概率密度曲线,而且可以通过采取训练样本来估计决定正态函数的两个参数。 假定某一波段某一组类l ( 1 = 1 ,2 ,m ) 有训练像元n 1 个,对应像元值为。i l ( i - 1 ,2 ,n 1 ) ,则有 h = 去缸c 毗m , ( 2 3 ) 群:丢羔妻o 。一m ) ( 却一h ) ( 1 - l ,2 ,m ) ( 2 4 ) mi t ,- l 对于n 个波段图像信息数据有 工l 且 z 2 : 工删 0 = 1 ,2 ,n l ;l _ l ,2 , m )( 2 5 ) 数据矩阵中元素粕1 的下标分别为:i - l ,2 , n 为波段序号,共n 个波段。 此时均值和协方差为 h = k 。,鸬一- - 肌】r ,z ,= 点2 f 如, : 晶2 , ( 2 6 ) 而n 维正态分布的概率密度函数公式为 脚2 赤麟帕卜椭k 刊 ( 2 7 ) 式中,离i 是协方差矩阵z ,的行列式,- 1 是,矩阵的逆。 相应的最大似然分类判决函数为 g ( x ) = p ( x i q ) p ( ) ( 2 8 ) 从式( 28 ) 两边取对数得到实际应用的最大似然比判决公式 ; 山东科技大学硕士学位论文2 遥感图像分类 g i ( x 1 = 1 0 9 p ( q ) 一 1 0 9 l i 一 ( x h ) 。i ( 工h ) ( 2 9 ) zz 最大似然比分类首先训练样本,即开始采样m 个组类像元训练样本,每组 类的训练样本数为n i 每个像元模式有n 个波段特征。然后根据像元的训练样本 计算各个组类的朋,“和酬,并事先对各个组类的先验概率p ( u i ) 进行赋值, 建立分类文件。逐点扫描各个像元,将像元模式代入式( 2 9 ) 计算m 个组类的判别 函数g l ( x ) ,并从m 个自( x ) 值中挑出其中一个最大值,并将被扫描待判像元判归属 于这个具有最大& ( x ) 值的一个组类。 2 4 1 2 存在的问题 随着遥感数据时空维数的不断扩展,基于b a y e s 统计理论的最大似然分类方 法开始暴露出一些弱点: 1 ) 多源、多维的遥感数据,可能不具备正态分布特征: 2 ) 离散的类别数据【如地面实测数据) ,在很多情况下不具备统计意义; 3 ) 对于高维空间数据,b a y e s 准则所要求的协方差矩阵将难以得到。 2 4 2 决策树分类法 决策树分类法也就是基于知识表达的分类方法,它采用产生式规则表示知识, 形式为:i f ( 条件) t h e n ( 结论) 在这个条件和结论的二元组,通过推理的结论是二值的,非此即彼。以后引入 了不确定的推理,由条件推出的结论有一个确定性程度,规则的形式为: i f ( 条件) t h e n ( 结论) c f ( 确定性因子) 其中c f 为实数,其值域在不同的研究中有所不同,一般为 0 ,1 或者 一1 ,1 。 虽然这种方法已经在遥感图像识别中得到应用,但还远远未达到实用阶段( 徐 冠华,1 9 9 6 ) 。由于地理知识主要来自于地理专家,地理专家知识的形式化问题不 能很好的解决。地学中的专家系统和其他专业的领域的专家系统一样,遇到知识 获取的瓶颈限制。但可以利用已知的某些知识对图像进行初步分类。 决策树分类法是以各像元的特征值作为设定的基准值,分层逐次进行比较的 分类方法。比较中所采用的特征的种类以及基准值是按照地面实况数据与目标物 的有关知识形成的。经过一次比较分割成两个组的决策树叫二叉决策分类树 ( b i n a r yd e c i s i o nt r e e ) ,图2 4 是一个简单的实例。 山东科技大学硕士学位论文2 遥感图像分类 圈2 ,4 二叉决策树分类树示意图 二叉决策分类树的每个节点完成一次将待分类像元某一波段上的值与门限比 较大小的判断。对一像元分类时,从根节点起下行,沿着所经过的节点上的判断 决定下一步的走向,最终在叶节点上决定一点的归类。二叉树的每个节点可表示 为: i d ,l e f t ,r i g h t ,t h ,b a n d ) ,其中l e f t 为左子树,r i g h t 为右子树,t h 是一 个判决门限,b a n d 是进行判断的那个波段的序号。i d 仅对叶节点有效,含义是进 入该叶节点时应当判决的类别。对一像元p 分类过程伪代码表示为: f u n c t i o nc l a s s i f y ( p ) :i n t e g e r : b e g i n r e s u l t := t e s t ( n o d e ,p ) : e n d : 对一个节点的判断表示为: f u n c t i o nt e s t ( n o d e ,p ) :i n t e g e r : b e g i n i fn o d e 为叶节点t h e nr e s u l t := n o d e i d : e 1 s ei fp 的第n o d e b a n d 波段数值小于n 0 d e t h t h e nr e s u l t := t e s t ( n o d e l e f t ,p ) : e l s er e s u l t := t e s t ( n o d e r i g h t ,p ) : e n d : 由于决策树分类中的运算基本上都是比较大小运算,因此分类计算量很小,在 模式含混比较小、各类别之间混迭不大时是一种效率很高的分类方法。容易看出, 二叉决策树的判决面是由一些多维长方体的表面连接而成的。 2 4 3 人工神经网络方法 人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k ,简称a n n ) 是在对人脑组 山东科技大学硕士学位论文2 遣感图像分类 织结构和运行机制的认识理解基础之上模拟其结构和智能行为的一种工程系统。 人工神经网络是由大量处理单元( 神经元) 广泛连接而成的网络,是人脑的某种 抽象、简化与模拟,反映了人脑的基本特征。四十年代,心理学家m c c u l l o c h 和 数学家p i t t s 合作最早提出了形式神经元的数学模型。作为人工智能的人工神经 网络系统的研究则是五十年代末和六十年代初开始的。到七十年代中后期,传统 的v o nn e u m a n n 计算机在人工智能领域遇到了不可克服的困难,神经网络以其高 度的适应性获得越来越多的重视。在神经网络中,网络的信息处理是由神经元之 间的相互连接实现的,知识和信息表现为神经元之间的相互连接。信息存储和处 理都具有分布性并行性的特点,具有良好的鲁棒性( r o b u s t n e s s ) 和自适应性。 在处理以数据量多、含混度高著称的遥感图像的模式识别问题时,利用多层神经 网络有利于实现多特征空间的非线性划分。用计算机模拟实现这一网络模型来进 行遥感图像的模式识别时完全可能的。 目前已经提出了多种用于模式分类的神经网络数学模型和学习算法,比较典型 的有感知机、多层b p 网络、r b p 网络、自组织映射的k o h o n e n 网络等。神经网络 分类是一种非参数方法,它不需要对模式的概率分布函数作某种假定或估计,具 有良好的适应能力。近年来,基于神经网络的分类方法越来越引起人们的重视。 4 山东科技大学硕士学位论文3b p 神经网络分类 3 b p 神经网络分类 3 1 神经网络介绍 3 1 1 生物学的启示 由于人工神经网络是受生物神经网络的启发构造而成的,所以在开始讨论人 工神经网络之前,有必要首先考虑人脑皮层神经系统的组成。科学研究发现,人 脑由大量( 约1 0 “个) 高度互连的单元( 每个单元约有1 0 4 个连接) 组成。这些单 元被称为神经元。就研究的目的来看,这些神经元由三部分组成:树突、细胞体 和轴突。树突是树状的神经纤维接收网络,它将电信号传送到细胞体,细胞体对 这些输入信号进行整合并进行阈值处理。轴突是单根长纤维,它把细胞体的输出 信号导向其他神经。一个神经细胞的轴突和另一个神经细胞树突的结合点称为突 触。神经元的排列和突触的强度( 由复杂的化学过程决定) 确定了神经网络的功 能。 圉3 1 生物神经元简图 图3 1 是两个生物神经元的简化图示,其他神经元及其相互之间的联接与此 类似。一些神经结构是与生俱来的,而其他部分则是在学习的过程中形成的。神 经结构在整个生命期内不断地进行着改变,后期的改变主要是加强或减弱突触连 接。 人工神经网络没有人脑那么复杂,但他们之间有两个关键相似之处。首先, 两个网络地构成都是可计算单元的高度互连( 虽然人工神经网络比生物神经元简 单的多) 。其次,处理单元之问的连接决定了网络的功能。 山东科技大学硕士学位论文 3b p 神经网络分类 3 1 2 神经元模型 一个单输入神经元如图3 1 所示。 bi 图3 1 单输入神经元 标量输入p 乘以标量权值w 得到w p ,再将其送入累加器。另一个输入1 乘上 偏移量b ,再将其送入累加器。累加器输出n 通常被称为净输入,它被送入一个传 输函数f ,在f 中产生神经元的标量输出y ,y = f “p + b ) 。 传输函数可以是n 的线性和非线性函数,可以用特定的传输函数满足神经元 要解决的的特定问题。常用的有以下三种。 ( 1 ) 硬极限传输函数;当函数的自变量小于o 时,函数的输出为o ;当函数的 自变量大于或等于0 时,函数的输出为1 。用该函数可以把输入分成两类。 卧= o : ( 2 ) 线性传输函数:函数的输出等于输入,即y = n 。 ( 3 ) 对数一s 形( 1 0 9 s i g ) 传输函数:该函数的输入在( 一,) 之间取值,输 出在。到l 之间取值,其数学表达式为) 。i 。 反传( b p ) 算法训练的多层网络采用了该传输函数。 3 1 3 感知器 感知器( p e r c e p t r o n ) 是最早设计并实现的人工神经网络。它是由m c c u l l o c h 和p i t t s 于1 9 5 7 年提出的具有单层计算单元的神经网络模型,通常也叫做m p 模 型,即阈值加权和模型,它的激活函数是阶跃函数。图3 1 所示的是一个单神经 元的感知器,采用对称硬极限传输函数: r“ y = j 1 若善w i _ 埘揶 i 一1 ,其他 山东科技大学硕士学住论丈 3b p 神经网络分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论