(模式识别与智能系统专业论文)基于模糊积分的多光谱遥感图象分类方法研究.pdf_第1页
(模式识别与智能系统专业论文)基于模糊积分的多光谱遥感图象分类方法研究.pdf_第2页
(模式识别与智能系统专业论文)基于模糊积分的多光谱遥感图象分类方法研究.pdf_第3页
(模式识别与智能系统专业论文)基于模糊积分的多光谱遥感图象分类方法研究.pdf_第4页
(模式识别与智能系统专业论文)基于模糊积分的多光谱遥感图象分类方法研究.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(模式识别与智能系统专业论文)基于模糊积分的多光谱遥感图象分类方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 遥魑图像分类一直是遥感研究领域的重要内容。如何解决多类别l 笙i 像的识别并满足一定 的精度,是遥感幽像研究中的一个关键问题,具有十分重要的意义。在遥感数据的统计分类 中,假设条f f 存在差异时,无法取得满意的识别结果,使得传统的遥感影象分类方法难以快 速准确地从遥感影象中提取信息。因此,本课题将模式识势j 领域中新发展起来的多分类器融 合技术应_ 【l 到遥感图象分类识别中,并在融合理论的改善上作了一些探索性的研究。 多分类器融合技术结合数据融合、机器学习、模式识别等多方面理论,将来自不同分类 器的识别信息进行有机结合以降低单分类器的设计难度,全面提取和利用分类信息,达剑 改善或改进传统分类算法的目的。近年来,多分类器融合技术在人脸识别、手写字符识别等 方向上受到了广泛重视,显示出很大的研究价值和现实应用前景,但在遥感图象领域中的研 究尚显不足。 融合系统的实现主要关涉到二个方面:个体分类器的设计、适当的融台模型的建立。本 文也即从这二方面入手,首先对遥感图象的特征进行分析,通过预处理,建立不同结构和模 式的神经网络作为元分类器,再将基于模糊积分的融合模型应用于遥感分类的决策。 模糊积分是一种融合工具,用以提高多分类器融合系统的分类精确率和改善系统的稳健 性。在基于模糊积分的多分类器融合系统中,模糊测度对融合系统的性能有很大的影响。若 模糊测度定义得比较合适,可以明显地提高分类精确率;反之,定义得不恰当,可能使得融 合系统的分类精确率不如单个分类器的分类精确率。本文给出了2 种实现模糊测度的方法: l 、基于改进遗传算法确定模朔测度;2 、基于神经网络确定模糊测度。实验证明具有一定的 可行性。 【关键词】遥感图象分类,多分类器融合,模糊积分,模糊密度,遗传算法 a b s t r a c t r e m o t es e n s i n g ( r s ) i m a g ec l a s s i f i c a t i o ni sa l w a y sap i v o t a lp a r to fr e m o t es e n s i n gs t u d y h o wt oi m p r o v et h ea c c u r a c yo fr si n t e r p r e t a t i o ni sa l lu r g e n tp r o b l e mi nr sa p p l i c a t i o n i n r e c e n ty e a r s , w i t ht h ed e v e l o p m e n to ft h et h e o r ya b o u ta r t i f i c i a ln e u r a ln e t w o r ks y s t e m , t h e m u l t i p l ec l a s s i f i e rf u s i o nt e c h n o l o g yi sb e c o m i n gi n c r e a s i n g l ya l le f f e c t i v em e a n 5o f c l a s s i f i c a t i o n p r o c e s s i n go fm m o t es e n s i n gi m a g e s c o m p a r e dw i t hc l a s s i f i c a t i o no ft h et r a d i t i o n a lb a y e s i a n s t a t i s t i c s ,t h er e s u l t ss h o wi th a sn o to n l yt h eh i g h e s ta c c u r a c yb u ta l s ot h ef a s t e s ts p e e do f c l a s s i f i c a t i o n t h i st h e s i st r i e st oa p p l yn e wt e c h n i q u e so f m u l t i p l ec l a s s i f i e rf u s i o nt ot h ea r e ao f c l a s s i f i c a t i o no f m u l t i - s p e c t r a li m a g e a n dm a k ee f f o r t st om e l i o r a t et h ef u s i o nm o d e l s m u l t i p l ec l a s s i f i e rf u s i o n ,o rc o m b i n a t i o n , i sam o d e mt e c h n i q u ei np a t t e r nr e c o g n i t i o na r e a s t h r o u g hp e r t i n e n t l yc o m b i n i n gd i f f e r e n ti n f o r m a t i o nf r o mv a r i e so fs i m p l ec l a s s i f i e r s , t h e c l a s s i f i c a t i o na c c u r a c yc a r lb ef a i r yi m p r o v e da n dt h ed i f f i c u l t yo fd e s i g n i n gas i n g i e , h i g h - a c c u r e c yc l a s s i f i e rc o u l db ea v o i d e d i nr e c e n ty e a r s ,f u s i o nm e t h o d so fm a n yk i n d sh a v e b e e nw i d e l yu s e di nt h ei d e n t i f i c a t i o no f h u m a nf a c e ,h a n d - w r i t t e nc h a r a c t e r s ,u t c ,b u tr e l a t i v e l y r a r e l ys t u d i e di nt h em e d i c a li m a g er e g i o n t h ec o n s t r u c t i o no faf u s i o ns y s t e mm a i n l yc o n c e t n st ot w os t e p s :d e v i s i n gi n d i v i d u a l c l a s s i f i e r s ,s e l e c t i o no ft h ec o m p o n e n tc l a s s i f i e r s ,a n dd e s i g n i n gp r o p e rf u s i o nm o d e lt oc o m b i n e t h e s ec o m p o n e n t s i nt h i sp a p e r , a f t e ri m a g ef e a t u r e ss e l e c t e d ,b pn e t w o r k st r a i n e da si n d i v i d u a l c l a s s i f i e r s 。b ya n a l y z i n gt h ed i f f e r e n tf u s i o nt h e o r i e sa n dc o m p a r i n gt h e i rp e r f o r m a n c e s w eu s e t h em o d e lo fm u l t i c l a s s i f i e rf u s i o nb a s e do nf u z z yi n t e g r a l sr e s p e c tt ol a m b d a - f u z z ym e a s u r e st o m a k ead e c i s i o no nt h ei m a g ec l a s s i f i c a t i o n f u z z yi n t e g r a l i sa l la g g r e g a t i o nt o o li nm u l t i c l a s s i f i e rf u s i o n ,w h i c hc a ni m p r o v et h e a c c u r a c yo f c l a s s i f i c a t i o na n dt h er o b u s t n e s so fs y s t e m s i nm u l t i - c l a s s i f i e rf u s i o nb a s e do nf u z z y i n t e g r a l s , f u z z ym e a s u r e sh a v em u c hi n f l u e n c eo nt h ep e r f o r m a n c eo f f n s i o ns y s t e m s i f t h ef u z z y m e a s u r e sa r cw e l ld e f i n e d 。t h ea c c u r a c yo fc l a s s i f i c a t i o nc b ei m p r o v e dd i s t i n c t l y t h i sp a p e r g i v e st w om e t h o d sa b o u td e t e r m i n i n gt h ef u z z ym e a s u f s :i d e t e r m i n et h ef u z z ym e a s u r e sb a s e d o nt h eg e n e t i ca l g o r i t h m ;2 d e t e r m i n et h ef u z z ym e a s u r e sb a s e do nt h en e u r a ln e t w o r k s t h i s m e t h o di sv e r i f i e dt ob ep r a c t i c a lb ye x p e r i m e n t s 【k e y w o r d s r e m o t es e n s i n gi m a g ec l a s s i f i c a t i o n ,m u l t i c l a s s i f i e rf u s i o n ,f u z z y i n t e g r a l ,f u z z yd e n s i t y , g e n e t i ca l g o r i t h m n 学位论文独创性声明: 本人所呈交的学位论文是我个人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工 作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并 表示了谢意。如不实,本人负全部责任。 论文作者( 签名) :盔! i 重鳘2 。7 年5 月叫日 学位论文使用授权说明 河海大学、中国科学技术信息研究所、国家图书馆、中国学术 期刊( 光盘版) 电子杂志社有权保留本人所送交学位论文的复印件或 电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子 文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外, 允许论文被查阅和借阅。论文全部或部分内容的公布( 包括刊登) 授权 河海大学研究生院办理。 论文作者( 签名) : :蔓j 至整2 0 0 7 年5 月7f 日 第一章绪论 第一章绪论 1 1 信息融合的背景知识及研究现状 信息融合的概念产生于二十世纪七十年代末,开始源于军事领域,但随着信息融合技术 本身、信号检测与处理技术、计算机和网络通信技术以及控制技术等的迅速发展,信息融合 已成为信息处理的一种通用工具和常见的思维模式。其基本思想可以概括为:充分利用多个 信息源,通过对这些信息源及其提供的局部信息的合理支配和使用,把多个信息源在时间或 空间上的冗余或互补的信息依据某种准则进行组合,以获得对被测对象的一致性解释或描 述,使该信息系统获得比它的各组成部分的子集所构成的系统更优越的性能【1 1 。该技术是信 息科学,人工智能,数学、计算机科学、控制学等多学科的交叉和具体运用,其本质是一个 从多层次对多元信息进行整合,逐层抽象的信息处理过程。它消除多源信息之间可能存在的 冗余和矛盾,充分利用多源信息之间的互补性,具有提高信息处理的质量,降低信息的不确 定性,改善信息的置信度,降低推理的模糊程度,增强系统的自适应能力和容错能力,提高 智能系统决策、规划的科学性等优点,现已广泛应用于军事、工业、农业、气象、机器人技 术、模式识别和图像处理等多个领域。近年来,随着人工智能技术的发展,信息融合技术有 朝着智能化、集成化发展的趋势。以模糊集理论1 3 i i ”i 、神经网络 4 0 1 1 4 “、证据推理【2 1 1 “j 为代表 的智能化方法在信息融合的研究中占有很大比重,体现了智能方法在信息融合领域的独特优 势。目前,最新的研究动向包括:研究并完善实用的算法分类和层次划分方法,研究并发展 实用的融合系统测试和评估方法,建立系统设计和算法选择的工程指导方针等【1 2 i 。由于信 息融合理论还不成熟,至今尚未形成统一的理论框架,其研究大多是针对特定应用领域展开 的。 信息融合技术应用于分类问题时也称为多分类器融合技术,旨在利用各分类器检测的信 息和不同的处理方法以获得对分类对象的全面检测信息从而提高分类精度羽i 可靠性。对于 分类问题或目标识别问题,可分三个层次的融合1 3 i :( 1 ) 数据级融合。对来自同等量级的原 始数据直接进行融合,再对融合后的传感器数据进行特征提取和身份估计。( 2 ) 特征级融合。 每个分类器识别一个目标并完成特征提取获得特征向鹫,然后再融合这些特征向鼙产生联合 特征向量来产生身份估计。( 3 ) 决策级融合。每个分类器经过独立地识别得山对识别对象的 身份估计或识别结果,然斤对米臼每个分类器的身份估计或识别结果进行融合。本文中所指 的多分类器融合一般指决策级的融合。 目前,对多分类器融合技术的研究集中丁以f = 方面: ( 1 ) 对融合i j 急的研究。 该方面的研究是多分类器融合技术的核心内容。目前,常h j 的融合方法有投票法,b a y e s 规则d - s 证据理论,基丁模糊集理论的融合方法,k a l m a n 滤波方法,神经网络等。由丁 模糊集理论可以很盘r 的描述由不精确性导致的不确定现象,使数学模型更贴近实际情况,冈 l 第一章绪论 此基于模糊集理论的融合方法是应用最广泛的一类融合工具它包括像模糊积分、模糊决策 模板、b k s 理论以及基于务种模糊算子( 如o w a 模糊算子、z i m m e r m a n n - z y s n o 模糊算 子、d y c k h o f f - p e d r y c z 模糊算子) 的模糊融合方法f 】”。其中模糊积分能够很好的体现分类器 之间的交互作用,用它作为融合工具已在许多应用领域取得较好的效果【l “1 9 1 。在应h ; 模糊积 分进行融合时,一个关键性的问题就是如何定义适当的模糊测度来更好的表现各分类器自身 在融合系统中具有的重要程度和分类器之闻的交互作用,以达到有效提高融合系统的分类性 能的目的。许多学者在这方面做了大量工作,提出了各种确定模糊测度的方法,如通过对训 练数据应用某些算法产生模糊测度的方法f 2 0 - 2 2 ,基于神经网络的方法j ,遗传算法 2 4 1 、优 化算法1 2 ”等。 ( 2 ) 对多分类器融合系统的资源结构进行优化,以提高系统的分类性能。 多分类器的融合不仅包括信息的获取、处理、评估和集成,还包括对分类器的管理与控 制。这方面的研究主要是如何协调管理多个分类器,以使系统获得最好性能。当分类器较多 时,它们之间的交互影响也会非常复杂,而且它们之问的相关性有可能还会随着处理对象的 不同而变化。因此如何实时地选择合适的分类器进行融合,既能节省资源又能最大限度地获 取有用信息也是提高系统性能的重要方法。一些文献【2 6 - 2 a l 从信息论的角度对这一问题进行了 理论分析。提出了基于各种熵函数的分类器选择机制,有效去除冗余信息,获得较好效果。 ( 3 ) 对单个分类器的研究。 单个分类器的分类性能会影响到多分类器系统的分类性能,并且将不同的分类器进行融 合得到的效果也不同。一般认为,单个分类器的性能越好,由这些分类器组成的融合系统的 分类性能就越好:组合的各分类器之问的相关性越小就越有利于得到好的融合效果【”1 2 6 1 。 常用的分类器有贝叶斯分类器,神经网络分类器基于模糊规则的分类器,基于遗传算法的 分类器,决策树分类器,基于粗糙集的分类器,支持向量杌、最近邻技术分类器等。还有混 合型分类器,如基于神经网络的t 一近邻分类器,基于粗集的贝叶斯分类器,贝叶斯神经网 路分类器等等。其中,以神经网络的应用晟为广泛,并且由于神经瞬络具有并行处理的结构 本质,它还可以作为一种融合机制应用于多分类器的融合。虽然关于多分类器融合技术在应 | 【f 上已取得很大成功,但理论上还需要进一步的完善和发展。例如应用多分类器融合技术的 目的是为了突破单个分类器的性能极限,使系统的性能较单个分类器的性能有质的e 跃。已 有人最的实验表明多分类器融合确能达到这一效果,然而还没有比鞍成熟的理论分析说明为 什么并且在什么条件卜融合系统的性能会好- 丁单个分类器的性能等问题。 1 2 遥感分类技术发展 从本世纪七十年代起,遥感影像分类处理一直是遥感技术及其相关领域学者们关注的 问题。当时,土要是利川统计模式识j ;l 】方法进行遥感影像计算机解译,如s t r a h l e r ( 1 9 8 0 ) 使 j h 展人似然法对遥感幽像数捧;分类,g o l d b e r “1 9 8 3 ) 远川光谱特祉,对多波段p ! 影像进行 分类,从中获取森林资源信息,这种方法的特点是揪螂影像中地物多光谱特祉,埘运感影像 中地物进行分类。麻该浣这些方法对遥感影像计锥机分类的发展起到了推动作川。 2 第一章绪论 为了提高遥感信息分类精度,研究工作者做了大量研究,主要从四个方面着手解决这一 问题: 1 ) 预处理:即在进行分类之前根据传感器、电磁学和地形等方面的知识尽可能地剔除大 气散射、地形和太阳光照等因素地影响,通过降低源数据噪声提高分类精度; 多源多谱多形式信息的融合处理:也就是对同一区域通过不同数据源得到的信息进行 综合处理,提取出波谱、空间和时间信息,用空间、时间以及人的经验知识辅助分类以提高 精度; 3 ) 新一代遥感信息分类方法的应用:主要是将近年来发展起来的模糊理论、人工智能理 论( 主要是专家系统) 、人工神经网络技术等技术应用于遥感信息分类,从算法上改进分类精 度; 4 ) 分类后处理:通过对分类结果再进行处理提高分类精度,主要是指分类结果的平滑处 理 在遥感数据的统计分类中,以b a y e s 理论为依据的最大似然分类法得到普遍的应用。从 理论上讲,在对概率密度函数假设正确的前提下,b a y e s 分类器是最优的。这种方法的最大 局限在于它要求概率密度函数己知,当实际的概率分布与假设存在差异时,将无法得到正确 的分类结果。即使在实际的概率密度与假设一致时,由于样本构成的模式空间的复杂性,判 别函数也往往很难正确表达。随着遥感数据时空维数的不断扩展,该方法暴露出一些缺点: 1 ) 多源、多维的遥感数据,可能不具备正态分布特征:2 ) 离散的类别数据( 如地面实测数据) , 在很多情况下不具备统计意义;3 谢于高维空间数据,b a y e s 准则所要求的协方差矩阵将难 以得到。因此,研究具有综合分析能力及应用灵活的分类模型和方法引起人们的重视。人工 神经网络模型是近年来发展起来的综合数据分类方法之一。 神经网络又称人工神经网络( a r t i f i c i a ln e u r a ln e = t w o r k ,简称a n n ) ,它是一种模拟人脑 神经元细胞的网络结构。神经网络的研究己有近4 0 年的历史,其发展过程经过了一段曲折 的历程。随着各种神经网络模型的不断完善,以及计算机性能的不断提高,目前,神经网络 理论的应用己渗透到各个领域,在智能控制、模式识别、计算机视觉、自适应滤波和信息处 理、非线性优化,自动目标识别、连续语音识别、声纳信号处理、知识处理、传感技术与机 器人,生物医学工程妾3 ;方面均取得了令人鼓舞的进展【3 6 1 i ”1 1 ”,因而为神经网络的麻刚创造 了更有利的条件。 近年来,利川神经网络进行遥感影像分类的研究掀起了一个高潮,出现了很多这方面的 文献1 2 ”2 1 1 4 ”。这些研究结果表明神经网络与传统分类方法的最大区别在于:在处理模式分 类问题时,人:l :神经网络并不基于某个假定的概率分布;在监督分类中,网络通过对训练样 本的学习,获得阿络的权值,形成分类器;在1 f 监督分类中,从特征空间剑模式空问的映射 是通过网络的白组织米完成的,是一种聚类过程。另外,神经网络通常具有较好的容错特性, 有利丁解决遥感模式的“同物异谱”帛i “异物同谱”u j 题。利h j l e 参数的神经网络分类器比 传统的参量统计分类器在克服噪卢影响,分类白适席性等方面具有一定优势。 3 第一章绪论 1 3 多分类器融合技术 在处理分类问题时,传统的方法是根据某些特征设置单一的目标分类器,单一分类器有 以下几个缺陷: ( 1 ) 一些分类器只对某些特征有强的识别能力。对其他特征则识别能力较差;当目标 类别多,样本特征复杂时,分类器的精确度和稳健性就会大受影响。 ( 2 ) 基于一组特定目标特征和某一特定方法设计的分类器,仅能用一种感知方式去感 知对象,用单一的处理方式来处理所得信息,难以形成对分类对象的本质特性的全面认识, 在信息处理过程中也容易丢失有刚信息。 ( 3 ) 即使分类器本身有较高的分类性能,也不能避免自身固有的缺陷,例如神经网络 理论为目标分类器的设计提供了有效的手段,然而常用的神经网络n n ) 模型具有陷入局部 极小值的危险,使得基于单个n n 的分类器难以实现全局最优。多分类器融合技术利用各分 类器检测的信息和不同的处理方法以获得对分类对象的全面检测信息,从而提高分类精度和 可靠性。 融合系统的重要组成部分是融合算法。多分类器融合最常用的融合算法有贝叶斯法、 d - s 证据推理法和模糊积分法等。贝叶斯法需要先验信息,当有多个可能的假设和多个条 件相关事件时,计算复杂,要求对立的假设彼此不相容,无法分配总的不确定性;d - s 证 据法要求所使用的证据必须相互独立,且计算复杂度随着测量维数的增加以指数形式递增, 容易出现维数灾难。另外,上述两种方法均未考虑到分类器的可靠性问题。在多个分类器组 成的融合系统中,各分类器的性能可能会有较大差异。充分考虑这种差异导致的不同可靠性 是用模糊积分作决策融合的基本思想,也是本文的研究重点。模糊积分是一种基于模糊测度 的非线性决策融合方法,它不仅合成各分类器提供的客观结果,还考虑到分类器本身在融合 过程中的重要程度。它通过定义模糊测度可得到单个分类器或分类器集合的任意子集在融合 系统中的重要程度,积分过程转化为分类器所提供的客观结果关于分类器重要程度的积分。 肌信息融合的角度来看,这提供了一种基于信源( 分类器) 重要性程度的信息合成方法。它 在决策级融合中起剑1 f 常重要的作用。因此基于模糊积分的融合方法是目前多分类器融台研 究的热点。 在应用模糊积分进i 7 融合时,由丁模糊测度用来表征单个分类器和多个分类器j 勺纽合的 局部决策可信度,它对融合系统有着重要的影响。例如,对丁9 4 一模糊测度,模糊测度的 构造取决丁单点集上的模糊测度( 也称模糊密度) 。田此,融合系统中单一分类器的重要程 度决定着该系统中多分类器集合的任意子集的重要拌度。这时定义模糊密度是川模糊积分 进行多分类器融合的关键技术之一。住定义模糊密度的时候,一般把分类器的分类止确率作 为定义模糊密度的依据。如果川l 表示将样本止确分类,0 表示将样本错误分类,则分类 正确率就相当丁把分类器的输出向罐映射剑清晰集合 o ,1 上2 j l 亓,对1 的个故的统计结 果。这样就忽略了输山向垃本身所具有的模糊信息。就像考试都及格的学生对知u 的宁握程 4 第一章绪论 度不一定都在一个水平上一样,事实上,即使分类器具有相同的分类正确率,它们的分类能 力还有可能具有差别。例如:在一个两类分类问题中,分类器a 、b 对属于第一类的三个 样本的输出向量如下: a :( o 9 ,0 0 1 ) 、( o 8 。o 2 ) 、( 0 9 ,0 0 5 ) b :( o 5 ,0 ,4 ) 、( 0 6 ,0 4 5 ) 、( 0 7 ,0 5 ) 虽然分类器a 、b 都对这些样本进行了正确分类,但我们会觉得分类器a 好于b , 这是因为a 在分类时表现出了较小的不确定性,而b 具有较大的不确定性;当样本的特 征稍微有些不明显或受到干扰时,从上述两个分类器的输出来看,b 出错的可能性要大于a 出错的可能性因此b 的可信度应该低于a 的可信度多分类器融合系统实质上也是一 个消除不确定性的系统,在处理信息的过程中不可避免地存在不确定性的因素。考虑并分析 融合系统的不确定性因素,有助于更合理地估计分类器的性能,对提高系统的分类性能有着 重要的意义。 模糊测度是定义在分类器集合的幂集上的一个非负单调集函数,不满足可加性,但是满 足超可加性或者次可加性。目前已经提出了很多种方法来学习模糊测度,主要有: 启发式确定模糊测度的方法,如j a m e sm k e l l e r l l o l 、姚明海【3 3 1 分别给出了基于混淆矩 阵的两种不同确定模糊密度的方法;启发式搜索按照某种策略进行最优解的搜索,使得时间 复杂度相对于遗传算法来说比较低,能够在较短的时间内完成搜索,但是有可能得到的是局 部最优解而不是全局最优解。 优化方法,如g r a b i s c h i ”1 等提出了确定模糊测度的两种规划模型,一种是线性规划模型。 一种是二次规划模型,并对二次规划模型进行了推广;使用标准优化技术时,必须保证目标 函数是可微的。 神经网络i 纠和迭代方法1 2 2 】来确定模糊测度等等。神经网络实现模糊测度的方法的也有 其缺点。神经网络的泛化能力对融合系统的性能有很直接的影响。选择合适的神经网络是该 方法的关键问题之一。另一方面,训练神经网络时的期望输出确定方法对融合系统的性能也 有影响。 1 4 论文主要工作 本文主要介捌的是将多分类器融合技术应 日丁遥感图象分类的研究工作。我 j 同顾遥感 图象分类的一些传统方法,对其原理和局限性进行分析总结,并由此探讨多分类器融合技术 的可行性,进而构造合适的成员分类器及融合模型,在遥感图象上进行验让,给山识别结果 并分析多分类器融合算法相对丁| 单一分类算法的有效性。论文的组织结构如卜: 第l 章提出课题背景、对国内外研究状况简要综述,弗介耋h 论文主要i :作; 第2 章介绍了模糊测度、模糊积分的基本概念和儿种不同形式的模糊积分的定义;简 要介绍了遗传算法的基本思想、基本操作及对基本遗传算法进行改进的思路。 第3 章介鲥了遥感分类的原理及一些常h j 分类方法,在此理论基础上,将本文所需川剑 的遥感影象进行预处理,特祉选取和单分类器的设计。 第一章绪论 第4 章介绍了一些常用的融合算法。如基于模糊集理论的融合方法,贝叶斯方法和d - $ 证据理论。接着具体介绍了基于模糊积分的多分类器融合模型。给出了基于改进遗传算法的 模糊密度的定义方法和基于神经网络的模糊密度定义方法,并且验证了分类与融合模型的有 效性,将模型应用于遥感地物分类。 第5 章是本文的结论与展望。 6 第二章预备知识 第二章预备知识 2 1 模糊测度与模糊积分 2 1 1 模糊测度 念 为了将概率测度进行推广,s u g c n o 在二十世纪七十年代早期提出了模糊测度p 5 l 这个概 定义2 1 :设x 是一任意集合,o 是_ = i 上的盯一代数,定义在q 上的集函数 弘:【卜 【o ,1 】称为模糊测度,必须满足以下条件: 1 ( 正则性) 缈) = o ,( 幻= 1 2 ( 单调性) ( 彳) ( b ) ,v a ,b c q ,a c b 。 3 ( 连续性) l i m ( ”= ( 1 i m 工) ,工eq 是一个单调的集列。 一,qm 式( 2 i ) 式( 2 2 ) ( x ,q ,力称为模糊测度空间。模糊测度的特例包括概率测度、可能性测度、必要测度、 信任测度等等。在实际应用中,当x 是一个有限集合时,条件3 可以省略,此时q 是x 的 幂集p ( x ) 一般来说,模糊测度不满足可加性,而满足超可加性或者次可加性: ( 可加性) ( 4 u 回= ( 爿) + ( b ) ,v a ,b c p ( x ) ,4 n b = 矿。 式( 2 - 4 ) ( 超可加性) ( 爿u b ) ( 爿) + ( b ) ,v a ,b c p ( x ) ,爿n b = 矿。 式( 2 5 ) ( 次可加性) ( 4 u b ) ( 4 ) + ( 曰) ,v a ,bc 7 p ( x ) ,么n b = 妒。 式( 2 6 ) 定义2 2 :如果模糊测度还满足下面的附加条什,则称为g - i a m i x t a ( 或者9 2 ) 模糊测度。 g ( a u 功= g ( 彳) + g ( 口) + 堙( 4 ) g ( b ) , c a ,b c q ,a n b = 妒,五 一1 式( 2 7 ) 当五= 0 时,争l a m b d a ( 或者乳) 模糊测度就可还原为概率测度 定义单点集上的测度g = g ( 毛 ) ,i = 1 , 2 ,疗称为重要溅度。避过公式 l + 兄= 兀( 1 + 起) ,= l 可以唯一地确定一个z - i 。 7 式( 2 8 ) 第二章预备知识 2 1 2 模糊积分 常见的模糊积分有c h o q u e t 模糊积分、s u g e n o 模糊积分、王氏积分、p s n - 积分以及它 们的对偶形式,下面主要介绍前两种积分以及在论域为有限情况下的计算公式。 ( - - ) s u g e n o 模糊积分 定义2 3 :设f :x - 【0 , 1 】是定义在x 上的模糊测度,f - 关- t - z 的s u g e n o 模 糊积分定义为: ( j ) l f a a = s u p m i n ( m i n f ( x ) ,4 d ) 】= s u p m i n ( a ,4 疋) ) 】 式( 2 9 ) k fx e e a e 0 ,l 】 其中,只= 彬( 刁口 当x = 而,而,b 是一个有限集合时,s u g e n o 模糊积 分可简化为: ( s ) i f d l g2 二u ( 而) ( 4 ) ) 式( 2 1 0 ) 其中4 = x 。,一+ l ,矗) 不失一般性,我们假设o 厂( ) s f ( x 2 ) 厂( ) 1 ( 如不满足,重新排列x 中的元素为 i ,石:,) 使对应的函数值厂( x :) 满足该关系式) 。 s u g e n o 模糊积分并不是l e b e s g u e 积分的推广,因为当测度满足可加时。s u g e n o 模 6 盯 积分并不能还原为l e b e s g u e 积分,这种特性限制了s u g e n o 积分在实际中的应蹦。为了避 免这个缺陷,m u m f u s h i 和s u g e n 0 1 2 3 1 提出了所谓的c h o q u e t 模糊积分。 ( 二) c h o q u e t 模糊积分 c h o q u e t 模糊积分是l e b e s g u e 积分的严格推广,当测度可加时, c h o q u e t 模糊积分能够 还原成l e b e s g u e 积分。 定义2 4 :设,:x - 【o ,。c ) 是定义在x 上的模糊测度,厂关于的c h o q u e t 模 糊积分定义为: 厂( x ) 。( ) ;f ( 疋) 如 其中c = 【o ,l 】时,c h o q u e t 积分 的计算公式相应地变为: ( c ) j - 鳓= 窆( 厂( 一) 一,( t 一。) ) ( 4 ) 其中4 = x ,t 。,矗) ,f ( x o ) = 0 。不火一般性,假设( 工。) s f ( x 2 ) 蔓厂( 矗) s i 8 第二章预备知识 ( 否则,重新捧列x 中的元素为 i ,# ) 使对应的函数值厂( i ) 满足该关系式) 。 当模糊测度是乳模糊测度时任意子集的模糊测度可由下列式子确定: ( 4 ) = ( 而) ) = u i , ( 屯) ) = z ( 4 ) = 声+ ( 4 一1 ) + 五( _ i 1 ) ,k = 2 3 , 式( 2 - 1 4 ) 2 2 遗传算法 遗传算法唧( g a :g e n e t i ca l g o r i t h m ) 是一种有效的解决晟优化问题的方法。它是一种 抽象于生物进化过程的、基于自然选择和生物遗传机制的优化技术。从那以后,它逐渐发 展成为一种通过模拟自然进化过程解决最优化问题的计算模型。近年来,随着对于遗传算法 研究的不断深入完善,已将它应用到越来越广泛的领域,例如机器学习、模式识别、图像处 理、神经网络、工业优化控制和社会科学等方面。实践表明,遗传算法解最优化问题的计算 效率比较高、适用范围相当广。 2 2 1 遗传算法的基本思想 遗传算法起源于达尔文的生物进化理论。他认为,生物进化的动力和机制在于自然选择, 自然选择使用变异作材料,通过生存斗争实现的。凡是具有适应环境的有利变异的个体,在 生存斗争中将有更多机会生存和繁殖后代,而适应性较小的个体将被淘汰,因此,生物进化 便是“物竞天择,适者生存”的过程。 遗传算法模拟自然界“适者生存”的机制,把优化问题的解的搜索空间映射为遗传空间, 把每一可能的解编码( c o d i n g ) 为一个称为染色体( c h r o m o s o m e ) 的串,染色体的每一位称 为基因( g e ) 。每个染色体( 对应一个个体) 代表一个解,一定数量的个体( i n d i v i d u a l ) 组成 群体。 遗传算法是从代表问题可能潜在解集的一个种群( p o p u l a t i o n ) 开始的。而一个种群则 由经过基因( g e n e ) 编码( c o d i n g ) 的一定数目的个体( i n d i v i d u a l ) 组成。每个个体实际上 染色体( c h r o m o s o m e ) 带有特征的实体。染色体作为遗传物质的主要载体,即多个基因的 集合,其内部表现( 即基因型) 是某种基因组合,它决定了个体的形状的外部表现。因此, 在一开始需要实现从表现型剑基因型的映射即编码i :作。初始种群产生以后,按照迁者生存 和优胜劣汰的原理,逐代演化产生出越来越好的近似解。在每一代,根据问题域中个体的适 应度( f i t n e s s ) 大小挑选( s e l e c t i o n ) 个体,并借助丁i 臼然遗传学的遗传箅子进行缀合交义 ( c r o s s o v e r ) 和变异( m u t a t i o n ) ,产生出代表新的解集的种群。这个过程将导致种群像白然 进化一样的后生代种群比前代更加适戍丁环境,末代种群中的最优个体经过解码 ( d e c o d i n g ) ,可以作为问题近似最优解。 遗传算法采纳了自然进化模删如选择、交义、变异、迁移、局域与邻域曾。计算开始 时,一定数日n 个个体( 父个体1 、父个体2 、) 即种群随机地初始化,j l : l - 算每个个 9 第二章预备知识 体的适应度函数,第一代也即初始代也就产生了如果不满足优化准则,开始产生新一代的 计算。为了产生下一代,按照适应度选择个体,父代要求基因重组( 交叉) 而产生子代。所 有的子代按一定的概率变异。然后子代的适应度又被重新计算。子代被插入到种群中将父代 取而代之,构成新代( 予个体l 、子个体2 、) 。这一过程循环执行,直到满足优化准 则为止。基本操作过程如图示: 圆圈毋鬣 否 是 图2 1 基本遗传算法流程图 2 2 2 遗传算法的特点 遗传算法作为一种随机的优化与搜索方法,与传统算法有很多不同之处,但其最主要特 点p l 体现在下述两个方面: ( 1 ) 智能性:遗传算法的智能性包括自组织、自适应和自学习性等。应_ f : l 遗传算法求 解问题时,在确定了编码方案,适应值函数及遗传算子以后,算法将利用演化过程中获得的 信息自行组织搜索。由于基于t j 然进化的选择策略为:适者生存,不适应者淘汰,故而适应 值大的个体具有较高生存概率。通常适应值大的个体具有与环境更适应的基因结构,再通过 杂交和基因突变等遗传操作就可能产生与环境更适应的后代。遗传算法的这种自组织、自适 应性特征同时也赋予了它具有能根据环境变化自动发现环境的特性和规律的能力。臼然选择 消除了传统优化算法设计过程中的一个最大障碍需要事先描述问题的全部特点,并说明 针对闯题的不固特点,算法应采取不同的措施。于是,利用遗传算法可以解决那些结构还不 是很明确的复杂问题。 ( 2 ) 隐含并行性:遗传算法从初始群体出发,经过复制、交叉和变异等操作,产生一组 新的群体。每次迭代计算,都是针对一组个体同时进行而不是针对某一个个体进行,尽管遗 传算法是种搜索算法,但由丁采用并行计算机理,搜索速度很高。并行性是遗传算法的一 个重要特征。遗传算法的本质并行性表现在两个方面:一是遗传算法是内在并行的( i n h e r e n t p a r a l l e l i s m ) ,即遗传算法本身诈常适合人规模前行。最简单的并行方式是让儿百共至数千台 的计算机各自进行独立种辫的演化计算,共至运行过程中不进行任何通信( 独立的种群之闻 若有少量的通信般会带来更好的当! i 果) ,管剑运算结束时才通信比较,选取最佳个体,这 种并行处理方式对行行系统结构也没有什么限制和要求。可以说。遗传算法适合证目前所有 的并行机或分布式系统j 进行升行处理,而且对其斤彳了效率没有太人的影i 啕。j 是遗传算法 的内含并行性( i m p l i c i tp a r a l l e l i s m ) ,由丁遗传贸法采川种料的方式组织搜豢,从而它可以同 0 第二章预备知识 时搜索解空间内的多个区域,并相互交流信息,这种搜索方式使得它虽每次只执行与种群规 模m 成比例的计算,而实质上,据g o l d b e r gde 推算已进行了大约d ( m 3 ) 次有效搜索。 这使得遗传算法能以较少的计算获得较大的收益基于此,并行和分布式演化计算将是今后 研究的重点。 ( 3 ) 遗传算法直接以目标函数值作为搜索信息,基本上不用搜索空问的知识或导数等 其它辅助信息,而仅用适应度函数值来评价个体,并且进行遗传操作。更重要的是,遗传算 法的适应度函数不仅不受连续可微的约束,而且其定义域可以任意设定,这一特点使得它的 应用范围大大扩展。 ( 4 ) 遗传算法使用概率搜索技术。传统的优化算法使用确定性的搜索方法,很可能搜 索永远达不到最优点,因而也限制了它的使用范围。而遗传算法是自适应概率搜索技术,选 择、交叉,变异这三个算子都是随机操作,以概率为指导 2 2 3 遗传算法的基本特征和操作 遗传算法是一个解群体性的操作,该操作以解群中的所有串为对象体鲫。选择,交叉 和变异是它的三个主要操作算子,他们构成了遗传操作,使遗传算法有别于其它一切传统算 法。其核心内容是:参数编码,初始解群的确定,适应度和遗传操作的设计。 1 、确定编码方案 设计遗传算法的一个重要步骤是对所解问题的变量进行编码表示,因为遗传算法主要是 对群体中的个体施加操作,从而完成优化的。遗传算法不能直接处理问题空间的参数,而只 能处理以基因链码形式表示的个体。因此,要使用遗传算法,就必须把优化问题的解的参数 形式转换成基因链码的表示形式,从表现型到基因型的映射称为编码。遗传算法中的进化过 程是建立在编码机制基础上的,编码对于算法的性能如搜索能力和种群多样性等影响很大, 目前主要有二进制编码、浮点数编码和符号编码三种形式。二进制编码由二进制符号0 和l 组成,浮点数编码直接由实数构成。一般来讲,二进制编码比浮点数编码搜索能力强,浮点 数编码比二进制编码在变异操作上能够保持更好的种群多样性。在实际应用中,编码应该针 对要解决的问题来确定。本文采用浮点数编码方式。 2 、初始种群 初始种群也称进化的第一代,一般由计算机随机产生,该群体代表了优化问题的一些可 能解的集台。解群越人,解群中串的多样性越高,参与运算的串的数量越多,锋法陷入局部 解的危险就越小,所以,从考虑解群中的多样性出发,解群规模府较火。另一方面,如果解 群太小,会使解群集中住搜索空间的一个区域,搜索有可能出现早熟收敛现象。但解群太人, 其适应度评估次数增加,计算颦也增人,受剑计算机存储空间和运算速度的限制,解群不能 无限增人。解群规模的选择尚无确定的原则指导,麻按照贝体的模硭、计筇机的硬什配置和 采川的算法操作米配置。 3 、适应度函数 第二章预备知识 自然界中,个体的适应度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论