硕士学位论文-基于RS的桉树分布信息提取方法研究.doc_第1页
硕士学位论文-基于RS的桉树分布信息提取方法研究.doc_第2页
硕士学位论文-基于RS的桉树分布信息提取方法研究.doc_第3页
硕士学位论文-基于RS的桉树分布信息提取方法研究.doc_第4页
硕士学位论文-基于RS的桉树分布信息提取方法研究.doc_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号 P208 密级 公开 UDC 编号 硕士研究生学位论文题 目基于RS的桉树分布信息提取方法研究 学院(所、中心) 专业名称 研究生姓名 学号 2012年 6 月扉页:独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人或集体已经发表或撰写过的研究成果,对本文的研究做出贡献的集体和个人均已在论文中作了明确的说明并表示了谢意。研究生签名: 日 期: 论文使用和授权说明本人完全了解云南大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交学位论文和论文电子版;允许论文被查阅或借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 (保密的论文在解密后应遵循此规定)研究生签名: 导师签名: 日 期: 本人及导师同意将学位论文提交至清华大学“中国学术期刊(光盘版)电子杂志社”进行电子和网络出版,并编入CNKI系列数据库,传播本学位论文的全部或部分内容,同意按中国优秀博硕士学位论文全文数据库出版章程规定享受相关权益。研究生签名: 导师签名: 日 期: 摘要桉树作为世界上三大速生林之一,因其具有很高的实用价值和经济效益,世界各地大量引种。云南作为桉树种植大省之一,如何科学合理地经营、管理桉树人工林引起了人们的高度重视。做好桉树森林资源调查是一项基础性的工作,而传统的森林资源调查费时、费力。近年来,随着遥感技术的进一步发展,利用遥感影像进行特定的树种信息提取为我们提供了一种有效手段。本文以云南省普洱市西盟县为试验区。采用2009年12月28日中巴卫星遥感影像,结合目前比较流行的决策树方法与传统分类方法对桉树分布信息进行提取对比研究。同时在分析不同地类的光谱、植被指数、主成分变换及纹理特征等信息的基础上,构建了适合研究区特点的分类方法,可较准确地提取桉树分布信息。研究发现,在决策树分类过程中,基于光谱、植被指数、主成分变换和纹理特征的决策树是最佳的分类方法,分类效果最好,总体精度达到80.83%,Kappa系数为0.7549,桉树的生产者精度为86%;该分类方法比基于光谱、植被指数和主成分特征的决策树分类方法总体精度高4.16%,Kappa系数高0.0540,桉树的生产者精度提高3%;该最佳分类方法也比基于光谱特征和植被指数特征的决策树分类方法总体精度高10.00%,Kappa系数高0.1304,桉树的生产者精度提高8%。可见,纹理特征的加入有利于提高桉树分布信息提取的精度。与传统非监督分类的ISODATA法和监督分类的最大似然法相比,该最佳分类方法比非监督分类的IS0DATA法总体精度高35.20%,Kappa系数高0.4506,桉树的生产者精度提高44%;同时也比监督分类的最大似然法总体精度高20.62%,Kappa系数高0.2625,桉树的生产者精度提高28%;决策树分类方法由于充分利用了各地类的光谱、植被指数、主成分变换、纹理等特征信息,提高了分类精度。本论文研究初步形成了一套基于决策树的桉树分布信息资源自动提取的方法与技术。关键词:桉树;遥感;纹理;决策树分类;信息提取AbstractThe eucalyptus is one of the three fast-growing forests in the world. Because of its high practical value and economic benefits, it is introduced by a large number of parts in the world. Yunnan is one of the largest provinces of planting eucalyptus, and how to scientifically and reasonably operate and manage for eucalyptus plantations has attracted much attention for people. Making eucalyptus forest resources survey is a basic work, but the traditional forest resources survey is time-consuming and laborious. In recent years, with the further development of remote sensing technology, it has become one possibility by use of remote sensing images for specific species information extraction.Ximeng County in Puer City of Yunnan Province is used for the test area in paper. Based on December 28 2009 CMB satellite remote sensing images, the paper makes the study of extraction contrast for eucalypt with the more popular method of the decision tree and the traditional classification of information. At the same time, on the basis of spectral analysis of different land types, vegetation index, principal component transform features and texture information, the paper constructs classification of the characteristics of the study area to accurately extract the eucalyptus distribution information.The study finds that the decision tree based on the spectral information, vegetation index, principal component transform features and texture features is the best classification method and the best classification result in the decision tree classification process. The overall accuracy of that classification method is to reach 80.83%, Kappa coefficient is to reach 0.7549, and eucalyptus producers accuracy is to reach 86%. The overall accuracy of that classification method is 4.16% higher than that based on spectral information, vegetation indices and principal component features. The Kappa coefficient is 0.0540 higher, and eucalyptus producer precision is 3%high. The overall accuracy of that classification method is 10.00% higher than that based on spectral information and vegetation indices. The Kappa coefficient is 0.1304 higher, and eucalyptus producers accuracy is 8% high. The study shows that texture features are helpful to improve the accuracy of eucalypt extract. Compared with the traditional IS0DATA and supervised classification maximum likelihood method, the overall accuracy of that classification method is 35.20% higher than that of the unsupervised classification IS0DATA classification.The Kappa coefficient is 0.4506 higher, and eucalypt producers accuracy is 44% high. The overall accuracy of that classification method is 20.62% higher than that of the supervised classification maximum likelihood method.The Kappa coefficient is 0.2625 higher, and eucalyptus producers accuracy is 28% high. Because of full use of the spectrum of the surface features, the principal component transform characteristics, texture, and other information, decision tree classification improves the classification accuracy. In this study, the method and technique for automatic extraction of eucalypt resources based on decision tree is formed initially.Keywords: Eucalyptus; Remote Sensing; Texture; Decision Tree Classification; Information extraction目录1.绪论11.1论文选题的意义和目的11.2国内外研究现状11.2.1植被信息提取技术研究进展21.2.2基于决策树提取方法的研究进展41.3研究内容与方法51.3.1研究内容51.3.2技术路线61.4本文的结构安排72. 遥感图像计算机分类技术82.1.计算机传统分类方法92.1.1ISODATA法92.1.2最大似然法92.2 传统分类方法的不足112.3 计算机非传统分类方法112.3.1人工神经网络法(ANN)122.3.2支持向量机法(SVM)132.3.3决策树分类法142.4遥感图像分类的评价162.4.1误差矩阵172.4.2 Kappa分析173.研究区遥感图像地类分类特征分析193.1 研究区概况193.2研究数据213.2.1基础数据资料213.2.2中巴地球资源卫星数据213.3研究区土地利用/覆盖分类确定273.4地类样本的选择293.5遥感图像地类分类特征分析333.5.1光谱特征分析333.5.2植被指数分析353.5.3主成分变换特征分析383.5.4纹理特征分析404.桉树分布信息提取方法试验研究454.1 基于决策树的桉树分布信息提取454.1.1基于光谱信息和植被指数的决策树信息提取454.1.2基于光谱信息、植被指数和主成分特征的决策树信息提取494.1.3基于光谱信息、植被指数、主成分特征和纹理特征的决策树信息提取544.2 基于其它分类方法的桉树分布信息提取604.2.1 ISODATA分类方法604.2.2 最大似然分类方法614.3分类精度评价625.结论与展望675.1结论675.2展望68参考文献:70致谢75VII1.绪论1.1论文选题的意义和目的本论文依托于国家自然科学基金项目云南尾叶桉类林引种的环境影响与生态安全格局研究开展研究。桉树作为外来树种人工林中的一种,近20年来发展十分迅猛,规模不断扩大,在林业上具有不可争议的经济效能,而且桉树生长迅速、轮伐期短、耐干旱、耐贫瘠、适应性广、用途广泛,因此桉树成为我国南方包括云南在内普遍使用的一种造林树种。我国自1890年引种桉树以来,从零星种植到规模发展,现有桉树人工林总面积达到170多万hm,已成为我国南方速生丰产林的战略性树种(郑明镜等,2003)。云南作为桉树种植的省份之一,2002年金光集团与云南省政府合作,于2003年签下153万hm2的林浆纸基地,开始引种,关于引种桉树人工林的生态问题争论也随之而来。目前需要解决的关键问题是科学合理地发展桉树人工林,实现桉树人工林的可持续发展。这就需要对桉树进行调查研究,提取桉树分布信息,从而快速准确的得到桉树资源空间分布信息,为研究区生物多样性保护、生态功能维持和恢复提供支持。传统的森林资源调查费时、费力。随着遥感技术的发展,因其具有覆盖面积大、重复周期短、多时相性和动态监测等优势,已成为一种最有效的资源调查和监测手段,广泛应用于遥感信息提取中。本论文是利用遥感技术,采用遥感传统分类方法与目前比较流行的决策树分类方法,通过分析桉树与其他土地利用类型的光谱、纹理信息等信息,对中巴遥感影像进行分类,从而实现对桉树资源分布信息的准确提取,为桉树引种规范化和合理化提供技术支持。1.2国内外研究现状继1972年美国实施地球资源卫星计划以来,卫星遥感技术以迅猛的速度在全球范围内发展,随着新的遥感平台陆续升空,遥感仪器也不断的进行更新换代。随着航天遥感技术的快速发展, 遥感为地球科学研究提供数据的能力越来越强, 已经成为资源调查、环境监测的重要技术手段1-2。基于遥感技术的桉树空间分布信息提取,在国内外研究中,可以参考的文献资料很少,但现有的采用遥感技术提取其它植被信息的研究积累为本论文的研究提供了借鉴。1.2.1植被信息提取技术研究进展植被不但是环境的重要组成因子,也是反映区域生态环境的最好标志之一,同时也是土壤、水文等要素的解译标志3。因此,相关植被信息提取显得极其重要。采用传统的人工调查法耗时耗力,无法满足大区域的准确植被信息提取的需要,且遥感技术具有宏观观测等特点,在大面积调查时具有较大优势。因此植被信息的调查成为遥感的重要应用领域3-5。植被遥感信息提取的目的是在遥感影像上有效确定植被的分布、类型、长势等信息以及对植被的生物量作出估算等6。最开始的植被分类主要采用人工目视解译,它可充分利用判读人员的知识,具有很好的灵活性,擅长提取空间相关信息,但定位不准确,时效性差,可重复性差,并存在个人差异7。之后的计算机自动分类比目视解译进了一步,后面又发展采用了遥感信息复合技术8。信息复合的内容和方式包括:a.同种遥感信息多波段多时相信息复合;b.多平台遥感数据复合;c.遥感与非遥感信息的复合。遥感数据与GIS数据的复合,可视为信息复合的高级形式。随着计算机技术的迅速发展,遥感技术的不断日益创新,遥感植被信息提取也不断的出现了很多新的方法。如原始波段合成法、植被指数提取法、NDVI与波段合成法、HIS融合法、分级分类提取法、基于知识库提取法等9。利用光学遥感进行植被信息提取的理论是植被的光谱特征,与其他地物光谱特征具有明显的区别。绿色植物体内的叶绿素控制着植物在可见光波段区间的光谱特征。因此可以利用叶绿素在0.45m、0.65m处的吸收带和在0.55m附近的反射峰这一特点对植被信息进行提取。采用光学遥感手段进行植被信息提取的方法已经比较成熟10。将光谱特征和非光谱形成的特征(如地形、纹理结构等)结合对植被的提取也有很大的帮助。即可以利用地物在不同地形(如高程、坡度、坡向)出现概率的不同建立判别函数实现植被的分类。在国内,邸向红等通过引入高程信息能很好地将林地与果园分开11。李国清采用光谱信息、植被指数、纹理特征和地形因子进行决策树分类,使毛竹精度提高了3.23%,杉木精度提高了22.76%,马尾松精度提高了14.85%,阔叶林精度提高了20.69%,经济林精度提高了8.17%12。黄建文等利用TM数据对4个季节的帽儿山进行植被分类,同时辅助以物候特征和地面GIS专题信息,先利用基于光谱知识的林地提取模型提取林地边界,再用监督分类方法分别进行林地和非林地内部类型信息的提取,生成多季相综合分类图,分类结果精度比单时相提高19.613。申广荣等通过统计和小波分析的方法提取了SPOT影像的绿地纹理特征,并将其引入基于光谱分类的最大似然法进行绿地信息的提取分类,相对于面向象元的监督分类分类结果,其分类总精度由原来的76.5%提高到了80.2%, Kappa系数由原来的0.7023, 提高到了0.748414。颜梅春以南京市钟山景区为试验区,探讨了植被类型信息提取相关的图像预处理和植被类型信息提取方法,利用IKONOS影像数据的纹理信息进行植被分类, 并将结果与用光谱信息、植被指数信息的分类结果比较。研究表明纹理信息分类的精度最高, 植被指数次之, 光谱信息中的非监督分类最低15。田新光等采用面向对象的提取方法,对IKONOS卫星影像利用简单的决策树分类方法对海岸带红树林信息提取,并与其他方法进行比较,结果表明该分类精度较高16。向娟采用面向对象分类方法,对桉树信息提取进行研究,结果表明采用面向对象分类方法分类总精度为80%,Kappa系数为0.7531,桉树的生产者精度为83%,分类精度较传统分类方法大大提高17。ADAMS等(1995)采用1988年、1989年、1990年的TM影象对巴西AMZON盆地进行土地覆盖变化研究,其监测精度可达到90以上。LENNEY等(1996)对埃及的农业土地进行了监测,采用1984年和1993年的TM数据NDVI特征进行,分类精度可达到95.8518。Stolz,Roswitha(1996)为解决在德国南部的Bavarian山区草地与谷物很难区分这一情况,使用RS和GIS,对图像中每个像元的类别进行判定,最终结果比仅用归一化植被指数(NDVI) 进行地面植被分类的精度高。Zarco-Tejado等(1999)综合植被调查、植被光谱信息和陆地卫星资料对地面覆盖物和森林分布进行分类,分类精度有所提高19。S.Berberoglu等(2000)以图斑为单元结合纹理信息的人工神经网络方法,使该区域的土地覆盖分类能够达到的精度最大为89%。Griffiths和Lee(2000)采用GIS技术结合地物的光谱信息,分类精度在80%85%18。Knotes利用光谱和纹理信息进行土地覆盖高一层次的分类。Shefali等(2003)利用多时相的NDVI对中南亚地区的植被进行分类,植被指数的加入使分类结果较好20。Jason SWalker等采用面向对象的方法从高分辨率的航片上提取Phoneix市的植被信息,总体分类精度达至94。1.2.2基于决策树提取方法的研究进展自数字计算机在上世纪五、六十年代出现以来,人们利用计算机模拟人的智能过程不断得到各种成就,在这一研究过程中不断加速了数据分析技术“模式识别”的发展。决策树一词最早出现在1982年的模式识别领域中,十多年前作为一种数据挖掘技术引入遥感图像处理,因此,模拟专家目视解译,建立遥感图像解译的专家系统,实现图像的自动解译成为遥感图像解译的主要趋势之一22。决策树学习算法在信息提取问题上呈现了非常巨大的优势,因为它不但建立速度快、精度高,而且可以生成可理解的规则。更重要的是计算量不是很大,能够处理连续值和离散值属性,能够直观的显示重要属性,并且在学习过程中使用者不必了解很多背景知识,因为提供的训练例子能够用属性结论式的方式表达出来,就能以该算法来进行学习。基于决策树的分类决策树分类能够按照一定的方式将多种信息(RS和非遥感数据)有机地组合来提高分类精度。如它与GIS数据进行融合的分类,就是采用分级形式,选取不同的标准或方法针对不同的集合对其进行最有效的划分,达到将复杂的多分类问题指标简单化目的。国内申文明等以河北唐山为研究区,利用Landsat ETM+ 影像数据和GIS数据,采用决策树分类技术C5.0算法和传统计算机自动分类方法对研究区进行分类研究,得到决策树分类方法与传统自动分类相比,分类精度提高了18.29%, Kappa 系数也提高了0.187823。可以看出,决策树分类方法在一定程度上优于传统自动分类。汪金花等以河北省唐山市为研究区,采用CBERS-1影像,运用决策树分层处理结构思想, 构建了唐山市土地利用分类体系和数学模型24。罗来平采用TM遥感影像,利用决策树CART算法进行专题图分类,识别出了水体、建筑用地、耕地和林地25。袁林山等以江苏省徐州市为研究区,采用多特征决策树方法对CBERS-02数据分类,并与最大似然法和支持向量机分类方法进行比较,结果表明,多特征决策树分类方法在土地利用/覆盖分类具有较好的分类效果26。陈君颖等对IKONOS卫星影像,利用决策树分类算法对植被进行了分类,研究表明,充分利用高分辨力影像的纹理信息,能有效实现植被分类并且精度较高,为实现植被的自动化提取提供了理论依据和方法途径27。高玉蓉利用SPOT5影像,引入植被指数、纹理、高程数据和坡度特征数据进行信息提取,通过决策树C5.0算法实现计算机自动分类,研究表明,其分类相对于相对监督分类能明显提高分类精度28。美国的USGS、EPA 等部门联合实施的“美国土地覆盖数据库”计划(NLCD 2001) 中,利用决策树进行了土地、城市密度信息、林冠密度信息的提取,结果表明,土地利用分类精度达到了73%77%, 城市密度信息提取精度达到83%91%, 树冠精度在78% 93%,完全能够满足大规模土地分类数据产品的生产要求。John Durkin(2005)利用决策树对卫星图像进行分析以估计落叶林和针叶林的基部面积值。Defries等(1984)通过对1984年AVHRR全球遥感数据的分类处理,得到了全球土壤覆盖分类图。Friedl等(1997)利用TM影像,通过单因子决策树、多因子决策树、混合决策树与最大似然法和线性分离函数分类器相比较得出,决策树的分类精度较高。Joy等(2003)基于TM影像,采用决策树方法对森林类型进行识别,也取得了较好的效果。Yoshikawa Masanobu等(1995)用完全自动构造二叉决策树对遥感数据进行了土地覆盖类型分类,并将这种算法与Bayesian分类器进行了比较,结果表明在分类精度和所需要的训练样本数量上,该模型都得到了比较满意的结果。通过研究现状,我们可以看出利用遥感技术实现桉树分布信息提取,很少有文献涉及,而利用决策树分类方法实现对桉树分布信息的提取研究,更是薄弱。为弥补上述不足,本文基于决策树分类技术,尝试选择不同的特征组合对遥感影像进行分类研究,并与传统的ISODATA法和最大似然分类法进行比较,找到最佳决策树分类方法,实现对桉树分布信息的准确提取。1.3研究内容与方法1.3.1研究内容本文主要利用决策树的分类方法,利用中巴遥感影像,探讨了基于决策树分类方法的影像特征提取、分类体系的建立,并提取出桉树分布信息。最后通过与传统分类方法非监督分类ISODATA法和监督分类最大似然法在实验区的分类结果对比评价,说明利用决策树分类方法相对于传统分类方法的优势所在。在遥感信息提取时,桉树的光谱信息和其它地类光谱信息会出现一定的相似性,因此在特征选择时,除了利用其光谱信息外,同时还利用了植被指数特征、主成分变换特征和纹理信息特征,构建了基于光谱信息、植被指数信息、主成分变换信息和纹理信息等分类特征,建立研究区的各地类识别知识。利用中巴卫星遥感影像,采用基于知识的决策树分类方法,利用已构建的分类特征,对研究区主要地类进行分类识别,研究了一种最佳桉树分布信息识别方法。1.3.2技术路线本论文主要采用的技术路线如下:中巴卫星影像影像预处理光谱特征各地类光谱特征差异分析光谱特征植被指数特征各地类植被指数特征差异分析ISODATA法分类最大似然法分类各地类主成分变换特征差异分析主成分变换特征各地类纹理特征差异分析纹理特征建立土地利用/覆盖分类识别的知识基于知识的决策树分类土地利用/覆盖及桉树信息提取精度评价与分析图1 论文技术路线1.4本文的结构安排1、绪论本章主要概述了论文选题意义和目的,以及国内外植被信息提取技术和决策树分类技术的研究进展。并介绍了本文的研究内容和技术路线。同时对全文的整体结构作了详细安排。2、遥感图像计算机分类技术本章主要介绍了遥感图像的计算机分类技术,论述了非监督分类中的ISODATA法和监督分类中的最大似然法两种最常用传统分类方法,以及目前非传统分类中比较流行的人工神经网络法、支持向量机法和本次试验研究主要采用的决策树分类方法。3、研究区遥感图像地类分类特征分析本章介绍了研究区的概况和数据源的预处理工作。并确定了土地利用/覆盖分类类别,针对研究区进行了各类别的典型样本选择,计算各对象的光谱、植被指数、主成分变换、纹理信息等特征,并对这些特征进行分析。4、基于决策树分类的桉树分布信息提取实验本章主要选取合适的特征组合构建特征空间,然后利用不同特征组合信息提取研究最优桉树分布信息提取方案。最后,用传统的非监督分类(ISODATA法)和监督分类(最大似然法)进行了研究区桉树分布信息提取试验,并将其分类结果和决策树分类结果进行精度评价和对比。5、结论和展望总结了本文的研究结果和结论,并且对其实际应用进行了展望。2.遥感图像计算机分类技术遥感(Remote sensing)是在不直接接触研究对象的情况下,通过某种传感器装置,测量、分析并判定目标性质的一门科学和技术29-32。新型传感器的不断出现,能获得不同空间分辨率、时间分辨率和光谱分辨率的遥感图像,并与全球定位系统(Global Position System,简称GPS)、地理信息系统(Geographical Information System,简称GIS)等相结合,为遥感图像的解译提供了多种途径。遥感技术具有覆盖面广, 成像迅速而且具有周期成像能力, 并且具有多波段、多时相、多应用目标以及多学科综合的特点22。遥感图像分类就是利用计算机对遥感图像中各类地物的光谱信息和空间信息进行分析,然后选择特征,并用一定的手段将特征空间划分为互不重叠的子空间,然后将图像中的每个像元按照某种规则或算法划分为不同的类别,得到遥感图像中与实际地物的对应信息,最终实现分类33。遥感图像分类过程中可以利用计算机技术,通过数字处理的方法来增强和提取遥感图像中的专题信息,从而提高分类精度。传统的遥感影像计算机分类主要基于统计模式识别方法。利用遥感数据的统计值特征与训练样本数据之间的统计关系来实现地物分类。常用的传统分类方法包括非监督分类的循环集群法(ISODATA)分类法、K-均值聚类法等,以及监督分类的最大似然法、最小距离法、平行六面体分类法等。随着遥感图像解译和分析的深入研究以及地物类型分布方式的复杂性,统计模式识别方法逐渐显现了本身的一些不足之处,因为只考虑单一分类规则对影像进行分类,而不考虑其他因素,如空间位置、色调特征等构成影像的多种因素,最终影响了传统分类方法的精度,造成传统分类方法不足,加上卫星遥感光谱数据由于空间分辨率比较低(TM影像30米、SPOT-5影像10米) ,存在综合光谱信息如混合像元,致使计算机分类面临着诸多模糊对象导致分类出现较多错分、漏分,使得分类精度达不到要求。为此专家学者不断研究和探索新方法。尤其是近年来由于模式识别技术特别是人工智能的发展,人们发展了许多新方法和新技术来改善分类效果或提高分类精度。如目前比较流行的分类方法:人工神经网络方法、模糊数学方法、决策树方法、专家系统方法、支持向量机方法等。本论文主要介绍比较典型人工神经网络法、支持向量机法和决策树分类法。2.1.计算机传统分类方法在传统方法中人们最常使用的是以迭代为实质的ISODATA法以及基于贝叶斯(Bayes)准则建立的最大似然法。2.1.1ISODATA法ISODATA法是迭代式自组织数据分技术算法(Iterative Self-Organizing Data Analysis Techniques Algorithm)的缩写,简称迭代法,是一种重复自组织数据分析技术,首先计算数据空间中均匀分布的类均值,然后用最小距离技术将剩余象元进行迭代聚合,每次迭代都重新计算均值,且根据所得的新均值,对象元进行再分类34。这是一种最常用的非监督分类算法,它不需要通过训练场地来确定判别函数集,而是根据像元间的相似度大小,进行合并归类,也称聚类35。ISODATA法或迭代法聚类的实质是先给出一个不的初始分类,然后用某种原则反复修改和调整分类,以逐步逼近一个正确的分类。ISODATA算法的一般步骤如下:(l)首先选择一些初始值作为初始聚类中心,然后将带分类像元按照一定指标分配给各个聚类中心。并计算各类中央本的距离函数等指标;(2)根据给定的要求,将前一次获得的集群组进行处理,以获得新的聚类中心;(3)进行迭代运算,重新计算各项指标,判别聚类结果是否符合要求。(4)经过多次迭代运算后,直到结果收敛,运算最终结束。ISODATA法作为非监督分类优势在于不需要事先对所要分类的区域有广泛的了解认识,得到的类别只是按照自然光谱获得,但是如果要想得到具体的分类就需要人工操作将每个类别划分到相应的目标类中,这个过程往往需要对研究区有一些背景资料和认识。该方法优点在于引入误差小,并且独特的、覆盖量小的类别也能够被识别,但在实际应用中也存在精度低、无法控制等缺陷。2.1.2最大似然法最大似然分类方法是根据有关概率判决函数的贝叶斯准则对遥感图像进行的识别分类。具有严密的理论基础,判别函数对呈正态分布的类别易于建立,能综合应用每个类别在各波段中的均值,方差以及各波段之间的协方差,充分利用了遥感数据的统计特征,被认为是至今应用比较广泛、比较成熟的一种监督分类方法36。最大似然法假设遥感图像的每个波段数据都为正态分布。其基本思想是:地物类数据在空间中构成一定的点群;每一类的每一维数据都在自己的数轴上呈正态分布,该类的多维数据就构成了一个多维正态分布;各类的多维正态分布模型各有其分布特征,如位置、形状、密集或分散的程度等37。最大似然分类法在多类别分类时,常采用统计学方法建立起一个判别函数集。然后根据这个判别函数集计算各待分像元的归属概率。这时的归属概率是指对于待分像元x,它从属于分类类别k的(后验)概率,取最大概率对应的类为分类结果。假设一影像中的光谱类别表示为wi(i=1,M,M为总的类别个数)当判别位于x的某一像元的类别时,使用条件概率p(wi |x)(i=1,M)位置矢量是一个多波段的反射值的矢量,它将像元表达为多维空间中的一个点。概率p(wi |x)给出了再光谱空间中点x的像元属于类别wi的概率。分类按以下规则进行38:如果对所有ji,有p(wi |x) p(wj |x),则xwi也就是说,当p(wi |x)最大时,像元属于类别wi。这是贝叶斯分类的一个特例。一般情况下,p(wi |x)是未知的,但是在有足够的训练数据以及地面类别的先验知识的条件下,该条件概率可以估计得到。条件概率p(wi |x)和p(x | wi)可以用贝叶斯定律表达:p(wi |x)= p(x | wi)p(wi)/ p(x) (2-1)式中:p(x | wi)-x在类别wi出现的概率;p(wi)- 类别wi在整个图像中出现的概率,并且有p(x)=i=1M p(x |wi)p(wi) (2-2)p(wi)为先验概率,p(x | wi)为后验概率。分类规则如下:如果对所有ji,有p(x | wi)p(wi) p(x j)p(wj),则xwi这里由于p(x )与判别无关,被作为公共项删去,为便于计算,设gi(x)= ln(p(x |wi)p(wi))= lnp(x |wi)+lnp(wi) (2-3)则判别函数表达为如果对所有的ji,有gi(x)gj(x),则xwigi(x)被称为判别函数。在p(x |wi)服从多元正态分布的假设下,判别函数可改写成gi (x)= lnP(Wi)ln|i | (xMi) T (i) -1 ( xMi) (2-4)式中:Mi为类别中wi中像元的均值;i 为类别wi中像元的协方差矩阵;|i |表示矩阵i的范数;Mi和i可以从训练数据中获得。最大似然分类方法的计算量比较大,同时对不同类别的方差变化也比较敏感,但训练样本比较多、一定的类别先验概率分布的知识,而且数据接近正态分布的条件下,最大似然法被认为是分类精度最高的分类方法,在遥感分类中比较常用。2.2 传统分类方法的不足传统方法中的ISODATA法虽可自迭代由少到多地确定类数,但参数确定困难,一些距离参数要随维数的变化作相应的调整39-41。最大似然法是以经典统计学为基础,分类器的分类精度很到程度上依赖有关样本的先验知识。然而,在很多实际的遥感图像分类问题中取得先验知识很困难,这使得最大似然法取得的效果不理想。随着遥感数据时空维数的不断扩展,该方法开始暴露出一些缺点:a.多源、多维的遥感数据可能不具备正态分布特征;b.离散的类别数据(如地面实测数据)在很多情况下不具备统计意义;c.对于高维空间数据,Bayes准则所要求的协方差矩阵将难以实现。监督分类中最大似然分类方法在中低空间分辨率遥感数据分类中被认为是最佳方法。但是,假如特征空间数据分布比较复杂、离散,再加上如果采集的训练样本不够充分、不具代表性,则通过直接手段来估计的最大似然函数的参数,极容易造成与实际分布存在较大偏差,从而导致分类结果精度下降。2.3 计算机非传统分类方法传统的遥感图像计算机分类方法是根据遥感数据的统计特征与训练样本数据之间的统计关系来进行地物分类,其分类结果精度差强人意。因此为了提高分类精度,人们不断研究和尝试新方法,以图改善。近几年,很多新的研究方法已经应用在了遥感图像分类上,比如有人工神经网络法(ANN)、决策树分类法以及支持向量机(SVM)等。2.3.1人工神经网络法(ANN)人工神经网络(artificial neural network,ANN)是在对人脑组织结构和运行机制的认识理解基础之上模拟其结构和智能行为的一种工程系统,简称神经网络。人工神经网络分类方法在分类时综合考虑了地物的光学特性、空间特性和时相特性42-43。人工神经网络由大量处理单元互相连接而形成的复杂的并行网络结构,虽然是简单的处理单元,而且完成的是简单的计算功能,但是其构成的整个网络结构却是高度复杂的非线性动力学系统44-45。能“自然地”实现各种非线性映射和求解各种分界面十分复杂和高度非线性的分类和模式识别问题46。人工神经网络是基于生物神经系统的分布存储、并行处理及自适应学习这些现象构造出具有一些低级智慧的人工神经网络系统。近年来,不同学者提出或应用BP网络、三维Hopfield网络、径向基函数神经网络和小波神经网络等对遥感图像进行监督分类47-48。神经网络方法具有很多特性:能够并行分布处理、具有非线性映射特性、通过训练进行学习、适应与集成;有自学习、自适应和自组织的能力,对外不但表现为可以适应多种不同的问题空间,也能很好地抑制噪声和信息缺失对最优解的影响;对内则表现为很好的容错性,即可以通过自适应与自组织来消除坏神经元的影响33。在遥感数字图像分类中得到越来越多的重视,并广泛应用于分类研究中。神经网络是人工智能的一种,可用于监督分类也可用于非监督分类。一个基本的神经网可分为三层:输入层、中间层和输出层。输入层只是连接数据的界面,并不做任何处理。输入模型就是用于分类的特征数据。在最简单的情况下,他们就是训练样本像元的多光谱数据向量。其他特征数据,如像元的空间邻域数据或多时相光谱向量数据也可以用做输入。中间层又叫做隐藏层。每一层都包括许多节点。在中间层和输出层的节点上都包括许多处理元。在每一个处理节点都进行求和以及变换运算。2.3.2支持向量机法(SVM)支持向量机(Support Vector Machines,SVM)是20世纪90年代发展起来的一种基于统计学习理论的有限样本的模式分类方法,建立在传统统计学理论基础之上,逐渐成为模式识别和机器学习领域中的一个研究热点。它建立在统计学习理论的VC维和结构风险最小化原理基础上,通过适当地选择函数子集,根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折中,使学习机的实际风险达到最小。支持向量机(SVM)提出软间隔的概念以解决线性不可分问题;引入核函数使解平面从线性扩展到非线性。支持向量机是基于从线性可分情况下的最优分类超平面(OHP,Optimal Hyper Plane)提出的,通过非线性变换将输入空间变换到一个高维的特征空间,继而在这个新的高维特征空间中求取最优分类超平面,该最优分类超平面能够将所有的训练样本正确分类,而且使训练样本中离分类面最近的点到分类面的距离最大,也就是实现分类间隔最大。标准的支持向量机算法是有监督的学习方法,根据最优分类面情况可分为两种:线性类别(可分和不可分)和非线性类别。如图2-1所示,空心点和实心点代表两类样本。如果这两类样本(训练集)是线性可分的,那么机器学习的结果是一个超平面(二维情况下是直线)或称为判别函数,该超平面将训练样本分为正负两类。图2-1 线性可分情况下的超平面图2-1中H为分类线,H1、H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离就叫做分类间隔(margin)。分类间隔是指两类中离分类超平面最近的样本且平行于分类超平面的两个超平面间的距离,或者说是从分类超平面到两类样本中最近样本的距离的和,正是这些样本确定了最优分类超平面,它们就是所谓的支持向量(Support Vectors,SV)。SVM实现的过程是首先求出支持向量SV,然后求出最优分类超平面。2.3.3决策树分类法决策树算法是以实例为基础的归纳学习算法,它从一组无次序、无规则的事例中推理出决策树表示的分类规则49-50。它是一种直观的知识表示方法,以信息论为基础,根据影像的不同特征,以树型结构表示分类或决策集合,实现复杂的决策形成过程抽象成易于理解和表达的规则或判断。决策树由一个根节点(Root nodes)、一系列内部节点(Intenral nodes)(分支)及终节点(Terminal nodes)(叶)组成,类似于流程图的树状结构(图2-2决策树示意图)。位于树最顶层的节点称为根节点。其中每个内部节点都包含一个父节点,一个或者几个子节点。假如节点没有子节点,则称其为叶节点51。决策树内部节点对输入数据的属性特征进行相应的判断,每个分支对判断后的结果进行相应的输出;每个外部节点表示判断后的最终结果,为一个判断类别。使用决策树进行事例决策的过程,就是通过对事例的属性进行一系列的由数根节点向下经内部节点逐步判断,直至叶节点产生最终决策结果52。此方法也就是利用信息论中的信息增益寻找示例数据库中具有最大信息量的属性字段,形成一条规则以此建立决策树的一个节点,依据这条规则对指定遥感影像进行运算,所产生的逻辑值(真或假)派生出两类结果,即形成两个分支,或根据属性的不同取值形成多个分支,该过程可向下继续拓展,直至图像分出类别,即叶节点14。 决策树分类的算法原理就是以选定的样本数据为对象逐级找到分类树的结点,并且在每个结点上记录所选的空间数据图层的编号以及相应的判别函数参数,从而有可能反过来从“树根”到“叶”按照生成的判别规则,逐级地在每个结点上对样本数据以外的待分类数据进行分类53。在二维空间的分布模式上看两个模式类,若用传统的分类方法进行分类,其决策边界将会是一个十分复杂的二元函数式,而若用决策树分类法,只想要两个判别条件的联合就轻易而又准确地将两个模式类别区别开来。图 2-2 决策树示意图决策树分类树模型早期有CART和CHIAD两种算法,1997年Loh和Shih对CHIAD算法加以改进,提出了一种新的二叉树算法QUEST(Quick,Unbiased,Efficient Statistical Tree的缩写),该算法不但克服了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论