




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、湖南师范大学研究生课程论文论文题目 基于专家知识的决策树遥感影像分类 课程名称 遥感地学分析 姓 名 乔方毅 学 号 201202131079 专 业 人文地理学 年 级 2012级 学 院 资源与环境科学学院日 期 2012-03-05 研究生课程论文评价标准指标评价内容评价等级(分值)得分ABCD选题选题是否新颖;是否有意义;是否与本门课程相关。20-1615-1110-65-0论证思路是否清晰;逻辑是否严密;结构是否严谨;研究方法是否得当;论证是否充分。20-1615-1110-65-0文献文献资料是否翔实;是否具有代表性。20-1615-1110-65-0规范文字表达是否准确、流畅;体
2、例是否规范;是否符合学术道德规范。20-1615-1110-65-0能力是否运用了本门课程的有关理论知识;是否体现了科学研究能力。20-1615-1110-65-0 评阅教师签名: 年 月 日 总分:湖南师范大学研究生处制基于专家知识的决策树遥感影像分类摘要:决策树分类作为一种基于空间数据挖掘和知识发现的监督分类方法在遥感影像分类中应用广泛。本文首先回顾了基于决策树的遥感影像分类的基本概念、主要算法以及应用特点。在此基础上,以Landsat TM数据和DEM数据构成多源数据进行在ENVI软件中进行试验,探讨基于专家知识的决策树分类方法的主要应用特点。关键词:遥感影像分类;决策树;专家知识;C4
3、.5算法1 引言 随着计算机技术的快速发展,遥感影像的计算机分类已经成为遥感影像信息提取和分类的主要手段。传统的基于统计模式识别的遥感影像分类(如最大似然法分类等)、人工神经网络分类、模糊聚类分类等在遥感影像分类中获得了广泛地应用。但这些分类方法都是以影像的光谱特征为基础,由于遥感影像“同物异谱”和“异物同谱”现象的大量存在,导致分类结果出现较多的错分、漏分情况,致使分类精度降低。众多研究表明,结合影像光谱信息以及其它辅助信息,则可以大大提高遥感影像的分类精度1。而决策树分类作为一种基于空间数据挖掘和知识发现的监督分类方法,突破了以往分类仅仅依靠影像光谱信息,不需要满足正态分类,可以充分利用G
4、IS数据库中的地学知识辅助分类,大大提高了分类精度2。2 决策树分类2.1 概念3 决策树(Decision Tree),顾名思义就是一个类似于流程图的树形结构。一个决策树由一个根节点(Root nodes)、一系列内部节点(Internal nodes)组成,每个内部节点只有一个父节点和两个或多个子节点,节点和子节点之间形成分支。其中,每个分支代表测试的一个结果,不同属性值形成不同的分支;而每个叶节点就代表一个类别,即图像的分类结果。树的最高节点称为根节点,是整个决策树的开始。图1就是一棵用于遥感影像分类的二叉树决策树分类器的简单示意图。决策树是一种直观的知识表示方法,同时也是高效的分类器。
5、它以信息论为基础, 将复杂的决策形成过程抽象成为易于理解和表达的规则或判断。此方法利用信息论中的信息增益寻找示例数据库中具有最大信息量的属性字段,形成一条规则以此建立决策树的一个节点,依据这条规则对指定遥感影像图像进行运算,所产生的逻辑值(真或假)派生出两类结果,即形成两个分支,或根据属性的不同取值形成多个分支,该过程可向下继续拓展,直至图像分出类别(叶节点)。这种自顶向下递归的方式构造判定决策树的方法称之为“贪心算法”。高程aNDVIbClass2Class1Class3Class4Bandc是否是是否否图1 决策树分类简单示意图 理想的决策树有3个要求:最优覆盖问题(MCV)生成最少数目的
6、公式(合取式);最简单公式问题(MCOMP)生成具有最少数目选择子及属性值的公式;最优示例学习问题生成具有最简单公式的最优覆盖。2.2 决策树分类的主要算法 1) 分类回归树1 分类回归树(CART, Classification and Regression Tree)是一种通用的树生长算法,由Breiman等人提出,是一种监督分类算法,它利用训练样本来构造二叉树进行决策树分类。其特点是充分利用二叉树的结构(Binary Tree-structured),即根节点包含所有样本,在一定的分割规则下根节点被分割成两个子节点,这个过程又在子节点上重复进行,成为一个回归过程,直至不可再分成子节点为止
7、。构造CART树采用的思路:在整体样本数据的基础上,生成一个多层次、多叶节点的大树,以充分反映数据之间的联系(这时树生长为考虑噪声,往往反映的是训练过度情况下的数据联系),然后对其进行删减,产生一系列子树,从中选择适当大小的树,用于对数据进行分类,具体可分为树生长和树剪枝两部分。2) C4.5算法4 C4.5算法基本原理是从树的根节点处的所有训练样本开始,选取一个属性值来区分这些样本。对属性的每一个值产生一个分支,分支的属性值相应样本子集被移到新生成的子节点上,这个算法递归地应用于每个节点上,直到节点的所有样本都分区到某个类中,到达决策树的叶节点的每条路径表示一个分类规则。该算法采用了信息增益
8、比例来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性不足,并且在树构造过程中或树构造完成后进行剪枝,能够对连续属性值进行离散化处理。3) Boosting算法1 Boosting算法(增强算法)是一种提升任意学习算法准确率的集成学习方法,可将准确率仅比随机猜测略好的弱学习算法提升为强学习算法,它的思想来源于可能近似正确(Probably Approximately Correct, PAC)学习模型。它利用某种学习算法生成一系列的基分类器,每个基分类器的训练依赖于在其之前产生的分类器的分类结果,对训练失败的训练样本赋予较大的权值,让学习算法在后续的学习中“更加重视”。最终分类器通过多
9、个基分类器的加权投票得到最后的结果,减少了单个分类器的误差,提高了分类器的分类精度。2.3 决策树分类的主要特点3 基于决策树的分类模型进行遥感影像分类具有巨大的优势:1) 决策树进行遥感图像分类时,在每个节点处只根据一个属性值或几个属性的线性判决函数值对图像进行划分。由于分类判据已知,即依据划分的标准(属性)已经明确, 而且在节点处划分的类别一般较少,可以更加有针对性地选择判别函数进行分类,以提高其分类精度。同时,由于每次只对一个或几个属性进行运算,这样大大简化了参加分类的自变量的维数。2) 决策树分类法便于地物的几何特征、结构特征和纹理特征等参与图像的分类过程。例如参考地物的几何形状、纹理
10、等特征可将农田和草地进行区分,即使两者的光谱统计特征相似也不会错误的将其划为一类。3) 决策树分类法可操作性强。可以根据不同的目的确定和调整各个属性之间的相互关系(层次关系、权重关系等)。例如,光谱特征相似的类别之间可先进行几何特征的区分,而几何特征相似的地物之间又可以先进行光谱特征的比较。4) 由于决策树分类法对训练区内的统计并非基于任何“正态或中心趋势”假设,因而它比传统的统计分类法更适合于处理非正态、非同质(分布不均)的数据集,并对于特定的类别可以产生不止1个(多个)终端节点。3 实验与分析 基于专家知识的决策树分类时基于遥感影像数据及其他空间数据,通过专家经验总结,简单的数学统计和归纳
11、方法等,获得分类规则并进行遥感分类。分类规则易于理解,分类过程也符合人的认知过程,最大的特点是利用多源数据。基于专家知识的决策树分类总体上可分为四个过程:定义分类规则、构建决策树、执行决策树和评价分类结果。 (1) 定义分类规则 本次试验以Landsat TM数据和DEM数据构成多源数据,根据专家经验知识定义分类规则: Class1 (朝北缓坡植被):NDVI0.3,坡度20°,朝北 Class2 (非朝北缓坡植被):NDVI0.3,坡度20°,非朝北 Class3 (陡坡植被):NDVI0.3,坡度20° Class4 (水体):NDVI0.3,波段4的DN值大
12、于0且小于20 Class5 (裸地):NDVI0.3,波段4的DN值大于等于20 Class6 (无数据区,背景):NDVI0.3,波段4的DN值等于20图1 原影像(局部)图2 原影像地区DEM数据(局部) 按照ENVI软件中分类规则的表达规范,将定义好的分类规则转换成规则表达式为Class1 (朝北缓坡植被):NDVI gt 0.3,slope lt 20,(aspect lt 90) or (aspect gt 270) Class2 (非朝北缓坡植被):NDVI gt 0.3,slope lt 20,(aspect gt 90) and (aspect lt 270) Class3
13、(陡坡植被):NDVI gt 0.3,slope ge 20 Class4 (水体):NDVI le 0.3,(b4 gt 0) and (b4 lt 20) Class5 (裸地):NDVI le 0.3,b4 ge 20 Class6 (无数据区,背景):NDVI le 0.3,b4 eq 20 (2) 创建决策树 ENVI中的决策树是用二叉树来表达,规则表达式生成一个单波段结果,并且包含一个二进制结果0或1。0结果被归属到“No”分支,1结果被归属到“Yes”分支。在ENVI中创建决策树的主要步骤:编辑节点属性、变量/文件选择、编辑输出分类属性。具体见图3至图5。图3 节点属性的编辑图4
14、 变量/文件的选择图5 决策树结构图 (3) 执行决策树 决策树创建之后,即可在ENVI中执行决策树分类,得到分类结果(见图6)。 (4) 精度评价与分类后处理 分类后的精度评价方法包括:分类结果叠加、混淆矩阵和ROC曲线。常用的分类后处理包括更改分类颜色、分类统计分析、小斑点处理(类后处理)、栅矢转换等操作。这里不再详述。图6 决策树分类结果(局部)4 总结 基于专家知识的决策树分类方法与传统的基于光谱特征的自动分类方法相比,不需要数据集满足正态分布的假设,可以重复利用GIS数据库中的多源信息,因此具有更高的分类精度和适应能力,并易于实现计算机自动分类的流程化和自动化。分类过程中加入DEM数据、坡度、坡向等GIS数据,可以提高分类精度,特别是在山区、丘陵地形区域。但是,辅助数据的分辨率必须与待分类影像接近,否则反而会影响分类结果2。此外,分类规则的确定是决策树分类的关键。参考
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安全优化填空题集
- 2025年国际工程师资格证书综合能力考试试题及答案解析
- 2025年安全员考试安全生产安全应急预案题库及答案
- 2025年地铁安全员应急处理模拟题及答案
- 2025年建筑施工三类人员C证考试重点题库
- 2025年气象观测员中级面试模拟题及答案解析选
- 课件《关雎》教学课件
- 2025年政府会计准则制度预测题及解析资料
- 2025年土耳其国家电投招聘笔试全真模拟题及答案
- 2025年宠物训导师笔试重点复习题
- 2025江苏南京农业大学新校区建设指挥部、基本建设处人员招聘10人笔试备考试题及答案解析
- 2025-2026学年第一学期九年级开学第一课:收心班会课件
- VTE的预防及护理
- 2025年济南市中考英语试题含答案
- Unit1单元复习课件人教版八年级英语上册
- 2025年青海省中考英语试卷真题(含答案及解析)
- 民事起诉状要素式(民间借贷纠纷)
- 肺孢子菌肺炎护理查房
- 法官培训人民调解员讲稿
- 茶叶施肥技术课件
- 2025年湖南省长沙市中考物理试卷(含答案)
评论
0/150
提交评论