




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
土壤有机质含量高光谱遥感中的数据挖掘 摘要:文章分析了数据挖掘技术在土壤有机质含量高光谱 遥感数据分析中的发展历程以及目前所面临的问题;探讨 了聚类、模糊集、粗集、神经网络、决策树等数据挖掘算 法在高光谱数据分析中的应用;展望了数据挖掘技术的应 用前景。 关键词:数据挖掘;高光谱遥感;算法 数据是客观世界性质、特征和状态的描述,但由于客 观世界的复杂性和在数据产生过程中携带了一些和客观无 关的因素的干扰,使得数据产生了与客观世界不一致的状 况,人们通常把这些干扰称为“误差”,在信息科学中则 称之为“噪声”。根据信息理论,数据是由信息和噪声共 同组成的,只有当数据中排除了“噪声”之后,才能称为 信息:信息=-。在日常应用中,大量的数据未能充分利用 这一现象常常被描述为“数据丰富,但信息贫乏”。为此, 决策者迫切需要从海量数据库中提取有价值知识的工具, 数据挖掘技术正是为满足上述要求而产生的。 土壤高光谱遥感数据就是这样一种情况,在室内土壤 高光谱测试过程中,由于可控条件和不可控条件的变化, 使得所得结果有一定的差异,如土壤的粒径差异、测试土 样表面处理方法的不同、测试时几何条件的差异等都会引 起土壤光谱反射系数的不确定。同时,高光谱遥感数据波 段众多,数据量庞大,这些给处理和解译都带来了很大困 难,而数据挖掘技术能够很好的解决这种情况。 一、数据挖掘技术的发展 数据挖掘的产生发展 数据挖掘其实是一个逐渐演变的过程,其思想可以追 溯到 20 世纪 70 年代。随着数据库存储技术和计算速度提 高,科学研究人员意识到,还可以利用机器学习的方式来 分析数据。机器学习的过程就是将一些已知的并已被成功 解决的问题作为范例输入计算机,机器通过学习这些范例 总结并生成相应的规则,这些规则具有通用性,使用它们 可以解决某一类的问题。随后,伴随着神经网络技术的形 成和发展,人们的注意力转向知识工程。知识工程不同于 机器学习那样给计算机输入范例,让它生成出规则,而是 直接给计算机输入已被代码化的规则,而计算机是通过使 用这些规则来解决某些问题。80 年代末在美国底特律召开 的第 11 届国际人工智能联合会议的专题讨论会上首次出现 KDD 这个术语,人们接受了这个术语,并用 KDD 来描述整个 数据发掘的过程。随后的 KDD 国际学术大会研究重点逐渐 从发现方法转向系统应用,并且注重多种发现策略和技术 的集成,以及多种学科之间的相互渗透,数据挖掘和知识 发现成为当前计算机科学界的一大热点。随着支持数据挖 掘技术发展,数据挖掘渐渐成为成熟的技术,并在实际应 用中取得了良好效果。 数据挖掘所面临的问题 由于数据挖掘时遇到的数据库种类繁多,且各种数据 挖掘方法作用范围有限,因此采用单一方法难以得到决策 所需的各种知识,多方法融合将成为数据挖掘的发展趋势。 而数据挖掘技术当前所面临的问题主要有:如何进行降维 操作、高维数据索引、典型特征提取等;挖掘算法的表达 和改进创新;如何对挖掘产生的规则和模式进行解释与表 达,使其与信息处理的要求相关联以得到应用,并对挖掘 的知识进行客观、科学的评价,控制知识可靠性和质量, 实施有效管理;针对高光谱遥感信息的特点,对数据挖掘 任务的描述、算法功能模块组织都是其中的关键问题。 二、数据挖掘的主要算法 数据挖掘算法很多,结合不同的应用领域又发展了一 些新的方法,进一步丰富和发展了数据挖掘的算法体系。 数据挖掘可以采用的方法主要包括聚类、空间分析、模糊 集、粗集、神经网络、决策树等。这些方法都有局限性, 但它们的有机组合具有互补性,多方法融合将成为数据挖 掘的发展趋势。目前一些具有较好应用效果的方法主要包 括: 聚类 聚类是把一组个体按照相似性归纳成若干类别,即 “物以类聚”。它的目的是使得属于同一类别的个体之间 的距离尽可能的小,而不同类别上的个体间的距离尽可能 的大。在实现其他挖掘任务之前,应用聚类方法可使挖掘 精度与效率大大提高。聚类方法包括统计方法、机器学习 方法、神经网络方法和面向数据库的方法。由于高光谱遥 感信息的海量特点,聚类是一种有效的挖掘算法。通过将 信息从光谱维和空间维进行聚类,挖掘隐含在其中的规则 和知识,对于解决波段选择、特征提取、纯净象元识别等 问题,具有明显的优越性。由于聚类仅是实现对目标的集 群分析,而对不同集群的属性和特征进行挖掘才能取得更 好的效果,因此聚类一般要和其他算法结合进行。 人工神经网络 神经网络是数据挖掘和知识发现非常重要的方法,包 括前向神经网络、径向基函数神经网络、反馈神经网络等 已都得到了重视和应用。另一方面,人工神经网络也在高 光谱遥感信息中得到了一些应用。神经网络常用于两类问 题:分类和回归。神经网络的参数可以比统计方法多很多。 由于参数如此之多,参数通过各种各样的组合方式来影响 输出结果,以至于很难对一个神经网络表示的模型做出直 观的解释。实际上神经网络也正是当作“黑盒”来用的, 不用去管“盒子”里面是什么,只管用就行了。人工神经 网络有望在高光谱遥感数据挖掘中得到广泛应用。 粗集理论和模糊理论 在数据挖掘中,从实际系统采集到的数据可能包含各 种噪声,存在许多不确定因素和不完全信息有待处理。传 统的不确定信息处理方法因需要数据的附加信息或先验知 识,有时在处理大数据量的数据库方面无能为力。粗集作 为一种软计算方法,可以克服传统不确定处理方法的不足, 并且和它们能有机结合,可望进一步增强对不确定、不完 全信息的处理能力。粗集理论中,知识被定义为对事物的 分类能力。这种能力由上近似集、下近似集、等价关系等 概念体现。因为粗集处理的对象是类似二维关系表的信息 表。目前成熟的关系数据库管理系统和新发展起来的数据 仓库管理系统,为粗集的数据挖掘奠定了坚实的基础。 决策树 决策树提供了一种展示类似在什么条件下会得到什么 值这类规则的方法。决策树的基本组成部分为决策节点、 分支和叶子。决策树中最上面的节点称为根节点,是整个 决策树的开始。决策树的每个节点子节点的个数与决策树 所用的算法有关。每个分支要么是一个新的决策节点,要 么是树的结尾,称为叶子。在沿着决策树从上到下遍历的 过程中,在每个节点都会遇到一个问题,对每个节点上问 题的不同回答导致不同的分支,最后会到达一个叶子节点。 这个过程就是利用决策树进行分类的过程,利用几个变量 来判断所属的类别。数据挖掘中,决策树是一种经常要用 到的技术,可以用于分析数据,同样也可以用来作预测。 决策树在高光谱遥感信息分类、典型信息提取等任务中都 得到了应用,在高光谱遥感数据挖掘中,决策树学习可以 建立对特定应用敏感的知识集,以指导挖掘过程的进行。 三、发展前景 从目前高光谱遥感信息处理与应用情况来看,高光谱 遥感数据挖掘将在智能信息处理和高水平应用方面发挥重 要作用,以下对其潜在应用领域进行分析。 典型信息提取与识别 通过对标准地物波谱数据库、典型高光谱信息源等的 挖掘,建立和发现对特定信息、特征和现象提取有效的规 则和知识,以直接应用于目标信息的提取与识别。 定量遥感与遥感反演 高光谱遥感信息是定量遥感如成因矿物学、作物养分 监测、植被监测、生态遥感等的基础,其中隐含的规则和 知识也是遥感反演如地面组分反演、陆面温度反演等的基 础。数据挖掘发现的知识可以建立相应的决策规则和专题 知识。 高光谱分类与亚像元分解 分类是遥感应用的重要环节,基于知识的自动分类目 前是遥感分类的热点。基于知识的高光谱遥感分类的基础 是领域知识,而这正是数据挖掘的优势所在。亚像元分解 与混合像元分类是高光谱遥感信息处理的重要内容,数据 挖掘在纯净像元提取及分解知识与规则发现方面可以发挥 作用。 特征提取与最优特征组合选择 实现面向应用的特征提取与最优特征组合对于充分应 用高光谱信息、减少信息冗余、提高处理效率具有重要作 用,也是目前高光谱应用中的主要模式之一。随着研究的 深入,可以预言数据挖掘在高光谱遥感信息处理与应用中 将可以发挥更加深入和重要的作用,促进高光谱遥感的快 速发展和广泛应用。 参考文献: 1、FuLM.RulegenerationfromneuralnetworksJ. IEEETransonSystems,ManandCybernetics,1994(8). 2、TowellG,Shavlik.Theextractionofrefinedrulesfromk nowledgebasedneuralnetworksJ.MachingLearning,1993 (1). 3、袁曾任,卢振中.由神经网络提取规则的一种方法J. 信息与控制,1997(1). 4、刘振凯,贵忠华,蔡青.基于神经网络结构学习的知 识求精方法J.计算机研究与发展,1999(10). 5、张朝辉.利用神经网络发现分类规则J.计算机学 报,1999(1). 6、黄源,萧嵘,张福炎.神经网络的规则提取研究J. 计算机研究与发展,1999(9). 7、TuPeilei,ChungJenyao.Anewdecision2treeclassifica tionalgorithmformachinelearningC.InProceedingsoft he1992IEEEInternationalConferenceonToolsforArtifici alIntelligence.Arlington,VA,QuinlanJR.InductionofDe cisionTreesM.MachineLearning,1986. 8、刘小虎,李生.决策树的优化算法J.软件学报, 1998(10). 9、洪家荣,丁明峰,李星原等.一种新的决策树归纳学 习算法J.计算机学报,1995(6). 10、SchlimmerJC,FisherD.Acasestudyofincrementalconc eptinductionC.I
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水电安装维修活动方案
- 桂平市广场五四活动方案
- 检察院整治活动方案
- 河北农大活动社团活动方案
- 气焊工比武活动方案
- 校长走进课堂活动方案
- 汉字拼凑游戏活动方案
- 汽车国庆活动策划方案
- 棋道育人活动方案
- 森林昆虫聚会活动方案
- 手术室人员出入管理制度
- 2025年贵州省罗甸县事业单位人才引进166人历年高频重点提升(共500题)附带答案详解
- 《如何设定目标》课件
- 房地产业智慧物业管理系统实施方案
- 2024年度城市公共停车场停车场承包经营合同范本3篇
- T∕HGJ 12402-2021 石油化工装置火灾紧急隔离控制阀设计标准
- 办公用纸项目建设实施方案
- 2024版《53天天练单元归类复习》3年级语文下册(统编RJ)附参考答案
- 辣椒购销合同范本
- 13J927-3 机械式停车库设计图册
- 装卸工安全培训课件
评论
0/150
提交评论