下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于svm的耕地分类识别
0耕地资源缺乏效率,重实传统的土地监控是通过统计或地面调查进行的。这种方法仅适用于局部精细的土地管理。而对整个耕地的监测,不仅会消耗大量的人力、物力和财力,还会缺乏效率,从而无法在短时间内反映耕地资源的实时变化。使用遥感技术获得的图像还需要经过遥感图像分类技术处理才能够得到耕地的信息。遥感图像分类技术是指通过模式识别理论,分析图像中反映同类地物的光谱、空间相似性和异类地物的差异,进而将遥感图像自动地分成若干地物类别的技术1svm算法的优势支持向量机(SupportVectorMachine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。小样本并不是说样本的绝对数量少,而是说与问题的复杂度比起来,SVM算法要求的样本数是相对比较少的。SVM算法的最终决策函数只由少数的支持向量所决定,其计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这样可以在一定程度上避免“维数灾难。支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力1.1svm的分类原理支持向量机(SVM)的基本模型定义为特征空间上的间隔最大的线性二类分类器,即找到一个分类超平面,使得样本空间中距离分类超平面最近的点到分类超平面的距离最大,也就是分类间隔最大。应用SVM对分类问题进行分析时,假设训练集为(xSVM解决问题的思路是找到离超平面最近的样本点,通过其约束条件求出最优解。SVM的基本分类器是一个线性函数,可用于线性分类,分类函数为:其中W和b是训练样本数据后得到的参数。对于训练数据集T,其数据可以分为C1和C2。对于C1类的数据xw分类超平面的函数为f(x)=xw设分类器的间隔为γ,如果令γ=maxyf(x),那么就有一个问题,就是w和b可以等比例增大,导致间隔yf(x)可以无限大。所以需要变成求等价的最大几何间隔:此时,目标函数是严格的凸二次型,可以使用拉格朗日乘子法和KKT条件来求解w和b。SVM的问题满足使用拉格朗日乘子法的条件,因此问题变成:其中,α其中,〈x现实情况中,不可能总是能够完美地把所有样本分离开来,也就是无法找到一个分类超平面,使得样本能完全正确地被超平面分开。这种无法被分类超平面正确分类的点被称为异常点。SVM对这种情况的处理方法就是引入松弛变量ξ。通过修改之前的约束条件为:则运用拉格朗日乘子法后的公式变为:其中,参数C为惩罚系数,即对误差的宽容度。C越高,越不能容忍出现误差,即容易过拟合;C越小,越容易欠拟合。ξ为对所有样本数据都有效的松弛变量,比如0.0001。至此,可以通过SMO(SequentialMinimalOptimization)算法快速地求解出最优解α1.2svm的核函数支持非线性分类能力经过以上过程,SVM已经能够高效地解决线性可分的二分类问题。不过SVM能够如此受欢迎的原因更多是因为它强大的支持非线性分类的能力。SVM通过核函数将非线性问题映射到高维空间并将其变成一个在高维空间线性可分的问题。SVM中关于向量x的计算,总是在计算两个向量的内积K(x常用的核函数如下:(1)线性核函数:K(x(2)多项式核函数:(3)径向基函数(RBF):(4)sigmoid核函数:其中,K(x1.3多类分类使用SVM进行多类分类多通过组合多个二类分类器的方法来实现。常见的方法有一对多法(OVRSVMs)和一对一法(OVOSVMs)一对一法每个分类器选择一个类的样本作为正样本,选择一个类的样本作为负样本,这样就避免了数据集偏斜的问题。分类时,每一个分类器都对其类别进行判断,并为相应的类别“投上一票”,最后得票最多的类别即作为该未知样本的类别。这种方法会构造k(k-1)/2个分类器。虽然分类器的数目变多了,但是在训练阶段所用的总时间却比一对多法少很多。不过这种方法也会出现分类重叠的现象,但不会出现不可分类现象。因为一对一法存在误分类,Piatt提出了决策导向的有向无环图(DAGSVMs)方法。其原理是依次构造分类器,每次构造都利用上一次构造的分类器的分类结果来构造下一个分类器,这样只需要构造k-1个分类器。因此相对于一对一法,其分类速度更快,而且不存在分类重叠的现象2支持向量机的遥感图像耕地识别2.1研究区域的主要地类研究区域为江苏省某地级市,面积901平方公里,海拔在4~8m之间,市内地势平坦,湖泊众多,森林覆盖率在44%左右。研究区域的主要地类有:水域、农田、公路、房屋、大棚、林地等。实验数据来自Google地图采集的图像,总共有三个通道,共有27777813个像素点,如图1所示。2.2分类准确性程度要求分类器自对于遥感图像分类结果的评价,混淆矩阵是最常用到的精度分析方法。混淆矩阵(confusionmatrix)能够刻画一个分类器的分类准确程度。“混淆”一词也形象地表达了分类器面对多个分类时可能造成的混淆。混淆矩阵的每一列表示一个预测的类别,每一列的数据的总数表示分类器预测为该类别的数据的数目,而每一行表示数据的真实归属类别,每一行的数据总数表示该类别的数据实例的真实的数目。由混淆矩阵可以很容易地得到分类的准确率。所以,本文使用混淆矩阵作为分类效果的评价标准,并由混淆矩阵计算分类的准确率。2.3svm的算法性能分析首先设计实验的基本步骤如下:1)遥感图像预处理,进行辐射校正和空间域增强处理滤波;2)确定分类数目,选择训练样本,得到训练集;3)在选择的训练集上训练支持向量机分类器;4)将测试数据输入训练好的分类器得到分类结果,对最终的分类结果进行分类精度分析。为提高分类精度,在步骤2)中依据实验区域的地表物体将地表类型分为10个类型:行道树、温室大棚、房屋、田埂、公路、河流、池塘、森林、在耕地和休耕地。通过ENVI5.1的地表真实感兴趣区(ROI)选择训练样本共计1323786个像素点,统计如表1所示。在SVM算法的众多核函数中,应用最广的是RBF核函数,无论是小样本还是大样本,高维还是低维等情况,RBF核函数均适用。而且RBF核函数与多项式核函数相比,RBF需要确定的参数要少很多,数值的计算和调参会相对简单。而对于某些参数,RBF和sigmoid具有相似的性能当使用RBF核函数时,SVM的训练效果主要取决于两个参数C和γ。其中,C是惩罚系数,即对误差的宽容度。C越高,越不能容忍出现误差,即容易过拟合,C越小,越容易欠拟合。C过大或者过小,都会使得算法的泛化能力变差。γ是选择RBF函数作为核函数之后,该函数自带的一个参数。它隐含地决定了数据映射到新的特征空间后的分布,如果γ太大,支持向量太少,那么对于未知样本的分类效果会很差,会存在训练准确率很高但是测试准确率不高的可能,也就是过拟合。如果γ值太小,支持向量太多,则会造成平滑效应太大,无法在训练集上得到特别高的准确率,也会影响测试集的准确率。对于这两个参数的选取可以通过使用交叉验证和网格搜索的方法来寻找最优的一组C和γ。3不同类别地物的识别效果通过设置不同的参数可以得到不同的分类精度。事先设定一组参数,通过穷举法将所有的参数都代入算法中运行一遍,然后计算每组参数下的分类准确率,并从中找出总体分类准确率最高的一组参数作为最优的参数,最终得到如表2的分类准确率数据。从表2可以看出,当C=2.0,γ=0.15时,分类器的总体准确率最高,达到了75.6%。图2给出了原始图像和分类后的图像的比较,可以看出分类的结果是很明显的,对于休耕地和在耕地都给出了很好的识别效果。表3给出了此时分类结果的混淆矩阵,可以看出此时分类器对于耕地类型的地物(包括休耕地和在耕地)的识别准确率已经很高了,分别达到了91.81%和90.05%。因为房屋类型地物的特征的复杂,分类器对于房屋的识别准确率比较低,仅为44.56%。而由于田埂和休耕地的相似性,导致对田埂的识别准确率也比较低,仅为51.91%。不过由于本文的目的是从遥感图像中识别出耕地类型地物,所以对于房屋和田埂等其他地物的低识别准确率是在可以接受的范围内的。4遥感图像识别结果本文通过使用支持向量机模型,对江苏省某地级市的卫星遥感图像中的耕地进行识别。通过调整支持向量机模型的参数,可以使得模型对耕地的识别准
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业电子商务理念
- 八年级英语下学期期中复习(一)
- 会计造假的商业伦理与会计职业道德分析
- 仪器设备技术指标表达成要求设备参数信息表
- 2026届湖北省宜昌市五峰县中考语文猜题卷含解析
- 《道路工程识图与绘图》教学大纲
- 2026 学龄前自闭症入门感统课件
- 鉴赏《日出·印象》
- 《中药学(第2版)》课件16 止血药
- 大棚承包合同
- 经典酒店设计案例分析
- (2026春新版)北师大版二年级数学下册全册教学设计
- 2026年高中历史学业水平考试知识点归纳总结(复习必背)
- 家政培训婴幼儿早教课件
- 22G101 混凝土结构施工图 平面整体表示方法制图规则和构造详图(现浇混凝土框架、剪力墙、梁、板)
- 网络查控申请书(模板)
- 2026年高考作文备考训练之题目解析及范文:人们常说凡事要“尽我所能”也要“敬我不能”
- 七年级数学下册知识点(人教版)
- 九江市机械技工学校教师招聘考试题库及答案解析
- P-III曲线水文频率计算电子表格程序
- 小学语文课程整体教学规划
评论
0/150
提交评论