毕业设计(论文)-支持向量机在gps高程转换中的应用研究.doc_第1页
毕业设计(论文)-支持向量机在gps高程转换中的应用研究.doc_第2页
毕业设计(论文)-支持向量机在gps高程转换中的应用研究.doc_第3页
毕业设计(论文)-支持向量机在gps高程转换中的应用研究.doc_第4页
毕业设计(论文)-支持向量机在gps高程转换中的应用研究.doc_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

支持向量机在GPS高程转换中应用研究目 录摘 要GPS定位技术的应用给测量方法带来了历史性的变革,通过GPS技术得到的GPS高程是基于WGS-84椭球的大地高,而工程中所采用的高程一般是基于似大地水准面的正常高,所以GPS技术提供的高程还不能直接运用到工程建设中,要对GPS高程进行高程转换,把GPS所测得大地高转换为正常高有着非常重要的现实意义。本文阐述GPS技术及支持向量机的国内外研究现状,分析了GPS高程转换的基本原理,常用的高程系统以及各个高程系统之间的关系,讨论了常用的高程转换方法原理,通过实验支持向量机在GPS高程转换中的优越性;分析支持向量机参数影响因素,通过实验总结参数和点位队精度影响的规律;研究遗传算法和差分进化算法对参数的优化,运用MATLAB编程,验证支持向量在GPS高程转换中的可靠性。关键词:GPS高程转换 高程异常 支持向量机ABSTRACTGPS positioning technology to the measurement method brought a historic change, obtained through GPS technology GPS height is based on WGS-84 ellipsoid geodetic height, and height used in the project is generally based on the normal geoid high, so the GPS technology provides elevation cannot be directly applied to construction, to carry out the GPS elevation height conversion, as measured by the GPS geodetic height into normal height has a very important practical significance.This paper describes the GPS technology and support vector machine research situation, analyzes the basic principles of GPS height conversion, common elevation system and the relationship between the various elevation system, discussed the principle of the method commonly used height transformation, support vector machines through experiments in the GPS height Conversion superiority; analysis of support vector machine parameters influencing factors, summarized by experiment parameters and impact point precision team rules; research on genetic algorithm and differential evolution algorithm for parameter optimization, using MATLAB programming, validation support vectors GPS height Conversion reliability.KEYWORDS:GPS height;Conversion height anomaly;Support vector machines V目 录摘 要IABSTRACTII第一章 绪论11.1 研究意义11.2 研究现状11.3 研究内容2第二章 GPS高程转换原理42.1 GPS高程测量基本原理42.2 常用高程转换方法52.2.1绘等值线图法52.2.2曲线拟合法52.2.3曲面拟合法72.2.4 支持向量机92.3精度拟合精度评定112.4 实验对比122.5 本章小结14第三章 支持向量机参数影响分析和选取实验153.1 支持向量机参数影响分析153.2 参数选取实验153.2.1 核函数实验153.2.2 惩罚因子c实验163.2.3 样本分布实验173.2.4 样本数量实验193.3 本章小结20第四章 支持向量机参数寻优方法214.1 支持向量机参数寻优方法214.1.1 基本原理214.1.2 技术流程244.2 程序验证264.2.1 MATLAB平台264.2.2 系统功能264.2.3功能实现284.3 本章小结31第五章 总结展望325.1 总结325.2 展望32参考文献34致 谢36南京工业大学本科生毕业设计(论文)第一章 绪论1.1 研究意义随着GPS技术的愈发成熟,相对定位精度达到了毫米级的精度,可以达到了平面控制测量精度要求。由于其精度高、全天候、高效率、多功能、操作简便的特点逐渐取代传统耗时耗力的平面控制测量。GPS正广泛应用于交通、测绘、水利、资源调查、环境监测、军事、林业、气象、移动通信等诸多行业,GPS技术对传统测量技术产生巨大影响。GPS相对传统测量方法在效率、经济性、实时性有巨大优势1。传统的高程测量采用几何水准测量方式,工作量巨大,同时还受地形的限制,容易引来系统误差和偶然误差。但是由于GPS高程是基WGS-84椭球的大地高,此高程与工程建设中用的高程系统是不一致的,这导致在工程建设中只利用了GPS测量中的平面位置信息,浪费了高程信息,没能充分利用GPS的三维坐标,因此需高程转换为正常高高程,目前GPS确定测站点正常高的关键点就是高程异常的测定。将GPS高程转换为正常高一直是研究热点,具有非常重要的实际意义,有广阔的应用前景。1.2 研究现状GPS高程转换作为一个研究热点,得到了国内外众多学者的关注。越来越多的方法被运用在高程转换中,其中支持向量机由于其小样本学习能力强和计算简单的特点2得到了广泛的运用。支持向量机运用在GPS高程转换中可以发挥小样本学习能力强的特点。对比多项式拟合法、三次样条曲线拟合法、曲面拟合法、平面拟合、神经网络法3等可以减少测量工作量和人工成本。目前支持向量机已经应用于GPS高程转换中,将支持向量机用于GPS似大地水准面拟合,支持向量机技术拟合数据的精度达到了神经网络和多项式拟合的精度,并且解决了神经网络技术不能实时处理数据、过学习、收敛速度慢、易陷于局部极值等问题。基于DE_SVM非线性组合预测模型,该方法利用差分算法对核函数和惩罚因子进行优化。该方法预测结果的相对误差平方和,相对误差和,最大相对误差都较单一预测模型结果精度更高,更加精确4。基于最小二乘支持向量机的区域GPS高程转换组合,该方法是一种基于结构化风险最小原理的非线性模型,能较好地解决小样本和局部极小值问题同时具有参数少、易于求解等特点5。SVM的优势在于基于结构风险最小化原理来提高泛化能力,同时能较好地解决小样本、非线性、高维数、局部极小点等实际问题。还克服了如神经网络等一般机器学习中存在的过学习,局部优化和样本数量过多等诸多问题6。对于支持向量机的改进优化主要表现在对于支持向量机参数优化和选取,如核函数选取及其参数优化,惩罚因子的优化,目前参数优化有:基于粒子群优化算法的支持向量机参数选择,该方法在提出了以最小化交叉验证误差为目标粒子群优化(PSO)算法为寻优技巧的SVM参数调整方法7。基于遗传算法的支持向量回归机参数选取,该方法提出了基于遗传算法的SVR参数自动确定方法。分析了SVR各参数对其性能的影响,根据已有的样本集确定遗传算法的搜索区间,然后在该区间内对搜索的参数进行最优选取。为了减少所选参数对训练样本的依赖性,借鉴交叉验证的方法,把训练集分为估计子集,用来选择模型;确认子集选择参数,以推广能力最好的一组参数作为最终参数8。目前支持向量机在GPS高程转化中的应用是一个研究热点。由于它的对于样本数量上的要求不高。越来越多的学者正在进行研究,对于核函数、参数的选取是一个重点。参数选择决定了GPS高程转化的精度和速度。1.3 研究内容对GPS高程转换研究现状和发展进行研究,GPS高程转换原理进行研究,对常用高程转换方法进行研究通过实验分析其相对优劣性,分析支持向量机参数对你和拟合精度影响,通过实验总结出参数和样本对拟合精度的影响规律,通过对差分算法和遗传算法研究,分析参数优化的流程,最后通过MATLAB验证支持向量机的可靠性。主要分为以下几点:1)对GPS国内外研究现状及发展、支持向量机方法应用、相对其他拟合方法的优势及对支持向量机的改进进行综述。2)介绍GPS高程测量原理。介绍常用的高程系统以及各高程系统之间的关系,对常用拟合方法进行分析研究并进行实验对比。分析各种方法优劣型。3)针对支持向量机的精度受参数影响,通过实验分析样本数据分布、惩罚参数、核函数和样本数据个数对于支持向量机高程转换的影响。并通过对实验结果进行分析,总结参数和样本对精度影响规律。4)对遗传算法和差分算法原理和算法进行分析研究,分析遗传算法应用于SVM参数优化和基于DE算法的SVM参数优化选择。并进行MATLAB编程,程序主要实现拟合方法选取、支持向量机参数选取、支持向量机参数算法优化并通过绘图直观的显示实验结果。第二章 GPS高程转换原理2.1 GPS高程测量基本原理GPS高程测量是利用全球定位系统(GPS)测量技术直接测定地面点的大地高,或间接确定地面点的正常高的方法。在用GPS测量技术间接确定地面点的正常高时,当直接测得测区内所有GPS点的大地高后,再在测区内选择数量和位置均能满足高程拟合需要的若干GPS点,用水准测量方法测取其正常高,并计算所有GPS点的大地高与正常高之差(高程异常),以此为基础利用平面或曲面拟合的方法进行高程拟合,即可获得测区内其他GPS点的正常高9。此法精度已达到厘米级,应用越来越广。PABCHgHhgHHrHr3地表面似大地水准面大地水准面参考椭球面HHrPHAhgBC图2-1大地高、正高、正常高关系大地高的概念:由地面点沿通过该点的椭球面法线,到参考椭球面的距离,通常以表示。GPS定位测量获得的是WGS-84椭球空间直角坐标系中的成果,其中的高程值是地面点相对于WGS-84椭球的大地高10。正高系统是以大地水准面为基准面的高程系统,地面某点P的正高Hg定义为由地面点P沿垂线方向至大地水准面的距离。大地水准面是一族重力等位面(水准面)中的一个,由于水准面之间不平行,所以,过一点并与水准面相垂直的铅垂直线,实际上是一条曲线,正高的计算公式为: (2-1)式中,是地面点至大地水准面之间的位能差,为由地面点沿垂线方向至大地水准面的平均重力加速度。由于无法直接测定,所以严格的讲,正高是不能精确确定的。由于正高是以大地水准面为基准面,具有非常重要的物理意义,所以它在水利建设、管道和隧道建设等精密工程技术方面有着广泛的应用。若以表示大地水准面和椭球面之间的差距,则正高与大地高的关系按如下公式可得: (2-2)由于无法直接测定,导致正高无法严格确定。为了方便使用,根据前苏联大地测量学学者莫洛金斯基的理论,建立了正常高系统。其公式为:任意点处的大地水准面与椭球面的差值称为高程异常,正常高与大地高的转换关系为: (2-3)其中z为似大地水准面的高程异常。 (2-4)2.2 常用高程转换方法2.2.1绘等值线图法绘等值线图法是最早的一种高程转换方法,设在某一测区,一共有m个GPS点,通过集合水准联测获得其中n个点的正常高,通过GPS测量获得的GPS点的大地高,求出这n个已知点的高程异常。接着选取合适的比例尺,根据这n个已知点的平面坐标,将这n个已知点展绘在图纸上,并将相应的高程异常值标注在图上,再用15cm的等高距,绘出该区域的高程异常图。在高程异常图上内插出未联测几何水准的个点的高程异常,然后再结合GPS测量获得的大地高计算出这些待求点的正常高。该方法求取高程异常的精度取决于等值线图与内插的精度。2.2.2曲线拟合法当测区GPS点按线状布设时,同时在认定沿线似大地水准面为一条连续光滑的曲线的前提下,可用曲线内插法,来求取未知点的正常高。曲线拟合原理是,根据GPS控制点的平面坐标x及其高程异常,通过构造一个插值函数拟合出测线方向的似大地水准面曲线,在内插出待求点的高程异常,进而可以求出待定点的正常高。多项式曲线拟合若将坐标系转换成与测线x方向重合,与测线y方向垂直,则设高程异常值和坐标间存在函数关系: (2-5)已知点的高程异常和拟合得到的高程异常之差:;根据最小二乘原理,在条件下求解各参数,然后利用上式求出各店高程异常,从而求出各点的正常高。三次样条曲线拟合法当测线长已知点多,变化大是,在条件下解各误差会增大,故通常总采取分段计算。这样使曲线在分段点上不连续,也影响拟合经度。采用三次样条法来拟合。三次样条曲线实际上是由一段一段的三次多项式曲线拼接而成的连续曲线。在连接点处,不仅函数自身是连续的,而且其一阶导数和二阶导数也是连续的。这样既保留了多项式在表达上的简便性,又克服了单个多项式不灵活、不稳定的缺点,且计算较简单,故在长测线似大地水准面拟合中得到了应用。设过n个已知点,和(或或拟合坐标)在区间()上有三次样条函数关系 (2-6)式中为待定点坐标,为待求点两端已知点的坐标。其中为一阶差商。;为二阶差商,。满足系数矩阵为对称三角阵的线性方程组 (2-7)用追赶法解方程组,可求出和,而 (2-8)一般采用下式来拟合:(2-9)式中,。待定参数同样可由对称三角阵的线性方程组解得。2.2.3曲面拟合法当GPS点布设成一定区域面时,在GPS网中联测一些水准点,然后利用这些点上的正高和大地高求出它们的高程异常值,再根据这些点上的高程异常值与坐标的关系,用最小二乘的方法拟合出测区的似大地水准面,利用拟合出的似大地水准面,内插出其他GPS点的高程异常,从而求出各个未知点的正常高。多项式曲面拟合多项式拟合是在拟合区内的水准重合点之间,按削高补低的原则平滑出一个曲面来代表拟合区域的似大地水准面,供内插使用。采用此种方法拟合似大地水准面,拟合范围越大,高程异常的变化越复杂,削高补低的误差也越大。同时,随着多项式阶次的增高,拟合出的曲面的震荡增大设测站点的高程异常与点的平面坐标间存在以下函数关系 (2-10)式中,为高程异常为的趋势值,为误差,选用空间曲面函数 (2-11)式中,为待定参数,于是有 (2-12)当已知点个数大于等于参数个数,在条件下求出各参数,然后可以求出测区内任意点的高程异常值。对于多项式曲面拟合模型并非阶数越高精度就越高,即多项式曲面拟合并非随着阶数的增加而无限逼近局部似大地水准面,反而会随着阶次的增高,拟合出的曲面的震荡增大,一般选阶数为2或3比较合适。平面拟合在小范围的平坦或低丘地区。可以认为似大地水准面趋近于平面。这样就可以用一个平面函数来近似拟合出似大地水准面,进而求出待定点的正常高。将似大地水准面模型表示为 (2-13)式中,分别为点的纵横坐标。此时要求公共点至少3个,当公共点数目大于3个时,可以写成矩阵形式 (2-14)式中 (2-15)根据最小二乘法原理可求得拟合系数 (2-16)从而求出待求点的高程异常。二次曲面拟合二次曲面拟合法的数学模型为 (2-17)式中,分别为点的纵横坐标,为拟合系数二次曲面方程有6个待定系数。因此至少需要6个已知点才能计算,若测区内已知点的个数为6个,可以求出多项式的系数,若测区内的已知点的个数大于6个,多项式系数可以由这些已知点通过最小二乘原理求得假设已知点点数为n,可列误差方程 (2-18)表示成误差方程形式 (2-19)式中 由最小二乘原理,得到解、 (2-20)式中,改正数向量;为高程异常值向量;为拟合系数向量;为系数矩阵。由此得到似大地水准面二次曲面拟合模型。求得后,即可根据点位的平面坐标计算出待求点的高程异常,在利用GPS观测值求得的大地高减去求出的高程异常得到正常高。2.2.4 支持向量机在19921995年提出的支持向量机以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。SVM的理论基础就是统计学习理论支持向量机( SVM) 是一种基于统计学习理论的机器学习算法,采用SRM 准则,在最小化样本点误差的同时缩小模型泛化误差的上界,从而提高模型的泛化能力14。在函数拟合问题中,对于数据集,如果用线性函数来拟合,拟合精度为,引入松弛因子和根据SRM准则,拟合函数应使(2-21)最小( 0为惩罚因子),同时要满足(2-22) (2-21)。 (2-22)采用Lagrange优化方法可以得到该优化目标对偶问题,则在条件 (2-23)对Lagrange 因子 , 最大化目标函数 (2-24)回归函数为 (2-25)这里,只有小部分不为0,它们对应的样本就是支持向量,在样本集中剔除非支持向量重新拟合,拟合结果应不变。对于非线性函数拟合,采用适当的内积函数 就可以实现某一非线性变换后的线性逼近。此时拟合函数变为 (2-26)SVM 中不同的内积核函数将形成不同的算法,目前常用的核函数主要有多项式核函数、径向基函数(RBF)和Sigmoid核函数等。在数据拟合前数据归一化处理,这由于数据数值较大容易造成结算复杂,训练时间长,对拟合结果造成巨大影响,通过数据归一化处理可以避免上述问题15。 (2-27)上式中是归一化变量,是样本最大值,是样本最小值。2.3精度拟合精度评定为了能客观地评定GPS水准计算的精度,采用内符合精度和外符合精度检核,内符合精度表明的是结点与所选模型的符合程度,而外符合精度表示的是检核点与所选模型的符合程度。1)内符合精度根据参与拟合计算已知点高程异常值i与计算后得到的高程异常值,用Vi=i求拟合残差,按下式计算GPS水准拟合的内符合精度: (2-28)式中为参参与计算的已知点个数。2)外符合精度根据参与检核点的高程异常值与计算后得到的高程异常值,用求拟合残差,按下式计算GPS水准的外符合精度: (2-27)式中为参与检核点的个数3 GPS水准精度评定内符合精度和外符合精度是绝对精度评定的方法,相对精度的评定为根据检核点至已知点的距离L(km),按几何水准限差计算检核点拟合残差的限值,将残差与限值比较,评定GPS水准的精度。表2-1GPS水准限差等级允许残差(mm)三等几何水准测量四等几何水准测量普通几何水准测量2.4 实验对比某GPS控制网联测了20个水准高程点,点均匀分布在测区。各点坐标、大地高、正常高、高程异常如表点号X/mY/m大地高/m水准高/m高程异常/m14810368.432515025.6861028.0911162.130134.03924809797.323515217.801969.3561103.395134.03934809311.668515239.028911.7931045.845134.05244808523.766515001.742887.9141021.961134.04754808203.308515234.394940.4321074.469134.03764808826.717515535.605912.7071046.740134.03374808523.624515845.168947.7321081.732134.00084809487.071515537.147949.4891083.513134.02494809795.127515873.663912.4331046.464134.031104810039.985515539.111950.5491084.579134.030114810367.905515850.058962.3431096.365134.022124809798.359515056.806976.5731110.614134.041134809014.165515228.382888.3331022.384134.051144808299.962515535.418948.1811082.199134.018154808523.755515565.976929.0871063.109134.022164809066.191515719.601875.6081009.647134.039174809796.463515538.266943.5091077.542134.033184810121.176515240.1161007.0221141.054134.032194810368.383515240.0431011.5111145.546134.035204810368.461515530.071959.6491093.678134.029点位分布如图图2-2点位分布 选取11个分布均匀的点作为学习样本点,9个作为检核点(实心点为检核点,空心点为样本点)。采用支持向量机、多项式拟合、二次曲面、平面拟合结果如下表2-2拟合方法精度对比单位(mm)拟合方法内符合精度外符合精度残差最大值残差最小值支持向量机7.76.814.90.7多项式拟合8.59.219.10.7二次曲面5.67.116.70.2平面拟合8.79.417.10.7图2-3几种方法拟合残差图通过对表2-2和图2-3分析可以得到,支持向量机在本实验中其内符合精度较高。外符合精度和残差最大值是几种拟合方法中较小的。残差最小值和其他方法精度相差无几并且残差变化平缓。由于本实验样本点分布均匀。三次样条曲线不参加实验。通过对实验结果的分析发现支持向量机方法在高程转换中具有明显的优势。由于支持向量机有解决小样本、非线性、高维数、局部极小点等实际问题的特点,我们将进一步对支持向量机进一步研究。2.5 本章小结本章首先介绍了了GPS高程测量基本原理,常用的高程系统和各高程系统之间的关系。重点是对常用的高程转换方法支持向量机,多项式拟合,二次曲面,平面拟合的原理和数学模型进行了研究。通过对比试验发现了支持向量机方法在的精度对比其他拟合方法具有一定优越性。由于支持向量机具有解决小样本的实际问题,可以充分的解放人力物力,所以接下来要对支持向量机在高程转换中的精度进行进一步研究,探讨参数和样本对于支持向量机的精度影响。第三章 支持向量机参数影响分析和选取实验3.1 支持向量机参数影响分析支持向量机具有参数少的优点,只有核函数和惩罚因子选取,核函数反映了训练数据集的特性,影响系统泛化能力。惩罚因子是调节学习机经验风险比例,学习机的置信范围。以达到更好的推广能力16。GPS高程转换效果受支持向量机参数影响分为几个部分:1) 核函数的影响。2) 惩罚参数的影响。3)训练样本分布的影响。4)训练样本数的影响。接下来将对上述几种对支持向量机高程拟合精度存在影响的因素进行研究。通过实验对比,对实验结果进行分析以求得到对于支持向量机高程拟合参数和样本的选取方法。3.2 参数选取实验3.2.1 核函数实验核函数是支持向量机的重要组成部分,核函数决定了支持向量机的特征空间结构,不同的核函数对于高程拟合的精度有着重要的影响。常用核函数有四种17:1)多项式核函数 (3-1)其中为待定参数2) 径向基函数(RBF函数) (3-2)其中为核函数宽度,为待定参数3) 线性核函数 (3-3)4) Sigmoid核函数 (3-4)其中,c和v为待定参数为了研究核函数对高程拟合的影响,分别采用线性核函数,多项式核函数,线性核函数,径向基核函数和sigmoid核函数对第二章实例进行高程拟合,结果如下表3-1表3-1不同核函数拟合精度(mm)核函数拟合点检核点最大误差最小误差内符合精度最大误差最小误差外符合精度多项式核函数1838.8634220.81线性核函数2319.671418.85径向基核函数1305.75904.87sigmoid核函数30515.7720310.33对表3-1拟合结果进行分析,得到结果为支持向量机的核函数不同结果亦不同。本实验中选取径向基函数的支持向量机比选取其他核函数拟合精度高,高斯函数具有很多优良的性态。广泛应用于模式识别、神经网络中都取得了良好效果。RBF函数可以将样本非线性的规划到更高维的空间中,并且RBF核函数的参数选择的限制条件较少。综上所述RBF核函数具有更好的适用性。3.2.2 惩罚因子c实验惩罚因子是调节学习机经验风险比例,学习机的置信范围。以达到更好的推广能力。研究惩罚因子对支持向量机的影响,对第二章实验取不同的惩罚因子进行高程拟合。实验结果见表3-2表3-2惩罚因子取值对高程拟合影响(mm)惩罚因子拟合点检核点最大误差最小误差内符合精度最大误差最小误差外符合精度0.145431.23551345.45123011.291308.54101508.641417.611001046.581506.8410001305.411405.97100001305.291115.861000001305.66804.961000000401530.1356833.41通过对表3-2进行分析研究,得到惩罚因子增大高程拟合的精度会提高,同时在一定范围内会对高程拟合精度影响保持不变,但是当惩罚因子增大到一定数值后,继续增大对高程拟合的精度不会提高,而且会迅速变小。以上结论对惩罚因子选取提供了指导意义。3.2.3 样本分布实验样本分布对于支持向量机高程转换有着重要影响,本文通过实验分析样本分布对于精度的影响。在第二章实验中,均匀分布的样本点为11个时,支持向量机对比其他高程拟合方法外符合精度最高,本实验现选取11个样本点,分布情况分为点位均匀分布、点位不均与分布、点位在外围分布。点位构成见表3-3,表3-3样本分布构成点位分布样本点号点位均匀分布1、3、4、5、6、7、8、10、11、12、20点位不均与分布1、3、4、5、6、7、9、12、14、19、20点位在外围分布1、2、3、4、5、7、9、11、14、16、20样本分布不同得到的结果及精度见表3-4表3-4样本点拟合结果点位均匀分布点位不均与分布点位在外围分布点号残差(m)点号残差(m)点号残差(m)10.005210.00210.005630.00423-0.005320.008540.00484-0.00773-0.00385-0.00115-0.01494-0.00636-0.00896-0.00245-0.00957-0.00457-0.010870.01278-0.0129-0.00489-0.006110-0.0066120.000411-0.005711-0.00814-0.0109140.0098120.00719-0.0019160.008620-0.011220-0.005920-0.0042内符合精度7.7(mm)内符合精度8.2(mm)内符合精度7.9(mm)表3-5检核点拟合结果点位均匀分布点位不均与分布点位在外围分布点号残差(m)点号残差(m)点号残差(m)2-0.00392-0.00866-0.00039-0.00158-0.00028-0.021213-0.014910-0.008310-0.004914-0.010511-0.02212-0.0002150.005913-0.0132130.004616-0.002615-0.0132150.006917-0.0036160.003917-0.0213180.000717-0.012118-0.01519-0.003718-0.0118190.0169外符合精度6.8(mm)外符合精度12.9(mm)外符合精度11.9(mm)图3-1样本点残差图图3-2检核点残差图 通过对表3-4、表3-5、图3-1、图3-2进行分析可以得到:当样本点均匀分布时内符合精度和外符合精度都是最高,同时残差变化平稳。当样本点位在外围分布时精度较均匀分布较低,样本点位不均与分布的拟合精度最低。实验结果表明,支持向量机高程拟合中的精度受样本点分布的影响。当样本点均匀分布时拟合精度最高,残差变化较平稳。所以在支持向量机高程拟合选取样本点时要在整个测区中均匀的选取样本点。3.2.4 样本数量实验样本数量对支持向量机拟合结果有着影响,下面我们将要通过实验总结样本数量对拟合结果影响的规律。支持向量机高程拟合方法需要选取一定数量的样本点。现在选取5个、7个、9个、11个已知点作为样本点。要求在选取时样本点均匀分布,已消除点位不均匀分布对支持向量机高程拟合法精度的影响。经过实验,对比实验结果。研究样本数量对于精度的影响。样本构成见表3-6表3-6样本构成序号学习样本点个数学习样本点号工作样本集个数151、5、7、8、1115271、4、5、7、8、10、1113391、3、4、5、7、8、9、10、11114111、2、3、4、5、6、7、8、9、10、119不同样本数量拟合结果见表3-7表3-7不同样本数量拟合结果序号学习样本数内符合精度(mm)外符合精度(mm)156.112.0276.310.4397.27.74117.76.8图3-3不同样本数残差图通过分析表3-7和图3-3实验结果可知:支持向量机在GPS高程拟合时,选取样本点数量不同对于拟合精度存在重要影响。当样本数量增加,检核精度随之提高,残差曲线平稳。证明支持向量机的推广能力随着样本数量增加而增加。当学习样本数量较少时,支持向量机的外符合精度精度也是相对很高的。证明了支持向量机在小样本情况下较其他方法的优越性。这一特性对于工程建设中因点位不足无法使用其他方法具有重要实际意义。 3.3 本章小结本章对支持向量机的核函数、惩罚因子、样本分布、样本数量对于支持向量机高程拟合精度的影响进行研究。通过实验表明核函数、惩罚因子、样本分布、样本数量对支持向量机高程拟合的精度存在影响,为参数选取和样本选择提供了方法。第四章 支持向量机参数寻优方法4.1 支持向量机参数寻优方法对于支持向量机参数寻优方法采用遗传算法和差分进化算法进行参数优化寻优。4.1.1 基本原理1)遗传算法遗传算法(Genetic Algorithm)是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法,它是有美国Michigan大学J.Holland教授于1975年首先提出来的,并出版了颇有影响的专著Adaptation in Natural and Artificial Systems,GA这个名称才逐渐为人所知,J.Holland教授所提出的GA通常为简单遗传算法18。遗传算法是从代表问题可能潜在的解集的一个种群开始的,而一个种群则由经过基因编码的一定数目的个体组成。每个个体实际上是染色体带有特征的实体。染色体作为遗传物质的主要载体,即多个基因的集合,其内部表现(即基因型)是某种基因组合,它决定了个体的形状的外部表现,如黑头发的特征是由染色体中控制这一特征的某种基因组合决定的。因此,在一开始需要实现从表现型到基因型的映射即编码工作。由于仿照基因编码的工作很复杂,我们往往进行简化,如二进制编码,初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代演化产生出越来越好的近似解,在每一代,根据问题域中个体的适应度大小选择个体,并借助于自然遗传学的遗传算子进行组合交叉和变异,产生出代表新的解集的种群。这个过程将导致种群像自然进化一样的后生代种群比前代更加适应于环境,末代种群中的最优个体经过解码,可以作为问题近似最优解。遗传算法的基本算法 遗传算法是基于生物学的,理解或编程都不太难。下面是遗传算法的一般算法:a.创建一个随机的初始状态初始种群是从解中随机选择出来的,将这些解比喻为染色体或基因,该种群被称为第一代,这和符号人工智能系统的情况不一样,在问题的初始状态已经给定了。b.评估适应度对每一个解(染色体)指定一个适应度的值,根据问题求解的实际接近程度来指定(以便逼近求解问题的答案)。不要把这些“解”与问题的“答案”混为一谈,可以把它理解成为要得到答案,系统可能需要利用的那些特性。c.繁殖(包括子代突变)带有较高适应度值的那些染色体更可能产生后代(后代产生后也将发生突变)。后代是父母的产物,他们由来自父母的基因结合而成,这个过程被称为“杂交”。d.下一代如果新的一代包含一个解,能产生一个充分接近或等于期望答案的输出,那么问题就已经解决了。如果情况并非如此,新的一代将重复他们父母所进行的繁衍过程,一代一代演化下去,直到达到期望的解为止。e.并行计算非常容易将遗传算法用到并行计算和群集环境中。一种方法是直接把每个节点当成一个并行的种群看待。然后有机体根据不同的繁殖方法从一个节点迁移到另一个节点。另一种方法是“农场主/劳工”体系结构,指定一个节点为“农场主”节点,负责选择有机体和分派适应度的值,另外的节点作为“劳工”节点,负责重新组合、变异和适应度函数的评估。2) 差分进化算法差分进化( Differential Evolution, 简称DE )算法作为一种较新的全局搜索算法,以其收敛性好,概念简明,易于理解,原理简单,受控参数少,为解决复杂的全局优化问题提供了一种新的解决方案。本质上说,它是一种基于实数编码的具有保优思想的贪婪遗传算法。同遗传算法一样,差分进化算法包含变异和交叉操作,但同时相较于遗传算法的选择操作,差分进化算法采用一对一的淘汰机制来更新种群。由于差分进化算法在连续域优化问题的优势已获得广泛应用,并引发进化算法研究领域的热潮。 差分进化算法由STROM以及PRICE 提出,算法的原理采用对个体进行方向扰动,以达到对个体的函数值进行下降的目的,同其他进化算法一样,差分进化算法不利用函数的梯度信息,因此对函数的可导性甚至连续性没有要求,适用性很强。同时,算法与粒子群优化有相通之处,但因为差分进化算法在一定程度上考虑了多变量间的相关性,因此相较于粒子群优化在变量耦合问题上有很大的优势基本DE算法 a.初始化。DE利用NP个维数为D的实数值参数向量作为每一代的种群,每个个体表示为: (4-1)式中:是个体在种群中的序列;G为进化代数;NP为种群规模,在最小化过程中NP保持不变。为了建立优化搜索的初始点,种群必须被初始化。通常寻找初始种群的一个方法是从给定边界约束内的值中随机选择。在DE研究中,一般假定对所有随机初始化种群均符合均匀概率分布19。设参数变量的界限为,则: (4-2)式中:在之间产生的均匀随机数。如果预先可以得到问题的初步解,初始种群也可以通过对初步解加入正态分布随机偏差来产生这样可以提高重建效果。b.变异。对于每个目标向量 ,基本DE算法的变异向量如下产生: (4-3)其中,随机选择的序号和互不相同,且和与目标向量序号i也应不同,所以须满足。变异算子是一个实常数因数,控制偏差变量的放大作用。 c.交叉。为了增加干扰参数向量的多样性,引入交叉操作。则试验向量变为: (4-4)式中,为产生0,1之间随机数发生器的第个估计值,为个随机选择的序列,用它来确保至少从获得一个参数;CR为交叉算子,取值范围为0,1。 d.选择。为决定试验向量是否会成为下一代中的成员,DE按照贪婪准则将试验向量与当前种群中的目标向量进行比较。如果目标函数要被最小化,那么具有较小目标函数值的向量将在下一代种群中赢得一席地位。下一代中的所有个体都比当前种群的对应个体更佳或者至少一样好。注意在DE选择程序中试验向量只与一个个体相比较而不是与现有种群中的所有个体相比较。 e.边界条件的处理。在有边界约束的问题中,确保产生新个体的参数值位于问题的可行域中是必要的,一个简单方法是将不符合边界约束的新个体用在可行域中随机产生的参数向量代替。 即:若或,那么: (4-5)另外一个方法是重新产生试验向量,然后进行交叉操作,直到产生的新个体满足边界约束为止,但这样做效率较低。 4.1.2 技术流程1) 遗传算法应用于SVM参数优化将遗传算法应用于SVM参数优化时, 首先确定各设计参数的取值范围, 算法的基本步骤如下。步骤1 迭代次数步骤2 随机选择实数编码的初始种群步骤3 针对中的个体训练SVM, 计算个体适应度函数值步骤4 若种群中最优个体所对应的适应度函数值满足要求或达到设定的迭代次数, 则转到步骤7步骤5 步骤6 应用选择、交叉以及变异算子产生新的种群,之后转到步骤3;步骤7 给出最佳的核参数p、E以及参数,并用其训练数据集以获得最佳回归模型。2) 基于DE算法的SVM参数优化选择选取高斯RBF 核函数作为SVM核函数。支持向量机的参数优化是指选择最优高斯核函数和惩罚参数,使得支持向量机具有最好的预测精度。为此定义目标函数,也即个体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论