应用GA-SVM的城市景观水体富营养化多光谱遥感监反演v1.doc_第1页
应用GA-SVM的城市景观水体富营养化多光谱遥感监反演v1.doc_第2页
应用GA-SVM的城市景观水体富营养化多光谱遥感监反演v1.doc_第3页
应用GA-SVM的城市景观水体富营养化多光谱遥感监反演v1.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用GA-SVM的城市景观水体富营养化多光谱遥感监测反演霍艾迪1王菊翠1 张学真1 (1长安大学环境科学与工程学院,陕西 西安 710018)摘 要: 建立了基于支持向量机的遥感水质参数反演模型。基于多光谱遥感数据和水质实地监测数据,以西安市景观水体为例进行了遥感反演,并与水质遥感反演的多元线性回归法、神经网络法和GA优选SVM参数法进行了分析比较。实验结果表明,在样本数目有限的情况下, 提出的GA-SVM方法的反演结果比神经网络和传统的多元回归方法模拟结果均好, 且神经网络方法比多元回归法结果稍好。SVM 具有强的非线性映射能力,适合小样本情况, 由GA实现了模型参数的自动优选, 使GA-SVM用于解决回归问题表现出优势。因此,将机器学习和全局优化智能计算方法引入, 使得GA-SVM为城市景观水体遥感监测提供了一种新方法, 取得了较好的反演结果。关键词: 支持向量机, 遗传算法, 水质参数, 遥感反演中图分类号: X832/TP79 文献标识码: AMultispectral Remote Sensing Inversion for City Landscape Water Eutrophication based on GA SVMAidi HUO1 Jucui WANG1 Xue-zhen ZHANG1(1 School of Environment Science and Engineering, Changan University, Xian 710054,China)Abstract: The paper establishes an model for Water Quality remote sensing Retrieving of the Urban Landscape Water based on Support Vector Machine (SVM). The model is experimented with monitoring water quality data and multispectral remote sensing data of Landscape Water in xian city, and is compared with water quality Retrieving methods of Multiple regression and BP neural network. The results demonstrate that GA- SVM (Genetic algorithm) method is better than the inversion results of the neural network and the traditional statistical regression method, and the method of multiple regression results better than a dollar regression results. SVM has strong nonlinear mapping ability, and SVM is suitable for the limited number of samples, model parameters has realized automatic optimization choice by GA, let GA - SVM show advantage to solve regression problems. The machine learning and global optimization intelligent computation methods is introduced, GA- SVM provides a new method for Remote Sensing Monitoring and Application of the Urban Landscape Water Eutrophication and has made the good inversion resultsKey words : SVM; Genetic algorithm; water quality; Remote sensing51 引言水体富营养化是指水中氮、磷浓度达到一定阈值,促使浮游性藻类大量繁殖、水色发暗、透明度降低、水体溶解氧下降、水质恶化、水体功能衰退的水环境污染现象1。常规的水体富营养化监测是通过采集水样、过滤、萃取以及分光光度计分析得出,这种方法耗时、耗力、耗钱,且只能了解监测断面上水体营养化状况,不能反映研究水体的整体分布状况。随着传感器空间分辨率和光谱分辨率的进一步提高,遥感技术日益成熟,将遥感技术应用于水质监测成为一大突破,利用遥感技术监测水质具有快速、简便、及时并能提供某个区域、整个水体乃至全国全球范围的整体状况的优点。在国内外遥感应用于水质监测已经取得了很大的成就。Wezernak等(1976) 2研究利用遥感数据建立富营养化评价指数,并讨论了多光谱遥感应用于内陆湖泊富营养评价的可能;Thiemann和Kaufmann(2000) 3利用多光谱传感器IRS.1c数据,针对德国梅克伦堡州湖泊群水体叶绿素a进行了反演,并结合卡尔森模型评价了该地区水体富营养化程度;国内王学军等(2000)4利用TM数据和有限的实地监测数据建立了太湖水质参数预测模型,并应用遥感技术对太湖流域水体富营养化发展趋势进行了预测;张海林等(2002) 5利用武汉东湖各子湖多年可靠的地面监测资料和1999年TM各波段的卫星遥感数据,建立了各子湖的营养状态指数与TM5图像上灰度值之间的线性关系模型,并运用该模型对武汉各主要湖泊进行了富营养化评价6。通过几十年的研究,国际学术界对以上问题,已有大量成果发表,但许多问题尚无定论,不少遥感反演模型之间尚无法连接与协调,模型之间的冲突也多有存在,故有赖于新方法的获得。本文突破传统的水质分析监测方法,将多光谱遥感技术应用于水体叶绿素a浓度等水体富营养化指标的监测,使富营养化程度的测定更加方便、快捷。通过利用一种新的机器学习法-支持向量机(GA-SVM, genetic algorithm- support vector machines)建立城市景观水体叶绿素a浓度与TM数据的反演模型,并将此模型应用扩展于更大区域,对不同空间尺度的水体富营养化程度进行评价,分析评价结果及其原因,并提出相应的防治措施。2 研究方法与数据2.1 研究区域概况本研究以西安市景观水体为实验区,研究对象为护城河、兴庆湖、曲江南湖、大峪水库、许家沟水库、东沟水库、汇流池,它们是西安市城区主要景观水体,具有旅游功能。其中护城河位于西安市中心,是古城堡防御体系的一个重要组成部分,形成于公元1370年,距今已经有600多年的历史;兴庆湖位于西安市东郊兴庆宫公园内,在唐朝时被誉为“龙池”,湖水曾经明净透亮,是唐玄宗与杨贵妃盛夏避暑之地;曲江湖位于西安市的东南角,是西安著名的历史遗迹;大峪水库建于大峪峪口处,位于诸葛镇大峪村,属沂河水系,这里的水质寒凉,适合养殖鳟鱼,当地也以盛产金樽和虹鳟而出名;许家沟水库位于西安市长安区引镇街办许家沟村,南依秦岭山脉,北距环山公路不足1公里,水库库容528图1 研究区域的水体分布图Figure 1 Distribution of the study area water万立方米,最大蓄水面积487亩,水库周围景色宜人,适宜旅游度假。如今部分景观水体出现了不同程度的富营养化现象,颜色泛绿,发出难闻的腥臭味,严重影响周边的自然环境和人居环境,丧失了水体的应有的景观功能。研究区水体分布图如图1所示。2.2 研究方法水体富营养化的常用研究方法有物理法、化学法和生物法等,本文采用物理分析法作为主要研究方法。ETM各波段之间的相关系数见表1。表1 ETM波段间的相关性Table 1 ETM inter-band correlation相关系数lnR1lnR2lnR3lnR4lnR5lnR6lnR7lnR11.00lnR20.871.00lnR30.880.881.00lnR40.120.180.221.00lnR50.200.020.440.901.00lnR60.710.500.690.380.681.00lnR70.230.060.450.890.980.711.00由表可知,相关系数普遍较低。这是由于研究水体多悬浮物,其高反射率可能掩盖了水体中的叶绿素a信息7,因此不适合选择单波段光谱反射率建立定量模型来估算叶绿素a浓度。这与以往针对内陆水体进行研究的结果相似8。表2为各波段光谱反射率与叶绿素a、透明度、TP相关系数。表2 波段与水质参数间的相关性The 2 correlation between Band and water quality parameters相关系数Ln(Chl-a)(mg/L)Ln(tp)(mg/L)Ln(SD)(m)Ln(Tn)(mg/l)lnR(1)0.67570.4840.608-0.5506lnR(2)0.26080.27620.0515-0.4168lnR(3)-0.3911-0.4389-0.53380.8243lnR(4)0.75330.24320.6794-0.5509lnR(5)0.23990.30340.7021-0.3027lnR(6)-0.3689-0.5024-0.50810.3854lnR(7)-0.2525-0.2428-0.74850.4133可见波段和波段间大多具有较强的相关性。Tp 和波段的相关性较低,其他3个水质参数和波段具有较好的相关性,特别是和可见光波段(R1、R2、R3)及红外波段(R4、R5、R7)。而热红外(R6)波段与各水质参数间的相关性最差。这表明某些波段值与水质参数的变化有较强的关联,据此可选择和各水质参数相关性做多元回归,考虑到综合各波段可以提供更多信息,也将基于全部7个波段实现多元回归。(1)多元线性回归法多元线性回归分析预测法是指通过对两上或两个以上的自变量与一个因变量的相关分析建立预测模型进行预测的方法。多元线性回归分析预测法根据多种评价指标确定水体的总体水质类别。(2)BP人工神经网络评价法采用二层结构的BP人工神经网络对15组训练样本进行训练。再对5组测试样本作分类测试( 其中: BP网络的初始值和阈值是由rand函数产生均匀分布随机矩阵来确定的。控制误差为0.001) 。(3)GA 优选SVM 参数法GA (Genetic algorithm)利用生物遗传学的观点, 结合了适者生存和随机信息交换的思想。通过自然选择、交换、变异等作用机制。实现种群的进化。在寻优过程中。GA在解空间随机产生多个起始点并同时开始搜索, 由适应度函数来指导搜索方向。是一种能够在复杂搜索空间快速寻求全局优化解的搜索技术。目前已在优化、机器学习和并行处理等领域得到越来越广泛的应用。SVM决策树通常与二叉树结合构成多类识别器。基于一对余类算法的SVM分类模型简单、有效,训练时间较短。本文采用基于一对余类算法的SVM分类模型。该模型是用支持向量机解决多类分类问题的最早的方法。对于k( k2)类SVM分类问题。构造k个两类分类器,自然地将k分类问题转化为k个两类SVM分类问题。第i个SVM分类问题是把第i类作为一类,其余k-1类视为另一类。图2 监测点位置的空间分布图Figure2 Monitoring point position of the spatial distributionSVM 模型参数的寻优是一个复杂的连续参数优化问题, 这里采用遗传算法来解决。GA 基于达尔文进化论适者生存的思想, 是一种能够在复杂的搜索空间并行快速寻求全局最优解的智能搜索技术9。算法通过编码来表示解(即模型参数), 初始随机产生多个解同时开始搜索,由适应度函数指导搜索方向, 通过自然选择、交换、变异等作用机制实现解的进化。算法根据适应度函数决定搜索的方向, 这里将适应度函数定义为: (1) (2)其中, 分别表示第个测试样本的实际值和预测值。可见平均绝对偏差MAD的值越小, 对应参数的适应度值就越大, 这些较优的参数被遗传到下一代的可能性也越大。2.3 遥感数据和实测数据样本包括20002011年间渭河陕西段的部分水质实地监测数据, 以及12幅TM遥感影像数据。考虑到城市景观水体的主要污染物为有机污染物, 结合获取数据的实际情况,选取4 种代表性的水质参数:叶绿素a(chl-a)、总磷(TP)、总氮(TN)和透明度(SD)进行研究。对遥感数据进行了预处理,包括传感器定标和几何校正。在护城河、兴庆湖、曲江南湖、大峪水库、许家沟水库、东沟水库、汇流池中采集水样(图2)并编号,分别编为sc1、sc2、sc3、sc4、sc5、sc6、sc7。当场记录下温度和ph值并进行GPS(精度3m左右)定位,然后通过记录的经纬度和TM图像进行叠加分析。水质采样使用标准采样器,约2.5L。每个采样位置选取6个采样点:从水面以下约50cm处采集水样,东南西北4个方位各1个点,湖中心取2个点,将6个点的水样混合,组成混合水样,重复5次,最后以5次的平均值作为该位置的实测值。每个水体取多个水样,经过充分混合后装在两个容器中,一个是用来测量chl-a,另一个是用来测量其余几个指标。采样时天气晴朗微风,水面基本平静,水样的COD浓度在采样后立即返回实验室测定,COD数据依据国标方法测得。3 结果与分析利用基于ETM所有7个波段建立多元SVM反演模型, 利用GA选择模型参数。由于样本数较少,采用K折交叉验证法:随机将样本分成7个互不相交的子集, 最后一个子集取7个样本, 轮流选择其中6个子集作为训练集, 剩余的1个子集做验证。SVM利用LIBSVM 库文件10构建,实验运行环境及平台采用Matlab7.0。采用统计回归方法(Zhou & Wang, 2008)、BP 神经网络(BP-ANN)方法建立了反演模型,并将其结果和GA-SVM 模型的结果进行比较。BP-ANN 模型的隐层神经元个数分别为3个、4个和5个,同样采用K折交叉验证法训练。表 3种方法对5个测试样本反演叶绿素a结果比较Table 3 The comparison results of the retrieved Chl-a formed by five test samples编号Chl-a实测值(mg/L)多元线性回归模型(mg/L)BP-ANN预测值(mg/L)GA-SVM 预测值(mg/L)Sc162.48675.74666.51261.735Sc229.729125.729138.66514.936Sc3106.431125.390130.77998.673Sc6197.418102.795140.632160.440Sc70.62816.5767.6329.157MAD31.35311.2309.533R20.6080.6870.977表4 3种方法对5个测试样本反演总氮结果比较Table 4 The comparison results of the retrieved Tn formed by five test samples编号Tn(mg/l)多元回归模型 (mg/l)BP-ANN预测值(mg/l)GA-SVM 预测值(mg/l)Sc11.0760.84951.48690.4261Sc20.3540.6040.97810.3797Sc30.9881.14611.12120.417Sc61.2340.78160.92710.3555Sc70.9120.99871.18310.912MAD3.1493.1912.811R20.8340.8200.932表5 3种方法对5个测试样本反演总磷结果比较Table 5 The comparison results of the retrieved Tp formed by five test samples编号Tp(mg/L)多元回归模型(mg/L)BP-ANN预测值(mg/L)GA-SVM 预测值(mg/L)Sc10.0350.25860.18580.0318Sc20.0090.03120.02530.0039Sc30.0310.0710.04390.0035Sc60.0610.02710.02150.0087Sc70.0140.04480.05410.014MAD0.4190.4110.375R20.8680.8860.938表6 3种方法对5个测试样本反演透明度结果比较Table 6 The comparison results of the retrieved SD formed by five test samples编号透明度SD(m)多元线性回归模型预测值(m)BP-ANN预测值(m)GA-SVM 预测值Sc11.450.72130.51091.2859Sc21.3231.09761.33651.4438Sc31.3240.95541.16030.6753Sc60.6511.33310.95370.2931Sc74.2684.074.18864.268MAD0.7170.7360.644R20.9400.9640.981采用MAD和相关系数R2来评价反演结果,表3表6给出了以上3种方法对5个样本进行预测的结果及MAD和R2值。结果表明,不论是BP-ANN 模型还是多元回归模型,GA-SVM 表现出了明显的优势, 采用平均绝对偏差指标评价时,GA-SVM 方法的反演结果大多好于(个别相当)其他2种模型;采用R2指标评价时,对这4种水质参数,GA-SVM模型得到的R2均大于0.9,而另2种方法不论是BP-ANN还是多元模型达不到这个水平,表明GA-SVM可以得到较准确的预测结果。GA-SVM和BP-ANN 是非线性模型,更适于这里复杂的非线性回归问题。从结果看,神经网络没有比统计回归更优越, 其主要原因在于这里的样本集小。若训练样本数太少(至少要达到网络连接边数),采用神经网络在理论上就存在不确定问题,得到的模型不可信。对于SVM 模型, 即使样本数少,但模型参数合适, 仍然有较好的预测精度。这里采用GA在参数空间进行全局搜索寻找最佳参数,取得了较好的结果,并且非线性映射的优势体现得很明显。4 结论和讨论以西安市城市景观水体为研究对象, 采用ETM遥感数据进行水质参数遥感反演。在方法上, 采用非线性的SVM建模, 得到的模型可以方便地实现隐式的非线性映射, 不需要大量的样本, 推广性好,此外模型在高维情况下不增加训练算法的复杂度,适合推广到高光谱遥感应用中。SVM 模型的参数选择影响到整个模型的性能,采用GA实现了SVM模型参数的自动全局优选。将提出的GA-SVM方法用于西安市城市景观水体水质参数反演取得了较好的预测结果, 研究结果表明:在西安市城市景观水体遥感反演方面,该方法较常用的统计回归和神经网络方法具有明显的优势, 为水质遥感监测提供了一种新方法。实验中的样本数量还偏少, 希望未来可以增加样本数量,以区分不同的季节, 做更多的时空分析及验证。本次研究用的遥感监测景观水体富营养化状况,存在一定的误差,导致误差的主要原因有:(1)地面的实测资料是多个采样点水质分析结果数据的平均值,与布点的方法及数量范围差异有关;(2)水体的遥感反演值是根据灰度平均值计算得到,而地面监测采用的是一些代表性的采样点数据,从而不可避免的会带来一些误差;(3)TM图像的获取时间与地面监测的时间有所出入,其结果必然会受到一定影响;(4)反映在TM影像上的地物信息比较多,泥沙、水生植物、等一定程度上对结果产生干扰;(5)水体的水深和底质等状况对结果也会存在一定的影响。致谢感谢长安大学大学生创新实验项目的资助;感谢长安大学环境科学与工程学院实验室谢娟老师在水质分析试验上的指导及郭冀峰等老师们在研究方案上的指导与协助。参考文献1 吴英豪,纪伟涛. 江西鄱阳湖国家级自然保护区研究.北京:中国林业出版社,20022 Wezernak C T,Tanis F J,Baiza C A. 1976. Trophic state analysis of inland lakes JRemote Sensing of Environment,5:147 1643 Thiemann S,Kaufmann H2000 Determination of chlorophyll content and trophic state of lakes using field spectrometer and IRS- 1C satellite data in th

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论