(控制理论与控制工程专业论文)基于神经网络和支持向量机的水华预测方法研究与应用.pdf_第1页
(控制理论与控制工程专业论文)基于神经网络和支持向量机的水华预测方法研究与应用.pdf_第2页
(控制理论与控制工程专业论文)基于神经网络和支持向量机的水华预测方法研究与应用.pdf_第3页
(控制理论与控制工程专业论文)基于神经网络和支持向量机的水华预测方法研究与应用.pdf_第4页
(控制理论与控制工程专业论文)基于神经网络和支持向量机的水华预测方法研究与应用.pdf_第5页
已阅读5页,还剩90页未读 继续免费阅读

(控制理论与控制工程专业论文)基于神经网络和支持向量机的水华预测方法研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

瑶参 北京工商大学硕士学位论文 摘要 水华的形成是水环境污染的典型问题,其中涉及到很多不确定的影响因素, 难以建立统一的数学模型对其进行有效的预测和分析。近年来,广大学者从机理 建模和智能预测两方面分别对水华预测方法进行研究,水华预测已成为水华研究 的重点之一。 本文针对水华预测难的问题,基于水华机理的特点,分别提出了基于e l m a n 神经网络的水华短期预测方法和基于最小二乘支持向量机的水华中期预测方法, 初步建立了比较完整的水华预测系统,为水华预测探索了新的智能化研究方法。 将该系统应用于北京市河湖水华预测,并使用软件混合编程,构筑系统的操作平 台,为北京市河湖水华的防治提供了全面实用的参考依据。 首先,基于水华暴发的机理,从实验和理论两方面综合研究水华预测模型的 输入输出变量。使用正交实验和粗糙集分别分析水华的主要影响因素,确定将 “总磷,总氮,水温,光照,溶解氧和前一时刻的c h l _ a 一作为模型的输入变量, c h l _ a 作为模型的输出变量。为水华预测方法的研究奠定了坚实的基础。 其次,针对水华机理中能量随时间积累的特点,提出基于反馈型e l m a n 神经 网络的水华短期预测方法,使用改进结构和算法的e l m a n 网络建立预测模型,选 择不同时间间隔训练和测试,并与常用的b p 网络模型进行对比,证明了e l m a n 模型水华短期预测的准确性。 针对水华暴发具有时间序列的特性,提出基于最小二乘支持向量机的水华中 期预测方法,最小二乘支持向量机是支持向量机的改进,研究最小二乘支持向量 机的算法及其参数的选择方法,并选取不同时间间隔进行预测,最后将支持向量 机与神经网络模型进行对比,证明了最小二乘支持向量机模型水华中期预测的有 效性。 最后,将e l m a n 短期预测方法和最小二乘支持向量机中期预测方法综合应用 于北京市河湖水华预测检验,证明了两种预测方法的有效性。根据北京市水文总 站实际需求,初步建立北京市水华预测系统。同时,使用m a t l a b 和v b 两种 软件的混合编程技术,搭建北京市水华预测系统的应用操作平台。 关键词:ei m a n 神经网络最小二乘支持向量机水华短期预测 中期预测混合编程 基于神经网络和支持向量机的水华预测方法研究与应用 a b s t r a c t w a t e rb l o o mi sat y p i c a lp r o b l e mo fe n v i r o n m e n tp o l l u t i o n i ti sd i f f i c u l tt o e s t a b l i s hac o m m o nm a t h e m a t i c a lm o d e lt op r e d i c ta n da n a l y s i sw a t e rb l o o m ,w h i c h i n v o l v e sl o t so fu n c e r t a i nf a c t o r s i nr e c e n ty e a r s ,p r e d i c t i n gm e t h o d so fw a t e rb l o o m a r es t u d i e dm a i n l yo nm e c h a n i s mo ri n t e l l i g e n tm o d e l i n g s p r e d i c t i o oo fw a t e rb l o o m h a sb e c o m eo n eo ft h ef o c u s e so fw a t e rb l o o m s t u d y a i m i n g a td i f f i c u l t i e so fw a t e rb l o o mp r e d i c t o n ,as h o r t t e r mp r e d i c t i n gm o d e lo f e l m a nn e u r a ln e t w o r ka n dam i d d l e - t e r mp r e d i c t i n gm o d e lo fl e a s ts q u a r e ss u p p o r t v e c t o rm a c h i n e ( t s s v m ) a r ep r e s e n t e db a s e do nm e c h a n i s m so fw a t e rb l o o m a p r i m a r i l yi n t e g r a t e ds y s t e mi se s t a b l i s h e da n da p p l i e dt op r e d i c tw a t e rb l o o mi n b e i j i n gl a k e s m i x e ds o f t w a r ep r o g r a m m i n gi sa d o p t e dt or e a l i z et h ep r e d i c t i o n s y s t e m , w h i c hc a np r o v i d eu s e f u la n dp r a c t i c a lr e f e r e n c ef o rp r e v e n t i o na n d m a n a g e m e n to fb e i j i n gla k e s f i r s t l y , i n p u ta n do u t p u tv a r i a b l e so fw a t e rb l o o mm o d e la r es t u d i e df r o mb o t h e x p e r i m e n t a la n dt h e o r e t i c a la s p e c t s c r o s s - c u tt e s ta n dr o u g hs e ta r eu s e dt o a n a l y z em a i nf a c t o r so fw a t e rb l o o m r e s u l t ss h o wt h a ti n p u ta n do u t p u tv a r i a b l e s i n c l u d es i xf a c t o r s :t 0 t a lp h o s p h o r u s ,t 0 t a ln i t r o g e n ,t e m p e r a t u r e ,t j g h t , d i s s o l v e d o x y g e na n dc h l o r o p h y l lj w h i c hi saf i r mb a s e m e n tf o rp r e d i c t i o nr e s e a r c ho fw a t e r b l o o m s e c o n d l y , s h o r t - t e r mp r e d i c t i n gm e t h o do fe l m a nn e u r a ln e t w o r ki sp u tf o r w a r d c o n s i d e r i n ge n e r g ya c c u m u l a t i o no fw a t e rb l o o mm e c h a n i s m e l m a nn e t w o r ki s i m p r o v e db o t ho ns t r u c t u r ea n da l g o r i t h m d i f f e r e n tt i m ei n t e r v a l sa r ec h o o s e dt o t r a i na n dt e s ti m p r o v e de l m a nm o d e l ,c o m p a r i n gw i t hb pn e t w o r km o d e l r e s u l t s s h o wt h a ti ti se f f f e c t i v ea n du s e f u lt ou s ee l m a nm o d e lt op r e d i c tw a t e rb l o o mi n s h o r t - t e r mp e r i o d t h i r d l y , m i d d l e - t e r mp r e d i c t i n gm e t h o do fl s s v mi sp r e s e n t e dc o n s i d e r i n g t i m e - s e r i e sc h a r a c t e r i s t i c so fw a t e rb l o o m l s s v mi m p r o v e ss v mo na l g o r i t h m s t h ea l g o r i t h m so fl s s v ma r es t u d i e d , a sw e l la st h em e t h o dt oc h o o s ei t sp a r a m e t e r s d i f f e r e n tt i m ei n t e r v a l sa r eu s e dt ot r a i na n d t e s tl s s v mm o d e l ,c o m p a r i n gw i t h i 参北京工商大学硕士学位论文 s v m ,n e u r a ln e t w o r km o d e l s r e s u l t sp r o v et h a ti ti se f f f e c t i v ea n du s e f u lt o u s e l s s v mm o d e lt op r e d i c tw a t e rb l o o mi nm i d d l e - t e r mp e d o d f i n a l l y , e l m a ns h o r t t e r mp r e d i c t i n gm e t h o da n dl s s v mm i d d l e - t e r mp r e d i c t i n g m e t h o da r ea p p l i e dt op r e d i c tw a t e rb l o o mo fb e i j i n gl a k e si n t e g r a t e d l y , a n dp r o v e n t ob ee f f e c t i v ea n du s e f u l p r e d i c t i o ns y s t e mo fb e i j i n gl a k e si sb u i l tp r i m a r i l y m a t l a ba n dv bm i x e dp r o g r a m m i n ga r ea d o p t e dt oe s t a b l i s ht h eo p e r a t i o n p l a t f o r mo ft h ep r e d i c t i o ns y s t e m k e yw o r d s :e l m a nn e u r a ln e t w o r k , l e a s ts q u a r e ss u p p o r tv e c t o rm a c h i n e ( 璐s 旧,w a t e rb l o o m ,s h o r t t e r mp r e d i c t i n g , m i d d l e - t e r mp r e d i c t i n g , m i x e d p r o g r a m m i n g m 北京工商大学学位论文原创性声明 本人郑重声明:所呈交的学位论文是本人在导师指导下进行的研究工作所 取得的研究成果。除了文中已经注明引用的内容外,论文中不包含其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体, 均已在文中以明确方式标明。本声明的法律后果完全由本人承担。 学位论文作者签名: 丕星! 熟 日期:年岁月衫日 北京工商大学学位论文授权使用声明 本人完全了解北京工商大学有关保留和使用学位论文的规定,即:研究生 在校攻读学位期间论文工作的知识产权单位属北京工商大学。学校有权保留并 向国家有关部门或机构送交论文的复印件和电子版,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以采用影印、缩印或其它复 制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 学位论文电子版同意提交后,可于口当年彤年口二年后在学校图 书馆网站上发布,供校内师生浏览。 学位论文作者签名:竖! 望望导师磊: 日期:舻陴多月妇 增北京工商大学硕士学位论文 第一章绪论 本章首先介绍了课题的来源、研究背景和意义;其次描述了水华的概念、水 华发生的影响因素,并详细分析了水华预测方法的研究及其现状;最后概述了本 文研究工作的主要内容。 1 1 课题的来源、研究背景和意义 本课题来源于北京市高校拔尖创新人才计划项目( 2 0 0 5 8 9 ) ,北京市教委科 技项目( 酬2 0 0 8 1 0 0 1 1 0 0 3 ) ,北京市水文总站科技攻关项目。 自古以来,河湖就是陆地生态系统的重要组成部分,人类文明大多起源于江 湖流域。然而,由于人类生存作息的长期影响,使得湖泊及流域系统不断发生着 巨大变化【。文献资料表明,亚太地区5 4 的湖泊富营养化,欧洲、非洲、北美 洲和南美洲的比例分别是5 3 、2 8 、4 8 和4 1 1 2 】;我国约有2 万多个湖泊, 其中6 5 已达富营养化标准【3 1 。 随着湖泊富营养化的加剧,湖泊发生水华现象也越来越普遍。在我国,早在 2 0 世纪6 0 年代太湖中已经发现有蓝藻水华出现i 钔。近年来,我国许多大型湖泊 如滇池、巢湖、洞庭湖、太湖、洪泽湖等皆暴发过严重的水华现象,导致湖泊周 围水域大面积水质恶化,生态环境遭到严重破坏,城市居民的生产、生活用水受 到较大影响。 首都北京是举世闻名的世界文化名城,北京的河湖水系是城市建设与生态发 展的重要载体,在城市现代化建设中发挥着举足轻重的作用。北京城市的绝大部 分湖泊与河道相同,具有滞、蓄、排、泻雨洪,工农业供水和城市景观的综合功 能。北京市长河水系中的“六海”:什刹海( 西海、后海、前海) 、北海、中海、 南海,被誉为北京的城市心脏,担负着供水、防洪和环境生态等多种功能,其水 质重要性不言而喻。可是从2 0 0 1 年开始,长河水系夏秋季都发生程度不同的蓝 藻水华,比较严重的是西海、后海、前海与北海入口,水面景观和水体功能都受 到不同程度的破坏,给首都的生态环境和声誉带来了不良影响【5 1 。随着2 0 0 8 年 北京奥运会的临近,北京城区河湖的水环境质量更加受到人们的关注。它不仅是 面向国内外的窗口,更是实现“绿色奥运”的目标之一,体现着这一座城市的经济 基于神经网络和支持向量机的水华预测方法研究与应用 发展和文明程度。因此,水华的防治已经成为北京市城市水污染治理的重点之一, 加强水环境治理已经成为北京市保持经济发展和国民建设的重要任务。但是,在 水华的防治工作中,水华预测却一直都是一个难点。例如,我国著名的太湖自 8 0 年代就开始投入大量的资金对其水华发生和治理进行研究,但2 0 0 7 年5 月, 太湖梅梁湾还是暴发了大规模的蓝藻水华。为什么准确预测水华的暴发不容易? 这是因为水华的发生机理非常复杂,影响因素很多,直接建立水华机理生态模型 进行预测比较困难。 本论文研究的实际意义在于:通过研究智能预测方法,借助计算机信息技术 建立水华智能预测模型,为北京市河湖水华的预测及进一步治理提供有效参考依 据,为全国河湖水华发生的准确预测探索一种新的思路。同时,本文的研究成果 也进一步拓宽了智能方法的应用领域,为智能技术的进一步发展产生积极的作 用。 1 2水华及其预测方法研究 1 2 1 水华的概念 水华,亦称水花( w a t e rb l o o m ,w a t e r - f l o w e r ) 通常是指淡水池塘、河流、 湖泊、水库等水体受到污染,氮、磷等营养物质大量增加,致使水体达到富营养 化或严重富营养化状态,在一定的温度、光照等条件下,某些藻类发生暴发性的 繁殖,引起明显的水色变化,并在水面形成或薄或厚的绿色或其他颜色的藻类的 漂浮物现象【6 】。那么,什么又叫做水体富营养化呢? 一般来说,水体富营养化是 指在人类活动影响下,氮、磷等营养物质大量进入水体,引起藻类及其它浮游生 物迅速繁殖( 例如:水华暴发) ,水体溶解氧量下降,水质恶化,鱼类及其它生 物大量死亡的水体污染现象。由此可见,水华是水体富营养化的一种特殊表现形 式。水华发生时水体必然已经达到富营养化,而富营养化时水体不一定会出现水 华,水华的出现是以水体富营养化为前提条件的。 水华现象已经成为世界性的水污染公害,它既是水污染的突出表现,同时它 又进一步加剧了水体污染。甚至有人将水华称作水体的癌症。水华的危害主要表 现在以下几个方面i 飞 傍北京工商大学硕士学位论文 影响供水水质并增加制水成本 对水生生态的影响 影响水体的溶解氧 向水体释放有毒物质 降低水体的透明度 散发出腥味异臭 影响饮用水源 影响水产养殖 影响旅游和航运 2 0 0 7 年太湖、巢湖和滇池蓝藻的大面积暴发直接导致了周围水域大面积水 质恶化,几十种水生高等植物濒危,严重污染了市民的饮水水源,影响了数以百 万居民生活饮用水的供给。河湖水华已经成为我国河湖水资源保护面临的一个重 大水环境问题。 1 2 2 水华的影响因素及特点 1 2 2 1 水华的影响因素 关于水华发生的临界因素和机理目前还不十分清楚,但有研究表明,水体中 氮磷含量、温度、微生物种类、光照条件以及风浪强度等均可以影响水华的发生。 水体富营养化的根本原因是营养物质的增加,一般认为主要是磷,其次是氮,可 能还有碳、微量元素或维生素等。按目前己有的研究结果,藻类水华暴发一般有 生物学机制和非生物学机制。生物学机制包括正常和非正常功能的内在因素以及 化学调节、生理需求、营养竞争、食物链的生态相关性:而非生物学因素包括物 理因素、化学因素的驱动作用以及抑制作用。应该说,水华是在人类活动的干扰 下,多种因素长期相互作用的结果。除了营养物质以外,其它影响因子还包括气 候因子( 如光照、温度和降水等) 、地理因子( 如湖库地质状况等) 和生物因子 ( 如鱼的种类和数量) 。水华就是由于这些因素的综合作用,以致湖泊、水库等 内陆水体失去原有的自然生态系统结构,破坏了水生生态系统的平衡。 下面,本文从化学因素、物理因素、生物因素三个方面对影响水华发生的因 基于神经网络和支持向量机的水华预测方法研究与应用 素进行具体分析。 ( 1 ) 化学因素 化学因素主要包括:营养元素氮、磷( n 、p ) ,p h 值,溶解氧( d 0 ) ,化 学需氧量( c o d ) ,电导率( e c ) 等。 1 ) 总氮、总磷( t n 、仰) 氮和磷是浮游植物生长所必需的营养元素,一般认为藻类生长的适宜浓度范 围是氮不低于0 1m g l ,磷不低于0 0 0 9m g l 。发生水华时的氮、磷浓度一般都 比较高,多在富营养化的水平( t n0 2m g l ,t p0 0 2r a g l 以上。 水体中氮磷的浓度比值和藻类的生长有着十分密切的关系,各国科学家分别 提出各自不同的研究结论。日本湖泊学家板本曾经指出,当湖水的总氮和总磷浓 度的比值在1 0 :1 2 5 :1 的范围时,藻类生长与氮、磷浓度存在着直线相关关 系。日本另一位湖泊学家合田建进而提出,湖水的总氮和总磷浓度的比值在1 2 - 1 1 3 :1 时,最适宜于藻类增殖。伴随着湖泊的富营养化,尤其是水体中磷浓 度的增加,通常会导致水体中浮游植物的种群组成朝着形成水华的蓝藻演剖剐, 水体中总氮总磷比也会显著影响着浮游植物的种群组成【们,通常当t n :t p 光照 总磷 总氮,则对藻类生长和繁殖的影响程度大小依次是水温 光照 总磷 总氮。 ( 2 ) 以藻类最大日增长率( 以叶绿素表示) 为结果进行分析 表2 4 藻类最大日增长率为结果联3 4 ) 正交实验极差分析 光照强度 i序号 水体温度( )t p ( m g t , )t n ( m g i , )g ( 1 d ) ( l n x ) 瑶参北京工商大学硕士学位论文 16 0 0 0 2 0 0 5 0 0 5 3 5 26 0 0 02 8 20 2 9 9 36 0 0 03 5 4 0 1 1 2 2 41 2 0 0 02 020 1 6 9 51 2 0 0 02 840 0 5 1 2 3 61 2 0 0 03 50 50 2 1 0 9 71 8 0 0 02 040 2 9 8 81 8 0 0 02 80 50 1 1 7 6 9 1 8 0 0 03 5 2 0 0 5 1 1 k l = k l 3 8 5 3 36 7 3 3 1 0 6 6 7 8 9 3 3 k 2 = k 2 3 1 0 0 3 31 3 2 6 79 2 6 71 0 2 k 3 = k 3 3 1 2 81 1 3 6 71 1 4 3 31 2 2 3 3 r 4 2 6 76 5 3 42 1 6 63 3 从表2 _ 4 中可以看出,四个因素的极差大小顺序与用藻类最大现存量作为结 果时是一致的,则对藻类生长和繁殖的影响程度大小依次也是水温 光照 总磷 总氮。 正交实验结论:水华的主要影响因素包括( 按影响程度从大到小排列) :水 温 光照 总磷 总氮。 2 一 使用粗糙集研究预测模型的输入输出变量 水华预测模型输入输出变量的选择不论是对于预测精度还是对于水华模型 的收敛性能、计算速度的影响都很大。粗糙集【孙3 7 1 ( r s :r o u g hs c t ) 理论是一种有 效的数据挖掘( d m ) 方法,特点是不需要预先给定属性的数量描述,能够直接从 给定的数据中提取出简洁易懂且有效的决策规则,本章引入粗糙集理论中的属性 约简算法来选择与预测量相关性大的参数作为预测因子( 预测模型的输入) ,充 分保证了预测模型输入参数的合理性。 基于神经网络和支持向量机的水华预测方法研究与应用 2 3 1粗糙集理论 2 3 1 1 粗糙集理论的概念 1 9 8 2 年z p a w l a k 发表了经典论文r o u g hs e t s 【强加】,简称r s ,宣告了粗糙 集理论的诞生。它是继概率论、模糊集、证据理论之后的又一个处理不确定知识 的数学工具,能有效地分析不精确、不一致、不完整等各种不完备的信息,还可 以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。 在粗糙集中,设给定知识库k 一,月) ,对于每个子集j u 和一个等价关 系r e i n d ( k ) ,当集合x 能表示成尺的基本集合的并集时,则称集合j 是可以 精确定义的;否则,可以根据尺的基本集合的描述来划分集合x : 墨( x ) 一u r e v r :y x ( 2 1 ) r ( y ) u r e vl r :y f l x 一爹 ( 2 2 ) 其中,垦( x ) 和r ( x ) 分别称为j 的尺下近似集和尺上近似集。墨( x ) 是根据已有 知识判断肯定属于x 的基本集合的并集;尺( x ) 是可能属于x 的基本集合的并 集。集合工的边界域定义为: b n ( x ) 一r ( x ) - g ( x ) ( 2 3 ) 粗糙集由此定义为: 当且仅当尺僻) - r 一) ,x 为r 可定义集; 当且仅当尺一( x ) 一r 一( x ) ,x 为r 粗糙集。 p o s ( x ) = 星( x ) ( 2 4 ) n e c ( x ) = u - 尺( x ) ( 2 5 ) 我们把p o s 置仁) 称为x 的尺正域;把n e g ( x ) 称为x 的尺负域。集合( 或 概念) 的不确定性是由边界的存在而引起的,边界域越大,概念的精度越低。如 图2 - 1 所示。 国 北京工商大学硕士学位论文 图2 - 1 粗糙集概念示意图 由等价关系尺定义的精确度为: c a r d r ( x ) - 一 c a r d r ( 2 - 6 ) 其中,c a r d 表示该集合的元素的数目,称为集合的基数或势,且x 一驴。精确度 ( x ) 表示我们的知识对于集合x 的完备程度。 2 3 1 2 决策表属性约简算法 决策表属性约简的过程,就是从决策表系统的条件属性中去掉不必要的( 对 取得决策不重要的) 的条件属性,从而分析所得约简中的条件属性对于决策属性 的贡献率的大小【嬲l 。 属性的重要度【4 1 l 在约简的过程中往往被作为启发规则,在该系统中这个属性 的“权重”越大即越重要。设s 为一决策表,c 、d 分别为条件属性集和决策属性 集,尺cc ,对于任意属性a e c r 的重要性定义如下: s g f ( a ,r ,d ) tk ( r u a t ,d ) 一k ( r ,d ) ( 2 。7 ) 其中,k ( r ,d ) - c a r d ( e o s r ( d ) ) c a r d ( p o s c p ”。 决策表属性约简算法的具体步骤如下所示: 已知:决策表s - 。其中【,论域,a c u d 是属性集合,c ,d 分别是条件和决策属性集。 基于神经网络和支持向量机的水华预测方法研究与应用 求出:该决策表的一个最小相对约简r e d d ( c ) 。 第1 步:求c 的d 核c o r e d ( c ) ,即相对核,记为r e d d ( c ) 亡= c o r e o ( c ) ,作 为属性约简的起点; 第2 步:构造另一个条件属性集合c ,使c 。 = c - r e d d ( c ) ; 第3 步:计算 作- ,0 ) - a 【) ,屿i c 帅,( d ) 一,峨( c ) p ) 】 + o 1 h ( d l r e d d ( c ) ) 一h ( dr e d d ( c ) u 口 ) 】 ( 2 8 ) 在c 。中找出使得c - ) ( 口) 取最大值的属性口; 第4 步:如果使墨峨i c - ) 0 ) 取最大值的属性多于一个,则从中选取一个与 r e d d ( c ) 的值的组合数最小的属性作为口; 第5 步: r e d d ( c ) 等蒯d ( c ) u 口) ,c - c 一伽 ; 第6 步:如果( c ) ( d ) - 1 ,则终止;否则转第3 步。 算法的第1 步求出属性的核,求核的具体算法可参考文献1 4 2 1 或其它相关文 献;第2 步至第5 步通过不断的迭代,每次迭代都选择在当前条件下被认为最理 想的属性,在搜索的属性集中将其剔除,约简了搜索的空间。最后,当 ,( c ) ( d ) - 1 时,即得出属性最小约简的结果。 2 3 2 粗糙集在确定水华预测模型输入输出变量中的应用 为了确定水华预测模型的输入输出变量,使用阳光房水华实验的监测数据进 行粗糙集分析。将阳光房2 0 0 7 年的监测数据作为论域u ;根据第一章水华机理 的介绍,将水华的众多影响因素作为条件属性集c = 【总氮,总磷,p h 值,溶解 氧,化学需氧量,电导率,水温,光照,透明度】- ,决策属性d = 叶绿素a 。 使用粗糙集属性约简的算法对水华的影响因素进行约简分析。其中,贡献率 9 0 为第一类,即非常重要的影响因素;9 0 贡献率 7 0 为第二类,即比 嚆参北京工商大学硕士学位论文 较重要的影响因素;贡献率 水温 光照,比较重要的影响因素包括( 按贡献率由大到小排列) :总氮 溶 解氧 化学需氧量。因此,通过粗糙集分析得出结论:水华的重要影响因素包括: 总磷 水温 光照 总氮 溶解氧 化学需氧量。 2 4本章小结 综合“粗糙集 和“正交实验一两种方法的分析结果得出:总磷,总氮,水 温,光照,溶解氧是水华发生的重要影响因素,作为水华预测模型的输入变量。 l 叶绿素a ( c h l a ) 是表征水体水华现象及其程度的最重要的指标之一,确定将 c h la 作为水华预测模型的输出变量。同时,考虑到水华机理能量积累的特性, 前一时段的c h la 可以作为预测后一时段c h la 的参考,所以将前一时段的c h la 也作为水华预测模型的输入变量。 综上所述,最终确定水华预测模型的输入输出变量如下所示: 模型输入变量:总磷,总氮,水温,光照,溶解氧,前一采样点的c h l 模型输出变量:_achla 基于神经网络和支持向量机的水华预测方法研究与应用 第三章基于人工神经网络的水华短期预测方法研究 及应用 本章主要研究反馈型人工神经网络的水华短期预测方法。使用改进后的 e l m a n 网络建立预测模型,选择不同时间间隔进行网络训练和测试,并与b p 模 型进行对比;研究结果表明:采用e l m a n 预测模型可以更精确地预测叶绿素的短 期变化规律,为水华的短期预测提供了一种有效的新方法将改进后的e l m a n 预 测模型应用于北京市河湖水华的短期预测进行检验,应用结果表明:e l m a n 网络 模型能够较为准确地预测北京市河湖水华的短期变化情况,为北京市河湖水华的 预防提供了实用的参考 3 1概述 人工神经网络( a r t i f i c i dn e u r a ln e t w o r l 【,a n n ) 是一种模拟人脑的神经网络 原理,能自适应地响应环境信息,自治地演化出运算能力的非程序化计算模式, 是近年发展中比较热门的新兴交叉科学。人工神经网络由具有非线形作用函数的 神经元构成、能进行大规模并行信息处理的,具有高度的非线性运算能力及很强 的容错能力。利用其可以很好地逼近非线性系统的特性,对历史曲线进行拟合, 并达到进一步预测的效果。 人工神经网络具有的显著特点: ( 1 ) 不依赖精确的数学模型,具有广泛的从输入到输出的任意非线性映射能 力。 ( 2 ) 分布式信息存储、大量数据单元同时高速并行处理,有很强的鲁棒性。 ( 3 ) 信息分布地存储于处理单元的阈值和它们的联结权中,具有很强的容错能 力,个别处理单元不正常不会引起整个系统出错。 ( 4 ) 应用多种调整权之和阈值的学习算法,具有类似人脑的学习( 自适应和自 组织) 功能。 正是因为人工神经网络具有以上的优势,适合解决许多非线性系统预测的实 际问题,所以它在诸多领域得到了广泛应用,且应用领域还在不断扩大。它不仅 瑶参北京工商大学硕士学位论文 可以广泛应用于工程、科学和数学领域,也可广泛应用于医学、商业、金融和交 通等领域。 随着人们对水华研究的不断深入,许多智能方法在水华方面得到了广泛的运 用;但是大部分的智能方法都用于对水体富营养化的评价,人工神经网络仍是水 华预测的主要方法之一,目前应用最多的是b p 神经网络 4 3 - 4 5 。但是水华机理研 究表明,水华的暴发与时间积累有密切联系。而b p 神经网络是一种静态的前馈 神经网络,在训练大样本数据时易陷入局部最小、函数逼近能力不足,用于时间 积累的水华预测建模,不可避免会影响到预测精度。e l m a n 网络具有内部反馈, 可以存储和利用过去时刻的输入输出信息,更加直接地反映系统的时间积累特性 【蛔。因此,本章重点研究基于e l m a n 网络的水华短期预测方法。 3 2b p 人工神经网络 3 2 1b p 网络结构 b p 网络是一种单向传递的多层前向网络,网络结构如图3 - 1 所示。网络由 输入节点,隐节点,输出节点三层组成,层与层之间全互联,同层节点之间没有 任何耦合。隐节点的激励函数一般采用s i g m o i d 函数,因为s i g m o i d 函数既具有 很好是线性区域,又具有很好的非线性区域,可以使得网络既能处理小信号又能 处理大信号。 误差反传( 学习算法) 一期 望 - 一 输 出 输入层 输h 屡 信号流 图3 - 1b p 网络结构图 b p 网络可以看作是一个从输入到输出的高度非线性映射,即f :r - - r 1 , f ( x ) y 。对于样本集合:输a x , ( 尺。) 和输出m ( r 啊) ,可认为存在某一映射 2 3 基于神经网络和支持向量机的水华预测方法研究与应用 g 使:g ( 乇) 一乃 i = 1 ,2 ,n ,神经网络通过对简单的非线性函数的多次复合, 可近似复杂的函数。 3 2 2 b p 网络的算法 b p 算法的基本思想是:学习过程由信号的正向传播和误差反向传播两个过 程组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出 层。若输出层的实际输出与期望输出不符,则转入误差的反向传播阶段。误差反 传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的 所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的 依据。这种信号正向传播与误差反向传播的各层权值调整过程是周而复始地进行 的【明。权值调整的过程,也是网络学习的过程,此过程一直持续到网络可接受的 误差为止。b p 算法是依据d e l t a 学习规则,建立在梯度下降法基础上的。b p 学 习算法具体如下所示: 1 输入训练样本对,计算各层输出 用当前的样本对工p 、d ,对向量数组zik ,j r 2 一气】,d - d ,d :4 】赋 值,一代表输入层神经元的个数,表示输出层神经元的个数,p 表示样本数。 隐层第j 个神经元的输出是: y j 一厂( 善峋) ( j = l ,2 m ) ( 3 - 1 ) 输出层第k 个神经元的输出是: q f ( 荟w j k y ,) ( 七= 1 , 2 f ) ( 3 - 2 ) 表示输入层神经元f 到隐层神经元之间的连接权值,w 肚表示隐层神经元,到 输出层神经元七之间的连接权值。胁代表隐层节点数。为便于计算,将隐层和输 出层神经元的阈值计算在,w 斥权值之中。 2 计算网络的输出误差 采用批训练方法训练网络,则总误差为: 静北京工商大学硕士学位论文 乓- 互1 未p 荟i ( d f 一衅) 3 计算各层误差信号 6 f 一( d t - o , x l - o k ) d k ( k - - 1 ,2 1 ) 6 ;l ( 荟6 ;w 肛) ( 1 一) ,) y ,( j = 1 , 2 - - m ) 4 调整各层权值 w 成一w 斥+ ,7 6 ;y j ( k = 1 , 2 l :j - - 0 ,1 ,2 m ) 一峋+ ,7 6 ;而( | = 1 ,2 m ;i - - 0 ,1 ,2 n ) 3 3e l m a n 人工神经网络 3 3 1e l m a n 网络结构 ( 3 3 ) ( 3 - 4 ) ( 3 5 ) ( 3 - 6 ) p 7 ) e l m a n 神经网络是e l m a n 于1 9 9 0 年首先针对语音处理问题而提出来的,它是 一种典型的递归网络。由于e l m a n 神经网络在处理贯序数据输入输出具有优越性, 得到了广泛的应用。e l m a n 网络一般分为4 层:输入层、隐层、关联层和输出层, 如图3 2 所示。 u 1 图3 2e l m a n 网络结构图 e l m a n 网络的特点是:在b p 网络的基础上增加了一个“关联层”,它用来保 存中间层单元前一时刻的输出状态,以表征对象的内部特征,可以认为是一个一 基于神经网络和支持向量机的水华预测方法研究与应用 步时延算子,从而达到记忆的目的。这个反馈连接由一组“连接”单元组成,用于 记忆隐层过去的状态并且在下一时刻连同网络输入一起作为隐层单元的输入,相 当于状态反馈。这一性质使得递归网络具有动态记忆功能和适应时变特性的能力, 能反映动态系统的时间积累特性,适合用来建立基于时间序列的预测模型。 3 3 2e l m a n 神经元及函数 e l m a n 网络的非线性状态空间表达式为【鹌1 : y ( k ) = g t 0 3 工伍) 1 z ( 七) 一, k ( 七) + 2 比( 七) 】) ( 七) - x ( k - 1 ) ( 3 - 8 ) ( 3 - 9 ) ( 3 - 1 0 ) 其中:y 、z 、m 、分别为m 维输出结点向量、n 维中间层结点单元向量、 r 维输入向量和n 维反馈状态向量;3 、2 、1 分别为隐层到输出层、输入层 到隐层、关联层到隐层的连接权值;g ( 石) 为输出神经元的传递函数,多取为线性 函数;,( z ) 为隐层神经元的传递函数,多采用s i g m 。i d 函数,即: 几) 。丽1 ( 3 1 1 ) 设第k 步系统的实际输出为y d ( 川,则e h 柚网络的目标函数即误差函数可表 示为: e ( 七) i 三( ) 。( 七) 一y ( 七) ) r ( 儿( 七) 一y ( 七) ) ( 3 1 2 ) 3 3 3e l m a n 网络的学习算法 将e ( 七) 对知1 ,埘2 ,幻3 分别求偏导,由梯度下降算癌可得e l l i l 觚网络的学习 算法: 2 6 鸯北京工商大学硕士学位论文 a t 0 3 - r l ,掣_ ( 七) ,ia 1 分,万 a m 2 = ,7 :影“。( 七- 1 ) ,一1 ,2 ,肛;留a1 2 ,x ( 3 - 1 3 ) ( 3 1 4 ) 耐茎( 卵四) 掣小垅朋m 扎厅 其中,叩1 ,r 2 ,73 为t o1 ,t o2 ,t o3 的学习步长, 掣- ( y 出( 七) 一y ( 七) ) , 6 7 。善( 纠) 岩形阱掣 3 3 4e l m a n 网络的改进 3 3 4 1e i m a n 网络结构的改进 ( 3 - 1 6 ) ( 3 - 1 7 ) ( 3 1 8 ) e l m a n 神经网络使用隐层到输入层的反馈来实现神经网络对其内部过去时 刻状态的记忆功能,但e l m a n 神经网络关联层输出的利用并不是很充分。可以通 过改进e l m a n 神经网络的结构使这种情况得到改善:增加从关联层到输出层的连 接权值。改进后的e l m a n 网络结构如图3 3 所示: 3 图3 - 3 改进后的e l m a n 网络结构图 改进后的e l m a n 网络结构与其基本结构不同之处在于增加了从关联层到输 出层的连接权值矿,从而使神经网络输出更充分的利用了网络内部的记忆功能, 而且实践表明改进的神经网络由于增加了权值t 0 4 ,从而增强了系统的动态性能, 基于神经网络和支持向量机的水华预测方法研究与应用 提高了网络在每次学习过程中的学习效率,从而加速了网络误差的学习收敛,比 基本e l m a n 网络使用更少的学习循环次数。而且在达到同样的收敛误差下,改进 的网络结构使用的隐含层神经元个数更少。改进后神经网络的状态方程如下: x ( 七+ 1 ) = ,( k ( 七) + 2 l ( 七+ 1 ) ) ( 3 1 9 ) y ( k + x ) - g ( a 0 4 工( 七) + ( 七+ 1 ) ) ( 3 - 2 0 ) 3 3 4 2e i r o n 学习算法的改进 由于e l m a n 网络是以b p 网络为基础建立起来的,因此e l m a n 网络可以参考 b p 网络的权值改进算法。其算法改进主要有启发式学习算法、优化算法两种途 径。启发式学习算法就是对于表现函数梯度加以分析,从而改进算法,主要为有动 量项和自适应学习率的梯度下降法( t r a i n g d x ) 。基于数值优化理论的训练算法主 要有:共轭梯度法( t r a i n c g f ) 和l e v e n b e r g _ m a r q u a r d t 方法( t r a i n l m ) 。 m a t l a b 是美国t h em a t h w o r k s 公司开发的一种用于科学计算和工程方面的 数值分析软件。m a t l a b6 5 提供的神经网络工具箱给出了很多经典的学习算法, 它能够快速实现对实际问题的建模求解。下面结合m a t l a b 环境给出几种改进 e l m a n 算法的实现方法。 ( 1 ) 有动量项和自适应学习率的梯度下降法( t r a i n g d x ) 它采用动量项和学习速率自适应调整的两种策略,加速了网络的收敛速度, 动量项法降低了误差曲面局部细节的敏感性,有效抑制了网络陷于局部最小,自 适应学习率有效地加速网络收敛速度,增加稳定性,提高速度和精度。调整原理 如下【4 9 】: 叩。,7 西( ;= ;丝 0 ) ( + 1 ) 1w a t ) + 山( f + 1 ) + ,7 蛳j 】f o ) ( 3 2 1 ) 其中巾 1 ,6 1 ,a ea o ) 一e ( f 一1 ) ,;表示动量项调整的系数,7 表示网络 学习速率。m a t l a b 中的t r a i n g d x 0 函数实现上述算法。与函数有关的训练参 数有: 鸯北京工商大学硕士学位论文 n e t t r a i n p a r a m g o a l n e t t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论