(环境工程专业论文)人工神经网络模型在黄河水质预测中的应用.pdf_第1页
(环境工程专业论文)人工神经网络模型在黄河水质预测中的应用.pdf_第2页
(环境工程专业论文)人工神经网络模型在黄河水质预测中的应用.pdf_第3页
(环境工程专业论文)人工神经网络模型在黄河水质预测中的应用.pdf_第4页
(环境工程专业论文)人工神经网络模型在黄河水质预测中的应用.pdf_第5页
已阅读5页,还剩86页未读 继续免费阅读

(环境工程专业论文)人工神经网络模型在黄河水质预测中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要本文以黄河中游渭河入黄口( 潼关) 至花园口段为研究区域,研究入河污染物( c o d c ,、氨氮) 在三门峡、小浪底、花园口各水质监测断面上的水质响应。由于黄河干流的水文及排污条件具有随机性,导致了水质预测模型输出的不确定性。文中采用人工神经网络方法,建立能够反映研究区域中,下游污染物各水质响应指标与影响它的上游各参量之间关系的水质模型,揭示上、下游主要水质要素问的客观规律,分析和验证该方法的适用性。研究结果表明:( 1 ) 由于黄河水环境系统的复杂性,实测数据中呈现出较大的非均一性,把这些数据强行组合在一起,进行单一构型模型的构建,对于异常复杂的黄河水质系统不适用。文中将研究区域划分为四个研究空间( 即:龙门一潼关,潼关一三门峡坝下,三门峡坝下一小浪底坝下,小浪底坝下一花园口) ,在每个子空间上按不同的流量级别( 可分为:q 茎5 0 0 m 3 s ,5 0 0 m 3 s q 1 0 0 0 m 3 s ,q 之1 0 0 0 m 3 s ) ,再分别建立针对性更强的多个较小的神经网络来替代唯一的单一构型的神经网络,从模型的稳定性和预测性能的对比分析中可知,据此方法建立的模型在预测精度上具有较高的优越性。( 2 ) 筛选出的影响下游监测断面该水质指标的主要因子,它们分别是:上游来流量q 、区间纳污量w 、来沙量s 、水库水位z 、上游断面污染物的本底浓度值c o 。已经建立起来的训练模式为:模型选定为三层b p 网络结构,隐层神经元数选为6 个,b p 模型的最佳输入模式为5 6 6 1 。学习速率取默认值0 0 l 。最大训练次数为2 0 0 0 1 0 0 0 0 次。传递函数,隐层选用协s i g 函数,输出层选用p u r e l i n函数。训练误差目标取o 0 0 叭0 0 0 1 之间。数据处理,采用p r e s t d 函数进行前处理,用p o s t s t d 进行后处理,选用t r a i m m 函数训练和测试网络。( 3 ) 运用m a t l a b 语言编写相应的训练程序和应用程序。在训练程序阶段,根据典型研究河段在1 2 个年份内的统计资料,建立污染物输入响应模型,同时在程序中对测试集的相对误差进行了效果分析,用图形的形式直观地展示了训练成熟后的模型对部分测试集的拟合、预测效果;在应用程序阶段,根据训练稳定后的模型得到隐层至输出层的连接权值和阈值矩阵,可进行模型的预测计算。关键词:黄河典型流域入河污染物水质指标人工神经网络模型响应关系a b s t r a c tt 王l i sp a p e rs t u d i e dt h ed i 曲s i n ga i l dm o v 吨r u l e si nt h eo b s e r v a t i o ns u 而c e so fs a n m e n x i a ,x i a o l a t l g d ia n dh u a y u a l l k eb e c a u s eo ft h er i v e rp o l l u t a l l t ( c o d c ra n dn 1 4 + 悄a r ea p p r a i s i n gg e n c s ) t h es t i l d y i n ga r e ai s 如mw e ir i v e r ( t o n gg u a l l ) t oh u a n g y u a n k ei nm i d d l er e a c h e so f m ey b l l o w r i v e b e c a u s eo f t l l e 啪d o m c i 妙i nt h ey e l l o wr e r ,也ed e f e r e mu n c e r t a i n t yw a sb r o u g h ti nt h em o d e lo fw a t e tq u a l i t yf o r e c a s t u s i i l gm a n u a ln e u r a ln e t 、v o r km e t h o d ,n l ew a t e rq u a l i t ym o d e lw a sb u i l tt 0r e f l e c tt h er e l a t i o no fb a c k w a r dp o s “i o n sp o l l 咖tc o n c e n 订a t i o n sa i l du p w a r dp o s i t i o n si i l f i u e n c ef 犯t o r s i tw a sa p p l i e dt 0o p e no u tt h ei m p e r s o n a lm l e so fu p w a r da n db a c kw a r d sm a i nw a t e rq u a l i 哆f a c t o r s ,a n a l y s i sa i l dv a l i d a t em e 印p l i c a b i i i 哆o fm i sm e t l l o d t h em a i nr e s u l t ss h o wm a t :( 1 ) b e c a u s eo fc o m p l e x i t yo fm ey e l l o wm v e r sw a t e rc i r c m s t a i l c e ,t h ea c t u a lm e a s u r cd a t as h o w c db i g g i s hi n e q u a l i 够i ft h e s ed a t aw e r ef o r c e dt oc o m b i n ea n db u i l ts i n g l em o d e l ,i t 、v a sn o ts u c c e s s f u lf o rv e r yc o m p l i c a t e dw a t e rq u a l i t ) rs y s t e mi nt h ey 宅l l o wf d v e li n 1 i sp a p e r ,m es t u d y i i l ga r e aw a sc a r v e du pf o u rt y p i c a ls p a c e s o ml o n gm e nt ot o n gg u a n ,舶mt o n gg l l a nt os 粕m e n x i a ,舶ms a n m e n x i at ox i a o l a i l g d ia n d 丘o mx i a o l a n g d it oh u a y u a n k e ) a 1 1 dd i 牖r e n tn o w1 e v e l s ( i n c h m i n gq s 5 0 0 m 3 s ,5 0 0 m 3 s q l 0 0 0 m 3 s ,q 三1 0 0 0 m 3 s ) i ne v e r ys p a c e ,al o to f i e s s e rn e u r a ln e 觚o r km o d e l sw e r eb u n tt or e p l a c es i n g i em o d e l t h ea d v a n t a g ew a ss h o w e db yu s i n gt h i sm e a n ,a c c o r d i n gt ot h es t a b i l i t y 孤df o r e c a s tc 叩a b i l i 哪o f m o d e l ( 2 ) t h em a i ni n n u e n tf a c t o r sw e r es e l e c t e da b o u tb a c k w a r ds u r f a c e s t h e ya r eu p w a r dn o w ( q ) ,i n t e r z o n ep o l l u t a n t ( w ) ,s a l l dq u a n t i t y ( s ) ,r e s e r v o i rw a t e r1 e v e l ( z ) a i l db a c k g r o u n dc o n c e m r a t i o no fu p w a r ds u r f 她e ( c o ) t h et r a i n i n gm o d ew a sb u i h ,s u c ha s 廿l r e el a y e r s 舶m e w o r ko fb pn e 柳o r km o d e l ,s i xi l e ec e l i so fc o 彻o t a t i v el a y er b e s ti n p u m n gm o d eo f5 6 6 一lb pm o d e l ,s t u d y i n gs p e e d0 0 1 ,m o s tt r a i n i n gt i m e 82 0 0 0 1 0 0 0 0 ,t a i n i n ge o r0 0 0 0 l o 。0 0 l ,f o 删dd i s p o s a lf u n c t i o n “p r e s t d ”,b a c k w a r dd i s p o s a lf 讪c t i o n “p o s t s t d ”,a n dt h ef u n c t i o no f “t r a i n l m ”w a sa p p l i e dt ot r a ma i l dt e s t 血en e t w o r k ( 3 ) m a t l a b1 a n g u a g ew a su s e dt o 、v r i t et r a i n i n ga 工l da 即l y i n gp r o g r a m s i nt h et m i n i n gp r o g 衄,t h ef o r e c a s t i gm o d e lo fi 1 1 f l u e n tf a c t o r sw a sb u i l t ,a c c o r d i n gt ot 、v e l v ey e a r ss t a t i s t i cd a t ai nr e p r e s e n t a t i v es t u d y i n gr e a c h ,a tt h es 眦et i m e ,也er e l a t i v ee 玎o ro ft e s t i n gd a t aw a sa n a l y z e di nt h ep r o 铲a m t h ea f r c c t i o n so fi m “a t i o na n df o r c c a s tw e r cs h o w e dv i s u a l l yb yu s i n gf l g l l r e s ,w h e nt 1 1 em o d e l 、硼5t r a i n e dw e l l _ i nm ec o u r s e ,m em a 仃i x e so f 、v c i 曲ta n dr e m a i n d e rw e r e 仃a n s f b r r e df o mc o 衄。诅t i v e1 a y e rt oo u 訇p u tl a y e r t h eo u t p u tr e s u l t so fb a c k w a r ds f 犯ew e t ec a l c u l a t e di nt h et 1 1 0 d e lk 呵w o r d s :t h e 蛐i c a l 盯e ao fy e l l o wr i v e r ;m ep o l l u t a n to fe n t e r i n g 由e r ;w a t e rq l l a l i t y ;a r t i f i c i a ln e u r a ln e t 、v o r km o d e l ;r c s p o n s er e l a t i o n学位论文独创性声明:本人所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。如不实,本人负全部责任。论文作者( 签名) :形年莎月日学位论文使用授权说明河海大学、中国科学技术信息研究所、国家图书馆、中国学术期刊( 光盘版) 电子杂志社有权保留本人所送交学位论文的复印件或电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅。论文全部或部分内容的公布( 包括刊登) 授权河海大学研究生院办理。论文作者( 签名) :形年莎月日哗彬卫奉第一章绪论第一章绪论第1 节研究的目的和意义黄河流经我国的9 个省区,干流河道全长5 4 6 4 k m ,流域面积7 9 5 万k m 2 ,是我国西北、华北地区的重要水资源。但随着流域经济的快速发展,大量的工业废水和城市污水未经处理直接排入河道,入黄污染物量已远远超出黄河水环境承载能力,使原本有限的黄河水资源受到严重污染,水质不断恶化,水生态环境遭受破坏,水质恶化直接影响着流域内工农业生产和人民身体健康,特别是近年来黄河来水量连续偏枯,黄河水污染的形势更加严峻,水污染已成为流域经济可持续发展的制约因素。为遏制黄河流域水污染恶化的态势,切实改善水环境,黄河流域正在建立污染物排放总量控制体系,推行污染物排放总量控制。污染物总量控制方案是水资源保护规划的重要组成部分,实施排污总量控制的关键技术,就是建立污染源的排放量与河流水质目标之间的输入响应关系,也即在设计条件下,给定水域和污染物排放条件,反映污染源排放污染物数量所引起的水质指标增加或减少的响应关系 ”。黄河流域由于区域自然环境的差异、经济发展不均衡、水资源高度开发利用等诸多因素,使污染源与水功能区水质目标输入响应关系更加复杂,增添了研究的难度。传统方法在对水环境质量进行分析时,通常都会采用水环境数学模型,模型是对污染物在水环境中变化规律及其影响因素之间相互关系的描述 2 l 。但是,水环境数学模型也存在一些局限性,由于黄河干流的河道特征、水文、水力学条件等具有很大的随机性,这就导致了模型输出的不确定性,而水环境数学模型中需要测量的水质因子和环境因子既多又难于测量。此外,在黄河水质系统中,有许多反应机理还不太清楚,有很多过程目前还不能或难以用数学方法表达,另一方面【3 j ,由于在水环境监测方面的投入有限,从而导致许多监测数据无法获取,这更加限制了确定性水质模型的适用性和准确性。因此,在建立黄河流域输入响应关系模型的过程中,运用不确定性方法进行数学模拟显得尤为重要。阋海大学硕士学位论文第2 节国内外研究现状及论文选题2 1 国内外水质数学模型的研究进展1 9 2 5 年h w s 订e e t e r 和e b p h e l p s 两位工程师提出了后来称之为s 仃e e t e 卜p h e l p s 氧平衡的水质模型【4 】。这一模型即使不是第一个关于水质的数学模型,也应当是最早的水质模型之一。从那时算起,水质模型的建立与应用己经有了7 0 多年的历史。经过许多中外学者的不断努力,水质数学模型得到了长足发展,其发展过程大致可以分为以下几个阶段【5 j :第一阶段( 1 9 2 5 1 9 6 5 ) ,这一阶段以s t r e e t e r 和p h e l p s ( 1 9 2 5 ) 提出的氧平衡模型为代表。后来科学家在此基础上成功地总结出b o d d o 模型并将其运用到水质预测等方面。这一阶段的模型比较简单,是只考虑了b o d 及d o 的双线性系统。这一阶段的模型主要是s p 模型及其修正式,如t h o m a s ( 1 9 4 8 年) 1 6 】、d o b b m s c 踟p 吲、0 c o i l i l o r ( 1 9 6 2 年) 【”等修正式。1 9 6 0 年后,在s p 模型基础上的发展,还包括将其运用于比较复杂的系统,引入空间变量和物理的、生物化学的、动力学系数,以及引入温度状态变量和考虑水表面的热交换等。津田1 9 1 、安部喜也和l l f a l k 【1 1 等人的研究是这几方面工作进展的代表。第二阶段( 1 9 6 5 1 9 7 0 ) ,在这个阶段不连续的一维模型扩展到包括其他输入源和漏源。其他输入源和漏源包括氮耗氧化合物( n o d ) 、光合作用、藻类的呼吸以及沉降、再悬浮等等。计算机的成功应用使水质数学模型的研究有了突破性的发展。第三阶段( 1 9 7 0 1 9 7 5 ) ,数学模型已发展到变成许多模型相互作用的线形化体系。有限元模型用于两维体系,有限差分技术也应用于水质模型的计算,更高维数的模型不断地被发展,关键问题是在进行水质模型研究中需要足够的数据。第四阶段( 1 9 7 5 1 9 9 5 ) ,在这二十年里,科学家研究的注意力逐渐地转移到改善模型的可靠性和评价能力方面。随着改进的二维、三维河流、河口和湖泊( 水库) 模型的发展,水力学和水质问的偶合越来越引起科学研究工作者的重视。水生生态系统的复杂性是许多生物问题的一个重要课题。水质模型的研究由单一组分的模型向较综合的模型发展,在该阶段中,水库、湖泊的富营养化模型研究已驭得了可喜进步。美国环保局( u s e p a ) 开发的q u a l i i 模型便是一个成功第一章绪论范例【1 2 】 13 1 。2 0 世纪8 0 年代以来,由于计算机软硬件、在线仪表监铡系统、卫星遥感技术、g p s 技术、g i s 技术、人工智能技术和信息技术的高速发展,并且在水环境中的应用得到不断地探索,使水环境数学模型有了飞速发展,许多以前不能解的数学模型,现在多能得到很满意的结果。模型的可靠性、预见性、综合性和科学性得到进一步的提高,维数更高的模型( 例如四维的水质模型) 在水质规划中得到应用。模型的微观化、动态化、智能化在目前和今后仍是关注的焦点。另一方面,由于环境的水文及排污条件具有的随机性,这就导致了水环境数学模型输出的不确定性。为了提高模型的预测精度和结果的可靠性,对模型不确定性分析研究,近十几年来取得了明显的进展。a n d r e w sk t a k y i 1 4 】分析了模拟优化模型中不确定性的来源有:( 1 ) 污染物的排放量和河流背景值的随机性;( 2 ) 估计模型参数所需的河流和水质资料的不充分;( 3 ) 对污染物传输过程和水质管理系统的简化缺乏充分的认识。水体水质模拟的复杂性,在很大程度上是因为水环境系统是巨大的开放系统。这种开放性造成的水质模拟的复杂性主要表现在系统的非确定性和非结构性两个方面。为此,寻求简捷、可靠而准确的水质预测模拟方法,一直是学术界不懈努力的方向。人工神经网络是由大量神经元相互连接而成的超大规模非线性动态系统,目前正朝着进一步模拟人脑:能处理非结构性问题和能解决复杂系统建模的高级智能模拟系统的方向发展【1 6 】。2 2 水环境系统的非线性及不确定性黄河水质系统的污染过程不仅受到水体自然水文条件、污染物排放时空强度等物理因素的影响,而且受到社会、经济等因素的影响,变化极其复杂。另一方面,由于黄河干流的水文及排污条件具有的随机性,这就导致了水质预测模型输出的不确定性。在黄河流域的水质系统中,污染物质在水体中的扩散、输移和降解过程都是在物理、化学、生物、生物动力学等诸多方面因素的综合作用下形成的。水环境因子如水文条件、水流的流态、上游来沙量、河床几何形状、水体中底栖及浮游动植物的种类、数量及其瓤陈代谢的变化等都将引起水质状态的变化。凋海大学硕士学位论文假定流域的纳污条件恒定,由于上述因子偶然变化的影响而产生不确定性的输移速率和降解速率,在下游断面得到的浓度过程也是波动的。事实上,排污口的排污过程、支流的汇入过程都是不确定的。因此,水质的变化过程绝不是某个确定性的函数过程,确定性模型显然不能描述在不确定性作用下的特性,综上所述,将不确定性方法应用于黄河流域水质模型的建立是有必要的。2 2 1 无法建立描述水环境污染现象的精确数学模型由于污染物在水体中迁移、转化、降解等现象涉及水文、气候、生物化学、物理作用等方面,因而十分复杂,使得人们至今还不能用数学物理方程严格地描述其中的每一个子过程,现有的水力水质模型在许多结构环节上仍主要借助于概念化模拟或经验函数描述,这样的模拟只涉及现象的表面而不涉及现象的本质或作用机理,因此精度不高17 1 。2 2 _ 2 水环境系统是一个高度的非线性系统尽管目前模拟水环境污染系统的模型多为线性或线性化的非线性模型,但水环境污染过程的非线性特征是客观存在的。叶常明 1 8 】将水环境污染中的溶解氧浓度沿河流纵向距离的变化、b o d 随时间的变化关系以及污染物扩散自净的动力学过程归纳为八类非线性行为,详细论述了水环境污染过程非线性作用的普遍性并指出这种非线性不满足线性量叠加的原理。这是导致非线性模型线性化求解精度不高的根本原因之一。2 - 2 3 水环境污染问题的不确定性水环境污染问题的不确定性早己为广大科研工作者所关注。水环境污染问题的不确定性主要表现在:( 1 ) 黄河流域典型研究区段的四个监测断面在什么时候出现最高污染物浓度,出现哪些主要的污染物,以及污染强度的数值等,在任何时刻是不可重复的,具有随机性( 不确定性) 1 9 】【2 0 】。但经过多年大量的观测统计,只要污染源不变化,那么其特征是趋于稳定的,因而就服从统计规律而言,是严格数学意义上的随机性。( 2 ) 研究对象概念上的不确定性( 模糊性) 。水环境科学目前尚未形成自己成熟的学科体系,许多概念并没有明确自己的内涵与外延,是模糊概念。在指标第一章绪论描述上不仅存在易于清晰定量的指标,而且存在大量“弹性”指标,如水环境感官评判。在决策上【2 ”,决策人只能根据已有的经验知识,综合考虑影响水环境质量的众多因素进行模糊推理。例如我们常说的水污染控制最优方案,其实本质上仅仅是由我们可知的多个方案组成的非劣集的解而己。( 3 ) 研究对象信息量不充分而出现的不确定性( 灰色性) 。在缺乏水环境资料的研究中,常常遇到信息缺损以及难以精确数量化表达的信息,这也导致水环境污染问题的非确定性。黄河水质污染过程的不确定性和非线性,使得传统的水质污染评价和预测方法存在局限性。要想客观反映水环境污染的真实状况或接近实际的情况,就必然涉及到水环境污染的复杂且非线性过程。同时,水环境污染评价与预测本身就是一个动态的概念。因此,用非线性科学的新理论与新方法来研究黄河水质污染现象是科学发展的必然。2 3 论文的选题筛选出黄河干支流具有代表性的典型水功能区,在对水功能区和陆域污染源普查的基础上,建立典型功能区入黄污染物与水功能区水质输入响应关系。本论文以黄河中游渭河入黄口( 潼关) 至花园口段为研究区域,研究入河污染物( 评价因子为c o d c ,、氨氮) 在研究区段的扩散输移规律。采用人工神经网络方法,建立能够反映研究区域中,下游污染物各水质响应指标与影响它的上游各参量之间关系的水质模型,揭示上、下游主要水质要素问的客观规律,分析和验证该方法的适用性。本文的课题来源于国家科技项目“黄河流域( 片) 水资源综合规划工作大纲”提出的专题研究之一,作为黄河流域水资源综合规划中专业规划黄河流域水资源保护规划的一项基础性研究工作。论文的研究从筛选出影响水质的污染因子入手,以控制入河污染物为目的,探索入河污染物对水质输入的影响,以此来指导污染物排放总量控制方案的制订。阚海大学硕士学垃论文第3 节论文的主要研究工作3 1 研究目标的确定根据所研究水功能区河道特征与水文条件,选用适合的数学模型,在设计条件下,根据黄河流域( 片) 水资源综合规划技术细则所确定的水功能区污染物控制因子,计算评价入河污染物c o d c ,、氨氮对水功能区控制断面的污染贡献量,建立水功能区水质与入河污染物响应定量关系。在对流域水功能区和陆域污染源普查的基础上 2 2 1 ,筛选出黄河干流具有代表性的典型水功能区作为研究对象,本次选在潼关( 含渭河入黄口) 、三门峡水库、小浪底水利枢纽和花园口四个监测断面所包含的区域作为本论文的研究对象。3 2 数据收集的原则本文欲在对数据的获取方法分析和比较的基础上,并结合实际情况,确定建立模型所使用的数据。为适应建立模型的需要,本文还要对原始数据根据建模的需要进行筛选和处理,筛选后的基础样本数据必须符合以下特点:( 1 ) 样本数据具备完整的输入因子和输出因子数据;( 2 ) 作为建立模型的基础样本数据,所有因子的水平都是数字化的、非描述性的:( 3 ) 在一定的筛选标准下,不存在不合理的离群数据。3 3 数学模型的建立论文中分析了灰色模型、人工神经网络模型和多元非线性回归法在水质预测中的适用性,并以神经网络方法建立黄河典型区域入河污染物和水质的输入响应关系。运用m a t l a b 语言编写相应的训练程序和应用程序。在训练程序阶段,根据典型研究河段在1 2 个年份内的统计资料,建立其影响因子对下游水质的输入响应模型,同时在程序中对测试集的相对误差进行了效果分析,用图形的形式直观地展示了训练成熟后的模型对部分学习集和测试集的拟合、预测效果;在应用程序阶段,根据训练稳定后的模型得到隐层到输出层的连接权值和阈值矩阵,按照程序要求的格式和顺序,准备输入数据或数据文件,在m a t l a b 6 5 的运行窗口调用相应的子程序,经模型计算后得到下游断面某水质指标的输出值。第二章数学模型的选择第二章数学模型的选择第1 节不确定性方法的建模规则及其应用水环境中不确定方法的研究始于6 0 年代,随后不确定性研究迅速展开,近年来在我国水环境领域出现了不确定性方法研究热潮。由于水环境中的不确定性主要包括随机性、模糊性和灰色性,这就使得传统的不确定性研究方法主要有三种类型,即随机理论、模糊集理论和灰色系统【2 3 】。近年来又发展各种耦合方法并引入新的不确定性研究方法,使不确定方法在水环境研究中的生命力越来越壮大。本课题的研究中分析了灰色模型、人工神经网络模型( 蛳f i c i a ln e u r a ln e 艄o r k ,以下简称a n n 模型) 和多元非线性回归法的适用性,并以神经网络方法建立入河污染物和水质的输入响应关系。以下对这三种不确定性方法的建模规则和在水环境领域中的应用作简要的阐述。1 1 灰色理论模型灰色模型( g r e ym o d e l ) 简称g m 模型,是灰色系统理论的基本模型,通过建立该模型体系就能实现灰色方法的系统分析、评估、预测和控制等功能1 2 “。g m ( n ,h ) 模型为灰色模型的一般表达,模型中的“n ,表示微分方程的阶数,一般而言,“n ”的值不宜大于3 ,模型中的“h 表示模拟的变量个数,其中g m ( 1 ,1 ) 模型是灰色模型用于水质预测中使用较广的一种。灰色模型具体的建模过程以灰色模块( 所谓灰色模块是时间数列x ( m ) 在时间数据平面上的连续曲线与时间轴所围成的区域) 为基础,以微分拟合法而建成的灰色微分型方程。在灰色模块中,由预测值上界和下界所夹的部分称为灰色平面( 简称灰平面) ,这个灰平面的大小是由各个未来时刻预测值的灰区间所决定的。因此,它由原点( 现在时刻) 向未来时刻呈喇叭型展开,即未来时刻越远,预测值灰区间就越大,见图1 1 一l 所示。这样,灰色模型对系统的刻画将因时间的逐渐外推,而逐渐失真。灰色理论在水质模拟和预测方面的运用主要有以下两种方法:一种方法是把嗣海大学硬士学位论文水质确定性模型中的全部或部分变量或参数处理为灰色变量获得灰色解( 用灰域表示) ,如果采用优化技术,还可依据实测数据对水质模型中的参数进行灰色识别。另一种方法是在实测的时序数据基础上,根据灰色系统建模原理,建立水质的灰色模拟模型来进行水质预测。1 2 人工神经网络模型近年来全球性的神经网络研究热潮的再度兴起,不仅仅是因为神经科学本身取得了巨大的进展,更主要的原因在于发展新型计算机和人工智能新途径的追切需要。基于神经科学研究成果基础上发展出来的人工神经网络模型,反映了人脑功能的若干基本特性,开拓了神经网络用于计算机的新途径。目前【2 ”,已发展了几十种神经网络,例如h o p f i e l d 模型,f e l d m 籼等的连接型网络模型,h i n t o n等的玻尔茨曼机模型,以及r u m e l h a n 等的多层感知机模型和k o h o n c n 的自组织网络模型等等。在这众多神经网络模型中,应用最广泛的是多层感知机神经网络。多层感知机神经网络的研究始于上世纪5 0 年代,但一直进展不大。直到1 9 8 5 年,r u m e l h a r t 等人提出了误差反向传递学习算法( b a c k - p r o p a g a t i o nn e t 、v o r k ,简称b p 算法【2 6 j ) ,实现了多层b p 网络( 不仅含有输入层、输出层,而且中间含有个或多个“层”组成的“隐层”) 的设想,如图1 2 1 所示。圈il l 灰平面示意图圈12 ,1b p 网络模型神经网络是由大量神经元通过极其丰富和完善的联接而构成的自适应非线性动态系统,它是一种新型的黑箱方法,不需要了解输入与输出之间的相互关系。模型通过简单的非线性函数的多次复合,可以克服线性和非线性拟合中的基函数第二章数学模型的选择选择与系数求解的困难,并可进行高维的非线性的精确映射,具有较强的自适应能力,为建立水环境数学模型提供了新的研究手段 2 7 】1 2 8 1 。人工神经网络模型摈弃了任何人为因素,只根据水质标准本身的特点进行学习,从而产生连接权值和阈值矩阵,这是与传统水质预测方法的根本区别。当将测试样本输入模型后,网络将自动地调用权值与闽值,进行回想或联想,从而得到测试样本的输出结果( 预测结果) 。就此而言,其输出结果与其他需人为确定权值矩阵的评价方法的输出结果相比具有更真实的客观性。如前所述,a n n 网络的一个非常吸引人的特性,就是即使没有明确提供给它们过程内部的物理演化过程知识,它们也可以在一个过程的输入与输出之间直接建立关系。它们可把一个多维空间映射到另一个多维空间,只需提供一定数量的有代表性的数据,即使这些数据中含有噪声或错误团】。这些特性说明伽q n 网络非常适合复杂的黄河水质预测模型的建立,可以帮助我们进一步捕捉、探索其水质演变过程中的规律。并且神经网络的建模过程非常灵活,可以采用不同的非线性函数来模拟其过程的非线性特征。值得我们注意的是,神经网络的上述优点有时也会带来严重的问题。比如,a n n 如完全依靠数据驱动,就无法充分发挥相关专业知识的作用。水资源学科是一个有较长研究历史的学科,前人通过多年研究总结、归纳出的理念知识虽不通用于所有的水资源系统,但仍是非常有价值的宝贵知识,可以对水质模拟提供指导。即使在数据驱动型的模拟途径中,有效地考虑和充分利用这些专业知识和理念,无疑要比纯黑箱的数据挖掘有成效。此外,在使用数据驱动手段时,应注意所掌握的数据一般都含有噪声干扰。在挖掘过程中,如过分追求对原始数据的拟合度,会产生“过适应”问题。也就是神经网络可以很好地再现以往的系统行为,却无法很好的预测未来。在此就需要依据规律性的知识和理念,对模拟结果进行合理性分析,以找到黄河水质演变真正的、潜在的规律。1 3 多元非线性回归法依据数学中的多元非线性函数逼近理论,工程中的大多复杂多元函数,理论上都可以用多元幂级数形式充分逼近,幂级数形式是白变量的各阶乘幂与两两、三三、交叉的线性和。设_ y 为响应变量,x 】,x 2 ,码,飘为输入变量( 为方便记,这里表写四元输入的情况,更多元的输入情况依此类推) ,y 与x l ,x 2 ,肋,橱海大学硕士学位论文札之间的响应式为_ y = 砸1 ,砘,功,驰)( 2 1 )具体的响应关系,可能很复杂,数学理论上已证明,当响应关系,满足一定条件时,这一关系总可以表示为如下形式y i 0 l ,靶,趵,翰) :蛳+ 口1 lz l + 1 2 娩+ d l 搏3 + d 1 4 轴+ 啦l 工1 2 + 啦2 2 + 啦3 x 3 2+ 啦4 靴2 + 啦5x 】+ d 2 6z l 奶+ 口2 7x l 驰+ 啦8x 搏3 + d 2 8 靶瓤+ 啦80 3 h + ( 2 2 )式2 2 中,第二个等号的右边有无穷多项相加。由于实际问题的有解性,使得工程问题中的响应关系,1 都能满足这一逼近式成立的条件3 0 1 。工程应用中具体的响应关系不可能取无穷多项,这就需要截尾,而截尾就必然会使所得模型产生随机误差( 也称截尾误差) ;再者,如果取很多项,可能对某些数据拟合很好,但由于所取表达式( 模型) 中有些项没有物理意义,并不代表客观存在的主要物理过程,使得模型不具有同类物理过程下的一般适用性。事实上,由于工程应用中,所使用的数据都是测量值,这些测量值都不可避免地带有随机误差,应用中的输入变量都是随机量,也就是说,上面逼近式右边的加项都具有随机性。基本的随机理论告诉我们3 1 】,随机项的增加会使模型的方差增大,即会使模型的偶然性增加,使得模型即使在同类物理过程下都可能不具有普适性;因此,在工程问题中应用上述逼近理论结论时,一方面要设法消除截尾产生的随机误差,另一方面要使得最终模型的各项都代表主要的物理过程,都具有明确的物理意义。基于后一原因,逼近式不需取全部各项,包括一阶项和二阶项( 或更高阶项) 都不要全取,只选取与响应变量y 有明显关系的各阶项,这当然会增加模型随机误差。为了进一步考虑如何有效地消除随机误差,仔细分析一下逼近式( 2 2 ) 可见:一阶项乘上常数相加在模型中,二阶( 以及更高阶) 项如果看成一个整体也是被乘上常数相加在模型中。要能够被乘上常数后就相加到模型中,有一个条件那就是,该项与响应变量y 是明显线性关系。注意到逼近理论结论的这一本质特点,借鉴其特定构成形式,在上述只取有明显关系的各阶项的基础上,如果一阶项与响应变量y 有明显关系,但不是线性的,那就首先根据它们问较为明确的关系变换为线性。然后再组成二阶项,并在二阶项中也根据二阶项与响应变量y 的关系变换为线性。第二章数学模型的选择第2 节模型的适用性分析及选取因为在利用灰色理论进行水质预测时,预测时间愈靠近现实时段其精度愈高,随着预测时间的增长,灰平面的增大导致预测结果失真,影响模型的预测精度;另一方面,g m ( 1 ,1 ) 模型将整个污染物在水中的迁移转化过程看作为一个灰色过程,利用灰色生成或序列算子的作用弱化随机性,找到数据中隐含的规律性。由于使用的是同步资料,一些区间加入的偶然性,黄河水、沙、河床的特殊性,使得这些数据中所隐含的规律性并不显著。因此,如果利用灰色理论和多元非线性回归法来建立黄河水质预测模型,则可能会导致预测的可靠性低,且不利于预测结果的分析。综上所述,建议舍弃灰色理论方法和多元非线性回归法,采用人工神经网络模型来建模。资料分析可知吲【3 3 1 1 34 1 ,目前人工神经网络模型在水质预测和评价中的应用比较广泛,其主要应用于以下三个方面的研究,即:( 1 ) 以上游断面水质预测下游断面水质或建立某一断面上流量和水质指标的非线性函数映射关系;( 2 ) 以某一时间序列上的水质资料建立时间和水质指标的函数关系,用来预测在某年份的水质情况,即以当前水质预测未来水质:( 3 ) 建立某一监测断面上多个水质污染因子与水质评价等级( 可分为五类水) 之间的映射关系。以下从四个方面对a n n模型应用于黄河水质预测问题的适用性作了详细的阐述:( 1 1a n n 模型的适应性分析。a n n 模型是通过一定的数据挖掘技术直接从数据中找到潜在规律性的方法。它最主要的缺点是对物理概念渗透缺乏适当的考虑,比如神经网络模型无法反映在物理的、化学的或生物的作用下,污染物质在水体中的稀释降解过程。只有在影响下游断面水质监测指标的因子筛选过程中,考虑了一些物理成因的分析。本文探索了应用人工神经网络技术这种数据挖掘工具来建立模型,进行入黄污染源与水功能区水质输入响应关系的模拟研究,虽然经后面的误差分析后,相对误差 4 0 的预测结果均认为是可行的,但是前提条件是必须保证在学习样本中,不能存在噪声数据或者是自相矛盾的数据。然而,当支流和排污口的污染物质比例改变后,下游断面水质指标的浓度值是怎样的变化过程,模型中并没有考虑。在污染源的资料统计中,对于区间的入河污染物主要分析了排放量较大的支流及重点的2 9 个排污口汇入的情况,并针对入河污染物资料不全的情况,在1 9 9 2 一1 9 9 8 年和1 9 9 8 2 0 0 3 年间运用的插值方坷海大学碗士学位论文法来补充,期望在模型中能够反映入河总量变化对下游水质是否影响显著。而对于支流汇入和排污口的排放量比例改变时,下游断面的水质影响如何,在今后的研究工作中会逐步完善。另外,考虑到排污口的污染物汇入过程在年内分配具有不均衡性,部分企业是全年生产其污染排放量稳定,而有些企业全年中只有一半的时间是生产运营期,因此其产污量在某几个月份较集中,即可能出现突发污染事件。基于该情况,区间内的月均纳污量是根据本月内污水排放量的大小按比例插值而得,基本可以反映年份内的总排污量在每个月的分布情况,由所有年份的训练数据可以看出,c 0 d c r 或氨氮排放量较大的数据对中,下游断面相应的水质指标较高,模型对这些数据的拟合和预测情况也是与之相符的。在其它四个影响因子值不变的前提下,模型对突发污染事件具有一定的预测能力。( 2 1 按照不同的流量级别建模。黄河干流研究区间内河道宽浅,河流水质受水量的影响较大,水沙冲淤变化及主流摆动较频繁,属典型的宽浅游荡型河道。建模的创新之处除了力求把理念知识融入神经网络的结构之中外,还进一步明确提出应将研究区域划分为四个典型研究空间,在每个子空间上按不同的流量级别,再分别建立针对性更强的多个较小的神经网络来替代唯一的单一构型的神经网络。各个神经网络的输入模式应不同,以反映各个形成阶段的主导影响因素;即使在三门峡至小浪底水库段内由于数据少的局限性,输入模式一致,但各个神经网络模型内部的连接权值的不同同样可以反映各种影响因素的不同影响。由于黄河水环境系统的复杂性,实测数据中呈现出较大的非均一性,把这些数据强行组合在一起,进行单一构型模型的构建,对于异常复杂的黄河水质系统就不那么奏效。理想的建模途径需要物理理念的渗入,对数据中的非均一特性进行一定的成因分析,把属性较为一致的数据组合在一起进行进一步的分析。综上所述,按照黄河上不同的流量级别来分别建模,从模型的稳定性和预测性能的对比分析中可知,据此方法建立的模型在预测精度上具有较高的优越性。( 3 ) a n n 模型应用于黄河流域水质预测的可行性。因为m 町n 模型可以递归式的“从数据中学习”,即具有记忆功能,可以大大节省建模时间,非常适用于复杂多变、非线性水质演变系统,所以该网络也非常适合于动态的、不确定的黄河水环境系统。a n n 在黄河上的应用研究必须得到应有的重视,以探讨出一条可以补充传统模拟技术的新路子。第二章数学模型的选择在确定黄河水质模型的最佳输入模式时,曾经选用7 个影响因子的统计数据作为b p 模型的输入向量,即在前面选定的5 个因子中增加p h 值和溶解氧两个因子,模型结构选为7 7 7 1 ,仍然选用t r a i n l m 函数进行网络训练,结果表明:虽然神经网络模型被认为是一种“黑箱”模型,但并非对任何数据输入都可以得到满意的结果。输入模式分量过多,则网络模型结构会过于复杂,从而一则训练周期长,网络训练误差曲线在很长的时间内进入饱和区,无法收敛到全局最小点,二则容易形成“过适应”,随着训练时间的延长,学习结束后,模型输出值与实测值拟合非常好,但模型对测试集的输出值与实测值之间误差很大;反之,如果分量过少,则不足以捕捉复杂的非线性关系,使得模型过于简单。h 1a n n 模型在实际应用中的不足之处。m 州在工程控制、模式识别等领域虽己取得了令人瞩目的成绩,但其在水环境领域的应用仍处在起步阶段。由于网络的训练是通过m a t l a b 神经网络工具箱里的t m i i l l m 函数来实现的,在此计算平台的基础上,对于人工神经网络模型的实现过程提供了方便。a n n 模型的局限性主要表现在:当提供给网络的学习集中增加一个输入因子或者几对新的学习数据时,原先建立起来的训练模式( 包括各个训练参数的选取,如隐层神经元个数、学习速率、最大学习次数、目标收敛误差等) 将都要重新率定。但是,有了本研究的基础,重新率定的工作并不是难事。总之,当处理常规方法无法解决或效果不佳的问题时,神经网络显示出其相当大的优越性。尤其是当对问题的机理等规律不甚了解,或不能用数学模型表示的系统,神经网络往往是最有利的工具;另一方面,神经网络对处理大量原始数据而不能用规则或公式描述的问题,表现出极大的灵活性和自适应性。黄河水质演变系统本身的复杂性、不确定性是选择神经网络模型的主要原因。因此实际应用过程中,必须把神经网络模型与黄河水质系统的演变规律有机结合起来,创造性地解决模型推广应用的实际问题。稠海大学硕士学位论文第三章人工神经网络系统模型b p 网络在恰当选择网络层次与隐层节点数条件下可以任意精度逼近非线性函数,但它使得参数估计容易陷入局部极小,并需大量计算。为了克服局部极小,提高算法收敛速度,一种行之有效的方法是采用其改进算法,即l e v e n b e 瑶一m a r q u a r d t 算法。1 1 模型的概述第1 节a n n 模型的基本概念人工神经网络( a r t m c i a l n e l 】r a l n e t 、v o r k ,简称a n n ) 是由大量神经元通过极其丰富和完善的联接而构成的自适应非线性动态系统,是目前国际上非常活跃的前沿研究领域之一【3 5 j 。它使用大量简单的相连的人工神经元来模仿生物神经网络的能力,它从外界环境或其它神经元获得资讯,同时加以简单的运算,将结果输出到外界或其它人工神经元。神经网络在输入资讯的影响下进入一定状态,由于神经元之间相互联系以及神经元本身的动力学特性,这种外界刺激的兴奋模式会自动地迅速演变成新的平衡状态。这样具有特定结构的神经网络就可定义出一类模式变换,即实现一种映射关系3 6 】口”。由于人工神经元在网络中不同的联接方式,就形成了不同的人工神经网络模式,其中误差反向传播网络( b

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论