




免费预览已结束,剩余31页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章 基于遗传算法的水资源系统建模方法3.1 水资源系统建模概述系统模型,是所研究系统的各要素之间关系,或所研究系统的输入与输出之间关系的符号表示形式,这些符号可以是思维的、语言的、描述的、图形的、数学的、物理的、相似的、模拟的或系统本身的符号1,3-5。复杂系统模型,目前主要用计算机程序来描述。系统模型只是系统某些方面本质属性的描述,这些属性的选取取决于系统工程研究的目的和研究的条件。因此,一个适用的系统模型,应该是对实际系统的抽象或模仿,应该反映实际系统主要因素及其关系。基于不同的分类原则,有不同的系统模型的分类方法。根据对实际系统定性和定量认识的深刻程度,系统模型一般可分为4类模型9,127:一是概念模型,它是最抽象的模型,采用定性分析等方法将所研究的实际系统问题抽象成一些概念,以描述实际系统的主要特征,一般用语言和图形来表示,这类模型是其它深化模型的基础,例如流域暴雨洪水系统可抽象为流域暴雨子系统、流域产流子系统、流域汇流子系统;二是结构模型,用层次图、网络图、隶属关系图、因果关系图等从宏观定性层次上反映实际系统的要素及其相互关系,一般不涉及具体的定量值,例如计算机程序流程图、系统动力学中的因果关系回路图等;三是数学模型,用数字、字母及其它数学符号从定理、定律、公式、算法、图表等层次上描述实际系统各要素及各要素之间的定量关系或拓扑关系,是在系统工程理论和实践中应用最广泛的一类系统模型,例如流域多年平均水量平衡模型;四是物理模型(形象模型),根据几何相似、力学相似、运动相似等物理相似原理,对实际系统的尺寸缩小或放大并用实物构造的系统模型,例如大坝下游冲淤试验模型等。系统工程的基本工作方式,就是根据系统观点,采用定量方法、定性与定量相互结合的方法、人机结合方法等,从技术的、经济的、环境的、社会的、政治的等方面对实际系统进行预测、模拟、优化、评价和决策分析等,其中最基础的工作就是对这些方面的各种关系和影响进行描述38,128。根据系统工程中常遇到的需要加以描述的事物规律的类型,系统模型一般可分为4类模型38,128:一是描述物理系统之间相互关系及其与外界环境之间关系的物理模型,主要反映实际系统的“物”是什么;二是描述事理系统之间相互关系及其与外界环境之间关系的事理模型,主要反映如何去处理这些“物”;三是描述人的主观意图和对客观事物反映的人理模型,主要反映根据人文特征、思想、精神等方面要求应该如何去处理这些“物”和“事”;四是描述许多人(群体)的主观意图的组合方式的系统模型,主要反映许多不同主观意见的人的不同利益冲突关系。对复杂的水资源管理系统,其物理模型主要表现在水资源学科、计算机科学、软件工程、自动化工程、通信工程、系统工程等知识子系统,其事理模型主要表现在水资源预报、调度、分配、防洪、模拟、数据输入处理和输出、自动化办公等各种水资源管理方式,其人理模型主要表现在定性定量结合、人机结合和人际协调等方面38。 根据系统模型在水资源系统工程中的作用,系统模型一般可分为5类模型,即系统优化模型、系统预测模型、系统模拟模型、系统评价模型和系统决策分析模型。这也是本书采用的分类方法,而且探讨的系统模型都限于数学模型。水资源系统建模(system modeling),就是将实际水资源系统问题抽象、简化,明确变量、系数和参数,然后根据某种规律、规则或经验建立变量、系数和参数之间的数学关系,再解析地或数值地求解并加以解释、验证和应用,这样一个多次迭代的过程3,13,129,130,这一过程又称模型化过程。水资源系统建模是沟通水资源系统工程实践与理论的重要桥梁。在系统建模中,变量是描述系统状态和行为的量,分为三种变量3,13,描述系统本身内部状态随时间而变化的变量称为状态变量,描述系统与外部环境相互作用的变量称为行为变量,包括输入变量和输出变量。输入变量是系统环境施加于系统的变量,它又可分为可控变量和不可控变量,输出变量是系统作用于系统环境的变量,它是由系统输入变量、状态变量和系统转换机构特性共同作用所产生的变量。在水资源系统工程中,常把输入变量称为自变量,输出变量称为因变量。系数是表示系统某性质已知的量,是由系统本身所决定,一般与环境无关,其值是预先给定且为常数,如重力加速度系数、阻尼系数等。参数是表示系统某性质不全知的量,在某种意义上也是变量、其值在不同系统条件下需要且可以调整和优化,主要反映系统其它变量之间的关系。为简便,本书把系数也称为参数,实际上它是数值保持不变的参数。数学关系是系统要素、变量和参数之间相互关系的数学表达形式,这些数学关系是根据系统内部结构、系统转换机制,或根据一些系统输入输出样本数据,或根据一定的原理、定理、经验等建立起来的,确定合适的数学关系是系统建模过程中的主要内容。水资源系统建模的一般过程大体可分为如下6步3,9,13:确定所研究系统的目标体系,收集有关数据;确定系统和环境的边界条件,识别影响系统功能的主要因素、主要变量和主要参数,以及它们的变化范围、约束条件和它们相互之间的关系形式;从整体出发将研究系统分解若干子系统,确定这些子系统的组成要素、主要变量和主要参数,建立各子系统模型;把各子系统模型集成为总系统模型;系统模型的编程、求解、分析、解释、验证和应用;重复以上步骤、并作相应调整,直至系统模型的合理性、实用性达到满意为止。实际上系统建模既是一种技术,又是一种艺术,提高系统建模能力,需要广泛而深入地参考他人所建立的系统模型,更需要大量的亲身建模实践,是一种需要努力积累的长期过程。水资源系统建模实际上是一种跨学科的协作过程,对复杂系统模型的求解往往具有挑战性,并能推动水资源系统工程学科与其它学科之间的渗透和发展。水资源系统建模的重要意义在于3,5,9,13:为水资源系统设计、系统分析和决策分析提供简便的研究工具;用水资源系统建模来研究实际系统在政治性、社会性、经济性、技术性、时间性、风险性和可行性等方面往往比对实际系统用实物进行实验研究要优越;水资源系统模型的理解和操作比较方便,而实际水资源系统则由于因素多、信息庞杂而不易理解和控制,实验也不易得到有用的结论;水资源系统建模提供了与计算机计算协同操作的联接条件,从而加速了系统分析的过程,提高了系统分析的有效性;某类水资源系统的建模过程往往对其它类型的水资源系统的建模过程具有典型意义。总之,通过水资源系统建模,可对各种水资源系统问题获得深刻认识,并在建模基础上解决各种实际的水资源系统问题;水资源系统建模是水资源系统工程学科与数学、计算机科学等其它学科相互交叉的一种方式,也是水资源系统工程学科理论走向实践的一条主要途径。水资源系统是一类典型的复杂系统,在水资源系统中往往有多种现象交织在一起,常见的水资源现象有:随机现象,即内涵、外延都明确,而出现时间和出现的量值呈现不确定性的现象,如某区域每年的年降雨量是随机现象;模糊现象,即内涵明确而外延不明确的现象,是人的主观判断的区间性的反映,如某区域水资源可持续利用程度是模糊现象;灰色现象,即内涵不明确而外延明确的现象,如预测某区域未来某年的需水量为一个区间,这是由于掌握的信息不充分而产生的;混沌现象,即确定性系统中对初始条件敏感的内随机现象,如河道演变过程;突变现象,即水资源系统的变化过程出现跳跃现象,如黄河断流现象;其它非线性现象,如某流域月径流过程的准周期现象、流域暴雨洪水系统的非线性过程等;空间分布不均匀现象,如中国水资源量呈东南多、西北少的分布现象。面对不同现象的水资源系统,需要建立相应的系统模型。从线性现象和线性系统的研究过渡到非线性现象和非线性系统的研究是当今水资源系统建模研究的一种明显的发展趋势。目前在水资源系统工程学科领域已投入相当多的人力和物力去观察、研究有关的非线性问题,由于这些问题的复杂性、多样性,其研究的进展要比线性问题研究缓慢,并且很难找到一种统一的方法来处理所有的非线性问题,常规的方法就是分门别类地去研究,以解决各种具体的水资源系统问题。鉴于此,本章重点探讨水资源非线性系统的建模方法。非线性系统模型是研究非线性系统问题的基础,它在系统建模中的三个主要问题是24,131:模型结构的确定、模型参数的估计和模型的有效性检验。复杂水资源系统的模型结构的确定问题仍是当前水资源系统工程学科前沿性难题之一,常规的处理方法主要有机理分析和统计分析两类方法。机理分析方法一般是对于内部结构和特性已经清楚的系统,从对事物运动、变化规律的认识出发,运用已知的物理学、化学和数学原理、定理对事物进行分析、数学处理、构造模型。由于水资源系统常常是由众多因子综合作用形成的,表现出非线性、不确定性、高维性等复杂特征,定量的机理分析至今仍是有限的和困难的。统计分析法是直接利用系统的输入输出样本数据,通过统计推断和识别方法来构造系统模型,用以模拟系统的输入输出关系。这两类方法各有优缺点和适用范围。为了满足解决各种水资源系统问题的实际需要,目前普遍采用的建模方法是机理分析与统计分析联用,即:或先通过统计分析确定有关因子之间的关联性,再在这种关联的基础上分析其内在的机理,如水库地震预报模型的建立;或者先假定有某种机理存在于所研究的水资源系统问题中,再用统计方法检验这种假设的合理性,如降雨径流相关模型的建立。而近年来被其它领域广为应用的人工神经网络方法在进行系统建模时,则无需对系统本身的性质作过多的假设,且对系统内部机理知识也无需了解太多,只要利用人工神经网络对输入输出的映射能力,就可以对系统直接进行模拟、仿真,模拟出实际系统的输入输出之间的复杂函数关系,还可以利用人工神经网络具有自学习的特点,动态地更新系统输入输出的训练样本,从而更新网络模型,使之逐步逼近实际系统的动态变化特性132,133。因此,将人工神经网络技术引入水资源系统问题中,通过建立合适的人工神经网络模型,可望能部分解决水资源系统工程中目前尚难以处理的模型结构的确定问题。对于信息不充分的水资源系统,理论上也可以考虑灰色系统模型、模糊系统模型或其它不确定性系统模型来描述,但在实际应用时需要将这些不确定性系统模型与常规方法运用于同一系统对象上,进行效果的平行比较工作,证实这些不确定性系统模型确有精度上的优势后方才可行。总之,一个实际水资源系统究竟采用何种模型结构形式,是一类双向选择,即在准确性与可操作性、适应性与稳定性之间进行权衡3,4,6。一个水资源系统模型f( ),一般是由系统输入u、输出y、参数和噪声e四项组成的。给定某个模型f (u,y,e,k),当 (3.1) (3.2) (3.3) (3.4)成立时,我们称输入、输出、参数、噪声都是线性的,如果以上4个公式中的任一个等式不满足,则该模型就是非线性的。上式中,、为实常数,k为时间变量。模型的参数估计,就是在模型的结构、模型的输入输出数据已知的情况下,去计算模型的参数值,使模型的误差函数极小化。从参数估计的角度可把非线性系统模型分为线性参数模型和非线性参数模型两类。对线性参数模型的参数估计问题,可直接将线性系统参数估计方法推而广之,而且在一定的假定条件下,可证明参数估计一致收敛。但对非线性参数模型参数估计问题,由于可能存在多个局部最优参数值问题,目前尚缺乏有效的算法。由于参数估计是一类特殊的优化问题,因此对非线性模型参数估计问题,一般可以利用常规的非线性优化方法求解。但是这些方法对参数初值一般比较敏感,常要求初值位于全局最优值附近,否则有可能收敛于局部最优值,甚至发散,所以它们的结果并不能保证是全局最优的,从而使得参数估计不是一致收敛的。因此,研究具有全局性最优且一致收敛的非线性模型参数估计算法是目前模型参数估计中的一个重要而迫切的问题。目前比较常用的系统模型的参数估计方法有131:最小二乘法及其改进、预测误差(prediction error)算法、正交最小二乘法、高阶矩算法、图解法、枚举法等,这些方法的实际应用效果不是很佳。至今为止,非线性系统模型的有效性检验问题仍是水资源系统工程前沿的重要难题。目前主要的处理方法是用新的输入数据经所确定的系统模型的作用所产生的输出误差的统计特征值、模型参数值的标准差等来检验非线性系统模型的有效性。笔者认为进行非线性系统模型有效性检验的最可行的方法也许就是,把同一非线性系统模型用于广泛的实际水资源系统问题中,在大量的实际应用研究中总结和改进该非线性系统模型的优缺点,根据解决实际水资源系统问题的效果对该非线性系统模型进行反馈式修改,从而不断完善非线性系统模型。总之,水资源系统建模是一个十分广泛的前沿性研究课题,对水资源系统工程的理论和实践都至关重要6。当今的水资源系统建模的进展有赖于水资源学科和计算技术学科的进一步发展。只要用数学作为工具去研究各种水资源系统问题就必然有建模活动,但仅限于形成数学模型尚不能解决问题,必须要解析地或数值地求解该数学模型,才能使建模过程得以彻底完成。伴随着计算机技术的迅速发展,已涌现出了许多新的优秀的计算方法,这正是近60年来水资源系统建模迅速发展的必要前提。数学建模和与之相伴的计算技术正日益成为处理水资源系统问题的关键理论、方法和工具。基于以上论述,本章将探讨基于遗传算法的水资源系统人工神经网络建模方法、基于遗传算法的水资源非线性系统建模方法、基于遗传算法的水资源灰色系统建模方法等。3.2 基于遗传算法的水资源系统人工神经网络建模方法受天文、气候、气象、下垫面、人文等众多因素的影响,水资源系统过程是一高度复杂的非线性空间过程,其中存在着大量非线性优化、系统识别、仿真、预测等问题。对于这些复杂问题,尤其对于尚不能用确切函数表示的水资源系统问题,如用统计方法则存在着如何选择模型的结构形式及非线性参数估计问题,表现出明显的局限性,而且统计模型更新工作繁重;而人工神经网络则经过神经元作用函数的简单复合就能逼近有界子集上的任意非线性函数,且模型具有自适应能力,更新方便。所以探讨人工网络在水资源系统建模问题中的应用是很有意义的。从1.3节遗传算法研究进展的论述中我们可以看到,遗传算法与人工神经网络的结合是当今一个十分活跃的研究领域。基于以上观点,本节先对人工神经网络及其在水资源系统建模问题中的应用研究进展作简要回顾,在此基础上进一步探讨加速遗传算法(AGA)与人工神经网络的结合问题。3.2.1 水资源系统人工神经网络建模方法研究进展243.2.1.1 人工神经网络研究简史 模糊集理论创立者L.A.Zadeh教授近来提出了软计算(soft computing,又称计算智能)这一新学科群134,它包括遗传算法、模糊计算、人工神经网络、随机算法、混沌计算等智能学科。人工神经网络(artificial neural networks-ANN),又称并行分布处理模型(parallel distributed processing model)或连接机制模型(connectionism model),是基于模仿人类大脑的结构和功能而构成的一类信息处理系统或计算机,它具有很多与人类智能相类似的特点,诸如结构与处理的并行性、知识分布存储、很强的容错性、通过训练学习而具备适应外部环境的能力、模式识别能力和综合推理能力135。20世纪80年代以来,人工神经网络研究重新崛起,已成为高技术研究领域中的一门令人瞩目的新兴学科分支。世界各国对人工神经网络的理论与应用的研究得到了迅速发展,神经网络理论的应用已渗透到各个领域,尤其在模式识别、知识处理、非线性优化、传感技术、智能控制、生物工程、机器人研制等方面得到广泛应用和研究。 人工神经网络的研究和发展经历了几起几伏135。1943年美国神经生物学家Warren McCulloch和数学家Walter Pitts合写了名为“A Logical Calculus of Ideas Immanent in Nervous Activity”的开拓性文章,提出了MP模型,给人们的信念是大脑的活动是靠脑细胞的组合连接实现的。在此基础上,1949年心理学家Donala Hebb在“The Organization of Behavior”书中提出了著名的Hebb学习规则:脑细胞间的通路每当参与某种活动时将被加强。该学习规则在目前一些神经网络模型中仍被应用,为神经网络的学习算法奠定了基础。1957年Frank Rosenblatt提出的感知器(perception)模型被认为是最早的神经网络模型。1959年Bernard Widrow和Marcian Haff开发出自适应线性单元(adaline)的网络模型,第一次把神经网络研究从纯理论的研究付诸工程应用,掀起了神经网络研究的第一次高潮。1969年Marvin Minsky和Seymour Papert在合著的“Perception”书中指出了简单感知器的严重局限性,再加上当时基于语言智能和逻辑数学智能的人工智能研究很热,导致人工神经网络研究陷于低潮。20世纪70年代,芬兰电子工程师Kohonen提出了联想记忆理论;日本NHK的福岛邦彦、美国波士顿大学的Grosserg进行了感知机的自适应理论的研究;日本甘利俊一进行了神经网络有关数学理论的研究;Anderson提出了盆中脑(BSB)模型。自20世纪80年代以来,人工神经网络的研究进展非常迅速。1982年美国加州理工学院物理学家John Hopfield提出了离散的神经网络模型,标志着人工神经网络研究高潮的又一次到来。同年美日两国联合举办了联合竞争型神经网络会议,接着日本宣布了“第六代计算机”工程,Grossberg对神经网络进行严格的数学分析,1984年Hopfield又提出了连续神经网络模型。1985年Rumelhart等发展了反向传播学习算法(back-propagation algorithm-BP算法),实现了Minsky的多层网络的设想。1986年在美国Snowbirds召开了第一次国际神经网络会议。自此以后,各国对神经网络的理论和应用研究迅速发展起来。3.2.1.2 BP神经网络理论研究进展 不同的神经网络结构,由于网络连接模型、输入信息的离散性或连续性、有无监督训练、神经元的作用函数和动态特性等的不同,相应的学习算法也随之不同。BP神经网络是用BP算法训练的一种多层前馈型非线性映射网络,网络中各神经元接受前一级的输入,并输出到下一级,网络中没有反馈联接。BP神经网络通常可以分为不同的层(级),第j层的输入仅与第j1层的输出联接。由于输入层节点和输出层节点可与外界相连,直接接受环境的影响,所以称为可见层,而其它中间层则称为隐层(hidden layer)。决定一个BP神经网络性质的要素有三个:网络结构、神经元作用函数和学习算法,对这三个要素的研究构成了丰富多彩的内容,尤其是后者被研究得最多。BP算法是目前应用最为广泛且较成功的一种算法,它解决了多层前馈网络的学习问题,从而使该网络在各方面获得了广泛应用。它利用梯度搜索技术(gradient search technique)使代价函数(cost function)最小化。但由于BP算法收敛速度慢,存在局部极小问题,这在一定程度上妨碍了前馈网络的更深入应用。为此,人们正致力于BP算法的改进,如卡尔曼滤波法136、同伦算法137、连续型学习算法138。 BP算法可分为在线学习算法(单样本点学习算法)和批学习算法两种。前者在其学习过程中每输入一个输入输出训练样本对后,即对网络参数进行一次调整;后者采用的策略是,每次所作的网络参数的调整是在输入了样本集中所有训练样本对后进行的。批学习算法是作为试图对在线学习算法的改进而提出的。一般认为批学习算法可以加速训练速度,使收敛过程更平滑且泛化性能更好;而欧景等139经分析比较这两种算法的学习机理和学习过程后认为,在线学习算法因为可以实现对训练样本集中每个样本点的充分逼近,所以它比批学习算法具有更好的学习效果。 李伟等140用统计模式识别的方法分析了目前在模式识别中得到广泛应用的多层BP神经网络,揭示了具有线性输出单元的多层BP神经网络用作特征提取器和分类器时具有良好性能的原因,即:多层BP网络在模式识别中有两个重要阶段特征提取和分类识别。在特征提取阶段,多层BP网络可以实现在特定分离度准则函数意义下的最优特征提取,使得学习样本集在特征空间中满足分离度函数最大;而在分类识别阶段,它可以在均方误差意义下以任意精度实现对Bayes分类器的渐近逼近,从而揭示了多层BP网络用作分类器时的优越性和在大量应用实例中取得成功的原因。Jacques等141认为,理论上仅有一个隐层的多层感知器(multiple layer perceptron-MLP)就够了,三层MLP(一个隐层)与四层MLP(两个隐层)相比,后者更易陷入局部极小,且更加难以训练,而二者在其它方面的性能相似。一般应用时既要求尽可能减少学习费用,而又要求满足一定精度,多数应用选用有一个隐层的MLP。Sartori等142认为,选取的隐层神经元数目不宜超过训练样本容量。 BP网络的神经元作用函数一般采用sigmoid作用函数y=1/(1+ex),整个网络可看成是输入到输出的高度非线性映射。席道瑛等143指出:在实际应用BP网络中,数据的表示方式对成功地解决问题至关重要,学习样本集中的输入数据及所要求的输出应当是正交的或线性独立的;对于输入向量的某个分量来说,其变化范围不可过大,最好规范成同等数量级,否则对权重的调节会引起过调或振荡;另外,学习速率和动量因子若取得太大,可能出现麻痹现象或连续不稳定,取得太小则收敛太慢。 王彦春等144的研究表明,一般情况下网络误差曲面都比较复杂,有大量平缓的“高原”和“峡谷”,又有大量的“峭壁”。当训练样本较少时,可以观察到误差曲面呈“台阶”状,一般一个台阶对应一个训练样本,当训练样本较多时,“台阶”状便不明显。现在常用的BP算法,其权值的调整量是采用误差梯度与学习速率的乘积,采用大于零的小常数。在误差曲面变化非常平缓的地方,误差曲面的梯度便会很小,如果也较小的话,会导致权值增量W也很小,其结果是迭代很多次仍不能摆脱这个平缓带;而在误差曲面变化急促的地方,它的梯度较大,这时要求较小,否则W会较大,容易发生振荡现象而难以收敛。也就是说,在误差曲面平缓区域,要求大些,而在误差曲面变化剧烈的区域,则要求很小。如果在整个训练过程中学习速率取为常数,只能取一个较小的常数,这样必然导致较慢的学习速度。为此,文献144中提出了快速BP算法,该法采用批学习的方式,在每个迭代步上考察所有样本的误差平方和较上次迭代是否有所下降,再对学习速率进行自适应调节。许强等145所采用的改进BP算法与文献144类似,即在采用批学习的前提下,比较前后两次迭代时网络全局误差E的相对大小,若E(t)E(t1),则使学习速率适当增大,反之适当减小,也就是说,在误差曲面平缓区域增大,使之很快越过平缓区,而在误差曲面变化剧烈的区域减小,避免迭代过程中的振荡。BP算法收敛缓慢的主要原因,一是网络误差函数(error function of neural networks)E()是网络参数高维空间的超曲面,该曲面存在着许多大范围的“平坦区”,又存在着大量的局部极小的“沟谷”,影响收敛速度,甚至难于收敛;二是神经元作用函数Sigmoid函数引起的“假饱和现象”。对此,罗莉等146针对输入输出值属于0,1的情况,选取“信息熵”为代价函数提出了改进的BP算法,试验结果表明收敛速度提高了。向国全等147研究认为:BP网络的总误差函数E是由网络拓扑结构、节点作用函数和训练样本所决定的,节点作用函数越陡峭则BP算法收敛越快;针对局部极小问题,提出了逐步添加训练数据的方法,收到良好效果。即设训练数据全体为N,它的子集为N1,Nm,且有N1N2Nm=N。由数据Ni形成的总误差函数记为Ei,当im时,EiEm=E,Ei的最小值E的最小值。训练时,先用数据N1,从随机选取网络参数开始训练,得到E1的最小点,记为W(1),在W(1)基础上开始用数据N2训练网络,得E2最小点W(2), ,直到用数据N训练,并得E的最小点W(m)。该法的好处在于,一是N1数据一般较少,函数E1较简单,收敛快,不易有局部极小问题发生;二是Nk+1与Nk差别不大,因而EK+1与Ek也相近,它们的最小点相距不远,因而使Nk+1从W(k)开始的训练不易碰到局部极小的问题。李众立等148论述了神经网络学习算法的研究现状和存在的问题,并根据状态空间混合法,提出了一种自适应调整学习步长的学习算法。张志华等149归纳了在实际工作中BP算法的一些急待解决的问题,如:学习收敛速度慢,甚至不收敛;网络的容错能力差,即推广能力有时不强,使识别或预测效果不佳。造成上述问题的主要原因,一方面是网络算法本身存在的缺陷,另一方面是应用学科本身的原因。他们提出了解决这些问题的主要途径:算法作局部改进;与其它技术的融合;采取专业性措施。综上所述,目前的人工神经网络,都是按人体神经网络的简单基本特性、基本网络结构和工程观点建立相应的人工神经网络模型,尚未涉及到人体神经网络的机理,以及人体神经网络的具体结构,更未涉及到人体神经网络的自我生长、重构和演化。毫无疑问,随着当代科学技术对这些问题的研究进展,人工神经网络的理论和技术也将得以“进化”。3.2.1.3 BP神经网络在水资源系统建模问题中的应用研究进展水资源系统建模问题中影响系统输出变量的因子众多、复杂,影响因子与输出变量之间的关系的复杂性往往超出了当前人类的认识能力,至今尚未明了,用物理成因途径来处理这类模式识别问题存在很大困难,目前较多地用显式的统计分析方法来解决。但是统计分析模型缺乏自适应性,模型更新困难,模型的不确定性问题往往导致模型拟合历史资料的精度较高,而模型的预测检验的精度时好时坏,不很稳定。许多事实已经证明,水资源系统建模问题中很多变量间的复杂非线性关系远非简单的代数方程所能有效表达,而对于所要解决的问题,BP神经网络并不需要预先编制出计算程序来计算,只需给它若干训练实例,它就可通过反馈式自学习来完成。基于这一显著特点,BP神经网络在水资源系统建模中已得到广泛的应用。 (1)在隐式互相关统计模式识别中的应用 用BP神经网络理论来处理这类模式识别问题是近年来的新进展,该网络模型的一类主要应用就是函数估计器150,其基本思路是:首先分析出影响系统输出变量的因子集,并将其作为BP网络的输入,每一个影响因子对应BP网络输入层的一个节点,将系统输出变量作为BP网络的输出,输入层和输出层的节点数目由具体的水资源系统建模问题来确定;当BP网络的结构确定之后,用该网络对样本实例进行监督学习,从而识别出影响因子与系统输出变量之间的复杂非线性映射关系。 吴晓(1993年)151采用BP网络研究了暴雨预报问题,提出了从决策树到人工神经网络的映射方法来构造多层神经网络,将影响暴雨形成的27个气象因子(如水汽、温、湿、能量等)作为网络的输入,将有无暴雨发生作为网络的输出,从暴雨历史资料库中获取历史暴雨资料作为该网络的训练样本,该文中利用训练后的网络对暴雨识别做了一系列试验,展示了用神经网络进行暴雨预报的应用前景。朱晓冬等(1993年)152采用BP网络预报鲁西北雷雨冰雹天气,他们选取了与鲁西北对流天气有关的特征因子,得到一个用08时常规资料判别鲁西北地区下午到夜间有无雷雨或冰雹的人工神经元分类预报网络,经过试报,该网络对有无雷雨、冰雹这3类天气的预报准确率达75%。Zhang等(1993年)153建立了日需水量人工神经网络模,输入层节点有前一日的转移水量、日最高气温、天气(晴、阴、雨)、降雨量级别(0,1),1,5),5,) mm/d)、日特征(假日、非假日),输出层的节点为日需水量的预测值。该文中将预报结果与多元回归分析模型ARMR模型、Kalman滤波模型进行了对比,结果表明,神经网络模型预报效果(平均相对误差、相关系数、相对均方误差)均好于其它模型。 杨望月等(1994年)154用BP网络来预报广西前汛期暴雨,从1981年1990年的气象资料中取34个因子作为输入层,经对600多个样本的训练,网络最高成功指数为67%。蔡煜东等(1993年)155用神经网络模型来预报鄱阳湖年最高水位,选取6个与当年最高水位有较好相关关系的前期水文气象因子,将历年最高水位划分成3个等级,利用1963年1987年共25年间的资料作为训练网络的样本,用1988年的资料作检验,结果表明,预报结果完全符合实际情况。胡铁松等(1994年)156采用联合梯度算法的BP网络来预报大伙房水库汛期平均流量,并用1972年1982年资料作预报检验,结果表明,该预报方法是有效的,而且神经网络可进行离线训练和在线应用。Kung等(1993年)157探讨了BP网络在降水预报中的应用问题,它由数据分析模块、训练模块、预报模块组成,经训练后的网络用美国孟菲斯市1982年1989年的年降雨资料进行预报检验,结果表明误差在30%以内,一个可靠的神经网络模型取决于恰当地选择输入层、隐层、输出层的结构。 Zhu等(1993年)158研究了BP网络在洪水预报中的应用问题,采取了离线预报、在线预报和区间预报3种方式进行预报,结果表明:离线预报的神经网络的性能取决于训练样本的代表性,即看网络预报洪水是样本的内插还是外延;在纽约州Butternut河1976年10月20日、1977年9月26日和1977年10月16日3场洪水在线预报中都取得了较好的效果,预报精度较以前使用的模糊推理预报方法更好。蔡煜东等(1995)159用BP网络预报大伙房水库枯水期的径流,该文中选取平均位势高、雨强、相对温度和平均气温作为输入层,经1978年1980年的资料的预报检验表明,该法预测成功率高。Hsu等(1995年)160首次将3层BP网络模型应用于美国密西西北的Leaf流域的水文建模研究中,并同滑动平均自回归模型和Sacramento土壤水文计算模型比较,结果表明:用神经网络建模优于其它两种方法;尽管神经网络方法在水资源系统建模中不存在具有物理意义的模型结构和模型参数,但它只需输入和输出数据而不需模型结构假设,而且网络经过训练和学习,其中各节点上的权重系数实际上已经隐含着我们尚不能明了的参数和模型结果,因此它不失为水资源系统工程中可供选择的一种有效方法。鉴于自然灾情评估问题从根本上说是一个模式识别问题,而BP神经网络具有逼近紧致集上任意非线性映射的能力,魏一鸣等161初步建立了自然灾害灾情评估的神经网络模型,并对1989年1990年间我国部分省份发生的45个自然灾害灾情历史资料进行了训练和测试,实例结果表明了该方法是可行的。李致家等162提出了适用于河道洪水预报的神经网络模型,并与河道洪水演算的马斯京根法进行了比较,结果表明:对于线性河道系统的实时洪水预报,马法优于神经网络模型;对于非线性河道的实时洪水预报,神经网络模型略优于马法。鉴于此,该文建议加强神经网络理论在非线性水资源系统中的应用研究。 丁晶等163应用BP网络模型预报兰州站过渡期(5月、6月)月径流量,网络输入为贵德站以上前一个月降水量、贵德兰州区间前一个月降水量、贵德站前一个月流量和兰州站前一个月流量,并与多元回归方法作比较,研究表明前者的预报效果好于后者。 珠江三角洲河口地区的水位变化同时受到上游洪水和下游潮水的影响,河网各水道的相互作用使得水位变化更加复杂和具有非线性的特点,吴超羽等164用BP网络成功地模拟了本质为非线性的河口网河地区实际水位过程,所建立的BP网络的输入是三水、马口站最高水位,南沙和万顷沙西站的日最高潮位,网络输出为容奇、大洲和甘竹站的水位,计算结果表明:当网络模型只用马口站作为输入(也即仅考虑洪水影响)时,即使在受洪水影响较大的甘竹站,其误差也较大;而当网络模型包括了洪(三水、马口)和潮(南沙、万顷沙西)作为输入时,各站平均验证误差一般在10cm以下,结果令人满意。(2)在隐式自相关统计模式识别中的应用目前,用BP神经网络模型来模拟和预报水资源时间序列也取得了不少经验,基于BP神经网络的水资源时间序列的模拟和预报是一种隐式参数的建模方法150。训练这类神经网络的样本集就是水资源时间序列的实测资料,经训练后的网络掌握了实测资料所反映的水资源规律,于是就可用于水资源序列的模拟和预报。 French等(1992年)165用一个3层BP网络预测雨强场的时空分布,把当前雨强场作为输入预测1h以后的雨强场,结果表明,神经网络能较好地预测训练中出现的事件。Macher等(1993年)166提出了用Box-Jenkins方法与启发式方法来确定用于水资源时间序列预报的BP网络的输入层和隐层的结构,即通过ARMA模型中自回归项数来确定BP网络输入层的节点数目,隐层节点数目依照输入层节点数目和训练样本数按启发式规则近似确定,采用4条河流的资料进行神经网络模型与其它模型(ARMA、FGN、Markov等)的预报效果进行比较,结果表明:在提前一个时段的预报中神经网络模型预报效果最佳,在提前多个时段预报中神经网络模型与ARMA模型相近;在提前一个时段的预报中,网络的性能随输入层、隐层的节点数目的增加而变差。 Raman等(1995年)133应用三层BP神经网络模型进行了多变量水资源时间序列的模拟,用于训练的样本是印度Manglam、Pothundy两水库1977年1990年的月入流序列,用训练好的网络来模拟月入流序列,并与多变量AR(2)模型的模拟结果进行比较,结果表明:神经网络模型具有更高的精度,用神经网络模型模拟水资源序列是可行的。 钟登华等(1995年)167研究了用BP神经网络模型进行水资源时间序列预报,网络训练集为水资源实测序列,输出分单输出和多输出两类,在实例研究中,对石泉水电站1987年9月37日进行时段流量预报的合格率为85.7%,对沅水陵至王家河河段1968年8月的一次洪水进行预报的合格率为95.8%,结果表明:由于神经网络有很好的非线性映射能力,把神经网络应用于水资源预报建模具有广阔的应用前景。水资源时间序列BP神经网络模型的输入层节点数目与输入样本序列的长度及样本序列的时序特征有关,寻找对水资源序列进行预处理的方法以及建立适合水资源长序列的神经网络模型,仍是今后值得进一步研究的课题。(3)在水资源优化问题中的应用目前在水资源学科领域主要采用的优化计算方法有线性规划、非线性规划、动态规划、大系统理论、多目标决策技术等13。由于BP神经网络是一种由大量简单非线性单元广泛连接而成的、可以高速并行处理的系统,具有高度非线性处理能力,它能快速收敛于状态空间中某一稳定平衡点(对应于其能量函数的极小点),因而它可作为优化计算方法模型而被应用于许多复杂优化问题的求解中,为优化计算方法的研究提供了一条新的途径。胡铁松(1995年)168研究了BP网络在水库群优化调度中的应用,建立了基于BP网络的并联水库的优化调度模型,结果表明:这个网络用于PK地区水库调度是可行的,能有效克服其它方法在高维情况下的“维数灾难”;但这些方法存在较强的初值与参数的不稳定性和局部最优解问题,如何获得全局最优解有待进一步的研究。Ranjithan等(1993年)169采用BP网络研究了地下水优化调度管理问题:采用一个包含隐层的BP网络,在不影响地下水回灌方案的可靠性水平的前提下,大大减少了地下水优化管理的机遇约束混合整数规划模型的约束条件。(4)在组合预测中的应用组合预测从集结尽可能多的有用信息出发,充分利用不同单个模型的各自优点,弥补单个预测模型对于预测问题的片面性,从而使预测模型具有对环境变化的适应能力。组合预测方法的关键在于确定各模型的权重,而BP网络是模拟大脑神经系统的一种计算模型,它可以学习已有的知识,适于处理非线性的、含有噪声的、模糊的系统,擅长于非线性问题的处理,利用它可以方便地训练出权重。基于此,陈秉钧等170提出了将BP网络应用于组合预测的新方法,实例研究结果说明了该方法的可行性。(5)在专家系统研制问题中的应用在模拟人的智能方面,专家系统(ES)适合于模拟人的逻辑思维演算,而神经网络则适合于模拟人的形象思维归纳,将两者有机地结合在一起无疑是模拟智能更有效的途径。近年来, ES在水资源系统问题中的研究与应用也开始活跃起来,开发了一些ES示范原型,但总体上说还离实用阶段较远。其中的原因是多方面的,主要有知识获取的瓶颈问题,知识的显式表达,知识推理中的“组合爆炸”、“无穷递归”问题,自学习能力差,更新困难,数值程序嵌入困难等。而BP神经网络恰好模拟了人脑的一些基本功能:知识分布式存贮;信息大规模并行处理;具有学习、记忆、联想、归纳、概括和抽取、容错以及自学习、自适应的能力;通过用成功实例对网络进行训练,它能自动抽取输入、输出之间的复杂关系,并通过环境条件变化所产生的新样本的训练来不断调整、更新网络内容。显然,BP神经网络的这些功能为解决专家系统中的知识获取和表示、并行推理等问题提供了一条有效的途径,因此,BP神经网络和专家系统技术的结合,必将进一步推进人工智能在水资源系统研究中的开发与应用进程。刘国纬等171在南水北调东线工程运行管理研究中,提出了基于神经网络的调度咨询专家系统,该系统的自动知识获取模块采用BP网络,从调度知识的搜集仿真试验结果数据库中获取专家知识,用该系统进行洪泽湖1980年10月调度过程咨询,取得了满意结果。张继群(1995年)172进行了洪水灾害影响程度的神经网络专家系统的研究,其BP网络的输入层为灾害等级、测报防能力、抗救灾能力、重建恢复能力,输出层为灾害社会影响程度。 综上所述,BP神经网络的大规模并行处理、信息的分布式储存、连续时间非线性映射能力、全局集体作用、高度的容错性和鲁棒性、自学习、推理泛化能力等一系列优良特征,是水资源系统工程中许多常规研究方法所不具备或无法比拟的,这为BP神经网络在许多复杂水资源系统问题研究中提供了一条新的有效途径。但是,BP神经网络在水资源系统工程中的应用研究,国内外均处在探索阶段,目前的成果仍是初步的,尚有不少问题值得进一步研究,主要有: 当给定网络结构时,为达到好的网络泛化(generalization,又称推广)能力,需要什么样的训练样本,样本容量多大,特别是当研究对象是稀遇事件时,样本的代表性、容量等问题都值得研究。从几何角度看BP网络模型,网络学习相当于根据给定离散的样本数据点来恢复一个连续的超曲面,在样本点处曲面的值要逼近样本值,而网络推广则相当于估计非样本点所对应的该超曲面上的值(内插)。BP网络模型是建立在大量且有代表性的样本资料基础上的,它反映了也仅仅反映了样本本身所表示的系统输入和输出关系,学习后的网络模型所存储的也全部是样本所包含的信息。当样本资料较少或代表性较差时,据此训练成的网络的有效性会大大降低;而当预测事件超越训练样本的范围时,网络可能会出现困惑与失误现象。因此,如何识别样本资料的代表性,以及在样本资料少或代表性较差时如何提高网络的适应能力仍将是BP网络应用研究中的一个急待进一步深入研究的问题。当训练样本量已定时,如何确定合理的网络拓扑结构。Kolmogorov定理已经证明了多层感知机可以表示从某个输入空间到某个输出空间的任意有界连续映射问题,但该定理只是个存在性定理,它没有给出关于如何构造网络的提示,但至少从工程应用角度看,网络的构造是非常重要的,BP网络的具体构造在很大程度上还需依靠网络设计者的知识和经验。BP神经网络方法只研究输入与输出,从系统观点看,网络中的隐层数目、各隐层的节点数目以及各节点上作用函数和权重系数是一种“黑箱”,它们缺少必要的物理意义和理论基础,只是一种计算机的局部“拟合优化”过程。为此可考虑用小波变换(wavelet transform)、模糊变换函数等作为神经元的作用函数,以克服网络参数物理意义不明确的问题。一般来讲,水资源系统问题研究中应用的BP网络,其输入层、输出层节点数目常可依据实际情况较易确定,而有关隐层节点数目的确定及其归纳能力的研究尚无明确的结论,但这些问题是与BP网络能否成功应用密切相关的。当BP网络的拓扑结构、训练样本都已确定时,如何选择合适的训练算法,以使网络快速收敛于全局最优解。学习是BP网络区别于其它建模理论的重要特性,与此有关的学习算法自然是BP网络理论研究的一个重要问题。BP算法是BP网络应用得最多的一种学习算法,从数学上看,BP网络的训练是一种高维非线性优化问题,BP算法本质上是一种梯度下降法,在应用中不可避免的会遇到局部极小问题,从而影响网络的外推能力;它的训练速度很慢,尤其到训练后期离极值点较近时,更是如此;目前,网络隐层节点数的选取尚无理论上的指导,只能根据经验选取;它的学习参数的设置目前仍处在经验性的试错阶段。这些缺点严重限制了它的实际应用,目前的BP算法研究也主要针对这些缺点而进行的。迄今已提出上百种学习算法,但尚没有一种算法被公认为是十分成功的。BP算法的泛化能力与训练样本特性(代表性、相关性、正态性、平稳性和样本容量)、网络结构、节点的作用函数、学习算法、数据预处理方式等许多因素有关。例如,虽然BP网络理论上可映射任意复杂的非线性函数关系,但计算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公交星级考试试题及答案
- 卓越厂级安全培训试题及答案解析
- 2025年餐饮火锅考试试题及答案
- 学校安全保卫测试题及答案解析
- 2025贵州遵义医科大学附属口腔医院第十三届贵州人才博览会引进急需紧缺专业人才6人考前自测高频考点模拟试题及答案详解(典优)
- 2025-2030工业自动化领域无线传输模块技术演进与市场应用前景
- 2025-2030工业自动化控制系统行业市场供需状况技术趋势及商业模式创新研究报告
- 2025-2030工业级滑石粉质量分级标准与采购决策模型
- 2025-2030工业级光纤跳线抗干扰性能测试与数据中心应用场景拓展
- 2025-2030工业级3D打印设备下游需求结构演变
- 甲状腺课件类型
- 单招备考科学方案
- 2025年秋新人教版数学三年级上册全册教学课件
- 医美咨询培训课件
- NoSQL数据库应用与实践 课件 第1-6章 认识NoSQL - 增删改查
- DB37-T4868-2025 既有公路隧道结构健康监测技术规范
- 供应链金融视角下涉农中小企业信用风险评估研究
- 宁夏差旅费管理办法文件
- DB51∕T 3231-2024 公路隧道岩爆防控技术规程
- 新高考考试命题培训心得体会
- 2023CSCO头颈部肿瘤诊疗指南
评论
0/150
提交评论