




已阅读5页,还剩57页未读, 继续免费阅读
(水文学及水资源专业论文)非汛期径流预报方法的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着社会主义现代化事业的不断发展,国民经济各个部门对水文预报提出的 要求越来越高:从防洪抗旱的指挥,大中小型水利、水电、水运工程的兴建、管 理运行直至国防建设都要求水文部门能提供预见期长、准确性高的径流预报。 径流预报方法可以分为两种:过程驱动方法和数据驱动方法。过程驱动方法 认为从系统的理论来看,径流是流域系统的输出。它用数学的方法估计控制径流 过程的流域内在物理过程。而数据驱动方法是基于黑箱子方法的,它从数学上识 别输入和输出的关系,而不考虑流域内在的物理机制。 本文首先对径流预报的意义和研究现状进行了概述,介绍了数据驱动模型的 三种理论和方法:逐步回归分析、b p 神经网络和多维时间序列模型。分别对影 响伊洛河流域黑石关、卢氏和栾川站日径流过程的因素进行了分析,在此基础上, 选取合适的预报因子,确定模型的结构和参数。 根据递归的方法,用率定好的模型和综合预报方法对各站1 9 9 6 - 2 0 0 1 年非汛 期日径流过程进行多步外推预报,对试报结果进行了分析和比较。 本研究建立的模型计算方便,应用简单,所需的资料和参数较少,进一步完 善后可广泛应用于其它地区的径流预报。 关键词:径流预报;逐步回归分析;b p 人工神经网络;多维时间序列 a b s t r a c t w i t ht h ed e v e l o p m e n to fs o c i a l i s mm o d e r n i z a t i o n , h y d r o l o g i cf o r e c a s t i n g b e c o m e si n g r e a tr e q u e s t d i r e c t i o n o fd r o u g h t r e s i s t i n g a n df l o o dp r o t e c t i o n , c o n s t r u c t i o n , m a n a g e m e n ta no p e r a t i o no fh y d r a u l i cp r o j e c t ,a sw e l la sc o n s t r u c t i o no f n a t i o n a ld e f e n s ea l lr e q u i r eh y d r o l o g i cd e p a r t m e n tt op r o v i d er u n o f fp r e d i c t i o nw i t h l o n gl e a dt i m e sa n dh i 【g hv e r a c i t y m e t h o d so fs t r e a m f l o wf o r e c a s t i n gf a l li n t ot w oc a t e g o r i e s :p r o c e s s - d r i v e n m e t h o d sa n dd a t a - d r i v e nm e t h o d s t h ep r o c e s s - d r i v e nm e t h o d sc o n c e i v eas t r e a m f l o w p r o c e s sa st h eo u t p u to faw a t e r s h e ds y s t e mi n t h ev i e wo fs y s t e mt h e o r y , a n d m a t h e m a t i c a l l ya p p r o x i m a t et h ei n t e r n a lp h y s i c a lp r o c e s s e so ft h ew a t e r s h e ds y s t e m t h a tg o v e r nt h es t r e a m f l o wp r o c e s sb a s e do n s o m eu n d e r s t a n d i n go ft h o s ep h y s i c a l p r o c e s s e s b yc o n t r a s t , d a t a - d r i v e nm e t h o d sa r ef u n d a m e n t a l l yb l a c k - b o xm e t h o d s , w h i c hm a t h e m a t i c a l l yi d e n t i f yt h ec o n n e c t i o nb e t w e e nt h ei n p u t sa n dt h eo u t p u t s , w i t h o u tc o n s i d e r i n gt h ei n t e r n a lp h y s i c a lm e c h a n i s mo fw a t e r s h e ds y s t e m t h i st h e s i s f w s t l ys u m m a r i z e st h es i g n i f i c a n c ea n dp r e s e n t s t a t u so ft h e s t 陀锄f l o w f b c c 嬲t i n 吕1 1 l i o fd a t a d r i v 饥m e t h o d sa 盂;蚤o d u c e d :s t e p 而辩 r e g r e s s i o na n a l y s i s ,b pa n n a n dm u l t i v a r i a t et i m es e r i e sm o d e l f a c t o r st h a ta f f e c t h e i s h i g u a n , l u s h i ,l u a n c h u a ng a u g e 。sd a i l ys t r e a m f l o wp r o c e s sa r ea n a l y z e d t a k e a p p r o p r i a t ef a c t o r si n t oc o n s i d e r a t i o n , a n dd e t e r m i n es t r u c t u r ea n dp a r a m e t e r so ft h e m o d e l s b yt h em e t h o d so fr e c u r s i o n ,s t r e a m f l o wp r o c e s s i sf o r e c a s t e di nl o w - w a t e r p e r i o do f1 9 9 6 - 2 0 0 1 ,w i t hl e a d t i m e so fs e v e r a ld a y s t h er e s u l t sa r ec o m p a r e da n d a n a l y z e d t h em o d e l st h i st h e s i sc o n s t r u c t sa r et ob cp e r f e c t e dt ob eu s e di nm o r er e g i o n s k e y w o r d s :s t r e a m f l o wf o r e c a s t i n g ,s t e p w i s er e g r e s s i o n ,b pa r t i f i c i a ln e u r a ln e t w o r k , m u l t i v a r i a t et i m es e r i e s , 学位论文独创性声明: 本人所呈交的学位论文是我个人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工 作的同事对本研究所做的任何贡献均已在论文中作了明确的说明并 表示了谢意。如不实,本人负全部责任。 论文作者( 签名) : 蕴国区么。9 年月他e l 学位论文使用授权说明 河海大学、中国科学技术信息研究所、国家图书馆、中国学术期 刊( 光盘版) 电子杂志社有权保留本人所送交学位论文的复印件或电 子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文 档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允 许论文被查阅和借阅。论文全部或部分内容的公布( 包括刊登) 授权河 海大学研究生院办理。 论文作者( 签名) ;盔区! 型z 。7 年6 月t o 日 第1 章绪论 第l 章绪论 1 1 引言 水作为人类必需而不可替代的一种资源,是实现社会经济可持续发展的重要 物质基础。进入2 1 世纪,水文学问题受到越来越多的关注,因为它关系到为全 人类的福祉。随着人口的快速增长,工业的发展,各种用水量在一个相当长的时 期内还将继续增加,但是水的总量是不变的,水资源问题将变得更加复杂和严峻。 众所周知,在我国半干旱半湿润地区水资源的供需关系非常紧张,以致出现 了一系列问题,成为阻碍经济发展和引起社会不安定的重要因素之一。如何科学、 有效地利用当地有限的水资源( 包括地表水和地下水资源) ,并坚持水资源可持 续开发利用的原则,是当前十分迫切需要研究和解决的课题【。径流预报的任务 就是分析研究、掌握运用水文过程的客观规律,提示和预报未来的径流过程,从 而帮助人们更好地控制和利用水资源。 实际上,由于气象、自然地理特性和人类活动等因素影响,径流过程既有确 定性规律,又有随机性和模糊性规律。由于目前预报技术仍比较落后,资料的完 备性比较差,理论不十分成熟等,至今尚未真正掌握上述规律,因此水文要素的 预报水平还比较低,这种状况远远不能满足水库及水利系统运行控制和各需水部 门计划生产的要求。由于一方面,在枯水季节,江河水量逐渐枯竭,而各部门的 用水需要却十分迫切,并且相互之间存在一定的矛盾,这就要求作好径流预报, 以合理安排水资源;另一方面,受季风气候的影响,我国半干旱半湿润地区干湿 季节分明。干季( 枯季) 降水量少,持续时间长,河川枯季径流主要是由流域蓄 水补给,径流过程一般呈现较稳定的消退规律,这为较长预见期的枯季径流预报 提供了理论依据和有利条件i l j 。 1 2 国内外研究概况 水文预报方法很多,可以粗略地分为过程驱动模型方法和数据驱动模型方法 两大类【羽。过程驱动模型指以水文学概念为基础,对径流的产流过程与河道演进 过程进行模拟,从而进行径流过程预报的数学模型。数据驱动模型则是基本不考 虑水文过程的物理机制,而以建立输入输出数据之间的最优数学关系为目标的黑 非汛期径流预报方法的应用研究 箱子方法。数据驱动模型以回归模型最为常用,近年来新的预报手段得到很快发 展,如神经网络模型、非线性时间序列分析模型、模糊数学方法和灰色系统模型 等,同时,水文数据的获取能力及计算能力得到飞速发展,因此,数据驱动模型 在水文预报中得到越来越广泛的关注和应用【3 l o 1 2 1 回归分析方法 回归分析方法在生产实践中的广泛应用是它发展和完善的根本动力。如果从 1 9 世纪初高斯( g a u s s ) 提出最小二乘法算起,回归分析的历史已有1 9 0 多年。 从经典的回归分析方法到带控制项的回归分析方法,它们所研究的内容己非常丰 富:一元回归,多元回归,回归诊断等【4 l 。 2 0 0 2 年,陈乐湘等采用分析与图解相结合的方法解决多因子非线性相关计 算,求回归方程的问题,并成功用在淮河王家坝水文站最高洪水位预报【5 1 0 葛朝霞,王会容等利用相关分析方法,对柘溪水库月入库流量与全球海温及 2 7 类气象因子的关系进行了分析研究,通过逐步回归,建立了3 种类型的月入 库流量预报模型,并进行了对比分析,研究结果表明:影响柘溪水库月径流量的 主要因子有青藏高原西部西风带系统、西太平洋副热带高压和西南季风;前期海 温对柘溪入库流量有重要影响,关键海区在北部印度洋和北赤道中西段【6 l 。 梁忠民等提出一种基于数理统计的方法来预报中期降雨,对潘家口水库的预 报结果表明,该方法简单易行,对资料条件要求不高,预报结果可供水库实际防 洪调度参考川。 2 0 0 5 年,高剑平针对用电量预测的多元线性回归模型,提出了逐步回归分 析方法,通过计算分析表明,与多元线性回归模型预报方法相比较,逐步回归预 报模型对用电量的预测是有效的【引。 张雯怡等利用逐步回归分析优选因子的功能和遗传程序设计搜索模型结构 能力强的优点,建立了多年调节水库年末消落水位预报模型,并将其用于多年调 节水库年末消落水位的预报。模型通过逐步回归分析寻找因子,再利用演化计算 自动寻找最优的模型结构,与传统方法相比不仅具有较大的灵活性和智能化,而 且在一定程度上提高了遗传程序的寻优效率。结果表明,模型适应性强,预报精 度高,可以为水库调度提供一定依据1 9 】。 2 第1 章绪论 2 0 0 6 年,r o b e r tm g o l d s t e i n 等用逐步线性回归的方法,研究了在大的地理 尺度上,土地利用对流域物理特性的影响能否确定的问题,发现气候、地形等比 土地利用影响更大;而当尺度减小时,后者变得重要起来【埘。 1 2 2 人工神经网络 进入2 0 世纪9 0 年代,由于计算机软、硬件的日益成熟,功能迅猛增强,许 多凭借于计算机的高速计算功能而得以发展的人工智能技术,如人工神经网络 ( a r t i f i c i a ln e u r a ln e t w o r k s 。缩写为a n n ) 、遗传算法、模糊逻辑、决策树等在 水文科学领域广为应用。a n n 因其结构的灵活性和具有模拟非线性关系的能力, 近年来已应用于地下水管理、洪水预报、径流中长期预报、水质模拟与预报、水 资源的模式识别与分类等方面,并取得良好效果。a n n 是数据驱动模型,是一 种以建立输入输出数据之间的最优数学关系为目标的黑箱子方法,能很好地反映 径流时间序列的非线性关系。它不能对水文现象进行物理解释,其参数也不具有 任何物理意义1 1 1 】。 f r e n c h 等人最早讨论了a n n 在水文科学领域研究中具有的优势【1 2 1 。1 9 9 7 年,h s u 和g u p t a 等人在他们相关的研究中开始涉及如何提高a n n 的训练时间, 论述了采用l l s s i m 算法提高a n n 训练速度的问题,并将其应用日降雨径流过 程模拟。他们将a n n 的模拟结果与线性a r m a 模型和萨克拉门托模型进行了 比较,发现前者的模拟精度优于后面两种模型【1 3 】。 m i n n s 等人对用蒙特卡罗方法生成的人工序列进行研究。一个三层的b p 网 络用于建模,输入模式包括同期及前期1 4 个时段的降雨和3 个前期径流分量, 用以预报同期径流【1 4 1 。m a i e r 等人认为,对于复杂的水文系统模拟,a n n 模型 的一个明显优势是它们径流对有噪声干扰的数据不那么敏感,即使有趋势或季节 变化的非平稳序列也可以隐含在它们的内在结构中【1 5 】。f e r n a n d o 和j a y a w a r d e n a ( 1 9 9 8 年) 以径向基函数r b f 网络对径流进行模拟,后来又以r b f 型网络和 o l s 算法来进行径流预报,并与a r m a x 、b p 和实测资料比较,预报结果相对 精确【1 6 1 。 s a j i k u a m a r 等人采用多层次前向网络及回归网络进行月径流预报i 。a v i n a s h a g a r w a l ,r d s i n g h 建立了多层b p 网络来模拟印度n a r m a d a 河的降雨一径流过 3 非汛期径流预报方法的应用研究 程,结果表明效果比改进线性转移方程模型好【1 s l 。 国内,吴超羽和张文较早以神经网络作为水文预报模型,对年日均及洪水季 节径流序列应用b p 网络进行预报。并与常用的简单线性模型作了比较,认为人 工神经网络模型在明显增加预报长度的同时,也提高了预报精度【1 9 i 。台湾有篇论 文自组性演算法于河川流量预测之研究( 1 9 9 5 年) ,以逐步回归显著性水平 控制模拟长期径流系统的人工神经网络模型,证实了二次非线性函数已可满足水 资源量预估。 2 0 0 2 年刘少华在“一种水文序列预报的新方法”一文中探讨了结合混沌理 论的神经网络,并在对长江宜昌站径流预报进行了实际检验,取得了良好结果l 刎。 张翔等针对神经网络洪水预报模型的结构难以确定的问题,应用一种在讲练过程 中可调整隐含层神经元数的算法,建立了变结构神经网络洪水预报模型。该方法 提供了设计面向问题的网络结构的途径,在网络结构设计、提高洪水预报精度等 方面具有一定的实用性【2 1 1 。 覃光华等学者在论文“基于人工神经网络的卡尔曼滤波实时校正技术”中, 将神经网络与卡尔曼滤波技术结合,充分利用神经网络模型拟合效果好、卡尔曼 滤波技术校正能力较强的优点对淮河流域王家坝水文站最高洪水位、岷江上游河 段紫坪铺水文站的径流进行了预报,计算实例表明,该模型较之标准的神经网络 模型或卡尔曼滤波模型,在预报精度上均有较大的提高瞄】。 2 0 0 3 年刘素一等学者在论文“小波变换结合b p 神经网络进行径流预报”一 文中对比了b p 神经网络、小波变换结合b p 神经网络这两种方法对径流预报的 结果,并对第二种方法给予了充分肯定瞄1 。王玲等讨论了a n n 应用中存在的几 个关键问题,提出采用增加监控样本的办法来预防网络过适应现象,以增强网络 的概化能力,并以淮河流域为例,将经过改进的b p 网络模型应用于流域日径流 预报中,得n t 较高的模拟精度瞄i 。 1 2 3 时间序列模型 时间参数取离散值的随机过程称时间序列。考虑到水文时间序列的非平稳 性,6 0 年代前后主要采取把序列分解为趋势项、平稳项、噪声项,然后分项预 报,再进行叠加来获得预报结果。7 0 年代,g p b o x 和g m j e n k i n s 发表专著( ( t i m e 4 第1 章绪论 s e r i e sa n a l y s i s :f o r e c a s t i n ga n dc o n t r o l ,使时间序列分析的应用成为可能,标 志着时间序列理论进入到一个新的阶段。几十年来,时问序列模型无论是理论上 还是在应用方面,都有迅速的发展。自回归求各模型,自回归移动平均,即 a r m a d a ) 模型,自回归移动平均求和即a r i m a p 砌) 模型以及处理非线性问 题的门限自回归( 1 a r ) 模型均已应用于径流的长期预报。 时间序列的研究也经历了传统时间序列分析和现代时间序列分析两个发展 阶段【矧。传统的时间序列通常研究变量、平稳随机过程,是在a r m a 模型基础 上,根据观测样本的自相关函数、偏相关函数的“截尾性”或“拖尾性”进行模 型辨识与初定阶;但由于计算中的位数保留误差,其“截尾性”或“拖尾性”不 可能直观地表现出来,必须借用统计学上的假设检验来判断,而且需要比较精确 地求得初参数,否则,迭代计算有可能不收敛1 2 6 1 。 7 0 年代中后期以来,国内外有些研究者开始采用现代时间序列的一些模型 和思路。1 9 9 3 年,夏军提出了用灰关联模式识别的方法进行中长期径流预报【韧。 此后有研究者将此类模型应用于年、月径流预报。对多维时间序列的分析很早就 开始了, t u n e s e r i e s a n a l y s i s :f o r e c a s t i n ga n d c o n t r o l 一书中就采用过将天然 气的输入速率作为输入变量,研究c 0 2 的输出浓度,由此将时间序列的分析领 域由一元拓展到了多元的场合【矧。 对多维时间序列的分析建模,目前已有较多研究( h a n n a n ,1 9 7 0 ;安鸿志, 1 9 8 6 ;邓自立,1 9 8 5 ) ,并有很多建模方法。由于多维自回归滑动平均( 咀m a ) 模型的建立十分复杂,一般应用多维自回归( v a r ) 模型代替v a r m a 模型( 邓 自立等,1 9 8 5 ) 而对动态系统实行统一建模,这是因为任何v a r m a 模型均可以 充分将高阶的v a r 模型逼近到任意精度1 2 9 。 付强等应用多维自回归模型a r v 伽) 建立了井灌水稻生育期内需水量预测模 型,分析表明,日平均气温、日照时数等6 维变量序列之间存在密切关系,对水 稻需水量预测均必不可少,模型拟合精度较高,预测效果良好1 3 0 1 。 2 0 0 1 年,梁忠民用多变量a r ( 1 ) 随机模型对南水北调中线工程水源区的可调 水量及各供水区的缺水量进行了联合模拟研究,并由模拟的长序列进行供需意义 上的供水量风险计算【3 1 i 。 5 非汛期径流预报方法的应用研究 有些学者也在时间序列和a n n 模型耦合方面进行了研究。钟登华、王仁超 探索利用输入输出数据建模的方法。建立了单输出和多输出的水文预报时间序列 b p 模型,对时段径流量和洪水出流量进行了较好预估【3 2 1 。姜铁兵分别将a r m a x 模型和多层b p 网络应用于流量演算中模型参数确定的方法,并对结果进行了对 比分析【3 3 】。采峰,曾风章提出了预测城市用水量的a n n - a r m a 模型,相对误差 小于带有动量的反向传播人工神经网络模型预测的相对误差,取得了良好的效 果。 近年来,有人主张尽可能地采用参数估计和定阶都比较简单的a l l 模型来描 述实际序列,即使真实模型是m a 或a r m a 序列,也可以用高阶a r 模型来近 似描述p 4 l 。文献【3 5 】证明了基于任何可逆的a r m a 模型都可用阶数充分大的a r 模型逼近到任意精度。 虽然目前水文预报模型很多,但还没有一种模型对所有的水文序列来说都是 适用的。预报模型的适用性至今仍是有待深入研究的问题。对一个具体水文序列 的预报问题,往往是通过分析、尝试、检验等步骤,最终找到合适的预报模型。 在预报理论研究上,更多注重的是水文系列的统计相关特性,而对物理成因关系 的关注相对较少;在预报方法上,对各种方法的有效性研究不够,使现有的方法 很难在实践中推广应用;在预报结果的实际应用上,径流预报目前主要是对水资 源的宏观调控起一些参考性作用。 1 3 本文研究内容 根据目前径流预报的现状,在分析影响径流的主要因素的基础上,合理选择 因子对伊洛河三个水文站的日径流进行预报。目前径流预报主要方法有过程驱动 和数据驱动模型,数据驱动模型以其应用简单而受到人们的关注和广泛应用,但 对于比较复杂的因果关系、高度非线性的映射,则存在很多难以解决的问题。 本文论述了径流预报的多种理论和方法,介绍了在伊洛河的应用成果。对日 径流过程和选用的因子的历史资料进行分析,从中寻找两者之间的统计规律,在 此基础上采用数据驱动模型中的多元逐步回归分析,人工神经网络,时间序列等 方法,建立径流预报模型,通过逐步外推法,对黑石关、卢氏和栾川站1 9 8 6 2 0 0 1 6 第1 章绪论 年非汛期的日径流过程作多步计算,对不同地区的效果进行了分析比较。本次研 究的技术路线如图1 - 1 。 图1 1 研究的技术路线图 第2 章逐步回归模型 第2 章逐步回归模型 2 1 回归分析简介 回归分析研究的主要对象是客观事物变量间的统计关系,它是建立在对客观 事物进行大量试验和观察的基础上,用来寻找隐藏在那些看上去是不确定的现象 中的统计规律性的统计方法。回归分析方法是通过建立统计模型研究变量间相互 关系的密切程度、结构状态、模型预报的一种有效的工具【4 j 闭。 回归分析根据变量的多少有一元回归和多元回归之分,而多元回归又可分为 一个因变量对多个自变量之间的回归和多个因变量对多个自变量之间的回归。每 种回归又可分为线性回归和非线性回归i 删【3 7 1 。与模拟模型相比,回归分析法需 要的输入资料少,易于建立和使用,这使它在很多领域广泛应用【1 1 。 一元回归是最简单的回归分析方法,其数学模型为: y _ p o + 卢工+ f ( 2 1 ) 式( 2 1 ) 称为y 关于x 的回归方程,风和芦是待定系数,称为回归系数; 是随机变量,可以看作是y 中无法由工线性表示的各种复杂的随机因素组成的误 差。 在现实生活中存在大量复杂现象,因变量的主要影响因素不止一个,很难从 中抽出一个因素建立一元回归方程。如水文分析和预报等工作中,对于研究的变 量y 虽可从物理联系方面选出一些对y 有影响的自变量,但由于变量y 构成的复 杂性,这些因子对y 的关系空间如何,不是单凭物理分析就可判定的。其中可能 有些对y 有显著影响,有些则影响很小。自变量之间也可能会相互影响,或者说 存在线性相关。有些自变量单独看,可能对因变量有作用,但与其他变量放在一 起,其作用可能被其他变量所代替,使之在回归方程中的作用微不足道。为了避 免遗漏对y 有显著影响的因子,所以在初选因子往往比较多,要求出所有可能的 回归方程是不现实的。 人们总是希望,不但求得的回归方程是显著的,而且在回归方程中的自变量 也都是尽可能显著的,也就是要选择最佳的回归模型。现有方法各有优缺点,至 今还没有绝对最优的,目前常用的方法有“前进法”、“后退法”、“逐步回归法”, 面逐步回归法最受推崇【3 8 3 9 1 。 9 非汛期径流预报方法的应用研究 2 2 逐步回归分析原理 逐步回归的基本思想是有进有出。具体做法是将变量一个一个引入,当每引 入一个白变量后,对已选入的变量要进行逐个检验,当原引入的变量由于后面变 量的引入而变得不再显著时,要将其剔除。引入一个变量或从回归方程中剔除一 个变量,为逐步回归的一步,每一步都要进行f 检验,以确保每次引入新的变量, 之前回归方程中只包含显著的变量。这个过程反复进行,直到既无显著的自变量 选入回归方程,也无不显著自变量从回归方程中剔除为止【3 9 1 。其计算步骤如下: 1 建立正规方程 正规方程为 s 1 1 饥+ $ 1 2 b 2 + + s h kisl,(2-2) j 2 l 以+ 占2 2 b 2 + + j 抽b m _ s 2 ,( 2 - 3 ) s , l b l + s 麻2 b 2 + + s 删。k s 胛( 2 - 4 ) 为了使计算有更好的数字效果,可以将上述正规方程修改为 r n b l 。+ r i 2 b 2 + + 吒一,l ,( 2 - 6 ) ,2 a + k 6 2 + + 吒一,2 ,( 2 - 6 ) _ l b l + r m 2 b 2 + + k - k ( 2 - 7 ) 式中r o 是相关系数,有相关矩阵 r o - s q s h $ 1 d ( 2 - 6 ) i ,j 一1 ,2 ,m ,y ( 2 - 9 ) 显然白一1 。此外,新方程的解岛与原方程的解以有如下关系: b i - b i c 、瓦 ( 2 1 0 ) i 一1 ,2 ,m ( 2 - 1 1 ) 相关矩阵( r o ) 的逆矩阵( g ) 与离差矩阵( ) 的逆矩阵( c o ) 的关系 为: c j ,一c f 屯s 口 ( 2 1 2 ) 在逐步回归所出现的勺都可以用勺来代替。当然s ,己被标准化 ( s ,勺一1 ) ,因此新的残差平方和( q ) 、回归平方和( u ) 、贡献( k ) 等值都与原值差一个比例因子s ,例如,q q s ,。 1 0 第2 章逐步回归模型 2 自变量的剔除和引入 假设已经到了k 步,回归方程引进k 个自变量,则第k + 1 步计算内容如下: 算出全部贡献 k 啦) - b f 毛。巧咄+ 1 ) ( 2 1 3 ) 其中,前一个等号可以理解为回归方程中剔除量毛所损失的贡献,后一个等 号为未引入自变量而一旦引入所增加的贡献。 在己引入的自变量中,考虑剔除可能存在的不显著量。这时在已引入的自变 量中选出具有最小v 的那一个( 比如,对已经选入的f 有,k 啦- m i n k , 计算f 值, f 一( 一k 一1 ) k 唯q ( i ( 2 1 4 ) 如果f 兄( e 为临界值,在大样本的情况下,疋随k 的变化甚微,在逐 步计算过程中可以认为e 不变) ,则把t 从回归方程中剔除。如果f ,兄,则考 虑从未引入的自变量中选出最显著的量,即未引入量中具有最大y 的那一个( 比 如,对已经选入的f 有,k 啦m 缸以咄“ ,计算f 值, ,一( 一k 一2 ) k 咄“妇( i ) 一k 毗+ 1 ) ( 2 1 5 ) 如果f 兄,则把而引入回归方程,否则逐步计算阶段结束,进入步骤3 。 消去运算。对需要剔除或引进的五作一次消去运算,分4 种情况: 当f f ,j - 咐, 勺- 恤几恤 当f - _ _ f 时, 吩怔+ ”恤一恤白恤t o 当f - t ,- t 时, r , j “+ ”= 当f - f ,j - t 时, r k 1 ) ,一r u ( k ) r ( k ) 已经进入回归方程的自变量而,其回归系数岛( “) 一i “) ,可由下式计算 矿“一拉+ 1 用石 ( 2 1 6 ) 到此为止,第k + 1 步结束,然后再重复上述步骤进行下一步计算。计算的每 一步总是先考虑自变量的剔除,仅当不需剔除时才考虑引入。开头几步可能都是 引入自变量,其后的某些步可能剔除几个自变量。在既无需剔除,也无法再引入 自变量的情况下,逐步计算结束,转入求及残差等。 3 求6 d 及残差 假定z 是自变量的平均值,p ,为因变量的平均值,计算6 0 使用下面的公式 非汛期径流预报方法的应用研究 b o 一,也以 ( 2 1 7 ) 残差的计算公式为 e t 毗( 6 0 + 以i ( 2 - 1 8 ) 、t, 2 3 逐步回归一些问题的说明 逐步回归方程的自变量是逐个增加的,选取第k 个自变量时,仅要求它与前 面已经选入的k 一1 个自变量配合起来有最小的残差平方和。最终选出的k 个重要 自变量不见得总是使残差平方和为最小,从理论上说,也许还能找到残差平方和 为更小的k 个自变量。但大量实际问题的计算结果表明,在k 不大的情况下,这 些自变量就是所有组合中具有最小残差平方和的那一个组合。由此可见,逐步回 归确实是很有效的算法。 在对各自变量贡献的显著性检验中,如果临界值疋取得足够小,特别是 瓦- 0 时,则全部自变量都会被选中。这时逐步回归退化为一般的多元线性回归。 但是当自变量之间存在线性相关,以至正规方程出现病态,逐步回归计算将自动 放弃一些无用的自变量,避免计算上的困难,这也是逐步回归优越的地方。 在使用逐步回归时,被选中的自变量个数与给定的临界值兄的大小有关。 巴取值越小,如2 甚至1 ,则被选中的自变量个数越多;兄取值越大,例如6 甚至9 ,则被选中的自变量个数越少。在观测数据的样本量比较小时,兄取值可 以相对大一些,这样可以使被选中的自变量个数少一些,回归系数的精度能高一 些。 第3 章b p 神经网络模型 第3 章b p 神经网络模型 3 1a n n 概述 a n n 是一个具有高度非线性的超大规模连续时间动力系统,是由大量的处 理单元( 神经元) 广泛互连而形成的网络。它是在现代神经学研究成果基础上提 出的,反映了脑功能的基本特征。 a n n 具有并行分布的信息处理结构,是通过“学习”或“训练”的方式完 成某一特定的工作。其最显著的特点是具有自学习能力,并在数据含有噪音、缺 项或缺乏认知时能获得令人满意的结论,特别是它可以从积累的工作实例中学习 知识,尽可能多地把各种定性定量的影响因素作为变量加以输入,建立各影响因 素与结论之间的高非线性映像,采用自适应模式识别方法完成此工作。它对处理 内部规律不甚了解、不能用一组规则或方程进行描述的较复杂问题或开放的系统 显得较为优。 按照神经元的连接方式,人工神经网络可分为两种:没有反馈的前向网络和 相互结合型网络。前向网络是多层映像网络,每一层中神经元只接受来自前一层 神经元的信号,因此信息的传播是单方向的。b p 网络是这类网络最典型的例子。 在相互结合型的网络中,任意神经元之间都可能有连结,因此,输入信号要在网 络中往返传播,从某一初态开始,经过若干变化,渐渐趋于某一稳定状态或进入 周期震荡等其它状态,这方面的网络有h o p f i e l d 网络、s o m 网络等【加】。 神经网络的工作过程主要由两个阶段组成,一个阶段是工作期,此时各连接 权值固定,计算单元的状态变化,以求达到稳定状态。另一阶段是学习期( 自适 应期,或设计期) ,此时各计算单元状态不变,各连接权值可修改( 通过学习样 本或其他方法) ,前一阶段较快,各单元的状态亦称短期记忆( s t m ) ,后一阶段 慢的多,权及连接方式亦称长期记忆( l t m ) 。 输 入 输 出 图3 1 基本的神经网络模型 根据网络的拓扑结构和学习规则,a n n 大体可分为三种类型,即:前馈网 非汛期径流预报方法的应用研究 络( f e e d f o r w a r dn e u r a ln e t w o r k s ) ,反馈网络( f e e d b a c kn e u r a ln e t w o r k s ) 和自 组织网络( s e l f - o r g a n i z i n gn e u r a ln e t w o r k s ) 。目前已有几十种不同的神经网络模 型。代表的网络模型有感知器、反向传播b p 网络、g m d h 网络、r b f 网络、 双向联想记忆( b a m ) 、h o p f i e l d 网络、b o l t s m a r m 机、自适应共振网络c a r t ) 、 自组织特征映像( s o m ) 网络等。运用这些网络模型可实现函数近似( 数字逼 近映像) 、数据聚类、模式识别、优化计算等功能,因此,人工神经网络广泛用 于人工智能、自动控制、机器人、统计学、工程学等领域的信息处理中。 3 2 经典b p 神经网络 b p 网络是一种单向传播的多层前馈网络,以其优良的非线性逼近能力,被 广泛应用到很多领域,取得了良好的效果。b p 算法最初由w e r b o s 开发的反向传 播训练算法是一种迭代梯度算法,用于求解前馈网络的实际输出与期望输出间的 最小均方差值,其计算框图如图3 2 。 图3 - 2b p 网络算法程序框图 3 2 1b p 网络模型特点 b p 网络模型是把一组样本的输入输出变成一个非线性优化问题,使用了最 优化中最普遍的梯度下降算法,用迭代运算求解权,加入隐含层神经元使得优化 1 4 第3 章b p 神经网络模型 问题的可调参数增加,从而可以逼近精确解。 b p 网络由输入层、输出层及隐含层组成,隐含层可有一个或多个,每层由 多个神经元组成。其特点是;各层神经元仅与相邻层神经元之间有连接;各层内 神经元之间无任何连接;各层神经元之间无反馈连接。输入信号先向前传播到隐 含层神经元,经过变换函数之后,把隐含层神经元的输出信息传播到输出神经元, 经过处理后再给出输出结果。神经元的变换函数通常选取s i g r a o i d 型函数。一般 情况下,隐含层采用s 型对数或正切激活函数,而输出层采用线性激活函数。 如果输入层有珂个神经元,输出层有m 个神经元,则网络是从甩维欧氏空间 到m 维欧氏空间的映像。在确定了b p 网络的结构后,利用输入输出样本集对其 进行训练,也即通过调整b p 网络中的连接权值、网络的规模( 包括行、坍和隐 含层神经元数) ,就可以使网络实现给定的输入输出映像关系,并且可以以任意 精度逼近任何非线性函数。b p 网络通过对简单的非线性函数的复合来完成映像, 用这种方法经过少数的几次复合就可以得到极为复杂的函数关系,进而可以表达 复杂的物理世界现象,使得许多实际问题都可以转为利用神经网络来解决。经过 训练的b p 网络,对于不是样本集中的输入也能给出合适的输出,这种性质称为 泛化( g e n e r a l i z a t i o n ) 功能。从函数拟合的角度看,这说明b p 网络具有插值功 能。 3 2 2b p 网络学习算法 b p 神经网络采用误差反传学习算法,它使用梯度搜索技术,实现网络的实 际输出与期望输出的均方差最小化。网络学习的过程是一种边向后边传播边修正 权的过程。 在这种网络中,学习过程由正向传播和反向传播组成。在正向过程中,输入 信号从输入层经隐含层单元逐层处理,并传向输出层,每一层神经元的状态只影 响下一层神经元的状态。如果在输出层不能得到期望的输出,则转向反向传播, 将输出的误差按原来的连接通路返回。通过修改各层神经元的权值,使得误差信 号最小。得到合适的网络连接值后,便可对新样本进行非线性映像。 1 信息的正向传递 假设b p 网络共层,对于给定的尸个样本,网络的期望输出为: t d :盼1t d 2 t d q 】 ( 3 1 ) 非汛期径流预报方法的应用研究 当输入第p 个样本时,对于网络中的第f ( f - 1 2 ,- ,l 一1 ) 层中第j 个神经 元的操作特性为: 痒甜岔- 艺嘟哪。1 一彰 ( 3 - 2 ) d 磐- t ( n e t s ;) ) ( 3 - 3 ) 其中,为神经元f 到神经元,的连接权值;h i - 1 是第f 一1 层的神经元数; d 扫( i - 1 为神经元,的当前输入;d j :) 为神经元j 的输出; 为非线性可微非递减函数,一般取为s 型函数,即 f a x ) 。寿 而对于输出层则有 d = 丘。甜) 一笺略,。- i p p 一日j ( 3 5 ) 神经网络学习的目的是实现对每一样本 e p 。j 1 荔m ( 一乇) 2 ,( p 。1 ,2 ,p ) ,其中小为输出神经元个数。 达到最小,从而保证网络总误差 e q ( 3 6 ) 一 7 极小化。其中7 k ,毫分别为输出层第,个神经元的期望输出和实际输出。 2 利用梯度下降法求权值变化及误差的反向传播 采用梯度算法对网络权值、阀值进行修正。 第f 层的权系数迭代方程为: j d l i 形 ) + a ,形 + 1 ) ( 3 7 ) 缈。k 。7 其中,k 为迭代次数。 令a ,务 一务一旦o n e t 留器一旦o n e t ;t ) 嘭哪 a w i a w 扩 7 删。毒删有 1 6 第3 章b p 神经网络模型 a , w j - 和:硝。,其中,7 为学习步长。 3 2 3 网络的训练过程 1 网络初始化,用一组随机数对网络赋初始权值,设置学习步长叩、允许 误差、网络结构( 即网络层数l 和每层神经元数n 1 ) ; 2 网络提供一组学习样本; 3 对每个学习样本p 循环: a 逐层正向计算网络各神经元的输入和输出; b 计算第p 个样本的输出的误差e ,和网络的总误差e ; c 当小于允许误差或者达到指定的迭代次数时,学习过程结束,否则, 进行误差反向传播; d 反向逐层计算网络各神经元误差6 爹 j l 如果五取为s 型函数,即 似。五,则 对于输出层 6 磐- d 参( 1 一d 爹) o ,坤一d 参) ( 3 - 9 ) 对于隐含层 6 爹- d 参( 1 一d 器) 6 善w g 哪 ( 3 1 0 ) e 修正网络连接权值 ( 七+ 1 ) 一作) + ,7 6 爹哪 ( 3 - 1 1 ) 式中,七为学习次数,叩为学习因子。t 取值越大,每次权值的改变越剧烈, 可能导致学习过程振荡,因此,为了使学习因子的取值足够大,又不至产生振荡, 通常在权值修正公式中加入一个附加动量法。 3 3b p 算法的启发式改进 3 3 1 附加动量法 附加动量法使网络在修正其权值时,不仅考虑误差在梯度上的作用,而且考 虑在误差曲面上变化趋势的影响。在没有附加动量的作用下,网络可能陷入浅的 局部极小值,利用附加动量的作用有可能滑过这些极小值。 该方法是在反向传播法的基础上在每一个权值( 或阈值) 的变化上加上一项 非汛期径流预报方法的应用研究 正比于前次权值( 或阈值) 变化量的值,并根据反向传播法来产生新的权值( 或 阈值) 变化。 带有附加动量因子的权值和阈值调节公式为: a w , j ( k + 1 ) 一( 1 - m c ) ,7 6 j p ,+ m c a w o ( k ) ( 3 1 2 ) 她( 七+ 1 ) 一( 1 - m c ) ,7 $ j + m c 她 ) ( 3 1 3 ) 其中k 为训练次数,m c 为动量因子,一般取o 9 5 左右。 附加动量法的实质是将最后一次权值( 或阈值) 变化的影响,通过一个动量 因子来传递。当动量因子取值为零时,权值( 或阈值) 的变化仅是根据梯度下降 法产生;当动量因子取值为1 时。新的权值( 或阈值) 变化则是设置为最后一次 权值( 或阈值) 的变化,而依梯度法产生的变化部分则被忽略掉了。以此方式, 当增加了动量项后,促使权值的调节向着误差曲面底部的平均方向变化,当网络 权值进入误差曲面底部的平坦区时,也将变得很小,于是a w # ( k + 1 ) 一a w o ( k ) , 从而防止了a w o 一0 的出现,有助于使网络从误差曲面的局部极小值中跳出。 根据附加动量法的设计原则,当修正的权值在误差中导致太大的增长结果 时,新的权值应被取消而不被采用,并使动量作用停止下来,以使网络不进入较 大误差曲面:当新的误差变化率对其旧值超过一个事先设定的最大误差变化率 时,也得取消所计算的权值变化。其最大误差变化率可以是任何大于或等于1 的 值。典型的取值取1 0 4 。所以,在进行附加动量法的训练程序设计时,必须加进 条件判断以正确使用其权值修正公式。 训练程序设计中采用动量法的判断条件为: f 0e )
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 购房者信用记录查询与报告协议
- 2025公务员税务面试题及答案
- 介绍绿色技术
- 2025至2030中国聚芳砜行业项目调研及市场前景预测评估报告
- 2025年智能可穿戴设备在飞行员睡眠监测中的技术创新应用
- 2025年智能可穿戴设备睡眠监测技术革新应用展望
- 2025至2030中国汽车节油技术行业产业运行态势及投资规划深度研究报告
- 2025至2030中国废旧电器行业项目调研及市场前景预测评估报告
- 消防安全教育课件
- 江苏纺织:达成纺织行业股权置换与产业升级框架协议
- 阿尔茨海默症的护理诊断与措施
- 辅导机构创业路演
- 2025年穿脱隔离衣的试题及答案
- 2025年移动初级解决方案经理认证理论考试指导题库-下(多选、判断题)
- 健身房卫生安全措施及服务质量提升方案
- DB14-T 1737-2024 医疗护理员培训机构服务规范
- 《混凝土砖块机:混凝土砖块机技术》课件
- 物业经理聘用合同
- 理想二语自我对交际意愿的影响:二语坚毅和自信的链式中介作用
- MPOWER及烟草控制框架公约及国际国内控烟进展
- 2023年建筑三类人员(B类)考试题库(浓缩500题)
评论
0/150
提交评论