版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于差分自回归移动平均和人工神经网络的最优枯季径流预测模型
随着经济的发展,水资源的缺乏已成为区域可持续发展的主要影响因素之一。水资源的合理分配尤为重要。特别是在我国北方,年生气候和时空分布极不平衡,洪水期短,年平均降水70%以上。旱季雨水少,水资源短缺已成为制约当地经济发展的瓶颈之一。做好枯季径流预报,提高枯季径流预报质量,对水资源的合理调配和灌溉管理有着非常重要的意义。目前,国内外开发了许多枯季径流预测模型,包括基于概念的过程驱动模型(如流域退水模型)及基于统计数据的驱动模型(如回归模型、时间序列模型、人工神经网络模型(ANN模型)、模糊逻辑模型、灰色系统模型、最近邻模型等)。Druce对哥伦比亚河流域20年的径流预测,提出了基于概念的水文模型,并将其结果与回归模型进行对比,认为基于概念的水文模型的稳定性及效果更好;Markus等运用ANN模型预测了美国科罗拉多州格兰德河的月径流,并将预测结果与周期动态回归模型(TFN模型)预测结果进行了比较,结果表明,当使用标准化的月径流数据时,ANN模型的预测结果略好于TFN模型;Huang等将ANN与差分自回归移动平均模型(ARIMA模型)在日、月、季以及年径流上的预测结果进行了比较,认为ANN模型较ARIMA模型的预测精度高。由以上研究可见,这些传统的径流预测模型简单方便,且有一定的预报精度,故在实践中应用广泛。但自Bates和Granger在1959年首次提出组合预测理论以来,由于其能综合各单项模型的优点,可有效地集结更多的有用信息,从而提高了预测精度,因此组合预测方法的研究和应用,日益受到了国内外学者的重视。单个预测模型仅包含或体现了研究系统的局部信息,用不同的方法对系统进行模拟,各方法往往具有各自的特点和不足,而将若干种预测方法组合成一个预测模型,可以更合理地描述系统的客观实际。理论研究和实际应用表明,组合预测模型的预测精度和预测稳定性较单个预测模型高,适应动态系统变化的能力也较单个预测模型强。近年来,组合模型方法在径流预测中开始应用,如段召辉等运用径流响应线性模型和时间序列模型的最优加权组合来预测日径流,结果表明最优加权组合模型的精度较单一模型好;傅新忠等采用BP神经网络来构造组合预测模型,运用时间序列模型预测方法得出预测结果,同时采用历史滚动法将前5年的预测结果数据作为BP网络的输入,以当前年份的预测结果为网络期望输出,建立了ARIMA-ANN组合预报模型,实例应用表明该组合模型的预报精度更高。现有的枯季径流预报模型很多,但尚缺乏一种通用的预测模型,且预报模型的适用性至今仍是有待深入研究的问题。对于一个具体河流的径流预报问题,需要通过分析、尝试、检验等步骤,最终找到适合于研究区域实际情况的预报方法。为此,本研究建立了基于差分自回归移动平均(ARIMA)模型、BP神经网络和多元线性回归模型(MLR)的简单平均组合模型(ARIMA-ANN、ARIMA-MLR、ANN-MLR、ARIMA-ANN-MLR)和最优加权组合模型(ARIMA-ANN、ARIMA-MLR、ANN-MLR、ARIMA-ANN-MLR),并分别采用3个单项模型和8个组合模型,对石羊河流域支流西营河枯季径流进行预测,通过模型检验和精度分析,提出了适宜该河流的枯季径流预测方法,以期为河流枯季径流的预测提供参考。1单因素预测方法1.1阿尔马模型1.1.1arra预测模型预测的一般描述ARIMA模型常表示为ARIMA(p,q,d),其中p和q为自回归移动平均阶数,d为差分算子阶数。ARIMA模型属于平稳时间序列分析,其通过对噪声概率分布的研究,能预测在各种概率下可能出现的偏差大小,可以很好地处理随机干扰问题。ARIMA模型的基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述该序列。这个模型一旦被识别后,就可以从时间序列的过去值及现在值来预测未来值。ARIMA预测模型及其参数估计描述如下:假定{yt,t=1,2,3,…}为平稳时间序列,则ARIMA(p,q,d)有如下形式:Φ1yt-1+Φ2yt-2+…+Φpyt-p+εt=εt+θ1εt-1+θ2εt-2+…+θqεt-q。(1)式中:实参数Φ1,Φ2,…,Φp为自回归系数;实参数θ1,θ2,…,θp为移动平均系数;εt是零均值、方差为δ2pq的白噪声序列。称{yt}为(p,q)阶自回归移动平均模型,记为ARMA(p,q)。当阶数(p,q)固定时,上述系数可用矩估计法、非线性最小二乘估计法、最小平方和估计法等方法确定。上述讨论中,假定时间序列{yt}是平稳的,当{yt}非平稳时,则可根据B-J方法原理,对其进行差分,经过d阶差分,将其变换为平稳序列。1.1.2水文特征识别模型时间序列预测的建模过程一般分为5步:(1)水文时序的平稳性识别;(2)数据平稳化处理;(3)识别模型阶数确定;(4)参数估计;(5)对模型的残差序列进行白噪声检验。1.2bp神经网络1.2.1bp神经网络的定义ANN是在现代神经生理学和心理学研究的基础上,模仿人的大脑神经元结构特性而建立的一种非线性动力学网络系统,其由大量的非线性处理单元高度并联、互联而成,具有对人脑某些基本特性的简单数学模仿能力。人工神经网络最大的特点是自适应性,其通过自身学习机制自动形成所要求的决策区域。BP神经网络是ANN的一种,也称误差反向传播神经网络,是迄今为至应用最为广泛的神经网络,其由输入层、隐含层和输出层组成,上下层之间实现全连接,而每层神经元之间无连接。当一对学习样本提供给网络后,神经元的激活值从输入层各中间层向输出层传播,输出层各神经元获得网络的输入响应后,按照减少目标输出与实际误差的方向,从输出层经过各中间层逐层修正各连接权值,最后回到输出层,这种算法称为“误差逆传播算法”,即BP算法。随着这种误差逆传播修正的不断进行,网络对输入模式响应的正确率也不断上升。1.2.2bp网络激励函数作为一种简单的处理器,人工神经元可以对输入的信号进行加权求和处理,即:y=n∑i=1xiwi+b,i=1,2,⋯,n。(2)式中:y表示神经元的输出,xi表示输入值,wi表示权重,b表示阈值。设神经元网络有n个输入神经元、m个输出神经元和p个隐层神经元,则输出层神经元的输出为:yi=p∑i=1woijxlj+bi,i=1,2,⋯,m,j=1,2,⋯,p。(3)BP网络激励函数通常选取对数-S型函数。对数-S形函数为:f(x)=11+e-axa>0。(4)1.2.3施工步骤(1)归一化网络权值的预处理①确定神经网络的结构参数:包括定义输入层、隐含层和输出层的神经元个数,确定最小训练速率、动态参数、允许误差、迭代次数和Sigmoid参数;②对输入层样本值进行归一化处理;③网络权值初始化;④从前向后计算各隐含层到输出层单元的输出向量;⑤计算输出层的误差信号;⑥从后向前计算隐含层的误差信号;⑦计算并保存各权值修正量;⑧修正权值并保存;⑨计算误差。(2)输出值利用经训练所保存的网络权值,根据网络输入的各项指标值,运行网络向前计算,即可得实际输出值。根据网络的实际输入确定其性能优劣,并确定其是否具有很好的泛化能力。1.3加标回归系数t设经过分析,已经挑选到p个预报因子x1,x2,…,xp,通过回归分析,建立p个预报因子与预报对象y的p元线性回归模型:{y=b0+b1x1+⋯+bpxp+ε‚ε~Ν(0,σ2)。(5)式中:b0、b1、…、bp、σ2都是与x1、x2、…、xp无关的未知数,其中b0、b1、…、bp称为回归系数;ε是随机误差(或随机干扰)。对变量x1、x2、…、xp和y做n次独立观察,得到容量为n的一个样本(xi1、xi2、…、xip、yi)(i=1,2,…,n)。参数b0、b1、…、bp一般采用最小二乘法估计。MLR模型建立后,对其与实际数据是否具有较好的拟合度及模型的线性关系是否显著等,均还需要通过数理统计进行检验,一般主要用线性回归的显著性检验(F检验)和相关系数R进行。2组合预测模型加权系数设对某一具体问题有n种预测方法,该问题某一物理量的N个实际观测值yt(t=1,2,…,N),记组合预测方法的加权系数向量K=[k1,k2,…,kn]T,其中ki为第i种预测方法在组合预测模型中的权重,n∑i=1ki=1。令第i种预测方法的预测值为fit,则组合预测模型的预测值ft为:ft=n∑i=1kifit=k1f1t+k2f2t+⋯+knfnt,t=1,2,⋯,Ν。(6)2.1组合预测模型预测误差简单平均就是给组合模型中的每个预测值fit配以权重1/n,其预测误差eit=yt-fit,则组合预测模型的预测值为:ft=n∑i=1kifit=1nn∑i=1fit,t=1,2,⋯,Ν。(7)2.2最优组合预测方法的求解组合预测是使用多种预测方法对同一预测对象进行预测,在此基础上通过加权组合形成一个预测模型,以提高预测精度的方法。记第i种预测方法的预测误差为eit,组合预测方法的预测误差et=n∑i=1kieit(t=1,2,⋯,Ν),组合预测方法的预测误差平方和J=n∑i=1e2it,第i种方法的预测误差向量Ei=[ei1,ei2,…,eiN]T,预测误差矩阵为e=[E1,E2,…,En],则J可表示为:J=eTe=KTE(n)K。(8)式中:K=[k1,k2,…,kn]T;E(n)为预测误差信息矩阵,其集中反映了各种预测方法的预测误差信息:E(n)=[E11E12⋯E1nE21E22⋯E2n⋯⋯⋯⋯En1En2⋯Enn],如果E1,E2,…,En是线性无关的,则E(n)为对称正定阵;Eij=Eji=EΤiEj,Eii=EΤi,Ei=Ν∑i=1e2it。记Rn=[1,1,…,1]T为n×1的列阵,由于加权系数的约束条件为n∑i=1ki=1,则可得RTnK=1。采用组合预测的主要目的是减少预测误差平方和,如若某一加权系数向量Kn使组合预测方法的预测误差平方和达到极小值Jn,即Jn=minRΤnΚ=1{J}=minRΤnΚ=1{ΚΤE(n)Κ},则Kn为最优加权系数向量,与其对应的组合方法即为最优组合预测方法,于是将求解最优权值转化为数学规划问题,有:{minJ=mineΤe=minΚΤE(n)Κ‚s.t.RnΤΚ=1。(9)用Lagrange乘子求解式(9),由∂∂Κ(ΚΤE(n)·K-2K(RTnK-1))=0,得最优权重向量为:K0=E(n)-1Rn/(RTnE(n)-1Rn)。(10)目标函数的最小值为:J0=K0ΤE(n)K0=1/(RTnE(n)-1Rn)。(11)3比较模型使用以下3个指标比较单项模型之间以及各组合模型之间的统计特性。(1)yt-yR=∑t=1Ν(yt-y¯)(fi-f¯)∑t=1Ν(yt-y¯)2∑t=1Ν(ft-f¯)2。(12)式中:yt为实测值,y¯为实测值的均值,ft为预测值,f¯为预测值的均值,N为资料序列长度。(2)我国水文预报预报精度等级的规定DC=1-∑t=1Ν(ft-yt)2∑t=1Ν(yt-y¯)2。(13)我国《水文情报预报规范》(SL250-2000)规定:DC≥0.90,预报精度等级为甲级;0.70≤DC<0.90,预报精度等级为乙级;0.50≤DC<0.70,预报精度等级为丙级;DC<0.50,则不能满足预报要求。(3)平均平方误差rcseRΜSE=1Ν∑t=1Ν(yt-ft)2。(14)4西营河意象研究4.1预报河流水文年际变化以石羊河流域支流西营河为研究对象,该河发源于祁连山,是中国河西走廊三大内陆河流之一,位于甘肃省河西走廊东部,祁连山东段与巴丹吉林沙漠、腾格里沙漠南缘之间。石羊河流域自东向西由大靖河、古浪河、黄羊河、杂木河、金塔河、西营河、东大河、西大河八条河流及多条小沟小河组成,河流补给来源为山区大气降水和高山冰雪融水。西营河是石羊河流域流量最大的支流,是武威市工农业生产及生活的重要水源。以西营河四沟嘴水文站1957-2007年的枯水期径流作为预报对象,以山区肃南气象站同期丰水期的温度和降水量作为预报因子,水文年划分为当年的5月份到第2年的4月份,其中丰水期为5月份到10月份,枯水期为11月份到第2年的4月份。温度和降水资料来源于中国气象科学数据共享服务网(/),径流资料来自水文站的观测值。4.2各单项预测结果选用西营河1957-2007年枯水期径流为研究对象,取前46年(1957-2002)作为率定期建立模型,后5年(2003-2007)作为检验期,检验预报模型的效果与有效性。运用DPS7.05统计分析软件的ARIMA模型、BP神经网络模型和MLR模型,对西营河历年枯水期径流资料进行分析和验证。其中ARIMA模型是以枯水期的径流量序列建立模型预测,ANN和MLR模型均以丰水期的温度和降水量为输入、枯水期的径流量为输出建立模型。ARIMA模型、ANN模型和MRL模型的计算值与枯水期径流量的实际值对比见图1,2003-2007年单项预测结果见表1。基于简单平均和最优加权组合原理,ARIMA-ANN、ARIMA-MLR和ANN-MLR简单平均组合权重为k1=k2=0.5,3个单项方法简单平均组合ARIMA-ANN-MLR的权重为k1=k2=k3=0.33;最优加权组合权重通过MATLAB求得,ARIMA-ANN的权重k1=0.89,k2=0.11,ARIMA-MLR的权重k1=0.88,k2=0.12,ANN-MLR的权重k1=0.54,k2=0.46。西营河枯水期径流量的实际值与ARIMA-ANN、ARIMA-MLR、ANN-MLR以及ARIMA-ANN-MLR简单平均组合预测值的对比结果见图2,实际值与ARIMA-ANN、ARIMA-MLR、ANN-MLR和ARIMA-ANN-MLR最优加权组合预测值的对比结果见图3,各组合的预测结果见表1。由表1可得出,ARIMA、ANN和MRL3个单项预测模型的最大相对误差分别为5.68%,13.21%和14.14%,以ARIMA模型的相对误差最小,ANN和MLR模型预测误差较大,但均小于15%。ARIMA-ANN、ARIMA-MLR、ANN-MLR及ARIMA-ANN-MLR4种简单平均组合预测模型的相对误差最大值分别为7.3%,7.04%,13.65%和9.10%,对应的4种最优加权组合预测模型的相对误差最大值分别为4.04%,3.72%,13.62%和7.69%,可见无论是简单平均组合还是最优加权组合模型,ARIMA-ANN组合和ARIMA-MLR组合预测的相对误差较ANN-MRL及ARIMA-ANN-MLR组合小。ARIMA-MLR最优加权组合模型的相对误差最大为3.72%,而ARIMA模型的最大预测误差为5.68%,可见ARIMA-MLR最优加权组合模型较ARIMA模型的预测误差更小。4.3基于方根误差的预测模型分别应用指标R、DC和RMSE对3种单项预测模型和8种组合模型的预测精度进行检验,结果见表2。由表2可知,单项预测模型中ARIMA模型预测序列与实测序列
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- AI智能调控长期氧疗:为慢阻肺患者带来呼吸新希望
- 2025年工业元宇宙数据隐私保护技术应用
- 新生儿黄疸培训课件
- 2025年人工智能伦理评估宣传报告
- 学校实验教学档案表
- 深度抽搐患者的监护与护理
- 甲状腺疾病护理中的患者教育
- 护理:患者的健康保障
- 2026年养鹿场建设合同协议
- 2026年水库合同转租合同(1篇)
- 北京市朝阳区2024年中考物理一模试卷
- 防火防爆理论与技术智慧树知到期末考试答案章节答案2024年华北科技学院
- 2024年网络与数据安全知识竞赛题库及答案(80题)
- 香料改扩建项目环境影响报告书
- 心理危机干预的操作指南:02 危机干预中的会谈技术
- 2022勘察设计服务成本核算指南
- 光伏工程 危害辨识风险评价表(光伏)
- 第一章 货币与货币流通(金融学课件-中央财经大学,李健)
- 高中作文纸800字模板
- 药物医疗器械临床试验质量管理规范试题及答案
- YC/T 88.2-2006烟草机械喂料机第2部分:技术条件
评论
0/150
提交评论