石羊河流域径流中长期预测:方法比较与应用研究_第1页
石羊河流域径流中长期预测:方法比较与应用研究_第2页
石羊河流域径流中长期预测:方法比较与应用研究_第3页
石羊河流域径流中长期预测:方法比较与应用研究_第4页
石羊河流域径流中长期预测:方法比较与应用研究_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

石羊河流域径流中长期预测:方法比较与应用研究一、引言1.1研究背景与意义水是生命之源,是维持地球生态系统和人类社会经济发展的基础性资源。水资源的合理开发、利用与保护,对于保障生态安全、促进经济可持续发展以及维护社会稳定都具有至关重要的作用。石羊河流域作为我国西北干旱区重要的内陆河流域,其水资源状况对区域生态平衡和经济社会发展影响深远。石羊河流域发源于祁连山北麓,自东向西汇聚了大靖河、古浪河、黄羊河、杂木河、金塔河、西营河、东大河、西大河等8条河流及多条小沟小河,形成石羊河干流,一路北流汇入红崖山水库,最终奔向民勤县青土湖。它不仅是武威人民的母亲河,更是维系整个流域生态系统稳定的关键纽带。流域内分布着众多的绿洲,孕育了丰富的生物多样性,为当地居民提供了生存和发展的基础。然而,石羊河流域深居内陆,属于典型的温带大陆性干旱气候,降水稀少,蒸发量大,水资源总量匮乏。多年平均降水量仅约200毫米,而蒸发量却高达2000-2600毫米,水资源供需矛盾十分突出。同时,随着气候变化和人类活动的加剧,石羊河流域的水资源形势愈发严峻。气温升高导致冰川退缩、积雪减少,使得河流的补给水源受到影响,径流量呈现出不稳定的变化趋势;人口增长、城市化和工业化进程的加快,以及农业灌溉面积的不断扩大,对水资源的需求量持续增加,进一步加剧了水资源的短缺状况。此外,不合理的水资源开发利用方式,如过度开采地下水、水资源浪费等,也导致了一系列生态环境问题,如地下水位下降、土地沙漠化、植被退化等,严重威胁到流域的生态安全和可持续发展。径流作为水资源的重要组成部分,是流域水循环的关键环节,其变化直接影响着水资源的可利用量和时空分布。准确预测石羊河流域的径流变化,对于实现水资源的科学管理和合理配置具有重要的现实意义。通过径流中长期预测,能够提前掌握水资源的变化趋势,为水资源规划和调配提供科学依据。在制定农业灌溉计划时,可以根据径流预测结果合理安排灌溉时间和用水量,避免因水资源短缺或不合理利用导致农作物减产;在城市供水方面,能够提前做好应对措施,保障城市居民的生活用水需求;对于工业用水,也能依据径流预测进行合理分配,促进工业的可持续发展。准确的径流预测有助于优化水资源配置,提高水资源利用效率,减少水资源浪费和不合理开发利用。通过科学的预测和规划,可以实现水资源在不同行业、不同地区之间的合理分配,使水资源得到更有效的利用,从而缓解水资源供需矛盾,保障流域经济社会的稳定发展。此外,径流预测对于生态环境保护也具有重要作用。石羊河流域的生态系统较为脆弱,对水资源的依赖程度极高。通过径流预测,可以提前了解水资源变化对生态系统的影响,采取相应的保护和修复措施。在预测到径流量减少时,可以及时调整生态用水分配,加强对湿地、河流等生态系统的保护,防止生态系统退化;合理的径流预测还能为生态修复工程提供科学指导,促进生态系统的恢复和改善,维护流域的生态平衡。石羊河流域径流中长期预测对于应对气候变化、保障水资源安全、促进经济社会可持续发展以及维护生态平衡都具有不可忽视的重要意义。本研究旨在深入探讨石羊河流域径流变化的规律和影响因素,建立科学有效的预测模型,为石羊河流域的水资源管理和可持续发展提供有力的技术支持和决策依据。1.2国内外研究现状径流预测作为水文水资源领域的重要研究内容,长期以来一直受到国内外学者的广泛关注。其发展历程伴随着科学技术的进步和对水文过程认识的深化,不断演进和完善。早期的径流预测主要依赖于简单的统计分析方法。在20世纪初,相关分析、回归分析等经典统计方法被用于建立径流与气象因素(如降水、气温)之间的关系,以此来预测径流变化。这些方法基于线性假设,通过对历史数据的统计分析,寻找变量之间的定量关系,为径流预测提供了初步的手段。由于径流形成过程受到多种复杂因素的综合影响,包括地形、地貌、土壤、植被以及人类活动等,简单的统计方法难以全面准确地描述径流的变化规律,预测精度往往受到限制。随着计算机技术和数学理论的发展,水文模型逐渐成为径流预测的重要工具。从20世纪中叶开始,集总式水文模型应运而生,如斯坦福水文模型(StanfordWatershedModel)、水箱模型(TankModel)等。这些模型将流域视为一个整体,通过对流域水文过程的概化,建立输入(降水、蒸发等)与输出(径流)之间的数学关系,能够较好地模拟流域的平均径流过程。然而,集总式模型忽略了流域内部的空间异质性,对于地形复杂、下垫面条件多样的流域,模拟效果可能不尽如人意。为了更好地反映流域水文过程的空间变化,分布式水文模型在20世纪后期得到了迅速发展。分布式水文模型基于地理信息系统(GIS)和遥感(RS)技术,将流域划分为多个子流域或网格单元,考虑每个单元的地形、土壤、植被等特征,对水文过程进行分布式模拟,如SWAT(SoilandWaterAssessmentTool)模型、MIKESHE模型等。这些模型能够更详细地描述流域内的水文过程,提高了径流预测的精度和可靠性,被广泛应用于不同类型流域的径流模拟和预测研究中。近年来,随着人工智能技术的兴起,机器学习和深度学习方法在径流预测领域展现出了巨大的潜力。支持向量机(SVM)、人工神经网络(ANN)、深度学习神经网络(DNN)等方法具有强大的非线性映射能力,能够自动学习径流与影响因素之间复杂的非线性关系,无需对水文过程进行详细的物理描述。这些数据驱动模型在处理高维、非线性数据方面具有独特优势,能够充分利用大量的历史数据进行训练,提高预测精度。一些研究将深度学习中的长短期记忆网络(LSTM)应用于径流预测,通过对时间序列数据的学习,有效捕捉了径流的长期依赖关系和动态变化特征,取得了较好的预测效果。为了进一步提高预测精度和可靠性,融合多种方法的组合预测模型也逐渐成为研究热点。将水文模型与机器学习方法相结合,利用水文模型的物理机制和机器学习方法的非线性拟合能力,实现优势互补,能够更好地适应不同流域的水文特征和预测需求。在石羊河流域径流预测方面,国内众多学者已开展了大量研究工作。一些研究聚焦于石羊河流域水资源演变规律分析,探讨了气候变化、人类活动等因素对流域水资源的影响。有学者通过对石羊河流域气象和水文数据的分析,发现气候变化导致流域降水量和平均气温发生变化,进而影响了水资源的分配和利用;流域人口增长、城市化和工业化发展以及农业灌溉用水量的增加,也对水资源的保护和管理提出了更高要求。在径流模拟方面,基于SWAT模型和VIC(VariableInfiltrationCapacity)模型等的研究较为常见。有研究利用SWAT模型对石羊河流域的径流过程进行模拟,分析了模型输入参数(如降雨量、蒸发量、土地利用类型和土壤类型等)对模拟结果的影响;也有研究基于VIC模型对石羊河上游出山径流进行模拟与预测,通过对模型参数的优化和验证,较好地模拟了该地区的径流过程,揭示了径流量的季节性和年际变化特征。还有学者通过对石羊河流域各支流(如西营河、黄羊河等)径流变化规律及其影响因素的分析,采用多种统计方法对年径流量进行趋势性检验和跳跃点显著性检验,建立了径流与气温、降水等气候因子的相关关系,为流域水资源管理和生态调水提供了重要依据。尽管国内外在径流预测方法研究以及石羊河流域径流预测方面取得了一定的成果,但仍存在一些不足之处。现有研究在考虑径流影响因素时,虽然已关注到气候变化、人类活动等主要因素,但对于一些复杂的交互作用和潜在因素的研究还不够深入。人类活动对下垫面条件的改变如何与气候变化协同影响径流,以及土地利用变化的长期累积效应等方面,还需要进一步的研究和探讨。部分模型在处理石羊河流域复杂的地形地貌和多样的下垫面条件时,存在一定的局限性。分布式水文模型虽然能够考虑空间异质性,但模型参数众多,校准和验证过程较为复杂,且对数据的要求较高,在实际应用中可能受到数据质量和数量的限制;而数据驱动模型缺乏明确的物理机制,可解释性较差,难以准确反映径流形成的内在物理过程。此外,不同预测方法在不同时间尺度和不同流域条件下的适用性和可靠性还需要进一步的对比和验证,以确定最适合石羊河流域径流中长期预测的方法和模型。1.3研究内容与方法1.3.1研究内容本研究旨在深入探究石羊河流域径流中长期变化规律,综合运用多种方法建立精准有效的预测模型,为流域水资源科学管理与可持续利用提供坚实支撑。具体研究内容如下:石羊河流域径流变化特征分析:系统收集石羊河流域长时间序列的径流数据,涵盖不同支流及关键控制断面的实测径流资料,同时获取同期的气象数据(如降水、气温、蒸发量等)、地形地貌数据以及土地利用数据等。运用数理统计方法,深入剖析径流的年际、年内变化特征,包括径流的均值、极值、变差系数等统计参数的计算与分析,明确径流的丰枯变化周期和趋势。采用Mann-Kendall趋势检验、Spearman秩相关检验等方法,对径流序列的趋势性进行显著性检验,判断径流是否存在上升或下降趋势;运用有序聚类法、Pettitt检验等方法,识别径流序列中的突变点,确定径流发生显著变化的时间节点,从而全面掌握石羊河流域径流的变化规律。石羊河流域径流影响因素分析:从气候变化和人类活动两个方面,深入探讨影响石羊河流域径流变化的主要因素。在气候变化方面,分析降水、气温、蒸发等气象要素的变化对径流的影响机制。通过建立降水-径流关系模型、气温-径流关系模型等,定量研究气象要素变化与径流变化之间的响应关系,明确降水和气温变化对径流的贡献率。在人类活动方面,研究土地利用变化(如耕地、林地、草地、建设用地等面积的增减和空间分布变化)、水资源开发利用(如水库建设、灌溉用水、工业用水、生活用水等)对径流的影响。利用遥感影像解译和地理信息系统(GIS)技术,分析不同时期土地利用类型的变化情况,并结合水文模型,模拟不同土地利用情景下的径流变化,评估土地利用变化对径流的影响程度;通过统计分析流域内水资源开发利用量的变化趋势,以及用水结构的调整情况,研究水资源开发利用活动对径流的直接和间接影响,为后续的径流预测提供全面的影响因素分析基础。石羊河流域径流中长期预测模型构建与对比:选取多种适用于径流中长期预测的方法,包括传统的统计方法(如多元线性回归、自回归滑动平均模型ARMA等)、水文模型(如SWAT模型、VIC模型等)以及人工智能方法(如支持向量机SVM、长短期记忆网络LSTM等),分别构建石羊河流域径流中长期预测模型。对于多元线性回归模型,基于前期筛选出的影响径流的主要因素(如降水、气温、前期径流等)作为自变量,径流量作为因变量,建立线性回归方程,通过最小二乘法等方法估计模型参数,并对模型进行显著性检验和残差分析,评估模型的拟合效果和预测能力;对于ARMA模型,根据径流时间序列的自相关函数(ACF)和偏自相关函数(PACF),确定模型的阶数p和q,通过极大似然估计等方法估计模型参数,利用建立好的模型对径流进行预测,并通过计算预测误差等指标评价模型性能。对于SWAT模型,利用GIS技术对流域进行数字化处理,划分子流域和水文响应单元,根据流域的地形、土壤、土地利用等数据,确定模型的输入参数,包括气象数据、土壤参数、植被参数等,并对模型进行参数校准和验证,通过模拟不同情景下的径流过程,预测流域径流的变化;对于VIC模型,同样基于流域的气象、地形、土壤和植被等数据进行模型输入,考虑不同土壤层的水分运动和蒸散发过程,通过对模型参数的优化和调整,使其更好地模拟石羊河流域的径流过程,并利用验证后的模型进行径流预测。在人工智能方法方面,对于支持向量机SVM模型,选择合适的核函数(如径向基核函数RBF等),通过交叉验证等方法确定模型的惩罚参数C和核函数参数γ,将历史径流数据和影响因素数据进行归一化处理后作为输入,训练SVM模型,并对模型的泛化能力进行评估;对于长短期记忆网络LSTM模型,确定模型的网络结构(如层数、隐藏层神经元数量等),设置合适的训练参数(如学习率、迭代次数等),将时间序列的径流数据和相关影响因素数据进行编码处理后输入模型进行训练,利用训练好的模型对未来径流进行多步预测,并通过对比预测值与实际值,分析模型的预测精度和稳定性。对建立的不同预测模型进行对比分析,从预测精度、计算效率、模型复杂度、可解释性等多个方面进行综合评价,筛选出最适合石羊河流域径流中长期预测的模型。石羊河流域径流预测结果评估与分析:运用多种评价指标,如均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R²)、纳什效率系数(NSE)等,对筛选出的最优预测模型的预测结果进行全面评估。RMSE能够反映预测值与实际值之间的平均误差程度,其值越小,说明预测精度越高;MAE衡量预测值与实际值之间绝对误差的平均值,可直观反映预测误差的大小;R²用于评估模型对数据的拟合优度,取值越接近1,表明模型对数据的解释能力越强;NSE则综合考虑了预测值与实际值的偏差和数据的离散程度,其值越接近1,说明模型的模拟效果越好。通过计算这些评价指标,定量分析模型的预测准确性和可靠性。除了定量评估外,还对预测结果进行不确定性分析。采用蒙特卡洛模拟、贝叶斯推断等方法,考虑模型输入数据的不确定性(如气象数据的测量误差、土地利用分类的不确定性等)、模型结构的不确定性(如不同模型假设和参数化方案的差异)以及参数估计的不确定性,分析这些不确定性因素对径流预测结果的影响程度,确定预测结果的置信区间,为水资源管理决策提供更加科学合理的依据,使决策者能够充分认识到预测结果的不确定性风险,从而制定更加稳健的水资源管理策略。1.3.2研究方法资料收集与整理:通过实地调研、文献查阅、数据共享平台等多种途径,广泛收集石羊河流域的径流、气象、地形、土壤、植被、土地利用以及水资源开发利用等相关资料。对收集到的数据进行严格的质量控制和预处理,包括数据清洗(去除异常值、填补缺失值等)、数据标准化(统一数据格式和单位)等,确保数据的准确性、完整性和一致性,为后续的分析和建模提供可靠的数据基础。对于径流数据,收集流域内各水文站长期的实测径流资料,包括日径流、月径流和年径流数据,并对数据进行合理性检查,如检查数据的连续性、极值是否合理等;对于气象数据,收集周边气象站的降水、气温、风速、相对湿度等数据,采用插值方法将离散的气象站点数据转换为流域面数据,以满足模型输入的需求;利用遥感影像和地理信息系统(GIS)技术,获取流域的地形数据(如数字高程模型DEM)、土壤类型数据、植被覆盖数据以及土地利用现状数据等,并对这些数据进行矢量化处理和空间分析,提取与径流相关的特征信息。模型构建与求解:根据研究内容和目标,选择合适的预测模型,并运用相应的数学方法和计算机技术进行模型构建和求解。对于统计模型,运用数理统计方法建立变量之间的数学关系,通过最小二乘法、极大似然估计等方法求解模型参数;对于水文模型,基于流域的水文物理过程,利用数值计算方法对模型进行离散化处理和求解,如采用有限差分法、有限元法等对水文模型中的偏微分方程进行数值求解;对于人工智能模型,利用深度学习框架(如TensorFlow、PyTorch等)搭建模型结构,通过反向传播算法等优化方法对模型进行训练,不断调整模型参数,使模型能够准确地学习到径流与影响因素之间的复杂关系。在模型构建过程中,充分考虑流域的实际情况和数据特点,对模型进行合理的参数设置和优化,提高模型的适应性和预测精度。以多元线性回归模型为例,首先确定自变量和因变量,然后利用最小二乘法求解回归系数,建立回归方程,并通过方差分析(ANOVA)等方法对模型的显著性进行检验;对于SWAT模型,利用流域的数字化地图和相关数据,在模型软件平台上进行参数设置和模型运行,通过不断调整模型参数,使模型模拟的径流过程与实测径流数据尽可能吻合;在构建LSTM模型时,根据径流数据的时间序列特点和影响因素的维度,确定模型的输入层、隐藏层和输出层的结构,利用随机梯度下降(SGD)等优化算法对模型进行训练,不断更新模型的权重和偏置,使模型能够准确地预测未来径流。模型验证与评估:采用交叉验证、独立样本验证等方法对构建的预测模型进行验证,确保模型的泛化能力和可靠性。将收集到的数据划分为训练集、验证集和测试集,利用训练集数据对模型进行训练,使用验证集数据对模型进行参数调整和优化,最后用测试集数据对模型进行独立验证,评估模型的预测性能。运用多种评价指标对模型进行定量评估,同时结合实际情况对模型的预测结果进行定性分析,全面评价模型的优劣。在交叉验证中,通常采用K折交叉验证方法,将数据集平均分成K份,每次取其中一份作为验证集,其余K-1份作为训练集,重复K次训练和验证过程,最后将K次的验证结果进行平均,得到模型的平均性能指标,以减少因数据划分不同而导致的误差;在独立样本验证中,将未参与模型训练的测试集数据输入模型进行预测,通过计算预测值与实际值之间的误差指标(如RMSE、MAE等),评估模型对未知数据的预测能力。除了定量评估外,还可以通过绘制预测值与实际值的散点图、时间序列对比图等方式,对模型的预测结果进行可视化分析,直观地判断模型的预测效果是否符合实际情况,从而为模型的改进和优化提供依据。二、石羊河流域概况与径流特征分析2.1流域自然地理特征石羊河流域位于甘肃省河西走廊东部,乌鞘岭以西,祁连山北麓,介于东经101°41′-104°16′,北纬36°29′-39°27′之间。其东南与甘肃省白银、兰州两市相连,西北与甘肃省张掖市毗邻,西南紧靠青海省,东北与内蒙古自治区接壤,总面积达4.16万平方公里。独特的地理位置,使其成为连接多个地区的重要纽带,同时也决定了其在区域生态和经济发展中的关键地位。该流域地势呈现出南高北低、自西南向东北倾斜的显著特征,依据地形地貌的差异,全流域可清晰地划分为四个主要地貌单元。南部祁连山地,海拔在2000-5000米之间,山脉大致呈西北-东南走向,这里地势高耸,终年积雪不化,为石羊河提供了丰富的水源基础,是径流形成的关键区域;中部走廊平原区,由东西向龙首山东延的余脉-韩母山、红崖山和阿拉古山的断续分布,将走廊平原巧妙地分隔为南北盆地,南盆地包含大靖、武威、永昌三个盆地,海拔在1400-2000米,北盆地则包括民勤盆地、金川-昌宁盆地,海拔在1300-1400米,最低点的白亭海仅1020米(已干涸),此区域是流域内人口和农业活动的主要集中地,也是水资源开发利用的重点区域;北部低山丘陵区,为低矮的趋于准平原化荒漠化的低山丘陵,海拔低于2000米,其地形相对平缓,但生态环境较为脆弱;以及荒漠区,主要分布在流域的边缘地带,气候干旱,植被稀少,生态系统极为脆弱。石羊河流域深居大陆腹地,远离海洋,属于典型的大陆性温带干旱气候,其气候特点鲜明。太阳辐射强,日照充足,这使得流域内的农作物能够充分进行光合作用,有利于农业生产,但同时也加剧了水分的蒸发;温差大,昼夜温差可达10-15℃,这为一些特色农产品的生长提供了独特的气候条件,如民勤的蜜瓜就因昼夜温差大而糖分积累丰富,口感清甜;降水少,流域多年平均降水量约160毫米,且时空分布极不均匀,南多北少,东多西少,降水主要集中在5-10月,占年降水量的81.0%-89.23%,连续4个月(6-9月)最大降水量占年降水量的63.04%-74.11%,冬季(12、1、2月)降水量极少,仅占年降水量的1.9%-3.4%,春季4-5月降水量普遍偏少,4月占年降水量的1.81%-7.95%,5月占年降水量的8.86%-11.1%,降水的这种不均匀分布导致流域内水资源在时间和空间上的分配不均,增加了水资源管理和利用的难度;蒸发强烈,空气干燥,流域年蒸发量高达2000-2600毫米,远远超过降水量,这进一步加剧了水资源的短缺状况。从河流水系来看,石羊河流域自东向西由大靖河、古浪河、黄羊河、杂木河、金塔河、西营河、东大河、西大河八条主要河流及多条小沟小河汇聚而成。这些河流的补给来源主要为山区大气降水和高山冰雪融水,产流面积达1.11万平方公里,多年平均径流量为15.60亿立方米。石羊河流域按照水文地质单元又可细分为三个独立的子水系,即大靖河水系、六河水系及西大河水系。大靖河水系主要由大靖河构成,隶属大靖盆地,其河流水量在本盆地内实现转化利用;六河水系上游主要由古浪河、黄羊河、杂木河、金塔河、西营河、东大河组成,该六河隶属于武威南盆地,其水量在该盆地内经利用转化,最终在南盆地边缘汇合成石羊河,随后进入民勤盆地,石羊河水量在该盆地全部被消耗利用;西大河水系上游主要由西大河组成,隶属永昌盆地,其水量在该盆地内利用转化后,汇入金川峡水库,进而进入金川-昌宁盆地,在该盆地内全部被消耗利用。石羊河流域复杂的地形地貌、干旱的气候条件以及独特的河流水系分布,共同影响着流域内径流的形成、分布和变化,对流域的水资源开发利用和生态环境保护产生了深远的影响。2.2流域水资源状况石羊河流域水资源总量相对匮乏,主要由地表水资源和地下水资源组成。据相关资料统计,流域多年平均水资源总量约为17.36亿立方米,其中出山地表水资源量多年平均为15.82亿立方米,平原区纯地下水天然资源量为1.54亿立方米。水资源的分布在空间上极不均衡,南部祁连山区是径流形成的关键区域,降水相对较多,高山冰雪融水也较为丰富,产流量较大,该区域水资源相对丰富,为全流域提供了主要的水源补给;而流域下游地区,如民勤盆地等地,降水稀少,蒸发强烈,水资源极为短缺。在时间分布上,水资源的年内分配不均,主要集中在汛期(5-10月),这一时期的径流量占全年径流量的大部分,而枯水期(11月-次年4月)径流量较小。水资源的年际变化也较为明显,存在连续丰水年和枯水年的交替出现,丰水年持续期一般为10年左右,枯水年持续期可达20年。这种水资源时空分布的不均匀性,给流域水资源的合理开发利用和管理带来了极大的挑战。在石羊河流域,地表水与地下水之间存在着密切的相互转化关系,这种关系对流域水资源的形成、分布和利用产生着深远影响。在山区,降水和高山冰雪融水形成地表径流,部分地表径流在流动过程中会渗入地下,补给地下水;而在山前平原地区,地下水又会以泉水等形式出露,成为地表径流的重要组成部分。当河流流经山前冲积扇时,由于地层结构的变化,河水会大量渗漏,转化为地下水,在冲积扇前缘,地下水又会溢出地表,形成泉水河,最终汇入石羊河干流。这种地表水与地下水的相互转化,使得流域水资源在一定程度上得以重复利用,提高了水资源的利用效率,但也使得水资源的管理变得更为复杂。随着人类活动的加剧,如过度开采地下水、修建水库和灌溉工程等,地表水与地下水的转化关系发生了改变。过度开采地下水导致地下水位下降,使得泉水出露量减少,部分泉水甚至干涸,进而影响了地表径流的形成和维持;大规模的水库建设改变了河流的天然径流过程,使得地表水与地下水的补给和排泄关系发生变化,对流域生态系统产生了负面影响。因此,深入研究地表水与地下水的相互转化关系,对于科学合理地开发利用石羊河流域水资源、保护生态环境具有重要意义。长期以来,石羊河流域的水资源开发利用程度较高。农业用水在水资源利用中占据主导地位,由于流域内灌溉农业发达,农田灌溉用水量较大,约占总用水量的80%以上。随着经济的发展和人口的增长,工业用水和生活用水的需求量也在不断增加。据统计,近年来流域总用水量已超过20亿立方米,水资源开发利用程度高达172%,远超水资源的承载能力。在水资源开发利用过程中,也暴露出一系列问题。水资源利用效率较低,农业灌溉方式较为粗放,大水漫灌现象仍然普遍存在,导致灌溉水利用系数较低,仅为0.5左右,大量水资源在灌溉过程中被浪费;工业用水重复利用率不高,一些企业的节水意识淡薄,生产工艺落后,水资源浪费严重;流域内还存在着水资源不合理分配的问题,上下游之间、不同行业之间用水矛盾突出,中游地区用水量大,导致下游地区水资源短缺,生态用水被严重挤占。这些问题不仅加剧了水资源的供需矛盾,也对流域生态环境造成了严重破坏,如地下水位下降、土地沙漠化、植被退化等,威胁到流域的生态安全和可持续发展。2.3径流特征分析石羊河流域径流年际变化明显,呈现出复杂的波动趋势。通过对多年径流数据的统计分析,发现不同支流的年径流量存在较大差异。大靖河多年平均径流量相对较小,约为0.45亿立方米;而西营河多年平均径流量较大,可达3.88亿立方米。从长时间序列来看,石羊河流域年径流量总体呈现出一定的下降趋势,尤其是在20世纪90年代以后,下降趋势更为显著。在1991-2002年期间,石羊河流域出山径流持续减少,这与青藏高原东北部气温持续升高,流域蒸发量增大,降水量持续减少密切相关。气温升高导致冰川退缩、积雪消融加速,使得河流的冰雪融水补给减少;而降水量的持续减少,进一步削弱了河流的主要补给来源,从而导致径流量下降。流域年径流量还存在明显的丰枯交替变化,丰水年持续期一般为10年左右,枯水年持续期可达20年,这种长时间尺度的丰枯变化对流域水资源的稳定供应和合理利用带来了极大的挑战。石羊河流域径流的年内分配不均,具有明显的季节性变化特征。受降水和气温等因素的影响,径流主要集中在汛期(5-10月),这一时期的径流量占全年径流量的比例较高。6-9月的径流量通常占全年径流量的60%以上,主要是因为这一时期流域降水较多且集中,同时气温较高,高山冰雪融水也大量增加,共同导致河流径流量增大。而在枯水期(11月-次年4月),径流量相对较小,仅占全年径流量的30%-40%。其中,冬季(12、1、2月)由于河流封冻,径流主要靠地下水补给,流量最小,1-3月的来水量仅占年总量的6.59%;4-5月随着气温升高,流域积雪融化和河网储冰解冻,形成春汛,流量有所增大,来水量占年水量的15.76%,但此时正值农业出苗水春灌时期,用水需求大,水资源供需矛盾较为突出。径流的空间分布规律与流域的地形地貌、降水分布以及水系特征密切相关。在空间上,石羊河流域径流呈现出从南部山区向北部平原逐渐减少的趋势。南部祁连山区是径流的主要形成区,这里地势高寒,降水较多,气温低,蒸发弱,且有冰川积雪,有利于径流形成,径流量随集水面积的增大而增大,在出山口达到最高值。深山区降水量多、植被条件好,产流量相对较大,径流模数在7.57-8.89升/秒・平方公里之间;浅山区降水量小、植被条件差,产流量相对小,径流模数在5.16-1.22升/秒・平方公里之间。从东向西,径流模数在1.11-8.89升/秒・平方公里范围内呈逐渐增大的趋势,说明整个流域内西部产流量相对大,东部产流量相对小。而在中部走廊平原区和北部低山丘陵区及荒漠区,由于降水稀少,蒸发强烈,且人类活动对水资源的开发利用程度高,导致径流量逐渐减少,水资源短缺问题较为严重。在民勤盆地,由于中游用水急剧增加,进入该地区的地表水量大幅减少,水资源供需矛盾十分突出,生态环境也因此受到严重威胁。影响石羊河流域径流变化的因素众多,主要包括气候变化和人类活动两个方面。在气候变化方面,降水是径流的主要补给来源,降水的变化直接影响径流量的大小。当降水量增加时,径流量相应增大;反之,径流量则减少。气温的变化也对径流产生重要影响,气温升高会加速冰川积雪的融化,增加冰雪融水补给,但同时也会导致蒸发量增大,减少地表水资源量。研究表明,近几十年来,石羊河流域气温呈上升趋势,降水则呈现出波动变化且总体略有减少的趋势,这对流域径流产生了不利影响。在人类活动方面,土地利用变化是影响径流的重要因素之一。随着城市化和工业化进程的加快,流域内耕地、林地、草地等土地利用类型发生了显著变化。大量的耕地开垦和建设用地扩张,导致植被覆盖度降低,地表径流增加,而地下径流减少;同时,森林砍伐和草地退化也削弱了流域的蓄水保水能力,进一步加剧了径流的变化。水资源开发利用活动对径流的影响也不容忽视。石羊河流域水资源开发利用程度较高,水库建设、灌溉用水、工业用水和生活用水等活动改变了河流的天然径流过程。众多水库的修建调节了河流的径流量,使径流过程变得平缓,但也导致下游地区的径流量减少;大规模的灌溉用水使得大量地表水被消耗,减少了河流的补给水源;工业和生活用水的增加也对水资源造成了一定的压力。这些人类活动的综合作用,使得石羊河流域径流变化更加复杂,对流域水资源的合理利用和生态环境保护提出了严峻挑战。三、石羊河流域径流中长期预测方法3.1统计预测方法3.1.1时间序列分析时间序列分析是一种基于时间序列数据自身变化规律进行预测的方法,它假设时间序列数据是由过去的信息和随机因素共同作用产生的,通过对历史数据的分析和建模,来预测未来的趋势。自回归积分滑动平均模型(ARIMA)作为时间序列分析中的经典模型,在径流预测领域有着广泛的应用。ARIMA模型的基本原理是将时间序列数据看作是由自回归(AR)、差分(I)和滑动平均(MA)三个部分组成。自回归部分描述了当前值与过去值之间的线性关系,即通过过去的观测值来预测当前值。假设时间序列Y_t,p阶自回归模型AR(p)的数学表达式为:Y_t=\varphi_1Y_{t-1}+\varphi_2Y_{t-2}+\cdots+\varphi_pY_{t-p}+\epsilon_t,其中\varphi_i(i=1,2,\cdots,p)是自回归系数,\epsilon_t是白噪声序列,表示不可预测的随机误差。滑动平均部分则关注自回归模型中的误差项的累加,通过过去的误差值来预测当前值。q阶滑动平均模型MA(q)的数学表达式为:Y_t=\mu+\epsilon_t+\theta_1\epsilon_{t-1}+\theta_2\epsilon_{t-2}+\cdots+\theta_q\epsilon_{t-q},其中\mu是常数项,\theta_i(i=1,2,\cdots,q)是滑动平均系数。差分部分的作用是使非平稳时间序列转化为平稳时间序列,因为ARIMA模型要求数据必须具有平稳性。对于非平稳时间序列,通常进行d阶差分,即\nabla^dY_t=(1-B)^dY_t,其中B是向后移位算子,B^kY_t=Y_{t-k}。将这三个部分结合起来,就得到了ARIMA(p,d,q)模型,其数学表达式为:\Phi(B)\nabla^dY_t=\Theta(B)\epsilon_t,其中\Phi(B)=1-\varphi_1B-\varphi_2B^2-\cdots-\varphi_pB^p是自回归算子,\Theta(B)=1+\theta_1B+\theta_2B^2+\cdots+\theta_qB^q是滑动平均算子。在石羊河流域径流预测中应用ARIMA模型,需要遵循一定的步骤。要对石羊河流域的径流时间序列数据进行收集和预处理。收集流域内各水文站长期的实测径流数据,确保数据的准确性和完整性。对数据进行清洗,去除异常值和缺失值,对于缺失值可以采用插值法(如线性插值、样条插值等)进行填补;对数据进行标准化处理,消除量纲的影响,使数据具有可比性。可以采用归一化方法,将数据映射到[0,1]区间,公式为X_{norm}=\frac{X-X_{min}}{X_{max}-X_{min}},其中X_{norm}是归一化后的数据,X是原始数据,X_{max}和X_{min}分别是原始数据的最大值和最小值。接着,要对径流时间序列数据进行平稳性检验。因为ARIMA模型要求数据必须平稳,所以需要判断数据是否满足平稳性条件。常用的平稳性检验方法有单位根检验,如ADF(AugmentedDickey-Fuller)检验。ADF检验的原假设是时间序列存在单位根,即非平稳;备择假设是时间序列不存在单位根,即平稳。通过计算ADF统计量,并与临界值进行比较,如果ADF统计量小于临界值,则拒绝原假设,认为时间序列是平稳的;否则,认为时间序列是非平稳的。如果径流时间序列数据不平稳,就需要对其进行差分处理,直到数据达到平稳状态。确定差分的阶数d,可以通过观察时间序列的折线图,看经过几阶差分后数据的均值和方差不再随时间变化,变得相对稳定。也可以结合ADF检验结果,当ADF检验通过时,对应的差分阶数即为d。然后,要确定ARIMA模型的阶数p和q。这是ARIMA模型建模的关键步骤,可以通过自相关函数(ACF)和偏自相关函数(PACF)来确定。ACF描述了时间序列观测值与其过去的观测值之间的线性相关性,PACF描述了在给定中间观测值的条件下,时间序列观测值与其过去的观测值之间的线性相关性。如果PACF在p阶后截尾,即从第p+1阶开始,PACF值迅速趋近于0,则p为自回归阶数;如果ACF在q阶后截尾,即从第q+1阶开始,ACF值迅速趋近于0,则q为滑动平均阶数。也可以采用AIC(AkaikeInformationCriterion)或BIC(BayesianInformationCriterion)准则来确定阶数,AIC和BIC值越小,说明模型的拟合效果越好,对应的p和q即为最优阶数。确定好模型阶数后,就可以使用最小二乘法、极大似然估计等方法对ARIMA模型的参数\varphi_i和\theta_j进行估计,得到具体的ARIMA(p,d,q)模型。利用建立好的ARIMA模型对石羊河流域的径流进行预测,并对预测结果进行评估。可以采用均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R²)等评价指标来衡量预测精度。RMSE能够反映预测值与实际值之间的平均误差程度,其计算公式为RMSE=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2},其中n是样本数量,y_i是实际值,\hat{y}_i是预测值;MAE衡量预测值与实际值之间绝对误差的平均值,公式为MAE=\frac{1}{n}\sum_{i=1}^{n}|y_i-\hat{y}_i|;R²用于评估模型对数据的拟合优度,取值越接近1,表明模型对数据的解释能力越强,计算公式为R²=1-\frac{\sum_{i=1}^{n}(y_i-\hat{y}_i)^2}{\sum_{i=1}^{n}(y_i-\bar{y})^2},其中\bar{y}是实际值的均值。根据评估结果,可以对模型进行调整和优化,如重新选择模型阶数、改进数据预处理方法等,以提高预测精度。3.1.2多元回归分析多元回归分析是一种研究一个因变量与多个自变量之间线性关系的统计方法,它通过建立回归方程来描述因变量与自变量之间的数量关系,从而实现对因变量的预测。在石羊河流域径流预测中,多元线性回归方法被广泛应用,通过筛选与径流相关的气象、地形等因子,构建回归方程,对径流进行预测。多元线性回归的基本原理是假设因变量Y与k个自变量X_1,X_2,\cdots,X_k之间存在线性关系,其数学模型可以表示为:Y=\beta_0+\beta_1X_1+\beta_2X_2+\cdots+\beta_kX_k+\epsilon,其中\beta_0是常数项,\beta_i(i=1,2,\cdots,k)是回归系数,\epsilon是随机误差项,它服从均值为0,方差为\sigma^2的正态分布。回归分析的目的就是通过对样本数据的分析,估计出回归系数\beta_i,使得回归方程能够最好地拟合样本数据,从而可以利用该方程对因变量进行预测。在石羊河流域径流预测中,运用多元线性回归方法,首先需要筛选与径流相关的因子。石羊河流域径流受到多种因素的影响,主要包括气象因素、地形因素和人类活动因素等。气象因素中,降水是径流的主要补给来源,降水的多少直接影响径流量的大小,二者通常呈现正相关关系,即降水量增加,径流量也会相应增加;气温对径流的影响较为复杂,一方面,气温升高会加速冰川积雪的融化,增加冰雪融水补给,使径流量增大,但另一方面,气温升高也会导致蒸发量增大,减少地表水资源量,使径流量减少。地形因素方面,流域的海拔高度、坡度、坡向等都会影响径流的形成和分布。海拔较高的地区,气温较低,降水较多,有利于径流的形成;坡度较大的地区,水流速度较快,下渗量较少,径流量相对较大;坡向不同,接受的太阳辐射和降水也不同,从而影响径流。人类活动因素如土地利用变化、水资源开发利用等对径流也有显著影响。土地利用变化导致植被覆盖度改变,进而影响地表径流和地下径流的比例;水资源开发利用活动如修建水库、灌溉用水等改变了河流的天然径流过程。通过对这些因素的分析和研究,结合石羊河流域的实际情况,筛选出与径流相关性较强的因子作为自变量,如降水、气温、前期径流、土地利用类型等。筛选出相关因子后,要收集石羊河流域的径流数据以及对应的自变量数据。径流数据可以从流域内各水文站获取,包括年径流量、月径流量等;气象数据(降水、气温等)可以从周边气象站收集;地形数据可以通过数字高程模型(DEM)等获取;土地利用数据可以利用遥感影像解译得到。对收集到的数据进行预处理,包括数据清洗(去除异常值、填补缺失值等)、数据标准化(统一数据格式和单位)等,确保数据的质量和可靠性。接下来,基于筛选出的自变量和径流数据,建立多元线性回归方程。利用最小二乘法等方法估计回归系数\beta_i,使得回归方程能够最佳拟合样本数据。最小二乘法的原理是通过最小化残差平方和来确定回归系数,即\min\sum_{i=1}^{n}(y_i-\hat{y}_i)^2,其中y_i是实际观测值,\hat{y}_i是回归方程的预测值。通过求解这个最小化问题,可以得到回归系数的估计值。得到回归方程后,需要对其进行检验和评估。进行显著性检验,包括对回归方程的显著性检验(F检验)和对回归系数的显著性检验(t检验)。F检验用于判断回归方程整体的显著性,原假设是所有回归系数都为0,即自变量与因变量之间不存在线性关系;备择假设是至少有一个回归系数不为0,即自变量与因变量之间存在线性关系。通过计算F统计量,并与临界值进行比较,如果F统计量大于临界值,则拒绝原假设,认为回归方程是显著的;否则,认为回归方程不显著。t检验用于判断每个回归系数的显著性,原假设是某个回归系数为0,即该自变量对因变量没有显著影响;备择假设是该回归系数不为0,即该自变量对因变量有显著影响。通过计算t统计量,并与临界值进行比较,如果t统计量大于临界值,则拒绝原假设,认为该回归系数是显著的;否则,认为该回归系数不显著。如果某个自变量的回归系数不显著,可以考虑将其从回归方程中剔除,重新进行回归分析。除了显著性检验,还需要评估回归方程的拟合优度,常用的指标是决定系数(R²)和调整后的决定系数(AdjustedR²)。R²用于衡量回归方程对样本数据的拟合程度,取值范围在0到1之间,越接近1,说明回归方程对数据的拟合效果越好;AdjustedR²在R²的基础上考虑了自变量的个数,对R²进行了修正,避免了因自变量个数增加而导致R²虚高的问题,其计算公式为AdjustedR²=1-(1-R²)\frac{n-1}{n-k-1},其中n是样本数量,k是自变量的个数。还可以计算均方根误差(RMSE)、平均绝对误差(MAE)等指标来评估回归方程的预测精度,这些指标越小,说明回归方程的预测效果越好。根据检验和评估结果,如果回归方程不理想,可以对模型进行调整和优化,如重新筛选自变量、增加数据量、改进数据预处理方法等,以提高回归方程的性能和预测精度,使其能够更准确地预测石羊河流域的径流变化。3.2物理模型方法3.2.1SWAT模型SWAT(SoilandWaterAssessmentTool)模型是一种基于物理过程的分布式流域水文模型,由美国农业部(USDA)农业研究服务中心(ARS)开发。该模型能够模拟复杂流域内的水文循环、土壤侵蚀、养分循环以及土地利用变化等多种过程,在水资源管理、生态环境评估等领域有着广泛的应用。SWAT模型的结构主要包括水文响应单元(HRUs)、子流域和流域三个层次。模型将流域按照地形、土壤类型、土地利用等因素划分为多个水文响应单元,每个HRU被视为一个相对均匀的区域,具有相似的下垫面条件。在每个HRU内,模型基于水量平衡原理来模拟水文过程。水量平衡方程为:S_{t}=S_{t-1}+P+I_{r}-Q_{s}-E_{a}-Q_{gw}-Q_{lat},其中S_{t}和S_{t-1}分别是t时刻和t-1时刻的土壤含水量,P为降水量,I_{r}为灌溉水量,Q_{s}为地表径流量,E_{a}为蒸散发量,Q_{gw}为地下径流量,Q_{lat}为侧向径流量。降水首先满足植物截留和地表填洼,剩余部分形成地表径流或入渗到土壤中。入渗的水分在土壤中进行再分配,一部分被植物根系吸收,一部分通过蒸散发返回大气,一部分形成壤中流和地下径流。地表径流通过坡面汇流和河道汇流最终流出流域。在石羊河流域应用SWAT模型时,需要进行充分的数据准备。收集流域的地形数据,如数字高程模型(DEM),通过对DEM数据的处理,可以提取流域的坡度、坡向、河网等地形特征信息,这些信息对于确定水流方向、汇流路径以及子流域的划分至关重要。获取流域的气象数据,包括降水、气温、风速、相对湿度、太阳辐射等,气象数据是驱动模型运行的重要输入,其精度直接影响模型模拟结果的准确性。可以从当地气象站、气象数据共享平台等获取这些数据,并根据模型要求进行格式转换和预处理。还需要收集流域的土壤数据和土地利用数据。土壤数据包括土壤质地、土壤容重、土壤孔隙度、土壤水力参数等,这些参数决定了土壤的入渗、蓄水和排水能力;土地利用数据则反映了流域内不同土地覆盖类型的分布情况,不同的土地利用类型具有不同的植被覆盖度、糙率等特征,会对水文过程产生显著影响。可以通过土壤调查、遥感影像解译等方法获取这些数据。参数率定是SWAT模型应用中的关键环节,其目的是调整模型参数,使模型模拟结果与实测数据尽可能吻合。在石羊河流域,可选取流域内具有代表性的水文站实测径流数据作为参考。运用敏感性分析方法,确定对径流模拟结果影响较大的参数,如CN值(曲线数,反映土地利用和土壤类型对径流的综合影响)、基流系数、蒸散发系数等。通过手动调试或借助自动优化算法(如SCE-UA算法、遗传算法等)对这些参数进行调整。在手动调试时,根据经验和对流域水文过程的理解,逐步改变参数值,并对比模拟结果与实测径流数据,直到模拟结果达到满意的精度。自动优化算法则通过在参数空间中进行搜索,寻找使目标函数(如均方根误差RMSE、纳什效率系数NSE等)最优的参数组合。在参数率定过程中,还需要进行模型验证,即利用另一时间段的实测数据对率定后的模型进行检验,以确保模型的可靠性和泛化能力。3.2.2VIC模型VIC(VariableInfiltrationCapacity)模型是一种大尺度的分布式水文模型,由华盛顿大学、普林斯顿大学和美国国家大气研究中心联合开发。该模型主要用于模拟流域的水循环过程,包括降水、蒸散发、土壤水分运动、径流形成等,能够考虑流域下垫面的空间异质性,在区域水资源研究、气候变化影响评估等方面具有重要应用。VIC模型对水循环过程的模拟基于物理机制。在降水过程模拟方面,模型考虑了降雨在空间上的不均匀分布,通过将流域划分为多个网格单元,每个单元接收不同的降水量。对于蒸散发过程,模型采用了三层蒸散发计算方法,分别考虑了植被冠层截留蒸发、植被蒸腾和土壤蒸发。冠层截留蒸发量取决于冠层截留水量和潜在蒸发能力,当冠层截留水量达到饱和后,多余的降水开始下渗。植被蒸腾量与植被类型、叶面积指数、土壤水分含量以及气象条件(如气温、辐射等)有关,模型通过计算植被的气孔导度来确定蒸腾速率。土壤蒸发则主要受土壤含水量和土壤表面能量平衡的影响。在土壤水分运动模拟中,VIC模型将土壤分为多层,考虑了各层之间的水分交换。水分在土壤中的入渗过程采用Green-Ampt模型进行计算,该模型基于土壤水力特性和土壤初始含水量,计算入渗率随时间的变化。土壤层间的水分再分配则根据达西定律进行模拟,考虑了重力和土壤基质势对水分运动的作用。当土壤含水量超过田间持水量时,会产生壤中流;当土壤含水量超过饱和含水量时,会产生饱和坡面流。对于径流形成过程,模型将地表径流和壤中流分别进行计算。地表径流采用运动波方程进行模拟,考虑了坡面的坡度、糙率等因素对水流运动的影响;壤中流则根据各土壤层的水力特性和含水量分布进行计算。各网格单元的径流通过河道汇流最终流出流域。在石羊河流域应用VIC模型时,同样需要准备丰富的数据。地形数据是模型的基础输入之一,通过DEM数据可以获取流域的地形起伏、坡度、坡向等信息,这些信息对于确定水流方向和汇流路径至关重要。利用DEM数据可以生成流域的水系网络,为径流模拟提供框架。气象数据也是必不可少的,包括降水、气温、风速、相对湿度、太阳辐射等。降水数据用于驱动模型的降水过程模拟,气温数据用于计算蒸散发和土壤冻结融化过程,风速、相对湿度和太阳辐射等数据则影响蒸散发和能量平衡。可通过气象站实测数据结合插值方法获取流域面气象数据。还需要获取流域的土壤数据和植被数据。土壤数据包括土壤质地、土壤孔隙度、土壤饱和导水率等,这些参数决定了土壤的水分存储和传输能力;植被数据包括植被类型、叶面积指数等,用于计算植被截留蒸发和蒸腾。可以通过土壤调查、遥感影像解译等手段获取这些数据。在模型参数设置方面,VIC模型有众多参数需要确定。一些参数可以通过实测数据或已有研究成果直接获取,如土壤的物理性质参数可以通过土壤实验测定。对于一些难以直接测量的参数,则需要通过校准来确定。常用的校准方法包括试错法和自动校准算法。试错法是根据经验和对流域水文过程的理解,手动调整参数值,然后对比模拟结果与实测数据,不断优化参数,直到模拟结果与实测数据达到较好的吻合。自动校准算法则利用优化算法在参数空间中搜索最优参数组合,如基于遗传算法、粒子群优化算法等。在石羊河流域,可以选取多个水文站的实测径流数据作为校准和验证数据,通过对比不同参数组合下的模拟径流与实测径流,确定最优的模型参数。还可以对模型进行不确定性分析,考虑输入数据的不确定性、模型结构的不确定性以及参数估计的不确定性对模拟结果的影响,以提高模型模拟结果的可靠性和可信度。3.3机器学习方法3.3.1BP神经网络BP(BackPropagation)神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,在众多领域有着广泛应用。其网络结构通常包含输入层、隐藏层和输出层。输入层负责接收外部数据,将数据传递给隐藏层;隐藏层是神经网络的核心部分,可包含一层或多层神经元,能够对输入数据进行非线性变换,提取数据的特征;输出层则根据隐藏层的处理结果,输出最终的预测值。BP神经网络的学习算法基于误差反向传播原理。在训练过程中,首先将训练数据输入到输入层,数据依次经过隐藏层和输出层的处理,得到预测输出。计算预测输出与实际输出之间的误差,然后将误差从输出层反向传播到隐藏层,再到输入层。在反向传播过程中,根据误差调整各层神经元之间的连接权重和阈值,使得误差不断减小。通过多次迭代训练,网络逐渐学习到输入数据与输出数据之间的映射关系。在石羊河流域径流预测中,确定BP神经网络各层神经元数量至关重要。输入层神经元数量的确定取决于所选取的影响径流的因素。经过前期对石羊河流域径流影响因素的分析,选取降水、气温、前期径流等作为主要影响因素。若选取降水、气温、前一个月径流、前三个月径流、前六个月径流这5个因素作为输入,那么输入层神经元数量即为5。隐藏层神经元数量的确定相对复杂,目前尚无明确的理论公式,通常依据经验公式和多次试验来确定。一种常用的经验公式为n_h=\sqrt{n_i+n_o}+a,其中n_h为隐藏层神经元数量,n_i为输入层神经元数量,n_o为输出层神经元数量,a为1到10之间的常数。假设输入层神经元数量n_i=5,输出层神经元数量n_o=1,根据该经验公式计算可得隐藏层神经元数量n_h的范围,然后在这个范围内进行多次试验,对比不同隐藏层神经元数量下模型的预测精度,如计算均方根误差(RMSE)、平均绝对误差(MAE)等指标,选择使这些指标最优的隐藏层神经元数量。输出层神经元数量根据预测目标确定,若只预测石羊河流域的月径流量,那么输出层神经元数量为1;若同时预测月径流量和月蒸发量等多个指标,则输出层神经元数量相应增加。3.3.2支持向量机支持向量机(SupportVectorMachine,SVM)是一种基于统计学习理论的机器学习算法,最初用于解决二分类问题,后来经过扩展也可应用于回归分析,在径流预测等领域展现出独特优势。其基本原理是在特征空间中寻找一个最优超平面,将不同类别的样本尽可能地分开,并且使分类间隔最大化。对于线性可分的数据,SVM通过求解一个二次规划问题来确定最优超平面的参数。假设给定训练样本集\{(x_i,y_i)\}_{i=1}^n,其中x_i是输入特征向量,y_i是样本标签(y_i\in\{+1,-1\}),最优超平面的方程为w^Tx+b=0,其中w是超平面的法向量,b是偏置。为了使分类间隔最大化,需要求解以下优化问题:\min_{w,b}\frac{1}{2}\|w\|^2,约束条件为y_i(w^Tx_i+b)\geq1,i=1,2,\cdots,n。对于线性不可分的数据,SVM引入核函数将原始数据映射到高维特征空间,使得在高维空间中数据变得线性可分。常用的核函数有线性核函数K(x_i,x_j)=x_i^Tx_j、多项式核函数K(x_i,x_j)=(\gammax_i^Tx_j+r)^d(其中\gamma是核函数参数,r是常数,d是多项式次数)、径向基核函数(RBF)K(x_i,x_j)=\exp(-\gamma\|x_i-x_j\|^2)(其中\gamma是核函数参数)等。核函数的选择对SVM的性能有着重要影响。在石羊河流域径流预测中,径向基核函数因其具有良好的局部特性和泛化能力,被广泛应用。不同核函数的特点决定了其适用场景,线性核函数计算简单,适用于线性可分的数据;多项式核函数可以处理一些具有多项式关系的数据,但计算复杂度较高;径向基核函数能够将数据映射到无穷维空间,对非线性数据具有较好的处理能力。在应用SVM进行石羊河流域径流预测时,除了核函数选择外,参数优化也非常关键。SVM的主要参数包括惩罚参数C和核函数参数\gamma。惩罚参数C用于权衡分类间隔和分类错误的代价,C值越大,对分类错误的惩罚越重,模型越复杂,容易出现过拟合;C值越小,模型越简单,可能出现欠拟合。核函数参数\gamma则决定了径向基核函数的宽度,\gamma值越大,函数的局部性越强,模型对训练数据的拟合能力越强,但泛化能力可能变差;\gamma值越小,函数的全局性越强,模型的泛化能力较好,但对训练数据的拟合能力可能不足。为了确定最优的参数组合,可以采用交叉验证结合网格搜索等方法。网格搜索是一种穷举搜索方法,它在给定的参数范围内,对每个参数值进行组合,然后使用交叉验证评估每个参数组合下模型的性能,选择性能最优的参数组合作为最终参数。将惩罚参数C在[0.1,1,10,100]等取值范围内进行搜索,核函数参数\gamma在[0.01,0.1,1,10]等取值范围内进行搜索,通过5折交叉验证计算每个参数组合下模型的均方根误差(RMSE)等指标,选择使RMSE最小的C和\gamma值作为最优参数。也可以采用遗传算法、粒子群优化算法等智能优化算法来搜索最优参数,这些算法能够在更广阔的参数空间中进行搜索,提高搜索效率,有可能找到更优的参数组合。四、模型应用与结果分析4.1数据收集与处理为了准确预测石羊河流域的径流,本研究广泛收集了多方面的数据,这些数据涵盖了气象、水文、地形等多个领域,为后续的模型应用和分析提供了坚实的数据基础。在气象数据方面,主要从中国气象数据网以及石羊河流域周边的多个气象站点获取。收集的气象要素包括降水、气温、蒸发量、风速、相对湿度和日照时数等。这些数据的时间跨度从1980年至2020年,以月为时间尺度进行记录,确保能够全面反映气象条件的长期变化和季节性特征。降水数据是通过雨量计的观测记录整理得到,经过严格的质量控制,剔除了异常值和错误数据,保证数据的准确性;气温数据则是由气象站的温度计测量记录,同样进行了细致的数据校验和修正。水文数据的收集主要来源于甘肃省水文水资源局以及石羊河流域内的各个水文监测站。收集的水文数据包括各河流断面的月径流量、年径流量以及水位数据等,时间跨度与气象数据一致,均为1980-2020年。水文站采用先进的水文监测设备,如超声波流量计、水位计等,对河流水文要素进行实时监测和记录。对于径流数据,在收集过程中,仔细检查了数据的连续性和完整性,对于少量缺失的数据,采用线性插值、Kriging插值等方法进行了填补。地形数据采用了分辨率为90米的SRTM(ShuttleRadarTopographyMission)数字高程模型(DEM)数据,该数据能够精确地反映石羊河流域的地形起伏和地貌特征。通过对DEM数据的处理和分析,可以提取流域的坡度、坡向、流域面积、河网密度等地形参数,这些参数对于理解径流的形成和分布规律至关重要。利用ArcGIS等地理信息系统软件,对DEM数据进行了矢量化处理,提取了流域的边界和水系网络,为后续的水文模型应用提供了基础地理信息。土壤数据方面,主要参考了中国土壤数据库以及相关的土壤调查资料。获取了石羊河流域的土壤类型、土壤质地、土壤孔隙度、土壤饱和导水率等土壤参数信息。这些土壤参数对于描述土壤的水分存储和传输能力具有重要意义,是水文模型中不可或缺的输入数据。在数据处理过程中,将土壤类型按照国际标准进行了分类和编码,便于模型的识别和应用;对于土壤质地、孔隙度等连续型参数,进行了空间插值和数据标准化处理,使其能够更好地与其他数据融合。植被数据通过遥感影像解译和实地调查相结合的方式获取。利用Landsat系列卫星遥感影像,通过监督分类和非监督分类等方法,提取了流域内的植被覆盖类型和植被覆盖度信息。实地调查则是在不同季节和不同区域选取样地,对植被类型、高度、盖度等进行详细测量和记录,用于验证和校准遥感解译结果。将植被覆盖类型分为林地、草地、耕地、建设用地和裸地等类别,建立了植被覆盖类型数据库;对于植被覆盖度数据,进行了空间分析和统计,得到了流域内植被覆盖度的空间分布特征。在数据收集完成后,进行了一系列的数据预处理工作。对收集到的数据进行清洗,去除异常值和错误数据。对于气象数据中的异常降水值、气温突变值等,通过与相邻站点数据对比、时间序列分析等方法进行判断和修正;对于水文数据中的异常径流值,结合流域的气候条件、地形特征以及人类活动等因素进行分析,确定其是否为真实值,若为错误数据,则采用合理的方法进行替换。对于存在缺失值的数据,根据数据的特点和分布情况,选择合适的方法进行填补。对于时间序列数据,如气象数据和水文数据,采用线性插值、三次样条插值等方法进行缺失值填补;对于空间数据,如地形数据、土壤数据和植被数据,采用Kriging插值、反距离权重插值等空间插值方法进行填补。还对数据进行了标准化处理,将不同量纲和数量级的数据统一到相同的尺度范围内,以消除量纲和数量级对模型计算的影响。对于气象数据和水文数据,采用归一化方法,将数据映射到[0,1]区间,公式为X_{norm}=\frac{X-X_{min}}{X_{max}-X_{min}},其中X_{norm}是归一化后的数据,X是原始数据,X_{max}和X_{min}分别是原始数据的最大值和最小值;对于地形、土壤和植被等空间数据,采用Z-score标准化方法,公式为Z=\frac{X-\overline{X}}{\sigma},其中Z是标准化后的数据,X是原始数据,\overline{X}是原始数据的均值,\sigma是原始数据的标准差。通过这些数据收集和预处理工作,为石羊河流域径流中长期预测模型的应用提供了高质量的数据支持,确保了模型分析结果的准确性和可靠性。4.2模型构建与参数率定4.2.1统计模型构建在统计模型的构建方面,选用了多元线性回归模型和自回归滑动平均模型(ARMA)。多元线性回归模型旨在建立石羊河流域径流量与多个影响因素之间的线性关系。经过前期对流域径流影响因素的深入分析,选取降水、气温、前期径流作为主要影响因子。设径流量为y,降水为x_1,气温为x_2,前期径流为x_3,构建的多元线性回归模型为y=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_3+\epsilon,其中\beta_0为常数项,\beta_1、\beta_2、\beta_3分别为降水、气温、前期径流对应的回归系数,\epsilon为随机误差项。通过最小二乘法对回归系数进行估计,使得模型能够最佳拟合历史数据。最小二乘法的原理是通过最小化残差平方和来确定回归系数,即\min\sum_{i=1}^{n}(y_i-\hat{y}_i)^2,其中y_i是实际观测值,\hat{y}_i是回归方程的预测值。通过求解这个最小化问题,可以得到回归系数的估计值。得到回归方程后,对其进行显著性检验,包括F检验和t检验,以判断回归方程整体以及各回归系数的显著性。还计算了决定系数(R²)和调整后的决定系数(AdjustedR²)等指标来评估回归方程的拟合优度,R²用于衡量回归方程对样本数据的拟合程度,取值范围在0到1之间,越接近1,说明回归方程对数据的拟合效果越好;AdjustedR²在R²的基础上考虑了自变量的个数,对R²进行了修正,避免了因自变量个数增加而导致R²虚高的问题,其计算公式为AdjustedR²=1-(1-R²)\frac{n-1}{n-k-1},其中n是样本数量,k是自变量的个数。对于ARMA模型,首先对石羊河流域的径流时间序列数据进行平稳性检验,采用ADF(AugmentedDickey-Fuller)检验方法。ADF检验的原假设是时间序列存在单位根,即非平稳;备择假设是时间序列不存在单位根,即平稳。通过计算ADF统计量,并与临界值进行比较,如果ADF统计量小于临界值,则拒绝原假设,认为时间序列是平稳的;否则,认为时间序列是非平稳的。若径流时间序列数据不平稳,对其进行差分处理,直至数据达到平稳状态,确定差分阶数d。根据径流时间序列的自相关函数(ACF)和偏自相关函数(PACF)来确定模型的阶数p和q。ACF描述了时间序列观测值与其过去的观测值之间的线性相关性,PACF描述了在给定中间观测值的条件下,时间序列观测值与其过去的观测值之间的线性相关性。如果PACF在p阶后截尾,即从第p+1阶开始,PACF值迅速趋近于0,则p为自回归阶数;如果ACF在q阶后截尾,即从第q+1阶开始,ACF值迅速趋近于0,则q为滑动平均阶数。也可以采用AIC(AkaikeInformationCriterion)或BIC(BayesianInformationCriterion)准则来确定阶数,AIC和BIC值越小,说明模型的拟合效果越好,对应的p和q即为最优阶数。确定好模型阶数后,使用极大似然估计等方法对ARMA模型的参数进行估计,得到具体的ARMA(p,d,q)模型。利用建立好的ARMA模型对石羊河流域的径流进行预测,并通过计算均方根误差(RMSE)、平均绝对误差(MAE)等指标来评估模型的预测精度。RMSE能够反映预测值与实际值之间的平均误差程度,其计算公式为RMSE=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2},其中n是样本数量,y_i是实际值,\hat{y}_i是预测值;MAE衡量预测值与实际值之间绝对误差的平均值,公式为MAE=\frac{1}{n}\sum_{i=1}^{n}|y_i-\hat{y}_i|。4.2.2物理模型构建在物理模型构建中,运用了SWAT(SoilandWaterAssessmentTool)模型和VIC(VariableInfiltrationCapacity)模型。SWAT模型是一种基于物理过程的分布式流域水文模型,它将流域按照地形、土壤类型、土地利用等因素划分为多个水文响应单元(HRUs)。在构建SWAT模型时,利用分辨率为90米的SRTM(ShuttleRadarTopographyMission)数字高程模型(DEM)数据,通过ArcGIS软件对其进行处理,提取流域的坡度、坡向、河网等地形特征信息,依据这些信息划分流域的子流域和水文响应单元。收集石羊河流域1980-2020年的气象数据,包括降水、气温、风速、相对湿度、太阳辐射等,这些数据从中国气象数据网以及流域周边的多个气象站点获取。土壤数据参考中国土壤数据库以及相关的土壤调查资料,获取土壤类型、土壤质地、土壤孔隙度、土壤饱和导水率等参数信息。植被数据通过Landsat系列卫星遥感影像解译和实地调查相结合的方式获取,提取植被覆盖类型和植被覆盖度信息。将这些数据按照SWAT模型的输入要求进行格式转换和预处理后,输入模型。在参数率定方面,运用敏感性分析方法,确定对径流模拟结果影响较大的参数,如CN值(曲线数,反映土地利用和土壤类型对径流的综合影响)、基流系数、蒸散发系数等。采用SCE-UA(ShuffledComplexEvolution-UniversityofArizona)算法对这些参数进行自动优化,以实测径流数据为目标,不断调整参数值,使模型模拟结果与实测数据尽可能吻合。SCE-UA算法是一种高效的全局优化算法,它通过在参数空间中进行搜索,寻找使目标函数(如均方根误差RMSE、纳什效率系数NSE等)最优的参数组合。在参数率定过程中,将1980-2000年的数据作为率定期,2001-2020年的数据作为验证期,利用验证期数据对率定后的模型进行验证,确保模型的可靠性和泛化能力。VIC模型是一种大尺度的分布式水文模型,主要用于模拟流域的水循环过程。在构建VIC模型时,同样利用SRTMDEM数据获取流域的地形起伏、坡度、坡向等信息,生成流域的水系网络。气象数据与SWAT模型使用的数据源相同,经过处理后输入模型。土壤数据和植被数据也通过相应的途径获取,并按照模型要求进行整理和输入。VIC模型对水循环过程的模拟基于物理机制,在降水过程模拟方面,考虑降雨在空间上的不均匀分布,通过将流域划分为多个网格单元,每个单元接收不同的降水量。对于蒸散发过程,采用三层蒸散发计算方法,分别考虑植被冠层截留蒸发、植被蒸腾和土壤蒸发。土壤水分运动模拟中,将土壤分为多层,考虑各层之间的水分交换,水分在土壤中的入渗过程采用Green-Ampt模型进行计算,土壤层间的水分再分配则根据达西定律进行模拟。地表径流采用运动波方程进行模拟,壤中流根据各土壤层的水力特性和含水量分布进行计算。在参数设置方面,对于一些可以通过实测数据或已有研究成果直接获取的参数,如土壤的物理性质参数,直接采用相应的数据。对于难以直接测量的参数,如蒸散发参数、土壤水力传导度等,采用试错法和自动校准算法相结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论