版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章水文模型评估
7.1概述
在使用水文模型估算某流域输出之前,有必要对模型进行评估。具体包括:模型选取、
模型率定、模型验证和模型评价,这四个方面内涵明确,在水文模型评估中依次进行。其中,
模型率定中对参数值的估计最受关注。但是,这四个方面都同等重要,忽视任何•个都可能
导致严重的错误。模型评估的具体流程见图7-1(Singh,2002)。
图7-1模型评估的步骤
7.2模型选取
7.2.1需要考虑的因素
在遵循模型选取和验证、充分利用已有信息等系统化规则的基础上客观、准确的选取模
型可以有效地促进水文工作。目前,供我们使用的水文模型非常之多,如何选择真正适合的
水文模型,是需要解决的首要问题。Haan认为,模型的选取很大程度上依赖于我们所研究的
问题。通常来讲,在模型选取的过程中需要考虑的因素有:研究问题所包含的水文过程的特
点、模型的用途、现有资料的有效性以及根据模型结果所做出的决策(Singh,2002)。我国
学者王旭东等人(2004)认为,模型选取应该考虑以下几个关键问题:
①模型的输出信息是否满足决策需求:大多数水文模型都有研究问题的侧重点,需要
考虑模型输出的信息是否满足决策要求。
②模型的适用区:任何模型都有一定的假设和概化,因而有各自的适用范围,应充分了
解模型的结构特点,确定其适应性。
③模型的当前状态:需要确认模型是试验性的、公共软件、还是完全商业化的?哪些
区域已经成功地使用了它?修改漏洞和扩展模型功能时需要作些什么?通常,更有用的
模型都处于不断的完善之中并且有一个用户群,而且也能提供用户支持。
④模型的数据需求:各模型都有其不同的原始数据需求。我们不可能奢求任何•种信
息采集方案可以完全满足流域水文模型的数据需求:不顾现有数据基础和落后的信息采集设
施肓目讲行流域水力模型的开发也显不理智的。
⑤模型对不同数据源获取信息的能力:大多数流域水文模型软件具有数据输入能力,
以尽量减少数据输入的工作量。对于空间数据输入,确定该系统具有格式转换、投影转换、
插值和预测功能,有无电子表格数据格式输入功能等等。
⑥模型对用户的要求:用户必须有什么样的专业知识和技
能才能成功运用模型?用户群有这些技能吗?
⑦采用该模型软件的开销及可获得的技术支持状况:应该
确定最初的开销,以及维护、培训、和支持的开销;安装系
统、准备输入、学习系统和运行系统将花多长时间;在线材
料、文本、文章、和源代码文档是否可供使用等。
只有全面考虑、综合比较,才能选择出真正适合于研究流域
的水文模型,才能使水文模型为提高流域管理现代化水平发
挥作用。
7.2.2模型选取的标准
以上讨论了选取适当模型通常需要考虑的问题。然而,多数情况下,根据某一特定问题
选择最佳模型的完全客观的方法并不存在。Dawdy和Lichty就如何从多个备选模型中选出
我们所需要的模型提出了四个标准(Singh,2002):
①模型预测的精度
②模型的简易性
③参数估计的一致性
④参数的敏感性
模型预测的精度至关重要,其他因素相同的
条件下,应该选择具有最小误差方差的模
型;模型简易性考虑的是待评估参数的数量
以及应用该模型向公众或委托人做出解释
的难易程度,其他因素相同的条件下,应该
选择最简单的模型;如果参数最优值对某特
定时期的资料非常敏感,或者是在同一流域
变化很大,那么这个模型就不可取。此外,
模型不能对不宜测量的输入变量过于敏感。
7.3模型率定
无论选择哪种模型,都包含很多表征物理过程的未知参数。
使用模型模拟径流过程之前,必须对模型参数进行赋值,也
就是说必须评估这些参数使得模拟径流过程和实测径流过
程达到最佳程度的拟合,这一过程称为“模型率定。这里主
要讲解“概念性”水文模型的率定。
7.3.1模型参数
许多水文模型都是基于流域物理过程的概念表达,这类模型包含两类参数:具有物理意
义的参数和过程参数。具有物理意义的参数指能够通过直接测量得到的用来表征流域特性的
参数。包括:河长、河道坡度、雨量站权重、流域面积、不透水面积的比率等,这类参数•
经确定不再修改。过程参数指不能够通过直接测量得到的表征流域特性的参数,随流域降雨
径流特性以及下垫面条件不同而不同,包括:各土层最大蓄水容量、自由水库最大容量、蒸
散发系数以及各种水流的出流、消退系数等。这类参数在模型中不具有明确的物理含义,可
以通过物理成因分析推导或计算。
参数的确定包括参数初估和参数评估两个过程:参数初估是
指根据流域特征确定模型参数的初始值。对于具有物理意义
的参数,可以通过野外测量和文献资料分析获取;对于过程
参数,通过对流域水文特征的判断和理解给出参数的取值范
围(最大和最小值)。然后通过参数评估进一步减小参数初
估的不确定性。可以采用多种方法减小参数初估的不确定
性。典型的方法是首先在参数取值范围内选取一个初值,然
后通过人工或计算机自动调整参数,使得模型更适用于该流
域(Singh,2002)o
7.3.2人工率定
为了率定模型,必须选择某些要求与模型匹配的流域特征。典型地,通常选择河流某处
或多处水文过程线,然后通过调整模型参数使得在某些历史数据上模拟河流水文过程线与
实测河流水文过程线相逼近。人工率定方面,通常采用试错法进行调参。每个参数调整后,对
比模拟水文过程线和实测水文过程线,比较二者的匹配程度是否有所提高。
对于受过训练、有丰富经验的人员来说,采用人工率定的方
法可能能够得到很好的率定结果。然而,对于没有受过训练、
没有丰富经验的人员来说,人工率定是既复杂又浪费时间的
一项工作,原因是很难确定调整参数的逻辑值(由于存在参
数对模型输出的补偿效应)。计算机的发展使得人工率定过
程在某种程度上复杂性有所降低,能够使我们快速观察和比
较调参的结果。
人工率定的最大缺点是缺少普遍公认、客观的度量准则来确
定何时终止率定过程。例如,很难确定是否已经得到了最佳
的模拟效果。因为人工率定包含了大量的主观判断,同一流
域不同的人会得到截然不同的参数值。因此很难评价该率定
模型及其模拟和预测的可信度。
7.3.3自动率定
Dawdy和O'Donnell、Nash和Sutcliffe、Ibbitt等诸多学者对自动率定方法进行了研究
(Singh,2002)。他们采用统计回归和模型拟合技术解决了大量率定问题的研究工作,如
Dswdy和O'Donicll等人基于Roscnbrock算法开发计算机程序来优化线性水库容量、卜渗
系数等。自动率定方法开始以后,便取得了很大进展。需要注意的是,虽然自动率定提高了
解决问题的速度,但它还不能够完全取代人工率定,它仍离不开人为的技巧性,且与人工率
定紧密相联。
参数率定乂称为参数优选。参数自动优化过程就是采用数学算法、通过系统的反复试验
改变模型参数值的大小,使得河流特征模拟值和实测值的差别最小。这些反复的试验称为
“迭代例如,评价模拟径流和实测径流拟合程度的定量方法是在每个参数迭代之后计算
目标函数。整个优化过程中,最终将保留使目标函数值达到最小的参数系列,该参数系列被
称为最优参数系列。
以一维参数模型和二维参数模型为例,当根据参数值描绘出目标函数(曲线)吐即形
成了一个响应面,两个模型对应的典型响应面如图7-2所式。这个概念可以延伸到含有n个
参数的模型,在(n+1)维空间上形成的响应面,当然,这样的响应面是无法可视化的。最优
参数系列定义为目标函数值最小的情况下响应面上的最低点。这个最低点是全局最优的。响
应面上还存在许多其它点,这些点比它邻近范围内的其他点要低,但不低于全局最优点,这
些点称为“局部最优”,见图7.2所示。
(A)
(B)
图7-2响应面,A:一维参数模型:B;二维参数模型
典型的参数自动评估过程包括目标函数、优化算法、终止准则和收集率定数据四部分内
容。
73.3.1目标函数
目标函数用来评价实则过程与模型模拟过程的吻合程度。因此,模型自动率定的目的就
是“寻找使目标函数值达到最优(最小、最大或适中)的参数值”。不同的目标函数用来评
价水文过程的不同特征,H标函数的选择对优选结果至关重要。为了使优选的参数能更好的
代表流域水文特征,选择目标函数时一般考虑以下几个方面:
①模拟流量过程与实测流量过程保持水量平衡。
②模拟与实测流量过程形状基本一致。
③洪峰流量、峰现时间较好的吻合。
根据统计回归和模型拟合理论,最常用的目标函数是加权最小二乘法及其各种变形形
式:
尸(。)=力皿夕—一严(加
9(7.1)
式中:一一时刻实测流量值;
夕:加——f时刻模拟流量值;
e——待优选参数;
n——数据点个数:
叱——/时刻权重。
若=1,加权最小二乘法则简化成简单最小二乘法,如果模型能够精确模拟实测过程,
那么目标函数可以达到最小值0。然而,一般来讲,目标函数是不可能达到0的,因此参数率
定的目的就是寻找使目标函数值达到最小的参数值。
为了对模拟结果做出正确的评价,我们将目标函数转化为一些具体的可操作的指标。不同目
标函数之间存在一个平衡约束关系。例如.我们可能找到一系列能够很好的模拟洪峰流量的
参数.但它却不能很好的模拟小流量.反之亦然。下面介绍几个目标函数:
(1)总体水量误差,评价总体水量是否平衡:
N
耳@=f=l________________________(7.2)
N
/=|
(2)根均方误,评价实测与模拟流量过程线的吻合程度:
v%
£城修产-武⑹F2
Gl______________________(7.3)
办N广
r=l
(3)洪峰流量过程的根均方误,评价实测与模拟洪水流量过程的吻合程度:
%
力M;联-六加
1M,,
,=1(7.4)
f=l
(4)小流量过程的根均方误、评价实测与模拟最小流量过程的吻合程度:
(7.5)
式中:----实测流量序列;
q———模拟流量过程;
N——流量序列数;
M0——洪峰个数;
Mi——小水过程数;
〃,——第j个洪峰〃卜水过程序列数;
0——待优选参数;
叱----权重。
上式中洪峰流量过程以实测流量大于某•给定的流量值来确定,枯水流量过程以实测
流量小于某一给定的流量值来确定。
Nash与Sutcliffe在1970年提出了模型效率系数(也称确定性系数)来评价模型模拟结果的
精度,确定性系数是式(7.3)的另一种表现形式,它更直观的体现了实测与模拟流量过程拟
合程度的好坏,确定性系数公式如下:
ZN炉展-夕”
R2=I-----------------(7.6)
£炉[小-武]2
/=1
式中:一一表示实测流量过程的均值;
其余符号同前。越大表示实测与模拟流量过程拟合的越好,模拟精度越高,另外还有
洪峰合格率、峰现时差等评价指标(Madsen,2000)。
单目标参数优选往往不能恰当地描述由观测资料所反映出来的各种水文特征。例如,在
作水库入库洪水预报时,人们不仅关心洪峰流量和峰现时差预报的精度,而且还关注洪量和
洪水过程线的预报结果。用单日标函数优选出来的参数常常无法同时满足上述这些要求。
因此,研究探讨多目标参数自动优选方法,在理论和实践中均具有重大的现实意义(张洪刚
等,2002)。
当应用多目标参数优选方法时,模型率定可由下式描述:
min忻(6),尸2(。),一£(。)}匹。(7.7)
式中,为模型参数解空间,一般根据模型参数的物理意义给出每个参数的取值范围。由
上式得出的结果,一般情况下并不是唯一的解,而是包含了所有非支配解优化点的集合,对
于集合中的任意有以下规律:
①对于所有支配解,集合中至少存在一非支配解,使得();
②在集合中找不到一组解,使得()。
由上述①可知,模型参数空间可以划分为两种情况,即非支配解与支配解。由②可知,
在非支配解集合里没有哪一组参数比其它任何一组参数都好,只是说这组参数所反映的水
文过程的某些方面特征比其它参数准确。
因此,在利用多目标参数自动优选率定模型时,关键问题在于如何综合考虑各个目标函
数之间的平衡协调关系,如何对各个目标函数进行组合得到一个综合目标函数。下式给出了
一个总体目标函数:
F(—=[(耳(6)+4产+(43)+4)2+…有(夕)+4)2]%(78)
式中,为对应于每一个目标函数给定的一个常数,通过它来调整各个目标函数在总体
目标函数中的权重。然而,由于各个目标函数在总体目标函数中的权重还取决于函数本身,
所以并不能简单地通过给定一个常数就能很好地协调各目标函数之间的平衡关系。为了综合
评价,对不同的FI标函数赋不同的值进行参数优选,使得上式中()项到原点的距禽相
等,该方法称为距离函数法。值由下式给出(Madsen,2000:赵人俊,1984)。
4=max忆.in,/=1,2…p}-Fimin,i=1,2…p(7.9)
张洪刚等人(2002)以三水源新安江模型为例,综合考虑水
量平衡、确定性系数、洪峰和枯水流量过程等目标函数,通
过对目标函数的不同组合方式,分别率定模型参数和分析比
较结果。研究表明,多目标参数自动优选方法综合考虑了水
文过程的各种要素,优于传统的单目标优选结果,具有较高
的模拟预报精度(张洪刚,2002)。
7.332优化算法
对于某一特定流域,当水文模型和目标函数选定以后,优选算法的选择对模型参数最终
取值起决定性作用。在过去的20年中,水文工作者对水文模型参数优选方法做了大量的研
究,可归结为以下四点(Singh.2002):
①实测数据中各种谩差的处理方法研究;
②寻求一种解决模型参数优选问题的最佳方法;
③选择多少数据以及选择什么样的数据来进行参数优选;
④如何有效统计分析模型结构与模型参数的不确定性,以及这种不确定性对模型输出
的影响。
参数优选方法一般分为局部寻优与仝局寻优.局部寻优法通过给定参数初值,给定搜索
步长,通过计算新的目标函数值,逐步用较优的点代替次优的点,在给定终止条件的前提下,
经过反复试算逐步确定参数最优点,比如:罗森布瑞克法,单纯形法,模式搜索法等。由于水
文模型大多数是非线性的、模型的响应面是多峰的,也就是说在参数空间里有若干个局部极
低点,因此局部寻优法对参数初值的要求较高,给定不同的参数初值,往往会得到不同的优
选结果,因此采用局部寻优法很难确定优选结果是否为全局最优(Wang,1991)。
全局寻优法能有效的对参数空间内的多个极值点进行综合考虑,从整个参数空间中寻
求全局最优解。全局最优法分为确定优选、随机优选及二者综合的方法。确定性优选方法能
保证严格收敛,但是往往要求目标函数连续、可微,因此水文模型参数优选中最常用的是随
机优选法或者综合优选法.如ARS、SCE-UA.基因算法等。
目前在水文模型参数优选中应用最为广泛的方法是基因法、罗森布瑞克法、单纯形法和
SCE-UA法。前三种优化方法中以罗森布瑞克法的运算速度最快,单纯形法次之,基因法略
差;参数初值的选定对基因法的影响较小,而对罗森布瑞克法和单纯形法的影响较大;各方
法以单纯形法的精度最高,罗森布瑞克法次之,基因法略差。综合上述三种方法的优点,建
议以基因法的优选结果作为参数初值,然后采用罗森布瑞克法,最后再采用单纯形法进一步
优化,一般可得到模型参数的最佳值(谭炳卿,1996;Duan,1992)。
Duan等人认为用优化算法来优化水文模型参数,可能会出现几组不同的参数,这是由
于优化算法本身可能是局部优化引起的,同时水文模型参数优化常常表现为高维性、多峰
性、非线性、非凸性,据此Duan等人提出了单纯多边形优化算法(SCE-UA)算法,SCE-UA
算法结合了包括遗传算法、单纯下山搜索方法的一些优点。郭靖等人(2006)结果表明:
SCE-UA法对优选参数的初值要求低,只要在寻优空间内,不论参数初值怎么选取,都可以
得到近似最优值,可以进行全局寻优;SCE-UA法的收敛速度比基因法快,但是比罗森布瑞
克法和单纯形法慢;SCE-UA法是一种全局寻优方法,其优选结果稳定并由于其余三种方法,
更适合于水文模型的参数优选。王建群等人(2001)分析了SCE-UA算法的特性,指出该算
法仍存在着一些缺陷.例如SCE-UA算法的全局最优性依赖干随机选取的初始点集的多样
性,若初始点集选取不当,搜索进化就会早熟而陷入局部最优解;SCE-UA算法求解具有区
间约束的非线性约束优化问题较有效,但对于一般的不等式约束非线性优化问题其求解效
率有待于进一步提高等。下面简单介绍以上四种方法。
(1)基因法Genetic
基因法是一种基于自然基因和自然选择机制的寻优方法。该法按照“择优汰劣”的法
则,将适者生存与自然界基因变异、繁衍等相结合,从各参数的若干可能取值中,逐步求得
最优值。基因法不是从参数的给定起始点按确定的搜索方向直接对参数值本身寻优,而是随
机地从参数的搜索空间中选取个点(可取100),以参数值的二进制码进行操作,从选取的
个点中随机地选取两点,并赋以产生较小目标函数值的点较高的概率,按某•随机方式
(有时可加入随机扰动)生成两个新点,一直到生成个新点为止。通常,生成的个新点
可望比原有的个点更接近于最优值域(谭炳卿,1996)。
(2)罗森布瑞克法Rosenbrock
该法由Rosenbrock于I960年提出,是一种迭代寻优过程,它把各搜索方向排成一个正
交系统,在完成一个坐标搜索循环之后进行改善,当所有坐标轴搜索完毕并求得最小的目标
函数值时迭代结束。
设是维欧儿里得空间中的单位矢量,表示搜索的阶段(=0,I,-),为一组生成
的规格化正交方向,分别为循方向的步长,搜索从起,由在序列的第一个坐标方向作一
扰动开始,若的值等于或小于的值,这一步就算是成功的,就以试算点代替,乘上
一个因子乂),并在搜索方向作下一次扰动。如果的值大于的值,这一步就算是失败的,
不用代换,乘上一个因子<0,然后在搜索方向作下一次扰动。
当个搜索方向全部扰动过后,再在第一个方向作扰动,扰动的步长等于或,视
方向上最近一次扰动的结果而定。扰动在各搜索方向上依次持续进行,直到在第一方向上成
功后遇到失败为止,这时第阶段结束。由于把函数值相等认为是成功的,故在每个方向上
当的乘子将步长缩短时总会达到成功。所得的最后点变为下一阶段的始点,即。规格化
方向选为与平行,其余方向选成互相正交并与正交(谭炳卿,1996)。
⑶单纯形法
单纯形法由Splcndy等人1962年提出,单纯形法的基本思想是根据问题的标准型,从
可行域中一个基本可行解(一个极点)开始,转换到另一个新的基本可行解,并且使目标函
数值较前有所改善。经过若干次这样的转换,最后得到问题的最优解或判断无最优解。Nelder
和Mead针对该法不能加速搜索,以及在曲谷中或曲脊.上进行搜索所遇到的困难,对搜索方
法做了若干改善。改进后的方法允许改变单纯形的形状,应用中()个顶点的可变多面体把
具有个独立变量的函数极小化。每一个顶点可山一个矢量确定,在中产生的最面值的
顶点,通过其余各顶点的形心连成射线,用更好的点逐次代替具有最高值的点,就能找到
目标函数的改进值,一直到的极小值被找到为止(谭炳卿,1996)。
(4)SCE-UA算法
SCE-UA算法由Duan等人1992年提出。该算法是一种解决非线性约束最优化问题的
有效方法,可以找到全局最优解。该算法已在概念性水文模型、半分布式水文模型和分布式
水文模型中得到广泛应用(Duan,1992)。
SCE-UA算法的基本思路是将基于确定性复合型搜索技术和自然界中生物竞争进化原
理相结合。算法的关键部分为竞争的复合型进化算法(CCE)o在CCE中,每个复合型的顶
点都是潜在的父辈,都有可能参与产生下一代群体的计算。每个子复合型的作用如同一对父
辈。随机方式在构建子复合型中的应用,使得在可行域中的搜索更加彻底。用SCE-UA算法
求解最小化问题的具体步骤如下:
①初始化,假定待优化问题是维问题,选取参与进化的复合型个数p(pN1)和每个
复合型所包含的顶点数目m(m2n+l),计算样本点数目s=pXma
②产生样本点,在可行域内随机产生s个样本点分别计算每一点的函数值,
③样本点排序,把个样本点()按函数值升序排列,排序后仍记为(),其中
,记。
④划分复合型群体,将划分为个复合型,每个复合型含有点,其中
⑤复合型进化,按CCE分别进化各个复合型。
©复合型混合,把进化后的每个复合型的所有顶点组合成
新的点集,再次按函数值升序排列,排序后不妨仍记为D,
对D按目标函数的升序进行排列。
⑦收敛性判断,如果满足收敛条件则停止,否则返回④。
7.333终止准则
优化策略是通过不断的试算一修改来搜索最优参数值的迭代过程。因此,这就需要一个
判断何时终止搜索过程的合理准则。原则上,结果存在于参数空间的某一个点上,该点
处目标函数值最小、函数响应面的梯度为0。而事实上,即使已经达到该点可能也不知
道。因此.通常用到以下几条终止准则来结束整个搜索过程(Singh,2002)。
⑴函数收敛
当算法不能够再通过一次或多次迭代使函数值有明显改进时,即终止搜索过程。如果最
优的精确判断不是非常重要,函数收敛可以作为一个有月的终止标准。当满足下式时,即可
终止搜索过程:
(九-力)/力<=盯(710)
其中,和分别表示第次和第次迭代的函数值,表示函数收敛标准值。(例如取
=10-3)
⑵参数收敛
另一个方法是当算法不能够再通过一次或多次迭代使参数值有明显改进、且同时增加函
数值时.,即终止搜索过程。对于每一个,当满足下式时,即可终止搜索过程:
(仇”T-6(”)«伙力”小一8⑺min)<=%(711)
其中.和分别表示第次和第次迭代的第个参数值,表示参数收敛标准值(例如
取=10-3)。
⑶最大次代次数
若计算时间有限,为避免算法进入无限循环中,可以用限定迭代次数的方法,这种方法
可以将计算的速度限定在一个数量上.实现起来比较简单,一般情况下使程序能够及时
终止。
⑷局限性
显然,没有哪些终止准则可以保证搜索结果可以达到全局最
优。这些准则可以用于同一个优化过程的运算中,当达到第
一个准则时,即可终止整个搜索过程。
733.4率定数据
毋庸置疑,正确选择率定数据可以有效的减少水文模型率定过程中遇到的困难。然而,
客观上,对于“最佳”率定数据由什么组成却知之甚少。这里讨论的是.率定过程中多
少数据是必需的、多少数据是充足的,哪些数据会给出最好的分析结果。
⑴数据的数量
众所周知,我们通常采用一部分数据率定模型,采用其余的数据验证模型。Sorooshian等人、
Xu和Vandewiele的研究表明,采用比实际必需的数据序列更长的序列仅能较小程度上提高
参数估计。从统计的观点来看,采用的数据序列长度应该至少是参数个数的20倍(例如,如
果有10个参数,那么应该至少有200个河流数据点来计算函数值)。当然,这仅是一个经验
法则。Gupta和Sorooshian研究表明,参数的标准误差随着样本的增大而降低,可以近似
表示成如卜公式:
/•、1
忑(7.12)
当达到500至1000以后,随着的增大,的变化程度很小。这表明,对于少于10个
参数的日模型来说,只要数据正确,2到3年的率定数据已经足够了(Singh,2002)。
⑵数据的质量
Gupta与Sorooshian(1985)分析发现,
水文数据的质量对模型参数优选的影响远
大于所选取数据数量对模型参数优选的影
响。数据质量依赖于数据中所包含的有关水
文过程信息的多少与数据本身存在的误差,
数据包含的信息多少取决于水文过程的变
幅,如果数据涵盖了丰水、中水、枯水年,则
认为数据中包含的水文信息较多。我们总是
希望信息足够的多而误差尽可能的小,但实
际上,无论选取怎样的数据,由于测量仪器
的系统偏差、数据转化算法的误差、反推入
库流量的误差等因素,误差不可避免,尤其
是降雨资料往往会低估了流域上的实际降
雨量,因此对模型率定数据要慎重选择,需
要对数据进行三性(数据的代表性、可靠性
与一致性)审查。
7.4模型验证
模型验证是继参数评估之后的模型分析的第三部分内容。当
在一个流域上使用某一模型时,首先要对模型进行率定,求
出其最优参数,除此之外,还需要另外一部分资料,用于对
模型的检验。只有既在率定期又在检验期模型都具有较高的
精度才有把握将这一模型用于该流域。
7.4.1模型验证方法
Klemes提出了概念性水文模型的模型验证框架,共包括四类验证方法,如表7-1所示
(Singh,2002)o
简单样本等分法是将流域实测时间序列数据分成两部分,分别用于模型率定和模型验证,然
后比较结果。差异样本等分法,与简单样本等分法基本相同,但数据划分有所不同;该方法
是根据雨强或其他变量进行数据划分.目的是为了展示在条件发生变化时,即模型验证期的
条件与率定期的条件有所差异的情况下,模型可以预测输出变量值的有效性。例如.如果预
采用该模型模拟湿润条件下的径流,那么应该采用干旱条件下的历史数据序列进行模型率
定,采用湿润条件下的数据序列进行模型验证;反之亦然。代理流域法将使用两个流域的数
据序列,使用其中一个流域的数据序列进行模型率定,使用另外一个流域的数据序列进行模
型验证。代理流域差异样本等分法是根据雨强或其他变量将每个流域的实测数据序列分成
两部分,使用某一流域的其中一部分数据序列进行模型率定(如第一个流域干旱条件下的数
据序列),使用相反的数据序列进行模型验证(如第二个流域的湿润条件下的数据序列)。
以上四种验证方法中都必须进行模型率定。
表7-1水文模型验证的分级结构
固定条件瞬变条件
A流域B流域A流域B流域
A流域样本等分法代理流域法差异样本等分法代理流域差异样本等分法
B流域代理流域法样本等分法代理流域差异样本等分法差异样本等分法
7.4.2需要验证的内容
7.4.2.1参数分析
采用数学最优化方法率定参数时应重视对参数结果的合理性分析,可参照系统科学方
法进行参数的灵敏度、稳定性、可靠性、独立性或相关性、必要性和系统稳定性方面进行分
析。
对于模型参数的敏感性分析,可以按以下方案进行研究:在其他参数固定的条件下,
分别将每个参数在率定值的正负一定范围内(如30%)改变,再次运行模型,通过观察它对
模拟结果和目标函数变化的相对影响幅度来分析各个参数的敏感程度。当后者较大幅度地超
过了前者,则说明该参数过于灵敏,它将可能在运用中出现大误差。反之,前者相对变幅大,
后者基本不变,则表明该参数过于不灵敏,甚至是无效参数。采用最小二乘估计类方法优选
参数时,不仅可以估计出参数,还可计算出参数估计的均方误差,当参数绝对值小于3倍均
方误差时,这种参数属于无效的估计。
通过详细分析参数的方差•协方差矩阵可以检验参数之间的相关性。如果两变量之间相
关系数接近+1或-1,这意味着我们或许可以找到一个包含较少变量但具有同样功能的模型。
参数的稳定性指在一定迭代次数之后,参数值不随迭代次数的增多而改变的特性。为了回答
是否所有参数都有必要这个问题,我们可以假设参数,……不等干。.然后检验0值是否
属于95%的置信区间。系统稳定性试验可采用系统可观测、可控制矩阵测试等方法进行。
通过参数灵敏度试验、可靠性分析和系统稳定性试验发现问
题后,需要有针对性地进行改进。
7.4.2.2残差分析
模型验证最基本的问题是明确由率定得到的水文估计值(残差)是否可以接受。残差分
析是检验残差的特性是否与模型假设中要求的相一致,尤其是对残差序列是否相互独立、
是否同方差、是否符合正态分布等进行检验。
(1)残差序列相依性检验
通过计算残差序列时间延迟为的自相关系数,可以判断残差序列的相依性。的计
算公式如下:
(7.13)
其中,和分别是残差序列的均值和方差。的估计值,
Z%%--为)(Z%)
I〃-攵/」LKn-k为
=1(7.14)
当时,,自相关系数的简单估计值为:
“一«一一
,=1(7.15)
相互独立的残差序列自相关系数的置信区间的限值为:
双95%)=
(716)
如果计算的值不在该限值之内,则拒绝=()假设(;)
(2)残差序列趋势性及同方差性检验
残差的同方差性可以通过图解法和Kruskal-Wallis法检验。图解法中,通过判断残差与
重要变量如时间、输入变量降雨、蒸发、输出结果径流的关系,进而分析残差的特竹、
Kruskal-Wallis检验或检验,是检验来自于同一总体的个独立随机样本的零假设,是非参
数检验。该方法假设变量具有连续分布,但并没有要求总体分布形式,检验基于以下统计
量:
124咫
H=------------+(7.17)
是第个样本的个观测值秩的总和,。当对于所有的,,且零假设正确的条件下,
统计量的样本分布近似服从自由度为的卡方分布。对于给定显著性水平,如果计算得
到的大于,则拒绝同方差的零假设。
(3)残差序列正态分布检验
可以采用多种不同的方法进行残差序列的正态分布检验。这里着重介绍Kolmogorov-
Smirnov非参数检验方法。该方法简单实用,可以在同一副图上表现大量样本的检验结果,
且不受小样本的限值。该方法表述如下:
①令尸(用是零假设条件下确定的理论累积分布函数;
②令是基于个观测值的样本累积密度函数。对于任何一个观测值,,其中是观
测值的数量,;
③确定最大偏差值,:
@如果对于某一显著性水平,观测值大于或等于
Kolmogorov-Smirnov统计量的临界值时,则拒绝假设。
7.4.3模拟和实测径流过程线的比较
降雨一径流模型最主要的目的是根据降雨情况模拟径流序列,因此考察模型性能的第
一步也是最关键的一步就是比较模拟和实测径流过程线,只有当二者拟合较好或在预定误差
范围内时.,模型才可以直接应用。否则,整个过程就必须重新开始:根据研究需要选取模型、
率定模型、检查数据等。因此,某些情况下,模型验证又被称为“诊断检查工
《水文情报预报规范SL250-2000》中规定
检验期定为“2年”是参照国际通行的下限
要求,当资料充分时,应使用更多一些的资
料。一般来说,方案的精度指标和等级应以
率定期的结果为准,检验期的精度等级也应
与率定期基本相同(等级不同只出现在正好
处于跨级边界的上下很小幅度之内),当出
现检验期精度大大低于率定期精度时,则应
增加新资料再行检验,否则只能将方案降级
使用。
7.5模型评价
7.5.1模型不确定性评价
水文现象深受气候、气象、地形、地貌、植被等条件的影响。
在当前的客观条件下,人们既不能很准确的获取水文资料,
也不可能获得流域内水循环诸要素(降水、蒸发、截留、下
渗、土壤水、地表及地下径流等)可靠的时空变化值。因此,
水文模型的概化给水文模型带来了许多不确定因素,即水文
模型存在着许多不确定性问题。
7.5.1.1影响模型不确定性的因素
国内外许多学者,如Beven和Binley(1992)、宋星原(1994)、Kuczera(1998)等都
分析和讨论了模型的不确定性问题的原因,将其主要归纳为:
(1)资料或信息误差问题
①水文信息空间随机分布特性与数学期望(均值)的代表性问题。例如雨量,由于降
雨信息的空间随机分布的变动性导致固定雨量站网接受输入信息误差的变动性。
②水文信息的时程随机分布特性的均化问题。水叉信息的时程变化总是连续的,而计
算时的采样总是离散的,从而导致信息在时段内的均化,并带来模型计算的误差。
③凡是用仪器不能直接测量的水文要素,其误差来源是多方面的。以流量误差为例:
目前大都用流速仪量侧出的断面流速,乘以断面面积而得流量。把水流速度简化为垂直于断
面的一维水流,在不少情况卜.是粗略的。
④一些水文要素至今还缺乏可靠的信息来源。例如流域土壤含水景.表层流、地下径
流的划分等。
⑤测量仪器自身的观测误差。
(2)模型结构
①由于对水文现象的实际过程理解很不够,因此现有模型的框架结构不可能真实的反
映水文现象的实际过程。
②水文现象之间的确定性联系很好杂,而模型往往用大量简化的数学物理方程去近似
地模拟其联系。大多数集总式模型忽略了流域空间分布面上产汇流的随机性。
③许多模型没有考虑环境变化(如全球变化,人类活动影响)对流域产汇流机制的影
响。
(3)模型参数的优选调试
①忖标函数选择不同,将导致优选参数结果的不同。
②调试系列样本选择不同,优选出的参数也就不同。
7.5.1.2研究模型不确定性的方法
由于水文模型不确定性的存在,即使我们采用当前最流行、最快速、最有效的全局优化
算法进行水文模型参数自动优选确定模型最佳参数时,每次搜索到的参数组合总是不尽相
同,个别参数甚至相差较大,而这些参数组合却均能使模型的目标函数(如确定性系数等)
达到相同或几乎相同的水平,这就是所谓的异参同效(Equifinalily)。由于在实际应用模拟流
量或进行洪水预报时,水文模型采用的是单一的参数组合,异参同效现象的存在使得我们在
最终选择一组模型参数最优值时具有很大的不确定性,因此使得模型输出同样存在很大的
不确定性(李向阳,2005),
随着人们对水文模型认识的提高,水文摸型不确定性研究受到越来越多的关注,井取
得了很大成果,主要包括Beven等人提出的GLUE(GeneralizedLikelihoodUncertainty
Estimation)方法,Thieman等人提出的贝叶斯递归估计方法BaRE(BayesianRecursive
Estimation)方法,马尔可夫链蒙特卡罗(MarkovChainCarlo,简称MCMC)方法等(李向
阳,2005)。
GLUE方法是基于Hornberger和Spear的RSA(RegionalizedSensitivityAnalysis)方法
发展起来的。GLUE方法中一个很重要的观点就是:导致模型模拟结果的好与坏不是模型的
单个参数,而是模型参数的组合在预先设定的参数分布空间内,按照先验分布随机抽取模型
的参数值组合,运行模型.选定似然目标函数.计算模型预报结果与观侧值之间的似然函数
值,再将这些函数值的归一化,作为各参数组合的似然值。在所有的似然值中,设定一个临
界值,低于该临界值的参数组似然值被赋为零。表示这些参数组不能表征模型的功能特征:
高于该临界值则表示这些参数组能表征模型的功能特征。按照归一化权重对各参数组合进行
随机抽样,针对某场洪水采用所抽取的样本参数分别进行洪水模拟,便可由模拟结果求出该
洪水指定置信度下模型输出的不确定性范围。
2(X)1优Thiemann提出了BaRE方法,该方法可以在实际洪水预报过程中同时对水文模
型参数和水文预报不确定性进行递归计算,预报结果以概率形式表示。BaRE方法只需要给
水文模型参数假定一个初始值,便可以进行递推预报,预报结果以概率形式表示(或者简化
为最大可能值及贝叶斯置信区间),较好的解决了缺资料地区的水文模型参数优选及不确定
性预报问题。随着实测资料的增加,由模型参数不确定性引起的模型输出不确定性范围也将
缩小。Vrugt等、Gupta等'MisiHi等也对递归模型识别策略进行了研究,通过连续对流量系
列的递归”算,可以得到参数的不确定性估II。这些方法虽然可以推翻模型参数的常规假定,
并用于在参数估计中识别最具信息的数据,得到相应的参数不确定性估计。但是,他们都是
将模型输入输出方式的不确定性考虑成参数估计不确定性和残差模型的结合,缺少所有重
要不确定性来源的严格区分。
蒙特卡罗模拟(MonteCarloSimulalion)也称为随机摸拟、统计试验,其理论基础是概
率统计,其基本手段是随机抽样。蒙特卡罗模拟要求进行大量重复抽样,计算量非常大。随
着现代计算机的发展,它在实际中得到日蓝广泛的应用。蒙特卡罗模拟可避免决策分析过程
中不确定因索之间的相互干扰而使决策发生偏差情况的发生,使在复杂情况下的决策分析
更为合理和准确。蒙特卡罗模拟可以直接处理决策因素的不确定性,将不确定性以概率分布
的形式表示,建立决策的随机模型,对随机变量抽样试验。模拟结果分析,不仅能得出决策
目标输出、期望值等多种统计量,也可给出概率分布。由于蒙特卡罗模拟是通过大量简单重
复抽样来实现,受条件限制影响较小,故该方法简单灵活,易于实现和改进,不受状态函数
是否非线性,随机变量是否非正态分布等条件限制。只要模拟次数足够多就可得到比较精确
的统计特征值。且模拟估评的标准误差及收敛速度与所解决问题的维数具有较强的独立性,
适用于多变量、多时间阶段的高维问题,并且模拟误差容易确定。但蒙特卡罗模拟也具有一
定的局限性,例如,对•些复杂问题,要想达到较高的模拟精度需要进行较多的模拟次数,
消耗大量的计算资源,否则就可能产生较大的误差;结果给出的是具有概率特征的置信区间,
即得到统计层面上近似的结果(趋势),而不是对于特定结果的精确的数据描述等。
马尔可夫链蒙特卡罗(MCMC)方法是与统计物理相关的一类重要随机方法,它涉及
的两个基本思想比较简单。第一个基本思想是采用蒙特卡罗方法估计期望值,
1T
…Xn/f=l(71g)
对于较大的T,根据采样得到。要从这个分布中采样,就
要用第二个基本思想,即构建一条马尔可夫链,使其极限分
布为P,然后对这条马尔可夫链模拟并对其极限分布采样。
水文水资源流域的专家学者将MCMC方法应用于流域水文
模型不确定性问题研究,取得了较大的成果。
7.5.2模型适用性评估
现有的流域水文模型模拟流域产汇流过程的方式有两类:是先模拟总径流,然后划
分径流成分并进行汇流模拟;二是径流成分及其汇流的模拟同时进行•,从地面至深层分层进
行模拟。前者以新安江模型为代表,后者以水箱模型为代表。不同水文模型的适用范围有所
差异。
70年代初,世界气象组织(WMO)对流域
水文模型进行了一次世界性的对比,从7个
国家选出10个模型,从6个国家挑出6个
流域,每个流域提供8年资料,其中6年资
料给模型制定者率定模型参数,其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 会议报告与总结撰写制度
- 兰州大学口腔医院2026年招聘备考题库及参考答案详解1套
- 2026年鹤山镇中心卫生院医学检验科招聘备考题库及参考答案详解
- 中学学生社团活动经费监管职责制度
- 中学社团指导教师职责制度
- 2026年昭通市第三人民医院总务科综合岗位招聘备考题库附答案详解
- 2026年菜园坝街道社区卫生服务中心招聘放射技师1名备考题库附答案详解
- 2026年秦皇岛市九龙山医院第二批公开选聘工作人员备考题库有答案详解
- 2026年长春黄金设计院有限公司招聘备考题库带答案详解
- 2026年皮山县人民医院招聘备考题库及一套答案详解
- 2024年地下储气库行业现状分析:全球地下储气库数量增至679座
- GB/T 6003.2-2024试验筛技术要求和检验第2部分:金属穿孔板试验筛
- 离婚协议标准版(有两小孩)
- 浙江省台州市路桥区2023-2024学年七年级上学期1月期末考试语文试题(含答案)
- 假体隆胸后查房课件
- 2023年互联网新兴设计人才白皮书
- DB52-T 785-2023 长顺绿壳蛋鸡
- 关于地方储备粮轮换业务会计核算处理办法的探讨
- GB/T 29319-2012光伏发电系统接入配电网技术规定
- GB/T 1773-2008片状银粉
- GB/T 12007.4-1989环氧树脂粘度测定方法
评论
0/150
提交评论