第三章 水文统计基本知识_第1页
第三章 水文统计基本知识_第2页
第三章 水文统计基本知识_第3页
第三章 水文统计基本知识_第4页
第三章 水文统计基本知识_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章水文统计基本知识第1页,课件共45页,创作于2023年2月

第三章(2)水文统计基本知识第一节概述第二节机率与频率第三节统计参数第四节经验频率曲线第五节理论频率曲线第六节适线法第七节相关分析第2页,课件共45页,创作于2023年2月第一节概述

水文现象和自然界中其他现象一样,其发生、发展和演变过程中,包含必然性和偶然性(随机性)两面。

河流上任一断面的年径流量值,由于每年有降水发生,则必有径流量产生,这是必然性,然而,年径流量,因受流域许多因素影响,即使年降水量相同,年径流量也不完全相同,这就是水文现象偶然性(随机性)。

因此可把水文现象中的一些特征值(如瞬时流量、日,月、年平均流量等)作为偶然量(随机变量)看待,应用数理统计的原理和方法研究它的变化规律。

第3页,课件共45页,创作于2023年2月

例如,流域开发——河流未来的径流量;设计拦河坝——未来河流洪水的大小。但由于影响径流的因素众多,难于应用成因分析法作出长期的时序定量预报。基于水文现象的统计规律性,可进行概率预估以满足规划设计的需要——水文统计法。

水文统计法:应用数理统计的原理和方法研究大量观测的水文偶然数列的规律,凭借短期的观测数列,推论某一水文现象未来的变化可能性。重力拦砂坝工程第4页,课件共45页,创作于2023年2月一、基本概念

1.机率与事件(1)机率——指偶然事件在客观上可能出现的程度。(2)事件——是机率和数理统计中最基本的概念,也是水文统计中常见的名词,它是指在一定的条件组合下,在试验的结果中所有可能出现或可能不出现的事情。

第二节机率与频率自然界中的一切现象,可以分成三种类型:必然事件:是指在一定条件下必然会发生的事情不可能事件:是指在条件实现之下永远不会发生的事情偶然事件(也称随机事件、或然事件):是指一定条件下,可能发生也可能不发生的事情第5页,课件共45页,创作于2023年2月

第二节机率与频数(3)机率计算公式

按照机率的古典定义,机率可以用

式中:P(A)

——一定条件组合下,随机事件出现的机率m

——有利于A事件的可能总数;n——可能的结果总数。(4)机率分类(举例:白球和黑球)事先机率:事件出现的可能性与不可能性事先都非常清楚。经验机率:对于某些复杂事件,很难预知它出现与不出现的可能性,只能通过大量试验来估计它的机率,经验机率又称之为频率。第6页,课件共45页,创作于2023年2月2、频率频率:指在具体重复试验中事件出现的次数与总次数之比设事件A在n次重复试验中,实际出现了m次,则事件的频率为:

第二节机率与频率

实验证明,对于次数不多的试验,事件的频率有明显的随机性,但试验的次数越多,事件的频率就渐趋稳定,频率就接近于机率。机率是个理论值,频率则为经验值。

实用意义:水文现象可以通过逐年积累资料,用事件出现的频率作为事件的机率的近似值。水文研究和计算的目的,就是运用足够大的对总体具有代表性的样本,通过数理统计方法,推估总体的近似值,以满足实际应用的需要。第7页,课件共45页,创作于2023年2月对于水文现象而言,其事先机率很难求得,所以通常只能借助于观测资料去求经验机率(即频率),但观测数据常常是散乱的,因此,首先必须对观测数据进行适当整理以显示其规律性。如何进行数据的初步整理?

第二节机率与频率①将样本的各项数据按由大而小的次序排列成表(如果数据较多,也可以分组统计);②统计各个数据出现的次数(频数),计算其相应的频率,并根据表绘图;③根据图表观察数据的大致分配情况,进而计算一些统计特征值,以概括了解数据的分配规律。二、频率密度曲线和频率分布曲线

第8页,课件共45页,创作于2023年2月

1.

频率密度图与累积频率图频率密度分布图——表示各种水文特征值与发生频率的关系累积频率图——表示水文特征值和发生累积频率的关系例:以某水文站1947-1976年的实测洪水位资料为例,计算各组值的频率及累积频率。

表1某站实测水位频率统计(p33)水位组距(m)频数(a)累积频数(a)频率W(Hi)%累积频P(H>Hi)%

62—60226.676.6760—587923.3229.9958—56112036.6766.6656—5452516.6783.3354—5232810.0093.3352—502306.67100.00第9页,课件共45页,创作于2023年2月据上表,以水位为纵坐标,频率为横坐标,将实测数据点绘于图中,得到频率密度图和累积频率图(下图)。

第10页,课件共45页,创作于2023年2月第二节机率与频率

2.频率密度曲线与频率分布曲线

很多统计资料的出现次数(频数)或频率密度关系都与上图中的(a)类同,即中间高而两侧低,离中间最远的地方出现的次数最少。因此,在资料项数趋于无穷且每组的间隔取成无穷小时,则频率密度图可以设想为一种钟形曲线,称这种光滑的钟形曲线为频率密度曲线,方程以y=f(x),称为频率密度函数。累积后的S形曲线称为频率分布曲线,其相应方程式:

P称为频率分布函数。第11页,课件共45页,创作于2023年2月频率密度曲线和频率分布曲线如下图所示:

注意:累积频率具有两个特性:当X=Xmin时,P=1;当X=Xmax时,P=0。第12页,课件共45页,创作于2023年2月频率P是水文计算和水利水保工程设计中的重要指标,但概念抽象,因此,在水文学中常用重现期来代替。重现期(T)——是指等量或超量的水文特征值平均多少年一遇或多少年出现一次。第二节机率与频率频率P(%)与重现期(T)的关系如下:研究对象为暴雨或洪水时,一般的设计频率P<50%,则2.研究对象为枯水流量时,一般设计频率P>50%,则三、重现期第13页,课件共45页,创作于2023年2月频率与重现期的关系及其意义见下表频率P(%)重现期(T)意义

1100平均百年一遇的多水年

1010平均十年一遇的多水年502平均二年一遇的中水年.(平水年)9010平均十年一遇的少水年99100平均百年一遇的少水年第14页,课件共45页,创作于2023年2月水文上常用的统计参数有以下几种:

第三节统计参数一、算术平均值、中值和众值(一)算术平均值(均值)设实测系列的随机变量为x1,x2,x3,…,xn,其相应出现的次数为f1,f2,f3…,fn。由于fi的大小对平均值有影响,必须权衡其轻重,并以fi为权数,且f1+f2+f3+…+fn=n,则加权算术平均值为:第15页,课件共45页,创作于2023年2月

若为等权随机变量,即f1=f2=f3=…fn,则算术平均值按下式计算:意义:(1)均值集中反映系列在数值上的大小情况。例如实测系列为降水资料,则平均值大的表示该地降水充沛,若为洪水流量资料,则平均值大的表示该地洪水流量较大。(2)均值还可绘成等值线图,用来表示水文特征值的空间分布情况。如平均径流量与平均降水量的等值线图。第16页,课件共45页,创作于2023年2月第三节统计参数将n项观测系列依大小次序排列后,位置居中的那个数值便称为中值(中位数)。当n为偶数时,则取这系列正中的那两数的平均值为中值。例如,系列10,11,13,15,17,19的中值,即第三项和第四项的平均值等于

(13+15)/2=14。(二)中值(三)众值

在某一频率分配中出现次数最多的那一个数称为这一系列分配的众数,在众数处频率密度函数f(x)取得极大值,因而第17页,课件共45页,创作于2023年2月平均值不能充分说明变量分布在平均值左右的疏密程度,即离散程度的大小。为了研究系列变量的变化幅度,数理统计学中采用离差系数CV来表示系列的离散情况。(均方差σ)

第三节统计参数

对样本:

令则上述公式可变为:对总体:

式中ki称为变率或模比系数。对总体:

对样本:

二、离差系数

CV第18页,课件共45页,创作于2023年2月三、偏差系数

cs说明系列中各值在平均值左右的分布情况,也就是说,是大于平均值的特征值多还是小于平均值的特征值多,采用偏差系数Cs表示,其计算公式如下:第三节统计参数

对总体:

对样本:

因为

所以当n较大时,则,

第19页,课件共45页,创作于2023年2月当时,称为正偏分布,表示实测系列中正离差占优势

当时,称为负偏分布,表示实测系列中负离差占优势当时,称为对称分布,表示比平均值大的或小的离差各占其半,即正、负离差均等第20页,课件共45页,创作于2023年2月

资料的项数不多时,计算出来的误差很大,一般认为不足百年资料,即在100项以下时,cs计算结果是不可靠的,所以实用上一般都是采用经验性方法,比如取

等于若干倍,如年径流与年降雨量在研究不足的地区,常采用

,计算设计暴雨时,采用

第三节统计参数第21页,课件共45页,创作于2023年2月第四节经验频率曲线一、经验频率的计算经验频率——是指根据实测资料,按递减次序排列,然后依次计算其频率。常见的计算经验频率的公式有以下四种:海森公式均值公式或维泊尔公式(常用)中值公式或切哥达也夫公式式中:n—按由大到小次序排列的系列x1,x2,x3,…,xn,的总项数;m—等量或超量的项数,或某项在递减系列中的位次;P—经验频率第22页,课件共45页,创作于2023年2月二、经验频率曲线的绘制与使用用经验频率公式求出系列x1,x2,x3,…,xn,的各项相应的经验频率Pi,以Xi为纵坐标,Pi为横坐标,即可在机率格纸上通过各经验频率点联绘成一条光滑曲线,称为经验频率曲线。

实例说明绘制步骤:例:某站有1949—1970年期间年最大洪峰流量(P38-39页),见下表(3)栏,试绘该站年最大洪峰流量经验频率曲线。第23页,课件共45页,创作于2023年2月第24页,课件共45页,创作于2023年2月步骤:1、整理实测资料,将实测年最大洪峰流量由大到小排列,编上序号,表第4栏。2、按均值公式计算各项所对应的经验频率(或查附表一)记入表中第七栏。3、按表中第四和第七栏的对应值在机率格纸(也叫海森机率格纸)上点绘出各经验点。4、根据经验频率点据的分布趋势,目估连绘出一条光滑曲线,即为该站年最大洪峰流量的经验频率曲线。如下图:第四节经验频率曲线第25页,课件共45页,创作于2023年2月第26页,课件共45页,创作于2023年2月

从经验频率曲线图上,看出:据20余年的实测资料,在经验频率曲线上仅能读出相应于P=4%至P=95%所对应的年最大洪峰流量值。为推求更小频率,如P=2%(50年一遇)或P=1%(百年一遇)的设计洪水,则需将曲线向左上方外延,这种外延具有任意性,如图虚线,无法断定哪个正确,为此,只能利用具有数学形式的理论频率曲线。第四节经验频率曲线第27页,课件共45页,创作于2023年2月第五节理论频率曲线

理论频率曲线是水文现象总体情况的一种假想模型。适合于水文现象频率特征的数学模型较多,常用有皮尔逊III型和克里茨基——闵凯里曲线两种。

一、皮尔逊III型曲线

1895年,英国生物学家皮尔逊首先提出。根据经验资料的统计结果发现,频率密度曲线存在着一个类似的特点——有一个众值(出现次数最多的变量),数值愈大或愈小的变量出现的次数较少,曲线近似呈钟形,右图。

第28页,课件共45页,创作于2023年2月根据这一特点,皮尔逊建立了机率密度微分方程式:

解此方程可得13种类型的曲线,当b2=0时,皮尔逊III型曲线的微分形式如下:

积分后可得皮尔逊III型曲线方程式的一般形式:式中:Ym——曲线最大纵坐标,为众值出现的机率;

a——曲线起点与众值的距离;

d——均值与众值之间的距离;

e

——自然对数底;其中a、d、Ym均为待定参数,可根据统计参数、Cv、Cs求得。

第五节理论频率线第29页,课件共45页,创作于2023年2月二、统计参数对皮尔逊III型曲线形状的影响1.Cs变化对曲线形状的影响

第五节理论频率曲线(1)cs=0时,均值与众值重合,系列呈对称分布(2)cs>0时,则d>0,系列呈正偏分布。(3)cs<0时,则d<0,系列呈负偏分布。第30页,课件共45页,创作于2023年2月(4)cs、cv为常数,曲线形状的图形不变,位置随X而变,如下图d所示。(5)x、cs为常数,cv愈大,a、d也愈大,曲线形状呈矮平,如下图e所示。(6)x、cv为常数,cs愈大,则d越大,而a及a+d愈小,曲线的偏度就越加剧,如下图f所示。第31页,课件共45页,创作于2023年2月

三、统计参数对累计频率曲线形状的影响1.若Cv及Cs不变,则频率曲线纵坐标的变化与X的变化成正比,如下图a所示。2.若Cs不变,则Cv愈大,频率曲线左上方向高处升起,右下方向低处跌降;Cv值减小时,则恰好相反。Cv=0,频率曲线变为K=1的直线,图b所示。3.若Cv不变,在Cs>0的情况下,当Cs增大时,曲线上端逐渐变陡,下端逐渐变平;当Cs<2Cv时,在P=100%处出现负值,图c所示。第32页,课件共45页,创作于2023年2月

理解统计参数对频率曲线的影响,有助于在应用适线法绘制频率曲线时更确切的选择参数。另外,应用皮尔逊III型曲线计算时,必须联系水文现象的物理性质来确定曲线的应用范围。当Cs<2Cv

时,k值将出现负值,如分析年降雨量或径流量等,都不可能出现负值,出现Cs<2Cv的情况,表示皮尔逊III型曲线不适用,必须适当变换线型。第33页,课件共45页,创作于2023年2月适线法的主要依据是经验频率,方法要点如下:

(1)整理资料(由大到小排列),计算参数x,cv,查附表1经验频率值表得到相对应的经验频率值。(2)在机率格纸上,点绘经验频率点据。(3)假定Cs值,查附表2皮尔逊III型曲线Kp值表,试算出与经验频率点据配合较好的理论频率曲线。(4)必要时可以适当调整x,cv值,但不宜调整过多。一般多以变动Cs进行试算为主。(5)频率曲线多采用皮尔逊III型曲线。第六节理论频率曲线计算方法—适线法

第34页,课件共45页,创作于2023年2月第六节理论频率曲线计算方法—适线法

结合实例进行频率分析:某站共有实测径流资料24年,求10年一遇的丰水年年径流深和10年一遇的枯水年年径流深(课本43页)。

计算步骤:

1.整理资料,按从大到小排列,列于(课本44页)表3-4中(4)栏2.计算多年平均年径流深3.计算各年年径流深的模比系数Ki=Yi/Y,(Ki-1),(Ki-1)2,计算分别列于表(5)、(6)、(7)栏。

4.计算Cv

第35页,课件共45页,创作于2023年2月5.利用附表1查经验频率(也可以用公式计算),列于表(8)栏,并将Y与P点绘于频率机格纸上。6.假定Cv=0.30,Cs=2Cv=0.60,查附表2,得到相应于各种频率的模比系数Kp,见表3-5中的(2)栏(见P43),乘以均值,则得相应于各种频率的Y值,见表(3)栏,将表(1)、(3)栏对应数值点绘于下图中,发现理论频率曲线的中段与经验频率点据配合尚好,但头部和尾部偏于经验频率点据之下。第36页,课件共45页,创作于2023年2月7.改变参数,重新配线。假定Cv=0.30,Cs=2.5Cv=0.75,查附表2,得到相应于各种频率的模比系数Kp和Y值,见表3-5中的(4)栏、(5)栏,将表(1)、(5)栏对应数值点绘理论频率曲线,图3-8。该曲线与经验频率曲线配合较好,即为采用的理论频率曲线。如何调见P45??8.查理论频率曲线,求得10年一遇的丰水年年径流深和10年一遇的枯水年年径流深如下表。第六节理论频率曲线计算方法—适线法

第37页,课件共45页,创作于2023年2月第七节相关分析在降雨与径流、水位与流量之间以及地区上降雨、蒸发与径流等现象,都存在一定的联系,这种关系称为相互关系。对其进行分析,就是相关分析(或称回归分析)。它是一种处理两个或两个以上随机变量的相关关系的一种数理统计方法。相关关系可分为以下三种:1.完全相关(函数关系):自变量X的每个确定值都有一个或多个确定的因变量y与它相对应,则这两个变量之间的关系称为完全相关(在数学上称为函数关系)。如图(a)及图(b)。

第38页,课件共45页,创作于2023年2月2.零相关:两变量之间没有对应关系,即一个变量的变动对另一个变量的变动没有影响,所绘的点十分散乱,如图(c)及图(d)所示,这种情况称为零相关。

3.相关关系:自变量X的每一个确定值所对应的因变量Y由于受到多种偶然因素的影响,其值是不确定的,但经过观察,仍可发现X与Y之间存在有某种关系,根据X与Y的对应值所绘出的点,虽不严格落在一条直线或曲线上,但仍显示出一定的趋势,如图(e)及图(f)所示,介于完全与零相关之间,称为相关关系。水文分析与计算主要是研究这种关系。第39页,课件共45页,创作于2023年2月相关分析按其变量的多少可分为简单相关和复相关:简单相关——是指两个变量之间的相关关系;复相关——是多个自变量同时影响一个因变量的相关关系。

在水文分析与计算中主要用简单相关。简单相关又可分为直线相关和曲线相关两种,其中又以直线相关最多。

相关分析就是建立变量间的相关关系。其任务:(1)判断两个变量相关关系的密切程度(相关系数的大小)(2)确定两个变量之间相关关系的数学形式(相关方程或回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论