《工程水文学》(第4版)第6章 水文统计.ppt_第1页
《工程水文学》(第4版)第6章 水文统计.ppt_第2页
《工程水文学》(第4版)第6章 水文统计.ppt_第3页
《工程水文学》(第4版)第6章 水文统计.ppt_第4页
《工程水文学》(第4版)第6章 水文统计.ppt_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、工程水文学 (Engineering Hydrology),主 讲:张 峰 手 机邮 箱:zf_,安徽水电学院水文与水资源专业教研室 二一五年二月一日,工程水文学 (Engineering Hydrology),二一五年二月一日,第6章 水文统计,一、概述,(1)水文现象 水文现象是一种自然现象,它具有必然性的一面,也具有偶然性的一面。 必然现象是指在一定条件下事物在发展、变化中必然会出现的现象。 偶然现象是指在一定条件下事物在发展、变化中有可能出现也可能不出现的现象,或称随机现象。 (2)水文统计的任务 统计学的任务就是要从偶然现象中揭露事物的规律。这种规律需要从大

2、量的随机现象中统计出来,称为统计规律。 研究随机现象统计规律的学科称为概率论,而由随机现象的一部分试验资料区研究总体现象的数字特征和规律的学科称为数理统计学。 水文统计的任务就是研究和分析水文随机现象的统计变化特性,并以此为基础对水文现象未来可能的长期变化做出在概率意义上的定量预估,以满足工程规划、设计、施工以及运营期间的需要。,河流,湖泊,必然现象,融雪,融雪,偶然现象,二、概率的基本概念,1、事件 在概率论中,对随机现象的观测或观察叫做随机试验,随机试验的结果称为事件。事件分为以下三种: (1)必然事件。在每次试验中一定会出现的事件。 (2)不可能事件。在任何一次试验中都不会出现的事件。

3、(3)随机事件。在一次随机试验中,可能出现也可能不出现的事件。随机事件常用A,B,C,表示,简称为事件。 2、概率 一定条件下,随机事件在试验中可能出现也可能不出现,但不同随机事件其出现的可能性大小可能不相同。为了了解随机事件出现的可能性大小,必须要有一个数量标准,这个数量标准就是随机事件的概率。计算公式如下: 上式只适用于古典型随机试验,即试验的所有可能结果都是等可能的,且试验可能结果的总数是有限的。,二、概率的基本概念,3、频率 设随机事件A在重复n次试验中出现了m次,则称P(A)为事件A在n次试验中出现的频率。 对于水文现象,可以将频率作为概率的近似值。 4、概率加法定理和乘法定理 对于

4、A和B两个事件,若A与B不能同时发生,则称A与B为互斥事件。如果两个事件彼此互斥,则两个事件之和出现的概率等于这两个事件的概率之和,即 对于任意两个事件A和B,则有 若A 、B是随机试验S的两个事件,在事件A发生的前提下,事件B发生的概率称为事件B在条件A下事件的条件概率,记作P(B|A)。由此推证,两事件积的概率等于其中一事件的概率乘以另一事件在已知前一事件发生条件下的条件概率,即,二、概率的基本概念,如果两个事件是相互独立的,即任一事件的发生不影响另一事件发生的概率。那么两个独立事件共同出现的概率P(AB)等于这些事件各自出现概率的乘积,即,三、随机变量及其概率分布,1、随机变量 随机变量

5、是指在随机试验中测量到的数量。水文现象中的随机变量一般是指某种水文特征值,如年径流、洪峰流量等。 随机变量分为两大类:离散型随机变量和连续型随机变量。 (1)离散型随机变量,是指随机变量仅能取得有限个数值或可列的有限个数值。 (2)连续型随机变量,是指随机变量可以取得一个有限连续区间或无限连续区间的任何数值。,三、随机变量及其概率分布,2、随机变量的概率分布 随机变量的概率分布是指随机变量的取值与其概率之间的对应关系。 对于离散型随机变量,其概率分布一般以分布列表示,即,其中,pm为随机变量X取值xm(m=1,2,)的概率。它满足下列两个条件: (1)pm0(m=1,2,) (2) 对于连续型

6、随机变量,无法研究个别值的概率,只能研究某个区间的概率。水文学习惯研究事件Xx的概率及其分布。 事件Xx的概率P(Xx)随着随机变量取值x而变化,所以P(Xx)是x的函数,这个函数称为随机变量X的分布函数,记为F(x),即,三、随机变量及其概率分布,F(x)代表随机变量X大于或等于某一取值x的概率。该分布函数用几何图形表示出来,如下图所示,在数学上称此为随机变量的概率分布曲线,在水文上通常称为随机变量的累积频率曲线,简称频率曲线。,上式中,f(x)为分布函数导数的负值,刻划了密度的性质,叫做概率密度函数,或简称密度函数。密度函数f(x)的几何曲线称为密度曲线。实际上,分布函数和密度函数是微分与

7、积分的关系,即,【实例】P136,三、随机变量及其概率分布,2、随机变量的统计参数 随机变量的统计参数是指能说明随机变量的统计规律的某些数字特征的量值。 统计参数有总体统计参数与样本统计参数。所谓总体是某随机变量所有取值的全体,样本则是从总体中任意抽取的一个部分,样本中所包括的项数则称为样本容量。在水文计算中,常用的样本统计参数有:,(1)均值 设某水文变量的观测系列(样本)为x1,x2,xn,则其均值为 均值表示系列的平均情况,可以说明这一系列总水平的高低。,三、随机变量及其概率分布,(2)均方差(标准差) 均方差反映随机变量系列在均值两侧绝对离散的程度。 计算公式如下:,均方差对密度曲线的

8、影响: 均方差愈大,系列愈离散; 反之,愈集中。,三、随机变量及其概率分布,(3)变差系数(离差系数、离势系数) 数理统计中,用均方差与均值之比作为衡量系列相对离散程度的一个参数,它是一个无因次的数,用小数表示,其计算公式为,均方差对密度曲线的影响: 变差系数愈大,系列愈离散; 反之,愈集中。,三、随机变量及其概率分布,(4)偏态系数 在水文统计中,主要采用偏态系数作为衡量系列不对称程度(偏态)的参数,它也是一个无因次的量,其计算公式为,【注意】对于总体统计参数,通常用EX或E(X)表示均值(或称数学期望),而离势系数及偏态系数仍用Cv和Cs表示。,三、随机变量及其概率分布,(5)原点矩 随机

9、变量X对原点离差的r次幂的数学期望E(X),称为随机变量X的r阶原点矩,以符号mr表示,即,对离散型随机变量,r阶原点矩为,对连续型随机变量,r阶原点矩为,当r=0时, ,即零阶原点矩就是随机变量所有可能取值的概率之和,其值等于1。,当r=1时, ,即一阶原点矩就是数学期望,也就是算术平均值。,三、随机变量及其概率分布,(6)中心矩 随机变量X对分布中心E(X)离差的r次幂的数学期望EX-E(X)r,称为随机变量X的r阶中心矩,以符号r表示,即,对离散型随机变量,r阶中心矩为,对连续型随机变量,r阶中心矩为,显然,当r=0时,0 =1;当r=1时,1=0;当r=2时,2=2;当r=3时,Cs=

10、3/ 3。,四、水文频率计算,1、分布线型 水文频率计算的两个基本内容包括分布线型和参数估计。 连续型随机变量的分布是以概率密度曲线和分布曲线来表示的,我国水文计算中常用的有正态分布、皮尔逊型分布及对数正态分布等。 (1)正态分布 正态分布的密度函数及密度曲线的特点如下:,正态分布的密度曲线有以下三个特点: 1)单峰; 2)关于均值a对称,即Cs =0。 3)曲线两端趋于无限,并以x轴为渐近线。,正态分布在水文上的应用频率格纸的横坐标,横坐标:两端稀疏,中间密集,四、水文频率计算,(2)皮尔逊型分布(P-型 分布) P-型曲线是一条一端有限一端无限的不对称单峰正偏曲线,如下图所示,数学上称为伽

11、马分布,其概率密度函数为,式中,()为的伽马函数;、0的为P-型分布的形状、尺度和位置参数, 0、0,且三个参数与总体的三个参数Ex、Cv、Cs具有如上关系。,四、水文频率计算,(2)皮尔逊型分布(P-型 分布) 水文计算中,一般需求出指定频率p所对应的随机变量xp,这要通过对密度曲线进行积分,求出等于或大于xp的累积频率p值,即,令,则有,简化后得到公式,已知P,求xp? 直接利用上式求解比较困难,引入中间变量 , 是标准化变量,称为离均系数, 的均值为0,标准差为1。,已知P和Cs,查附录1得到p,计算xp。,【应用举例】 已知某地多年平均降雨量1000mm,Cv=0.5、 Cs=1.0。

12、若降雨量分布符合P-型,试求频率P=1%的年降雨量为多少?,解:由Cs=1.0,P=1%,查附录1得 p=3.02,龙门水文站年最大洪峰流量理论频率曲线,【应用举例】 已知P、Cv、Cs、均值,求xp? 利用P-型分布,查表计算,绘制理论频率曲线如下,四、水文频率计算,2、参数估计 用有限的样本观测资料去估计总体分布线型中的参数,称为参数估计。参数估计的方法主要有:矩法、概率权重矩法、线性矩法、权函数法及适线法。 (1)矩法估计 矩法是用样本矩估计总体矩,并通过矩和参数之间的关系,来估计频率曲线参数的一种方法。矩法估算样本参数的无偏估计量公式如下:,随机变量所取数值的全体称为总体,从总体中任意

13、抽取的一部分称为样本,样本中所包括的项数称为样本容量。水文变量的总体是指自古迄今以至未来的水文系列,现有的水文观测的系列可以当作总体的一个样本。 用一个样本的统计参数来估计总体的统计参数是存在误差的,称之为抽样误差。这种误差是由于从总体中随机抽取的样本与总体有差异而引起的。 样本抽样误差的均方值称为均方误,是衡量抽样误差的大小的常用指标。皮尔逊型分布参数矩法估计的均方误公式如下:,由表中可见,当n100时,CS的误差在40126%之间。 水文资料一般都很短(n100),按矩法公式算得的CS值,抽样误差太大。,四、水文频率计算,(2)适线法 根据估计的频率分布曲线和样本经验点据分布配合最佳来优选

14、参数的方法叫做适线法(亦叫配线法),包括传统目估适线法、计算机优化适线法。 1)经验频率曲线 水文计算中习惯把由实测资料(样本)所绘制的频率曲线称为经验频率曲线,而把由数学方程式所表示,符合经验点据分布规律的频率曲线称为理论频率曲线。,四、水文频率计算,2)经验频率 经验频率是指将实测水文变量资料按递减次序排列,并以自然数顺序编序号,然后依次利用一定的公式(如期望公式)计算系列中各项的频率,即称为经验频率。 我国水利水电工程设计洪水规范中规定采用的经验频率计算公式采用期望公式,公式如下,【应用举例】 已知某水文站24年最大洪峰流量实测资料,绘制其经验频率曲线,并求10年一遇的设计洪水。,某站2

15、4年的最大洪峰流量经验频率曲线,解: 由第(3)栏最大洪峰流量及对应的第(4)栏经验频率, 绘制经验频率曲线如下,四、水文频率计算,频率比较抽象,为便于理解,常采用重现期。所谓重现期是指在许多试验中,某一事件重复出现的时间间隔的平均数,即平均的重现间隔期。在工程水文计算中,重现期用字母 T 表示,一般以年为单位,它是频率的倒数。频率与重现期的关系有两种表示方法如下: 当研究暴雨洪水时,一般P 50%,采用,所谓百年一遇的暴雨或洪水是指大于或等于这样的暴雨或洪水在长时期内平均100年发生一次,而不能认为每隔100年必然遇上一次。,四、水文频率计算,3)目估适线法 目估适线法估计频率曲线参数的基本

16、步骤,四、水文频率计算,3)目估适线法 目估适线法估计频率曲线参数的具体步骤如下: 1将实测资料由大到小排列,用期望公式计算各项的经验频率,在频率格纸上点绘经验点据(纵坐标为变量的取值,横坐标为对应的经验频率),绘制经验频率曲线。 2选定水文频率分布线型(一般选用皮尔逊型)。 3假定一组参数x、Cv和Cs。假定值可用矩法求出三个参数的值,作为第一次的假定值。由于Cs的抽样误差比较大,而根据经验假定Cs为Cv的某一倍数。 4根据初估的参数值,查附录1,计算xp值。以xp为纵坐标,P为横坐标,即可得到理论频率曲线。将此线画在绘有经验点据的图上,看与经验点据配合的情况,若不理想,则修改参数(主要是调

17、整Cv和Cs),再次进行计算。 5 最后根据理论频率曲线与经验点据的配合情况,从中选择一条与经验点据配合比较好的曲线作为采用曲线。相应于该曲线的参数便看作是总体参数的估值。,四、水文频率计算,(1)均值EX对频率曲线的影响。 Cv和Cs不变时,均值大的频率曲线位于均值小的频率曲线之上; 均值大的频率曲线比均值小的频率曲线陡。,统计参数对频率曲线的影响,(2)变差系数Cv对频率曲线的影响。 在均值、Cs一定时,Cv越大,理论频率曲线越陡。,更正:Cv=0.2,【应用实例】 P150,(3)偏态系数Cs对频率曲线的影响。 在均值、Cv值一定的情况下,随着Cs的增大,理论频率曲线的上段变陡,中段曲率

18、变大,下段变平缓。,【应用举例】 某站共有实测降水量资料24年,见下表。 求:频率P=10%和P=90%的年降水量。 计算步骤如下: 1、将原始资料按大小次序排列,列入表(4)栏; 2、计算经验频率Pm =m/(n+1) 列入表(5)栏,并与xm 对应点绘于概率格纸上;,某站年降水量频率计算表,3、用矩法计算系列的多年平均降水量和离差系数;,4、选定CV0.25,假定CS0.50。查表得P,求得 根据表中(1)、(3)两栏的对应数值点绘曲线,发现曲线头部和尾部都偏于经验频率点据之下。,5、改变参数,选定CV0.30,CS0.75,查表计算出各xP值。 绘制频率曲线,该线与经验点据配合较好,取为

19、最后采用的频率曲线。,P10% = 933mm P90% = 433mm,【应用实例3】 已知某枢纽实测24年的年最大洪峰流量资料列于下表第(1)、(2)栏。试根据该资料用矩法初选参数配线,并推求千年一遇的洪峰流量。,解:(1)点绘经验频率曲线,(3)选配理论频率曲线,(2)计算样本系列的统计参数,绘出相应的理论频率曲线,如下图,调整参数,第二次配线 再次调整参数,第三次配线,第三次配线结果见下图,P-型理论曲线与经验频率点配合较好,故选取第三次配线所得结果为设计洪峰流量计算依据。,(4)推求设计洪峰流量 T=1000年,P=0.1%,查图或第三次配线表,得出相应洪峰流量为Qm设 =18404

20、m/s。,五、相关分析,成因联系:自然界中有许多现象之间是有一定联系的,自然界中有许多现象之间存在相互联系和相互制约的关系,而不是孤立存在的。比如降雨与径流之间、上下游洪水之间、水位与流量之间等等。 相关关系:两个或多个随机变量之间存在的相互联系。 相关分析:采用数理统计法分析和研究两个或两个以上随机变量之间的相关关系的方法。 目的意义:主要用于水文预报,插补和延长水文资料短系列。 相关分析先决条件:变量间确实存在相关关系。,1、相关分析的概念,五、相关分析,根据变量之间相互关系的密切程度,变量之间的关系有三种情况:完全相关(函数关系)、零相关(没有关系)和相关关系。,2、相关的种类,Y与x之

21、间有明确的解析函数表达式,两变量之间毫无联系,相互独立,五、相关分析,2、相关的种类,两变量之间的关系介于完全相关和零相关之间,五、相关分析,(1)根据随机变量的个数可分为:简单相关和复相关。 (2)根据随机变量间的线型可分为:直线相关和曲线相关。 (3)组合情况:简单直线相关、简单曲线相关 复直线相关、复曲线相关,3、相关关系的分类,(1)判定变量间是否存在相关关系及其密切程度。 (2)建立变量间的回归方程或相关线。 (3)根据自变量的值,预报或延长、插补倚变量的值,并进行误差分析。,4、相关关系的内容,五、相关分析,(1)绘图,判断线型。 (2)计算均值并描点。 (3)过均值点与点群中心画

22、一直线。 (4)量出截距a和斜率b。 (5)写出相关方程:y=a+bx。,5、简单直线相关相关图解法,五、相关分析,假设相关方程:y=a+bx 已知(xi,yi),利用最小二乘法计算参数a,b,5、简单直线相关相关分析法,五、相关分析,5、简单直线相关相关分析法,五、相关分析,5、简单直线相关相关分析法,6、简单直线相关相关分析的误差,(1)回归线误差:回归直线只是对观测点的一条最佳配合线,并不是所有点据都在直线上,而是散布在回归线的两侧。因此,按此关系由推求的和实际值之间存在着误差,误差大小一般采用均方误Sy表示如下:,五、相关分析,6、简单直线相关相关分析的误差,(2)相关系数及其误差:用于表示两个变量之间的相关密切程度的参数叫做相关系数,用字母r表示。r0,表示正相关;r0,表示负相关。相关系数的取值范围为|r|1。讨论如下: 若r2=1,两变量间为函数关系;若r2=0,两变量间零相关,或为非直线关系;若0 r21,当r越接近1时,x、y间的关系愈密切。,点据分布和相关关系大小说明图,五、相关分析,6、简单直线相关相关分析的误差,(2)相关系数及其误差 在相关分析计算中,相关系数是根据有限的实测资料(样本)计算出来的,不免带有抽样误差,因此,为了推断两变量之间是否真正存在着相关关系,必须对样本相关关系作统计检验。这种检验的实质在于找出一个临界的相关系数值r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论