版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、工程水文学第四章 水文统计频率计算相关分析水文现象具有二重性:水文现象包含着必然性水文现象也包含着偶然性(随机性) ,对水文的偶然现象(或称随机现象)所遵循的规律一般称做统计规律。 第一节 频率计算 概述水文分析计算常用到数理统计的方法 流域或地区水资源开发利用,首先要了解流域内未来的河道的来水量,以合理规划; 水利工程规划设计,需弄清未来河流中可能的洪水量及其过程,以确定工程的规模。对未来长期径流情势(属随机变量)的估计,只能依据其统计规律,利用数理统计方法进行概率预估。所谓“概率预估”,即分析水文变量出现超过某个数值的可能性为多少。水文统计的任务 (1)频率计算根据已有的资料(样本),应用
2、概率理论和频率计算,推求指定频率的水文特征值。 (2)相关分析研究水文现象之间的统计关系,应用这种关系延长、插补水文特征值和作水文预报。ABC1950197519852009199219502009水文统计的任务 (3)误差分析根据误差理论,估计水文计算中的随机误差范围。 水文统计的任务 (1)分布函数的形式不同在工程数学中,常采用不及制累积概率形式: 水文学上,习惯研究随机变量的取值等于或大于某个值的概率,采用超过制累积概率形式:水文统计与概率论和数理统计的主要差别表示随机变量 X 大于或等于值x的概率,其几何曲线称作随机变量的概率分布曲线(水文学上通常称累计频率曲线,简称频率曲线)。(2)
3、概率密度曲线和分布曲线画法习惯不同 水文统计与概率论和数理统计的主要差别xPg(x)xg(x)xPG(xp)G(x)xG(x)(%)10000(a)(b)(2)概率密度曲线和分布曲线画法习惯不同 水文统计与概率论和数理统计的主要差别概率分布函数导数的负值,称为概率密度函数水文上通常称概率分布曲线为累积频率曲线频率计算基本内容确定分布线形和参数估计经验频率曲线理论频率曲线设事件A在 n 次随机试验中出现了 m 次,则称:为事件A 在n 次试验中出现的频率。注意:n不是所有可能的结果总数,仅是随机试验的次数。二、经验频率曲线1频率二、经验频率曲线2经验频率及计算经验频率:根据实测水文资料,按从大到
4、小顺序,采用经验公式计算得到的频率。注意:样本的每一项的经验频率用公式P=m/n进行计算,当m=n时,P=100%,说明样本的最末项为总体的最小值,这是不合理的。故必须进行修正,常采用下面的公式进行计算:经验频率的计算公式:这样,当m=n=12 时,该公式在水文计算中通常称为期望公式重现期:是指某一随机事件在很长时期内平均多长时间出现一次(水文学中常称为“多少年一遇”)。即在许多试验中,某一随机事件重复出现的时间间隔的平均数,即平均的重现间隔期。在水文分析中,重现期可以等效地替代频率。重现期 Recurrence interval/return perioda.当研究洪水或暴雨问题 水文上关心
5、的是大于某洪水或某暴雨量发生的频率,因此,重现期指在很长时期N年内,出现大于某水文变量XP 事件的平均重现的间隔期T :式中, T:重现期,以年计; P:大于某水文变量 XP 事件的频率,频率P与重现期T关系的两种表示法:水文上关心的是小于xP的事件出现的频率及相应的重现期。重现期指在很长的时期内(N年)出现小于某水文变量xP事件的平均重现间隔期。若水文变量大于等于xP的频率为P ,则小于xP事件的频率应为等于b. 当研究枯水问题1-P 枯水问题的重现期为:(1)当研究暴雨或洪水时(一般p50%)【例】:当某一洪水的频率为p=1%时,则T=100年,称此洪水为百年一遇洪水,表示大于等于这样的洪
6、水平均100年可能会遇到一次。(2)当研究枯水或年径流时(一般p50%)【例】:对于p=90%的枯水流量,则T=10年,称此为十年一遇枯水流量,表示小于等于这样的流量平均10年可能会遇到一次。经验频率曲线绘制步骤:将样本系列 按从大到小的顺序排列;用经验频率公式计算系列中各项的频率;以水文变量X为纵坐标,以经验频率P为横坐标,点绘经验频率点据; 根据点群趋势绘出一条平滑的曲线。 经验频率曲线绘制根据经验频率曲线,即可在曲线上求得指定频率P的水文变量值XP经验频率计算表:年降雨量x排序( m)频率(%) P=m/(n+1)131017.71210215.41100323.11050430.810
7、10538.5990646.2950753.8920861.5910969.29051076.98501184.68201292.3n=12其反映年降雨量(Xx)的经验频率P(Xx)和x的关系。随着样本容量n的增加,频率P就非常接近于概率,而该经验分布曲线就非常接近于总体的分布曲线。由此得到经验分布曲线:P (Xx)X(年降雨量:mm)问题:这样求到的样本经验频率分布是否符合实际?三、理论曲线线型1正态分布 许多随机变量如水文测量误差、抽样误差等一般服从正态分布。式中, :均值(平均数); :均方差(标准差)。f (x) a. 单峰,只有一个最高点; b. 对于平均数(均值)对称, Cs= 0
8、; c. 曲线二端趋于 , 并以x 轴为渐近线; d.正态分布曲线的特点:正态曲线与X轴所围成的面积为1数学上可以证明:正态分布的密度曲线在 处出现拐点,而且:f (x)频率格纸横坐标的划分0.01%,3.7250%,0概率密度函数表达式: 2.皮尔逊 型分布(P- 型) 可见,当以上三个参数确定后,P-III型密度函数亦完全确定。式中, () 的伽玛函数, , , a 0:三个参数,它们与三个统计参数具有函数关系,其表达式为: f(x)皮尔逊 型概率密度曲线 a0M0(x)Me(x)xPx一端有限另一端无限的不对称单峰正偏曲线P-III型曲线的特点:在水文计算中,一般要求出指定概率P所相应的
9、随机变量的取值xP,即求出的 xP满足下列等式: 按上式计算相当复杂,故实用中,采用标准化变换: 取标准变量(离均系数) , 即 代入上式,, , a0 以相应的 函数关系式表示,简化后得:0.031.302.473.384.160.20.021.292.403.233.940.10.001.282.333.093.720.0501010.10.01P(%)P CsP-III型曲线离均系数 P 值表注:详表见附表1被积函数含有参数 , Cs ,而 包含在 中,制成 对应关系表:因此,由给定的CS 及P,从P-III型曲线离均系数 值表,查出P ,再由下式求:xP即为指定概率 P 所相应的随机变
10、量的取值。这是水文统计分析中要求计算的一个量如求频率P=1/100(水文学常称为百年一遇)时的径流量QP=0.01。【算例】求解:由 CS =1.0及P =1%,查附表1得P = 3.02 已知: 某地年平均降雨量 =1000 mm, CV =0.5, CS =1.0,若年降雨量符合P - III型分布试求:P=1% 的年降雨量。另一种求解方法(该法更常用)上例的解法:由 CV = 0.5, CS = 1.0=2 CV ,P = 1%查附表2得:引入模比系数: 由由此建立 的 对应数值关系P-III型曲线模比系数 KP 值表(见附表2)P-III型曲线模比系数 KP 值表(附表2) P(%)C
11、V0.010.10.20.330.512510205075909599(一) CS=CV0.051.191.161.151.141.131.121.111.091.071.041.000.970.940.920.891.5011.68.858.027.366.876.005.113.923.002.040.64-0.10-0.53-0.70-0.89(二)CS=1.5CV0.05(三) CS=2CV (三) CS=6CV参数估计:水文随机变量的总体是无限的,这就需要在总体不知道的情况下,靠从总体中抽出的样本(观测的系列)去估计总体参数。四、频率曲线参数估计 Statistical parame
12、ters estimation估算方法有: 矩法; 适线法; 极大似然法; 权函数法; 一、随机变量参数a.均值(样本的算术平均值):已知样本的随机系列:x1, x2, x3, xn,分别求样本的三个统计参数 。 均值代表样本水平高低,表示样本系列的平均情况。【例】甲河多年平均流量Q甲=2500m3/s,乙河多年平均流量Q乙=100m3/s,说明甲河水资源比乙河丰富。不能反应系列的离散程度b.样本均方差(标准差):均值相同的两个系列,值越大,离散程度愈大。均值不同的两个系列,通过值来比较离散程度?【例】甲系列 , 乙系列 。不合适!式中, 称作模比系数c.样本的离差系数:【例】甲系列 , 乙系
13、列 。甲系列的离散程度比乙系列的要小c.样本的离差系数:反映样本系列的离散程度,需要知道系列对称情况?CV值愈大,分布愈分散;CV 值愈小,分布愈集中。CV1CV2CV2 CV1f(x)x变差系数对密度函数的影响注意:以上三个公式求到的参数是根据样本求参得到,故与相应的总体的参数是不相等的。d. 样本的偏态系数:反映样本系列对称情况CS=0,系列对称分布f(x)x偏态系数对密度函数的影响Cs0CS 0 , 称为正偏;CS 0 , 称为负偏。矩法-参数估计方法矩法:是用样本估计总体矩,并通过矩和参数之间的关系,来估计频率曲线参数的一种方法。特点:计算简便,事先不用选定频率曲线线形。根据统计学的证
14、明可知: 以上求到的样本平均值 为总体平均数的无偏估计量,然而CV , CS 则不是总体相应参数的无偏估计量,称为有偏估计量。故需要对参数CV , CS 进行修正,使其变成无偏估计量。无偏估计量: 由统计学的定义,若 是未知数 的估计量,而且 ,则称 为 的无偏估计量。 (当 n 较大时)Cv , Cs 的无偏估计量的修正计算式: 用上述的无偏估算公式计算的很多同容量的样本的统计参数的均值,可望等于总体的同名参数。 由于水文系列总体是无限的,而样本的容量是有限的,因此,由样本求到的参数对于总体的参数存在一定的误差,则称为抽样误差。因此,以样本参数替代相应的总体参数时,在生产实际应用中需要考虑这
15、一误差。但该误差无法准确求到,只能在概率意义下作出某种估计。现以样本的平均值说明其抽样误差概念:抽样误差:Sampling error样本平均数的抽样分布均值误差的抽样分布总体的平均值 从总体抽出的样本 均值 的抽样误差样本1:样本2:样本i:样本n:. . 同理, 也是随机变量,其分布称为均值误差的抽样分布。 样本的某个抽样值xi 是一随机变量,故作为xi 函数的样本平均数 亦是一随机变量,具有一定的概率分布,其分布称为样本平均数的抽样分布。a. 根据概率统计中心极限定理,当样本容量n 较大时,样本平均数的抽样分布趋近于正态分布;b. 可以证明,当样本无限增多,样本平均数的抽样分布的期望值=
16、总体的均值,即 结论:c. 样本平均数的抽样误差,可以用抽样分布中的标准差/均方差 (称为均方误, Mean square error)来度量: 同理,与样本平均数的抽样误差类似,样本的 CV , CS 的抽样误差,可以它们相应的抽样分布的均方误 来表示 。 因此,只要样本参数的均方误为已知的,则可以对该样本参数的抽样误差可作出估计。 上式的物理意义是:若随机抽取一个样本,则以此样本的均值作为总体均值的估计值时,有68.3%的可能性其误差不超过 ;有99.7%的可能性误差不超过 。由于抽样分布通常为正态分布,由正态分布的特性可知:如何求出各种统计参数的均方误? 当总体为P-III型分布时,其样
17、本各参数的均方误计算式分别为:当样本容量不大时,由样本系列直接计算CS误差较大。说明:以上均方误计算公式中,CV,CS分别为总体的均方差,离差系数和偏态系数,但总体的统计参数是未知的,故可用样本的相应的统计参数代替。结论: (1) 样本统计参数抽样误差随样本的均方差、离差系数CV及偏态系数CS的增大而增大; (2) 样本统计参数抽样误差随样本的容量n的增大而减少。 依据(2)可知水文计算常用延长系列增加项数n的方法,增加对总体的代表性越好,来减少抽样误差。五、水文频率计算适线法 Curve fitting method适线法(配线法):是以经验频率点据为基础,在一定的适线准则下,求解与经验点据
18、拟合最优的频率曲线参数,这是一种较好的参数估计方法,是我国估计洪水频率曲线等统计参数的主要方法。适线准则目估适线优化适线以经验频率点据为基础,给它们选配一条符合较好的理论频率曲线,以此来估计水文要素总体的统计规律。在一定的适线准则(即目标函数)下,求解与经验点据拟合最优的频率曲线的统计参数的方法。经验点据与理论曲线拟合的好坏全凭人们的目测来判断,因此,估计结果往往因人而异。离差平方和最小准则(OLS)离差绝对值和最小准则(ABS)相对离差平方和最小准则(WLS)五、水文频率计算适线法 Curve fitting method六、目估适线法已知:经验频率分布, 求:总体分布参数计算经验频率假定一
19、组参数选定线型理论频率曲线具体求解步骤:根据实测样本资料(n)进行点绘纵坐标为随机变量X=x,横坐标为对应的经验频率P(X x),经验频率按下式计算:假定一组参数 , 可选用矩法的估值作为 的 初始值; 一般不求CS,假定 ,K为比例系数,可选 K1.5, 2, 2.5, 3.目估适线法的步骤已知:经验频率分布, 求:总体分布参数根据初选的参数 ,由P-III型曲线离均系数值(附表1)或P-III型曲线模比系数KP 值表(附表2),计算xp值,求出 xP P 的频率曲线,将其绘在有经验点据的同一张图上,看它们的配合好坏,若不理想,则修改有关的参数(主要调整CV 及K=CS /CV ),重复以上
20、的步骤,重新配线;选定线型,对于水文的随机变量,一般选P-III型;根据配合的情况,选出一配合最佳的频率曲线作为采用曲线,则相应的参数作为总体参数的估值。求出指定频率 P 的水文特征值XP。PxP 适线法的实质是通过样本经验分布来推求总体分布,适线法的关键在于“最佳配合”的判别。经验点据 理论频率曲线为避免修改参数的盲目性,应了解参数 对频率曲线形状的影响:a) 值愈大,频率曲线位置愈高;x PPPx PPx Pc) CS 值愈大,频率曲线上段变陡,下段变缓,中部向左偏。b) CV 值愈大,频率曲线愈陡;CV=0七、优化适线法 在一定的适线准则(即目标函数)下,求解与经验点据拟合最优的频率曲线
21、的统计参数的方法。优化适线法准则: 离差平方和最小准则(OLS)(最小二乘法) 离差绝对值和最小准则(ABS) 相对离差平方和最小准则(WLS)离差平方和最小准则(OLS)(最小二乘法): 使经验点据和同频率的频率曲线纵坐标之差的平方和达到最小。即使目标函数:取极小值,即:欲使S(Q)为最小,则要使一、相关关系的概念 水文现象中许多变量不是孤立的,相互之间存在联系,则分析研究二个或二个以上随机变量之间的关系,称作相关关系。目的:研究两个或多个随机变量之间的联系。例如:降雨与径流之间、上下游洪水之间、水位与流量之间等。第二节 相关分析水文计算中的应用:资料的展延、水文预报等。必须注意的问题:必须
22、先分析变量在成因上是否有联系,不能在两个毫不相关的变量之间硬凑出相关关系。第二节 相关分析 如果两个变量x, y,其中变量x 的每一个值,变量y都有一个或多个确定值与之对应,而且x, y成函数关系,即x, y的关系点完全落在直线或曲线上, 则称这二个变量是完全相关的。完全相关yx完全相关(函数关系Functional relation直线关系曲线关系二个随机变量的关系有以下三种情况:零相关YXb. 零相关 (没有关系) Unrelated如果两个变量x, y之间互不影响互不相关,则称这二个变量没有关系或零相关。即x, y的关系点毫无规律,十分分散。yx如果两个变量x, y之间关系介于以上二者之
23、间,x, y的关系点虽有点分散,但有明显的趋势,数学上可以用一定的表达式进行拟合。则称这二个变量关系为: 统计相关或相关关系。统计相关c. 统计相关【相关关系】Statistic relation确定二个变量间相关关系的数学表达式,以相关方程或回归方程( Regression equation)表示,用以由已知变量推求未知变量;判断二个变量间相关关系的密切程度,用相关系数的参数 (Osculation degree)来表示。 故水文计算中常利用二个长短的水文系列的相关关系对短的水文系列进行延长和插补。水文计算中的相关分析的主要任务:曲线相关直线相关 水文计算中,一般处理两个变量间的相关关系,称
24、简相关,有时也要处理三个或三个以上变量关系,称为复相关。简相关可分为直线相关和曲线相关。一、简相关设xi 和yi 代表两系列的观测值共有n对;将对应点绘于方格纸上,如果点群分布平均趋势为一直线,通过点群中心目估绘出一条直线,在图上量出直线的斜率a和截距b,直线方程: y=a+bx()回归方程及其误差分析 图解法该方法简便实用,而且一般情况下精度可以保证。 相关分析法若相关点分布较散,目估定线有一定任意性,为保证一定精确性,一般采用分析法来确定相关线的方程。设该直线方程形式为: y = a+bx式中,x:自变量(Independent variable) y :倚变量(Dependent var
25、iable) a, b :为常数,需要通过实测相关点来确定。 相关点与配合直线在纵轴方向必然存在离差。配合直线与观测点在纵轴方向的离差为:xiy离差y 要求配合直线与所有的观测点能“最佳”拟合,即满足所有的观测点的离差y 的平方和为最小,即:注:式中符号为 的简写形式分别对 a, b 求一阶偏导数,并令其为零:求解上列两联立方程式,可得: 称相关系数,可用以判断x、y相关的密切程度。式中, :分别为x, y 系列的均方差/标准差; :分别为x, y 系列的平均值; :x, y 系列的偏差系数(按不偏估计公式计算): :相关系数; Kxi ,Kyi:分别为xi , yi系列的模比系数:上式即为y
26、 倚x 的回归方程,其曲线称为回归线/相关线(仅是对点据拟合最佳一条线),亦可表示为:回归线的误差回归线只反映两变量间的平均关系。按此关系推求的y和实际值之间存在着误差,用均方误表示。 相关系数误差总体不相关(r =0)的两变量,由于抽样原因,样本的相关系数不一定等于零。为此,需要对相关系数进行检验。 相关分析的误差 变量间应具有成因联系; 同期观测资料不能太少,一般要求n在10或12以上,否则误差太大; 相关系数大于0.8,此时认为相关性密切; 用到直线无实测点据部分,要慎重。相关分析应注意的问题:则上式可写成: - 直线关系故可按直线相关的方法求Y倚X的回归方程,再还原成 y 与 x 的函数关系二、曲线相关1)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年江苏省南通市海安市十三校联考八年级(下)质检数学试卷(6月份)(含答案)
- Methyl-14-pentadecenoate-生命科学试剂-MCE
- 初中八年级道德与法治《于细节处见尊重:构建和谐人际关系的基石》导学案
- 八年级下册数学期末专题复习“图形与统计”融合教学设计
- 初中八年级生物(北师大版)动物生殖发育知识清单(第2课时)
- 《生物医学工程专业大三:医学信号数据采集系统教案》
- 八年级信息技术项目式教案:基于GeoGebra的勾股定理探究与可视化证明
- 初三物理中考专题复习导学案:电磁现象的探究与应用
- 初三英语中考听力:基于考情诊断与词汇建构的听力能力提升教案
- 初中八年级历史《从计划到市场:中国特色社会主义市场经济体制的建立》导学案
- 雨课堂学堂在线学堂云《审计理论与实务(Theory and Practice of Auditing)(西南政法)》单元测试考核答案
- 广东省深圳市宝安区2024-2025学年七年级下学期语文期末考试试卷(含答案)
- 代理记账公司风控制度
- 屠宰加工厂财务制度内容
- 龋病相关知识
- 拇外翻介绍教学课件
- 2026年事业单位招聘考试公共基础知识试题及答案
- 2026年一级建造师之一建建筑工程实务考试题库500道及答案(真题汇编)
- 杭州萧山技师学院职业教育教师招聘笔试真题2024
- 工程机械维修保养技术标准
- 舞蹈解剖学教学课件
评论
0/150
提交评论