




已阅读5页,还剩83页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章水文统计 频率计算 相关分析 水文过程的随机模拟 研究对象 频率计算 包括随机变量及其概率分布 水文频率曲线 水文频率计算 相关分析 包括两变量直线相关 两变量曲线相关 复相关 水文过程的随机模拟 研究内容 3 1水文统计的意义 3 1 1水文现象的特性 1 必然现象是指事物在发展 变化中必然会出现的现象 水文学中称水文现象的这种必然性为确定性 水文现象是一种自然现象 它具有必然性的一面 也具有偶然性的一面 2 偶然现象是指事物在发展 变化中可能出现也可能不出现的现象 偶然现象也称随机现象 偶然现象仍然是有规律的 一般称为统计规律 3 1 2水文统计规律的研究 水文统计 数学中研究随机现象统计规律的学科称为概率论 而由随机现象的一部分试验资料去研究总体现象的数字特征和规律的学科称为数理统计学 概率论与数理统计学应用到水文分析与计算上则称为水文统计 3 1 3水文统计的任务 水文统计的任务就是研究和分析水文随机现象的统计变化特性 并以此为基础对水文现象未来可能的长期变化作出在概率意义下的定量预估 以满足工程规划 设计 施工以及运营期间的需要 3 2概率的基本概念 3 2 1事件 在概率论中 对随机现象的观测叫做随机试验 随机试验的结果称为事件 事件可以分为必然事件 不可能事件和随机事件三种 3 2 3频率 设事件A在n次试验中出现了m次 则称 3 2 为事件A在n次试验中出现的频率 当n趋于无穷大时 频率无限接近概率 3 2 4概率加法定理和乘法定理 两个事件A B 在事件A发生的前提下 事件B发生的概率为事件B在条件A下事件B的条件概率 记为P B A P B A P AB P A 1 两事件和的概率 2 条件概率 3 两事件积的概率 3 3随机变量及其概率分布 3 3 1随机变量 离散型随机变量 只能取有限个或可列个数值的随机变量 例如 某地一年的降雨天数连续型随机变量 可能取值充满某个区间 例如 年最高水位一般而言 用英文大写字母代表随机变量 其取值用相应的小写字母 若随机事件的试验结果可用一个数x来表示 x随试验结果的不同而取得不同的数值 它是带有随机性的 则将这种随机试验结果x称为随机变量 随机变量可分为两类 即离散型随机变量和连续型随机变量 3 3 2随机变量的概率分布 随机变量可以取所有可能值中的任何一个值 但是取某一可能值的机会是不同的 有的机会大 有的机会小 随机变量的取值与其概率有一定的对应关系 一般将这种对应关系称为概率分布 离散型随机变量的概率分布一般以分布列表示 如表3 1 1 离散型随机变量的概率分布 表3 1离散型随机变量及其概率分布 2 连续型随机变量的概率分布 对于连续型随机变量 无法研究个别值的概率 只能研究某个区间的概率 或是研究事件X x的概率 以及事件X x的概率 二者可以相互转换 水文统计中常用X x的概率及其分布 连续型随机变量的概率分布 随机变量X落在区间dx上的概率 分布函数 设事件X x的概率用P X x 来表示 它是随随机变量取值x而变化的 所以p X x 是x的函数 称为随机变量x的分布函数 记为F x 即 F x P X x 3 3 它代表随机变量X大于等于某一取值x的概率 其几何图形如图3 4所示 图中纵坐标表示变量x 横坐标表示概率分布函数值F x 在数学上称此曲线为分布曲线 水文统计中称为随机变量的累积频率曲线 简称频率曲线 P X x F 700 P X 700 0 9 F 1000 P X 700 0 15 P 1000 X 700 0 75 分布密度 密度函数的几何曲线称密度曲线 水文中习惯以纵坐标表示变量x 横坐标表示概率密度函数值f x 如图4 5所示 实际上 分布函数与密度函数是微分与积分的关系 图3 5随机变量的概率密度函数 不及制累积概率 当研究事件X x的概率时 数理统计学中常用分布函数G x 表示 G x P X x 4 4 称不及制累积概率形式 相应的水文统计用的分布函数F x 称为超过制累积概率形式 两者之间有如下关系 F x 1 G x 4 5 3 3 3随机变量的分布参数 3 3 3 1位置特征参数 1 均值均值表示系列中变量的平均情况 设某水文变量的观测系列 样本 为x1 x2 xn 则其均值为 3 6 2 数学期望 数学期望是算术平均的推广 3 8 设连续型随机变量 的概率密度为f x 若绝对收敛 则定义 的数学期望 3 中位数 离散型随机变量 将随机变量所有的可能取值按大小次序排列 位置居中的数 或最中间两个数据的平均数 就是中位数 连续性随机变量 中位数将概率密度曲线下的面积划分为相等的两个部分 3 众数 离散型随机变量 使概率P X xi 最大的xi 连续型随机变量 使密度函数f x 最大的x 3 3 3 2离散特征参数 1 方差和标准差 均方差 设 为随机变量 若E E 2存在 则定义 的方差D 为 D E E 2 4 9 方差 标准差 均方差 称为 的标准差或均方差 记为亦即 2 离势系数 离差系数 变差系数 离势系数越大 离散程度越大 离势系数越小 离散程度越小离势系数对密度曲线的影响 4 偏态系数 图4 6Cs对密度曲线的影响 a CS 0 分布对称b CS 0 正高差占优势 分布的均值大于众数 分布正偏或右偏c CS 0 负高差占优势 分布的均值小于众数 分布负偏或左偏 3 3 3 3矩 动差 1 原点矩 1 当k 0时 2 当k 1时 2 中心矩 1 当k 0时 2 当k 1时 3 当k 2时 3 3 4几种常用的概率分布曲线 3 3 4 1正态分布 2 频率格纸 正态频率曲线在普通格纸上是一条规则的S形曲线 它在P 50 前后的曲线方向虽然相反 但形状完全一样 如图3 7中的 线 水文计算中常用的一种 频率格纸 其横坐标的分划就是按把标准正态频率曲线拉成一条直线的原理计算出来的 如图3 7中的 线 图3 7频率格纸横坐标的分划 3 3 4 1皮尔逊 型分布 如果3个参数确定后 该密度函数即随之确定 3 4经验频率曲线 通常把由实测资料 样本 所绘制的频率曲线称为经验频率曲线 设水文要素的随机变量 样本系列 X1 X2 Xn共有n项 按从大到小的顺序排列 则大于或等于Xn的数值有m次 其频率为m n 经验频率可按下式计算 4 20 3 4 1经验频率曲线的绘制 根据实测水文资料 按从大到小的顺序排列 如图4 8所示 然后用经验频率公式计算系列中各项的频率 称为经验频率 以水文变量x为纵坐标 以经验频率为横坐标 点绘经验频率点据 根据点群趋势绘出一条平滑的曲线 称为经验频率曲线 图3 9为某站年最大洪峰流量经验频率曲线 有了经验频率曲线 即可在曲线上求得指定频率的水文变量值 图3 8水文系列按大小排列示意图 图3 9某站年最大流量经验频率曲线 3 4 2经验频率公式与重现期 3 4 2 1经验频率公式 1 经验频率公式对经验频率的计算 目前我国水文计算上广泛采用的是数学期望公式 式中 p 等于和大于xm的经验频率 m xm的序号 即等于和大于xm的项数 n 系列的总项数 4 21 表3 2某枢纽坝址年最大洪峰流量频率计算表 表3 2某枢纽坝址年最大洪峰流量频率计算表 2 经验频率曲线存在的问题 经验频率曲线计算工作量小 绘制简单 查用方便 但受实测资料所限 往往难以满足设计上的需要 为此 提出用理论频率曲线来配合经验点据 这就是水文频率计算适线 配线 法 3 4 2 2重现期 频率曲线绘制后 就可在频率曲线上求出指定频率p的设计值xp 由于 频率 较为抽象 水文上常用 重现期 来代替 频率 所谓重现期是指某随机变量的取值在长时期内平均多少年出现一次 又称多少年一遇 根据研究问题的性质不同 频率P与重现期T的关系有两种表示方法 1 当研究暴雨洪水时 式中 T 重现期 aP 频率 例如 当洪水的频率P 1 时 代入上式得T 100a 意指等于或大于此洪水的机遇为百年一遇 4 22 2 当研究枯水问题时 采用 式中 T 重现期 a P 频率 例如 对于P 80 的枯水流量 代入上式得T 5a 意指小于此流量的机遇为5年一遇的枯水流量 4 23 3 5水文随机变量概率分布的估算 3 5 1皮尔逊 型频率曲线及其绘制 从现在掌握的资料来看 皮尔逊 型比较复合水文随机变量的分布 水文计算中 一般需要求出指定频率P所相应的随机变量取值xp 即 求出等于及大于xp的累积频率P值 直接由式 4 24 计算P值非常麻烦 实际做法是通过变量转换 变换成下面的积分形式 4 24 查给定Cs的对应于P的 p值 算出xp值 因此 已知 Cs就可求出各种P值相应的xp值 也就可以绘制皮尔逊 型概率分布曲线 3 5 2统计参数的估算 目前 由样本估计总体参数的方法主要有矩法 三点法 权函数法等 矩法是用样本矩估计总体矩 并通过矩和参数之间的关系 来估计频率曲线参数的一种方法 1 矩法 样本平均数 样本标准差S 样本离势系数 式中 ki称为模比系数 样本偏态系数 水文计算上习惯称上述公式为无偏估值公式 并用它们估算总体参数 作为配线法的参考数值 2 抽样误差 用一个样本的统计参数来代替总体的统计参数是存在一定误差的 这种误差是由于从总体中随机抽取的样本与总体有差异而引起的 称为抽样误差 抽样误差的大小由均方误差来衡量 计算均方误差的公式与总体分布有关 对于皮尔逊 型分布且用矩法估算参数时 用 分别代表 S Cv和Cs样本参数的均方误差 则它们的计算公式为 由上述公式可见 抽样误差的大小 随样本项数n cv和cs的大小而变化 样本容量大 对总体的代表性就好 其抽样误差就小 这就是为什么在水文计算中总是想方设法取得较长的水文系列的原因 3 5 3适线法 目估适线法又称目估配线法 是以经验频率点据为基础 给它们选配一条符合较好的理论频率曲线 并以此来估计水文要素总体的统计规律 具体步骤如下 点绘经验频率点据将实测资料由大到小排列 计算各项的经验频率 在频率格纸上点绘经验点据 纵坐标为变量的取值 横坐标为对应的经验频率 选定水文频率分布线型一般选用皮尔逊 型 据初定值cv和cs进行试配根据初定的Cv和Cs 查模比系数Kp值 可得皮尔逊 型的理论频率曲线Kp P 将此曲线画在绘有经验点据的图上 看与经验点据配合的情况 若不理想 可通过调整Cv和Cs点绘频率曲线 选定采用曲线最后根据频率曲线与经验点据的配合情况 从中选出一条与经验点据配合较好的曲线作为采用曲线 相应于该曲线的参数便看作是总体参数的估值 初定参数先采用矩法或其它方法估计出频率曲线参数的初估值Cv 而Cs凭经验初选为Cv的倍数 表3 某站年最大流量经验频率计算 表3 某站年最大流量经验频率计算 表3 某站年最大流量经验频率计算 表3 某站年最大流量经验频率计算 表3 某站年最大流量经验频率计算 3 6相关分析 相关的种类关系的密切程度 变量之间的关系有三种情况 即完全相关 零相关 统计相关 3 6 1概述 相关分析自然界中有许多现象之间是有一定联系的 按数理统计法建立上述两个或多个随机变量之间的联系 称之为近似关系或相关关系 把对这种关系的分析和建立称为相关分析 零相关 没有关系 两变量之间毫无联系 或某一现象 变量 的变化不影响另一现象 变量 的变化 这种关系则称为零相关或没有关系 完全相关 函数关系 两变量x与y之间 如果每给定一个x值 就有一个完全确定的y值与之对应 则这两个变量之间的关系就是完全相关 或称函数相关 完全相关的形式有直线关系和曲线关系两种 完全相关示意图 相关关系若两个变量之间的关系界于完全相关和零相关之间 则称为相关关系或统计相关 当只研究两个变量的相关关系时 称为简相关 当研究3个或3个以上变量的相关关系时 则称为复相关 在相关的形式上 又可分为直线相关和非直线相关 相关关系示意图 4 相关分析与回归分析的关系 1 研究变量的性质来说 回归分析 因变量是随机的 而自变量通常是非随机变量相关分析 全是随机变量2 研究任务来说 回归分析 确定因变量与自变量之间的关系相关分析 研究随机变量间关系密切的程度 检验其间的相关系数是否为零或为某值3 研究变量间关系的性质来说 回归分析 处理的是变量间的单向的依赖关系 既根据自变量来确定因变量的关系相关分析 处理的是变量间的相依关系 3 根据自变量的值 预报或延长 插补因变量的值 并对该估值进行误差分析 相关分析的内容 1 判定变量间是否存在相关关系 若存在 计算其相关系数 以判断相关的密切程度 2 确定变量间的数量关系 回归方程或相关线 3 4 2简单相关 相关图解法设xi和yi代表两系列的观测值 共有n对 把对应值点绘于方格纸上 得到很多相关点 如果相关点的平均趋势近似直线 即可通过点群中间及 点绘出相关直线 1 相关方法 简直线相关 为避免相关图解法在定线上的任意性 常采用相关计算法来确定相关线的方程 即回归方程 简直线相关方程的形式为 y a bx式中x 自变量 y 倚变量 a b 待定常数 待定常数a b通过最小二乘进行估计 最后得到如下形式的回归方程 相关计算法 式中 x y系列的均方差 相关系数 表示x y两系列的密切程度 式中r为简单相关系数 其值介于 1 1之间 r的绝对值越大 表示相关愈密切 r的绝对值为1时 即完全相关 r为零时 即零相关 在水文计算中一般要求有十年以上相关资料 且r的绝对值在0 8以上 n不小于12 才能通过相关分析插补延长短期系列的资料 若以y求x 则要应用x倚y的回归方程 x倚y的回归方程为 2 相关分析的误差 回归线仅是观测点据的最佳配合线 通常观测点据并不完全落在回归线上 而是散布于回归线的两旁 因此 回归线只反映两变量间的平均关系 按此关系推求的和实际值之间存在着误差 误差大小一般采用均方误来表示 如用Sy表示y倚x回归线的均方误 yi为观测值 为回归线上的对应值 n为系列项数 则 回归线的误差 水文上要求 Sy不大于y的均值的15 在相关分析中 相关系数是根据有限的实测资料 样本 计算出来的 必然会有抽样误差 一般通过相关系数的均方误来判断样本相关系数的可靠性 按统计学原理 相关系数的均方误为 相关系数误差 曲线相关 许多水文现象间的关系 并不表现为直线关系而具有曲线相关的形式 水文上常采用幂函数 指数函数两种曲线 基本作法是将其转换为直线 再进行直线回归分析 幂函数的一般形式为y axb两边取对数lny lna blnx令Y lny A lna X lnx则有Y A bX对X和Y而言就是直线关系 可对其作直线回归分析 幂函数 指数函数的一般形式为y aebx两边取对数logy loga bxloge令Y logy A loga B bloge X x则有Y A BX这样对X和Y同样也可作直线相关分析 指数函数 3 4 3复相关 可以根据实测点绘出z与x的对应值于方格纸上 并在点旁注明y值 然后做出y值相等的 y等值线 这样点绘出来的图 就是复相关关系图 它与简相关图的区别就在于多了一个自变量 即z值不单是倚x而变 同时还倚y而变 因此 在使用复相关图插补 延长 z值时 应先在x轴上找出xi值 并向上引垂线至相应的yi值 然后便可查得zi值 图解法 复相关的计算 在工程上采用图解法选配相关线 在右图中 倚变量z受自变量x和y两变量的影响 复相关计算除用图解法以外 还可用分析法 但非常繁杂 分析法主要用于复直线相关分析 或称复直线回归分析 多元线性回归分析 有关多个自变量的复直线回归分析 其原理与前面介绍的简直线 一元 回归分析大致相同 所不同的是回归直线方程中系数 回归系数 的确定需要求解更为复杂的线性代数方程组 式中b0为待定常数 有时b0 0 b1 b2分别称为y对x1 x2的回归系数 x1 x2为自变量 Y为倚变量 分析法 总平方和Lyy 残差平方和Q 回归平方和U 其中 R复称为复相关系数 是衡量回归效果好
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机关会议室管理制度
- 机加工铁屑管理制度
- 机构与人员管理制度
- 机要交换站管理制度
- 材料加工室管理制度
- 村全民阅读管理制度
- 村垃圾清理管理制度
- 村庄网格员管理制度
- 村环卫设施管理制度
- 村防疫卡口管理制度
- 小儿麻醉气道和呼吸管理指南鲁彦斌
- 插班生申请表
- 压力容器壁厚计算软件
- 降低非计划重返手术率PDCA
- 肿瘤防治知识讲座
- 湖北省普通高中教育技术装备建设规范
- 《激光原理及应用》课后部分参考答案 陈鹤鸣
- 八年级名著导读-给青年的十二封信
- 2023版个人征信模板简版(可编辑-带水印)
- 2023-2024学年浙江省慈溪市小学语文六年级期末评估试题附参考答案和详细解析
- 2023年广东广州市公安局招考聘用刑事技术助理70人笔试题库含答案解析
评论
0/150
提交评论