水文统计课件:6 - 估计理论(2016)_第1页
水文统计课件:6 - 估计理论(2016)_第2页
水文统计课件:6 - 估计理论(2016)_第3页
水文统计课件:6 - 估计理论(2016)_第4页
水文统计课件:6 - 估计理论(2016)_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章估计理论,基本内容:参数估计和非参数估计 如何根据随机变量的样本,采用适当的方法,对总体分布中的未知参数或数字特征作出估计,这就是参数估计问题。 参数估计形式:点估计和区间估计 点估计:用一个具体的数值去估计一个未知参数; 区间估计:用一个区间去估计未知参数。 当总体分布未知时,对其分布(包括分布密度、分 布函数的类型等)进行估计就是非参数估计问题。,第一节水文频率计算的一般问题 一、设计标准 水利建设的目的:除害兴利 ,解决天然来水与用水的不相适应的矛盾。要做到“经济合理”又“安全可靠”。在规划设计时,就要确定一个合理的工程规模或设计标准。 早期水利设施多以防洪为目的,常用历史上出现过

2、的某次大洪水或加上一个安全系数作为设计标准。存在问题: (1)水利设施是在未来使用的,在未来使用期内会不会出现更大的洪水?(2)对历史上水文情况的了解是与所掌握的资料多少有关,对资料充分与不充分的情况,如何加安全系数?(3)各种工程重要性不同,设计标准应有所区别,统一用历史洪水(或加一个安全系数)作为设计标准,就可能发生设计标准偏高或偏低。,一、设计标准 后来,人们根据水文现象的随机性,用概率来描未来出现各种大小洪水的可能性,设计时,对给定的概率p(水文上习惯称为频率),选择满足,P称为设计频率(也称保证率);xp称为设计值。,重现期,重现期T表示事件(Xxp)出现的平均轮转年数,表示该水文事

3、件每T年出现一次。,引入频率概念后,就可按频率划分等级确定设计标准了。重要工程,设计频率取小些(设计值大些),对次要工程,设计频率取得大些。 因此,设计频率也就成了设计标准了。 设计标准是由国家制订的,设计时应根据工程的重要性选取。,在p50%时采用,例如研究暴雨洪水。 当p50%时,一般采用下式:,此时T表示每T年出现一次事件(Xxp),常用于研究枯水径流或干旱问题。,水文频率计算的基本问题,二线型选择 要得到合理的频率计算成果,首先要有符合水文现象的概率模型。 在水文实际工作中,目前选择线型还是经验性的。即根据实测水文资料经验频率分布的情况,选配适当概率分布模型,并根据所选配的曲线与经验分

4、布点据拟合情况的好坏判断理论模型是否适当。由于实际应用中评判拟合优劣的标准不同,所得结论往往相差很大。,二线型选择 一般,选配频率曲线根据下列两条原则: (1)理论密度曲线的形状大致符合水文现象的物理性质,曲线的一端或两端有限,不应出现负值; (2)概率密度函数的数学性质简单,计算方便,同时应有一定的弹性,但有不宜包含过多的参数。 水利水电工程水文计算或设计洪水规范中规定采用P 型分布。,三参数估计和误差分析 每一种概率分布,还必须确定其中的参数,才能进行频率计算。 同样,这些参数是无法根据水文现象的物理机制确定的,而必须利用实测资料加以估计。这就要研究估计方法。同时,既然是估计,就不可避免地

5、会有误差。 因此,参数估计和误差分析是水文频率计算的另一重要内容。,第二节P 型分布,P型分布的概率密度,P-型分布密度曲线,1、P 型分布的参数,P-型分布密度曲线,P 型分布的参数,一a0非负,所以,二实测资料中的最小值xmin一般大于总体中的真正最小值a0,所以,,其中,2、P 型分布频率曲线,将X标准化,令 (称为离均系数),同理,是p与Cs函数。现已编制Csp关系数值表供查用,称为P型分布离均系数值表,见附表4。,因为值与p有关,所以有时将写成p,根据上式求得满足关系式:,例:设X服P型分布,且E(X)1000,Cv=0.50,Cs=2.00,求: p=0.2%的xp值; P(X25

6、00)。,3、P 型分布频率曲线的绘制,(1)理论频率曲线 若已知E(X)、Cv、Cs,由P型分布值表,可查得与各种(超过制)频率p相应的p值;再利用,可得到相应的xp。将点(p, xp )点绘在座标纸上,即可联成一条光滑的频率曲线,称为理论频率曲线(区别于经验频率曲线)。 (2)概率格纸,第三节参数估计的数理统计方法,一参数点估计 设随机变量X的分布函数 已知,其中为个未知参数, 需要利用X 的样本估计它 们的值,这就是参数的点估计问题。,1、矩法 由大数定律,当时,样本的各阶 矩也必相应地趋近于总体的各阶矩。,可以证明: 样本的各种数字特征都是总体同名特征的矩 估计量。,解方程组得:,作为

7、参数 的矩估计量。当观测到一个具体的样本 (x1,x2,xn)时代入上式估计量,得一组估计 值 ,并令,例1:设(X1,X2,Xn)为总体X的一个样本,求总体的均值a和方差2的矩估计。 例2:设总体X服从指数分布,其分布密度为,其中0为未知参数,现有X的一组样本值:0.17,0.05,0.15,0.06,0.28,0.05,试求的矩估计量和矩估计值。 例3:设总体X在a,b区间上服从均匀分布,求a,b的矩估计量。,2、极大似然法 极大似然法原理:若某项试验有多项可能的结果,它们发生的概率各不相同,那么在一次试验之前,可以合理地认为发生概率最大的那个事件将要发生;反之,如果在一次试验中,某个事件

8、发生了,那么认为在诸事件中,该事件发生的概率为最大也是合理的。,极大似然法,设随机变量X的密度函数 ,其中为个未知参数, 为X 的样本,则n维随机变 量()的联合概率密度函数 为:,上式称为样本的似然函数。,设为一实测样本,则随机 变量落在点邻域 内的概率为:,根据极大似然原理,应该认为作为n元随机变量的样本的取值,在领域内的概率较大,或者说取得这一组数值的概率密度比取得其他数值的概率密度要大。 这等价于似然函数L在已知样本值处比较大,而对似然函数而言,是常数,而参数 , , 是自变量,极大似然法就是将使L取得极大值的参数作为估计值。,使函数 达到最大的可由下式求 得:,或,上式称为似然方程。

9、,极大似然估计量,极大似然估计值,例4:设(X1,X2,Xn)为正态总体X的一个样 本,求a,2的极大似然估计。 例5:设总体X的密度函数为,其中0为未知参数,设x1,x2,xn为X的样本, 试求的矩估计和极大似然估计。,1、矩法的一个优点是寻求总体的数学期望、方差、变差系数、偏态系数等的估计量时无须知道随机变量的分布函数。 2、应用极大似然法时必须知道总体的概率分布,但是极大似然法的性质要比矩估计量好。在数理统计中,极大似然法被认为是最好的方法。,二、参数的区间估计,所谓区间估计,就是要构造两个统计量 和 ,且 对样本的任何值 都有,于是,可以以一定的可 靠度估计参数的真值包括在区间 内。即

10、,二、参数的区间估计,为置信概率; 为置信区间; ,为置信下限和置信上限。,注意下列两式的区别,其中(x1,x2)为预测区间.,若从总体中反复抽取容量相同的样本,得到许多 其中有的包含,有的不包含,当试验次数很多时, 约有100()个区间包含,见上图。,1正态总体均值的区间估计(1)方差已知,将一个具体样本代入,得:,从而,若2未知,但样本很大,可用S2代替2 。,(2)方差未知, t(n-1),将一个具体样本代入,得:,例1对一段距离测量16次,测得数据(单位:km)为:2.14, 2.10, 2.13, 2.15, 2.13, 2.12, 2.13, 2.10, 2.15, 2.12, 2

11、.14, 2.10, 2.13, 2.11, 2.14, 2.11。设测量值X服从N(a,2)分布,试在下列情况下求实际距离a的95%的置信区间:已知0.01; 未知。P194例2 对某事件A作了1000次试验,发现A发生了600次,试以0.95的置信度估计A发生概率p的置信区间。 P196 例3 对某商品的价格进行10次调查,该商品的价格与规定价格之差如下:2,1,-2,3,2,4,5,-2,3,4设该商品的价格与规定价格之差X服从正态分布N(a,2),求X的方差D(X)的置信度为0.95的置信区间。,2正态总体方差的区间估计,得:,其中:,设事件A发生的概率为p,在n次重复独立试验中,A出

12、现了m次,由德莫佛拉普拉斯定理知:,渐近于正态N(0,1),因此,当n足 够大时,近似地有:,化简后得:,3事件概率的区间估计,第四节参数估计的水文统计法,由于水文变量的样本一般都很小,使得应用数理统计中的各种方法的结果都不太好。 本节只介绍P型分布参数的估计方法,着重介绍我国水文统计现行的适线法。 适线法是一种图解法,它是集线型选择和参数估计于一体的一种方法,是我国水文统计中的一种基本方法。,一适线法的基本思想 (1)设x1,x2,,xn为水文变量X的样本,将其按由大到小顺序排列为,(2)采用某种经验频率公式,计算样本频 率,并称之为经验频率。,适线法的基本思想,(3)将经验频率点据 点 绘

13、在概率格纸上,可得到经验频率曲线。,(4)假定X的分布符合某种已知的概率模型 (如P型),其密度函数为,其中为未知参数。,适线法的基本思想,(5)则选定参数的一组初值 后,通过积分:,可得到X的理论频率曲线pG(x),将它绘到同一张概率纸上。,适线法的基本思想,(5)检查理论频率曲线与经验点据的拟合情况,如拟合良好,就采用所选的一组参数作为总体参数的估计值,如拟合不好,可另选一组参数,重复上述过程,直到拟合满意为止。,用适线法估计参数的好坏决定于三个问题: (1)总体分布线型是否行当; (2)经验点据的位置是否绘得合理; (3)用什么准则判断理论频率曲线与经验 占据拟合的好坏。,例 P169已

14、知某水文站平均流量资料,假设总体服从P-3型分布,试用适线法估计参数E(X)、Cv、及Cs.,第一次配线,第二次配线,适线法估计参数的三个问题,(一)总体分布的线型是否得当; (二)经验点的位置是否绘得合理; (三)用什么准则判断理论频率曲线 与经验点据拟合的好坏。,特大值处理,、分别处理法,特大洪水:,一般洪水:,、统一处理法,调查考证期; a 在年中连续顺位的特大洪水项数; 实测洪水系列中抽出作特大洪水处理的项。,(a)连序样本;(b)不连序样本,例:某坝址断面处水文站,经插补延长后得到19521978年共27年的洪峰流量资料。1979年进行设计时,经调查考证获得两次洪水资料;1788年约

15、为m=9200m3/s,是1788年以来的最大值;1909年m=6710m3/s,是1909年以来的第二位。实测系列中的1954年m=7400m3/s为1909年以来的第一位。为在该处修建一座水库,需根据以上资料,推求1000年一遇的设计洪峰流量。,统计参数的初估:,例2: 河 站,自19531986年中,有两年资料缺测,且无法插补。在年实测资料中,1982年洪水最大;1964年次大;1978年洪水最小。经调查考证获得1905年和1931年两次历史洪水信息,即1905年洪水大于1931年的洪水,但都没有1982年洪水大,且已查清在1905年1986年的82年中没有遗漏比1931年更大的洪水。又

16、经文献考评1764年曾经发生过一次量级比1982年还要大的洪水,是1764年以来的最大洪水,但因年代久远,17641905年间的其他洪水情况未能查清。,第五节估计方法好坏的评选标准,参数估计的方法很多,对于总体的某一参数,可以构造出许多不同的统计量,如何评价统计量的优劣? 1、无偏性 无偏估计量是没有“系统偏差”的估计量。对于无偏估计量U来讲,虽然不同的样本,它的取值也不同,但这些取值的平均数等于参数。,应当注意: 若U是u0的无偏估计量,g(u0)是u0的任意函数,一般来说,g(U)不是g(u0)的无偏估计量,即一般E g(U) g(u0) 。 例如:,但,所以样本均方差s*不是总体均方差的

17、无偏估计量。事实上,所以,这说明用s*估计时,平均而言总是偏小的。,2、有效性 总体的同一个未知参数可能有许多无偏估计量。由于各无偏估计量都是围绕着待估参数摆动,其好坏自然应当是在样本容量相同时,摆动愈小愈好,而刻划摆动程度的指标是方差,方差愈小,摆动愈小,抽样误差也就愈小。 设U1,U2都是参数u0的无偏估计量,若对任一n 成立,则称估计量U1较U2有效。 设 作为数学期望的估计量,可以证明,,在满足某些条件下,对一般的总体F(x,u0),都存在一个正数De,使得u0的任何无偏估计量U的方差D(U)都不会小于De ,这个De称为无偏估计量的方差的下界。它的数值与总体概率密度及样本容量有关,其表达式为:,而不等式,称克拉美罗不等式。,3、一致性 若参数u0的估计量U,对任意0具有性质 则称U为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论