版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于核估计的多变量非参数随机模型初步研究王文圣i, 丁晶i(1.四川大学水利水电学院,四川成都610065)摘要:本文基于核估计理论构造了多变量非参数模型。该模型是数据驱动的、不需识别和假定序 列相依形式和概率分布形式的一类随机模型,克服了多变量参数模型的不足。实例统计试验表明, 建议的多变量非参数模型是有成效的,为随机水文学发展提供了一些新思路。关键词:核估计;多变量非参数模型;随机模拟;实用性检验 中图分类号:p333. 9文献标识码:a流域水资源的开发利用,不仅需要单站水文信息,而且需要流域内各站的水 文信息。进行多站水文序列模拟的一个重要手段就是建立多站(变量)随机模型。目 前,多变量
2、随机模型1比较成熟的有自回归模型和解集模型。这两类模型的共同点 是用有限个参数的线性函数关系描述水文现象。因此简便实用,能表征水文序列的 统计特性和一般变化规律,但缺点也明显:水文序列是一时间不可逆过程,而参 数模型描述的是可逆过程,因此大多数参数模型难以反映其涨落不对称性;水文 现象受流域下垫面、人类活动、气候等多因素影响而变化错综,是一个高度复杂的 非线性系统,而多数参数模型仅能表征变量及变量之间的线性相依结构,忽略了占 据重要位置的非线性性;水文变量概率密度函数复杂r未知,某一指定概率分布 与真实分布存在着差异。如图1、2所示,正态分布、p-iii型分布都与直方图相差甚 远,但才检验并不
3、拒绝ptii型分布和正态分布;而核估计和k最近邻估计与直方图 比较接近。即概率分布具有不确定性;模型参数由于抽样误差和估计方法不同具 有不确定性。为克服参数模型之不足,文献2提出了单变量非参数模型,径流模拟表明 是满意的。在此基础上,本文基于核估计理论构造了多变量非参数模型。该模型避 开了序列相依形式和模型结构的假设,不涉及模型参数估计,能反映各种复杂关系, 较参数模型优越。以中国金沙江流域屏山站和宜宾一屏山区间两站fi流量过程随机 模拟为例,对建议模型进行了应用研究。1核估计理论1.1多维核估计定义 设x为d维随机变量,x., x2,x.为x的一样本。x的概 率密度函数f(x)的核估计定义如
4、下::"'一i 41-尽)-忑弔铲召畀p式中:x=(x1, x2,,xd) xi=(xii, xi2,xid)t(i=l, 2,,n) ; k()为核函数,是一 给定概率密度函数;h为带宽系数;n为样木容量;s是x的dxd维对称样木协方 差矩阵。1.2 核估计精度评价 核估计既同样本有关,乂与k()和h的选取有关。在给 定样本后,核估计的精度取决于k()及h的选取是否适当。常采用枳分均方误差 准则-mzs® =进行度量。mise由偏差和方差组成。当k()固定时,若h选得过大,偏差较大,但降低了方差,故(x)对f(x)有较大的平滑,使 得f(x)的某些特征被掩盖起來;
5、若h选得过小,偏差减小了,但增大了方差,贝9(x) 有较大的波动。显然同时减少偏差和方差是不可能的。1.3k()和h的确定依潘涅契科夫和scott通过统计试验发现,当给定带宽系 数,不同核函数对mise的影响是很小的。实际工作中,选择满足一定条件的核函数 即可。本文釆用标准高斯函数。h随n增大而减小。h的确定还要考虑数据的密集程度,在数据密集区,h 选小一点;在数据稀疏区,h选大一点。h的具体计算方法很多。这里使用lscv法。 lscv是基于积分平方误差(integrated square error (ise)最小准则的一种计算方 法。对多维随机变量x, tse为:式(2)中最后一项与h无关
6、。lscv就是取式(2)中前两项进行最小化,即1+c1)ee(-见4-2杰必式中:昶处町“一兀疔当lscv(h)最小时,h即为所求。2 基于核估计的多变量非参数随机模型2.1模型建立所谓多变量,可以是同-测站的几个水文变量,也可以是不同测站上 的一种或几种变量。设xj n(t可以是年,也可以是季、月、日)为多变量相依时 间序列,儿依赖于前p个值xtxm,,x®取vt=(xt-i, xt-2,xt-p)t, xt的条件概 率密度函数为:式中:&珂即.孑疔尸为变量个数, 牌为j变量 t时刻水文变量值;f (xt, v.)为m(p+l)维联合密度函数,fv(vt)为mp维边缘密度函
7、数。由多维核估计知=其中(7)式中:s为(xt,vj的样本协方差矩阵;,为xt的mxm阶对称样本方差阵;sxv为九 与叽的mxmp阶样本协方差阵;sv为x的mpxmp阶对称样本方差阵。vi=(xi, xy, x.-p)r, xl(xi,xi,,xa, x和x(二p+l,p+2,n)来自实测样本。当det (sv) ho时(一般满足),s可分解为:s =x9匕设sx-sxvs_1vstxv=a,则s可作如下变化:計屮)但y应-叫t1的-应1将式、(9)代入式(5)整理得:公耳)=占 £ &严 z严 h严 *同也(10)再将式、(10)代入式(4)可得:其中,l 乜沪制/备*(1
8、2)乞略“ 8.=应+;识-£)c“g% -広上略)s-m由式(11)知,条件密度函数(xi/vj是n-p个m维高斯函数(均值向量bi,方差矩阵 c)的加权(权重为wj平均和。用式(11)可随机模拟人,其模拟式为:xt=b.+det(13)式中:d为mxm阶标准差矩阵,c=ddr; et是均值0,方差1的m维独立高 斯随机变量。在条件v下,模拟序列x,是來自条件概率密度函数式仃1)的一个样本。 到此,多变量p阶非参数模型建立完毕。2.2模型阶数p的确定 在k()给定后,建立非参数模型的关键是寻求最优h和确 定p。p可由aic准则确定。2.3模型算法算法:从实测资料中构造xi和vi(i
9、二p+l,p+2,n);计算协方 差矩阵s;给vi赋初值;给定讥,由式(12)计算抽样概率wi;以概率wi抽样 xi;按式(13)模拟x,;给比重新赋值,转向第步,继续模拟;满足模拟数时 停止。3多变量非参数随机模型在日流量随机模拟中的应用3.1流域及资料情况 溪洛渡水电站的修建不仅要涉及自身的防洪安全,而且还要兼 顾下游城市宜宾的安危,因此研究溪洛渡洪水(屏山站)和宜宾一屏山区间(简称宜- 屏区间)洪水将至关重要。屏山站有48年(19401987)日流量过程,宜-屏区间日流 量由岷江高场站实测日流量(19401987)按面积比获得。以上述两站口流量过程为 例尝试将多变量非参数随机模型用于径流
10、随机模拟研究,以检验该类模型的可行性 和有效性。3.2模型建立 唱吩(i二1,2,,48; j二1,2,,365)表示屏山站、宜-屏区 间日流量。计算各截口(天)斜方差矩阵s,建立各截口两变量非参数模型。经计算,p=l,汛期(5月1日10月31 h)h=0. 532,非汛期(11月1日次年4月30 s)h=0 379o构造各截口对应的xi, vi。当jm2时,儿二(4起),曙(zg*殆*)(二1,2,48);当 j二1 时,x =(z«bzj)v;=( z8g,zj*)t(i=2,3,,48)。由模型算法便可对屏山站日流量和宜-屏区 间日流量同时进行随机模拟。3.3模型检验 建立各截
11、口两变量非参数模型,随机模拟100个模拟样本(模拟样 本容量与实测样本相同),用短序列法1对模型进行实用性检验。3.3. 1日流量过程截口统计参数检验 截口统计参数有截口均值、s、g、0、滞时1、 2的自相关系数ri,r2和最大值(max)、最小值(min)o统计了各统计量在不同站(区) 不同模型情况下,在两个均方差检验标准下的通过率,结果载于表1。表中显示截 口各统计参数的通过率是很理想的,表明各模型能很好地反映实测口流量过程的截 口统计特性。表1截口各统计参数通过率(%)站名均值sc、csrimaxmin屏山10010097.887. 510010010098.9宜-屏97.3100100
12、9& 410010096.791.83. 3.2时段量统计参数检验 检验时段有1、3、7、15、30d共5种,检验参数有时 段量均值、c、c“成果载于表2中,可以看出:均值、c、cs儿乎都控制在一个均 方差检验标准下。可见模型对各站(区)时段量统计参数都保持得很好。3. 3.3月径流统计参数检验 为进一步验证模型的实用性,本文对510月径流统计 参数进行了检验。成果载于表3中。该表显示:除极个别g控制在两个均方差检验 标准下外,其余都控制在一个均方差检验标准下。说明各模型能保持好月径流统计 参数。3. 3.4年最大日流量季节性变化检验 分别模拟4800年日流量过程,统计年最大口 流量在
13、各月出现的百分比,载于表4。由表4看出,各模型能反映各站(区)年最大 日流量季节性变化特性。表2时段洪量统计参数实用性检验时段洪量w10/1ovw3a/iowwtb/iowwis0/ioww3o0/low参数均值c' cs均值cvcs均值cvcs均值c. cs均值cv cs屏样本14. 80. 24 0. 79 42. 9 0. 23 0. 7893. 4 0. 23 0. 89182 0. 22 0. 87321 0. 22 0. 79山均值 14. 90. 23 0. 50 43. 0 0- 23 枚均方拟0.5 0. 02 0. 37 1.3 0. 02差0. 5393.80.
14、230. 581830. 220. 423270. 22 0. 30站0. 402.80. 020.415.40. 020. 349.50. 02 0. 30宜样本 16.90.27 1. 36 40. 7 0. 281.5274. 50. 251.521320. 241.412270.21 1. 36均值 17.20. 25 0. 63 41.3 0. 26 模均方拟0.6 0. 02 0. 35 1.5 0. 030. 9476.60. 251.231350. 231. 132300. 20 1. 08屏0.412.90. 040. 674.90. 040.617.20. 03 0. 54
15、表3 5-10月径流统计参数实用性检验时段洪站曰5月6月7月8月9月10月参数均值cvc,均值ac,均值a c,均值g cs均值cv cs均值cv cs样本 22180. 210. 3149010. 260. 7494100. 270. 63101680. 301. 09 9942 0. 240. 5465410. 250. 92 屏均值22270. 230. 1848990. 290. 2294560. 300. 38100360. 320. 67102300. 250. 2766000. 260. 58 山模均方站拟斗 73. 40. 030. 37 207 0. 030. 22 373
16、0. 020. 27 427 0. 030. 29 314 0. 020. 36 242 0. 020. 34 差样本 24660. 200. 0346320. 190. 3674540. 221. 29 6878 0. 260. 79 5879 0. 240. 0938730. 19(). 54 宜均值24590. 210. 0445620. 210. 0973650. 261. 23 6830 0. 250. 36 5901 0. 240. 0938620. 200. 56 模均方屏拟 77. 60. 020. 28 144 0. 020. 28 296 0. 040. 72 233 0.
17、 020. 33 174 0. 020. 26 111 0. 020. 26 差表4年最大日流量在各月岀现的冇分比(%)站名月份5月6月7月8月9月10月样本0.02.626.339.526.74.8屏山模拟0.02.020.246.229.81.9样本0.06.350.035.48.30.0宜-屏模拟0.05.242.93& 713. 10. 1总之,上述检验表明,非参数模型随机模拟两站日流量过程是可行的。该模 型同样适合于多站(多变量)各种时间尺度的随机变量。模拟序列來源于但不同于实 测样本,能充分利用己有的全部信息。而参数模型仅能利用实测资料中的一部分信 息。4结语鉴于参数模型的缺陷,本文基于核估计理论提出了多变量非参数随机模型。 该模型避免了模型结构(线性或非线性)选择和参数不确定性问题,同时借助于核估 计理论避开了序列概率分布形式的假定。通过实例分析计算表明,多变量非参数模 型适合水文水资源系统。参考文献:1 丁晶,邓育仁随机水文学皿成都:成都科技大学出版社,1988.2 王文圣,丁晶,袁鹏.单变量核密度估计模型及其在径流随机模拟中的应用j.水科学进展, 2001, 25(3).3 陈希儒,柴根象.非参数统计教材m.上海:华东师范大学出版社,1993.4 epanechnikov v a. nonparametric
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 制造业工厂设备运维经理的工作安排与优化
- 2026年公共安全与应急管理考试及答案
- 成人留置导尿护理指南2026
- 金融创新下总会计师的挑战与机遇
- 数学的奇异之美演讲稿
- 厦门演讲稿小学生
- 2025年AI艺术生成工程师的项目文档管理与规范
- 《地理》地球与地图知识考试及答案
- 2026年电网金属技术监督专业知识考试题库及答案
- 伯克利分校毕业演讲稿
- 黑龙江旅游职业技术学院单招《职业技能测试》参考试题库(含答案)
- 【可行性报告】2023年高纯氮化铝粉体行业项目可行性分析报告
- 营养支持讲课最终课件
- 全国优质课一等奖中职《就业与创业指导》课件
- 医院医技科室综合目标管理考核标准
- 出口海运工厂集装箱货物绑扎加固指南
- 领导科学PPT完整全套教学课件
- 电动机检修作业指导书
- 云南省普通初中学生成长记录模板-好ok
- GB/T 19867.1-2005电弧焊焊接工艺规程
- 公共管理核心与前沿课件
评论
0/150
提交评论