(水利水电工程专业论文)径流预报时间序列理论及方法研究.pdf_第1页
(水利水电工程专业论文)径流预报时间序列理论及方法研究.pdf_第2页
(水利水电工程专业论文)径流预报时间序列理论及方法研究.pdf_第3页
(水利水电工程专业论文)径流预报时间序列理论及方法研究.pdf_第4页
(水利水电工程专业论文)径流预报时间序列理论及方法研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(水利水电工程专业论文)径流预报时间序列理论及方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学硕士学位论文 摘要 f3 ;弓| 7v z , 径流过程具有很大的随机性和不确定性,一般只能用统计的方法进行分析研 究。而入库径流对发电调度、航运、防洪等方面叉产生很大影响,因此,如何准 、 确地预报径流过程及其变化趋势对水电系统优化及经济运行具有重大意义。夕, , 本文概括了国内外水文预报的进展与研究发展方向,并具体结合了“清江梯 级水电联合调度系统”开发项目,较深入地探讨了径流预报的相关方法。在利用 现有历史观测资料建立径流时间序列的基础上,通过时间序列分析方法建立了相 应的预测模型。 时间序列分析的若干理论已经相当成熟,特别是对于线性平稳时间序列,其 多种模型己被广泛应用于各领域的控制和预测。本文详细介绍了a r m a 系列模型 的特点、相关分析方法及建模过程,并结合现有数据资料,通过相关分析,给出 了枯水期径流预报的a r 模型,经过实例验证,取得了较好的效果。 径流过程很难用线性系统来描述,径流序列一般也是非平稳的。随着非线性 科学的发展,研究工作者开始用人工神经网络模型、混沌系统等非线性系统来描 述径流过程,且显示出较好的应用前景。本文介绍了神经网络的相关理论与模型, 初步尝试了用三层b p 网络模型模拟全年的径流过程,在网络结构与算法优化等 方面做了有益的探讨,并在此基础上进行预测,其结果证明是可行的。 关键字:水文预报,径流,时间序列,a r m a 模型,a r 模型, 人工神经网络,b p 算法 华中科技大学硕士学位论文 a b s t r a c t t h er u n o f fc o u i s cu s u a l l yc o u l db ea n a l y z e db ys t a t i s t i c a lm e t h o d sb e c a u s eo fi t s r a n d o m i c i t ya n di n d e t e r m i n a c y h o w e v e r , t h er u n o f fi m p a c t sg r e a t l y o ng e n e r a t i o n d i s p a t c h i n g ,n a v i g a t i o n , f l o o dc o n t r o l l i n ga n ds oo n s o ,h o w t oc o r r e c t l yp r e d i c tt h e r u n o f fc o u r s ea n di t sc h a n g et r e n di sv e r yi m p o r t a n tt ot h eo p t i m i z a t i o na n de c o n o m i c a l o p e r a t i o no f h y d r o p o w e rs y s t e m t 1 1 i sp a p e rr e v i e w e dt h ea d v a n c ea n dd e v e l o p m e n ti nh y d r o l o g i cf o r e c a s t i n g ,a n d d i s c u s s e dd e e p l yt h ec o r r e l a t i v em e t h o d st ot a l n o f fp r e d i c t i o na s s o c i a t e dw t ht h e p r o j e c t c o m b i n e do p e r a t i o no fq i n g j i a n gc a s c a d eh y d r o p o w e rs y s t e m ”b a s e do n c r e a t i n gr l m o f ft i m es e r i e s 、i t l lh i s t o r i c a ld a t a , s e v e r a lf o r e c a s t i n gm o d e l sh a db e e n e s t a b l i s h e db yt h em e t h o d so f t i m es e r i e sa n a l y s i s 1 1 1 em a i n t h e o r y t ot i m es e r i e sh a sb e e ng r o w n u p a n dm a n y l i n e a rs t a t i o n a r yt i m e s e r i e sm o d e l sh a v eb e e nu s e dt oc o n t r o la n df o r e c a s ti nv a r i o u sf i e l d s i nt h i sp a p e r , t h e c h a r a c t e r s ,c o r r e l a t i v ea n a l y s i sm e t h o d sa n dm o d e l i n gp r o c e s so fa r m as e r i e sw a s i n t r o d u c e di nd e t a i l ,a n dt h ed r o u g h tp e r i o dr u n o f ff o r e c a s t i n ga rm o d e lw a sg i y e n a c c o r d i n gt oc o r r e l a t i v ea n a l y s i sa s s o c i a t e dw i t ha v a i l a b l ed a t a b yp r a c t i c e d , g o o d r e s u l tw a sa t t a i n e d i ti sd i 衔c u l tt od e s c r i b ear u n o f fc o u r s ew i t hl i n e a rs y s t e r n a n dr u n o 行s e r i e s u s u a l l ya r en o n - s t a t i o n a r y w i t ht h ed e v e l o p m e n to fn o n - l i n e a rs c i e n c e r e s e a r c h e r s b e g a n t od e s c r i b e1 1 1 1 1 0 f f c o u r s ew i t hn o n 1 i n e a rs y s t e ms u c ha sa r t i f l c i a ln e u r a ln e t w o r k , c h a o ss y s t e m a n ds h o w e dg o o da p p l i c a t i o n p r o s p e c t t l l i sp a p e ri n t r o d u c e ds o m e t h e o r ya n dm o d e l so fa n i f i c i a ln e u r a ln e t w o r k , a n da r e m p t e dt os i m u l a t et h ea l l - y e a r r u n o f fw i t ht h et h r e e 1 a y e rb pm o d e l a f t e rm a d es o m eu s e f u lr e s e a r c ht oo p t i m i z a t i o n o fn e i w a ln e t w o r kc o n s t r u c ta n da l g o r i t h m t h ea n nm o d e iw a su s et oa 1 1 y e a rr u n o i f , a n di tw a sf e a s i b l eb yt e s t e d k e yw o r d s :h y d r o l o g i cf o r e c a s t i n g ,r u n o f f , t i m es e r i e s ,a u t o r e g r e s s i v em o v i n g + i a v e r a g em o d e l ,a u t o r e g r e s s i v em o d e l ,a r t i f i c i a l n e u r a l n e t w o r k , b a c k p r o p a g a t i o na l g o r i t h m 华中科技大学硕士学位论文 1 综述 电力系统运徭方式中,运行的经济性、可靠憔和供电质爨的保证,都与水电 站及其水库的运行密切捆关,在某种意义上讲,水电站在电力系统运行方式中起 誉十分重要的作用。水电站运行的最重要的特点是其运行情况的不确定性,这种 不确定性主要是由于入库径流的不确定性造成的。径流的多变性、不重复性、周 期性碧日髓枧性绘电力系统中水电站的优化调度带来很多困难。根据库区水文、气 象信息、流域工况信息,进行流域水情长、中、缀期预报,为电力系统的长、中、 短期发电优化调度提供决策支持和依据,提高电力系统的经济住和可靠髓。 1 1 课题简俞 1 本课题结合“可视化清江梯级水电联合调度系统”研究项目展开。浦江位予 鄂西南山区,是长江中游南岸的条较大支流,河流自西向东,流经1 0 个萎市, 在技城市汇入长江,千流全长4 2 3 k m ,总落差1 4 3 0 m ,流域面积1 7 0 0 0 k m :。流域形 状呈狭长形,东话长,南北窄,地势自西向东倾斜。流域由势陡峭,河谷深讶, 坡陡流急。清江流域气候属驻热带季风气候匿,气候温和,雨量丰富,年降雨蠢 1 4 0 0 m ,年径流羹1 3 3 亿m ,由予地形和气候的原因,流域麓内多暴雨,多洪永, 往往造成洪水灾害,危度下游和剩江河段的防洪安全。 清江流域水能资源率富,主要集中程干流中下游,给占全流域西能开发耋鹣 8 5 8 ,占干流可汗发羹的9 7 4 。清江梯缀三犬永电辩建成后,慧装梳容量3 4 5 2 m w , 联合运行年发电蠢8 t 6 亿k w h 。为潮托省宅麓供藏基缝之一。 水布垭、隔河岩梯级的水库总瘁容7 8 6 亿秽,有效痒察3 6 亿瓣,基渍篷滚 域总径流量的2 儒,求鬻为年、多年调节水瘁,能鸯效调节径滚,经滚剃耀搴达 9 3 黻上,同时键高了桔求精豹发电出力。东布壤和隔海岩调节瘁窖巨大,电蛙装 杭蕊模丈,又无综合乖j 稻要求约束,承跑站矮舂建好豹湄蜂性熊,涛江梯级承魄 站为华中电潮和灞敖省龟圈调蜂、调频龟站基地;嘏站建残后调蜂察量占华中彀 瀚酶蘅容量豹1 7 l 8 ,能鸯效地改善豢中宅网淫蜂容爨严藿不是豹状态。 清敬是长江出三峡麓豹第一条大支漉,是汇入长江豹距荆泼河段最近的较丈 华中科技大学硕士学位论文 夏五清、工砖级筒;三痒容的利用,对长江洪水可有效地起到削峰、错峰,推迟洪 逢f b j 的咋n 。c _ 对长工刊江河段和中下游的防洪具有极其重要的作用。隔河岩水 重互1 9 9 8 年长j 工流域特大洪水的抗洪斗争中怍出的巨大贡歙至今还记忆犹新。自 然条件下i 青江只能局部河段通航梯级建成后,恩旌以下河道基本上渠化,年 通过能力大为提高为库区沿岸运输和物资交流带来了便利条件,必将对促进当 地资源的于= 发和经济的发展带来积极的影响。清江干流水电工程具有防洪、发电、 航运等巨大的练合效益,其运行涉及社会的诸多方面,对社会具有很大影响。尤 其是梯级水电综合调度不仅是一个扳富挑战性的前沿研究课题,而且亦是国际学 术受工程界研究的热点问题。具有深远的社会效益和巨大的经济效益,同时其研 究盛果对推动我国水电孽业的科学技术进步也有重大的科学意义和工程实甩价 直, 项目以清江流域防洪、发电、航运、环保以及经济可持续发展等综合效益为 ,誊目f ,下,充分发挥清江水电工程的综合效益,并提供最大的调峰发电效益,为国 内外其它大型水电厂梯级水电综合调度决策过程的自动化、智能化工程起到示范 作习,研究成果达到国际领先水平。 研究项目由以下几大模块组成:梯级系统长朗优化调度、梯缎日优化调度、 径流预报、负简预报、不稳定流计算和梯级水电预演仿真,其中径流预报的准确 性对由此作出的调度方案的最优性至关重要,针对入库径流的不确定性,进行径 流预报的模型及算法研究。 1 :径流描述 水电站水唪的束水,是一个咀年为周期的连续随机过程,它有两个基本特点: 左固定时刻进行观察,水库末水是一个随机变量;对于一个水库来水的具体实现 它是一个随对旬变化的函数。如果我们观察的时间足够长,流量过程是遍历的。 对径流描述的研究,过去的工作可大致上分为两类,即统计法和时历法【i i 。统计 i 三考虑弪流随机属性方面比较多,而时历法则强调径流随时州变化的过程属性。 为了便于研究,同时考虑到水电站水库调度计划本身是生产计划的一部分, 是班时段为单垃安排的( 年、月、旬、日计划) 。可把作为连续随机过程的径流在 时问上逆 i 离散她也就是把连续时间分成若干个时段,每一个时段的入库流量 华中科技大学硕士学位论文 由该时段的流量平均值来表示。 闰i 表示了时间离散前后的入库径流过程,连续益线表示菜一实际径流过程, 阶越直线段表示与其对应的时间离散亿后的往流过程。 0 ”ln 时l t 萄1径攮过程离散 幺 闰中表示连续过程划分为多个对毅,这样,对连续蔽梳过程豹研究瑶代数对游段 径流及箕相盔关系静研究。 任一时敬的径流繇( 第n 葬雩最的径瀛) 是伞箍槐交鬃。恣掌握一定数量 m 或y n 时,掣= 0 ,当k 坍+ 时,幺= 0 。 等流时线法可从一场降雨的过程及降雨的区域( 即降雨的时空分布) ,计算出径 流的流量过程线,如果降雨的时空分布测得较准,则计算的流量过程是非常准确 的,由于面积单位为k m 2 , 雨量单位为m n l ,出口断面流量以m 2 s 计,根据考虑 问题的不同可能为小时、日、旬或月,因此计算时,必须注意单位换算。另外, 计算时,要考虑到土壤的潮湿程度( 这次降雨与上次降雨的时间间隔) 等因素,则计 算结果将更准确。 当雨量较大,持续时间较长时,土壤的调蓄作用影响很小,此法计算非常准 6 华中科技大学硕士学位论文 - - _ - - - - - _ i - - - _ _ _ 一i _ i ! o 苎! 苎! ! ! ! 确。所以,此法也特别适用于洪水的预报。由于要用到各雨量站各时刻的雨量及 流域地理信息,计算工作量大。 该方法根据流域的大小,适用于中、短期径流预报。 径流短期预报涉及的主要因素有: 雨量站地理分布图及实测降雨数据; 流域内上游各水文站实测径流数据; 流域地理信息( 土壤湿度、地质状况、植被状况和她貌信息等) ; 气象信息( 卫星云图,各地天气,气温等) 。 1 3 2 径流中长期预报 中长期水文预报一般是指以天为单位,一年以内的水文预报。中长期预报方 法可分为传统方法和新方法,传统方法主要有成因分析和水文统计方法,新方法 主要有模糊分析、人工神经网络、灰色系统分析等方法【1 孙。 ( 1 ) 成因分析 河川径流主要来源于大气降水,与大气环流有密切关系。一个流域或地区发 生旱涝是与环流联系在一起的。分析研究大气环流与水文要素之间的关系一直是 水文气象工作者深入探讨的课题。黄忠恕1 1 4 1 等分析了北太平洋和青藏高原下垫面 热状况变化与长江流域汛期旱涝之间的关系,初步揭示出一些相关性。刘清仁i ”】 以太阳活动为中心,以长期和超长期水文预报为目的,用数理统计分析方法,分 析了太阳黑子和厄尔尼诺事件对松花江区域水文影响特征及其水、旱灾害发生的 基本规律,揭示了降水量按磁周期呈丰、枯水变化的规律。章淹1 1 6 】从水文气象学 角度论述了近年国内在暴雨中期预报研究方面的若干新进展,探索了中期预报的 方法。 总之,联系大气环流的长期演变以及前后承替规律来进行水文要素的中长期 预报是一条具有物理基础的重要途径,也是中长期水文预报发展的方向。 ( 2 ) 水文统计方法 水文统计方法是通过水文资料的统计分析进行概率预测,可分为两大类:一 类是分析水文要素自身随时间变化的统计规律,然后用这种规律进行预报,如历 史演变法、时阿序列分析法等;另类是用多元回归分析法建立预报方案,进行 预报。目前应用较广的水文统计预报方法主要有多元分析与时间序列两种。 华中科技大学硕士学位论文 多元回归分析常用的方法主要有逐步回归、聚类分析、主成分分析等a 这种 方法的主要问题有如何合理选择因子个数,解决拟合效果与预报效果不一致的矛 盾:由于预报值是取各个因子数据的均值,难以预报出极大或极小值的水文现象。 时间序列分析是应用水文要素的观测记录,寻找其自身的演变规律来进行预 报。常用的有平稳时间序列中的自回归模型、周期均值迭加、马尔可夫链等。六 十年代以前主要采取把序列分解成趋势、周期、平稳等项,然后再分项预测后进 行迭加而的到预报结果。七十年代后,b o x 等提出的a r m a 类模型逐步应用于中长 期水文预报【1 7 l 。同时,具有非线性特点的t a r 模型也开始用于中长期水文预报【l 引。 ( 3 ) 模糊分析 八十年代,陈守煜1 等在水利、水文、水资源与环境科学领域中进行了模糊 集的应用研究,并将模糊集分析与系统分析结合起来,形成了一个新的模糊随机 系统分析体系,1 9 9 7 年陈守煜 19 】又提出了中长期水文预报的综合分析理论模式与 方法,该方法将水文成因分析、统计分析、模糊集分析有机地结合起来,为提高 中长期水文预报的精度提供了一条新途径。 模糊分析的引进丰富了中长期水文预报理论,但由于信息模糊化带有明显的 主观性,使模糊分析的应用受到了一定的限制。 ( 4 ) 人工神经网络 人工神经网络是基于连接学说构造的智能仿生模型,是由大量神经元组成的 非线性动力学系统,具有并行分布处理、自组织、自适应、自学习和窖错性等特 点。九十年代以来,人工神经网络在水文预报中的应用逐渐增多。吴超羽 2 0 l 等认 为人工神经网络模型具有生物神经网络的一些特性,能够“学习”,因此易于应用 在各种类型的流域系统。人工神经网络模型是高度非线性模型,能够有效地模拟 本质为非线性的实际水文系统,人工神经网络模型在预报期和预报精度上较对比 性模型( c a r ,r w f l ,a r ) 有明显的优越性。钟登华【2 l 】等提出了水文预报的时间 序列神经网络模型,并指出探索利用输入输出数据进行建模的方法是十分必要的。 胡铁松 2 2 1 等对人工神经网络在水文水资源中的应用现状作了全面的介绍,并认为 神经网络为一些复杂的水文水资源问题的研究提供了一条有效的途径。h s u 2 3 1 等提 出了确定三层b p 网络模型结构和参数的线性最小二乘单纯形法( l l s s i m ) ,并认 为三层结构的b p 网络就能满足水文预报的一般需要。丁晶【2 4 1 等认为当前单纯地分 华中科技大学硕士学位论文 别应用确定性和不确定性方法,面临许多无法妥善处理的困难,因此有必要探索 一种新思路和新途径。新思路就是模拟人脑思维方式来处理极端复杂系统中出现 的各种各样的问题( 判别、分析、预测、控制、调度等) ;新途径就是在人工神经 网络理论的基础上,通过分析和计算,建立适应性很强的人工神经网络模型。胡 铁松【2 5 1 等提出了径流长期分级预报的k o h o n e n 网络方法,有效地克服了人为给定 监督信号进行径流分级预报存在的不确定性给预报精度带来的影响冯国章惭l 等 提出了基于径流形成机理的以时段降水量与前期径流量为预报因子的前向多层人 工神经网络径流预报模型,分析了网络结构对预报精度的影响。邱林l z 等提出了 模糊模式识别神经网络预测模型,开创了神经网络拓扑结构建模的新思路。 确定性水文预测的神经网络方法虽然白化能力具有最小熵优势,但存在定 的学习和泛化误差,即无法覆盖水文预测中的不确定性信息。此外,影响人工神 经网络拓扑结构的因素众多,且参数优选理论发展不甚完善也制约了人工神经网 络模型优势的发挥,使之在应用推广方面遇到了定的困难。 ( j ) 灰色系统理论 灰色系统理论是邓聚龙于1 9 8 2 年创立的,十几年来发展较快。李正最1 2 川认为 灰色静态模型g m ( o ,h ) 与多元线性回归模型在模型形式与参数辩识、方法处理等 方面是相同的,因此,两种模型用于水文变量相关分析所得结果一致。谢科范网 认为灰色系统理论在某些方面存在不少缺陷,与回归分析相比,短期预测结果较 好,长期预测结果欠佳。冯平【3 0 1 等采用灰色系统理论中灰关联度分析方法,对枯 水期径流量的预估模式进行了探讨。夏军j 基于时间序列多重信息利用的扩维原 理和灰色系统理论的关联分析思想,提出一种适合于缺乏输入因子资料或选择影 响因子有困难条件下的中长期水文预报方法。陈意平1 3 2 l 等认为g m ( i ,1 ) 模型为水 利系统的中长期预报提供了一种新方法。钟挂芳1 3 3 1 尝试应用灰色交基模型进行水 库的长期预报。 灰色理论由于其特点,比较适合具有指数增长趋势的问题,对于其他变化趋 势,则有时拟合灰度较大,导致精度难以提高,且灰色系统理论体系尚不完善, 正处于发展阶段,它在中长期水文预报中的应用也属于尝试和探索性的。 1 3 3 存在的不足及关键技术问题 径流预报的方法很多,对于中长期预报,目前还没有一种模型对所有的水文 华中科技大学硕士学位论文 序列柬晚都是适用的,预报模型的适用性是至今仍然有待深入研究的问题,对于 一个具体水文序列的中长期预报问题,人们往往是通过分析、尝试、检验等步骤, 最终找到合适的预报模型。中长期水文预报研究仍处在发展阶段,相对于短期水 文预报来说,滞后于生产实际的要求。径流预报的准确性和预报时间长度是一对 矛盾,一般来讲,预报时间越长,预报精度越低。在预报理论研究上,更多注重 的是水文系列的统计相关特性,而对物理成因关系关注的相对较少;在预报方法 上,对各种方法的有效性研究不够,使现有的方法很难在实践中推广应用;在预 报结果的实际应用上,中长期水文预报目前主要是对水资源的宏观调控起一些参 考性作用。 一切水文要素的变化都有其特定的物理机制,从物理成因上解释预报因子的 合理性,从形成水文现象的物理机制分析入手,使预报模型建立在严格的物理成 因基础上,是今后水文预报应遵循的基本原则。水文系统是一个复杂系统,水文 要素的时空变化具有高度的非线性特点,非线性科学方法都可能成为有效的新的 分析途径。中长期水文变化趋势主要受大尺度水文气象要素变化的影响,对它们 变化规律的掌握和解释将对提高中长期水文预报的准确性起到重要作用。资料不 足或资料代表性不好是制约水文预报发展的重要原因之一,应积极开展水文资料 的观测与积累,为水文预报提供必要的条件。 1 4 现有条件及研究方向 清江梯级水电联合调度系统现已建成隔河岩和高坝洲水电站,水布垭尚在建 设中。“可视化清江水电联合调度系统”开发项目已全面启动,径流预报与长期调 度、短期调度、梯级a g c 、界面与数据库设计几个模块同时进行。对于径流预报 部分,现有清江流域各水文站1 9 9 6 1 9 9 9 年四年的历史径流资料,根据流量变化 大小不同,每天2 4 个时段流量数据,枯水期和丰水期不等。 由于缺乏长系列历史数据、各雨量站实测降雨信息、流域地理信息和气象信 息等相关数据资料,径流预报难以从流域物理成因入手,只能从统计角度出发分 析现有数据,力争找出其内在规律,在满足航运、防洪、环保的基本要求下,为 制定最优发电计划提供依据。 所需数据资料的缺乏给我们的工作带来了很大的不便,但我们也要从现有条 1 0 华中科技大学硕士学位论文 件出发,探讨和研究适当的方法,使科研项目得以展开进行。根据现有的数据资 料,作适当的归纳和整理,建立相应的径流时间序列。在此基础上,探讨时间序 列的内在相关性,从平稳时间序列分析入手,结合非线性科学领域的研究成果, 建立相应的系统模型,进行水文中长期预报。 华中科技大学硕士学位论文 2 径流时间序列的建立 在对径流序列进行分析之前,必须对观测数据进行整理和加工,建立合适的 时间序列,才能继续下一步的工作。径流原始观测数据是根据实际需要及具体情 况实时采集的数据,它们在时间间隔、时段上一般没有严格统一的规定,有时由 于观测失误或仪器故障,可能会出现离群数据甚至数据缺损。此外,所提供的数 据资料也是根据工情制定的,数据文件格式也不一定会满足需要。因而,有必要 对原始数据进行适当的处理,建立合适的时间序列。 2 1 时间序列 人们的一切活动,其根本目的无不在于认识和改造客观世界。在工程、经济、 自然科学和社会科学等领域的实际工作者和研究人员都要和一系列的观察数据打 交道,我们把按时间顺序产生和排列的观察数据序列称为时间序列。比如气象上 的月降水量序列、水文上的河流流量序列、机械系统的振动序列等。通过对时间 序列的分析,不仅可以从数量上揭示某一现象的发展变化规律或从动态的角度刻 划某一现象与其他现象之间的内在数量关系及其变化规律性,达到认识客观世界 之目的。而且运用时序模型还可以预测和控制现象的未来行为,修正或重新设计 系统以达到利用和改造世界之目的。 一般来说,时间序列很难用一个完全确定的数学函数来表述,即具有不确定 性,但它们大都具有统计规律性,可以通过分析序列的统计特征来揭示其内在的 规律。 时间序列的特点体现在观测数据与排列顺序有关,即观测值之间有一定的时 间相关性,不同系统的相关性彼此不同,因而用某种数学模型来表达这种相关性 是研究时间序列的关键。 用来分析各种相依有序的离散数据集合的方法称为时间序列分析( 简称时序 分析) 。从表面上看,时序分析撇开了系统变量闯的因果关系和结构关系的影响, 但事实上,由于时序中反映了曾经发生过的所有因果关系和结构关系的影响。时 序分析是从总的方面进行考察,来晚明各种作用力的综合作用。因此,当我们所 华中科技大学硕士学位论文 关心的影响因素错综复杂或有关的数据资料无法得到时,就直接采用时间t 作为 变量来综合地代替这些因素。时间作为一个明确的自变量进入模型,其意义表面 上是表示因变量随时间而自发的变化,而实际上是代表了决定因变量变化的诸因 素的联合影响【o j 。 时间序列根据所研究的依据不同,可以有不同的分类:( 1 ) 按所研究的对象的 多少分,有一元时间序列和多元时间序列。多元时间序列不仅描述了各个变量的 变化规律,而且还揭示了各变量之间相互依存关系的动态规律性。( 2 ) 按时间的连 续性可将时间序列分为离散时间序列和连续时间序列。( 3 ) 按序列的统计特性分, 有平稳时间序列和非平稳时间序列两类。如果一个时间序列的概率分布与时间t 无关,则称为严格的平稳时间序列。如序列的一、二阶矩存在,且均值为常数、 协方差为时间间隔的函数,则为宽平稳时间序列。不具平稳性即序列均值或协方 差与时间有关的序列称之为非平稳时间序列。( 4 ) 按序列的分布规律来分,有高斯 型( 正态分布) 时间序列和非高斯型时间序列。( 5 ) 按系统模型可分为线性时间序列 和非线性时间序列。 入库径流可以看作与自身历史观测数据相关的一元时间序列,也可以看作与 流域气候、水文要素等有关的多元时间序列,通过等时间间隔离散化,得到离散 时间序列,再在此基础上进行分析。时间序列分析处理加工的是来自所研究系统 的时间序列数据,因此,建立一个时间序列是进行时序分析的第一步。一般,数 据资料是通过记录仪、观察测量或运用次级资料获得的,在进行分析处理前,必 须对所依据的资料进行认真的检查、整理【l 孙,建立合适的时间序列,以利于进一 步的分析。 2 2 数据采集 对于所研究的系统来说,相应于时间的连续性,系统在不同时刻上的响应常 是时间t 的连续函数。为了数字计算处理上的方便,往往只按照一定的时间间隔 对所研究系统的响应进行记录和观察,称之为采样,相应地把记录和观察的时间 间隔称为采样间隔。 在对时间序列x ( t ) 的采样过程中,取不同的采样间隔可以得到不同的数字时 间序列x 。,t = l ,2 ,。采样间隔既可以相等,也可以不等。在此,只讨论等间隔 华中科技大学硕士学位论文 采样。 如前所述,时间序列包含了系统的全部信息,因而人们可以藉以研究系统的 动念结构和运行规律。但是,采样得到的离散时间序列x 。失去了相邻时间间隔之 间的值,即这个区间内系统的信息在采样之后丢失了。显然,在合理的范围内, 采样间隔越小,采样值就越多,信息损失就越小,数据处理量越大,相应的处理 时间、人力、财力消耗越大。相反,采样间隔越大,采样值越少,处理时间、人 力、财力消耗越小,但信息损失大。因此,选择合适的采样间隔是建立时间序列 的关键,理想的采样间隔就是既没有损失信息,也没有出现信息冗余。在实际中, 研究者只能根据所研究系统的具体特性和经验,在不过分减少信息损失和不过分 增加数据量之间作出合理选择。 以清江流域径流数据为例,在流量变化不大的冬春季枯水期,一般每天分两 个时段,每十- d , 时采集一次流量数据,而流量变化较大的丰水期,则每天分四 个时段,每六个小时采集一次流量数据。数据文件以数据库表的格式提供,我们 需要忽略掉“站号”、“水位”等信息,提取有用的对应于各“站名”和“日期”、 “时段”的“流量”信息。在计算日径流时,将每天各时段的流量值相加,再取 平均值。 2 3 缺损数据的补足 在采集时间序列时,有时会由于仪器故障、操作失误、观测问题等种种原因, 引起在某些观测点上未能记录下来观测值,这种缺少的观测值称为缺损值。但序 列中存在缺损值时,就破坏了系统运行的连续性,违背了时间序列“顺序重要性” 的原则。严格的说,我们不能依据一个“残缺”的序列进行分析,即使强制性地 进行了分析,其结果也是无意义的。可是,由于时间的不可逆性,我们又无法重 新观测。因此,我们所能做的就是依据其运动轨迹或变化趋势,运用一定的方法 对缺损值进行估计、推测,以补足缺损的数值。具体估算、推测的方法很多,如 增量推算法、插值法、比例推算法、平滑法等第,分析人员可根据具体序列选择 运用。 此外,在对某一时间序列进行分析之前,还要对序列中的每一个数据的数值 可行域、数值单位等进行认真检查,若存在不一致,要运用科学的方法进行调整。 华中科技大学硕士学位论文 _-ii一 一 一 一i 如表2 - 1 所示为清江流域渔峡口的部分水文数据,出于种种原因出现了数据缺损, 表2 一l渔峡口水文数据截录 站号 站名日期时间水位 流量 2 4 2渔峡口1 9 9 7 - 1 0 - 2 98 :0 01 7 9 1 31 6 2 2 4 2渔峡口 1 9 9 7 一1 0 2 91 4 :0 01 7 9 2 2 1 7 2 2 4 2渔峡口1 9 9 7 一1 0 - 2 92 0 :0 0l ? 8 9 81 7 2 2 4 2渔峡口1 9 9 7 一1 0 - 3 02 :0 01 7 9 0 l1 6 5 2 4 2渔峡口 1 9 9 7 一1 0 - 3 0 8 :0 01 7 9 1 21 4 3 2 4 2渔峡口1 9 9 7 - 1 0 - 3 01 4 :0 0 2 4 2渔峡口1 9 9 7 一1 0 - 3 02 0 :0 0 2 4 2 渔峡口 1 9 9 7 1 0 - 3i2 :0 01 7 9 0 5 1 4 5 2 4 2渔峡口1 9 9 7 - 1 0 - 3 l8 :0 0 l7 9 1 3 1 3 6 2 4 2 渔峡口 1 9 9 7 一1 0 - 3 11 4 :0 01 7 9 21 3 0 2 4 2渔峡口1 9 9 7 1 0 - 3 i2 0 :0 01 7 9 1 11 2 1 2 4 2 渔峡口 1 9 9 7 1 1 - 18 :0 01 7 9 1 81 2 4 2 4 2渔峡口1 9 9 7 - 1 l l1 4 :0 0 2 4 2 渔峡口 1 9 9 7 11 一l2 0 :0 01 7 9 1 31 1 2 2 4 2渔峡口 1 9 9 7 一l1 2 8 :0 01 7 9 1 50 2 4 2渔峡口1 9 9 7 1 l 一21 4 :0 01 7 9 1 81 0 8 2 4 2 渔峡口 1 9 9 7 - 1 1 - 2 2 0 :0 0 i ? 9 0 5 1 0 5 2 4 2渔峡口1 9 9 7 - 1 1 38 :0 01 7 9 1 21 9 1 2 4 2 渔峡口 1 9 9 7 - i l 一3 1 4 :0 01 7 9 19 3 5 2 4 2渔峡口1 9 9 7 1 l 一32 0 :0 01 7 9 0 38 4 1 2 4 2 渔峡口 1 9 9 7 1 l 一48 :0 0 2 4 2渔蛱口1 9 9 7 - 1l 一41 4 :0 0l ? 9 0 78 6 2 2 4 2渔块口1 9 9 7 一1 1 42 0 :0 01 7 90 3 8 2 1 2 4 2渔蛱口 1 9 9 7 一l l 一5 8 :o o1 7 9 1 18 0 1 2 4 2渔蛱口1 9 9 7 一l i 一51 4 :0 01 7 91 37 9 9 2 4 2 渔蛱口 1 9 9 7 - l l 一5 2 0 :0 0l ? 9 1 47 99 对此情况,应予以补足,具体做法是 性插值法推算补足,如:x ,时刻数据缺损 在冬春枯水期,缺损数据通过次线 但k 和x 。时刻数据完备,可通过线 华中科技大学硕士学位论文 性插值得出x 。的值: x t x t 1 = x t - 1 一x t x t = ( x t l + x t + i ) 2 而丰水期,由于流量变化较大,采用比例推算法补足: x t p a t j = x t + l ,x t x t _ ( x 小x t + 1 ) 1 7 2 2 4 离群点的检验与处理 离群点是指一个时间序列中,远离序列一般水平的极端大值和极端小值。因 此,也称之为奇异值,有时也称其为野值。如图2 一l 所描述的是清江流域渔峡口 水文站记录的1 9 9 7 年冬季的径流数据。从图形中可以直观地看出,时段4 3 的径 流量大大高于其它时段的径流量,从序列来看,x 。远离了序列x 。我们称,为离 群点。 概括地说,离群点是由于系统受外部干扰而造成的。但是,形成离群点的系 统外部干扰是多种多样的。首先可能是采样中的误差,如记录仪出现偏误、工作 人员出现笔误、计算差错等,都有可能产生极端大值或极端小值。其次可能是被 华中科技大学硕士学位论文 研究现象本身由于受各种偶然非f 常的因素影响面引起的。 不论是何种原因引起的离群点,对以后的时间序列分析都会造成一定的影响。 从造成分析中的困难来看,统计分析人员是不希望序列中出现离群点的,离群点 会直接影响模型的拟合精度,甚至会得到一些虚假的信息。因此,离群点往往被 分析人员看作是一个“坏值”。但是,从获得的信息来看,离群点提供了很重要的 信息,它不仅提示我们认真捡查采样中是否有差错,在进行时间序列分析前,认 真确认序列,而且,当确认离群点是由于系统受外部突发因素刺激而引起的时候, 它会提供关于系统稳定性、灵敏性等重要信患。 在时间序列分析中,通常把各种各样的离群点分为四种类型进行处理。第一 种是加性离群点,造成这种离群点的干扰,只影响该干扰发生的那一时段上的序 列值,而不影响以后的序列值。第二种是更新离群点,造成离群点的干扰不仅作 用于发生时刻,而且影响后续所有时刻,其作用方式与系统的动态模型有关。第 三种是水平移位离群点,造成这种离群点的干扰是在某一时刻起,系统结构发生 了变化,表现在此时刻以后,序列均值发生水平位移。第四种是暂时变更离群点, 造成这种离群点的干扰是在某时刻具有一定的初始效应,以后影响逐渐减弱。对 于不同的离群点应分别对待。 对于清江径流数据,一般枯水期较平稳,流量变化不大,丰水期流量起伏变 化大。因而,对离群点的检验只在枯水期进行,一般是由于突法性天气原因造成 的,且类型多属于加性离群点和暂时变更离群点。对离群点用以下两种方法进行 处理:一是根据数据取值进行检查,如果某一时刻的数值超出了一定的范围,则 认为该点是一个离群点,予以剔除,再用上述数据补足的方法处理;二是对数据 进行模型分析,然后根据拟合模型后的剩余序列计算特定的统计量,测出显著的 离群点及其类型,并用相应的模型进行修正。 时间序列分折不是做数学游戏,也不是做数学练习,因此,不能盲目地对一个 序列建立模型进行分析。在建模分析之前,对所研究的时间序列进行认真检查和 科学地预处理,也就是建立一个规范的时间序列是十分重要的,是做好时间序列 分析的基础。分析研究人员千万不可忽视。 华中科技大学硕士学位论文 3 时间序列建模 在实际工作中,人们经常要对一系列的观察数据进行分析和处理,对这些数 据的定量分析往往是想得出一个数学模型,用它来简洁而又全面地表征所研究的 系统,即对时间序列的建模。再利用这个模型对观测数据及产生这一数据的系统 进行分析,以便更本质地了解数据的内在结构和系统的动态特性,从而可以利用 过去的观测数据对未来值进行预测与控制。 3 1时间序列的参数模型 能否找到一个合适的模型去代表或逼近观测数据的相关性昵? 换句话说,任 何一个随机系统能够建立相应的模型去很好地表示吗? 回答是肯定的。理论上已 经证明,任何平稳随机系统都能用一个合适的平稳时间序列模型来逼近到我们所 需要的近似程度。时间序列模型说到底,就是一个( 或一组) 随机差分方程,它 用于系统的控帝与预报1 6 l 。 3 1 1建立时序模型的基本思想 时间序列分析的主要想法是认为同一变量在现在时刻的观测值,在时间上同 以前的观测值是有关联的。当然,在新的时刻会出现未预料的新情况。因此,若 记x t ( t = ,2 , - 1 ,0 ,l ,2 ,) 是一个时间上无限伸展的序列,则我们可提出一种描述该 序列的模型是 x t = f k 十x t ) + 口f ( 3 1 1 ) 这里的函数f 把现在的情况同以前的情况联系起来,而a t 表示时刻t 出现的新 情况,假定它是同t 时刻以前的情况无关的随机因素,其均值为常数,在此称为 白噪声序列通常表示为系统或外界的扰动。 3 1 2 自回口3 ( a r ) 模型 对于观测序列 x 。 ,如果x 。仅与过去p 时段的观测值( x t l l x t 2 ,x 。 有关, 与xc i ( j p ) 无关,用记忆性来说,即是系统具有p 期记忆,也就是p 阶动态性1 1 2 】。 1 3 华中科技大学硕士学位论文 描述这种关系的数学模型就是p 阶自回归( a u t o r e g r e s s i v e ) 模型,即 x ,= 妒1 z 卜l + 妒2 r 卜! + + 妒p x 卜p + a , ( 3 1 2 ) t = l ,2 ,3 , 其中币i ,中2 ,为自回归系数,a t 是均值为零、方差为d a 2 的正态分布白噪声, 这样的模型记为a r ( r ) 。 现以最简单的a r ( 1 ) 模型为例,进一步说明自回归模型的物理意义。 设观测数据x l ,x 2 ,x 。是平稳、零均值的时间序列,它们内部最简单的 关系是:x t 只与酢i 线性相关,当然x 。的取值还受其他随机因素的综合影响,郾 x ,= 吼一l + 口, ( 3 1 3 ) 式中币i 是) ( t 与x t - l 间的线性相关系统,a t 是残差,表示随机因素的综合影响, 是白噪声。 a r ( 1 ) 模型表明,它将x t 分解为两部分:一部分取决于x t 1 ,由币lx t i 表示: 另一部分独立于x 由a t 表示,这两者彼此无关。由于在t 一1 时刻,砥是一未知 的随机变量,因此a t 也是一个未知的随机变量。一旦在t 时刻被观测得知,煲l j a t 不再是随机变量而成为固定的数,它可以由下式计算出来 口,= i t 一9 ) 1 i t l ( 3 1 4 ) 由此可知,是一个相关的序列,而a t 是一个独立的序列,a r o ) 模型可以看作是 一个把相关数据交换为独立数据的工具,这是通过从x t 中将取决于x 。i 的部分除 去而实现的。 最后,讨论一下a r ( 1 ) 模型的两种特殊情况。 如果l p l = 0 ,则a r ( m ) 模型成为 石,= a t ,t = l ,2 , ( 3 1 5 ) 因而x 。实际上是独立的或不相关的序列,则称( 3 1 j ) 式为纯粹随机过程,这是所 有时序模型中最简单的模型,它相当于没有“记忆”的过程,即时刻过程的值和 所有过去直到t l 时刻的值( 实际也包括过程的未来值) 都不相关。 a r ( 1 ) 模型的另一种特殊情况是币i - l 时,则( 3 1 3 ) 成为 x 。= x + 口 ( 3 1 6 ) 9 华中科技大学硕士学位论文 这是当 p f 趋于l 时a r ( 1 ) 模型的一个有趣的极限形式,它表明这一系统具有很大 的惯胜,即有强的相关或记忆。当x 。从t l 时刻移至t 时刻,如果没有一个随机 项a t 则它的值( 或响应) 将保持不变。但就是因为这个a t ,x 。的值才不确定。由于 随机项i l t 主宰增量a x 。的大小,所以称( 1 3 6 ) 式为随机游动模型。 3 1 3 滑动平均( m a ) 模型 前面介绍的a r 系统,其特征是系统在t 时刻的响应砥仅与其以前时刻的响 应x i _ l ,x l _ 2 ,x t + 有关,而与其以前时刻进入系统的扰动无关。如果一个系统 在t 时刻的响应x 。,与其以前时刻t l ,t 一2 ,的响应x l - i ,x t - 2 ,无关,而与其 以前时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论